Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM...

25
1 Network Layer 4-1 Chapter 4 Network Layer Computer Networking: A Top Down Approach Featuring the Internet, 2 nd edition. Jim Kurose, Keith Ross Addison-Wesley, July 2002. A note on the use of these ppt slides: We’re making these slides freely available to all (faculty, students, readers). They’re in PowerPoint form so you can add, modify, and delete slides (including this one) and slide content to suit your needs. They obviously represent a lot of work on our part. In return for use, we only ask the following: If you use these slides (e.g., in a class) in substantially unaltered form, that you mention their source (after all, we’d like people to use our book!) If you post any slides in substantially unaltered form on a www site, that you note that they are adapted from (or perhaps identical to) our slides, and note our copyright of this material. Thanks and enjoy! JFK/KWR All material copyright 1996-2002 J.F Kurose and K.W. Ross, All Rights Reserved Network Layer 4-2 Chapter 4: Network Layer 目標: ネットワーク層サービスの背 後にある原理の理解: 経路制御(パス選択) 大規模化 ルータ動作 最近の話題: IPv6, モビリ ティ インターネットにおける事例 と実装 概要: ネットワーク層サービス 経路制御の原理: パス選択 階層ルーティング IP インターネット経路制御プロトコル intra-domain inter-domain ルータの内部構造 IPv6 モビリティ Network Layer 4-3 Chapter 4 内容 4.1 イントロダクションとネットワークサービスモデル 4.2 経路制御の原理 4.3 階層経路制御 4.4 The Internet (IP) プロトコル 4.5 インターネットにおけるルーティング 4.6 ルータの内部構造 4.7 IPv6 4.8 マルチキャストルーティング 4.9 モビリティ Network Layer 4-4 ネットワーク層の機能 始点ホストから終点ホストへのパ ケット転送(プロセス間ではない) ネットワーク層機能は,全てのホ スト,ルータにある 3つの重要な機能: 経路決定: 送信ホスト・受信ホス ト間の経路.経路制御アルゴリズ フォワーディング: ルータ入力ポ ートから適切な出力ポートへの交 呼設定: アーキテクチャによって は,データ転送前にパスに沿った ルータ呼設定が必要 network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical network data link physical application transport network data link physical application transport network data link physical Network Layer 4-5 ネットワークサービスモデル Q: 送信ホストから受信ホ ストまでパケットがとお る“チャネル”のための サービスモデルは? 帯域保証か? パケット間の同期保証か( ジッタなし)? ロスフリーか? 順序保証か? 送信ホストへの輻輳通知 ありか? ? ? ? 仮想回線(バーチャルサーキット) データグラムか? ネットワーク層によって提供され るサービスの抽象化において最 も重要なものは: サー の抽象化 Network Layer 4-6 仮想回線(VC) データ転送の前後に呼設定と開放 パケットはVC識別子を含む(終点ホストIDではない) 送受信パス上のルータは経由するコネクションの状態を保持 エンドシステム間のトランスポート層コネクション リンク,ルータ資源(帯域,バッファ)の各VCへの割当 専用回線の性能を得るために “送受信間パスは電話回線のように振舞う” 性能指向 送受信間パスにそったネットワークアクション

Transcript of Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM...

Page 1: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

1

Network Layer 4-1

Chapter 4Network Layer

Computer Networking: A Top Down Approach Featuring the Internet, 2nd edition. Jim Kurose, Keith RossAddison-Wesley, July 2002.

A note on the use of these ppt slides:We’re making these slides freely available to all (faculty, students, readers). They’re in PowerPoint form so you can add, modify, and delete slides (including this one) and slide content to suit your needs. They obviously represent a lot of work on our part. In return for use, we only ask the following:

If you use these slides (e.g., in a class) in substantially unaltered form, that you mention their source (after all, we’d like people to use our book!)

If you post any slides in substantially unaltered form on a www site, that you note that they are adapted from (or perhaps identical to) our slides, and note our copyright of this material.

Thanks and enjoy! JFK/KWR

All material copyright 1996-2002J.F Kurose and K.W. Ross, All Rights Reserved

Network Layer 4-2

Chapter 4: Network Layer目標:ネットワーク層サービスの背後にある原理の理解:経路制御(パス選択)

大規模化

ルータ動作

最近の話題: IPv6, モビリティ

インターネットにおける事例と実装

概要:ネットワーク層サービス

経路制御の原理: パス選択階層ルーティング

IPインターネット経路制御プロトコル

intra-domaininter-domain

ルータの内部構造

IPv6モビリティ

Network Layer 4-3

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-4

ネットワーク層の機能

始点ホストから終点ホストへのパケット転送(プロセス間ではない)

ネットワーク層機能は,全てのホスト,ルータにある

3つの重要な機能:経路決定: 送信ホスト・受信ホスト間の経路.経路制御アルゴリズム

フォワーディング: ルータ入力ポートから適切な出力ポートへの交換

呼設定: アーキテクチャによっては,データ転送前にパスに沿ったルータ呼設定が必要

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

networkdata linkphysical

applicationtransportnetworkdata linkphysical

applicationtransportnetworkdata linkphysical

Network Layer 4-5

ネットワークサービスモデル

Q:送信ホストから受信ホストまでパケットがとおる“チャネル”のためのサービスモデルは?帯域保証か?

パケット間の同期保証か(ジッタなし)?

ロスフリーか?

順序保証か?

送信ホストへの輻輳通知ありか?

? ??仮想回線(バーチャルサーキット)

かデータグラムか?

ネットワーク層によって提供されるサービスの抽象化において最

も重要なものは:

サービスの抽象化

Network Layer 4-6

仮想回線(VC)

データ転送の前後に呼設定と開放

パケットはVC識別子を含む(終点ホストIDではない)

送受信パス上のルータは経由するコネクションの状態を保持

エンドシステム間のトランスポート層コネクション

リンク,ルータ資源(帯域,バッファ)の各VCへの割当

専用回線の性能を得るために

“送受信間パスは電話回線のように振舞う”性能指向

送受信間パスにそったネットワークアクション

Page 2: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

2

Network Layer 4-7

仮想回線:シグナリングプロトコル

VCの設定,維持,開放に使用

ATM, frame-relay, X.25 で使用今日のインターネットでは用いられていない

applicationtransportnetworkdata linkphysical

applicationtransportnetworkdata linkphysical

1. Initiate call 2. incoming call3. Accept call4. Call connected

5. Data flow begins 6. Receive data

Network Layer 4-8

データグラムネットワーク:インターネットモデル

ネットワーク層における呼設定なし

ルータ: エンド間コネクションに関する状態保持せずネットワーク層レベルでのコネクションの概念なし

終点ホストアドレスにもとづくパケットフォワーディング送受信ペア間のパケットは異なるパスを通りうる

applicationtransportnetworkdata linkphysical

applicationtransportnetworkdata linkphysical

1. Send data 2. Receive data

Network Layer 4-9

ネットワーク層におけるサービスモデル:ATMネットワーク

NetworkArchitecture

Internet

ATM

ATM

ATM

ATM

ServiceModel

best effort

CBR

VBR

ABR

UBR

Bandwidth

none

constantrateguaranteedrateguaranteed minimumnone

Loss

no

yes

yes

no

no

Order

no

yes

yes

yes

yes

Timing

no

yes

yes

no

no

Congestionfeedback

no (inferredvia loss)nocongestionnocongestionyes

no

Guarantees ?

インターネットモデルへの拡張: Intserv, Diffserv6章

Network Layer 4-10

データグラムかVCか: なぜ?

インターネットコンピュータ間のデータ交換

“エラスティック(伸縮)”サービス,厳密なタイミング保証の必要なし

“賢い”エンドシステム(コンピュータ)

適応性があり,制御を実行でき,誤り回復を実行できる

ネットワーク内は簡単化,“エッジ”は複雑

リンクの多様性

多様な性質

一様なサービスは困難

ATM電話網から発展

会話: 同期,信頼性への要求条件

品質保証サービスの必要性

“賢くない(dumb)”エンドシステム電話

ネットワーク内は複雑

Network Layer 4-11

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理

Link state routingDistance vector routing

4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-12

経路制御(ルーティング)

経路制御アルゴリズムのためのグラフによる抽象化:グラフのノードはルータを表す

グラフのエッジは物理リンクを表すリンクコスト:遅延,費用,輻輳レベル

目標: 送受信間の“良好な”パス(ルータのつながり)の決定

ルーティングプロトコル

A

ED

CB

F2

21

3

1

1

2

53

5

“良好な”パス:通常は最小コストパスのこと

他の定義も可能

Page 3: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

3

Network Layer 4-13

経路制御アルゴリズムの分類

グローバルまたは分散情報?グローバル:全ルータは完全なトポロジ,リンクコスト情報をもつ

“リンクステート”アルゴリズム

分散型:ルータは,隣接ルータと隣接ルータへのリンクコスト情報をもつ

隣接ノードとの情報交換と計算の繰り返し処理

“距離ベクトル”アルゴリズ

静的または動的?静的:経路が時間的にゆっくり変化

動的:経路がすばやく変化

周期的に更新

リンクコストの変化に応じて更新

Network Layer 4-14

リンクステート経路制御アルゴリズム

Dijkstra アルゴリズム全ノードはネットワークトポロジとリンクコストを知っている

“リンクステートブロードキャスト”によって実現

全ノードは同じ情報をもつ

あるノード(“ソース”)から他の全ノードへの最小コストパスを計算

経路表を得る

反復:k 反復後,k 終点までの最小コストを得る

記号:c(i,j): ノード i から j までのリンクコスト.隣接ノードでなければコストは無限大

D(v): ソースから終点 V までの現在のパスコスト

p(v): ソースから v にいたるパス上で v の直前のノード,すなわちその次ノードは vN:最小コストパスが既知となったノードの集合

Network Layer 4-15

Dijsktra アルゴリズム1 Initialization:2 N = {A} 3 for all nodes v 4 if v adjacent to A 5 then D(v) = c(A,v) 6 else D(v) = infinity 7 8 Loop9 find w not in N such that D(w) is a minimum 10 add w to N 11 update D(v) for all v adjacent to w and not in N: 12 D(v) = min( D(v), D(w) + c(w,v) ) 13 /* new cost to v is either old cost to v or known 14 shortest path cost to w plus cost from w to v */ 15 until all nodes in N

Network Layer 4-16

Dijkstra アルゴリズム: 例

Step012345

start NA

ADADE

ADEBADEBC

ADEBCF

D(B),p(B)2,A2,A2,A

D(C),p(C)5,A4,D3,E3,E

D(D),p(D)1,A

D(E),p(E)infinity

2,D

D(F),p(F)infinityinfinity

4,E4,E4,E

A

ED

CB

F2

21

3

1

1

2

53

5

Network Layer 4-17

Dijkstra アルゴリズム,ディスカッションアルゴリズムの複雑さ: n ノード反復ごとに N に含まれない全ノード w をチェックする必要ありn*(n+1)/2 比較: O(n**2)より効果的な実装が可能: O(nlogn)

発振の可能性:例,リンクコスト = 運ばれるトラヒック量

AD

CB

1 1+e

e0

e1 1

0 0

AD

CB

2+e 0

001+e 1

AD

CB

0 2+e

1+e10 0

AD

CB

2+e 0

e01+e 1

initially … recomputerouting

… recompute … recompute

Network Layer 4-18

距離ベクトル経路制御アルゴリズム

反復:ノードが情報交換しなくなるまで繰り返し

自律終了: 終了のための“シグナル”はない

非同期:ノードは,ロックステップでは,情報交換の必要/繰り返しなし

分散:各ノードは,直接の隣接ノードとのみ通信

距離テーブルデータ構造

各ノードが自分用のものをもつ

行:とりうる終点ホストごと

列:ノードにいたる隣接ノードごと

例:ノード X 内,隣接ノード Z を経た終点ノード Y:

D (Y,Z)X

次ホップとして Z を選んだ場合のノード X から Y への距離

c(X,Z) + min {D (Y,w)}Zw

=

=

Page 4: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

4

Network Layer 4-19

距離テーブル:例

A

E D

CB7

81

2

1

2D ()

A

B

C

D

A

1

7

6

4

B

14

8

9

11

D

5

5

4

2

E cost to destination via

dest

inat

ion

D (C,D)E

c(E,D) + min {D (C,w)}Dw=

= 2+2 = 4

D (A,D)E

c(E,D) + min {D (A,w)}Dw=

= 2+3 = 5

D (A,B)E

c(E,B) + min {D (A,w)}Bw=

= 8+6 = 14

loop!

loop!Network Layer 4-20

距離テーブルによる経路表の構築

D ()

A

B

C

D

A

1

7

6

4

B

14

8

9

11

D

5

5

4

2

Ecost to destination via

dest

inat

ion

A

B

C

D

A,1

D,5

D,4

D,4

Outgoing link to use, cost

dest

inat

ion

Distance table Routing table

Network Layer 4-21

距離ベクトルルーティング:概要

反復,非同期: 各局所反復は,以下の原因で発生: ローカルリンクコストの変化

隣接ホストからのメッセージ受信:隣接ホストからの最小コストパスの変化を知る

分散:各ノードは,任意の終点ホストへの最小コストパスが変化した場合にのみ,隣接ノードに通知

必要なら隣接ノードはその隣接ノードに通知…

(隣接ノードからのメッセージのローカルリンクコストの変化)を待つ

距離テーブルの再計算

任意の終点ホストへの最小コストパスが変化すると,隣接ノ

ードに通知

各ノードの動作:

Network Layer 4-22

距離ベクトルアルゴリズム:

1 Initialization: 2 for all adjacent nodes v: 3 D (*,v) = infinity /* the * operator means "for all rows" */ 4 D (v,v) = c(X,v) 5 for all destinations, y 6 send min D (y,w) to each neighbor /* w over all X's neighbors */

XX

Xw

全ノード X において:

Network Layer 4-23

距離ベクトルアルゴリズム(つづき):8 loop9 wait (until I see a link cost change to neighbor V 10 or until I receive update from neighbor V) 11 12 if (c(X,V) changes by d) 13 /* change cost to all dest's via neighbor v by d */14 /* note: d could be positive or negative */ 15 for all destinations y: D (y,V) = D (y,V) + d 16 17 else if (update received from V wrt destination Y) 18 /* shortest path from V to some Y has changed */19 /* V has sent a new value for its min DV(Y,w) */ 20 /* call this received new value is "newval" */ 21 for the single destination y: D (Y,V) = c(X,V) + newval 22 23 if we have a new min D (Y,w)for any destination Y 24 send new value of min D (Y,w) to all neighbors 25 26 forever

w

XX

XX

X

ww

Network Layer 4-24

距離ベクトルアルゴリズム:例

X Z12

7

Y

Page 5: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

5

Network Layer 4-25

距離ベクトルアルゴリズム:例

X Z12

7

Y

D (Y,Z)X c(X,Z) + min {D (Y,w)}w=

= 7+1 = 8

Z

D (Z,Y)X c(X,Y) + min {D (Z,w)}w== 2+1 = 3

Y

Network Layer 4-26

距離ベクトル:リンクコストの変化

リンクコストの変化:ノードがローカルリンクコストの変化を検出

距離テーブルの更新(15行目)

最小コストパスのコストが変化した場合,隣接ノードに通知(23,24行目)

X Z14

50

Y1

algorithmterminates

“良いニュースは速く伝わる”

Network Layer 4-27

距離ベクトル:リンクコストの変化

リンクコストの変化:良いニュースは速く伝わる

悪いニュースはゆっくり伝わる- “count to infinity” 問題!

X Z14

50

Y60

algorithmcontinues

on!

Network Layer 4-28

距離ベクトル: poisoned reverseXに到達するのにZがYを経由するのなら :

ZはYに,ZからXへの距離は無限大であると伝える(これによりYはZを介してXにいかない)この方法によってcount to infinity問題を完全に解決できるだろうか?

X Z14

50

Y60

algorithmterminates

Network Layer 4-29

リンクステート型と距離ベクトル型の比較

メッセージ複雑度LS: n ノード, E リンクでは, O(nE) メッセージが送信される

DV: 隣接ノード間でのみ交換される

収束時間が変動する

収束速度LS: O(n2) アルゴリズムで,O(nE) メッセージが必要

発振の可能性

DV: 収束時間は変動経路がループしているかもしれない

count-to-infinity 問題

ロバスト性:ルータがおかしくなったら何がおこるか?

LS:ノードが間違ったリンクコストを広告する可能性がある

各ノードは自身のテーブルを計算する

DV:DV ノードは,誤ったパスコストを広告する可能性がある

各ノードのテーブルは他のノードに利用される

• エラーがネットワークを介して伝播する

Network Layer 4-30

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Page 6: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

6

Network Layer 4-31

階層ルーティング

スケール: 2億もの終点ノード:経路表に全終点ノードを記述することは無理!

経路表交換でリンクがいっぱ

いになる!

管理の自律性インターネット = ネットワークの

ネットワーク

ネットワーク管理者は,自身のネットワーク内の経路制御を自分で管理したいかもしれない

これまでの議論は理想化されていた

全てのルータは同一

ネットワークは“フラット”

… でも実際は違う

Network Layer 4-32

階層ルーティング

ルータ群をリージョン“自律システム(AS: Autonomous System)”に集約する同一 AS 内のルータは同一の経路制御アルゴリズムを実行

“intra-AS” ルーティングプロトコル

異なるAS内のルータは,異なるintra-ASルーティングプロトコルを実行するかもしれない

AS 内の特別なルータAS 内の他のルータとは,intra-AS ルーティングプロトコルを実行

さらに,AS外の終点に対するルーティングもおこなう

他のゲートウェイルータと,inter-AS ルーティング プロトコルを実行

ゲートウェイルータ

Network Layer 4-33

Intra-AS と Inter-AS ルーティングゲートウェイ:

•ゲートウェイ間ではinter-AS ルーティングを実行•AS 内の他のルータとは intra-AS ルーティングを実行

ゲートウェイ A.c における inter-AS, intra-AS

ルーティング

ネットワーク層

リンク層

物理層

a

b

b

aaC

A

Bd

A.aA.c

C.bB.a

cb

c

Network Layer 4-34

Intra-AS と Inter-AS ルーティング

Host h2

a

b

b

aaC

A

Bd c

A.aA.c

C.bB.a

cb

Hosth1

Intra-AS routingwithin AS A

Inter-ASrouting

between A and B

Intra-AS routingwithin AS B

特定の inter-AS と intra-AS インターネットルーティングプロトコルを紹介

Network Layer 4-35

Chapter 4 roadmap4.1 Introduction and Network Service Models4.2 Routing Principles4.3 Hierarchical Routing4.4 The Internet (IP) Protocol

4.4.1 IPv4 addressing4.4.2 Moving a datagram from source to destination4.4.3 Datagram format4.4.4 IP fragmentation4.4.5 ICMP: Internet Control Message Protocol4.4.6 DHCP: Dynamic Host Configuration Protocol4.4.7 NAT: Network Address Translation

4.5 Routing in the Internet4.6 What’s Inside a Router4.7 IPv64.8 Multicast Routing4.9 Mobility

Network Layer 4-36

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル

4.4.1 IPv4 アドレッシング4.4.2 始点ホストから終点ホストへのデータグラムの流れ4.4.3 Datagram フォーマット4.4.4 IP フラグメンテーション4.4.5 ICMP: Internet Control Message Protocol4.4.6 DHCP: Dynamic Host Configuration Protocol4.4.7 NAT: Network Address Translation

4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Page 7: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

7

Network Layer 4-37

インターネットのネットワーク層

forwardingtable

ホスト,ルータのネットワーク層機能:

Routing protocols•path selection•RIP, OSPF, BGP

IP protocol•addressing conventions•datagram format•packet handling conventions

ICMP protocol•error reporting•router “signaling”

Transport layer: TCP, UDP

Link layer

physical layer

Networklayer

Network Layer 4-38

IP アドレッシング: はじめにIP アドレス: ホスト,ルータのインタフェースのための32ビット識別子インタフェース: ホスト/ルータと物理リンクを接続ルータは,通常,複数のインタフェースをもつ

ホストは,複数のインターフェースを持つ場合がる

各インタフェースには IP アドレスが割り振られる

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

223.1.1.1 = 11011111 00000001 00000001 00000001

223 1 11

Network Layer 4-39

IP アドレッシングIP アドレス:ネットワーク部(上位ビット)

ホスト部(下位ビット)

ネットワークとは何か?

(IPアドレスから見た場合)IPアドレスが同じネットワーク部をもつデバイスインタフェース群

ルータが介在することなく,互いに物理的に到達可能

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

3つのIPネットワークからなるネットワーク(223で始まる24ビットネットワークアドレスをもつ)

LAN

Network Layer 4-40

IP アドレッシングネットワークをどのようにはっけんするか?

ルータ,ホストからインタフェースを切り離す

分離されたネットワークの“島”が出来上がる

223.1.1.1

223.1.1.3

223.1.1.4

223.1.2.2223.1.2.1

223.1.2.6

223.1.3.2223.1.3.1

223.1.3.27

223.1.1.2

223.1.7.0

223.1.7.1223.1.8.0223.1.8.1

223.1.9.1

223.1.9.2

6つのネットワークが相互接続されたシステム

Network Layer 4-41

IP アドレス

0network host

10 network host

110 network host

1110 multicast address

A

B

C

D

class1.0.0.0 to127.255.255.255128.0.0.0 to191.255.255.255192.0.0.0 to223.255.255.255

224.0.0.0 to239.255.255.255

32 bits

ネットワークの概念を得たところで,IPアドレスについて再考しよう:

“クラス型”アドレッシング

Network Layer 4-42

IP アドレッシング: CIDRクラス型アドレッシング: アドレス空間の利用効率が悪い,アドレス空間の枯渇

例:たとえネットワークに2千のホストしかなくても,クラスBでは6万5千のアドレスが割り当てられる

CIDR: Classless InterDomain Routing任意の長さのネットワーク部

アドレスフォーマット: a.b.c.d/x,ここで,x はネットワーク部のビット長

11001000 00010111 00010000 00000000

networkpart

hostpart

200.23.16.0/23

Page 8: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

8

Network Layer 4-43

IP アドレス:どうやって得るか?

Q: ホストは IP アドレスをどうやって得るのか?

システム管理者がファイル内に格納

Wintel: control-panel->network->configuration->tcp/ip->propertiesUNIX: /etc/rc.config (異なる場合がある)

DHCP: Dynamic Host Configuration Protocol: サーバから動的にアドレスを入手

“plug-and-play” (もっと簡単にいうと)

Network Layer 4-44

IP アドレス:どうやって得るか?Q: ネットワークは,IPアドレスのネットワーク部をどうやって得るのか?

A: プロバイダのISPアドレス空間の一部が割り当てられる

ISP's block 11001000 00010111 00010000 00000000 200.23.16.0/20

Organization 0 11001000 00010111 00010000 00000000 200.23.16.0/23 Organization 1 11001000 00010111 00010010 00000000 200.23.18.0/23 Organization 2 11001000 00010111 00010100 00000000 200.23.20.0/23

... ….. …. ….Organization 7 11001000 00010111 00011110 00000000 200.23.30.0/23

Network Layer 4-45

階層アドレッシング:ルート集約

“200.23.16.0/20で始まるアドレスを持つものはこっちに送ってくれ”

200.23.16.0/23

200.23.18.0/23

200.23.30.0/23

Fly-By-Night-ISP

Organization 0

Organization 7Internet

Organization 1

ISPs-R-Us “199.31.0.0/16で始まるアドレスを持つものはこっちに送ってくれ”

200.23.20.0/23Organization 2

...

...

階層アドレッシングは,効率的な経路情報広告を可能にする

Network Layer 4-46

階層アドレッシング:より詳しい経路情報

ISPs-R-Us が Organization 1 への経路を持つ場合

200.23.16.0/23

200.23.18.0/23

200.23.30.0/23

Fly-By-Night-ISP

Organization 0

Organization 7Internet

Organization 1

ISPs-R-Us “199.31.0.0/16あるいは200.23.18.0/23で始まるアドレスを持つものはこっちに送ってくれ”

200.23.20.0/23Organization 2

...

...

“200.23.16.0/20で始まるアドレスを持つものはこっちに送ってくれ”

Network Layer 4-47

IP アドレッシング:最後に…

Q: ISPはアドレスブロックをどうやって得るのか?A: ICANN: Internet Corporation for Assigned

Names and Numbersアドレス割当

DNSの管理ドメイン名の割当,紛争の解決

Network Layer 4-48

データグラムの始点・終点ホスト間の配送

IP datagram:

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

A

BE

miscfields

sourceIP addr

destIP addr data

始点から終点までの間,データグラムは不変

ここではアドレス部に興味がある

Dest. Net. next router Nhops223.1.1 1223.1.2 223.1.1.4 2223.1.3 223.1.1.4 2

forwarding table in A

Page 9: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

9

Network Layer 4-49

データグラムの始点・終点ホスト間の配送

A から B に IPデータグラムを送信する場合:フォワーディングテーブル内でBのネットワークアドレスを検索

BがAと同じネットワークであることを発見

リンク層は,リンク層フレームによりデータグラムをBに直接送信

BとAは直接接続されている

Dest. Net. next router Nhops223.1.1 1223.1.2 223.1.1.4 2223.1.3 223.1.1.4 2

miscfields 223.1.1.1 223.1.1.3 data

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

A

BE

forwarding table in A

Network Layer 4-50

データグラムの始点・終点ホスト間の配送

Dest. Net. next router Nhops223.1.1 1223.1.2 223.1.1.4 2223.1.3 223.1.1.4 2

AからEへの転送:フォワーディングテーブルでEのネットワークアドレスを検索

Eは違うネットワーク上にあるAとEは直接つながっていない

経路表:Eへの次ホップルータは,223.1.1.4 リンク層は,リンク層フレームによりデータグラムをルータ223.1.1.4に送信

データグラムが23.1.1.4に到達以下繰り返し…

miscfields 223.1.1.1 223.1.2.3 data

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

A

BE

forwarding table in A

Network Layer 4-51

データグラムの始点・終点ホスト間の配送

223.1.4に到着,223.1.2.2へルータのフォワーディングテーブルで,Eのネットワークアドレスを検索

E は,ルータインタフェース223.1.2.9と同じネットアドレスルータとEは直接接続

リンク層はインタフェース223.1.2.9 を介し,リンク層フレームによりデータグラムを223.1.2.2に送信データグラムが223.1.2.2に到着! (万歳!)

miscfields 223.1.1.1 223.1.2.3 data Dest. Net router Nhops interface

223.1.1 - 1 223.1.1.4223.1.2 - 1 223.1.2.9223.1.3 - 1 223.1.3.27

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

A

BE

forwarding table in router

Network Layer 4-52

IP データグラムフォーマット

ver length

32 bits

data (variable length,typically a TCP

or UDP segment)

16-bit identifierInternetchecksum

time tolive

32 bit source IP address

IP protocol versionnumber

header length(bytes)

max numberremaining hops

(decremented at each router)

forfragmentation/reassembly

total datagramlength (bytes)

upper layer protocolto deliver payload to

head.len

type ofservice

“type” of data flgs fragmentoffset

upperlayer

32 bit destination IP address

Options (if any) E.g. timestamp,record routetaken, specifylist of routers to visit.

TCPのオーバヘッドはどのくらいか?

20 bytes of TCP20 bytes of IP= 40 bytes + app layer overhead

Network Layer 4-53

IP フラグメンテーションとリアッセンブリネットワークリンクには最大転送サイズ(MTU: max.transfersize)がある – 最大限可能なリンクレベルフレームのサイズ

種類の異なるリンクは,異なるMTU を持つネットワーク内で大きな IP データグラムを分割(フラグメント)する

ひとつのデータグラムが複数のデータグラムに

最終的な終点ホストにてのみ再構築(リアッセンブル)される

関連するフラグメントを識別,並べるためにIPヘッダのフィールドが利用される

fragmentation: in: one large datagramout: 3 smaller datagrams

reassembly

Network Layer 4-54

IP フラグメンテーションとリアッセンブリID=x

offset=0

fragflag=0

length=4000

ID=x

offset=0

fragflag=1

length=1500

ID=x

offset=1480

fragflag=1

length=1500

ID=x

offset=2960

fragflag=0

length=1040

ひとつの大きなデータグラムがいくつかの小さなデータグラムになる

4000 バイトデータグラム

MTU = 1500 bytes

Page 10: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

10

Network Layer 4-55

ICMP: Internet Control Message Protocol

ホスト,ルータ,ゲートウェイがネットワークレベル情報を通信するために利用

エラー報告:不達ホスト,ネットワーク,ポート,プロトコル

エコー要求/応答 (ping で利用される)

IP “より上”のネットワーク層:ICMP メッセージは,IPデータグラムで運ばれる

ICMPメッセージ: タイプ,コード+エラーを起こしたIPデータグラムの最初の8バイト

Type Code description0 0 echo reply (ping)3 0 dest. network unreachable3 1 dest host unreachable3 2 dest protocol unreachable3 3 dest port unreachable3 6 dest network unknown3 7 dest host unknown4 0 source quench (congestion

control - not used)8 0 echo request (ping)9 0 route advertisement10 0 router discovery11 0 TTL expired12 0 bad IP header

Network Layer 4-56

DHCP: Dynamic Host Configuration Protocol

目標: ホストがネットワークに接続した際にネットワークサーバから動的にIPアドレスを入手することを可能にする.使用中のアドレスのリースを更新できる(使用中の場合のみアドレスを保持できる)

アドレスの再利用を可能にする

モバイルユーザがネットワークを利用することをサポート

DHCP 概要:ホストは “DHCP discover” メッセージをブロードキャストDHCP サーバは “DHCP offer” メッセージで応答ホストは IP アドレスを要求: “DHCP request” メッセージDHCP サーバはアドレスを送信: “DHCP ack” メッセージ

Network Layer 4-57

DHCP クライアント・サーバ シナリオ

223.1.1.1

223.1.1.2

223.1.1.3

223.1.1.4 223.1.2.9

223.1.2.2

223.1.2.1

223.1.3.2223.1.3.1

223.1.3.27

A

BE

DHCP server

arriving DHCP client needsaddress in thisnetwork

Network Layer 4-58

DHCP クライアント・サーバ シナリオDHCP server: 223.1.2.5 arriving

client

time

DHCP discover

src : 0.0.0.0, 68 dest.: 255.255.255.255,67yiaddr: 0.0.0.0transaction ID: 654

DHCP offersrc: 223.1.2.5, 67 dest: 255.255.255.255, 68yiaddrr: 223.1.2.4transaction ID: 654Lifetime: 3600 secs

DHCP request

src: 0.0.0.0, 68 dest:: 255.255.255.255, 67yiaddrr: 223.1.2.4transaction ID: 655Lifetime: 3600 secs

DHCP ACKsrc: 223.1.2.5, 67 dest: 255.255.255.255, 68yiaddrr: 223.1.2.4transaction ID: 655Lifetime: 3600 secs

Network Layer 4-59

NAT: Network Address Translation

10.0.0.1

10.0.0.2

10.0.0.3

10.0.0.4

138.76.29.7

local network(e.g., home network)

10.0.0/24

rest ofInternet

このネットワーク内に終点または始点をもつデータグラムは,(通常)10.0.0/24 アドレスを,始点,終点にもつ

ローカルネットワークから外に向かう全てのデータグラムは,同じ送信 NAT IPアドレス(138.76.29.7)を持つが,そのソースポート番号は異なる

Network Layer 4-60

NAT: Network Address Translation

モチベーション: ローカルネットワークは,外部に接続されている限りにおいては,ひとつのIPアドレスのみを使う:

ISPからある範囲のアドレスを割当ててもらう必要がない:- たった一つのIPアドレスが全デバイスで利用されるローカルネットワーク内のデバイスのアドレスを外部に通知することなく変更できる

ローカルネットワーク内のデバイスのアドレスを変えることなく ISP を乗り換えることができるローカルネットワーク内のデバイスは,外部から陽にはアクセスできない,外部から見えない(安全性が増す)

Page 11: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

11

Network Layer 4-61

NAT: Network Address Translation実装: NAT ルータは次のことができなければならない:

外向データグラム: 外向きデータグラムの(始点 IP アドレス,ポート番号)を(NAT IPアドレス,新規ポート番号)に置換. . . 外部のリモートクライアント/サーバは,終点アドレスとして(NAT IPアドレス,新規ポート番号)を使って応答

各(始点 IP アドレス,ポート番号)-(NAT IP アドレス,新規ポート番号)変換対を(NAT変換テーブル内で)記憶

到着データグラム:incoming datagrams: replace 終点に(NAT IP アドレス,新規ポート番号)をもつ到着データグラムの終点をNAT変換テーブルに保持された(始点 IP アドレス,ポート番号)に変換

Network Layer 4-62

NAT: Network Address Translation

10.0.0.1

10.0.0.2

10.0.0.3

S: 10.0.0.1, 3345D: 128.119.40.186, 80

110.0.0.4

138.76.29.7

1: host 10.0.0.1 sends datagram to 128.119.40, 80

NAT translation tableWAN side addr LAN side addr138.76.29.7, 5001 10.0.0.1, 3345…… ……

S: 128.119.40.186, 80 D: 10.0.0.1, 3345 4

S: 138.76.29.7, 5001D: 128.119.40.186, 802

2: NAT routerchanges datagramsource addr from10.0.0.1, 3345 to138.76.29.7, 5001,updates table

S: 128.119.40.186, 80 D: 138.76.29.7, 5001 3

3: Reply arrivesdest. address:138.76.29.7, 5001

4: NAT routerchanges datagramdest addr from138.76.29.7, 5001 to 10.0.0.1, 3345

Network Layer 4-63

NAT: Network Address Translation

16ビットポート番号フィールド:60,000 の同時コネクション

NAT の論点:ルータは3層までをサポートすべきエンド間という趣旨に違反

• NAT の存在をアプリケーション設計者(例えば,P2Pアプリケーション)が考慮しなければならない

アドレス不足は,IPv6によって解決されるべきだ

Network Layer 4-64

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング

4.5.1 Intra-AS ルーティング: RIP と OSPF4.5.2 Inter-AS ルーティング: BGP

4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-65

インターネットにおける経路制

インターネットは,相互に接続された自律システム(AS: Autonomous Systems)からなる:

Stub AS: 小企業: 他のASに対して1接続Multihomed AS: 大企業(非中継): 他のASに対して複数接続Transit AS: プロバイダ,多くの AS が接続

2レベル経路制御:Intra-AS: 管理者は,ネットワーク内の経路制御の選択に関して責任があるInter-AS: inter-AS 経路制御については唯一の標準がある: BGP

Network Layer 4-66

インターネット AS 階層Intra-AS border (exterior gateway) routers

Inter-AS interior (gateway) routers

Page 12: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

12

Network Layer 4-67

Intra-AS 経路制御

Interior Gateway Protocols (IGP) として知られている最も一般的な Intra-AS 経路制御プロトコル:

RIP: Routing Information Protocol

OSPF: Open Shortest Path First

IGRP: Interior Gateway Routing Protocol (Cisco独自方式)

Network Layer 4-68

RIP ( Routing Information Protocol)

距離ベクトルアルゴリズム

1982年のBSD-UNIX ディストリビューションに含まれた距離メトリック: ホップ数(最大15ホップ)その理由はなぜか?

距離ベクトル: 隣接ノード間と30秒ごとにResponse Message (広告:advertisementとも呼ばれる)を介して交換各広告:AS内の最大25終点ネットワークのリスト

Network Layer 4-69

RIP: 例

Destination Network Next Router Num. of hops to dest.w A 2y B 2z B 7x -- 1…. …. ....

w x y

z

A

C

D B

Routing table in D

Network Layer 4-70

RIP: 例

Destination Network Next Router Num. of hops to dest.w A 2y B 2z B A 7 5x -- 1…. …. ....

Routing table in D

w x y

z

A

C

D B

Dest Next hopsw - -x - -z C 4…. … ...

AからDへの広告

Network Layer 4-71

RIP: リンク故障と復旧180秒間広告を受信しなかった場合→隣接ノード/リンクが死んだと判定

隣接ノードを介した経路を無効化

新しい広告を隣接ノードに送信

隣接ノードは,(テーブルが変更されたら)順番に新しい広告を送信

リンク故障情報が全ネットワークにすばやく伝播

ピンポンループを防ぐためにポイズンリバースを使用

(無限距離 = 16 ホップ)

Network Layer 4-72

RIP テーブル処理

RIP 経路テーブルは route-d (デーモン)とよばれるアプリケーションレベルプロセスによって管理される

広告は UDP パケットによって送信され,定期的に繰り返される

physicallink

network forwarding(IP) table

Transprt(UDP)

routed

physicallink

network(IP)

Transprt(UDP)

routed

forwardingtable

Page 13: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

13

Network Layer 4-73

RIP テーブルの例Router: giroflee.eurocom.fr

3つのクラス C ネットワーク(LAN)が接続ルータのみが接続された LAN への経路を知っているその他へはデフォルトルータを使用

マルチキャストアドレス(224.0.0.0)への経路ループバックインタフェース(デバッグ用)

Destination Gateway Flags Ref Use Interface -------------------- -------------------- ----- ----- ------ ---------127.0.0.1 127.0.0.1 UH 0 26492 lo0 192.168.2. 192.168.2.5 U 2 13 fa0 193.55.114. 193.55.114.6 U 3 58503 le0 192.168.3. 192.168.3.5 U 2 25 qaa0 224.0.0.0 193.55.114.6 U 3 0 le0 default 193.55.114.129 UG 0 143454

Network Layer 4-74

OSPF (Open Shortest Path First)

“open”: パブリックに利用可能リンクステートアルゴリズムを使用

LS パケットの配布各ノードにおけるトポロジマップ

Dijkstraアルゴリズムを使った経路計算

OSPF 広告は,隣接ノードあたり一つのエントリを運ぶ広告は,(フラッディングをもちいて)AS全体へ配信される(TCPやUDPというより)IPを介して直接 ISPF メッセージによって運ばれる

Network Layer 4-75

OSPF の(RIPにはない)優れた特徴

セキュリティ:全ての OSPF メッセージは(悪意のある侵入を防ぐため)認証される

複数の同一コストパス許される(RIPでは一つのパスのみ)各リンクごとに,異なるTOS(例えば,衛星リンクコストをベストエフォートに対して低く,リアルタイムに対して高く設定)に対して複数のコストメトリックを使用可能

ユニ,マルチキャストサポートの統合: マルチキャストOSPF (MOSPF) は,OSPFと同じトポロジデータベースを使用

大きなドメインでは階層OSPF を使用

Network Layer 4-76

階層 OSPF

Network Layer 4-77

階層 OSPF

2レベル階層: ローカルエリア,バックボーンリンクステート広告はエリア内のみ

各ノードはエリア内の詳細なトポロジ情報を有する;他のエリアのネットワークへの方向(最短パス)のみを知る

エリア境界ルータ: 自身のエリア内のネットワークへの距離

を“要約”し,他のエリア境界ルータに広告する

バックボーンルータ: バックボーンに制限された OSPFルーティングを実行

バウンダリルータ: 他の AS へ接続

Network Layer 4-78

インターネット inter-AS ルーティング: BGP

Figure 4.5.2-new2: BGP use for inter-domain routing

AS2 (OSPF

intra-AS routing)

AS1 (RIP intra-AS

routing) BGP

AS3 (OSPF intra-AS

routing)

BGP

R1 R2

R3

R4

R5

Page 14: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

14

Network Layer 4-79

インターネット inter-AS ルーティング: BGP

BGP (Border Gateway Protocol): デファクトスタンダードパスベクトル プロトコル:距離ベクトルプロトコルに類似

各 Border Gateway は,隣接ゲートウェイ(ピア)に目的ネットワークへの全パス(すなわち,ASの系列)をブロードキャストする

BGP は,個々のホストではなくネットワーク (AS)への経路を決定する

例,ゲートウェイ X は,Z へのパスを送信:

Path (X,Z) = X,Y1,Y2,Y3,…,ZNetwork Layer 4-80

インターネット inter-AS ルーティング: BGP

仮定: ゲートウェイ X がピアゲートウェイW にパスを送信W が X によって提供されたパスを選択するかどうかは任意コスト,ポリシー(競合する AS を介したくない),ループ防止,などの理由から

W が X から提供されパスを選択した場合:Path (W,Z) = w, Path (X,Z)

注意: X は,ピアへのルート広告を制御することで,流入トラヒックを制御できる:

例,Z へのトラヒックを通したくない → Z への経路を広告しない

Network Layer 4-81

BGP: 誰が自分を経由するかを制御

Figure 4.5-BGPnew: a simple BGP scenario

A

B

C

W X

Y

legend:

customer network:

provider network

A,B,C : プロバイダネットワークX,W,Y: プロバイダ利用者X はデュアルホーム: 二つのネットワークに接続

X は,Xを介した B から C への経路を望まないX は,B に C への経路を広告しない

Network Layer 4-82

BGP: 誰が自分を経由するかを制御

Figure 4.5-BGPnew: a simple BGP scenario

A

B

C

W X

Y

legend:

customer network:

provider network

A は B にパス AW を広告B は X にパス BAW を広告B は C にパス BAW を広告すべきか?とんでもない!W も C も B の顧客ではないため,B は CBAW と経由させてもいかなる収入もない

B は,C が A を介した w への経路を利用するよう強制したいB は,自分の顧客への/からの経路のみを望む!

Network Layer 4-83

BGP オペレーション

Q: BGP ルータは何をするのか?隣接ゲートウェイからのルート広告を受信,フィルタリング

経路選択

終点 X への経路を向けるために,いくつかの広告されたパスのうちどれを選択するだろうか?

ルート広告を隣接ゲートウェイに送信

Network Layer 4-84

BGP メッセージ

BGP メッセージは TCP を介して交換されるBGP メッセージ:

OPEN: ピアに TCP コネクションをオープンし,送信ピアを認証する

UPDATE:新しいパスを広告する(あるいは古いパスを破棄する)

KEEPALIVE: UPDATE がなくてもコネクションを維持する; また,OPEN 要求に ACK を返すNOTIFICATION: 直前のメッセージにエラーを返す;また,コネクションをクローズするのにも利用される

Page 15: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

15

Network Layer 4-85

なぜ Intra- と Inter-AS ルーティングは異なるのか?

ポリシー:Inter-AS: 管理者は,自身のネットワークをどのくらいのトラヒックが経由するのか,誰が経由するのかを制御したい

Intra-AS: 一元管理だから,ポリシー決定の必要はないスケール:階層ルーティングは,テーブルサイズを節約し,更新トラヒックを削減する

性能:Intra-AS: 性能に重点をおくことが可能Inter-AS: 性能よりポリシーが重要

Network Layer 4-86

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-87

ルータアーキテクチャの概要

二つの主要機能:経路制御アルゴリズム/プロトコルの実行 (RIP, OSPF, BGP)入力リンクから出力リンクへのデータグラムの交換

Network Layer 4-88

入力ポート機能

分散入力ポート処理:データグラムの宛先にもとづき,入力ポート内の経路制御表を使って出力ポートをルックアップ

目標:ラインスピードでの入力ポート処理

待つ行列:交換基盤への転送レート以上の速度でデータグラムが到着した場合

物理層:ビットレベルの受信

データリンク層:e.g., Ethernet

5章参照

Network Layer 4-89

入力ポート待ち行列

交換基盤速度が入力ポート速度の合計より低い場合

⇒入力ポートで待ち行列が形成される可能性

ヘッドオブライン(HOL) ブロッキング: 待ち行列の先頭データグラムが,競合しないポートを目指す,背後のデータグラムをブロック

待ち行列遅延や入力ポートキューでのバッファオーバフローによる廃棄

Network Layer 4-90

3種類の交換基盤

Page 16: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

16

Network Layer 4-91

メモリ型交換基盤

第一世代ルータ:パケットはシステムの(単一)CPUによりコピーされる速度はメモリ帯域によって制限(データグラムあたり2度バ

スを通過)

InputPort

OutputPort

Memory

System Bus

現在のルータ:入力ポートプロセッサがルックアップとメモリへのコピーを

実行(共有メモリアーキテクチャ)

Cisco Catalyst 8500Network Layer 4-92

バス型交換基盤

共有バスを介して入力ポートメモリから出力ポートメモリへデータグラム転送バス競合:交換速度はバス帯域によって制限1 Gbps bus, Cisco 1900: アクセスルータ,エンタープライズルータでは十分な交換速度(非広域・バックボーンルータ)

Network Layer 4-93

内部接続網(クロスバスイッチ)型交換基盤

バス帯域制約の解決

バンヤンネットワーク,他がマルチプロセッサにおけるプロセッサ接続に利用

先端設計: データグラムを固定長セルに分割し,交換基盤を介してセルを転送

Cisco 12000: 最大 60 Gbpsの交換能力

Network Layer 4-94

出力ポート

データグラムが出力リンク速度を超えて交換基盤から到着した場合にバッファリングが発生

スケジューリング規律により伝送するデータグラムを選択(FIFOとは限らない)

Network Layer 4-95

出力ポート待ち行列

出力リンク速度を超えて交換基盤からデータグラムが到着した場合に待ち行列が形成される

待ち行列遅延や出力ポートバッファあふれによる廃棄!

Network Layer 4-96

Chapter 4 roadmap4.1 Introduction and Network Service Models4.2 Routing Principles4.3 Hierarchical Routing4.4 The Internet (IP) Protocol4.5 Routing in the Internet4.6 What’s Inside a Router?4.7 IPv64.8 Multicast Routing4.9 Mobility

Page 17: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

17

Network Layer 4-97

IPv6Initial motivation: 32-bit address space completely allocated by 2008. Additional motivation:

header format helps speed processing/forwardingheader changes to facilitate QoS new “anycast” address: route to “best” of several replicated servers

IPv6 datagram format:fixed-length 40 byte headerno fragmentation allowed

Network Layer 4-98

IPv6 Header (Cont)Priority: identify priority among datagrams in flowFlow Label: identify datagrams in same “flow.”

(concept of“flow” not well defined).Next header: identify upper layer protocol for data

Network Layer 4-99

Other Changes from IPv4

Checksum: removed entirely to reduce processing time at each hopOptions: allowed, but outside of header, indicated by “Next Header” fieldICMPv6: new version of ICMP

additional message types, e.g. “Packet Too Big”multicast group management functions

Network Layer 4-100

Transition From IPv4 To IPv6

Not all routers can be upgraded simultaneousno “flag days”How will the network operate with mixed IPv4 and IPv6 routers?

Two proposed approaches:Dual Stack: some routers with dual stack (v6, v4) can “translate” between formatsTunneling: IPv6 carried as payload in IPv4 datagram among IPv4 routers

Network Layer 4-101

Dual Stack Approach

A B E F

IPv6 IPv6 IPv6 IPv6

C D

IPv4 IPv4

Flow: XSrc: ADest: F

data

Flow: ??Src: ADest: F

data

Src:ADest: F

data

A-to-B:IPv6

Src:ADest: F

data

B-to-C:IPv4

B-to-C:IPv4

B-to-C:IPv6

Network Layer 4-102

TunnelingA B E F

IPv6 IPv6 IPv6 IPv6

tunnelLogical view:

Physical view:A B E F

IPv6 IPv6 IPv6 IPv6

C D

IPv4 IPv4

Flow: XSrc: ADest: F

data

Flow: XSrc: ADest: F

data

Flow: XSrc: ADest: F

data

Src:BDest: E

Flow: XSrc: ADest: F

data

Src:BDest: E

A-to-B:IPv6

E-to-F:IPv6B-to-C:

IPv6 insideIPv4

B-to-C:IPv6 inside

IPv4

Page 18: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

18

Network Layer 4-103

Chapter 4 roadmap4.1 Introduction and Network Service Models4.2 Routing Principles4.3 Hierarchical Routing4.4 The Internet (IP) Protocol4.5 Routing in the Internet4.6 What’s Inside a Router?4.7 IPv64.8 Multicast Routing4.9 Mobility

Network Layer 4-104

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-105

Multicast: one sender to many receivers

Multicast: act of sending datagram to multiple receivers with single “transmit” operation

analogy: one teacher to many studentsQuestion: how to achieve multicast

Multicast via unicastsource sends N unicast datagrams, one addressed to each of N receivers

multicast receiver (red)not a multicast receiver (red)

routersforward unicastdatagrams

Network Layer 4-106

Multicast: one sender to many receivers

Multicast: act of sending datagram to multiple receivers with single “transmit” operation

analogy: one teacher to many studentsQuestion: how to achieve multicast

Network multicastRouter actively participate in multicast, making copies of packets as needed and forwarding towards multicast receiversMulticast

routers (red) duplicate and forward multicast datagrams

Network Layer 4-107

Multicast: one sender to many receivers

Multicast: act of sending datagram to multiple receivers with single “transmit” operation

analogy: one teacher to many studentsQuestion: how to achieve multicast

Application-layer multicastend systems involved in multicast copy and forward unicast datagrams among themselves

Network Layer 4-108

Internet Multicast Service Model

multicast group concept: use of indirectionhosts addresses IP datagram to multicast grouprouters forward multicast datagrams to hosts that have “joined” that multicast group

128.119.40.186

128.59.16.12

128.34.108.63

128.34.108.60

multicast group

226.17.30.197

Page 19: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

19

Network Layer 4-109

Multicast groupsclass D Internet addresses reserved for multicast:

host group semantics:o anyone can “join” (receive) multicast groupo anyone can send to multicast groupo no network-layer identification to hosts of

membersneeded: infrastructure to deliver mcast-addressed datagrams to all hosts that have joined that multicast group

Network Layer 4-110

Joining a mcast group: two-step process

local: host informs local mcast router of desire to join group: IGMP (Internet Group Management Protocol)wide area: local router interacts with other routers to receive mcast datagram flow

many protocols (e.g., DVMRP, MOSPF, PIM)

IGMPIGMP

IGMP

wide-areamulticast

routing

Network Layer 4-111

IGMP: Internet Group Management Protocol

host: sends IGMP report when application joins mcast group

IP_ADD_MEMBERSHIP socket optionhost need not explicitly “unjoin” group when leaving

router: sends IGMP query at regular intervalshost belonging to a mcast group must reply to query

query report

Network Layer 4-112

IGMPIGMP version 1

router: Host Membership Query msg broadcast on LAN to all hosts host: Host Membership Report msg to indicate group membership

randomized delay before respondingimplicit leave via no reply to Query

RFC 1112

IGMP v2: additions includegroup-specific QueryLeave Group msg

last host replying to Query can send explicit Leave Group msgrouter performs group-specific query to see if any hosts left in groupRFC 2236

IGMP v3: under development as Internet draft

Multicast Routing: Problem StatementGoal: find a tree (or trees) connecting routers having local mcast group members

tree: not all paths between routers usedsource-based: different tree from each sender to rcvrsshared-tree: same tree used by all group members

Shared tree Source-based trees

Approaches for building mcast trees

Approaches:source-based tree: one tree per source

shortest path treesreverse path forwarding

group-shared tree: group uses one treeminimal spanning (Steiner) center-based trees

…we first look at basic approaches, then specific protocols adopting these approaches

Page 20: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

20

Shortest Path Tree

mcast forwarding tree: tree of shortest path routes from source to all receivers

Dijkstra’s algorithm

R1

R2

R3

R4

R5

R6 R7

21

6

3 45

i

router with attachedgroup member

router with no attachedgroup memberlink used for forwarding,i indicates order linkadded by algorithm

LEGENDS: source

Reverse Path Forwarding

if (mcast datagram received on incoming link on shortest path back to center)then flood datagram onto all outgoing linkselse ignore datagram

rely on router’s knowledge of unicast shortest path from it to sendereach router has simple forwarding behavior:

Reverse Path Forwarding: example

• result is a source-specific reverse SPT– may be a bad choice with asymmetric links

R1

R2

R3

R4

R5

R6 R7

router with attachedgroup member

router with no attachedgroup memberdatagram will be forwarded

LEGENDS: source

datagram will not be forwarded

Reverse Path Forwarding: pruningforwarding tree contains subtrees with no mcast group members

no need to forward datagrams down subtree“prune” msgs sent upstream by router with no downstream group members

R1

R2

R3

R4

R5

R6 R7

router with attachedgroup memberrouter with no attachedgroup memberprune message

LEGENDS: source

links with multicastforwarding

P

P

P

Shared-Tree: Steiner Tree

Steiner Tree: minimum cost tree connecting all routers with attached group membersproblem is NP-completeexcellent heuristics existsnot used in practice:

computational complexityinformation about entire network neededmonolithic: rerun whenever a router needs to join/leave

Center-based trees

single delivery tree shared by allone router identified as “center” of treeto join:

edge router sends unicast join-msg addressed to center routerjoin-msg “processed” by intermediate routers and forwarded towards centerjoin-msg either hits existing tree branch for this center, or arrives at centerpath taken by join-msg becomes new branch of tree for this router

Page 21: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

21

Center-based trees: an example

Suppose R6 chosen as center:

R1

R2

R3

R4

R5

R6 R7

router with attachedgroup memberrouter with no attachedgroup memberpath order in which join messages generated

LEGEND

21

3

1

Internet Multicasting Routing: DVMRP

DVMRP: distance vector multicast routing protocol, RFC1075flood and prune: reverse path forwarding, source-based tree

RPF tree based on DVMRP’s own routing tables constructed by communicating DVMRP routers no assumptions about underlying unicastinitial datagram to mcast group flooded everywhere via RPFrouters not wanting group: send upstream prune msgs

DVMRP: continued…soft state: DVMRP router periodically (1 min.) “forgets” branches are pruned:

mcast data again flows down unpruned branchdownstream router: reprune or else continue to receive data

routers can quickly regraft to tree following IGMP join at leaf

odds and endscommonly implemented in commercial routersMbone routing done using DVMRP

TunnelingQ: How to connect “islands” of multicast

routers in a “sea” of unicast routers?

mcast datagram encapsulated inside “normal” (non-multicast-addressed) datagramnormal IP datagram sent thru “tunnel” via regular IP unicast to receiving mcast routerreceiving mcast router unencapsulates to get mcast datagram

physical topology logical topology

PIM: Protocol Independent Multicast

not dependent on any specific underlying unicast routing algorithm (works with all)

two different multicast distribution scenarios :

Dense:group members densely packed, in “close” proximity.bandwidth more plentiful

Sparse:# networks with group members small wrt # interconnected networksgroup members “widely dispersed”bandwidth not plentiful

Consequences of Sparse-Dense Dichotomy:

Densegroup membership by routers assumed until routers explicitly prunedata-driven construction on mcast tree (e.g., RPF)bandwidth and non-group-router processing profligate

Sparse:no membership until routers explicitly joinreceiver- drivenconstruction of mcast tree (e.g., center-based)bandwidth and non-group-router processing conservative

Page 22: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

22

PIM- Dense Mode

flood-and-prune RPF, similar to DVMRP butunderlying unicast protocol provides RPF info for incoming datagramless complicated (less efficient) downstream flood than DVMRP reduces reliance on underlying routing algorithmhas protocol mechanism for router to detect it is a leaf-node router

PIM - Sparse Mode

center-based approachrouter sends join msg to rendezvous point (RP)

intermediate routers update state and forward join

after joining via RP, router can switch to source-specific tree

increased performance: less concentration, shorter paths

R1

R2

R3

R4

R5

R6R7

join

join

join

all data multicastfrom rendezvouspoint

rendezvouspoint

PIM - Sparse Mode

sender(s):unicast data to RP, which distributes down RP-rooted treeRP can extend mcast tree upstream to sourceRP can send stop msg if no attached receivers

“no one is listening!”

R1

R2

R3

R4

R5

R6R7

join

join

join

all data multicastfrom rendezvouspoint

rendezvouspoint

Network Layer 4-130

Chapter 4 roadmap4.1 Introduction and Network Service Models4.2 Routing Principles4.3 Hierarchical Routing4.4 The Internet (IP) Protocol4.5 Routing in the Internet4.6 What’s Inside a Router?4.7 IPv64.8 Multicast Routing4.9 Mobility

Network Layer 4-131

Chapter 4 内容4.1 イントロダクションとネットワークサービスモデル4.2 経路制御の原理4.3 階層経路制御4.4 The Internet (IP) プロトコル4.5 インターネットにおけるルーティング4.6 ルータの内部構造4.7 IPv64.8 マルチキャストルーティング4.9 モビリティ

Network Layer 4-132

What is mobility?

spectrum of mobility, from the network perspective:

no mobility high mobility

mobile user, usingsame access point

mobile user, passing through multiple access point while maintaining ongoing connections (like cell phone)

mobile user, connecting/ disconnecting from network using DHCP.

Page 23: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

23

Network Layer 4-133

Mobility: Vocabularyhome network: permanent “home” of mobile(e.g., 128.119.40/24)

Permanent address:address in home network, can always be used to reach mobilee.g., 128.119.40.186

home agent: entity that will perform mobility functions on behalf of mobile, when mobile is remote

wide area network

correspondent

Network Layer 4-134

Mobility: more vocabulary

Care-of-address: address in visited network.(e.g., 79,129.13.2)

wide area network

visited network: network in which mobile currently resides (e.g., 79.129.13/24)

Permanent address: remains constant (e.g., 128.119.40.186)

home agent: entity in visited network that performs mobility functions on behalf of mobile.

correspondent: wants to communicate with mobile

Network Layer 4-135

How do you contact a mobile friend:

search all phone books?call her parents?expect her to let you know where he/she is?

I wonder where Alice moved to?

Consider friend frequently changing addresses, how do you find her?

Network Layer 4-136

Mobility: approaches

Let routing handle it: routers advertise permanent address of mobile-nodes-in-residence via usual routing table exchange.

routing tables indicate where each mobile locatedno changes to end-systems

Let end-systems handle it: indirect routing: communication from correspondent to mobile goes through home agent, then forwarded to remotedirect routing: correspondent gets foreign address of mobile, sends directly to mobile

Network Layer 4-137

Mobility: approaches

Let routing handle it: routers advertise permanent address of mobile-nodes-in-residence via usual routing table exchange.

routing tables indicate where each mobile locatedno changes to end-systems

let end-systems handle it: indirect routing: communication from correspondent to mobile goes through home agent, then forwarded to remotedirect routing: correspondent gets foreign address of mobile, sends directly to mobile

not scalable

to millions ofmobiles

Network Layer 4-138

Mobility: registration

End result:Foreign agent knows about mobileHome agent knows location of mobile

wide area network

home networkvisited network

1

mobile contacts foreign agent on entering visited network

2

foreign agent contacts home agent home: “this mobile is resident in my network”

Page 24: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

24

Network Layer 4-139

Mobility via Indirect Routing

wide area network

homenetwork

visitednetwork

3

24

1correspondent addresses packets using home address of mobile

home agent intercepts packets, forwards to foreign agent

foreign agent receives packets, forwards to mobile

mobile replies directly to correspondent

Network Layer 4-140

Indirect Routing: commentsMobile uses two addresses:

permanent address: used by correspondent (hence mobile location is transparent to correspondent)care-of-address: used by home agent to forward datagrams to mobile

foreign agent functions may be done by mobile itselftriangle routing: correspondent-home-network-mobile

inefficient when correspondent, mobile are in same network

Network Layer 4-141

Forwarding datagrams to remote mobile

Permanent address: 128.119.40.186

Care-of address: 79.129.13.2

dest: 128.119.40.186

packet sent by correspondent

dest: 79.129.13.2 dest: 128.119.40.186

packet sent by home agent to foreign agent: a packet within a packet

dest: 128.119.40.186

foreign-agent-to-mobile packet

Network Layer 4-142

Indirect Routing: moving between networks

suppose mobile user moves to another network

registers with new foreign agentnew foreign agent registers with home agenthome agent update care-of-address for mobilepackets continue to be forwarded to mobile (but with new care-of-address)

Mobility, changing foreign networks transparent: on going connections can be maintained!

Network Layer 4-143

Mobility via Direct Routing

wide area network

homenetwork

visitednetwork

4

2

41correspondent requests, receives foreign address of mobile

correspondent forwards to foreign agent

foreign agent receives packets, forwards to mobile

mobile replies directly to correspondent

3

Network Layer 4-144

Mobility via Direct Routing: comments

overcome triangle routing problemnon-transparent to correspondent:correspondent must get care-of-address from home agent

What happens if mobile changes networks?

Page 25: Chapter 4 Chapter 4: Network Layer - Kobe Universityohta/old_public_html/... · ATM 電話網から発展 会話: 同期,信頼性への要求条件 品質保証サービスの必要性

25

Network Layer 4-145

Mobile IP

RFC 3220has many features we’ve seen:

home agents, foreign agents, foreign-agent registration, care-of-addresses, encapsulation (packet-within-a-packet)

three components to standard:agent discoveryregistration with home agentindirect routing of datagrams

Network Layer 4-146

Mobile IP: agent discoveryagent advertisement: foreign/home agents advertise service by broadcasting ICMP messages (typefield = 9)

RBHFMGV bits reserved

type = 16

type = 9 code = 0 checksum

router address standard

ICMP fields

mobility agent advertisement

extension

length sequence #

registration lifetime

0 or more care-of-addresses

0 8 16 24

R bit: registration required

H,F bits: home and/or foreign agent

Network Layer 4-147

Mobile IP: registration example

visited network: 79.129.13/24 home agent

HA: 128.119.40.7 foreign agent

COA: 79.129.13.2 COA: 79.129.13.2

….

ICMP agent adv. Mobile agent MA: 128.119.40.186

registration req. COA: 79.129.13.2 HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 9999 identification:714 ….

registration req. COA: 79.129.13.2 HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 9999 identification: 714 encapsulation format ….

registration reply

HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 4999 Identification: 714 encapsulation format ….

registration reply

HA: 128.119.40.7 MA: 128.119.40.186 Lifetime: 4999 Identification: 714 ….

time

Network Layer 4-148

Network Layer: summary

Next stop:the Datalink layer!

What we’ve covered:network layer servicesrouting principles: link state and distance vectorhierarchical routingIPInternet routing protocols RIP, OSPF, BGPwhat’s inside a router?IPv6mobility