RFC1771中文版(zt)
时间:2009-05-13 08:29来源: 作者: 点击:
次
NetworkWorkingGroupY.
Rekhter
RequestforComments:1771T.J.WatsonResearchCenter,IBM
Corp.
Obsoletes:1654T.
Li
Category:StandardsTrackcisco
Systems
Editors
March
1995
边界网关协议版本4(BGP-4)
(RFC1771ABorderGatewayProtocol4(BGP-4))
本备忘录的状态
本文档讲述了一种Internet社区的Internet标准跟踪协议,它需要进一步进行讨论
和
建议以得到改进。请参考最新版的"Internet正式协议标准"(STD1)来获得本协议
的标准
化程度和状态。本备忘录的发布不受任何限制。
摘要
本文档,以及随同文档,"边检网关协议在互联网中的应用",定义了互联网的自
治系
统间路由协议。
目录
1.致谢3
2.介绍3
3.操作总结4
3.1路由:通告和存储5
3.2路由信息库5
4.消息格式5
4.1消息头格式6
4.2OPEN消息格式6
4.3UPDATE消息格式8
4.4KEEPALIVE消息格式13
4.5NOTIFICATION消息格式13
5.路径属性15
5.1路径属性使用16
5.1.1ORIGIN16
5.1.2AS-PATH16
5.1.3NEXT-HOP16
5.1.4MULTI-EXIT-DISC17
5.1.5LOCAL_PREF17
5.1.6ATOMIC_AGGREGATE17
5.1.7AGGREGATOR18
6.BGP错误处理18
6.1消息头错误处理.18
6.2OPEN消息错误处理19
6.3UPDATE消息错误处理19
6.4NOTIFICATION消息错误处理20
6.5HOLDTIMER溢出错误处理20
6.6有限状态及错误处理.20
6.7终止21
6.8连接冲突检测21
7.BGP版本商议21
8.BGP有限状态机22
9.UPDATE消息处理25
9.1决策过程26
9.1.1Phase1:优先级的计算26
9.1.2Phase2:路由选择27
9.1.3Phase3:路由分发28
9.1.4路由重叠29
9.2UPDATE发送过程29
9.2.1内部更新30
9.2.2外部更新31
9.2.3控制路由流量开销31
9.2.4路由信息的有效组织32
9.3路由选择标准34
9.4产生BGP路由34
附录1.BGPFSM状态转换和行为34
附录2.对比RFC126737
附录3.对比RFC166338
附录4.对比RFC110538
附录5.BGP可能使用的TCP选项39
附录6.应用建议39
6.1每个消息的多网络前缀39
6.2使用流协议40
6.3减少路由抖动40
6.4BGP计时器40
6.5路径属性顺序40
6.6AS_SET排序41
6.7版本商议控制41
6.8复杂AS_PATH聚合41
参考41
安全考虑42
作者地址42
1.致谢
本文档初版是1991年10月的RFC1267,由KirkLougheed(cisco系统)和
Yakov
Rekhter(IBM)合作。
我们意欲感谢GuyAlmes(ANS),LenBosack(cisco系统),和JeffreyC.Honig
(Cornell大学)对本文档早期版本的贡献。
我们特别感谢BobBraden(ISI)回顾本文档的早期版本并作出了建设性有价值的
评论。
我们同时感谢BobHinden,InternetEngineeringSteeringGroup路由主管,以
及他
组织回顾早期版本(BGP-2)的小组。本小组,包括DeborahEstrin,MiloMedin,
JohnMoy,
RadiaPerlman,MarthaSteenstrup,MikeSt.Johns,和PaulTsuchiya,工
作顽强专
业谦逊。
本文档作为更新版本是编者YakovRekhterandTonyLi的IETFIDR工作组的产
品。
本文档某些部分广泛参考了IDRP[7],BGP的OSI对等协议。为此感谢ANSIX3S3.3
组,主席
是LymanChapin(BBN),编辑是CharlesKunzinger(IBMCorp.)。同时感谢Mike
Craren
(Proteon,Inc.),DimitryHaskin(BayNetworks,Inc.),JohnKrawczyk(Bay
Networks,
Inc.),和PaulTraina(ciscoSystems)的深刻评论。
我们特别感谢DennisFerguson(MCI)的巨大贡献。
YakovRekhter的工作资金部分来自NationalScienceFoundation,批号
NCR-9219216.
2.介绍
边界网关协议(BGP)是自治系统间路由协议。它的建立来源于RFC904[1]中定义
的EGP以及RFC1092[2]和RFC1093[3]中描述的EGP在NSFNET骨干网中的使用。
BGP交互系统的主要功能是和其他的BGP系统交换网络可达信息。网络可达信息包
括可达信息经过的自治系统(AS)列表上的信息。这些信息有效地构造了AS互联图
并由此清除了路由环路同时在AS级别上实施了策略决策。
BGP-4提供了一套新的机制来支持无类别域间路由。这些机制包括支持网络前缀的
通告取消BGP网络中"类"的概念。BGP-4也引入机制支持路由聚合,包括AS路径的聚
合。这些改变为[8,9]建议的超网方案提供了支持。
为了描述BGP执行的策略决策集,集中讲述BGP发言者通告他自己使用的路由到相
邻AS中对端(与之通信的别的BGP发言者)的规则。这些规则反映了当今互联网广
泛使用的"一跳一跳"路由范例。注意一些策略不被"一跳一跳路由范例支持,所以
需要执行比如源路由之类的技术。例如,BGP不支持AS发送流量到相邻的AS,并想
要产生于邻居AS的流量带有不同的路由。
另一方面,BGP支持任何与"一跳一跳"一致的策略。由于当前互联网只使用"一跳一
跳"路由范例同时BGP支持与范例一致的策略,BGP作为AS间路由协议非常适用于当
今互联网。
BGP能否执行哪些策略超出了本文档的讨论范围(请参考讨论BGP使用的随同文档
[5])。
BGP运行在稳定的传输协议上。这样就不用再更新分段,重传,应答和排序。传输
协议使用的认证机制可以作为BGP自己的认证机制的附加。BGP的错误通知机制假定
传输协议支持"体面"关闭,也就是说,在联接关闭之前所有的突出数据要被发送。
BGP使用TCP[4]作为传输协议。TCP满足BGP的传输需求并在所有的商业路由器和主
机上使用。在后面的叙述中,术语"传输协议连接"可以理解为TCP连接。BGP使用
TCP端口179建立连接。
本文档使用术语自治系统(AS)。自治系统的经典定义是在统一技术管理下的一
系列路由器,在AS内部使用内部网关协议和通用的度量路由数据包,在AS外部使用
外部网关协议路由数据包到其他的ASs。由于本定义的发展,通常一个AS可以使用
几个内部网关协议同时在AS内部使用多种度量。使用自治系统这个术语强调了以下
事实,即使使用了多个IGP和度量,对别的AS而言,AS的管理对于其他的ASs来说表
现出一致的路由计划和一致的目的地可达。
在互联网中使用BGP的计划,包括拓扑问题,BGP和IGP的交互,路由策略规则的实
施,在随同文档[5]中表述。本文档是一系列探究BGP应用各方面问题计划的开始。
请发表评论到
BGP邮件列表(bgp@ans.net).
3.操作总结
两个系统通过传输协议互联。他们交换消息来打开和确认连接参数。初始的数据流
是整个BGP路由表。路由表改变时发送增加的更新。BGP不需要对整个的BGP路由表
作周期性的更新。因此,BGP发言者必须保存在连接期间所有对等体的整个BGP路由
表的当前版本。KeepAlive心跳消息周期性发送来保证连接的存在。通知消息用于
报错或者特别情况。如果一个连接遇到一个错误情况,要发送通知消息并且关连接
。
执行边界网关协议的主机不一定是路由器。一个非路由主机可以通过EGP甚至内部
网关协议和路由器交换路由信息。然后非路由主机可以通过BGP和别的AS中的边界
路由器交换路由信息。这种应用构架可以用于更进一步的研究。
如果一个特定AS有多个BGP发言者同时为别的AS提供中转业务,应该注意保证本
AS中对路由有一致的观点。AS内部路由的一致看法由内部路由协议提供。AS外部对
路由的一致看法由所有AS内部的BGP发言者保持BGP一一互联提供。使用通常的策略
,BGP发言者对哪一个边界路由器作为和别的AS的外出/进入点服务达成了一致。这
些信息可能通过内部网关协议通信到AS的内部路由器。注意在BGP发言者把中转业
务通告到别的AS之前所有的内部路由器需要更新中转信息。
不同AS之间的BGP发言者的连接被称为"外部"链接。同一个AS内部的BGP连接被称
为"内部"链接。同样,不同AS之间的对端被称为外部对端,相同AS之间的对端被称
为内部对端。
3.1路由:通告和存储
从协议的用途出发,路由被定义为组合了一个目的地和到这个目的地的路径属性
的信息单位。
-路由在一对BGP发言者之间通过UPDATE消息通告。目的地也就是在网络层可达
信息(NLRI)内报告的IP地址,路径是在UPDATE消息路径属性字段内报告的信息。
-路由存储在路由信息库(RIB)内:也就是theAdj-RIBs-In,theLoc-RIB,and
theAdj-RIBs-Out.将被通告到别的BGP发言者的路由放在Adj-RIB-Out里;在本
地BGP发言者使用的路由放在Loc-RIB,这些路由的下一跳信息保存在BGP发言者的
转发信息库内;从别的BGP发言者收到的路由信息保存在Adj-RIBs-In内部。
如果一个BGP发言者选择路由通告,他可以在通告路由到对端之前加入和修改路由
的路径属性。
BGP提供了机制告诉对端先前的路由通告不再能使用。有三种方式供BGP发言者
指示撤销某条路由的服务。
a)对于先前通告的路由,在UPDATE消息的WITHDRAWNROUTES字段内通告了到目的
地IP前缀,这样相应的路由被标志为不再使用,
b)有相同网络层可达信息的替代路由能够被通告,
c)BGP发言者-发言者的连接能够关闭,这意味着从服务里撤销这一对发言者互相
通告的所有的路由。
3.2路由信息库
BGP发言者的路由信息库(RIB)包括三个不同部分:
a)Adj-RIBs-In:Adj-RIBs-In保存了从输入UPDATE消息学习到的路由信息,这是
决策过程的输入。
b)Loc-RIB:Loc-RIB保存了BGP发言者根据本地策略在Adj-RIBs-In内选择的本地路
由信息。
c)Adj_RIBs_Out:Adj_RIBs_Out保存了本地BGP发言者通告到对端的路由。
本地BGP发言者的UPDATE消息包含了放在Adj_RIBs_Out内部的路由信息发送到对端
。
总之,Adj_RIB_In包括了对端通告到本地BGP发言者的未处理的路由信息;
Loc_RIB包括了被本地决策过程选择的路由信息;使用UPDATE消息通告,
Adj_RIBs_Out组织路由通告到特定对端。
尽管本概念模型区分Adj-RIBs-In,Loc-RIB,和Adj-RIBs-Out,这并不意味着也
没有必要在具体应用中维护路由信息的独立拷贝。应用的选择(例如,信息库的三
份拷贝或者一个拷贝的指针)不受协议限制。
4.消息格式
本章描述BGP的消息格式。
消息通过一个稳定的传输协议互联发送。消息只有在被完整收到之后才会处理。
最大的消息是4096字节。所有应用都支持最大消息长度。最小的消息就是一个不包
括消息体的BGP消息头,19字节。
4.1消息头格式
每一个消息包括一个定长的消息头。消息头后面可以/可以不包含数据部分,这取
决于消息类型。这些字段设计如下:
0123
01234567890123456789012345678901
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
||
+
+
|
|
+
+
|Marker|
+
+
|
|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Length|Type|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Marker(标记):
本16字节的字段包含消息接收者可以预测的值。如果消息类型是OPEN,或者OPEN
消息没有承载认证信息(作为可选参数),标记必须是全1。否者,标记的值要使
用认证机制来计算(认证机制是通过认证信息的一部分来指定的)。标记可以用来
探测BGP对端的同步丢失,认证进入的BGP消息。
长度(Length):
两字节无符号整数指定了消息的全长,包括头部字节。这也就是说,允许在
传输层数据流定位下一个消息(的标记字段)。长度的值必须最少19字节最大
4096字节,同时由于不同的消息类型有更多的约束。不允许"填充"多余的数据在消
息后,所以长度字段是需要有最小值。
类型(Type):
一字节的无符号整数制定了消息类型编码。如下定义:
1-OPEN
2-UPDATE
3-NOTIFICATION
4-KEEPALIVE
4.2OPEN消息格式
在传输协议连接建立之后,两边发送的第一个消息是OPEN消息。如果OPEN消息可以
接受,需要发回一个KEEPALIVE消息来确认OPEN消息。一旦确认了OPEN消息,
UPDATE,KEEKPALIVE和NOTIFICATION消息可以交换。
在定长的BGP消息头后面,OPEN消息包含下列字段:
0123
01234567890123456789012345678901
+-+-+-+-+-+-+-+-+
|Version|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|MyAutonomousSystem|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|HoldTime|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|BGPIdentifier|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|OptParmLen|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|
|
|OptionalParameters|
|
|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Version(版本):
1字节无符号整数指示消息的协议版本号。当前的BGP版本号是4。
MyAutonomousSystem(我的自治系统):
2字节无符号整数指示发送者自治系统号。
HoldTime(保持时间):
2字节的无符号整数指示了发送者期望的Hold计时器的秒数。在接收OPEN消息后,
BGP发言者必须使用自己配置的Hold计时器和收到的Hold计时器的较小值来计算
Hold计时器的值。Hold计时器必须是0或最少3秒。应用可以根据Hold计时器来拒绝
连接。计算好的值指示了在连续的KEEPALIVE和/或UPDATE消息之间可以流逝的最大
秒数。
BGPIdentifier(BGP标示符):
4字节无符号整数指示了BGP发言者的标示符。给定的BGP发言者设置BGP标示符为
IP地址。在启动的时候决定BGP标示符,对每一个本地端口和每一个对端是一样的
。
OptionalParametersLength(可选参数长度):
1字节无符号整数指示可选参数字段的字节总长度。如果这个字段是0,说明没有可
选参数。
OptionalParameters(可选参数):
这个字段包含了可选参数列表,每一个参数编码为<参数类型,参数长度,参数值
>三元组。
01
0123456789012345
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-...
|Parm.Type|Parm.Length|ParameterValue(variable)
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-...
参数类型是1个字节,明确指示了单个的参数。参数长度1字节包含参数值的字节长
度。参数值是变长字段,根据参数类型有不同的解释。
本文档定义了下列可选参数:
a)认证消息(参数类型1):
可选参数用来认证BGP对端。参数值包含1字节认证编码后面是变长的认证数据。
012345678
+-+-+-+-+-+-+-+-+
|Auth.Code|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|
|
|AuthenticationData|
|
|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
AuthenticationCode(认证编码):
1字节无符号整数指示了使用的认证机制。当认证机制指定用于BGP的时候,需要说
明三件事情:
-认证编码的值用来指示认证机制,
-认证数据的格式和含义,
-计算Marker字段值的算法。
注意在建立传输层连接时可以使用另外的认证机制。
0
AuthenticationData(认证数据):
这个字段的格式和含义取决于认证编码,它是变长的。
OPEN消息的最小长度是29字节(包括消息头)。
4.3UPDATE消息格式
UPDATE消息用来发送路由信息到BGP对端。UPDATE消息报内的信息可以被用来构造
AS之间的关系描述。通过应用以下讨论的规则,路由环路和别的异常可以测出并清
除出AS间路由。
UPDATE消息用来通告一条可用的到对端的路由,或者撤销多条不可用路由(见3。
1)。UPDATE消息可以同时通告一个可用路由并撤销多个不可用路由。UPDATE消息
总是包括定长消息头,同时可选的包括下面的字段:
+-----------------------------------------------------+
|UnfeasibleRoutesLength(2octets)|
+-----------------------------------------------------+
|WithdrawnRoutes(variable)|
+-----------------------------------------------------+
|TotalPathAttributeLength(2octets)|
+-----------------------------------------------------+
|PathAttributes(variable)|
+-----------------------------------------------------+
|NetworkLayerReachabilityInformation(variable)|
+-----------------------------------------------------+.
UnfeasibleRoutesLength(不可用路由长度):
2字节无符号整数指示了撤销路由的字节总长度。这个值必须保证网络层可达信息
字段的长度被确定。0说明没有撤销路由,UPDATE消息内部没有撤销路由。
WithdrawnRoutes(撤销路由):
这是一个可变长字段,包括一系列的IP前缀将要撤销的路由。每一个IP前缀编码为
〈长度,前缀〉二元组,如下描述:
+---------------------------+
|Length(1octet)|
+---------------------------+
|Prefix(variable)|
+---------------------------+
使用和含义如下:
a)Length(长度):
长度指示了IP前缀的比特数。0长度指示了匹配所有IP地址的前缀(前缀本身
为0字节)
b)Prefix(前缀):
前缀包含了IP地址前缀,后面是填充比特保证字段结尾符合字节边界。注意填充比
特的值无意义。
TotalPathAttributeLength(总的路径属性长度):
2字节无符号整数值是路径属性字段字节总长度。值必须使下文中网络层可达字段
的长度能够被决定。值0指示在UPDATE消息中没有网络层可达信息字段。
PathAttributes(路径属性):
在每一个UPDATE消息中有变长的路径属性序列。每一个路径属性是<属性类型,
属性长度,属性值>变长三元组
属性类型是2字节字段包括了属性标志字节和属性类型码字节。
01
0123456789012345
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Attr.Flags|Attr.TypeCode|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
属性标志字节第一高位比特(比特0)是可选比特。定义了属性是否是可选的
(设为1)或者是公认的(设为0)。
属性标志字节第二高位比特(比特1)是转发比特。定义一个可选的属性是否
是转发的(如果设置为1)或者不是转发的(设为0)。公认属性的转发位必须设为
1。看部分5讨论转发属性)。
属性标志字节的第三比特(比特2)是部分比特。它定义了包括在可选转发属
性内的信息是部分的(设置为1)还是完整的(设置为0)。(公认属性和可选非转
发属性)的部分位必须是0。
属性标志字节的第四比特(比特3)是扩展长度比特。定义了属性长度是1
字节(如果设置为0)还是2字节(如果设置为1)。仅仅当属性值超过255字节的时
候,扩展长度可以使用。
属性标志字节低字节顺序4比特没有被使用。必须填0(接收时不处理)。
属性类型编码字节包含了属性类型码。当前定义的属性类型码在部分5讨论。
如果属性标志字节的扩展长度比特被设置为0,路径属性的第三个字节包含了
属性数据的字节长度。
如果属性标志字节的扩展长度比特设置为1,那末路径属性的第三和第四个字
节包含了属性数据的字节长度。
路径属性剩下的字节代表属性值并且通过属性标识和属性类型码表示。支持的
属性类型码,它们的属性值和使用如下定义:
a)ORIGIN(类型码1):
ORIGIN是公认强制属性定义了路径信息的来源。本数据字节设定如下值:
值含义
0IGP-网络层可达信息和来源AS同内部
1EGP-网络层可达信息通过EGP学习
2INCOMPLETE-网络层可达信息通过别的方式学习
它的使用在5.1.1定义。
b)AS_PATH(类型编码2):
AS-PATH是公认强制属性由一系列AS路径段组成。每一个AS路径段表示为三元
组<路径段类型,路径段长度,路径段值>。
路径段类型是1字节长度字段有下列定义值。
值段类型
1AS_SET:在UPDATE消息中的路由经过的AS的无序集
2AS_SEQUENCE:在UPDATE消息中的路由经过的AS的
有序集
路径段长度是1字节长度的字段包含了在路径段值字段的AS的数量。
路径段值字段包含了一个或者多个AS号,每一个编码为2字节长度的字段。
属性的使用定义在5.1.2。
c)NEXT_HOP(类型码3):
这是一个公认强制属性,它定义了作为到达目的地作为下一跳的边界路由器的
IP地址,目的地列表于UPDATE消息的网络层可达字段。
属性的使用定义在5.1.3。
d)MULTI_EXIT_DISC(类型码4):
可选非转发属性是4字节非负整数。属性值可以被BGP发言者决策过程在相邻自治系
统中区分多个出口。
它的使用在5.1.4.定义。
e)LOCAL_PREF(类型编码5):
LOCAL-PREF是公认自决属性4字节非负整数。BGP发言者使用它通知别的BGP在
自己的自治系统中源发言者通告路由的优先程度。使用属性在5。1。5中描述。
f)ATOMIC_AGGREGATE(类型编码6)
ATOMIC-AGGREGATE是公认自决属性长度为0。BGP发言者使用它通知别的BGP发言者
本系统选择了一条更不特殊的路由而不是选择了一条更特殊的包括在内的路由。
使用这个属性描述在5。1。6。
g)AGGREGATOR(类型编码7)
AGGREGATOR是可选转发属性长度为6。属性包含了形成聚合路由最后的AS号码(编
码为2字节),后面是形成聚合路由的BGP发言者的IP地址(编码为4字节)。使用
这个属性描述在5。1。7。
NetworkLayerReachabilityInformation(网络层可达信息):
这个变长字段包含了IP地址前缀的列表。网络层可达信息的字节长度不是明确编
码的,但是可以计算如下:
UPDATE消息长度-23-总的路径属性长度-不可用路由长度。
其中UPDATE消息长度是定长BGP消息头的编码值,总的路径属性长度和不可用
路由长度是作为部分UPDATE消息的编码值。23是定长的BGP消息头,总的路径属性
长度字段和不可用路由长度字段的组合长度。
可达信息编码时作为一个或者多个二元组格式为〈长度,前缀〉,它们的字段描
述如下:
+---------------------------+
|Length(长度,1字节)|
+---------------------------+
|Prefix(变量)|
+---------------------------+
字段使用和含义如下:
a)长度:
长度字段指示了IP地址前缀的比特长度。0指示一个匹配了所有IP地址的前缀(前
缀本身0字节)
b)前缀:
前缀区字段包含了IP地址前缀并跟随足够的填充比特使该区字段的结尾能够落在字
节边界。注意填充比特的值不关紧要。
UPDTAE消息的最小长度是23字节-19字节定长消息头+2字节不可用路由长度
+2字节总的路径属性长度(不可用路由长度是0同时总的路径属性长度是0)。
UPDATE消息能够通告至少一条路由,路由可用几个路径属性描述。所有的包含在一
个给定的UPDATE消息里的路径属性适用于带在UPDATE消息中的网络层可达信息区字
段里的目的地。
一个UPDATE消息能够列出多个路由撤销服务。每一个路由通过目的地制定(表
示为IP前缀),明白的根据上下文指定了先前通告过的BGP发言者-BGP发言者连接
里的路由
一个UPDATE消息可以仅仅撤销路由,这样就不需要包括路径属性或者网络层可
达信息。相反,也可以仅仅通告可达路由,这样WITHDRAWNROUTES不需要了。
4.4KEEPALIVE消息格式
BGP不使用任何基于传输协议的keep-alive机制来确定对端是否可达。相反,
KEEPALIVE消息在对端之间交换的频率要满足HOLD计时器不溢出的标准。合理的最
大两个KEEPALIVE消息之间的时间是HOLD计时器间隔的1/3。KEEPALIVE消息必须不
能比每秒一个更频繁。应用可以调整发送KEEPALIVE消息的速率作为HOLDTIME间
隔的函数。如果议定的HOLDTIME间隔是0,周期性的KEKPALIVE消息必须不发送。
KEEPALIVE消息只包含消息头,长度是19字节。
4.5NOTIFICATION消息格式
NOTIFACATION消息在探测到错误情况时发送。发送之后BGP连接要立即关闭。
除了定长BGP消息头,NOTIFICATION消息包括下面的字段。
0123
0123456789012345678901234567890
1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Errorcode|Errorsubcode|Data
|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
+
|
|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
错误码:
1字节的无符号整数指示了NOTIFICATION的类型。下列的错误类型编码定义:
错误码符号名称参考
1消息头错误部分6.1
2OPEN消息错误部分6.2
3UPDATE消息错误部分6.3
4HoldTimer溢出部分6.5
5有限状态机错误部分6.6
6终止部分6.7
错误子码:
一个字节的无符号整数提供了更多的关于错误报告种类的信息。每一个错误可以有
一个或者多个错误子码,如果没有特别的错误子码定义,在错误子码字段填充0(
不具体)。
MessageHeaderErrorsubcodes(消息头错误子码):
1-连接未同步.
2-错误消息长度.
3-错误消息类型.
OPENMessageErrorsubcodes(OPEN消息错误子码):
1-不支持版本号.
2-错误对端AS.
3-错误的BGP标示符.'
4-不支持的选项参数.
5-认证失败.
6-不支持的HOLD时间.
UPDATEMessageErrorsubcodes(UPDATE消息错误子码):
1-畸形属性表.
2-未识别的公认属性
3-缺少公认属性
4-属性标志错误
5-属性长度错误
6-无效ORIGION属性
7-AS路由环路
8-无效的NEXT-HOP属性
9-可选参数错误
10-无效网络字段
11-畸形AS_PATH.
数据:
这个变长的字段用来诊断NOTIFICATION的原因。数据字段的内容依赖于错误码和错
误子码。部分6有详细说明。
注意数据字段的长度可以利用公式从消息长度来确定。
MessageLength=21+DataLength
NOTIFICATION消息最小的长度是21字节,(包括消息头)
5.路径属性
这个部分讨论UPDATE消息的路径属性。
路径属性分为下面四类。
1.Well-knownmandatory.(公认强制)
2.Well-knowndiscretionary.(公认自决)
3.Optionaltransitive.(可选转发)
4.Optionalnon-transitive.(可选非转发)
公认属性是所有BGP应用都要识别的。有一些属性是强制的而且必须被包括在每一
个APDATE消息内部。别的是自决的可以也可以不在特定的UPDATE消息内部发送。
所有的公认属性必须发送到BGP对端(在必要的更新之后)。
除了公认属性,每一个路径可以包括一个或者多个可选属性。不是所有的BGP应用
都要支持所有的可选属性。可选属性的处理是通过设置属性标志字节的转发比特来
确定的。带有未识别转发可选属性的路径应该被接受。如果一个未识别的转发可选
属性的路经被接受并且被转发到别的BGP对端,则未识别的路径转发可选属性必须
和路径一起传递到别的BGP对端,同时属性标志字节的部分位设置为1。如果一个路
径有可识别的转发可选属性被接受并且转发到别的BGP对端,他的属性标志字节的
部分比特被先前的AS设置为1,当前的AS不能把他设置为0。未识别的非转发可选属
性必须默默丢弃不能发送到别的BGP对端。
新的转发可选属性可以被起源者和别的AS附加到路径上。如果不是被其源者附加的
,属性标志字节的部分位被设置为1。附加新的非转发可选属性法则依赖于特定属
性的特性。每一非转发可选属性的文档要包括这些法则。(MULTI-EXIT-DISC属性
的描述给出了一个例子)所有可选的属性(转发和非专发的)可以被路径上的ASs
更新(如果合适)。
UPDATE消息的发送者要排序路径属性在UPDATE消息内为属性类型的升序。UPDATE消
息的接收者必须准备在乱序的UPDATE消息中处理路径属性。
同样的属性不能在特定UPDATE消息的路径属性字段内出现两次。
5.1路径属性使用
每一个BGP路径属性的使用描述如下:
5.1.1ORIGIN
ORIGIN是一个公认强制属性。ORIGIN属性是由产生相关路由信息的自治系统产
生的。所有选择通告路由到别的BGP发言者的BGP发言者可以把这个包括在UPDATE消
息内。
5.1.2AS-PATH
AS-PATH是公认强制属性。本属性定义了带有路由信息的UPDATE消息经过的AS。列
表的元素可以是AS_SET或者AS_SEQUENCE。
1.当BGP发言者通告从别的BGP发言者的UPDATE消息学习到的路由,应该根据路由
发送到的BGP发言者的位置,修改路由AS-PATH的属性。
a)当给定的BGP发言者通告路由到本AS的别的BGP发言者,通告发言者不应该修改路
由的AS-PATH属性。
b)当给定的BGP发言者通告路由到邻居AS的BGP发言者,通告发言者因该修改路由的
AS-PATH属性如下:
1)如果AS-PATH的第一个路径段是AS-SEQUENCE类型,本地系统应该把自己的AS号
码作为序列的最后一个元素加在后面(放在最左面)。
2)如果AS-PATH的第一个路径段是AS-SET类型,本地系统应该添加一个新
AS-SEQUENCE类型的路径段到AS_PATH,包括段的内部的自己AS号码。
2.当BGP发言者产生路由:
a)起源发言者应该把自己的AS号码包括在发送到邻居AS自治系统的BGP发言者的所
有UPDATE消息的AS-PATH属性中。(在这种情况下,起源发言者的自治系统号因该
是AS-PATH属性的唯一入口)。
b)起源发言者因该把一个空的AS-PATH属性包括在发送到本地自治系统的BGP发言者
的所有UPDATE消息的AS-PATH属性中。(空的AS-PATH属性是长度字段是0的属性)
5.1.3NEXT-HOP
NEXT-HOP路径属性定义了边界路由器的IP地址,作为到达的目的地下一跳而列表
于UPDATE消息中。如果边界路由器和对端属于同一个AS,对端是内部边界路由器
。否则,是外部边界路由器。BGP发言者可以通告任何内部边界路由器作为下一跳
,前提是边界路由器接口和它相应的ip地址(说明在NEXT-HOP路径属性中)和本地
以及远端边界路由器共享公共的子网。BGP发言者可以通告任何外部边界路由器作
为下一跳,前提是本边界路由器的IP地址是通过对端BGP发言者学习到的,同时边
界路由器的IP地址和它相应的接口(在NEXT-HOP路径属性中说明)和本地以及远端
的BGP发言者共享公共的子网。BGP发言者需要能够支持外部边界路由器的通告能力
不足。
BGP发言者必须不通告对端的一个地址作为NEXT-HOP到这个对端,作为这个发言者
产生的路由。BGP发言者必须不能安装路由把自己作为下一跳。
当BGP发言者通告路由到本地AS的BGP发言者,通告发言者不应该修改路由的
NEXT-HOP属性。当BGP发言者通过内部链路收到路由,可以转发包到NEXT-HOP地址
,如果属性中包含的地址是和本地以及远端BGP发言者在公共的子网上。
5.1.4MULTI-EXIT-DISC
MULTI-EXIT-DISC属性可以被用来在外部(AS间)链路上区分同一个邻居AS的多个
出口或者入口点。MULTI-EXIT-DISC属性的值是四个字节的无符号数称为一个
metric。所有别的因素相等,具有较低的度量的出口或者入口有较高的优先级。如
果在外部链路上收到,MULTI-EXIT-DISC属性可以通告到内部链路的同一个AS的别
的BGP发言者。MULTI-EXIT-DISC属性不能再通告到邻居AS的别的BGP发言者。
5.1.5LOCAL_PREF
LOCAL-PREF是公认自决属性,可以包括在发送到本地AS的BGP发言者的UPDATE消息
内。BGP发言者应该为每一条外部路由计算优先级程度同时在通告路由到内部对端
的时候包括这个优先级。优先级高的路由应该优先。BGP发言者因该使用通过
LOCAL-PREF学习到的优先级用于决策过程(见部分9。1。1)。
BGP发言者不应该把这个属性包括在发送到邻居AS的发言者的UPDATE消息中。如果
BGP发言者收到一条不在同一个AS内的BGP发言者的UPDATE消息包括了这个属性,这
个属性将要被接收路由器忽略掉。
5.1.6ATOMIC_AGGREGATE
ATOMIC-AGGREGATE是公认自决属性。如果BGP发言者,当得到一个对端的一些重叠
的路由(见9。1。4),选择了一条更不特殊的路由而不是选择一条更特殊的路由
,那末当通告到别的BGP发言者的时候本地系统应该附加ATOMIC-AGGREGATE属性到
路由,(如果属性没有表示在接收的更不特殊的路由中)。当通告路由到别的BGP
发言者的时候,接收具有ATOMIC-AGGREGATE属性的路由BGP发言者不应该使任何的
路由的NLRI更特殊。收到具有ATOMIC-AGGREGATE属性的路由的BGP发言者需要知道
如下事实:实际的到达目的地的路由,在路由的NLRI内说明,当有自由回环特性时
,可以穿越AS-PATH属性内没有列出的ASs。
5.1.7AGGREGATOR
AGGREGATOR是可选转发属性,可以包括在聚合形成的更新中,(见9。2。4。2)。
执行聚合的BGP发言者可以加入AGGREGATOR属性,里面包括自己的AS号和IP地址。
6.BGP错误处理
本部分讨论当处理BGP消息探测到错误的时候采取的行动
当下面描述的任何情况被探测到,NOTIFICATION消息包括制定的错误码,错误子码
,数据字段,发送出去,BGP连接断开。如果错误子码没有指定,必须要使用0。
术语"BGP连接关闭"意思是传输协议连接被关闭同时BGP连接的所有资源被释放。远
端对应的路由表入口被标记无效。在路由被系统删掉之前,路由无效的事实被发送
到BGP对端。除非特别说明,发送指示错误的NOTIFICATION消息的数据字段是空的
。
6.1消息头错误处理.
当处理消息头时所有探测的错误在发送NOTIFICATION消息时用错误码Message
HeaderError指示.错误子码依赖于具体的错误。
(1)消息头的Marker字段的期望值是全1,如果消息类型是OPEN。别的所有类型
的BGP消息的Marker字段的期望值决定于认证信息可选参数的表达和实际的认证机
制(如果BGPOPEN消息表达了认证信息)。如果消息头的Marker字段不是期望的,
就发生了同步错误,错误子码设置为ConnectionNotSynchronized。
(2)如果消息头的长度字段小于19字节或者大于4096字节,或者OPEN消息的长度
字段小于最小的OPEN消息长度,或者UPDATE消息的长度字段小于UPDATE消息的最小
长度,或者KEEPALIVE消息的长度字段不等于19,或者NOTIFICATION消息的长度小
于最小的NOTIFICATION消息的长度。则错误子码设置为BadMessageLength。数据
字段包含了错误的长度。
(3)如果消息头的类型字段未识别,则错误子码设置为BadMessageType。数据
字段包含了错误的Type字段。
6.2OPEN消息错误处理
处理OPEN消息探测到的错误通过发送NOTIFACAITION来指示,错误码是OPEN
MessageError。错误子码取决于特定的错误。
(1)如果OPEN消息Version字段内的版本号不支持,错误子码设置为Unsupported
VersionNumber。数据字段是2字节的无符号整数,说明最大的本地支持的版本号
码小于对端BGP提出的版本。(在OPEN消息中收到)
(2)如果OPEN消息的AutonomousSystem字段不支持,错误子码设置为BadPeer
AS。可接受的AS号码的确定超出了文档的范围。
(3)如果OPEN消息的HoldTime字段不可接受,错误子码必须设置为
UnacceptableHoldTime。应用必须拒绝一到两秒的HoldTime值。应用可以拒绝
任何建议的HoldTime。接受HoldTime的应用必须使用HoldTime的商议值。
(4)如果OPEN消息的BGPIdentifier字段语法错误。错误子码设置为BadBGP
Identifier。语法正确意味着BGPIdentifier是有效的IP主机地址。
(5)如果OPEN消息的一个OptionalParameter未识别,错误子码设置为
UnsupportedOptionalParameters。
(6)如果OPEN消息承载了AuthenticationInformation(作为可选参数),激活
相应的认证过程。如果认证过程(基于认证码和认证数据)失败,错误子码设置为
AuthenticationFailure。
6.3UPDATE消息错误处理
处理UPDATE消息时探测到的所有错误通过发送NOTIFACATION说明,错误码是UPDATE
MessageError。错误子码决定于具体的错误。
(1)UPDATE消息的错误检查开始是路径属性检查。如果不可用路由长度或者整个
属性长度太大(也就是说,如果UnfeasibleRoutesLength+Total
AttributeLength+23超过了消息长度)messageLength),错误子码是
MalformedAttributeList。
(2)如果任意识别的属性的属性标志和属性类型码矛盾,错误子码设置为
AttributeFlagsError。数据字段包含了错误的属性(类型,长度和值)。
(3)如果任意识别的属性的属性长度和期望的长度矛盾(根据属性类型码),错
误子码是AttributeLengthError。数据字段包含了错误的属性(类型,长度和值
)。
(4)如果强制公认属性没有表示,错误子码设置为MissingWell-known
Attribute。数据字段包括了漏掉的公认属性的属性类型码。
(5)如果任何强制公认属性未识别,错误子码设置为UnrecognizedWell-known
Attribute。数据字段包含了未识别的属性(类型,长度,值)。
(6)如果ORIGIN属性值不识别,错误子码是InvalidOriginAttribute.数据字
段包含了不识别的属性(类型,长度,值)。
(7)如果NEXT-HOP属性是语法错误,错误子码是InvalidNEXT_HOPAttribute。
数据字段包含了不正确的属性(类型,长度,值)。语法错误意思是NEXT-HOP属性
表示无效IP地址。语义检验只用在外部BGP链接上。这意味着IP地址的接口,在
NEXT-HOP中说明,和接受BGP发言者共享了公共的子网但不是接收BGP发言者的IP地
址。如果NEXT-HOP属性是语义不正确,错误要记录,路由被忽略。在这种情况下,
不发送NOTIFACAITON消息。
(7)AS-PATH属性要检查语法错误。如果路径语法错误,错误子码是Malformed
AS_PATH。
(8)如果可选参数识别,参数值要检查。如果发现错误,属性被丢弃,错误子码
是OptionalAttributeError.数据字段是这个属性(类型,长度和值)。
(9)如果任何属性在UPDATE消息中出现多次,错误子码是MalformedAttribute
List。
(10)UPDATE消息的NLRI字段作语法有效性检查。如果语法错误,错误子码是
InvalidNetworkField。
6.4NOTIFICATION消息错误处理
如果对端发送NOTIFICATION消息,在消息中有错误,很不幸没有办法通过又
一个NOTIFICAITON消息报告这个错误,。任何这种错误,,比如不识别的错误码或
者错误子码,应该注意,在本地记录,同时引起对端管理的注意。实现手段就不是
本文档讨论的问题了。
6.5HoldTimer溢出错误处理
如果系统在OPEN消息的HoldTime字段说明的周期内没有收到连续的KEEPALIVE和/
或UPDATE和/或NOTIFACATION消息,则错误子码设为HoldTimerExpiredError
Code的NOTIFICATION消息发送出去同时BGP连接断开。
6.6有限状态及错误处理.
BGP有限状态机探测的任何错误(比如,接收到不识别事件)通过发送错误子码是
FiniteStateMachineError。的NOTIFICATION消息指示。
6.7终止
如果出现任何致命错误(在这个部分说明),BGP对端可以选择在给定的任何时间
关闭BGP连接,通过发送错误码是ErrorCodeCease的NOTIFACATION消息。然而,
CeaseNOTIFACATION消息必须不使用,当这个部分说明的致命错误不存在。
6.8连接冲突检测
如果一对BGP发言者尝试互相同时建立TCP连接,在一对发言者之间的两个并行的连
接形成,我们称为连接冲突。很明显,一个连接应该关闭。
基于BGP标示符的值,建立了约定来探测当冲突发生的时候哪一个BGP连接是先来的
。约定是比较冲突的BGP对端的标示符同时保留使用较高的BGP标示符的BGP发言者
初始化的连接。
收到OPEN消息,本地系统应该检测所有的处于OpenConfirm状态的连接。BGP发言者
也可以检测在OpenSent状态的连接,如果他通过本协议以外的手段知道对端的BGP
标示符。如果在这些连接中,有一个连接到远端的BGP发言者,他的BGP标示符等于
在OPEN消息中的标示符,本地系统执行下面的冲突解决过程:
1.本地系统的BGP标示符比较远端系统的BGP标示符。(在OPEN消息中说明)
2.如果本的BGP标示符的值小于远端,本地系统关闭已经存在的BGP连接(已经在
OpenConfirm状态的那个),同时接受远端系初始化的BGP连接。
3.否则,本地系统关闭新建立的BGP连接(和新收到的OPEN消息关联的),继续使
用存在的那个(已经在OpenConfirm状态的那个)。
比较BGP标示符是把他们看作(4字节长)无符号整数。
带有处在建立状态的BGP已存在连接的连接冲突导致无条件关闭新建立的连接。注
意连接冲突不能被探测,如果有连接在Idle,或者Connect,或者Active状态。
关闭这个BGP连接(这是冲突解决过程的结果)是通过发送NOTIFICATION消息,错
误子码是ErrorCodeCease.
7.BGP版本商议
BGP发言者可以商议协议版本,通过多次尝试打开一个BGP连接,使用两边都支持的
最高版本。如果建立尝试失败,错误码是OPENMessageError,错误子码是
UnsupportedVersionNumber,BGP发言者得到他尝试的版本号,对端尝试的版本
号,在NOTIFICATION消息中对端发送的版本号,是支持的版本号。如果两个对端支
持一个或多个公共版本,可以很快决定最高的支持版本。为了支持BGP版本商议,
未来的BGP版本保留OPEN和NOTIFACATION消息的格式。
8.BGP有限状态机
本部分使用状态机(FSM)说明BGP的操作。下面是BGP操作的FSM简要的说明和回顾
。BGPFSM
精华版本在附录1中说明。
开始BGP在Idle状态。
Idle状态:
在这个状态,BGP拒绝任何进入的BGP连接。不为对端分配任何资源。为响应
Start事件(系统或者操作者初始化),本地系统初始化所有的BGP资源,开启
ConnectRetry计时器,初始化传输连接到别的BGP对端,当检听到由远端BGP对端初
始化的BGP连接,改变状态到连接。ConnectRetry计时器的确切值是本地设置,但
是要足够大以允许TCP初始化。
如果BGP发言者探测到错误,关闭连接并转换状态到Idle。脱离Idle状态需要
Start事件的产生这个事件自动产生,连续的BGP错误会导致连续的发言者的抖动。
为了避免这个。如果情况,建议先前由于错误而转换到Idle状态的对端的Start事
件不应该立即产生。在连续产生的Start事件之间的时间,如果事件是自动产生的
,应该指数增长。初始计时器的值应该是60秒。时间应该每连续产生一次就加倍。
在Idle状态下收到的任何别的事件被忽略。
连接状态:
在这个状态BGP等待传输协议连接的完成。
如果传输协议连接成功,本地系统清除ConnectRetry计时器,完成初始化,发送
OPEN消息到对端,改变状态到OpenSent.
如果传输协议连接失败(比如,重新传送超时),本地系统重启ConnnectRetry计
时器,继续侦听远端BGP对端初始化的连接,改变它的状态到Active状态。
响应ConnectRetry计时器溢出事件,本地系统重启ConnectRetry计时器,初始化
传输连接到BGP对端,继续侦听远端BGP对端初始化的连接,停留在Connect状态。
Start事件在Active状态被忽略。
响应其他的事件(被系统或者操作者初始化),本地系统释放连接占有的所有的
BGP资源,转换状态到Idle。
Active状态:
在这个状态,BGP尝试通过初始化传输协议连接来得到对端。
如果传输协议连接成功,本地系统清除ConnectRetry计时器,完成初始化,发送
OPEN消息到对端,设置Hold计时器为一个很大值,改变状态到OpenSent。计时器值
建议是4分钟。
响应ConnectRetry计时器溢出事件,本地系统重启ConnectRetry计时器,初始化
传输连接到别的BGP对端,继续侦听远端BGP对端初始化的连接,改变状态到
Connect.
如果本地系统探测到远端尝试建立BGP连接到自己,远端的IP地址不是期望的,本
的系统重启ConnectRetry计时器,拒绝尝试连接,继续侦听远端BGP对端初始化的
连接,停留在Active状态。
Start事件在Active状态被忽略。
响应任何别的事件(系统或者操作者初始化),本地系统释放连接占有的所有的
资源,改变状态到Idle.
OpenSent状态:
在这个状态BGP等待来自对端的OPEN消息。当OPEN消息收到,所有的字段要检查正
确性,如果BGP消息头检查或者OPEN消息检查探测到错误(见部分6。2),或者连
接冲突(见部分6。8),本地系统发送NOTIFACATION消息,改变状态到Idle。
如果在OPEN消息内没有错误,BGP发送KEEPALIVE消息设置KeepAlive计时器。先前
被设置为一个大值的Hold计时器,(见上面),被商议的HoldTime值替代(见部
分4。2)。如果商议的HoldTime值是0,HoldTime计时器和KeepAlive计时器不被
重启。如果AutonomousSystem字段的值是和本地AS号码一样的,则连接是"内部
"连接,否则是"外部"连接。(这会影响下面所描述的UPDATE消息的处理。)最后
,转态转换到OpenConfirm。
如果从承载传输协议收到断开通告,本地系统关闭BGP连接,重启ConnectRetry计
时器,同时继续侦听远端BGP初始化的连接,进入Active状态。
如果Hold计时器溢出,本地系统发送NOTIFICATION消息,错误码是HoldTimer
Expired,同时改变状态到Idle。
响应Stop事件(系统或者操作者初始化),本地系统发送NOTIFICATION消息,错
误码是Cease同时改变状态到Idle。
Start事件在OpenSent状态被忽略。
对别的事件的响应,本地系统发送NOTIFICATION消息,错误码是FiniteState
MachineError同时改变状态到Idle。
无论何时BGP改变状态从OpenSent到Idle,关闭BGP(以及传输层)连接释放连接占
用的所有的资源。
OpenConfire状态:
在这个状态,BGP等待KEEPALIVE或者NOTIFICATION消息。
如果本地系统收到KEEPALIVE消息,改变状态到Established。
如果在收到KEEPALIVE消息之前,Hold计时器溢出,本地系统发送NOTIFICATION
消息,错误码是HoldTimerExpired,改变状态到Idle.
如果本地系统收到NOTIFICATION消息,改变状态到Idle。
如果KeepAlive计时器溢出,本地系统发送KEEPALIVE消息,重启他的KeepAlive计
时器。
如果从底层的传输协议收到断开通告,本地系统状态转换到Idle。
响应Stop事件(系统或者操作者初始化)本地系统发送NOTIFICATION消息,错误
码是Cease,改变状态到Idle。
Start事件在OpenConfirm状态被忽略。
响应别的事件,本地系统发送NOTIFICATION消息,错误码是FiniteState
MachineError,改变状态到Idle。
无论何时BGP改变状态从OpenConfirm到Idle,关闭BGP(传输层)连接同时释放所
有连接占用的资源。
建立状态:
在建立状态,BGP能够交换UPDATE,NOTIFICATION,和KEEPALIVE消息到对端。
如果本地系统收到UPDATE或者KEEPALIVE消息,开启Hold计时器,如果商议的Hold
Time值不是零。
如果本地系统收到NOTIFICATION消息,状态转换到Idle.
如果本地系统收到UPDATE消息,UPDATE消息的错误处理过程(见部分6。3)探测
到错误,本地系统发送NOTIFICATION消息,改变状态到Idle。
如果断开通告通过底层传输协议收到,本地系统改变状态到Idle。
如果Hold计时器溢出,本地系统发送NOTIFICATION消息,错误码是HoldTimer
Expired,改变状态到Idle。
如果KeepAlive计时器溢出,本地系统发送KEEPALIVE消息,重启KeepAlive计时器
。
每次本地系统发送KEEPALIVE或者UPDATE消息,重启KeepAlive计时器,除非商议
的计时器值是零。
响应Stop事件(通过系统或者操作者初始化),本地系统发送NOTIFICATIOIN消息
,错误码是Cease,改变状态到Idle。
Start事件在Established状态被忽略。
响应别的事件,本地系统发送NOTIFACATION消息,错误码是FiniteState
MachineError,改变状态到Idle。
无论何时BGP改变状态从Established到Idle,关闭BGP(以及传输层)连接,释放
连接占用的所有资源,删除所有的连接产生的路由。
9.UPDATE消息处理
UPDATE消息仅仅在建立状态可以被接收。当一个UPDATE消息被接收,每一个字段要
有效性检查,说明见部分6。3。
如果可选的非转发的属性不识别,默默丢弃。如果可选转发属性不识别,属性标志
字节的部分位设置为1(第三个高位顺序位),保留属性公告到别的BGP发言者。
如果可选的属性被识别,而且值有效,要根据可选参数的类型在本地处理,保留更
新,如果必要通告到别的BGP发言者。
如果UPDATE消息包括非空的WITHDRAWNROUTES字段,先前通告的路由如果目的地包
括在这个字段里面需要从Adj-RIB_In中移出来。BGP发言者应该运行决策过程,原
因是先前的公告路由不再可用。
如果UPDATE消息包括了一个可用的路由,应该放在相应的Adj-RIB_In内部,同时做
下面的步骤:
i)如果NLRI和当前保存在Adj-RIB-In中的一条路由相同,则新路由要改变
Adj-RIB-In中的老路由,则从服务中收回老路由。BGP发言者要运行他的决策过程
因为老路由不可再用。
ii)如果新的路由重叠包含在Adj-RIB-In老路由内部(见9。1。4),BGP发言者应该
运行决策过程,因为更特殊路由使得原来的更不特殊路由的一部分不可用了。
iii)如果新路由有和Adj_RIB_In内包含的路由同样的路径属性,并且更特殊(见9
。1。4)。不需要做任何事情。
iv)如果新路由的NLRI不同于Adj-RIB-In存储的任何路由,新路由应该放入。BGP发
言者应该运行决策进程。
v)如果新路由是更不特别的重叠路由,BGP发言者应该运行对更不特殊的路由运行
决策进程。
9.1决策过程
决策过程选择路由用于下一步的通告,方法是应用本地策略信息库(PIB)的策略
处理Adj-RIB-In中的路由。决策过程的输出是通告到所有对端的路由集合;被选的
路由存储在Adj-RIB-Out中。
选择过程可以定义为一个函数,给定路由的属性作为参数,返回非负的整数指示路
由的优先级别。计算路由优先级别的函数不能把以下的情况作为输入:别的路由的
存在,别的路由的不存在,或者别的路由的路径属性。路由选择对每一个可用路由
运用优先程度算法,选择最高优先程度的路由。
决策过程操作Adj-RIB-In包括的路由,同时负责:
-选择通告到本地的AS中别的BGP发言者的路由
-选择通告到邻居AS中的BGP发言者的路由
-路由聚合和路由信息简化
决策过程分三期,通过不同的事件触发。
a)一期负责计算来自邻居AS的BGP发言者的每条路有的优先级,并通告路由到本地
AS的别的BGP发言者,该路由到每个不同的目的地的具有最高的优先级。
b)二期在一期完成的时候激活。负责从到达目的地的所有路由中选择最好的路由,
同时安装每个选择的路由到相应的Loc-RIB。
c)在Loc-RIB修改后激活三期。负责发布Loc_RIB中的路由到邻居AS的每个对端。根
据在PIB中的规则,路由聚合和信息简约在这期可选的执行。
9.1.1Phase1:优先级的计算
无论何时本地的BGP发言者接收到邻居AS的对端的通告新的路由,替代路由,测销
路由的UPDATE消息,都要激活一期决策过程,
一期决策过程是独立的过程,当没有别的工作要做的时候就停止。
一期决策函数在操作任何包含路由之前锁定Adj-RIB-In,在操作完成所有新的或者
不可用的路由之后,解开Adj-RIB-In。
每一个新收到或者替代的可用路由,本地BGP发言者应该确定一个优先级。如果路
由是通过本地AS的BGP发言者学习到的,或者LOCAL-PREF值被当作优先级,或者本
地系统应该根据预先配置的策略信息计算路由优先级。如果路由通过邻居AS中的
BGP发言者学习,优先级的计算是根据预先配置的策略。策略信息的确切特性和相
关计算是本地的问题。本地发言者应该运行内部更新进程9。2。1选择并且通告最
佳路由。
9.1.2Phase2:路由选择
第二期决策函数在第一期完成后激活。第二期函数是独立的过程当没有更进一步的
工作要做的时候就停止。第二期进程要考虑Adj_RIB_In中的所有路由,包括从自己
的AS中和邻居的AS中的BGP发言者接收的路由。
当运行第三期决策函数,第二期决策函数可以阻塞。第二期函数应该在开始函数前
锁定所有的Adj-RIB-In,在完成后解开。
如果BGP路由的NEXT-HOP属性描述了一个地址,在本地Loc-RIB中BGP发言者没有到
该地址的路由,BGP路由应该排除在第二期决策函数外面。
对于Adj_RIB_In中的路由的每一个目的地集合,本地BGP发言者应该确定路由:
该路由
a)对同一个目的地集合有路由的最高优先级,或者
b)是唯一的到目的的地路由,或者
c)是9.1.2.1.第二期解扣规则的选择结果。
本地发言者应该安装路由到Loc-RIB中,替代Loc-RIB中保存的任何到相同目的地的
路由。本地发言者必须根据选择路由的NEXT-HOP属性立即确定下一跳地址,通过查
找IGP选择IGP中的可能的路径。当安装选择路由在Loc_RIB中,下一跳立即必须被
使用。如果NEXT-HOP属性描述的地址改变,路由选择应该按照上面的说明重新计算
。
不可用的路由应该从Loc-RIB中拿出,相应的不可用路由应该从Adj-RIBs-In拿出。
9.1.2.1解扣(第二期)
在Adj-RIBs-In中一个BGP发言者可以有多个有相同的优先级的路由到同一个目
的地。本的发言者可以选择包含在相应Loc-RIB中的一条路由。本地发言者认为所
有的路由,不论是邻居AS的BGP发言者收到的路由,还是本地AS的BGP发言者收到的
路由是一样的。
下面的解扣过程假设对于每一个候选路由一个自治系统的所有BGP发言者的能够确
定到NEXT-HOP属性描述的地址的路径代价(内部距离)。根据下面的算法解扣。
a)如果本地系统配置考虑MULTI_EXIT_DISC,候选路由的MULTI_EXIT_DISC属性不
同,选择MULTI_EXIT_DISC属性值最小的。
b)否则,选择到入口的代价(内部距离)最小的路由,该入口由路由的NEXT-HOP属
性描述。如果有几个路由有相同的代价,按照下面的过程解扣
-如果最少有一个路由是通过邻居AS的BGP发言者通告的,选择邻居AS的BGP发言者
通告的路由,该BGP的标示符的值是所有邻居AS的BGP发言者中最小的。
-否则,选择BGP标示符最小的BGP发言者通告的路由。
9.1.3Phase3:路由分发
第三期路由决策过程可以被第二期的完成激活,或者下面的事件发生:
a)Loc-RIB中的到本地目的地的路由改变。
b)当本地产生的通过BGP以外的方式学习的路由改变。
C)当新的BGP发言者-BGP发言者连接建立。
第三期函数是独立的过程当没有进一步的工作去做的时候停止。如果第二期决策过
程在运行,第三期路由决策过程应该被阻塞,。
所有的Loc-RIB中的路由应该被处理到相应的到Adj-RIBs-Out的入口。路由聚合和
信息简约技术(见9.2.4.1)可选执行。
为了更好支持未来的AS间组播能力,参加AS间组播路由的BGP发言者应该
通告他从外部对端收到的路由同时如果安装在Loc-RIB内,因该通告回接收
路由的对端。对没有参加AS间组播路由的BGP发言者这个通告是可选的。如果
做这样一个通告,NEXT-HOP属性应该被设置为对端地址。应用可以优化这
个通告,截断AS-PATH属性的信息而只包括自己的AS号码和通告路由的对
端的AS号码(这个截断要求ORIGIN属性被设置为INCOMPLETE)
。另外,应用不需要传递可选的或者自决的路径属性在这种通告中。
当Adj-RIBs-Out更新而且转发信息库(FIB)完成,本地BGP发言者应该运行
外部更新进程9。2。2。
9.1.4路由重叠
BGP发言者可以传送具有重叠的网络层可达信息(NLRI)的路由到别的BGP
发言者。NLRI重叠发生在一系列目的地由非匹配的多个路由来鉴别。由于BG
P使用IP前缀对NLRI编码,重叠一般要展示子网关系。路由描述了更小范围
的目的地(更长的前缀)称为更特别路由,路由描述了更大范围的目的地(更短的
前缀)成为更一般路由。反之同样。
这种优先关系有效分解了更一般路由为两部分:
-一系列目的地,仅仅使用更一般路由来描述。
-一系列路由,使用更一般和更特殊路由的重叠来描述。
当重叠路由发生在同样的Adj-RIB-In,更特殊的路由应该有优先权,顺序是更特殊
到更一般。
重叠描述的目的地的集合表明一部分更一般路由是可用的,但是当前不可用。如果
一个更特殊的路由后来撤销了,重叠描述的目的地的集合将可以使用更一般的路由
到达。
如果BGP发言者接收了重叠路由,决策过程应该考虑重叠路由的语义。特别是,
如果BGP发言者接收了同一个对端的更一般的路由同时拒绝了更特殊的路由,那
末重叠表示的目的地可能不转发到路由的AS-PATH属性列出的AS那里。因
此,BGP发言者可以有下面的选择:
a)同时安装更一般和更特殊的路由
b)只安装更特殊的路由
c)只安装更一般路由的非重叠部分(这意味着解聚和)
d)聚合着两条路由同时安装聚合路由
e)安装更一般的路由
f)都不安装
如果一个BGP发言者选择e),应该加入ATOMIC-AGGREGATE属性到路由中。承载
ATOMIC-AGGREGATE属性的路由不能被解聚和(de-aggregate)。也就是说,路由的
NLRI不能被做得更特殊。向这个路由转发不保证IP包实际沿着路由的AS-PATH属性
中列出的AS中转。如果BGP发言者选择a),必须在没有更特殊的路由的时候不通告
更一般的路由。
9.2Update发送进程
Update-Send进程负责通告UPDATE消息到所有的对端。例如,他发布决策进程选择
的路由到位于同样的自治系统或者邻居自治系统的BGP发言者。不同自治系统的
BGP发言者之间信息交换的法则参看9。2。2;相同自治系统的BGP发言者之间信息
交换的法则参看9。2。1。
在BGP发言者集合之间的路由信息的发布,所有BGP发言者如果在同一个自治系统,
称为内部发布。
9.2.1内部更新
内部更新进程是发布路由信息到本地自治系统的BGP发言者。
当BGP发言者从在本地自治系统的别的BGP收到了UPDATE消息,接收BGP发言者不应
该再分配UPDATE消息中的路由信息到别的本地自治系统的BGP发言者。
当BGP发言者接收了邻居自治系统的BGP发言者的一条新的路由,如果下面的情况之
一发生,应该使用UPDATE消息通告路由到本的自治系统的所有的BGP发言者:
1)本地BGP发言者安排给新接收的路由的优先程度高于本地发言者已经安排的接
受自邻居自治系统的别的路由的优先级,或者
2)没有接收到别的邻居自治系统的BGP发言者发送的路由,或者
3)新接收路由是几个最高优先级,同样目的的的路由解扣的结果,(解扣过程在
9。2。1。1中说明。
当BGP发言者收到了UPDATE消息,有非空的WITHDRAWNRJOUTES字段,应该从
Adj-RIB-In里去掉所有的在这个字段中(IP前缀表示)的目的地。
发言者应该做下面的附加步骤:
1)如果相应的可用路由先前没有被通告,不需要做更多的行动。
2)如果相应的可用路由先前被通告,那末:
i)如果被选择通告的新的路由和不可用路由有相同的网络层可达信息,本地系统
因该通告替代路由。
ii)如果替代路由不能用于通告,BGP发言者应该包括不可用路由的目的的(IP前
缀形式)在UPDATE消息的WITHDRAWNROUTES字段,因该发送这个消息到先前通告了
相应的可用路由的对端。
所有的通告过的可用路由因该放入相应的Adj-RIBs-Out,所有不可用的但是通告过
的路由应该被从Adj-RIBs-Out清除。
9.2.1.1解扣(内部更新)
如果一个本地的BGP发言者连接到邻居AS的几个BGP发言者,有多个Adj-RIBs-In和
这些对端相关联。这些Adj-RIB-In可以包含到同一个目的的的多个等价优先级的路
由,所有的路由被邻居自治系统通告。本的BGP发言者应该根据下面法则选择其中
一条路由:
a)如果候选路由只是NEXT-HOP和MULTI-EXIT-DISC属性不同,本地系统配置中考虑
了MULTI-EXIT-DISC属性,选择有最低的MULTI-EXIT-DISC属性的路由。
b)如果本地系统能够确定到入口路径的代价,该入口被候选路由中NEXT-HOP属性描
述,选择代价较低的路由。
c)在所有别的情况中,选择的路由由具有较低的BGP标示符的BGP发言者通告。
9.2.2外部更新
外部更新过程和发布路由信息到邻居AS的BGP发言者的有关。作为阶段3路由选择过
程的一部分,BGP发言者已经更新他的Adj-RIBs-Out和转发表.所有新的安装的路
由和所有新的没有替代路由的不可用的路由要通过UPDATE消息通告到邻居AS内部的
BGP发言者。
任何位于LOC-RIB的路由,如果是不可用的应该被撤销。在自己的AS内部如果可达
地址改变应该发送UPDATE消息。
9.2.3控制路由流量开销
BGP协议限制路由流量(也就是UPDATE消息),目的是限制通告UPDATE消息的链路
带宽和消化UPDATE消息里的信息决策过程的处理能力。
9.2.3.1路由通告的频率
参数MinRouteAdvertisementInterval确定了BGP发言者到特定目的地的两个路由通
告之间的最小时间。这个速率限制过程是基于每个目的地的,但是这个
MinRouteAdvertisementInterval值是基于每一个对端设置的。
UPDATE消息被MinRouteAdvertisementInterval分离,该消息从邻居AS的BGP发言
者接收而来,从通告可用路由的单个BGP发言者发送到目的地集合.无疑,只有精
确保持目的地集合的计时器才能做到这一点。这是不现实的开销。任何保证BGP发
言者接受自邻居AS通告的两个UPDATE消息之间时间间隔的技术通告可用路由到目的
的地最小间隔是MinRouteAdvertisementInterval,也要保证大于间隔的一个常量是
可以接受的。
由于需要在AS内部快速收敛,本过程不能用于从本AS中别的BGP发言者发来的路由
。为了避免永久黑洞,本过程不能用于明确的撤销或者不可用路由(也就是,目的
地(通过IP前缀表示)在UPDATE消息中WITHDRAWNROUTEST字段的路由)。
这个过程不限制路由选择的速率,但是仅仅限制路由通告的速率。当等待
MinRouteAdvertisementInterval溢出时,如果新的路由被选择多次,在
MinRouteAdvertisementInterval的结尾通告最后选择的路由.
9.2.3.2路由产生的速率
参数MinASOriginationInterval确定了在BGP发言者本身的AS中报告变化的UPDATE
消息的连续通告的最小间隔
9.2.3.3Jitter
为了减少给定的BGP发言者的BGP消息产生尖峰,jitter应该被使用于
MinASOriginationInterval,Keepalive,MinRouteAdvertisementInterval计时
器.给定的BGP发言者应该应用同样的jitter数量,无论UPDATE被送到那个目的地;
也就是说,jitter不能被基于"每个对端"使用。
引入的Jitter的数量使用相应的计数器的基本值乘以一个范围是0。75到1的随机因
子。
9.2.4路由信息的有效组织
选择将要通告的路由信息,一个BGP发言者可以采用几个方法,组织信息为一个有
效形式。
9.2.4.1信息简约
信息简约可以在策略控制的程度上使用简约-在信息崩溃之后,相同的策略在等价
类上使用在所有的目的地和路径。
决策进程使用下面方法可选的减少放在Adj-RIB_Out中的信息数量:
a)网络层可达信息(NLRI)
目的IP地址可以被看作IP地址前缀。若地址结构和在AS管理者控制下的系统能够达
成一致,有可能减少UPDATE消息中NLRI的尺寸。
b)AS_PATHs(AS路径):
AS路径信息可以表达为顺序AS-SEQUENCE和无序AS-SET。S-SET可以用在路由聚合
算法,描述在9。2。4。2中。无论在聚合的AS-PATH上出现了几次,通过只列出每
个AS号码一次,他们减少了AS-PATH的尺寸。
一个AS-SET意味着NLRI列出的目的地能够通过由AS-SET中的部分AS组成的路径到达
。AS-SET提供有效的信息来避免回环;然而使用他们可能会剪除一些潜在的有用路
径,原因是一些路径不再被单独通过AS-SEQUENCE的方式列出。实际使用中这不是
个问题,因为一旦IP报到达AS组的边界,这个点上的BGP发言者更可能有更多的详
细路径信息并能够区分到目的地的路径。
9.2.4.2聚合路由信息
聚合是一个过程用来组合几个不同的路由来通告一个单独的路由。聚合作为决策的
一个部分发生,这样可以减少放在Ajd_RIBs_Out中路由信息的数量
聚合减少了BGP发言者存储并且和别的BGP发言者交换的路由。路由聚合使用下面的
独立于期望类型的路径属性和网络层可达信息的过程。
有下面属性的路由不能被聚合。除非相应的属性是唯一的MULTI_EXIT_DISC,
NEXT_HOP.
具有不同类型码的路径属性不能被聚合在一起.有同样类型码的路径能够被聚合,使
用下面的规则:
ORIGIN属性:如果至少一个被聚合路由它的ORIGIN指示INCOMPLETE,聚合路由
ORIGIN的属性值是IMCOMPLETE.否则,如果最少一个路由的属性是EGP,聚合路由的属
性是EGP.在所有别的情况下ORIGIN属性是INTERNAL.
AS-PATH属性:如果路由聚合有单一的AS-PATH属性,聚合的路由有同样的AS-PATH属
性.
为了聚合路由属性,我们建模AS-PATH属性作为二元组<类型,值>,"类型"定义了路径
段的属性(比如AS-SEQUENCE,AS_SET),"值"定义了AS号码.如果路由被聚合有不同的
AS-PATH属性,聚合的AS-PATH属性应该满足:
-所有在聚合AS-PATH的AS-SEQUENCE二元组应该在最早的路由集的AS-PATH中都出现
.
在聚合的AS-PATH中AS-SET类型的所有的二元组应该出现在最少一个AS-PATH类型中
(可以出现为AS-SET或者AS-SEQUENCE)。
-在聚合AS-PATH中,任何AS-SEQUENCE类型的二元组X领先于Y,在初始的集合中,
X在每一个AS-PATH中领先于Y,不论Y的类型。
-在AS-PATH中不能由同一个二元组具有相同值却出现了两次,不论二元组的类型。
应用可以选择任何算法只要符合这些规则。最少的一个构造应用应该能够执行下面
的算法来满足上面所有的条件。
-确定最长的对所有的聚合AS-PATH属性来说的二元组序列(如上定义)。把这个序
列作为聚合后的排头AS-PATH属性序列。
-设置剩下的AS-PATH属性二元组为AS-SET,把他们加入到AS-PATH后面。
-如果聚合AS-PATH属性有多个相同的二元组(不论二元组的类型),清除所有的,
通过从聚合AS-PATH属性中去掉AS-SET类型的二元组来只留下一个。
附录6,部分6。8提出另外一个算法来满足这个条件同时允许复杂的策略配置。
ATOMIC_AGGREGATE:如果最少一个路由有这个路径属性,那末聚合后的路由应该有
这个属性。
AGGREGATOR:聚合者属性应该被忽略。
9.3路由选择标准
总的来说,在几个可替代路由中比较路由的额外法则是在本文讨论问题之外的。有
两个例外。
-如果新路由中AS路径出现了本地AS,新路由不能被看作比别的路由更好的路由。
如果使用这样的一个路由,路由环路会发生。
-为了成功实现发布操作,只有具有稳定可能性的路由被选择。这样,一个AS必须
避免使用不稳定的路由,必须不使路由自发选择快速改变。前面句子中"不稳定"和
"快速"的名词量化需要经验,但是原理是清楚的。
9.4产生BGP路由
一个BGP发言者可以通过某些方式(比如通过IGP)获得的注入BGP的路由信息产生
BGP路由。
BGP发言者产生BGP路由应该通过决策进程(见部分9。1)来安排路由的优先级别。
这些路由可以被发布到别的在本地AS的BGP发言者作为内部更新进程的一部分(见
9。2。1)。在一个AS内部决定是否发送非BGP获得的路由,取决于AS内部的环境(
也就是IGP类型)而且可以通过配置来控制。
附录1.BGPFSM状态转换和行为
这个附录讨论BGPFSM响应BGP事件的状态转换。下面是当商议的HoldTime值不是
0的时候状态和事件的列表
BGP状态:
1-Idle
2-Connect
3-Active
4-OpenSent
5-OpenConfirm
6-Established
BGP事件:
1-BGPStart
2-BGPStop
3-BGPTransportconnectionopen
4-BGPTransportconnectionclosed
5-BGPTransportconnectionopenfailed
6-BGPTransportfatalerror
7-ConnectRetrytimerexpired
8-HoldTimerexpired
9-KeepAlivetimerexpired
10-ReceiveOPENmessage
11-ReceiveKEEPALIVEmessage
12-ReceiveUPDATEmessages
13-ReceiveNOTIFICATIONmessage
下面的表描述BGPFSM的状态转换,以及转换触发的行为。
事件行为发送的消息下一个状态
--------------------------------------------------------------------
------分隔线----------------------------