《基于用户行为的网络流量模型及自相似性分析.pdf》由会员分享,可在线阅读,更多相关《基于用户行为的网络流量模型及自相似性分析.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 9 ,通信学报 7 一 一,困 基 于 用 户行 为 的 网络 流 量 模 型 及 自相 似 性 分 析 ,印 旦 塑:,郑 少 仁 了 f 7 (解放军理工大学通信工程学院 江苏 南京 2 1 0 0 1 6),摘要:本 文 在 到达 网 络 的用 户数 服从 P o l s a o n分布 这 一 基 本 假 设 基 础 上,对 用 户 行 为 做 了 统计 描 述,得 到一 新 的 厢络 流 量模 型。分 析 表 明,该 模 型 不 仅 可 以产 生 与 厢 络 实测 数 据 相 类 似 的流 量 特 征,而 且具 有 较好 的 自相 似性,其 自相 似 性 变 化规 律也 与 实测
2、结 果吻 合。关t 词:计 算 机 网络;流量 模 型;自相似性 中 匝分 类号:T P 3 9 文献 标 识 码:A 文章 螭 号:1 0 0 04 3 6 x 2 0 o;0 9 一(0 1 90 7 M o de l o fn e t wo r k t r a ffi c b a s e d o i l u s e r be ha v i o r a nd i t s s e l f-s i m i l a r i t y T I AN C h a n g,WANG Ha i。Z HE NG S h a o-t e n (1 a s t ie a t c 0 衄叫l i 呲 l岫,卧u
3、憎 哼0 f S c ie n c e s a d T v c h a g y,H _ 吨 2 1 0 0 1 6,C h i)A 嘣:Ba 自 e d o nt h e棚叫m t h a t t h e n u mb e r o f a 工 r i v i 丑 gI】船i n c e r t a i nt i me 0 b t h eR d i 曲恤 t i o n,t h i s p a p e r 懈 s t a t i c a l d 册 0 f u s e r b E 叫 p a 0 o s e s HI m制0 f瑚棚k 曲血 S t-毗i 毗 a l雌I 日s h o wst h
4、 a tt h i s mo d e l c a n g e n e r a t e s e l f-a i mi l a r w h i c hi s I a rt ot h e o 0 e c v e a l啦,a n d d e e e 0 f 8 i _ t y 锄 t h el o a d o nt h e n e a a r k,t h e p l 妇 础 啪 丑 l 邮 a p p e a m in v e a l n d r o l h 瓶 c 1 L e y m ini s:c a u t e r n e t wo r k;咖c mo d e l;a e L f-a imi
5、l a fi t y 1 引言 网络的流 量特 性是 网络 设计 和性 能 分 析 中所 必须 考 虑 的 一个 重 要 因素,在 网 络 协议 设 计、性能 优化 和 网络设备 研究等 方面起 了至关重 要 的作 用,因而 网络流量模 型的 研究长期 以来 受到 计算 机 网络研究 人员 的高度重 视。根据 网络流量 的实测分 析,在传统 电信 网中广泛使 用 的 P o i a s o n流模 型 已不适 合描述 现代 计算 机 网络 的流量 特征“,因而现代 计 算 机 网络 的流 量特 征 及其模 型成 为 现代 网 络 研究 中 必须解决的问题。文献 3】通过对局域网网络流量的分析得
6、出网络流量具有 自相似性,进一步 研究 发现 广域网 的流量 同样 具有 自相似 特性 j。R J a i n 等 人 于 1 9 8 6 年 提 出网络流 量的“分 组火 车”模 型,并且 进一步 分析得 出“分 组火 车 模型具 有 自相 似性,表 明“分组 火车”模型 可 以 作为 网络流量合 理 近似。但是,自相 似流 的生成不仅 计算 量 大,而 且 各参 数 缺少 明确 的物理 意 义,难 于生成 特定 的网络流 量。“分组 火 车 模型是 根据 网 络实测 数 据的分 析 而得 到,其 物理 意义 明确,同时又具 有 自相似性,可 以认为是个 比较合理 的网络流量模 型。然而,“
7、分 组火车”模 收 藕 日期:1 9 9 90 5 1 2;修 订 日期:2 0 一0 7一if 3 基盘项 目:国家 自然科学基盒瓷助项 目(6 7 2 0 4 0)ll 维普资讯 http:/ 2 0 通 信 学 报 砌 型需分别 考察 网络 中各节点 对之 间 的通信 流量,当用 于仿真 产生 网络 流量时,由于“分组火 车”模 型 不具 有 可加 性,需要 考虑 网络 的拓 扑结构 及分别 设定各 节点 对之 间的通信 流量,建模 较复 杂。P o is s 0 流具有可加性,即多个 P 0 i8 s 0 n 流的相加仍是 i s 8 0 n 流。因此,采用 P 0 i s s 0 n
8、 流模型 可 以方便 地分 配各 节点 的到 达 速率,仿 真生 成 所 需 的 网 络 流 量。复 合 P o i s s o n到 达(c o mp o u n d P o i s s o n a r r i v a l s)模型 采用分 组成批 到达方 式仿 真网络 流量 特 性,然 而分析 表 明复 合 P o i s s o n 流也 不符合 网络流 量特性。本文 在复 合 P o i s s o n流 基础 上,对用 户到 达 分 布 及各 个 用户 的流 量特 征做 了一系列 假设,提 出一种新 的 网络 流量 模 型,并 进 一步 分 析 了模 型 的 白相 似 性。分 析 表
9、 明,这种模 型可 以得 到与现 有文献 实测结 果类似 的 自相似性,尽 管该模 型不是严 格数 学意义 上 的 自相似 流,但是其 统计特 性与实测 流量类 似,完 全 可 以作 为网 络 流量 的 合理 近似。与 现有 白相似 流生成 方法 圳 相 比,这种模 型 具有可加性、物理意 义 明确、仿 真流 生成简单 等优点。一 2 基于用户行 为 的网络 流量模型 与传 统电信 网类似,我们 假 设现 代计 算 机 网 的用 户 到 达 也是 符合 参 数 为 的 P o i s s o n分 布。即在时间 t 内到达的 个用户的概率为 P (,):e (1)传统电信网描述用户的行为只用用
10、户的通话时间描述,通常认为符合 负指数分布。而在 计算机网络中,用户到达网络后,可能会访问不同的站点,从各个站点获取相关的信息。从网络 流量的特 性看,就是用 户 髓机 产 生一些 不 同长 度的 网络 流,每 个流 的长度(分组 数)取决 于所 传送的信息类型。我们假设用户所产生的流的个数及每个流的长度都是服从均值为 耳和目 的 几何 分 布的,郎 P f(n):p(单个 用户产 生 个 流)=1,1 1 一 古 r (2)()=P(流 的长度 为 个分 组)=1,1 一 古 r (3)我们进 一步假 设各个 流之 间的间隔 时 间 tf 和一 个流 中分组之 间的间隔 时间 服 从参 数分
11、 别为 和 的负指数分 布。即)_ P(f)=。(4)():P()=一。:(s)在(0,r)时间内到达的分组数 N(r)可表示为(r】()(r)=(r)(6)其 中,“(r)表示在(0,r)时间内到达的用户数;(r)表示第 i 个用户在(0,r)时间内产生的 流的个数;(r)则表示第 个用户的第 个流在(0,r)时间内到达的分组数。在(t,t+r)时 间 内到达 的分组数 为(f)=(+r)一N(t)(7)为了分析上的方便,通常总是假设网络流量是个宽平穗过程。则式(7)中(r)的分 维普资讯 http:/ 第 9期 口 畅等;基 于 用户 行为 的网络 流量 模 型及 自相 似性 分 析 2
12、t 布与 f 无关,即,N(r)=N(r)。由于 我们 目前 尚未得 到 N()分 布及 方差 的解 析 式,以下采 用 仿真 的方法 分析()的 自相似性。在 5个仿 真参数 中,与用 户行 为有关 的有用户 平均到 达速率、每个 用户平 均产 生的流 的 个 数 和流 之 间的平 均间隔 时间 l,流的平 均长 度 和分 组间 的平均 间隔时 间 l,则 取 决于所 传送 的信 息类型 和网络 的性能。我们认 为 网络 流量 大小 主要是 由用户 行 为 确定,郎,用 户平均到达速率、每个用户平均产生的流的个数和流之间的平均 间隔时间。文献 3 中网络流 量 2 7 h的实测数据在不 同时
13、间段呈现出明显 的变化规律(工作时间网络流量明显大于休息时 间),反 映了用 户行 为是 影响 网络 流量 的主要 因素。采用 上述模 型仿真 生成 网络 流量 时,模型 中的用 户 行 为参数 可 以根 据 需 要 指定,以生成 所需 的 网络流 量,而流 的平均长 度和 分组 间的平 均 间隔时 间则根据 所要仿 真的 网络环境 确定,通常 可采 用相关 网络 中的实 测数据。需要 说 明的是用 户 所创 建 的各 个流 之 间 的平均 间隔 时 间 一定程度上也受到网络性能的影 响,但在 网络拥 塞程度不是很大的情况下通常影响不大。因 此,在仿真过程中各个流之问的平均间隔时间我们也是采用
14、 网络的实测数据。由于 P o i s on流具 有可加性 因此本模 型可 以根 据总 的网络流 量按需 要分别指 定所仿 真 网 络各 个节 点的用户 到达速 率,适 合于各 种不 同网络环境 的仿真要 求。在网络流量中,用于网络设备之间通信的控制流仅 占总流量的极小部分,在网络负荷达 到一 定程度 时,控 制流 的存在 与否对 网络 流 量的统计 特性 影 响不 大。但是,根 据实测 数据,当网 络 负荷 较轻 时,网络 流 量 的 自相 似 性 程 度 降 低0 。分 析认 为这 是控 制 流 可 能 不 是 自相 似 所 致,当流 量较小 时,控 制流 的影 响不能 忽略。因此,我们
15、将网络 流量分解 为具 有 自相似 特性 的 用户信息流和不具有 自相似性的网络控制流 目前,对网络控制流的流量特征 尚未见到相关的 研究 报 道,我们 在仿真 中简 单地 采 用参数 为 的 P o i s s o n流模型仿 真网络 的控制 流。3 仿真结果及模型 的 自相似性分析 3 1 平穗随机过程的 自相似性及其检验 设 X:(置:=0,1,2 )是一个宽平稳随机过程,即,其均值为常数 a=g 置,方差=g(置 一a)0 都满足 一 (k)=r(k),则称随 机过程 是严格 二 阶 自相似 的。如果 对足 够大 的 m,k满足 r(k)一-。,并且,r (k)一,当 m,k 一,这里
16、 0I9 1 则称 是渐进二阶自相似(a s Y m p l。t i c a l s e c o n d-o r d e r s e l f-s i m i l a r)的。H u r s t 系数 t=1 一p 2 是度量相似性程度的参数。显然,对 自相似随机过程 1 2 t0为 一常数,0 卢0为一 常数,0 口 0为一常数,0卢1。对于 独立随机 过程=V m,即 卢=1,H=1 2。当 1 2 时,随机过程被 认为是 独 立 的 或短 时 间相关(s h o r t r a n g e d e p e n d e n c e)的;当 1 2(H 1时随机过程 被认 为是 自相 似 的
17、或长 时间相关(1 o n g-r a n g e d e p e n d e n c e)的。对 于 自相 似过程 由 I g =l g b一卢l g m可 知 i s 与 l g m 呈线性关 系,通过对 l g 与 l s m 擞线 性拟合,即可得到 卢的估 计值,进而 得到 Hu r s t 参 数 H=1一卢,2。3 2 仿真结果及流量的 自相似性分析 为了方便与文献 3 中的实测数据进行比较,在仿真过程 中我们通过调整用户平均到达 速率和每个用户平均产生流的个数生成了与文献 1 中实测数据相类似 的流量。我们取用户 平均到达速率 为0 7 5 个 s,每个用户平均产生流的个数 为
18、1 2,其它参数则取 自文献(1 的 实测结 果。网 络 的 控 制 流采 用 平 均 到 达 速 率 为 2 0个,s的 P o i s s o n流。系 统 仿 真 时 间 为 1 0 5 X l0 s,其 中前 5 0 0 0 s 用于系统进入稳定状态,从 5 0 0 0 s 以后开始记录单位时间内分组到达数,每 个不 同的时 间单位分别 记录 1 0 0 0个单 位时 间 内到达 的分组数。仿真 参数 和 5个 不 同 时间单 位的仿真 结果分别 由表 1和图 1 所 示。寰 1 仿 真参数 名 称 数 值 单 位 分 布 用户翻选速率 0 7 5 个,B P B 每个用户产生的燕敷
19、母 1 2 个 几何 流之 同时 同隔 时间 1 ,u f 2 3 7 负指 数 流 的长度 5 0 分 组 几何 流中分组闻隔时问 l 0 负指敷 控制流到选速率 2 0 个,B P o i s s o n 仿 真 时 间 l 0 0 0 图1 对不 同的时间单位给出了单位时间蓟达网络分组数的分布。为了与文献 3 中的实测 数据比较,我们选择 了与文献 3 相 同的时间单位,即时间单位分别取 1 0 0 s、1 0 s、l s、l O O m s 和 l O i n s。从直观上看,五个不同的时间单位的网络流量分布不仅在数量上与文献 3 的实测结果 非常类似,而且显示出流量 的自相似特性 这
20、表明仿真结果可以作为网络流量的合理近似。需 要说 明的是文献 3 中时间单位为 1 0 0 s 的实测数据反映了2 7 h 的网络流量的变化,因而呈现出 明显 的有规 律的周期 性变化,工 作时 间的流量 明显太于 中午和 晚上的流 量。本文 的模 型未考 虑 这种 随 时间的规律 性变化,这 并不影 响本文模 型 的实用 性,而且需 要时可 以根方便 地通过 随时 间变 化调整用 户 到达 速率实 现所 需的流量 特 征 为 了分析 模 型 的 自相 似 性,我 们 取 3 7个 不 同 时 间单 位(m=1 2 9,1 0,2 0 ,9 0,1 0 0+,9 C 0,1 0 0 0,2 O
21、 O O+,9 O 0 0,1 0 0 0 0)分 别计算其 样本方 差,通过对 l g m 和 l g 擞线性 拟合 得到 口的估计 值。拟合结 果如 图 2所示。维普资讯 http:/ 第 9 期 田橱等:基于用户行为的同珞流量模型及 自相似性分析 6 0 0 O 赫 g舢 隶 赫 霸 彘 4 0 O O O 1 0 0 2 0 0 3 0 0 4 0 0 5 0 0 6 O O 70 0 8 0 0 9 0O t O 0 0 t=t I s I=0 Ol s E I=l o s 图 l 不同 时问 单位 网络 流 量仿 真 结果 I=0 1 B I gm 图 2 l s m l g 线性
22、拟舍结果 蕞噼隶 hU _ _ _ 一 _ -娜_ 一 m _ _“H H M 卜 9 7 6 5 4 3 2 1 O 蕞岛彘 维普资讯 http:/ 通 信 学 报 2 O 0 O年 根据数值拟合结果,按表 1 参数所得的流量其 卢值为0 3 0 7 4 8 4;自相似性参数 日=1 一卢,2 =0 8 4 6,见表 2。表明了我们 的模型所产生的流量具有 自相似性。文献 3 根据实测结果用同 样 方法做 线性拟 合得 到的 Hu r s t 参数 的估 计 值为 0 8 o。裹 2 拟合最,值估计结果 名 称 数 值 0 9 l 63 斡 估计值 0 3 0 7 4 8 4 对不 同的网络
23、 流量我们 按上述 方法 分 别测 定 了其 不 同 的 自相 似性 参 数,测 定结 果 如 表 3 所 示。表 3 I u r s t 参数随流变化表 用户翻选速率 每十用户产生的瘴数 O 3 1 2 0 8 2 6 O 1 0 O 7 9 2 0 O 1 1 O O 丌 4 O O 1 5 0 卸 0 删 5 0 5 B B 从表 3可以看出,网络流量的 自相似性程度随网络流量降低而有所下降,这与文献 3 的 实 测结果 也完全 吻台。3 3 模 型 的讨论 合理 的网络流量模型是网络性能分析和网络设备悸曩培;智 研究的基础 目翦对语音和视 频等 各 种不 同业 务的统 计特征 已有 了
24、较深入 的研究,而 网络 上传输 的流 量是 多 种 业务 流 的综 合,其流量特征仍是 一个有待研究的问题。在文献 2,3 提 出网络流量特征具有 自相似性 以 后,自相 似 流的快 速生成方 法 的研 究引起 了人们 的重 视。然 而,自相 似性 仅 是 随机 过程 的一 个 参 数,并不 能唯一 确定一个 过程。多 个不 同的 随机过 程可 以具 有相 同 的 自相 似性 参数和 自相关 函数。能否用自相似性唯一表示网络 的流量特征?笔者认为这仍是一个有待进一步探讨的问 题。仅 从 自相似 性角 度讲,本文提 出的模 型 可以作 为网 络 流量 的合理 近似,用于 网 络性 能和 网 络
25、设备体系结构的仿真分析,同时,也为 自相似流的产生提供了一种具有明确物理意义的新途 径。现有 自相似流生成算法以得到具有特定 自相似性参数的时问序列 为目的,缺少明确 的物 理 意 义。本 文 的模 型 通过 5 个具 有 明确物理 意义 的参数,采 用复合 Ma r k o v 过程 的方法 同样得 出 了具 有 自相 似 性的时 间序列。这表 明,通过将 实测 网络流量分 解为具 有不 同特性 的多个 随机过 程,有 可能 进一步 揭示 网络流量 的实质。网络流量 的 自相似 性是 通过 对 一定 时 间范 围 的 网络 流量 分 析 得 出 的。由于受 计算 机 处理 能 力的 限制,时
26、间范 围难 以取 得很大,因而 限 制 了统计 结 果 的可 信 度。从 严格 数 学 意义 上 讲,我 们猜 测本模 型不是 自相似 的,模型 自相 似性 的解 析分 析有待 于进 一步 的研究。然而,采 用 与相 关文献 中实测数 据相 同的时问 范围和 统计 分 析方 法,我 们也 得 出 了本模 型 是 自相 似 的结 维普资讯 http:/ 第 9期 田幡等:基 于用 户行 为的 网络 流量 模 型 及 自相似 性 分 析 论,而且 图示的流量特征与实测数据类似。我们认为更大时间范围内网络流量的统计特征仍是 一个值得探讨的领域。4结 束 语 网络流量模型不仅是网络性能解析分析的基础,
27、而且在网络性能仿真中具有重要的实用 价值。本文根据网络用户的行为提出了一种新的阿络流量模型。与现有各种 网络模型。相比,本 文给出的模型不仅具有 自相似性,其 自相似性程度随网络流量的减少而有所下降,与文献 3 中网络实测结果相吻合,而且模型 中各参数具有明显的物理意义,便于仿真产生所需的网络流 量。致谢:苏兆龙教授在课题研 究中给予了很大的帮助,在此表示意谢!参 考文献 1:J R,R O l Y I HI E R s A P D c k 雠 血d n e w D d dh o m pu t r n e t w h伍 c J 崛 J m e 删A t-i n c I d c ,s e p t
28、 1 9 8 6 4(6)1 2 F A X S O N V,F L O Y D s Wu t e-a t r a c g t h e柚 I e。f p o i a s o n D d d J I E E E A C M T m ma c fi tm t 叽 N“1 i s J l 1 e 1 9 9 5 3(3)3 L E L,O4 DV,r E,d O nt h e a e 1 f-l a r n a l u r e。f DI l e n Hh 硼日 c J I E E E A C MT r a n a O n N I I t i s 1 9 9 4 2(1)4 B A B Cc、V A
29、N D A L O R EB J A R I M b -l g dt m e 耶d 帅 d 由 硼地哪 i 叫 I e t 帅r h R O h i o s e U 叫 v 日 一 日t OS U,HS RC一1 9 8-T-a 9 9 8 5 S C h WA R I Z M B m 血 h u r r i e d H 舳 砌 P|I a l l I me m t m a 1 I n c,1 9 3 6 6 许都,李乐 民 自相似韭务流的快速生成方法及其性能研究 】通信学撮 1 9 9 8,1 9(S)7 B 班lA N J 蜊 E 王 l h i A NR T A Q Q UM s k时 叫 一-k n 断 i l l v a x i a b e-b i t-i v i d e o h伍 c J 垧皿 n 瞄c l i 吣 帆 删 血-一 l i a n a,1 9 9 5 4 3(2 r 3 4)8 P A T R I C KD,B O U D E C】L A 耐 -s i m i l a t T Mv B R h a 伍 l 0 A 眦O D C O M 9 6 c d 咂 1 9 3 6 维普资讯 http:/