车流量预测范文(精选10篇)
车流量预测 第1篇
关键词:交通噪声预测,等效车流量,等效车速
目前,国内的高速公路交通噪声预测在环评等实际工作中应用较多的是中华人民共和国交通部颁发的《公路建设项目环境影响评价规范(试行)》(JTJ005-96)给出的模型[1](以下简称交通部预测模型)和前国家环境保护总局发布的《环境影响评价技术导则-声环境》(HJPT214-1995)推荐的美国联邦公路管理局(FHWA)公路噪声预测模型[2,3](以下简称FHWA预测模型)这两种。有文献报道对多条高速公路的交通噪声监测表明,实际测量值与预测值常常偏差较大,有时最大偏差竟达8d B(A)以上[4].交通部预测模型是根据FHWA预测模型修改得到,计算时参数复杂,并且有关研究表明在高速公路交通噪声预测中FHWA预测模型更为合理[5].FHWA预测模型是美国联邦公路管理局在1978年提出的公路噪声预测模型,自发布以来经过数次改进,该预测模型比较成熟、完善、预测精度高,在许多国家得到广泛应用。该预测模型采用能量平均的等效连续A声级Leq作为评价指标比较合理、科学,与我国国标GB3096一93的规定相吻合。FHWA模型预测的误差为-0.8 d B±2.0d B,一般情况下,当预测点到声源距离适中时,预测结果可以达到模型发布时公布的误差精度。但是由于道路车流的车型、车龄、车况、轮胎类型、路面状况在不同地区、不同时间存在差异,即车辆参考噪声级存在地区差异、时间差异,这使得预测模型在其它地方使用时预测精度会有一定程度的降低[6]。何况FHWA预测模型产生于30年前,预测模型建立时所依据的车型、路况及环境标准与我国当前的实际情况差异甚大,应用到我国高速公路交通噪声预测中精度难以保证。
本文以高速公路交通噪声为研究对象,以FHWA预测模型为基础,利用等效车流量的概念建立高速公路交通噪声预测模型,探讨更适合我国车辆、道路、环境标准等实际情况的高速公路交通噪声预测办法。
1 FHWA预测模型
FHWA预测模型是将高速公路上的汽车按照车种分类(如大、中、小型车),先求出某一类车辆的小时等效声级:
式(1)中,Leq(T)i为第i类车的小时等效声级,dB(A);为第i类车的参考能量平均辐射声级,dB(A);Qi为在指定的时间T内通过某预测点的第i类车流量;D0为测量车辆辐射声级的参考位置的距离,D0=15m;D为预测点到车道中心线的垂直距离,m;Vi为第i类车的平均车速,km/h;T是计算等效声级的时间,T=1h;α为地面覆盖系数,取决于现场地面条件,α=0或α=0.5;ΔΦ代表有限长路段的修正,dB(A);ΔS为由遮挡物引起的衰减量,dB(A)。
而混合车流模式的等效声级是将各类车流等效声级叠加求得,即总车流等效声级为:
2 FHWA预测模型中交通噪声的分解
对于某一类车辆的小时等效声级Leq(T)i由式(1)可以写成:
式(3)中
由式(2)和式(3)得:
式(6)中,是平坦高速公路中交通噪声自由传播时各类车流等效声级叠加得到的总车流等效声级。从理论上看,L自由是Leq(T)在平坦高速公路中交通噪声自由传播的计算模型;而L修正则是Leq(T)关于地面覆盖、有限长路段和遮挡物等的修正值的叠加,显然它只依赖于预测点的环境条件,而跟车的种类无关;二者的叠加组成了高速公路交通噪声总车流等效声级Leq(T)的计算模型。本研究重点讨论前者,对于后者将直接应用FHWA预测模型及国内有关研究结果,具体请参考文献[2]、[6]。
3 基于等效车流量的高速公路交通噪声预测模型
参考能量平均辐射声级与车流量具有相关性。在FHWA预测模型中是一统计量,由美国实测得到的关于各类车的参考辐射声级统计公式为:
由于国情和时代的差异,上述参考辐射声级统计公式并不十分适合于当前我国的实际情况,这也是FHWA预测模型应用到我国高速公路交通噪声预测时精度难以保证的重要原因之一。FHWA的预测模式先将车流量按照各车型分开考虑,每种车型采用不同的参考能量平均辐射声级进行预测,再进行具体车流量修正及其他修正后,进行叠加。由于目前国内高速公路交通噪声监测均是在混合车流情况下进行的,同时基于当前我国的实际情况的各车型的参考能量平均辐射声级的经验统计公式还曾见诸报道,因此若采用上述方式进行预测,较难获得数据支持。
基于以上分析及我国高速公路中混合车流这一事实的考虑,本研究采用等效车流量和等效车速的概念来处理混合车流,应用统计方法建立平坦高速公路中交通噪声自由传播的计算模型,并由此导出高速公路交通噪声预测模型。车型分类和车流量的折算按照《高速公路交通噪声监测技术规定(暂行)》进行,详见表1。
根据噪声的能量叠加原理,高速公路中混合车流各型车辆的流量经折算后相加得总等效车流量为:
等效车速为:
从FHWA预测模型理论看,由式(4)可知,Li自由与第i类车流量Qi、平均车速Vi和预测点的相对距离成对数线性关系,跟第i类车参考能量平均辐射声级成线性关系。而作为一统计量,由式(7)可知,跟平均车速Vi也成对数线性关系。从统计观点看,车流等效声级是一随机变量的统计量,可以认为L自由跟Li自由一样,与总等效车流量Q、等效车速V及预测点的相对距离成对数线性关系。于是对于高速公路中混合车流的总车流等效声级可以建立如下的对数线性模型:
由式(5)及(10)得到高速公路交通噪声预测模型:
4 参数的确定与模型的验证
预测模型中的参数通过参数Ai回归分析得到。具体来说,可以就全国范围或某个地区的高速公路或某条具体的高速公路先选取统计学上数量适宜的测点,然后根据测点的实测数据进行参数回归分析来确定Ai的值。
为了验证模型精度,从某一高速公路(该高速公路为沥青混凝土路面,基本无坡度)92个实测点中随机选取60个测点,然后根据这60个测点的实测数据进行参数回归分析,所得预测模型的参数回归分析结果为:
对92个实测点中剩余的32个测点应用上述模型计算预测噪声值,并与实测值及FHWA预测噪声值进行比较,见表2。从表2中可以看出,对绝大部分的测点模型的Leq预测精度在2.5d B(A)以内,且不含明显的系统误差。相对FHWA预测模型的结果而言,预测效果有明显的改进,证明本研究所得模型是可用的。
5 结论
本研究所得模型适用于我国高速公路交通噪声的Leq的预测,相对于目前国内实践中应用较多的美国联邦公路管理局(FHWA)公路噪声预测模型而言,由于预测模型是基于我国的车型、路况和环境标准,因此更适用于我国实际情况。而且在使用了等效车流量和等效车速以后,模型应用更简洁。
参考文献
【1】JTJ005-96公路建设项目环境影响评价规范[S].
【2】BarryTM,ReaganJA.FHW A highway traffic noise predictionmodel[R].Washington DC:U.S.Departmentof Transportation,1978.
【3】涂瑞和.对美国FHWA公路噪声预测模式的深入探讨[J].环境工程,1995,13(3):41-45.
【4】周兆驹,卢伟玲,石红蓉,等.高速公路交通噪声预测评价偏差探析[J].声学技术,2007,26(2):282-285.
【5】沈红霞,潘仲麟.杭甬高速公路不同预测模型比较[J].噪声与振动控制,2004(4):35-38.
【6】丁亚超,周敬宣,李恒.国外几种道路交通噪声预测模式的对比分析[J].交通环保,2004,25(2):5-7.
全国春运客流量预测报告 第2篇
据预测,春运期间道路旅客发送量将达25.2亿人次,增长1%;铁路3.56亿人次,增长9.7%;民航5830万人次,增长10%;水运4350万人次,增长2%。
国家发展改革委副主任连维良表示,年春运客运量继续保持增长态势,呈现高峰高、高峰早,客货运输压力碰头,异常天气因素偏多、安全运行压力大等特点,同时互联网时代对春运售票方式、安全监管、客运服务等提出了新的要求。
车流量预测 第3篇
网络流量特征是网络性能分析、网络拓扑结构优化以及网络负载均衡等实现的基础, 也是网络服务异常和故障发现的重要手段[1,2,3]。网络流量模型是对网络流量数据的各种统计特性准确和全面地刻画。精确的网络流量模型不但可以帮助人们设计更好的网络协议和更合理的网络拓扑结构, 并且能够实现更高效的QoS管理和更智能的网络性能监控, 从而最终保证网络高效、稳定、安全的运行。网络流量模型的一个非常重要的应用就是网络流量预测[4]。通过网络流量预测可以确定网络流量的基准, 从而发现和定位网络故障和安全攻击;或者根据流量预测进行流量负载均衡, 区分服务优先等级, 进行合理的网络规划设计等。
随着目前校园网络规模的不断扩大, 网络应用类型的多样化以及各种网络病毒和网络攻击手法的出现, 网络管理和维护面临着日益严峻的挑战。通过网络流量模型和网络流量预测来进行网络管理和故障排查对校园网管理已变得越来越重要。
1传统流量模型介绍
传统的随机统计模型通常假设数据包到达的过程为泊松过程, 数据包长度为指数分布, 并把该模型应用于ARPANET, 理论模型精确的描述了实际的流量特征。但是随着网络规模扩大、QoS保证技术以及新的应用的出现, 流量特征得到极大改变, 经典的随机统计模型已经不能表示实际的流量特征[5]。以下简单介绍经典的流量模型和自相似流量模型。
Poisson 流量模型假设: (1) 数据源产生数据包的间隔时间为指数分布的, 即每个数据源产生数据包的行为是个Poisson过程; (2) 数据包的长度服从指数分布; (3) 数据包的到达过程和数据包的长度相互独立。
根据Poisson 流量模型, 从不同的数据源汇聚的网络流量将随着数据源的增加而日益平滑, 这和实际测试的流量是不符合的;实际网络承载的数据包大小分布和网络承担的主要应用相关, 测试的结果表明假设 (2) 也是不合理的;因交换机/ 路由器的工作方式以及QoS 保证等影响, 数据包的大小和达到过程明显是不独立的, 因此假设 (3) 也不合理。Poisson 模型的确较好满足了早期的ARPANET, 并在网络设计、维护、管理、性能分析等方面发挥了极大的作用, 但网络流量特征的变化使得该模型不适于实际的网络流量。最近的测试结果表明了流量的自相似特征[6]。尽管可以验证流量的自相关特征, 但是基于该模型进行流量估计是困难的。
因此充分考虑流量的时间相关特征和流量的突发特征, 建立可以预测流量的流量模型对于流量负载均衡、QoS 保障、故障异常检测、网络规划设计等都是必须的[7]。
2流量测试实验
网络流量测试是数据模型建立的基础, 我们主要采用被动测试的方法。流量测试基本上可以分为:基于SNMP MIB/ RMON的测试方法;数据包过滤的测试方法;系统日记文件分析的方法。
基于SNMP MIB/ RMON的测试方法适合长期大范围的测试, 但是必须要求网络设备支持SNMP, 频繁的查询路由器/交换机的MIB , 加重网络设备的负载, 降低设备处理包的效率, 增加网络流量。
基于数据包过滤的方法, 可以通过端口镜像或者将测试仪串接在目标链路上进行测试。其中, 端口镜像要求网络设备必须支持端口镜像并且提供空闲端口, 而如果将测试仪串接在目标链路上则会增加数据包的传输延迟, 要求测试仪有较高的数据包处理能力, 由于受测试仪缓存的限制, 该方式不适合长期的流量测试。
系统日记的方式, 一般被服务器采用, 该方式只能适用于端系统。
综上所述, 由于基于数据包过滤的方法需要为每个测试链路提供镜像端口或提供额外测试设备, 测试成本开销较大, 而系统日记的方式只适用于服务器, 并且目前校园网汇聚层网络设备均支持SNMP且性能较高, 因此为了能够长期、大范围、实时的测试监控网络中各主干链路, 本文中采用基于SNMP MIB/ RMON的测试方法来测试网络流量。
本文中的测试数据是针对青岛农业大学校园网进行测试, 测试时间为2006年11月1日至2007年11月1日, 测试方法采用基于SNMP MIB/ RMON的测试方法, 测试数据以5分钟为周期进行记录, 测试对象为210.44.48.91路由器的GigabitEthernet 0/0接口, 整个校园网通过该路由器接入CERNET中国教育科研网。所有数据通过MRTG网管工具进行获取, 这些测试数据经计算后被绘制成图表以帮助对网络流量特征有一个更加直观的分析。图1、图2、图3、图4分别表示该链路一年、一月、一周、一天的网络流量情况。
3流量模型
3.1流量分析和模型建立
在校园网络正常运行状态下, 网络流量主要由用户产生, 因而有着一定的规律性。从长期来看, 如图1所示, 网络流量的规律性并不明显, 由于网络结构的调整、网络规模的变化以及用户作息时间的改变, 每天网络流量都会出现较大程度的变化。例如图1中2月份流量所示, 这是由于学校里大部分师生放寒假而导致网络流量出现低谷。但从短期来看, 网络流量的周期性规律却非常明显, 这种规律表现在每周七天和每天二十四小时内的流量变化特征。从图2、图3、图4可以看出, 网络流量按照天为周期呈现明显的时间周期特性, 且每日流量峰值和谷值出现的时段相对稳定和集中, 通常在工作时间内网络使用比较繁忙, 而在凌晨休息时间内流量比较小。基于网络流量这种周期性特征, 建立一个周期性网络流量模型并对网络流量在一定范围内进行预测, 但这种网络流量模型和网络流量预测只适合短期预测, 并且随着网络流量新的变化需要不断更新网络模型的基准值, 以便更加准确地预测网络流量。因此, 在本文中我们将通过对一周网络流量数据的计算分析来建立网络流量模型。
针对以上分析结果, 首先建立如下变量, 标识符如表1所示。
根据以上变量, 我们对校园网路由器GigabitEthernet 0/0链路一周流量进行统计, 一天为一个周期测试得到的网络流量样本可以表示为数列{T1[1], T2[1], , Ti[1];T1[2], T2[2], , Ti[2];, T1[n], T2[n], , Ti[n]}
设流量平均值函数为:
则存在时刻t相关的数列{τ1, τ2, , τn}。我们设定测试周期为一天, 测试采样周期为5分钟, 则一个周期内的抽样次数n=288, 抽样时间为2007年11月5日 (星期一) 至2007年11月11日 (星期日) 共7天时间, 则τt如图5所示, τt曲线与实际流量相比较为平滑, 减少了流量的突发性。
又设测试流量与平均值之差函数为:
δi[t]= Ti[t]-τt (2)
因此, 在测试的7天时间中, 有:
{δ1[1], δ2[1], , δ7[1];
δ1[2], δ2[2], , δ7[2];,
δ1[288], δ2[288], , δ7[288]}
再由公式 (2) 知, 在测试的7天时间中t时刻实际流量为:
Ti[t]=τt+δi[t] (3)
因此可以假设2007年11月11日以后每日t时刻的流量:
T[t] =τt +δ[t] (4)
其中τt为可列函数, 因此我们需要研究δ[t]的性质与规律。由图1观察可知网络流量较大时, 突发流量较大, 即δi[t]值较大;而当流量较小时, 突发流量较小, 即δi[t]值较小。为了能够准确反映网络流量的这一特征, 我们不能简单的按照δi[t]的样本值来分析δ[t]函数的规律, 而是令:
ξi[t]= δi[t]/τt (5)
这样对应每一δi[t]值我们有ξi[t]值与其对应, 相对于δi[t]值而言, ξi[t]值屏蔽了突发流量随着网络流量的大小而变化的特点。根据公式 (4) 得:
T[t] =τt +ξ[t]τt (6)
下面我们主要分析ξ[t]的性质与规律。
3.2模型分析
首先对ξi[t]样本值进行概率统计, 接着分析并验证ξi[t]的概率分布特性, 最后根据置信区间来预测网络流量的上下限。
3.2.1 假设检验
假设在测试数据中ξi[t]的取值范围为[α, β], 将区间[α, β]等分为m个小区间分别记作:
令fj表示测试数据中ξi[t]出现在区间Aj内的频数。通过上述方法, 我们将2016个样本数据划分为16个独立的区间Aj (1≤j≤16) , 每个区间宽度为0.2, 统计每个区间Aj内ξi[t]出现的频数fj, 并作图如图6所示。
通过对测试数据ξi[t]的fj–Aj关系图进行观察, 可以初步假设ξi[t]值服从正态分布, 即P{ξi[t]}符合正态分布N (μ, σ2) 。分布函数如下:
其中, μ和σ为待估参数, 根据极大似然估计法有:
根据假设:H0:P{ξ[t]<x}的概率密度为:
以及估计值μ=0.0338, σ2=0.1033, 分别计算P (Aj) 的概率p’j并求得 (fj-np′j) 2/np′j的数据值。计算结果如表2所示。
因为X
3.2.2 流量预测
对于服从正态分布N (μ, σ2) 的随机函数ξ[t], 我们希望得到满足一定置信度的置信区间, 即设ξt、ξb分别为ξ[t]的置信上限和置信下限, 对给定的置信度α有:
P{ξb<ξ[t]<ξt}=α (9)
由式 (8) 得:
P{ξ[t]<ξt} -P{ξ[t]<ξb}=α (10)
根据上式及正态分布函数的属性, 可以得到其置信上限ξt的表达式如下:
其中Φ (x) 为标准正态分布函数。很显然在正态分布的参数已知的情况下, 上式中有两个未知参数, 必须首先确定一个参数时才能求另一个参数, 本文中我们更关心置信上限, 因此先假定置信下限满足某种情况, 例如假设P{ξ[t]<ξb}=α0, 则有:
ξb=Φ-1 (α0) σ+μ (12)
由式 (10) 、式 (11) 可得置信上限的表达式如下:
即:
ξt = Φ-1 (α+α0) σ+μ (13)
通过式 (6) 、式 (13) 我们可以对未来的网络流量进行预测。
网络流量t时刻的上限为:
T[t] =τt +ξtτt (14)
网络流量t时刻的下限为:
T[t] =τt +ξbτt (15)
4结论
本文在对青岛农业大学校园网流量长期测试的基础上, 通过对大量网络流量测试数据的概率统计分析, 提出一个基于周期性网络流量的网络流量模型, 将网络流量分为时间相关分量和正态随机分量, 其中时间相关分量是时间的周期性函数, 正态随机分量服从正态分布, 并利用该模型预测特定时刻的网络流量, 从而最终保证我们对整个校园网络进行高效的管理。
摘要:网络流量模型是网络性能评价、网络协议设计和网络规划等的基础, 然而实践证明基于泊松过程的传统流量模型并不适用于实际的网络流量。在对大量校园网络流量数据统计分析的基础上, 提出一个基于周期性网络流量的网络流量模型, 将网络流量分为时间相关分量和正态随机分量, 并利用分布拟合检验算法加以验证, 同时给出了在不同置信度下基于该流量模型的流量预测算法, 从而保证对校园网络高效的管理。
关键词:流量测试,流量模型,流量预测
参考文献
[1]Wu G, Chong EKP, Givan R.Congestion Control via Online Sampling[A].Proceedings of the2001IEEE INFOCOM[C].Anchorage, A K, April22-26, 2001:1271-1280.
[2]Wang S, Xuan D, Bettati R, et al.Providing Absolute Differentiated Services for Real-Time Application in Static Priority Scheduling Net-works[A].Proceedings of the2001IEEE INFOCOM[C].Anchorage, AK, April2001:22-26.
[3]Feldmann A, Greenberg A, Lund C, et al.NetScop:Traffic Engineering for IP Networks[J].IEEE Network Magazine, March2000.
[4]Sheng D, Hellerstein J L.Predictive Models for Proactive Network Man-agement:Application to a Production Web Server[A].Proceedings of the2000IEEE/IFIP Network Operations and Management Symposium[C].Honolulu, Hawaii, April2000:10-14.
[5]Floyd S, Paxson V.Difficulties in Simulating the Internet[J].IEEE/ACMTransactions on Networking, 2001, 9 (4) :392-403.
[6]Willinger W, Taqqu MS, Erramilli A.ABibliographical Guide to Self2Similar Traffic and Performance Modeling for Modern High-Speed Networks, in Sto-chastic Networks:Theory and Applications[M].Oxford University Press, 1996:339-366.
车流量预测 第4篇
第一节 —超声波流量计行业产品总产量及细分产品产量统计
一、2010—20超声波流量计行业产品总产量统计
二、2010—年超声波流量计行业细分产品产量统计
第二节 2010—2014年超声波流量计行业产品及细分产品市场容量统计
一、2010—2014年超声波流量计行业产品市场容量统计
二、2010—2014年超声波流量计行业细分产品市场容量统计
第三节 产品技术指标分类
第四节 2010—2014年我国超声波流量计行业产品结构变化
第五节 —超声波流量计行业产品总产量及细分产品产量预测
第六节 2015—20超声波流量计行业产品总产量及细分产品市场容量预测
第三章 超声波流量计行业技术发展分析
第一节 超声波流量计行业当前主流技术分析
第二节 国内外超声波流量计行业技术对比
第三节 国内外超声波流量计行业前沿技术动态
第四节 超声波流量计行业技术壁垒分析
第四章 超声波流量计行业产业链发展分析
第一节 超声波流量计行业产业链模型分析
第二节 超声波流量计行业上游行业发展概况
第三节 超声波流量计行业下游行业发展概况
第四节 超声波流量计行业原材料供给情况
第五节 超声波流量计行业下游消费市场构成
第五章 超声波流量计行业政策研究
第一节 2010—2014年超声波流量计行业产业政策回顾
第二节 20超声波流量计行业产业政策热点
第三节 “十二五”期间超声波流量计行业发展政策环境预测
第四节 超声波流量计行业价格调控政策分析
第五节 超声波流量计行业投资鼓励限制政策分析
第六章 超声波流量计行业企业竞争
第一节 超声波流量计行业企业竞争格局
一、市场集中度分析
二、区域市场竞争格局
三、品牌市场竞争格局
四、渠道市场竞争格局
第二节 国内外企业竞争力对比分析
第三节 国外主要企业研究
一、企业一
1. 企业介绍
2. 产品业务构成
3. 2010—2014年经营统计数据
4. 2015—年发展预测
二、企业二
1. 企业介绍
2. 产品业务构成
3. 2010—2014年经营统计数据
4. 2015—2017年发展预测
车流量预测 第5篇
关键词:小波变换;网络流量;ARIMA
中图分类号:TP393.07文献标识码:A文章编号:1007-9599 (2011) 07-0000-01
Network Traffic Prediction Research Based on Wavelet Technology and Arima Mode
Li Jingfei1,Guo Aiping2,Yang Zhiguo2
(1.Artillery Command College,Xuanhua075100,China;2.Staff Communication Training Base,Xuanhua075100,China)
Abstract:Combined with wavelet transform technology and time series model ARIMA,establishing a network traffic prediction model with actual network flow.The mode test,results show that the model has higher prediction effect.
Keywords:Wavelet transform;Network flow;ARIMA
一、引言
网络流量的准确预测在计算机网络的设计和管理、冲突控制和动态带宽分配具有十分重要的作用。然而,成功的流量预测离不开精确的流量模型的支持,高质量的流量模型对于设计高性能网络协议和高效的网络拓扑结构;对于设计高性价比的网络设备与服务器;对于精确的网络性能分析与预测:对于拥塞管理与流量均衡提高服务质量等都具有非常重要的意义。
小波变换在经济预测方面有了较深入的研究,将其应用到网络流量中来会有一种新的突破。小波是一种时频域变换方法,小波变换对具有长程依赖性的流量起到了去相关作用,在时域不容易解决的问题可以转化到频域中来。通过小波变换信号可以一层一层地分解到不同的频域上,分解后的信号在频域上比原始信号单一,并且对信号作了平滑,因此分解后信号的平稳性比原始信号好得多。一般小波算法此时就将逼近系数作为平稳序列进行处理(参见文献)。但多数情况下逼近系数此时依然为非平稳信号,因此在此处采用ARIMA(p,d,q)的方法建模,利用差分方程使逼近系数平稳后再建立ARMA模型.这样就将小波分析与经典的平稳时间序列建模结合起来,从而为非平稳时间序列的建模与预测提供了一种新的方法,并且提高了预测精度。
二、模型原理
(一)ARIMA模型
ARIAM模型是建立在马尔可夫随机过程基础上的,它反映动态的特点,既吸收了回归分析的优点又发扬了移动平均的长处。在许多实际问题中(如网络流量),所观测的样本数据序列{Xt,t=0,1,2⋯,}一般都是非平稳序列,但将其进行d次有限次差分处理后,该序列就成为了平稳序列。
(二)小波分解
利用小波对时间序列进行分解与合成时,本文采用是基于Mallat算法的多尺度小波分解与合成,这种方法可以得到不同分解尺度下的细节系数和逼近系数。
(三)模型具体操作步骤:
1.对细节系数的d1,d2,…dj 重构信号的建模。
单支重构的实质就是保持尺度系数一定,仅对平移因子进行积分,得到在特定尺度下的单支时间信号。单支重构的意义在于将信号分解成各特定频率范围内的时间信号,种单支重构信号进行分析,可以排除其他频率成分的干扰。
重构后的细节系数一般可视为平稳过程来处理,可用ARMA(p,q)模型来建模并进行预测得到预测值dj,相加后得到拟合值dj。
2.对逼近系数重构信号的建模。
逼近系数表示序列的趋势或走向,一般小波算法此时就将逼近系数作为平稳序列进行处理,但多数情况下逼近系数此时依然为非平稳信号,因此在此处采用ARIMA(p,d,q)的方法建模,利用差分方程使逼近系数平稳后再建立ARMA模型,最后得到预测值cj。
3.将各模型预测的结果进行叠加,即可得最终的模型预测结果:
{xt}=dj+cj
三、结论
由于网络流量的突发性,相似性,自相关特性使得传统的网络流量模型或者单一的网络流量模型已经不能很好的描述,所以本文引入了小波技术。
小波变换对具有长程依赖性的流量起到了去相关作用,在时域不容易解决的问题可以转化到频域中来。通过小波变换信号可以一层一层地分解到不同的频域上,分解后的信号在频域上比原始信号单一,并且对信号作了平滑,因此分解后信号的平稳性比原始信号好得多,经过小波分解成细节系数和逼近系数,因为细节系数趋于平稳所以我们直接采用平稳序列模型建模预测,而对于逼近系数我们先用ARIMA模型平稳化后,再使用平稳序列模型进行建模预测,最后将两种信号的预测结果进行叠加,通过实验数据的验证我们得出结论,对于逼近系数平稳化后的预测值与实际值的拟合度要远远高于没有进行平稳化的拟合度。网络流量模型的组合建模预测以及将一些技术引入到流量模型中并进行不断的改进仍将是我们今后研究的热点。
参考文献:
[1]薛可,李增智,刘浏.基于ARIMA模型的网络流量预测[J].微电子学与计算机,2004,7:84-87
网络流量丢包率预测模型 第6篇
车用自组织网络是运用于道路上的新型移动无线自组织网络,可以实现车辆间,车辆与路边节点间的多跳无线通信[1],不仅能用于交通事故告警,还能用于道路交通信息查询、公路不停车缴费和车辆间语音视频通信等功能,故车用自组织网络逐渐成为研究的热点,而当前主要的研究集中在路由协议[2]、传输控制协议[3,4]和数据服务等方面。移动自组织网络尤其是车用自组织网络,运行环境复杂,节点快速移动,链路带宽不稳定,链路级丢包较多,所以链路质量、链路丢包是上层协议必须考虑的因素。虽然使用频谱仪可以观测到实际链路的信号衰落特性,进而估计出链路的BER,但是BER并不能完全反映丢包率,无线信道的包是由不同长度的位序列组成,仅从BER难以计算不同长度序列传输的成功率,所以需要采用实测的手段获取丢包率,发现其规律和特征,为上层协议设计和服务质量保证提供直接支持。
通过分析信道收发过程中的丢包率的检测数据以及周围环境的一些基本数据,可以判断出当前情况的丢包率的变化规律,保证重要信息的传输。而要对移动自组织网络的无线信道网络流量状况进行分析关键是找出其丢包率的规律,解决此类问题的常用方法是对测量数据进行曲线拟合[5]。因此,可以采用最小二乘曲线拟合法来实现基于丢包率的无线信道网络流量的曲线拟合与仿真。通过实验,对不同环境下车用移动自组织网络无线链路丢包率进行了测量,并找出能够预测相关变化趋势的拟合方法。
1 数据信息的提取
基于802.11b/g的车用自组织网络无线链路的特点是视距可达(LoS),节点采用ad-hoc模式,节点移动速度为20~40 km/h,节点间距离为20~50 m。目前的研究没有考虑信道干扰问题,经过大量实地道路的丢包率测量,得到了真实道路环境下链路变化的统计规律,为无线链路丢包率的估计打下了基础。
整个实验由3个模块组成,如图1所示。实验过程中发送方(T)走在前面,接收方(R)随后。发送方开始发送数据后,接收方记录GPS位置信息、以及与两节点的相对距离,作为筛选实验数据的依据。笔记本甲上运行的GPS模块程序主要是用来读取发送方自身的位置信息,并在1秒钟内(GPS约1 s更新一次信息)发送100个数据包,通过socket发送。发送的广播信息包括:包序列号、GPS定位信息和时间等。笔记本乙上运行的GPS模块一方面要读取本地GPS信息,另一方面要接收广播信息,接收的广播信息里包含了笔记本甲的GPS位置信息。根据2个GPS位置信息画出两车的运行轨迹,并计算出实时距离,同时将丢包率信息存入本地文件。
2 拟合算法的设计分析
曲线拟合的基本思想就是通过构造一个逼近函数来表达样本数据的总体趋势和特征。在充分了解样本数据特征的情况下,可以根据数据的特点选择相应的函数模型。由于起初对样本数据的认识不够清楚,不能确定变量之间的准确关系,这时就需要将样本数据绘制成散点图,观察样本数据在散点图中的分布。根据函数特征和散点分布特点确定适合的模型。
2.1 N阶多项式拟合模型的网络流量预测
曲线拟合是用连续曲线近似地刻画或比拟平面上离散点所表示的坐标之间的函数关系的一种数据处理方法,其目的是根据试验获得的数据去建立因变量与自变量之间的经验函数关系。针对第二部分的试验数据,基于最小二乘原理求丢包率x在t时刻的函数关系f(t,A),使其最佳逼近已知数据,采用N阶多项式拟合模型f(t,A)=a0+a1t+a2t2++antn。通过迭代不同的参数A,让拟合模型与实际观测值在各点的方差最小。
不同阶次的函数图形的比较通过其样本数据拟合的程度从而确定出与样本数据特征相符的最佳模型。
通过计算拟合参数A,可以得到f(t,A)的表达式。基于前t秒的表达式f(t,A),即可以得到t+1时刻的丢包率xt+1=f(t+1,A)。依此进行对网络流量丢包率的预测。拟合模型的网络流量预测如图2所示。
2.2 基于Matlab的函数拟合实现
3 试验结果分析
对于一次道路交通试验,当车辆保持在10 m的距离内,周围环境变化相对稳定,取采样周期T=287 s。在N=1,2,3的情况下,N阶多项式拟合模型的网络流量丢包率预测的实际分析结果如图3、图4和图5所示。图中黑色线代表当前时间t下网络流量丢包率的实际值。红色加点线代表当前时间t下基于多项式模型丢包率的预测值。
从图3、图4和图5可以看出来,n阶多项式拟合模型能够对于无线网络流量的丢包率数值进行预测。同时,随着多项式阶数增高,拟合模型预测的结果于真实结果相差增大。说明无线网络的丢包率分布的趋近于线性。1阶多项式模型对于网络流量的预测效果较为理想。总体误差可以控制在5%~8%。
4 结束语
通过对无线自组织网络流量的丢包进行实时环境下的实验,对不同环境下车用移动自组织网络无线链路丢包率测量,找出能够预测相关变化趋势的拟合方法。提出一种基于最小二乘法的丢包率拟合模型,为无线网络下信号丢包率的预测供了可行的手段。其中,1阶多项式模型的预测效果较为理想,具有普遍的使用价值。
摘要:无线信道的网络流量的及时预测,是目前国内外研究的前沿课题。通过对实时网络流量的测量分析,提出了一种基于最小二乘法的多项式拟合网络流量丢包率预测模型。该模型根据当前获得的网络流量信息,对网络丢包率趋势进行预测,为无线网络下信号丢包率的预测供了可行的手段。实测丢包率与预测丢包率的对比分析表明提出的预测模型能很好的预测丢包率趋势。
关键词:多项式拟合,丢包率,预测,网络流量
参考文献
[1]YANG Yang,XU Jun,CHENG Da.VANET LinkCharacteristics and Analysis in Urban and Suburban Scenarios[C].Fujian:ICCCAS,2008:83-85.
[2]HAO Jiang,LI Jian-jin.Geographic Pattern Routing for MANETORin IVC[C].Ottawa:ADHOC-NOW,2006:156-169.
[3]陈立家,江昊,吴静,等.车用自组织网络传输控制研究[J].软件学报,2007,18(6):1477-1490.
[4]CHEN A,KHORASHADI B,GHOSAL D.Impact ofTransmission Power on TCP Performance in Vehicular ad HocNetworks[C].Oberguyrgl:WONS,2007:65-71.
[5]任铭,张建建.基于Matlab的曲线拟合法分析长江流量规律[J].统计与咨询,2007(5):20-21.
车流量预测 第7篇
关键词:交通流量预测,区间二型模糊神经网络,BP学习算法
Short-term forecastingoftrafficflow isanimporantissueforintelligenttransportationsystem (ITS) , specially, foritsadvanced traffic managementand ravelerinformationsystem research.Theproblem of hort-term trafficforecastingistodeterminethetraffic olumeorconditioninthenexttimewindow, usually ntherange 530min, basedonhistoricaltrafficinormationorreal-timeinformation.
Inthepast10yearsorso, manystudieshavebeen devotedtoforecasttrafficflows, vehiclespeedsorother trafficvariables, includingonesthatarebasedontime seriesmodels[1,2], Kalmanfiltertheory[3], non-parametricmethods[4], simulationmodels[5], localregressionmodels[6], leastsquaressupportvectormachines (LS-SVM) [7]andneuralnetworkapproaches[8].Nevertheless, theneuralnetworklacksperceivedreliability andtheknowledgecontainedinanetworkisnoteasilyunderstood[9].An importantdevelopmentin neural networkmodelinginrecentyearshasbeentoincorporateafuzzysystem intoaneuralnet[8,10,11].
Trafficsystem isapeopleinvolved, time-varying andcomplexnonlinearsystem.Oneofitsinstinctcharacteristicsishighuncertainty, whichsubjectstoavarietyofnaturalfactorsandhumanfactors.Buttype-1fuzzysetsarenotabletodirectlymodelsuchuncertainties because theirmembership functions are totally crisp[12].Sothetype-1fuzzyneuralnetwork system (T1FNS) cannotforecasttrafficflow accurately.On theotherhand, type-2fuzzysetsareabletomodel suchuncertaintiesbecausetheirmembershipfunctions arethemselvesfuzzy[13].Type-2fuzzysystem hasbeen appliedtodatawithagreatsuccesstomanyreal-world applications in which theyhave outperformed their type-1counterpartsduetothetype-2fuzzysystemsabilitytohandleuncertainties[1316].Thispapersetsup anew system forforecasting, ormoregenerally, for handlinguncertaintyand generatingshort-timetraffic forecastswithreasonableaccuracy.Ourmodelisanintervaltype-2fuzzyneuralsystem inwhichaninterval type-2fuzzymembershiparrayisembeddedinaneural networkstructure.Thenew system takesadvantageof bothneuralnetworkandtype-2fuzzylogicconcepts, capableoflearningnew patternsbyusingneuralnetworktrainingproceduresandhandlinguncertaintiesby usingtype-2fuzzylogicsets.Therulesandmembershipfunctionscanbeextractedfrom thefuzzyneural system, modifiedbasedonsuperiortheoreticalknowledge, andthenapplieddirectlyfortrafficflowforecasting.Ourproposedtrafficforecastingmodelbasedon type-2fuzzyneuralsystem willexplicitlyconsiderthe day-to-dayrecurrenttrafficpattern, whichmaybehave similartoarandom walk.Experimentsshowedthatthe proposedmodelcangeneratetrafficforecastswithreasonableaccuracy.
Thechoiceofintervalmodelisimportantforperformanceoftrainingalgorithm, whichisdesirabletobe easytocompute.Oneofthemajoradvantagesofintervaltype-2fuzzylearningalgorithm isaccelerateconvergencespeed[17].
Theorganization ofthispaperisasfollows.In Section 2, weoutlinethestructureoftheintervaltype-2fuzzyneuralnetwork.Section 3presentstheinterval type-2fuzzyneuralsystem fortrafficflow forecasting.Insection 4weevaluateandcomparetheperformance ofourIT2FNSwithT1FNS.Finally, conclusionand futureresearcharesummarizedinSection 5.
1 Intervaltype-2fuzzyneuralsystem
1.1 Intervaltype-2fuzzysettheory
Theconceptoftype-2fuzzysetwasinitiallyproposedasanextensionofordinary (type-1) fuzzysets byProf.Zadehin 1975[18].Type-2fuzzysetscanallow tohandlelinguisticuncertaintiesasnoisydata, differentmeansofwords, etc[14].Type-2fuzzysetsletus modelandminimizeeffectsofuncertainties.Thereare manyreal-worldproblemswherewecannotdetermine theexactform ofthefuzzysetinanalysisofsystems becauseofnoiseinthedata.Thetype-2fuzzysetscan beconsideredasasecondorderapproximationwithrespecttotype-1fuzzysets.Itispossibletousefuzzy setsofhighertypesbutthecomplexityofthefuzzyset increasesveryrapidly.Sointervaltype-2fuzzylogic set is introduced to simplifythe computationalprocess[19].
A type-2fuzzysetinuniversalsetXisdenotedas A.which is characterized bya type-2 membership functionμA (x) inegua. (1) .TheμA (x) canbereferredasasecondarymembershipfunctionoralsoreferredasasecondaryset, whichisatype-1fuzzysetin[0, 1].fx (u) isasecondarygradeinegua. (1) , which isthe amplitude ofa secondarymembership function;i.e., 0≤fx (u) ≤1.Thedomainofasecondarymembershipfunctioniscalledtheprimarymembershipofx.Inegua. (1) , Jxistheprimarymembership ofx, whereu∈Jx[0, 1]for x∈X;uisafuzzy setin[0, 1], ratherthanacrisppointin[0, 1].
Figure 1showsanexampleofatype-2fuzzymembershipfunction.Theshaded region bounded byupper andlowermembershipfunctionsiscalledthefootprint ofuncertainty (FOU) asshowninfigure 1 (a) .A secondmembershipfunctionisaverticalsliceofμ. (x, u) asshowninfigure 1 (b) .Althoughtype-2fuzzysetsmaybeusefulinmodelinguncertaintywhere type-1fuzzysetscannot, theoperationsoftype-2fuzzy sets involve numerous embedded type-2 fuzzysets whichconsiderallpossiblecombinationsofsecondary membershipvalues.
Therefore, largecomputationsmayberequired.However, intervaltype-2fuzzysetscanbeusedtoreduce the computationalcomplexity.Intervaltype-2fuzzysetsarespecifictype-2fuzzysetswhosesecondarymembershipfunctionsareintervalsetsexpressedas
Thebasicsoffuzzylogicdonotchangefrom type-1totype-2sets.Thedifferencebetweenthesetwosystemsisoutputprocessing.Thetype-2FLSsshoulduse thetype-reducertoreducetheoutputfuzzysets'degree.AsFigure 2shows[1317], thestructureofatype-2FLSissimilartothestructureoftype-1one.The structureincludesfuzzifier, knowledgebase, inference engine, type-reducer, anddefuzzifier.Inordertoemphasizetheimportanceofthetype-reducedsetwehave showntwooutputsforthe type-2FLS, the type-reducedsetandthecrispdefuzzifiedvalue.Basedonthe blockdiagram, wewillexplanationtheFLSsoftype-2fuzzyneuralnetworksystem innextsection.
1.2 Intervaltype-2fuzzyneuralsystem
Duetothecomplexityoftypereduction, thegeneraltype-2FLSbecomescomputationallyintensive.An intervaltype-2FLS, whosesecondaryMFsareallunity, makethingssimplerand easiertocomputemeet andjoinoperations, whichleadsfinallytosimplifytype reduction.An intervaltype-2fuzzyneuralsystem is shownonfigure.2, whichisanimplementationofintervaltype-2fuzzylogicsystem, andsomeoftheirparametersandcomponentsarepresentedbyfuzzylogic terms.Liketype-1FNN, Figure.3isatypicalFNN withfourlayersstructure[17].Inputnodesandtype-2fuzzificationnodesaredrawnonlayerIandlayerII, respectively.Theyform the antecedentpartofthis T2FNN.ConsequentpartsaredrawnonlayerIIIand IV whichareconstructedfrom aclassical 2-layerNN withfuzzyrulenodesandoutputnodes.Thefuzzifier nodesinlayerIIwillyieldtype-2membershipgrades.EachnodeatlayerIIIisafuzzyrule.LayerIIInodes consistofthepreconditionsoftherule, i.e., thefiring strengthfrom egua. (3) asshowninthefollowingcontext.LayerIV nodesdefinetheconsequencesofthe rulenodes.ThelinksbetweenlayerIIIandlayerIV consistofintervalweightingfactorswhichwilldecide theactualoutputsofthissystem.
TheIF-THEN ruleforIT2FNScanbeexpressedas
THENy1isωil1ωir1」, and, andyzisωilZωirZ」.Wherei=1, 2, , M isrulenumber, theFniisthe intervaltype-2fuzzysetsofantecedentpart, andωilZωirZ」isacentroidsetwithunitymembershipgrade, which can be called weighting intervalset, derived from intervaltype-2setin the consequentpart[19].BothωilZandωirZaretreatedasweightingfactorstofully connectlayerⅢandlayerⅣinourIT2FNSstructure.Inpracticaluse, bothωilZandωirZcanalsobesetatrandom initiallyin areasonableinterval.Thisstructure combinestype-2fuzzificationinantecedentpartwitha random weightingintervalsetin consequentpart.It cannotonlytotallyrepresentsatype-2fuzzylogicrelation, butitcanalsoprocesstype-reductionandleads tothedevelopmentadynamicoptimaltraininginconsequentpartwhichwillbeshownlaterinsimulation.
1.3 Typereduction
Similartotype-1FNS, forGaussianintervaltype-2fuzzysetasshowninFigure1, theupperMF isa subsetthathasthemaximum membership gradeand thelowerMFisasubsetthathastheminimum membershipgrade.thefiringstrengthFicanbeobtainedby thefollowinginferenceprocess:
Thecenter-of-setstype-reduction[20]willbe used in thispaper.Inordertosimplifythenotation, weconsidersingleoutputhere.Thenwehavethecenter-ofsetstype reduction method asshown in egua. (4) whereycos (x) isalsoanintervaltype-1setdetermined byleftandrightendpoints (ylandyr) , whichcanbe derivedfrom consequentcentroidsetωliωri」andfiringStrengths fi∈Fi=fi, fi」.Theintervalsetωliωri」 (i=1, , M) shouldbecomputedorsetfirstbeforethecomputationofycos (x) .Foranyvaluey∈ycos (x) , ycanbeexpressedasegua. (5)
Whereisamonotonicincreasingfunctionwithrespect toωi.Also, ylinegua. (6) istheminimum associated onlywithωli, andyrinegua. (7) isthemaximum associatedonlywithωri.Notethatylandyrdependonlyon mixtureoffiorfivalues.Hence, left-mostpointyl andright-mostpointyrcanbeexpressedaslyry[21]
and
2 Intervaltype-2fuzzyneuralsystem for short-term trafficflow forecasting
2.1 The membership function for traffic flow forecasting
Theintervaltype-2fuzzysethasanuppermembership function and a lowermembership function.Thispropertycanbeconvenientlyutilizedtogeneratea prediction interval.Gaussian primarymembership functionsareusedintwoways.Weconsidertheuseof aGaussianprimarymembershipfunctionwithafixed standarddeviation, σ, butuncertainmeaninthefollowingform:
Foreachvalueofm, thereisacorrespondingmembershipcurve.Thechoiceofandisbasedonthehistorical information.In thecaseoftheintervaltype-2fuzzy set, theuppermembershipfunctionisdefinedby
Whereasthelowermembershipfunctionisdefinedby
Similarly, wecanconsidertheuseofaGaussian primarymembershipfunctionwithfixedmean, m, but uncertainstandarddeviation:
Foreachvalueofσ, thereisacorrespondingmembershipcurve.Inthecaseoftheintervaltype-2fuzzyset, theuppermembershipfunctionisdefinedby
Thelowermembershipfunctionisdefinedby
2.2 Learningprocess
Itisknownthatthetype-1FNN system isauniversalapproximator[2, 3, 69].Thatis, in general, for functionmappingorsystem identification, itiseasyto designanFNN system toachieveasatisfactorylevelof accuracy.Bytheway, wedeterminethefeatureparameterstorepresentatype-2fuzzyset.Then, backpropagation learning algorithm is used optimize the type-2FN system, i.e., antecedentand consequent MFs.Herein, thetrainingprocessusingback-propagationlearningalgorithm isdescribedasfollows.
Step 1:Constructingandinitializingthetype-1FNN system。
Step 2:Usingtheback-propagationalgorithm to trainthetype-1FNNandobtainasetofGaussianfunctions (mean, variance) andweightingvector.
Step 3:UsingtheresultsofStep 2andaddauncertaintyinantecedentandconsequentpartofIT2FNS,
Step 4:ConstructingtheGaussianprimarymembershipfunction.
Step 5:UsingtheBPtotrainthetype-2FNN to findtheoptimalvalues.
Theobjectiveofparameterslearningistooptimize thefreeparametersofthetype-2FNN system.Subsequently, in thisphasetheparametersshould bedefined.OneistheMFandtheotherisweightingvector.EachMF containstwomeansvalues (upperMF and lowerMF) , STD, andweightingvector (ormean, two STDvalues, andweight) .Therefore, foragivenn-inputoneoutputtype-2FNNwithRrules, thenumberof rulesis 3R×n+2R.
3 Simulationresults
Wearenow inthepositiontocomparetheperformanceofthedesiredIT2FNSwiththeclassicaltype-1fuzzyneuralsystem forecastingtechniques.Ourexperimentswereconductedusingbenchmarkdatafrom theTianHeDistrictofGuangzhouonApril 12, 2004.Realtrafficdataseriesincludingquantity, velocityand occupancycollected from a section ofhighwayfrom8:00a.m.to 12:00a.m.Thereareavarietyofaccuracymeasuresavailableintheforecasting.Onecom-monpracticeinevaluatingtheperformanceistostudy thecorrelation between predicted outputand actual output.Thiscouldbeilluminatingiftheunderlyingrelationshipisactuallylinear.ThefrequentlyusedmeasuresareMeanSquaredError (MSE) , MeanAbsolute Error (MRE) and Mean Absolute Error (MAE) .Theseerrorstatisticswereusedinourstudy.
ThebestresultswereinIT2FNS, asshowninFigure 4 and Table 1 The out-of-sample forecasts of IT2FNSmodelascomparedwiththetype-1fuzzyneuralsystem modelaresummarizedinTable 1.Itisclear thattheIT2FNSmodelperformedsubstantiallybetter thantheothermodel.
4 Conclusionandfutureresearch
ThispaperintroducesanovelIT2FNS approach forshort-timetrafficflow forecasting.Theconsequent partofthisintervalT2FNN isalsoanintervalneural network.This type-2 fuzzyneuralnetwork has the characteristic ofhighlyhandling uncertainties.The proposedmodelusestheback-propagationlearningal-gorithm fortheparameter-learningphase.Theoptimal weightingfactorsintheconsequentpartofthisT2FNN canbedirectlyfoundfrom thedynamicaloptimaltrainingalgorithm withglobalsearching.OurexperimentinvestigatestheperformanceofIT2FNSincomparisonto popularmodelfortrafficflowforecasting.Ourpreliminaryresultshowedthattype-2fuzzylogicispromising inforecastingtrafficvariables.Theperformanceofthe modelintermsofthemeasuresofperformanceusedin thisstudyiseithercomparabletoorbetterthanthose usingtype-1FNN.
Thereisstillroom tofurtherimprovetheperformanceoftheproposedmodel.Forexample, currentlyin themodel-buildingprocesswehavemadenoattemptto tunetheparameterstooptimizetheperformanceofthe model.Thisisinpartbecausethereareonlylimited datasetsavailabletous.Inaddition, duetovariation oftheinitialMFparameters, i.e., thespreadlevelof uncertain means or deviations ofintervalGaussian MFs, the performance ofback propagation training processmaybeaffected.Toachievebettertotalperformance, otheralgorithmsareneededtosearchoptimalspreadrateforuncertainmeansandoptimallearningfortheantecedentpart.
网络流量预测的组合方法研究 第8篇
随着网络规模和业务种类的不断增长,网络流量成为一个非线性、时变的动力系统。为了满足日益膨胀的网络通信量需求,需对高速网络进行有效管理,而网络流量预测是网络管理的基础,高精度预测模型不但可以对将来的流量数据进行预测,而且还可以应用于接入控制、网络带宽分配和网络拥塞控制等许多方面[1]。
针对网络流量预测问题,学者们进行了大量深入研究,提出了许多网络流量预测模型。传统网络流量预测模型有:线性回归分析、灰色模型和时间序列等[2,3],这些方法基于线性建模,而网络流量是一个复杂的非线性系统,因此,传统线性模型无法准描述现代网络流量变化特点,预测结果不可靠[4]。近年来,随着非线性理论发展,出现了基于神经网络、支持向量机等非线性网络流量预测模型[5]。由于网络流量是一种典型时间序列数据,具有滞后、后效性特征,因此,在网络流量预测中,需要确定网络流量的最优滞后阶数和模型参数。传统滞后阶数采用线性回归方法确定,难以找到最优滞后阶数[6]。此后有学者提出了一些非线性定阶方法,提高了模型的预测性能,但这些方法非常耗时,影响网络流量预测效率[7]。基于统计理论的支持向量机算法LSSVM较好地解决了非线性等问题,克服了传统机器学习算法的局部最优、运行效率低等缺陷,成为网络流量的主要预测方法。LSSVM预测的性能对于参数的选择比较敏感,然而到目前为止,还缺乏指导LSSVM参数选择的好方法,在实际应用中大多凭经验确定其参数,从而因参数选择不当导致网络流量预测精度低[8]。
针对当前网络流量预测存在的一些问题,提出一种网络流量组合预测算法(GS-GA-LSSVM)。首先利用地统计学GS(geostatistics)对网络流量数据之间相关程度进行分析,快速确定网络流量时间序列的最优滞后阶数;然后根据最优滞后阶数对网络流量数据进行重构,输入到LSSVM学习,采用遗传算法GA对LSSVM的参数进行优化,建立网络流量的最优预测模型;最后通过具体实例对模型性能进行验证。
1 地统学和最小二乘支持向量机概述
1.1 地统计学
GS是一种基于区域化变量理论的统计学方法,采用变异函数描述变量结构性与随机性双重特征[9]。对于观察时间序列数据Z(xi),i=1,2,,n,变异函数值γ(h)的计算公式为:
式中,Z(xi)和Z(xi+h)分别为Z(x)在xi和xi+h上的观察值。
在二阶平稳假设条件下,协方差函数可表示为:
C(h)=E[Z(x)Z(x+h)]-m2 (2)
对不同的时间间隔距离h,根据式(2)可以计算出相应的变异函数值γ(h),以h为横坐标,γ(h)为纵坐标可得变异函数曲线图(如图1所示)。
从图1可知,随着h的增大而γ(h)增大,当h超过一定距离后,γ(h)稳定在一个极限值附近,此处的变异函数值称之为基台值,用C0+C表示,此时的间隔距离称为变程,用α表示。变异函数曲线在y轴上的截距称为区域不连续性值,用C0表示。
1.2 最小二乘支持向量机
支持向量机的复杂度与输入空间的维数无关,而依赖于样本数据的个数,因此样本数目越大,求解相应的二次规划问题越复杂,计算速度越慢,限制支持向量机的应用范围[10]。Suykens等在标准支持向量机的基础上提出了最小二乘支持向量机(LSSVM),将标准支持向量机型中的损失函数设定成误差平方和,把不等式约束改成等式约束,减少待定参数,又将求解二次规划的问题转化成线性KKT(karush kuhn kucker)方程组的求解,降低了求解的复杂性,拓宽了支持向量机的应用空间。
对于训练样本集{(xi,yi)},i=1,2,,n。xi和yi分别表示样本输入和输出,xi∈Rn,yi∈R,通过非线性映射函数φ()将样本映射到高维特征空间,从而获得最优线性回归函数:
f(x)=wTφ(x)+b (3)
式中,ω为特征空间的权值向量,b为偏置量。
根据结构风险最小化原则,式(3)问题求解的LSSVM回归模型为:
s.t. yi-wTφ(x)+b=ei (i=1,2,,n)
式中,γ为惩罚参数,用于平衡训练误差和模型复杂度;ei为实际值与回归函数间的误差。
通过引入拉格朗日乘子将上述约束优化问题转变为无约束对偶空间优化问题,即:
式中,αi为拉格朗日乘子。
根据Mercer条件,核函数定义如下:
K(xi,xj)=φ(xi)Tφ(xj) (6)
本研究选择径向基函数作为LSSVM核函数,径向基函数为:
最后LSSVM回归模型为:
其中,σ表示径向基核数宽度。
1.3 最小二乘支持向量机的参数优化
LSSVM在实际应用中的泛化推广性能,相当程度上取决于参数(γ和σ)的选择。误差惩罚参数γ的作用是在确定的数据子空间中调节学习机器置信范围和经验风险的比例,以使学习机器的推广能力最好,不同数据子空间中最优的γ不同。在确定的数据子空间中,γ的取值小表示对经验误差的惩罚小,学习机器的复杂度小而经验风险值较大;反之亦然。前者称为“欠学习”现象,而后者则为“过学习”。σ不敏感损失函数的大小决定了支持向量的个数。σ越大,支持向量的个数越少,函数估计的精度越低;σ越小,则支持向量的个数越多,函数估计的精度越高。但是σ也不是越小越好,因为虽然精度提高了,但是算法所需要的时间也变长了。所以,必须选择最合理σ,以保证LSSVM的速度和精度,只有正确选择参数,才可以使LSSVM回归估计得到很好的拟合效果。
如何合理选择LSSVM的参数,目前尚未有有效的方法。一般通过交叉验证试算或梯度下降法求解,这些方法或者人为因素太多,或者要求函数连续可导,易陷入局部极小。遗传算法(GA)是一种启发式搜索算法,具有很强的全局搜索能力,通过遗传算子模拟自然界生物遗传过程中的复制、交叉和变异等现象,对种群个体逐代择优,从而最终获得最优个体,因此本研究采用GA对LSSVM参数进行优化。
GA对LSSVM参数优化的基本步骤如下:
(1) 设种群规模为P。随机生成含P个个体的初始种群W=(W1,W2,,Wp)T,给定一个选定的数据范围,采用线性插值函数生成种群中个体Wi的一个实数向量w1,w2,,ws作为GA的一个染色体,为了得到高精度的γ和σ值,采用实数编码方法。
(2) 确定个体的适度度函数。给定一个LSSVM参数,将步骤(1)中得到的染色体进行解码,得到LSSVM的γ和σ值,将训练样本输入到LSSVM进行训练,达到设定的精度得到模型的训练输出值,以训练误差平方和作为种群W中个体Wi的适应度。
(3) 采用轮盘赌法选择算子,即基于适应度比例的选择策略对每一代种群中的染色体进行选择,选择概率为:
式中,f为适应度值的倒数,P为种群规模。
(4) 由于个体采用实数编码,交叉操作方法同样采用实数交叉法,第k个基因wk和第l个基因wl在j位的交叉操作分别为:
式中,b为[0,1]间的随机数。
(5) 变异操作,选取第i个个体的第j个基因位进行变异操作,即:
式中,wmax和wmin分别为基因wij取值的上下界,r为[0,1]间的随机数,r2为一个随机数,g为当前迭代次数,Gmax为最大进化代数。
(6) 将GA得到的最优个体分解为LSSVM的γ和σ,以此作为LSSVM预测模型的γ和σ值,LSSVM预测模型经训练后,输出网络流量时间序列的最优预测值。
2 GS-LSSVM的网络流预测模型
2.1 GS和LSSVM相结合的思路
在基于LSSVM的网络流量预测模型滞后阶数确定过程中,通过GS描述网络流量数据之间的时间相关性,凡落在变程α范围内的数据都具有时间相关性,且随着数据点之间的时间间隔增大相关程度降低,从而可以根据α值快速确定网络流量预测模型最优滞后阶数,然后根据最优滞后阶数对网络流量样本进行重构,最后将重构样本输入到LSSVM的进行学习,从而建立了网络流量预测模型。具体过程如图2所示。
2.2 数据归一化
受到多种因素影响,网络流量变化范围比较大,对LSSVM学习速度产生不利影响,为消除该不利影响,提高学习效率,对网络流量值进行归一化处理,归一化公式为:
式中,xi为网络流量的原始值,x′i为归一化后的网络流量值,xmax和xmin分别为网络流的最大值和最小值。
2.3 基于GS的LSSVM模型阶数确定
网络流量具有明显的时间结构特点。当前的网络流量与前多个时间点的网络流量相关联,时间较近的数据相关性强,而时间较远的数据相关性往往相关弱,因此网络流量具有滞后、后效性特征。滞后阶数n对网络流量预测结果具有很大的影响:阶数太小,虽然能够体现数据之间的相关性,但易造成数据信息缺失;若阶数太大,能够选择更多的相邻数据,但可能包含过多的冗余信息,因此滞后阶数不能选择太小,也不能选择过大。基于GS的网络流量预测模型滞后阶数确定过程如下:
设有n个Z(xi),i=1,2,,n。设(p<n)为待测点,那么取前p-1个样本作为分析数据,取小时作为时间间隔,即Δh=1;各样本间距离hi,j=j-i,为保证每组距离对数N(h)充分大,可依GS分析要求规定:
根据样本距离h及其半变异函数值γ(h)构建半变异函数曲线图,观察尺度范围内最大γ(h)值对应的h,即为变程α。根据GS原理可知,距待测点α时间内的样本与待测点具有相关性,即α时间内的样本数据对待测样本值存在较大的影响,模型滞后阶数即为α。
2.4 LSSVM对重构后网络流进行预建模
采用GS确定网络流量时间序列的最优滞后阶数,并根据最优阶数对网络流量数据进行重构;然后将重构后数据分成为训练集和测试集两部分,将训练集输入到LSSVM进行学习,采用GA对LSSVM参数进行优化建立最优网络流量模型,最后采用建立的模型对测试集进行预测,得到网络流量预测结果,并对预测结果进行分析。
3 GS-LSSVM在网络流量预测中的应用实例
3.1数据来源
实验数据来源于网络流量文库:http://newsfeed.ntcu.net/~news/20011/,收集了主节点路由器Incoming articles从2011年1月1日起,共208天的网络每小时访问流量,共采集到4992个数据,具体如图3所示。从图3可知,网络流量具有较强的非线性、时变性。将数据分成两部分,其中最后1000个数作为测试集,其余数据作为训练集。
3.2评价指标和对比模型
为了评价GS-GA-LSSVM模型性能的优劣,选择GS-LSSVM(LSSVM参数采用网格搜索)、GA-LSSVM(滞后阶数采用文献[11]方法)和传统LSSVM(不定阶,LSSVM参数采用网格搜索)算法作为对比模型。模型性能评价指标体系为:采用均方误差MSE(Mean squared error)和平均绝对误差百分率MAPE(Mean absolute percentage error)。MSE和MAPE分别定义如下:
式中,yi为实际值,为模型预测值,n为测试样本数。
3.3模型实现
首先采用GS对网络流量数据进行分析,前100个数据变程的分析结果如图4所示,从图4可知,网络流量数据的最优滞后阶数为3,这表明,预测点的网络流量受到前3个时间点网络流量影响,这就意味着将前3个点的网络流量作为LSSVM的输入来预测当前时刻的网络流量,用该方式对网络流量进行重构,组成一个多维的网络流量时间序列。
在Matlab 7.0平台下,自编程调用LSSVM和GA工具箱来实现LSSVM算法,核函数为高斯函数,将训练集输入到LSSVM进行训练,并采用遗传算法对LSSVM参数进行优化,得到的最优参数γ=29.15和σ=0.75;然后采用最优参数对训练集重新进行学习,建立最优网络流量预测模型;最后采用建立的预测模型对测试样本集进行预测,得到的预测结果如图5所示。
3.4与对比模型的性能比较
LSSVM、GS-LSSVM、GA-LSSVM和GS-GA-LSSVM对测试样本集的预测结果MSE和MAPE如表1所示。
对表1对比结果进行分析,可以得到如下结论:
(1)无论是MSE还是MAPE,GA-LSSVM的预测性能均要优于LSSVM,这表明GA对LSSVM的参数进行优化,能够找到最优LSSVM参数,提高了网络流量预测精度。
(2)同时,GS-LSSVM的预测精度高于LSSVM,这表明采用GS快速确定网络流量的滞后阶数,能够很好地反映了数据的时间相关性,充分挖掘了隐藏于网络流量数据之间的信息。
(3)在所有的预测模型中,GS-GA-LSSVM的预测精度最高,表示对于非线性、时变的网络流量时间序列进行预测时,不仅要考虑数据间之间相关性,同时要考虑非线性预测模型的参数优化问题。
综合上述可知,GS-GA-LSSVM融合了时间序列分析和回归分析的优点,能够很好地反映了数据的时间相关性,具有结构风险最小,非线性,避免过拟合、维数灾和局极小,泛化推广能力优异等许多优点,使模型预测性能更高、稳定性更好。
4 结 语
将用于分析数据相关性的GS和全局搜索能力强的GA引入到网络流量测中,分别通过变程来确定模型的滞后阶数和最优参数,并充分考虑网络流量的非线性变化特点,引入非线性预测能力强的LSSVM模型,以提高网络流量预测精度。实例验证表明,相对传统网络流量预测方法,GS-GA-LSSVM提高了网络流量的预测精度,该模型可以推广到非线性预测领域。
本研究仅对网络流量的一维时间序列进行预测,而实际上,网络流量与多种因素密切相关,是一种典型多维时间序列,因此随着预测时间的延长,GS-GA-LSSVM模型的预测精度必会受到影响,因此,需要考虑多因素影响且及时补充新的数据来修正预测模型,从而提高网络流量的预测精度,这是需要进一步研究的内容。
摘要:网络流量是一种典型的时间序列数据,具有很强的滞后性和后效性。针对当前滞后阶数确定方法存在局部最优,耗时长等缺陷,提出一种网络流量组合预测方法(GS-GA-LSSVM)。首先采用地统计学(GS)快速确定网络流量的最优滞后阶数,然后根据滞后阶数对网络流量进行重构,最后采用遗传算法(GA)优化最小二乘支持向量机LSSVM(least square support vector machine)对网络流量进行建模预测。仿真结果表明,GS-GA-LSSVM对网络流量的预测精度优于参比模型,更能反映网络流量复杂的动态变化规律。
关键词:网络流量,地统计学,最小二乘支持向量机,遗传算法
参考文献
[1]Nguyen T T,Armitage G.A survey of techniques for internet trafficclassification using machine learning[J].IEEE Communications Sur-veys and Tutorials,2008,10(4):56-76.
[2]高波,张钦宇,梁永生,等.基于EMD及ARMA的自相似网络流量预测[J].通信学报,2011,32(4):47-56.
[3]雷霆,余镇危.一种网络流量预测的小波神经网络模型[J].计算机应用,2006,26(3):526-528.
[4]Jin Yi,Zhou Gan.Theoretical mean-variance relationship of IP networktraffic based on ON/OFF model[J].China Ser F-Inf Sci,2009,52(4):645-655.
[5]王升辉,裘正定.结合多重分形的网络流量非线性预测[J].通信学报,2007,28(2):45-50.
[6]叶苗,王勇.基于支持向量回归学习机的网络流量预测[J].桂林工学院学报,2007,27(2):282-284.
[7]向昌盛.基于支持向量机的时间序列组合预测模型[D].长沙:湖南农业大学,2012.
[8]Este A,Gringoli F,Salgarelli L.Support vector machines for TCP trafficclassification[J].Computer Networks,2009,53(14):2476-2490.
[9]Qi H L,Zhao H,Liu W W,et al.Parameters optimization and nonlin-earity analysis of grating eddy current displacement sensor using neuralnetwork and genetic algorithm[J].Journal of Zhejiang University Sci-ence A,2009,10(8):1205-1212.
[10]王俊松,高志伟.基于RBF神经网络的网络流量建模及预测[J].计算机工程与应用,2008,44(13):6-11.
城市智能交通流量预测系统的研究 第9篇
关键词:ITS,交通流量,交通预测
0 引言
ITS作为目前世界交通运输科学技术的前沿, 发达国家都先后投入了大量的资金和人员来进行研究。借助于先进的信息和通信技术, 使得道路和汽车更加协调, 交通更加系统化, 减少交通拥堵和交通公害, 提高交通安全性。我国在智能交通系统ITS方面的研究起步比较晚, 目前, 我国的ITS系统主要是在高速公路上使用的通信系统、监控系统和收费系统。随着我国经济的快速发展, 对交通的依赖不断增加, 交通问题已经越来越明显的出现在城市中。
1 系统的结构设计
本智能交通预测系统是实现城市智能化管理、预测, 达到最终以向民众提供各项服务为目的的智能化交通预测系统, 是现代化城市建设的一个重要组成部分。要求智能交通预测系统能够方便快捷的计算和预测出城市中各条道路的拥堵状况, 以直观形象的方式向民众表达城市道路信息。本文系统以GIS为平台, 采用Sql Server 2005作为数据库管理系统, 以Eclipse为开发环境, java为开发语言, 设计了一个城市交通流量预测系统, 实现了对道路历史数据的分析, 对道路实时监控和对未来路况的预测。系统结构框图如图1所示。
系统根据固定探头提供的数据和浮动车提供的数据信息, 对全市历史路况信息进行分析, 也可对某条路段历史路况进行分析;对全市路况信息进行监控和预测, 也可对某条路段进行短时监控和预测;对全市未来路况信息进行监控和预测, 也可对某条路段未来路况进行分析;对定点区域内路况信息进行监控和预测。
(1) 数据库模块提供由各种硬件或者途径采集的路况信息, 并保存中间过程产生的临时数据, 为数据处理模块和地图显示模块提供数据支持, 是整个系统的基础。
(2) 数据处理模块对数据库中提供的数据信息进行合理化清洗, 通过Arcgis将浮动车数据进行地图定位, 采用科学的算法将车辆匹配到某条路上, 随后将由硬件系统或者浮动车辆传输的异常数据进行消减补充或者填补操作, 为预测系统进行路况预测提供正确数据的保障, 是整个系统的预处理部分, 也是对于预测结果是否准确的关键。
(3) 预测系统采用数据处理模块处理完成的数据对全市各路段的路况信息进行预测处理, 根据用户需求对所得到的数据进行短时或者长期预测, 或者对以前道路路段信息进行查看分析, 采取特殊的预测方式使得预测结果合理准确, 并将相关数据存储在数据库中, 同时为地图显示提供显示数据, 是本系统的核心部分。
(4) 地图显示模块主要根据预测系统的结果对所要显示的数据进行图形化显示, 从数据库中提取所需数据, 并根据用户需求可以将预测结果以多种形式的图形进行显示。
(5) 干扰因素分析可以通过地图显示模块显示的信息对某路段的道路交通信息进行合理性分析, 通过对某路段的异常数据预测本路段可能发生的道路交通情况, 有助于相关部分对全市路况信息的掌握, 以便应对可能的道路状况。
2 数据模块设计
数据模块主要存储采集的原始数据和处理数据, 原始数据包括安装的固定探头记录的数据信息, 此数据包括设备号、方向号、道路名称、道路号、开始时间、流量、速度、占有率等信息;浮动车采集的数据包括经纬度、车速等信息;历史采集数据是针对以前路段有路况信息而现在短时间内无法采集到信息的路段;路网模型预测数据是对于无法通过固定探头和浮动车采集到信息的路段。
2.1 数据库模块流程如图2所示。
2.2 数据处理方法
固定探头和浮动车发来的数据, 除了正常数据以外, 同样也可能出现重复、缺失、错误等问题。对于正常数据当然是存入库中。而对于非正常数据, 则要进行相应的处理。 (1) 对于冗余数据处理:接收到浮动车和固定探头发来的数据时, 将此数据与数据库中原有的数据进行匹配, 若有相同记录, 则不存入库中, 否则, 存入库中。 (2) 对于缺失数据的处理:根据原有的历史的数据, 将此缺失数据补全。 (3) 对于无效数据的处理:当发回来的数据与GIS地图上任意路段都无法匹配时。将此数据直接丢弃。 (4) 对于错误数据的处理, 根据合理的运算, 将错误数据进行修正, 并存入数据库中。无法修正的, 则将其舍弃。
3 系统功能设计
本系统使用数据处理模块清洗的数据对全市的路况信息进行综合处理, 可以对以前数据进行统计分析, 也可以对未来数据进行适当预测估计。本系统可以分为短时预测和长期预测, 短时预测主要针对一小时之内的路况, 系统在不断进行刷新操作, 实时更新数据, 便于对实时路况信息的了解, 并且对后面可能出现的情况预测提供数据支持;长期预测可以分为按照小时/天, 天/周, 天/月, 月/年等形式输出, 可以对以前数据进行统计显示, 也可以对未来一段时间内的道路交通状况进行预测。
4 结束语
交通流量预测是智能交通系统中的主要研究内容之一, 也是智能交通系统中当前需求较为迫切的系统。近年来随着我国智能交通系统的发展和研究的深入, 以及城市对于交通服务需求的提高。交通流信息的实时性和可靠性, 直接关系到智能交通系统中交通控制与交通管理的效果。同时, 交通流量预测受随机干扰因素影响更大, 不确定性更强, 规律性更不明显。
交通流量预测作为智能交通系统的一部分, 在未来的交通运输过程中发挥着非常重要的作用。本文由于时间关系, 在研究中存在许多不足之处, 还有待进一步的研究和验证。
参考文献
[1]Anurag Pande.Mohamed Abdel-Aty.Assessment of freeway traffic Parameters leading to lane-change relatede ollisions[J].Aecident Analysis&Prevention, 2006 (38) :936-948.
[2]白文江.基于图像处理的智能交通监控系统的研究与实现[D].东华大学, 2010.
车流量预测 第10篇
1 改进的真实矢量场法确定相空间参数
重构相空间是分析混沌系统的第一步,由Takens定理[4]可知系统任意fi(tk)分量的演化都是由与之相互作用着的其他分量所决定。因此这些相关分量的信息隐含在任一分量的发展过程中,重构系统相空间只需考察一个分量,通过某些固定的延时点上的观测值找到中的m维向量,就可以重构出一个等价的相空间[3]。从这个相空间中恢复原系统来研究吸引子的性质。重构相空间的关键是选择嵌入维数和确定延迟时间。对于嵌入维数的确定,常用的计算方法有饱和关联维数(G-P)法、伪最近领域法、Cao方法等。这些方法通常需要先假定时间延迟,再进行嵌入维数的确定。假设的时间延迟通常给系统带来一些不确定性,使用一个不带假设的方法会增加系统的确定性。因此本文采用真实矢量场法来测定交通流量系统的嵌入维数,真实矢量场法是一种无需确定时间延迟的的方法,但该法也有一个明显的缺点:判断平均方向矢指标随嵌入维数变化是否收敛,尚无定量方法。本文提出了一种方法来定量的判断平均方向矢指标随嵌入维数变化是否收敛。在实际计算中取得了较好的效果。
真实矢量场法又称平滑法或连续法[4],其实质是从相空间的几何特性着手,将相空间划分为若干盒子,对于研究系统如果嵌入参数合适则轨道充分展开,每个盒子轨道穿过的方向是相似的,表现出规则的特性。通常定义一个流函数Φ[X(i)],对每个盒子中的轨道进行度量:
式中X(i)对应相空间中第i个相点;R为使用的参考点数;Cr为系数;Fr()为一抽样函数。如果仅仅考虑两个参考点,则有
取单位方向矢为
对第j个盒子中的轨道的单位方向矢平均
其中nj为第j个盒中轨道穿过的次数。
令W为评判重构相空间平滑性的平均方向矢量指标,则其中N为所有盒中轨道穿过的次数之和。
如果穿过盒中的轨道很规则,则各个轨道的单位方向矢V[X(i)]很接近,每个盒的平均方向矢Yj的模‖Yj‖会很大,从而整个相空间的平均方向矢指标W也很大。根据平均方向矢指标W的这种变化关系,便可评价嵌入参数的优劣,W值越大,嵌入空间质量越好。通常以最大的W值作为评判指标,通过分析W值随嵌入维数m升高而逐渐收敛的程度来确定最优嵌入维数:
当m值趋近于最优的嵌入维数k时极限值s趋于(wn-c)k。Wi为每个流函数对同一个盒的方向矢指标,k、c为常数。在形成一个盒时多个Wi值各有不同,用该值减去c最后求和并取极限若其值为(wn-c)k则说明此时的嵌入维数m较好。
2 优选d值的最大Lyapunov指数法
最大Lyapunov指数的预测方法,其思想是在历史时间序列样本中寻找相似点,根据相似点的演化行为和最大Lyapunov指数,运用数学模型获取预测值。在预测方法中d值集合在预测过程中有重要作用,在原方法中对d值处理没有进行说明,考虑到最大Lyapunov的含义:系统在相空间中相邻轨线沿该方向平均发散速率,而多个点对其发散速率是不一致的,若只选择其中的某个点对则与最大Lyapunov指数有误差,从而影响预测结果。改进方法主要是对d值进行筛选,筛选的方法是首先在d值集合中选取时间差内的点,然后在这些点中找到符合其与参考点距离r最近的点,从而取得多个邻近点有效避免了个别邻近点引起的最大Lyapunov指数误差较大的问题。
具体算法如下:
1)根据真实矢量场法和C-C法分别求嵌入维数及时间延迟,得到重构相空间
2)利用小数据量法[2]计算最大Lyapunov指数λ1
3)寻找中心点X(t)的临近状态X(tn),并计算
4)对得到一系列的d值进行筛选,选出时间最近d且在规定r内的点
5)由公式计算得到预测值。
3 预测实例
预测实例的数据采自乌鲁木齐市河滩路某天8:30-20:30的流量数据。时间间隔为5分钟,如图1所示。
3.1 最大Lyapunov指数测定
交通诱导周期一般为5分钟,采用如Wolf等方法对求Lyapunov指数需要很大的数据量,这与交通流量的实时性形成矛盾,为解决该问题对交通流量的混沌性判别可以采用小数据量法。本文就是利用小数据量法通过Matlab计算研究交通流量时间序列的最大Lyapunov指数为λ1=0.0844>0。说明交通流量时间序列为混沌时间序列。
3.2 嵌入维数的测定及时间延迟的测定
本文采用改进的真实矢量场法来测定嵌入维数,由Matlab计算如图2所示。
由图2可以看出随着嵌入维数的增加W值与S值接近相等,实验测定在嵌入维数为11时预测效果较为理想。
在求解时间延迟的方法中C-C法[10]是最常用的方法也是运算量比较小的方法之一,尤其是针对非线性的交通量时间序列。通过Matlab计算的时间延迟,得出在t=7时△s出现极小值,所以时间延迟τ=7*采样时间间隔=7*5=35min。
3.3 预测结果
实验结果显示预测结果与实际值在短时范围内效果较好,预测值能够反映真实情况,随着预测时间增加预测误差较大,这也符合混沌理论的断言,长期预测是不可能的。对于图中2分钟和11分钟处的尖峰是预测失效值,经过分析是由噪声引起的误差。平均误差率不超过20%,这种误差在实际中是可以接受的。我们对预测值的采用一般是20分钟之内,在超出20分钟之后的长期趋势可以采用神经网络的预测方法,综合影响交通流量的各种因素进行预测。
4 总结
文章对真实矢量场法及最大Lyapunov指数进行了讨论,并改进了这两个方法,改进的真实矢量场法给出了平均方向矢指标的定量测定方法从而可以定量的取得最佳嵌入维数,改进的最大Lyapunov指数预测方法对d值进行了优选,从而可以避免邻近点选择不当可能对结果带来的不利影响。最后通过实验仿真,验证了改进方法的有效性。在实验结果中出现的尖峰与实际值相差较大的问题,为进一步研究指明了方向:进一步研究噪声处理以及多时间序列同时预测。
参考文献
[1]蒋海峰,等.一种基于小数据量的快速识别短时交通流混沌特性的方法[J].铁道学报,2006,28(2):63-66.
[2]Rosenstein M T,Collins J J,Deluca C J.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physica D,1993,65:117-134.
[3]陈铿,韩伯棠.混沌时间序列分析中的相空间重构技术综述[J].计算机科学,2005,32(4):67-70.
[4]韩敏.混沌时间序列预测方法理论与方法[M].中国水利水电出版社,2007.
[5]李松,贺国光,等.仿真交通流混沌转化过程研究[J].计算机工程与应用,2009,45(5):232-235.
[6]贺国光,万兴义.基于最大Lyapunov指数的交通流仿真数据混沌状态识别[J].控制理论与应用,2003,22(4):8-13.
[7]Vallejos R O,Anteneodo C.Theoretical estimates for the largest Lyapunov exponent of many-particle systems[J].Phsical Review E,2002,66(2):1203-1218.
[8]陈淑燕,王炜.基于Lyapunov指数的交通量混沌预测方法[J].土木工程学报,2004,37(9):96-99.