小波信息熵范文(精选7篇)
小波信息熵 第1篇
DDoS攻击是互联网上的一大威胁。在DDoS攻击中,攻击者利用多个攻击源对攻击目标发送大量数据包,最终造成攻击目标的资源消耗以致无法对外提供正常服务[1]。目前网络已成为了一种基础设施,与人们的生活密不可分,所以保障网络资源的可用性是必须要解决的问题。对于DDoS攻击来说,如何能够及时且准确地检测到攻击发生是面临的重要问题。
目前DDoS攻击检测主要有两种策略[2,3],一种是基于攻击流特征的检测,也称为基于误用的检测,另一种是基于正常流特征的检测,也称为基于异常的检测。基于攻击流特征的检测根据已知的DDoS攻击特征来进行,需要事先收集DDoS攻击的各种特征并建立特征库。通常这种检测依赖于所建立的特征库,只能检测到已知种类的攻击。而基于正常流特征的检测通过对网络流量的正常状况进行建模来检测网络中的异常状况,目前大多数检测方法都属于此类,最大的优点在于可以检测到未知攻击,然而检测率很高的同时误报率也很高。
本文针对传统基于网络流量自相似性检测方法的较高误报率进行改进,除了自相似参数外,增加了源IP地址分布熵,提出了通过监测这两个参数检测DDoS攻击的算法WAIE。
1 相关研究
1.1 网络流量自相似性
张宾等人阐述了Internet流量模型的发展历程,指出众多研究表明Internet网络流量具有大时间尺度上的自相似性。网络流量自相似性可用自相似过程描述。自相似过程是统计意义上具有尺度不变性的一种随机过程[4]。
定义1[5]一个随机过程x(t),对于任意的a>0,如果满足x(t)=a-Hx(at),则称其为自相似的。
其中,a是尺度,H是一个常数,称为局部尺度指数,也就是前面提到的Hurst指数,是描述自相似特性的惟一参数。H的取值范围是,H越大,过程自相似程度越高。
1.1.1 传统基于网络流量自相似性的检测方法
一般,网络流量的如下属性可用于计算Hurst指数:单位时间分组数、平均分组大小和到达速率、WWW通信量、各协议成分的百分比等。
传统的自相似方法通常选取平均分组大小或单位时间通信量来进行Hurst指数的计算。以平均分组大小为例,介绍一下处理流程:首先在路由器上收集T时间的数据包,从每个数据包中提取<time,size>信息,time指数据包到达时间,size指数据包的大小。然后计算T中每时隙t内数据包的平均大小作为样本值,得到一个长度为的平均包大小序列。根据T内得到的序列可选取一定的方法计算出H值。重复这样的步骤,在整个时间区间内设定一定的阈值通过监测单一的H值变化来判断DDoS攻击是否发生。
1.1.2 影响网络流量自相似性的因素分析
网络具有复杂性和动态性,影响网络流量自相似性的因素很多。对于数据包大小,不同协议、不同应用甚至网络中转发节点的参数限制都可能导致其发生变化,比如,一般访问的网页如果只有文字和图片接收到的数据包就会偏小,而如果在使用视频相关的业务接收到的数据包就会偏大。对于不同类型网站的访问量,行业的淡旺季、市场活动、热点事件、网站的调整、服务器的状态等都能引起其发生较大变化。
由于影响流量变化的因素众多,所以网络中流量的变化很大程度上不可控,再加上不同DDoS攻击使用的数据包大小不一,有的甚至还会模拟正常状况下网络中数据包的大小,导致传统自相似方法检测DDoS攻击时误报率较高。
1.2 信息熵
香农信息论中,信息熵是衡量信息紊乱程度的测度。另外,信息熵也是衡量分布分散程度的一种度量,分布越分散,信息熵越大,分布越集中,信息熵越小。
定义2样本集X是一个包含n个分类的随机变量,则样本集X的信息熵可定义为:
其中,Pi是X中第i类元素出现的概率。当n为1时,E取最小值0。当X中每个分类概率均为时,E取最大值log2n。
信息熵是一个敏感的量,计算耗时小,所以近年来有学者将其应用到DDoS攻击检测中[6,7,8],基于熵的检测也属于异常检测,但这种检测方法需要对数据包中多个属性进行分析才能达到较好的检测效果,文献[8]中采用主成份分析的方法对选取的数据包中九个属性求得的熵值进行筛选并最终确定了五个属性来进行检测。
2 攻击检测算法WAIE
2.1 算法思想
DDoS攻击一般具有如下特征:源IP地址分布分散性[1]、目的IP地址分布集中性[1]、攻击持续性[9]、大的包速率[9]。
DDoS攻击发生时,目标主机所在网络附近会涌现大量数据包,所以可以对包到达时间进行分析。能引起短时间内包数目突增亦即包到达时间间隔急速缩小的原因有两种,一种是DDoS攻击,另一种是突发的正常流量。网络中的突发正常流量有一部分可能是由于大文件传输等原因引起的,相对应的用户数目并没有突然大量增多,所以源IP地址的分散程度也没有发生较大变化。当网络突发的正常流量在一定范围内时,不会对网络中的主机或服务器造成威胁,而如果超出了其所能承受的范围可能也会导致拒绝服务。对于一般网站来说,除了基本固定的访客群外,还会希望更多的人对其进行关注,可是并不希望突然增多的客户群对网站的服务器造成特别大的冲击,所以需要对这种情况也进行监测。
基于以上分析,可以得到检测算法的主要思想:从数据包到达时间以及源IP地址分散程度两个方面进行考虑,采用网络流量自相似理论来分析数据包到达时间,用信息熵来衡量源IP地址分散程度。在自相似参数和源IP地址分布熵同时超出所设阈值的情况下,判定为DDoS攻击并发出警报。
2.2 检测算法WAIE
检测算法WAIE主要分为四个模块:数据采集模块、Hurst指数与熵值计算模块、阈值设置模块、攻击判决模块。
算法WAIE的检测步骤如下:
Step1初始化参数。确定时间窗口大小T与阈值计算需要的窗口数N,将攻击发生状态指示值attack设定为0。
Step2网络流量数据采集。数据采集模块对网络数据包进行处理,得到T时间内的时间序列{<t1,sip1>,<t2,sip2>,,<ti,sipi>,,<tn,sipn>}后,将数据发送给Hurst指数与熵值计算模块。其中ti是采集到的第i个数据包的时间,sipi是第i个数据包的源IP地址。
Step3流量参数计算。调用Hurst指数与熵值计算模块,对从数据采集模块得到的T内的数据进行H值与E值的计算。判断N值大小是否为0,若为0则将计算所得结果发送给攻击判决模块,并执行Step 5。若N不为0,则将计算所得结果发送给阈值设置模块,并将N值减1。
Step4阈值设定。阈值设置模块从Hurst指数与熵值计算模块获取N次的计算结果来设定阈值Htop以及Etop,设定结束后通知攻击判决模块开始工作。
Step5判断攻击是否发生。攻击判决模块接到开始工作信息后,从Hurst指数与熵值计算模块和阈值设置模块获取参数。比较H值和E值同阈值Htop和Etop的大小。如果两个值同时超出设定的阈值,就认为攻击发生,此时若attack为0,将attack设定为1并发出攻击发生的告警信息,若attack为1,则认为攻击在持续,发出攻击持续的告警信息。如果两个值没有同时超出设定的阈值,认为网络流量状态正常或攻击已经停止,此时若attack为1,将attack设定为0并发出攻击停止的信息。
Step6重复执行Step2-Step5。
2.3 算法中的参数计算
算法WAIE中的参数计算通过在Matlab中编程进行了实现。
2.3.1 Hurst指数的计算
网络流量自相似理论可用于数据包到达时间的分析,当数据包到达时间间隔变化时,会引起Hurst指数的变化。Hurst指数计算方法[4]中,小波分析法[5,10,11,12,13]的有效性已经得到了验证。使用小波法时需选择合适的小波和小波消失矩。研究表明,使用Daubechies(简称db)小波且消失矩为3时计算Hurst指数效果最理想[5,12,13]。小波法求解Hurst指数有方差法、谱估计法、能量法三种方法[5],本文采用小波系数方差法,该方法的一般步骤[5,11,12,13]如下:
Step1小波分解。用db3小波对序列x(t)进行J级小波分解:
其中,ΦJ,k(t)是小波尺度函数,Ψj,k(t)是小波母函数,ax(J,k)是小波尺度系数,dx(j,k)是小波系数。
Step2小波系数提取。小波系数定义为:
Step3求小波方差。
其中k=0,1,,2j-1。
Step4拟合直线,求Hurst指数。拟合一条以j为自变量、斜率为2H+1的直线。根据直线的斜率便可计算出H值。该直线的形式如下:
从求解步骤可看出,小波分解时需确定分解层数J。小波分解最大层数max_level与序列长度L5及选取小波的滤波器长度Lw有关[11]:
其中,Lw不变时,Ls越大,max_level越大。J只能取小于等于max_level的正整数,J越大,H精度越高,计算效率却越低。
文献[12,13]中均采用固定J值,采用网络流量大小进行H值的计算,每个时间窗口T内的序列长度固定。而本文的算法根据数据包到达时间计算H值,每个T内获取的序列长度不一。为此设计了一个自适应的函数level_cal来根据T内获得的序列长度调节J,同时考虑了计算的时间复杂度因素,以提高H值的计算精度与效率。
函数level_cal根据经验设定最大分解层数Jtop,结合式(6)由T内获取的序列长度n和db3的滤波器长度计算出max_level,若max_level大于Jtop,将J值设置为Jtop,否则设置J值为max_level。
确定J后,设计了函数hurst_cal计算H值。结合小波系数方差法的步骤,首先使用wavedec,用db3小波对T内获得的序列t(n)进行J级小波分解,然后用detcoef从小波分解结构中提取每层的小波系数,接着用var计算每层小波系数的方差,最后结合式(5)用polyfit采用最小二乘法进行线性拟合,从拟合所得数组中可得到直线斜率,即2H+1,由此便可计算得到H值。
2.3.2 源IP地址分布熵的计算
文献[14]指出熵适合于DDoS攻击中可聚集信息的描述,可用于计算网络包头中一些属性的分布随机性,比如IP地址、TTL值等。基于这个原理,本文使用信息熵来对源IP地址的分布进行衡量。
设计了函数entropy_cal计算E值。首先由length得到T内获取的序列sip(n)中总的sip个数,然后使用unique得到不同sip的集合,接着使用strcmp得到不同sip对应的个数,由每个sip的个数除以总sip个数得到每个sip出现的概率Pi,最后结合式(1)计算出E值。
2.3.3 阈值的自适应设置
算法WAIE中监测的参数有两个,当发生DDoS攻击时,参数H值与E值都会增大,需要分别为其设置上限阈值。
大多数检测算法在进行阈值设定时都会采用固定的值,然而在实际网络中,不同节点处的流量变化情况会有较大区别,这会导致检测不准确。考虑到这一点,本文采用自适应的方法根据算法部署位置处采集到的流量数据来计算该监测点的上限阈值Htop与Etop。H值的取值范围是,E值取值范围是(0,log2n),相比之下E值取值范围较广,所以为阈值Htop与Etop的设置采用了不同的方法:
(1)Htop的计算:获取初始N个时间窗口内计算出的H值,设置Htop的值为,其中,Hmax是H值中的最大值,是平均值。
(2)Etop的计算:获取初始N个时间窗口内计算出的E值,设置Etop的值为Emax+(Emax-Emin),其中,Emax是E值中的最大值,Emin是最小值。
3 实验与分析
3.1 实验场景
实验部分采用了三个数据集,其中两个是广泛用于DDoS研究的MIT林肯实验室2000年发布的DDoS攻击数据集,另外一个是在实验室局域网环境下采集的包含三次大文件传输的正常数据集。对每个数据集,使用算法WAIE以及基于数据包大小的传统自相似方法分别进行计算,以比较算法的性能。
使用了Wireshark软件对数据集进行分析,提取出所有数据包中的时间、源IP地址以及包大小这三个字段的数据。在Matlab中进行了相关参数的计算。其中,阈值均采用算法WAIE中阈值设置的方法计算。在使用传统自相似方法计算H值时,小波分解采用固定的分解层数10。实验时,每个数据集最后不满一个时间间隔的数据均被舍弃,这并不影响实验效果。
实验一数据集为林肯实验室攻击场景LLDOS 1.0中内网捕获的数据。设置T为300秒,N为10。数据集中攻击发生在第26个时间间隔内。计算得到的H和E值变化情况分别如图1和图2所示。
实验二数据集为林肯实验室攻击场景LLDOS 2.0.2中内网捕获的数据。设置T为200秒,N为8。数据集中攻击发生在第25个时间间隔内。计算得到的H和E值变化情况分别如图3和图4所示。
实验三数据集为实验室局域网环境下使用Wireshark软件捕获的数据。设置T为30秒,N为8。数据集中大文件传输分别在第2、13以及30这几个时间间隔内。计算得到的H和E值变化情况分别如图5和图6所示。
3.2 实验结果分析
在三组实验中,可以观察到如下现象:(1)算法WAIE可以成功检测到实验一中的攻击且没有误报,而基于数据包大小的传统自相似方法对真实的攻击并不敏感。(2)一般情况下的H和E值均在一定范围内波动。(3)传统的自相似方法在大文件传输时计算出的H值有明显的减小。(4)算法WAIE在数据包数目增多时计算出的H值有明显的增大。(5)算法WAIE计算出的E值对DDoS攻击以及大文件传输都比较敏感,不同的是,DDoS攻击发生时E值有较大幅度增大,而发生大文件传输时E值有较大幅度减小。
分析这些现象发生的原因如下:(1)算法WAIE能检测到实验一中攻击但检测不到实验二中攻击的原因:攻击场景LL-DOS 1.0中,攻击者成功入侵了三台服务器并用这三台服务器对一个固定IP发起了短时猛烈攻击,攻击数据包均采用随机伪造的源IP地址,这导致网络中源IP地址和数据包数目突增。而在攻击场景LLDOS 2.0.2中,攻击者只成功入侵了一台,所以发起的攻击实际上只是一对一的攻击,并没有达到分布式拒绝服务攻击的效果,虽然也采用了随机伪造的源IP地址,但是数据包数目并没有大幅度的增加。(2)传统自相似性方法检测不到DDoS攻击但对大文件传输比较敏感的原因:分析数据集中数据包大小可以发现,一般情况下网络中小包居多,大多在六十左右,偶尔会有上百或上千的数据包。而攻击场景LLDOS 1.0和LLDOS2.0.2中的攻击包均为六十左右的小包,这些攻击流量并没有较大程度破坏网络流量的自相似性。而在实验室网络中收集的数据集里,大文件传输造成的数据包均为一千多的大包,这很大程度影响了网络流量的自相似性。(3)算法WAIE计算出的E值对攻击以及大文件传输均比较敏感的原因:由于两个攻击数据集中均采用了随机伪造源IP地址,所以攻击发生时网络中源IP地址数目大幅增加,导致E值增大。而大文件传输时,网络中几乎只有来源于建立连接的两个主机发的包,因此导致E值减小。
算法的实时性分析如下:对每个数据集做计算时,均采用循环的方式将所有时间间隔里的参数计算出来。Matlab计算速度较快,处理每个数据集的时间都在秒的数量级,例如实验三中计算H和E值共花了不到10秒。在实际应用中,可以把算法应用于路由器或者主机上,采集数据一直进行,每当一个时间间隔结束,就将采集的数据用于计算,理论上只要在下一个时间间隔内结束计算就可以实现实时的检测,而且消耗内存最少。小波分析和信息熵法计算参数的收敛速度都较快,所以在应用时只要根据网络中流量大小选取合适的时间间隔,就可以实现实时的检测。在内存消耗方面,基于数据包大小的传统自相似方法需要采集每个数据包的时间以及包大小,IP包头中包大小字段占16位,但是如果要计算H值,需要根据这两个参数对数据进行二次处理,这也会消耗一定的内存和CPU时间。本文的算法需要采集每个数据包的时间以及源IP地址,如果是IPv4版本的地址,则占用32位,但不需要对数据做二次处理就可以直接用于H和E值的计算。在Matlab中查看发现实验三中用于计算的11万多数据包的数据只占用了不到2Mb的空间。
因此可得出结论:使用本文提出的检测算法WAIE通过监测H值和E值的变化来检测DDoS攻击的发生是可行的,而且比传统自相似方法仅通过监测单一H值得到的结果更加准确。
4 结语
本文提出的DDoS攻击检测算法WAIE是在分析了传统基于网络流量自相似性方法的基础上进行的。根据DDoS攻击会引起网络流量相似性变化的原理,采用了小波分析的方法计算网络流量的Hurst指数,为提高Hurst指数的计算精度和效率,设计了一个自适应的函数来根据一定时间段中网络上采集的序列长度调节小波分解层数。另外,分析了DDoS攻击对网络数据包中源IP地址分散程度的影响,引入了信息熵来衡量源IP地址分散程度,可以有效地区分出DDoS攻击流量。在进行两个参数阈值的设置时,还采用了自适应的方法根据其各自的特点采用了不同的计算方法。实验结果表明,提出的攻击检测算法WAIE可以有效检测到DDoS攻击的发生。
摘要:DDoS(Distributed Denial of Service)攻击检测方法中,基于网络流量自相似性的检测方法作为一种异常检测方法,对网络流量变化情况比较敏感,检测率较高,然而同时也存在误报率较高的问题。对传统自相似方法以及网络中可能引起流量异常的事件进行分析,在此基础上提出一种改进的检测算法WAIE。WAIE采用小波分析的方法计算网络流量的Hurst指数并引入信息论中的信息熵对源IP地址的分散程度进行度量,根据初始阶段Hurst指数及熵值的变化自适应地设定阈值以检测攻击的发生。采用MIT林肯实验室发布的数据集以及实验室环境下采集的数据集进行实验,实验结果表明该算法能准确检测到攻击的发生。
小波信息熵 第2篇
滚动轴承在旋转机械中应用极为广泛,其运行状态往往直接影响整个机器的精度、可靠性与寿命。滚动轴承的寿命离散性大,无法进行定时维修[1],因此对滚动轴承开展实时故障诊断具有重要意义。轴承振动信号具有非线性、非平稳的性质[2],当轴承出现故障时,振动信号的复杂性发生变化,出现一些异常信号,能量分布发生变化[3,4],因此可以利用异常信号的复杂程度来诊断轴承的故障。
将小波用于故障诊断的研究很多[5,6,7],但大多是从小波变换的多分辨率、时频特征入手,提取故障信号的特征,或者通过小波来消减噪声而增强故障特征,从而更好地将其提取出来;而不是从故障信号时频能量分布的复杂程度入手来诊断故障,同时在实时诊断中也缺乏诊断的直观性。奇异值分解理论能够挖掘出信号复杂程度基本模态特征的特性[8],信息熵具有对复杂程度的特性数据进行统计量化功能[9]。谐波小波频域的紧支、分解均具有快速算法,能够表征振动信号时频分布特征,而且分解精度高,具有明确的数学表达式[10]。
因此,本文从揭示故障振动信号能量分布的复杂程度入手对此进行研究,充分利用了谐波小波[5,10]快速处理异常不规则信号的独特优势、奇异值分解[8]对时频特征矩阵基本特性的提取功能,以及信息熵[9]对复杂信号的统计特性,将谐波小波变换、奇异值分解理论和信息熵结合起来,从分析轴承故障信号复杂程度的角度对轴承故障进行实时诊断。
1 谐波小波奇异熵的基本理论
谐波小波奇异熵就是基于奇异值分解理论,将信号经谐波小波变换后的系数矩阵分解为能反映原系数矩阵基本特征的奇异值,再利用信息熵的统计特性对奇异值集合进行不确定度分析,从而对原始信号的复杂程度给出一个确定的度量。
1.1 谐波小波变换
Newland[10]于1993年构造出谐波小波,其小波函数为
式中,t为时间。
根据小波理论,j,k∈Z;m,n∈R+且m<n,设m=2j,n=2j+1,通过伸缩和平移得到谐波小波函数族
给定谐波小波位移步长k(n-m),则式(2)变为
其对应的谐波小波频域表示为
2πm<ω<2πn
因此,谐波小波w(2jt-k)作为L2(R)的一组正交基,对信号做谐波小波变换,可以将信号既无重叠也不遗漏地分解到各自独立的频段上,从而实现更细的信号分析,揭示信号的时频特征。
1.2 奇异值分解
由奇异值分解理论可以知道,任何MN阶的矩阵A(其中M>N)的奇异值分解(SVD)可以表示为
A=UΛVT (4)
Λ=diag(α1,α2,,αN)
式中,U、V分别为MM和NN阶正交矩阵。
这里,α1,α2,,αN称为A的奇异值,并按降序排列。由于Λ为一个对角阵,因此SVD可以将秩为kα的MN阶矩阵A表示为kα个秩为1的MN阶的子矩阵之和。其中,每个子矩阵由二个特征向量(分别来自矩阵U、V)和权值相乘得到,表达式如下:
式中,ui、vi分别为矩阵U、V的第i列向量。
式(5)表明,矩阵A经过SVD后成为一系列的子矩阵Ai和对应的奇异值αi(反映该子矩阵包含信息的多少),即将矩阵分解成相互正交的子空间,从而将矩阵包含的信息分解到不同的子矩阵中。
1.3 信息熵
信息熵是信源平均不确定性大小的度量,与信源可能出现的状态数目及各个状态出现的概率有关。信源发出某信息所含有的信息量称为自信息,它与信息的先验概率成反比。信源的自信息定义为
式中,βi为第i个信息;p(βi)为第i个信息的先验概率。
自信息的数学期望为信源的平均自信息量,即信息熵,其表达式为
式中,E为数学期望;Q为信息的总个数。
信息熵能实现对系统复杂不确定性的度量。
2 基于谐波小波奇异熵的故障诊断模型
设采集的故障振动信号为x(c),c=0,1,,C-1。对信号x(c)作谐波小波变换得到时频分布矩阵,揭示振动信号的能量分布特征,C表示离散信号的长度。
对x(c)进行快速傅里叶变换得到X(0),X(1),X(2),,X(C-1),基于此构建阶次为pq的谐波小波的时频分布矩阵B。令p=C,q=log2(C/4)+2,矩阵B的第1、2、q列的元素分别为
B(:,1)=2|X(0)|2
B(:,2)=2|X(1)|2
B(:,
矩阵B的第i1列的元素为
B([(j1+1)Dd+1]:(j1Dd),i1)=2|X(2i1+j1)|2 (8)
对谐波小波时频分布矩阵B进行奇异值分解计算,提取振动信号时频特征分布复杂程度的基本特性:
B=YΘGT (9)
Θ=diag(η1,η2,,ηr)
式中,Y、G分别为pp和qq阶正交矩阵;ηi为矩阵B的第i个奇异值。
按降序排列,得到奇异值矢量
SB=(a1,a2,,ar) rp (10)
式中,r为矩阵B的秩;ai为矩阵B的降序奇异值。
条件ασ/a1≥ξ(一般ξ取0.0001)下对奇异值矢量简化得到主奇异值矢量:
Sσ=(a1,a2,,aσ) (11)
对简化的特征值矢量进行信息熵计算,对不规则复杂程度进行定量计算
式中,σ为主奇异值的个数。
用于诊断故障的信息熵为
3 诊断实例和实时性分析
3.1 轴承的故障诊断实例
应用基于谐波小波奇异熵的故障诊断模型对美国Case Western Reserve University电气工程实验室的滚动轴承故障模拟试验台[11]的故障数据进行诊断分析。故障轴承的型号为SKF6025,故障类型为滚动轴承的外圈单点故障和内圈单点故障。用电火花对轴承加工单点损伤,损伤直径为0.1778mm,对轴承早期的轻微故障的内圈和外圈进行故障模拟。下面给出采集到的故障轴承振动信号的一组试验数据,内圈单点故障的振动信号如图1所示,外圈单点故障的振动信号如图2所示,正常轴承的振动信号如图3所示。
分别对内圈单点故障、外圈单点故障和正常轴承作10次试验,采集到对应图1~图3所示信号的10组数据(由于篇幅有限不全部列出),然后对10组数据进行谐波小波奇异熵值的计算,得到信号的统计熵值,计算结果如表1所示。
从表1中的谐波小波奇异熵值可看出,内圈故障、外圈故障和正常轴承的谐波小波奇异熵值处于不同的数值范围内,因此利用这个特点可以诊断出轴承故障。正常轴承运转时,各个部件的接触比较均匀,其冲击作用反映在谐波小波的时频分布矩阵中,其能量分布具有随机性,分布较均匀,因此熵值最大。故障轴承运转时,在伤点处产生较大的冲击,反映在谐波小波的时频分布矩阵中,其能量分布具有某种确定性,因此熵值小一些,同时从图1和图2可以看出,外圈故障的冲击振动比内圈故障的冲击大,变化规则较明显,因此外圈故障的熵值与内圈故障的熵值相比,还要小一些。这说明熵值的大小对轴承的故障敏感,能够对轴承故障进行有效的确诊。
3.2 基于谐波小波奇异熵的诊断模型实时性分析
在dell笔记本电脑(CPU为Intel(R) Core(TM)2,内存为1GB)上,对基于谐波小波奇异熵的诊断模型的算法程序进行测试,数据长度为1024,所花的时间为0.015s,设该模型用于实时测试系统所许可的采样频率为fs,则
因此该模型能对采样频率低于68kHz的诊断系统实现实时故障诊断,具有很高的实时性,在故障诊断和检测的实际应用中,具有很高的实用价值。
4 结论
(1)基于谐波小波奇异熵的故障诊断方法将谐波小波、奇异值分解和信息熵理论有机结合,充分利用三种信号处理手段各自独特的优势:谐波小波对振动信号的时频表示特性和自身具有的快速算法;奇异值分解提取数据基本模态的基本特性,信息熵对复杂特性数据的统计量化功能。
(2)基于谐波小波奇异熵的故障诊断方法能定量描述故障轴承振动信号时频分布的复杂性,能直观区分信号的复杂性,因此可以实现对故障的定量诊断。
(3)基于谐波小波奇异熵的故障诊断方法,模型简单,确诊性好,诊断的实时性高,具有一定的应用前景。
参考文献
[1]陈果.滚动轴承早期故障的特征提取与智能诊断[J].航空学报,2009,30(2):363-367.
[2]田广,唐力伟,栾军英,等.基于时频分布的行星齿轮箱滚动轴承故障诊断研究[J].机械强度,2007,29(1):152-155.
[3]申弢,黄树红,韩守木.旋转机械振动信号的信息熵特征[J].机械工程学报,2001,37(6):94-98.
[4]郭磊,陈进.小波包熵在设备性能退化评估中的应用[J].机械科学与技术,2008,27(9):1203-1206.
[5]王胜春,韩捷,李志农.谐波小波包自适应分解在故障诊断中的应用[J].农业机械学报,2007,38(10):174-177.
[6]张邦基,于德介,杨胜.基于小波变换与粗集理论的滚动轴承故障诊断[J].中国机械工程,2008,19(15):1793-1831.
[7]曾庆虎,邱静,刘冠军,等.基于小波相关滤波法的滚动轴承早期故障诊断方法研究[J].机械科学与技术,2008,27(1):114-118.
[8]Konsstantinides K,Yao K.Statistical Analysis of Effective Singular Values in Matrix Rank Determi-nation[J].IEEE Trans.on Acoustics,Speech and Signal Process,1988,36(5):757-763.
[9]Rosson O A,Blanco S,Yordanova J,et al.Wavelet Entropy,a New Tool for Analysis of Short Dura-tion Brain Electrical Signals[J].J.Neurosci.Meth.,2001,105(1):65-75.
[10]Newland D E.Harmonic Wavelet Analysis[J].Rroc.Rsoc.Land.A.,1993,443:203-225.
小波信息熵 第3篇
1 小波熵基本原理
1.1 连续小波变换与多尺度分析
小波分析是在短时傅里叶变换的基础上发展起来的一种函数分析方法。
其中,称ψa,b为分析小波或连续小波;称ψ为基本小波或母小波;a为伸缩因子;b为平移因子。
这样对于信号f!L2(R),定义其连续小波变换(CWT)为
其逆变换重构公式为
其中,ψ(t)表示ψ(t)的复共轭,且ψ(t)满足允许条件:2
其中,是小波函数ψ(t)的傅里叶变换。
基于多分辨分析的快速小波变换是利用正交小波基将信号分解为不同尺度下的各个分量的一种信号分解方法,可以有效地将待分析的信号分解为高、低频2个部分,同时分解出来的低频部分可以继续分解,直到得到预期的低频分量。
设信号x(n)经上述快速变换后,在第j分解尺度下的高频分量系数为c Dj,低频分量系数为c Aj,进行单支重构后得到的信号分量Dj、Aj。则原始信号序列x(n)在m个尺度下可表示为各分量叠加,即
为求统一,将Am(n)表示为Dm+1(n),则
1.2 信息熵
信息熵理论指出,对于一个不确定性系统,若用一个取有限个值的随机变量X表示其状态特征,取值为xj的概率为pj=P)X=xj*(j=1,,L),且则X的某一结果得到的信息可以用Ij=log(1/pj)表示,于是X的信息熵为
当pj=0时,pjlogpj=0,信息熵H是在一定的状态下定位系统的一种信息测度,它是对序列未知程度的一种度量,可以用来估计随机信号的复杂性。它是分析一个系统复杂程度的有效工具,可以通过系统的信息量描述系统的确定性或不确定性。
1.3 小波能量和小波熵
如果信号f(t)在时间b、尺度a上的连续小波能量定义为Ewf(a,b)=Wψf(a,b)2,则信号f(t)在时间-尺度域上的全部能量为
对于离散的小波系数可定义全部能量为
在尺度上的能量为
或
在时间上的能量为
或
设E=E1,E2,,Em,为信号x(t)在m个尺度上的小波能谱。则在尺度域上E可以形成对信号能量的一种划分。将小波能量与信息熵结合,设在某一时间窗内信号总功率E等于各分量功率Ej之和。设pj=Ej/E,则于是定义相应小波熵(wavelet entropy)为j
2 直流系统环网接地故障检测
现采用BP算法构造神经网络来识别环网接地故障模式。
基于小波熵和神经网络的直流系统网接地故障检测的基本思想是:对大量不同接地故障情况信号的小波分析提取小波能量和小波熵构成输入向量,作为训练网络的样本,把每个样本的故障特征进行故障编码,构成每个输入样本的网络目标输出。确定样本输入、输出后,进行训练,生成人工神经网络。实际诊断中,通过低频信号注入,采集环网支路的状态信号,提取小波能量和小波熵作为系统的特征参数,输入到训练好的神经网络,通过神经网络识别输出模式,判定是否发生接地故障。其原理框图如图1所示。
直流系统环网是为了增加系统供电的可靠性,但这也使得直流电网结构复杂,而直流电网结构越复杂,进行接地检测的困难就越大。采用环网方式运行的支路不是独立的,它可能随着运行方式的改变不断发生变化。此时就会造成支路中存在由环网而产生的谐波环流,通常环流比注入的低频信号电流大许多倍,给检测注入的低频信号带来困难。
小波变换的多尺度分析具有时频局部化表征信号的特性,它可以反映信号在时频方向上的能量分布状况。针对环网上的谐波电流信号,它是由几种频率的信号叠加而成,系统发生接地故障时,因要注入低频信号检测,环网上又增加低频分量,相应信号的低频段能量就会增大,利用熵能对系统状态表征的特点,通过小波分析反映的各时频段能量分布的变化,对信号的能量复杂度进行定量描述,这样把小波分析理论与熵结合,构成了信号的故障特征,通过训练好的神经网络达到识别故障的目的。
3 故障检测仿真分析
3.1 小波熵的特征提取
根据前面所述的基本原理,选择低频信号电压为20 V,频率为30 Hz,做低频信号注入。因为有很大的环网电流,电流互感器有输出,此时环网电流主要成分为50、100、300 Hz,少量600 Hz以及高频噪声干扰。这样采集支路信号以3种形式出现。
环网无故障,即无低频电流只包含环网谐波电流;环网故障,即有接地故障情况,此时除有环网电流外还有低频电流并且按照接地电阻大小的不同进行分类:接地电阻大于20 kΩ,接地电阻小于20 kΩ。一般认为接地电阻小于20 kΩ可认定发生接地故障。
电流互感器采样信号如图2~4所示,采样频率为1000 Hz。
采用Daubechies4小波函数对信号进行5尺度分解,所得分解信号对应频率段即fA5为0~31.25 Hz,fD5为31.25~62.5 Hz,fD4为62.5~125 Hz,fD3为125~250 Hz,fD2为250~500 Hz,fD1为500~1 000 Hz。计算各分解信号在各频段的能量以及小波熵,如表1所示(表中1为无故障,2为接地电阻>20 kΩ,3为接地电阻<20 kΩ,SWE为小波熵,表2、3同)。
从表1可以看出3种情况计算出来的小波熵确有不同。环网在没有故障的情况下小波熵最小,而在接地情况下,小波熵增大,特别对于接地电阻小于20 kΩ的环网故障,小波熵最大。
从熵反映系统复杂度的角度考虑,环网无故障时,因为有很大的环网电流,电流频率成分较复杂,而当环网发生故障时,因为有低频信号注入,信号的频率组成会发生变化,加入了低频成分,低频部分小波能量增加,小波熵增大,同时随着接地程度增加低频信号电流增大,小波能量和小波熵也随之增大。图5为小波熵与低频信号电流关系的曲线。由曲线图可见,小波熵可以反映环网接地程度。一般认为接地电阻小于20 kΩ(低频信号电流大于1 m A)可以认定发生接地故障,可以把1 m A电流对应的小波熵作为判定故障的阈值。这样可以把故障情况进行分类作为训练样本,把小波能量和小波熵作为神经网络的输入向量,利用神经网络更好地进行故障的在线分类诊断,完成直流系统环网接地故障的模式识别。
3.2 神经网络的故障识别
首先,进行网络学习训练。对不同接地故障情况下的信号进行小波熵特征提取,确定发生接地故障的小波熵阈值,把获得的小波能量和小波熵组成输入向量,作为训练网络的样本。把每个样本的故障特征按照表2进行故障编码(Y1、Y2为输出),确定每个输入样本的网络目标输出。确定样本输入、输出后,选取输入层节点为7,隐含层节点为7,进行训练。
利用训练好的网络对一组不同故障情况下采集到的环网信号进行识别,输入检测样本,其结果如表3所示。从识别结果看来,这种训练好的网络可以准确地对直流系统环网接地故障情况进行区分识别,大量的仿真实验表明,该网络识别结果正确,具有较高的精度。
4 结论
小波分析是一种信号时间尺度分析方法,而且在时、频两域都具有表征信号局部的能力,而直流系统环网发生接地故障时,检测到的信号会发生变化,其信息熵的值也会发生相应的变化。结合小波分析理论和熵原理,运用小波熵来提取直流系统环网信号特征,并输入到BP神经网络中用以识别故障类型。本方法通过仿真分析表明,环网接地故障不同情况的小波熵是具有显著差别的,通过神经网络可以很好地检测直流系统环网故障。
摘要:直流系统环网是接地故障检测中的一个关键因素。针对直流系统中环网对接地故障检测的影响,基于小波熵理论,提出一种新的检测环网接地故障的方法。该方法利用小波分析具有时频局部化特性和熵能对系统状态表征的特点,将小波分析和熵结合起来完成信号的特征挖掘。通过低频信号注入,采集环网状态,计算小波熵作为系统的特征参数,运用这些特征参数作为输入样本,训练BP神经网络,建立神经网络故障检测系统,以实现智能化的故障识别。仿真分析证明,环网发生接地故障前后的小波熵具有显著差别。
关键词:直流系统,接地故障检测,环网,小波熵,神经网络
参考文献
[1]季涛,谭思源,徐丙垠,等.基于波形分析的直流系统接地故障检测新方法[J].电力系统自动化,2004,28(22):69-71.JI Tao,TAN Siyuan,XU Bingyin,et al.New method of DC system grounding fault monitoring based on waveform analysis[J].Automation of Electric Power Systems,2004,28(22):69-71.
[2]吴军基,杨敏,杨伟,等.暂态高频分量能量法小电流接地故障选线[J].电力自动化设备,2004,24(6):14-17.WU Junji,YANG Min,YANG Wei,et al.Fault line detection using transient high frequency energy for small current grounding system[J].Electric Power Automation Equipment,2004,24(6):14-17.
[3]李冬辉,徐津津.一种新的直流系统环网接地故障检测方法[J].电网技术,2006,30(2):57-60.LI Donghui,XU Jinjin.A new method to detect grounding fault of looped network in DC power system[J].Power System Technology,2006,30(2):57-60.
[4]BLANCO S,FIGLIOLA A,QUIROGA R Q,et al.Time-frequency analysis of electroencephalogram series(Ⅲ):information transfer function and wavelets packets[J].Physical Review E,1998,57(1):932-940.
[5]管霖,吴国沛,黄雯莹,等.小波变换在电力设备故障诊断中的应用研究[J].中国电机工程学报,2000,20(10):46-49.GUAN Lin,WU Guopei,HUANG Wenying,et al.Study on the application of wavelet transform in fault diagnosis of electric devices[J].Proceedings of the CSEE,2000,20(10):46-49.
[6]李志民,李卫星,李勃龙.熵原理及其在电力系统可靠性中的应用[J].电力系统及其自动化学报,2001,13(3):37-39.LI Zhimin,LI Weixing,LI Bolong.Entropy principle and its application in power system reliability[J].Proceedings of the EPSA,2001,13(3):37-39.
[7]封洲燕.应用小波熵分析大鼠脑电信号的动态特性[J].生物物理学报,2002,18(3):325-330.FENG Zhouyan.Dynamic analysis of the rat EEG using wave-let entropy[J].ACTA Biophysica Sinica,2002,18(3):325-330.
[8]QUIROGA R Q,ROSSO O A,SERRANO E.Wavelet entropy in event-related potential:a new method shows ordering of EEG oscillations[J].Biological Cybernetics,2001,84(4):291-299.
[9]印欣运,何永勇,彭志科,等.小波熵及其在状态趋势分析中的应用[J].振动工程学报,2004,17(2):165-169.YIN Xinyun,HE Yongyong,PENG Zhike.Study on wavelet entropy and its applications in trend analysis[J].Journal of Vib-ration Engineering,2004,17(2):165-169.
小波信息熵 第4篇
1 极大熵谱法
1.1数据模型和参数估计
给定数据的离散系列x (n) , 其中n为数据点数。n=1, 2, 3, N, 设x (n) 是白噪声激励的线性响应, 所以有:
其中w (n) 是方差为σw2的白噪声, p是模型阶数, ak是模型参数, k=1, 2, 3, p。根据自相关定义, 则有:
将式 (1) 带入式 (2) 得:
当m≥1时x (n) 与w (n+m) 无关, 所以有:
式 (4) 也可以写成矩阵形式
当给定数据离散系列x (n) , 并通过计算得到自相关Rx及方差σw2, 然后解由方程 (5) 可以得到模型参数。由此可得信号的功率谱密度, 即极大熵谱:
2 小波变换法
小波变换通过调节时窗和频窗能够分析信号的细节成分, 因此在信号分析中占有重要地位。
设时域信号f (t) , 则其连续小波变换为:
式中的共轭, 称为分析小波, 其中a、b∈R, a≠0, a为尺度伸缩因子, b为时间移位因子。通过改变a、b可以生成不同的小波函数构成小波族。
f (t) 的小波逆变换为:
工程实际中一般是经过实际采样得到离散信号, 因此多采用离散小波变换形式。离散小波变换是将式 (7) 、 (8) 中a、b离散为2-j, 2-k的形式。即得到离散二进小波变换和逆变换的表达式为:
小波分析同时具有频率伸缩和时间移位功能。设原始信号分析频率为fa, 由公式 (10) 可以推得在第一次小波变换中进行一次带通和低通滤波, 带通上限频率为fa, 下限频率为, 低通滤波频率范围, 第二次变换中, 带通滤波频率范围为;低通滤波频率范围为, 以此类推。
3 实例分析
设线性调频信号为:, 其时域信号如图1所示。
根据式 (6) 可得进行熵谱分析, 分析时每段采样点为64点, 共连续采样30个数据段。采样间隔为0.05s。图2为线性调频信号的三维谱图, 随着时间的增加, 频率0.15Hz增加到0.6Hz左右。而幅值基本平稳波动, 因此三维熵谱很好地反映了信号的时频特征。
图3为线性调频信号的三级小波分解, 其中S0为原始信号, S1~S3分别表示三级小波的高通信号, S33为三级小波的低通信号。由于原始信号的截断频率为1.2Hz, 因此四个频段分别为:0.6~1.2Hz, 0.3~0.6Hz, 0.15~0.3Hz, 0~0.15HzHz。从图3中可以看出, 信号在0.6~1.2Hz高频段上幅值较小, 而在低频段, 即三级小波的低频段0~0.15Hz和三级小波的低频段0.15~0.3Hz范围内信号占主要成份。
参考文献
[1]科恩L[美]著, 白居宪译.时频分析:理论与应用.西安:西安交通大学出版社, 1998
[2]张贤达, 保铮.非平稳信号分析与处理.北京:国防工业出版社, 1998
[3]郑治真, 张少芬.瞬态谱估计理论及其应用.北京:地震出版社, 1993
[4]应怀樵, 沈松, 刘进明.短时最大熵谱阵的时频分析.东方振动和噪声技术研究所研究报, 1996
小波信息熵 第5篇
边缘是图像最基本的特征, 也包含了图像大量的信息, 通过边缘检测可以极大地降低图像处理的数据量[1], 简化图像的分析过程, 是图像分析与识别的重要环节。医学图像已成为临床诊断、病理分析及治疗的重要依据。在对医学图像进行处理的过程中, 边缘检测的结果会直接影响到后续的治疗过程[2]。然而, 一些医学图像由于病变组织侵蚀周围组织造成边界模糊, 使其边缘更难于检测。
传统的边缘检测算法是基于空域的, 如Sobel、Prewitt和Canny算子等。这些算子的主要作用是高通滤波, 各有针对性和特点, 但涉及方向性, 对噪声比较敏感, 因此很难检测出复杂的边缘。为此人们提出很多新算法, 将各种数学理论和工具应用到图像边缘检测中。本文提出了一种基于提升小波和多尺度形态学熵权边缘检测方法, 结合提升小波变换与数学形态学的优点, 即提升小波不仅继承了传统小波的时频局域化特性及多尺度分析能力, 同时具有计算速度快、占用内存少等优点, 非常适合于图像处理[3]; 数学形态学是一种非线性滤波方法, 可以简化图像数据, 保持它们基本的形状特征, 并除去不相干的结构[4]。利用上述这些特点, 首先对图像进行提升小波变换, 然后分别采用小波变换和多尺度形态学算子提取边缘, 采用一定的融合规则将两个边缘图像进行融合, 再通过提升反变换得到最终的边缘。实验结果表明该算法融合过程简单, 有效地保护了图像的细节, 检测出连续、清晰的边缘。
1 基于提升小波的边缘检测
提升小波是构造小波的一种新方法, 它与经典的Mallat算法的主要区别是它的构造不依赖于Fourier变换, 也不是某个函数的伸缩和平移, 而是从“惰性”小波开始的有限次的提升步骤的级联[5]。只要构造出具有小波变换特性的正变换, 就可以很容易地得到它的逆变换。提升小波变换的正反变换都比传统的Mallat算法快两倍[6], 因而被广泛应用于图像处理。一般的提升方案包含以下三个步骤:
( 1) 分裂, 将原始信号x ( n) 按奇偶性分为偶子集xe ( n) 和奇子集xo ( n) , 分裂过程表示为: x ( n) = ( xe ( n) , xo ( n) ) ;
( 2) 预测, 利用相邻信号之间的相关性, 用一个子集预测另一个子集。通常用偶子集xe ( n) 预测奇子集xo ( n) , 定义预测算子P[], 则预测过程可表示为: d ( n) = xo ( n) - P ( xe ( n) ) ;
( 3) 更新, 目的是用d ( n) 来修正偶子集xe ( n) , 使得修正后的xe ( n) 只包含信号x ( n) 的低频成分, 更新过程可表示为: c ( n) = xe ( n) + U ( xo ( n) ) 。正是由于更新算子U[]的存在, 因此称为提升。
对于二维图像f ( x, y) 的提升小波分解一般采用行列逐层分解法, 即先对图像矩阵的行做提升分解变换, 再对得到的结果按列做提升分解变换。经过一层分解后可得到四个子图像, 分别是反映原始图像平滑特性的低频子图和反映亮度突变及细节特性的水平、垂直和对角三个方向的高频子图[7]。边缘属于突变信号, 图像经过提升小波变换后, 小波系数的局部极值代表着图像上的边缘点。通过检测沿幅角方向上模值的极大值点, 即可得到图像的边缘点。
在尺度2j下, 图像f ( x, y) 的二维小波变换为: W12jf ( x, y) 、W22jf ( x, y) , 则每一像素点的模值和幅角的计算公式如下:
2 多尺度形态学熵权边缘检测
数学形态学基于集合运算, 具有非线性特性, 在进行边缘检测时既能体现图像集合特征, 很好地检测出图像边缘, 又能通过改变结构元素的尺度来克服噪声影响[8]。形态学的基本思想是利用结构元素对信号进行“探测”, 保留主要形状, 删除不相干形状 ( 如噪声、毛刺) 。作为探针的结构元素, 可直接携带信息, 如方向、大小、色度等, 来探测和研究包含了图像主要信息的结构特征[9]。各种形态学算法均可分为形态学运算和结构元素选取两个基本问题, 而形态学运算的性能取决于结构元素的选择。
2. 1 形态学边缘检测算子
形态学的基本运算包括腐蚀、膨胀、开启和闭合。将这四种运算进行组合, 可以构造出许多形态学边缘检测算子。下面是几种简单常用的形态学边缘检测算子。设f是输入图像, B是结构元素, E为检测出的边缘, 则:
由此可以看出, 形态边缘检测算子是一种非线性的差分算子, 实质上是传统线性差分算子在一定意义上的推广。腐蚀型提取的是图像的内边缘, 膨胀型提取的是图像的外边缘, 膨胀腐蚀型提取的是图像骑跨在实际边缘上的边缘[10]。然而这三种检测算子对噪声较敏感, 抗噪性能较差。考虑到形态学腐蚀和开运算对正向噪声有抑制作用, 而膨胀与闭运算对负向噪声有抑制作用, 可以构造一种抗噪边缘检测算子:
2. 2 结构元素的选取
结构元素的选取一直是形态学检测的一个难题, 它的选择直接影响了图像边缘检测的效果。不同形状的结构元素对图像边缘的感应能力不同[11], 常用的结构元素有矩形、圆盘形、菱形、线形等, 其中矩形结构元素可以检测到图像上下左右的边缘, 可得到强连通边界。多尺度形态学边缘检测就是利用不同尺度的结构元素提取图像边缘信息, 将各尺度下的边缘信息通过某种方法合成新边缘。许多研究表明, 采用多尺度形态检测算子, 可克服结构元素尺寸选择的困难。
多尺度结构元素定义如下, n是尺度参数, 是一正整数。可以看出大尺度的结构元素是由小尺度结构元素膨胀运算得到。对一个给定的多尺度结构元素序列, 不同尺度大小的结构元素可用于抽取不同尺度上的边缘, 但当尺度选取较大时会增加运算负担, 并会在一定程度上模糊检测到的边缘图像[12]。综合考虑以上问题本文选取矩形作为结构元素, 尺度参数n取4, 初始结构元素选取33大小, 膨胀后分别得到55、77、99的矩形结构元素。
2. 3 熵权计算
熵的概念由Rudolf Clausius在1865 年提出的, 它反映了一个事件给予人们信息量的大小, 可以说它是信息量的一个度量。因信息熵为图像的内在特性, 由它来决定不同尺度结构元素提取的边缘在最终合成边缘中所占的权重, 是自适应且客观的[13]。熵权值计算方法如下:
( 1) 用膨胀得到的不同尺度的结构元素对图像进行形态学开闭、闭开运算, 然后分别求出这些结构元素的开闭、闭开运算的均值图像。设处理后的图像为gn, 即:
( 2) 计算不同尺度下图像的信息熵:
其中, L图像的灰度级, Pi是各灰度级像素出现的概率。
( 3) 用不同尺度下的图像信息熵确定权值:
3 医学图像边缘检测算法步骤
经上述讨论, 医学图像边缘检测算法主要步骤如下:
(1) 输入原始图像;
( 2) 利用sym4 小波对原始图像作二维提升小波变换, 因为sym4 小波具有很好的对称性, 可以减少图像重构时的相移[14];
( 3) 计算小波变换系数的模极大值找出边缘点, 得到边缘图像;
( 4) 结合式 ( 5) 和2. 2 节中构造的多尺度结构元素分别提取各尺度下的边缘图像, 通过计算不同尺度下边缘图像的信息熵确定权重系数, 再通过加权求和得到合成边缘图像;
( 5) 将上述两种方法提取的边缘图像按与的规则进行融合, 得到融合边缘图像;
( 6) 对融合后的边缘图像进行最优阈值二值化和骨架提取, 得到单一像素、连贯、完整的边缘图像。
本文利用Matlab语言编程进行仿真, 部分程序如下:
4 实验结果及分析
为验证算法的可行性和性能, 本文使用CPU为Intel Penti-um G630, 内存为2 GB的硬件平台, 在Matlab R2011a的环境下编程实现了上述算法, 以医院提供的肺部CT图像作为实验图像, 图像大小为512 512。通过仿真实验比较不同算法下边缘提取的结果, 如图1 所示。
图1 ( a) 是肺部病灶CT图像, ( b) 、 ( c) 分别是采用传统的边缘检测算子prewitt和canny算子检测到的边缘图像, ( d) 、 ( e) 分别是采用小波变换法或经典形态学法边缘提取的结果, ( f) 是本文算法提取的边缘图像。本文算法对经过提升小波变换后的图像, 分别采用两种方法先后提取边缘: 一种是小波模极大值法得到边缘图像, 另一种是多尺度形态学熵权方法, 选取多尺度结构元进行形态学边缘检测后, 由各尺度下边缘图像的信息熵来决定权值系数, 信息熵和权值计算结果如表1 所示。由表可以看出由于小尺度结构元素能够检测到好的边缘, 因而所占比重大, 而大尺度结构元素去噪能力强, 边缘检测能力弱, 占比重就小; 然后将两种方法得到的边缘图像进行融合, 再经过提升小波反变换获得连贯、清晰、完整的边缘图像。
比较图1 中各种算法的检测结果可以看出, 传统的边缘检测算子采用卷积运算, 对边缘比较敏感使得检测结果不清晰; 小波变换依赖于傅里叶变换, 采用卷积运算, 计算量较大, 而且有虚假边缘存在, 从而导致边缘提取结果不理想; 经典形态学边缘检测算法由于采用单一尺度的结构元素, 只提取了一个精度的边缘, 检测效果下降, 所以造成了边缘的断裂和不完整; 相比之下本文算法提取出了不同尺度下的边缘, 避免了边缘信息的丢失, 得到了完整平滑连贯的边缘, 边缘定位精度显著提高。本实验选取了大量的肺部CT图像进行处理, 均得到了上述相同的结果, 表明该算法能够快速、精确地检测出图像的边缘, 相比小波变换和数学形态学边缘检测算法, 计算量减小, 算法实现简单, 检测效果显著提高。
5 结语
小波信息熵 第6篇
电网的源网协调研究将是电网科研的重要方向。源网协调研究的基础正是负荷的短期有效预测,在一些负荷大波动地区,提高负荷预测的精确度是一个热点和难点问题[1]。大波动地区[2]是指冲击负荷和小水电负荷等难预测的负荷占总负荷的三分之一以上的地区。在这类地区,引起负荷波动和影响负荷预测精度的原因为:炼钢、轧钢、电铁牵引负荷等冲击负荷;许多大型企业拥有自备电厂;径流式小水电群丰富。本文中大波动地区短期负荷预测指以1 h或者15 min为单位对该地区的冲击性负荷和小水电负荷(基本负荷之外的大波动负荷)进行预测。而对于这类大波动性负荷,目前国内外尚未有一个有效的短期预测方法。虽然冲击负荷和小水电负荷无规律,难预测,但只要准确分析、精确计算,合理地安排调度计划,一定能够把冲击负荷和小水电负荷的干扰控制到最低程度,从而达到对电力系统进行合理经济调度、降低生产成本、防止电网大面积停电提高自身以及用户的经济效益的目的。目前,对小水电负荷的短期预测法通常运用的是多元线性回归模[3]和改进的指数平滑预测方法[4],而文献[5]对冲击负荷的预测运用的是基于修正的时间序列模型。如果需要对预测的精度有所提高,传统的方法显然是不能满足需求的。在文献[6-7]将小波分解重构技术运用到常规负荷的短期预测中去,得到了很好的效果,本文将限幅小波的理论引用到大波动短期负荷预测模型中去,使得小水电负荷和冲击负荷的预测精度得到改善。另外,但文献[3,5]均未给出用以预测此类波动大的负荷的相似日选取方法。文献[4]对于选取用于小水电负荷预测的相似日仅仅考虑了降雨量的因素,不够全面,并且筛选方法复杂,没有统一的数学表达式。本文提出了一种改进熵值法,用于选择历史样本,该方法与限幅小波模型结合能够准确地预测出大波动地区的负荷。
1 负荷特性分析
1.1 小水电群负荷特性
由于小水电负荷的无周期性和无规律性,要对径流式小水电群做出准确短期负荷预测,首先要了解小水电群的负荷特性[8]。本文将小水电发电负荷与主要影响因素做出比较,通过观察图1可以知道:温度和风力[9]对小水电的发电负荷影响相对较小,降雨量和上游排水对小水电的发电负荷到达显著作用需要一定的时间,也就是由于积累效应引起的滞后时间。通过比对可知针对长寿地区大洪河流域而言,上游排水量对于小水电负荷占主要作用,其滞后时间大约8 h。
1.2 冲击负荷特性
在一些负荷以煤炭,钢铁,化工为主的地区,电网负荷冲击性较强。这类负荷的特点是:出现最大负荷的时间很短,但其峰值可能是其平均负荷的数倍或数十倍。针对重庆市长寿区,分别对重钢和永航两个大型炼钢企业的负荷进行分析。
对数列进行一阶差分,可以消除数据增长趋势性。从图3可以看出,预测数列取作一阶差分后的图形显示基本消除了长期趋势性的影响,趋于平稳化,由以图3中我们可以看出冲击负荷的“节奏”。
2 训练样本的选择
2.1 初步筛选
通过分析可以知道,无论是钢厂还是小水电站,不同时刻下的负荷数据还与机组情况有关。钢厂的冲击负荷与炼钢和轧钢工艺所用有功负荷密切相关。假设在t时刻,某机组停运或者不处于工作状态,用0表示;相反,用1表示。通过比较由机组运行状态所构成的向量则可以进行第二步筛选。
2.2 改进的熵值法
首先,训练样本与预测样本的区别在于预测样本对应的时间段为将来时,而训练样本对应的时间段为过去时[10]。以重庆市长寿区为例,对于冲击负荷的预测,首先要考虑到对于该地区冲击负荷的主要影响因素,因为该地区主要以钢厂为主,所以炼钢“节奏”以及一些炼钢的生产情况(钢材的类型,重量等等)成为影响冲击负荷的主要因素,将第j时刻到第j-m时刻的冲击负荷值作为炼钢“节奏”的体现。而针对小水电群的出力预测,将第j时刻到第j-s时刻的上游排水量,第j时刻到第j-t时刻的降雨量,以及温度和风力为神经网络的输入,然后运用神经网络,对输入样本进行训练。训练样本最关键在于其准确性,也就是说训练样本首先要能能正确反映该过程的内在规律。本文运用改进的熵值法对样本数据进行筛选,在信息论中,熵是对不确定性的一种度量[11]。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。改进熵值法步骤如下。
①异质指标同质化
式中:lij为第i个样本的第j个指标的数值;lpj为待测时刻p的第j个指标的数值;i∈{1,2,,n},j∈{1,2,,m}。
②计算第j项指标下第i个样本占该指标的比重
③计算第j项指标的熵值
式中:k>0,k=1/ln(n);ej≥0。
④计算第j项指标的差异系数
⑤求权值
⑥计算各样本的综合得分
3 限幅小波
3.1 小波理论
对于性质随时间稳定不变的信号,处理的理想工具是傅里叶分析,但是实际情况中绝大多数信号是非稳定的,而适用于非稳定不变的信号的工具就是小波分析[12]。小波变换通过伸缩平移运算对信号逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求。
对于时间序列f(t)∈L2(R)L2(R)(表示能量有限)的连续小波变换为[4]
式(4)中:ɸ(t)为基本小波;Wf(a,b)为对应于不同尺度不同位置的小波变换系数。如果时间序列是离散的,则离散小波变换为[4]
式(9)中:N为离散点数;Δt为抽样时间间隔。
本文分别将N个样本时刻的历史数据作为状态向量,对其分别做一维小波变换,其中高频信号反映的是随机扰动带来的影响,低频信号反映的是该信号时间序列的内在变换趋势。故通过小波分析的原理对信号进行分解,并用本文的方法进行处理,再进行低通滤波和信号还原,最后用线性神经网络对其进行训练和预测。通过去掉原始信号中难以预测的高频变化部分和处理表示信号内在趋势的低频信号,可以提高最终预测能力,比用N个随机波动性强的原始信号直接进行笼统的预测更加能够反映数据内在关系。
3.2 基于规则性系数的小波基选取
小波基的选取通常与小波基的连续性、正交性、对称性、消失矩、线性相位、斜对称性等相关,但在通常情况下,小波基的选取很难总结一般的原则,只能视由具体情况而定。文献[13]中提出了一种按照小波规则性系数选择小波基的新方法,此种方法的原理在于小波的规则性系数与小波的消失矩有着相同的变化趋势。用平滑的小波表示平滑的函数,用非平滑的小波表示非平滑的函数,也就是说,波动性小的的信号选择规则性系数大的小波,波动性大的信号选择规则性系数小的小波。实验证明,本文采用“db5”小波基(规则性系数为1.59)所得的预测结果好于采用“db10”(规则性系数为2.9)小波基所得预测结果。
3.3 限幅滤波
本文对小波分解后的低频小波系数先进行限幅滤波,再对极大模值作异常处理,最后以低通滤波的形式还原信号。限幅滤波的优点是能够克服因偶然因素引起的脉冲干扰,其原理如下。
式中,限值λ1,λ2根据实际情况而定。
3.4 基于模极大值的异常处理
历史负荷数据中会夹杂许多伪数据。伪数据的出现对预测模型的精度产生不良的影响。如果不去除伪数据的影响,负荷预测的精度将受到很大影响。本文经小波分析后对每个尺度的负荷数据做异常数据处理[13]。
式中,θ,σ由实际情况而定。
4 基于限幅小波的预测模型
4.1 线性神经网络
对于小水电发电负荷的预测,本文所选用的是线性神经网络模型,因为它更能反映冲击负荷和小水电发电负荷与其相关因素之间的关系。神经网络的线性回归模型即自适应线性组合器,它没有隐含层,激励函数为线性函数。线性神经网络采用Widrow-Hoff学习规则,又称最小均方误差学习规则,由Widrow-Hoff提出,属于有导师的学习算法,它的目标是通过调节权值,使均方误差从误差空间某点开始,沿着均方误差的斜面向下滑行,最终使均方误差达到最小值。本文选择这种简单的神经网络的原因在于,自适应线性组合器原理简单,运用方便,在输入层数据类型较多的情况下,需要的历史数据较BP神经网络少,不会出现“过拟合”的现象,并且实验表明,它的预测效果远好于径向基神经网络[14]和其他类型的神经网络。
4.2 改进的积累自回归-滑动平均模型(ARIMA)
对于冲击负荷的预测,本文选用的是ARIM模型。ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,d为移动平均项数,q为时间序列成为平稳时所做的差分次数。其模型表达式可表示为
公式(15)中:B为延迟算子;▽为差分算子。经过简单的推导可以知道[15]:
式(16)中:yt为t时刻的电力负荷预测值;yt-1,yt-2,,yt-k为电力负荷的历史值;Ui,t-j为电力负荷相关因素;a1,a2,,ak和bi,j为待估计参数。
5 应用实例
收集到重庆长寿区冲击负荷和小水电发电负荷电及其影响因素新息,针对2011年3月26日,结合当下时刻的机组检修运行状况对长寿地区小水电负荷和冲击负荷进行超短期预测。采用以下评价指标作为参考[15],结果见表1、表2。
1)平均绝对百分比误差
2)均方根相对误差
通过表1、表2对小水电负荷与冲击负荷预测结果的相对误差,平均绝对百分比误差和均方根相对误差进行比较可以知道,对于小水电负荷和冲击负荷的预测,单层限幅小波分解理论的效果略优于单层小波分析理论的预测效果。该结果可以用于与基本负荷预测值进行叠加得到的长寿地区负荷短期预测值。在大波动负荷地区,运用本文所提出的分解模型比直接运用时间序列更能准确地求出负荷预测的结果,而限幅小波的运用也为预测结果提高了精度。通过分析可以知道,误差的产生主要来自于历史数据的选取方法,模型本身的误差和对模型参数的选取。
注:Mod1表示基于线性神经网络的模型;Mod2表示基于线性神经网络和小波分析的模型;Mod3表示基于线性神经网络和限幅小波的模型
6 结论
针对神经网络输入信号的随机性和无规律性,本文先用改进的熵值法对历史数据进行筛选,再将限幅小波运用到处理神经网络的输入数据方面,使得处理以后的数据更加能够准确地反映被预测时刻的真实情况。利用改进的熵值法和限幅小波对数据进行预处理的思想,不仅能运用到神经网络的预测中来,也可以运用到其他的预测方法中去,例如多元线性回归和时间序列预测法也同样适用。经过试验数据的论证,可以得出一个结论:在运用改进的熵值法对历史数据进行选择后,再运用限幅小波分析理论对数据进行去噪的方法对于提高大波动地区的冲击负荷和小水电负荷预测的准确度有较好的效果,为把其干扰控制到最低程度和提高源网协调的研究水平打下坚实的基础。
注:Mod1表示基于改进ARIMA的模型;Mod2表示基于改进ARIMA和小波分析的模型;Mod3表示基于改进ARIMA和限幅小波的模型。
摘要:为了使大波动地区的短期负荷预测精度得到改善,将大波动地区的负荷划分为基础负荷、冲击性负荷和小水电负荷,对波动大的的冲击性负荷和小水电负荷作出预测,并将限幅小波的理论引用到负荷预测模型中去。找出影响冲击负荷和小水电负荷相关的若干因素。由于用于预测的信号随机波动大,因此先运用改进熵值法对历史数据进行筛选,再运用规则性系数选取适合的小波基对信号进行小波分解,然后对低频信号进行限幅滤波,对极大模值做异常处理和以低通滤波的方式去噪,再选用线性神经网络模型和改进的差分自回归-滑动平均模型(ARIMA)进行预测,对预测结果进行比较和分析。实验证明对于波动大的冲击性负荷和小水电负荷,基于单层限幅小波分析的负荷模型预测效果较单层小波分析的负荷预测效果好。改进的熵值法和限幅小波分析理论对提高冲击负荷和小水电负荷的短期预测结果精度有较好的实用价值。
小波信息熵 第7篇
关键词:小波变换,灰度直方图熵,图像融合
目前, 全国第一次地理国情普查正在紧锣密鼓的进行, 遥感影像自动解译将大大减少内业工作量, 而近红外波段能够很好的区分水体和植被, 弥补可见光波段光谱特性的不足, 所以对近红外与可见光图像融合质量提出来较高的要求。
目前关于图像融合的方式与理论不断被提出, 就像素级图像融合而言, 按照算法的不同主要包括基于塔形分解的图像融合和基于小波分解基的图像融合[1]。本文通过对上述算法进行分析, 就目前近红外与可见光图像融合方法上存在的问题, 提出了基于图像分割技术与多分辨率分析的基础上, 应用灰度直方图熵理论与平稳小波变换理论实现近红外与可见光图像融合的方法。
1 基于灰度直方图熵和平稳小波变换图像融合原理
本方法首先以灰度直方图熵及索贝尔算子边缘检测相结合的方式为标准, 对图像进行分割, 将其分为目标图像与背景图像。随后应用平稳小波变换理论将可见光条件下的目标图像与近红外条件下的背景图像进行融合, 频率高的部分采用绝对值取大的方式进行融合, 频率低的部分则采用高斯模糊逻辑进行融合。按照加权与融合准则融合背景图像与目标图像, 最终形成近红外图像与可见光图像的完美融合图像。
1.1 索贝尔算子边缘检测
索贝尔算子, 作为图像边缘检测算子中常用的一种的离散性差分算子, 可以较好的实现图像亮度函数在梯度方向近似数值的计算工作。将图像进行极限划分, 图像中的任意某一点都可以计算出其纵向矩阵与横向矩阵, 按照积分计算可得出它们与图像作平面的卷积, 也就是横向与纵向在亮度上的差分解。假设以X代表原始图像, 则索贝尔算子边缘检测步骤如下:
首先, 分别计算图像A的横向及纵向边缘检测图像Gx和Gy, 如公式 (1) 所示:
其次, 完成图像各像素点的梯度值和梯度方向的计算, 如公式 (2) 所示:
最后, 设置阈值T, 在图像像素梯度值不小于T时, 则表明该像素点即是边缘像素点, 所有的边缘像素点则形成最终的边缘图像。
1.2 近红外图像分割方法与融合准则
近红外图像分割方法主要是结合了灰度直方图熵以及索贝尔算子边缘检测技术而实现图像的分割。在进行分割时, 需要用索贝尔算子边缘检测判别有可能出现的目标区域, 并以灰度直方图熵计算目标阈值作为参考, 统筹两者最终判定所需的目标区域。
传统的融合准则倾向于应用区域空隙频率取的较大情况下的融合准则, 以便于获取质量高的图像融合效果, 但是区域空间的频率在图像灰度出现跳跃时表现力强, 其主要反映了图像的边缘化强度, 所以在选择区域空间频率取大的融合准则时往往会出现图像边缘细节信息获取量大而忽略了图像的亮度信息。为了规避上述融合准则的不足, 本文基于高斯模糊逻辑权重的融合准则。本融合准则可以在突出近红外图像的目标信息的同时也统筹了可见光图像的场景细节信息, 其系数选取准则如公式 (3) 所示:
2 实验结果和分析
为了验证本文提出的近红外与可见光图像融合方法, 结合常用的几种方法进行对比实验。对比的方法包括基于Laplacian塔变换的图像融合方法 (LPTF) , 基于小波变换的图像融合方法 (WTF) 和基于平稳小波变换的图像融合方法 (SWTF) 与本文提出的方法共四种[3]。
WTF所采用小波基为bior4.4小波, 分解层数总共为4层, 低频与高频融合准则分别为均值法和绝对值取大法[2];SWTF同样使用bior4.4小波, 分解层数也为4层, 其中低频融合准则其一为均值法 (SWTF1) , 其二为高斯模糊逻辑权值法 (SWTF2) , 高频融合准则为绝对值取大法;本文提出的方法所使用的小波基为bior4.4小波, 分解层数为4层, 权重系数w1=1.0, w2=1.0。采用标准差、信息熵及互信息三个指标作为不同方法的综合评价。本实验采用的近红外与可见光图像是荷兰TNO人为因素研究所拍摄的近红外和可见光图像, 融合图像结果分别如图1所示, 评价指标结果如表1所示。
光源图; (3) LPTF融合结果; (4) WTF融合结果; (5) SWTF1融合结果; (6) SWTF2融合结果; (7) 本文算法融合结果。
从图1可以看出LPTF、WTF与SWTF1所融合形成的图像层次感差, 对比度低, 且画面亮度不够, 图像中的景物清晰度不足, 且源图像中的栅栏与道路等关键信息在融合图中模糊;本文的融合算法与SWTF2融合所得到的融合图像则表现质量较好, 一方面突出了人物的形体特征, 另一方面栅栏与道路等景物细节也有着很好的体现, 因此本文的融合方法整体效果优于上述前几种方法。
从表1可以得出量化的评价信息。结论如下:本文融合算法得到的融合图像较之其他几种的融合方法形成的图像其标准差、信息熵与互信息均为最高, 这说明采用本文的融合算法得到的融合图像具有高对比度、高信息量的特点, 有利于最大程度上反映出源图像上所包含的信息。
其中SWTF2得到的融合图像的标准差、信息熵、互信息要较之于SWTF1的有着很大的提高, SWTF2的融合效果优于SWTF1, 这说明在低频子带相比于均值法, 应用高斯模糊逻辑融合准则的融合效果更好。
3 小结
本文阐述了基于灰度直方图熵和平稳小波变换的近红外与可见光图像融合方法, 通过与传统融合方法进行实验比较, 表明本文所提出的融合方法很好的统筹了红外图像的目标信息与可见光图像的场景细节信息, 且在标准差、信息熵和互信息的客观指标体系上也表明本方法的优越性。因此基于灰度直方图熵和小波变换的近红外与可见光图像融合的方法是一种较优的融合方法, 可以在生产实践中应用。
参考文献
[1]王海晖, 彭嘉雄.基于多小波变换的图像融合研究[J].中国图像图形学报, 2004, 9 (8) :1002-1007.
[2]刘贵喜, 杨万海.基于小波分解的图像融合方法及性能评价[J].自动化学报, 2002, 28 (6) :927-934.