正文内容
模糊核聚类算法
来源:漫步者
作者:开心麻花
2025-09-19
1

模糊核聚类算法(精选4篇)

模糊核聚类算法 第1篇

绘画是艺术门类中的重要组成之一。绘画艺术从作品材质划分, 西方有油画、漆画等, 中国有水墨画、水彩画等;从风格上划分, 则更加细分到诸多流派, 单譬如油画, 就有印象主义、浪漫主义、写实主义, 抽象主义、后现代主义等等数十种之多, 对于一般的艺术欣赏者而言, 难以分辨。因此, 亟需提出一种基于机器识别的分类算法。

分类算法需根据艺术流派分析的传统经验进行算法设计, 同时可以参考基于内容的视频检索的部分核心思想进行实现。就核心概念而言, 视频是帧的封装, 流派是目标作品绘画的封装, 在实现上具有类比的可行性。在基于内容的视频检索领域, 许多研究方法都是利用并提取关键帧从而简化视频相似度对比的运算量, 但需满足帧数相等的先决条件。在绘画目标作品分类算法中, 显然不适用。为了更好的满足本文特定的分类需求, 算法需解决两个不同绘画样本数量 (矩阵不同维) 的聚类及其相似度计算问题。本文主要思想正是以此为出发点, 提出相似度核来计算不同维矩阵相似度的算法, 再结合聚类算法解决流派分类问题。

1 特征提取

颜色、纹理和形状是绘画作品图像中最重要的代表特征, 也是最为底层的视觉特征, 我们在特征向量的提取工作中, 着重从此着手。

颜色特征是固有的一种视觉特性, 颜色特征对图像质量的变化、噪声等都有很好的鲁棒性, 目前基于图像颜色提取特征向量的算法日臻成熟, 如颜色直方图、颜色矩、累计直方图、Color Coherence Vector等。

纹理特征与物体的表面有强相关性, 表现物体的某种局部性质, 是像素在局部区域中分布关系的度量, 但其本质是像素灰度空间的分布规律。基于图像纹理提取特征向量的算法有重要的研究意义, 也取得了很大的发展, 主要有Tamura纹理特征、灰度共生矩阵、小波变换和自回归纹理模型等。

形状特征基于图像中物体与区域的划分, 在目前的技术水平下, 无法保证准确性和鲁棒性, 只应用于特殊情况中。

对此, 提出了综合特征提取方法, 采用颜色特征与纹理特征相结合的方法构造特征矩阵。

1.1 颜色特征向量提取

选取分量间相互独立且具有视觉一致性的HSV颜色空间, 如图1所示。

为72级的一维直方图, 即该图像的颜色特征。

1.2 纹理特征向量提取

采用灰度共生矩阵来表示纹理特征, 其本质是图像二阶组合条件概率密度函数。具有计算量小, 算法复杂度低, 容易实现, 特征提取速度快的特点。

取d=1, θ分别为0°、45°、90°、135°的公式如下:

RGB转化为灰度图像, 灰度级256, 如式 (7) :

其中Y为灰度值, R为红色分量的灰度值, G为绿色分量的灰度值, B为蓝色分量的灰度值。

在保证检索特征的前提下, 采用16级灰度量化能大大提高提取速度, 按照公式 (3) (4) (5) (6) 构造共生矩阵, 分别计算出其惯性矩CON、熵ENT、能量ASM、相关COR后做归一化处理, 得公式 (8) :

其中Fi为N维特征向量, fij为上特征分量。

1.3 综合特征向量提取

在获得颜色特征和纹理特征之后, 根据公式 (1) 和公式 (8) 可构造综合特征向量为:

1.4 特征矩阵构造

2 相似度计算

2.1 相似度核

根据上文1.2章节构造特征矩阵的定义, 利用公式 (11) 对待分类的绘画目标作品建立特征矩阵, 即:

其中, nj为所选流派图像库中所包含的作品图像的数量。

公式 (14) 得出的相似度核, 可以量化解决绘画目标作品与绘画流派图像库之间 (即不同维度矩阵) 的相似度计算问题。为了进一步提高机器分类的精度, 我们结合艺术作品传统识别方法中最为关键的特征进引入权重系数, 即对绘画作品的纹理和颜色特征进行加权。在公式 (11) 中加入权重系数ω, 则公式 (11) 的改进形式为:

根据公式 (12) 与公式 (13) 定义, 代入公式 (15) 中得到加权相似度核为:

权重系数采用加权向量进行设置:

其中, ωcm是颜色特征加权值, ωtm是纹理特征加权值, 可根据具体情况进行优化调整。

2.2 聚类算法

综合分析目前的主流聚类算法并根据本文研究的实际情况, 采用层次聚类中的凝聚算法, 可以得到较好的聚类精度与较好的聚类时间, 应用在本文算法中流程如下:

流程一:输入待分类的数字化绘画作品图像, 提取颜色特征向量和纹理特征向量并构造综合特征向量, 进而构造特征矩阵;

流程二:输入流派图像库全部图像, 提取颜色特征向量和纹理特征向量并构造综合特征向量, 进而构造特征矩阵;

流程三:根据公式 (16) 计算相似度, 进行凝聚聚类后标记、合并高于相似度阀值的类别, 并更新聚类特征矩阵;

流程四:若聚类符合要求, 则选择相似度最高的流派图像库, 作为匹配结果, 并按相似度排序列举备选流派图像库。若聚类不符合要求, 则转流程三。

4 结束语

本文提出一种相似度核聚类算法, 主要解决了绘画作品相似度的量化及机器分类的问题。首先定义了目标作品绘画与流派图像库的特征向量与特征矩阵;其次, 基于矩阵运算方法及核函数提出一种相似度核聚类算法, 能有效完成绘画作品的流派分析和聚类。但是, 本文所设计的算法在特征向量的提取上, 还不够全面有效, 造成了对作品流派的进一步细分, 例如印象派中的新印象派、后印象派等, 就无法做到较好的识别与相似度区分, 此类问题更加复杂, 将是下一步研究的重点。

参考文献

[1]李梁凯, 徐庆, 罗小小.结合Tsallis熵与Jensen距离的视频关键帧抽取方法[J].计算机工程, 2015.04.10 16:39.

[2]王松, 韩永国, 吴亚东, 张赛楠.基于图像主色彩的视频关键帧提取方法[J].计算机应用, 2013, 9.

[3]孙吉贵, 刘杰, 赵连宇.聚类算法研究[J].软件学报, 2008, 19 (1) .

模糊核聚类算法 第2篇

基于蚁群算法的结构面产状模糊C均值聚类分析

摘要:鉴于传统结构面分析方法只能进行相对的优势组数划分,无法准确定量地给出优势结构面的`产状,提出了基于蚁群算法(ACA)的结构面产状模糊C均值(FCM)聚类算法;该算法利用ACA算法得到结构面产状的模糊聚类个数,并利用FCM算法得到初始聚类中心,最终得到具有全局分布特性的最优聚类;通过现场实测数据分析,验证了该算法的实用性和有效性.作 者:滕继东 徐光黎 申艳军 TENG Ji-dong XU Guang-li SHEN Yan-jun 作者单位:中国地质大学工程学院,武汉,430074;岩土钻掘与防护教育部工程研究中心,武汉,430074期 刊:安全与环境工程 Journal:SAFETY AND ENVIRONMENTAL ENGINEERING年,卷(期):,17(4)分类号:X93 TU45关键词:岩体 结构面产状 蚁群算法(ACA) 模糊C均值(FCM)聚类算法

模糊核聚类算法 第3篇

摘 要:本文提出了基于改进遗传算法的特征加权模糊聚类算法(IG-WFCM),通过对样本数据集进行聚类划分,以此来确定数据所属的类别。并通过入侵检测仿真实验对该算法进行了测试,结果表明本文的算法是可行的,在一定程度上提高了入侵检测算法的性能和效率。

关键词:遗传算法;模糊聚类算法;入侵检测

中图分类号:TP393.08 文献标识码:A 文章编号:1007-9599 (2013) 09-0000-02

模糊C-均值聚类是利用模糊理论进行数据分析的经典聚类算法,由于其能比较客观地反映现实模型,所以在数据挖掘、入侵检测等很多领域都获得了有效的应用[1,2]。遗传算法(GA)是一种模拟自然进化过程来进行查找最优解的高效全局优化搜索算法[3],应用非常广泛。本文结合这两种算法的特点,提出了一种基于遗传算法的模糊聚类算法,并通过仿真实验对其在入侵检测中的表现进行研究。

1 模糊C-均值聚类算法基本原理

模糊C-均值聚类(FCM)算法基本原理:通过优化目标函数计算每个样本点对所有类别中心的隶属度,从而自动将样本分成c个模糊类别。

设样本集,X={X1,X2,…,Xn}则特征向量样本,Xi=(Xi1,Xi2,…,Xim),xik为样本xi的第k个属性值。样本集X的c个模糊子类别为X1,X2,…XC,V=(V1,V2,…VC),Vj为类别Xj的聚类中心,隶属度矩阵U=(uij),xi对于Xj的隶属关系为uij。

(1-1)

(1-2)

Jm为目标函数,表示样本到类别中心的距离平方和,dik=ㄧㄧXi-Vkㄧㄧ即样本xi到第k个类别中心Vk之间的欧式距离,模糊加权指数m∈(1,∞),其用来控制隶属度矩阵U的模糊程度,根据大量实验可知,m值一般取[1.5,2.5]。利用拉格朗日乘数法,结合条件∑ck=1Uik=1,Uik∈[0,1],i=1,2,∧,n,k=1,2,..,c

可得:

Uik=[∑cj=1(dik/dij)2/(m-1)]-1 (1-3)

Vk=∑ni=1(Uik)mxi/∑ni=1(Uik)m (1-4)

设置终止条件 ,通过式(1.3)和式(1.4)迭代计算,使目标函数Jm趋向最小,达到收敛的目的。

2 属性处理及初始化聚类中心

鉴于网络数据属性值之间的度量单位存在较大差异,为了减少对聚类结果的影响,需要对数据的属性进行预处理[5]。若X={x1,x2,...,xn}为样本集,则容量为n,维数为m,Xif表示第i个样本第f个属性值。xi包含r个连续型属性C1,C2,…,Cr和s个离散型属性T1,T2,…,Ts

本文对于离散型属性值采用基于不同状态的实数编码方式。N(tik)、N(tjk)分别表示属性Tk在样本集X中取值为tik和tjk的数量,dt(i,j)即样本xi和xj之间的离散型属性距离。

dt(i,j)=∑sk=1(N(tik))/N(tik)N(tjk)*λ(tik,tjk) (1-5)

λ(tik,tjk)={0(tik=tjk;)1(tik≠tjk) (1-6)

式(1-7)中Xif即为标准化后的连续型属性值,设R1,R2,…,Rr分别是连续型属性C1,C2,…,Cr的取值范围。mf=1/n∑ni=1xif,sf=1/n∑ni=1(Xif-mf)。

xif=xif-mf/sf (1-7)

dc(i,j)=ω1(x`i1-x`j1)2+ω2(x`i2-x`j2)2+∧+ωr(x`ir-x`jr)2 (1-8)

ωf=Rf/∑rk=1Rk,对连续型属性距离值dc(i,j)进行归一化处理如下:

d`c(i,j)=dc(i,j)/max{dc(i,j)} (1-9)

最后,样本xi和xj的混合属性距离即为DH(i,j)。

DH(i,j)=r/(r+s)*d`c(i,j)+s/(r+s)*dt(i,j) (1-10)

本文初始化聚类中心的确定采取文献5的方法,预先不设定聚类数目C,而是通过启发式聚类来自动确定聚类数目,从而划分聚类类别。网络数据样本集第一个聚类中心的计算可以采用属性算术平均值和属性最高频率取值的方法[5]。

令第一个聚类中心V1的连续型属性向量A=(a1,a2,…,ak,…,ar),离散型属性向量B=(b1,b2,...,bk,…,bs)。ak为连续型属性Ck的算术平均值,bk为离散型属性Tk的最高频率值。

ak=1/n∑nj=1xjk, k=1,2,…,r (1-11)

v1=A+B=(a1,a2,∧,ar,b1,b2,∧,bs) (1-12)

3 IG-WFCM算法在入侵检测中的应用

本文针对模糊聚类算法的特点,提出了基于改进遗传算法的特征加权模糊聚类(IG-WFCM)算法,并通过在入侵检测系统进行测试,对训练数据集划分聚类,计算待测数据与聚类中心Vi的最小距离di,若di大于聚类宽度阈值,则为异常数据。

Step1.对输入的训练数据集初始化;将原始样本集划分成Cmax-1种不同的聚类,聚类数目为Ck,并找出对应的Ck个初始聚类中心;

Step2.对Ck个初始聚类中心进行染色体编码,形成初始种群。

Step3.针对种群中的个体进行FCM聚类运算,计算UCk和VCk,由此迭代,最后得出目标函数Jm;

Step4.对第t-1代种群进行选择操作,形成种群P'(t-1);对于种群P'(t-1)进行交叉操作,形成种群P''(t-1);对种群P''(t-1)的个体进行变异操作,形成第t代种群P(t)。

Step5.根据其聚类中心矩阵计算出群体中个体的隶属度矩阵,再计算对应的目标函数Jm,求出目标函数的平均值Jm=1/n∑nk=1Jm(k),若t=0,则t=t+1且返回Step3,如果t≥Gmax或者︱Jm(t)-Jm(t-1)︳<ε,则转下一步Step6,否则t=t+1,返回Step3继续迭代。

Step6.选取最优个体,并对其进行聚类的评价。

Step7.如果Ck

Step8.利用评价函数选取最优聚类数,输出训练数据集的最优聚类结果。

Step9.计算聚类的宽度阈值,对测试数据进行检测。

4 仿真实验

4.1 样本数据集的选取

本文实验选用的样本数据是KDD CUP 1999入侵数据集中的数据,它是目前入侵检测领域权威的测试数据[6]。数据集中的入侵类型可分为:R2L、DoS、U2R、Probing四类。本文训练数据集中的数据皆为正常数据,测试数据集通过随机无回放的方式采样得到。本文分别采用基于IG-WFCM算法与基于传统FCM算法的方法对表1中的5个测试数据集进行了仿真对比检测实验。

表1 测试数据集

4.2 实验结果

本文模糊加权系数m设置为2,FCM的目标函数收敛误差为10-5,遗传算法种群规模N=30,遗传迭代终止阈值为10-4,最大遗传代数Gmax=100,交叉概率Pc=0.8,变异概率Pm=0.01。图1为基于IG-WFCM算法和基于FCM算法的检测率(detection rate)和误警率(false Positive rate)的对比曲线图。

图1 算法检测率和误警率对比曲线

通过实验表明本文的IG-WFCM算法具有可行性,其平均检测率达到80.1%,平均误警率保持为1.605%左右,而FCM算法平均检测率为56.8%,平均误警率为2.32%。

5 结束语

本文提出了基于改进遗传算法的特征加权模糊聚类算法(IG-WFCM),通过仿真实验表明,基于IG-WFCM的入侵检测算法能够有效地降低误警率,提高检测率,对入侵检测系统性能的提高有一定的意义。

参考文献:

[1]戴文华.基于遗传算法的文本分类及聚类研究[M].北京:科学出版社,2008.

[2]周世兵,徐振源,唐旭清.新的K-均值算法最佳聚类数确定方法[J].计算机工程与应用,2010,46(16):27-31.

[3]Maulik U,Bandyopadhyay S.Genetic algorithm-based clustering techn-ique[J].Pattern Recognition.2000,33(9):1455-1465.

[4]黄敏明,林柏钢.基于遗传算法的模糊聚类入侵检测研究[J].通信学报,2009,30(11):140-145.

[5]周铁军,李新宇.基于加权特征的无监督模糊聚类入侵检测研究[J],湘潭大学自然科学学报,2011,33:01,98-102.

[6]胡昌振.网络入侵检测原理与技术[M].北京:北京理工大学出版社,2006.

作者简介:李新宇(1984-),男,湖南益阳人,湖南第一师范学院助教,硕士,主要从事网络与信息安全,数字图像处理研究。

模糊核聚类算法 第4篇

齿轮箱是风电机组传动链的关键设备,风电机组运行环境恶劣,导致齿轮箱故障频繁发生,不仅事后维修工作难度大,而且费用高。因此对风电机组齿轮箱进行有效的监测和故障诊断具有重要意义。

故障诊断的本质是对故障信息的模式识别与分类[1]。近年来,国内外的许多学者将模式识别方法引入到风电机组故障诊断中。目前,大量的研究多采用基于有监督学习的模式识别方法,例如BP神经网络、支持向量机、故障树分析法[2,3,4,5,6]。 这些方法是通过对大量已知故障类别的训练样本的学习,实现待识别样本的分类与诊断。但是这种方法只能识别训练样本中含有的故障类别,当有新类别的样本数据出现时,会给出错误的识别结果,导致错误诊断。实际故障诊断中,获取所有已知故障的大样本数据需要花费大量的人力和时间,难以获取完备的故障样本,这使得基于有监督学习的模式识别方法难以得到有效的应用。

模糊核聚类 (kernel fuzzy c-means clustering,KFCM)是一种基 于无监督 学习的聚 类算法,它利用核函数将原始输入空间中的样本数据映射到高维特征空间中再进行模糊聚类,能有效改善复杂数据集的聚类性能[7],在气动系统、汽轮机、变压器、卫星控制系统[8,9,10,11]等故障诊断领域得到了应用。但是在实际工程应用中,KFCM的分类效果依赖初始聚类中心和核函数参数的选择。 本文针对上述问题,结合KFCM算法和引力搜索算法 (gravitational search algorithm,GSA)[12], 提出一种基于模糊核聚类和引力搜索的风电机组齿轮箱故障诊断方法,实现风电齿轮箱已知和未知类别故障的自动诊断。

1模糊核聚类算法

模糊核聚类算法利用核函数,通过非线性映射将原始特征空间X映射至高维特征空间F后再进行聚类。非线性映射 Ф 可表示为

式中,xk为原始特征空间样本,xk∈ X。

KFCM算法的聚类目标函数为

式中,vi为原始特征空间中 第i类的聚类 中心,i= 1,2, …,c;c为类别数;n为原始特征空间样本数量;μik为第k个样本xk对第i类的隶属 度,μik∈[0,1];m为加权指数。

如果直接将样本映射到高维空间后再进行聚类,则存在确定非线性映射函数的形式和参数、特征空间维数等问题,但采用核函数可以有效地解决该问题。 定义核函数K(x,y)=ΦT(x)Φ(y), 这样式(2)中高维空间的欧氏距离可表示为

常见的核函数有高斯核函数、多项式核函数、 Sigmoid核函数等,本文选用高斯核函数:

式中,σ 为高斯核参数。

根据约束条件,结合式(3)、式(4),运用拉格朗日乘子法求式(2)的极小值,可求得隶属度和聚类中心:

最后根据样本xk对每个类的隶属度μik来确定所属类别,如果有,则判定xk属于第i* 类。

2引力搜索算法

假设在一个d维搜索空间中有N个粒子,定义第l个粒子位置Ql=(ql1,ql2,…,qld),l=1,2, …,N。

根据牛顿引力定理,在第t次迭代中,第r维上第l个粒子受到第j个粒子的引力为

式中,ε为一个非常小的常量;MPl(t)为第l个粒子的被动引力质量;MAj(t)为第j个粒子的主动引力质量;G(t)为引力常数;G0=100,α =20;T为最大迭代次数。

所以在第t次迭代,第l个粒子受到来自其他粒子引力合力为

式中,ωj为区间[0,1]内的一个随机数。

根据牛顿第二定理,粒子Ql在第t次迭代时产生的加速度为

式中,MIl(t)为粒子Ql的惯性质量。

在第t次迭代中,定义粒子Ql的质量为Ml(t),假设引力 质量与惯 性质量相 等,则有MAl(t)=MPl(t)=MIl(t)=Ml(t)。定义

式中,fl(t)为在第t次迭代时的适应度值。

在每一次迭代过程中,粒子Ql根据计算得到的加速度来更新粒子的速度和位置,更新公式为

式中,vlr、alr分别为粒 子Ql的速度和 加速度;τl为区间 [0,1]内的一个随机数。

3基于KFCM和GSA故障诊断方法的实现

3.1GSA求解KFCM聚类模型

本文首先利用KFCM法对已知类别的训练样本进行分类。 定义一个含有c类、样本特征维数为d的训练样本X,以训练样本的分类错误率评价聚类有效性,并以此为聚类目标建立聚类模型,根据文献[13],训练样本的分类错误率为

式中,Ci为数据集X经过KFCM聚类运算后分在第i类的样本集;Ui、|Ui|分别为数据集X中第i类的样本集和所含样本数量;|Ci∩Ui|为Ci和Ui的交集所含元素数量。

利用GSA求解聚类模型,以初始聚类中心和核函数参数为优化变量,定义初始聚类中心Zi= (zi1,zi2,…,zid),i=1,2,…,c,高斯核参 数σ。GSA搜索算法粒子的编码为

以式(17)为目标函数,以聚类中心和高斯核参数为优化变量,搜索W的极小值,则定义适应度函数f=W 。GSA求解KFCM聚类模型流程如图1所示。

3.2故障诊断流程

基于KFCM和GSA的故障诊断步骤如下:

(1)将已知c类故障的历史数据作为训练样本集X;

(2)利用KFCM对训练样本集进行分类,利用GSA求解KFCM聚类模型,获得最优分类结果的第i类的类心oi;

(3)对于待诊断的新样本xnew,首先根据式 (19)计算新样本xnew与类心oi之间的核空间样本相似度[11]:

式中,d(xnew,oi)为xnew与类心oi在核空间上的欧氏距离;davg为第i类中所有样本与类心oi在核空间上的平均欧式距离;|Ci|为分在第i类的样本数量。

然后引入阈值常数λ 并与ρi比较来判断新样本xnew是否属于已知类别故障。文献[13]中,阈值常数λ的取值范围为0~0.5。若阈值常数λ和ρi满足,则判定xnew属于已知故障,否则属于未知故障。

4实例分析

4.1风电机组齿轮箱测试描述

以某风电场1.5 MW双馈风力发电机组为研究对象,风轮工作转速范围为11~21r/min,齿轮箱采用一级行星轮与两级平行轴结合的传动方案,如图3所示。所选的风电机组齿轮箱在运行过程中曾出现中速级小齿轮裂纹故障(记为F1)、 高速级小齿轮点蚀故障(记为F2)和高速输出轴轴承内圈故障(记为F3)。在齿轮箱高速轴轴承座位置安装了压电加速度传感器,采集了风轮工作转速下的正常运行状态(记为N)和3种故障状态的加速度信号,信号采样频率为8192Hz,图4为4种状态下的部分原始时域波形图。

4.2特征值提取

考虑风电齿轮箱振动信号具有非平稳性,本文选用相对小波包能量作为风电机组齿轮箱振动信号特征值。小波包变换能够对非平稳信号进行有效的分析,相对小波包能量能够反应信号在不同频带内的能量分布,文献[14]给出了相对小波包能量能特征值提取方法,定义如下。

离散时间信号x(t)经过J层小波包变换后,可以得到2J个频率段的小波包系数CL(k),L= 0,1,…,2J-1,某一频段上的小波包能量定义为该频率段的小波系数的平方和:

因此,所有频段的总能量为

相对小波包能量为

为了验证本文提出的方法能够对已知故障进行识别,本文将N、F1和F2作为已知故障,分别编号为1、2、3,并分别从3种状态信号中选取30组样本作为训练样本,总共获得90组训练样本, 同时每个状态选取3组样本作为测试样本。为了验证提出的方法能够对未知故障进行判断,将状态F3作为未知故障,并从对应的振动信号中提取3组样本作为测试样本。每个样本采样点数为2048。对每个训练样本和测试样本进行3层小波包变换,根据式(21)~式(23)计算每个频段上的相对小波包能量,并将其作为每个样本信号的特征值,部分训练样本和测试样本数据如表1和表2所示。利用KFCM对训练样本进行分类,运用GSA求解最优分类结果,获得最优分类结果对应的各个类的聚类中心,最终按照图2所示的故障诊断流程对测试样本进行故障分类。

4.3KFCM和GSA参数设置

KFCM和GSA的参数设 置如下 :类别数量c=3,特征维数d=8,加权指数m =2,群体粒子个数N=50,最大迭代次数T=100,第k个粒子的初始速度vk=0,k=1,2,…,50。运用GSA求解KFCM聚类模型后,得到最优分类结果以及最优分类结果对应的每个类别的聚类中心和核函数参数σ,如表3所示。

4.4诊断结果与分析

根据图2所示的诊断流程,对表2中的测试样本进行分类诊断。根据文献[13]给出的λ取值范围,本文选取阈值常数λ=0.2,诊断结果如表4所示。从表4可以看出,前9个样本中,每个样本到各个聚类中心的核空间样本相似度的最大值均大于λ,这表明样本1~9属于已知类别的故障。进一步观察样本1~9与各个聚类中心的核空间欧氏距离可以看出,样本1~3与第1类聚类中心之间的核空间欧氏距离最小,所以样本1~3分为第1类; 样本4~6与第2类聚类中心之间的核空间欧氏距离最小,所以样本4~6分为第2类;样本7~9与第3类聚类中心之间的核空间欧氏距离最小,所以样本7~9分在为第3类。样本10~12每个样本到各个聚类中心的核空间样本相似度的最大值均小于λ,表明这3个样本类别不属于训练样本中的已知故障类别,属于未知故障,因此将样本10~12编号为“4”,诊断结果与实际情况相符。

最后,本文分别采用BP神经网络和KFCM方法进行故障诊断,诊断结果如表5所示。从表5可以看出,基于有监督学习的BP神经网络可以对已知类别的测试样本1~9给出正确的分类结果,但是对未知类别的测试样本10~12进行分类时,BP神经网络将测试样本分类在已知的故障类别中,与实际结果不符。这是因为BP神经网络只记忆了训练样本中的类别,因此给出了错误的诊断结果。而本文提出的方法将未知类别样本分在第4类,即不属于原有训练样本中的已知故障类别。直接利用KFCM算法由于受到初始聚类中心和核函数参数选取的影响,在对已知类别和未知类别的测试样本分类时均出现了错误分类。 与表4的诊断结果进行对比,可以看出本文提出的故障诊断方法更加准确。

5结语

本文提出了一种基于模糊核聚类和引力搜索的风电齿轮箱故障诊断方法,结合实际风电齿轮箱故障样本数据对提出的方法进行了验证,并与传统BP神经网络和KFCM分类方法进行了比较。结果表明,本文提出的方法不仅能够准确地识别诊断出已知类别的故障样本,而且能有效地识别判断出未知类别的故障样本,为风电机组齿轮箱状态监测与故障诊断提供了一种新的思路。

摘要:为了诊断风电齿轮箱已知类别和未知类别的故障,提出了基于模糊核聚类和引力搜索的故障诊断方法。首先建立以训练样本分类错误率为目标的聚类模型,利用模糊核聚类对训练样本进行分类;然后利用引力搜索算法求解聚类模型,获得最优分类结果下每个类的类心;最后根据新样本与各类心之间的核空间样本相似度判断属于已知故障或者未知故障。结果表明,该方法准确度高,可有效用于风电齿轮箱故障诊断。

相关文章
2024中考体育考试安全预案

2024中考体育考试安全预案

2024中考体育考试安全预案(精选13篇)2024中考体育考试安全预案 第1篇清涧分部2014年初中毕业学业理科实验操作、体育考试安全工作预案为...

1
2025-09-19
2024国培总结

2024国培总结

2024国培总结(精选9篇)2024国培总结 第1篇2017教师国培学习总结当今社会,教事业迅猛发展,各类培训数不胜数,而“国培”对于我们教育发...

1
2025-09-19
2024年单位与单位的新年联欢会主持稿及串词

2024年单位与单位的新年联欢会主持稿及串词

2024年单位与单位的新年联欢会主持稿及串词(精选5篇)2024年单位与单位的新年联欢会主持稿及串词 第1篇2018年单位与单位的新年联欢会主持...

1
2025-09-19
2024年上海市崇明县中考一模语文试题及答案

2024年上海市崇明县中考一模语文试题及答案

2024年上海市崇明县中考一模语文试题及答案(精选6篇)2024年上海市崇明县中考一模语文试题及答案 第1篇2017年崇明区初三一模语文试题(一...

1
2025-09-19
2010—2011学年度第一学期六年级语文教学计划

2010—2011学年度第一学期六年级语文教学计划

2010—2011学年度第一学期六年级语文教学计划(精选13篇)2010—2011学年度第一学期六年级语文教学计划 第1篇2010—2011学年下学期六年级...

1
2025-09-19
2011《农业农村工作知识》高频考点

2011《农业农村工作知识》高频考点

2011《农业农村工作知识》高频考点(精选12篇)2011《农业农村工作知识》高频考点 第1篇2011公考备考:《农业农村工作知识》高频考点2011-0...

1
2025-09-19
以案促改主持词

以案促改主持词

以案促改主持词(精选4篇)以案促改主持词 第1篇主持词同志们:根据市委要求,今天我们在这里召开“××局开展案件剖析做好以案促改工作动...

1
2025-09-19
2024致自己的励志说说

2024致自己的励志说说

2024致自己的励志说说(精选5篇)2024致自己的励志说说 第1篇人生,说到底,活的是心情。人活得累,是因为能左右你心情的东西太多。以下是...

1
2025-09-19
付费阅读
确认删除?
回到顶部