正文内容
昆虫图像分割范文
来源:文库
作者:开心麻花
2025-09-19
1

昆虫图像分割范文(精选8篇)

昆虫图像分割 第1篇

随着计算机技术尤其是多媒体技术和数字图像处理及分析理论的成熟,图像作为更直接更丰富的信息载体,正在成为越来越重要的研究对象。昆虫是生物类群中物种最丰富、数量最多的一类,尤其是一些农林害虫对农林业生产形成了很大威胁,因此,昆虫成为与人类密切相关的生物类群之一。研究昆虫图像的处理和分析对昆虫形态学、昆虫生态学以及昆虫测报所需的田间抽样调查都具有十分重要的意义。昆虫图像的处理和分析要解决的第一个问题就是数字图像的边缘检测和图像分割。因为数字图像通常是包含多个物体的结果,对昆虫图像的处理和识别来说,目标在于图像中的昆虫部分,即以昆虫部分作为前景,而将寄主植物作为背景。为了识别和分析目标,需要将这些有关区域分离出来,在此基础上才能对目标进一步地利用。这个过程即所谓的图像分割[1]。

灰度和二值化[2]、平均值分割算法[3]、迭代阈值分割算法[4]和中值滤波[5,6]等是早期科研人员采用的昆虫识别方法。近年来,国内外学者研究了基于机器视觉的昆虫识别方法,主要包括数学形态学方法[7,8]、二叉树方法[9]、人工神经网络方法[10,11]和变分水平集方法[12]等。其中,C-V模型是变分水平集的经典模型,也是目前应用广泛的图像分割模型,在医学图像分割中取得了良好的应用效果,但该模型应用于昆虫图像分割效果不太理想。为此本文提出一种基于RGB三色板的多元线性回归的昆虫图像分割方法,该方法能够有效地将目标与背景分割开来,达到理想的分割效果。

1线性回归算法概述

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一,它在生物、医学、工业、农业、经济以及物理和自然等领域运用十分广泛。 根据自变量的个数,可以把线性回归分为一元线性回归和多元线性回归。

一元线性回归是描述两个变量之间相互联系的最简单的回归模型,它只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示。一元线性回归的数学模型是:

Y=β0+β1X+ε (1)

式(1)中因变量Y由两个部分描述:一部分是由于X的变化引起Y线性变化的部分,即β0+β1X,其中β0和β1是未知参数,称为回归系数;另一部分表示其他随机因素的影响,记为ε

线性回归算法最初应用于图像处理中时通常选用灰度图像或彩色图像三色板中的一个色板的像素信息建立回归模型。然而,三色板像素信息更有利于表达图像的完整信息,这时采用一元线性回归就有较大的局限性,因此需要借助多元线性回归模型。

多元线性回归研究一个因变量和多个自变量之间数量上相互依存的线性关系。多元线性回归方程的模型是:

与一元线性回归相似,β0是常数项,β1,β2,,βm称为偏回归系数。βi(i=1,2,,m)表示在其他自变量保持不变的条件下,自变量Xi改变一个单位时因变量的平均改变量。ε为随机误差,又称残差,它表示Y的变化中不能由自变量解释的部分。

多元线性回归在实际应用中具有更重要的意义,本文提出的昆虫图像分割方法就是采用多元线性回归的数学模型,结合彩色图像三色板像素信息对图像进行分割,取得了良好的效果。

2基于RGB三色板的多元线性回归算法

2.1RGB三色板多元线性回归的数学模型

根据式(2)的多元线性回归的数学模型,结合彩色图像中的RGB三色板信息,建立彩色图像的RGB三色板多元线性回归模型如下:

其中,RGB分别表示彩色图像的红色板、绿色板和蓝色板像素信息。图像的RGB三色板信息及其线性拟合示意图如图1所示。

图1中星点表示实际RGB三色板像素值,非星点表示线性回归拟合后RGB三色板像素值。从图中可以看出,(a)中像素分布零散;(b)中则拟合效果良好。三色板像素的拟合效果与回归模型中参数β的设定有关。

2.2RGB三色板线性回归模型的参数设定

图像的像素信息通常采用二维坐标表示,即假设I(i , j)表示图像I的第(i , j)个像素,R(i , j)、G(i , j)、B(i , j)分别代表像素I(i , j)的红、绿、蓝三个分量。将这些像素信息代入式(3)中,RGB三色板的多元线性回归模型转换为:

为了计算方便,图像处理中通常将二维向量转换成一维向量, 即使用变换:

R(i,j)R(m(j-1)+i) i=1,,m j=1,,n

则式(4)再次转换为如下形式:

R(j)=β0+β1G(j)+β2B(j) (5)

其中R(j)、G(j)、B(j)分别代表红色板、绿色板和蓝色板像素的一维信息,与式(2)多元线性回归模型中的XY变量相对应,则式(5)的变量形式为:

X=[1G(1)B(1)1G(2)B(2)1G(mn)B(mn)]Y=[R(1)R(2)R(mn)]Τ

系数矩阵为:

β=[β0β1β2]Τ

根据矩阵理论相关知识可得线性回归参数的求解公式为:

β=(XTX)-1XTY (6)

由于图像的三色板信息已知,因此可根据所选取区域的RGB信息确定β参数,建立整幅图像的线性回归模型,从而将具有同样背景信息的图像分割出来,得到昆虫的目标图像。

以婪步甲成虫图像为例,说明通过选取背景区域确定线性回归参数的过程。

从经过预处理的婪步甲成虫图像的背景样本中任意采集一块5050的像素块,如图2所示,其中(a)为原图,(b)为从背景中选取的像素块样本。

根据选取的像素块,利用式(6)计算机回归模型的参数如下:

β=inv(XX-1e-10eye(u,v))XY (7)

其中β为所求的线性回归参数,

β=[β0β1β2]

;inv()是矩阵求逆函数;X是由1和所取像素块的GB值构成的矩阵;X′是X的转置矩阵;eye(u,v)是uv列矩阵,且主对角线为1,其它元素为0;Y是所取像素块的R值。

根据所选取像素块的像素信息计算出β参数值,将其应用于式(5),再实现对整个图像的分割,利用式(5)的分割结果如图3(a)所示。

实际应用中,像素块的选取依据具体图像的背景信息而定,背景颜色越单纯所需像素块数越少,反之则需要设置多个像素块,以包含更全面的图像信息。样本信息越多越有利于图像目标区域的分割,但同时也加大了工作量,对复杂背景图像选择合适数量的像素块不是容易的事,对此我们引入范数对式(4)的模型进行优化。

2.3RGB三色板线性回归模型的范数优化

式(4)的回归模型是取图像像素的RGB三色板信息建立线性关系,由于像素信息的取值范围较大,有可能导致回归模型的线性拟合发生较大偏差,对三色板信息进行取范数规范化处理可以解决这个问题。

R(i , j)、G(i , j)、B(i , j)的规范化形式如下:

则式(5)的多元回归模型转换为:

利用式(11)分割婪步甲成虫图像的效果如图3(b) 所示。

对比图3(b)和(a)可知,进行范数优化后的算法可以去掉多余的阴影,更好地实现目标提取。

3算法的实现

3.1算法实现步骤

综合以上分析,基于RGB三色板多元线性回归算法的图像分割具体步骤如下:

Step1 图像预处理 首先将昆虫图片进行统一的亮度处理,使图片不至于过亮或者过暗。

Step2 背景样本块选择 从图像的背景信息中选择有代表性的区域作为样本块,以求取回归参数。由于不同图像的背景信息不同,单纯一色的背景也可能由于色度深浅不均带来误差,因而提取1块像素块作为回归模型样本具有较大的局限性。实验证明,在昆虫图像分割中,选择4-7块如图2(b)所示的样本块效果较好。

Step3 建立回归模型 根据样本块信息按照式(6)计算回归参数,建立式(5)的图像RGB多元线性回归模型。

Step4 求取RGB像素范数 根据式(8)-式(10),计算三色板像素的范数,构建优化模型,见式(11)。

Step5 昆虫图像提取 利用优化模型,实现昆虫图像分割。

3.2算法程序设计

根据该算法的实现步骤,软件编程实现基于RGB三色板多元线性回归算法的图像分割的核心代码如下。

4实验效果分析

算法在Windows XP系统下,利用Matlab实现。Matlab是以复杂矩阵作为基本编程单元的一种程序设计语言,它提供了各种矩阵的运算与操作,并有较强的绘图功能。为了验证算法的有效性,选取3张经过预处理的昆虫图片,图片来源于课题组的科研数据库。这3张图片的大小分别为9.81MB、841KB、294KB,且它们的水平分辨率和垂直分辨率均为96dpi。分别采用本文提出的RGB多元线性回归算法和C-V模型算法对所选图片进行分割,效果如图4-图6所示。

图4显示两种算法的分割效果差不多,本文提出的算法计算速度比C-V模型更快;图5和图6显示本文算法分割效果优于C-V模型的分割,C-V模型分割的边界处理效果不是太好,本文算法在分割这两幅图像中分别选择了4块色板和7块色板做样板,取得了较好的分割效果。

表1为本文方法和C-V方法就分割结果的迭代次数和分割时间进行比较。从表中可以看出本文方法无论从速度方面还是迭代次数方面都具有一定的优越性。

5结语

本文介绍了基于RGB三色板的多元线性回归算法及其在昆虫图像分割中的应用,讨论了RGB三色板多元线性回归模型的参数设定方法,并利用范数对像素信息进行规范化处理,

优化了单纯依靠RGB色板信息的多元线性回归模型。实验和实例对比证明,本文提出的算法能较好地实现昆虫图像分割。

在实际的农林虫害防治中,运用本文算法能够很好地识别害虫,将其中的目标区域(害虫)分离出来,从而实现仅对害虫进行药剂喷洒,防止了由于化学药剂的大面积使用而造成的环境污染问题。

本文算法的不足是目前本算法更适合于背景颜色较少、背景色彩分布较均匀的昆虫图片,下一步将针对各种复杂背景图片进一步优化和完善算法,以扩大算法的应用范围。

参考文献

[1]于新文,沈佐锐.昆虫数字图像的分割技术研究[J].农业工程学报,2001,17(3):137-141.

[2]潘梅森,荣秋生.基于SOFM神经网络的图像融合的二值化方法[J].光学精密工程,2007,15(3):99-104.

[3]于新文,沈佐锐.几种图像分割算法在棉铃虫图像中的应用[J].中国农业大学学报,2001,6(5):69-75.

[4]付峰,应义斌.生物图像阈值分割方法的研究[J].浙江大学学报,2003,29(1):108-112.

[5]祁广利.农业机器视觉技术及其应用[J].陕西农业科学,2004(5):121-128.

[6]王建卫.彩色图像的中值滤波算法的改进与应用[J].哈尔滨商业大学大学报:自然科学版,2006,22(4):67-69.

[7]马骏,王建华.一种基于数学形态学的植物病虫识别方法[J].深圳大学学报:理工版,2004,21(1):72-75.

[8]黄小燕,郭勇,赵太飞.数学形态学的储粮害虫彩色数字图像分割[J].计算机测量与控制,2003,11(6):467-469.

[9]林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报,2005,10(1):1-11.

[10]邱道尹,张红涛.基于机器视觉的储粮害虫智能检测系统软件设计[J].农业机械学报,2003,34(2):83-85.

[11]赵汗青,沈佐锐,于新文.数学形态特征应用于昆虫自动鉴别的研究[J].中国农业大学学报,2002,7(3):38-42.

遥感图像分形特征提取与分割 第2篇

(中国科学院遥感应用研究所,北京100101)

摘要:分形理论由B.B.Mandelbrot于20世纪70年代中期创立,现已被广泛地应用于自然科学和社会科学的几乎所有领域。本文在前人研究的基础上,利用双毯法(DoubleBlanketMethod)提取出图像的分形特征并用于图像分割,进一步证实了分形在此领域的可行性和有效性。首先,通过比较局部分形维数偏移全局分形维数的标准差来确定适合该方法的最优滑动窗口。其次,考虑到单尺度分维特征的局限性,提取出多尺度的特征值并建立分形维数谱。然后,以模拟图像为例,分析图像中各区域的分维谱,选择适当尺度的分形特征,利用最大似然法对图像进行分割。最后,将分形理论应用于遥感图像中,与传统的基于灰度值特征的图像分割方法相比,加入图像的空间分形纹理特征后分割精度明显提高。研究结果表明:分维值的大小和变化趋势可以表示不同地物的空间复杂度,结合地物的光谱以及灰度信息能有效地识别目标地物。

关键词:遥感;多尺度分形;双毯法;图像分割

中图分类号:TP751 文献标识码:A 文章编号:1000-317795-0009-07

1 引 言

自B.B.Mandelbrot创立分形以来,分形理论被广泛的应用于山脉、河流、云等地表真实景观的模拟。Pentland观察到自然过程产生了分形曲面,通过对曲面数据的分析可以得出其分形特征。他提出用分形维数去描述自然表面的粗糙度[1]。自然表面的分形性决定了图像的分形性,Peleg等人提出双毯法,根据图像的灰度曲面面积,计算不同尺度下的分形维数,应用于图像中目标与背景的识别[2~3]。近年来,分形理论被引入到遥感领域,主要应用在遥感影像的特征信息提取[4]、信息融合、辅助遥感图像分类和以及模拟遥感图像等方面。孙家柄利用分形与小波方法进行航片与TM的特征融合,提高了影像的信息量和清晰度[6];舒宁则采用分形方法进行单波段影像的分维估计与多波段影像纹理分析[7],这些研究均促进了分形理论与遥感科学的交叉发展。

基于双毯法进行遥感图像分形特征的提取,目的在于通过对提取特征的分析识别不同的地物类型,同时将图像的空间结构分形纹理特征加入到图像分割,结合图像的光谱以及灰度信息,提高图像分

收稿日期:-06-13

基金项目:国家自然科学基金项目(40371085)

[5]

割的精度。分形理论应用于遥感图像,为遥感信息科学提供了崭新的理论指导和技术方法,随着研究的不断深入一定会涌现出更多的新成果,从而有力地推动遥感信息科学的进程。

2 分形与分形维数

Mandebrot指出分形具有三要素:形状、机遇和维数[8]。分形的形状是指事物支离破碎、参差不齐等不规则性特征。机遇用来描述对象的差异性;维数则是用分数的形式来定量描述客观事物的 非规则 程度。分形具有自相似性和自仿射性,并且在某种意义下分形维数严格地大于其拓扑维数[9]。常见的维数有相似维、Hausdorff维、盒维数、信息维数、关联维数等。本文根据图像数据的特点应用双毯法计算图像的分维值。

Peleg在分形布朗随机模型的基础上,基于图像表面的灰度信息创立了 双毯法 。该方法将图像视为一座山丘,高度为图像的灰度值,在距该表面为r的两侧形成厚度为2r的毯子。对于不同的r,毯子的面积可以重复如下计算[2]:

设f(i,j)代表灰度值函数,ur,br分别代表上表面和下表面。先令

作者简介:郑桂香(1983~),女,湖南宁乡人,中科院遥感所在读硕士研究生,主要从事资源环境遥感研究。E mail:zhenggui913@163.com

9

遥感信息

理论研究 2008.1

该方法对模拟图像进行实验。参照T.Parrinello生成的模拟图像[12],本实验中的第一个图像由一个随机函数和一个确定的函数生成,第二个图像则由两个不同的随机函数产生。

模拟图像见(图1(a))的大小为256#256像元,由两个同心矩形组成,像素值范围0~255。外部环形区域是在matlab软件中根据randn函数生成的服从(0,1)分布的图像,内部矩形区域则根据如下函数式产生:Iinner(x,y)=100cos(0.03x

3)

+127。模拟图像(b)的不同之处在于其内部区域由满足均值方差为(2,10)的随机正态分布函数生

成。

u0(i,j)=b0(i,j)=f(i,j)

则上下两张 毯子 分别沿如下的方法生长:

(1)

ur(i,j)=max{ur(i,j)+1,

d(i,j,m,n) 1

maxur(m,n)},r=1,2,3!

(2)

br(i,j)=max{br1(i,j)+1,

d(i,j,m,n) 1

maxbr1(m,n)},r=1,2,3!

(3)

其中,d(i,j,m,n)代表(i,j)与(m,n)之间的距离。因此, 毯子 的表面积为:

(4)

2r

2 由于分形表面积符合关系式A(r)?k*r,等式两边同时取对数,则

logA(r)=C1logr+C0(5)

式中,C1为拟合直线的斜率。由此可以得到分形维数D=2C1。

k+w

A(r)=

i,j

(ur(i,j)br(i,j))

A(k,l,r)=

i=kj=lw

l+w

(ur(i,j,r)

2r

br(i,j,r))

(6)

(a)模拟图像1(b)模拟图像2

图1

图像的局部分形维数(LFD)[3],即图像中每个像元的分形维数值是以像元(k,j)为中心,选择大小为(2w+1)#(2w+1)的滑动窗口,由公式(5)、(6)导出,并且将图像中的均一区域作为一个计算窗口可以得到图像的全局分形维数(GFD)。

理论上分形具有尺度不变性,在所有的尺度上均满足自相似性,但实际的图像仅在一个小尺度范围内

2D

呈分形特征,因为A(r)?k*r只是一个近似公式,logr与logA(r)并不是严格的线性关系,因而随尺度的变化,分维值也会发生变化,但最终趋于恒定。

为了更好的进行图像分割,这里引入多尺度分[3,10]

形特征,即一定范围内分维值随尺度变化的特征。此概念的理解可以参照遥感图像的多光谱或者高光谱特征,由于目标地物对太阳辐射的反射、散射能力随波长的变化,因此在不同波段有不同的地面

[11]

反射率。同于多光谱或者高光谱,我们可以根据不同尺度对应的分维值建立分形维数谱,客观定量地表示分维值随尺度的变化及其规律。

3 模拟实验

为了验证分形方法对图像分割的可行性,先用3.1 单尺度分形特征

理论上而言:由于随机图像的不规则性导致分形维数必定比规则性图像大,图1(a)中外部区域的分形维数大于内部区域趋近于3,内部区域由规则函数生成,分形维数在2附近波动。图1(b)中内外区域的图像纹理都比较复杂,分形维数均趋近于3。针对此理论,该实验提取出图像的单尺度特征对其进行验证。

为选择适合本图像分形维数计算的滑动窗[13]

口,从图像中随机截取20个大小为32#32像元的区域。以尺度r=10为例,分别计算出3#3,5#5,7#7,9#9窗口的局部分形维数(LFD)和整个图像的全局分形维数(GFD),如图2所示。用SE表示LFD偏离GFD的标准差,四个窗口所得的SE分别为:0.039381,0.025816,0.020892,0.021352。窗口越大LFD与GFD越接近,局部分形维数越能反映整个图像的分形特征。但考虑到时间复杂度和图像的局部细节以及边缘效应,本研究中采用的滑动窗口大小为5#5,此时LFD与GFD偏移不大并且能较好的保留图像的局部特征。

利用5#5的滑动窗口,在尺度r=10的情况下得到整个图像的LFD。模拟图像1由于外部区域

2008.1

理论研究 遥感信息

图2 尺度r=10,LFD与GFD的线性拟合图

和内部区域生成机理的不同,分形特征存在很大差异。图3(a)是该图的分形维数频率分布直方图,直方图中明显的存在两个不同的区段。分形值域(2,2.35),基本上反映的是内部区域的分形特征,而值域(2.8,3.0)反映的是外部区域图像的分形特征。确定性函数产生的图像复杂度小,灰度曲面的变化

小,而随机函数生成图像纹理复杂,分维值相对于前者较大。图3(b),模拟图像2的分形维数频率分布直方图所示:整个直方图成高斯分布,只有一个峰值,并且分维值的取值范围在(2.8,3)之间,内外区域的分形复杂度差异不大,因此实验所得分维值与理论估计值基本相似。

(a)模拟图像1(b)模拟图像2

图3 分形维数频率分布直方图

为了更好的研究不同区域地边缘特征,在图像y=140处,提取出分形图像的水平剖面,如图4(1)所示。第一部分和第三部分表示图像的外部区域,分维值域为(2.8,3),第二部分表示图像的内部区域,分维值域为(2,2.35)。并且在(50,140),(200,140)附近分形维数波动最大,由最高值跳到最低值,

反映图像的边缘变化。根据上述分析,对模拟图像1而言,单一尺度的分形特征反映了图像中不同区域的特点,可以利用此特征进行图像的分割。复杂的纹理图像,如模拟图像2,由图3(b)、4(b)所示,单一尺度的分形特征无法区分不同的区域。

(a)模拟图像1(b)模拟图像2

图4 分形图像水平剖面(y=140处):

遥感信息

理论研究 2008.1

数值要稍大。可以解释为:相对于外部区域而言,内部区域服从均值方差为(2,10)的高斯正态分布,相比于(0,1)分布图像要更加复杂,影像的纹理更加不规则。%内部区域在尺度11附近即达到峰值而外部区域在尺度18附近才达到峰值。并且图5(1)中左侧曲线相对于图5(2)来说都要更加陡一些。根据实验数据,内部区域在r=3,10,100处的分维值要高于外部区域,便于进行目标的识别,因而选择提取了这三个尺度分维特征,生成模拟图像2的局部

分形维数图。

3.2 多尺度分形特征

由于单一尺度分形特征的局限性,因此提取出图像各尺度的分形特征进行分析。在模拟图像2内部和外部区域分别选择10个样本点进行1~100尺度的分形维数的计算,有代表性的分形维数谱如图5所示:(1)表示内部区域的分形维数谱;(2)表示外部区域的分形维数谱。因为构成机理均为服从高斯分布的函数,其谱曲线形状相似,并且在尺度100左右分维值趋于恒定。其不同点在于:?内部区域的谱曲线要稍微高于外部区域的谱曲线,也即分形维

(a)内部区域(b)外部区域

图5 模拟图像2分形维数谱

3.3 模拟图像分割

传统的图像分割是根据图像的灰度或者彩色特征,将图像空间分为不同的区域。但在实际景观中,地物具有一定的空间结构特征,利用空间特征纹理的差异可以比较容易的区分不同的类型,而单纯的亮度信息则不一定能很好地区分。

结合分形维数对传统方法进行改进,对于较复杂图像综合了分维的多尺度特征,利用最大似然法对图像进行分割。图6(a)仅利用传统灰度方法对模拟图像1进行的图像分割,分割效果不太理想。图6(b)综合了尺度为10的分形特征对其进行分割,样本分割精度达到了99.0404%,其Kappa系数为0.9807

[11]

针对模拟图像2,无论是传统分割方法还是结合了单一分形维数的分割方法结果均不理想。基于灰度特征值的分割精度仅61.0956%,Kappa系数为0.2156,但加入了单尺度分维特征后,分割精度有所提高,表1所示。当三个尺度分维特征均参与图像分割时,样本数据的分割精度达到了98.0008%;多尺度分形特征考虑了图像的空间结构信息,其优化组合提高了图像分割的精度。

表1 模拟图像2各尺度分维分割精度比较Scale: 3101003,1010,1003,1003,10,100

OverallAccuracy76.9292%76.4494%76.8892%78.8085%96.%88.2047%98.0008%

KappaCoefficient

0.54260.53420.54300.58340.92340.76490.9597

此外,本实验也尝试了利用与遥感植被指数的计算方法相似的思想得到分维指数,先求得在尺度r=10以及尺度r=100下原图像的分维图,然后利

(a)基于灰度值的图像分割

(b)综合分形特征的图像分割

用公式(r10r100)/(r10+r100)得到指数图像,并结合尺度r=100下的图像进行图像分割,理论上分割效果比r=10,r=100的简单结合要好,但是此实

图6 模拟图像1分割效果图

2008.1

理论研究 遥感信息

验中分割精度仅为93.7625%,Kappa系数为0.8745,这样的结果与图像本身的特点以及尺度选择有关。最优分维指数的探讨是今后分形图像研究中的一个重要话题。

VFDI=FDband3,r=30FDband2,r=100(2)

此外,盐田的分形维数在第3波段的整体下降

与对该波段处的强吸收造成的DN值较小有关。

(3)分形维数在一定的范围内波动但随尺度变化趋于恒定。由于ASTER1、2、3波段图像的空间分辨率为15m,混合像元的存在必将造成像元内成分的不均一,以致分形维数在一定的范围内波动,但是由于维数是用来定量的反映目标物体的不规则性,图8中各曲线最终趋于平缓。

(4)分形维数随尺度的变化可以用来描述目标或者区分潜在的目标,当一些尺度同一类内具有相

(a)尺度10 (b)尺度3,10,100

似信息而不同类间具有很大差别时,这些尺度可以用于目标的识别和特征提取。波段1中,尺度30~50的分维值,波段2中尺度35~70的分维值以及波段3中,尺度45~85的分维值均可以用来作为特征提取因子识别目标地物。

图7 模拟图像2分割效果图

4 遥感图像分割实验与分析

研究中选用的数据源为天津南部地区海河入海处8月21日的ASTER的1、2、3波段数据,选取了大小为512#512的.区域作为实验区。该区域的土地利用类型比较有代表性,包括水域、植被、城镇用地、裸地和盐田。

4.1 分形特征提取与分析

采用上述提到的分析方法和流程,试验中对该遥感图像进行了相同的处理,提取了三个波段具有代表性的地物分形维数谱,如图8所示,得出如下结论:

(1)分形维数反映地表的粗糙度,自然景物的分形维数值较小并且随尺度的变化小而人工景物则相反。水域、裸地的纹理结构简单均一,分形维数相对较小随尺度变化范围也小;盐田、植被(包括耕地)、城镇用地由于受人工的影响,地表不规则,纹理结构粗糙分形维数值较大,分形维数随尺度的变化也大。

(2)灰度信息影响分形维数,与其成正相关关系。由于波段1、2、3分别表示地物在0.5560 m,0.6610 m,0.8070 m附近的发射光谱响应DN值,分形维数在此范围内表现出与反射光谱相同的变化。植被的分形维数满足FDband3>FDband1>FDband2,这与植被在近红外的高反射、绿光波段的强反射以及对红光波段的吸收造成的低反射有关。因此参照光谱和植被指数的概念,可以试图建立植被分维指数VFDI(VegetationFractalDimensionIn dex),FDband3,r=30表示ASTER第三波段在尺度r=30下的分形维数,FDband2,r=100表示ASTER第二波段在尺度r=100下的分形维数。

4.2 遥感图像分割

采用5#5的滑动窗口,计算出图像在尺度r=30,40,70的分形维数值,提取其分形特征后利用最大似然法对图像进行分割。经过多次反复实验,得出如下结论:?多分形特征参与的图像分割较之单分形特征对图像分割效果有所改善。仅利用灰度信息对图像分割的总分割精度为:82.6986%,Kappa系数为0.7819;在原图的基础上加入单一分形特征后分割精度提高,最高为84.7116%(尺度r=70);在此基础上,加入尺度r=40后分割精度达到85.8426%。%分形特征能很好的区分灰度信息接近而纹理结构不同的地物类型,如图9中所示的裸地和城镇用地。因为城镇用地与裸地的颜色接近,基于灰度值的图像分割容易造成两者的混淆,而分形纹理能明显的将两者区分出来。图9(a)中右下角部分为裸地中的沙地,在图中与城镇用地颜色相差不大,均为青色。但在求出的分维图9(b)中颜色却与城镇用地差异很大。这是由于沙地较城镇用地结构简单,分形曲面起伏不大,分形维数较小,颜色较深。&分形能从宏观上把握目标的边缘特征但对细节部分把握不够。图9(d)中各地物类型的区分明显,并且成片分布,但是丧失了部分细节信息。

5 结束语

本文通过对模拟图像和遥感图像的分形特征提取与分割实验证实了传统的基于灰度值特征分割方法的不足以及单一尺度分形特征的局限性,引入多

遥感信息

理论研究 2008.1

尺度分形特征建立分形维数谱,来客观定量地描述各种地物的空间结构差异。实验中结合多尺度分维特征,遥感图像的分割精度达到了85.8426%,提高了3%以上。并且根据遥感图像分维谱,我们可以清楚的识别各种地物不同的空间结构差异:水域、裸地的纹理结构简单均一,分形维数相对较小并且随尺度变化范围也小,分维曲线值较低并且平缓;

盐田、植被(包括耕地)、城镇用地由于受人工的影

响,地表不规则,纹理结构粗糙,分形维数值较大,随尺度的变化也大,分维曲线偏高且不太平缓。

研究结果表明:分形特征是描述图像信息的一种有效特征量,根据分维值的大小和变化趋势可以表示不同地物的空间复杂度,利用分形能够把图像的空间信息和灰度信息有机的结合起来。

参考文献

1 A.P.Pentland.Fractalbaseddescriptionofnaturalscenes[J].IEEETrans.,1984,PAMI-6,(6):661~674.

2 S.Peleg,J.NaoR,R.HartleyandD.Avnir.Multipleresolutiontextureanalysisandclassification[J],IEEETrans.,1984,

PAMI(6):518~523.

2008.1

理论研究 遥感信息

3 T.Peli.Multiscalefractaltheoryandobjectcharacterization[J].J.Opt.Soc.AmA,1990,7(6):1101~1112.4 江东,王建华.遥感信息科学中的分形思维[J].甘肃科学学报,,12(1):53~57.5 吴健平.分形理论在遥感中的应用[J].遥感技术与应用,1993,8(12):23~27.6 孙家柄,刘继琳,李军.多源遥感影像融合[J].遥感学报,,2(1):47~50.

7 舒宁.卫星遥感影像纹理分析与分形分维方法[J].武汉测绘科技大学学报,1998,23(4):370~373.8 B.B.Mandelbrot著.文志英,苏虹译.分形对象?形状、机遇与维数[M].北京:世界图书出版公司,.9 B.B.Mandelbrot.TheFractalGeometryofNature.Freeman[M].SanFrancisco,Cali,1982.

10 JayFeng.Fractionalfractalgeometryforimageprocessing[D].Illinois:NorthwesternUniversity,2000.11 赵英时,等.遥感应用分析原理与方法[M].北京:科学出版社,.

12 T.ParrinelloandR.A.Vaughan.Multifractalanalysisandfeatureextractioninsatelliteimagery[J].INT.J.Remote

Sensing,,23(9):1799~1825.

13 SonnyNovianto,etal.Nearoptimumestimationoflocalfractaldimensionforimagesegmentation[J].PatternRecognition

Letters,2003(24):365~374.

FractalFeatureExtractionandSegmentationofRemoteSensingImagery

ZHENGGui xiang,LINQi zhong

(InstituteofRemoteSensingApplication,ChineseAcademyofSciences,Beijing100101,China)

Abstract:FractalmethodisanewsubjectwhichwasfoundedbyAmericanscientistB.B.Mandelbrotinthemiddleof1970s,whichiswidelyappliedtoalmostallthefieldsofphysicalandsocialsciences.Basedonpreviousstudies,thispaperextractedthefractalfeaturesofimagesbyusingtheDoubleBlanketMethodandappliedthemtoimagesegmentationwhichshowedthevalidityandfeasibilityoffractalinthisfieldfurther.Firstly,anoptimumwindowwasselectedbycomparingthestandarderrorbetweenlocalandglobalfractaldimensions.Secondly,multi scalefractalfeatureswereextractedandfractaldimensionspec trumswereestablishedwithregardtosingle scale(slimitation.Then,byanalyzingobjectfractaldimensionspectrum,appro priatefeatureswereutilizedtosimulativeimagesegmentationbasedonthemaximumlikelihoodmethod.Atlast,fractaltheorywasbestowedtoremotesensingimage.Relativetothetraditionalmethodconsistedofonlygraylevelfeatures,theoverallseg mentationaccuracywasobviouslyimprovedwhenconsideredthespatialfractaltexturefeatures.Theresultsshowedthatfractaldimensionanditschangetrendcoulddisplayspatialcomplexityofdifferentobjects.Combinedwiththespectrumandgraylevelinformation,theobjectscanbediscriminatedeasily.

Keywords:remotesensing;multi scalefractal;DoubleBlanketMethod;imagesegmentation(上接第8页)

ANewMethodofAcquiringThreeComponentsofDeformation

DisplacementBasedonDInSARTechnique

ZHAXian jie,FURong shan,LIUBin,DAIZhi yang,SHAOZhi gang,HANLi bo(SchoolofEarth&SpatialScience,ChineseScienceTechnologyUniversity,Hefei230026)

图像分割方法综述 第3篇

关键词:数字图像,图像分割,灰度图像

1、引言

图像分割是将图像中有意义的特征部分提取出来, 例如, 图像中的边缘、区域等, 这是进一步进行图像识别、分析和理解的基础。因此, 对图像分割的研究还在不断深入之中, 是目前图像处理中研究的热点之一。

近几年来, 很多研究人员做了大量的工作[1], 提出了很多实用的图像分割算法。本文针对当前主流的灰度图像分割算法进行了分析、分类、归纳和总结, 指出了各类方法的优缺点, 为人们在不同的应用场合及不同的图像数据条件选择不同的分割算法提供了一定的依据。需要指出的是, 由于从不同的角度将得到不同的分类结果, 文中涉及方法的分类并不是绝对的, 而且许多分割方法还是多种简单方法的综合体, 只能大致将它们分为属于最能反映其特点的某一类。

2、图像分割算法的分类

2.1 基于阈值的分割技术

这类方法简单实用, 根据使用的是图像的整体信息还是局部信息, 可以分为上下文相关方法和上下文无关方法。根据对全图使用统一阈值还是对不同区域使用不同阈值, 可以分为全局阈值方法和局部阈值方法。

阈值分割的核心问题是如何选择合适的阈值。其中, 最简单和常用的方法是从图像的灰度直方图出发, 先得到各个灰度级的概率分布密度, 再依据某一准则选取一个或多个合适的阈值, 以确定每个像素点的归属。选择的准则不同, 得到的阈值化算法就不同。其中, 常见的有如下几种:p-分位数 (p-tile) 法, 最频值法 (mode法) , Otsu方法, 嫡方法, 最小误差法等。

所有的门限化方法都是基于这样的假设:图像中目标和背景所占据的灰度级区间是严格分开的。可是, 由于光照不均或者噪声干扰, 这样的假设并不总是成立的。

2.2、基于边缘的分割技术

这类方法主要基于图像灰度级的不连续性, 它通过检测不同均匀区域之间的边界来实现对图像的分割, 这与人的视觉过程有些相似。依据执行方式的不同, 这类方法通常又分为串行边缘检测技术和并行边缘检测技术。

串行边缘检测技术首先要检测出一个边缘起始点, 然后根据某种相似性准则寻找与前一点同类的边缘点, 这种确定后继相似点的方法称为跟踪。全向跟踪可以克服由于跟踪的方向性可能造成的边界丢失, 但其搜索过程会付出更大的时间代价。串行边缘检测技术的优点在于可以得到连续的单像索边缘, 但是它的效果严重依赖于初始边缘点, 不恰当的初始边缘点可能得到虚假边缘, 而较少的初始边缘点可能导致边缘漏检。

并行边缘检测技术通常借助空域微分算子, 通过其模板与图像卷积完成, 因而可以在各个像素上同时进行, 从而大大降低了时间复杂度。常见并行边缘检测方法如:Roberts算子, Canny算子, Kirsh算子, Prewitt算子, Sobel算子, Walks算子等。

上述算法和其他边缘检测算法虽然在检测的准确性和边缘定位精度上有所差异, 但是都有一个共同的缺点, 不能得到连续的单像素边缘, 而这对于分割来说是至关重要的。所以, 通常在进行上述边缘检测之后, 需要进行一些边缘修正的工作。

与这些传统的边缘检测算法相比, Snake模型[2]从另一个角度探讨了边缘检测问题。首先, 给出一条封闭曲线作为初始的边缘轮廓。此后, 一方面使用像梯度场这样的图形信息作为外力, 让曲线尽量靠近真实边缘;另一方面使用曲线长度、平滑程度等作为内力, 约束曲线的形变。在这两种力量的共同作用下, 最终得到精确的、连续的物体边缘。这种方法省去了对边缘的繁琐的后处理, 但是这却是以提供初始轮廓为代价的。由于图形信息所提供的外力场是很微弱的, 所以初始轮廓应当比较接近真实边缘, 否则, 算法可能无法收敛到真实边缘。

2.3、基于区域特性的分割技术

基于区域的分割技术有两种基本形式:区域生长和分裂合并。前者是从单个像素出发, 逐渐合并以形成所需的分割结果, 后者是从整个图像出发, 逐渐分裂或合并以形成所需要的分割结果。与阈值方法不同, 这类方法不但考虑了像素的相似性, 还考虑了空间上的邻接性, 因此可以有效消除孤立噪声的干扰, 具有很强的鲁棒性。而且, 无论是合并还是分裂, 都能够将分割深入到像素级, 因此可以保证较高的分割精度。

区域生长算法先对每个要分割的区域找一个种子像素作为生长的起点, 然后将种子像素邻域内与种子像素有相似性的像素合并到种子像素集合。如此往复, 直到再没有像素可以被合并, 一个区域就形成了。显然, 种子像素、生长准则和终止条件是算法的关键。然而, 种子点的选择并不容易, 有人试图通过边缘检测来确定种子点, 但是, 由于边缘检测算法本身的不足, 并不能避免遗漏重要的种子点。

分裂合并算法则是先从整个图像开始不断的分裂得到各个区域, 再将相邻的具有相似性的区域合并以得到分割结果。这种方法虽然没有选择种子点的麻烦, 但也有自身的不足。一方面, 分裂如果不能深达像素级就会降低分割精度;另一方面, 深达像素级的分裂会增加合并的工作量, 从而大大提高其时间复杂度。

分水岭算法[3]是一种较新的基于区域的图像分割方法。该算法的思想来源于注地积水的过程:首先, 求取梯度图像;然后, 将梯度图像视为一个高低起伏的地形图, 原图上较平坦的区域梯度值较小, 构成盆地, 原图上的边界区域梯度值较大, 构成分割盆地的山脊;接着, 水从盆地内最低洼的地方渗入, 随着水位不断长高, 有的洼地将被连通, 为了防止两块洼地被连通, 就在分割两者的山脊上筑起水坝, 水位越涨越高, 水坝也越筑越高;最后, 当水坝达到最高的山脊的高度时, 算法结束, 每一个孤立的积水盆地对应一个分割区域。分水岭算法有着较好的鲁棒性, 但是却往往会形成过分割。

2.4、基于统计模式分类的分割技术

模式可以定义为对图像中的目标或其它感兴趣部分的定量或结构化的描述, 图像分割可以被视为以像素为基元的模式分类过程。这一过程主要包括两个步骤, 特征提取和模式分类。阈值分割就相当于在一维 (灰度) 或二维 (共生矩阵) 特征空间进行的模式分类, 它所使用的特征并没有充分反映像素的空间信息和其邻域像素的相关信息。为了改善分割的效果, 我们自然的想到使用能够充分利用图像信息的高维特征来描述每一个像素。

这类方法, 对于无法由灰度区分的复杂的纹理图像显得尤为有效。由于模式分类可以借鉴模式识别技术中的成熟算法 (如FCM算法和SOM算法) , 所以这类分割技术的主要差别在于特征提取的方法。常用的特征有:基于共生矩阵的特征, 纹理谱特征, 傅立叶域滤波特征, 波域滤波特征, 基于Gabor滤波器的特征, 基于随机场模型的特征等。

结语

图像分割是数字图像处理中的关键技术之一。虽然目前已研究出不少边缘提取、区域分割的方法, 但至今还没有一种普遍适用于分割各种图像的有效方法。

参考文献

[1]Pal N R, Pal SK, AReview on Image Segmentation Techniques, Pattern Recognition, 1993, 26 (9) :1277一1294.

[2]M.Kass, A.Witkin, and D.Terzopoulos, "Snakes:Active contour models, "InternationalJournalofComputer Vision, vol.1, PP.21-331, 1987.

彩色图像分割算法综述 第4篇

图像分割是模式识别和图像分析的核心技术,图像分割是将具备特定属性的目标区域从一定的背景中进行提取。可作如下定义:对一幅图像p(x,y)(0≤x≤xmax,0≤y≤ymax进行分割就是将图像划分为满足条件的N个子区域pi(x,y),i=1,2,...,N。经典的图像分割是基于灰度的,一般单元区域内的灰度级别最多几十个。与灰度图像相比,彩色图像更符合人的视觉特性,更加切合人类对外在世界的认识。由于彩色图像具有颜色空间的信息,如何将颜色空间信息表达为特征,研究颜色空间信息的表达方式以及颜色空间信息在图像分割中所起到的作用,已成为彩色图像分割技术的核心课题。

2 彩色图像分割方法的研究和特点分析

2.1 彩色图像分割方法的研究

彩色图像分割算法的研究最近一些年取得了很大的进展,呈现百花齐放之势。图像分割很大程度上依赖于特定领域需求、特定的目标对象、以及分割背景……这些因素很大程度上影响着分割效果。目前具有广泛应用基础的主要有基于直方图阈值分割、基于特征聚类和区域生长的、基于分水岭算法、基于人工神经网络等。

2.1.1 直方图阈值法

利用灰度阈值变换分割图像就称为阈值分割。它的特点是算法简单、计算量小、性能稳定,因而成为最基本和应用最为广泛的分割技术。阈值分割的基本思想:设置特征阈值,把每个像素点的灰度值和阈值相比较,根据比较的结果把该像素划分为两类—目标区域和背景区域。

阈值分割一般分为三步骤:(1) 确定阈值;(2) 将阈值和像素比较;(3)把像素归类。其中第(1)步阈值最重要,阈值的选择将直接影响分割的准确性以及由此产生的图像描述、分析的正确性。

常用的直方图阈值法有根据直方图谷底确定阈值、迭代选择阈值、最小均方误差法、最大类间方差法。国外学者Hollander等提出了一种基于多维的直方图阈值化方案, 该方法的基本思想是直方图阈值从不同的颜色空间(RGB、YIQ、HSI)中得到,并且把该阈值用于即将进行的区域分裂。然而,对于每个待分裂的区域,首先计算出各颜色空间中各分量的特征量的直方图, 然后再确定各个直方图的峰值, 从得到的峰值中选出具有最佳峰值的直方图,即用该峰值作为阈值,将待分裂的区域再分为两个子区域,采用递归算法,对于新分裂出的子区域重复相同的过程,直至每个区域都是相似的,不能再进行分裂为止。汤凌等人甚至提出一种基于人工免疫的图像分割算法,该算法在生物免疫的思想上加入了人工免疫算子,不仅能够确定最优阈值,而且还能大大缩短分割时间。

基于直方图阈值法的优点是计算量较小,而且不需要先验信息。缺点主要体现在四点:(1)基于单独的某个颜色分量的峰值分割图像区域是不完整的;(2)可能待分割的图像各个颜色分量的直方图并不具备明显的波峰或波谷;(3)彩色图像的像素映射到灰度图像的时候伴随发生的颜色信息发散;(4) 直方图阈值法是个全局的方法,并没有考虑到局部空间信息。

总之虽然很多研究对阈值分割的算法进行了改进,图像分割的效果有所提高。但在阈值的设置上还是没有很一个很好的解决方法。若将智能遗传算法引用到阈值筛选上, 或许对于最优分割图像的阈值的确定大大有利,这或许是基于阈值分割的图像分割法的发展趋势。

2.1.2 特征空间聚类以及区域生长

特征空间聚类算法在提取各类的特征值迭代的分类算法,因此不需要预先训练样本,特征空间聚类算法是一种无监督的统计学方法,比较常用的分类方法有模糊C- 均值、K- 均值等。对于彩色图像,在颜色空间上聚类必须先确定聚类数目,进行聚类的有效性分析,这种方法的优点, 充分利用了各个颜色分量上的颜色信息,而且直观易于实现。

基于特征空间聚类算法没有考虑到空间信息,对噪声比较敏感,但是它不需要预先训练样本,只需要确定聚类的数目。

区域生长分割方法对噪声不敏感, 所以对目标区域进行模糊聚类分割以后, 对分割出来的区域进一步进行区域生长,以达到更精确的分割目的。区域生长是根据事先定义的准则将像素或者子区域聚合成更大区域的过程。其基本思想是从一组生长中心开始(生长中心可以是单个像素,也可以是某个小区域),将与该生长点性质相似的相邻像素或者区域与生长点合并,形成新的生长点,重复此过程直到不能生长为止。生长点和相邻区域的相似性判断依据可以是灰度值、纹理、颜色等多种图像信息。

一般来说,区域生长算法有三个步骤:(1)选择合适的生长点;(2)确定相似性准则即生长准则;(3)确定生长停止条件。

具体过程有三步骤。

第一步: 经聚类算法后的聚类区域有k个, 以这k个区域的聚类中心作为区域生长点。可将区域生长点表示为:{C1(0),C2(0),...,Ck(0)}。

第二步:以区域生长点为基础进行区域增长:设经过i次迭代后的区域为{S1(i),S2(i),...,Sk(i)},每次迭代以后判断该区域是否已增长结束,采用8- 邻接区域来判断其中任意像素是否已经到达区域的边界,以下给出判断条件:

第三步: 当某个区域所有边缘像素的8- 邻接区域都不满足(公式1),即表该区域已增加结束,在下一轮迭代时跳过该区域,然后再返回到第二步,计算其他的区域,直到所有的区域停止增长为止。

一般来说, 在无像素或者满足加入生长区域条件时,区域生长就会停止。

区域的合并是将图像中任意两个具有相似特征的相邻区域合并,合并的两个区域可以大小不同,当无法再进行聚合时操作停止。区域的生长和合并对分割复杂场景图像比较有效,如果引入应用领域知识,则可以更好地提高分割效果。

2.1.3 分水岭分割方法

用来描述物体形状的非线性算子的代数称之为数学形态,在很多方面的应用都要优于线性算子。和其他的一些分割算法相比,在很多领域中:如预处理、物体形状的分割、物体量化……数学形态学方法都够在理结果和速度展现出优势。分水岭算法是数学形态学图像处理理论中比较有代表性的算法。

在彩色图像分割过程中,由于噪声的影响,分水岭算法分割图像非常容易过分分割。当然文献[11]中提到了几种解决方法:中值滤波、彩色形态学、低通滤波和高斯滤波等。这些滤波技术的依据是图像中信息出现的频率,但是频率并不是图像中唯一重要的信息。比如说,有些信息频率并不高,但是属于边缘信息,很重要,因为导致对边缘信息的保持效果较差。如果通过改进的基于边缘信赖度的各向异性扩散算法来对图像进行预处理,能够相对比较好地解决噪声影响。改进的基于边缘信赖度的各向异性扩散算法主要手段是通对P-M扩散算法中K和□的值进行改进:

K是控制传导系统函数形状的参数 ,□是用来控制扩散程度的参数。边缘信赖度是用来衡量局部窗口内的图像像素与边缘相似程度的参数。

改进的基于边缘信赖度的各向异性扩散方程为:

其中,参数P是梯度hNIx,y的函数,下标P的下标值代表四个计算维度的方向。参数Kx,y和λx,y的取值在目标空间域是逐点变化的。分水岭分割方法的关键是标记的选取,适当的选取不会导致过分割。马丽红等提出开闭滤波技术,对输出图像做二值标记预处理后的图像作为初始的分割步骤,然后把所得的分割结果作为分水岭算法的种子(标记),取得较好的效果。

2.1.4 人工神经网络

神经网络是对生物神经网络若干基本特性的抽象和模拟,它可以训练样本,为的函数提供解决方案。在汽车智能驾驶、光学字符识别和人脸识别等领域取得了很大的成功。对于分类问题,目的是学习决策函数h(x),该函数的输出为离散值或者向量,这是人工神经网络的强项;另外,由于可学习实值函数,神经网络也是拟合的利器。

神经网络的研究在受到了生物大脑仿生学启发,由一系列人工神经元相互密集连接构成。每个神经元由三部分组成:输入、人工神经细胞体和输出。每个神经元具有一定数量的实数值输入, 并产生一个的实数值的输出,如图1所示。

一个人工神经元的输入信号来自另一些神经元的输出,其输出又可以作为另一些神经元的输入。一个人工神经元可以看成感知器,具有两种状态:1和 -1。人工神经细胞对这些输入信号进行整合并进行阈值处理,若刺激值超过某一阈值, 则神经元被激活而进入1状态否则神经元就处于 -1状态。

在神经网络的训练过程中,训练样本特征向量是神经网络的输入,训练样本的目标输出是网络的输出。初始情况下,网络权值被初始化为一种随机状态,当把某个训练样本输入网络时,由此产生的网络输出与训练样本目标输出之间的差异称为训练误差。接下来,神经网络将根据某种机制调节权值w, 使得训练误差逐步减小;随着这种训练和调整过程的进行,网络对于训练样本的实际输出将越来越接近于目标输出。

人工神经网络技术的引入,使得图像分割技术具备了学习功能,为图像分割技术的智能化和启发式发展提供了理论基础。

2.2 颜色模型的研究

从物理的角度,颜色的感知源于刺激视网膜的电磁辐射的谱能量。谱能量分布E(λ),λ取值在350~780 nm它们的关系可以表示成:

彩色模型也称为彩色空间或彩色系统,是用来精确标定和生成各种颜色的一套规则和定义。它的用途是在某种标准下用通常可接受的方式简化彩色规范。如针对数码硬件的RGB模型,以及符合人类视觉特性的HSI模型。

2.2.1 RGB 模型

RGB模型是工业界的一种颜色标准 , 是通过对红(Red)、绿 (Green)、蓝 (Blue) 三种颜色的变化以及相互之间的叠加来得到各种的颜色的总称。该标准几乎包括人类视觉所能感知的所有颜色,是目前运用最广的颜色模型之一。

RGB颜色空间对应的坐标系统可以用如下一个三维向量来表示,如图2所示。

在RGB模型中, 三个图像分量组成了所要表示的图像。每一个颜色分量用8比特图像表示的话, 一个RGB彩色像素就有24比特深度。故这24比特RGB图像中颜色总数就是(28)3=16777216。

色觉的产生是需要发光光源的光通过反射或透射方式传递到眼睛,刺激视网膜细胞引起神经信号传输到大脑,然后人脑对此加以解释产生色觉。设为组成某种颜色C所需的3个刺激量分别用X、Y、Z表示,3刺激值与R、G、B有如下关系:

对白光,有X=1,Y=1,Z=1。设每种刺激量的比例系数为x,y,z,则有C=x X+y Y+z Z。比例系数x,y,z为色系数,其定义为:

此时,x+y+z=1。

2.2.2 HSI 颜色模型

HSI模型是从色调、饱和度和亮度来描述颜色 ,符合人类的视觉认知。HSI彩色空间可以用一个圆锥空间模型来描述,如图3所示。

通常用饱和度和色调表示颜色的类别与深浅程度。在模型中体现为横截面圆,模型纵坐标表示亮度。

一般来说,人的视觉对颜色浓淡的敏感程度要远弱于亮度的敏感程度,为了便于颜色处理和识别,人的视觉系统经常采用HSI彩色空间, 它比RGB彩色空间更符合人的视觉特性。此外,由于HSI空间中亮度和色度具有可分离特性,使得图像处理和机器视觉中大量灰度处理算法都可方便地应用在HSI彩色空间中。

综上对RGB和HIS两种颜色空间模型的分析和研究,HSI彩色空间和RGB彩色空间只是对物理量的表示方法不同,它们之间存在着一定的转换关系。

从RGB到HSI的彩色转换 及其实现。 给定一幅RGB格式的图像 ,每一个RGB像素的I、S、H分量可用下面的公式得到:

HSI模型有两个重要的特点 :第一个特点是亮度分量与色度分量是分开的,I分量与图像的彩色信息无关第二个特点是H及S分量与人感受彩色的方式紧密相连(这里强调了颜色的重要性,因为人对光的感知还与分量有关)。这些特点使得HSI模型非常适合基于人的视觉系统对彩色感知特性而进行处理分析的图像算法。

3 结束语

3.1 图像分割算法的评估

图像分割领域的分割算法的研究和改进越来越多算法的评估会适当度量算法的适用条件以及目标区域的优化分割,对分割算法的优化和改进具有一定的理论指导意义。

评估方法应具备两个条件。(1)较高的执行效率和鲁棒性好。如果运算量太大且对环境要求太过于苛刻的话,分割算法的应用意义不大,不能够很好地工业应用(2)应该具备完整、客观和科学的评估体系。能够评估众多不同的分割算法且能够根据分割算法的不同适用领域进行分类。

3.2 图像分割算法的研究方向

随着专家和学者的大量科研工作和实验,图像分割算法的应用型也越来越强。分割算法的智能化,分割效果的准确性和精确性,以及分割算法的鲁棒性都将成为广大学者所追捧的准则和目标。

由于图像分割算法众多, 且各自有各自的适用领域,各种分割算法的协作和融合,也将成为图像分割领域的研究热点。比如分水岭算法与区域生长的结合,遗传算法[17]与聚类分析的结合,寻找最有阈值与最大类间差结合[18]等,并且引入训练样本库技术,在提高图像分割算法性能的同时提高了分割算法的智能性。

摘要:图像分割是计算机视觉和图像分析的核心技术,作者首先对当前各种图像分割算法进行全面的分析和研究,指出色彩在图像分割技术中的作用。然后对直方图阈值法、特征空间聚类及区域生长、分水岭分割算法、神经元网络等主要的彩色图像分割技术进行综述,并分析比较这几种方法的特点,并且引入了颜色模型的概念,进行了研究。最后结论部分,提出图像分割算法的评估体系,展望了彩色图像分割技术的发展趋势和将来的研究方向。

图像分割研究现状概述 第5篇

图像分割, 就是将一副图像通过一定的方法分割成不同的区域, 同一区域表现出相同或相似的特征, 如灰度、颜色、纹理等, 而不同的区域之间有明显的差异。简单地说, 就是从一副图像的背景中分离出目标[1]。图像分割在很多领域都有着非常广泛的应用, 并涉及不同类型的图像。

2 图像分割的基本表达

设集合R表示一副图像占据的整个空间区域, 是定义在集合的点上的一个逻辑属性, 对R分成满足下列条件的非空子集区域

(b) 是一个连通集,

对于所有的i和j,

对于任何的邻接区域。

由以上基础知识, 我们可以把图像分割的方法分为基于区域、边界、特定理论的方法。在生活应用中, 图像分割根据以上五个准则, 把感兴趣的目标区域提取出来。

3 基于区域的分割方法

这种方法就是将一副图像分割成多个区域, 将区域内特征相似的归为一类, 使区域内像素都满足于灰度、形状等特征的一种相似性准则。

3.1 阈值法

阈值法已是研究者们极为常用的分割方法, 由于图像在灰度特性上目标和背景总有差别, 通常我们把一幅图像看作具有不同灰度级的区域组合, 再选取一个适合的阈值, 就能判断像素点是属于目标还是背景区域, 从而生成对应的二值图像。由此可见, 阈值法不仅处理直观, 实现简单, 而且计算速度快。

3.1.1 直方图阈值分割

一副图的灰度级取值范围为设灰度级i的像素数为则一副图像的总像素N为:灰度级i出现的概率定义为:

灰度直方图是一种二维关系, 即像素数ni与灰度i, 它表示的是一种统计特性, 这种方法是将像素灰度作为属性的基础。

Prewitt在20世纪60年代中期, 提出了直方图双峰法, 即当直方图出现双峰状时, 选取两峰的谷底所对应的值当作阈值。Doyle提出的Ptile法是早期的基于灰度直方图的自动阈值选择方法, 该方法计算简单, 抗噪声性能较好。

3.1.2 类间方差阈值分割

最大类间方差法是由Ostu提出的, 它的推导是在判断分析最小二乘法原理的基础上得出的, 该算法较为简单, 是一种被广为关注的阈值选取方法, 这种方法被认为是阈值分割中的经典算法。

3.1.3 最大熵阈值分割

最大熵阈值分割, 是最重要的阈值法之一, 该方法减少了人的主观参与, 对于最佳阈值的选取不依赖于人的主观判断, 而是利用计算机的自动选取。P·Sahoo[2]等人提出了用Renyi熵代替常规熵的最大熵原则, 该方法提高了计算机阈值选取的速度。

3.1.4 模糊阈值分割

1983年Pal等人提出模糊阈值分割, 它是以模糊数学为理论依据, 将图像看成一个模糊阵列, 在选取阈值的时候, 要计算图像的模糊率或模糊熵。

3.2 区域增长法和分裂合并区域方法

3.2.1 区域增长法

作为区域分割的方法, 最基本的是区域增长法。这种方法是预先定义我们需要的性质, 从一组“种子”点开始, 将与定义的性质相似的像素添加到种子上, 形成生长区域 (如特定范围的灰度或颜色) 。这种方法的特点为将处理过程分解为多个顺序步骤, 前面步骤的处理结果得到判断后才能进行后面步骤的处理。

3.2.2 分裂合并法

该方法的思想是通过分裂的条件把一副图像分割成不同的区域, 再定义合并的规则使区域完成合并, 从而实现对区域分割的目的。

Horowtiz和Pavlids[4]最早用这种方法分割图像, 开始使用的均匀性测试准则是每块图像区域中极大与极小值之差是否在允许的偏差范围, 后来又发展到用统计检验和模型拟合等。该方法对复杂图像能产生较好的分割结果, 但算法较复杂, 计算量较大。

4 基于边界的分割方法

由于不同的区域像素灰度会呈现出不连续, 该方法就是利用这种特点, 检测出这些区域的边缘, 再通过一定的准则将它们连成边界, 把图像分成不同的区域, 这样就实现了图像分割。

4.1 微分算子法

图像内不同区域之间总有边缘, 边缘处像素灰度值具有不连续性, 正因为这种不连续性, 我们能通过求导数来检测到。我们在实际工作中, 常用的一阶微分算子有Roberts、Sobel、Prewitt边缘算子, 二阶微分算子有Laplacian和Kirsh算子等。微分算子法的优点是速度较快、计算简单, 不过也有一定的缺点那就是对噪声的干扰比较敏感。

4.2 边界追踪法

这种方法是从二值图的一边缘点出发, 其目标和背景点分别标为1和0, 一次搜索并链接相邻边缘点, 从而实现对图像边界的检测。按顺时针方向进行, 采用合理的搜索机理, 按照搜索的完结条件完成边界的追踪, 最终实现边缘的提取。柳稼航等人[3]提出了一种优先搜索方向的边界跟踪法, 这种方法不仅能满足对边界像素的宽度、同一区域边界连通封闭、定位区域外围轮廓的要求, 而且能保持目标区域外边界的原貌和特点。

5 特定理论的分割方法

5.1 基于数学形态学的方法

法国数学家Mathern和Serra于1964年提出数学形态学[4], 其基本运算有:膨胀、腐蚀、开启和闭合。它以数学理论为基础, 并在计算机视觉和图像处理领域得到广泛应用。

数学形态学的基本思想是选择具有某种特定形态的结构元素去度量和描述图像中结构之间的相互关系, 从而达到分析和识别的目的。戴天虹等人[5]应用数学形态学在木材缺陷的图像分割, 阐述了数学形态学方法能有效获得清晰的边缘图像, 能克服大量噪声对图像提取的影响。

5.2 基于神经网络的方法

近年来, 神经网络方法在图像分割中得到了极大的应用, 根据处理的数据类型可以分成两类:基于像素、基于特征数据的算法。

根据神经网络存在大量的连接和空间的信息, 所以该方法能够较好地处理一幅图像的噪声以及不均匀的问题。选择哪种结构是该方法要解决的问题。崔栋等人[6]利用神经网络法在图像分割中的应用, 经过论证该方法抗干扰能力强, 分割得到的图像清晰且内容丰富。

5.3 基于活动轮廓模型的图像分割

Kass等人在1987年提出Snake模型[7]。该方法的思想是先通过人的主观鉴别能力, 在图像的目标边界周围确定最初的轮廓线, 然后对曲线选择能量最小化变形, 将其锁定在我们要分割的边界上。

这种算法能使图像的整体信息和局部信息得到充分地利用, 能够准确定位边界, 并且拥有提取和跟踪特定区域目标轮廓的能力, 对噪声和对比度不是很敏感, 能将目标从复杂背景中分割出来。但是, 该模型存在三个问题:活动轮廓的初始位置影响分割结果;对于存在特定轮廓的模型, 不能使变形模析收敛到边缘;该算法要得到快速实现也是一个问题。

5.4 基于遗传算法的图像分割

Holland于1975年提出遗传算法, 它是通过对目标空间进行随机搜索的一种全局搜索算法。这种算法的基本思想是模拟自然选择和遗传学理论, 依据适者生存的原理。

这种算法已经被广泛应用到各个领域, 包括计算机科学、图像处理、人工智能、工程设计、商业金融等。

5.5 基于图论的图像分割

图论是数学的一个分支, 它以图为研究对象。它是一种数据结构, 可以表述复杂的结构关系, 其基本思想是将图像分割问题转化为最优化问题, 将图像映射为带权无向图, 通过把像素视为节点, 利用最小剪切准则得到图像的最佳分割[8]。目前, 该方法广泛应用于计算机、图像分割、机械设备、数学、网络等各个领域。

6 结论

目前, 图像分割已经广泛应用于各个领域:计算机、机器视觉、人脸识别、指纹识别、交通系统、制造业、航空、船舶、医学等。过去, 人们不断提出新的方法和理论处理图像问题, 但是仍然未提出一种高效、快速且通用的方法。其原因是人们对视觉系统还有很多需要挖掘的地方和学习的空间。相信未来会有更多新的方法和理论, 笔者下一步的研究方向是结合新的理论对水体进行提取, 对图像分割作更深一步的研究。

参考文献

[1]夏良正, 李久贤.数字图像处理[M].南京:东南大学出版社, 2005:211-214.

[2]Sahoo P, Wilkins C, Yeager J.Threshold Selection Using Renyi’s Entropy[J].P-attern Recognition, 1997, 30 (1) :71-84.

[3]刘稼航, 杨建峰, 单新建, 等.一种基于优先搜索方向的边界跟踪算法[J].遥感技术与应用, 2004, 19 (3) :210-213.

[4]Angulo J, Serra J.Modeling and segmentation of colour images in polar representations[J].Image and Vision Computing, 2007, 25 (4) :475-495.

[5]戴天虹, 吴以.基于OTSU算法与数学形态学的木材缺陷图像分割[J].森林工程, 2014, 30 (2) :52-55.

[6]崔栋, 刘敏敏, 张光玉.BP神经网络在眼底造影图像分割中的应用[J].中国医学物理学杂志, 2011, 28 (1) :2396-2398.

[7]Kass M, Witkin A, Terzopoulos D.Snake:Active contour models[J].Internation-al Journal of Computer Vision, 1987, 1 (4) :321-331.—46.

昆虫图像分割 第6篇

高光谱遥感图像由于覆盖波段多,光谱分辨率高,可以进行精细的地物分类,近年来被应用在矿物勘测、精细农业、医学检验等民用领域和军事侦察、战场地图绘制等军事应用领域。由于高光谱数据维数高,当样本数量有限时,往往会出现分类精度随特征维数的上升而下降的所谓Hughes现象[1]。支持向量机(Support Vctor Machine,SVM)在解决小样本高维数据的分类问题上具有较好的性能,是目前应用最为广泛的高光谱图像分类方法[2],为了解决SVM的凸优化求解问题提出了最小二乘支持向量机(Least Square Support Vctor Machine,LSSVM)。但由于支持向量机和最小二乘支持向量机分类器都缺乏理论依据且受核函数选择、参数设置的影响较大,不足以满足实际的应用需要。近年来,随着稀疏表示分类(Sparse Representation Classification,SRC)在高光谱图像分类上的良好表现,人们开始研究高维数据的内在低维结构,通过对每一个像元稀疏表示来进行高光谱图像分类,不仅有效解决了维数灾难的问题,而且比支持向量机可以获得更好的分类精度[3]。低秩表示衍生于稀疏表示,与稀疏表示不同的是,低秩表示不再对单个像元进行稀疏,而是寻找一个所有样本点作为向量组的最低秩的表示,它更好地保持了数据的全局结构,并且对噪声和奇异点有更好的鲁棒性[4⁃5]。但以上这些方法都没有将高光谱图像的空间上下文信息融合到分类中,使得分类精度不能更好满足实际应用中的需求。

本文提出一种新的空谱信息分类方法,首先利用熵率超像素分割方法得到高光谱图像的分割图,然后利用分割图区域的内在低秩结构和区域同质性构建降维特征值方程求出投影矩阵,在分类过程中使用LSSVM对降维后的数据进行分类得到分类图,最后采用最大投票方法融合分割图和分类图得到最终分类结果。通过高光谱图像分类实验,结果表明本文提出的结合空谱信息的分类方法有效提高了高光谱图像的分类精度。

1 基于均值漂移的高光谱图像分割

本文先利用主成分分析[6](Principle Compenent Analysis,PCA)提取第一主成分高光谱图像,然后对图像中的每一个像素点求出均值漂移值,基于局部区域同质性的原因,同一个类别的像素点总近似收敛到一点,这样可以将高光谱图像分割成许多形状大小不同、一致性较好的闭合区域[7⁃8]。均值漂移向量的基本形式定义为:

式中:sR是半径为R的高维球区域,sR={x2-y2≤R2};k表示n个样本点有k个落入sR区域;x-xi为样本点xi相对于x的偏移量。向量mR(x)就是对落入区域sR中k个样本点相对于点x的偏移向量然后再平均,从直观上看如果样本点xi从一个概率密度中采样得到,非零的概率密度就会指向概率密度增加最大的方向,因此sR区域内的样本点更大可能地落在沿着概率梯度的方向。因此,对应的均值漂移向量mR(x)指向概率密度梯度的方向。均值漂移示意图和经过均值漂移的分割图如图1、图2所示。

均值漂移将高光谱图像分为大小不同的封闭图像块区域,可以将每一个图像块看作一个超像素,通过对超像素块中的像素点的光谱值求和作平均得到图像块之间的空谱信息

2 基于LSSVM的高光谱图像分类

2.1 构建降维目标函数

由上文均值漂移高光谱分割图可以得到不同形状大小的块区域,同一区域的像素是同一类的,设同一分割区域像素间的相似度为1,不同分割区域的相似度为0,以此来构造相似性矩阵Wij。利用图的拉普拉斯算子来描述数据的局部结构信息,为了使相邻的样本点在降维后依然保持[9]对不是同一区域的点,则不加约束,构造降维目标函数,最小化下列目标函数并变换成最小化拉普拉斯算子:

式中:V是降维映射矩阵,是由降维映射向量{v}nii=1组成;D是相似性矩阵W的度,即每行之和;L是拉普拉斯矩阵。

假设高维数据集X=[x1,x2,……,xn],每一个列向量都是一个样本点都可以用数据集X线性表示,低秩表示[3]的目标函数为:

式中:Z为高维数据集X的最低秩表示;D为一个线性张成数据空间的字典,可以将数据集作为字典;E为噪声向量;λ是平衡参数。所以可将低秩表示模型看作将高维数据矩阵分解为低秩矩阵和稀疏矩阵的形式。为了避免出现NP难问题,可以将式(3)化简为:

式中:‖·‖表示矩阵的核范数,即所有奇异值的和;‖·‖2,1为l2,1泛数。可以化为增广拉格朗日乘子求解问题,通过非精确拉格朗日乘子法求解低秩表示算法得出低秩表示系数矩阵Z。由于低秩表示能够更好地表示数据的全局信息,因此,用低秩表示对高光谱图像进行计算,得到低秩表示系数矩阵Z,基于低秩表示系数构造最小误差目标函数并化简为:

式中,{zi}ni=1是低秩表示系数。结合式(5)构造一个降维映射矩阵,最小化式(2)同时最大化式(5),即基于区域相似性低秩表示的维数约减算法目标函数可写为:

式中,X′是高光谱图像经过超像素分割之后得到的所有超像素的均值向量组成的新数据集。

式中:ve是第e个特征向量;λe为第e个特征值;d是降维后的维数。数据通过V=[v1,v2,……,vn]降维映射到低维空间中,经过降维后的数据,在结构上是稀疏的、低维的,可以真实反映出高光谱数据最本质的分类特征。

2.2 基于支持向量过采样的LSSVM分类

本文先利用数据的内在结构对高光谱数据进行降维,使得降维后的高维数据是低秩的、稀疏的、符合真实高光谱数据内在结构的低维高光谱数据。将原始高光谱图像进行投影,并且将降维后的高光谱图像分为标记训练集和无标记的测试集,然后利用LSSVM进行分类。但是传统的LSSVM分类器,由于为了解决SVM求解的凸优化问题而牺牲了原有支持向量的稀疏特性,使得在解决高光谱数据的多样本、不平衡分类问题时,出现少数类分类精度不高,或者与多数类分类精度差距很大。本文提出对LSSVM分类模型中的支持向量(Sup⁃port Vectors,SVs)过采样来提高少数类分类精度不高的问题。SVs采样主要有两个原因:

(1)只有少量的训练样本作为SVs且这些作为支持向量的样本一般都在判决边界上附近,对少样本类别的支持向量过采样可以减轻与多样本类别支持向量不均衡的问题;

(2)支持向量是最小二乘支持向量机分类模型在信息量最大最有代表性的样本,对其采样比对训练样本采样更节约训练成本。本文对SVs少的一边进行过采样来使得分类边界的SVs分布平衡。本文提出的对支持向量过采样技术为用数学语言可表达为:

式中:N+表示多数类的SVs;N-表示少数类的SVs;N-/(N++N-)∈(0,0.5)和α∈(0,1)是可调参量控制采样位置。首先计算出多核支持向量机中多数类支持向量个数N+和少数支持向量个数N-,然后代入式(8)计算出过采样后的少数支持向量个数,然后将过采样后的支持向量代入多核最小二乘支持向量机模型进行不平衡分类。本处理过程只是针对少数类与多数类训练的子分类器,其他的子分类器不做处理。LSSVM是基于统计学习理论的机器学习算法,采用结构风险最小化准则,根据有限训练样本建立二分类模型通过引入非线性函数和对偶理论后,LSSVM的最大间隔的分类超平面函数为:

约束条件:

式中α为拉格朗日乘子。用核函数替代非线性函数的点积,K(xi,xj)=φ(xi)·φ(xj)。在前文中已经算出空间信息Xw,混合核函数将空谱信息结合起来如下:

式中:Ks,Kw分别为光谱信息核函数,空间信息核函数;0<μ<1用来平衡两者的权重比例。最后得出最优分类函数,b为常数。

本文对降维后的数据采用一类对一类LSSVM分类,在每两类之间训练分类器,进行高光谱图像的多分类问题。本文方法的的流程图如图3所示。

与以往的空谱信息分类方法[10]不同,本文先对高光谱图像利用均值漂移算法分割,然后通过对降维后的高光谱数混合核LSSVM分类得到分类图,最后用最大投票方法融合分割图和分类图得到结合空谱信息的高光谱图像最终分类结果[11]。通过大小不均封闭的分割图和混合核LSSVM分类图融合可以保证同一区域内的像素点是属于同一个类的,如图4所示。

分割图示意图中同一颜色代表同一块区域,当然这些区域内会有奇异点;分类图示意图是代表块区域内基于像素的分类情况,本文利用最大投票融合分类图和分割图消除掉分类图中的奇异点,得到最终的分类结果。

3 实验结果与分析

本文试验一采用1992年AVIRIS采集的印第安纳州西北部的Indian Pines高光谱数据,此数据有220个波段,145×145个像素,去除用于噪声和水汽吸收的20个光谱波段(104~108,150~163和220),有16种地物覆盖类型。这些数据被大多数研究者使用,研究结果具有可比性。通过比较LSSVM分类结果、SRC分类结果、MS分割图和LSSVM分类图融合的分类结果、MS分割图和SRC分类图融合的分类结果以及本文方法的分类结果如图5所示,表1给出了各种方法的总体分类精度(OA)、平均分类精度(AA)、Kappa系数、各地物分类精度。

本文核函数采用径向基函数,参数主要包括惩罚系数C、高斯核参数σ。在分类时需要预先设置C的取值范围,设置为{10-4,10-3,…,102},σ的取值范围设置为{10-7,10-6,10-5,…,1,10,102},C值可通过训练样本的交叉验证获得,最优值为0.002,σ最优值为0.001。由表1可知,苜蓿、玉米略耕地、玉米、玉米未耕地、小麦、大豆略耕地的分类精度(不管是SVM还是SRC分类方法),在融合分割图后都有明显的提高,这也验证了融合分割图和分类图的可行性。本文方法通过对高光谱数据利用其本身的低维数据结构和区域同质性的特点进行降维,然后分类,更符合实际的数据特点。本文方法在分类精度上比MSSVM和MSSRC分类方法有进一步的提高,特别是大豆已耕地的分类精度达到了89.39%比MS+LSSVM的74.48%和MS+SRC的77.88%分别提高了14.91%和10.51%;混合土房的分类精度也比MS+LSSVM的66.94%和MS+SRC的73.21%分别提高了13.67%和7.40%;总体分类精度也达到了87.06%比MS+LSSVM的76.53%和MS+SRC的82.18%分别提高了10.53%和4.98%;Kappa系数为0.851 4。也达到了优良分类精度,高于MS+LSSVM的0.732 2和MS+SRC的0.796 7。

4 结语

本文结合空谱信息进行高光谱图像分类,提出一种基于图像分割和LSSVM分类器的高光谱分类方法。与传统的空谱信息分类方法不同的是本文提出的方法利用分割图提取空间信息,然后利用分割图的区域同质性和高维数据内在的低秩结构构建降维目标函数,得到低秩稀疏数据通过LSSVM进行分类,最后由最大投票融合原则对分割图和分类图进行融合得到最终的分类结果,并且考虑了少数类分类精度不高的问题,提出了对其支持向量过采样来解决不平衡的分类问题。实验结果表明,本文方法很大程度上提高了高光谱图像的总体分类精度。在后续的研究中可以在保持分类精度的基础上,减少分类复杂度。

注:本文通讯作者为晁拴社。

摘要:提出一种基于图像分割和LSSVM的高光谱图像分类方法,将空谱信息结合起来进行高光谱图像的分类。首先利用均值漂移算法对高光谱图像进行分割,然后对每一块分割区域数据进行降维并且对降维后的数据LSSVM分类,最后用最大投票方法融合分割图和分类得到最终的分类结果。该文分类方法先对分割后的区域求出相似性矩阵并训练新样本集求出低秩系数矩阵,由相似性矩阵和低秩系数矩阵构造特征值方程求解出降维矩阵,然后利用混合核LSSVM对降维后的数据进行分类。实验结果表明,提出的基于图像分割和LSSVM的高光谱图像分类方法有效提高了高光谱图像的分类精度。

关键词:高光谱图像分类,图像分割,LSSVM,数据降维

参考文献

[1]LANDGREBE D.Hyperspectral image data analysis[J].IEEEsignal processing magazine,2002,19(1):17-28.

[2]谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128.

[3]SUN X,QU Q,NASRABADI N M,et al.Structured priors forsparse-representation-based hyperspectral image classification[J].IEEE geoscience and remote sensing letters,2014,11(7):1235-1239.

[4]宋相法,焦李成.基于稀疏表示及光谱信息的高光谱遥感图像分类[J].电子与信息学报,2012,34(2):268-272.

[5]HE Z,LIU L,DENG R,et al.Low-rank group in spired dic-tionary learning for hyperspectral image classification[J].Sig-nal processing,2016,120:209-221.

[6]Ro DARMEL C,SHAN J.Principal component analysis for hy-perspectral image classification[J].Surveying and land informa-tion science,2002,62(2):115-122.

[7]COMANICIU D,MEER P.Mean shift:A robust approach to-ward feature space analysis[J].IEEE transactions on patternanalysis and machine intelligence,2002,24(5):603-619.

[8]HUANG X,ZHANG L.An adaptive mean-shift analysis ap-proach for object extraction and classification from urban hyper-spectral imagery[J].IEEE transactions on geoscience and re-mote sensing,2008,46(12):4173-4185.

[9]KIM D H,FINKEL L H.Hyperspectral image processing usinglocally linear embedding[C]//Proceedings of 2003 First Inter-national IEEE EMBS Conference on Neural Engineering.[S.l.]:IEEE,2003:316-319.

[10]王立国,孙杰,肖倩.结合空-谱信息的高光谱图像分类方法[J].黑龙江大学自然科学学报,2011(6):788-791.

数字图像分割方法研究 第7篇

关键词:图像分割,技术方法,支持向量机

1 引言

图像分割是图像处理与机器视觉必不可少的重要环节,是从图像处理到图像分析的关键步骤,在图像分割的基础上才能对目标进行特征提取和参数测量,使得更高层的图像分析和理解成为可能。图像分割大多为彩色和灰度图像分割,从分割的原理上看,二者是近似一致的,即基于像素数值的相似性和空间的接近性,彩色图像分割可以近似为灰度图像分割技术在各种颜色空间上的应用。图像分割是指将图像中具有特殊意义的不同区域分开,并使这些区域相互不相交,且每个区域应满足一致性条件,即同质性和唯一性。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域边界上一般具有灰度不连续性。图像分割的数学表达形式可作如下描述:

定义对一幅图像g(x,y)(0xxmax,0yymax)进行分割就是将图像划分为满足如下条件的N个子区域gi(x,y),i=1,2N。

1),即由所有子区域组成整幅图像;

2)gi(x,y)是连通的区域,连通性是指在该区域内存在连接任意两点的路径;

3)gi(x,y)∩gj(x,y)=φ(i,j=1,2,,N,i≠j),即任意两个子区域不存在公共元素;

4)区域gi(x,y)满足一定的均匀性条件,所谓均匀性(或称相似性)是指区域内所有像素点满足灰度、纹理、颜色、梯度、方差、频率等特征的某种相似性准则。

2 基于边缘检测的分割方法

边缘检测分割法是通过检测出不同区域边界来进行分割的。边缘总是以强度突变的形式出现,可以定义为图像局部特性的不连续性。边缘常常意味着一个区域的终结和另一个区域的开始。对于边缘的检测常常借助于空域微分算子进行,通过将其模板与图像卷积完成。

在现存的局部技术边缘检侧方法中,主要有一次微分(Sobel算子、Roberts算子等)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子、Robinson算子等)、基于样条修匀公式等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像,大多数提取算法均可以取得较好的效果。但对于边缘复杂、采光不均匀的图像来说,则效果不太理想,表现为边缘模糊、边缘非单像素宽、弱边缘丢失和整体边缘的不连续等方面。在噪声较大的情况下常用的边缘检测算法,如Marr算子、递归滤波器和canny算子等都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者先对图像进行局部拟合,然后再用拟合的光滑函数的导数来代替直接的数值导数。Canny算子较为简单,而且考虑了梯度方向,效果比较好。

基于边缘的图像分割方法存在的主要问题是容易产生对边缘点的错误跟踪,可能产生伪边缘、不连续边缘和边缘丢失,不能保证边缘的封闭性,具有灵敏性和确定性不足的问题。

3 基于区域的分割方法

基于区域的图像分割技术以区域为处理对象,依照共同的图像属性划分图像区域。分割的目的是把图像中的每一个像素都赋予一个类别属性,使得具有预定意义的像素都聚集在同一个类别中。这样的属性包括:1)原始图像的强度值,或基于图像算子的强度计算值;2)每个图像区域的独特的纹理或模式;3)提供多维图像数据参数。

用于区域分割的主要有:特征聚类、阈值、区域生长、分裂合并等方法,主要依赖于图像中区域的连续性。其中,区域生长的基本思想就是组合邻近的像素或者收集具有相似特征的像素,从而将具有相似性质的像索集合起来构成区域。首先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素合并到与种子像素所在的区域中;分裂和合并技术的思想是将整个图像分成若干个互不相交的图像块,对每块进行分割,然后根据块与块分割特征进行聚合,甚至可以一开始把每一个像素看成一块即一簇,然后再不断聚合。

基于区域的方法是将像素归类为一致区域。当区域一致准则比较容易定义的时候,这种方法能取得较好的效果,并且比基于边缘的方法更能抗干扰。但是,基于区域的方法在时间和空间上代价都比较大。区域生长本质依赖于种子像素的选取以及像素和区域检测的顺序。而区域分裂由于分裂算法的原因,其产生的分割结果太趋于正方形。

4 基于特定理论的分割方法

基于特定理论的分割方法有很多,常见的有基于数学形态学的图像分割、基于形变模型的图像分割、基于分形的图像分割、基于神经网络的图像分割、基于多分辨率的图像分割、基于知识的图像分割、基于聚类分割法、基于模糊集理论的方法、基于Snakes模型的分割方法、基于FCM(模糊C均值算法(Fuzzy C-means)的分割方法、基于小波变换的分割方法、基于等周算法的分割方法、基于MRF的分割方法、基于Rough Sets的分割方法、基于互信息量的分割方法、基于样条的分割方法等等。以上方法在许多文献中都已经得到论述,本文主要对支持向量机方法进行论述和验证。

5 基于支持向量机的分割方法

支持向量机(Support Vector Machine,简称SVM)是Vapnik等人提出的、基于统计学习理论(SLT)的一类新型机器学习方法,该方法是对结构化风险最小化归纳原则(Structural Risk Minimization Inductive Principle)的近似,能较好地解决了小样本机器学习问题。

5.1 广义最优分类面

设H为分类线,H1,H2分别为过两类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开,而且是分类间隔最大。分类线方程为g(x)=(ωx)+b。

5.2 线性可分的SVM

使分类间隔最大实际上就是对推广能力的控制,这是SVM的核心思想之一,统计学习理论指出,在N维空间中,设样本分布在一个半径为R的超球范围内,则满足条件‖ω‖A的正则超平面构成的指示函数集:

f(x,ω,b)=sgn{(ωx)+b}

sgn()为符号函数,上式的VC维满足下面的界

hmin(「R2A2」,N)+1

5.3 非线性的SVM

为了解决高维计算问题,Vapnik等人提出使用SVM作为超平面分割方法的扩展,因为在分类判别式函数中只涉及训练样本之间的内积运算(xix),根据泛函的有关理论,只要一种核函数K(xixj)满足Mercer条件,它就对应某一变换空间中的内积。因此,在最优分类面中采用适当的内积函数K(xixj)就可以实现某一非线性变换后的线性分类,而不增加计算复杂度。

最有分类判别函数为:

5.4 核函数

SVM中不同的内积核函数将形成不同的算法,目前研究最多的核函数主要有三类:

一是多项式核函数:K(xxi)=「(xxi)+1」q所得到的是q阶多项式分类器;

二是径向基函数(RBF):

所得分类器与传统RBF方法的重要区别是,这里每个基函数中心对应一个支持向量,它们及输出权值都是由算法自动确定的;

三是采用Sigmoid函数作为内积,即:

K(xxi)=tanh(v(xxi)+c)

支持向量机是实现模式识别的工具之一,在分类方面,具有全局优化、适应性强、理论完备、训练时间短、推广性能好等优点。而图像分割的核心之一也是图像像素的分类问题,因此采用支持向量机工具实现图像分割问题是可行的和有效的,并已经得到理论和实验的验证,加之集合修剪法的应用,大大提高处理的速度。

6 展望

图像分割中运动估计研究 第8篇

图像序列运动估计是通过分析图像序列,从而得到图像全局或局部物体运动量的一种重要技术方法,广泛应用于图像超分辨率重建[1]等各种领域。光流法是一种高精度运动估计算法,在最近得到了较大发展。其中,基于局部的Lucas-Kanade光流法[2,3],算法简单,运算量较小,杜绝了误差全局传播的可能,但在小邻域内容易导致孔径问题,获得的光流场平滑性较差。HornSchunck方法[1]计算光流场快速有效,结果平滑性好,但平滑性限制也使边界信息部分丢失。

提出一种新的运动估计算法,在Horn-Schunck光流法的基础上,引入图像结构不变假设,利用图像的梯度不受光照变化和图像偏移的影响,对图像进行初步的简单处理。再运用K-Mean法对其进行聚类,将图像中运动情况不同的物体分割开来。最后利用各个聚类中心的仿射参数对前面用光流法获得运动场进行矫正,使得结果更加准确。该算法在不影响运动场平滑的基础上,降低了运动边界处的模糊,有效保留了边界信息。

1 Horn-Schunck迭代光流法

图像序列I(x,y,t)上的点(x,y)在平面坐标上的瞬时变化率(u,v)=(dx/dt,dy/dt)称为光流矢量。光流矢量函数的二维图像坐标平面域称为光流场(即2D速度场)。光流法的目的就是准确地估计出二维图像的速度场。I(x,y,t)经过时间Δt后移动(Δx,Δy)后得到相应的图像序列为I(x+Δx,y+Δy,t+Δt),对于同一个点,有:

式(1)右侧泰勒展开后,并令Δt0得到:

式(2)即是光流法的基本等式。U=(u,v)有两个变量,而只有一个方程,求解U的两个分量必须附加另外的条件。平滑性假设[4]是一个有效的正则化假设,一般被称为平滑性限制,可被表达为积分式:

为了尽可能地满足光流限制(2)和平滑性限制(3),由这两个限制条件产生的下列能量函数应取最小值:

上式中正数α为第一项(数值项Edata)对应第二项(平滑项Esmooth)权重,则光流场(u,v)为:

使得能量函数为最小值的解(u,v)应该满足此能量方程的Euler-Lagrange方程:

采用近似值替代Δ算子,式(6)可改写成:

使用Gauss-Seidel迭代法,可得到Horn-Schunck方法的迭代模型:

平滑性限制的引入,使得到的结果平滑性更好。但边界的模糊使边界信息部分丢失。

2 基于图像结构不变约束的光流法

基于图像光照恒定假设的光流法存在对光照的变化敏感的缺陷。在图像光照存在较小变化时,图像的梯度[5]是不受光照变化和图像偏移影响的标准量,对于光流场的计算很有帮助。假设图像结构不变,即:

将Δt归一化为1,上式可以表示为:

式中:表示图像的空间梯度,同样它具有线性叠加性质。因为图像结构不变约束式(9)的加入,式(4)的第一项相应的变成:

式中:γ表示两种约束间的权重。由于平方使图像的边界对函数有较大影响,应用凹函数ψ(s2)来获得鲁棒性更好的能量函数[6,7],则式(10)变为:

式中:。Esmooth(u,v)和E(u,v)相应的变为:

使得能量函数为最小值的解(u,v)应该满足此能量方程的Euler-Lagrange方程:

式中:

与Horn-Schunk方法相同,可以使用近似值代替▽3算子,并运用Gauss-Seidel迭代法计算光流场(u,v)。

3 结合基于K-Mean聚类算法图像分割的光流法

光流法计算运动场时出现的运动边界模糊和边界信息丢失主要是由在一条运动边界两边的物体运动情况不同造成。因此,如果能够将图像中不同运动情况的物体分割开来,然后独立看待它们的运动场,可以很好地解决物体边界处运动场模糊和边界信息丢失情况。根据像素点的运动情况不同,将图像分割成不同的物体,就是对图像中的像素点按运动情况聚类。K-Mean聚类算法[8]以其简单有效性适合解决此类数据聚类问题。按照聚类的一般方法,需要用一个向量作为特征向量来表示物体的运动情况。本文以仿射运动模型的参数作为特征向量。仿射运动模型(affine motion model):

除了物体的边界区域,物体的运动情况都是连续的,将图像分成不重叠的块后,将每个小块作为一个对象,然后进行分割。首先需要计算每个块的仿射运动参数,方法如下:

根据仿射运动模型联立方程:

式中:{(x1,y1),(x2,y2),,(xi,yi)表示参考块中各个点的坐标;{u(x1,y1),u(x2,y2),,u(xi,yi)}表示其在x轴方向上的运动分量。用:

重新表示方程(15)得到:AP1-Uu=0。根据最小二乘法,超定方程的解为P1=(ATA)-1ATUu。

同样计算得到仿射运动模型的其他参数[p4,p5,p6]T=-(ATA)-1ATUv。其中:

在得到每个块的仿射运动参数P=[p1,p2,p3,p4,p5,p6]T后,根据仿射运动参数对图像中的块进行分类,分类的具体步骤如下:

(1)取一个较大的值K(多于图片中运动物体的个数);

(2)用K-Mean聚类法对图像中的块进行聚类,得到K个聚类中心Ci(i=1,2,,K);

(3)计算Ci(i=1,2,,K)中每两个聚类中心之间距离Li,j=‖W(Ci-Cj)‖,i,j∈K,i≠j。W为仿射参数P的权重,一般的取值平移分量p3,p6的权值比旋转分量p3,p4,p4,p5的权值大。当Li,jT则将两个分类合并,重新计算新的分类的聚类中心;

(4)将新的聚类中心作为K-Mean聚类的初始聚类中心,回到(2),直到步骤3中没有出现新的合并。

将包含对象很少且位置分散的聚类中心从全体聚类中心中删除,认为剩下的聚类中心Ci,i=1,2,,K'(K'表示剩下得聚类中心数)可以代表不同物体的仿射运动参数。得到新的聚类中心后,将图像中每个像素点作为待分类对象,再次进行分类。像素点的分类原则是:假设点[x,y]通过光流法计算得到的运动矢量为Ux,y=[ux,y,vx,y];将上面得到的聚类中心Ci,i=1,2,,K',和点的坐标代入仿射运动模型函数,分别计算出点[x,y]按照不同的运动情况得到的运动矢量。将点[x,y]归类到于Ux,y距离最近的所属于的聚类中,即聚类的结果为:

属于相同聚类的点,满足相同的仿射模型,则视为同一个物体,从而实现图像的分割。同时物体具有空间连续性,可以对图像分隔的结果进行一次平滑滤波,纠正因为光流场计算不准确引起的分隔出错的点。这样得到最终的图像分割结果。在实现了图像中不同物体的分割,又获得了每个物体运动的反射参数(即对应的聚类中心)之后,可以对原来光流法初步获得的运动场进行矫正。矫正的具体方法如下:点[x,y],分类属于Ck,通过光流法计算得到的运动矢量为Ux,y=[ux,y,vx,y],根据聚类Ck的仿射参数计算获得的运动矢量为Ux,y'=[ux,y,vx,y]。则矫正后的结果为:

式中:α∈(0,1);T为一正数。式(17)表示当Ux,y,Ux,y'差距不大时,最终的场由它们共同决定,否则认为得到的光流场具有明显误差,结果由Ux,y'单独决定。

4 实验结果

本文以序列mobile_qcif中的2帧图像作为测试对象,以验证本文算法的有效性。图1、图2显示了不同的光流法进行运动估计的结果。

从图中看出Lucas-Kanade可大致地获得图像的运动场,但得到结果平滑性较差。在加入图像结构不变假设后,算法获得运动场在运动边界处有了一定的改善。

5 结语

本文的算法保持了Horn-Schunk法结果的平滑性,在运动边界处的结果有明显的改善,保留了图像的边界信息。

摘要:为了改善运动估计中传统光流法处理的图像存在平滑性不好,边界信息丢失等缺点,提出了一种新的图像运动估计方法。该方法加入图像结构不变假设,降低光照变化的影响,并利用K-Mean聚类法对图像分割矫正,使得运动估计结果在保持平滑的基础上,更好地保留图像的边界信息。实验结果表明,该算法比传统光流法在运动边界问题的处理上更有好的改善。

关键词:运动估计,光流法,K-Mean聚类,边界信息

参考文献

[1]HORN B K,SCHUNK B G.Determining optical flow[J]. Artificial Intelligence,1981(17):185-204.

[2]URAS S,GIROSI F,VERRI A,et al.A computational approach to motion perception[J].Biological Cybernetics, 1988(60):79-87.

[3]POLVERE Mario,NAPPI Michele.Speed-up in fractal image coding:comparison of methods[J].IEEE Transactions ?? on Image Processing,2000,9(6):1002-1009.

[4]LEE Tzann-Shin.Lagrangian modeling and passivity-based control of three-phase AC/DC voltage-source converters [J].IEEE Trans.on Industrial Electronics,2004,51(4): 892-902.

[5]MOGHADDAM M Ebrahimi,JAMZAD M.Finding point spread function of motion blur using radon transform and modeling the motion length[C]//Proceeding of the 4th IEEE International Symposium on Signal Processing and Information Technology.Rome,Italy:IEEE,2004: 314-317.

[6]POLVERE Mario,NAPPI Michele,Speed-up in fractal image coding:comparison of methods[J].IEEE Transactions on Image Processing,2000,9(6):1002-1009.

[7]YAHAGI T,HAGLWARA M,YAMAGUCHI T.Neural network and fuzzy signal processing[M].Beijing:Science Press,2003.

相关文章
婚礼安排表范文

婚礼安排表范文

婚礼安排表范文(精选7篇)婚礼安排表 第1篇婚礼准备及婚礼日程安排表■婚礼筹备计划1.决定婚礼日期、地点、仪式及婚宴方式2.确定婚礼预算...

1
2025-09-22
昙花静静开随笔

昙花静静开随笔

昙花静静开随笔(精选3篇)昙花静静开随笔 第1篇小学生作文:昙花开了正文:国庆节的晚上,我照例去看昙花是否开了.这次惊奇地发现昙花开...

1
2025-09-22
沪教版三年级下册语文周周练7周

沪教版三年级下册语文周周练7周

沪教版三年级下册语文周周练7周(精选10篇)沪教版三年级下册语文周周练7周 第1篇第7周周练1、圈出词语中的错别字,并改正在横线上:迫不...

1
2025-09-22
患者写给医院的一封感谢信

患者写给医院的一封感谢信

患者写给医院的一封感谢信(精选14篇)患者写给医院的一封感谢信 第1篇患者写给医院的一封感谢信尊敬的各位领导:你们好!我是一名来重庆...

1
2025-09-22
欢度新年晚会活动策划方案

欢度新年晚会活动策划方案

欢度新年晚会活动策划方案(精选12篇)欢度新年晚会活动策划方案 第1篇晚会主题:待定( 备选:old if not wild we are young fear...

1
2025-09-22
河北毕业生就业信息网

河北毕业生就业信息网

河北毕业生就业信息网(精选14篇)河北毕业生就业信息网 第1篇河北立法:帮助高校毕业生就业针对当前高校毕业生就业难的现状,经河北省十...

1
2025-09-22
合并同类项参考例题

合并同类项参考例题

合并同类项参考例题(精选14篇)合并同类项参考例题 第1篇合并同类项例1 判断下列各式是否正确,如不正确,请改正.(1)3x23x2x2...

1
2025-09-22
话题作文指导专题

话题作文指导专题

话题作文指导专题(精选8篇)话题作文指导专题 第1篇无愧我心 人可以欺骗一切,但唯独无法欺骗自己的心灵,心灵是比雪山天池还要澄明清澈...

1
2025-09-22
付费阅读
确认删除?
回到顶部