正文内容
动态图像识别范文
来源:漫步者
作者:开心麻花
2025-10-11
1

动态图像识别范文(精选8篇)

动态图像识别 第1篇

1 火灾火焰或者火灾早期高危点的检测

红外图像采用灰度图像来描述视场中事物的红外特征图像中的每个像素都使用中的一个整数表示该点的温度场特征。由于火灾的早期可疑点和火灾火焰都具有相当明显温度场特征,可以使用设定温度阈值的方法,迅速有效地发现在红外摄像头视场中的火焰和可疑火焰点。

根据摄像头的内参数,可以求算出红外图像灰度数值空间和温度空间所存在的线性转换关系,根据实验,可疑火灾和火焰的温度场一般如表1所示。

下面,使用表1中的数值来设置图像分割的阈值,所得到的图像为t(x,y):

式中:x,y为像素坐标;g(x,y)为该坐标的灰度值。

假设捕获的两帧图像为t1(x,y)f1(x,y),t2(x,y),对此两帧图像做异或运算,取其灰度值信息,得到一个二值图像,分辨出两幅图像的不同,当t(x,y)的灰度值超过设定的阈值T,即说明图像中可能存在火灾火焰或者火灾早期高危点

2 火焰检测与判别

2.1 可疑火焰高危点的识别

当可能存在火灾高危点和火灾火焰时,需要根据火焰的其他温度场的动态特性来判断是否为真的火灾或者火灾高危点。火灾探测信号的变化率是一个重要的特征,对于如红外摄像头的感温探测器的输出信号,当温度上升率超过一定值的时候,表明温度发生了急剧的变化,这是可能导致火灾的典型特征[1]。

对上文的阈值方法已经分割出的可疑区域g(x,y),采用微分运算求算其可疑点的温度变化率来辨识其是否火灾早期高危点。对应的信号变化值进行以下的近似计算做绝对值运算:|g1(x,y)-g2(x,y)|。其中g1(x,y),g2(x,y)为相邻两帧的火灾可疑区域。

由于红外摄像头帧率恒定,所以采样信号时间t作为信号变化斜率的时间间隔。根据实验和文献,温度升高率超过斜率阈值,可判定为早期火焰高危点。

式中:S为设定的火灾高位点温度斜率阈值;Δt为帧间时间。

2.2 火焰识别

红外图像与普通彩色图像相比,虽然可以捕捉明显野外景观的红外特征,但是无法排除如变电站、高压电线等无火灾危险的红外辐射源以及其在镜面上的反射的干扰。这是红外图像火灾检测所独有的缺陷,因而采用彩色图像的火焰识别算法无法解决该问题。根据野外的火灾火焰是一种不稳定且不断发展的火焰的特点。对上文分割出的疑似火灾高危点和火灾火焰区域,对其中心做x向,y向和±45°的梯度运算。由于火焰飘动的动态随机性,其相邻两帧在上述四个方向的图像梯度值将会有较大的波动。对于稳定的红外辐射源如发电机、输电线,其灰度梯度值则相对稳定,不会有很大的波动。由此可以使用它作为识别火焰的判据。

已分割出的高危区域和火焰区域中心点为在四个方向上逐像素点做差值运算,来近似四个方向的梯度。以水平方向为例,以R5为中心的区域33区域,用下述方法计算梯度值,再用同样的模板套用计算R6的梯度值,将火焰边界内所计算的一系列梯度值的计算结果保存在单链表Q1中,当采集下一帧,重复上述步骤,记录为Q2,比较Q1和Q2两者的差若大于预先设定的火焰梯度阈值既可以判定为火焰。梯度计算如下:

竖直:grad(R5)=2R6+R3+R9-2R4-R1-R7

水平:grad(R5)=2R2+R1+R3-2R8-R9-R7

正45°:grad(R5)=2R3+R2+R6-2R7-R4-R8

负5748326

3 实验结果与分析

3.1 火焰检测试验结果与分析

这里采用蜡烛来模拟火灾火焰,采用上文中所述的温度梯度算法得出的部分结果如表2所示。

从实验结果可以看出,非火灾红外源温度梯度值相对稳定,而火焰的温度梯度值跳变较大,该算法有较强的识别能力。

3.2 火灾高位点火焰检测与分析

使用逐渐变热的电烙铁来模拟火灾高危点,使用计算机视觉库OpenCV,执行上文所述的图像微分运算后,所标定出来的结果,可知火焰高危区域的灰度变化率在10/帧以上,即可判定其为火灾高危点,根据这一特征,该算法成功地探测出了火灾高危点的位置。如图1、图2所示。

4 结语

该算法使用阈值运算、微分运算和改进的梯度算子结合图像的动态特征来判断火焰和火焰高危点的算法能够有效地识别火灾火焰和火灾高危点,提高火灾检测的准确度,降低误报率。通过实验,该算法能够快速地识别火灾火焰和早期火灾高危点,算法结构清晰,效率较高,便于工程实现。

摘要:针对普通彩色图像对早期火灾高危点的有限检测能力,提出一套基于红外图像动态特征的早期火灾识别算法,该算法使用改进的梯度算子结合图像的动态特征来判断火焰。通过实验,该算法能够快速地识别火灾火焰和早期火灾高危点。算法结构清晰,效率较高,便于工程实现。

关键词:红外图像,火灾火焰,动态特征,识别算法

参考文献

[1]吴龙标,方俊,谢启源.火灾探测与信息处理[M].北京:化学工业出版社,2006.

[2]王亚军,徐大芳,陈向成,等.基于火焰动态特征的火焰识别算法[J].测控技术,2007,26(5):7-9.

[3]杨俊,王润生.基于计算机视觉的视频火焰检测技术[J].中国图像图形学报,2008(7):1222-1235.

[4]闫厚,倪金生.基于网络摄像机的森林火灾烟火自动识别技术探讨[J].林火监测,2007(2):25-29.

[5]吴龙标,宋卫国,卢结成.图像火灾监控中一个新颖的火灾判据[J].火灾科学,1997(9):60-66.

[6]陈亮.基于Video4 Linux 2的图像采集程序设计[J].微计算机信息,2009,25(7):65-67.

[7]马颂德.计算机视觉[M].北京:科学出版社,1998.

[8]张进华,庄健,杜海峰,等.一种基于视频多特征融合的火焰识别算法[J].西安交通大学学报,2006,40(7):811-814.

[9]徐仕玲,赵敏,徐建波.野外早期火灾图像识别方法研究[J].计算机技术与发展,2008,18(6):214-216.

海讯图像识别 连结“天”与“地” 第2篇

随着宽带网和智能手机的普及,世界已进入“读图”时代,图片不仅仅停留在“看”的层面,而进入到“读”和“用”的阶段。所谓“读图”、“用图”,就是对图片内容进行检索与挖掘。目前的潮流,就是用计算机图像识别技术自动“读图”,提取用户所需要的信息。比如2011年,美国第一大报U.S. Today 用图像识别在橄榄球 Super Bowl 决赛报道文章上播放录像 ,同年,澳洲主要银行之一 CommonWealth 银行用图像识别把虚拟3D模型叠加于房产广告手册上 。亮风台(上海)信息科技有限公司(以下简称“亮风台”)就是应运这个“读图”时代而产生的。

亮风台成立于2012年,虽然成立时间不长,但其厚积薄发,致力于成为图像识别和增强现实领域的互联网高科技领头企业。公司拥有具备自主知识产权的图像识别和增强现实核心技术,专注于相关技术研究与应用,提供广告营销、教育出版、娱乐、电商、旅游等行业解决方案。

亮风台的联合创始人廖春元是图像识别、增强现实和人机交互领域的专家。早年,毕业于清华大学计算机系,之后赴美留学,获得博士学位。2008年至2012年,他在富士施乐硅谷Palo Alto研究院任正研究员,是该院迄今唯一在工作前四年内就三次获得年度杰出成就奖的华人科学家。期间他主持的多个研究项目获得世界范围内同行的高度评价,并在国际计算机协会ACM主办的ACM IUI和ACM Multimedia两个业内顶级会议上分别获得最佳论文和最佳论文入围奖。2012年,廖春元放弃国外的优厚待遇,回国联合唐荣兴、王迅和韩磊等联合创立了亮风台,海讯图像识别也就此诞生。说起最初归国创业的动因,廖春元笑称,一切为了理想。

记者:能说说“亮风台”的由来吗?当初为公司取名字的时候有何构想?

廖春元:亮风台是我们家乡一座山的名字。我和亮风台的联合创始人唐荣兴、王迅和韩磊都是高中同学。当时我们经常组织活动去爬山。亮风台海拔有三千多米,我们必须在山上过夜,虽然夜晚的山林很冷很黑,但第二天却可以看到很美的云海日出。公司的核心技术——海讯图像识别的英语译名HiScene的出处也来自这里,HiScene意为Highland Scene (高地风景),意为只有爬到高处,才能看到最美的风景,我们希望图像识别技术可以为用户带来如美丽风景一般的美好体验。HiScene代表了“高度”、“视野”和“团队”三方面的理念。公司虽然成立的时间不长,但我们的核心团队成员由世界级计算机视觉、机器学习和人机交互领域科学家、国内顶尖移动开发团队以及传媒专家组成。亮风台推出的“HiScene海讯”图像识别解决方案应用平台,致力于把技术和商业相结合,以“识别图像价值,超越媒介体验”为目标,目前已经在新媒体、电子商务、广电视讯等领域为合作伙伴提供快捷接入、扩展丰富的图像识别整体应用解决方案。

记者:图像识别在国内还属于比较新鲜的事物,能否介绍一下图像识别技术?

廖春元:所谓图像识别技术,简单的来说,就是计算机通过对图像进行特定处理,理解其内容,从而找到用户所需要的信息。这些信息可能是一段文字,也可能是一段视频。公司的图像识别技术是基于HiScene互联新媒体发布管理平台实现的,这个管理平台是我们技术的关键所在,能识别的图像内容有多少,取决于这个后台数据库有多大。只要用户上传图片,系统就会自动将图片与后台数据库中的图片做对比,选出相似度最高的,然后自动回复相关信息。以图书为例,用户对着图书封面的任何一个区域拍照,然后通过我们的App或微信公共账号上传至云端,就可以识别出所拍图书的相关信息,如背景资料、相关介绍、版本等。我将图像识别技术称为“天”与“地”的连结纽带,“天”是在云端的多媒体数据库,“地”是线下媒体或实际的物体,而图像识别将两者很好地结合在了一起。

海讯图像识别技术的技术优势在于,首先我们有可以处理百万级以上的海量数据图片库,而且拥有高识别率。HiScene自有的技术可以在像素级别提取图片特征,用多种方法去除噪声,并用领域知识加以验证,多管齐下,提高识别率。对测试集识别正确率为 99%以上。另外,在手机本地优化以后,可以实现对图片进行实时处理,在手机上识别速度可以达到每秒10帧以上。最后,我们专门对移动设备进行优化:支持手机用户的各种操作姿势,比如不同角度、距离、光照条件,实现自然的用户交互体验。

记者:提取相关数据,使用户获得所需要的信息,这些都让人联想到现在很火的二维码识别技术,您认为图像识别技术与二维码相比,有哪些优势?

廖春元:二维码技术必须事先将每条待识别的信息制作成黑白相间的方块格子,你可以想象,在一张海报或是一本书上,有很多可识别区域的话,二维码的做法是在每一个可识别区域做一个二维码,这样会破坏原图的美感;另外,任何可以识别的物体必须加上二维码,这使得可被识别的物体具有很大的局限性。而海讯图像识别只需要一张没有做过任何特殊处理图片就能完成。我们的技术是基于最原始的数据,提取图片的特征,然后快速地在将数据库里的图片一一比对,最后将匹配图片的相关信息发送给用户。我们的图像识别技术识别力强,允许周边有物体遮挡物,并且识别面广,即使是早年发行的电影海报、图书或CD,只要在我们的数据库中有过注册,就能够被识别。

记者:图像识别是一个渗透性很强的技术,可以应用于很多领域,那么公司目前与哪些企业合作,发挥图像识别技术在该领域的作用?

廖春元:图像识别确实用途很广,可以被用于教育、广告、营销、会展、娱乐等各个领域。首先,我们利用海讯图像识别技术,提供移动AR新媒体解决方案,所谓AR,即Augmented Reality,意为增强现实,它通过突破性的多媒体展示方式,连结线上线下媒体。

nlc202309031908

公司与炫动传媒(以制作和发行《喜洋洋和灰太狼》闻名的国内儿童动漫龙头企业)结成战略合作伙伴,跟它旗下的《哈哈画报》等杂志合作开发创新的互动杂志。《哈哈画报》是一份集“视、听、闻”等多感官阅读的互动儿童读物。我们通过图像识别技术,将平面杂志与视频、动画、游戏结合在一起,提供全新的儿童娱乐和教育体验。孩子们只需下载 “哈哈探宝器”App,在有探索标示的页面移动摄像头,摄像头一旦移动到与所识别内容相匹配的画面上,手机就会播放相关多媒体动画。这种把对小孩子知识的灌输模拟成新奇探索的寓教于乐方式,对孩子来说更容易被接受。除了平面媒体之外,我们还与炫动传媒合作开发互动电视节目。只要孩子们在炫动卡通频道上酷地带节目播放期间,通过专用App扫描台标签到,就证明他这个时候确实是坐在电视机前,然后可以参与抽奖。

同时,公司还与政府合作,配合宣传。例如今年“五四”青年节前后,公司为共青团上海市委做了一个名叫“文明家族”的App,只需通过App扫描他们的宣传画,就可以播放相关文明公约的宣传视频。

另外,我们为知名艺术院校的教授设计了个性化名片,只要扫描名片上的指定logo,就能展现3D立体动画,并全面展示它在空间中的位置。这个应用可以被运用在房产宣传册和其他产品的营销当中,这种将虚实叠加在一起的方式,增强了现实效果。

除了为第三方提供图像识别解决方案,我们还拥有自己的产品,如“海讯识图”App和微信图像识别机器人——“图答应”。特别是“图答应”,将图像识别技术与方兴未艾的微信公共账户结合起来,能对用户上传的图片进行及时的回复,大大扩展了微信公共账号目前仅对关键字进行回复的功能,可以让商家很快开展更具交互性的网络营销。比如我们给宜家家居的微信账号装上了“图答应”之后,用户只需拍摄照片上传至宜家微信公共账号,即可获得家具安装视频。化妆品牌可以让用户拍新推产品的照片,参加抽奖活动,引导用户对品牌的关注。鉴于微信平台的数亿庞大用户数,图答应的应用前景极具想象空间。

无论是解决方案、“图答应”还是“海讯识图”App,其核心都是HiScene互联新媒体发布管理平台,关键技术和算法都融于其中,我们只是以此把它包装成不同的产品而已。

记者:目前,亮风台运营得很不错,前期推广也获得了一定的成功,那么您对于公司下一步的发展有什么规划?

廖春元:公司下一步发展的关键是继续完善HiScene互联新媒体发布管理平台,不断丰富平台的数据,随着云计算日益成熟,算法不断发展,以前难以处理的数据变得容易。

另外,公司希望通过宣传,让更多的用户知道和了解望风台和海讯图像识别。公司目前正和一些行业龙头,诸如安卓手机制造商合作,探讨如何将图像识别技术置入他们的摄像头。可以想见,将来的安卓手机摄像头不仅有摄影摄像的功能,还有识别功能,不需要下载图像识别App,只需这样打开摄像头的图像识别模式,就可以识别任何在管理平台注册过的商品或平媒。

此外,公司下一步打算和云南省旅游局合作,共同推动深度游。通过我们的图像识别技术,游客只需扫一扫,就能够通过文字、图片甚至视频全方位了解一块碑、一口古井、一座宫殿等等古迹背后蕴含的深厚历史积淀。

总之,亮风台将会始终专注于核心技术的研发,保持图像识别核心技术在业内领先,不断推动人机交互、视觉识别搜索技术以及产品的改进完善,为媒介、通信、电商、娱乐等行业带来变革,让人机交互体验更加立体、互动、智慧、宽广。我们利用图像识别的领先技术推动行业变革、为合作伙伴创造最大价值,实现“天”与“地”——线上线下的无缝连结。

动态图像识别 第3篇

关键词:轮廓波变换,红外成像,图像识别,动态识别

0 引言

如今, 红外目标图像识别技术已经广泛地应用于空间探测、遥感、现代农业等各个领域, 如在军事领域, 红外成像精确制导成为主要先进的制导方式。红外目标图像的动态识别具有超强的识别能力, 使得红外制导精度很高, 另外红外图像是热成像, 所以在夜间也不受影响, 因此红外制导成为当前一大发展趋势。在红外制导的过程中, 红外图像识别是最为关键的一步, 过去许多研究一直是基于小波变换进行的, 但是, 由于外界环境的干扰, 加之热成像仪的特点, 在过去的红外目标图像识别方面一直存在着一些问题。为很好地解决小波变换存在的问题, 轮廓波被提出并不断发展, 大量研究人员对基于轮廓波变换的红外目标图像识别进行了积极的探讨研究, 使得该技术的应用也十分广泛, 轮廓波变换在图像处理、消噪、压缩等方面与小波比较有着独特的优势, 也取得了十分可喜的效果。

1 小波变换存在的不足

小波变换与傅里叶变换的基本思想类似, 从信号处理的角度看, 都是将信号投影到一组基上来表示此信号, 此组基当成基函数能够生成某种特定空间。小波在此基函数上存在明显的一个特性, 即利用一个母小波或基本小波的函数, 可以实现同一尺度上的平移与不同尺度间的伸缩。通常能够把小波看成是均值等于0的平方可积函数:

函数ψ (t) 即基本小波或母小波, 它进行平移u和伸缩s时, 一组基函数就能生成:

对于任意一个平方可积函数f (t) ∈L2 (R) , 若ψ∈L2 (R) , 则其小波变换及相应的逆变换分别定义为:

其中被称为小波“允许条件”。根据该定义就能得知, 本质上可以将小波变换看成是原始信号内积上伸缩之后的小波函数簇的结果。小波进行正变换之后能够获得时频宽度不一样的小波系统, 从而和初始信号的各种强度和位置进行匹配, 实现局部化分析信号的目的。小波的聚焦属性能够使它对信号在某点周围的性态准确地感应, 使局部余弦基、加窗傅里叶、短时傅里叶、傅里叶及离散余弦等变换形式的频域和时域局部化间存在的矛盾解决。连续小波变换是将一维信号变换为二维信号, 所以它的冗余度比较大, 这样就能够对时移与尺度参数开展取样操作, 只通过时间-尺度面中的部分合适的离散点小波变换数值对信号进行反应, 并且将初始信号恢复。小波级数系数就是在离散化时间与尺度参数之后, 经过计算得到的小波变换的数值。

与FFT, DCT等相比, DWT使用了一组称为小波的局部振荡基函数取代了傅里叶变换中无穷振荡正弦基函数, 能够分析不同的尺度信号。然而, 小波变换在得到性能提升的同时, 也带来了一些缺陷与不足, 例如:变换域系数的振荡性、移变敏感性等。

(1) 小波系数的振荡性。因为小波是带通函数, 小波系数很容易在奇异点附近上下摆动。这将使得基于小波的运算变得更加复杂, 特别是奇异点 (对于二维情况则为奇异线) 的抽取更加困难。而且, 因为一个振荡函数经常在零值上下摆动, 信号中的奇异点将产生大系数是言过其实的。在小波与奇异点发生交叠的情况下, 完全可能产生很小的小波系数甚至零值小波系数。

(2) 小波系数的移变性。所谓移变性, 是指原始信号的微小移动将严重影响奇异点周围的小波系数的振荡模式。移变特性也使得基于小波变换的图像处理任务变得更加困难:相关算法必须能够处理由于奇异点移动造成所有可能的小波系数模式的变化。

(3) 小波变换的频谱混叠性。在传统的DWT变换中, 上采样和下采样是其中的关键步骤。但是, 下采样会导致混叠, 上采样则产生频谱映像。因此, 在采用Mallat算法的DWT分解与重构过程中, 本质上就存在着混叠问题。事实上, 如果逆小波变换是针对未做任何处理的正变换小波系数, 它可以完全消除这些混叠。然而, 实际的图像处理是要在小波域对小波系数进行处理 (例如门限化、滤波和量化等) , 这就打乱了正变换与逆变换之间微妙的平衡, 导致重构信号出现混叠。

(4) 二维小波变换缺乏方向性。对于二维离散小波变换而言, 由于它是采用一维小波张量积的形式来构造的, 因而它表示信息的能力只有三个方向, 分别是对角线、垂直与水平方向。即便如此, 对角线方向子带仍然存在严重的棋盘状频谱混叠现象。这就使得小波域的建模和对于几何图像特征 (例如脊和边等) 的处理变得非常困难。前面所述的小波包变换能够在一定程度上提高方向信息的表达能力, 但是由于通常需要采用寻优算法来寻找最优基, 运算速度没有保障。

2 轮廓波变换原理及优点

轮廓波变换的基本思想是在多尺度的基础上实现方向信息的提取。系统中的滤波器共分两块:其中一块是由Hi和Li构成的拉普拉斯金字塔滤波器, 它们两个结合在一起实现奇异点的分离任务;然后由另外一块——方向滤波器 (DFB) 完成奇异点的收集工作, 将方向基本相同的奇异点收集到一个基函数上进行更集中的描述。

该变换直接定义在数字离散空间, 便于使用计算机程序进行分析, 因此, 它的提出对于多尺度几何分析领域的研究具有很大的促进作用。该变换的冗余度为4 3, 也就是说, 变换之后的系数个数是初始图像信号的4 3倍, 这是一个很低的冗余度, 使得该变换能够应用于很多图像处理领域。

轮廓波变换作为一种新型的固定基二维离散变换, 属于非自适应变换的范畴。基本出发点是产生符合人类视觉特征的频率分割, 从而有效地提取方向信息。轮廓波变换具有诸多优点:

(1) 较低的冗余度:将轮廓波变换通过非可迭代滤波器组实现分离方向与多尺度分析两个过程, 并有频域分割形式, 非冗余的特点使其在压缩领域和图像编码领域具有更好的应用前景, 基于小波的轮廓波变换也具有最低的冗余度。

(2) 移不变特性:轮廓波变换在不严格要求存储空间和计算速度的情况下, 可以取较高的移不变水平, 随着计算机计算能力的提高, 该方法将会受到更多的重视。无下采样轮廓波变换的实现本质上是去除了轮廓波变换中所有的下采样和上采样运算, 而抗混叠轮廓波变换则只是修改了基本轮廓波变换在最细致尺度上的采样方法。另外, 在消噪方面的具体应用上, 特别是变换系数的处理问题上, 该变换也有突出表现。

(3) 抗混叠性:基本轮廓波的变换在相位信息和抗混叠能力两个方面, 都具有较好的能力。它虽然带来了两倍于基本轮廓波变换的冗余能力, 由于其巧妙的设计而换来的优异性能, 将可以广泛地应用于模式识别和目标跟踪等诸多领域。

轮廓波变换的研究可以看作图像中几何结构信息提取的一种研究方法, 它目前的发展可以从两个角度来审视, 这两个角度是微观和宏观。微观角度在于滤波器的设计, 宏观角度则在于框架结构的研究。

3 红外目标图像动态识别

如今, 红外目标图像识别技术已经广泛地应用于各个领域, 图1为基于轮廓波变换的红外目标图像动态识别系统工作流程, 下面对其进行简要叙述。

(1) 温度控制

本系统能够支持的热量度具有不一样的层次, 按照自身实际需求进行设置。温度模型属性属于全局参数的范畴, 可以在全部几何体上使用。通常能够按照项目实际需要手动设置与调整目标飞行器任意部位的温度。按照飞行高度、状态的不同动态选择需要的数值。

(2) 实时驱动

将目标加载到指定场景后, 下一步问题是如何将目标驱动起来, 从而使红外图像序列生成, 这一问题的实现要记录各种时刻下目标的飞行数据, 根据需要选择实时网络或数据文件传输上述数据。本系统在管理目标的运动特性参数时使用了统一的接口, 使用此接口接收并管理所有数据来源。

(3) 精度控制

该系统还能够进行物体的实时识别, 想要实现这一功能, 帧频控制的精度要更高。本文在对Vega循环进行控制时利用高精度定时器实现这一功能。使用步骤为:调用Query Performance Frequency () 函数得到机器内部定时器的时钟频率, 接着每次开始Vega渲染前, 调用Query Performance Counter () 函数, 从而得到现有状态下的计数值, 并和上一次的计数值比较, 求得差值;然后按照时钟频率将渲染前一帧需要的精确时长计算出来。若这一时长比预先设置的渲染周期小, 那么继续等待;当比预设周期大时, 开始渲染下一帧。该法的误差不会比1 f/s大, 因此图像识别功能的实时性要求能够得到满足。

(4) 图像识别系统

图像预处理技术是一些有效的改善图像质量的技术, 它的输出仍然是一个完整的形象, 旨在突出图像分割的特点。面临的问题是在图像预处理之后如何提取有效的特征, 然后决定分类。图像识别可以对图像分类, 它属于模式识别的范畴。特征提取和选择是分析数据预处理。由于有大量的原始图像数据, 需要将数据转换成一定数量的特征数据, 称为特征提取。为了提高分类处理的速度和准确性, 特征提取也必须选择一些代表, 要求其最小信息冗余, 并且希望能有规模、旋转并具有移不变性。其他特征:纹理特征、三维几何结构描述特征等。完成目标图像的分割后, 计算每个目标的一组特征量, 平均像素强度、最大像素强度和其他强度特征。特征选择的主要目的是获得一些最有效的特征量, 从而使同类目标有最大的相似性, 不同类的目标具有最大的相异性, 同时提高分类效能, 降低存储器的存储要求。

(5) 图像输出

生成红外图像时, 当分辨率是256×256的情况下, 速度能够超过200 f/s, 通过高精度帧频调控, 就能在200 f/s的条件下进行实时仿真, 这一功能的实际应用价值很高。将图像序列获得之后, 就能利用函数回调的过程, 通过Open GL接口将图像数据从显卡端获取, 实时网络就能得到实时数据。

4 结语

红外目标图像识别技术已经广泛地应用于各个领域。本文首先分析了基于小波变换的红外图像识别存在明显不足, 主要表现在小波系数的振荡性、移变性, 频谱混叠性以及二维小波变换缺乏方向性。然后介绍了轮廓波变换的理论, 轮廓波变换的提出和发展, 优点明显, 很好地解决了这些问题。依据理论分析, 设计开发了基于轮廓波变换的红外目标图像动态实时识别系统, 很好地实现了红外目标图像的动态实时获取, 应用前景广泛。

参考文献

[1]董卫军, 周明全, 黎晓, 等.基于小波分析的边缘检测技术研究[J].计算机工程, 2004, 40 (25) :38-39.

[2]张红岩, 张登攀.图象边缘检测二维小波算法研究与实现[J].中国工程科学, 2003, 5 (4) :62-63.

[3]李卓.红外动态图像生成技术[J].红外与激光工程, 2006, 35 (4) :388-391.

[4]娄树理, 周晓, 董言治.动态红外景象生成方法研究[J].红外与激光工程, 2004, 33 (4) :427-431.

[5]PO D D, DO M N.Directional multiscale modeling of images using the contourlet transform[J].IEEE Transactions on Image Processing, 2006, 15 (6) :1610-1620.

[6]LU Y, DO M N.A new contourlet transform with sharp frequency localization[C]//Proceedings of 2006 IEEE International Conference on Image Processing.Atlanta:IEEE, 2006:8-11.

[7]CUNHA A L, ZHOU J, DO M N.The nonsubsampled contourlet transform:theory, design, and applications[J].IEEE Transactions on Image Processing, 2006, 15 (10) :3089-3101.

[8]曹壬艳, 周莉, 宋丽玲.双波段图像在大空间建筑火灾探测中的应用[J].煤矿现代化, 2008 (6) :50-51.

[9]朱永松, 国澄明.基于相关系数的相关匹配算法的研究[J].信号处理, 2003, 19 (6) :531-534.

动态图像识别 第4篇

一、图像识别系统

一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。

二、图像识别方法

图像识别的方法很多, 可概括为统计 (或决策理论) 模式识别方法、句法 (或结构) 模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。

2.1神经网络识别方法

2.1.1人工神经网络的组成

人工神经网络 (简称ANN) 是由大量处理单元经广泛互连而组成的人工网络, 用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。

2.1.2人工神经网络的输出

对于某个处理单元 (神经元) 来说, 假设来自其他处理单元 (神经元) i的信息为Xi, 它们与本处理单元的互相作用强度即连接权值为Wi, i=0, 1.....n-1处理单元的内部阈值为θ。那么本处理单元 (神经元) 的输入为而处理单元的输出为式中, Xi为第i个元素的输入, Wi为第i个处理单元与本处理单元的互联权重。f称为激发函数或作用函数, 它决定节点 (神经元) 的输出。

2.1.3人工神经网络的结构

人工神经网络中, 各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。

2.1.4学习算法

1) 感知器模型及其算法

算法思想:首先把连接权和阈值初始化为较小的非零随机数, 然后把有n个连接权值的输入送入网络中, 经加权运算处理后, 得到一个输出, 如果输出与所期望的有较大的差别, 就对连接权值参数按照某种算法进行自动调整, 经过多次反复, 直到所得到的输出与所期望的输出间的差别满足要求为止。

2) 反向传播模型及其算法

反向传播模型也称B-P模型, 是一种用于前向多层的反向传播学习算法。

算法思想是:B-P算法的学习目的是对网络的连接权值进行调整, 使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算, 即对某一输入信息, 经过网络计算后求出它的输出结果;反向传播用于逐层传递误差, 修改神经元之间的连接权值, 使网络最终得到的输出能够达到期望的误差要求。

B-P算法的学习过程如下:

第一步:选择一组训练样例, 每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例, 把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层, 并按照某种原则 (能使误差向减小方向发展) , 调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤, 直到误差达到要求时为止。

3) Hopfield模型及其学习算法

它是一种反馈型的神经网络, 在反馈网络中, 网络的输出要反复地作为输入再送入网络中, 使得网络具有了动态性, 因此网络的状态在不断的改变之中。

算法思想是:

(a) 设置互连权值

其中xis是s类样例的第i个分量, 它可以为1或0, 样例类别数为m, 节点数为n。

(b) 未知类别样本初始化。Yi (0) =Xi 0≤i≤n-1

其中Yi (t) 为节点I在t时刻的输出, 当t=0时, Yi (0) 就是节点I的初始值, Xi为输入样本的第I个分量。

(c) 迭代直到收n-1敛

f为阈值型激发函数。该过程一直迭代到不再改变节点的输出为止。这时各节点的输出与输入样例达到最佳匹配。

总结:每一种识别方法都有自己的优缺点, 我们在今后的工作中需要把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来, 深入掌握各种工具的效能和应用的可能性, 互相取长补短, 开创模式识别应用的新局面。

摘要:图像识别技术的方法主要分为统计模式识别方法、句法模式识别方法、模糊模式识别方法以及神经网络识别方法, 本文在概述图像识别基本概念及基本技术的基础上, 着重对图像识别中神经网络识别方法进行分析。

基于图像配准的纸币图像识别方法 第5篇

关键词:纸币图像,图像配准,Harris角点特征,B-样条FFD模型

0 引言

图像配准是指对同一场景在不同时间、不同视角或不同传感器拍摄的两幅或多幅图像之间确定最佳匹配的过程, 广泛应用于计算机视觉、医学诊断、遥感图像处理等多个领域。根据变换模型的不同, 图像配准算法可以分为刚性变换和非刚性变换[1,2]。刚性配准既是针对图像的六个自由度 (三个平移分量、三个旋转分量) 的空间变换。目前的刚性配准算法研究已比较成熟, 可以达到较高的配准精度。非刚性配准则涉及图像更多的自由度变换, 主要思想是将非刚性配准问题看作一个优化问题, 即对待配准图像实施特定的空间变换得到与参考图像相似性测度最大的图像。

纸币图像包含有丰富的多光谱图像信息, 为了防伪目的纸币印刷采用多种防伪油墨, 在不同的光传感器下会呈现不同光谱图像, 主要是红外光图像信息和紫外光图像信息, 通过局部的防伪特征的检测可以实现纸币的检伪。

由于纸币有着相对固定的印刷格式, 将待检测纸币与参考纸币进行比较, 是一种比较有效的纸币图像分析方法。但同时纸币图像也具有两大不稳定因素:首先, 纸币是以纸张为介质, 容易受环境温度、湿度影响, 流通中在折叠磨损的作用下会发生难以估计的变化;其次, 纸币是极其复杂的印刷品, 图案多为细小线条构成, 这种局部纹理在低分辨率成像条件下, 表现极不稳定, 同时不同版次的纸币图案还会有一定的误差 (数值可达数毫米) 。所以, 待检测纸币与参考纸币就会有较大的差异, 纸币图像的这种特点则要求在纸币图像配准过程中既需要全局的刚性变换, 又需要局部的非刚性变换。

本文在分析纸币图像特点的基础上, 提出了分级的变换模型对纸币图像进行配准, 即首先对图像整体上进行刚性变换, 然后对图像采用局部的非刚性变换, 并取得了较好的配准结果。

1 纸币图像配准的分级变换模型

针对待配准纸币图像与参考纸币图像之间既存在整体上的刚性形变, 又有局部的非刚性畸变的特点, 单一的仿射变换已经不能满足纸币图像的配准, 本文采用由全局形变和局部形变组成的分级变换模型对纸币图像进行配准。分级变换模型可以进行如下的公式化描述:

整体的空间变换T (x, y) 分成两个步骤。首先, 对纸币图像进行全局的刚性变换Tglobal (x, y) 来描述待配准纸币图像与参考图像之间的整体刚性变换, 此时可以采用基于Harris角点特征的刚性变换模型作为图像整体刚性配准的空间变换模型。在此基础上, 对纸币图像进行局部的非刚性变换Tglobal (x, y) , 采用基于B样条的FFD模型[3,4]进行描述。具体公式为:

2 纸币图像配准

2.1 纸币图像预处理

纸币清分设备中, 实际上都采用高速扫描装置通过传感器来采集纸币图像, 在扫描时多会受到倾斜和侧向移动影响, 因此通常状况下就会存在一定程度的几何变形。图像采集过程中, 传感器紧贴纸币, 可以忽略视角、视距对于图像的影响, 同时纸币的原始形状是矩形, 发生几何形变后纸币图像仍可以保持为平行四边形, 因此可以通过检测纸币图像四条边沿, 就可以进行倾斜校正。图1为校正前后的纸币图像, 直接采用崭新、无折痕的纸币进行采样几何校正后作为参考纸币图像。

2.2 相似性测度

相似性测度是用来度量待配准图像和参考纸币图像之间的相似程度, 经典的相似性测度方法包括灰度差平方和 (SSD) 、互信息 (MI) 和互相关法。

目前, 互信息[5] (Mutual Information, MI) 法是一种广泛使用的图像配准的相似性测度方法。互信息是信息论的基本概念, 通过熵值来描述两幅图像的互信息, 表示两幅图像相互包含的信息量。若两幅图像完全相同, 则两幅图像的互信息值达到最大, 最大值为2, 即两幅图像越相似, 两者间的互信息值越大。图像A和B的熵分别定义为:

图像A和B的联合熵定义为:

这里, pA (a) 是图像A中像素值为a的概率, pAB (a, b) 是图像A和B灰度对 (a, b) 的联合概率密度。

图像A和B的互信息值MI (A, B) 可以表示为:

为了减少互信息对两幅图像重叠大小的敏感性, 文献[6]提出改进形式, 即归一化互信息 (NMI) :

互相关法也是一种图像配准常用的相似测度方法, 该方法比较适合处理基本相似的图像。常用的测度方法有相关系数、相关比率和局部强度均匀性测度等。这里采用了相关系数 (Correlation Coefficient, CC) , 具体公式为:

其中, fn和gn分别为图像相应灰度值, f, g分别为图像的灰度均值。相关系数CC取值范围[-1, 1], 相关系数值越大, 则图像的相似度就越高。

2.3 基于Harris角点纸币图像全局刚性配准

图像特征点由于定位准确, 并且匹配后的特征点可以直接用来计算图像之间的空间变换关系及具有计算量较小、特征点的相似度量对位置变换比较敏感、配准精度比较高等优点, 而得到了广泛研究和普及应用。同时, 纸币图像具有明显的角点信息, 清分系统对时间效率要求比较高, 而且也可以减少纸币图像局部残污造成的影响。本文采用基于Harris角点特征[7], 对纸币图像进行全局的刚性配准。

Harris角点提取方法是由Harris和Stephens在1988年提出的, 角点特征是通过图像的一阶梯度提取的。Harris算法通过计算每个像素点自相关矩阵M, 并分析自相关矩阵的特征值来提取角点。其中:

这里, w (x, y) 表示高斯平滑因子;Ix, Iy分别代表图像中该点在水平、竖直方向上的梯度。在实际应用中, 角点相应函数为:

这里, Det (M) 为M的行列式的值, Tr (M) 为M的迹, k为经验值, 通常取0.040.06。当CRF大于设定的阈值threshold, 并且在规定的邻域内取得局部极值时, 该点为候选角点。

在纸币图像配准中, 参考纸币图像是固定的, 利用Harris角点算法提取纸币图像上的角点, 从这些检测到的角点中选择一定数目的具有明显代表性的角点特征作为参考纸币图像的角点特征, 如图2所示。

此后, 即需要进行角点匹配[8]和控制点的选择过程。在纸币图像配准过程中, 首先提取待配准图像的角点特征, 然后对参考纸币图像上的角点与待配准图像中的角点特征进行匹配, 同时选择控制点。

角点匹配的具体过程为:对于参考纸币图像上的每一个角点Corner, 建立以角点为中心的大小KK (K为奇数) 的模板, 在待配准图像上环绕该角点坐标 (2K+1) (2K+1) 范围内搜索所有角点, 并以每个角点为中心建立大小为KK的模板, 然后对角点Corner的中心范围内所搜索到的全部角点进行模板操作 (这里使用相关系数法) 。最后, 选择相关系数最大的角点作为Corner角点的候选配准角点。对参考纸币中的所有角点均执行相同的操作, 这样就为参考纸币图像中的每个角点都找到相应的候选匹配角点。

此后进行的控制点对的选择过程为, 分别以候选匹配角点对坐标为中心建立大小为kk (k

由于纸币图像经过几何校正后, 可以认为从待配准图像到参考图像的坐标变换仅存在位移及伸缩变换, 仿射变换模型可以表示为:

这里, Δx, Δy分别为偏移量, a, b分别为水平及垂直方向上的伸缩系数。将选取的两个控制点对代入式 (9) 中, 即可以得到所有的仿射变换参数, 根据变换参数就可以对纸币图像进行全局的刚性配准。

2.4 基于B样条FFD模型纸币图像局部配准

在全局刚性配准的基础上, 接下来就是找到纸币图像的局部的非刚性形变。由于纸币的印刷误差及纸张形变, 为了提高配准精度, 本文采用基于B-样条的FFD模型来描述纸币的实际形变。FFD模型的基本思想是通过操纵嵌入在图像上网状控制点的扰动, 来获得参考图像的实际形变模型。纸币图像的FFD控制网格, 如图3所示。

如图3, 在纸币图像的空间Ω上建立一个KL个控制点组成的规则网格Φ, 网格之间的交点为控制点。δx, δy分别为控制点之间的横向、纵向距离, ij表示控制网格的第i, j个控制点, 其中, i=1, , K, j=1, , L。T: (x, y) (x', y') 表示待配准图像上任意像素点 (x, y) 到参考图像相对应像素点 (x', y') 的形变。给定一个网格控制点ij, 则纸币图像上任意像素点的变形T (x, y) 定义为:

B样条具有局部控制特性, 对图像上任意一像素点的变形仅受到周围44邻域的控制点的影响, 采用B样条可以更有效率地计算具有大量控制点的图像。

2.5 基于图像配准的多光谱纸币图像识别架构

基于图像配准的多光谱纸币图像识别架构如图4所示。

3 实验结果与结论分析

如图5所示, 以图像 (a) 为标准参考纸币图像, 首先对待检测纸币图像 (b) 进行基于Harris角点特征的仿射配准, 配准前的差值图像为 (c) , 配准后的差值图像为 (d) , 然后在此基础上对待检测纸币图像进行基于B-样条的FFD非刚性变换, 使用灰度差方和梯度下降法作为配准的优化函数和优化方法, 配准后的差值图像为 (e) 。

相似纸币识别是在纸币图像全局配准的基础上, 计算两图像之间的相似度, 这里使用归一化互信息 (NMI) 作为相似度测度, 当相似度超过给定的阈值δ时, 则判定为具有相同面值面向。实验中选用美元纸币50美元、20美元、10美元和5美元四种面值的纸币图像, 每种面值大约有120个样本, 共有四种面向。通过对样本训练学习, 当相似度阈值δ=1.10时, 只有大约3%的误识情况。

纸币红外防伪特征检测是检测纸币红外图像中关键防伪特征图案与标准图像之间的相似程度, 全局的刚性配准不能满足鉴伪要求的高精确度, 所以要先对纸币红外图像进行局部非刚性配准, 在此基础上检测关键防伪区域。实验中选取50美元和20美元两种面值纸币图像, 选择头像和建筑作为关键区域, 而选用相关系数作为相似度测度。实验结果显示, 关键区域的相关系数值基本都超过0.75。

本文提出的分级配准模型能很好完成多光谱纸币图像的配准, 并且在相似纸币识别和关键红外防伪特征检测方面取得了良好的效果。

参考文献

[1]王海南, 赫重阳, 雷方元, 等.非刚性医学图像配准研究综述[J].计算机工程与应用, 2005, 41 (11) :180-184.

[2]彭晓明, 陈武凡, 马茜.基于B样条的快速弹性图像配准方法[J].计算机工程与应用, 2006, 42 (11) :186-189.

[3]SEDERBERG TW, PARRY S R.Free-form deformation of solid geometric models[J].ACM SIGGRAPH Computer Graphics, 1986, 20 (4) :151-160.

[4]RUECKERT D, et al.Nonrigid registration using free-form deformations:application to breast MR images[J].IEEE Transactions on Medical Imaging, 1999, 18 (8) :712-721.

[5]MAES F, et al.Medical image registration using mutual information[J].Proceedings of the IEEE, 2003, 91 (10) :1699-1722.

[6]STUDHOLME C, HILL D L G, HAWKES D J.An overlap invariant entropy measure of 3D medicalimage alignment[J].Pattern Recognit ion, 1999, 32 (1) :71-86.

[7]TRAJKOVIE M, HEDLEY M.Fast corner detection[J].Image and vision computing1998, 16:75-87.

九芯片图像识别研究 第6篇

关键词:自动键合机,单芯片图像识别,九芯片图像识别,工作时序

0 引言

在半导体器件封装中, 一般采用自动键合机来将芯片键合到框架上。自动键合机首先识别芯片的好坏, 然后将合格的芯片移动到屏幕中央, 接着焊头运动, 通过吸嘴拾取芯片, 并将芯片键合到框架上。因此自动键合机识别芯片、并将合格芯片移动到屏幕中央的时间将会直接影响自动键合机的运行速度, 要求从识别到将合格芯片移到屏幕中央位置时间越短越好, 以在工作时序上不单独占用整机运行时间为宜。

1 早期单芯片图像识别方式

早期自动键合机主要采用单芯片图像识别方式, 例如香港ASM公司生产的AD809自动键合机, 拾取一个合格芯片之后, X-Y工作台依次按水平方向 (或垂直方向) 运动一个设定的步距 (一般设定为相邻芯片之间的平均间距) , 将下一个芯片移到识别范围内, 然后判断芯片是否合格。如果合格, 则X-Y工作台将合格芯片精确移到屏幕中央, 然后吸嘴拾取芯片, 并键合到框架上;如果不合格, 则按水平方向 (或垂直方向) 再运动一个设定的步距, 将下一个毗邻芯片移进识别范围, 进行识别, 合格的话则拾取, 并键合到框架上, 如果不合格, 则如前所述循环, 直到识别到合格芯片为止。

这种芯片识别方法简单实用, 但缺点是当晶圆上有很多不合格芯片, 或者转行时, 芯片识别将单独占用整机运行时间, 从而影响整机的运行速度。如图1是香港ASM公司AD809的工作时序图[1], 它正常键合一个芯片的周期大约是720 ms, 焊臂回到高位并且离开预拾取位置去键合, 然后再回到预拾取位置的时间就是留给芯片识别的时间, 大约为500 ms。

X-Y工作台将一个合格芯片移到屏幕中央, 经过了三个阶段。

(1) X-Y工作台沿水平 (或垂直) 方向移动一个步距, 使下一个芯片进入识别范围, 需要占时15~20 ms, 包括X-Y工作台从启动到停稳的时间。

(2) 判断芯片合格与否。芯片不合格的类型主要有:墨点芯片、崩角芯片、旋转超过规定角度的芯片, 当两个芯片距离小于规定值时, 这两个芯片也会被判定为不合格。芯片识别的过程就是将摄取的芯片图像进行二值化处理, 使芯片与其背景区分开来, 如图2所示, 然后自动键合机通过计算设定范围内的白像素, 从而判定该芯片是否合格, 整个识别时间占时约为80~90 ms。

(3) 如果芯片合格, 则X-Y工作台进行微运动, 使合格芯片位于屏幕中央, 以便吸嘴准确拾取芯片。这个过程占时5~10 ms;如果芯片不合格, 则X-Y工作台沿水平 (或垂直) 方向继续移动一个步距, 使毗邻的芯片进入识别范围。

因此自动键合机识别一个芯片, 并将合格芯片移到屏幕中央的时间为100~120 ms, AD809一般设置为连续识别四个芯片为不合格芯片 (或者没有芯片) 后就换行, 也就是说每次换行或者连续碰到五个以上的不合格芯片时, X-Y工作台再将一个合格芯片移到屏幕中央的时间都会超过500 ms, 这时焊臂将停留在预拾取位置, 自动键合机的其它动作也会暂停, 都在等待X-Y工作台将合格芯片移到屏幕中央之后才会动作, 所以自动键合机整个运动周期因芯片识别而被延长了。

自动键合机运动周期延长, 直接降低了其生产效率, 特别是在共晶粘贴方式下, 可能会由于等待识别芯片的时间过长, 导致上一个已键合的芯片仍然停留在高温炉上, 从而损坏芯片。

2 改进的九芯片图像识别方式

九芯片图像识别方式采取一次提取芯片图像, 同时识别多个芯片的方式, 如图3所示, 与单芯片识别方式相同的是在屏幕中央有一个方框, 其大小等于两个相邻之间芯片的间距, 这是中心芯片的识别范围;在其外围还有一个大方框, 大小等于一个芯片与其顺序第四个芯片之间的间距, 除了中心芯片, 它还包含了其外围的八个芯片, 每个芯片的识别范围都等于两邻两芯片之间的平均间距。

九芯片图像识别方式还对大方框内的芯片按照识别优先次序在控制程序内做了编号, 如图4所示, 当自动键合机拾取芯片按照从左到右的方向时, 九芯片编序如图4 (a) 所示;如果拾取芯片按照从右到左的方向, 则九芯片编序如图4 (b) 所示。自动键合机拾取芯片的起始方向可以设定, 在换行时其拾取方向会按照上一个芯片的拾取方向自动变换方向。

九芯片图像识别方式的工作过程是这样的:

(1) 刚启动自动键合时, 需要判断芯片1是否合格, 如果不合格, 需要从芯片2~9中按顺序将第一个合格的芯片移到屏幕中央位置 (即芯片1所在位置) ;

(2) 拾取芯片1;

(3) 同时识别其他8个芯片;

(4) 从2、3、……、9按照递增顺序, 将第一个认定合格的芯片移到屏幕中央 (即原来芯片1的位置) , 然后在新的大方框内识别其它的芯片, 由于其中五个芯片在上一次己经被识别, 仅有三个新进入大方框内的芯片未曾被识别, 因此识别新的芯片需要占时240~270 ms;

(5) 重复步骤 (4) , 直至将晶圆中的合格芯片全部拾取完毕。

如果AD809采取九芯片图像识别方式, 焊臂和X-Y工作台的时序图如图5所示, 从中可以看出, X-Y工作台在一个运动周期中, 只有一个X-Y步进的过程, 其余时间都可以进行芯片识别;而且每次直接将合格芯片移到屏幕中央, 不存在换行和不合格芯片在时序上单独占用时间的问题, 因此提高了自动键合机的工作效率。

九芯片图像识别在自动运行中, 会将晶圆切割成一块一块的独立区域, 如图6所示, 如果自动键合机从最底层开始拾取芯片, 中央芯片所在列的芯片都是合格芯片的话 (即每次芯片2都是合格的) , 自动键合机会一直垂直向上拾取芯片, 直到拾取最顶层的一个芯片后, 才会横向拾取芯片。从屏幕上看, 相当于将晶圆切割成两半了。特别是在晶圆中存在很多不合格芯片时, 晶圆将会被切割成多个弧立的区域。

为了克服九芯片图像识别拾取的缺陷, 有必要存储可能存在的断点芯片位置。所谓断点芯片, 指在包含九芯片的大方框内, 当拾取了芯片1之后, 按照2、3、……、9顺序, 将第一个合格芯片移到屏幕中央后, 因原来被判定为合格的芯片被挤出当前的九芯片大方框, 可能导致自动键合机不能自动拾取的芯片就是断点芯片。对于芯片2、3、……、9来说, 将不同的芯片移到屏幕中央位置, 所产生的断点芯片是不同, 如图7所示, 因此在将合格芯片移到屏幕中央时, 同时需要存储对应的断点芯片位置。

断点芯片采取后进先出法, 即自动键合机拾取完当前区域的合格芯片后, 首先自动回到最后存储的断点芯片上, 拾取芯片, 所以九芯片图像识别方式下, 拾取的流程图如图8所示。

3 实现方法

在一台具有多个PCI插槽的工控机上, 在PCI插槽中插入一块图像卡[2]和两块运动控制卡[3], 图像卡和运动控制卡都是由专业厂家提供, 它们都曾在各种工业场合中大量使用, 其稳定性和可靠性非常高, 在工控机中通过调用图像卡和运动控制卡的底层软件, 从而实现九芯片识别。

图像卡与一台CCD摄像机和一台监视器相连, 用于实时提取芯片图像;一块运动控制卡与焊臂电机及其传感器连结, 一块运动控制卡与X-Y工作台及其传感器连结, 并在工控机上安装以下软件:Windows2000和Microsoft Visual Studio 6.0以上版本、图像卡驱动程序、运动控制卡驱动程序。

启动Microsoft Visual C++6.0, 新建一个工程[4], 将图像卡、运动控制卡的DLL链接进来, 通过调用相关的控制函数[5,6], 从而实现九芯片图像识别。

4 结论

九芯片图像识别与单芯片图像识别相比, 碰到不合格芯片或者换行, 都不会影响将合格芯片移到屏幕中央, 因此提高了自动键合机的工作效率, 特别是对于关注产品质量和生产效率的制造商, 九芯片图像识别方式是一种比较好的识别方式。

如前所述, 九芯片图像识别方式实际上是绕开不合格芯片, 直接拾取合格芯片, 因此对于被不合格芯片包围中的合格芯片, 自动键合机是不会自动拾取的, 需要人工干预, 尤其是如果合格芯片散落在不合格芯片包围圈中时, 九芯片图像识别方法并不能提高自动键合机的效率。当然现在晶圆的流片技术已经非常成熟, 已经不太可能会出现这种极端的情形, 所以九芯片图像识别是一种非常值得推广应用的识别方式。

参考文献

[1]AD809操作手册[Z].ASM太平洋科技有限公司, 1990.

[2]OK系列图象卡安装手册[Z].北京嘉恒中自图像技术有限公司, 2004.

[3]MPC08A运动控制卡安装手册[M].成都步进机电有限公司, 2005.

[4]吴金平等.Visual C++6.0编程与实践[M].北京:中国水利水电出版社, 2004.

[5]OK系列图象卡编程手册[Z].北京嘉恒中自图像技术有限公司, 2004.

指纹图像识别技术的研究 第7篇

关键词:指纹预处理,特征提取,特征匹配

随着现代社会的发展, 安全已成为一个主要的考虑。指纹因其不可复制的特点, 是一种不可替代的身份识别手段。近年来, 指纹的自动识别和认证已成为当下热门的模式识别方向。指纹信息的处理及其在身份识别上的应用, 已广泛应用于银行, 保险, 公安, 门禁, 考勤等方面。

1 系统概述

指纹识别系统包括指纹图像的采集, 预处理, 特征提取以及特征匹配等。其中, 预处理在指纹识别中起着非常重要的作用, 由于压力, 变形, 在场的污渍和其他噪音的影响, 导致预处理上的指纹识别系统的准确性和可行性直接受到影响。空间区域中的图像预处理, 也可以在频域实现。有很多成熟的前处理方法。特征提取是则是通过合适的算法提取出能够体现图像明显特征的参数和数据。特征匹配则通过将采集数据和数据库中的指纹信息进行比较, 从而进行确认。

2 指纹图像的预处理

2.1 指纹图像预处理概述

指纹识别的预处理过程由分割、二值化、细化这几步组成。分割就是把原始灰度图像的感兴趣区域和背景区域分离开, 感兴趣部分包含着脊线和谷线的清晰区域分割操作能有效地去除部分噪声, 使后续处理更加简便, 所以分割是预处理的第一步。现有的指纹图像分割方法大都是根据指纹图像灰度的统计特征 (如方差、均值) 设计算法的。

2.2 分割

指纹图像, 往往不是完全充满指纹, 常混有一定的背景噪音, 所有有必要进行图像的分割, 从而减少预处理的区域, 提高图像信息的抗干扰性。图像分割的质量直接关系到后续特征的提取和识别的精确度。

2.3 二值化

图像分割后需要对图像进行二值化处理, 按照某个设定的阀值, 将图像像素值转换成“1”或“0”。通常采用局部阈值自适应二值化算法。该算法利用指纹的脊线和谷线宽度的特点大致是二元化的黑色和白色像素相同数目应该大致相同的特点, 来进行二值化处理。

2.4 细化

二值化后的指纹图像, 脊线仍具有一定的宽度。而指纹识别只和纹线的方向有关, 无需考虑其厚度。所以从减少数据量和提高识别精度的角度考虑, 有必要对指纹图像进行细化处理。细化的原则就是要保持纹线连接性、方向性以及中心位置等特征的不变。

传统的图像细化算法, 会带来明显的脊吞噬现象或骨骼位置偏移现象, 效果不是很好, 因此需要进行算法改进。本文在OPTA细化算法的基础上进行改进。改进后的算法应用于细化时, 与原始图像对比, 显示了叉脊线的特征信息, 并连接基本上保留了点, 但它也带来了一些伪特征点, 而这些伪特征点, 大多在噪音区。可以分开处理, 以减少伪特征点后去噪。

3 指纹图像的特征提取

指纹图像的提取关键在于伪特征的过滤。因此需要对空洞、毛刺、绞线、断脊等伪特征能够进行较好的判断及滤除。

伪特征点的滤除步骤如下:

(1) 选取半径为R的领域, 假设领域内包含M个特征点。比较这M个特征点的关系是否和真特征点的标准相一致。一致则为真特征点, 予以存储, 否则作为待滤除的特征点进行下一步分析。

(2) 对交叉点和端点进行分析。在端点分析时, 考虑领域内的M个特征点时候存在断脊及短线等伪特征 (真特征是没有的) 。如果检测到存在断脊或短线, 则先进行短线的删除, 然后接着删除掉断脊, 从而实现伪特征的删除;在进行分叉点分析时, 则是分析M个点中, 是否包含有孔洞和毛刺等结构特征。如果存在其中一种, 则为伪特征。要先进行毛刺的删除, 其次删除孔洞, 最后是滤除叉连。

(3) 经过前面两步骤的处理后, 如果还存在较多数量的特征, 并且数量在50个以上, 则表明指纹图像中存在较多的干扰信息, 从而导致伪特征过多, 难以滤除。在这种情况下, 则需要采用遍历各特征点的办法, 对距离很近的特征点予以删除, 值得达到标准为止。

4 指纹图像的匹配

基于特征点的模式被认为是普遍采用的一种特征匹配方式。通过提取指纹图像的特征点, 将指纹图像转换成一系列的点集。再将指纹图像匹配转换为两组点集的一致性问题。考虑到指纹信息在采集的时候是按某一方向和力量录入的, 对应的数据存入了指纹识别系统中的存储区域。而当再次验证指纹时, 由于指纹按下的方位和力度往往和指纹图像录入时不一样。因此, 在进行指纹图像信息匹配时, 需要将采集到的指纹的特征点集进行旋转、展缩等各种变化, 以便和数据库中的原始指纹信息进行良好的匹配, 而避免误动作。这一点当然是图像匹配的难点所在。

因此在图像匹配时, 需要对每一个细节点信息进行处理和配比, 包括方向特征 (一般考虑脊线方向) , 端点特征以及分叉点特征等。然后结合奇异点、脊线等表征出来的信息综合考虑。在进行具体的细节点匹配时, 要通过选用的算法, 对各细节点之间的几何关系进行计算, 从而对细节点之间的等同关系进行判断。有点图像匹配算法, 在进行细节点匹配时, 会计算出一个最大似然概率P, 当P的值较大, 说明匹配度高, 匹配双方更为接近。然后找出P值最大的进行最终的成功匹配;还有一种算法是采用阀值来实现指纹信息的匹配。只要细节点之间的差异程度在预设的阀值范围内, 则认为配对成功, 否则配对失败。

这种细节匹配的核心在于引入了限界盒的概念, 传统的匹配中的限界盒是固定大小的。为了提升匹配的精确度, 本文采用了可变大小的限界盒。这样就可以扩大细枝末节的匹配准确度。可以说由于指纹图像呈现的非线性, 导致了细节匹配也应该采用这种非线性的限界盒方式, 从而确保匹配的准确度。另外, 指纹特征匹配的过程中, 如何选择一个可靠的参考点也是非常重要的。如果将所有可能的点都分别作为参考点, 势必会加大计算量。

5 总结

信息社会的发展和技术的进步, 更加高安全性的身份识别技术已经变的越来越重要, 指纹识别正以其处理高速、采集方便和准确性高的优点, 被广泛的应用于各类场合。

参考文献

红外图像模糊识别筛选方法 第8篇

1 模糊评判模型

1965年Zadeh提出了著名的模糊集理论,它是对一类客观事物和性质更合理的抽象和描述,可以通过一个隶属函数对事物进行模糊识别.应用模糊模式识别理论建立红外图像辐射源样本评判模型,其识别过程原理如图1所示.虚线上部为识别过程,下部是特征模式识别库建立过程.

(1)设U代表评判模型专家诊断库中目标红外辐射样本模式类别的全体,它是通过训练样本以及专家的经验得到的一个模糊集合,集合中有N个客观红外辐射源的特征参数.

U=(U1,U2,,UN) (1)

式中,表示红外辐射源中有N种不同形式的特征模式,对于每个特征模式中的某一类对象类别j用1个特征矢量来表示:

Uj=(Uj1,Uj2,,Ujn)T (2)

其中Uji代表第j类对象类别的第i个特征参数,由专家选择或提取某些典型的参数作为特征参数集组成特征矢量.

(2)X是待识别目标红外辐射源的特征参数,

X=(x1,x2,,xn)T (3)

其中xi是待识别红外辐射源的第i个特征参数.

(3)建立模糊隶属函数.隶属函数的确定通常有以下几种方法:专家确定法、客观尺度法、统计法、对比排序法和综合加权法等.常用的隶属函数有正态分布、矩形分布等.

红外图像信号具有模糊性、欺骗性、不确定性.但对于正态随机变量来说,它的值落在3倍标准差范围内是肯定的.误差范围的大小可以根据精度的要求确定.这里以3倍标准差为例,可定义特征参数xi隶属于Uji模糊隶属函数[2]:

undefined

(4)假设第i种红外辐射源特征参数的权重系数为αi,且有undefined,其中i=1,2,,n,则待识别辐射源xi的模糊隶属度uUj(X)为

undefined

由此可得出待识别红外辐射源特征参数矢量X对于论域U的一组模糊隶属度uU1(X),uU2(X),,uUN(X).

2 模糊模式识别的方法

利用上面建立的模糊评判模型,可对红外辐射源进行模糊识别.利用贴近原则方法对红外信号进行模糊筛选[3,4,5,6]:

设Ai(i=1,2,,n)是论域U上n的模糊集,待识别对象B也是U上的模糊集.如果贴近度undefined,则称B与Ak最贴近,可以将B和Ak归一模糊集.根据情况可以规定一个合适的模糊隶属度门限值λ∈[0,1],如果有uUk≥λ,则:Χ∈Uk.

如果有 k1,k2,∈1,2,,N,且有k1≠k2≠都满足uUk≥λ(k=k1,k2,且 k1≠k2≠),则:X∈Uk1∪Uk2∪U.

可以判断X∈Uk1∪Uk2∪U,也就可判定红外辐射源X可能属于模式(U1,U2,,UN)中某几个Uk所代表的红外辐射目标类型,这样模式识别之后再由操作员根据经验和其他细节进行重点判断.

而对于论域中不存在的观测样本X无法进行分类.但可作为待测的未知参数保存在数据库中,便于资料的积累.

3 算 例

这里采用一个模拟诊断对象的数据来说明红外图像识别专家数据库系统的建立及运行方案.在该对象中,输入表现为6种红外辐射源的特征参数,特征参数经过归一化处理,输出表现为客观红外目标辐射源.表1列出的是经过归一化处理后的5组已确诊样本和3组待诊样本的数据.表1中已确诊样本是指过去诊断过且诊断结论是正确的征兆数据和诊断结果集合.

依据模糊识别数据库,对上面的3个待诊断样本进行诊断:

(1)根据与特征参数相关的权重组建系统知识库,经过专家分析,各征兆隶属度权重的取值分别为α1=α3=0.1,α2=0.05,α4=0.15,α5=0.3,α6=0.3.

以一种数据库语言作为专家系统的设计语言,将训练样本的数据作为记录存入数据库中.在本例中已存入记录为5条.

(2)训练样本得到的数据构成评判模型专家诊断库中目标红外辐射样本模式类别的全体,这里只选已记录的5个训练样本为例.

并通过大量的训练样本和专家的经验得出归一化后的6种特征参数的标准差为1%,1.3%,2.1%,3%,1%,0.8%,2.5%.

(3)求解待诊断目标与数据库中的特征样本的贴近度,对上面的3个待诊断红外目标进行计算得表3.

用贴近原则来表示,且当λ=0.7时,可以判断:

X1∈(A,B,C) X2∈(A,B) X3∉(A,B,C) (8)

从式(8)可以判断X1可能为(A,B,C) 3个目标中的一个,而X2可能为(A,B)这2个中的一个,X3不属于3个目标的任何一个.通过这样的模糊识别筛选之后,操作人员可以根据经验对待诊断目标在筛选后的集合中判断,这样既能发挥专家诊断系统对复杂运算判断的优势,还可以最大可能地发挥操作人员的主观能动性.显然,这种方法可以提高对红外图像处理的运算效率和准确性.对于集合中没有的目标可以进行认真分析,如果是一个新的辐射目标则可以将其添加到模型数据库.

(4) 对知识库进行充实

若能保证某待诊样本的诊断结果是正确的,则可以将其特征数据和诊断结果加入到知识库中,随着诊断数据的增加,诊断模型的数据库系统将越来越完善.

4 结 论

本文根据模糊数学理论建立的模型,并依据专家诊断系统原理,对海量红外图像信息进行了针对性的目标模糊筛选识别,通过筛选可以把待识别红外目标的可能结果限定在一定范围内,然后由操作人员进行重点判断和处理.显然,通过模糊识别筛选的方法不仅可以提高操作人员的识别效率,而且识别库的建立和充实也提高了识别的科学性和准确性.但是,模糊识别的关键是对红外辐射源信号进行适当的处理,从红外辐射源原始信号众多特征中求出那些对分类识别最有效的特征,以实现特征空间维数的压缩,即特征提取和选择.特征提取和选择的优劣极大影响着分类器的设计和性能.

摘要:研究了一种针对海量图像信息进行模糊识别筛选的方法.运用该方法可大大减少操作人员的工作量,提高处理效率.

关键词:红外图像,模糊识别,隶属函数

参考文献

[1]宣益民,韩玉阁.地面目标与背景的红外特征[M].北京:国防工业出版社,2004.

[2]科文,郑孝勇.雷达模糊识别方法[J].电子对抗,2001.

[3]张河.探测与识别技术[M].北京:北京理工大学出版社,2005.

[4]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.

[5]Pieter A.Jacobs(Holland).Thermal Infrared Character-ization of Ground Targets and Backgrounds[M].北京:国防工业出版社,2004.

相关文章
创新公共服务范文

创新公共服务范文

创新公共服务范文(精选12篇)创新公共服务 第1篇科学技术是第一生产力,科技公共服务平台对国家或区域的技术创新具有巨大的推动作用。科技...

3
2025-10-24
匆匆中学生读后有感

匆匆中学生读后有感

匆匆中学生读后有感(精选9篇)匆匆中学生读后有感 第1篇匆匆读后感500字_读《匆匆》有感当细细地品读完一本名著后,大家心中一定有不少感...

1
2025-10-24
草莓教学范文

草莓教学范文

草莓教学范文(精选17篇)草莓教学 第1篇“风儿轻轻吹,彩蝶翩翩飞,有位小姑娘上山摘草莓,一串串哟红草莓,好像……”优美的歌词,动听...

3
2025-10-24
仓储类课程范文

仓储类课程范文

仓储类课程范文(精选7篇)仓储类课程 第1篇物流产业是复合型产业,发达的物流能加速传统运输、仓储和零售等行业向现代物流服务领域延伸。...

1
2025-10-24
创造性批评:解说与解读

创造性批评:解说与解读

创造性批评:解说与解读(精选8篇)创造性批评:解说与解读 第1篇创造性批评:解说与解读作为诗性文化重要组成部分的审美批评,同文学艺术实践...

2
2025-10-24
初二地理试卷分析

初二地理试卷分析

初二地理试卷分析(精选6篇)初二地理试卷分析 第1篇莲山 课件 w ww.5 YK J.COM 4 初二地理试卷分析二、试题所体现的新课程理念和...

4
2025-10-24
常州市河海中学文明班小结

常州市河海中学文明班小结

常州市河海中学文明班小结(精选2篇)常州市河海中学文明班小结 第1篇常州市河海中学2008~2009学年第一学期 八(1)班创 文 明 班 ...

4
2025-10-24
财务负责人身份证明

财务负责人身份证明

财务负责人身份证明(精选14篇)财务负责人身份证明 第1篇财务负责人身份证明及签字样本兹证明为我公司财务负责人。特此证明。身份证复印...

3
2025-10-24
付费阅读
确认删除?
回到顶部