在<仙剑奇侠传>里,你是那么的英俊潇洒,是那么的自信,仿佛你就是正义的化生,爱情的代名词;在< 天外飞仙>和<聊斋>里,你对爱情又是那么的矢志不逾;一曲<六月的雨>有数不尽的哀愁;一首<逍遥叹>有说不出的快活......无论你在演艺事业还是歌唱事业你无不散发出夺目的光芒,在现实生活中,你的爱情又是那么令人嫉妒发狂.似乎幸运的光环始终眷顾着你.然而正当你还沉侵在甜蜜的爱河,你的事业正蒸蒸日上时,命运却给你开了个莫大的玩笑------一场车祸从天而降.这场车祸夺去了你女朋友的生命,你的事业也因此受到重创.似一位历经千心万苦的人终于征服了巍峨的高山时却发生了雪崩,似一只终于可以翱翔于蓝天的幼鹰,翅膀却发生骨折.....
我知道你出车祸的事时已隔了相当一段时间,当你出现在我眼帘时,我几乎已认不出是你.命运在你年轻的身上割下道道伤痕,看着你那憔悴而又无奈的你,我既感到无奈又为你感到叹惋......我非常喜欢你,喜欢你的笑,你的哭,你的每一句话,喜欢你演的电视剧,喜欢你饰演的人物,更喜欢 ... ...
我的偶像是那个在仙剑奇侠传里风流倜傥的李逍遥,是在天外飞仙里憨厚的童远,是蒲公英里那失忆的程颢 ,是别爱我里爱着飞扬的徐风,是聊斋之小倩里那对爱情总是报着矢志不愈态度的蔺采辰,是电影第601个电话里想为自己的偶像写歌的那个晓文,我的偶像他演的作品其实并不多,但我认为部部堪称经典之作.在06年8月29日那天,胡歌在上完通告后准备往回赶的路上遭遇了一场另所有喜欢他的人都感到悲痛的事情,那就是那场几乎要把胡歌带离世界的车祸,在那场车祸中庆幸的是胡歌并没有离开,而离开的是胡歌的一位私交很好的朋友.在胡歌清醒后,得知朋友的悲痛离世,痛哭流涕.在胡歌恢复的这段时期,我看了他在自己的博客里写的文章,写的很是感动我啊!因为胡歌他明明就是在苦中作乐,甚为感动的我给他留了言,因为我想告诉他不管他变成什么样胡椒一定会支持他到永远,我不知道别的胡椒怎么样,但我知道我一定会支持胡歌到永远!
有人说胡歌是靠着他的那张帅气的脸才能在演艺圈待下来,可我不这么认为,我喜欢胡歌不是因为他的帅,而是臣服于他的演技,从看他的李逍遥开始,一直到最近还在排的射雕英雄传,我都认为是他在演绎这些个角色,而不是角色在演绎胡歌这个人!
我不知道各位胡椒们记不记得在当代歌坛的06年有一期上面有一张胡歌的照片,那张照片的名字叫做右脸!在那张照片的下方还写了这样一段话"他别过左脸看不出表情,向左侧斜着脑袋,也许是不想让泪从右眼的眼角滑落,怕咸咸的眼泪刺的伤口生疼,他的右脸有些忧郁,用冷漠拒绝曾经意气风发的年华,让青春开花结果"当时我看完这段话的时候,我的眼泪瞬间就爆发了,看着胡歌那张在这个年纪理应意气风发的脸,如今是这般的憔悴,那张曾经挂满笑容的的脸现在写满了沧桑,这张照片让我着实的心疼一把! 胡歌是我第一次这么喜欢的一个明星,我真的都不知道为什么我会喜欢他,可能有各方面的原因吧!不过现在最重要
的是,胡歌能重回演绎界,让那些认为他是靠脸生活的人见识一下我们最伟大的胡猫猫同学的演技,不是靠吹出来的!我真的很喜欢胡歌啊!我很想见他一面啊!知道他现在的生活怎么样,我爱胡歌胜过爱我自己!真的~!这是我在看完鲁豫有约之后的感慨~我真的觉得我喜欢胡歌~剩过喜欢我自己~~~
能在海天的晴空看见你新鲜美好的笑颜,是我一生挥之不去的温暖。
能在湿润的风中感受你纯洁热情的目光,是我一世不能忘却的记忆。
我注定是一条漂向暮色的舟。
你注定是一弯绚丽静美的虹。
可能的,把我当作你的良朋。
天涯海角,因为有你,我的血液才能掀起七彩的激浪。
灯火阑珊,因为有你,我的眼光才能蓦然回首中充盈。
你知道,我最后的风景是想拥有一座金色的木屋,有明亮的窗、鲜花、青草,小螃蟹正在廊檐下爬行。
如今,我年轻无虑的扁舟,已被你从浆声灯影里推出,在平静光滑的海面上漂流、寻觅。
微浪轻唱,柔波细语,扁舟载满一帆悠悠。
你静静地凝视着我,如星光不显眼,尽管细微,但都打上了真情的烙印,让我的诗句染上了晶莹,在水光里有了一丝潋滟。
这真挚的馈赠,使我的心灵之鸟,在你的友情天空里获得无垠。
但我和你注定是天各一方。你伫立在黎明的东方,我将消失于落日的西天。
喔,我的朋友,当曙光重现,当你身边彩霞满天时,请收下它吧,那是我用一生的感动为你酝酿一件霓裳。
关键字:
能在海天的晴空看见你新鲜美好的笑颜,是我一生挥之不去的温暖。
能在湿润的风中感受你纯洁热情的目光,是我一世不能忘却的记忆。
我注定是一条漂向暮色的舟。
你注定是一弯绚丽静美的虹。
可能的,把我当作你的良朋。
天涯海角,因为有你,我的血液才能掀起七彩的激浪。
灯火阑珊,因为有你,我的眼光才能蓦然回首中充盈。
你知道,我最后的风景是想拥有一座金色的木屋,有明亮的窗、鲜花、青草,小螃蟹正在廊檐下爬行。
如今,我年轻无虑的扁舟,已被你从浆声灯影里推出,在平静光滑的海面上漂流、寻觅。
微浪轻唱,柔波细语,扁舟载满一帆悠悠。
你静静地凝视着我,如星光不显眼,尽管细微,但都打上了真情的烙印,让我的诗句染上了晶莹,在水光里有了一丝潋滟。
这真挚的馈赠,使我的心灵之鸟,在你的友情天空里获得无垠。
但我和你注定是天各一方。你伫立在黎明的东方,我将消失于落日的西天。
喔,我的朋友,当曙光重现,当你身边彩霞满天时,请收下它吧,那是我用一生的感动为你酝酿一件霓裳。
10年后的某地,一间房子很大但是装修非常.朴实,摆着各样的书和相.机,还有一些礼物,比如十字.绣啥的。厨房里,肩膀宽宽,胡茬多多的胡先生正和一个虎头虎脑的小男孩在手忙脚乱。具体做的啥没看清。 美容 YGxo%o$EP
吃过饭后,胡先.生钻进书房里,很古色古香的.书架。看啊看啊的,合上书从桌子边站起来,温暖的阳光从天窗斜斜地照了下来,洒了一地的影子。 虚拟主机
然后就抽抽着.醒了,想想父亲节快到了,一时兴起,写了这么一.个东西,供一笑。 [成人X6pV%T2m7Z4
用品]
十年后.,一群二年级学生学习写作文,老师出的命题作文题为“.我最敬爱的人”。班里有个叫做胡柯的学生,作文如下: 虚拟主机
Y2y4KpU20Y3g
+ R5YX6O#K+T0~
我最敬爱.的人 - 我的爸爸 .
* q7P+T#M9 mOC6K
我最敬爱的人,是我的.爸爸。他是一个36岁的记录片导演,名叫胡歌。他最厉害的是,不仅能拍摄珍.贵的动物画面.,甚至能将普通的小草小花拍到惊心动魄!他长的高高的,瘦瘦的,慈祥的脸上总是挂着笑容。( 游戏 )
爸爸是个有吸引力的人。他走到哪里都带着一种气场,就是千万人里你会一眼挑出他,他像一个发光体,那种摄人的气质,让人震撼。用一句话说——知性而帅气!爸爸现在虽然是个导演,.但是我还是能.经常在电视上看到他。他经常帮他的导演朋友演个主角的兄长或干练的军人(据说爸爸以前曾经是个演员),我就总能一堆大白菜旁听到俩家庭主妇的对话“里面那演员叫啥来着?对了,胡歌!人长的顺眼,角色我也喜欢……”他.到现在才给我开过一次家长会。恰好赶上家长才艺展示,点了爸爸。他上去唱了.首《追寻》,结果从我们的女校长到刚入学的一年级女生,眼珠子黏在他身上,掸都.掸不掉!还有一次.,爸爸去学校看妈妈,在等的时候和.操场上的男生切了一局篮球,从此妈妈名声大震^^ .
哦,对了,说起.妈妈,爸爸和妈妈是很恩爱的。以前问爸爸,“你和妈妈是怎么认识的?”“还能咋.认识,以前下.雨的时候开车,过水坑的时候溅一个姑娘一身水,那姑娘就是你妈呗……你问这干啥?”妈妈是一个老师,有着和爸爸的尖脸形成.对比的鹅蛋脸,比爸爸小一岁。其实也不算矮,可是和货真价实的1米86的爸爸在一起的时候,总是很难倚到他的肩膀上,所.以他们俩一般都是——手拉手!经常吃完饭大半夜的心血来潮,俩人手拉手去看电影或者跑海边散步去。还有,由.于妈妈是语文老师,看到学生的好作文,就会在半夜把爸爸摇醒,叫他来看,睡眼惺忪的爸爸好脾气的笑,然后和妈妈一起高兴。爸爸还有句口头禅,“云.在青天水在瓶”,总是拿来对我说。“爸爸,你喜欢妈妈什么呢?”“心地善良.待人真诚呗。生活可不像电视剧,没那么多花里胡哨的。就记住,每个小姑娘子都是.朵娇嫩的花,要好好爱护。小柯,明白没”?我点头.。我想,最好的爱情,就是爸爸妈妈这样的吧! 教育
爸爸是个有爱心的人。据说他年轻时经历过一起很严重的车祸,这些年为了拍记录片也经常穿越无人区,可是看他对待小猫的样子,你绝对想象不到他的这些非凡经历。对,小猫.是我们家里一年四季都不缺的。家里本身就养了四只,我们在外面要是看到流浪猫,都会抱.回家来,然后爸爸就会给他们洗澡,喂吃的,要是有伤就认真的.包扎,之后为他们找到合适的主人才算完,为此我们的亲戚朋友都被麻烦遍了。(我们为什么不收养?你以为我家的四只猫是怎么来的?)看到爸爸的样子,我总是想起不知道从哪里听来的一句话“真正强大的男人,.可以在弱小者前,垂下双膝,温柔如绵羊。”从我记事起,就是每年两次跟着.爸爸妈妈去红十字会捐款,国庆.那天去一次,我的生日去一次。我去问妈.妈爸爸是什.么时候开始这么做的,她也不清楚,只说从她认识爸爸起就这样。去问爸爸,他只笑笑不答。 学习 Gv&1P2A
爸爸还是一个神秘的人。我们家里经常会.来一些哥哥、叔叔或者姐姐、阿姨(但姐姐、阿姨来的多些)。我知道她们是来做什么的:爸爸和她.们在陕西、甘肃、新疆都有一些叫“胡椒林.”的绿.化承包区,她们是来商量这些的,我和妈妈暑假也经常去种树。可是我不明白的是:为什么她们叫妈妈“嫂子”,却叫爸爸“老大”? .
而那些阿姨们,似乎也.是很奇怪的.人呢,比如上次,有一个不知叫小抠还是小Q的%_@6 kpRo,
阿姨(我没听清楚)凑到我面前来“小柯我给你爆爆料哈,你爸以前的外号可是小.白哦^^现在……算老白了吧?对了小朋友,看过《武林外传》没?”“《武林外传》?什么水果以及点心?”“哈哈,这可是一定要看的经典……诶,小宝你推我干啥玩意儿?”“去去去,小柯啊,男小孩是应该打打架的,见过黑社会火并么……”这个叫小宝的阿姨还没说完,就被一个叫“耗子”的阿.姨拧着.耳朵拖走了。 教育 y8^2p+v*V&F4~2
总之,.从爸爸身上,我看到了一个真正的男子汉是什么样的,他是我最敬爱的人! . 汽车
PS:在我的想象中,胡少爷结婚之后就不会再干演员了.那胡椒就变.成了什么呢?.是他的朋友,和他一起搞环保,经常跑到他家去蹭吃蹭喝.这是一篇.我关于胡少爷婚后生活的YY(广告)* 3w#o*Yoq&+v2hL9从来也不是胡歌的粉丝,只是偶然从天涯看到这篇文章.也许作者偏爱之心有之,写得过于美好了.但从之间的零碎片断还是很清晰的勾勒了这个只有24岁的男孩坚强纯真.我愿意相信它是真实的,因为他让我感动. 他的平实,他的努力,他的争取,他的不放弃,他的痛哭,都让我感觉到这是一个真实追求着幸福的善良的人.转发的目的,也不是让了让大家喜欢上他,而是希望看到的人可以检视我们在生活中是否亏欠了自己很多本应存在的幸福和快乐.虽然那么多的不如意总在困扰着,可是漏出来的快乐,一丝丝的,纺织后,还是能填满我们的人生的~~ 我以后大概仍然不会是胡歌的粉丝,但会记住,有这样一个男孩,是我们生命中一道绚烂的风景.祝福他得到生命中永远的快乐~愿他平安~
e1qh1R$%
第二篇:人工神经网络在机器人上的研究与应用
y1404697
分类号:TPl83
UDC:004密级:编号:
工学硕士学位论文
人工神经网络在机器人上的研究与应用
硕士研究生:赵树巍
指导教师
学位级别::董砚秋副教授工学硕士
学科、专业:计算机软件与理论
:所在单位信息科学与工程学院
论文提交日期:2008年1月lO日
论文答辩日期:2008年3月11日学位授予单位:沈阳理工大学
沈阳理T大学硕士学位论文
摘要
本论文以机器人视觉识别系统为出发点,进行神经网络在机器人上的研究。根据机器人视觉识别系统所要完成的具体识别任务,构建一个基于神经网络的视觉识别系统。‘‘
本文通过对系统功能的研究,结合神经网络、机器视觉、图像识别和图像处理等技术,根据模块化思想,将基于神经网络的视觉识别系统划分为输入信息处理系统和神经网络识别器两部分,并对这两部分分别进行研究、设计和实现。
具体的研究内容如下:
第一、系统论述了数字图像的二维图像灰度化、图像增强技术中的中值滤波,图像分割等技术。采用一种改进的中值滤波算法增强图像,并采用迭代式求图像最佳阀值算法实现了图像的二值化分割。在图像处理的基础上,定义了一些图像特征,研究了特征量的计算方法并加以实现,给出了实验结果。
第二、神经网络识别器的设计。通过对神经网络的研究,选择了一种神经网络模型,分析神经网络的相关参数的确定原则及神经网络的BP学习算法。根据BP算法中的缺点,提出对BP算法的改进方法,采用改进BP算法对神经网络识别器加以实现。
本文用VC++6.0对上面的内容进行实现。对样本图像的识别表明,基于神经网络的视觉识别系统可以快速的对训练样本中的模式进行识别。为机器人视觉的构建提供参考。关键字:神经网络;机器视觉;图像处理;图像识别
沈阳理工大学硕+学位论文
Abstract
Onthebaseofrobotvisionrecognitionsystem,thethesisdiscussesneuralnetworkinrobotresearch.Accordingtothespecificidentificationtask
athatrobotvisionbasedvisualrecognition
recognitionsystemwillaccomplish,thethesisbuildssystem.
theresearchthatthisneuralnetworkThroughsystemwillcompletefunction,combining
andmachineVisiontechniquesofneuralnetworks,imageprocessing,imagerecognition
andaccordingtomodularthinking,NeuralNetworkBasedvisualdividedrecognitionSystemistwoparts,oneisinputinformationprocessingsystem,anotherisneuralnetwork
parts.recognitionsystem.Thethesishas
asstudiedanddesignedandrealizedthesetwoDetailsarefollows:
First,thegray-scaleofthe
imagetwo-dimensionalimageisexpounded,thetechnologyofenhancementincludingsmoothing,sharpeningandfilterisresearchedin-depth.
aThethesisgetsthresholdingimagethroughadoptingbestthresholdvalueofimage
asegmentationmethod.Onbaseofimageprocessing,thethesisdefinesnumberof
imagefeaturesandstudiesandrealizesthemethodforcalculatingthecharacteristics.Thethesishasstudiedandrealized
results.themethodforcalculatingvolumeoffeatureandhasgivenexperimental
Second,Neuralnetworkrecognizer'sdesign.Through
networkneuralnetworkresearch,thethesischoosesakindofneuralmodelandanalysisprincipleofneuralnetwork
relatedparameterandneuralnetworkBPlearningalgorithm.AccordingtoshortcomingofBPalgorithm,proposingthemethodthatimprovesBPalgorithmandrealizesit.
ThethesisrealizesthesystemwithVC++6.0.SamplesofimagerecognitionshowsthatneuralnetworkbasedvisualrecognitionsystemCandistinguishthetrainingsample.Keywords:NeuralNetwork;MachineVision;ImageProcessing;ImageRecognition
沈阳理工大学
硕士学位论文原创性声明
本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
作者(签字):趣桕、丁巍
El期:夕印每年;月,3日
学位论文版权使用授权书
本学位论文作者完全了解沈阳理工大学有关保留、使用学位论文的规定,即:沈阳理工大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅。本人授权沈阳理工大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。
(保密的学位论文在解密后适用本授权书)
学位论文作者签名:走和寸镱
日期≯谤.;、,;指El导教师签期名.-:缈/K,,,2
第1章绪论
第1章绪论
1.1课题背景及意义
1.1.1课题背景
随着相关学科的发展及各种先进技术的应用和人们对生存环境的环保意识逐渐增强,环保机器人的研究与开发越来越受到广泛的重视,具有良好的应用前景,如智能清扫机器人、地板清洁机器人、擦窗擦墙机器人等。类似这样的机器人美国、日本、中国等均已研制和开发出产品并投入了使用。
目前,我国所有的人工湖都采用的是人工清理垃圾,但是对于水质的维护确不能得到保证,不能达到人工湖美化环境的效果。人工湖水不流动或流动性差,都造成了人工水景的水质随时间变差,这与保护和美化自然环境的要求是不相符的。所以有关部门提出了制造一种移动式水质净化保持器对湖水进行保持处理,用流动的处理器去处理不流动的水,达到水质处理的目的。处理器可同时对湖内的各种垃圾进行自动收集,清除和防治绿藻及其它损害水质的浮游生物。湖面清扫机器人就是一种可以全自动、全场移动式的处理不流动水而达到水质处理的水上智能环保机器人,能够对湖内的各种漂浮垃圾进行自动收集和对绿藻及其它损害水质的浮游生物等清除和防治,实现对湖面的环境保护和水质维护。
湖面清扫机器人的主要功能有:
第一,景观娱乐功能(定时喷水,放音乐);
第二,检测分析及生化处理功能,检测BOD5、CODer、PH值等水质指标;第三,集污功能和排污功能(物理处理);
第四,通信功能。
湖面清扫机器人主要由游动系统、视觉系统、GPS定位系统、垃圾处理系统、语音系统等五大部分组成。湖面清扫机器人通过其视觉系统将水中的垃圾进行识别定位并通过垃圾吸入系统收集到鱼的口中,经刮板器定时将垃圾推入到网状垃.1.
沈阿I理I:人学硕十学位论文
圾袋中。袋中垃圾装满后,启动返回排放垃圾系统,将垃圾投放到预定位置。机器鱼对湖面水进行定时采样收集分析水中检测BOD5、CODcr、PH值等主要水质指标参数值,判别是否符合水质要求,是否已造成污染。若水质不符合标准,则机器鱼对水面将喷洒污水处理生化物(环保公司的专利产品)进行水质维护。湖面清扫机器人的移动方向由GPS定位系统控制,实现监控室与机器鱼之间的无线通信。语音系统主要用来控制喷水、放音乐等娱乐功能的实现。
从上面的介绍可以看出,湖面清扫机器人包括很多个功能系统,神经网络可以在以上的很多的功能系统中应用,例如可以将神经网络应用到控制系统,定位系统,语音识别系统等。而本文以机器人的视觉识别系统为切入点,进行神经网络在机器人中的研究与应用。这就要求本文必须对神经网络、图像处理、图像识别、机器人视觉等技术进行研究和分析,探讨如何利用图像处理对图像进行有效的处理并提取出有效的特征值;探讨如何设计一个用于图像识别的神经网络识别器,并将该基于神经网络的视觉识别器应用到湖面清扫机器人视觉识别系统中。1.1.2论文研究的意义
目前,机器人是一个热门的研究领域,世界各国政府,对机器人的发展都给予了极大的关注,拨出巨款支持它的发展;而且,机器人的应用领域也越来越广,从传统的应用领域机器制造业、各种非制造业到军事活动以至家庭服务自动化,机器人都成为重要工具。随着机器人技术的进一步发展,可以预见其应用领域将涉及到人们工作的每一个领域,并开创很多前人无法进入而没有开发的新产业。
在机器人技术中,视觉系统是机器人中的重要部分,视觉系统的准确性与实时性直接影响到整个系统的工作状况。然而,由于环境因素、图像采集方式及运算处理速度等方面的原因,视觉识别始终存在一定的问题,成为一个仿生瓶颈。本文从神经网络、图像处理与图像识别的角度出发,对机器人的视觉识别问题进行探讨,采用神经网络识别器对图像中的目标物体进行识别,取得了较好的识别效果。
第1章绪论
1.2相关技术的发展现状
1.2.1神经网络研究现状
当前的计算机技术飞速发展,计算机的计算和信息处理能力愈来愈强大,处理速度也越来越快,但是对于简单环境的感知、辨识和反映能力远远不如人,计算机一般只能简单的按照人预先编制的程序机械地执行人的命令,甚至没有基本的学习和适应环境的能力,所以计算机能执行的动作和处理的事件必须由人预先考虑,而这是一件复杂而繁琐的工作,这也是阻碍人工智能技术发展的主要原因。
早在20世纪初,人们已经基本知道动物大脑的工作方式。人脑是由大约1011个神经元经过复杂连接而成的一种复杂的、非线性的、并行处理的信息处理系统。单个神经元的响应速度大约是10’:3秒,比起计算机的逻辑单元(反应时间10。9秒)低5-6个数量级。但是在对环境的感知和反应能力方面要比计算机快得多,这也是人工神经网络技术开始发展的起因。早在1943年,心理学家McCulloch和数学家Pitts合作提出神经元的数学模型(称之为MP模型),从此开创了神经科学理论研究的新时代。1944年Hebb提出了改变神经网络连接强度的Hcbb规则,这对现今的各种神经网络模型还起着重要的作用。1957年Roscnblat首次引进了感知机概念(Perception),它由阀值性神经元组成,试图模拟人脑的感知和学习能力,开始了人工智能的神经网络研究的标志。1982年美国加州工学院物理学家Hopfield提出了HNN模型,更加有力地推动了神经网络的研究眦1。
Hinton和Scjnowski等人提出的Boltzman机模型,该模型借用了统计物理学的概念和方法,首次采用了多层网络的学习算法,即学习过程中用模拟退火技术,保证整个系统趋于全局稳定点;Rumelhart和McCelland等人提出的PDP(并行分布处理)理论则致力于认知器官结构的探索,同时发展了多层BP算法,把学习的结果反馈到中间隐含层次的隐含单元,改变它们的连接权值矩阵,从而达到预期的学习目的,也是迄今应用最广泛的网络之一;Kosko提出的双向联想记忆网络,是最早用于学习的网络。神经网络技术正在飞速的发展,各种模型也不断改进和完善。
随着神经网络理论的发展,其应用已经渗透到各个领域,并在智能控制、模式识别、计算机视觉、自适应滤波和信号处理、非线性优化、自动目标识别、语.3.
沈冈I理一1:火学硕十学位论文
音识别、知识处理、传感技术与机器人、生物工程等方面的应用取得了飞速的发1.2.2机器视觉研究现状
机器视觉是在20世纪50年代从统计模式识别开始的、当时的工作主要集二维图像分析,识别和理解上,如光学字符识别、工件表面、显微图片和航空图片的分析和解释等。20世纪60年代,Roberts将环境限制在所谓的“积木世界”,.即周围的物体都是由多面体组成的,需要识别的物体可以用简单的点、直线、平面的组合表示。通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体的多面体的三维结构,并对物体形状及物体的空间关系进行描述。Roberts的研究工作开创了理解三维场景的为目的的三维机器视觉的研究。到70年代已有了一些视觉系统。
1973年,英国的Marr教授应邀在麻省理工学院的人工智能实验室创建并领导一个以博士生为主体的研究小组,从事视觉理论方面的研究。1977年,Marr提出了不同于“积木世界’’分析方法的计算视觉理论即Mart视觉理论14.s1,该理论在20世纪80年代成为计算机视觉研究领域中的一个十分重要的理论框架。到了80年代中期,计算机视觉获得了迅速发展,主动视觉理论框架、给与感知特征群的物体识别理论框架等新概念、新方法、新理论不断涌现。而计算视觉在工业环境中等到广泛的应用。其发展最先是与生产紧密结合的,主要用于自动化生产中的产品鉴别、分类和质量检测。这类系统一般是按规定的流程对图像进行处理并输出结果,系统主要由普通数字电路或是高速图像处理芯片组成,有很高的工作速度,较典型的有英国VINTEN科学系统股份有限公司生产的COMPARATRONIC5124系统。
第二代视觉系统是计算机技术发展的结果。在这类视觉系统中,计算机被用于图像数据的处理、分析和产生图像的描述。系统的构成除计算机外,还有图像输入设备和结果输出设备等。这类系统有一定的学习能力和适应能力,目前的视觉系统多属此类。较典型的有美国Standford大学和SRI开发的SRIVisionMoudle系统以及由PHLIPS公司开发的PAPS系统等。第三代视觉系统即是目前国际上正研制开发的智能视觉系统。它以高速图像处
第l章绪论
理芯片、并行算法、具有普遍适应性和高度智能为特点,目的是要模拟人的高层视觉系统,较典型的有美国Automatrix公司生产的Auto
研制的ACRONYM系统等16】。
1.2.3模式识别技术研究现状Vision4和Standford大学
图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。数字图像处理和识别的研究开始于1965年。过去人们主要是采用照相机技术、光学技术来处理图像,而计算机技术与信息理论的诞生将图像处理技术由模拟时代带入数字时代。数字图像与模拟图像即照片上的图像相比具有存储,传输方便、可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强劲的动力。
物体的识别主要指的是对三维世界的客体及环境感知和认识,属于高级的计算机视觉范畴171。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向其研究成果被广泛应用在各种工业及探测机器人上。
现今,图像识别技术被广泛应用于各种工农业生产与日常生活领域之中,但不同的应用领域的图像识别技术几乎都非常依赖本领域的专业知识,使得它们只能在本领域内发挥作用,一旦识别目标不是该领域的就完全束手无策了。比方说用于人的面部的识别技术就是根据人的面部特征而设计的就不能把它用于指纹识别。现代图像识别技术的另外一个不足就是自适应性能差,一旦目标图像被较强的非线性噪声污染或是目标图像有较大残缺往往就得不出理想的结果。相比之下人类的视觉就表现出非常的灵活性和自适应性,识别的对象范围几乎没有限制,并且在目标图像发生很大扭曲甚至只有目标某个残片图像也能将目标识别出来。因此如何加强图像识别技术的通用性及鲁棒性乃至研究具有较强通用性的图像识别技术就成了图像识别研究的一个热点问题。
模式识别的方法有吲:
第一,统计模式识别。统计模式识别指根据模式统计特性用一系列自动化技术将给定模式赋值和分
沈研l理jI:人学硕十学位论文
类,它建立在经典的决策理论之上。统计模式识别先使用一个由一组已知类别的模式构成的训练集获取决策函数参数,再用这个决策函数构成的分类器对模式进行识别。常见的分类器有:最小距离分类器、最优统计分类器。
第二,结构模式识别。
也称句法模式识别,它基于形式语言理论。实现结构模式识别需要定义一组模式基元,一组确定这些基元相互作用的规则和一个识别器(自动机automation)。其中,规则是以文法(grammar)形式给出的,识别器的结构则由文法规则确定。常见的结构模式识别有字符串结构识别、树结构识别,两者均有自身的文法和自动机。
第三,模糊模式识别。
它以模糊数学理论为基础。模糊数学是用数学的方法研究和处理“模糊性’’现象的数学,它提出了隶属度的概念、把数学从二值逻辑推向连续逻辑,更接近人类的思维形式,隶属函数的数值协助完成对不完整或有缺损知识的估计,并具有较强的推理能力。模糊数学所具有的特点,使模糊模式识别得到了长足进展。目前,模糊模式识别的方法主要有隶属度原则识别法、贴近原则识别法、模糊聚类分析法,不同的方法可应用模式识别于不同的方面。
第四,人工神经网络模式识别。
人工神经网络表现出类似人脑的学习分类能力以及并行和分布处理方式,可用作非参数分类器,逐渐成为进行模式识别的有效工具,并使传统的模式识别方式受到巨大的挑战和冲击。
1.2.4数字图像处理研究现状
数字图像处理是一门年轻的学科。本世纪二十年代,图像处理技术首次应用于图像的远距离传送,用来改善伦敦和纽约之间海底电缆发送的图片质量。数字图像处理则最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。
数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理
第1章绪论
方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器“徘徊者7号”在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用f9J。
数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(ComputerTomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类做出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为-f-JiJl人注目、前景远大的新型学科19.10】。
随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。
七十年代后期,我国学者开始了较大规模的研究,使我国的数字图像处理技术逐渐跻身于世界先进行列。近年来,各个应用领域对数字图像处理提出了越来
沈障l理11人学硕十学位论文
越高要求,从而促使这门学科的研究向更高级的方向发展,例如,图像处理的实时性,图像处理和图像分析的智能化等。可以预料,随着计算机技术的不断发展,尤其是第五代计算机的研究和使用,必将使数字图像处理技术得到更大的发展和广泛的应用。
1.3论文研究的主要内容及结构安排
1.3.1本文研究内容
建立了一种基于神经网络的视觉识别系统。对基于神经网络的视觉识别系统的两个主要的部分进行研究、设计和实现。首先,对基于神经网络的视觉识别系统的输入信息进行研究及实现。这部分包括,图像灰度化的研究和实现、图像平滑的研究与实现、改进图像增强算法的研究与实现,图像分割的研究与实现,图像特征的提取和选择的研究,图像特征量的计算。其次,对基于神经网络的视觉识别系统的识别器的设计。这部分包括,根据上面提取的特征设计BP神经网识别器,给出了改进BP算法的方法,并加以实现。最后以具体图像的识别为例,讲述基于神经网络识别系统的训练、学习和识别过程,并探讨了基于神经网络识别系统在湖面清污机器人上的应用。
1.3.2本文结构安排
论文的结构安排如下:
第1章为绪论。首先阐述了研究的背景和意义、研究内容,然后介绍了一些相关技术的当前发展现况,主要包括神经网络的研究现状、机器人视觉的发展现状、模式识别的发展现状、数字图像的发展现状。
第2章为基于神经网络的视觉识别系统的总体设计。在本章从两个方面进行了该系统的讲解。一是从系统的总体功能入手,对系统的功能模块进行了划分,二是从系统的整体的工作流程进行入手,并对各个工作流程工作进行讲解。
第3章为神经网络视觉识别系统输入信息的研究。本章是对上一章中的提到的图像处理部分和特征提取部分的具体研究和实现。因此,这一章分为两部分,第一部分研究重点图像处理,即如何对垃圾图像进行图像增强和分割,给出了一
第1章绪论
种改进的中值滤波算法;并对并行区域分割进行分析研究,运用迭代式求图像最佳阈值的方法对图像实现二值化。第二部分研究的重点是图像的特征选择、特征的计算及特征的统一化。
第4章为神经网络视觉识别系统识别器的设计。首先讲述了为什么将神经网络应用到视觉识别中去,然后研究了神经网络的选择及神经网络中相应参数的选取原则,研究三层BP神经网络学习算法,针对标准的BP算法的缺点对三层BP神经网路学习算法进行改进,最后讲述了神经网络视觉识别器的设计及实现。
第5章为基于神经网络的识别系统的识别过程及应用。本章介绍了神经网络视觉识别系统的工作过程,以及在智能机器人中的应用。第6章为结论。总结本文的主要工作和下一步工作以及展望。
沈同I理l:人学硕十学位论文
第2章基于神经网络的视觉识别系统的总体设计2.1系统总体功能划分
机器人视觉可以看作从三维环境的图像中抽取、描述和解释信息的过程,可以划分为六个主要部分:l、感觉;2、预处理;3、分割;4、描述;5、识别;6、解释[111。感觉是机器人获取图像的过程,预处理是对获取的图像进行加工处理以得到最佳效果,分割是将图像划分为若干个有一定含义的物体的过程,描述则是为了进行识别而从物体中抽取特征的过程,识别是识别景物中每个已分割的物体,并赋予该物体以某种标记的过程,解释可以看作是机器人视觉系统对其环境具有的更高级的认知行为。由上述过程所涉及的方法和技术的复杂性,可将机器人视觉系统分为阶段如图2.1所示。
低层视觉——————_◆中层视觉—------—---—--▲F'-高层视觉
图2.1视觉处理的三个阶段【41
各阶段的功能如下:
第一,低层视觉。
我们把机器人视觉中属于本能反应、而不需要智能的,但在视觉感觉中又是不可缺少的那些过程看作低层视觉处理。
第二,中层视觉。
对低层视觉处理所形成的图像进行元素抽取、表示和标记过程(分割、描述及单个物体识别)。
第三,高层视觉。
试图模仿认知行为的过程。
虽然各层次间没有明确界限,但这种划分对于将机器人视觉系统的固有处理过程加以分类提供了一种有用的结构,如图2.2所示。
第2章基了神经网络的视觉识别系统的总体设计
图2.2视觉处理层映射
本文中的基于神经网络的视觉识别系统是对机器人视觉中的低层视觉中的预处理、中层视觉和高层视觉研究。
基于神经网络视觉识别系统由两部分组成分别为:输入信息处理系统和神经网络识别器,其中输入信息处理系统又可以细分为两部分,分别为图像处理和特征提取。基于神经网络的视觉识别系统的结构如图2.3所示。
基于神经网络的视觉识别系统
输入信息处理系统
图像处理特征提取
图2.3基于神经网络的视觉识别系统结构
各个部分的功能如下所述:
第一部分为输入信息处理系统。
这各模块是将图像的信息转化、抽象为少量的能带表图像特征f孚征值。进一步细化,可以将将这以模块分为两部分如下:
(1)图像处理
在基于神经网络的机器人视觉识别系统中,有效的图像处理是整个系统成败的关键,起到非常重要的作用,图像处理并不是简单的图像处理。他需要尽可能
沈阿I理.1:人学硕士学位论文
的突出图像中的物体,将物体从背景中分离开,使目标物体尽可能的与不重要的部分之间产生明显的区别,从而滤去背景色和我们不关心的部分。
本文中采用的图形处理技术有图像灰度化、图像增强、图像的分割等等。为下一步的特征提取统一图像标准。在此过程中输入的是图像输出的还是图像,只不过是标准化的图像,有利于特征提取的图像。
(2)特征提取部分
在基于神经网络的机器人视觉识别系统中,特征提取是连接图像处理和神经网络识别两部分的桥梁。利用数字图像的一些测量方法,计算图像的特征值,例如,图像中物体的面积,图像中物体的周长,图像中物体的水平最大长度,图像中物体的垂直最大高度,图像的某一点的灰度,图像的复杂图,图像中物体长宽比,图像中的占空比等等,在这个过程中输入的是标准化后的图像,而输出的上面介绍的各种图像的特征值。
本文中采用这部分介绍的特征值构建特征库,用这个特征库去训练神经网络,也用这些特征值进行图像的识别。
这部分的具体的研究和实现,将在第三章中详细介绍。
第二部分为神经网络分类器。
在基于神经网络的机器人视觉识别系统中,神经网络识别器是基于神经网络的视觉识别系统的第三部分,也是最后一部分。它接受的输入是上一小节讲到的特征值,输出的是准结果(准结果就是需要根据神经网络设计时规定的各个输出的含义进行解释的结果,解释后的结果才是最后的识别结果)。
本文的神经网络识别器分为两种工作模式,一是训练学习模式。在这种模式下,神经网络识别器根据输入的参数调整神经网络中的各个神经元之间的连接权值;二是识别模式,在这种模式下,调整后的神经网络识别器根据输入图像的特征值,以及自身调整后的权值,计算出神经网络的输出,进而实现人工神经网络识别器对数字图像的识别。
这一部分具体内容将在第四章中详细研究。
2.2系统总工作流程基于神经网络的视觉识别系统的工作过程,首先利用有关的图像处理方法提
第2章基丁.神经网络的视觉识别系统的总体设计
取相应的特征参数,构建符合神经网络识别系统的特征库;其次要选择一种合适的神经网络和相应的学习算法,再依据神经网络和神经网络学习算法的具体要就设计神经网络的输入向量;最后利用特征库实例化神经网络的输入向量,训练用初值构建的神经网络,训练中学习调整权值,使其具有识别能力。
基于神经网络的视觉识别系统的工作分为三个阶段,如图2.4所示。
第。阶段
第二阶段第三阶段[二薹霎垂[二]———+[三三三三三二)————圉
图2.4基于神经网络的视觉识别系统的构建过程
各个阶段要完成的工作如下:
第一阶段为特征库的构建。
对大量的样本进行分析和处理(应用图像处理的方法),提取各个图像的特征值,并将这些特征值存储下来,将这些数据进行合理的组织,进而构成第二阶段所需要的特征库。
第二阶段为训练和学习。
在第二阶段是以第一阶段构建的特征库为输入,再结合神经网络识别系统参数的初始值,对系统参数(神经网络的权值)进行调整,使该系统记忆这些用于训练的样本的模式,以提高神经网络视觉识别系统的识别率,最后将这些经过训练的参数以标准的方式存起来,实现模型的记忆。
第三阶段是为识别。
在这一阶段将需要识别的图像进行适当的处理后,提取图像的特征值,并将这些特征值输入到用于识别的神经网络识别器中,神经网络识别器根据训练好的参数,结合输入的图像的特征值进行计算,计算出结果,并根据神经网络识别器设计时所定义的特定含义理解神经网络的计算结果。进而实现基于神经网络的视觉识别系统的识别功能。
沈陬I理I:人学硕十学位论文
2.3本章小结
本章为基于神经网络的视觉识别系统的总体设计。从两个方面对系统进行了介绍,首先,根据系统自身的特点,对系统的功能进行了划分并详细介绍了各个功能的模块要实现的功能;其次,对系统的工作流程进行了分析,初步将系统的工作流程分为三个阶段,并对这三个阶段要完成的工作进行细化。
第3章基丁I神经网络的视觉识别系统输入信息的研究
第3章基于神经网络的视觉识别系统输入信息的研究
基于神经网络的视觉识别系统的输入信息是图像信息。如果不将图像信息进行任何处理,就将图像的原始数据作为神经网络识别器的输入,这是一种可以考虑的方法。但在这种情况下,由于输入的信息是图像的原始信息,数据量较大,这样将增加神经网络识别器输入层神经元的个数,进而导致神经网络识别器的结构过于复杂,难于设计。由于神经网络识别器复杂性的增加,导致了神经网络识别器的运算时间增加。同时输入信息的增多,输入信息中无用的信息也会随着增加,这会降低神经网络识别器的泛化能力,进而降低识别系统的识别效率。显然,将图像的原始数据作为神经网络识别器的输入不是~个好的方法。而基于神经网络的视觉识别系统的信息处理系统接收的输入信息是图像信息,输出信息是的图像处理后的特征。将这些通过图像处理系统提取的图像特征值作为神经网络识别器的输入。这样就会降低神经网络识别器的输入层的神经元的个数,也会解决神经网络识别器由于输入层神经元的个数过多而带来的诸多问题。
因此,必须要进行基于神经网络视觉识别系统输入信息的研究。基于神经网络视觉识别系统输入信息的研究可以分为两部分,分别为图像处理——将图像处理成易于特征提取的图像,特征提取——定义图像中的特征并计算图像的特征值。
具体的研究将在下面介绍。
3.1图像处理
所谓图像处理,就是对图像信息进行加工以满足人的视觉心理或应用需求的行为【坦】。图像处理的手段有光学方法和电子学方法。在这里只研究数字图像处理,即利用数字计算机或者其他数字硬件,对从图像信息转换而得到的电信号进行某些数学运算,以提高图像的实用性。在研究图像时,首先要对获得的图像进行预处理以过滤干扰或噪声,这样可提高信噪比。下面首先对图像预处理的内容进行简单的介绍。
沈RI理.I:人学硕+学位论文
3.1.1图像灰度化
在计算机的内存中,颜色是非常丰富的。在这种情况下,要使用图像是非常困难的事情。为了更好的进行图像的特征提取,就要适当的将减少图像中的颜色,即图像的灰度化。
进入计算机内存的色彩是非常丰富的,要想使用它不是一件很容易的事。然而,通过光度学的研究结果表明:任何色彩都可以用红、绿、蓝这三种颜色按一定的比例混合而成。
灰度图(grayScale)是指只含亮度信息,不含彩色信息的图像,就像我们平时看到的黑白照片:亮度由暗到明,变换是连续。因此,要表示灰度图,就需要把亮度值进行量化。通常划分成。至U255共256个级别,其中0最暗(全黑),255最亮(全白)。BMP格式的文件中并没有灰度图这个概念,但是,我们可以很容易用BMP文件来表示灰度图。方法是用256色的调色板,只不过这个调色板有点特殊,每一项的RGB值都是相同的。也就是说RGB值从(O,0,O),(1,1,1)一直至U(255,255,255)。(0,0,0)是全黑色,(255,255,255)是全白色,中间的是灰色113】。
彩色图像中的每个像素的颜色有R、G、B(红、绿、蓝)三个分量决定,而每个分量有255中值可取,这样一个像素点可以有1600多万(255*255*255)的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,其每一个像素点的变化范围为255种,所以在数字图像处理种一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。狄度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像的灰度化处理可用两种方法来实现。
第一种方法使求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。
第二种方法是根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和ⅦV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=O.3R+0.59G+0.11B,以这个亮度值表达图像的灰度值【141。本文采用上面介绍的第二种方法编写VC++程序进行图像的灰度处理。图像的
第3章基于神经网络的视觉识别系统输入信息的研究
扶度处理的结果如下图33和34所示
图3.3原图像图3.4灰度化后的幽像
312图像增强
图像增强的目的就是采用一系列技术去改善图像的视觉效果或将图像转换为一种更适合于人眼观察和机器自动分析的形式。目前常用的增强技术根据其处理所进行的空间不同,可分为基丁罔像域的方法和基丁变换域的方法两类。空域法主要足对图像中的各个像素点进行操作;而频域沾是在崩像的某个变换域内,对图像进行操作,修改变换后的系数,然后再进行反变换得到处理后的图像㈣“。考虑到系统的实时性,本文仅就空域法对垃圾图像的增强进行了研究。
3121中值滤波
中值滤波是种非线性的信号处理方法,与其对应的中值滤波器当然也就是一种非线性的滤波器。中值滤波器在1971年由JW.Jukey首先提m并应用在维信号处理技术(时间序列分析)中,后来被二维图像信号处理技术所引用。巾值滤波在定的条件下可以克服线性滤波器如最小均方滤波,均值滤波等带来的图像细节模糊,而且对滤除脉冲T扰及图像扫描噪声最为有效[14,16】。
(1)理论基础
中值滤波一般采用一个古有奇数个点的滑动窗口,将窗口中各点灰度值的中值来替代指定点(一般是窗口的中心点)的灰度值。对丁奇数个元素,中值是指按
沈日『理J人学颂十学位论文
大小排序后,中间的数值:对r偶数个元素,中值是指排序后中间两个元素灰度值的平均值。中值滤波的J=作步骤如下
①将模板在图中漫游,并将模板中心与图中某个像素位置重合:
⑦读取模板r各列戍像素的扶度值:
@将这些扶度值从小到大排成1列;
0找出这些值罩排在中间的个:
@将这个中怕j值在赋给埘应模板中心位宥的像素。
山以上步骤可以看出,中值滤波器的主要功能就是让与周围像索挑度值的差比较大的像素该取与周围像素值接近的值,从而叫以消除孤立的噪声点。对一个所用模板尺J为MxM的中值滤波器(M为奇数),从图像中读取的像素按灰度值bkd,到大排成序列{n,.,,,。,,州r,,…),则输出值等于,㈣…m。--gzNiSLr,图像中尺寸小于模板尺寸半的过亮或过暗区域将会在滤波后被消除掉。山于中值滤波不是简单的取平均值,所以产生模糊比较少。
(2)实验结果
中值滤波主要特点是滤波后图像中各K域的轮廓仍比较清晰,从幽3.4中值滤波(3x3)、图3.5中值滤波(5×5)中可以看图像中的物体轮廓的确变得清晰了,但并没有使背景色扶度变得模糊一致,这对以后的日标分割定会造成很大的影响。
圈34中值滤波(3x3削35中值滤波(5×5
第3章基丁神经网络的视觉识别系统输入信息的研究
3.1.2.2改进图像增强算法研究与实现
中值滤波是图像增强空域法中常用方法,在处理图像噪声方面存在着的优缺点。中值滤波对含有垃圾图像进行滤除噪声处理,处理的效果通过观察明显看出中值滤波使目标图像变得模糊,背景色并没有均匀,这会对以后的图像分割造成很大的影响。综上所述,图像增强的目的是为了增强图像中感兴趣区域的信息,能够滤除图像在采集、数字化和传输等过程产生的噪声,从而使图像变得更有利于计算机处理。然而,中值滤波在处理垃圾图像方面不能起到增强垃圾和抑制背景的效果,所以必需对图像增强算法进行改进。
中值滤波的改进算法有很多,如多级中值滤波(MSM)、中心加权中值滤波(CWM)、广义中值滤波(WM)、改进的均值滤波算法(MTM)等。针对本文要解决的实际问题和在分析了中值滤波算法的结构特点极其优缺点的基础上,给出了一种改进的中值滤波算法071。
(1)算法思想
对含有噪声图像上的每一点都以其中心选取一个区域,首先,在这个区域内,找到灰度的中值,对于区域内每一点都以这个中值为基础计算其权值,其中权值的计算应该满足:
①如果区域内某点的灰度值越接近该区域内的中值,则其权值也相应地越大,如果某点为颗粒噪声点,则其次度值和该区域内的中值相差也就很大,因此其权值也应该非常小。
②权值应该被归一化。然后将区域内每一点的灰度与其对应的权值相乘再求和。最后将这个和值赋给所计算的图像点。
这样做的好处是:
①以中值为基础计算权值时,给颗粒噪声点赋的权值非常小,以致于在做累加的时候颗粒噪声点的值可以被忽略,这样可以滤除一部分颗粒噪声点。
⑦做累加类似于均值滤波,可以抑制一部分高斯噪声。
(2)算法步骤
第一步,在处理图像中第(i,J)个像素点时,首先以其为中心选取NXN的区域(N为奇数),求出这个区域内Ⅳ2个像素点的灰度中值M(i,j)。
沈RI理^学硕十学位论文
第二步,令r为N/2的整数部分,(例如,N=3则r-I),然后对这个(i,1)点的N×N区域内的每一点按下式计算其相应的加权系数r(n,ITI)
M=∑∑Ⅲ+(m,m)一M(i,J))2)]月一r*}一,(3”
,(M):!坐盟业幽塑塑塑㈣(3_2)
其中,I(n,m)为NxN区域内第(n,m)点的扶度值,可咀看出I(n,m)和M(u)相差越大,相对应的r(n,m)就越小:反之,1(n,m)和M(1J)相差越小,相对应的r(n,m)就越火;而当I(n,m)和M(u)相等的时候,相对应的r(n,m)最人,此时中值被赋予最大的权值。
第三步,将第(i,j)点的N×N区域内每。点的荻度值I(n,n1)与相应的r(n,m)
¨…‘
相乘,记为d(n,m)’将∑∑d(n,m)作为所处理点的滤波输出H…w一,,
3)实验结果
实验结果如图3.6所示
为了检验算法的滤波效果,定义信噪比改善园子S(单位dB).其定义下
。吣毒攀:‘竺:!竺!!12南善驴(¨)-ideal“∥∽。
其中,N,M分别为图像的高度和宽度,out为滤波后的图像,in为滤波耵的图像,
第3章基丁神经网络的视觉识别系统输入信息的研究
ideal为理想图像(即无噪声的图像)
.Ⅳ一1.
从上式可以看出,如果S为负值,说明∑∑(out(i,j)-ideal(iM-1,脚2小于∑N-IM∑-I伽(f,/)一嗣印砸,/))2,则说明滤波后噪声被抑制,s越低说明滤波效果越好。
’表3.1滤波效果(S)比较(向色坦料袋图像)单位:dB
3×3模极5×5模板
中值滤波一3.362-2.703
改进的中值滤波一5.996-4.534
表3.1列出了两种中值滤波算法的信噪比改善因子S,从表3.1可以看出,由改进的中值滤波算法得到的信噪比改善因子S比中值滤波算法得到的要小,从而说明改进的中值滤波算法达到了滤除噪声的要求,并且比原来的中值滤波效果要好。在消除背景色方面,改进的中值滤波也起到了很好的效果,但是仍存在问题,于是可以得出这样一个结论:因为背景色的灰度值和垃圾的灰度值有时候十分接近,所以不能单纯的只使用图像增强算法来消除背景的影响,还需要在其他技术方面进行深一步研究。
3.1.3图像分割
图像分割(imagesegmentation)是数字图像处理领域一类非常重要的图像分析技术,在对图像的研究和应用中,根据不同领域的不同需要,在某一领域往往仅对原始图像中的某些部分(目标)感兴趣。这些目标区域一般来说都具备自身特定的一些诸如灰度、纹理等性质,图像分割主要根据图像在各个区域的不同,而对其进行边界或区域上的分割,并从中提取出所关心的目标。
图像分割注重对图像中的目标进行检测与测量,这与在像素级对图像进行操作的图像处理技术,与改善图像视觉效果而强调在图像之间所进行的变换是有所区别的。通过对图像的分割、目标特征的提取,可将经初步图像处理的图像特征向量提取出来,并将原始的数字图像转化成为一种有利于目标表达的更抽象、更紧凑的表现形式,从而使高层的图像分析、图像理解以及计算机的模式自动识别成为可能。多年来,图像分割技术一直在工业自动化控制、遥感遥测、微生物工
沈同I理:l:火学硕士学位论文
种等多种工程应用领域得到相当广泛的应用。在应用的同时,也总结、研究出了千余种各类图像分割算法,并仍以每年发现上百种新算法的速度在不断递增。如,可变阈值法(VariableThresholding)、自适应阈值【‘8](Adaptive
VariationalThresholdingbyMethod)、区域生长法、区域分裂合并法、松弛迭代法铮19】。然而,目前对这些分割算法的分类并没有一种统一的提法,现在图像界得到相当认同的一种分类方式是根据处理策略和相邻像素在灰度级上的差异(可分为具有不连续性的边界和具有相似性的区域)对算法进行归类的分类方法,此分类方法将图像分割算法划归为4大类:并行边界分割算法、串行边界分割算法、并行区域分割算法和并行边界分割算、法【20l。一般来说,在并行算法中所有的运算过程均是在同一时间内各自独立完成的,而串行算法则是顺序处理的,即后续处理过程需要以前的处理结果作支持,因此在处理的速度上要比并行处理的速度慢,而且中间处理过程的控制相当复杂,但在抗噪声干扰方面串行分割算法要优于并行分割算法。在应用中应根据实际情况权衡利弊选择合适的图像分割算法。
由于图像分割算法是根据图像各区域不同特性而进行分割的,因此对于若干具有不同特性的图像,无法用同一种图像分割算法对其进行分割处理。到目前为止,所有的图像分割算法均是针对某具体问题而提出的,并没有一种可适用于任何图像的通用分割算法。这也可以从另一个方面说明,为什么能研究出上千种方式各异的图像分割算法,而且每年都是上百种的速度在递增。尽管存在着数量庞大的各种图像分割方法,但均可以将其分割处理的特点归纳为以下几方面:
第一,分割产生的所有区域之和包括了原始图像中原有的所有像素,即分割把原始图像的每个像素都分到某个区域;
第二,分割后的结果互不重叠,即原有像素不能同时分割到两个区域;
第三,分割后的各个区域有其独有的特性,即同区域的像素具有某种共性;第四,分割后的不同区域具有不同的特性,分割后同一区域内任两像素在该区域内相互连通,即分割后的区域是一个连通组元。
图像分割有三种不同的途径,其一是将各像素划归到相应物体或区域的像素聚类方法即区域法;其二是通过直接确定区域间的边界来实现分割的边界方法;其三是首先检测边缘像素再将边缘像素连接起来构成边界形成分割。
第3章基于神经网络的视觉识别系统输入信息的研究
3.1.3.1并行区域分割
并行区域分割算法通过并行的处理方式和对目标区域的检测来实现对图像的分割,由于通常进行图像分割的目的在于对目标区域的提取,因此采用针对区域进行分割的算法是非常直接的[201。其中,阈值化分割算法是并行区域分割算法中具有代表性的一类非常重要的分割算法,其基本的处理方式是:先在图像的灰度取值范围中选择一个狄度阈值,并对图像全部像素点应用该阈值。一般说来,经由此阈值分割的两部分像素点集分属于图像中的不同区域,这也就使利用阈值对图像进行区域分割成为了可能。
阈值是在分割时作为区分物体与背景像素的门限,大于或等于阈值的像素属于物体,而其它属于背景。这种方法对于在物体与背景之间存在明显差别的景物分割十分有效。实际上,在任何实际应用的图像处理系统中,都要用到阈值化技术。为了有效地分割物体与背景,人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等[2H。
全局阈值是指整幅图像使用同一个阈值做分割处理,适用于背景和前景有明显对比的图像。
自适应阈值在许多情况下,物体和背景的对比度在图像中不是各处一样的,这时很难用统一的一个阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阈值进行分割。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,进行图像分割。
最佳阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值。
(1)阈值分割
取阈值是最常见的并行的直接检测区域的分割方法。最简单的利用取单阈值方法来分割灰度图像,步骤如下。首先对一幅灰度取值在‰和‰之间的图像确定一个灰度阈值T(g血<T<g一)。然后将图像中每个像素的灰度值与阈值T相比较,并将对应的像素根据比较结果(分割)划为两类:像素的灰度值大于阈值的为1类,像素的灰度值小于阈值的为另0类。分割后的图像可以定义为:
沈冈I理:I:人学硕十学位论文
如川=代翥嬲≥》4,
单阈值分割算法只适合于由具有单峰灰度分布的目标和背景组成的,在目标或背景内部的相邻像素间的灰度值是高度相关的,并且在目标和背景交界处两边的像素在灰度值上有很大差别的图像。显然这些要求对于一个复杂一点的图像的分割是不适用的。
(2)双峰阈值分割
对于比较简单的图像,可以假定物体和背景分别处于不同的灰度级,图像被零均值高斯噪声污染,所以图像的灰度分布曲线近似认为是由两个正态分布函数(胁,彳)和(他,D言)叠加而成,图像的直方图将会出现两个分离的峰值,如图3.7所示。
图3.7双峰直方图
对于这样的图像,分割阈值可以选择直方图的两个波峰问的波谷所对应的灰度值作为分割的阈值。这种分割方法不可避免的会出现误分割,使一部分本属于背景的像素被判决为物体,属于物体的一部分像素同样会被误认为是背景。可以证明,当物体的尺寸和背景相等时,这样选择阈值可以使误分概率达到最小。在大多数情况下,由于图像的直方图在波谷附近的像素很稀疏,因此这种方法对图像的分割影响不大。这一方法可以推广到具有不同灰度均值的多物体图像。3.1.3.2迭代求图像最佳分割阈值算法研究与实现迭代求图像最佳分割阈值算法是双峰阈值分割算法的一种改进。通过阈值迭
第3章基丁神经网络的视觉识别系统输入信息的研究
代的方式可以通过程序自动搜索出比较合适的阈值[13?14]。此阈值的选取方法先用初始的开关函数将原图全部像素分成前景、背景两大类,然后分别对其进行积分并将结果取平均以获取一新的阈值,之后再次按此阈值控制开关将图像分成前景、背景,并用做新的开关函数。如此反复下去,当开关函数不再发生变化,即迭代已经收敛于某个稳定的阂值时,此时的阈值即作为最终的结果并用于对图像的分割。下面是这种算法的步骤:
(1)求出图像中的最小和最大灰度值Zf和乙,令阈值初值
P:华(3-5)
(2)根据阈值r将图像分割成目标和背景两部分,求出两部分的平均灰度值Z0和ZB:
∑z(枷×Ⅳ(f,,)
Zo=型暑而厂:(f。,)<一(3_6)
∑z(i,j)xN(i,/)
:(f,j)>Tk
zB=∑N(i,/)
:(f,j)>Tk(3-7)
式中z(i,j)是图像上(i,j)点的灰度值,N(i,J)是(i,j)点的权重系数,一般N(i,j)=1.0。
(3)求出新的阈值:
P?:掣冬(3-8)
(4)如果丁置:r川,则结束,否则K卜K+1,转步2。
本文采用上面介绍的迭代求图像最佳分割阈值算法,编写VC++程序进行图像的分割。图像分割的结果如下图3.8所示。
沈目i哩r人学硕}学位论文
毒
幽38分割效果圈
该算法很好的把图像中的垃圾图像和图像背景色很好的分离,有利于图像中物体的特征提取。
32特征空间
确定合适的特征空间是设汁基于神经网络的视觉识别系统十分重要的问题n“。如果所选用的特征空间能使同类物体分布具有紧致性,不同类别物体彼此分开,即各类样品能分布在个特征空间中彼此分开的区域内.这就为分类器设计提供良好的基础,反之,如果不同类别的样品在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。
特征守间的设计往往是一个逐渐优化的过程,设计初期阶段,选择的特种空问位维数较多,需要对它进行改造,改造的目的在于提高其某方面的性能,因此又称为特征空间的优化问题。
321特征选择
为了更有效地利用图像的特征.有必要对特征进一步进行选择,尽量设法去掉一世误差.而又保留原来特征中的信息,这往往利用原来的特征,通过些方法,找出某些综合指标来。
特征选择是对原始数据进行抽取,抽取那些对区别不同类别最为重要的特征,而舍去那些对分类并无多大贡献的特征,得到能反映分类本质的特征m,。
第3章基于神经网络的视觉识别系统输入信息的研究
为了进行快速、准确的识别,要进行特征选择和特征压缩。对于神经网络的识别器来说,使用什么样的特征描述事物,也就是使用什么样的特征空间与实际情况相关。
特征的选择常常面临着保留那些描述量,删除那些描述量的选择,通常要经过多到少的过程,因为设计神经网络识别方案的初期阶段,应该尽量多地列举出各种与分类有关的特征,这样可以充分的利用各种有用的信息,改善神经网络识别效果。但是大量的特征中肯定会包含许多彼此相关的因素,造成特征值的重复和浪费,给计算带来困难。Kanal.L曾经总结过经验:样品数N与特征数n之比应足够大,通常样品N是特征值n的5~10倍左右。为使特征数有多到少,需要进行特征选择,特征选择通常包括两个方面的内容:
第一对单个特征的选择,即对每个特征分别进行评价,从中找出对识别作用最大的那些特征;
第二从大量的原有特征出发构造出少数的有效的新特征,这种方法称为将为映射。
对一个具体问题来说,有以下几个层次:
第一物理层的获取和转换。
这是指用什么样的传感器获取电信号,对从传感器中得到的信号,可以成为原始信息,因为他要经过加工、处理才能得到对模式分类更加有用的信号。如摄取景物则要用摄像机,文字与数字识别首先要用扫描仪等设备,手写体文字所用传感器与印刷体文字也有和可能不同。这些都属于物理量的获取,并且已转换成电信号,为计算机分析打下基础。
第二描述事物方法的选择和设计。
在得到了原始信息之后,必须对原始信息进行加工,以获得对分类有效的信息。设计所要信息的形式是十分关键的。
3.2.1.1特征选择目的
用尽可能少的特征进行分类器的设计,不仅在样本不多的条件下可以改善分类器的总体性能,而且在很多情况下,能够简化特征的获取过程,以降低模式识别系统的复杂程度。所以研究如何把高维特征空间压缩到低维特征空间以便有效
沈阿I理jI:大学硕十学位论文
地设计分类器是特征选择的目的。
3.2.1.2特征选择任务
特征选择的任务是从一组数量为D的特征中选择出数量为d(D>d)的一组最优特征。为此要解决两个问题,一是选择的标准,可以用前所述的可分离性判据,即要选出使某一可分性达最大的特征组来,另一个问题就是要找到一个较好的算法,在合适的时间内找出最优特征组。现今出现了一些有特色的特征选择法,如:最优搜索算法、次优搜索法、模拟退火算法、Tabu搜索算法、遗传算法等。但是大多数方法需要大量的计算和统计,而且效果并不能完全令人满意,如果特征不多的情况下,可直接输入神经网路,理论证明BP神经网络在训练过程中有一定的特征选择能力。
3.2.2特征提取
为了将千差万别的图像进行分类,需要通过一些手段,将各类图像的重要性用数字刻画出来,就是所谓的特征提取。
常见的目标特征可分为灰度(密度、颜色)特征、纹理特征和几何形状特征等.把某一图像的某种特征进行度量并交给神经网络识别器,是模式识别的重要环节。所要提取的应当是具有可区别性、可靠性、独立性好的少量特征。
在模式识别中特征提取是首先需要解决的问题。对一个基于神经网络的视觉识别系统更为重要,图像特征选取的好坏,直接关系到神经网络识别系统是否能对图像能够进行有效、准确的识别。如果直接从样品中得到数据,那么数据的规模是巨大的,有时是无法想像的。要是直接将这些数据输入到基于人工神经网络识别系统中,不仅,导致神将网络的结构变得相当复杂,也会使增加神经网络的学习时间、训练时间和识别时间,这对会严重的影响系统的工作效率。
3.2.3特征量的计算
对图像进行相应的处理后,就得到了一副效果图很好的二值图像,其目的是为了计算图像中的物体的特征值。
在本论文中主要对以下几个特征量进行了计算:
’‘口。.28-
第3章基丁神经网络的视觉识别系统输入信息的研究
3.2.3.1图像中物体面积
在二值化图像中,相互连接的黑像素的集合合成为一个黑区域。通过对图像中黑像素的累加,即为图像中物体的面积。
具体的实现步骤如下:
(1)将数字图像灰度化:
●
(2)运用图像分割技术,将物体和背景分离;
(3)循环图像的每一行和每一列,将物体的像素点加起来;
(4)输出上一步的橡树像素点的和,即为图像中物体的面积(单位为像素)。3.2.3.2图像中物体周长
在二值图像中中,相互连接的黑像素的集合合成为一个黑区域。在上面的章节中,通过对图像内每个像素进行标记操作,将物体的像素值改为标记,再采用边界跟踪法,跟踪个封闭区域边界线的每个黑像素的标号,记录二值图像中物体边界的坐标值序列。边界线跟踪采用左手搜索法,它是将白区域是为平面,黑区域视为物体,然后一边让左手接触建筑物的壁面一般前进,最后返回出发点的一种跟踪方法。最后输出连同区域的周长。
具体的实现步骤如下:
(1)将数值化和灰度化的图像进行二值化;
(2)采用边缘跟踪法找到出发点,记录坐标,再跟踪下一像素,保留循环得到的边界点,其余都置成255(白点);
(3)判断是否会到出发点,没有则返回(2),有向下进行;
(4)输出记录的像素点的个数,即为图像中物体的周长。
3.2.3.3图像中物体的宽度
由于在图像中的物体很可能是不规则的物体,所以不存在宽度的问题。而在这里所指的图像中物体宽度是指物体的最大水平宽度。
具体的实现步骤如下:(1)将数值化和灰度化的图像进行二值化,是物体为黑色,物体为白色;
沈阿I理I:人学硕十学位论文
(2)将上面的二值化的图像进行小区域消除;
(3)循环每行,以此判断每一行的像素值是否为黑色,并统计给行黑像素的个数;
(4)循环各行,将每行中统计的黑像素个数进行比较,选择其中最大的数存储下来,
在上面的步骤中最后保存下来的数就是图像中物体的最大水平宽度。3.2.3.4图像中物体的高度
由于在图像中的物体很可能是不规则的物体,所以不存在高度的问题。而在这里所指的图像中物体高度是指物体中的最大水平高度。
具体的实现步骤如下:
(1)将数值化和灰度化的图像进行二值化,是物体为黑色,物体为白色;(2)将上面的二值化的图像进行小区域消除;
(3)循环每列,以此判断每一行的像素值是否为黑色,并统计给行黑像素的个数;
(4)循环各列,将每行中统计的黑像素个数进行比较,选择其中最大的数存储下来。
在上面的步骤中最后保存下来的数就是图像中物体的最大垂直高度。3.2.3.5灰度概率密度
图像中概率密度函数为p,(1):攀梨警(3-9)1孺素荪丽pr也,J2
c=e|4zrA(3-10)其中‘为图像中某个灰度的值,所(,:)为灰度I的概率值。3.2.3.6复杂度图像的复杂度的定义如下:
第3章基’神经嘲络的视觉识别系统输入信息的研究
其中,L为周长;A为面积:C表示复杂度。在相同的面税条件下,圆形的周长最短,可成为最密集的形状,CG:随着周围凹凸变化加剧,周长增大,C随之增大,因此常用复杂度作为区域相对于圆的离散性度量。
3237计算结果
本文运用上面介绍的各种特征的计算方法,用vc++60编写程序对图像的特征进行讨算。图像各个特征值的计算结果如图39所示。
削39图像特征值的计算结粜
324特征量的统一化
山于本文中提取的大部分是特征都是儿何特征,这样的话就会存在一个问题,对于同一物体的不同距离的拍摄的照片.物体在图像中的大小就会有变化。在这种情况F,同物体几何特缸值就会不一样。这样的话对同一个物体的识别就会得出两种结果,这是币允许。两种方法可以解决这个问题,第一,取同一物体不同距离的照片,进行特征提取,构建特征库。第二,以某一个固定的距离,统一图像中午体的特征值。很显然,第种方法,特征库中存在大量冗余数据,会增加神经删络的训练时间。是不可取的。
本文应用第■种方法,对特征值进行统一化。
统化过程如下:设湖血清污机器人到拍摄的物体的标准距离为d,实际的湖面清污机器人到拍
沈阿j理:T:人学硕士学位论文
摄的物体的距离为d2
令乡=面d(3-11)
这罩的0成为统一系数,实际计算出来的几何特征值都要乘上各系数,进行特征量的统一化。
3.3本章小结
本章是基于神经网络的视觉识别系统输入信息的研究。首先讲解了进行视觉识别系统输入信息的研究必然性。接下来从图像处理和图像的特征提取两个方面并给出了一种改进的中值滤波算法,实现图像的增强。研究了并行区域分割,阀图像最佳阀值分割进行实现。在特征空间中,学习特征提取的原则,对本文将用进行了研究。在图像处理中,研究了图像灰度化,图像增强,图像分割的技术,值分割,双峰阀值分割,迭代求图像最佳阀值分割等多种分割技术,并对迭代求到的特征进行选择和定义。研究了这些特征量的计算,给处理特征量的计算过程。最后对特征量的统一化进行了分析。
第4章基于神经网络的视觉识别器的设计与实现
第4章基于神经网络的视觉识别器的设计与实现4.1神经网络的选择‘
人工神经网络(ArticialNeuralNetworks,ANN),简称神经网络(NN),是对人脑或自然神经网络若干基本特性的抽象和模拟,是一种基于连接学说构造的智能仿生模型,是有大量神经元组成的非线性动力系统。
以生物神经网络为模拟基础的人工神经网络在模拟推理和自动学习等方面向前发展了一步,使人工智能更接近人脑的自组织和并行处理功能,它在模式识别、聚类分析和专家系统等多方面显示出了新的前景和新的思路。神经网络可以看成是从输入空间到输出空间的一个非线性映射,它通过调整权重和阀值来“学习"或发现变量间的关系,实现对事物的分类。由于神经网络是一种对数据分布无任何要求的非线性技术,他能有效解决非正态分布、非线性的评价问题,因而受到广泛的应用。由于神经网络具有信息的分布存储,并行处理及自学习能力等特点,所以它在信息处理、模式识别、智能控制等领域有着广泛的应用前景。进年来,神经网络已经成为研究的热点,并取得了广泛的应用。
人工神经网络具有如下特崩:习。
第一,固有的并行结构和并行处理。
人工神经网络和人类的大脑似,不但结构上是并行的,它的处理顺序也是并行的。在同一层内的处理单元都是同时操作的,即神经网络的计算功能分布在多个处理单元上。而一般计算机通常有一个处理单元,其处理顺序是串行。
第二,知识的分布存储。
在神经网络中,知识不是存储在特定的存储单元中,而是分布在整个系统中,要存储多个知识就需要很多连接。在计算机中,只要给定一个地址就可得到一个或一组数据。在神经网络要获得存储的知识则采用“联想"的办法,这类似于人类和动物的联想记忆。人类根据联想善于正确识别图形,人工神经网络也是这样。
沈阿I理j1:人学硕十学位论文
第三、容错性。
人工神经网络具有很强的容错性。它可以从不完善的数据和图形进行学习和做出决定。由于知识存在整个系统中,而不是存在存储单元中,预定比例的节点不参与运算,对整个系统的性能不会产生重大影响。它能够处理那些有噪声或不完整的数据,具有泛化功能和很强的容错能力。
第四,自适应性。
人工神经网络主要是根据所提供的数据,通过学习和训练,找到输入和输出之间的内在关系,从而求取问题的解,而不是依据对问题的经验知识和规则,因而具有自适应功能,这对于弱化权重确定其中人为的因素是十分有益的。
第五,模式识别的能力。
目前有各种各样的神将网络模型,其中有很多神经网络模型善于模式识别。模式识别是人工神经网络最重要的特征之一。它不仅能识别静态图像,对实时处理复杂的动态图像(随时间和空间变化的)也具有巨大潜力。模式识别往往是非常复杂的,各个因素之间相互影响,呈现出复杂的非线性关系,人工神经网络为处理这类非线性问题提供了强有力的工具。
人工神经网络在模式识别问题上,相比其他传统方法的优势可以大致归结为以下三点[241:
第一,要求对问题的了解较少。
第二,可对特征空间进行较为复杂的划分。
第三,适用于高速并行处理系统来实现。
多层网络可以解决非线性可分问题这一结论早已有了,由于有隐层后使得学习比较困难,所以限制了多层网络的发展,反向传播(BP)算法的出现解决了这一困难,促使多层网络的研究重新得到重视[26?271。
BP算法的多层网络是目前应用最多的神经网络模型之一。这是因为:
第一,BP算法是有指导的学习,是靠调节各层的加权使网络对训练组进行学习,其执行优化的基本方法是梯度下降法,它的算法可使网络产生的实际输出与希望输出量一致。
第二,BP网络是一个含有隐层的神经网络。其算法由正向传播和反向传播组成,模式从输入层输入,经隐层逐层处理后传入输出层。在正向传播阶段,每一
第4章基于神经网络的视觉识别器的设计与实现
层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出结果,则进入误差反向传播阶段,网络根据反向传播的误差信号修改各层的连接权,使误差信号达到最小,从而可以产生输入到输出的非线性映射,这J下好适合解决图形识别等非线性复杂问题。
有以上的分析,本文决定选择用BP网络实现神经网络分类器。
4.2BP网络分类器的设计
BP网是一种有三层或三层以上的多层神经网络,每一层都有若干神经元组成ll】,如图4.1所示。
0j
XI
yj
x2
Xn
图4.1人工神经元模型
它的左右各层之间各个神经元实现全连接,左层的每一个神经元与右层的每个神经元都有连接,而上下各个神经元之间无连接,如图4.2所示。
riIOl
riI02
图4.2由于多指标综合评价的三层BP神经网络
BP网络按有教师学习方式进行训练,当一对学习模式提供给神经网络后,其神经元的激活值将从输入层各中间层向输出层传播,在输出层的各神经元输出对应于模式的网络响应。然后,按减少希望输出与实际输出误差的原则,从输出层经各
沈冈I理]:大学硕+学位论文
中层,最后回到输入层逐层修正各联接权。由于这种修正过程是从输出到输入逐层进行的,所以称它为“误差逆向传播算法”。随着这种误差逆传播训练的不断进行,网络的输入模式响应的J下确率也将不断提高。
由于BP网络有处于中间的隐含层,并有相应的学习规则可循,可训练这种网络,使其具有对非线性模式的识别能力。特别是它的数学意义明确、步骤分明的学习,更使其有广泛的应用前景。
,’
4.2.1BP网络中参数的选择
在进行BP网络的设计时,应从网络的层数、每层中的神经元数、初始值及学习速率等几个方面进行考虑。
4.2.1.1网络的层数选择
已经证明:三层BP网络可以实现多维单位立方体Rm到Rn的映射,即能够逼近任何有理函数。这实际上给了一个设计BP网络的基本原则。增加层数可以更进一步地降低误差,提高精度,但同时也是神经网络复杂化,从而增加网络权值的训练时间。而误差精度的提高实际上也可以通过增加因层中的神经元数目来获得,其训练结果也比增加层数更容易观察和调整。所以一般情况下,应优先考虑增加隐含层中的神经元数。
4.2.1.2输入层的神经元数的选择
输入层单元数可以根据需要解决的问题和数据所表示的方式类确定。如果输入的为图像,这输入可以用处理后的图像特征空间的位数,也可以用图像的像素数来确定输入层神经元数。本文中输入层神经元数为图像特征空间的位数。4.2.1.3隐含层的神经元数的选择
网络训练精度的提高,可以通过采用一个隐含层而增加神经元数的方法来获得。这在机构的实现上要比增加更多的隐含层简单多。在具体设计时,比较实际的做法是隐含层取输入层的两倍,然后适当地加上一点余量。评价一个神经网络的设计的好坏,首先是它的精度,再一个就是训练时间。时间包含两层含义:一?36.
第4章基于神经网络的视觉识别器的没计与实现
层是循环的次数。二是每一次循环中计算所花的时间。
4.2.1.4输出层的神经元数的选择
用BP神经网络做分类器,一般使用多输出型。本文采用二进制编码的形式,表示神经网络识别器识别物体的模式。设目标类别数为m个,输出层一般取m个神经元,则他们必须满足下面关系:
2‘≥m(4-1)
其中k取刚满足上述表达式的最小正整数。
4.2.1.5初始权值的选择
由于系统是非线性的,初始值的选取对于学习是否达到局部最小,是否能够收敛以及训练时间的长短有很大关系。初始值过大、过小都会影响学习速度,因此权值的初始值应选为均匀分布的小数经验值,一般取出始权值在[.1,1]之间的随机数也有选取在[.2.4/F,2.4/F]之间的随机数的,其中F为输入特征个数。为避免每一步权值的调整方向是同向的,应将初始值设为随机数。
4.2.1.6学习率的选择
学习率决定每一次循环训练中所产生权值变化量。快的学习率可能导致系统的不稳定。但慢的学习率导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下,倾向于选取较慢的学习率以保证系统的稳定性。学习律的选取范围在0.01"--0.8之间。
如同初始权值的选取过程一样,在一个神经网络的设计中,网络要经过几个不同的学习率的训练,通过观察每一次训练后的误差平方和yP:的下降速率来判断所选定的学习率是否合适,若yP:下降很快,则表明学习速率合适,若Ee2出现动荡现象,这说明学习滤过快。对于每一个具体的网络都存在一个合适的学习率,但对于较复杂网络,在误差曲面的不同部位可能需要不同的学习率。为了减少寻找学习速率的训练次数以及训练时间,比较合适的方法是采用变化的自适应学习率,使网络的训练在不同的阶段自动设置不同的学习率。一般来说,学习速度越.37.
沈阳理工人学硕十学位论文
快,收敛越快,但容易震荡;而学习速率越慢,收敛越慢。
4.2.1.7期望误差的选取
在网络的训练过程中,期望误差值也应当通过对比训练后确定一个合适的值。所谓的“合适",是相对于所需要的隐含层的节点数来确定,因为较小的期望误差要靠增加隐含层的节点,以及训练时间来获得。一般情况下,作为对比,可以同时对两个不同期望误差的网络进行训练,最后通过综合因素的考虑来确定采用其中一个网络。
尽管含有隐含层的神经网络能实现任意连续函数的逼近,但在训练过程中如果一些参数选取的合适,可以加快神经网络的训练,缩短神经网络的训练时间和取得满意的训练结果。对训练过程有较大影响的是权系数的初值、学习速率等。
(1)调整量与误差成正比,即误差越大,调整的幅度越大,这一物理意义是显而易见的。
(2)调整量与输入值的大小成正比,这里由于输入值越大,在这次学习过程中就显得越活跃,所以与其相连的权值的调整幅度就应该越大。
(3)调整两语学习系数成正比。通常学习系数在0.01一---0.8之间,为使整个学习过程加快,又不引起震荡,可采用边学习率的方法,即在学习初期取得较大的学习系数,数则学习过程的进行逐渐减少其值。
4.2.2BP网络学习算法分析
为了使神经网络具有某种功能,完成某项任务,必须调整层间连接权值和节点阀值,使所有样品的实际输出和期望输出之间的误差稳定在一个较小的值以内。在训练BP网络的算法中,误差的反向传播算法是最有效最常用的一种方法【26,271。三层BP网络学习算法如图4.3所示。
BP网络的学习过程主要由如下四部分组成。
第一,输入模式顺传播(输入模式由输入层经中间层向输出层传播计算)。第二,输出误差逆向传播(输出的误差有输出层经中间层传向输入层)。
第4章基丁.神经网络的视觉识别器的设计与实现
图4.3BP网路的学习流程图.39.
沈阿I理’T:人学硕十学位论文
第三,循环记忆训练(模式顺序传播与误差逆传播的计算过程反复交替循环进行)。
第四,学习结果判断(判定全局误差是否趋向极小值)。
下面根据具体情况介绍和分析上面提到的四个过程:
4.2.2.1输入模式顺传播
这一过程主要是利用输入模式求出它所对应的实际输出。
(1)确定输入向量Xk。.
K=k,《A,《】
其中m学习的模式对数;rl是输入层单元数。
(2)确定期望的输出向量伍=1,2八砌(4-2)
y=坼,谚A,菇】(4-3)
其中q是输出层单元数。
(3)计算中间层各神经元的激活值sj。
s,:窆慨?Xj)一巳j=---1“2叩)(4-4)
其中,%是输入层至中间层的连接权;巳是中间层单元的阀值;P是中间层单元数。
激活函数采用s型函数即几)=丽1
II(4—5)这里之所以选S型函数为BP网络神经元的激活函数,是因为它是连续可微分的,而且更接近于生物神经元的信号输出形式。(4)计算中间层j单元的输出值。将上面的激活值代入激活函数中可得到中间层j单元的输出值为:6II,G、I.、(4-6)
第4章基丁.神经网络的视觉识别器的设计与实现
阀值嘭在学习过程中与权值一样也有不断地被修正。阀值的作用反映在S型函数的输出曲线上。如图4.4所示。
图4.4阀值的作用
有图中可见,阀值的作用相当于将输出值移了各单位。同理,可求的输出端的激活值。
(5)计算输出层地t各单元的激活值0,。
0t:羔眈?x.,)一幺(4—7)
j=i
式中,%是中间层至输出层的权值;只是输出层单元阀值;
(6)计算输出层第t个单元的实际输出值Ct。
c,=f(o,)O=1,2,…q)(4—8)
式中,f是s型激活函数。
利用以上格式就可计算出一个输入的模式的顺传播过程。
在第一步的模式顺传播计算中得到了网络的实际输出值,当这些实际的输出这里的校正是从后向前进行的,所以叫做误差逆传播,计算时是从输出层到中间层,再从中间层到输出层。(1)输出层的校对为4.2.2.2输出误差的逆传播。值和期望的输出值不一样或者误差大于所限定的数值时,就要对网络进行校对。
沈阿I理1:大学硕+学位论文
d≥◇?一c?l厂’∽)(4—9)
式中,t=l,2,…,P(p是中间层单元数);k=l,2,3,…m(m是学习模式总数);∥是希望输出;t是实际输出;厂’∽)是对输出函数的导数。
(2)中间层的校正误差为
萨陲t=1%叫灿)\/∽㈣
其中j=1,2,eom
9P(p是中间层单元数);k=l,2,…m。
这里应注意,每一个中间单元的校正误差都是由q个输出层单元校正误差传递而产生的。当校J下误差求得后,则可利用钟和P;沿逆方向逐层调整输出层至中间层,中间层至输入层的权值。
(3)对于输出层至中问层连接权和输出层阀值的校正量为
△%2口?衫?够
Ayt=o【?d:(4—11)
其中,骘是中间层j单元的输出;dj是输出层的校正误差。j=l,2,o
2,…,q;k=l,2,…,m;O<口(学习系数)。
(4)中间层至输入层的校正量为oo9p;t=l,
阑jt=jB?0xj(4-12)厶yt=p?ej
式中P;是中间层j单元的校正误差。i=1,2,
<1(学习系数)。ooo9n(n是输入层单元数);o<B
有以上过程可以得出以下特点。
(1)调整量与误差成正比,即误差越大,调整的幅度就越大。
(2)调整量与输入值的大小成正比,这里由于输入值越大,在这次学习过程中就显得越活跃,所以与其相连的权值的调整幅度就应该越大。
(3)调整量与学习系数成正比。通常学习系数在0.1~0.8之间,为是整个学习过程加快,又不引起震荡,可采用改变学习率的方法,即在学习初期取较大的学习系数,随着学习过程的进行逐渐减少其值。
第4章基丁神经网络的视觉识别器的设计与实现
4.2.2.3循环记忆训练
为使网络的输出误差趋向于极小值,对于BP网输入的每一组训练模式,一般要经过数百次甚至上万次的循环记忆训练,才能使神经网络记住这一模式。这种循环记忆训练实际上就是反复重复上面介绍的输入模式。
4.2.2.4学习结果的判别
当每次循环记忆训练结束后,都要进行学习结果的判别。判别的目的主要是检查输出误差是否已经小到可以允许的程度。如果小到可以允许的程度,就可以结束整个学习过程,否则还要进行循环训练。学习或者说训练的构成是网络全局误差趋向于极小值的过程。但是对于BP网络,其收敛过程存在着两个很大的缺陷:一是收敛速度慢,二是存在“局部极小点”问题。在学习过程中,有时会出现当学习反复进行到一定次数后,虽然网络的实际输出与期望输出还存在很大差异,但无论再如何学习下去,网络全局误差的减小速度都变得很缓慢,或者根本不在变化,这种现象是因网络收敛于局部极小点所致。BP网络的全局误差函数E是一个以S型函数为自变量的非线性函数。这就意味着由E构成的连接权空间不是只有一个极小点的曲面,而是存在多个局部极小点的超平面,如图6—11所示。
误差函
全局最小点
图4.6最小点和极小点
导致这一缺陷的主要原因是采用了按误差函数梯度下降的方向进行校正。在图4.6中,若初始条件是从A点的位置r开始的则只能达到局部极小值,但如果从B点开始则可以达到全局最小点。所以BP网的收敛依赖与学习模式的初始化位置,适当改进BP网络中间的单元个数,或者给每个连接权加上一个很小的随机数,都有可能使手链过程避开局部极小点。
沈冈I理jI:大学硕十学位论文
4.2.3BP网络学习算法的改进
将BP学习算法应用于具有非线性转移函数的三层前馈网,可以以任意精度逼近任何非线性函数,这一非凡优势使多层神经网络得到了越来越广泛的应用。.然而标准的BP算法在应用中暴露出了不少内在的缺点。
第一,易形成局部极小值而得不到全局最优。
第二,训练次数使得学>-j效率最低,收敛速度慢。
第三,隐节点的选取缺乏理论指导。
第四,训练是学>-j新样本有遗忘就样本的趋势。.本文针对神经网络的学>-j速度慢这一缺点进行改进,引入自适应调节学>---j率眦s】的概念。
学习率Tl也称为步长,在标准BP算法中定为常数,然而在实际应用中,很难确定一个从始至终都合适的最佳学习率。从误差曲面可以看出,在平坦区域内Il小会是训练次数增加,因而希望增大Tl值;而在误差变化剧烈的区域,n太大会因调整量过大而跨过较窄的“坑凹"处,是神经网络的训练出现震荡,反而出现迭代次数的增加。为了加速收敛过程,一个较好的思路就是自适应改变学习率Tl,使其该大的时候增大,该校的时候减小。
本文中根据上面的原则,初始学习率q选择一个比较大的初值。在学习的过程中选择q。为下次训练时的学习率。
学习率q。的定义如下:
驴吼(t一南)
意大的整数。泠㈣其中rl。表示初始的学习率,t表示当前的训练次数,T表示总的训练次数,M是任
训练过程中学习率的调整如下:若经过一批次权值调整后使总误差E总变大,这次调整无效,IEIr/,=-r/o(1一歹南);若经过一批次权值调整后使总误差%减小,这本次调整有效仉=77。(1—7南)。
第4章基丁神经网络的视觉识别器的设计与实现
引进变学习率后的BP算法流程如图4.5所示。
图4.5改进的BP算法流程
4.3BP网络分类器关键部分的实现
本文中的BP网络定为三层:输入层、隐含层、输出层。本文中研究了图像的6个特征值,经选择,确定图形中物体的面积,周长,宽度,高度和某一灰度的密度作为神经网络识别器的输入。因此,输入层的神经元的个数为5个。根据隐含层神经元的个数大约为输入层的二倍这一原则,隐含层取10个节点,输出层神经元的多少直接关系神经网络的识别种类,这里为实验方便选择比较小的输出层的节点数,选为4个。输出层以二进制进行编码。这就意味着输出节点为4的神经网络可以识别16中不同的图像。根据识别样品的增加,可以适当的增加神经网络输出层神经元的个数。
沈冈I理j‘I:人学硕十学位论文
4.3.1BP网络采用的数据结构
为了实现神经网络分类器,使神经网络识别器的结构清晰,易于扩展,本文采用面向对象技术1291,定义BpNet类。BPNet类为神经网络的数据结构,其中包括:神经网络数输入层、神经网络的输出层、神经网络的初始化函数、神经网络的训练函数、神网络络的各节点的权值等等神经网络所要用到的参数。
具体的实现如下:
classBpNet
{
public:
doubletjpt141j
doubleshuchu[4];
doublem141:
double宰sim(double枣psim);
voidtrain(doublep【]【5],doublet【][4】,intsamplenum);
BpNet0;
virtual—BpNet0;
intinNum;
inthideNum;
iraoutNum;//输入结点数//隐含结点数//输出结点数
∥输入向量
∥隐含结点状态值
//输出结点状态值
//隐含层激活值
//输出层激活值
//输入层至隐含层权值
∥隐含层至输出层权值
//权值学习率(输入层.隐含层)
//权值学习率(隐含层.输出层)doublex[200];doubledoubledoubledoublexl[2001;x212001;011200];021200];double州习口01;doublew111凹朋;doublerate_w;doublerate._wl;
第4章基于神经网络的视觉识别器的设计与实现
doublerate_bl;
doublerate_b2;
double//隐含层阀值学习率//输出层阀值学习率//隐含结点阀值bl//0/;
doubleb2C41;//输出结点阀值
doublepp[200];
doubleqq[200];
doubleyd[200];
doubleP;
doubleerror;//希望输出值∥允许的最大误差
4.3.2BP网络的训练函数
在上一节中,神经网络的数据结构的实例对象是一个没有识别能力的识别器,他还需要一个学习过程,学习过程包括:训练样本对的构建、输入模式顺序传播、输出误差你传播、循环记忆训练、学习结果判定。这一训练过程是神经网络识别器是否有识别能力的关键一步。
具体的实现如下:
voidBpNet::train(doublep【】【5】,doublet[】[4],intsamplenum)
{
for(intisamp=0;isamp<samplenum;isamp斗)//循环训练一次样品
{
for(inti=0;i<洫N啪;i++)
x[i]=p[isamp][i];
for(i=0;i<outNum;i++)
yd[i]--t[isamp][i];//构造每个样品的输入和输出标准
for(intj=0;j<hideNum;j++)
{
ol[j]=O.0:
for(i=0;i<inNum;i++).47.
沈研I理‘l:人学硕十学位论文
olD].olD]+w[i】D】木x[i】;//隐含层各单元输入激活值
xl[j]=1.0/(1+exp(.ol[j]-bl[j]));//隐含层各单元的输出
)
for(intk=0;k<outNum;k++)
{
02[k]=0.O:
for(j=0;j<hideNum;j++)
02[k卜02[k]+wlD】[k】宰x1D];∥输出层各单元输入激活值
x2[k]=1.o/(1.0+exp(一02[k]-b2【k】));//输出层各单元输出
)
for(k=0;k<outNum;k++)
{
e=0.O;
qq【k]=(yd[k】-x2[k】)木x2[k】奉(1.0-x2[k]);//希望输出与实际输出的偏
7f差
e+=fabs(yd[k].x2[k])*fabs(yd[k]-x2[k]);//计算均方差
for(j=0;j<hideNum;j++)
wl[j][k]=w1[j][k]+ratewl*qq[k]*xl[j];//下一次的隐含层和输出
//层之间的新连接权
e=sqrt(e);
if(e<error)
tjpt[k]=l;
)
for(j=0;j<hideNum;j++)
{
pp[j]=0.O;//隐含层的校正误差
for(k=O;k<outNum;l【++)
{
pp[j]=pp[j]+qq[k]半w1D】[k];
第4章基于神经网络的视觉识别器的设计与实现
)
pp[j]=PP[j]木xl[j]木(1.?xl[j]);//隐含层的校正误差
for(i=0;i<inNum;i++)
{
w[i][j]--w[i][j]+ratew木pp[j]*x[i];//下一次的输入层和隐含层之
∥间的新连接权
}
)
for(k=0;k<outNum;l【抖)?
b2[k]=b2[k]+rateb2*qq[k];//下一次的隐含层和输出层之间的新阈值
for{j=0;j<hideNum;j++)
bl[j]=b1[j]+ratebl*pp[j];//下'--次的输入层和隐含层之间的新阈值
本章介绍了神经网络选取,神经网络在图像识别上的优势,然后介绍了神经网4.4本章小结络的设计原则和人工神经网络各种参数的选定原则,其次,对三层BP网络学习算法进行了分析,针对三层BP学习算法的局限性提出自己的改善办法,最后介绍一个具体的人工神经网络分类器的设计和实现。
沈日l理I‘人学硕}j学忙论文
第5章基于神经网络的识别系统的识别过程及应用51基于神经网络的视觉识别系统的识别过程
第步,吲缘处理及特征提取。
运川图像处川,方注,对匿像进行H像的灰度化、图像的增强、时像的分割图像样术小的个样奉的处理结果如图5l所示。
零
吲51处理厉的图像
运用特征计算的打法进行特征值的计算.特征值的计算结果如下表5
表5l向纸团的原始特征单竹(像素)
第一步,特征库的构建。
分类器的设讨方法属于监督学习法。在监督学习识别方法中,为能够对未知事物进行分类,必须输入一定数量的样本,构建训练特征库,而且这些样品的类别已知,对这些样本进行上面的特征提取。将这些特征有机的存放文件中,进而构建成特征库。第二!步,神经州络分类器的构建。
第5章基丁神经网络的识别系统的识别过程及席圳
神经网络的构建即神经网络的学习过程。用样奉对对神经网络识别器进行两万次的训练,神经网络的权值将会进行适当调整,已录样本的模式。由于神经网络识别器的权值数量过多,这里只给出输八层的第一个}十经元和中间层各神经元之阃的初始权值,』上干次训练后,一万次训练后、一万五千次训练后、和两万次训练后的权值。具体情况如表52所示。
丧52权值的变化表
初值权值
w[O][01
w[O儿1】
w[O】[2】
w[O]【列
wf卅f4】
w【0】[5】
w【o】【6】
w[o][7]
w【0][8】
w【0】[9]05805820j32578053j102oj干次训整后1^次调整后15万次调整后2万扶调齄后5438850497742017276801164Ol嘶242
从表52可以看扎神绎网络的权值变化趋势是收敛的。经过两万次的神经网络的学习训练,神经M络识刖器记录了用于训练样本的模式,使神经删络有了识别能力。
第四步,神经网络分类器对图像的识别。
如图52所币给出了原图像的识别结果。
图52原圈干¨识别结果
沈阿l理:f大学硕+学位论文
其中神经网络识别器的输出是神经网络识别器计算的数字结果。本文中为了使实验结果看上去更容易理解,建立了神经网络识别器的数字结果和结果含义的对应关系,这种关系被存储在数据库中也可以存储在文件中,这样神经网络识别器识别计算出来的结果就可以被解释相应的文字含义。
5.2基于神经网络的视觉识别系统在机器人视觉上的应用
本文从基于神经网络的视觉识别系统的两个部分即基于神经网络的视觉识别系统的输入信息和神经网络识别器进行了研究。目的在实现湖面清污智能机器人对湖面各种垃圾、岸边和障碍物的识别。机器人不仅要具备自己的特征库(由已知的各种垃圾、岸边和障碍物的特种构成),更重要的是湖面清污智能机器人必须要有学习功能,能够实时的对图像进行分析,将新的样本特征值加入特征库中,用于重新训练神经网络识别器。湖面清污智能机器人可以根据目标图像样本对图像的面积、周长、水平最大宽度、垂直最大高度、复杂度、某一点的灰度等进行原始特征的提取构成原始特征空间。湖面清污智能机器人识别的对象可以分为以下几个模式:
正常模式:机器人正常在湖面上运行;
垃圾模式:机器人缓慢运行,对目标进行收集;
岸边模式或蔽障模式:湖面清污智能机器人减慢速度,对目标进行蔽障改变运动方向。
通过上面神经网络的识别过程和识别结果可以看出,基于神经网络视觉识别系统的可以应用在机器人的视觉上,使机器人能对各种垃圾很更好的识别。5.3本章小结
本章主要对图像神机网络的识别过程进行了详细的介绍,最后探讨了基于神经网络的视觉识别系统在机器人视觉上的应用。
沈阳理丁大学硕十学位论文
结论
工作总结
在一年多的调研、分析、设计中,对神经网络、机器视觉、图像处理、模式识别等领域进行了系统的学习,参考了大量的中外文文献资料。根据机器人视觉系统的特点,完成了基于神经网络的视觉识别系统的设计,并对设计的系统的各个功能进行了研究和实现。在输入信息处理部分,运用图像增强技术对图像的噪声进行了处理,给出了一种改进的中值滤波算法,对并行区域分割算法进行了研究,较好地利用迭代式求图像最佳阈值的分割算法实现了图像的分N--值化。定义了一些将用于图像识别的图像特征,进一步研究了这些图像特征的计算,并给出了计算步骤或者是计算公式。在神经网络识别器部分,对神经网络进行了研究,选择了一种神经网络模型,研究了神经网络的响应参数的确定,分析了神经网络的学习算法[!pBP算法,根据BP算法中的缺点,提出对BP算法的改进方法,完成了神经网络识别器的设计,并使用VC++6.O对标准的BP法实现及改进的BP算法的实现。
基于神经网络的视觉识别系统的识别过程表明,通过上面的图像处理过程处理的图像,可以很好对该图像中物体的特征值进行提取和计算,通过上面的神经网络学习算法实现的神经网络识别器,在训练过程中可以很好的收敛并记录训练样本的模式,在识别过程中,可以对训练的样本模式进行有效的识别。
基于神经网络的视觉识别系统的识别可以完成特定的识别要求;基于神经网络的视觉识别系统可以应用智能机器人视觉系统中。为智能机器人视觉系统的开发提供参考。
下一步工作与展望在本文的研究实现过程中遇到了不少困难。由于时间和条件的限制,解决的不
沈阿1理一T:大学硕+学位论文
是很完美,仍然需要在今后进一步研究,这些问题主要涉及到:
(1)在基于神经网络的视觉识别系统输入信息的研究中,图像的增强是图像处理过程中重要的一步本文使用了两种方法对图像增强进行比较,并获得了效果很好的图像。但是本人认为图像增强还存在着一定的问题,这些主要有客观因素造成。主要原因是图像的背景颜色过于复杂或图像中物体和背景色过于接近时,会出现很难将图像中的物体突出出来。这些因素直接影响了图像的效果,也为下一步的图像分割造成了一定的问题。
(2)在基于神经网络的视觉识别系统输入信息的研究中,图像特征的选择和提取是将图像信息转化成神经网络识别器输入信息的关键一步,图像特征的选择和提取的好坏直接关系到神经网络识别器识别的速度和识别的准确性。本文中用到的图像特征可以很好的识别图像中的不同物体。但是处在这样的问题,同一物体不同角度的拍摄,物体在图像中的成像是不一样的,提取的图像特征值也是不一样的,这就要求对神经网络识别器进行训练的时候,对同一物体要提取多组特征值,输入到神经网络识别器中,进行训练。由于同一物体提取的特征组数的增加,会增加神经网络的训练时间,业户降低神经网络识别器的识别率。所以本人认为,为了对物体进行有效识别,本文中定义的物体的特征是不够的,下一步可从物体的一些固有的特征进行提取,也可以在不变矩阵特征上进行分析。
(3)在基于神经网络的视觉识别系统识别器的研究中,本文中主要运用了BP算法和改进的BP算法,构建了一个神经网络识别器,该识别器对训练的样本,可以进行很好的分类,但是不在训练样本之内的样本模式不能进行很好的分类。当然也可以通过常规的办法加以解决,即加大训练样本的提取。但这是一种治标不治本的方法。本人认为应该尝试一下其它的带有联想功能的神经网络如Hcpficld神经网络。这样就可以不增加训练样本的提取,降低神经网络识别的训练时间,提供神经网络识别器的识别效率。
尽管还存在不少的问题,但可以预见,神经网络,机器人,机器视觉,图像处理及模式识别结合无论在实践中还是理论上,都存在着巨大的潜力。
沈阳理.f:人学硕士学位论文
参考文献
[1】韩立群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,
’
2004.4-9,50—51
[2】阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,
2006.2-4。
【3】TsukinetuH.ExrationRulesforTrainedNetworks.IEEETrans
NN,2000,1l(2):377-389
【4】张广军.机器视觉[M].北京:科学技术出版社,2005.2-35—7
【5】MarrD.Vision:Acomputationalinvestigationintothehuman
representationandprocessingofvisualinformation.W.n.San
Francisco:FreemanandCompany,1988.
。[6]日本机器入学会.机器人技术手册[M].北京:科学出版社,1996
[7】张洪刚,陈光,郭军.图像处理与识别[M].北京:北京邮电大学出版
社,2006.10—16,1’50-175
【8】李月景.图像识别技术及其应用[M].北京:机械工业出版社,1985.卜25
29—4188-105121-153
[9】(美)RafaelC.Gonzalez,(-美)RichardE.Woods.DigitalImageProcessing
SecondEdition[M].北京:电子工业出版社,2007.75-146
[10](美)WilliamK.Pratt.数字图像处理[M].北京:机械工业出版社2005.15_17
166-168
[n】钟玉琢等.机器人视觉技术[M].北京:国防工业出版社,1994
【12】黄爱民,安向京,骆力.数字图像处理与分析基础[M].北京:中国水利出版社,
2005
[13】何斌,马天予,王运坚,朱红莲.VisualC++数字图像处理[M].北京:人民邮,
2003.
[14】杨淑莹.VC++图像处理程序设计[M].北京:清华大学出版社,北京交通大学.S5.
沈阿l理工人学硕士学位论文
出版社,2005.149-151288-289
31—48,[15】章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.15—19
94-110,180-203
[16】LindaGShapiro.GeorgeC.Stockman.ComputerVision[M].北京:机器工业出
版社,2005.102-104
[17】张恒,雷志辉,丁晓华.一种改进的中值滤波算[J].中国图像图形学报,2004,
9(4).408—410’
[18】ParkerJR.Alogorithms
JohnforImageProcessingandComputerVision[J].WileyandSons,1997.
【19】林瑶,田捷.医学图像分割方法综述[J].模式识别与人工智能,2002,15(2):
192-204.
[20】王新成.高级图像处理技术[M].北京:中国科学技术出版社,2000.14—20[21](日)谷口庆治.数字图像处理[M].北京:科学出版社,2001.75—91127—146[22】杨淑莹.图像模式识别——VC++技术实现[M].北京:清华大学出版社,北京
交通大学出版社,2005.
[23】林瑶,田捷.医学图像分割方法综述[J].模式识别与人工智能,2002,15(2):
192-204
【24](希腊)SergiosTheodoridis,(希腊)Konstantinos
SecondKoutroumbas.PatternRecognitionEdition[M].北京:电子工业出版社,2004.209—222
【25】韩立群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.14一15[26]阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:请华大学出版社
2005.19-26
[27】Werbos
JohnPJ.TheRootsofBackpropagation:FormOrderedDerivativestoNN.Inc,1994.Wiley&Sons
【28】袁曾任编著.人工神经网络及应用[M].北京:清华大学出版社,2003.79—80
【29】ScottMeyers.EffectiveC++[M].北京:电子工业出版社,2006.
沈阳理下大学硕十学位论文
攻读硕士学位期间发表的论文和获得的科研成果
[1]赵树巍,董砚秋.一种用于机器人决策系统的神经网络的设计.科技咨询导报,2007,26己发表
沈阳理工大学硕士学位论文
致谢
衷心感谢导师董砚秋副教授。本文工作是在董老师的悉心指导下才得以顺利完成的。二年多来,导师在我学业上的精心指导,在生活上的热情关怀都令我难以忘怀。她不仅传授给我理论知识、实践经验以及社会经验,而且她严谨的治学态度和实事求是、认真勤勉的工作作风对我起到了表率作用,这些言传身教必定对我今后的工作和学习产生深远的影响。在此,谨向导师表示衷心的感谢!
论文的研究工作得到了沈阳甲乙技术开发有限公司的资助,在实习工作期间,得到了王甲亿总经理的耐心指导和帮助,在此表示感谢!
我要对王杨,魏利波等同学在学习中和课题的研究中给于的帮助,表示衷心的感谢
我还要向曾经教育过我的辛勤工作、无私奉献的老师们,研究生学院的领导和老师,衷心地道一声“谢谢"!
衷心感谢理解与支持我的所有亲人们!在此,谨向曾经关心和支持过我的师长和朋友们致以深深的敬意和最诚挚的感谢!
人工神经网络在机器人上的研究与应用
作者:
学位授予单位:赵树巍沈阳理工大学
1. 石玉秋 神经网络技术在机器人视觉伺服控制中的应用[学位论文]2006
2. 袁向荣.UAN Xiang-rong 神经网络在机器人视觉图像命令识别中的应用[期刊论文]-计算机仿真2009,26(6)
本文链接:.cn/Thesis_Y1404697.aspx