多种模式识别的调研报告

时间:2024.5.2

郑州科技学院   

人工智能调研报告

题    目 多种模式识别的调研报告

姓    名       闫 永 光       

专    业    计算机科学与技术  

学    号       201115025      

指导教师       谭  同 德       

                        郑州科技学院信息工程系

                            二○##年六月

  

引言

随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造。但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。这时,能够提高计算机外部感知能力的学科——模式识别应运而生,并得到了快速的发展。人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知

一、模式识别 

什么是模式和模式识别?

模式可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。

模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。
  

二、 人工智能

人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。

关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(consciousness)、自我(self)、思维(mind)(包括无意识的思维(unconscious_mind)等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。

人工智能目前在计算机领域内,得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。

    人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。

三、 多种模式识别的应用

3.1文字识别

汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了连机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。                          

3.2 语音识别

语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。             

3.3 指纹识别

我们手掌及其手指、脚、脚趾内侧表面的皮肤凹凸不平产生的纹路会形成各种各样的图案。而这些皮肤的纹路在图案、断点和交叉点上各不相同,是唯一的。依靠这种唯一性,就可以将一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,便可以验证他的真实身份。一般的指纹分成有以下几个大的类别:left loop,right loop,twin loop,whorl,arch和tented arch,这样就可以将每个人的指纹分别归类,进行检索。指纹识别基本上可分成:预处理、特征选择和模式分类几个大的步骤。

3.4 图像模式识别

    图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。

从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。

3.5 句法模式识别

    对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。

    句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。

3.6 统计模式识别

    统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。

统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

图2 统计模式识别模型

四、人工智能在模式识别中的应用实例

4.1 数字识别与语言识别

在数字识别的过程中,对于手一83一写体的识别一直是一个难题,而其又在邮政编码的识别、银行业务等方面具有较为广泛的应用,但是其字体形式变化较大,导致提高对其的识别率成为了一个难题,精准的识别存在着较大的困难。而采用人工智能中的神经网络技术后,系统可以利用神经网络的学习及快速并行功能来实现对手写数字的快速识别,有力的提高相关运用领域的工作效率。而语音识别,简单的将就是能使得计算机能听懂人所说的话,一个典型的例子就是七国语言(中、日、英、意、韩、法、德)口语自动翻译系统,它可以将人说的话翻译成为机器所设定的目的语言,在整个过程中不需要翻译人员的参与。其中的中文部分实验平台设置在中科院自动化所的模式识别国家重点实验室中,这标志着我国的机器口语翻译研究已经跨入世界先进行列。在这个系统的功能实现之后,出国旅行需要预定旅馆、购买机票、就餐等需要和外国人进行对话时,只需要利用电话网络或者是国际互联网就能够III~I的和对方进行通话,进行语言交流。

4.2 人脸识别的应用

人脸立体识别模式。人脸识别的过程主要包括这样三个主要的部分:其一,人脸模式库,即与所采集的实时图像进行对比,判断其是否存在于人脸模式库当中,若存在,则给出每个人脸的位置和大小等相关的脸部信息;其二,对面部特征进行定位,即对每一个人脸的主要器官进行检测,包括对其的具体位置和形状等特征进行具体的信息收集,然后将之进行归一化的处理;其三,比对,即根据所采集到得人脸面部特征来和人脸模式库中的图像进行对比,之后对该人脸的身份进行核实。常见的人脸识别技术大部分可以归为这样三个类型:采用基于几何特征的方法,基于模板的方法以及基于模型的方法。其中,基于几何特征的方法最为常见,它通常需要与其他的算法进行结合之后才能形成比较好的识别效果;而基于模板的方法又能够分为基于匹配的方法、脸部特征的方法、线性判别分析的方法、神经网络方法以及奇异值分解方法等;再次,基于模型的方法主要包括基于隐马尔可夫模型、主动外观模型和主动形状模型方法等。采用人脸识别模式来进行身份验证具有明显的有点,诸如:易用性好、准确度高、隐私性能好、稳定性好,且能被大部分的用户容所接受。人脸二维图像的识别已经基本实现,但是基于三维的立体图像人脸识别技术却处于研发阶段。人脸的二维及三维模型所反映的脸部外部信息是不同的,二维图像中的灰度值反映的是人脸表面亮度的差异,而三维图像中添加了深度信息,它能够表达脸形的信息数据,使得脸部的信息量更加丰富,能提高脸部的识别概率。

4.3 在医疗诊断中的应用

以下主要讨论满足πA-(x)=0的数据,建立其上基于直觉模糊集拓展的固定单参数区间值直觉模糊集模型,并利用其上贴近度公式进行诊断。基于文献[5,6]的医疗诊断案例,表1是基于直觉模糊集的诊断结果症状描述,表2是基于直觉模糊集的待诊病人症状描述。其中疾病诊断集(决策属性)症状集(条件属性)pain,cough,chestpain},上述为已有模式。待诊断病人集{AI,Bob,Joe,Ted},与已有模式条件属性相同。表中每一格两个数据,前者表示隶属度,后者为非隶属度。

例如,对于Viralfever病症患者,症状为temperture,隶属度tA(x)=0.4,假隶属度fA(x)=0,πA(x)=1-tA(x)-fA(x)=0

以下分别取λ=0,0.1,0.2,0.4,0.5,0.6,0.8,0.9,1来构造固定单参数区间值直觉模糊集,采用经典的标准化海明距离构造贴近度公式,进行模式识别结果对比。贴近度越高,说明病人与疾病特征的相似性越高,可凭此做出诊断。直觉模糊集贴近度公式为:

SIFS=1-∑ni=1(|tA-(xi)-tB-(xi)|+|fA-(xi)-fB-(xi)|)/2n

SIVIFSλ表示λ取不同数值时单参数区间值直觉模糊集贴

近度公式,定义方式都相同,唯一的区别就是因为λ不同而使得区间上界tA+(x),fA+(x)取值不同:SIVIFSλ=1-∑ni=1(|tA-(xi)-tB-(xi)|+|fA-(xi)-fB-(xi)|+|t+

A(xi)-tB+(xi)|+|fA+(xi)-fB+(xi)|)图1-图4是贴近度的计算结果对比,其中最左边一表示文献[5,6]的直觉模糊集结果,其余从左至右分别是单参数区间值直觉模糊集在参数λ=0,0.1,0.2,0.4,0.5,0.6,0.8,0.9,1时的结果。

图1,图2可知,对于参数λ的任意数值,Bob都识别为

Stomachproblem,而Joe都识别为Typhoid,结论与文献[5,6]相同。

五、模式识别技术的发展潜力
    模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。                          
    5.1语音识别技术

    语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。             

5.2生物认证技术
    生物认证技术本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100美元的市场规模。                                            
    5.3数字水印技术

    90年代以来才在国际上开始发展起来的数字水印技术(Digital Watermarking)是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。

模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

对于识别二维模式的能力,存在各种理论解释。模板说认为,我们所知的每一个模式,在长时记忆中都有一个相应的模板或微缩副本。模式识别就是与视觉刺激最合适的模板进行匹配。特征说认为,视觉刺激由各种特征组成,模式识别是比较呈现刺激的特征和储存在长时记忆中的模式特征。特征说解释了模式识别中的一些自下而上过程,但它不强调基于环境的信息和期待的自上而下加工。基于结构描述的理论可能比模板说或特征说更为合适。

                        结 语

    综上所述,模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

更多相关推荐:
调研报告与调查报告的区别

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及其写作技巧、样本及格式要求-志文工作室编辑

调研报告与调查报告的区别及其写作技巧样本及格式要求一什么是调研报告为了对某件事情作比较深入全面的了解我们就需要进行一番调查研究然后形成书面文字这就是调研报告二调研报告与调查报告的区别说到调研报告就不能不先说调查...

调研报告与调查报告的区别

调研报告与调查报告的区别调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报告的使用范围很广制定方针政策解决各种实际问题弄清事情真相扶植新生事物推广典型经验都离不开调查报告调查...

调查报告与调研报告 的区别

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

实体店与网店优劣比较的调查报告

关于在消费者购买决策过程中实体店与网店优劣比较的调查报告调查者10广策绝对印象小组调查课题实体店与网店在消费者购买决策过程中的优劣比较调查时间20xx年3月26日调查方式问卷调查调查报告内容调查目的通过进行问卷...

关于导学案使用与否的效果区别的调研报告

关于是否使用导学册的课堂教学效果区别研究调查黄苏珍在课改的背景下我校与时俱进精心筹划从改变教学方式入手改革课堂模式于上学期试行导学案在实践中探索在探索中完善如今已在学校全面推开根据学校的具体要求一是确保导学案的...

关于城乡教育差异的调查报告(整理完整版)

思想道德修养与法律基础实践课教学成果报告题目姓名吴鸿展学号51122902120xx142xxxxxxxx120xx135班级完成日期指导教师关于城乡教育差异的调查报告成国森张展通伍炯城萧海彬林士祺511229...

关于男女购物行为差异的调查报告

关于男女购物行为差异的调查报告为了了解男女消费者购物的心理和行为差异我们进行关于男女消费者购买心理和行为差异的调查我们调查了男女消费者各50人虽然过程不是非常顺利但也还算成功因为在分发调查问卷的过程中肯定会遇到...

课题研究中西方饮食文化差异调查报告

中西方饮食文化差异调查报告张志玲孙静文方璐一调查目的中国饮食文化历史悠久博大精深影响深远风靡世界它经历了几千年的历史发展已成为中华民族的优秀文化遗产世界饮食文化宝库中的一颗璀璨的明珠西方的一些国家曾为一些国家的...

调研报告和调查报告的区别(25篇)