固定污染源烟气连续自动监测系统
安装调试报告
[ ]第 号
安装点位:
设备名称:
(企业名称及公章)
年 月 日
A.1 基本情况
表A.1
A.2排污口
表A.2
表A.2(续)
A.3烟气自动监测系统设备性能
表A.3
A.4监测站房
表A.4
A.5安装施工
表A.5
表A.5(续)
A.6调试检测报告
表A.6
检测日期: 年 月 日至 年 月 日
A. 7结论
表A.7
A.8烟气自动监测系统安装布置图
表A.8
第二篇:报告册样本
贵州航天职业技术学院
****课程设计报告册
设 计 题 目:
专 业 :
指 导 教 师:
姓 名:
学 号:
20xx年5月
摘 要
摘 要
生物识别技术是利用人体生物特征进行身份认证的一种技术,是目前公认的最为方便与安全的识别技术。由于每个人的生物特征具有与其他人不同的唯一和在一定时期内不变的稳定性,不易伪造和假冒,所以利用牲识别和技术进行身份认证,安全、准确、可靠。
在生物识别领域中,声纹识别,也称为说话人识别,以其独特的方便性、经济性和准确性等优势受到世人瞩目,并且益成为人们日常生活和工作中重要且普遍的安全认证方式。声纹识别是一种根据说话人语音波形中反映说话人生理和行为特征的语音参数,自动识别说明人身份的技术。
声纹识技术可分为两类,即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的,是多选一的问题;而后者用以确认某段语音是若干人中的哪一个所说的,是多选一的问题;而后者用以确认某段语音是否是指定的某个人所说的,是一对一判别的问题。从另一方面,声纹识别又有与文本有关和与文本无关两种,根据特定的任务和应用,应用范围不同。与文本有关的声纹识别系统要求用户按照规定的内容发音,每个人的声纹模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果;而与文本无关的识别系统则不规定说话人的发音内容,模型建立相对困难,但用户使用方便,应用范围较宽。
关键词:声纹识别, 基于周期, 线性预测, 模式匹配, DTW。
I
目 录
目 录
第一章 算法原理 ..................................................... 1
1.1 预处理 ....................................................... 1
1.2 特征提取 .................................................... 2
1.2.1 特征参数的选取 ....................................... 2
1.2.2 LPCC参数的提取 ....................................... 3
1.2.3 基音参数的提取 ....................................... 4
1.3 模式匹配 ................................................ 4
第二章 硬件系统 ..................................................... 6
第三章 系统软件部分设计实现 ........................................ 10
3.1 软件设计 .................................................. 10
3.2硬件设计 .................................................... 15
3.3 结束语 .................................................... 15
致 谢 ............................................................. 16
附录器件列表 ....................................................... 17
参考文献 ........................................................... 18
II
第一章 算法原理
第一章 算法原理
说话人识别算法原理框图如下:
1.1 预处理
(1)去噪
对麦克风输入的模拟语音信号进行量化和采样,获得数字化的语音信号;再将含噪的语音信号通过去噪处理,得到干净的语音信号后并通过预加重技术滤除低频干扰,尤其是50Hz或60Hz的工频干扰,提升语音信号的高频部分,而且它还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的作用。
(2)端点检测
本系统采用语音信号的短时能量和短时过零率进行端点检测。语音信号的采样频率为8kHz,每帧数据为20ms,共计160个采样点。每隔20ms计算一次短时能量和短时过零率。通过对语音信号的短时能量和短时过零率检测可以剔除掉静默
1
电路CAD实习报告册
帧、白噪声帧和清音帧,最后保留对求取基音、LPCC等特征参数非常有用的浊音信号。
1.2 特征提取
在语音信号预处理后,接着是特征参数的提取。特征提取的任务就是提取语音信号中表征人的基本特征。
1.2.1 特征参数的选取 特征必须能够有效地区分不同的说话人,且对同一说话人的变化保持相对稳定,同时要求特征参数计算简便,最好有高效快速算法,以保证识别的实时性。 说话人特征大体可归为下述几类:
(1)基于发声器官如声门、声道和鼻腔的生理结构而提取的参数。如谱包络、基音、共振峰等。其中基音能够很好地刻画说话人的声带特征,在很大程度上反映了人的个性特征。
(2)基于声道特征模型,通过线性预测分析得到的参数。包括线性预测系数(LPC)以及由线性预测导出的各种参数,如线性预测倒谱系数(LPCC)、部分相关系数、反射系数、对数面积比、LSP线谱对、线性预测残差等。根据前人的工作成果和实际测试比较,LPCC参数不但能较好地反馈声道的共振峰特性,具有较好地识别效果,而且可以用比较简单的运算和较快的速度求得。
(3)基于人耳的听觉机理,反映听觉特性,模拟人耳对声音频率感知的特征参数。如美国尔倒谱系数(MFCC)等。MFCC参数与基于线性预测的倒谱分析相比,突出的优点是不依赖全极点语音产生模型的假定,在与广西无关的说话人识别系统中MFCC参数能够比LPCC参数更好地提高系统的识别性能。
此外,人们还通过对不同特征参数量的组合来提高实际系统的性能。当各组合参量间相关性不大时,会有较好的效果,因为它们分别反映了语音信号的不同特征。
在计算机平台的仿真实验中,通过各种参数的实际比较,采用MFCC参数比采用LPCC参数有更好的识别效果。但在SPCE061A平台上做实时处理时,与LPCC系统相比,MFCC系数计算有两个缺点:一是计算时间长;二是精度难以保证。由于
2
第一章 算法原理
MFCC系统的计算需要FFT变换和对数操作,影响了计算的动态范围;要保证系统识别的实时性,就只有牺牲参数精度。而LPCC参数的计算有递推公式,速度和精度都可以保证,识别效果也满足实际需要。
本系统采用了基音周期和线性预测倒谱系数(LPCC)共同作为说话人识别的特征参数。
1.2.2 LPCC参数的提取 基于线性预测分析的倒谱参数LPCC可以通过简单的递推公式由线性预测系数
C1= a1(m=1),Cm=a
求得。递推公式如下: m-1 K m+ km-k,m k=1 ∑ca(1<m<p)_
其中p为LPC模型的阶数,也是模型的极点个数。
(1)LPC模型阶数p的确定
为使模型假定更好地符合语音产生模型,应该使LPC模型的阶数p与共振峰个数相吻合,其次是考虑声门脉冲形状和口唇辐射影响的补偿。通常一对极点对应一个共振峰,10kHz采样的语音信号通常有5个共振峰,取p=10,对于8kHz采样的语音信号可取p=8。此外为了弥补鼻音中存在的零点以及其他因素引起的偏差,通常在上述阶数的基础上再增加两个极点,即分别是p=12和p10。实验表明,选择LPC分析阶数p=12,对绝大多数语音信号的声道模型可以足够近似地逼近。P值选得过大虽然可以略微改善逼近效果,但也带来一些负作用,一方面是加大了计算量,另一方面有可能增添一些不必要的细节。
(2)线性预测系数的求取
自相关解法主要有杜宾(Durbin)算法、格型(Lattice)算法和舒尔(Schur)算法等几种递推算法。其中在杜宾算法是目前最常用的算法,而且在求取LPC系数时计算量也量小,本系统采用该递推算法。
3
电路CAD实习报告册
1.2.3 基音参数的提取 基音估计的方法很多,主要有基于短时自相关函数和基于短时平均幅度差函数(AMDF)等基音估计方法。
基于短时自相关函数的基音估计
短时自相关函数在基音周期的整数倍位置存在较大的峰值,只要找出第一最大峰值的位置就可以估计出基音周期。
基于短时平均幅度差函数(AMDF)的基音估计
基于短时平均幅度差函数(AMDF)在基音周期的整数倍位置存在较大的谷值,找到第一最大谷值的位置就可以估计出基音周期。这种方法的缺点是当语音信号的幅度快速变化时,AMFD函数的谷值深度会减小,从而影响基音估计的精度。 实际上第一最大峰(谷)值点的位置有时并不能与基音周期吻合,第一最大峰(谷)值点的位置与短时窗的长度有关且会受到共振峰的干扰。一般窗长至少应大于两个基音周期,才可能获得较好的估计效果。语音中最长基音周期值约为
20ms,本系统在估计基音周期时窗长选择40ms。为了减小共振峰的影响,首先对语音进行频率范围为[60,900]Hz的带通滤波。因为最高基音频率为450Hz,所以将上限频率设为900Hz可以保留语音的一、二次谐波,下降频率为60Hz是为了滤除50Hz的电源干扰。
以上两种方法都是对语音信号本身求相应的函数。本系统采用的基音估计方法是:首先对带通滤波后的短时语音信号进行线性预测,求取预测残差;再对残差信号求自相关函数,找出第一最大峰值点的位置,即得到该段语音的基音估计值。实验表明,通过残差求取的基音轨迹比直接通过语音求取的基音轨迹效果更好。
1.3 模式匹配
目前针对各种特征参数提出的模式匹配方法的研究越来越深入。典型的方法有:矢量量化方法、高斯混合模型方法、隐马尔可夫模型方法、动态时间规整(DTW)方法和人工神经网络方法。
这些方法都有各自的优点和缺点。其中DTW算法对于较长语音的识别,模板匹配运算量太大,但对短语音(有效语音长度低于3s)的识别既简单又有效,而且并不比其他方法识别率低,特别适用于短语音、与文本有关的说话人识别系统。
4
第一章 算法原理
图1-2 动态时间规整算法示意图
动态时间规整(DTW)算法基于动态规划的思想,解决了说话人不同时期发音长短、语速不一样的匹配问题。DTW算法用于计算两个长度不同的模板之间的相似程度,用失真距离表示。假设测试模板和参考模板分别用T和R表示,按时间顺序含有N帧和M帧的语音参数(本系统为12维LPCC参数),失真距离越小,表示T、R越接近。把测试模板的各个帧号n=1~N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧号m=1~M在纵轴上标出,如图3所示。通过这些表示帧号的整数坐标画出纵横线即形成网络,网格中的每一个交叉点(n,m)表示测试模板中某一帧与参考模式中某一帧的交会点,对应两个向量的欧氏距离。DTW算法可以归结为寻找一条通过此网格中若干交叉点的路径,使得该路径上节点的距离和(即失真距离)为最小。对于端点松弛的情况,路径搜索原理相同,只是增加了搜索路径。
5
电路CAD实习报告册
第二章 硬件系统 语音电子门锁系统的核心是说话人识别模块。包括按键输入、语音信号采集、语音信号处理、FLASH存储扩展、扬声器输出、控制输出以及LCD模组等。说话人识别模型的原理框图如图2-1所示。其核心为语音信号处理,本系统选用特别适用于数字语音识别领域的凌阳16位单片机SPCE061A,并通过SPCE061A实现对其他各组成部分的编程控制。
SPCE061A是凌阳公司开发的一种性价比非常高的16位单片机。在2.6V~3.6V工作电压范围内,工作频率范围为0.32MHz~49.152Mhz,较高的处理速度使其能够非常容易、快速地处理复杂的数字信号;中断系统支持10个中断向量以及14个可来自系统时钟、定时器/计数器、时间基准发生器、外部中断、键唤醒、通用异步串行通信及软件中断的中断源,非常适合实时应用领域;内嵌2K字的SRAM和32K字的FLASH,具有32位可编程的多功能I/O端口;包含有7通道10位通用A/D转换器和内置麦克风放大器与自动增益控制AGC功能的单通道声音A/D转换器,以及具有音频输出功能的双通道10位D/A转换器;SPCE061A采用CMOS制造工艺,同时增加了软件激发的弱振方式、空闲方式和掉电方式,系统处于备用状态下(时钟处于停止状态),耗电仅为2μA3.6V,极大地降低了其功耗;另外,μ’nSPTM的指令系统还提供具有较高运算速度的16位×16位的乘法运算指令和内积运算指令,为其应用增添了DSP功能,在复杂的数字信号处理方面既非常便利,又比专用的DSP芯片便宜得多.
说话人识别模块各组成部分完成的功能如下:
(1)按键输入部分:共有数字键、训练键、删除键、确认键和取消键等16个按键,用于密码输入和工作模式选择。采用4×4矩阵式键盘输入,只使用具有键唤醒功能IOA的低8位,可以合理利用硬件资源,且编程灵活。
(2)语音信号采集部分:通过SPCE061A内置麦克风放大器与自动增益控制AGC功能的单通道声音A/D转换器完成8kHz语音信号采集。
(3)FLASH存储扩展部分:用于存储说话人的个性特征参数参考模板。
(4)扬声器输出部分:通过SPCE061A具有音频输出功能的双通道10位D/A转换器完成用户训练、识别等各种操作的语音提示。
6
第二章 硬件系统
7
电路CAD实习报告册
认证模式:同样通过麦克风录入说话人的声音,再由SPCE061A对采集的语音信号进行处理,将提取的说话人特征参数与存储在外扩FLASH内的特征参数模板进行匹配,匹配距离小于认证阈值时,通过认证;然后再判断匹配距离是否小于认证模式下的模板更新阈值,决定是否对模板进行更新。
(3)密码工作模式:在说话人感冒或其他使其声音发生暂时改变的情况下,可以采用长密码方式进行认证,以免因为非常原因被拒之门外。
另外,每个用户都有一个短密码(用户可自行修改),无论在训练模式还是认证模式都要输入此密码,以形成或找到与该用户相对应的特征参数模板。系统还设置一个具有长密码的超级管理员用户,可以通过键盘对用户模板进行添加或删除。
3 实验结果
对于说话人确认系统,表征其性能的最重要的两个参量是拒识率和误识率。前者是拒绝真实的说话人而造成的错误,后者是接受假冒者而造成的错误,二者与匹配阈值的设定相关。匹配阈值的设定与语音锁系统的应用场合、功能侧重有关,对于家庭、宾馆等门锁用户,要求误识率尽可能低,甚至为零;若用于公司员工考勤等同类功能,就不能有太高的拒识率。表2-1是对以下每种情况各进行100次实时匹配的结果,其中设定的阈值适合门锁用户。
8
第二章 硬件系统
声纹识别与其他生物识别技术相比,除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性:用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍;声音输入设备造价低廉,而其他生特识别技术的输入设备通常造价昂贵。与利用虹膜、指纹和人脸等技术的门锁相比,基于SPCE061A构建的语音电子门锁系统具有成本低、使用方便、保密性好等优点。经大量实验测试表明,该系统性能稳定、识别效果好。下一步将进行小批量的试用,以发现问题并加以完善。但是,在环境噪声或干扰信号高于语音信号时,该系统将无法进行正确的语音识别,在背景噪声处理及其工程实际上还要进一步改进。
9
电路CAD实习报告册
第三章 系统软件部分设计实现
3.1 软件设计 软件用VHDL来实现,VHDL相比较于VerilogHDL,具有更好的语法的严格性,但是其严格的语法一定程度上限制了错误的产生,调试较容易。VHDL的系统抽象能力比Verilog HDL强,在系统描述上占有一定的优势,但在门级描述上稍显逊色。
图3-1 系统模块框图
本设计软件模块框图如图3-1所示,共8个模块。
在本系统中,密码由4位十进制数组成,初始密码为“0000”,可由用户任意设定密码。密码输入正确时,则进入开锁状态。如果密码连续输入3次错误时,则系统进入自我定时锁定,并报警。在输入过程中,系统可以发音提示(也可屏蔽掉)用户输入的数字,或者说明当前的状态。
下面介绍状态机和ISD2560控制电路的实现。
本设计的状态图见图3-2。
其中state为状态代码,并通过state_out[3..0]端口传给其他电路。一开机,系统处在空闲状态,当按键处理电路传来确定使能的信号compare_en时,状态机
10
第三章 系统软件部分设计实现
等待effect_out脚的高电平脉冲信号,如果等不到则进入S2状态,即进入密码输入一次错误状态,如果等到则进入pass状态即开门状态,如果3次输入密码错误则系统进入死锁倒计时状态,拉高lock_pin脚,启动计数器。
State=0110
图3-2 状态图
idle状态:系统待机状态;S2状态:系统输入第1次错误密码后的状态;S3状态:系统输入第2次错误密码后的状态;pass状态:输入正确密码后的开锁状态;Modify状态:在开锁状态是进行修改密码的状态;Lock状态:当系统输入3次错误密码后系统进入锁定计时状态。
软件流程图见图3-3:
11
电路CAD实习报告册
图3-3状态机软件流程图
当计数满时则计数电路拉高unlock脚电平,状态机检测到unlock脚下为高电平时,则表示锁定时间结束,复位lock_pin的电平,在下一个时钟上升沿到来时,进入下一个状态即idle状态。只有pass状态下从按键处理电路传来modify_pin为高电平时,才能进入modify状态,即密码修改状态。当检测到modify_pin脚电平复位为低电平时则表明修改密码完成,状态机在下一个时钟上升沿到来之时,进入下一个状态即idle状态。如果在pass状态时,状态机检测到close_pin脚电平被拉高时,则表明用户要关门,此系统在下一个时钟上升沿到来之时,返同空闲状态。
12
第三章 系统软件部分设计实现
状态机还控制红绿黄3个发光二极管与buzz-er蜂鸣器,仿真波形如图4所示。当系统处在空闲状态、S2状态、S3状态时黄灯亮(S2、S3为第2次、第3次输入密码错误的状态);
系统处在修改密码的状态即modify状态时,3个灯一起亮;当处于pass状态时,绿灯亮;当系统处于锁定状态即locked状态时,红灯亮,且蜂鸣器发出报警的声音,直至跳出该状态。
本设计采用计数器方法在ce脚上产生一个低电平脉冲以控制ISD2560芯片。放录音当innum收到一个新的数值时,则开始计数;当计数器计到一半时,使ce脚输出低电平;当计数大于最高数的一半时,则复位ce脚电平,直到下次计数开始。当语音数据有多段时,先将要播放的语音段数存到一个变量中,并将各段地址存到另一个多位的变量中,然后开始放音并检测eom脚的电平。当检测到eom脚的低电平脉冲时,就表明放音结束,就让段数变量减1,然后给地址线再赋新值,并且使能计数器,再次使ce脚产生一个低电平脉冲,继续放音。这样直至语音段数变量为0时,则表明语音播放完毕,系统不再响应芯片eom脚的上升沿脉冲。图5为ISD2560控制电路的仿真波形图。
表3-1为与innum对应的发音:
本设计采用模块化编程,各模块分工明确,各自实现各自的功能,并通过信号线彼此相连,这样的好处是调试、修改、移植程序方便。使用资源和生成总的模块电路图分别如图3-4和图3-5所示。
Plow statun succassful-Thu Apr 27 23 10 51 20
13
电路CAD实习报告册
Quartus II Version Duild 101 06/2004 SJ Full Va Revision Rane locked
Jop-laval Entity name locked
Family Cyclone
Dvice EPIC3V144CB
Timing Models Production
Total logic elelmants 962/2,910(33%)
Total pins 39/104(37%)
Total menory bits 0/59,904(0%)
Total.plls 0/1(0%)
图3-4 FPGA 使用资源
14
第三章 系统软件部分设计实现
3.2硬件设计 硬件部分主要包括中央处理器FPGA 芯片——EP1C3T144C6、输入小键盘、输出4位数码管、ISD2560语音芯片、LM386音频放大和扬声器,如图3-6所示。FPGA芯片用米直接控制其他元件的工作,对小键盘的输入,通过一定的算法实现电子密码锁的功能。通过控制ISD2560的控制脚的电平状态,达到控制其发音从而实现智能语音提示的效果。3个发光二极管分别用于显示当前的状态,蜂鸣器用于误码报警。
图3-6 系统硬件原理框图
3.3 结束语
基于高性能新型铁电存储器组成程序存储部分和说话人特征数据部分的新型语音电子门锁系统工作稳定、性能良好。同时,经过长时间的改进和实际考验,与虹膜、指纹和人脸等技术的门锁相比,语音电子门锁具有成本低、适用范围广、控制容易的优点。
15
电路CAD实习报告册
致 谢
毕业设计是大学中学习和实践的一个重要环节。它综合的考察了一个学生对过去所学的知识的运用能力和对新知识吸收、消化能力,通过设计,可以培养我们独立思考、开拓创新、勇于探索的能力。通过设计,不仅掌握了设计的基本步骤,还学会了科学系统的设计方法,拓宽了知识面。在本课题设计中,为了熟悉课题,通过图书馆、互联网学习查阅了许多相关的资料,加强了自学能力并且有意识地将掌握知识归纳总结运用到实践中来。
本次毕业设计的整个过程联系到了大学三年的各方面的知识,使自己的知识得到了进一步的巩固,同时也学会了如何查找资料,综合运用图书馆知识和计算机网络知识,让自己在尽量短的时间里能够将自己所学的知识运用到实际中去。在本次毕业设计中要特别感谢我的指导老师刘旭梅,她给了我莫大的支持。另外要感谢我的同学们,他们让我知道了如何的系统地学习,如何将自己的知识连贯起来。同时,要感谢他们帮助我完成论文的排版工作。
16
附 录
附录器件列表
1. 16位单片机SPCE061A
2. 中央处理器FPGA 芯片——
3. EP1C3T144C6
4. 4位数码管
5. ISD2560语音芯片
6. LM386音频放大和扬声器
17
电路CAD实习报告册
参考文献
[1].张迎新等.单片机初级教程.北京:北京航空航天出版社,2000
[2].刘守义等.单片机应用技术.西安:西安电子科技大学出版社,2002
[3].付家才等.单片机控制工程实践技术.北京:化学工业出版社,2004
[4].张友德等.单片微型机原理应用与实验.北京:清华大学出版社,2005
[5].苏凯 刘庆国 陈国平 编著. MCS-51系列单片机系统原理与设计 北京:
机械工业出版社. 20xx年3月第1版
[6].周航慈 周立功 朱旻 饶运涛编著. 80C51原理及应用. 北京:北京航空航
天大学出版社. 20xx年1月
[7].王幸之 王雷 翟成 王闪编著. 单片机应用系统抗干扰技术 北京: 北京航
空航天大学出版社. 20xx年2月第1版
[8].余永权 世界流行单片机技术手册 北京航空航天大学出版社 20xx年11月
[9].苏凯 MCS-51系列单片机系统原理与设计 国防工业出版社 1999.12
[10].庄奕琪 王锡吉 刘发 电子元器件可靠性工程 北京航空航天大学出版社.
20xx年10月
18