基于支持向量机模型的声纹识别方法的研究开题报告

 2022-12-03 10:12

1. 研究目的与意义

所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。

声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是多选一问题;而后者用以确认某段语音是否是指定的某个人所说的,是一对一判别问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的训练或学习过程。

基于生物特征的身份认证技术是当今国际上的重点研究内容,声纹识别是通过语音识别说话人的身份,在系统安全认证、金融服务、司法鉴定以及电子侦听等领域有着广泛的应用价值。 声纹识别是语音识别的一种,从应用角度可将声纹识别分为说话人确认和说话人辨认两种,从识别条件角度可将其分为与文本有关的说话人识别和与文本无关的说话人识别两类。声纹识别不注重语音信号中的内容,只注重语音信号中个人的信息特征。声纹识别有两个关键技术:首先是特征提取,从声学或统计学的角度在语音信号中提取特征参数描述说话人的声音特征;其次是识别模型,用机器学习模型去学习、记忆说话人特征,从而实现说话人的识别。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

本文系统阐述了声纹识别技术的原理,并重点研究了: (1)语音特征提取:基音周期、过零率、明亮度、线性预测系数(LinearPrediction Coefficients,LPC)、线性预测倒谱系数(Linear Cepstral PredictionCoefficients,LPCC)、美尔频率倒谱系数(Mel-Frequency Cepstrum Coefficients,MFCC)等。 (2)声纹识别模型:高斯混合模型、隐马尔可夫模型、矢量量化模型、人工神经网络模型、支持向量机模型。 现有算法的识别效果容易受环境噪声、语音变异等因素的影响,针对这一问题,本文在对现有声纹识别技术进行深入研究的基础上,对现有算法进行了改进,并进行了大量实验(实验所用语音数据是在不同环境噪声下分早、中、晚不同时间段所录制,进行了为期一个月的声音采集,期间有人患重感冒,声音发生变异)。实验结果表明,改进的算法能够有效克服环境噪声、语音变异带来的影响。

3. 国内外研究现状(文献综述)

1.研究声纹识别的意义;

近年来,随着电信诈骗、绑架、敲诈勒索等案件数量呈现不断上升的趋势,声纹鉴定技术在公共安全领域的应用价值日益凸显,特别是在一些语言证据是唯一或有关证据的案件中,声纹鉴定技术发挥着不可替代的作用。

说话人的特征声纹有解剖关系;生理、心理影响年龄、性别;语言传递、检测简介显示错误率小于3%具有相对稳定性声纹因人而异,声纹鉴定技术适用于刑事侦查和司法鉴定领域,能起到提供线索和审判证据的作用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

毕业论文(设计)方案的制定

1.制定毕业论文(设计)方案的目的

(1)通过制定方案,学生自己对将要进行的工作任务有一个全面的设计、计划,对仪器、材料、实验方法、操作步骤、调查(实验)预期结果有一个全面系统的了解认识。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

第一周:查找文献资料,对基于支持向量机(SVM)模型的声纹识别技术有个大体的了解;

第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于支持向量机(SVM)模型的声纹识别技术等;

第三周:制定研究计划,写开题报告;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。