一、基于嗓音源变换函数的声门发声效率估计方法(论文文献综述)
翟冰慧[1](2021)在《普通话双字组中语音的空气动力学研究》文中提出关于汉语普通话的语音研究由来已久,随着科技的发展,越来越多的实验仪器被应用到语音的听感、声学,乃至生理研究当中,本文使用的发音空气动力学系统就是研究气流气压的一种生理仪器。气流和气压在人的整个发音过程中承担着非常重要的角色,通过对发音过程中的气流气压的分析,我们可以更好地掌握汉语普通话中各元、辅音的发音特征,并从气流和气压等参数角度来对各元、辅音进行区分。本文运用发音空气动力学系统(PAS6600)对汉语普通话中的塞音、擦音、塞擦音、通音和元音的气压峰值、气流峰值、气流均值和气流量等气流气压参数进行测量研究,同时还引入气压峰值与气流峰值的时间差、气压上升、下降阶段的时长和声门横截面积等其他参数,对各元、辅音进行综合对比分析,并研究了发音部位、发音方法,以及年龄、性别和位置对各项参数的影响,结果如下:1.从气流来看,在塞音和塞擦音中,送气音的气流大于不送气音;送气塞音的气流大于送气塞擦音大于擦音,擦音的气流峰值与不送气塞音接近,总之擦音气流峰值介于送气音和不送气音之间。通音和元音的气流小于塞音、擦音和塞擦音,其中,元音的气流最小。2.从气压来看,塞擦音的气压峰值略高于塞音,但是整体相差不大。擦音的表现更为复杂,/s/和/?/的气压峰值高于塞音,与塞擦音接近,而/x/的气压峰值则远低于其他擦音。同样,通音和元音气压远低于其他辅音,元音的气压最低。3.就年龄、性别和位置的影响,儿童阻塞音气压比成人更高,但是气流参数都要小于成人;除了8岁儿童所发的个别元辅音的气压高于成人外,其他元音和通音都表现为成人口内气压峰值高于儿童;成人通音和元音的气流均大于儿童。无论是辅音还是元音,均表现为男性气流气压高于女性;部分辅音明显表现为前字的气压大于后字,但这种趋势在送气塞擦音中没有体现。
陈莉媛,张晓俊,孙宝印,曾晓亮,王琰,薛隆基,陶智[2](2019)在《一种遗传算法的声带模型参数反演方法》文中指出采用遗传算法进行声带模型参数反演能够有效地实现概率意义的全局搜索,但存在易陷入局部最优解和收敛性能弱等缺陷,针对这些问题本文提出了一种改进遗传算法的声带模型参数反演方法。通过声门波形参数构建目标函数,引入精英保留策略,选择适应度高的精英个体保留至下一代种群,对普通种群进行双向邻域搜索;通过目标函数值进行模型参数反演操作,得到模型参数最优解。实验结果表明,反演后得到的特征相对误差不超过1.5%,改进后的加权平均相对误差比改进前减小了0.11%。说明改进后的遗传算法搜索性能好,收敛性能高;得到的特征参数精确度更高。
武雅琴[3](2019)在《病理嗓音修复算法的研究》文中认为语音是人类传递信息最直接的方式。近年来,发声器官器质性或神经性的病变使得嗓音疾病发病率越来越高,嗓音含混不清会影响人们的沟通效率,采用非侵入式的信号处理方式对病理嗓音进行修复,能提高受损语音的可懂度,提高人们的沟通效率。此外,病理嗓音修复在语音识别、机器导航、语音增强、语音通信系统、军事刑侦和隐蔽监听等领域都有着很广泛的应用前景。本文以提高病理嗓音可懂度为目标,设计实现了一套完整的病理嗓音修复系统,具体完成的工作如下:(1)分析发声系统的原理,为研究病理嗓音形成机制提供理论基础。通过发声系统的数学模型对激励模型、声道模型和辐射模型进行详细地介绍。针对发病率高的声带息肉嗓音信号,从时域、频域的角度分析其声学特性,并从短时和长时两方面分类总结声学特征,高效地对病理嗓音信号进行特征分析。研究提高病理嗓音识别率的算法。针对传统声学特征对病理嗓音识别率低的问题,提出一种E-BLSP参数的病理嗓音识别算法,将E-BLSP特征和其他传统参数(LPCC、MFCC)输入到SVM和DNN网络中,研究单一特征和融合特征在两种分类器下的识别性能,准确率、ROC等多个客观指标的评价结果均验证了该算法的有效性。(2)研究激励模型中反映韵律特性的激励参数,针对传统算法提取病理嗓音基频失效的问题,提出一种基于小波变换和HHT变换的算法,准确提取病理嗓音基频信息;研究声道模型参数和元音类型、发声音色的关系,针对病理嗓音信号共振峰出现偏移、不稳定等问题,基于LSP参数,参照正常嗓音参数特性对病理嗓音进行迭代修复,实现对病理嗓音声道特性的重建;研究基于不同合成规则的语音合成算法,基于修复后的基频参数和声道参数选择线性预测参数合成法进行病理嗓音再合成;研究评价语音质量的指标,针对修复前后的嗓音信号,分别从时域测度、频域测度和听觉域测度评价病理嗓音修复系统的性能。实验结果表明,本论文实现的病理嗓音修复系统在语音可懂度方面取得了令人满意的效果。
郭乐乐[4](2019)在《非传统特征参数的声带病理语音识别》文中提出表面刺激、组织变化等多种因素引起的声带病变,使得声带的活动性、功能性和形状等受到影响,导致声带不规则振动,整体声音质量变差。目前声带病理主要是通过侵入式喉镜检查,这种方式给患者造成不便,同时依赖临床医生主观经验评估,不同医生判断的结果可能不同。故人们希望借助计算机工具以非侵入方式分析语音信号,帮助实际诊断声带病变,为声音质量的客观评价提供统一量化的标准。基于这些原因,使用信号处理技术和机器学习算法自动计算语音特征并且准确识别正常和病理声音变得尤为重要。想要准确评估正常和病理语音,就必须提取出可以良好反映病理特性的特征参数。本文从量化语音信号的线性特征参数和非线性特征参数两方面入手分析,在传统声学特征参数的基础上,对语音信号做一系列变换处理得到非传统特征参数,将各个特征参数依次输入支持向量机建模识别,通过分类准确率判断各参数对声带病理语音的识别能力。本文结合理论分析和MATLAB仿真实验得出以下结果:1.与传统线性声学参数相比,本文的非传统线性特征参数提取不需要准确判断基音周期,方便实现,易于应用。从支持向量机识别结果来看,非传统线性特征参数比传统线性参数识别正常与病理语音的效果更好,这些非传统特征在一定程度上改善了传统特征分析病理嗓音的能力。2.利用四层小波包分解,提取语音信号不同频率范围内的非线性特征参数,得到非传统的非线性分层特征,比较特征参数分层前后的识别率发现,特征参数分层后整体识别率提高,降维优化后的特征参数包含了更多有用的信息,更有利于鉴别病理语音。3.不同参数对正常与病理语音的识别能力不同,比较参数在不同分类器下的平均识别率发现,识别率最高的是非线性特征参数分层优化模糊熵98.20%,其次是线性参数频谱平坦度98.19%,考虑到分层优化模糊熵维数比频谱平坦度的维数高,时间成本大,所以在区分正常与病理语音时选用频谱平坦度更好。4.比较不同参数对麻痹和息肉语音的识别率发现,非线性分层优化特征16维Hurst指数的识别效果最好,为96.97%,可以准确有效的区分出麻痹和息肉语音,该结果为无创检测不同类型病理语音提供可能。5.非线性特征参数在区分不同类型的声带病理语音时优势更大,这与声带病理语音的发音机制有关,喉部病变导致声带异常振动造成语音信号的湍流增加,非线性行为更明显,所以更适合用非线性分析方法研究不同类型嗓音疾病的发音特性。
常静雅[5](2016)在《小波域多重分形和能量谱参数的病理嗓音识别研究》文中提出随着社会的发展,人们之间的交往日益频繁,语言是人与人交流的重要桥梁,但是嗓音疾病导致嗓音嘶哑、无力等,严重影响了人们的生活质量和社会交流。采用声学分析技术对病理嗓音信号进行研究和分析,可以实现对嗓音质量的客观评估,对喉部疾病的诊断和治疗具有重要意义。小波变换能在不同尺度对信号进行分析,多重分形谱能够精细刻画信号局部尺度行为,同时小波变换是一种时频分析方法,能有效反映嗓音在时间‐尺度平面能量分布,因此本文主要研究了嗓音小波域多重分形谱参数和能量谱参数识别病理嗓音。针对单一分形维数在描述嗓音非线性方面的不足,引入分形和小波结合的小波leaders多重分形谱,并采用Chhabza算法求解小波leaders多重分形谱,通过非参数bootstrap统计估计参数置信区间。小波leaders多重分形谱能够表征嗓音信号的局部奇异性统计分布情况,其参数在正常嗓音和病理嗓音间具有较大差异,病理嗓音谱宽较小,正常嗓音谱宽较大,正常嗓音多重分形特征更加明显,小波leaders多重分形谱参数对病理嗓音的平均识别率为90.66%。传统声学参数无法很好的表征信号非平稳特性,本文对嗓音在小波域进行时频分析,提出一种小波域能量谱参数GCWT,对病理嗓音进行识别。对沿尺度轴方向的能量谱进行多维高斯混合建模,并且将模型参数作为嗓音特征参数GCWT进行病理嗓音识别,相对于传统参数,参数GCWT对病理嗓音具有比较好的识别效果,平均识别率为92.99%。由于参数GCWT维数较高,采用主成分分析和局部线性嵌入对特征参数GCWT进行降维处理,并且提出了动态加权局部线性嵌入DWLLE降维方法,弱化稀疏采样对降维的影响,有效保留了参数高维空间的几何特性,降低了参数冗余,降维后的参数对病理嗓音的识别率最高达97.45%。
张凯晗[6](2015)在《基于逆滤波提取声门波方法的研究与实现》文中进行了进一步梳理嗓音在日常生活中具有重要作用,它不仅是最有效的沟通工具,还具有情绪表达和艺术创造的功能。嗓音障碍不但影响人们的正常交流,也影响身心健康。嗓音源检测是嗓音康复治疗工作中的核心内容,因此对嗓音源检测的研究具有十分重要的理论意义和临床价值。本文通过逆滤波提取声门波进行嗓音源检测,能够有效弥补喉镜与电声门图仪的不足。论文主要工作如下:采用线性预测逆滤波法进行声门波提取,分析不同参数条件下的声门波质量。通过实验对比,得出满足语音分析帧长为1200个数据点,线性预测分析帧长为40个数据点,帧移为20个数据点,以声门关闭段的线性预测结果作为逆滤波传递函数的系数,预测器阶数p等于16,以/a/为测试语音的条件时,提取的声门波质量最好。在线性预测逆滤波提取声门波的基础上,提出基于加权线性预测逆滤波的声门波提取方法并应用于嗓音源检测。结果表明,在短时能量加权函数步长为24时,提取的声门波质量优于线性预测逆滤波法提取的声门波。以电声门图为参照,结合LF声门波模型对两种逆滤波法提取的声门波和电声门图进行参数提取及分析。结果表明,基于线性预测逆滤波提取的声门波的三个LF参数:声门从关闭到最大开放状态的时间、声带振动周期、声带运动回归时间误差分别为8%、1%、2%。基于加权线性预测逆滤波法提取的声门波相比前者质量有明显提高,其中提取的三个LF参数误差均不超过1%。论文工作将为替代电声门图仪,进而研制“数字化声道模拟下的汉语功能检测及康复平台”提供理论支撑。
周孝进[7](2014)在《采用SVM权重匹配特征参数的功能性病理嗓音识别研究》文中进行了进一步梳理语言是人类所特有的生理功能,是日常交流中最常用且最直接的方式。随着人类生活方式的改变,社会交流日益增加,嗓音疾病的发病率显着上升。随着模式识别技术的成熟,病理嗓音疾病的客观自动检测实现了无损检测,检测结果客观。病理嗓音识别研究代替传统临床主观检测成为研究热点。目前病理嗓音识别研究主要集中于特征参数提取与特征参数优化这两个重点。针对于特征参数提取方面,本文为了提高基频类参数的准确性,提出了基于最优病理嗓音重构的基频检测算法,该算法利用小波重构病理嗓音信号,去除高次谐波,再利用近似熵及最大李雅普诺夫指数自适应选择最优重构病理嗓音进行基频提取。此算法可以有效抑制传统基频检测算法中出现的倍频及半频误差。此外在非线性参数方面提出了小波能熵比,该参数结合了小波能量及小波熵的优势,很好的表征了病理嗓音的能量及复杂度特征。在特征参数优化方面,为了降低特征参数维度,本文采用了支持向量机权重匹配的参数融合算法进行特征参数融合。首先先对传统特征参数进行Spearman相关性分析,选取相关性较小的声学参数组成传统参数集。再利用核主成分分析对倒谱类特征参数进行参数降维,降低了MFCC与LPCC间的冗余度。最后将三个参数集利用支持向量机进行权重匹配,给予给参数集适当权重,最终组合成一个最优参数集。本文实验部分首先对病理嗓音库进行统计分析,此外对各类参数进行了分析研究,利用多种分类器对最优特征参数集进行识别研究。与原始特征相比,本文算法病理嗓音与正常嗓音识别率达96.92%,声带小结与声带息肉间识别率达83.22%。各项识别率均得到提高。
李宁[8](2013)在《基于声学参数和支持向量机的病理嗓音分类研究》文中认为随着人类社会交流的增加和生活习惯的改变,嗓音疾病的发生率越来越高,因此临床上对言语嗓音障碍的评估越来越重视,有关病理嗓音检测分析的研究也越来越多。能够对病理嗓音进行准确诊断是一切嗓音问题解决的根本。本研究根据病理嗓音的国内外研究现状以及目前的研究趋势,围绕病理嗓音的声学测量以及模式识别方法中的支持向量机,展开了病理嗓音客观自动分类与评级的前瞻性研究,最终构建了病理嗓音自动分类器。由于病理嗓音分类器的构建需要输入若干特征向量,因此本研究需进行嗓音特征参数的选取研究。针对分类器的特征向量集选取了和病理嗓音特征相关的基频类参数、振幅类参数、共振峰类参数、声门类参数、谐噪比参数以及倒谱类参数共六大类声学参数。为了克服基频提取时噪声对计算结果的干扰,采用同态系统和倒谱分析这种对噪声干扰不敏感的基频提取方法进行嗓音基频的提取,并在此基础上获得了其它新的基频类参数、谐噪比参数和倒谱类参数。为了提高病理嗓音分类器的分类效率,本研究对所选声学参数进行了优化。通过对病理嗓音声学特征参数相互之间的相关性分析,以及病理嗓音感知特征和声学特征的相关性分析,完成了病理嗓音声学参数的两次优化;从而选取包含较多信息含量,最能反映病理嗓音特征的参数作为优化后特征参数向量,输入到病理嗓音分类器中。为了避免有限样本量对研究结果的影响以及实现病理嗓音的非线性分类,本研究选择支持向量机这种模式识别方法作为病理嗓音的分类方法,其十分适合小样本和非线性分类问题的研究。根据提取的所有声学参数和优化后的声学参数分别建立了支持向量机的嗓音训练模型,从而构建了两个能够对正常嗓音和病理嗓音进行自动区分的病理嗓音二分类器。然后采用交叉验证和ROC曲线相结合的验证方式对病理嗓音二分类器的效果进行检验;这种检验方式避免了有限样本对验证结果的影响,推广性佳,而且简单直观。通过对分类器的识别正确率和ROC曲线图的研究发现:针对正常嗓音和病理嗓音识别的病理嗓音二分类器的分类效果极佳,识别率达到96%-98%,基本可以实现二者的区分。为了克服各类别嗓音样本数量不均衡的问题,以及避免分类重叠和不可分类的情况出现,本研究在病理嗓音二分类器的基础上,采用一对一的方法,根据提取的所有声学参数和优化后的声学参数,分别构建了两个能够对病理嗓音四级严重程度进行自动等级划分的病理嗓音四分类器。然后采用交叉验证和ROC曲线相结合的验证方式对病理嗓音四分类器的效果进行检验;通过对分类器的识别正确率和ROC曲线图的研究发现:针对病理嗓音等级评价的病理嗓音四分类器具有一定的分类效果,识别率达到73%~84%,但不如病理嗓音二分类器;基于优化后参数的病理嗓音分类器的分类效果略低于原始参数,在追求分类效率的情况下可以使用基于优化后参数的病理嗓音分类器进行分类。病理嗓音自动分类器不只针对病理嗓音和正常嗓音两种类型进行客观化区分,还针对病理嗓音的四级严重程度进行客观化的等级评价。对病理嗓音自动化分类与评级的研究使得嗓音障碍的评估不受到主观差异、语言环境等因素的影响,能够更加客观化。
周林灿[9](2011)在《病理嗓音的声学分析和合成》文中进行了进一步梳理对病理嗓音客观评估方法的研究,在言语嗓音的临床应用研究和基础研究领域中都具有重要的社会意义和理论意义。目前许多临床治疗师已经用主观评级的方法对病理嗓音进行了分类,但是这种主观评级方式对评价者非常依赖。理想的病理嗓音的评价应该是通过模型参数的匹配来对取样样本进行自动分析,从而得到更为客观的鉴别力。因此,本研究利用稳态元音/?/作为声学材料进行病理嗓音的声学分析和合成,通过分析合成感知实验来提出和验证嗓音音质评价的多参数变量函数方程组。围绕此研究目标,本研究工作主要以下几部分:在病理嗓音的音质特征研究基础上,利用线性预测分析和逆滤波技术,开发病理嗓音的声学分析软件,提取一系列描述嗓音音质特征的声学参数;并针对GRBAS进行主观感知将其等级分类。采用秩和检验方法验证主观感知结果与声学分析数据间的相关性,从而获取与感知评价一致的敏感声学参数;然后在此基础上利用马氏距离进行判别分析,以求解多参数变量的函数方程组,实现嗓音音质的客观评估。在病理嗓音敏感参数的研究基础上,以LF模型为基础进行病理嗓音源建模,开发病理嗓音信号合成器,实现病理嗓音在声学上的非周期性特征(包括基频微扰、振幅微扰和送气噪音),进而合成病理嗓音。在此基础上进行合成感知实验,对病理嗓音信号合成器的控制参数与合成嗓音的主观评价结果做相关性分析,从而进一步来验证评价函数的准确性和病理嗓音源建构的有效性。病理嗓音的分析和合成,是嗓音研究方法中分析合成感知法的基础和前提。本研究在国内外嗓音研究的基础上,通过病理嗓音分析感知的实验研究,获得了多维参数的嗓音评估函数和病理嗓音源模型;并通过病理嗓音的合成感知的实验研究来验证其函数的准确性和病理嗓音源模型的有效性。同时研究和开发了病理嗓音分析和合成软件,改善了国内在病理嗓音信号合成器方面的研究基础的不足,丰富和发展了嗓音障碍的研究方法和工具。
吴振宇[10](2011)在《个性特征的语音合成与模拟技术研究》文中进行了进一步梳理使计算机具有“说话”的功能,是人机交互的一个重要方面。随着计算机通信技术和多媒体技术等的飞速发展,借助于语音合成系统,计算机已经能够清晰、自然地说话了。然而,现有的语音合成系统往往只能按照一个或几个特定的模式说话,而用户不仅要求计算机有听和讲能力,还要求机器输出的语音能更加个性化。个性特征语音合成与模拟是语音合成研究的一个重要内容,此研究有助于语音合成产品扩大其应用范围,丰富机器语音合成的表现力问题。论文主要完成了以下几方面的工作:(1)通过阅读中外文献,了解了个性特征语音合成的发展现状。(2)从语音的形成过程入手,分析产生不同语音个性特征的生理原因,总结了语音的各声学参数及对感知的影响,建立了语音信号的物理模型和数字模型。(3)对个性特性声学参数进行提取实验和调整的方法研究。(4)实现了基于MS TTS的参数调整的个性化特征语音合成,并对合成语音进行了测评。实验表明通过这种方法可以在不事先录制个人语音库的情况下来使合成的语音有说话人的个性特征。本论文在研究语音合成、语音分析技术的基础上,研究了能反映说话者语音的个性特征参数,完成了参数的提取与分析调整,并通过VB编程二次开发SAPI5.1,将个性特征参数用于控制TTS语音,此方法可以在不增加新人语音库的条件下来丰富语音的表现力,增加了个性化的色彩,降低了合成语音的复杂度,实用效果较好。可应用于文本朗读、电影配音和语音伪装等方面,由于成本低,系统小,所以具有较高的推广价值。
二、基于嗓音源变换函数的声门发声效率估计方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于嗓音源变换函数的声门发声效率估计方法(论文提纲范文)
(1)普通话双字组中语音的空气动力学研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
第一节 汉语语音学的发展与实验语音学 |
第二节 基于气流气压信号语音研究的理论背景及现状 |
第三节 研究对象、意义、目的及方法 |
第四节 实验说明 |
第五节 创新点及局限性 |
第二章 普通话双字组中塞音发声气流气压分析 |
第一节 汉语普通话塞音概述 |
第二节 成人普通话双字组中塞音发声气流气压分析 |
第三节 儿童普通话双字组中塞音发声气流气压分析 |
第四节 塞音空气动力学对比分析 |
第五节 塞音空气动力学格局 |
第三章 普通话双字组中擦音发声气流气压分析 |
第一节 汉语普通话擦音概述 |
第二节 成人普通话双字组中擦音发声气流气压分析 |
第三节 儿童普通话双字组中擦音发声气流气压分析 |
第四节 擦音空气动力学对比分析 |
第五节 擦音空气动力学格局 |
第四章 普通话双字组中塞擦音发声气流气压分析 |
第一节 汉语普通话塞擦音概述 |
第二节 成人普通话双字组中塞擦音发声气流气压分析 |
第三节 儿童普通话双字组中塞擦音发声气流气压分析 |
第四节 塞擦音空气动力学对比分析 |
第五节 塞擦音空气动力学格局 |
第五章 普通话双字组中通音发声气流气压分析 |
第一节 汉语普通话通音概述 |
第二节 成人普通话双字组中通音发声气流气压分析 |
第三节 儿童普通话双字组中通音发声气流气压分析 |
第四节 通音空气动力学对比分析 |
第五节 通音空气动力学格局 |
第六章 普通话双字组中元音发声气流气压分析 |
第一节 汉语普通话元音概述 |
第二节 成人元音气流气压信号总体分析 |
第三节 儿童元音气流气压信号总体分析 |
第四节 元音空气动力学对比分析 |
第五节 元音空气动力学格局 |
第七章 总结 |
第一节 普通话辅、元音气流气压表现总结 |
第二节 强阻塞辅音气流气压表现总结 |
第三节 通音和元音气流气压表现总结 |
参考文献 |
附录 |
致谢 |
攻读学位期间发表的学术论文目录 |
(2)一种遗传算法的声带模型参数反演方法(论文提纲范文)
1 标准遗传算法 |
2 改进遗传算法的声带模型参数反演 |
2.1 改进遗传算法 |
2.2 目标函数构建 |
2.3 改进遗传算法的声带模型参数反演 |
3 实验结果及分析 |
4 结论 |
(3)病理嗓音修复算法的研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究意义 |
1.2 研究现状 |
1.2.1 病理嗓音修复的研究进展 |
1.2.2 面临的困难 |
1.3 本文主要研究内容 |
1.4 论文结构安排 |
第2章 病理嗓音修复理论概述 |
2.1 发声系统的原理和数学模型 |
2.1.1 激励模型 |
2.1.2 声道模型 |
2.1.3 辐射模型 |
2.2 病理嗓音形成机制和特点 |
2.3 病理嗓音信号的特征分析 |
2.3.1 预处理 |
2.3.2 声学特征 |
2.4 病理嗓音修复系统框架 |
2.5 本章小结 |
第3章 病理嗓音识别 |
3.1 引言 |
3.2 特征提取 |
3.2.1 线性预测系数LPCC |
3.2.2 梅尔倒谱系数MFCC |
3.2.3 E-BLSP特征 |
3.3 模式识别 |
3.4 病理嗓音识别系统的评价指标 |
3.5 本章小结 |
第4章 病理嗓音重构 |
4.1 引言 |
4.2 激励修复 |
4.2.1 小波包变换 |
4.2.2 HHT |
4.2.3 一种基于小波变换和HHT的病理嗓音基频提取算法 |
4.3 声道修复 |
4.4 语音合成 |
4.5 病理嗓音修复系统的评价指标 |
4.6 本章小结 |
第5章 实验平台搭建与测试 |
5.1 引言 |
5.2 实验数据集的设计 |
5.3 病理嗓音修复系统 |
5.3.1 实验参数设置 |
5.3.2 病理嗓音识别 |
5.3.3 病理嗓音重构 |
5.4 实验结果与分析 |
5.4.1 病理嗓音识别结果与分析 |
5.4.2 病理嗓音重构结果与分析 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 下一步工作展望 |
参考文献 |
发表论文及参加科研情况说明 |
致谢 |
(4)非传统特征参数的声带病理语音识别(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 本文的研究内容及章节安排 |
第2章 语音的特征参数提取 |
2.1 传统线性声学特征参数 |
2.1.1 基于原始语音的特征 |
2.1.2 基于声门波的特征 |
2.2 非传统线性特征参数 |
2.2.1 倒谱峰值突出 |
2.2.2 残差特征 |
2.3 传统非线性特征参数 |
2.3.1 L-Z复杂度 |
2.3.2 Hurst指数 |
2.3.3 Teager能量算子 |
2.3.4 熵值特征 |
2.4 非传统非线性分层特征 |
2.4.1 小波包分解分层处理 |
2.4.2 分层特征分析 |
2.5 本章小结 |
第3章 正常与病理语音的分类实验 |
3.1 实验数据与方法 |
3.1.1 实验数据介绍 |
3.1.2 识别方法 |
3.1.3 实验预设条件 |
3.2 一维特征参数的统计学分析 |
3.2.1 线性特征参数的盒图比较 |
3.2.2 非线性特征参数的盒图比较 |
3.3 二分类实验结果及分析 |
3.3.1 一维线性参数识别实验 |
3.3.2 一维非线性参数识别实验 |
3.3.3 多维分层特征参数的分类实验 |
3.3.4 多维特征参数优化后的分类实验 |
3.3.5 不同分类器对比实验 |
3.4 本章小结 |
第4章 不同类型病理语音的识别实验 |
4.1 一维特征参数的盒图分析 |
4.1.1 线性特征参数的盒图比较 |
4.1.2 非线性特征参数的盒图比较 |
4.2 分类识别实验结果及分析 |
4.2.1 一维线性参数识别实验 |
4.2.2 一维非线性参数识别实验 |
4.2.3 多维分层特征参数的分类实验 |
4.2.4 多维特征参数优化后的分类实验 |
4.3 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间的研究成果 |
(5)小波域多重分形和能量谱参数的病理嗓音识别研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 课题的研究背景及意义 |
1.2 病理嗓音分析方法 |
1.3 病理嗓音识别的研究现状 |
1.4 本文的主要研究工作及章节安排 |
1.4.1 本文的主要研究工作 |
1.4.2 本文的章节安排 |
第二章 病理嗓音发声机制和特征参数 |
2.1 嗓音信号产生 |
2.2 病理嗓音发病机制研究及评估 |
2.3 病理嗓音声学参数 |
2.3.1 传统声学参数 |
2.3.2 梅尔频率倒谱系数 |
2.4 病理嗓音非线性参数 |
2.4.1 Lempel-Ziv复杂度 |
2.4.2 分形维数 |
2.5 本章小结 |
第三章 病理嗓音小波leaders多重分形非线性分析 |
3.1 引言 |
3.2 多重分形 |
3.2.1 多重分形定义 |
3.2.2 多重分形分析 |
3.3 小波leaders多重分形谱 |
3.3.1 小波leaders多重分形谱参数 |
3.3.2 小波leaders多重分形谱参数计算 |
3.3.3 Bootstrap统计 |
3.4 本章小结 |
第四章 病理嗓音小波域能量谱参数 |
4.1 引言 |
4.2 病理嗓音时频特性分析 |
4.2.1 短时傅里叶变换 |
4.2.2 连续小波变换 |
4.3 小波域能量谱参数GCWT |
4.4 特征参数降维 |
4.4.1 主成分分析PCA |
4.4.2 局部线性嵌入LLE |
4.4.3 动态加权局部线性嵌入DWLLE |
4.5 本章小结 |
第五章 实验结果分析 |
5.1 实验数据 |
5.2 参数相关性及差异性分析 |
5.2.1 声学参数和非线性参数 |
5.2.2 声学参数相关性及差异性分析 |
5.2.3 小波leaders多重分形谱参数相关性及差异性分析 |
5.3 识别结果 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
攻读硕士期间发表的论文 |
致谢 |
(6)基于逆滤波提取声门波方法的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及研究意义 |
1.2 研究现状 |
1.3 论文主要工作及安排 |
第二章 声门波提取基础 |
2.1 言语产生的机制 |
2.2 言语产生源滤波理论 |
2.3 逆滤波理论 |
2.4 电声门图仪 |
2.5 本章小结 |
第三章 基于线性预测逆滤波提取声门波 |
3.1 发音材料样本采集 |
3.2 基于LP逆滤波提取声门波算法 |
3.3 算法实现及优化 |
3.4 实验结果 |
3.5 本章小结 |
第四章 基于加权线性预测逆滤波提取声门波 |
4.1 加权线性预测 |
4.2 WLP逆滤波算法实现与优化 |
4.3 实验结果 |
4.4 本章小结 |
第五章 实验结果分析 |
5.1 LF声门波模型及参数选择 |
5.2 LF模型T参数提取方法 |
5.3 LF参数提取及分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
在学期间发表论文和科研成果清单 |
致谢 |
(7)采用SVM权重匹配特征参数的功能性病理嗓音识别研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 功能性病理嗓音研究背景及意义 |
1.2 功能性病理嗓音声学参数的研究现状 |
1.3 功能性病理嗓音识别模型的研究现状 |
1.4 本文研究内容及论文安排 |
第二章 嗓音产生机制及临床表现 |
2.1 嗓音的产生机理 |
2.2 嗓音的数学模型 |
2.3 常见声带类嗓音疾病的临床表现 |
2.4 本章小结 |
第三章 嗓音常见声学参数及小波能熵比 |
3.1 引言 |
3.2 基频类参数 |
3.2.1 病理嗓音基音频率 |
3.2.2 传统基频提取算法 |
3.2.3 传统算法的分析 |
3.2.4 功能性病理嗓音基频检测算法 |
3.3 振幅类参数 |
3.4 倒谱类参数 |
3.5 非线性动力学参数 |
3.5.1 关联维 |
3.5.2 最大李雅普诺夫指数 |
3.5.3 盒子维 |
3.6 小波能熵比 |
3.6.1 小波分析 |
3.6.2 小波能谱熵 |
3.7 本章小结 |
第四章 基于参数融合的功能性病理嗓音识别研究 |
4.1 引言 |
4.2 传统声学参数 Spearman 相关性分析 |
4.3 倒谱类声学参数核主成分分析 |
4.3.1 倒谱类声学参数分析 |
4.3.2 核主成分分析 |
4.4 基于 SVM 权重匹配特征参数融合分析 |
4.4.1 支持向量机(SVM) |
4.4.2 基于支持向量机的参数融合 |
4.4.3 病理嗓音识别整体系统框图 |
4.5 本章小结 |
第五章 实验结果与分析 |
5.1 病理嗓音库与实验数据 |
5.1.1 录音对象 |
5.1.2 录音仪器及处理软件 |
5.1.3 病理嗓音参数统计及图片整理 |
5.2 病理嗓音基频检测实验分析 |
5.3 病理嗓音各类特征参数分析 |
5.3.1 各类病理嗓音间声学参数 Spearman 相关性分析 |
5.3.2 小波能谱熵盒图分析 |
5.3.3 倒谱类参数分析 |
5.4 功能性病理嗓音识别结果分析 |
5.4.1 正常嗓音与病理嗓音识别研究 |
5.4.2 声带息肉与声带小结识别研究 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 今后工作展望 |
参考文献 |
攻读硕士学位期间发表论文 |
致谢 |
(8)基于声学参数和支持向量机的病理嗓音分类研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 研究背景和思路 |
第一节 病理嗓音的生理学机制及其特征分析 |
第二节 病理嗓音的国内外研究现状 |
第三节 研究目的与框架 |
第二章 嗓音的声学特征分析与参数提取 |
第一节 嗓音的声学特征分析 |
第二节 嗓音声学参数的提取 |
第三节 嗓音声学参数的初优化 |
第三章 病理嗓音二分类器的研究 |
第一节 声音样本的采集 |
第二节 基于支持向量机的病理嗓音二分类器的构建 |
第三节 病理嗓音二分类器的效果验证 |
第四章 病理嗓音四分类器的研究 |
第一节 病理嗓音的感知评价 |
第二节 病理嗓音声学参数的二次优化 |
第三节 基于一对一法的病理嗓音四分类器的构建 |
第四节 病理嗓音四分类器的效果验证 |
第五章 研究总结与展望 |
第一节 研究总结 |
第二节 研究特色与创新 |
第三节 研究展望 |
参考文献 |
后记 |
(9)病理嗓音的声学分析和合成(论文提纲范文)
摘要 |
Abstract |
第一章 研究背景与框架 |
第一节 本研究的社会意义与理论意义 |
第二节 嗓音产生机制及其参数研究状况 |
一、言语的产生机制 |
二、声带的振动机制 |
三、病理嗓音的临床表现 |
四、嗓音声学参数的特点和临床含义 |
第三节 嗓音参数研究方法状况 |
一、言语产生、分析和感知的研究方法 |
二、嗓音源分析技术 |
第四节 嗓音声学参数的临床价值 |
第五节 本研究的目的和框架 |
第二章 病理嗓音的声学分析和判别 |
第一节 病理嗓音的声学分析 |
一、基于线性预测技术和逆滤波技术的参数估计 |
二、基音非周期性特征分析 |
三、送气噪音类分析 |
第二节 嗓音声学分析与感知评价实验 |
一、引言 |
二、材料与方法 |
三、实验结果 |
四、判别分析 |
五、小结 |
第三章 嗓音源建模和病理模型参数 |
第一节 嗓音声源 |
一、言语产生的源滤波器模型 |
二、声门阻抗 |
三、嗓音源与声道间相互作用 |
第二节 非相互作用下的嗓音源建模 |
一、声门波模型 |
二、病理声门脉冲模型 |
第三节 嗓音源的参数提取与合成 |
一、嗓音源的参数提取与编码 |
二、声门波的重建 |
第四章 嗓音合成器的研究和开发 |
第一节 功能概述 |
第二节 合成算法 |
一、嗓音源的激励合成 |
二、声道模型 |
第三节 软件实现 |
一、软件开发的实现平台 |
二、软件开发的实现方式 |
第五章 嗓音合成和感知评价实验验证 |
第一节 嗓音合成分析测量验证实验 |
一、基频轨迹曲线的验证 |
二、强度轨迹曲线的验证 |
三、声门参数序列的验证 |
四、结论与讨论 |
第二节 嗓音合成感知评价验证实验 |
一、实验的声学材料 |
二、评估人员及方法 |
三、相关分析结果 |
四、结论与讨论 |
第六章 研究总结和展望 |
第一节 研究总结 |
一、研究成果 |
二、特色和创新 |
第二节 后续研究展望 |
参考文献 |
后记 |
(10)个性特征的语音合成与模拟技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 引言 |
1.2 课题的提出和研究意义 |
1.3 个性特征语音合成与模拟技术的发展现状 |
1.4 本文研究的主要内容和结构 |
1.5 本章小结 |
第2章 研究的相关技术 |
2.1 语音产生的生理原因 |
2.2 语音的声学基础 |
2.2.1 声音的物理特征 |
2.2.2 声音的感知 |
2.3 语音信号的处理与分析技术 |
2.3.1 语音信号的数字化 |
2.3.2 语音信号的预处理 |
2.3.3 语音信号时域分析方法 |
2.3.4 语音信号的频域分析 |
2.4 Praat语音分析软件介绍 |
2.5 本章小结 |
第3章 语音个性特征参数分析 |
3.1 语音个性特征分类 |
3.2 个性特征参数分析 |
3.2.1 声学参数对语音个性特征的影响 |
3.2.2 韵律特征对语音个性特征的影响 |
3.3 个性特征参数的选择 |
3.3.1 嗓音源 |
3.3.2 基音频率 |
3.3.3 共振峰 |
3.3.4 时长 |
3.3.5 短时能量 |
3.4 本章小结 |
第4章 语音产生模型的建立 |
4.1 语音发音的物理模型 |
4.1.1 声源激励模型 |
4.1.2 声道的近似模型 |
4.1.3 口鼻辐射模型 |
4.2 语音发音的数学模型 |
4.3 本章小结 |
第5章 个性特征语音合成与模拟的实现 |
5.1 个性特征语音合成与模拟现实技术 |
5.1.1 文本分析技术 |
5.1.2 韵律控制技术 |
5.1.3 现有语音合成方法 |
5.2 个性特征语音合成与模拟设计 |
5.2.1 个性特征语音合成的环境 |
5.2.2 个性特征语音合成的过程 |
5.3 SAPI介绍 |
5.3.1 SAPI的组成 |
5.3.2 Microsoft SAPI5.1 |
5.4 个性特征语音合成与模拟实现方法 |
5.4.1 VB中使用的SAPI语音合成相关类 |
5.4.2 实现步骤 |
5.5 本章小结 |
第6章 实验结果及数据分析 |
6.1 实验结果与数据分析 |
6.1.1 时长调整和变换实验 |
6.1.2 嗓音源变换实验 |
6.1.3 基频调整和变换实验 |
6.1.4 共振峰调整和变换实验 |
6.1.5 短时能量调整和变换实验 |
6.2 系统性能分析 |
6.3 本章小结 |
第7章 结论与展望 |
7.1 结论 |
7.2 展望 |
参考文献 |
致谢 |
四、基于嗓音源变换函数的声门发声效率估计方法(论文参考文献)
- [1]普通话双字组中语音的空气动力学研究[D]. 翟冰慧. 天津师范大学, 2021(10)
- [2]一种遗传算法的声带模型参数反演方法[J]. 陈莉媛,张晓俊,孙宝印,曾晓亮,王琰,薛隆基,陶智. 电子器件, 2019(06)
- [3]病理嗓音修复算法的研究[D]. 武雅琴. 天津大学, 2019(01)
- [4]非传统特征参数的声带病理语音识别[D]. 郭乐乐. 陕西师范大学, 2019(06)
- [5]小波域多重分形和能量谱参数的病理嗓音识别研究[D]. 常静雅. 苏州大学, 2016(01)
- [6]基于逆滤波提取声门波方法的研究与实现[D]. 张凯晗. 暨南大学, 2015(12)
- [7]采用SVM权重匹配特征参数的功能性病理嗓音识别研究[D]. 周孝进. 苏州大学, 2014(01)
- [8]基于声学参数和支持向量机的病理嗓音分类研究[D]. 李宁. 华东师范大学, 2013(10)
- [9]病理嗓音的声学分析和合成[D]. 周林灿. 华东师范大学, 2011(09)
- [10]个性特征的语音合成与模拟技术研究[D]. 吴振宇. 华东师范大学, 2011(10)