一种高精度音高提取方案

一种高精度音高提取方案

一、一种高精度的基音提取方案(论文文献综述)

吴聪[1](2019)在《阵列麦克风语音采集增强系统设计与实现》文中研究说明麦克风作为一种拾音工具,在促进人类社会发展进步方面起着不小的作用。阵列麦克风作为麦克风发展的一个产物,是一个热点的研究方向之一。对于远场的语音拾取技术,小型阵列麦克风通过单纯的优化算法去改善性能的能力是有限的。针对这种情况,本文提出了一种从规模和结构上着手达到改善性能目的的方法。但是伴随而来的规模的扩大带来的硬件实现上的难度也会随之增大,因此,本文采用一种较高性能的FPGA芯片进行处理。本文首先针对现阶段阵列麦克风的发展做了一个综合的认识和了解,在此基础上,针对在现阶段发展相对空白之处进行分析思考,构想出本文阵列麦克风系统的设计思路,针对本设计进行建模,通过MATLAB仿真验证了设计思路的正确性,然后对硬件电路整体进行了设计。最后进行了硬件电路的FPGA的实现。建立的仿真模型为声源距离阵列麦克风50m,阵列麦克风是一个正方形阵列,每行与每列均由相同的麦克风数量如4个、6个、10个麦克风等距离摆放组成。采用的算法为固定波束形成算法,比较得出麦克风阵列行、列数为4和6的情况下,系统不能很好地对原始信号进行恢复,而当行、列数增加至10时,系统可以对原始信号进行很好的恢复。以此找到适用的麦克风阵列的规模大小,在此基础上,进行MATLAB仿真的综合实验,以Muti-tone信号模拟声源信号,在不同位置处设置干扰源。比较原始的Muti-tone信号和经过算法处理后的信号,可得到几乎相同的结论。本文重点介绍了硬件电路的设计,在硬件设计上,从系统整体出发,采用自上而下的设计思路,在整个框架之下完成各个模块的设计,再通过整体框架将各个模块之间联系起来,进而完成整体设计的目的。为了同步100路通道数据,本系统采用FPGA中较高性能的K7系列芯片进行数据处理,保证了接收信号的正确性。然后进行了本系统的FPGA实现,主要完成实现了对100个麦克风接收到的数据进行处理,实现了固定波束形成算法,完成了SD卡模块与FPGA模块之间以SPI协议进行通信连接的仿真实现,DAC模块与FPGA模块之间以I2C和Left Justified协议进行通信连接的仿真实现。

袁帅,熊绍潘,付天纯[2](2018)在《基于Android平台的听曲绘谱研究及其实现》文中认为本文介绍的是基于Android平台的自动音乐记谱的研究及其实现。采取模块化设计,将听曲绘谱系统分为音乐采集模块、特征提取模块、乐谱生成模块、乐谱显示模块和乐谱优化模块五大模块。论文重点研究了特征提取模块使用的基音周期提取算法,乐谱生成模块所使用的频率和乐音音高的映射关系,最后以音乐简谱目标表示,设计了一套在Android平台显示的简谱表示系统,以此进行听曲绘谱系统的研发。

童文[3](2013)在《基于安卓的乐音识别及MIDI文件输出的研究和实现》文中提出语音识别技术已经取得了不少进步,比如人们可以和Siri在苹果手机上对话了。另一个技术相关领域也有进展,乐音跟踪识别,比如微信可以摇一摇搜歌,手机根据“收听”到的音乐迅速查找出歌曲名称,并同步显示歌词,标志着乐音识别技术也越来越进入人们生活。技术的确在时时刻刻改变着人们的生活。本课题旨在探索用技术手段为热爱音乐DIY的人们打开一个新通道:设计一个手机APP(目前定位于Android平台),把使用者用某种乐器演奏的音符和节奏识别出来,并用MIDI文件记录下来,根据事前设定的乐器类型,还可轻松实现乐器换声,比如,用口琴吹奏,最后输出钢琴播放的音乐。这是个涉及音乐理论知识和计算机知识的综合性课题。这个需求要转换成现实,需要对乐理知识进行科学的把握,明确需求的技术本质。深入思考后不难发现,本课题从技术角度需要解决两个基本问题:一是音符的快速准确识别,二是对连续演奏的端点检测能力要稳定且迅速。为此,作者从当前较为成熟的音频识别技术入手,尤其是语言识别技术,深入了解各种时域和频域的分析方法,包括短时能量端点检测,自相关基频检测,快速傅立叶变换以及小波变换对音频信号的特征提取,了解了HMM及ANN在语音识别中的作用。并进一步通过在MATLAB上进行编程验证各种算法,最后提出在端点识别上的两点改进:一是启用一层db4小波分解并重构后的“细节”波形来进行短时能量检测,这个方法利用了“细节”波形在静音段较为平整的特点,较大程度上消除了在静音段误判,从而避免形成瞬时“跳音”的问题。二是把双门限端点检测法进行了改造,把4个状态变为2个状态进行判断,提出改进型能量门限反转端点识别法,在钢琴演奏和口琴演奏样本实验上端点识别效果较好。基音识别上,由于乐器演奏的音频较为清晰,频率成分较为确定,所以经过筛选验证选用了一种计算量小而且测得频率误差度较小的平均幅度差法。本课题已经设计和实现了一个基于Android的功能简单的APP,可以采集用户乐器演奏的乐音,按照事先设定的乐器种类输出与之对应的MIDI音乐文件,实现了在移动设备上无需使用MIDI键盘的MIDI输入,该APP经过一些完善后很快会免费分享给广大音乐爱好者。

王民,任雪妮,孙洁[4](2014)在《一种高效的基音检测与评估算法》文中认为基音轨迹是语音评估中重要的参数,它的高低变化反映了语音的音高起伏和语调韵律特点。为了准确地评估一段语音,利用变长夹角链码(Alterable Included Angle Chain,AIAC)来准确提取说话者的基音轨迹,对比模仿者与标准发音的基音轨迹的相似度,研究基音轨迹相似度的匹配算法及曲线拟合算法,从而完成基音特征相似性的评估。结果表明:该方法不仅能够准确、快捷提取说话者的基音轨迹,而且计算过程简单,操作简便并能够取得良好的评估效果。

王岐学[5](2010)在《基于统计特性的汉语方言辨识方法研究》文中研究指明方言辨识技术就是让机器根据讲话者的发音判定其所属方言区域的一项技术,它在多语言信息处理、机器翻译、辅助人工咨询和公共安全等领域都有重要应用价值。以GMM为代表的概率统计模型将辨识问题转换成对语音特征分布的估计问题,取得了较好的识别效果。本文基于GMM对长沙方言、邵阳方言、衡阳方言和普通话进行了辨识研究,主要内容包括:阐述了方言辨识的基本原理,详细介绍了方言辨识过程中语音特征参数的提取、训练模型选取、模板匹配和识别的基本方法。研究了用于方言辨识的语音特征参数的提取方法。针对汉语方言是有调语音的特点,经过差分处理进行二次特征提取后获取了语音信号的动态特征参数,并对不同特征参数进行组合构造出能更全面反映语音特点的新特征参数。建立了基于GMM的方言辨识模型,研究了模型参数的选取,并用该模型进行了方言辩识实验,分析了训练模型时所用特征参数对辩识结果的影响。实验结果表明:动态特征参数在抗噪方面具有优势,可提高辩识系统的鲁棒性和识别率。针对模型混合数对辨识系统带来的影响,提出了基于SOM神经网络分类和高斯混合模型的方言辨识方法。该方法首先用SOM神经网络对语音特征参数进行聚类分析,再对每类特征参数建立相应的辨识模型,然后将各子模型的辩识结果相加融合。实验结果表明:该方法可减少模型中的混合数,提升系统的性能,具有较强的实用性。

魏明果[6](2009)在《方言比较的特征提取与矩阵分析》文中研究说明对三种不同方言同一语句的语音资料进行了频谱分析与比较,利用Praat软件提取了三种方言的基音周期、基音周期内的频率加权平均、共振峰平均值。构建了三个方言特征矩阵,通过对三个方言特征矩阵的特征值与特征向量的数值分析,揭示了方言在一个方言区内随地域变化的内在规律,这种方法可用于方言的说话人识别。

黄观文[7](2009)在《GPS精密单点定位和高精度GPS基线网平差研究及其软件实现》文中进行了进一步梳理随着空间技术的发展,GPS定位技术应用越来越广泛,人们对GPS的定位精度要求也越来越高,因此,研究精密单点定位(PPP)和高精度GPS网平差的数据处理方法具有重要的理论和实际价值。对于本文的研究内容,主要包括两大部分:一是精密单点定位模型和卫星钟差研究及P3TEXT软件实现;研究涉及利用频谱分析法分析精密星历卫星钟差精度;精密单点定位数学模型的建立,以及基于自适应滤波的PPP算法,并编写相应的软件P3TEXT等。二是高精度GPS网平差数据处理方法研究,其中包括采用附加系统参数和附加基准条件的平差处理方法,编制了相应的高精度GPS网平差软件HPGPSADJ。概括起来,本文主要做了以下几方面的工作:(1)论述了GPS单点定位的观测模型以及线性组合。分析了各种误差源以及相应的改正模型,总结了精密单点定位中的主要关键技术。(2)利用频谱分析的方法对IGS精密星历钟差产品进行了精度分析,得出了卫星钟差精度不均匀的结论。(3)研究了GPS精密单点定位的数学模型,包括函数模型和随机模型。针对卡尔曼滤波容易发散的缺点,引入了三种自适应滤波模型,并将其运用于精密单点定位中。(4) GPS动态定位中,如采用序贯平差求解,模糊度参数变化以及参考星升降时,前后历元的承接关系异常复杂,这使得序贯平差模型变得十分复杂,针对这个问题,本文详细推导了序贯平差统一模型,并通过算例验证了模型的正确性和高效性。(5)论述了高精度GPS网的四种平差方法和三种参考基准,并分析了不同参考基准的几何意义。同时,当参考基准不一致时,需要在基线处理阶段或网平差处理阶段统一基准。(6)重点研究了高精度GPS形变监测网的平差数学模型,包括平差函数模型、随机模型以及附加系统参数的平差基准模型等。推导了系统参数对坐标估值的影响公式,提出形变监测网数据处理时,应在平差模型中考虑系统参数的影响,同时须选择合适的基准模型。(7)编制了精密单点定位软件P3TEXT和高精度GPS网平差软件HPGPSADJ,展示了软件的基本思路以及程序框架。

钱博,李燕萍,唐振民,徐丽敏[8](2007)在《一种基于线性预测残差倒谱的基音检测算法》文中研究说明基音检测算法一直是音频处理领域的研究热点,但是语音信号声道特征对基音及其谐振结构的影响很大,增加了检测的难度。利用LP残差仅仅保留声门激励信号的特点,通过倒谱分析避免了声道特征和噪声的影响。同时针对倒谱分析中经常出现的半频倍频问题和低频截断问题,引入了谐波积谱(HPS)的解决方案,提高了识别的精度。实验表明,该方法能够较好地避免半频倍频错误,对于截去了低频和高频的电话信道语音也能够得到令人满意的检测结果,同时作为帧检测技术能够满足实时应用的需要。

徐明,陈知困,黄云森[9](2007)在《基于FFT-ACF和候选值估计的基音周期提取方法》文中认为利用FFT-ACF算法进行基音周期候选值估计,减少在语音基音周期提取中常见的倍频和半频错误,提出针对候选值的多重后处理算法.后处理过程:首先运用峰值筛选法进行初选,接着利用一次均值法将语音分为不同的音高段,再使用二次均值法为每个音高段确定合适的频率范围,最后精确提取出基音周期.实验结果表明,基音周期后处理算法有效,在音乐哼唱识别应用中收到良好效果.

钱博[10](2007)在《基于汉语元音映射的说话人识别技术研究》文中研究指明语音是人类获取信息的主要来源之一,也是最方便、最有效、最自然的交流工具。说话人识别技术在近三十多年的时间里取得了很大的进步,这种技术的应用为人类的日常生活带来很大的便利。但是,随着说话人识别的实用化,不同应用领域对其要求。也越来越高。一方面,发音的多变性使说话人识别系统的适应性还有待提高;另一方面,噪声、训练时间以及通信信道失真等问题也会产生很大的影响。对于说话人识别来说,最主要的两个问题是如何从语音中提取单纯反映说话人身份信息的鲁棒特征,以及如何建立有效的识别模型达到实际应用中对速度、数据量、使用条件等方面的要求。本文针对汉语语音的特点,从分离身份信息和提高系统鲁棒性两个方面出发对汉语说话人识别展开研究,提出了新的说话人识别框架、模型和算法,主要取得了以下创新性成果。本文的核心是提出了一种新的基于汉语元音映射的说话人识别框架。该框架的基础是将汉语韵母中的元音部分以单元音音素为单位进行分解,对此我们使用频谱对比、特征对比、单元音滑动统计分布、分类器识别率等方式证实了从短时帧角度出发,汉语韵母可以分解为单元音音素的组合,并通过大量的实验建立了汉语韵母到单元音的映射表。相对于传统的说话人识别模型,新框架增加了汉语单元音音素分类模块进行韵母分解,并将多个针对单元音的说话人识别器组织起来代替传统的匹配或统计模块对帧特征进行处理。根据这个框架,每个针对单元音的说话人识别器进行说话人识别时避免了语义信息的干扰,增强了分类的针对性;同时,整个系统以短时帧作为基本识别单位,更易于达到实时处理的目标。根据基于汉语元音映射的说话人识别框架,提出了基于汉语元音分类的矢量量化说话人识别方法。由于每个矢量量化分类器在训练和识别过程中避免了语义信息的影响,该方法利用较小的码本就可以获得较高的识别率。然而,为了保证码本质量,需要大量的训练数据和识别数据。针对说话人识别方法需要大量数据参与训练和识别的缺点,结合新框架,本文又提出了基于仿生模式识别的汉语说话人识别方法。该方法在训练过程中为每个说话人的每个单元音音素帧特征在特征空间中建立一个包络;识别时通过分析测试帧特征与包络的关系进行判决,大大缩减了对训练和识别数据量的需求。在研究过程中,我们发现基于汉语元音映射的说话人识别框架由于增加了单元音分类模块,会带来分类误差并导致识别速度下降。对此,结合集成学习理论,我们提出了基于汉语元音映射的神经网络集成说话人识别方法。该方法在识别过程中不需要预先对测试语音帧进行元音分类,省略了元音分类模块,从而避免引入元音分类误差,加快了识别速度。此外,针对新的说话人识别框架的特点,本文在预处理和抗噪方面也进行了研究和改进,主要包括:提出了基于频谱特征的自适应元音帧提取算法,在损失端点检测准确性的前提下提高元音帧提取的速度和正确率;结合谐波积谱思想改进了基音提取算法;提出了基于背景估计的自适应抗噪方法,实现GMM模型下数据噪声背景不同时特征的提取、修正和识别;针对测试数据与训练数据背景不同的情况,从特征值处理和模型补偿两方面考虑,提出了基于高斯混合模型的加权特征补偿变换的抗噪方法,进一步改善了系统的性能。从本文一系列仿真实验的结果分析可得,基于本文新框架、模型和算法实现的说话人识别系统在识别率、识别速度和抗噪能力上都有所提高。特别是基于汉语元音分类的思想为分离语音特征中的语义信息和话者身份信息,将文本无关的说话人识别转变为文本有关的说话人识别提供了新的思路。

二、一种高精度的基音提取方案(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、一种高精度的基音提取方案(论文提纲范文)

(1)阵列麦克风语音采集增强系统设计与实现(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究工作的背景与意义
    1.2 国内外研究现状
    1.3 本论文的结构安排
第二章 阵列麦克风语音增强技术的理论基础
    2.1 语音信号和噪声信号的理论基础
        2.1.1 语音信号的产生模型
        2.1.2 语音信号的特征及分析
        2.1.3 人耳听觉感知的特征及分析
        2.1.4 噪声信号的特征及分析
        2.1.5 语音信号质量的评价规则
    2.2 阵列麦克风语音信号处理模型
        2.2.1 传统阵列信号处理模型
        2.2.2 阵列麦克风语音信号处理模型
    2.3 阵列麦克风语音增强基本算法比较
        2.3.1 波束形成算法
        2.3.2 后置滤波算法
        2.3.3 子空间分解算法
        2.3.4 盲源分离算法
        2.3.5 各种算法比较
    2.4 系统模型仿真
    2.5 本章小结
第三章 系统的硬件设计
    3.1 阵列麦克风介绍
    3.2 硬件框架
    3.3 阵列的硬件结构
        3.3.1 电源模块
        3.3.2 FPGA模块
        3.3.3 阵列麦克风模块
        3.3.4 方向调节模块
        3.3.5 SD卡模块
        3.3.6 DAC模块
        3.3.7 PCB设计
        3.3.8 系统硬件整体结构图
    3.4 本章小结
第四章 FPGA程序设计与实现
    4.1 Xilinx ISE简介
    4.2 FPGA程序设计流程
    4.3 FPGA的程序设计
    4.4 DAC模块的程序设计
    4.5 SD卡模块程序设计
    4.6 系统测试
    4.7 本章小结
第五章 总结与展望
    5.1 本文总结
    5.2 今后工作展望
致谢
参考文献

(2)基于Android平台的听曲绘谱研究及其实现(论文提纲范文)

1 概念设计
2 算法设计与实现
    2.1 基音周期提取
    2.2 频率音高映射
    2.3 乐谱表示系统设计
3 结论与讨论

(3)基于安卓的乐音识别及MIDI文件输出的研究和实现(论文提纲范文)

摘要
Abstract
目录
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 本文研究内容以及安排
第二章 基本乐理及音频信号分析方法
    2.1 乐音及音频
        2.1.1 声音基本特征
        2.1.2 声音采样及存储
        2.1.3 乐音以及十二音律
        2.1.4 音符时值
    2.2 音频信号的特征提取方法
        2.2.1 基础时频域分析
        2.2.2 小波变换
        2.2.3 线性预测倒谱系数LPCC
        2.2.4 Mel频率倒谱系数MFCC
    2.3 音频识别方法
        2.3.1 语音识别技术
    2.4 本章小结
第三章 乐音识别算法研究和设计
    3.1 乐音分割研究
        3.1.1 基础试验
        3.1.2 基于小波及短时能量的音频分割
        3.1.3 改进型能量门限反转端点识别法
    3.2 乐音基频识别研究
        3.2.1 基础试验
        3.2.2 基于平均幅度差的基频提取
    3.3 端点及连续帧联合音符识别
    3.4 乐音识别整体流程设计
    3.5 本章小结
第四章 乐音识别应用程序的设计与实现
    4.1 Android开发环境
        4.1.1 核心音频架构
        4.1.2 Android支持的音频文件
        4.1.3 UI工作原理
        4.1.4 开发环境搭建
    4.2 音频文件格式详解
        4.2.1 WAV文件格式
        4.2.2 MIDI文件格式
    4.3 应用程序需求分析
    4.4 UI设计及功能介绍
        4.4.1 录音模式界面
        4.4.2 转换模式界面
        4.4.3 乐器类型选择界面
    4.5 应用程序框架及流程
        4.5.1 程序结构图
        4.5.2 主要流程图
    4.6 应用程序权限设定
    4.7 应用程序主要模块
        4.7.1 WAV格式处理模块
        4.7.2 音频分割模块
        4.7.3 音符识别模块
        4.7.4 MIDI格式处理模块
    4.8 应用程序的性能测试及验证
        4.8.1 口琴单音测试
        4.8.2 钢琴单音测试
        4.8.3 口琴连续音测试
        4.8.4 钢琴连续音测试
        4.8.5 现场录音测试
    4.9 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
个人简历、在学期间发表的论文与研究成果

(5)基于统计特性的汉语方言辨识方法研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 方言辨识概述
    1.2 方言辨识的基本方法
    1.3 方言辨识面临的主要问题
    1.4 方言辨识的关键技术
    1.5 论文的主要研究内容
第二章 方言辨识的基本原理
    2.1 方言辨识的过程及系统框架
    2.2 方言语音的特征提取
    2.3 模型训练
    2.4 识别阶段
    2.5 辨识模型的选取
        2.5.1 基于高斯混合模型的方言辨识
        2.5.2 基于人工神经网络的方言辨识
    2.6 本章小结
第三章 基于多特征参数组合的动态特征参数提取
    3.1 引言
    3.2 基本特征参数
        3.2.1 短时能量分析
        3.2.2 基音提取
        3.2.3 LPCC特征参数
        3.2.4 MFCC特征参数
        3.2.5 口音敏感参数ASCC
    3.3 基于多特征参数组合和二次特征提取方法的语音动态特征参数的提取
        3.3.1 改进思路
        3.3.2 基于MFCC的语音动态特征参数提取
        3.3.3 基于MFCC和基音的组合特征参数及其动态特征参数提取
        3.3.4 基于LPCC和基音的组合特征参数及其动态特征参数提取
        3.3.5 基于短时能量和基音的组合特征参数及其动态特征参数提取
    3.4 本章小结
第四章 基于高斯混合模型的方言辨识方法
    4.1 引言
    4.2 模型的定义
    4.3 模型的参数估计
        4.3.1 模型参数初始化
        4.3.2 模型训练的过程
    4.4 识别过程
    4.5 实际应用中模型的混合数问题
    4.6 系统实现与仿真结果分析
        4.6.1 实现条件
        4.6.2 基于动态特征△MFCC+△△MFCC的方言鉴别实验
        4.6.3 实验结果及其分析
        4.6.4 基于组合动态特征参数的方言鉴别仿真实验及分析
    4.7 本章小结
第五章 基于SOM神经网络分类和高斯混合模型的方言辨识方法
    5.1 引言
    5.2 改进思路
    5.3 自组织映射神经网络(SOM)分类
        5.3.1 自组织映射神经网络(SOM)概念和算法
        5.3.2 基于SOM神经网络的语音特征参数分类过程
    5.4 建模及辨识过程
    5.5 仿真结果及分析
        5.5.1 分类数对辨识率的影响
        5.5.2 子系统模型混合数对辨识率的影响
    5.6 本章小结
第六章 总结和展望
参考文献
附录 读研期间发表论文情况
致谢

(7)GPS精密单点定位和高精度GPS基线网平差研究及其软件实现(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 引言
    1.2 研究背景及现状
    1.3 课题来源及研究意义
    1.4 主要研究工作
第二章 GPS 精密单点定位基础
    2.1 IGS 轨道和钟差产品概述
    2.2 GPS 的观测模型及其线性组合
        2.2.1 GPS 观测方程
        2.2.2 观测值的线性组合
    2.3 PPP 的主要误差源及改正模型
        2.3.1 与卫星有关的误差
        2.3.2 与信号传播有关的误差
        2.3.3 与接收机有关的误差
    2.4 精密单点定位的基本原理及其关键技术
第三章 IGS 精密星历卫星钟差精度分析研究
    3.1 引言
    3.2 常规卫星钟差模型分析
    3.3 频谱分析
        3.3.1 频谱分析原理及过程
        3.3.2 对拟合模型进行显着周期项改正
        3.3.3 白噪声检验
    3.4 算例及结论
        3.4.1 算例分析
        3.4.2 结论与建议
第四章 GPS 精密单点定位数学模型研究
    4.1 引言
    4.2 参数估计方法
        4.2.1 序贯最小二乘法
        4.2.2 卡尔曼滤波参数估计
    4.3 PPP 的观测模型和随机模型
        4.3.1 观测模型
        4.3.2 随机模型
    4.4 PPP 的数据预处理
    4.5 几种自适应滤波模型及其在PPP 中的应用
        4.5.1 基于预报残差的附加衰减因子动态卡尔曼滤波
        4.5.2 自适应选权滤波
        4.5.3 抗差自适应滤波
    4.6 算例分析
        4.6.1 算例1
        4.6.2 算例2
        4.6.3 算例3
    4.7 本章小结
第五章 GPS 动态定位序贯平差统一模型
    5.1 引言
    5.2 序贯平差数学模型
    5.3 GPS 动态定位中的序贯平差模型
        5.3.1 观测方程
        5.3.2 固定参数序贯模型
        5.3.3 变参数的序贯平差模型
        5.3.4 参考星变化的序贯平差模型
    5.4 推导序贯平差统一模型
    5.5 算例分析
    5.6 结论
第六章 高精度GPS 基线网概述
    6.1 背景
    6.2 国内外高精度GPS 基线网的概况
    6.3 国内外高精度GPS 网数据处理方法的研究现状
    6.4 本文高精度GPS 网数据处理研究的意义和主要内容
第七章 高精度GPS 网的平差方法和参考基准研究
    7.1 概述
    7.2 高精度GPS 网的数据处理方法
        7.2.1 经典平差
        7.2.2 伪逆平差
        7.2.3 拟稳平差
        7.2.4 顾及参数先验信息的平差
    7.3 高精度GPS 网的平差基准及其几何意义
        7.3.1 固定基准(又称经典基准)
        7.3.2 重心基准(又称伪逆基准)
        7.3.3 拟稳基准
    7.4 高精度GPS 网参考基准统一及其转换关系
        7.4.1 基线处理阶段统一基准
        7.4.2 网平差处理阶段统一基准
    7.5 本章小结
第八章 高精度GPS 形变监测网平差数学模型
    8.1 高精度GPS 形变监测网平差的函数模型
    8.2 同步环基线相关性讨论及独立基线选择方案
        8.2.1 同步环基线相关性讨论
        8.2.2 同步环独立基线选择方案
    8.3 随机模型
        8.3.1 同步环的随机模型
        8.3.2 整网的随机模型
    8.4 附加系统参数的平差基准模型
        8.4.1 带有系统参数的重心基准
        8.4.2 带有系统参数的固定基准
        8.4.3 带有系统参数的拟稳基准
        8.4.4 其他情况
    8.5 附加系统参数的秩亏自由网平差
    8.6 系统参数对坐标估值的影响
    8.7 系统参数显着性检验
    8.8 高精度GPS 网平差中的粗差分析与处理
        8.8.1 GPS 基线网的粗差分析
        8.8.2 GPS 基线网的抗差估计
        8.8.3 GPS 网整体平差中的方差分量估计
    8.9 本章小结
第九章 高精度GPS 网平差算例结果与分析
    9.1 算例数据描述
    9.2 分析方案选取
    9.3 算例分析
        9.3.1 算例1
        9.3.2 算例2
        9.3.3 算例3
        9.3.4 算例4
        9.3.5 算例5
    9.4 本章小结
第十章 软件设计与实现
    10.1 P3TEXT 精密单点定位软件
        10.1.1 基本思路及主界面
        10.1.2 程序框架
        10.1.3 主要菜单项展开
    10.2 HPGPSADJ 高精度GPS 网平差软件
        10.2.1 基本思路及主界面
        10.2.2 程序框架
        10.2.3 主要菜单项展开
    10.3 本章小结
总结与展望
    本文总结
    工作展望
参考文献
攻读学位期间取得的研究成果
致谢

(9)基于FFT-ACF和候选值估计的基音周期提取方法(论文提纲范文)

1 基音周期候选值估计函数
2 基音周期候选值的后处理
    2.1 候选值的选取
    2.2 最佳基音周期候选值的确定
        2.2.1 一次均值法
        2.2.2 二次均值法
        2.2.3 语音基音周期的确定
3 实验结果
结 语

(10)基于汉语元音映射的说话人识别技术研究(论文提纲范文)

摘要
ABSTRACT
目录
第一章 绪论
    1.1 引言
    1.2 说话人识别技术的应用
    1.3 说话人识别技术的特点和难点
        1.3.1 说话人发音的不稳定性
        1.3.2 声音的掩饰和模仿
        1.3.3 采集设备与环境影响
    1.4 国内外研究现状和发展方向
    1.5 研究思路和创新点
        1.5.1 研究思路
        1.5.2 主要创新点
    1.6 论文结构
第二章 说话人识别相关技术
    2.1 引言
    2.2 说话人识别原理
        2.2.1 说话人识别的分类
        2.2.2 说话人识别系统结构
        2.2.3 说话人识别系统性能的评价
    2.3 语音的产生和感知
        2.3.1 语音的产生
        2.3.2 语音的感知
    2.4 语音特征参数的提取
        2.4.1 基音周期
        2.4.2 线性预测倒谱系数
        2.4.3 美尔频率标度倒谱系数
    2.5 说话人识别模型
        2.5.1 K-最近邻方法
        2.5.2 矢量量化
        2.5.3 高斯混合模型
        2.5.4 人工神经网络
    2.6 本章小结
第三章 汉语元音映射技术
    3.1 引言
    3.2 汉语音节结构和韵母声学特征
        3.2.1 汉语语音基本特征
        3.2.2 韵母分析
    3.3 汉语元音特征映射技术
    3.4 基于汉语元音映射的说话人识别框架
    3.5 本章小结
第四章 基于元音映射说话人识别中的预处理技术
    4.1 引言
    4.2 基于频域能量分布分析的元音帧提取算法
        4.2.1 理论和算法
        4.2.1.1 含有MEL标度映射的频域能量分析方法
        4.2.1.2 基于能量和过零率的元音帧提取
        4.2.1.3 阈值的自适应策略
        4.2.1.4 算法步骤
        4.2.2 实验结果与数据分析
        4.2.2.1 单字音中的元音帧提取实验
        4.2.2.2 连续语音中的元音帧提取实验
    4.3 基于线性预测残差倒谱的基音检测算法
        4.3.1 算法描述
        4.3.1.1 倒谱法
        4.3.1.2 线性预测残差
        4.3.1.3 谐波积谱原理
        4.3.1.4 CBHPS算法
        4.3.2 实验和分析
    4.4 本章小结
第五章 基于汉语元音映射的说话人识别模型
    5.1 引言
    5.2 基于分类特征的矢量量化说话人识别研究
        5.2.1 矢量量化说话人识别原理
        5.2.1.1 特征参数的选取
        5.2.1.2 汉语元音特征的分类与识别
        5.2.1.3 矢量量化技术
        5.2.2 实验结果与数据分析
        5.2.2.1 矢量量化码本比较实验
        5.2.2.2 识别结果与分析
    5.3 基于仿生模式识别的说话人识别方法
        5.3.1 基于仿生模式识别的识别算法
        5.3.1.1 仿生模式识别理论
        5.3.1.2 改进的最近邻覆盖算法
        5.3.1.3 识别算法
        5.3.1.4 基于分层采样的KNN算法
        5.3.2 实验数据与分析
        5.3.2.1 算法性能实验
        5.3.2.2 针对连续语音的实验结果
        5.3.2.3 基于环域的分层采样算法实验
    5.4 基于神经网络集成的说话人识别算法
        5.4.1 基于单元音分类的神经网络集成
        5.4.1.1 研究动机
        5.4.1.2 系统结构和集成策略
        5.4.1.3 神经网络的训练方法
        5.4.2 仿真实验与数据分析
        5.4.2.1 针对单元音发音的实验结果
        5.4.2.2 针对连续语音的实验结果
        5.4.2.3 集成方法的对比
    5.5 本章小结
第六章 说话人识别系统中的噪声处理技术
    6.1 引言
    6.2 基于加权特征补偿变换的鲁棒性说话人识别方法
        6.2.1 加权特征补偿变换分析
        6.2.1.1 帧信噪比与加权因子
        6.2.1.2 加权特征补偿变换的提出
        6.2.2 鲁棒说话人识别仿真系统
        6.2.2.1 预处理和特征提取
        6.2.2.2 高斯混合模型的建立与识别
        6.2.3 仿真实验与结果分析
        6.2.3.1 仿真系统语音库
        6.2.3.2 加权因子仿真实验
        6.2.3.3 基于加权特征补偿变换的说话人识别方法的仿真研究
    6.3 基于背景噪声模型估计的自适应说话人识别技术
        6.3.1 语音帧/非语音帧的提取
        6.3.2 背景噪声模型估计和说话人特征提取
        6.3.3 说话人识别系统
        6.3.3.1 预处理和特征提取
        6.3.3.2 高斯混合模型的建立与识别
        6.3.4 仿真实验与结果分析
        6.3.4.1 仿真系统语音库
        6.3.4.2 基于背景噪声模型估计的自适应说话人识别技术的仿真研究
    6.4 小结
结束语
参考文献
致谢
附录

四、一种高精度的基音提取方案(论文参考文献)

  • [1]阵列麦克风语音采集增强系统设计与实现[D]. 吴聪. 电子科技大学, 2019(12)
  • [2]基于Android平台的听曲绘谱研究及其实现[J]. 袁帅,熊绍潘,付天纯. 电子世界, 2018(07)
  • [3]基于安卓的乐音识别及MIDI文件输出的研究和实现[D]. 童文. 中国科学院大学(工程管理与信息技术学院), 2013(08)
  • [4]一种高效的基音检测与评估算法[J]. 王民,任雪妮,孙洁. 计算机工程与应用, 2014(14)
  • [5]基于统计特性的汉语方言辨识方法研究[D]. 王岐学. 湖南师范大学, 2010(10)
  • [6]方言比较的特征提取与矩阵分析[A]. 魏明果. 2009系统仿真技术及其应用学术会议论文集, 2009
  • [7]GPS精密单点定位和高精度GPS基线网平差研究及其软件实现[D]. 黄观文. 长安大学, 2009(08)
  • [8]一种基于线性预测残差倒谱的基音检测算法[J]. 钱博,李燕萍,唐振民,徐丽敏. 计算机工程与应用, 2007(32)
  • [9]基于FFT-ACF和候选值估计的基音周期提取方法[J]. 徐明,陈知困,黄云森. 深圳大学学报(理工版), 2007(04)
  • [10]基于汉语元音映射的说话人识别技术研究[D]. 钱博. 南京理工大学, 2007(12)

标签:;  ;  ;  ;  ;  

一种高精度音高提取方案
下载Doc文档

猜你喜欢