news 2026/4/23 12:56:26

人工智能应用-机器听觉:7. 统计合成法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能应用-机器听觉:7. 统计合成法

2000 年以后,研究者提出了基于统计模型的语音合成方法。与拼接法保留原始录音片段不同,统计合成法将语料库中每个音素的语音片段“总结”成一个称为隐马尔可夫模型(HMM)的统计模型。在前一节中讨论过,HMM 模型可以描述发音的动态过程,因此可以用来合成声音。具体而言,首先用 HMM 模型生成每个音素的声门和声道的参数,再利用声码器(源-滤波模型)从这些参数合成语音。如图30.9所示,对每个音素(“n”“i”“h”“ao”)分别建立 HMM 模型,利用这些模型生成声门和声道参数,再通过声码器读取这些参数并合成语音。

统计模型的一个优势在于其可扩展性。通过调整模型参数,合成系统可以改变发音的特性。例如,只需少量训练数据就可以让模型模拟不同人的声音,或调整语音的情感表现。

然而,HMM 学习的是声音的平均特性,无法模拟真实语音中丰富的动态特性。因此,基于HMM 生成的语音通常较为平滑,缺乏真实语音的动态感。

统计合成法示意图

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 11:35:30

文心大模型助力人工智能数据质量评估,“以评促建”为人工智能产业发展注入新动力

2026年1月22日,百度“文心Moment”大会在上海举办,中国信息通信研究院人工智能研究所所长魏凯出席活动并介绍中国信通院高质量数据集评测实践,发布“动静结合”人工智能数据质量评估能力。文心大模型深度支撑基于模型性能的动态数据质量指标体…

作者头像 李华
网站建设 2026/4/23 12:50:57

学术导航仪:用书匠策AI解锁期刊论文写作的“超维空间”

在学术江湖中,期刊论文是研究者攀登的“险峰”,既要精准选题、逻辑自洽,又要语言严谨、格式规范。然而,传统写作模式常让人陷入“文献迷宫”“逻辑黑洞”或“格式泥潭”。如今,一款名为书匠策AI的智能工具(…

作者头像 李华
网站建设 2026/4/23 12:56:04

【小程序毕设源码分享】基于springboot+小程序的同城钓鱼社交APP的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华