当前位置:首页 > 技术学院 > 基础知识科普站
[导读]语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。

语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。

语音合成是利用电子计算机和一些专门装置模拟人,制造语音的技术。

专业技术语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进,大规模应用指日可待。语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。我们所说的“让机器像人一样开口说话”与传统的声音回放设备(系统)有着本质的区别。传统的声音回放设备(系统),如磁带录音机,是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。

转换系统文语转换系统实际上可以看作是一个人工智能系统。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。如《声道频域特性(频率响应图)》所示,显示了一个完整的文语转换系统示意图。文语转换过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。其中第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。因此一般说来,文语转换系统都需要一套复杂的文字序列到音素序列的转换程序,也就是说,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。

语音合成技术的研究已有两百多年的历史,但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。在语音合成技术的发展过程中,早期的研究主要是采用参数合成方法,后来随着计算机技术的发展又出现了波形拼接的合成方法。

参数合成在语音合成技术的发展中,早期的研究主要是采用参数合成方法。值得提及的是Holmes的并联共振峰合成器(1973)和Klatt的串/并联共振峰合成器(1980),只要精心调整参数,这两个合成器都能合成出非常自然的语音。最具代表性的文语转换系统当数美国DEC公司的DECtalk(1987)。但是经过多年的研究与实践表明,由于准确提取共振峰参数比较困难,虽然利用共振峰合成器可以得到许多逼真的合成语音,但是整体合成语音的音质难以达到文语转换系统的实用要求。自八十年代末期至今,语言合成技术又有了新的进展,特别是基音同步叠加(PSOLA)方法的提出(1990),使基于时域波形拼接方法合成的语音的音色和自然度大大提高。九十年代初,基于PSOLA技术的法语、德语、英语、日语等语种的文语转换系统都已经研制成功。这些系统的自然度比以前基于LPC方法或共振峰合成器的文语合成系统的自然度要高,并且基于PSOLA方法的合成器结构简单易于实时实现,有很大的商用前景。国内的汉语语音合成研究起步较晚些,但从八十年代初就基本上与国际上研究同步发展。大致也经历了共振峰合成、LPC合成至应用PSOLA技术的过程。在国家863计划,国家自然科学基金委,国家攻关计划,中国科学院有关项目等支持下,联想佳音(1995);清华大学的TH_SPEECH (1993);中国科技大学的KDTALK(1995)等系统。这些系统基本上都是采用基于PSOLA方法的时域波形拼接技术,其合成汉语普通话的可懂度、清晰度达到了很高的水平。然而同国外其它语种的文语转换系统一样,这些系统合成的句子及篇章语音机器味较浓,其自然度还不能达到用户可广泛接受的程度,从而制约了这项技术的大规模进入市场。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

中国 北京,2025 年 8 月 28 日 —— 全球领先的数学计算软件开发商 MathWorks 今日宣布,香港中文大学(下文简称:港中大)一支研究团队采用 MATLAB®、Medical Imaging Toolbo...

关键字: 生物医学 计算机

加利福尼亚州圣克拉拉 — 2025 年 8 月 25 日 — NVIDIA 今日宣布 NVIDIA Jetson AGX Thor™ 开发者套件和量产级模组现已发售。这是一款功能强大的新一代机器人计算机,旨在为制造、物流...

关键字: 机器人 计算机 AI

北京2025年8月18日 /美通社/ -- 2025年8月,软通动力集团一项关键决策引发行业瞩目——以自有资金8亿元向全资子公司软通计算机有限公司完成实缴增资,使其注册资本增加至23亿元。这笔战略注资不仅彰显集团对信创核...

关键字: AI 硬件 计算机 智能化

北京2025年7月31日 /美通社/ -- 近日,权威咨询机构德本咨询重磅发布"2025中国信创PC市场影响力品牌TOP 10"榜单。软通计算机凭借其迅猛的发展势头、领先的技术整合能力及显著的市场表现...

关键字: 计算机 TOP PC PC市场

我想把整个红外数据库,数千个远程文件分布在数百个文件夹中,打包到一个手持设备中。

关键字: 红外通信 M5Stack 计算机

工控机,全称为工业控制计算机,是一种专为工业环境设计并制造的计算机设备。为增进大家对工控机的认识,本文将对工控机的选择方法予以介绍,以便大家在选择工控机时有所依据。如果你对工控机具有兴趣,不妨继续往下阅读哦。

关键字: 工控机 指数 计算机

为增进大家对工控机的认识,本文将对工控机的变成方法以及工控机对设备的控制予以介绍。

关键字: 工控机 指数 计算机

6月12日消息,据媒体报道,美国宾夕法尼亚州立大学领导的研究团队首次利用二维材料成功制造出一台可执行简单操作的计算机。这一突破为开发更薄、更快、更节能的电子产品奠定了重要基础。

关键字: 非硅二维材料 计算机

上海 2025年6月4日 /美通社/ -- 环旭电子作为全球电子设计与制造服务领导厂商,近年来透过联合设计制造服务模式(Joint Design Manufacturing,JDM),协助知名品牌客户开发出兼具强固性与...

关键字: 电子 计算机 BSP DESIGN

北京 2025年5月20日 /美通社/ -- 近日,紫光计算机宣布推出全新UNIS L3893 G3高性能笔记本,该笔记本电脑不仅搭载了全国产兆芯开先KX-7000处理器,而且在电脑外形、屏幕素质、安全性等方面的设计也...

关键字: 处理器 紫光 计算机 笔记本电脑
关闭