当前位置:首页 > 科技  > 软件

11个优秀开源TTS引擎

来源: 责编: 时间:2024-01-03 11:36:19 386观看
导读TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的

TTS引擎用于实现文本到语音的转换。随着人工智能的普及以及数字设备应用的增加,相关系统对语音识别以及文语转换技术日益依赖,TTS正在变得越来越重要。a6n28资讯网——每日最新资讯28at.com

在这项技术的帮助下,可以将文本内容转换为录音。可以帮助视觉障碍的人理解文本内容,可以让开车的人听取一个文本工作报告,甚至模拟某个人的声音播报一段内容、演唱一个歌曲,实现虚拟主播、虚拟歌手。a6n28资讯网——每日最新资讯28at.com

本文主要查找收集了一些较好的开源TTS引擎。这些项目有助于我们更加了解TTS的功能。a6n28资讯网——每日最新资讯28at.com

a6n28资讯网——每日最新资讯28at.com

1.CoQui TTS

https://github.com/coqui-ai/TTSa6n28资讯网——每日最新资讯28at.com

这是一个在研究和生产中经过了实战考验的TTS深度学习工具包,可以以200毫秒的延迟进行流传输,支持13种语言(包括中文)。a6n28资讯网——每日最新资讯28at.com

2.mozilla TTS

https://github.com/mozilla/TTSa6n28资讯网——每日最新资讯28at.com

TTS是一个用于文本到语音生成的高级库。旨在实现易于训练、高速度和高质量的最佳平衡。 提供预训练模型,以及用于测量数据集质量的工具,支持用于产品和研究的20多种语言,包括支持中文。a6n28资讯网——每日最新资讯28at.com

3.OpenTTS

https://github.com/synesthesiam/openttsa6n28资讯网——每日最新资讯28at.com

OpenTTS是TTS最有效的开源模型之一。因为该模型支持包括中文在内的多种语言。a6n28资讯网——每日最新资讯28at.com

4.MaryTTS

https://github.com/marytts/maryttsa6n28资讯网——每日最新资讯28at.com

MARY Text-to-Speech 语音合成是一个多语言TTS平台,支持英语(英国和美国)、法语、德语、意大利语、俄语等语言。a6n28资讯网——每日最新资讯28at.com

产品特点:a6n28资讯网——每日最新资讯28at.com

  • 使用预处理技术,如tokenizer和数值扩展。
  • 它采用多线程网络架构,并行处理多个请求。
  • 它本质上是灵活的,因此您可以使用纯Java模型和外部模型。
  • 它使用XML结构来提高透明度,并且对于普通用户来说易于理解。

5.eSpeak

https://github.com/espeak-ng/espeak-nga6n28资讯网——每日最新资讯28at.com

eSpeak是一个紧凑的开源TTS引擎,可运行于Windows和Linux。支持100多种语种和语音(包括中文普通话)。a6n28资讯网——每日最新资讯28at.com

产品特点:a6n28资讯网——每日最新资讯28at.com

  • 这个平台可以很容易地完成文本到语音的转换。这有助于系统理解文本的含义。
  • 它带有两个合成器:eSpeakinG合成器,通过声音添加技术转换元音和响亮的辅音,以完成声音。Klatt合成器使用类似的技术,但使用减法合成。它使用数字滤波器来理解辅音、元音和响音之间的区别。
  • 因为它的差异化技术和将文本转换为语音的速度优势,这个工具在2010年被谷歌翻译使用。
  • 声音的音质清晰悦耳。

6.Mimic

https://github.com/MycroftAI/mimic3a6n28资讯网——每日最新资讯28at.com

Mimic是一个快如闪电的开源TTS引擎。a6n28资讯网——每日最新资讯28at.com

产品特点:a6n28资讯网——每日最新资讯28at.com

  • 由于它基于FLITE技术,您可以自定义语音的声音。
  • 它是一个低延迟平台,并且只占用少量的资源。
  • 它可以在Linux、Android和Windows上无缝运行。

目前,该工具正在为患有语言障碍的人带来逼真的声音。a6n28资讯网——每日最新资讯28at.com

a6n28资讯网——每日最新资讯28at.com

7.CMU Flite TTS

https://github.com/festvox/flitea6n28资讯网——每日最新资讯28at.com

Festival Lite通常被称为Flite。它是一个小型的运行时引擎,被认为是最快的TTS引擎之一。a6n28资讯网——每日最新资讯28at.com

由于它是一个开源引擎,并且是免费的,可以基于这个项目做许多自定义功能。因此,许多公司都选择了这个TTS引擎。a6n28资讯网——每日最新资讯28at.com

核心特点:a6n28资讯网——每日最新资讯28at.com

  • 可以用于小型和大型文件。
  • 它是线程安全的,其最新版本提供了一个轻松的TTS转换。
  • 它与Windows、Linux和Android兼容。
  • 它还提供多种语言版本。

a6n28资讯网——每日最新资讯28at.com

8.MBROLA

https://github.com/numediart/MBROLAa6n28资讯网——每日最新资讯28at.com

MBROLA是Multi-Band Resynthesis OverLap Add的缩写,也是最常用的开源TTS引擎之一。它支持多种语言。a6n28资讯网——每日最新资讯28at.com

功能特点:a6n28资讯网——每日最新资讯28at.com

  • 提供多语种数据库。
  • 它对于内部文本到语音的转换非常有用。
  • 它以前是一个非商业软件,但现在作为开源TTS引擎推出。
  • 它提供了令人愉快的音质,具有一致性、准确性的声音音高。

a6n28资讯网——每日最新资讯28at.com

9.mandarin-tts

https://github.com/ranchlai/mandarin-ttsa6n28资讯网——每日最新资讯28at.com

这是一个模块化的中文普通话TTS语音合成框架,旨在支持研究和快速产品开发。a6n28资讯网——每日最新资讯28at.com

主要功能包括:a6n28资讯网——每日最新资讯28at.com

  • 所有模块都可通过YAML配置,
  • 支持并可配置说话者嵌入/韵律嵌入/多流文本嵌入,
  • 适配器支持各种声码器(VocGAN、hifi-GAN、waveglow、melGAN),从而可以容易地进行不同声码器之间的比较,
  • 支持持续时间/音调/能量方差预测器,并且可以容易地添加其他方差,

a6n28资讯网——每日最新资讯28at.com

10.FCH-TTS

https://github.com/atomicoo/FCH-TTSa6n28资讯网——每日最新资讯28at.com

一个快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语。a6n28资讯网——每日最新资讯28at.com

11.rhasspy piper

https://github.com/rhasspy/pipera6n28资讯网——每日最新资讯28at.com

a6n28资讯网——每日最新资讯28at.com

piper是一个快速的本地语音合成系统,并针对Raspberry Pi 4(树莓)进行了优化。 支持包括中文在内的多种语言。a6n28资讯网——每日最新资讯28at.com

使用DEMO如:a6n28资讯网——每日最新资讯28at.com

echo 'Welcome to the world of speech synthesis!' | /  ./piper --model en_US-lessac-medium.onnx --output_file welcome.wav

本文链接:http://www.28at.com/showinfo-26-56598-0.html11个优秀开源TTS引擎

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Prometheus Go client library 详解

下一篇: 去测试化真的可行吗?

标签:
  • 热门焦点
  • Mate60手机壳曝光 致敬自己的经典设计

    8月3日消息,今天下午博主数码闲聊站带来了华为Mate60的第三方手机壳图,可以让我们在真机发布之前看看这款华为全新旗舰的大致轮廓。从曝光的图片看,Mate 60背后摄像头面积依然
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 携众多高端产品亮相ChinaJoy,小米带来一场科技与人文的视听盛宴

    7月28日,全球数字娱乐领域最具知名度与影响力的年度盛会中国国际数码互动娱乐展览会(简称ChinaJoy)在上海新国际博览中心盛大开幕。作为全球领先的科
  • 四年持续更迭坚持探索行业无人之境,HarmonyOS 4带来五大升级多项创新

    除了华为每年新发布的旗舰手机系列,上亿花粉更加期待鸿蒙系统每次的跨版本大更新。8月4日,HarmonyOS 4于HDC 2023正式发布,这也是该系统历经四年的再
Top