网易有道上线“易魔声” 开源语音合成引擎 用户可免费下载使用
创始人
2025-07-06 09:11:04
0

11月10日,网易有道正式上线“易魔声”开源语音合成(TTS)引擎,所有用户可免费在开源社区GitHub进行下载使用,通过其提供的web界面及批量生成结果的脚本接口,轻松实现音色的情感合成与应用。

据悉,“易魔声”是一款有道自研TTS引擎,目前支持中英文双语,包含2000多种不同的音色,更有特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

(GitHub开源界面)

在过往的回忆里,总会有一些特别的声音,比如:偶像的声音激励人心、妈妈的声音让我们一秒回忆起小时候……声音,作为语言维度的一种,总是蕴含着人类充沛的情感表达。而富有情感的合成语音,是能够为应用和内容增色的AI功能。有道“易魔声”则为开发者和内容创作者提供了一些解决思路——只需简单通过在文本中加入情感的描述提示,就可以自由合成符合自己需求的带有情感的语音,比传统TTS更加自然逼真。

随着基于GAN等现代AI技术的语音能力越来越成熟,实现一个质量较高的TTS系统的门槛越来越低。但即使如此,中英双语的高质量、现代TTS模块还是不易找到,要在自己的应用与内容中加入高逼真度且高度可控的语音,特别是中英双语的语音,也依然比较麻烦。

“目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量TTS的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议。”网易有道CEO周枫介绍道。

有道在 TTS 领域耕耘多年,始终以场景为导向,不断推动技术落地,为用户带来诸多高效便捷的应用和产品。例如,推出教育领域首个明星语音功能,将王源、欧阳娜娜、马伯骞等明星的声音内置在网易有道词典中,陪伴用户共同学习英语;提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制;近期推出的 Hi Echo 虚拟人口语私教,借助有道「子曰」教育大模型、语音和虚拟人技术,帮助用户随时随地轻松练习英语口语。

从2008年起,网易有道便开始布局AI,多年来一直致力于基于Transformer模型进行创新和应用,并在神经网络翻译、计算机视觉、高性能计算、智能语音AI技术等方面都具备了核心技术,为应用的实际落地打下了坚实的技术基础。

此外,用户还可通过有道智云官网,体验已经对开发者通过API等形式开放的文本和图像翻译、文字和各类图片识别、作文批改等各类AI技术。

有道智云AI开放平台,是网易有道旗下一站式人工智能服务提供商,为开发者、企业和政府机构等提供自然语言翻译、文字识别、OCR、语音识别等服务以及行业解决方案,致力于提供安全、可靠和高效的云服务。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...