新“声”报道!云知声TTS上线方言合成功能
创始人
2025-07-05 06:21:03
0

“少小离家老大回,乡音无改鬓毛衰。”

方言,不仅是地域风物的承载,更是人与故土联结的情感纽带。随着人们对智能语音需求的越来越多元化,更具乡土气息、更具情感联结的方言语音正成为智能语音合成的热门方向。

近期,云知声基于语音合成技术,上线方言合成功能,以 AI 传递乡音乡情。

AI遇上方言,“智”取乡音一片

伴随普通话的推广普及,以及城市流动人口的增加,方言正悄悄退出人们的生活,一些地方方言甚至濒临失传的境遇。让方言走进日常,以更多样化的形式“活”起来,已成为当前方言保护工作的重中之重。

为助力乡音传续,同时也更好满足人们对智能语音的多样化需求,云知声基于最新语音合成深度学习技术,全面学习方言音色、风格,合成贴近真人的“数字乡音”,让人工智能的科技温度浸润到多个智能语音应用场景——

对智能家居而言,用熟悉的乡音和用户对话,既能够慰藉用户身居异地的思乡之情,也有助于打造产品差异化优势,更好开拓下沉市场;在智能客服领域,很多老人、弱势群体既不会讲普通话,也听不懂普通话,方言的引入能够大大减少双方沟通成本,提高服务效率;直播间里,搞笑幽默的方言既能够让直播内容更有趣味性,也迎合了受众听乡音、知乡情的心理需求,增加了用户黏性……

迁移学习,让方言合成成为现实

让人工智能“说”出一口普通话已然不易,合成方言更是难上加难。

一直以来,方言合成存在两大难点:

一是难以获取大量高质量的语音数据和对应的文本信息,二是不同地区的方言之间相互独立,在音调、声母、韵母等方面有所差异,很难进行精确的发音和韵律标注,这无疑增加了数据标注和技术开发的难度。

利用迁移学习技术,云知声解决了以上问题,得以在短时间内将单个发音人的音色合成粤语、四川话等方言以及英语等外语。

针对部分方言的特性,云知声先是通过超大规模的高质量普通话数据,训练得到端到端声学模型和神经网络声码器等基础模型;然后,利用较大规模低质量的方言数据对基础模型进行迁移学习,使其能更好地适应方言的语音特点;最后,使用少量较高质量的方言数据再次对基础模型进行迁移学习,最终训练得到方言合成模型。

在迁移学习技术的支持下,云知声TTS已实现粤语、四川话及纯正美音的合成,可覆盖人机对话、影视配音、直播带货等多种场景需求,助力更多客户实现方言及个性化声音解决方案的落地。

通过方言合成技术,云知声数字人也得以开口说“乡音”,熟练“掌握”多种方言,甚至做到流畅切换。

除了方言合成,此次,云知声TTS还上线了rap合成功能,即使用户五音不全,也能秒变说唱歌手,轻松玩转freestyle。

从智能家居到呼叫中心,从生活娱乐到办公学习,云知声智能语音技术正不断打破场景限制,让AI以更丰富的声音形象融入日常。

目前,云知声TTS已上线28种发音人音色、64种音色风格,极大程度上满足了用户的多场景合成语音应用需求。

面向未来,云知声TTS将继续解锁更多音色、风格,覆盖更多应用场景,全力满足客户的个性化、差异化定制需求。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...