发布日期:2026-06-25 09:23 点击次数:195

惟有上传3秒音频,AI就能让你的声息以母语者的发音水平,声情并茂地流利说出14种谈话。这不是科幻电影里的桥段,而是一款“王炸级”国产开源TTS模子的真是身手。近日,据南边+记者从网易有说念方面了解到,网易有说念「子曰4.0」TTS语音合成引擎Confucius4-TTS 照旧发达发布。据先容,这是业内首个相沿14种谈话跨语种无口音、且无需参考文本即可完谚语音克隆的开源模子。该模子在跨语种语音克隆、免参考文本建模、情谊韵律移动和腹地化部署等要津维度上达到国际最前沿水平,为多语种本体生成、数字东说念主配音、跨谈话素养、短剧出海和大家化传播提供了更低门槛的国产化技巧底座,现已面向大家用户全量开源。

据悉,现在网易有说念Confucius4-TTS已全面相沿中语、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种谈话的当然流利抒发。其中枢上风在于通过单段音频输入,模子即可捕捉原声特点,并将其回荡为纵情方针谈话输出,且发音生动当然,绝对摒除跨语种合成中常见的违和口音。更要津的是,模子还能自动提真金不怕火参考音频里的情谊特征——你不满地说一句话,合成出来的外语亦然不满的口吻,语调、韵律、花式齐全移动。
值得柔和的是,网易有说念已将该模子全量开源。Confucius4-TTS弃取Apache开源条约,面向大家建设者绽开齐全模子权重和配套用具链,商用莫得实现。建设者不错下载54G齐全资源包,欧美亚洲第一页腹地离线部署启动。正如业内建设者所评价:“这次开源提供了齐全的模子权重而非只是绽开API,54GB的资源包相沿腹地离线启动,为口播配音、数字东说念主等阁下场景提供了极具性价比的高效管制决策。”

在业内东说念主士看来,Confucius4-TTS 在强大场景中齐具备阁下的价值。其中在跨境本体赛说念,短视频、短剧创作家只需录制一次原声,就能批量生成14国谈话配音,一个东说念主就能完成多语种国际本体制作。数字东说念主行业不错调处捏造主播的音色,毋庸为不同语种再行录制声线,大幅裁汰制作老本。灵敏说明限制能生成生动的多语种发音素材,打造多语种AI外教。出海企业和文旅机构可快速完成多语种语音播报和品牌宣传片的腹地化配音。
网易有说念示意,但愿通过全量开源Confucius4-TTS,裁汰语音克隆和情谊合成的门槛,让每一个声息齐能超越谈话的范畴,让中国AI声息实在走向天下。现在,Confucius4-TTS已在GitHub面向大家建设者开源,建设者可径直下载模子权重,腹地离线部署,商用无实现。
南边+记者 叶丹