查看原文
其他

Seed-TTS:文本转音频和真人无差了

不坑 不坑老师
2024-09-01

2020年左右,频频给大家分享微课制作的一些技巧。

当时很多人想要接近真人的文本转音频功能,来解决自己普通话不标准的问题。

那时Edge浏览器在微软Azure的加持下,网页可以用接近真人的“晓晓”来朗读。4年前,我发了一篇文章教大家如何用Edge浏览器来实现文本转音频:《干货 | 又一个免费的文字转语音妙招!关键是免费!》。

后来,各种文本转音频功能如雨后春笋。很多第三方网站接入Azure接口,在线实现文本转音频功能。不坑盒子也在前面一段时间,接入了微软多语言版的晓晓,朗读非常逼真。

从去年开始,生成式人工智能席卷网络,声音的生成也得到了颠覆性的升级。

前有GPT-SoVITS,帮助大家克隆各种声音,网友实现了“看剧自由”,想看什么自己剪;

接下来又冒出来一个ChatTTS,让文本转音频更加真实;

最近几天,全网都在传字节又推出了Seed-TTS,更是把文本转音频推到了以假乱真的地步。

围观Seed-TTS

Seed-TTS是最近字节推出的文本转音频项目,还热乎着呢~

开源地址:https://github.com/BytedanceSpeech/seed-tts-eval

目前还只有开源项目和官方的一些示例音频,网上还没有看到用它来生成音频的案例,包括本文,也是用的官方示例音频。

由于咱们粉丝中基础小白中较多,就不以“推理过程”、“可控性”等分类来给大家展示,直接给大家展示应用场景,可能更通俗易懂一点。

非常自然的声音

听听这些声音,你有没有心动~🫢


不同的语气

针对同一个话题的讲述,来试试同一角色的不同语气。


有声书

面对不同题材的小说,用不同的声音读出来效果更佳。

总结

遗憾的是现在还不能亲自体验生成自己文本,但未来可期。相信不久后,字节旗下的各种软件中的文本转音频功能,在Seed-TTS的加持下,获得更加真实的效果

而那些曾经担心自己普通话不好的人,在它的帮助下,人人都可以制作自己的播客了。

期待……

- end -

公众号篇幅有限,关于人工智能、高效办公,近期将上线详细的课程,邀请大家加入不坑老师付费社群,更加深入探讨。

继续滑动看下一个
不坑老师
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存