人声模拟和克隆，今天我蛋疼的时候发现了神奇的东西

( 11 )

gggccc44

1234

#1 18-7-27 01:02 …

人声模拟和克隆，今天我蛋疼的时候发现了神奇的东西

本帖最后由 gggccc44 于 18-7-27 01:04 编辑

起因是看到有人帖子说到“DIY WAVES服务器”，然后关键字搜索发现了这个文章
百度语音系统Deep Voice新突破可在几秒内克隆你的声音

然后发现居然有3个可以做到模拟克隆声音

Adobe Project VoCo，音频2016已经有人发过贴了http://www.audiobar.net/forum.ph ... 6485&highlight=VoCo，不过这玩意只是演示过并没有推出

谷歌 WaveNet
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
貌似这个是可能可以用的，等下再说

然后就是上面帖子的“百度Deep Voice”，貌似没看到有发布，我很怀疑是从谷歌“拿来”的

最后上实锤，看文章貌似有可以应用的，有兴趣的试试，相关文章链接
https://blog.csdn.net/ljp1919/article/details/52764913

还有个神奇的事就是刚好我混的另外个论坛有人找这类玩意，有图有真相，然后正好甩锅让他试试

个人觉得这么发展下去以后歌星甚至乐器都可以克隆了，上面文章的演示有人声有钢琴

话说有人试试来个测试报告？

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

回复此帖报告

六线谱上的柚子

181

#2 18-7-27 01:08 …

越来越没意思了。再过几年就是，乐器AI帮你弹，和弦AI帮你配，后期AI帮你混，人声AI帮你唱。
那要人干嘛——坐吃等死呗~

回复此帖报告

伊拉拉塔lala

15443

#3 18-7-27 08:17 …

越来越电脑机械化

回复此帖报告

DJ明

554

#4 18-7-27 08:28 …

这类东西其实还挺好玩的，但也仅限于好玩。
用技术取代艺术，那也就是某些理科生才有的幻想。

回复此帖报告

hjun

13923

#5 18-7-27 08:36 …

ai合成人声是一两年内的事情了，ai能完整编曲估计要2-3年

回复此帖报告

lies

1359

#6 18-7-27 11:57 …

我觉得还有很长的路要走，即使音色像了，字句的连接也做的很自然了，但情绪是很难模仿的，没有情绪的人声，根本没有生命，应该很容易辨识吧

回复此帖报告

s99yj

444

#7 18-7-27 18:02 …

还是关心DIY WAVES服务器

回复此帖报告

声学六部

1322

#8 18-7-27 19:06 …

实际应用

回复此帖报告

gggccc44

1234

#9 18-7-28 00:38 …

lies 发表于 18-7-27 11:57
我觉得还有很长的路要走，即使音色像了，字句的连接也做的很自然了，但情绪是很难模仿的，没有情绪的人声， ...

艺术类的工作我不认为ai可以完全替代，技术的目的是方便使用，降低门槛，想当年什么都要硬件的时候坛子里面没几个有能力玩音乐吧，虽然现在很多器材价格也不低，但是比当年可是简单多了

回复此帖报告

jimodejijie

107

#10 18-10-12 01:02 …

这种事特别被喜欢Zhuan-Zhi统一假大空的国家推崇，像欧美民主国家都是以艺术的个性为核心，

回复此帖报告

jaganshi

707

#11 18-10-12 23:13 …

目前这些技术能达到的仅是说话的程度，其实google去年年底新算法已经能在生成语音中加入一些语气了，音质也提升了很多（没有高频刺耳的齿音了）。
还有一个加拿大团队做的算法叫lyrebird，可以在这儿听https://soundcloud.com/user-535691776，官网https://lyrebird.ai/其实已经能用了。

但是唱歌比语音困难很多，因为需要考虑的变量更多，例如声音不同程度的失真、呼气量、音高变化等。更重要的三点是：1，结果是个艺术选择，并没有像语音表达这样有比较明确的标准；2，可学习用的采样非常少；3，没有市场，音乐人都穷买不起成品，不像语音生成都是自己用的。

回复此帖报告

凯伦

888

#12 18-10-14 18:45 …

diy waves的服务器镜像有就好了

回复此帖报告

返回列表

音频编辑

人声模拟和克隆，今天我蛋疼的时候发现了神奇的东西

人声模拟和克隆，今天我蛋疼的时候发现了神奇的东西

本帖子中包含更多资源