录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店

人声模拟和克隆,今天我蛋疼的时候发现了神奇的东西

( 11 )
 
[收藏]

1230

人声模拟和克隆,今天我蛋疼的时候发现了神奇的东西

本帖最后由 gggccc44 于 18-7-27 01:04 编辑

起因是看到有人帖子说到“DIY WAVES服务器”,然后关键字搜索发现了这个文章
百度语音系统Deep Voice新突破 可在几秒内克隆你的声音

然后发现居然有3个可以做到模拟克隆声音


Adobe Project VoCo,音频2016已经有人发过贴了http://www.audiobar.net/forum.ph ... 6485&highlight=VoCo,不过这玩意只是演示过并没有推出


谷歌 WaveNet
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
貌似这个是可能可以用的,等下再说


然后就是上面帖子的“百度Deep Voice”,貌似没看到有发布,我很怀疑是从谷歌“拿来”的


最后上实锤,看文章貌似有可以应用的,有兴趣的试试,相关文章链接
https://blog.csdn.net/ljp1919/article/details/52764913

还有个神奇的事就是刚好我混的另外个论坛有人找这类玩意,有图有真相,然后正好甩锅让他试试


个人觉得这么发展下去以后歌星甚至乐器都可以克隆了,上面文章的演示有人声有钢琴

话说有人试试来个测试报告?











本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

181
越来越没意思了。再过几年就是,乐器AI帮你弹,和弦AI帮你配,后期AI帮你混,人声AI帮你唱。
那要人干嘛——坐吃等死呗~

12742
越来越电脑机械化

526
这类东西其实还挺好玩的,但也仅限于好玩。
用技术取代艺术,那也就是某些理科生才有的幻想。

11243
ai合成人声是一两年内的事情了,ai能完整编曲估计要2-3年

582
我觉得还有很长的路要走,即使音色像了,字句的连接也做的很自然了,但情绪是很难模仿的,没有情绪的人声,根本没有生命,应该很容易辨识吧

359
还是关心DIY WAVES服务器

1045
实际应用

1230
lies 发表于 18-7-27 11:57
我觉得还有很长的路要走,即使音色像了,字句的连接也做的很自然了,但情绪是很难模仿的,没有情绪的人声, ...

艺术类的工作我不认为ai可以完全替代,技术的目的是方便使用,降低门槛,想当年什么都要硬件的时候坛子里面没几个有能力玩音乐吧,虽然现在很多器材价格也不低,但是比当年可是简单多了

107
这种事特别被喜欢Zhuan-Zhi统一假大空的国家推崇,像欧美民主国家都是以艺术的个性为核心,

661
目前这些技术能达到的仅是说话的程度,其实google去年年底新算法已经能在生成语音中加入一些语气了,音质也提升了很多(没有高频刺耳的齿音了)。
还有一个加拿大团队做的算法叫lyrebird,可以在这儿听https://soundcloud.com/user-535691776,官网https://lyrebird.ai/其实已经能用了。

但是唱歌比语音困难很多,因为需要考虑的变量更多,例如声音不同程度的失真、呼气量、音高变化等。更重要的三点是:1,结果是个艺术选择,并没有像语音表达这样有比较明确的标准;2,可学习用的采样非常少;3,没有市场,音乐人都穷买不起成品,不像语音生成都是自己用的。

296
diy waves的服务器镜像有就好了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索