最新人声合成技术 你要用谁的声音卡拉OK | |
http://www.sina.com.cn 2003年12月08日20:08 新华网 | |
数字人声模拟技术让你可用帕瓦罗蒂的声音歌唱 运用最新人声合成技术,每个人都能够以其他任何人的声音逼真地发出他/她从未发出的声音,这样的世界还可信吗? 国际先驱导报文章 就像其他电子合成器能模拟小提琴或大号等不同乐器的音色一样,Vocaloid用户可以利用该软件模拟“演奏”出自己或别人的歌声——没有巨星出场却有巨星演唱会的效果。 你也能模拟“萨达姆”说话 这种能再现人声的软件将开创一个新时代,同时也将带来种种真伪莫辨的法律、社会、艺术等问题。往后,任何人都可在计算机上自己再现任何一个歌手的声音,让这声音唱出自己任意指定或写成的歌,那么这歌究竟是谁唱的呢?人们也可以再现他人包括逝者的声音,让这声音“说”出自己任意指定的话语,感觉就像他们亲自说的一样。例如,伪造出逼真的“萨达姆”,让他说“我要用he武qi毁灭全世界!”在这样的世界里,你还能相信什么呢? 先撇开这些复杂的后果不谈,首先应当承认的,是该软件的问世标志着人类声音合成技术的一大飞跃。要模拟、制造、合成普通声音并不难,难的是合成人的声音。 虽然数字技术可以合成足够清晰的吐字声音来表达意思,但它们还很单调,更像机器人发出的声音,而与真人发音相差甚远。人类说话或唱歌的声音非常复杂,既清晰流畅又抑扬顿挫或颤动不定,因此很难合成出与人的自然发声吻合的声音来。 音素数据库与“音频字体” 而现在Vocaloid带来了革命。你可以把这个软件看成一种“音频字体”,音符和歌词可以被翻译成选定的“音字”并被播放出来。其原理就如同文字处理软件把文本的字体选定成新罗马字体、黑体、宋体、楷体等等并随时打印出来一样。假设某种字体是一个人,文本选定成该字体等于是这一文本由该人以他特定的方式“亲自”书写出来;同理,音乐文本由某个人的特定“音字”播放出来就等于由该人“亲自”演唱。 “音字”是通过音素数据库来构造的,而音素是构成各种语言的基本语音单位。为了创造某个人的音素数据库,可让他/她对足够多的单词或音调等声音元素朗读或清唱,并通过电子采样记录下来。音素数据库中还包括各种各样的唱读技巧如滑音、连唱等,然而通过软件分析和再现各种声音组合,由此一个人的“音字”就可形成。实际上,这等于是一个人的嗓音分解成基本元素后任意组合的再现,也就是说,嗓音可以脱离某个人而存在,并通过计算机自我组合再现,不必再通过这个人。 未来歌星卖嗓音赚钱 从雅马哈公司获得Vocaloid使用授权的英国“零重力”(Zero-G)公司通过雇人诵读、歌唱,已创造了一男声一女声“音字”,分别叫作“莱昂”和“洛拉”。它们被描述为“虚拟男女灵歌手”,主要是做伴音用。 2004年,“零重力”公司将利用Vocaloid做出一套名叫“米丽娅姆”的“音字”。这套“音字”的声音资料来源于歌星米丽娅姆·斯托克利。一旦米丽娅姆将她的声音制成“音字”卖出去,她就无法再控制人们如何运用这些声音。任何购买者都可以用它写歌并用于商业目的。但是,他们不能把这些歌作为米丽娅姆的原版带销售。 米丽娅姆本不想卖她的“嗓音”。她说:“我第一次接触到这个想法十分害怕,人们花很多钱来获得我的声音,而我要把它变成一种‘音字’。不过我后来改变主意了。因为你不能和进步斗争,不管它听来是多么奇怪。”她希望从卖出的“米丽娅姆音字”拷贝中获得分成。 “零重力”公司的长远计划是,与那些世界级的大腕艺术家合作,购买他们的嗓音制作世界知名的“音字”,但目前还没有任何一个大歌星对这个设想表示出兴趣。 普通用户可以用该软件制作出自己的“音字”吗?从原则上说,这是可以的,但在目前阶段,由于这项技术需要用户掌握深厚的语音学和音频工程学知识,对普通用户来说,其制作过程还是太复杂了。就算一个天才的音响发烧友可以掌握这个程序,其制作过程也过于繁杂,需要包含有成千上万音素资料的数据库。不过长远来看,随着其更新版本的问世,这种人声合成技术走入寻常百姓家只是时间早晚问题。( |