哦,大体的设计思路是这样。
第一,对指定歌手的声纹精确建模。
第二,精确计算次建模声纹对周边的影响,从而恢复其他乐器的完整内容(缩混时的),举个例子,紅加黄等于橙色,现在的技术做的是“抹掉橙色”,应该做的是减去
一个指定颜色。
前者的技术目前主要用于刑侦方面,针对语音识别确认犯罪嫌疑人什么的,目前并不成熟,声纹的优点是相对图形识别来说算法复杂度低,缺点是人声的变化是很大的,身体状况,情绪,发声技巧,环境,都会对声纹产生影响,受过专业发声训练的歌手就更难说。现在到程度了不太清楚,不过确定的是一直在进步,因为是很好的刑侦科技需求。
这只是其中一种设想,可能不是最方便的。
科学的发展总是交叉学科的,可能某个医学上的小进步,引发了录音技术的大进步什么的。
嗯。