归根结底,MP3也还是由0101010组成的。分析各种音乐的频谱,然后提取它们的特征于特征库,其实是一个非常大的数据库。
然后同样的提取你文件的特征去与库里的配对
重要还是在于对特征的提取,各种算法都不一样,有的算频谱,有的算形状,
当然最为匹配的还是音乐原文件了,你哼唱的要匹配是需要另外一种算法,是对音高的算法,那样的歌曲就太多了,兴许和调都有关系
其次,你的特征库要够大,最理想的状态是你的特征库包含人类有史以来的所有音乐,精确度才会无限的放大,
找不到或者只找到类似的也是很正常的,因为程序员们已经够努力了
[ 本帖最后由 造飞机的工厂 于 14-3-22 12:44 编辑 ]