录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店

[请教/求助] 十二种双耳渲染不同SOFA对比

( 11 )
 
[收藏]

2089
#1 22-8-4 19:45

十二种双耳渲染不同SOFA对比

使用的sofa除了cubase里VST AmbiDecoder自带的两个(Standard和Facebook)之外,其他全部来自Sofaconventions。通过VST AmbiDecoder这一插件可以把全景声(所有音轨输出给全景声编组通道)信号渲染成双耳信号输出给立体声总线。
所用的SOFA来自不同机构的不同模型,不太可能全部对所有人适用。网站提供的sofa文件数以千计,从其中参考听众人数较多的几个里随机选取了十个。
音频里用语音播报方位。所有方位都是在声像器里对应的绝对方位。
我自己听来所有的sofa都不完全准确。左下方和右下方听起来不对称。
想看看这里面哪一个对于参与投票的人来说不准确的地方最少。

请使用入耳式耳机听出以下十二项音频中,语音对自己所在方位描述准确率最高、偏移最少的一项。


01-dtf b_nh169:

下载mp3

02-dtf b_nh172:

下载mp3

03-hrtf b_nh169:

下载mp3

04-hrtf b_nh172:

下载mp3

05-mit_kemar_large_pinna:

下载mp3

06-mit_kemar_normal_pinna:

下载mp3

07-MRT01:

下载mp3

08-SCUT_KEMAR_radius_0.7:

下载mp3

09-Subject44_HRIRs_lfc:

下载mp3

10-Facebook:

下载mp3

11-Steinberg:

下载mp3

12-IRC_1070_C_44100:

下载mp3

单选投票, 共有 1 人参与投票
0.00% (0)
0.00% (0)
0.00% (0)
0.00% (0)
0.00% (0)
0.00% (0)
100.00% (1)
0.00% (0)
0.00% (0)
0.00% (0)
0.00% (0)
0.00% (0)
您所在的用户组没有投票权限

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

204
#2 22-8-4 20:40
有趣,先马克一下,忙完来听

8991
#3 22-8-4 20:50
谢谢分享

2089
#4 22-8-4 21:35
奇了怪了,为什么我听哪个都同样感觉右下方比左下方更下沉,是我双耳听觉不一致吗

244
#5 22-8-5 09:12
楼主,这种SOFA格式用什么软件或者插件加载数据?

2089
#6 22-8-5 12:35
cs5487626 发表于 22-8-5 09:12
楼主,这种SOFA格式用什么软件或者插件加载数据?

贴子开头就说了啊,Cubase自带的多声道解码插件VST AmbiDecoder。
除了这个,还有Noise makers的BINAURALIZER STUDIO也可以加载SOFA。

97
#7 22-9-6 14:32
所有的都听完了,跟我最契合的是07 能清楚的分辨前后左右 并且没有特别突然的频响改变

2089
#8 22-9-6 16:48
chengyu8025 发表于 22-9-6 14:32
所有的都听完了,跟我最契合的是07 能清楚的分辨前后左右 并且没有特别突然的频响改变

你运气真好,这些对我来说没有一个准的。
我把那个网站的sofa下载了几十个去听都没一个准的,然而,万万没想到在我听来声像不出严重偏移的竟然是Ambi head HD内置的纽曼假人头。
这个纽曼假人头的HRTF是森海塞尔用新技术重制的,跟以往的HRTF有很大区别,在那个网站上下载到的同款假人头话筒的sofa文件听起来都跟它完全不一样。
但我找不到这个sofa文件的公开资源,至少他们没放在那个网站的数据库,我在猜解包dll插件能不能把它提取出来用在别的插件上。

而你么,这是与你有缘的sofa:



本帖最后由 fi8vni13 于 22-9-6 16:55 编辑

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

97
#9 22-9-6 17:24
fi8vni13 发表于 22-9-6 16:48
你运气真好,这些对我来说没有一个准的。
我把那个网站的sofa下载了几十个去听都没一个准的,然而,万万 ...

谢谢,我其实一直想找中国的BHead 210的Sofa文件,但好像看样子并没有公开文件,可能都是声学研究所或大学内部交流的,不对外公开。我现在用得是Spat Revolution自带的Kemar 采样,对我来说更改参数到百分之80 是一个比较合适的状态,但是也会有前后位置不明确的问题,不过好在真力和杜比都有用手机通过拍摄耳朵和头部轮廓通过云计算的方式得到自己的SOFA,但真力的太贵了要三千多,杜比的免费,但是只能应用在杜比的套件里,这两个暂时还没用过。之前跟斯坦伯格和做的一个也是通过手机拍照的一个厂家我试用过,运算出来的HRTF效果不是很好,可能是我没拍摄好的原因。希望以后有厂家可以制作一个公开的云计算的HRTF采集吧。不然双耳算法的壁垒实在是没发被打破

2089
#10 22-9-6 18:00
chengyu8025 发表于 22-9-6 17:24
谢谢,我其实一直想找中国的BHead 210的Sofa文件,但好像看样子并没有公开文件,可能都是声学研究所或大 ...

这个事情我最近查了很多资料,有个信息知道的人很少。
HRTF可以通过消声室用扬声器阵列或者麦克风阵列对真人测量,可以用于AI基于大量数据库输入耳朵照片进行预测(也就是Steinberg和绝大多数通过拍耳朵照片生成的那类服务),也可以直接对人体做3D扫描建模通过物理引擎计算。
最后这种方法早就有了,COMSOL官方甚至给出了教程,用的正是COMSOL这个软件,还提供了人体模型作为教程案例,教程中甚至说计算出来的与实际测量结果略有偏差,而偏差的原因可能是真人在测量过程中动了头或肩膀。但是COMSOL这个软件体积巨大,它本来是做工业设计之类的软件,计算HRTF对它来说只是个不值一提的附带功能。
因此另有一个专门针对计算HRTF开发的程序包,叫做Mesh2HRTF,是个Python程序,没有操作界面,靠代码运行,过程也非常简单,就是把符合要求的模型输入进去等它计算出结果,但这个计算过程会很耗时也很吃资源,同时对模型有一定要求,类似多边形数量不能超过某个范围,以及模型不能有头发,尤其是耳朵结构的形状一定要清晰。
它的官网也有非常详细的教程,并且对于如何生成自己3D扫描模型也给出了低成本解决方案:利用苹果手机的前置原深感相机(从iPhoneX到iPhone12,iPhone13因为这个功能有问题不推荐),用Heges这个APP(App Store售价60元),扫描时尽可能用泳帽之类把头发包住(主要原因是头发太难建模),得到的模型导入Blender进行编辑优化,生成分别去掉左耳和右耳的两个模型然后计算。教程用blender是因为Blender是个开源免费的3D建模软件,实际上用其他建模软件如3DSmax之类都是可以的。
油管有一个人按照官方教程一步一步做了演示,用的是一个自制假人头模型,教程一共十集,八个单元,今年一月份左右上线,至今仅有三百多播放量。

我没有iPhone,但我看了不少通过照片合成模型的软件,猜测也许有某个软件对耳朵的建模可以达到足够的精度(找不到这方面的案例)。

目前,Agisoft metashape 提供专业版30天免费试用,试用期间可以使用20小时云端GPU合成的服务,我觉得只要自己拍的照片规范,分别合成两只耳朵的精确建模和一个头部的粗略建模再拼合为一个头部模型,应该没问题。

但我现在还没想出依靠自己自拍耳朵和头部多角度对焦清晰的照片的办法。

你可以让朋友帮你拍几十张导入这个软件试试。

然后Mesh2HRTF计算过程虽然也很耗资源,但我觉得,既然它是Python程序,应该可以上传到Google Colab用谷歌家的GPU或者CPU运算,但我不会玩代码。

也许某个懂得多的大佬看到这消息可以动动手造福一下大家吧。
本帖最后由 fi8vni13 于 22-9-6 18:02 编辑
观众反应

97
#11 22-9-7 09:59
fi8vni13 发表于 22-9-6 18:00
这个事情我最近查了很多资料,有个信息知道的人很少。
HRTF可以通过消声室用扬声器阵列或者麦克风阵列对 ...

谢谢大佬指点,能留个联系方式么?比如微信什么的,如果我遇到不懂得问题还想继续请教您

2089
#12 22-9-7 12:23
chengyu8025 发表于 22-9-7 09:59
谢谢大佬指点,能留个联系方式么?比如微信什么的,如果我遇到不懂得问题还想继续请教您

微信搜我马甲
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索