論文一覧に戻る

査読者 1

総合点

7

確信度

2

コメント

本論文は3次元音響に対する知覚の個人差を減少させるキャリブレーションにおいて,定位感の一対比較にユーザの知覚的フィードバックを活用することを提案しています.VR技術の再興や全天周映像撮影技術の簡易化,一般化が進んでいる現在において,三次元音響における個人差を(既存手法よりも)簡易・短時間で個人にフィットさせる提案は,有用性が高いと考えられます.
また,20名中18名において有意に優位な結果が得られた点は,個人差を考慮したキャリブレーションが意図通りに行われていることを示唆しています.しかし,体験者のうちどの程度の比率で優位な結果が得られれば、本提案が有効であるか,という指標については不明確と言えそうです.被験者毎の聴覚特性についても言及されていないため,発表では各音域での検査や,他の定位評価との結果との比較等を踏まえた議論を期待しています.
さらに,音源の定位判断には視覚的情報が関与する説もあるため(https://www.jstage.jst.go.jp/article/jasj/55/11/55_KJ00001457281/_pdfなど),表示された回転球体が定位感の認識に影響を与える可能性も考えられます.この面から,ユーザインタフェースでの表示手法についても議論が行われることを期待します.

コメント
動画・論文を見る限り,ユーザインタフェースで出力する音源は耳と同じ高さのみ(高さ方向の変更や傾斜はなし)と見受けられるが,論文上でも説明を追記することを勧めます.
(音源定位の議論では上下方向は検討されない傾向にありますが,論文から今回の対応を読み取れないため)

採録判定時のコメント

本来ならば数時間の作業時間と相応の機器が必要となる3次元音響の定位感の個人用キャリブレーションを時間・労力ともに削減させており、新規性・有用性の両面で高評価となった。定位に対する記述不足や一部例示の分かりにくさ等の問題はあるが、論文の価値を大きく下げるものではなく、ロング採録と判断された。

レビューサマリ

本論文は3次元音響の個人向キャリブレーションをユーザの知覚的フィードバックをベースに行う手法を提案しています.この手法は時間的制約と機材的制約の両面において簡易かつ実用性のあるものとして評価されています.

以下の2点については複数の査読者から同様の指摘が行われていますので,カメラレディや当日の発表等での変更や追加を検討することを進めます.

1. HTRFの上下方向に関する定位について
 上下方向を考慮したか否かについての記述の追加と、可能であれば今後検討を行う予定かについての議論

2. デモ動画におけるキャリブレーション結果の説明
 キャリブレーション前後の音源の違いについて、デモや説明で音響に関して非専門の参加者でもわかるように説明

その他コメント

査読者 2

総合点

8

確信度

1

コメント

20~30分程度の個人で行えるキャリブレーションでユーザにあったHTTFを生成できる点に新規性と有用性があります。
既存の手法に対して容易さという点で明らかな優位性があると思われます。
また、ユーザスタディの結果もキャリブレーションの結果、ユーザの定位感が実際にかなり向上している点も評価できます。

だた、素朴な疑問として、頭や耳の形状による個人差というものが、
3次元映像を利用する際にどれくらいクリティカルなのかがよくわかりません。
キャリブレーションなしでは、ユーザがVRやゲームの体験が妨げられたと感じるほどのものなのでしょうか?
その辺にかんして理解を助ける分かりやすい例があるとありがたいです。

あと、動画でキャリブレーション前後のを聞いても(当たり前かもしれませんが)全く理解できませんでした。
実際にデモで違いを体験できる場があるとよいかと思います。

査読者 3

総合点

7

確信度

2

コメント

著者らも本文の中で述べているとおり,個々のユーザの頭部伝達関数(HRTF)の計測/生成をどのように簡便に行うかは音響分野ではメジャーなトピックの一つです.提案手法では機械学習によって既存のデータセットからHRTF生成器を作成し,個々のユーザに一対比較形式で2つのHRTFのうちどちらが好みかを回答させることでチューニングを行っています.
その結果,20~30分程度という短い時間で,既存のHRTFを使うよりも定位感の高いHRTFを生成することに成功しています.
	
論文中で気になった点を以下に列挙します.
・HRTFの生成について
今回は恐らく水平面のみの生成を行ったのだと思われますが,実際のHRTFは上下方向も含まれます.もちろん,音源定位は上下方向よりも左右方向が支配的ではあるのですが,今後の展望として,上下方向のHRTFの生成にも言及されるといいかと思います.
	
・ユーザスタディについて
「各被験者にとって一番良いHRTFを選んでもらった. これには漸進比較法[15] を利用した.」とありますが,当該方法ではどのくらいの時間がかかるのかも記載していただければと思います.
「比較の方法はブラインドで2 つのHRTFによってつくられた音をどちらがどちらなのかを被験者には知らせずに提示し, 被験者にはどちらが定位感が良いか, を答えてもらうことを100 回繰り返した.」とありますが,この際に提示した音はキャリブレーション時と同じく,頭部周りを周回移動する連続音でしょうか?それとも単一の音でしょうか?提示した音についても記載されるとよいかと思います.
移動する音源の場合,少し定位がずれていても移動していることによってそれらしく聞こえてしまうのではないか,が気になりました.また,前後誤判断についてもどの程度生じていたのかが気になりました.
	
・動画
添付されていた動画の最後にキャリブレーション前後の結果が2件含まれておりましたが,違いがよくわかりませんでした….(そもそもHRTFが自分のものではないという問題はあると思いますが)WISSの聴衆は音響専門でない人も多いと思いますので,キャリブレーションによってどういった点が改善されたのかが動画に含まれているとより良いと思いました.発表の際にも言及いただけるとよいかと思います.
	
・軽微な修正
1章最後の段落:「本校では」→「本稿では」
関連研究:「Yuancheng ら」→「Luo ら」,「Josef [5]」→「Holzl [5]」
(他にもあるかもしれません.カメラレディでは修正ください)