論文一覧に戻る

査読者 1

総合点

4

確信度

2

コメント

胸につけた全天球映像から装着者の顔方向を推定する研究です.提案の流れから,手法の検討,実装,評価と手堅い流れで進められています.ただ,いくつかの点で疑問点があり,本研究の有効性や新規性に疑問が生じています.

・まず,査読者のイメージでは,カメラの小型化によって,全天球カメラなどにおいてもおそらく頭部装着やめがね装着の流れになってくるのではないかと思います.そういった流れで,頭部装着カメラの映像からの頭部角度推定などの研究がさかんに行われているのではないかと思います.そういった関連研究に対して,「従来の一人称視点映像に加えて装着者の身体も映りこむため,ユーザの頭部形状からユーザが見ている領域および見ていない領域を推測することができる」という主張は,違いの主張になっておらず,頭部装着の広角カメラであれば頭部位置推定もでき,装着者の体も映り込むことになります.まとめますと,頭部装着カメラによる角度推定で十分で,今回の提案はそもそも必要なものなのか,ということが明らかになっていないように思います.

・「視線」と「顔方向」は本来かなり異なるものだと思いますが,異なっているように書いてあったり,同じものとして扱われていたり,記述の正確性に問題があると思います.今回の方式は視線ではなくて顔方向の推定ですから,顔方向の推定が役に立つという考え方でのアプリケーション主張をするべきかなと思います.

・あごの5点が決まれば,顔方向を学習ベースで推定しなくても,モデルから顔方向が求まるように思うのですが違いますでしょうか.

採録判定時のコメント

胸につけた全天球映像に映り込んだ装着者の顎画像から顔方向を推定する提案。議論が手堅く進められており、手法に一定の新規性も認められる。一方で、顎の映り込みを利用する必要性やメリット(他手法との比較)の欠如・取れるのはあくまで顔方向であって視線ではないこと・インタラクティブシステムへの寄与が不明瞭などの問題が残っており、ショート採録と判断された。

レビューサマリ

広角カメラを胸に取り付け,写りこんだユーザの顎画像からユーザの向いている方向を識別する手法を提案する論文です.限定された環境ではあるものの,手法の提案・評価と手堅く行われており,論文としてはまとまっていると思います.ただ,他手法に対する優位性の説明ができていない点や,視線と顔方向の違いが明確でない点が指摘されており,WISSにおいてのインタラクティブシステムの進展における議論がしにくい状態にあるとメタ査読者は考えます.評価実験もかなり限定的でユーザ数もいないので,実際使えるのかどうかの説得力向上にはこの実験があまり寄与していないと思われます.WISSとしては,もう少し,この技術を使えばいままでできなかった具体的に何ができるようになるのか,といったインタラクティビティへの寄与を中心に記述していただければ良かったなと思います.

また,レビューの中にもありますが,「視線」と「顔方向」を同じものとして取り扱っておられるように思います.これは本来異なるものであり,PC委員会でもこの部分は問題視され,これの定義を明確にすることを条件にするべきという意見も多くありました.顔方向の推定で十分なアプリケーションを示したり,定義について議論するなど,なんらかの対応して頂くことを強く求めます.また,タイトルは「視線」となっていますが,実際にやられていることは「顔方向」ですので,タイトルは読者に混乱を招くと思われます.顔方向の推定であることが分かるように修正することを強く求めます.

その他コメント

査読者 2

総合点

3

確信度

3

コメント

【新規性】
広角カメラを胸元等に取り付けた際,必ず移りこむユーザの顎画像とモーションキャプチャデータをCNNにより学習し,ユーザの向いている方向を識別する手法をしめした論文です.着眼点はユニークであることから一定の新規性は認めますが,この技術をどのように利用するのかをもう少し明確に述べないと,対話設計としての論文の新規性には疑問が残ります.

【有用性】
ユーザの視線方向を推定したいだけであれば,視線計測,頭部へのモーションセンサ付加等で比較的手軽に且つ精確に実現できますが,本論文はユーザの下顎が映り込む画像を利用する動機が論文内からは理解できませんでした.記述の後半はほとんど機械学習に関する説明となっており,もう少しユーザ中心で議論していただかないと,本ワークショップの発表には不向きかなと思います.5.2に様々なアプリケーションを作成可能であると述べていますが,なぜ別手法で方向情報を取得してはだめなのか追記する必要があります.

【正確性】
特に問題ないと思います.

査読者 3

総合点

4

確信度

2

コメント

ユーザが胸部につけた全周囲カメラに写り込んだ,ユーザ自身の顎のラインから顔の向きを推定する研究です.一般的に顔検出,向きの推定に使われる鼻などの特徴を活用できない状況において,(背景を単一色にした限定環境とはいえ)一定の成果を上げています.今後の展望についても妥当かと思います.

一方で,本文中で「顔方向」「視点位置」「視線方向」という言葉が用いられていますが,顔の方向が分かっても,視線の方向まではカメラに写っていない限り算出できないので,これらの区別はもっと厳密にされたほうがいいかと思います.

学習に使用したデータセットの作成や認識結果の確認においては,単一のユーザで行っているのだとは思いますが,個人差も大きいと思いますので,どの程度誤差が出るのかなどを述べられると,よりよかったかと思います.

タイポ
3.1 注視点を推定ために→注視点を推定するために