査読者1

[メタ] 総合的な採録理由

本研究では、オンライン講義のような 1 対多の状況において、聴衆の視線情報を取得しそれを講師側の資料上にヒートマップで提示する手法を提案しています。提案手法はオンライン講義等が急増した昨今の状況下で有益であると考えられ、WISSにおいては提案システムを用いることでどのような効果が期待されるか、またそれをどのように評価していくかについて議論できればと思います。

[メタ] 査読時のレビューサマリ

本論文は3名の査読者に査読されました。
多人数の聴衆の視線情報を講師側の資料上にヒートマップで提示する手法の新規性・有用性については、いずれの査読者も一定の評価をしています。一方で、実施された評価の内容は限定的であり、現時点では提案手法の効果が十分に示されていない点を全ての査読者が指摘しています。また、論文としての主張が不明瞭である点や、システム構成・挙動についての説明が不十分である点も指摘されています。特にシステム構成について理解が困難である点については修正が必要であると考えられます。

上記の内容を総合的に判断し、以下の内容を採録条件とする「6: ショート採録(採録条件あり)」と評価しました。

採録条件:
「図6. システム構成」を、実際のシステム構成(話者側・聴衆側で動作するシステムの構成要素)を示した内容に変更する

[メタ] その他コメント

採録条件となっている部分に限らず、各査読者の指摘事項は研究の価値を高めるために有益な情報であると考えられますので、是非参考にしてください。

総合点

7: ロング採録に反対しない

確信度

2: やや専門からは外れる

採否理由

本研究では、オンライン講義等の1対多の遠隔コミュニケーション状況において、多人数の聴衆の視線をヒートマップで話者に伝達する手法を提案している。聴衆の視線方向取得にはブラウザ上で動作する視線検出ライブラリ(WebGazer.js)を用いており、特殊な機器を用いることなくシステムを利用することができる。また視線情報に加えて、頭部動作を伝達することで頷き等の伝達を行うこともできる。論文中では実装したシステムの評価も行っており、システムが聴衆の反応を知るのに役立つことが示された。

・提案されている内容の新規性(先行研究との差分が十分にあるか)
ブラウザ上で動作する視線検出ライブラリを用いたことにより、特殊な機器を用いることなく多人数の聴衆の反応をリアルタイムに反映した点は新規性を有する。

・有用性(実際に役に立つか)、正確性(技術的に正しいか)
限定的ではあるが評価実験を行いシステムの有効性を示している。ただし、実験参加者(講師役)が2名であり統計的な解析が行われていないこと、考えられる他のフィードバック提示手法(テキストや絵文字を用いた手法等)と比較が行われていない等、評価内容は限定的である。(ただし評価については、WISSの査読指針に即して論文の採否に影響を与えるものではない)

・論文自体の記述の質(分かりやすく明確に書かれているか)
全体の論理展開、文章の内容については概ね分かりやすく書かれている。ただし以下の点については説明が不十分であり、修正が必要である。

-3.3節「全体的な構成」
聴衆側ではWebGazerを組み込んだwebアプリケーション等が実行されていると思われるが、その点について説明されていないため、システムの全体構成が不明瞭である。また、図6は「システム構成」を示したものであることから、遠隔通話のためのZoom、ヒートマップ描画のためのUnityアプリケーション、WebGazerを用いたwebアプリケーション?等を含め、実際にシステムを実行するために必要な構成要素を全て記載することが望ましい。

上記内容を総合的に評価し、「7: ロング採録に反対しない」と判断する
ただし3.3節「全体的な構成」については前述の必要事項の追記を行うことを採録の条件とする。

この研究をよくするためのコメント

・頭部方向については、提示されるカーソル位置が注視点のように見えてしまうことから、異なる表現の方が良いように感じました(相対位置の変化から頷きを検出し、頷いてる人の絵文字をスクリーン端に提示する等)。

・対面であっても説明中に聴衆が見ている場所をピンポイントに把握することは困難であったことから、ヒートマップの利用により従来とは異なるインタラクティブな説明が可能になったりスライド作成を行う上での参考になったりするように感じました。


査読者2

総合点

5: ショート採録が妥当

確信度

2: やや専門からは外れる

採否理由

ノートPCに内蔵されているカメラを用いて,視線トラッキングライブラリを活用したヒートマップによる大人数の視線位置を可視化する手法を提案しています.
この手法により,話者は気を散らされることなく聴衆の反応を知ることができた述べています.
多人数の視線情報を講義資料上にヒートマップで可視化する手法は十分な新規性を持っており,有用性もあると思います.

一方で評価については,アンケートでの回答のみでまとめられており,話者の話しやすさが改善されるかどうかの検証には至っていないように思いました.
また,アンケートの回答結果の記載は提案システムについてのみであり,これでは提案システムが優れているかどうかの判断ができませんでした.
何かしらの手法と比較する必要があるかと思います.

以上より,「ショート採録が妥当」と判断しました.

この研究をよくするためのコメント

聴衆の顔の向きを表示する機能についての説明がいまいちわかりませんでした.
中心からの点の距離は何を示しているのでしょうか?
また,頷きが発生した時に,点がどのような挙動を示すのかもわかりづらかったです.

今回,視線の位置と顔の向きを表示する機能について合わせて評価を行っていますが,機能それぞれについて評価すべきかと思いました.
現状では,視線の表示と視線の向きのどちらが役に立ったのかが,アンケート結果からは読み取れないように思います.

本文で著者が述べている通り,話者の話し方の変化を示す客観的尺度を用意し,考察する必要があるかと思います.


査読者3

総合点

5: ショート採録が妥当

確信度

2: やや専門からは外れる

採否理由

本論文は,オンライン講義等の1対多の遠隔コミュニケーションを対象とし
て,聴衆の視線を取得し,ヒートマップとして話者に提示する手法を提案して
います.シンプルかつ現実的な手法で面白く,新規性もあり,一定の有用性も
あると思いますので,「ショート採録が妥当」と判定しました.

著書もわかっているのではないかとは思いますが,実験において(聴衆が6名い
たのだとしても)話者が2名だけであったというのは,この種の研究としては小
規模だったと思います.また,4節の最後の段落にも書かれているように,実
際の教師に使ってもらう必要もあると思います.

論文の主張や全体的な記述が平坦であることも気になりました.例えば1節の
最後の段落で「ノートPCに内蔵されるカメラのみを使用するwebベースの視線
トラッキングライブラリを用いることで大人数の聴衆の視線を話者側にリアル
タイムでヒートマップとして集合的に表示する手法を提案する」とあります
(3節も全体として同じような書きぶりです).しかし,webベースの視線トラッ
キングライブラリ(WebGazer.js)を用いていることをこのように強調する必要
はあるのでしょうか.例えば本論文とほとんど同じシステムをTobiiで実現し
た先行研究があったとした場合,Tobiiの代わりにWebGazer.jsを用いるという
研究にどの程度の新規性を主張できるかを考えてみるとよいと思います.論文
では,やったことを全て書くのではなく,研究のポイントを中心に論じ,その
効果を示すことに注力すべきだと思います.

この研究をよくするためのコメント

式(1), (2)にmax(|r-di|,0)のような形の式が現れますが,単なる|r-di|とは
どのように異なるのでしょうか.| |が絶対値を表すのであれば,|r-di|≧0で
すので,常にmax(|r-di|,0)=|r-di|であると思います.