論文一覧に戻る

査読者 1

総合点

5

確信度

2

コメント

 本研究は,初級・中級者をターゲットとした遠隔ピアノレッスン支援システムを提案している.提案システムは,双方の打鍵情報をディスプレイ上の仮想鍵盤及び双方の鍵盤にプロジェクションする機能,双方の表情,指示,指や手の形を視覚化するためにアングルが異なる複数視点のカメラ映像を表示する機能,楽譜上にメモや気づきを入力・保存・共有する機能,楽譜を指さしした際に相手側にもアニメーションをつけ表示する機能を有する.特にカメラ映像表示では,現在の演奏,過去の演奏,楽曲構造に基づき複数視点から最適な視点を予測するカメラスイッチング機能を実装し,ユーザのカメラ視点の手動切り替えと組み合わせて使用できる.
 提案システムの機能の豊富さ,従来の遠隔レッスンシステムでは実現されていない双方の演奏情報を追従した情報をプロジェクションする,楽譜へのジョイントアテンションを明確にするといった既存技術ではありますが,それを遠隔レッスンに適用したという点で評価は不十分ですが有用性の点で評価できると考えます.
 ただし,カメラの自動的なスイッチング機能の説明が不十分で本研究の技術的な新規性が認められる点の妥当性・有用性の評価ができない状況と考えます.また,気になる点としては,遠隔レッスンとして,例えばcafetalkなどでは,外国にいるピアニスト,ピアノ教師を中心に,遠隔レッスンを継続している(人気のある方もいて予約が取りにくいこともあるようです)状況もあるので,うまく遠隔でレッスンしている人にはしている人なりのコツみたいなものがあるはずで,そのあたりを調査して,現状の提案システムとあっているのか,新たに追加すべき機能などをインタビューできるとさらに良くなると思います(現状のレッスンの状況を踏まえた提案にはなっていないので現実に即しているのかという点が気になります).
 また,手指の視覚的な把握として,手首が下がっているとか上下しないのが良いような記述が見受けられますが,腕の重さで弾くことがメインの奏法では,手首の上下が大きく,指が鍵盤に触れる時間が長く自然と手首が下がることがあるので,一概に悪い例としていいのかにはすごく細かい点だとは思いますがやや疑問に思いました.
 さらに細かい点ですが,章・節の冒頭の字下げがあったりなかったりしているのでそこは修正した方が良いです.

採録判定時のコメント

遠隔地ピアノレッスン支援システムの提案であり、完成度が高い。いくつかある機能のうち、複数のカメラ画像を手指の動きから自動的にスイッチングする機能には一定の新規性が認められる。一方で、NNを用いた実装方法の妥当性(例:他の手法との比較など)についての記述が不十分であり、条件付のショート採録と判断された(採録条件はレビューサマリに記載)。※修正版の再査読の結果、条件を満たしていると判断され、採録となった。

レビューサマリ

 本論文は,遠隔地でのピアノレッスンを支援するためのシステム提案であり,複数カメラを手指の動きから自動的にスイッチングする機能,また,既存研究成果技術を適用した楽譜の共有機能,打鍵のプロジェクション機能を有しており,システム全体としては完成度が高いシステムであると評価します.本研究は主要機能のうち,カメラの自動スイッチング機能について新規性を認めますが,本機能の特に有用性・妥当性について説明が不十分と判断しましたので,条件付採録と判定いたします.

採録条件として以下3点をあげますので対応をお願いいたします.

(1)カメラの自動スイッチング機能の有用性・妥当性について現状で説明が不足しているので現状の内容を確認し,修正・加筆をお願いいたします.
-例えば,単純に手指がより大きく映っているカメラを選択するような手法と比べてどの程度有用であるかといった切り口での説明が必要です.

(2)カメラ予想の正解についてどのような場合が正解でどのような場合が不正解かを明確になるよう説明をお願いいたします.

(3)カメラの手動切り替えについて本文中の「手動カメラ切り替え結果をもとに,3.5.1で説明したフィードフォワードニューラルネットワークの入力パラメータを更新し,自己学習する」の解釈について,たとえば,自動切換えでは,俯瞰的に手動切り替えは気になるポイントを細かく見る,のような使い分けがあるという仮説が成り立つ場合,自動切換えの学習データにしてよいかどうか疑問があります.この点について確認の上,前述の内容で正しい場合には,学習データの妥当性について説明をお願いいたします.著者らの意図と異なる場合は,本文から正確な意図が読み取れない可能性がありますので,修正をお願いいたします.

--- 以下、修正版に対するレビューサマリ ---

採録条件として提示した(1)カメラの自動スイッチング機能の有用性・妥当性の説明の追加,(2)カメラ予想による正解/不正解の明確化,(3)本文「手動カメラ切り替え結果をもとに,3.5.1で説明したフィードフォワードニューラルネットワークの入力パラメータを更新し,自己学習する」の曖昧性の解消.の3つの条件について3名の査読者の再査読の結果,いずれも改善が見られ,本研究の技術的な新規性の有用性・妥当性が認められると判断しました.よって採録と判定いたします.

なお,採録条件(1)について修正後本文には「提案手法の性能評価実験においてこれらの問題が解決できていたことは実際に確認でき」とありますが,該当部分である性能評価実験の記述だけでは不十分なのではという指摘が一部ありますが,登壇発表時に具体例をあげることで十分解決するものであり,根本のカメラの自動スイッチング機能の有用性・妥当性には影響しないものと判断します.この点について著者らには発表準備に向け検討をお願いできればと思います.

その他コメント

※ タイトルが長すぎます。投稿用テンプレートに従い、奇数ページ(3ページ目以降)のヘッダ部分が1行に収まるように、文言の修正を行ってください。

査読者 2

総合点

5

確信度

2

コメント

本論文は、遠隔地でのピアノレッスンを支援するためのシステムの提案です。特に複数カメラを手指の動きから自動的にスイッチングすることを特徴としています。
楽譜の共有や、打鍵のプロジェクションなど、システム全体はかなり作りこまれており、完成度が高いように見えます。

一方で、カメラの自動スイッチングの仕組みについては理解できますが、その妥当性や有用性は、動画を見てもあまりよくわかりませんでした。たとえば、単純に手指がより大きく写っているカメラを選択する、ような手法と比べてどの程度有用であるか、示せるとよりよいと思います。

また、手動切り替えについて、
「手動カメラ切り替え結果をもとに,3.5.1で説明したフィードフォワードニューラルネットワークの入力パラメータを更新し,自己学習する」
については、若干気になりました。
(たとえば、自動切換えでは俯瞰的に、手動切り替えは気になるポイントを細かく見る、のような使い分けがあるという仮説が成り立つとしたら、自動切換えの学習データにしてよいかどうか疑問があります)

今後の研究で、実際のユーザのレッスンでのテストなどを含め、より多くの知見が得られることを期待します。

査読者 3

総合点

4

確信度

2

コメント

演奏によるカメラの選択機構(ルールベース)を提案していること,その結果を示していること,および,実際上のために選択機構のマニュアルのオーバライドなど実際の利用ができると考えます。

カメラの予測の正解については「主観」というのは正直なところであろうとは思いますが,どのようなものを正解として,どのようなものを不正解としたかの記載があったほうが,カメラの予測のレベルが伝わると考えられます。

遅延の問題は,NEDUETTOという技術で解決できるという記述がありますが,今回のシステムは遅延をどう扱っているかを明示したほうがわかりやすいと思います。これは,遅延はハードウェアで解決するので,この研究では扱わないという立場の表明とも思えるのですが,実際にNEDUETTOを使うことを想定しているということとも思え,どちらであるかを明示していただきたいです。その上で,通常のコンピュータネットワークで遠隔での運用をした場合では,遅延に由来した不都合がおきるようにも推測されますが,どのくらいまでの遅延が許されるのかというような考察があると,提案の有用性が向上すると考えます。