■ 論文ID: 10 ■ タイトル: 順解析と逆解析を相互に利用する打楽器のインタラクティブなデザインインタフェース ■ 著者: 山本和彦(東大),五十嵐健夫(東大) ------------------------------------------------------------------ レビューサマリ ------------------------------------------------------------------ 外部査読者より,数式に関する指摘があったため,この点については,著者に確認し,必要であればカメラレディまでに修正が必要かと思います. ------------------------------------------------------------------ reviewer 1 ------------------------------------------------------------------ ■ 総合点: 3 ■ 確信度: 2 ■ 査読コメント: 所望の音色と形状を持つ打楽器をデザインする状況を想定し、それを支援するインタフェースの提案です。従来研究[1]と比較した場合の機能としての新規性は、形状を指定できるだけでなく、ユーザが音色自体を直接編集できる点だと査読者は理解しています。また、形状から音色を生成する手法と、音色から形状を推定する手法を新たに提案されています。 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 評点の根拠 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 形状から音色を推定する順解析と音色から形状を推定する逆解析を相互に行うというインタラクションを新規に提案された点、それを実現する上で高度な実装がなされている点が高く評価できると感じます。 具体的には第1章において 「ユーザの形状変形操作に応じてシミュレーション結果をフィードバックするだけでは,フィードバックされた情報を基にユーザはさらにどのような形状変形操作を加えれば目的とする音に近づけていくことができるのかを判断することが困難であるというさらなる問題がある.」 という問題提起があり、それを解決する一つの方法として、打楽器の形状をデザインしながら音色をフィードバックされるだけでなく、ユーザがその音色を直接微調整して形状を更新できるという機能を提案されていて新しいと感じます。 しかし、ここで次の2点のような問題を感じました。 (1) 音色の変形が直感的ではなく、結局どのように変形して良いのか、ユーザは分からなくなるのではないか?と感じました。(パワースペクトルの形状だけから音をイメージすることが難しい) また例えば、「デモビデオの30秒付近」では、音色において最も低い制御点をより低く動かしていますが、その結果、音が低くなるのかと思ったら(私にとっては)高い(明るい?)音が生成されて聞こえたため、いったいどういう風に変形すれば所望の音色を得られるのか分からなくなりそうに感じました。 (2) 音色の変形は形状をあまり大きく変形させませんが、形状の変形は音色を大きく変形させるように感じます。したがって「形状操作→音色微調整」を行っても、再度形状を変えてしまうと、これまでの音色の微調整は意味をなさなくなってしまい、順解析と逆解析を相互に利用するという観点からは少し外れてしまうのではないかと感じました。 したがって、解決したい問題を解くのに最適なインタラクションかどうか確信が持てませんでした。つまり、従来研究[1]からの大きな差異を見つけにくいように感じました。 例えば、音色を編集しなくても、これまでの形状と音色の履歴を残しておくというような単純なインタラクションの追加によってでも、ずいぶんと試行錯誤がしやすくなるように感じます。また、例えば、形状や音色の特性をそれぞれ2次元上に射影するなどして、どういう形状になったらどういう音色になるのかをユーザに視覚的に分かりやすく提示する方が、より理想に近付けやすくなるようにも感じます。 以上が主な評点の根拠ですが、以下に示すような改善点を感じた結果も含めて総合的に判断しました。 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− 論文改善のためのコメント、疑問 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− ・第1章末尾において「楽器のみならず多くの一般的な製品の設計においても役立つ可能性がある.」は、デザイン要素にのみ集中できることに関しては同意ですが、順解析と逆解析を交互に解く支援が、具体的にどういう風に役立つのかよく分かりませんでした。役に立ちそうな気はしますが、その考えが妥当かどうかの根拠があると良いと思います。例を挙げるなどです。 ・第3章で「平均パワースペクトラム」とは何かを説明して下さい。おそらく、短時間フーリエ変換によって得られたパワースペクトルの時間方向の平均だと推測します。また、音響信号処理に不慣れな読者が分かるように、パワースペクトルの形状の違いが音色の違いに相当することを明記して説明して下さいますでしょうか。 ・査読者としては、音色の操作はパワースペクトルではなくて、対数スペクトルが良いのではないかと感じました。もし、調波構造を持った(音高のある)楽器音であるなら、パワースペクトルの方が高調波構造を制御しやすいようにも思えなくもないですが、今回は打楽器ですので、対数スペクトル(dB)の方が聴覚的な観点から妥当な操作に思います。しかも、図3のようにほとんど0付近になった時、パワースペクトルのままだと操作しづらいのではないでしょうか。 ・インタラクティブなシステムの提案ですので、第3章がかなり重要ではないかと査読者は考えます。しかし、現状の論文構成は、第4章及びその評価が論文の大半を占めています。第3章(及び第5.2節)をより充実できると良いと感じます。  例えば、「モード周波数」とは何か、という説明は簡単にでも必要だと思います。そして、なぜそれを表示するのか。それはパワースペクトルの画面には表示しないのか?Control Pointは何個でも良いのか?追加できるのか?音はどうやって鳴らして確認するのか? ・第3章の最後、Possessing Drumsを活用するところは、非常に良いアイディアだと思いますが、そのシステムの詳細を知らないと、この段落が理解できないと思います。図も意味が分からないと思います。この論文を初めて読む人にもイメージが伝わるように工夫できないでしょうか。また、最後の「評価を行うことができる」も、自動評価が行えるような印象を受けかねないと思います。 ・第4章の数式では、行列やベクトルは太字にした方が良いと感じました。 ・現在も質高く文章を書けていると感じますが、より完成度を上げるために、文章を全体的に再度推敲していただければと思います。特に1文がかなり長い場合があります。概要の1文目「本稿では,打楽器の~」、第1章の1文目「現在,打楽器を含む~」等です。 また 「フィードバックされた情報を基にユーザはさらにどのような形状変形操作を加えれば目的とする音に近づけていくことができるのかを判断することが困難であるというさらなる問題がある.」 も、句点がないまま長い文章で、少し読みづらいと感じました。 ------------------------------------------------------------------ reviewer 2 ------------------------------------------------------------------ ■ 総合点: 4 ■ 確信度: 1 ■ 査読コメント:  打楽器の形状と,その形状が奏でるであろう音のスペクトル波形の両者を同 時に順方向,逆方向としてリアルタイムに変形できるようにするシステムは有 用性が高く,同時に基礎研究として価値が高いと考えます.デモビデオも拝見 しましたが,システムの完成度も高いと思います.  筆者らも認めておりますが,残念なのは,このシステムで得られた結果が, 現実とどこまで合致するかが分からないということです.もし採択されたなら, その部分の評価が少しでも加筆されると良い論文になると思います. ------------------------------------------------------------------ reviewer 3 ------------------------------------------------------------------ ■ 総合点: 4 ■ 確信度: 2 ■ 査読コメント: 著者らは,順解析及び逆解析を交互に利用可能なUIを利用した楽器開発支援ツールを提案している.提案しているシステムの目標自体は新規性及び有用性をもつものである一方,現時点での論文内容だけでは,アルゴリズムの高速化が主で,高速化によって対話設計が可能になった,という話でとどまっている.Possessing Drumsによるインタフェースの改良やエンジニアによる試用も記述されてはいるが,インタフェースデザインに関するさらなる議論を今後望みます. しかしながら,順解析だけでなく,逆解析に関しても実時間処理をおこなうことで提案できたインタラクティブシステム自体は新たな体験価値をもたらすことは間違いなく,その点は積極的に評価します. −− 採択された場合の発表内容、議論内容に対するリクエスト ・参考文献[1]に示されているように,梅谷らは任意の音を(ある程度)自由な形で演奏可能な鉄琴のための対話システムを提案していますが,これと著者らの研究では,本論文を読む限り,ターゲットユーザが異なるように思います.論文中では楽器設計プロセスの流れから紹介していますが,文献[1]はキッズワークショップやアーティストによる試用から評価・検討を行っています.対象となるユーザは楽器エンジニアだけではないです. ・デザイン支援として話をまとめたいのは理解できるのですが,結果として本研究をどのような現場で利用して欲しいのかがぼやけています.実装しているシステムは面白いものなので,楽器設計エンジニアだけではない本研究の価値付けにも期待しています. *下記は分野外からの意見ですので,理解に違いがあれば無視してください. ・著者らは楽器設計エンジニアによる試用を行っていますが,そもそもエンジニアからは自分の好きな形状で音を鳴らしたいと思うのでしょうか?例えば木琴や鉄琴等で,音色を調整したい場合は,著者らの示すような2次元的アプローチでなく,すでに決定した形から穴あけやくり抜きなどで,音色を調整することが一般的では無いでしょうか?もしそうだとしたら,現行システムの頂点操作ではない,他の手法も存在するのではないでしょうか? ------------------------------------------------------------------ reviewer 4 ------------------------------------------------------------------ ■ 総合点: 4 ■ 確信度: 2 ■ 査読コメント: 論点の根拠: 大変おもしろく、有用な研究であると思いました。 解析的なアプローチで古くから同様の研究は存じておりましたが http://www.math.udel.edu/~driscoll/research/drums.html モダンなアプローチで順/逆解析含めて設計インターフェースまで 実現されている部分が大変に価値高いと思います。 設計者のコメントもありましたが、市場で活躍するメーカーにとっても 有用で興味深いと思える研究だと思います。 有用性に対する補足的な評価として、他に転用出来る可能性も感じています。 例えば、小規模なスタジオ/リスニングルームにおいては 有周波数の設計は重要な要因となりつつありますので、 そういった応用も期待できると思います。 論文改善のためのコメント、疑問: 数式の記述として、数式4の右辺第二項の行数列数が合っていないように見受けられました。 また、そもそもどのような支配方程式を解析されたのかが不明ですので、補足されておくと さらによいと思います。 また、実際のドラム等の打楽器への応用を考えると 特に境界の支持条件も大変重要だと思います。(他にも、張力など) 今後/もしくは現在デモそういった要素を取り込んで行ける可能性があるか等 触れていただけるとよいと思います。 後、ソフトウェアの周波数特性の表示部分で 高次モード(7/8)でピークの位置と赤丸の位置がずれていましたが これは評価点の選び方によってずれて見える、といったところが原因でしょうか? 何か理論的な解釈が可能でしたら、触れていただいたほうが誤解がなく、よいと思います。 提案手法について、複数の手法の組み合わせであるため 何らかの解析限界があるのでは、と勝手ながら推測しております。 周波数特性の編集の仕方によっては形状関数が発散したり等はないのでしょうか。 もしある場合は、発表時でも安定となる条件(それが例え経験的なものでも) をお知らせいただけるとよいと思います。 また、Possessing Drumsの手法と組み合わせされており Possessing Drums自体の考え方は大変興味深く、 最終的な応用には大変有用な組み合わせかと思うのですが 例えば、順解析/逆解析の過程がPossessing Drums手法の誤差で 音色としてよくわからなくなる、ということはないでしょうか? 形状の最適化が目的であるならば、他の影響は極力排したほうが よいのでは、という印象も持ちました。 以上となります。