-----------------------------
review comment 1
-----------------------------
■ 総合点
4
■ 確信度
2
■ 査読コメント
インタラクティブに作詞を支援するインタフェースの提案である。従来システムではユーザの意図を反映した作詞が難しかったが、この支援インタフェースを用いることで簡単に作詞が体験できる。システムの実装も丁寧にされている。関連研究の調査もしっかりされており、本研究の位置づけも明確であるため、とても読みやすい論文に仕上がっている。

様々な分野で創作活動をする人が急速に増えているが、創作活動をやりたいすべての人が作詞をすることができるとは限らない。しかしこのような支援は難しく、少しずつユーザの求める箇所を「うまく」支援していかなければ、ユーザの創作を支援したことにならない。著者らの未来ビジョンにはまさにそのようなことが書かれており、著者らも意識してシステム設計をしたと考えられる。さらに加えて最初は初心者へのほぼ自動での提案であっても、徐々に支援する箇所を減らしていくなどのユーザの成長に合わせた支援の工夫ができるとより良いシステムへとなるのではないか。システムが自動でユーザのレベルを推定して、とできると良いと思うが、せめて初心者モード、中級者モード、上級者モードなど最初に選択して、ユーザ自身のレベルに合わせた支援ができると良いと思う。

以下、疑問点。
・作詞の際に考慮する事項として「押韻」というのもあるが、今回は考慮しているのか?押韻の考慮もすることでさらに良い歌詞が推薦されるようになるのか?

・歌詞の良し悪しはある程度自動で判断できるものなのか?完全に人間の主観によるものなのか?

・1番とかなり似たような2番が推薦されることもあるのだろうか?もしくは、近似距離など定義していて、似すぎているものはそもそもシステムから推薦されないようになっている、などの工夫がしてあるのか?

論文を読んでいて気づいた点を以下に挙げる。カメラレディを作成する際の参考にしてください。
・「モーラ数」は楽曲に縁のない人には聞きなれない単語なのでもう少し丁寧な説明があると良いのでは? 「モーラ数」と「モーラ数列」が出てくるがどちらかに統一すべきものか?それとも「数」と「数列」で使い分けているのかがよくわからない。


「作詞初心者における評価実験を行い、提案手法の有効性を調べる予定である」とあるので実験結果にも期待できる。登壇発表の他、ぜひデモ発表でも展示していただき、会場で触れるようにしてほしいと期待する。
■ レビューサマリー
論文として読みやすく、関連研究の調査や位置づけも明確にされています。一方で、本当に一般の人に使えるシステムであるか、きちんと支援できているのかどうかは不明確です。すでに評価実験済みであれば追記してください。また、結果として示されている例が少ないため、システムがきちんと動作しているか疑問があります。未来ビジョンを削除してでも例を追加をすることをお勧めします。



-----------------------------
review comment 2
-----------------------------
■ 総合点
3
■ 確信度
2
■ 査読コメント
歌詞制作支援インタフェースとして、歌詞の大局的構造を考慮して、作詞家(初心者)の支援を行うことを目的としたシステムの提案です。論文とビデオのぱっと見の印象は良いのですが、一方で細かく見ていくと全然内容が分からない部分があることに気付きます。

- 例えば、「大局的」が意味するところの具体的な範囲が分かりません。現状、ブロック要素と、形態素パターンが大局的の根拠かと思いますが、そこにストーリー要素というのが入ってきて、これが大局的な要素なのかどうかがわかりません。

- 「2番の歌詞制作では、1番の形態素パターンと類似させることが多い。」としていますが、根拠を示してください。

- ストーリー要素について図5Aを見る限りでは要素は10個しかありませんが、これで全部でしょうか。また、これは十分な数でしょうか。

- あるブロックの役割がAメロなのか、Bメロなのか、サビなのかは考慮していないように読み取れますが、それで正しいでしょうか。また、その場合、あるブロックの楽曲中の役割を考慮することも大局的な観点からは重要かと思いますが、考慮しなくても良いのでしょうか。

関連して、行毎の関連性については考慮しなくても良いのでしょうか?「生成された2番のAメロ」の例を見る限りでは、行毎に文脈が異なっており、意味を成していないと思います。

- 実装の部分で「3.3 ストーリー要素のモデル化」について、学習に利用したデータセットについて言及がありません。

あと、そもそもなのですが、この作曲支援インタフェースは楽曲があって、それに対して歌詞を付けることを想定されているのでしょうか。そうでなければモーラ数を考慮する必要がないと思います。楽曲の存在を想定するのかどうか、これについて明記されたほうが良いと思います。

最後に、今回提案手法を利用されて実際に作った作詞例が論文とビデオで合わせて2例しか示されていなかったことは残念です。本研究においては作詞支援が目的であり、制作された歌詞の質は問題としていないのかもしれませんが、一方で、論文を読むほうとしては結果がどうなったのかが気になります。

提案ですが、現状の「未来ビジョン」は本文を要約しただけで、強く言えばスペースが無駄になっています。これを削除して、作例を入れてみてはどうでしょうか。

まとめますと、気持ち的には3.5点という感じで、採録が相応しいとまでは言えませんが、不採録になるような内容ではないと思います。一方で、上述した例のように、読者から見えにくい部分で制約も多い提案になっているように思います。このため判定としては3点とします。



-----------------------------
review comment 3
-----------------------------
■ 総合点
3
■ 確信度
1
■ 査読コメント
概要:本論文は、歌詞の作詞を専門知識を持たない一般の人々でもできるようにするための支援インタフェースを提案している。歌詞の構造、モーラ数、形態素パターン等を指定すると、それに合う歌詞を推薦し、ユーザがそれを修正することで作詞ができるようになっている。下記に示すように、本論文で対象としている一般ユーザに対して適切なインタフェースが提案されているかどうか、また歌詞生成アルゴリズムが適切であるかどうかの判断ができないため、積極的にサポートすることは難しいと考える。

新規性:査読者は音楽情報処理に関しては専門でないため判断は難しいが、著者らが主張するように全自動の歌詞生成、歌詞の用例辞書ではできないことを実現していることは確かなようである。また、既存の作詞支援インタフェースではなかった、抽象的条件に対応した歌詞生成が行える点も差分として示している。

有用性:本システムを実際に一般の人に対してユーザスタディを行ってはおらず、有用性は現時点では判断できない。

正確性:実装において示されている、形態素パターンの生成、歌詞生成手法は、比較的大きな歌詞コーパスから指定したパターンに対して生起確率の高い歌詞を生成するもので、想定上は妥当なものと考えられるものの、生成された歌詞の妥当性を評価していないため、適切なアルゴリズムであるかを判断することができない。

記述の質:本文は理解しやすく記述されており、記述の質は高い。