査読者1

(Primary)レビューサマリ

本論文は制作工程に着目して,漫画家が使用することを想定したネーム制作の支援システム「NameGen」を提案している.
漫画制作工程を分析したうえで,「1. 漫画全体のシナリオを書く」,「2. シナリオをコマに分ける」,「3. コマ割りをする」,「4. ラフスケッチと吹き出しを描く」,「5. 仕上げを行って実際の漫画を描く」の5つの工程のうち,2と4に対応した部分をシステム化し,複数の手法を提案したうえで「NameGen」を評価している.

研究としての新規性や将来性は認めつつも,「システムの目指すべきゴールなどが不明瞭」,「コマ割りのとらえ方なども明確ではない」ため,この辺りを特に明確にする必要がある.そのため条件付き採録としたい.

以下評価できる点と課題がある点を示す.

評価できる点
<新規性>
・ネーム制作支援をするシステムであり、ネームのコマ分割および吹き出し配置の生成を可能としている.
・セリフの吹き出しに注目し、最適化を試みているところ(コマの画像のデータベースからの類似度で吹き出しを似た位置に配置する手法)
・開発されたシステムは、LLMの利点を有効活用した設計である
<有用性・正確性>
・漫画会社にヒヤリングをして、漫画制作プロセスを述べたうえで議論しているところ
・漫画のシナリオに対し、漫画のラフを再構築し、比較・軽く実験している点

課題がある点
<有用性・正確性>
・本研究で対象とした工程の間に「コマ割り」があり,コマ割りによりコマの大きさや形などが異なるため,提案手法はかなり限定した条件下での実験になっており,著者の言う,実際には使えない研究になってしまっている
・本研究で対象としないのは「Limitation」の一つとし構わないが,せめて実験ではどのようなサイズのコマに対して生成したかについて述べるべき
<論文自体の記述の質>
・ゴール・思想がわかりずらいため,この論文の有用性がぼやけてしまっている(例えば,ネームは全自動でできるべきかシステムと対話しながら作られるべきか)
・吹き出しについての分析や言及は論文中で多くされているものの,コマごとのシナリオ分割についての具体的な分析・評価はあまり記載されていない
・3.2節で記載している提案手法以外の2つの手法について述べた後に、4.2節では実際の原稿とNameGenとの比較を述べていて読者は本手法の有用性を判断しづらい
・4.3にて図5を根拠にNameGenを他の手法より優れていると述べているが、図5のNameGenのコマを見ると,吹き出しの位置はあっているが,喋っているの位置があべこべになっている
・システム改善への道筋・議論がより詳細に述べられるとよい
<軽微な問題>
図3と4が順番逆で分かりにくい
NameGen/NamgeGenでのタイポあり

これらを踏まえ採録の条件として下記の8点を挙げる.
これらの条件を何らかの形で満たすことで条件付き採録と判定する.

(1)本研究ではコマ割りについては対象にしていないが,コマに対してラフスケッチと吹き出しを記載しています.そのため今回はどのようなコマを想定してラフスケッチを書くように実装を計画したかを明確にしてください.画像サイズ(縦横のピクセル数)などの記載があればよいかと思います.もしそのサイズにした理由があればそれも記載してください.
(2)初めにの箇条書きの後の「LLMを用いてシナリオから漫画生成を行う研究は, シナリオとは別にレイアウトを入力する必要がある研究[25] と吹き出しの生成ができない研究[11] しか存在せず,漫画制作の支援として使用することはできない.」の一文は,上記のコマ割り工程で分断されていることから,本研究も「ネームのコマ分割」と「吹き出しの配置」を別々にしている研究となっています.先行研究の記載の「漫画制作の支援として使用することはできない.」は削除するか表現を検討してください
(3)漫画家が本研究を漫画を書く際にどのように利用していくことを想定して設計しているのかを,「はじめに」または「課題と改善の方向性」の中で示してください.本研究がその想定通りに実装できている場合は「はじめに」に,そうでない場合は「課題と改善の方向性」に示すとよいです..
(4)「シナリオをコマに分ける」機能についての分析や評価についてに記載がないので,短くてもいいので記載をしてください.
(5)4.3にて図5を根拠にNameGenを他の手法より優れていると述べているが、図5のNameGenのコマを見ると,吹き出しの位置はあっているが,喋っている人物の位置があべこべになっている.その状態でも他の手法より優れているように補足する(ここでの評価は吹き出しの位置のみに限定しているので,話者が間違っている点は考慮しないなど)か他の例に差し替えてください.
(6)「課題と改善の方向性」について,議論が不足しています.(上述した条件と重複する可能性もありますが,)「シナリオをコマに分ける機能」「話者が間違っているケース」等にも言及して,システムの改善への道筋をできるだけ具体的に記載してください.
(7)図3よりも4が先に紙面に掲載されるため,図4にも「左の画像が漫画家が書いたネーム, 右の画像が生成されたラフスケッチと吹き出し.」のような説明がないとわかりにくいです.順番変えるのが難しければ図の見方を短い文章でもいいので補足してください.
(8)「概要」のところで,NameGen/NamgeGenのタイポが確認されています.

(Primary)採録時コメント

本論文は漫画制作工程の分析に基づき,シナリオ分割と吹き出し配置を支援する新規性あるシステムを提案している.対応した制作工程が限定されており,コマ割り工程への対応や実用に際しては質の向上が望まれる.有用性については課題が残るものの,LLMを有効活用した新規性のある手法である点を評価し,条件付き採録と判定された.

(Primary)論文誌として必要な改善点

判定理由で課題があるとされている点について追加や修正が必要と考えます
<有用性・正確性>
・本研究で対象とした2つの工程の間に「コマ割り」があり,コマ割りによりコマの大きさや形などが異なる.そのため,提案手法はかなり限定した条件下での実験になっており,著者の言う,実際には使えない研究になってしまっている・
・本研究で対象としないのは「Limitation」の一つとし構わないが,せめて実験ではどのようなサイズのコマに対して生成したかについて述べるべき
<論文自体の記述の質>
・ゴール・思想がわかりずらいため,この論文の有用性がぼやけてしまっている(例えば,ネームは全自動でできるべきかシステムと対話しながら作られるべきかなど,著者の考えるゴールを明確に示すとよい)
・吹き出しについての分析や言及は論文中で多くされているものの,コマごとのシナリオ分割についての具体的な分析・評価はあまり記載されていない.この評価を議論を加えるとよい
・3.2節で記載している提案手法以外の2つの手法について述べた後に、4.2節では実際の原稿とNameGenとの比較を述べていて読者は本手法の有用性を判断しづらい.実際の原稿とNameGenとそれ以外2つの方法を同様に比較することが望ましい.
・4.3にて図5を根拠にNameGenを他の手法より優れていると述べているが、図5のNameGenのコマを見ると,吹き出しの位置はあっているが,喋っているの位置があべこべになっている.上記のように,可能な限り多くの画像を3つの手法と漫画家の記載と比較し,望ましい結果を得られている事例を示せるとよい
・システム改善への道筋・議論がより詳細に述べらるとよい

総合点 (1: 強く不採録~6: 強く採録)

3

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

3

採否理由

新規性
・漫画制作プロセスの中でも「シナリオのコマ分割」と「コマ内要素(ラフスケッチ・吹き出し)の自動配置」に焦点を当てた支援システムを提案
従来研究の多くが「画像や映像からのコマ割り」や「テキストからの漫画画像生成」にとどまっていたのに対し,本研究はシナリオ分割とコマ内配置の自動化に踏み込んでおりキャラクタがいないコマの生成や,吹き出しを右に配置する例などが実現できている.

2. 有用性・正確性
実際の漫画原稿を用いた実験を行い,一定のレベルのラフスケッチと吹き出し配置が自動生成できることを示している
先行研究との比較ではないが,著者らが考えた他手法との比較実験も行われており,多様な吹き出し配置が可能であることや,標準的な配置だけでなくバリエーションも生成できている.
一方で,著者が示す制作工程で,今回実装した2つの工程の間にまたがる「コマ割り(ページ上でのコマの分割・レイアウト)」工程には未対応であり,展望で先行研究の利用などが述べられているものの,本研究の実験においてのの扱いについての議論がやや不足しています.現状の実装と実験において,具体的にどのようにコマ割りを行ったか記載が必要と思います.

3. 論文自体の記述の質
一部,レイアウトの制約方図の順番が前後し,その結果わかりにくい図になっている点がありますので修正が必要かと思います.
全体的には問題はないと思います.

改善コメント

マンガの工程の中の「コマ割りをする」工程に対応していない点は課題が大きいと思います.提案手法を分断してしまっており,本来であれば手法が二つの作業に分割されてしまうかと思います.また実験においてそれらをどのように扱ったかが書かれていないのが気になります.
基本的に,この部分が現時点では手作業であったり,定型的なコマに対してのみ対応したものであっても,十分価値のある研究であると考えるが,それでもコマ割りを利用者がどのように指定したかや,どのようなコマに対して生成したかの言及は必要と思います.(それが手間のかかるものであった場合は,先行研究同様に「漫画制作の支援として使用することはできない」となってしまうのではないか?と思います)
本研究ではすべて同じサイズのコマとして扱ったのだと推察しますが,その場合は,「シナリオのコマごとへの分割」はともかく「セリフの配置」については,定型のコマに対する配置というかなり限定的な成果になるのではと思います.
展望ではコマ割りの将来的な実装については言及しているので,今回の実装でコマ割りをどのようにしたかだけ説明すれば,実現できることは限定されますが,十分に価値のあるものになるかと思います.

些細なことですが,図の配置の関係で,図3よりも図4が前に来ています.そのため,図4の4つの絵に対する説明がないためわかりにくいです.
(左が漫画家のラフで右が生成された絵だと思いますが)図4の位置を図3よりも後ろになるように調整するか,図3の脚注に少し説明を入れるか工夫するといいと思います.例:左の絵下に(a)右の絵の下に(b)とつけ,「図 4. ネームの生成がうまくいかない例(それぞれ左が漫画家によるラフスケッチ,右が生成結果)」などとするといいかと思います.

査読者2

総合点 (1: 強く不採録~6: 強く採録)

5

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

1

採否理由

漫画のネーム制作に着目し、コマ分けおよびラフスケッチ・吹き出し描画の支援を目的としている提案手法は、漫画制作の効率化という点で大変意義深い研究であると感じました。また、手法の研究位置、他研究との差分が関連研究で丁寧に説明されていました。評価にも含まれている3手法の比較によって開発されたシステムは、LLMの利点を有効活用した設計であり、大変面白かったです。一方、システム改善への道筋・議論がより詳細に述べられていると、読者にもたらすインパクトは大きくなるでしょう。全体として、漫画家の漫画制作のために重要なネーム制作に着目し、綿密な設計と実験によって得られた結果は、高い実用性と将来性を感じる研究であると思います。創作支援におけるLLM活用のロールモデルとして広く読まれるべき論文であると考え、採録判定としました。

改善コメント

画像生成のミスやLLMの精度に関する議論が不足していると感じます。3.1.2で述べられているように画像生成精度には、各ステップのプロンプトが複合的に影響しているように予想されます。ミス画像とそうでない画像の時を比較することで、ステップごとの精度や課題を明らかにすることや、比較手法との差分から導かれる考察などをより議論されるのが良いと思いました。そのほか、漫画家目線からの評価などを収集できている場合、ぜひ、議論に追加していただきたいと思います。
本手法はシナリオのみを入力とする点で、実用的ですが、その要件やクオリティについて言及されていないように思います。ユーザには入力として、どの程度の具体的なシナリオや情報をプロンプト生成する必要があるのか、参考となる情報や要件を説明されると良いと思います。

査読者3

総合点 (1: 強く不採録~6: 強く採録)

4

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

1

採否理由

描きたい漫画の内容についての文章から、幾つかの画像に分けて並べ、その上にセリフなどを配置する研究です。

新規性:
先行研究にたいして、セリフの吹き出しに注目し、最適化を試みているところが差分になっています。
吹き出しのアルゴリズムについて幾つか提案し、最終的に、コマの画像のデータベースからの類似度で吹き出しを似た位置に配置する手法を取っています。
また、漫画会社にヒヤリングをして、漫画制作プロセスを述べたうえで議論をしています。

有用性:
既存の漫画のシナリオに対し、提案手法で漫画のラフを再構築し、比較・軽く実験している点はとてもおもしろいです。

ただ、この研究が目的としているゴール・思想がわかりずらいため、この論文の有用性がぼやけてしまっている気がします。例えば、ネームは全自動でできるべきなのでしょうか。それともシステムと対話しながら作られるべきなのでしょうか。

正確性:
実験の分析に疑問が残ります。
4.3にて図5を根拠にNameGenを他の手法より優れていると述べていますが、図5のNameGenのコマを見ると、喋っている人と吹き出しの位置があべこべになっています。(「創太くん、これ何?」と喋っているのは女の人だと推測されますが、男の人が喋っているような配置になってしまっています)
これから考えられることは2つあり、

1. 実は図5についてはNameGenより生成画像の吹き出し位置を利用する手法のほうが優れているのではないかということ

2. そもそも、画像生成用プロンプトの生成もしくはStableDiffusionでの画像生成プロセスに問題があること

どちらかもしくは双方に問題があるように感じます。

記述の質:
とても良くかけていると思います。ただ、図4と5が順番逆で、読んでて戸惑いました。
幾つか、タイポが含まれます。NameGenでしょうか?NamgeGenでしょうか?統一をお願いします。

結論:
正確性には難があるものの、研究の内容としてはおもしろく、よく書けていてWISSでの議論が活発になりそうな研究なため、以下のような評価としました。

改善コメント

採否理由にも書きましたが、この研究の目指すところを明記したほうが良い気がします。

例えば、「シナリオを書けばあとは全自動でラフまで出す(制作者はラフに対して意見を言わなくていい)」なのか、「シナリオを書いたあと、システムと対話しながらより良いラフを生成していく(制作者は積極的にシステムに干渉していく)」なのかを読者に提示して、議論を進めると親切なのかな、と思いました。
でないと「5 課題と改善の方向性」について、「生成結果の中から最も良いものを人の手によって選んでる」点が課題なのかどうかも読者はわからないような気がしています。

こういった議論を増やして、実装については記述量を減らしてもいいのではないかと思います(特に3.2章は端的にNameGenの差分だけ述べればよいのではないでしょうか)

査読者4

総合点 (1: 強く不採録~6: 強く採録)

3

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

2

採否理由

提案されたシステムは、ネーム制作支援をするシステムであり、ネームのコマ分割および吹き出し配置の生成を可能としている。提案手法は大変興味深く、今後の研究の発展も期待できると考える。
他方で、論文としての可読性については改善すべき点が多々あると考える。
特に3.2節で記載している提案手法以外の2つの手法について述べた後に、4.2節では実際の原稿とNameGenとの比較を述べていて読者は本手法の有用性を判断しづらい。
また、吹き出しについての分析や言及は論文中で多くされているものの、コマごとのシナリオ分割についての具体的な分析・評価はあまり記載されていないように見受けられる。

改善コメント

まず、3.2節と4.3節で述べている他の2つの手法については、1つの章でまとめ、整理して記載されることを推奨する。
次に、本論文で主張したい点を明確に定め、論文全体の構成を見直していただきたい。具体的には、図3で「左側に吹き出しを配置できた例」や「人物がいないコマでの吹き出し」を主張されているが、この点について4章より前では言及されておらず、有用性、新規性が本論文からでは把握しきれない。おそらく先行研究や既存技術では解決していなかった点を解決していると考えられるため、その点を明確に論文内に示した上で記載されると、論文としての価値、本研究の有用性が判断できると考える。