査読者1

(Primary)レビューサマリ

本論文は、スマートウォッチにおける日本語入力手法として、12キー配列の子音を一筆書きでなぞる入力方式 KanaShark を提案し、
その有効性を検証している。査読者4名の評価は (5, 5, 4, 5) で平均 4.75 と高く、採録と判定した。

フリック入力/子音タップ(トグル入力ではなく、子音を一つずつタップし単語を推測する)/提案手法の三条件を、
入力速度(CPM)、誤入力率(EPC)、NASA-RTLX、SUSスコアを評価、9名を対象に、10日間の評価を行っている。
その結果、1日目は提案手法は他手法に比べCPMが低いものの、10日目には他手法よりも素早くなっている。
さらにEPCも他手法に比べ優位に低いことが示されている。
NASA-RTLXやSUSスコアは他手法に比べて有意差はみられないものの中央値はもっとも低い結果であり、ユーザアンケートにより提案手法は実験参加者に好まれていることが示されている。

上記理由より、査読者らによる実験設計の評価も高く、有用性、新規性も認められている。

一方で、
・候補語推定アルゴリズムの説明が不足している点
・辞書に含まれていない語への対応
・初期段階では学習コストが高いため慣れるまでの負担が大きい点
・静的な室内実験にとどまっていることから動的な状況下では未評価な点
が査読者によって指摘されている。

また、論文誌推薦については査読者ら全員が認めることから、採録に加え推薦と判断しました。
(指摘の内、前者2点は可能であれば出版までに加筆いただければと思います。)

(Primary)採録時コメント

本論文は,スマートウォッチにおける日本語入力手法として,12キー配列の子音を一筆書きでなぞる入力方式 KanaShark を提案し,その有効性を検証している.提案手法を含む3手法を9名を対象とした,10日間の実験で比較しており,入力速度やエラー率において提案手法の優位性を示している.またNASA-RTLXやSUSスコアなども評価しており,実験結果やアイデア自体の有用性は査読者らによって高く評価されており,採録と判定した.

(Primary)論文誌として必要な改善点

・候補語推定アルゴリズムの説明が不足している点
・辞書に含まれていない語への対応
・初期段階では学習コストが高いため慣れるまでの負担が大きい点
・静的な室内実験にとどまっていることから動的な状況下では未評価な点

上記が指摘されておりますので、記述の改善、議論の追加が求められます。

総合点 (1: 強く不採録~6: 強く採録)

5

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

2

採否理由

新規性:スワイプキーボード自体はすでに提案されているが、携帯端末用の日本語子音配列かつスマートウォッチで実装・検証している点で新規性がある。

有用性:速度、エラー率ともにフリック入力に彼べ手優位に改善している。また、10日間の検証により子音タップ入力に比べてCPMが向上していることも確認している。スマートウォッチは常に装着し、日常的に利用されるデバイスであるため10日間の練習時間は特に問題なく思える。

正確性:実装方法やそのパラメータは十分に説明されている。

記述の質:特に問題は見られない。

改善コメント

単語等の推論に加えて、日本語の場合は助詞を入力したい場面が多いため、例えばフリック入力を組み合わせる方法があるとよいと思いました。どう切り替えるかは議論ですが。(「私は」であればよいですが、クアラルンプール「に」行った の「に」部分です。)

未来ビジョンにあるような方法で、大規模自然言語モデルで単語間の助詞を補完するようなシステムも大変よさそうです。

査読者2

総合点 (1: 強く不採録~6: 強く採録)

5

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

2

採否理由

スマートウォッチ上の文字入力において、キーパッド上で入力したい単語のすべての子音を一筆書きでなぞる方法を提案しています。
方法としては、単語と単語を一筆書きで書く場合の理想的経路を辞書として作っておき、その辞書と、いま入力された一筆書きを比較するようなアルゴリズムをとっています。

提案は査読者の調べた限り新奇であり、比較的丁寧な実験が計画され、評価されています。スマートウォッチ上の文字入力の方法の一つとしてWISSで発表されることに一定の価値があると思われますし、議論の余地があるので、ワークショップとしての趣旨にあっているとも思います。

論文で改善を要する部分としては、方法についての記述が正確でない部分についてです。なかでも重要なのが、候補語推定アルゴリズムについてです。3.3の記述と図3の説明がどのように対応づくのかがよくわからないです。図3においては3番目に各単語の頻度スコアを取得とありますが、候補となる単語の頻度スコアが必要となるのは形状スコアおよび位置スコアによって候補単語が選ばれた後とするのが適当だと思います。そのようなふるいわけをせずに辞書内のすべての単語について尤度を求めるのでも良いですが、図としてミスリードです。スコアは3つが独立して計算されるのですから直列に並ぶのではなくて並列に並ぶのでは?
形状スコアPs, 位置スコアPi、頻度スコアPfをどのように求めるのかについてもよくわかりません。ここは提案の根幹をなす部分ですから丁寧な説明が求められます。

細かいことですが、SHARK^2はSHARK^2であってSHARK2ではないと思います(2は上付き文字)。上付き文字を書く困難さはわかりますが、元の著者への敬意を示す意味も込めて、表記可能なところではSHARK^2と書くべきだと思います。

改善コメント

今後の課題にもありますが、辞書にない単語についてどのように扱うのかは必ず議論すべきポイントだと思います。同様に日本語でない英語入力と混在する文章をどのように入力すべきかについても議論できると思います。

図6においては、CPMにおける外れ値として提案法で100CPMを超えるようなユーザがいました。このように提案法に慣れているユーザについて、インタビュ調査などで意見を聴取することはあっても良いと思います。ちなみにこのユーザはSUSにおいて外れ値となっているユーザと同様でしょうか?

画面のレイアウトの変化に対して、この方法がどのように反応するのかについても興味深いです。すなわち、入力画面のサイズとアスペクト比、ボタンのサイズとアスペクト比に対してどのように入力が変化するのかは面白い観点だと思います。その観点でフリック入力や子音タップと比較するのも良いと思いました。

査読者3

総合点 (1: 強く不採録~6: 強く採録)

5

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

2

採否理由

ローマ字入力で広く使われている一筆書き手法を日本語向けにカスタマイズし、その有効性について3手法の比較評価がなされており大変意義深い研究であると感じました。関連する研究との比較も十分にされており、shark2などのラテン語文字圏で主流の一筆入力を日本語に導入するという目的も他研究との差分を明確に示されていると考えます。実験より得られた入力性能はフリック手法と比較して入力性能・ユーザビリティともに期待される結果であり、今後の発展が期待される有用な結果であったと考えます。全体通して、必要な情報が正確に示されていました。ぜひ、議論にもあるような、より長期的な学習による習熟度の変遷や実用環境調査を含め、社会実装に向けたシステム改善を期待しております。研究発表により、様々な観点からの改良・議論が行われることを期待し、採録判定としました。

改善コメント

入力ミスや時間のかかる単語の特徴や経路が明らかになっている場合、ぜひ議論に含めていただければと思います。研究の方向性として、片手での入力が実現可能であるのか興味があります。つまり、手首の傾きによって、軌跡を再現することで同様の入力が可能であるのか、検討していただき、議論可能であれば論文に含めると良いでしょう。より小さなコメントとして、学習曲線において、子音タップ入力とkanasharkがday4で逆転しているのが興味深かったです。例えば、初期学習は子音タップで行い、適切なタイミングでkanasharkに移ることで、学習効率を上げることができるのでしょうか?これは議論として含める必要はないと思いますが、ぜひ検討していただければと思います。

査読者4

総合点 (1: 強く不採録~6: 強く採録)

4

確信度 (1: 専門外である~3: 自身の専門分野とマッチしている)

3

採否理由

1. 新規性
・スマートウォッチの12キー配列上で日本語単語の子音のみを一筆書きでなぞることで入力する「KanaShark」という独自のジェスチャ入力手法を提案
・従来の日本語入力手法(フリック入力や子音タップ入力)や子音ジェスチャ入力と比較して,SHARK2やSwypeで用いられてきた経路全体の形状から単語を確率的に推定するアプローチを日本語12キー配列に応用した点
・曖昧な入力にも対応できる確率的推定アルゴリズムを導入した点
2. 有用性・正確性
・10日間の継続評価実験において、学習効果が顕著であり、習熟後はフリック入力手法よりも有意に高速かつ誤入力が少ない(最終3日間の平均CPM:KanaShark 72.3、フリック入力 58.4、EPCもKanaSharkが最も低い)
・ユーザのジェスチャ経路のずれを許容することで,スマートウォッチのような小画面環境でも高い入力効率と正確性を実現
・主観評価でも、参加者の多くがKanaSharkを好み、「慣れれば最も速く入力できる」「多少ずれても意図を汲み取ってくれる」点が評価されている
3. 論文自体の記述の質
問題ありません

改善コメント

いずれも将来の展望で述べられているので,実際に多くの参加者と下記の点を議論いただければと思います.
・初期学習コスト・習熟負担の高さ
習熟後に高い性能を示す一方で,初期段階では学習コストが高く,操作に慣れるまで負担が大きい点は課題

・未知語・固有名詞への対応
辞書に存在する語による短文入力が中心であり,未知語や固有名詞,文脈依存語彙の入力には未対応
未知語入力や辞書拡張機能をなどについての具体的展望などが示されるといい

・実利用環境での評価
実験は静的な環境で行われており,歩行中や公共交通機関内など動的な状況でのロバスト性や使い勝手は未評価である点