COMPANY:株式会社ニゴロデザイン

SERVICE:speechEngine SDK 

INTERVIEWEE:植村様、高橋様

 

 

導入した目的:Nintendo Switch用ゲーム「カブトクワガタ」のテキスト読み上げの実装

今までの課題:リアルタイムでスムーズにテキストを読み上げさせることが難しかった

導入後の効果:開発の効率化と多くのユーザー様からアクセシビリティ観点で評価を頂けた

 

2023年3月15日、ついに発売となったコロコロコミック発の甲虫バトルゲーム「カブトクワガタ」!制作を手掛けたのは、過去子供たちの間に昆虫ブームを創り出した、あの「甲虫王者ムシキング」の開発経験者の方々です。今回は企画ディレクションを担当した植村様と、株式会社ニゴロデザインで技術ディレクションを担当した高橋様の両名にお話しを伺いました。

 

>>>「カブトクワガタ」販売ページ

 

 

※(左)植村 比呂志 様  

※(右)高橋 剛 様

 

 

20年の時を経て、新たな虫ゲームのブームを

-まずは「カブトクワガタ」のローンチおめでとうございます。改めて、本作について教えてください。


植村:ありがとうございます。「カブトクワガタ」は自然界に本当に存在するカブトムシやクワガタムシを集めたり、育てたりすることで、虫の生態を深く学べるゲームです。元々カブトムシやクワガタムシは、小学生に人気がある生き物で、「甲虫王者ムシキング」当時から小学館様とプロモーションなどの取り組みを行っていましたが、今回「そろそろ次の昆虫ブームを起こせるのでは。一緒にやりませんか?」とお誘いを頂いて本作の開発に至りました。

 

 

-開発体制や人数、規模などは「甲虫王者ムシキング」の頃と比較してどのように変化していますか?

 

植村:最新ゲーム機のNintendo Switch向けは開発規模が大きくなるというイメージを持たれるかもしれませんが、本作はインディーゲームの枠組みなので、小規模な体制で制作を行いました。昔と比較しても、あまり変わっていないと思います。

 


-そうなんですね。今回の開発メンバーは当時「甲虫王者ムシキング」を担当されてたメンバーもいらっしゃるのでしょうか?


植村:はい。「カブトクワガタ」の話が立ち上がった時、「甲虫王者ムシキング」の開発経験者であった高橋に相談しました。高橋はNintendo Switchの開発経験があり、相談した結果「ぜひやりましょう」ということになったんです。ですから技術的な内容は高橋にディレクションをお願いしています。今回の「ReadSpeaker」の音声合成エンジンも、元々見つけてきたのは高橋です。

 

-そうだったのですね。どのようにして「ReadSpeaker」を知ってくださったのですか


高橋:音声合成エンジンは何社かある中で、まずNintendo Switch上でリアルタイムで動くことが条件だったこと、そして聞かせていただいた中で感情もうまく表現できていると感じました。それで、私のほうから植村に提案したんです。アプリ制作で「ReadSpeaker」の音声合成エンジンを使いたいと以前から思っていたのですが、予算の都合もあって問い合わせまでには至っていませんでした。ただ、今回は明確に植村からも音声合成で読み上げる、ということを前提として伺っていたので、すぐに「ReadSpeaker」へ問い合わせました。

 

 

-ありがとうございます。「甲虫王者ムシキング」の時から音声合成での読み上げを採用されているとお聞きしましたが、その時のお話もお聞かせいただけますか。


植村:昔「ゲームボーイアドバンス」という任天堂のポータブルゲーム機向けに「甲虫王者ムシキング グレイティストチャンピオンへの道」をリリースさせて頂きました。その時に「上手く文字が読めなくて、プレイしづらい」というご意見を頂いたことがありました。それによって、小学低学年から未就学児童の方々にも沢山遊んでいただいていることがわかったのと同時に、彼らの年齢だと文字の読解がまだ追い付いてないことに気付きました。この経験を活かして、次にNintendo DS向けに「甲虫王者ムシキング グレイティストチャンピオンへの道2」を開発することになったとき、なんとかして文字を読み上げたいと思ったのですが、フルボイス収録では容量が足りない問題があって、そこで音声合成エンジンを使う発想に至ったわけです。当時は別の音声合成エンジンを使っていましたが、好評を頂く事が出来ました。

 

 

「ReadSpeaker」だから実現できた、読み上げ品質

-ネットでも話題になっていますが、今回はアクセシビリティの観点でユーザー様から評価されていると思います。ここに関して感想をお願いします。


植村:はい。元々の原点は、文字がまだスムーズに読めないお子様のために実装したのですが、お恥ずかしながら視覚にハンデをお持ちの方などに向けてのアクセシビリティといった発想はありませんでした。今作では、狙ったわけではないものの、そういったユーザー様から評価を頂けて本当にありがたいと思いました。感覚的に想像すると、例えばUIが全て難解な英語で、理解できない状況に似ているのかなと思います。どこの何を押したり操作したりすればいいかわからないストレスがあるとゲームとしては良くないです。読み上げは色々な使い方があると思いますが、ゲームで特に重要なのはUIを読み上げてくれることなのかなと。これは何のボタンなのかとか、そういったことを説明することが重要だし、それが全部できているゲームは世の中まだあまり無いと思います。

 

 

たしかに、実際ユーザー様の配信実況を見ましたがとても親切な読み上げの使い方だなと思いました。


高橋:そうですね、だからリアルタイムでの読み上げが重要でした。かつ音声を返すレスポンスも良いのでストレスフリーな読み上げが実現できたと思います。また、開発状況に応じて柔軟に編集が可能なことも大きいですね。ボタンの内容も開発が進むにつれて変わることは日常茶飯事ですので、毎回ボイス収録していたら大変です。音声合成であれば開発状況に関わらず柔軟に調整ができます。実際、今作でもマスターアップの2日前まで調整をしていました。声優さんを使ってボイス収録する場合は最低でもマスターアップの3カ月くらい前には収録を終えてないといけないので。

 

 

-なるほど。弊社の音声合成を使った感想を詳細に教えてください。


植村:非常に良かった点と課題が二つ明確にあると思いました。まず非常に良かったのは、読み上げのAIの精度がこの20年間で劇的に進化しており、「ReadSpeaker」ではそれが実感できたことです。20年前、DSに実装した音声合成は本当に棒読みで、イントネーションを自分で変更することもできなかったです。「ReadSpeaker」の場合、日本語を入れると、ちゃんと日本語のイントネーションで読んでくれます。反対に、改善点があるとすればエンタメ向けの感情表現のバリエーションがもっと欲しいと思いました。例えば、ゲームであればキャラクターが「バトルなどで叫ぶ」ということがよくありますが、喜怒哀楽の表現に加えて叫ぶニュアンスもあればよりキャラクターの表現が豊かになると思っています。誤解がないようにお伝えすると、一切叫ばすことができない、ということではなくそれっぽくテキストを編集したりとか調整を加えることで実現することは可能だと思うのですが、例えばワンクリックで簡単に文章を叫ばせる、というようなことが難しいということです。「ReadSpeaker」のAIが優秀だからこそもっともっと求めたくなってしまいます(笑)。

 

ゲームにおける音声合成の利活用と作品の展望

正直なご感想をありがとうございます。今後の開発の参考にいたします。ちなみに、何か音声合成をゲームで使うにあたって相性の良いゲームのジャンルなどはありますか?

 

植村:まず1つ目は、キャラクターや何かしらのスペックを読み上げることが頻繁にあるゲームですね。「カブトクワガタ」のように図鑑にたくさん昆虫のスペック情報が登録されて、そこを頻繁に確認するようなゲーム性はとても相性が良いと思います。適切に速いテンポでテキストを読み上げる必要があるものは非常に向いております。UIでの説明が非常に多いゲームも含まれると思います。他にも、リアルタイムでゲームの進行内容が切り替わるもの、例えばスポーツなど実況が入るゲームなども相性が良いですね。一方で、RPGなどキャラクター性がとても重要なゲームやメジャーなIPはどうしても世界観を守るために声優を一貫して使う必要があったりするのでそこをリプレイスするのはまだ難しいでしょう。ただ、ゲームの中でも声優と音声合成のパートを使い分けるという使い方は可能になってくると考えています。ただし、音声合成を使うとCPUのリソースを割くので、トレードオフはあると思います。

 


-なるほど。開発コスト面からみてインディーゲームも全般的に相性は良さそうだとも思いますがいかがでしょうか。

植村:そうですね。小さいお子様は有名声優さんの声ってそこまで求めてないことが多いと思います。これが10代になってくると、我々の業界ではCVとよく言いますが、誰が声を当てるかを重視されるユーザー様が増えてきます。

 

 

-わかりやすいですね。最後に、カブトクワガタの今後の展望があれば教えてください。


植村:まずは虫を追加していきます。そして、ストーリーの続きを作り、マップを拡大させて、新しいキャラクターも登場させたいと思っています。新キャラなので新しいキャラクター性を持たせたいですし、1年後にもしそれを作るとしたら、音声合成エンジンでの読み上げも進化していて欲しいですね。御社の開発予算を10倍くらいにしてもらって凄い音声合成エンジンを作ってください(笑)。

 

 

ご期待に応えられるようがんばります(笑)、ありがとうございました!

 

 

音声合成/読み上げについて 

「合成音声」や「AI音声」は、音声合成技術の一般的な呼称で「音声読み上げ」や「読み上げ」は、文章を読み上げる機能を指します。これにより、ユーザーは文章を目で読む必要がなく、音声によって情報を受け取ることができます。「ReadSpeaker(リードスピーカー、旧VoiceText)」は高品質の音声合成エンジンを提供する世界的リーディングカンパニーで、自然な音声を生成するために機械学習やディープラーニングなどの最新技術を駆使しています。 

 

>>>お問い合わせはこちらから

 

 

ReadSpeakerについて

「ライフケア」「情報・通信」の分野で、国内外トップクラスのシェアを多数持つHOYA株式会社の事業ブランドのひとつで、AIを使った音声合成, 人工音声ソリューションを開発しています。 
 
20年以上前から音声合成ビジネスを行っており、日本国内では大手企業をはじめとして1,700社以上、グローバルでは11,000社以上にご利用いただいています。 
 
ReadSpeaker サービスサイト:https://readspeaker.jp/ 
 
公式Facebook:https://www.facebook.com/readspeakerjp/ 
公式Twitter:https://twitter.com/readspeakerjp 
公式 LinkedIn:https://www.linkedin.com/company/readspeakerjp/
PR TIMES:https://prtimes.jp/main/html/searchrlp/company_id/96974 
 
「ReadSpeaker」は HOYA株式会社 または HOYAグループ会社が保有する 日本国およびその他の国における登録商標です。 
 
その他、記載の会社名および製品名は、各社の商標または登録商標です。