経緯:資生堂のグローバルブランド「SHISEIDO」でAI音声における新たな体験を提供したい

VRやARを活用した多種多様なサービスが急速に広まっています。これまでもさまざまなサービスやゲームで、自由な仮想空間・拡張現実が提供されておりVRをはじめとするXR技術の進歩や、NFT・ブロックチェーン技術などの確立により、近年はXRをさらに超えてメタバースを活用した体験の可能性についても話題になっています。 

場所・空間などの物理的な制約があるにも関わらず、リアルに近い体験ができることがXR技術の魅力です。コロナ禍によって自由な移動や交流を制限されたことで、在宅時間が増えたことも、仮想空間に没入しやすい環境の構築につながっています。そして、こうした人々に非日常的な体験を提供できる場所、新たな顧客接点を創出する場所として、多くの企業がこれら技術を活用したビジネスの創出に乗り出しています。 

株式会社資生堂は、以前から積極的に「新しい体験価値」の提供に取り組まれてきました。特にグローバルブランド「SHISEIDO」のフラッグシップストア「SHISEIDO GLOBAL FLAGSHIP STORE」では、デジタルテスターやメディテーションカプセルなど、さまざまな先端テクノロジーを取り入れた、これまでにない体験をお客様に提供しています。 

その「SHISEIDO GLOBAL FLAGSHIP STORE」では、インテリジェント・ビューティー・パートナーである「LEAH」が、お客様の美にまつわる体験をサポートする役目を担っています。そして「LEAH」が発する声として採用されたのが、ReadSpeakerの「AI音声(TTS = Text to Speech)」です。 

 

 

選定理由:品質の高さと、自社開発ならではの柔軟性が決め手に 

これまで、キャラクターが発する声は人間が吹き込むものでしたが、今回、ブランド「SHISEIDO」は「LEAH」の声として、人間の声を収録するのではなく、AI音声の採用を決めていました。これには2つの理由があったそうです。 

1つは、今後ブランド「SHISEIDO」で展開するデジタルツールにおいて、「LEAH」の活用機会を増やしていくにあたり、「LEAH」として変わらない個性を作り上げたいという思いでした。人間の場合、どうしても環境の違いや経年により、多少なりとも声の個性は変化してしまいますが、AI音声の場合、そのような心配がありません。 

もう1つは、改良・更新の効率とリスクの軽減でした。活用の機会が増えた際、そのつど収録をしなければならず、改良や更新には多くのコストが発生します。さらに、その声の主に何らかの問題が発生した場合、新しいメッセージを収録できない、声の個性を失うというリスクもあります。両面の観点から、それぞれの効率性を実現しています。 

そこからAI音声を手がけている企業に問い合わせ、ブランド「SHISEIDO」のブランドイメージに合った、音声を形成できるかどうかを細かく吟味しました。その結果、選定されたのはReadSpeakerの「AI音声(TTS)」でした。選定の主なポイントは次の3つです。 

 

  1. ReadSpeakerの音声のクオリティー、特に日本語のクオリティーが高く、感情表現などのオプションの組み合わせが可能であるのに、価格とのバランスが取れていたこと 
  2. 多言語に対応している上、各言語の音声を自社で開発・アップデートをしていること 
  3. AI音声の黎明期からReadSpeakerは活動していて、先進的な取り組みに積極的なブランド「SHISEIDO」の姿勢とマッチしたこと

 

 

効果:好きなときに自由な声を作成可能に 

今回、ブランド「SHISEIDO」が利用したのは、ReadSpeakerの「オリジナルボイス」というサービスです。指定した声優・ナレーターなどの声で、音声合成ソフトを開発します。本プロジェクトでは、「リラックスを誘う、ゆったりとした音声」というオーダーを踏まえて、日本語・英語・中国語の音声合成ソフトを開発しました。 

これにより、いつでも好きな時に音声メッセージの作成・編集が可能になり、音声によるサービス提供に関しての自由度が飛躍的に向上しました。 

また、従来の方法と比較して、マンパワー不足の回避、費用の効率化、リスクの軽減を実現できたことはもちろん、イメージ通りの音声を確立できたと、ご満足いただいています。 

すでに活用の予定も決まっています。2020年7月に、「SHISEIDO GLOBAL FLAGSHIP STORE」のオープンに合わせて公開したバーチャルストア「SHISEIDO VIRTUAL FLAGSHIP STORE」は、XR技術活用の先駆的事例として評価されています。この2階では、スキンケアレッスンやメイクアップレッスンを実施していますが、そこで使用する動画に「LEAH」を採用することが決定しました。これからもさまざまな場面での活用が期待されています。 

 

 

音声合成/読み上げについて

「合成音声」や「AI音声」は、音声合成技術の一般的な呼称で「音声読み上げ」や「読み上げ」は、文章を読み上げる機能を指します。これにより、ユーザーは文章を目で読む必要がなく、音声によって情報を受け取ることができます。「ReadSpeaker(リードスピーカー、旧VoiceText)」は高品質の音声合成エンジンを提供する世界的リーディングカンパニーで、自然な音声を生成するために機械学習やディープラーニングなどの最新技術を駆使しています。

>>「ReadSpeaker」お問合せページ

 

 

ReadSpeaker®について 

ReadSpeaker(旧VoiceText)はAIを使った⾳声合成, ⼈⼯⾳声ソリューションを開発しています。

 20年以上前から⾳声合成、読み上げソフト等の開発を⾏っており、⼤⼿企業をはじめとして国内1,700社以上、グローバルで10,000社以 上にご利⽤いただいています。

公式Facebook:

https://www.facebook.com/readspeakerjp/

公式Twitter:

https://twitter.com/readspeakerjp/

公式LinkedIn:

https://www.linkedin.com/company/readspeakerjp/