経緯:資生堂のグローバルブランド「SHISEIDO」でAI音声における新たな体験を提供したい

VRやARを活用した多種多様なサービスが急速に広まっています。これまでもさまざまなサービスやゲームで、自由な仮想空間・拡張現実が提供されておりVRをはじめとするXR技術の進歩や、NFT・ブロックチェーン技術などの確立により、近年はXRをさらに超えてメタバースを活用した体験の可能性についても話題になっています。 

場所・空間などの物理的な制約があるにも関わらず、リアルに近い体験ができることがXR技術の魅力です。コロナ禍によって自由な移動や交流を制限されたことで、在宅時間が増えたことも、仮想空間に没入しやすい環境の構築につながっています。そして、こうした人々に非日常的な体験を提供できる場所、新たな顧客接点を創出する場所として、多くの企業がこれら技術を活用したビジネスの創出に乗り出しています。 

株式会社資生堂は、以前から積極的に「新しい体験価値」の提供に取り組まれてきました。特にグローバルブランド「SHISEIDO」のフラッグシップストア「SHISEIDO GLOBAL FLAGSHIP STORE」では、デジタルテスターやメディテーションカプセルなど、さまざまな先端テクノロジーを取り入れた、これまでにない体験をお客様に提供しています。 

その「SHISEIDO GLOBAL FLAGSHIP STORE」では、インテリジェント・ビューティー・パートナーである「LEAH」が、お客様の美にまつわる体験をサポートする役目を担っています。そして「LEAH」が発する声として採用されたのが、ReadSpeakerの「AI音声(TTS = Text to Speech)」です。 

 

 

選定理由:品質の高さと、自社開発ならではの柔軟性が決め手に 

これまで、キャラクターが発する声は人間が吹き込むものでしたが、今回、ブランド「SHISEIDO」は「LEAH」の声として、人間の声を収録するのではなく、AI音声の採用を決めていました。これには2つの理由があったそうです。 

1つは、今後ブランド「SHISEIDO」で展開するデジタルツールにおいて、「LEAH」の活用機会を増やしていくにあたり、「LEAH」として変わらない個性を作り上げたいという思いでした。人間の場合、どうしても環境の違いや経年により、多少なりとも声の個性は変化してしまいますが、AI音声の場合、そのような心配がありません。 

もう1つは、改良・更新の効率とリスクの軽減でした。活用の機会が増えた際、そのつど収録をしなければならず、改良や更新には多くのコストが発生します。さらに、その声の主に何らかの問題が発生した場合、新しいメッセージを収録できない、声の個性を失うというリスクもあります。両面の観点から、それぞれの効率性を実現しています。 

そこからAI音声を手がけている企業に問い合わせ、ブランド「SHISEIDO」のブランドイメージに合った、音声を形成できるかどうかを細かく吟味しました。その結果、選定されたのはReadSpeakerの「AI音声(TTS)」でした。選定の主なポイントは次の3つです。 

 

  1. ReadSpeakerの音声のクオリティー、特に日本語のクオリティーが高く、感情表現などのオプションの組み合わせが可能であるのに、価格とのバランスが取れていたこと 
  2. 多言語に対応している上、各言語の音声を自社で開発・アップデートをしていること 
  3. AI音声の黎明期からReadSpeakerは活動していて、先進的な取り組みに積極的なブランド「SHISEIDO」の姿勢とマッチしたこと

 

 

効果:好きなときに自由な声を作成可能に 

今回、ブランド「SHISEIDO」が利用したのは、ReadSpeakerの「オリジナルボイス」というサービスです。指定した声優・ナレーターなどの声で、音声合成ソフトを開発します。本プロジェクトでは、「リラックスを誘う、ゆったりとした音声」というオーダーを踏まえて、日本語・英語・中国語の音声合成ソフトを開発しました。 

これにより、いつでも好きな時に音声メッセージの作成・編集が可能になり、音声によるサービス提供に関しての自由度が飛躍的に向上しました。 

また、従来の方法と比較して、マンパワー不足の回避、費用の効率化、リスクの軽減を実現できたことはもちろん、イメージ通りの音声を確立できたと、ご満足いただいています。 

すでに活用の予定も決まっています。2020年7月に、「SHISEIDO GLOBAL FLAGSHIP STORE」のオープンに合わせて公開したバーチャルストア「SHISEIDO VIRTUAL FLAGSHIP STORE」は、XR技術活用の先駆的事例として評価されています。この2階では、スキンケアレッスンやメイクアップレッスンを実施していますが、そこで使用する動画に「LEAH」を採用することが決定しました。これからもさまざまな場面での活用が期待されています。 

 

 

音声合成/読み上げについて

「合成音声」や「AI音声」は、音声合成技術の一般的な呼称で「音声読み上げ」や「読み上げ」は、文章を読み上げる機能を指します。これにより、ユーザーは文章を目で読む必要がなく、音声によって情報を受け取ることができます。「ReadSpeaker(リードスピーカー、旧VoiceText)」は高品質の音声合成エンジンを提供する世界的リーディングカンパニーで、自然な音声を生成するために機械学習やディープラーニングなどの最新技術を駆使しています。

>>「ReadSpeaker」お問合せページ

 

 

ReadSpeaker®について 

ReadSpeaker(旧VoiceText)はAIを使った⾳声合成, ⼈⼯⾳声ソリューションを開発しています。

 20年以上前から⾳声合成、読み上げソフト等の開発を⾏っており、⼤⼿企業をはじめとして国内1,700社以上、グローバルで10,000社以 上にご利⽤いただいています。

公式Facebook:

https://www.facebook.com/readspeakerjp/

公式Twitter:

https://twitter.com/readspeakerjp/

公式LinkedIn:

https://www.linkedin.com/company/readspeakerjp/

SHISEIDO Adopts ReadSpeaker’s AI Voice (Text-to-Speech) to Deliver New CX (Customer Experience)

CX & Digital Communication Retail ORIGINAL VOICE

Background: SHISEIDO, a global brand of Shiseido, sought to provide a new experience with AI voice.

VR and AR-enabled services are rapidly expanding. Virtual spaces and augmented reality have been provided in various services and games, and with the advancement of XR technologies such as VR and the establishment of NFT and blockchain technologies, the potential for experiences beyond XR using the metaverse has also gained attention in recent years.

Despite physical constraints such as location and space, the appeal of XR technology lies in its ability to provide experiences that are close to reality. The pandemic has restricted freedom of movement and interaction, leading to an increase in time spent at home, which has contributed to the creation of environments conducive to immersion in virtual spaces. Many companies are now seeking to create new business opportunities by leveraging these technologies to provide non-everyday experiences and new customer touchpoints.

Shiseido Co., Ltd. has been actively working to provide “new experiential value” for many years. In particular, at the flagship store for its global brand “SHISEIDO,” the “SHISEIDO GLOBAL FLAGSHIP STORE,” the company offers customers unprecedented experiences through the use of various cutting-edge technologies, such as digital testers and meditation capsules.

At the “SHISEIDO GLOBAL FLAGSHIP STORE,” the intelligent beauty partner “LEAH” plays a role in supporting customers’ beauty-related experiences. The voice used for ‘LEAH’ is ReadSpeaker’s “AI voice (TTS = Text to Speech).”

Reasons for selection: High quality and flexibility unique to in-house development

Until now, the voices of characters were recorded by humans, but this time, the SHISEIDO brand decided to adopt AI voice rather than recording human voices for “LEAH.” There were two reasons for this decision.

The first was the desire to create a consistent personality for “LEAH” as the brand expands its use of digital tools in the future. With human voices, there is always some variation in tone due to environmental factors and aging, but this is not a concern with AI voice technology.

The second reason was to improve efficiency and reduce risks associated with improvements and updates. As opportunities to use the voice increase, it would be necessary to record it each time, which would incur significant costs for improvements and updates. Additionally, if any issues arise with the voice actor, there is a risk of being unable to record new messages or losing the voice’s unique characteristics. From both perspectives, AI voice technology offers the desired efficiency.

We then contacted companies that offer AI voice technology and carefully evaluated whether they could create a voice that matched the brand image of “SHISEIDO.” As a result, we selected ReadSpeaker’s “AI Voice (TTS).” The three main points for selection were as follows:

  1. ReadSpeaker’s voice quality, particularly in Japanese, is high, and it offers a combination of options such as emotional expression while maintaining a good balance with price.
  2. It supports multiple languages and develops and updates voices for each language in-house.
  3. ReadSpeaker has been active in the field of AI voice since its early days, which aligns with the brand “SHISEIDO’s” proactive approach to cutting-edge initiatives.

Effect: Ability to create any voice at any time

For this project, the brand “SHISEIDO” utilized ReadSpeaker’s “Original Voice” service. This service allows you to develop voice synthesis software using the voices of specified voice actors or narrators. Based on the request for a “relaxing, soothing voice,” we developed voice synthesis software in Japanese, English, and Chinese.

This has greatly increased the flexibility of providing voice services, as voice messages can now be created and edited at any time.

In addition to avoiding manpower shortages, improving cost efficiency, and reducing risks compared to conventional methods, the client is satisfied with the ability to establish a voice that matches their image. 

Plans for implementation are already in place.In July 2020, the virtual store “SHISEIDO VIRTUAL FLAGSHIP STORE” was launched in conjunction with the opening of the “SHISEIDO GLOBAL FLAGSHIP STORE.” This store has been recognized as a pioneering example of XR technology utilization. On the second floor, where skincare and makeup lessons are conducted, it has been decided to adopt “LEAH” for the videos used in these sessions. Further applications in various scenarios are anticipated in the future.