吉本興業ホールディングス株式会社(以下「吉本興業」)は、約6,000人の芸人・タレントのマネジメントをはじめ、テレビ・ラジオ番組の制作から、広告事業、不動産事業まで、幅広く展開されています。特に「お笑い」業界では、多くの著名な芸人を輩出し、連日、テレビで見ない日はないほどの活躍ぶりです。

その中でも、吉本興業の強みは「コンテンツビジネス」にあると言えます。年間5,000本という、圧倒的な数を誇る「テレビ番組の制作」を中心に、地上波だけではなく、BS放送、CS放送など、その領域は多岐にわたります。

さらに近年の「スマートフォン」「タブレット」といったデバイスの多様化に合わせ、「ニコニコ動画」「YouTube」「LINE」「Twitter」「スマホアプリ」など、さまざまなデジタルプラットフォーム上で、「オリジナル」のコンテンツを配信しています。

 今回、その「吉本興業」と、TTS(Text-to-Speech=音声合成)技術を世界的に展開する「ReadSpeaker」がタッグを組み、「声の著作権化」につながる取り組みを行いました。

 実証実験は、吉本興業所属の女性芸人「ゆりやんレトリィバァ(以下「ゆりやん」)」さんのDNN(Deep neural network)音声合成の開発です。 

自己紹介
AIの話
バーチャル店員

 


ゆりやんさんは、その独特のキャラクターと、特徴的な「声色」で、様々な「お笑い」を生み出し、「第1回女芸人No.1決定戦 『THE W』優勝」「第19回『R-1グランプリ』優勝」など、数々の実績を残しています。

 一方、「ReadSpeaker」もこれまで「ハローキティ」等の著名キャラクターのTTS(音声合成)エンジンの開発を手掛けてきました。

 今回の「実証実験」では、DNN(Deep neural network)を使うことにより、「約30分」の声の録音データから、ゆりやんさんの「声質」や「話し方」を再現することができました。 「声」を使ったコンテンツとしては、これまでも携帯電話の「着信ボイス」や「電子玩具」などに使われてきましたが、それらはあくまでも「実際に録音」したデータを使用するということが前提でした。

 しかし、DNN音声合成は、一度録音し制作してしまえば、あとはPC上で自由に「発声」「カスタマイズ」が可能です。つまり、いつでも、どんな状況でも「ゆりやん」さんの声を再現できるのです。

この技術の普及により、今までのような「長時間」の録音を必要とせずに、ゆりやんさんのオリジナル声色コンテンツが制作でき、ラジオ番組をはじめ、ナレーション、オリジナルアプリ、電子玩具まで幅広く、手軽に使用することができます。

 「肖像権」として、ライセンスビジネスは確立されていますが、これからは「声の著作権(私的所有権)」化が進み、「声のライセンスビジネス」として、多くの分野に拡がっていくことが想定されます。

 今回の実証実験の最大の成果は「高品質」「短時間」という2点になります。「カスタムボイス」制作を得意領域とする「ReadSpeaker」の高い技術力は、TTS(音声合成)にした際の「機械的」「不自然さ」を限りなく少なくし、違和感なく「ゆりやん」さんの声を再現しました。

また、制作にかかる時間の大幅短縮も大きな成果でした。今まで「カスタムボイス」を制作する際には、時には「数十時間」にもおよぶ声の録音が必要でしたが、結果的には30分間の録音データからでも「ゆりやんさんらしさ」を出すことに成功いたしました。このことから、30分以上の収録を行うことでより品質の高い音声合成(TTS)を開発できると考えています。

 DNN技術の進化、ReadSpeakerの開発力は、今までの「声」というコンテンツの概念を覆し、新たな「ビジネスモデル」を確立できると、今回の取り組みを通して実感いたしました。 


DNN音声合成

DNNを使った音声合成はコンピューティングパワーが必要なためサーバ上で動作させることが一般的ですが、ReadSpeakerの独自の技術により、DNN音声合成を機器上でスタンドアロンで動作させることが可能になりました。 ReadSpeaker のTTSを使うことにより、リアルタイムに音声合成を行うボイスユーザーインターフェース(Voice User Interface, VUI)を簡単に実装することができ、インタラクティブ性が必要な音声対話等にご利用いただけます。

DNN音声合成

 

オリジナルボイス

お客様ご指定の声優、ナレーターの声で開発した音声合成を開発します。オリジナルボイスを使うことにより、音声合成を活用してキャラクターの個性を表現できるようになります。

オリジナルボイス


ReadSpeaker®について

「ライフケア」「情報・通信」の分野で、国内外トップクラスのシェアを多数持つ【HOYA株式会社】の事業ブランドのひとつで、DNN(ディープニューラルネットワーク) を使った音声合成, 人工音声ソリューションを開発しています。
20年以上前から音声合成ビジネスを行っており、大手企業をはじめとして国内1,700社以上、グローバルで10,000社以上にご利用いただいています。


  • 「ReadSpeaker®」は HOYA株式会社 または HOYAグループ会社が保有する 日本国およびその他の国における登録商標です。 
  • その他、記載の会社名および製品名は、各社の商標または登録商標です。 
  • ゆりやんレトリィバァさんの音声合成の販売は行っていません。 

 

音声合成/読み上げについて

「合成音声」や「AI音声」は、音声合成技術の一般的な呼称で「音声読み上げ」や「読み上げ」は、文章を読み上げる機能を指します。これにより、ユーザーは文章を目で読む必要がなく、音声によって情報を受け取ることができます。「ReadSpeaker(リードスピーカー、旧VoiceText)」は高品質の音声合成エンジンを提供する世界的リーディングカンパニーで、自然な音声を生成するために機械学習やディープラーニングなどの最新技術を駆使しています。

>>「ReadSpeaker」お問合せページ

 

本リリースに関するお問い合わせ先

HOYA株式会社
MD部門 ReadSpeaker
TEL:03-6479-7182
製品ホームページ:https://readspeaker.jp/
公式Facebook:https://www.facebook.com/readspeakerjp/
公式Twitter:https://twitter.com/readspeakerjp/

※ 記載の会社名および製品名は、各社の商標または登録商標です。

会社概要

事業部名:HOYA株式会社 MD部門
事業部所在地:東京都新宿区西新宿3-7-1