株式会社ミクシィの「自律型会話ロボットRomi」にReadSpeakerの音声合成(TTS, text-to-speech)が採用されています。
Romi
Romiは話の内容や流れ等に応じてAI(人工知能)がその都度返す言葉を考える自律型会話ロボットです。 Romiには「ORIGINAL VOICE」のサービスで作成された既存ラインナップにはないオリジナルの音声合成エンジンが採用されています。Romiの声は声優 本名陽子さんの声を収録させていただき、 それを元にReadSpeaker ORIGINAL VOICEのサービスで作成された既存ラインナップにはないオリジナルの音声合成を行っております。この技術によりRomiのキャラクター感を表現した自然な声での対話が可能になりました。 |
ORIGINAL VOICE
ORIGINAL VOICEは、選定いただいたナレーターからディープラーニング(深層学習)を使ってナレーターの声再現した音声合成を作成するサービスです。本技術では、喜び・悲しみ・怒りを表現する『感情音声合成』にも対応しております。
音声対話システム x speechEngine SDK Embedded
speechEngine SDK Embeddedはスマートフォンや各種組み込み機器向けの開発に適した、スタンドアロン型の音声合成SDKです。テキストデータから音声をリアルタイムで作成することが出来るので、自動で生成された様々なテキストデータを即時に『声』としてユーザーに伝えることが可能です。speechEngine SDK EmbeddedのシンプルなAPI群は、効率良くかつスピーディーな開発を実現します。 日本語だけでなく、英語、中国語等の20言語以上に対応しています。
音声合成/読み上げについて
「合成音声」や「AI音声」は、音声合成技術の一般的な呼称で「音声読み上げ」や「読み上げ」は、文章を読み上げる機能を指します。これにより、ユーザーは文章を目で読む必要がなく、音声によって情報を受け取ることができます。「ReadSpeaker(リードスピーカー、旧VoiceText)」は高品質の音声合成エンジンを提供する世界的リーディングカンパニーで、自然な音声を生成するために機械学習やディープラーニングなどの最新技術を駆使しています。