AI音声合成・音声読み上げ(WEB テキスト)ソフトのReadSpeaker(リードスピーカー)

Product ソフトウェア開発キット

端末内で完結し、個人情報を徹底保護。
機密アプリや組込み機器に最適な
“軽量オフライン音声合成”。

speechEngine SDK

Windows・Linux向け
組込開発キット

  • できること

    • テキストの差し替えのみで即時反映・収録不要
    • オフラインでも低遅延で稼働
    • 多言語、多話者で発話可能
    • 発音辞書、記号読みで固有名詞に強い
    • 感情、速度、ピッチを細かく制御
    • 音声ファイル出力やリアルタイム再生に対応
  • 主な活用シーン

    システム開発・組込・POSレジ・券売機・キオスク端末・公共交通機関案内・テレビ・ラジオ・動画配信

  • 仕様

    標準対応OS: Windows, Linux
    対応開発言語: C, C++, Java, .NET

speechEngine SDK 実例

  • 京王電鉄バス株式会社

    バスターミナル東京八重洲における案内放送の自動化

    • 課題

      従来のマイク放送では人員負担が大きく、担当者によって放送品質にばらつきがあった。

    • 導入

      STS(スマートターミナルシステム)と連携。バス入線時に自動で多言語案内放送を生成。

    • 効果

      案内放送の自動化で、オペレーション効率アップを実現

    導入事例詳細はこちら
  • 株式会社FOOD & LIFE COMPANIES(スシロー)

    自動受付・案内システムへのAI音声実装(店舗案内・順番呼出を自動化)

    • 課題

      店舗オペを省力化する必要。出入口近くでも明瞭で自然な案内音声が必須。収録なしで柔軟にガイダンスを変更したい。

    • 導入

      案内システムに組込み。日本語/英語/中国語ほか多言語対応、端末ごとに声色を使い分けて案内を最適化。

    • 効果

      案内の自動化で業務負担を削減。聞き取りやすい音質で顧客体験を改善。海外店舗展開に向けた多言語運用の拡張性を確保。

    導入事例詳細はこちら
  • 株式会社ディンプス

    『FREEDOM WARS Remastered』(ゲーム)における多言語音声実装

    • 課題

      膨大なキャラクターボイスを収録するにはコストも工数も大きすぎる

    • 導入

      キャラクター音声を多言語・リアルタイムに生成。PS5/PS4/Switch/PCへ展開。

    • 効果

      収録負担を削減し、多言語展開を容易にし、プレイヤーの没入感を強化。

    導入事例詳細はこちら

特徴

  • 圧倒的な肉声感と明瞭感

    他社の音声合成を凌ぐリアルな音声品質を実現したReadSpeakerエンジンを搭載。スタンドアロン環境で利用可能です。

  • 50言語以上・多彩な話者に対応

    日本語・英語(アメリカ/イギリス)をはじめ、50言語以上・多数の話者をラインナップ。

  • 高速処理・マルチスレッド対応

    マルチスレッド処理により、複数の音声を同時に生成可能。
    ※音声バッファー出力APIのみ対応

  • シンプルで統一されたAPI群

    言語・話者を問わず共通化された直感的で分かりやすいAPIにより、効率的な組み込み開発が可能です。

  • 高音質合成方式を選択可能

    波形接続型合成やDNNによる感情音声合成など、ニーズに応じた高音質なエンジンを選択できます。

  • 柔軟な開発環境対応

    C/C++/.NETに対応。システム要件に応じて最適な環境を選択できます。

スペック

DNN型 波形接続型
CPU 1.0GHz以上
メモリ容量 20MB〜 50MB〜
ディスク容量 22kHz 9MB〜35MB 500MB~800MB
16kHz 9MB〜35MB 280MB〜420MB
8kHz ご相談ください 180MB~260MB
対応OS Windows 10 / 11
RHEL 7.x / 8.x / 9.x
CentOS 7.x / 8.x
CentOS Streamなどその他Red Hat系ディストリビューションについてはご相談ください。
UbuntuなどDebian系ディストリビューションについても対応可能です。ご相談ください。
開発言語 C/C++
C# / VB.NET(.NET Framework 2.0 以上)
音声出力
  • 16bit LPCM
  • 16bit LPCM Wave
  • 8bit A-law PCM※
  • 8bit A-law PCM Wave※
  • 8bit μ-law PCM※
  • 8bit μ-law PCM Wave※
  • 8bit μ-law PCM SUN AU※
  • 8bit unsigned LPCM Wave※
  • 4bit Dialogic ADPCM※
※8bit以下のフォーマットは8kHz版のみ対応
備考 Windows 64bit SDK、その他OSなどはご相談ください。

価格

ご利用用途により最適な価格をご提案致します。
下記のお問合せフォームからお問合せ下さい。

法人専用お問い合わせフォームへ

世界基準のAI音声を
試してみませんか?

AI音声の最新事例を今すぐチェック!

資料ダウンロード

簡単操作のAI音声化をまずは体験!

無料トライアルお申込み

FAQ

よくある質問

”” ReadSpeaker speechEngine SDKとは何ですか?
”” Windows/Linuxやエッジデバイス向けに、スタンドアロン型のAI音声合成SDKです。
高品質ニューラル音声(波形接続型 or DNN)で、複数言語・複数スレッドで同時処理が可能です。
”” このSDKを導入するメリットは何ですか?
”” APIがシンプルで開発しやすく、非一般名詞の辞書登録やマルチスレッド処理に対応。
高音質・感情表現・複数言語により、音声品質と運用効率を大幅に向上できます。
”” 他の音声合成エンジンとの違いは何ですか?
”” ReadSpeaker独自の肉声に近いクリアな音質と、感情表現が可能なDNN合成方式を特徴とし、50言語以上に対応。端末上でも処理でき、リアルタイム性能に優れています。
”” speechEngine SDKはどのような仕組みで音声を合成していますか?
”” Deep Neural Network (DNN) TTSもしくは波形接続型を採用し、高品質な音声と感情表現を可能にしながら、CPU 1GHz/メモリ20MBなど組込可能な軽量設計です。
”” 対応OSやハードウェア環境は何ですか?
”” Windows、Linux(RHEL/CentOS/Ubuntu等)およびARM CPU搭載のAndroid/iOS/組込Linuxに対応。CPU 1.0GHz以上〜、メモリ20MB〜を要件とします。
”” speechEngine SDKはどのような業種で使われていますか?
”” 車載システム、公共交通機関の音声案内、放送設備、業務用ロボット、製造業、教育用デバイス、IoT機器など多様な業界・用途で導入実績があります。
”” カスタム音声の作成は可能ですか?
”” はい。感情表現豊かなDNN合成方式を活用し、特定の声のニュアンス作成や感情付与が可能です。
”” ライセンスや料金体系はどのようになっていますか?
”” ご希望の環境や用途に合わせた価格提案を実施。価格は「お問い合わせフォーム」から見積もりが可能です。
”” 導入するにはどのような手順が必要ですか?
”” ①お問い合わせフォームまたは電話(03-6479-7182)から相談→②技術提案・トライアル→③ライセンス契約→④導入開始、という流れです。
”” 導入後のサポートやアップデート対応はどうなっていますか?
”” 技術スタッフによるテクニカルサポートとアフターサービス体制が整備されており、アップデート・バージョン管理も万全です。

世界基準のAI音声を
試してみませんか?

AI音声の最新事例を今すぐチェック!

資料ダウンロード

簡単操作のAI音声化をまずは体験!

無料トライアルお申込み