Product ソフトウェア開発キット
高トラフィック環境でも安定稼働。
同時多接続でも“品質を落とさない
”業務基盤向け音声サーバー。
speechServer
ネットワーク型システム
開発キット

-
できること
- Windows Server/Linux環境でオンプレミス稼働が可能
- REST APIを備え、既存システムとの連携が容易
- MRCP v1/v2対応で音声IVRや通話システムと統合可能
- SSML対応により発話速度・イントネーションなどを細かく制御
- マルチスレッド処理で複数音声を同時生成
- 専門用語辞書登録で、業界固有語の正確な読み上げに対応
-
主な活用シーン
電話対応・音声対話・アナウンス・受付
-
仕様
標準対応OS:Windows Server 2019 / 2022 / 2025(サーバー)
Windows 10 / 11(クライアント)、RHEL 7.x / 8.x / 9.x
CentOS 7.x / 8.x
speechServer 実例
-
導入事例詳細はこちら株式会社U-NEXTマーケティング
AIコンシェルジュの自動応答音声に導入
-
課題
問い合わせ対応を自動化する際、柔軟な文言変更・復唱応答・高品質な音声が求められた。
-
導入
speechServer を用い、AIが生成するテキストをリアルタイムに音声化。 API 経由で即応答。
-
効果
迅速な文言修正対応と高品質音声応答を両立。ユーザー体験の向上と運用効率改善。
-
-
導入事例詳細はこちらSBIリクイディティ・マーケット株式会社
FX取引アプリ内の為替レート読み上げ
-
課題
為替変動を即時に顧客に伝える音声通知機能が必要。音声の自然さと正確さも重要要件。
-
導入
speechServer を導入し、為替データをリアルタイムで音声変換。複数言語対応も含む。
-
効果
音声通知の信頼性と即応性を確保。ユーザーへの感度向上と情報提供価値の拡張。
-
-
導入事例詳細はこちらソフネットジャパン株式会社
CYBER Signage “VNSS” の音声合成機能
-
課題
デジタルサイネージにおいて、ナレーション収録なしで多言語音声案内を動的に生成したい。
-
導入
speechServer(旧 VoiceText)を用い、ナレーション文字列をリアルタイムに音声化。4言語対応。
-
効果
ナレーション制作負荷を削減し、言語拡張性を確保。デジタルサイネージの案内機能を強化。
-
特徴
-
圧倒的な肉声感と明瞭感
他社の音声合成を凌ぐリアルな音声品質を実現したReadSpeakerエンジンを搭載。クライアント/サーバーシステムやスタンドアロン環境での柔軟な利用が可能です。
-
50言語以上・多彩な話者に対応
日本語・英語(アメリカ/イギリス)をはじめ、50言語以上・多数の話者をラインナップ。
-
高速処理・マルチスレッド対応
マルチスレッド処理により、複数の音声を同時に生成可能。
※音声バッファー出力APIのみ対応 -
共通API設計とSSML対応
言語や話者に依存しない統一APIにより、効率的な組み込み開発を実現。SSML(Speech Synthesis Markup Language)にも対応しており、音声の細かな制御や調整も可能です。
-
柔軟な開発環境対応
Windows Server/RHEL/CentOS/Ubuntu に対応。C/C++/Java/.NET など主要な開発言語をサポートし、ユーザーやシステム要件に応じた最適な構成が可能です。
スペック
| CPU | 1.0GHz以上(サーバー)、400MHz以上(クライアント) | ||
|---|---|---|---|
| メモリ容量 | 1.5GB以上(サーバー)、256MB以上(クライアント) | ||
| ディスク容量 | 44kHz | 500MB~800MB | |
| 16kHz | 280MB~420MB | ||
| 8kHz | 180MB~260MB | ||
| 対応OS | Windows |
Windows Server 2019 / 2022 / 2025(サーバー) Windows 10 / 11(クライアント) |
|
| Linux |
RHEL 8.x / 9.x CentOS 8.x CentOS Stream 9 / 10 Ubuntu 20.x / 22.x / 24.x その他OSについてはご相談ください |
||
| 音声出力 |
|
||
| 備考 | SSML(UTF-8)対応 | ||
speechServer MRCP
ネットワーク上で音声合成、音声認識など
各種メディアサービスのリソースを制御するMRCP規格に対応しています。
| CPU | 1.0GHz以上(サーバー)、400MHz以上(クライアント) | ||
|---|---|---|---|
| メモリ容量 | 1.5GB以上(サーバー)、256MB以上(クライアント) | ||
| ディスク容量 | 180MB~260MB(サンプリング周波数 8kHz) | ||
| 対応OS |
Windows Server 2016 / 2019 / 2022 RHEL 7.x / 8.x CentOS 7.x / 8.x |
||
| 備考 |
MRCPv1 / v2 対応 音声出力 8kHzのみ SSML(UTF-8)対応 |
サーバーSDK AIX
日本IBMのUNIXオペレーティング・システム「AIX」にて、電話応答システム構築に利用できる音声合成ソフトです。
| 対応言語 | 日本語(SAYAKA/MISAKI)のみ | ||
|---|---|---|---|
| CPU | 1.0GHz以上(サーバー)、400MHz以上(クライアント) | ||
| メモリ容量 | 1.5GB以上(サーバー)、256MB以上(クライアント) | ||
| ディスク容量 | 300MB~800MB(サンプリング周波数 8kHz) | ||
| 対応OS | AIX 7.x | ||
| 備考 |
IBM Power Systems 対応 音声出力 8kHzのみ ReadSpeakerブランドのspeechServer AIXについてはお問い合わせください。 |
世界基準のAI音声を
試してみませんか?
AI音声の最新事例を今すぐチェック!
資料ダウンロード簡単操作のAI音声化をまずは体験!
無料トライアルお申込みFAQ
よくある質問
-
ReadSpeaker speechServerとは何ですか?
-
オンプレミス環境や閉域網でも動作する、サーバー型の音声合成エンジンです。API経由で音声ファイルを安定的に生成できます。
-
このサーバー型SDKを導入するメリットは何ですか?
-
ネット接続を必要とせず、イントラネットでも稼働可能なため、セキュアかつ高い利用安定性が得られます。
-
他の音声合成エンジンとの違いは何ですか?
-
オンプレミス対応に加え、REST/SOAP APIや辞書登録機能を備えた高度なカスタマイズ性が特長です。
-
speechServerはどのような仕組みで音声を合成していますか?
-
サーバー上で波形接続型とDNN方式により合成処理を実行し、mp3やwav形式で出力します。
-
対応OSやハードウェア環境は何ですか?
-
WindowsおよびLinux(RHEL, CentOS, Ubuntu)に対応し、HTTPS経由で安全にAPIアクセスできます。
-
speechServerはどのような業種で使われていますか?
-
公共交通の案内放送、カスタマーサポートシステム、社内アナウンス設備など、業務用途に幅広く利用されています。
-
専門用語など自社向けにカスタマイズする事は可能ですか
-
はい。辞書登録や音声調整機能により、業務要件に応じたチューニングが可能です。
-
ライセンスや料金体系はどのようになっていますか?
-
サブスクリプション形式のライセンス提供で、用途に合わせた価格提案を実施。
価格は「お問い合わせフォーム」から見積もりが可能です。 -
導入するにはどのような手順が必要ですか?
-
①お問い合わせフォームまたは電話(03‑6479‑7182)から相談→②技術提案・トライアル→③ライセンス契約→④導入開始、という流れです。
-
導入後のサポートやアップデート対応はどうなっていますか?
-
技術スタッフによるテクニカルサポートとアフターサービス体制が整備されており、アップデート・バージョン管理も万全です。
世界基準のAI音声を
試してみませんか?
AI音声の最新事例を今すぐチェック!
資料ダウンロード簡単操作のAI音声化をまずは体験!
無料トライアルお申込み