NTT-IT HOME
+ NAVIGATION +
トップ
音声合成とは
製品紹介
FutureVoice
Hipervoice
FineVoice
Visual Speech Creator
導入事例・適用例
体験版・試聴
FAQ
アナウンス代行サービス
Voice System Division
+ More Information +
Vシリーズ
ADVICE C3
Advice
スマート・コンタクトセンター
オペレーター協調応答サービス
ActiveDialer
音声認識
音声合成
音声ソリューション

   HOME >  製品 >  CTI・音声 >  音声合成ソフトウェア
音声合成ソフトウェア Hipervoice

NTTサイバースペース研究所開発音声合成エンジン「FLUET」搭載
テキストデータを正確に再現する音声合成ソフトウェア

製品概要

Hipervoiceとは
高機能音声合成エンジン搭載 日本語音声合成ソフトウェア
テキスト文章を高品質な音声に変換するテキスト音声合成ソフトウェアです。漢字かな混じり文を読みに変換し、自然なアクセントを付けて明瞭で滑らかな文章に読み上げます。
音声出力制御機能として、読み上げ速度、読み上げ音量、男声・女声/声の高さ切り替えなどがあり、コマンドにより制御できます。

特長・機能

高品質音声合成を実現
高機能・高音質な音声合成エンジンを搭載
音声合成エンジンとしてNTTサイバースペース研究所が開発した日本語音声合成エンジン「FLUET」を搭載。滑らかで自然な音声が作成できます。
約6000個の音素環境が異なる音素素片を用いて波形接続を行い、規則によりピッチや振幅、時間長を制御することによって滑らかで自然な合成音声を実現しています。

20万語を搭載したテキスト解析辞書
地名、人名などを固有名詞をはじめ、ニュース等で頻出の単語をサポート。高精度な漢字仮名変換を実現します。
また、ユーザ辞書に任意の単語を登録することができますので、特殊な表現や専門用語をターゲットとしたシステムでも正確な読み上げが可能となります。

テキストプリプロセッサ搭載
電子メール特有の文章や電話番号/日付表記など、通常の音声合成エンジンでは解析の難しかった表記を正確に読み上げます。

同時20アクセスまでサポート
CTIプラットフォームをはじめ各種サービス・システムの同時合成環境で威力を発揮します。

豊富な導入実績
NTT関連のWebサービスをはじめ、多数の導入実績があります。

使いやすさと経済性、豊富な機能
豊富なパラメータ制御 (※1)
性別(男声/女声)、音量、ピッチ(声の高さ)、抑揚、速度、声質、音声データファイルフォーマット(WAVE形式/RAW形式)、音声データコーデック(16ビットPCM/8ビットμ-law)、漢字コード(S-JIS/JIS/EUC)の指定が可能です。
これらの各種パラメータは、システム固有ではなく個々の音声合成要求ごとにきめ細かく設定することが可能ですので、同時にさまざまな音声を合成することができます。

多種多様な合成音声バリエーション
合成音声のサンプリング周波数は、電話回線からの利用を想定した8KHz、車載端末、携帯機器、PC向けのアプリケーションなどの出力用に11KHz の波形辞書を提供しています。(波形辞書はどちらかを選択することになりますが、オプションとして利用することも可能です。)
入力データの漢字コード体系は、日本語EUC、シフトJIS、JIS漢字の漢字コード体系に対応し、8ビットμ-law、16ビットPCMの出力データコーデックの指定が可能で、波形辞書と組み合わせることにより、色々な種類の合成音声をWindows標準形式のwavファイル、または、リニアファイルに保存することができます。

読みアクセント辞書登録ツールの提供
通常の音声合成では正常にテキスト解析されない単語(特殊な地名、人名等)を登録しておくことにより、的確な読み、アクセントの変更を行うことが可能になります。
  読みアクセント辞書登録ツール画面例
  単語登録画面例

話者属性設定ファイル作成ツールの提供
複数の話者設定ファイルを用意しておくことにより、さまざまな音声合成を簡単に作成することができます。
  話者属性設定ファイル作成ツール画面例
  話者属性設定ファイル作成ツール設定一覧

マルチスレッド対応
マルチスレッド環境で、スレッド毎に異なる音声を作成することが可能です。

使いやすいインターフェース
各関数は使いやすさを考え、C言語インターフェースで実装されています。(クライアントライブラリ)
  インターフェースを使用したサンプルプログラム
(※1)パラメータ設定
以下の設定を自由に変えることで多種多様な合成音声を作成することができます。

・話者(男声/女声)
・話速(100段階)
・抑揚(100段階)
・音量(100段階)
・音質(100段階)
・数字の桁読み、棒読み
・改行でのポーズの種類
・テキストフォーマット(漢字かな混じり文、カナアクセント文)
・漢字コード体系
・記号読み設定(読む/読まない)
・出力音声ファイルフォーマット(wav形式、音声データのみ)
・出力音声データ形式(8ビットμ-law、16ビットPCM)
・スペース部分のポーズ長設定(0〜10秒)

音声合成体験・試聴はこちら →

▲TOP

製品ラインアップ・仕様

Hipervoiceは、ライブラリ版とサーバ版をご用意しています。


Hipervoice ライブラリ

高速・高精度・省メモリDLL
ホームページやメールの読み上げ、CTIシステムなど音声情報システムを構築に手軽な合成音声作成インターフェースを提供します。
漢字仮名混じり文(通常の日本語文章)、仮名アクセント文(読みとアクセント位置を振った文章)を自動で合成音声に変換します。
作成した合成音声はWAV形式ファイルで出力、保存します。
Windows DLL形式でご提供
32ビットのダイナミックリンクライブラリ(DLL)として実装されています。
各インターフェース関数はC言語インターフェースで実装されています。
本APIはマルチスレッドで動作させることができます。
製品スペック
Hipervoiceライブラリ 製品仕様
入力形態 漢字仮名混じり文/仮名アクセント文
出力形式 サンプリングレート 8KHz、11KHzのどちらかを選択することが可能
(音声データベースに依存)
音声ファイル WAV形式、または、リニア形式でファイル保存可能
データ形式 16ビットPCMモノラル、8ビットμ-lawモノラル
言語処理部 入力コード EUC/SHIFT-JIS/JIS
基本辞書 20万語
ユーザ辞書 話者インスタンス毎に設定可能
音声合成部 合成単位 音韻連鎖単位
音声データベース 約6000素片(女声)、約6000素片(男声)
(8KHz、11KHzのどちらかを提供)
方式 波形重畳型合成
動作環境 対応OS Windows 95/98/Me/NT4.0/2000/XP 日本語版
CPU Pentium相当 100MHz以上推奨
メモリ 32MB以上推奨
ハードディスク容量 30MB以上(8KHz)、30MB以上(11KHz)
サウンドカード Sound Blasterまたはその互換ボード
(音声再生を行う場合)
コンパイラ Microsoft Visual C++ Ver6.0
※製品仕様、規格は予告なしに変更することがあります。
※記載されている製品名および会社名は、一般に各社の商標または登録商標です。
▲TOP

Hipervoice Server

安定した稼動で同時20アクセスまでサポート
CTIシステム構築に最適な、Hipervoiceのクライアント/サーバ構成版です。
クライアントライブラリ(DLL形式)を添付、本システムを導入したアプリケーションの開発が容易に行えます。
サーバOSにLinuxを採用、安定した稼動と均一な同時並行処理を実現しています。
同時20アクセスまでサポート、CTIシステムをはじめ各種サービス・システムの同時合成環境で威力を発揮します。
製品スペック
Hipervoice Server 製品仕様
入力形態 漢字仮名混じり文/仮名アクセント文
出力形式 サンプリングレート 8KHz、11KHzのどちらかを選択することが可能
(音声データベースに依存)
音声ファイル WAV形式、または、リニア形式でファイル保存可能
データ形式 16ビットPCMモノラル、8ビットμ-lawモノラル
言語処理部 入力コード EUC/SHIFT-JIS/JIS
基本辞書 20万語
ユーザ辞書 設定可能
音声合成部 合成単位 音韻連鎖単位
音声データベース 約6000素片(女声)、約6000素片(男声)
(8KHz、11KHzのどちらかを提供)
方式 波形重畳型合成
動作環境 対応OS サーバ RedHat Linux6.2J
クライアント Windows 95/98/Me/NT4.0/2000/XP 日本語版
CPU サーバ PentiumIII相当 500MHz以上推奨
クライアント Pentium相当 100MHz以上推奨
メモリ サーバ 128MB以上推奨
クライアント 32MB以上推奨
ハードディスク容量 サーバ 30MB以上
クライアント 10MB以上
サウンドカード サーバ
クライアント
コンパイラ サーバ
クライアント Microsoft Visual C++ Ver6.0
※製品仕様、規格は予告なしに変更することがあります。
※記載されている製品名および会社名は、一般に各社の商標または登録商標です。
▲TOP
FineVoiceの詳細ページ
FutureVoiceの詳細ページ
Visual Speech Creatorの詳細ページ

Back
音声合成 製品紹介へもどる
お問い合わせ・ご注文先
社名 NTTアイティ株式会社
住所 〒231-0032 横浜市中区不老町2-9-1 関内ワイズビル
TEL (045) 651-7512
FAX (045) 651-7737
E-Mail info-vcj@ntt-it.co.jp
担当部署 音声事業部 営業部
営業時間 9:00-17:30(月−金) ※祝祭日、特別休日を除く
ページTopへ

COPYRIGHT (C) NTTアイティ株式会社