NTT-IT HOME
+ NAVIGATION +
トップ
音声合成とは
製品紹介(ラインアップ)
FutureVoice Library
FutureVoice Server
FutureVoice Editor
FutureVoice ASP
サンプル音声
導入事例・適用例
FAQ
Visual Speech Creator
Voice System Division
+ More Information +
Vシリーズ
ADVICE C3
Advice
スマート・コンタクトセンター
オペレーター協調応答サービス
ActiveDialer
音声認識
音声合成
音声ソリューション

   HOME >  製品 >  CTI・音声 >  音声合成ソフトウェア
高品質テキスト音声合成ソフトウェア FutureVoice

音声合成 FAQ (よくある質問集)

1. 音声合成に関する一般的な質問
Q01-001 数字や記号の読み上げはできますか。
Q01-002 英語など、日本語以外の文章の読み上げはできますか。
Q01-003 固有名詞、外来語などの特殊な読み方、イントネーションの登録はどのように行うのですか。
Q01-004 人名や地名には対応していますか。
Q01-005 声の種類はどのくらいありますか。声のどのようなパラメータを変えることができますか。
Q01-006 どんな型の音声データに出力できますか。
Q01-007 音声合成にはどのような方式を使用しているのですか。
Q01-008 ユーザ辞書とシステム辞書の違いについて教えてください。
Q01-009 OSの対応状況について教えてください。
Q01-010 サンプル音声を聞くことはできますか。
Q01-011 ライブラリとサーバ、ツールの違いは何ですか。
Q01-012 SAPIには対応していますか。
Q01-013 MRCPには対応していますか。
Q01-014 サンプルプログラムはありますか。
Q01-015 製品を利用したアプリケーションを販売することはできますか。
Q01-016 どこで購入できますか。

2. SDK(ライブラリ、サーバ)に関する質問
Q02-001 数字や記号の読み上げはできますか。
Q02-002 英語など、日本語以外の文章の読み上げはできますか。
Q02-003 固有名詞、外来語などの特殊な読み方、イントネーションの登録はどのように行うのですか。
Q02-004 人名や地名には対応していますか。

3. ツール(FutureVoice EX Editor)に関する質問
Q03-001 チューニングはどのようにして行うのですか。
Q03-002 いちど合成/編集したファイルを、後でまた編集し直すことはできますか。


1. 音声合成に関する一般的な質問 【回答集】

Q [01-001]数字や記号の読み上げはできますか。
 
   

  A  可能です。
 例えば、134「ひゃくさんじゅうよん」、044「ぜろよんよん」、2ΠR「にぱいあーる」、Σ「しぐま」といった読み上げになります。 また、期待通りの読みをしなかった場合も、ユーザ辞書を利用することで正しく読み上げることができます。 数字の桁読みについては、20桁(千京の位)まで桁読み可能です(21桁以上になりますと桁読み設定であっても棒読みになります)。
 テキストプリプロセッサ(オプション)を搭載することにより、数字や記号はもちろん電子メール特有の文章や電話番号/年号/日付/金額表記などについても正確な読み上げが可能となります。
   

▲TOP


Q [01-002]英語など、日本語以外の文章の読み上げはできますか。
 
   

  A  当製品は日本語の音声合成を目的としております。ただし、読みアクセント辞書には一般的な英単語も登録されており、これらの単語を読み上げることは可能です。また、ローマ字表記であれば読み上げが可能です。
中国語やハングル語などの独自言語については対応しておりません。
   

▲TOP


Q [01-003]固有名詞、外来語などの特殊な読み方、イントネーションの登録はどのように行うのですか。
 
   

  A  ユーザ辞書機能で、読み、アクセント、品詞を指定することで、登録が可能です。
   

▲TOP


Q [01-004]人名や地名には対応していますか。
 
   

  A  基本辞書で一般的な人名や地名がある程度カバーされています。
   

▲TOP


Q [01-005]声の種類はどのくらいありますか。声のどのようなパラメータを変えることができますか。
 
   

  A  女声、男声の音声素片が用意されており、これに対し声質/ピッチ(声の高さ)/パワー/話速(話す速さ)といったパラメータを細かく制御することができるようになっています。 また、このようにして作成された音声の設定は、話者設定ファイルを作成することでいつでも呼び出すことができます。
   

▲TOP


Q [01-006]どんな型の音声データに出力できますか。
 
   

  A  コーデックとしては、16bitPCMモノラル or 8bitμ-lawモノラル、また、ファイル形式として、WAV型式 or RAW型式での出力が可能です。
   

▲TOP


Q [01-007]音声合成にはどのような方式を使用しているのですか。
 
   

  A  「コーパスベース音声合成方式」という方式を採用しています。数時間から数十時間の大規模な音声データベースを利用することで、肉声品質に近い、自然な音質の音声合成が可能となっています。
   

▲TOP


Q [01-008]ユーザ辞書とシステム辞書の違いについて教えてください。
 
   

  A  日本語では、同一の文字(漢字や数字など)に対し複数の読みが存在する場合が多く、文章を正しく読むためには読み方やアクセントの情報が必要となります。 システム辞書とは、ライブラリに最初から組み込まれている読みアクセント情報のことを示します。これに対しユーザ辞書では、ユーザ(利用者)自身が特定の文字列に対し読み方の訂正やアクセントの修正を行うことができるもので、システム辞書に登録されていない特殊な読みやアクセントを追加登録することができるようになっています。また、ユーザ辞書は保存/再編集することが可能です。
 なお、ツール(FutureVoice Editor)では、ユーザ辞書に登録する方法以外にも、随時 読みやアクセントを修正することができます。
   

▲TOP


Q [01-009]OSの対応状況について教えてください。
 
   

  A  ライブラリ版、サーバ版はWindowsXP、Vista、2003Server、Linux(RHEL4、5)に対応しています。
 ツール(FutureVoice Editor)はWindowsXP、Vista、2003Serverに対応しています。
 ※WindowsVistaでは、一部制約事項があります。
 ※64bitOSには対応していません。
   

▲TOP


Q [01-010]サンプル音声を聞くことはできますか。
 
   

  A  こちらのページでサンプル音声を試聴いただけます。
   

▲TOP


Q [01-011]ライブラリとサーバ、ツールの違いは何ですか。
 
   

  A  ライブラリ版は、インストールしたマシンで音声合成や音声ファイル出力を行います。単体動作するアプリケーションシステムでは、こちらのタイプが適しています。サーバ版は、クライアントマシンからサーバマシンに対してテキストを送信し、サーバ側で音声合成処理を行います。生成された合成音声はクライアントマシンに送信されます。大量の音声合成処理を必要とするシステムなどではこちらのタイプが適しています。
 なお、ライブラリ版とサーバ版のクライアントモジュールはDLL形式での提供となりますので、DLLを呼び出し音声合成を行うプログラムをC言語で別途作成する必要があります。
 ツール(FutureVoice Editor)は、テキストから音声の作成・調整を行うGUIアプリケーションです。こちらは実行形式(exe)ですので、単独で動作し、マウスやキーボード操作でご利用いただくことができます。
   

▲TOP


Q [01-012]SAPIには対応していますか。
 
   

  A  SAPIには対応しておりません。
   

▲TOP


Q [01-013]MRCPには対応していますか。
 
   

  A  対応しています。Linux版サーバタイプでのご提供となります。
   

▲TOP


Q [01-014]サンプルプログラムはありますか。
 
   

  A  ございます。
 製品に標準で、簡単なサンプルプログラムコードが添付されています。
   

▲TOP


Q [01-015]製品を利用したアプリケーションを販売することはできますか。
 
   

  A  製品を利用したアプリケーションを販売する場合は、「ソフトウェアライセンス使用契約書」を締結していただく必要があります。 ライセンス料は体系によって異なりますので、詳しくは弊社までご相談ください。
   

▲TOP


Q [01-016]どこで購入できますか。
 
   

  A  弊社より直販となります。
   

▲TOP


2. SDK(ライブラリ、サーバ)に関する質問 【回答集】

Q [02-001]数字や記号の読み上げはできますか。
 
   

  A  C言語のAPIがございます。
 コンパイラは、Windowsでは、VC6(MicrosoftVisualC++ Ver6)、Linuxでは、gcc 3.4.3-9.EL4、gcc 4.1.1-52.EL5 に対応しています。
Borland C++、C#、.NET、VBなどのコンパイラからの呼び出しには未対応です。
   

▲TOP


Q [02-002]同時に何回線まで対応できますか。
 
   

  A  サーバスペックや、同居する他のアプリケーションにもよりますが、1PRI(24ch)以上の対応が可能です。
   

▲TOP


Q [02-003]マルチスレッド対応ですか。
 
   

  A  対応しています。
   

▲TOP


Q [02-004]複数のプロセスに同時に音声を出力することは可能ですか。
 
   

  A  可能です。
 本製品はマルチプロセス、マルチスレッド対応ですので、同時に複数のプロセスもしくはスレッドからサーバに対して音声合成要求を行うことが可能です。
   

▲TOP


3. ツール(FutureVoice EX Editor)に関する質問 【回答集】

Q [03-001]チューニングはどのようにして行いますか。
 
   

  A  複数の手段によるチューニングが可能です。
 例えば、新商品名などシステム辞書にない単語に対して正確なヨミガナを付与したい場合は、ユーザ辞書にその商品の表記と、対応するヨミやアクセント情報を登録します。また、カナアクセント文という中間形式を編集することにより、長い文全体に対して、読みやアクセント、息継ぎの位置を調整することができます。。
 さらに詳細なチューニングを行ないたい場合は、音声合成に使用する「音声素片」を、音声合成エンジンによる自動選択ではなく、人手により明示的に指定することにより、更に音質を向上させることも可能です。
   

▲TOP


Q [03-002]いちど合成/編集したファイルを、後でまた編集し直すことはできますか。
 
   

  A  本ツールを使って作成した音声の、読み仮名情報については、情報を保存するための独自の形式のファイルが用意されており、再度読み込み/編集が可能です。また、文章や単語のイントネーション等も、専用の機能を使って編集内容が記録・保存されていれば、同じテキストに対して適用ができます。
 ただし、本ツール以外で作成された音声を編集・加工することはできません。
   

▲TOP


Back
音声合成「FutureVoice」トップへもどる
お問い合わせ・ご注文先
社名 NTTアイティ株式会社
住所 〒231-0032 横浜市中区不老町2-9-1 関内ワイズビル
TEL (045) 651-7512
FAX (045) 651-7737
E-Mail info-vcj@ntt-it.co.jp
担当部署 音声事業部 営業部
営業時間 9:00-17:30(月−金) ※祝祭日、特別休日を除く
ページTopへ

COPYRIGHT (C) NTTアイティ株式会社