NTT-IT HOME
+ NAVIGATION +
トップ
音声合成とは
製品紹介(ラインアップ)
FutureVoice EX Library
FutureVoice EX Server
FutureVoice EX Editor
FutureVoice ASP
サンプル音声
導入事例・適用例
FAQ
Visual Speech Creator
Voice System Division
+ More Information +
Vシリーズ
ADVICE C3
Advice
スマート・コンタクトセンター
オペレーター協調応答サービス
ActiveDialer
音声認識
音声合成
音声ソリューション

   HOME >  製品 >  CTI・音声 >  音声合成ソフトウェア
高品質テキスト音声合成ソフトウェア FutureVoice EX

音声合成とは

文章データを音声データに変換することを「音声合成」といいます。

処理は大きく分けて、漢字仮名混じり文を解析して漢字に対する読みやアクセント、ポーズを付与する[テキスト解析処理]と、それらの情報に基づいて音声を生成する[音声合成処理]から成っています。

高度なテキスト解析処理と音声合成処理により、正確な読みと自然なアクセントでの音声合成が実現されます。

テキスト解析処理

音声にするための文章を指定すると、まず、その文章に対してもっとも適した読みやアクセントが決定されます。この処理を「テキスト解析処理」といいます。具体的には、例えば「天気」を「テンキ」と読むということと、アクセントが「テ」の位置にあるということを調べます。
このように正しい読みやアクセントを得るためには前後の文脈なども考慮する必要があり、もし正しい読みやアクセントが得られなかった場合(つまりテキスト解析処理に誤りがあった場合)は、合成音声の明瞭性や自然性に大きな影響を及ぼすことになるため、テキスト解析処理には高い精度が要求されます。
当社の音声合成製品のテキスト解析処理では、NTTサイバースペース研究所で開発された約50万語の単語辞書を用いて、連接する単語の文法的接続関係を手がかりに高精度な読み/アクセント/ポーズ付与を実現しています。
テキスト解析ブロック図
合成処理

テキスト解析処理で生成された仮名アクセント文を、実際の音声データに変換する処理を「合成処理」といいます。
当社の音声合成製品の合成処理では、合成音声特有の機械音らしさを軽減するためアナウンサーによる収録音声データを使用し、また波形重畳と呼ばれる音質の劣化防止、ノイズ対策に強い方式を用いることで、人間の発声に近い明瞭性の高い音声品質を実現しています。
音声合成概要図

「FutureVoice EX」音声合成エンジンは、業界最高クラスの高品質な音声合成を実現しています。

従来の「FutureVoice」エンジンに、新たに高品質化技術を導入することにより、これまでの品質をさらに上回る、より自然な抑揚のある音声の合成を実現しています。

音声合成処理の流れと高品質化のポイント

新たに、自然な読み上げ口調音声の学習結果に基づく統計的な韻律生成技術や合成音声の韻律の安定化と高品質化を実現する音声選択的韻律適応技術を導入し、肉声に近い自然な読み上げ音声を実現しています。また、音声合成用データベースをさらに拡充し、音質の滑らかさが向上しました。音と音のつながりが滑らかになり、従来に比べさらに聞き心地のよい音声を作成することが可能となっています。

(1)統計的韻律生成処理の導入
大量の読み上げ口調音声からの学習結果に基づいた、統計的な韻律生成技術により、従来の規則やテンプレートに基づいた韻律生成技術と比べて、より自然な読み上げ口調韻律パターンの生成を実現しています。

(2)選択的素片韻律変形処理の導入
コーパスベース音声合成技術では、音声データベース中の音声素片を適切に選択・連結して素片系列とすることにより、音声を合成します。このとき、目標とする韻律パターンに合致する音声素片がデータベース中にない場合、目標パターン近いものが選択されるため、韻律がずれて不安定に聞こえてしまうことがあります。一方でこれを解決するために、音声素片を一律に目標韻律パターンに合わせて韻律変形すると、変形に伴い音質が劣化して肉声らしさが失われてしまうという問題があります。
これらの問題を解決するため、今回導入した選択的素片韻律変形処理では、目標韻律パターンから外れた不適切な音声素片に対してのみ韻律変形を行うことで、合成音声の韻律の安定化と高品質化を両立させました。

(3)音声データベースの拡充
音声情報提供サービスなどで重要な数字読み上げ部分を重点的に音声データベースを拡充しました。これにより、音と音の繋がりが滑らかになり、さらに聞き心地の良い音声の合成が可能となりました。
音声合成処理の流れと高品質化のポイント

  音声合成トップ │ 音声合成とは │ 製品紹介 │ サンプル音声 │ 導入事例 │ FAQ  

お問い合わせ・ご注文先
社名 NTTアイティ株式会社
住所 〒231-0032 横浜市中区不老町2-9-1 関内ワイズビル
TEL (045) 651-7512
FAX (045) 651-7737
E-Mail info-vcj@ntt-it.co.jp
担当部署 音声事業部 営業部
営業時間 9:00-17:30(月−金) ※祝祭日、特別休日を除く
ページTopへ

COPYRIGHT (C) NTTアイティ株式会社