平成16年11月30日
NTTアイティ株式会社
最新音声合成技術を導入したアナウンス代行サービスと
オペレーター協調応答サービスのASP提供を開始
〜 手軽で高品質な音声作成とオペレーター稼動の効率化を実現 〜
NTTアイティ株式会社(以下:NTTアイティ、本社:横浜市中区、代表取締役社長:橋田幸雄)は、最新の音声合成技術によるアナウンス代行サービスと、コンピュータによる自動応答機能によるオペレーター協調応答サービスを12月1日より開始いたします。
なお、本サービスは、平成16年6月1日から11月30日まで実施された株式会社ローソンチケット、日本電信電話株式会社、NTTアイティの3社による共同実験「チケット情報自動アナウンスサービス(愛称:チケアナ)」の実験結果を踏まえ、商用サービスの開始に至ったものです。
■開発の背景と目的
商品販売、お客様サポート等の各種コールセンターでは、受電率の向上とオペレーター稼働の効率化が急務となっています。
NTTアイティでは、こうした要望にお応えするため、お客様の問い合わせに対する回答音声をあらかじめアナウンス代行サービスで作成してデータベースに蓄積しておき、お客様から問い合わせがあった際にオペレーター協調応答サービスにより自動で回答するサービスを開発いたしました。今回ASPでの提供を開始するこれらの音声サービスは、NTTサイバースペース研究所が新たに開発した電話音声用コーパスベース
*1
テキスト音声合成技術「Cralinet(クラリネット)」を基盤とし、NTTアイティが従来より開発・提供している音声情報サービス「Vシリーズ
*2
」をもとに、独自に開発したものです。
■サービスの概要と特長
(1)アナウンス代行サービス
アナウンス代行サービスは、Webによる手軽で高品質な音声作成サービスです。お客様はインターネット経由で本サービスの専用サーバにアクセスし、ブラウザまたは専用ソフトウェアにテキストを入力するだけで簡単に音声を作成することができます。作成した合成音声はその場で試聴可能で、WAVE形式ファイルとして保存することによって音声応答サービスなどの各種コンテンツにご利用いただけます。
また、ご利用にあたっては、各種アプリケーションから本サービスを呼び出すためのアプリケーション用ライブラリを提供いたします。このライブラリをご利用いただくことにより、アプリケーションに容易に音声合成機能を導入することが可能となります。ASPでの提供のため、設備の構築・保守・メンテナンス費用が不要となり、手軽で高品質な音声合成サービスを安価でご利用いただけます。
図1 アナウンス代行サービス概要
(2)オペレーター協調応答サービス
本サービスは、システムとコールセンターのオペレーター間の相互的な音声案内を実現する機能です。お客様からの問い合わせは、Vシリーズが提供する音声応答プラットフォームで一次受け付けします。そのうちオペレーターの介在が必要な問い合わせは、コールセンターのCTIシステム
*3
に転送されます。このとき、スクリーン・ポップアップ
*4
機能より、あらかじめ登録されている回答音声の複数候補がオペレーター画面に表示されます。オペレーターが、お客様の問い合わせ内容に応じてこれら候補の中から適切な回答音声を選択すると、音声応答装置から音声が自動再生されます。音声の再生開始後はオペレーターは解放され、次のお客様の応対を行うことができます。また、自動再生された音声で用件が解決されなかった時には、再度オペレーターへ転送することも可能です。
本サービスにより、問い合わせ1件あたりの応対時間の短縮による受電率の向上だけでなく、履歴に応じた適切な応対を行うことで、きめ細かなサービスの提供を実現します。さらに、Vシリーズが提供する音声応答プラットフォームとの連携によって大規模な設備投資が不要となるため、従来に比べて安価で短期間のシステム構築が可能となります。
図2 オペレーター協調応答サービス概要
■提供価格
(1)アナウンス代行サービス
項 目
内 容
初期費用
無料
月額利用料
126,000円(1アカウントあたり、月額制、利用期間6ヵ月〜)
アカウント
1利用法人につき1アカウントが必要
(2)オペレーター協調応答サービス
(※1)
項 目
内 容
初期費用
42,000円
(※2)
月額利用料
2,100円(1アカウントあたり、月額制)
アカウント
利用オペレーター1名につき1アカウントが必要
(※1)
オペレーター協調応答サービスのご利用にあたっては、NTTアイティが提供する「Vシリーズ」のご利用契約が必要となります。
(※2)
コールセンター側設備ならびにVシリーズの設備・サービス利用料は含まれておりません。
■技術のポイント
・電話音声用コーパスベーステキスト音声合成技術「Cralinet」
入力された文章から、ナレーターによる録音音声と同等品質の合成音声を自動的に生成する技術です。従来の音声合成技術と比べ、大規模な音声データベースを用いることで肉声に限りなく近い音声品質と、姓名、アルファベット単語を中心とした精度の高い読みアクセント付与を実現しています。
本技術は、アナウンス代行サービスの基盤技術となっています。
■音声合成で利用している音声素材について
アナウンス代行サービスで提供される合成音声は、東京俳優生活協同組合に所属するナレーターの音声を音声素材として利用しており、元のナレーター音声とほぼ同等の声質を有しています。
NTTアイティは、東京俳優生活協同組合と連携して、著作隣接権についても配慮しながら、より肉声に近い合成音声を活かしたサービスの提供と開発を推進しています。
■お問い合わせ先
NTTアイティ株式会社
音声コミュニケーション事業部
担当:渡辺、千葉、松村
TEL:045-651-7512 FAX:045-651-7737
E-mail:
info-vcj@ntt-it.co.jp
URL:
http://www.ntt-it.co.jp/
[語句等の説明]
(*1)
コーパスベース
大量かつ多様な音声素片データ(コーパス)を利用すること、またはコーパスを収めたデータベースを利用すること。
特に音声合成では、数時間から数十時間の音声を収めた音声データベースを利用して音声合成を行うことを示します。
(*2)
V(ボイス)シリーズ
NTTアイティが国内で最初に製品化した業界標準VoiceXML対応の音声ポータルプラットフォームをベースとして、実績のある対話部品(設問や問答のこと、組み合わせて音声対話フローを構築する)と各種レポートをパッケージ化した音声アプリケーションシステム。音声対話フロー作成用のエディタの提供により音声アプリケーションの構築を容易に行うことができます。
Vシリーズの概要はホームページをご参照ください。
http://www.v-series.jp/
(*3)
CTIシステム(Computer Telephony Integration System)
PBXなどの電話系通信システムと、コンピュータやデータベースなどの情報系システムとを結合し、相互に連動できるようにしたシステムのこと。
(*4)
スクリーン・ポップアップ
電話の着信と同時にそのお客様に関連する情報(登録情報や過去の対応履歴など)をパソコン画面に表示させること。