NTT-IT HOME
+ NAVIGATION +
トップ
音声認識とは
製品紹介
ShakerRec
SpeechRec
導入事例・適用例
FAQ
Voice System Division
+ More Information +
Vシリーズ
ADVICE C3
Advice
スマート・コンタクトセンター
オペレーター協調応答サービス
ActiveDialer
音声認識
音声合成
音声ソリューション

   HOME >  製品 >  CTI・音声 >  音声認識ソフトウェア

音声認識ソフトウェア ShakerRec / SpeechRec

小語彙から大語彙連続音声認識までカバー、負荷分散を考慮した高速・高精度不特定話者音声認識ソフトウェア

NTT研究所の音声認識エンジン 「VoiceRex」 搭載
電話音声、VoIP音声も高精度に認識
認識対象語彙の設定/メンテナンスが容易
各種新機能搭載、安定した動作、豊富な導入実績

自由な発話を高精度に認識、SpeechRecをリリースしました。

抜群の認識精度

ShakerRecは音声認識エンジンとしてNTTサイバースペース研究所開発の「VoiceRex」を搭載。 長年にわたって培われた高い技術力と豊富なデータにより、さらに高精度な音声認識を実現しています。

ShakerRecとは

「ShakerRec」は、不特定話者の単語・連続音声認識および話者や環境雑音への適応機能を複合した総合的な音声認識のためのソフトウェアライブラリです。特に電話音声入力に対しても高精度音声認識を実現し、幅広いサービス分野に適用可能です。

・不特定話者の音声認識が可能
孤立単語発声から大語彙の連続発声まで対応
認識対象語彙はテキストで指定

・マイク音声はもちろん、難しいとされている電話回線経由の音声も高精度に認識
CTIシステムへの導入実績が多数

・ガイダンス途中での割り込み音声入力機能(バージイン)(※)

・話者適応・雑音適応機能など各種適応機能により、様々な利用環境で高い認識性能を発揮

(※)
当社ボイスポータルプラットフォーム ADVICE C3 との連携により提供可能な機能です。

多様な利用環境下で自由なタイミングで話された発話も高精度に認識します。New!
(SpeechRec)

自由発話対応 SpeechRec

「SpeechRec」は、「ShakerRec」をベースに開発された自由発話対応の高精度音声認識ソフトウェアです。電話回線のみでなく、インターネット、PCアプリケーションなどマルチモーダルな環境下で、誰が/いつ/なにを/どんな言い方で話しても、高精度に音声を認識し発話を理解できる実用サービスの実現が可能です。

(1)表現の実例(発話例文)から確率的に言語をモデル化、多様な表現に対応可能
認識させたい、あるいは発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化する手法により、人手による文法規則の決定や記述が不要となり、多様な表現に柔軟に対応することができます。基本言語モデルは約10万の発話例文より作成されていますが、確率的モデル化手法の採用により、適用業務や発話内容に応じた言語モデルのチューニングが可能であり、認識性能向上を図ることができます。

(例)
「秋のセールの特売商品を知りたいのですが」のように利用者が話す実例を数多く集め、「秋」「の」「セール」や、「セール」「の」「特売商品」、といった単語の並びを多数モデル化しておき、頻繁に使われる言葉をより認識しやすくします。


(2)適切なキーワードのみを抽出する発話理解機能の実装
認識結果のディクテーションテキスト(単語列)の中から適切なキーワードのみを抽出する発話理解機能を備えており、自由に発話された音声から適用サービスでの用件を遂行するために必要なキーワードのみをを抽出することができます。

(例)
「えーと、渋谷で居酒屋を探して欲しいのですが」のような認識結果の単語列から、キーワードとして「渋谷」「居酒屋」を抽出します。


(3)発話制約のない対話制御方式を採用
認識結果項目ごとの肯定/否定(はい/いいえ)確認をともなう対話管理ではなく、認識結果そのものの否定・訂正状況(状態変化)を用いた対話制御方式を採用することにより、ガイダンスにとらわれない自然な対話(発声)を可能としています。利用者は、言い直しや言い淀みなども含め日常生活で話すのと同じ自由な話し方で発声できます。

(例)
「渋谷でなくて、品川でお願いします」のような自然な発話が可能です。


(4)音響モデルの充実により高齢者や子どもの音声、VoIP網にも対応
音響モデル(音声の特徴をモデル化したデータベース)としては、成人とは特徴が異なる高齢者や子どもへの対応、VoIP網経由の音声への対応などにより、幅広い話者や多様な環境での利用を可能としています。また、適用先や必要性に応じて適切な音響モデルを選択することができます。

不特定話者対応ですので、事前の音声登録を必要としません。

特殊なハードウェアを必要とせず、ソフトウェアのみでの音声認識が可能です。

電話音声でも高い認識性能を発揮しますので、電話サービスにも安心してお使いいただけます。

当社CTIプラットフォームAdvice、ボイスポータルプラットフォームADVICE C3をはじめ各種サービス・システムで国内1,500回線以上の豊富な導入実績があります。 多くのお客様にご利用いただいている、信頼性の高い音声認識エンジンです。


使いやすさと経済性、便利な機能

認識する単語や文章の設定にはテキスト形式での記述を採用しているため認識対象語彙の設定が容易で特別な知識は必要ありません。 また、特殊なツール類も不要です。

音声認識を使うほどに認識誤りを減らすことができる話者適応機能(タスク適応機能)を装備。

音声認識の妨げになる背景雑音の影響を小さくする雑音適応機能を装備。

マルチスレッドに対応。スレッド別に異なる音声認識を行うことができます。

サーバ/クライアント方式による負荷分散と、独自のサーバ照会機能により優れた経済性と拡張性をご提供します。(サーバ版ご利用の場合)。
特に当社ボイスポータルプラットフォームADVICE C3とあわせてご利用いただくことにより最高のパフォーマンスを実現できます。


用途に応じた製品ラインアップ

電話応答サービスの自動化、音声によるコンピュータ操作・データ入力、各種アプリケーションなど、幅広い分野でお使いいただけます。

使用目的に応じてライブラリ版とサーバ版をご用意しています。必要最低限の構成でのシステム構築を実現し、また増設にも柔軟に対応できます。

ANSI C規格準拠のオブジェクトライブラリという形でご提供いたします。ShakerRec サーバ版の場合は、サーバ用通信ライブラリが同梱されます。


 
 

「ShakerRec」はNTTアイティ株式会社の登録商標です。
「VoiceRex」は日本電信電話株式会社の登録商標です。
記載されているその他の製品名および会社名は、一般に各社の商標または登録商標です。

    音声認識トップ │ 音声認識とは │ 製品紹介 │ 導入事例 │ FAQ    

お問い合わせ・ご注文先
社名 NTTアイティ株式会社
住所 〒231-0032 横浜市中区不老町2-9-1 関内ワイズビル
TEL (045) 651-7512
FAX (045) 651-7737
E-Mail info-vcj@ntt-it.co.jp
担当部署 音声事業部 営業部
営業時間 9:00-17:30(月−金) ※祝祭日、特別休日を除く
ページTopへ

COPYRIGHT (C) NTTアイティ株式会社