自由発話対応 SpeechRec
「SpeechRec」は、「ShakerRec」をベースに開発された自由発話対応の高精度音声認識ソフトウェアです。電話回線のみでなく、インターネット、PCアプリケーションなどマルチモーダルな環境下で、誰が/いつ/なにを/どんな言い方で話しても、高精度に音声を認識し発話を理解できる実用サービスの実現が可能です。
(1)表現の実例(発話例文)から確率的に言語をモデル化、多様な表現に対応可能
認識させたい、あるいは発声される可能性のある表現を実例(発話例文)として大量に収集し、そこに含まれる単語の並び方(文法規則)を確率的にモデル化する手法により、人手による文法規則の決定や記述が不要となり、多様な表現に柔軟に対応することができます。基本言語モデルは約10万の発話例文より作成されていますが、確率的モデル化手法の採用により、適用業務や発話内容に応じた言語モデルのチューニングが可能であり、認識性能向上を図ることができます。
(例) 「秋のセールの特売商品を知りたいのですが」のように利用者が話す実例を数多く集め、「秋」「の」「セール」や、「セール」「の」「特売商品」、といった単語の並びを多数モデル化しておき、頻繁に使われる言葉をより認識しやすくします。
(2)適切なキーワードのみを抽出する発話理解機能の実装
認識結果のディクテーションテキスト(単語列)の中から適切なキーワードのみを抽出する発話理解機能を備えており、自由に発話された音声から適用サービスでの用件を遂行するために必要なキーワードのみをを抽出することができます。
(例) 「えーと、渋谷で居酒屋を探して欲しいのですが」のような認識結果の単語列から、キーワードとして「渋谷」「居酒屋」を抽出します。
(3)発話制約のない対話制御方式を採用
認識結果項目ごとの肯定/否定(はい/いいえ)確認をともなう対話管理ではなく、認識結果そのものの否定・訂正状況(状態変化)を用いた対話制御方式を採用することにより、ガイダンスにとらわれない自然な対話(発声)を可能としています。利用者は、言い直しや言い淀みなども含め日常生活で話すのと同じ自由な話し方で発声できます。
(例) 「渋谷でなくて、品川でお願いします」のような自然な発話が可能です。
(4)音響モデルの充実により高齢者や子どもの音声、VoIP網にも対応
音響モデル(音声の特徴をモデル化したデータベース)としては、成人とは特徴が異なる高齢者や子どもへの対応、VoIP網経由の音声への対応などにより、幅広い話者や多様な環境での利用を可能としています。また、適用先や必要性に応じて適切な音響モデルを選択することができます。
|