NTTアイティ
HOME

文字認識

技術紹介
image 手書き英数仮名文字認識技術をより高い性能を目指して開発しています。
くせ字を含む大量の文字パターンデータベースを学習した識別辞書を内蔵し、読取る文字との類似度、 距離を定量的に求めて識別するパターン整合法を用いています。
本処理の前処理ではノイズ/掠れに対応した画像処理、正規化、黒点数によるスペース判定を、 後処理ではきわどい認識候補距離値に対するリジェクト(誤読の防止)を行います。
※手書き英数仮名文字認識技術はNTT研究所で開発された技術です。
特徴
識別辞書の学習方法に特徴が有ります。
文字認識にパタン整合法を適用した識別処理のほとんどは、各識別対象毎に閉じた統計量のみが用いられ、 "その文字らしさ"を定義するに留まっていました。
本認識アルゴリズムは、従来の"その文字らしさ"の定義に加え、各識別対象間で求められる統計量を取り入れ "他の文字らしくなさ"を強調して高精度な識別性能を実現しています。
利用イメージ
認識文字画像 帳票または文書等から切り出された各文字データが認識対象となります。
文字データは2値化表現し、0は白点、1は黒点を意味します。
認識結果 文字データに対して認識処理を施すことによって認識結果が得られます。
第1候補がより小さい候補距離値を持ち、第2候補との距離差がより大きい場合に 確度の高い認識結果が得られたことになります。
第1候補の距離値自体、および第1・第2候補の距離値の差が小さいとき判定を保留し、誤読を防ぎます。
製品仕様

NTTアイティ株式会社
画像事業部
〒231-0032
神奈川県横浜市中区不老町2−9−1 関内ワイズビル
 TEL:045-651-7597 FAX:045-222-9660
 E-mail: info-bcj@ntt-it.co.jp
   
NTT-IT