コストの中には、ハードウェアに関係する項目、すなわち認識速度やメモリ量、
回路素子数などが入るが、保守し易さも忘れてはならない要素である。
以前の OCR (文字認識装置)は高速性を実現するため専用回路によって作られていた。
そのため、OCR のハードウェアは、IC (LSI) の個数・基板枚数などで評価された。
最近はソフトウェアで実用的なスピードが出るようになったため、
全ての処理をマイクロプロセッサのソフトウェアで行うソフトウェア OCR が主流である。
ソフトウェア OCR では、速度に関係するダイナミックステップ数とメモリアクセス回数、
コストに関係するプログラムステップ数やメモリ量などが重要である。
認識率を比較する場合、
認識アルゴリズムと認識辞書
(標準パターン) を区別すべきことに注意しよう。
同じ認識アルゴリズムでも、標準パターンを沢山用意すれば認識率を上げることは可能である。
われわれの研究の中で、藤澤氏 (現在も日立中研) が得た経験式
認識率の評価尺度 R+10E については別項を参照されたい。
認識率のゴマカシ Nagy の法則とコンテストについても別項に書く。
[追記]
最近の藤澤氏の講演 (at PRMU, February 20, 2004) によると、
藤澤氏は上記の経験式は Zipf の法則と同等と考えておられるようである。
未だ検討していないが、機会があったら討論してみよう。
参考文献
←[手書き文字認識]
←[中野の研究紹介]
←[中野の目次]
mail address: | ![]() |
← お手数ですが打ち込んで下さい |
First Written February 4, 1999
Transplanted to KSU Before June 29, 2003
Divided June 29, 2003
Transplanted to So-net May 4, 2005
Last Update July 11, 2005