研究テーマの詳細

[手書き文字認識][中野の研究紹介][中野の目次]


認識方式の評価に関する諸注意

文字認識手法の比較を行うとき、認識率とコストが良く用いられる。

コストの中には、ハードウェアに関係する項目、すなわち認識速度やメモリ量、 回路素子数などが入るが、保守し易さも忘れてはならない要素である。 以前の OCR (文字認識装置)は高速性を実現するため専用回路によって作られていた。 そのため、OCR のハードウェアは、IC (LSI) の個数・基板枚数などで評価された。
最近はソフトウェアで実用的なスピードが出るようになったため、 全ての処理をマイクロプロセッサのソフトウェアで行うソフトウェア OCR が主流である。 ソフトウェア OCR では、速度に関係するダイナミックステップ数とメモリアクセス回数、 コストに関係するプログラムステップ数やメモリ量などが重要である。

認識率を比較する場合、 認識アルゴリズム認識辞書 (標準パターン) を区別すべきことに注意しよう。
同じ認識アルゴリズムでも、標準パターンを沢山用意すれば認識率を上げることは可能である。 われわれの研究の中で、藤澤氏 (現在も日立中研) が得た経験式

log(R+10E) = a - b・log(N)
がある。 ここで Nは標準パターンの個数、係数a、bは方式により定まる定数で通常 b<1 である。
この式から、評価尺度 R+10E を 1/10 にするためには、 b=1 と仮定して、N を 10倍にしなくてはいけないことが判る。
方式によって係数 a、b が異なるということは、同じ標準パターン数 N でも優れた方式とドジな方式があることを表す。 ドジな方式の場合、優れた方式と同等の認識率を上げるため標準パターンをどんどん増やす、 というアプローチも不可能ではないが、同時にメモリも増え速度も下がるから、 単に N を増やすだけでは立ち向かえないことが多い。
しかし、標準パターンのサイズを無視した認識率の比較は要注意である。

認識率の評価尺度 R+10E については別項を参照されたい。

認識率のゴマカシ Nagy の法則とコンテストについても別項に書く。

[追記]
最近の藤澤氏の講演 (at PRMU, February 20, 2004) によると、 藤澤氏は上記の経験式は Zipf の法則と同等と考えておられるようである。 未だ検討していないが、機会があったら討論してみよう。

参考文献

[手書き文字認識][中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written February 4, 1999
Transplanted to KSU Before June 29, 2003
Divided June 29, 2003 Transplanted to So-net May 4, 2005
Last Update July 11, 2005