誰でも文字は読めるから、自分が読める文字が何故機械で読めないかについて、 いろいろ意見を述べることができる。しかも、音声とは違って文字の構成原理が明確なので、 自分はこのように文字を認識しているに違いない、という思い込みも強烈である。
昭和42年頃の第1次の郵便区分機開発 (このときは日立は撤退した) の時期には、 このような思い込みからの御意見も多数あったらしいが、 このときは私は関与していなかったので影響はなかった。
われわれが文字認識手法開発に取り組んだ時期では、 さすがに人間と機械の認識方式は違うのだということがお偉いさんにも理解され、 こういう風に認識しなさいという御指導はなかった。
しかし、機械による文字認識では、自信を持って出した答えが誤りであり、 確信がなくてリジェクトした答えが正解であることは非常に多い。 このことは多分パターン認識の専門家以外には完全には理解して貰えないだろう。
誤り 0 の認識方式を開発するのは、実は簡単である。
全ての入力パターンをリジェクトしてしまえばいいからである。
しかし、そんな装置が受け入れられる筈もない。
誤読もお客さんには迷惑だが、リジェクトだって数が多ければ迷惑である。
工学的観点からは、許容されるリジェクト率というものがあって、
その条件の下で誤読率最小の方式 (+辞書) を開発すればいいではないかと考える。
(誤読率一定でリジェクト率最小でも良い。両者のバランスを取ったのが R+10E 基準である。)
しかし、お偉いさんは「誤読は製品の欠陥である。1個でも出すことはまかりならぬ」
と凄い見幕なので、相手にしては怪我をする。
しかし、顧客の秘密保持という点では実行困難である。 個別の文字パターンなら未だ許されるかも知れない。 しかし、最近の文字認識では、個別の文字画像に止まらず帳票全体の画像を解析している。 これを自動的に行うには顧客の帳票を (いわば勝手に) コピーして、 メモリに格納しないといけないが、それを顧客が許可してくれるかどうか疑問もある。
参考文献
←[手書き文字認識]
←[中野の研究紹介]
←[中野の目次]
mail address: | ![]() |
← お手数ですが打ち込んで下さい |
First Written February 2, 1999
Transplanted to KSU Before August 27, 2003
Transplanted to So-net May 4, 2005
Last Update July 11, 2005