研究テーマの詳細

[中野の研究紹介][中野の目次]


文字認識結果の知識処理(後処理)

手書き漢字認識では、誤認識は避けられない。 文字の種類が多いため、類似した文字が多数組存在し、 また、手書きによる変形も大きいからである。 幸い、漢字を認識する際、無意味な記号列として読みとる必要はほとんどなく、 文章や、地名・人名などの単語として読みとって欲しい、という要求が大半である。

この事実を利用すると、知識処理による誤認識の修正が可能となる。 例えば認識結果が「鹿児鳥」であったとき、 これが地名であるという知識を用いれば「鹿児島」に修正することは可能である。

[余談]
上記の「鹿児島」→「鹿児鳥」という誤認識の例は、あまり深く考えずに出した例である。 ところで、県名であることが決っている項目では、 対象を県名として使われる文字に限定することが可能である。 したがって、「和歌山」→「利歌山」というような誤認識は生じ得ないから、 こんな例を出したとしたら少しまずかった。 しかし、「鳥取」県があるので、 対象文字を限定しても「鹿児島」→「鹿児鳥」の誤認識は生じ得る。 偶然とはいえ助かっていた。「鳥取」→「島取」でも良かった。

時期尚早の試み

1970年代に印刷漢字認識の応用を模索する中で、 文章における制約を知識として利用することが有効であることを見出し、 開発した漢字認識パイロットシステムの中に組み込んだ。 漢字 OCR における知識処理として、時期的に早かったと思う。 しかし、漢字 OCR のニーズがなかったので、折角の技術開発が役に立たなかった。

15年近く経過し、手書き漢字 OCR 実用化に際して知識処理が必要となり、特に高速化が迫られた。 そのため、知識処理の高速化を研究したが、在職中には完成せず後輩に託した。

参考文献

  1. H. Fujisawa, Y.Nakano, Y. Kitazume and M. Yasuda; Development of a Kanji OCR: An Optical Chinese Character Reader, Proc. 3rd ICPR, pp.816-820 (1978)

[中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written Before August, 1996
Transplanted to KSU Before May 16, 2003
Transplanted to so-net May 4, 2005
Last Update May 5, 2005