研究テーマの詳細

[中野の研究紹介][中野の目次]


手書き英単語認識

手書き数字切り出し・認識

手書き数字では 認識との協調による手書き文字切り出し世界で初めて実用化した (1982)。

それまで、文字切り出しは認識の前処理と考えられていたが、この研究では 切り出しは認識の問題であって重要であることを指摘し、 手書き英数字を対象として、重なり・接触の場合を含めて切り出しを可能とする技術 「多重仮説切り出し法」を開発した。

手書き漢字切り出し・認識

しかし、手書き漢字認識にこの技術を適用しようとすると、 切り出された文字候補パターンの認識結果内の異常候補をリジェクトできない。 手書き漢字認識部では、個別文字認識の性能が低いことも原因の一つである。 また、へん、つくりなどの部首や逆に複数の文字を組み合わせたものが、 意味のある漢字・カナを構成することがあるからである。

そこで、文字切り出しの結果を文字認識だけで検定するのではなく、 単語認識部まで含めて検定する手法を考えた。実験するには至らなかったが、 手書き漢字を対象として特許だけは出願した。

連続筆記体手書き英単語認識

大学に移ってから、このアイデアは手書き漢字だけでなく筆記体英単語に使えるだろうと考え、 いくつかの論文を書いた。

その考えは正しかったが、世界では同じようなことを考える人が多く、 アメリカ/ロシアの郵便宛名認識システムやフランス/カナダの小切手認識システムで、 同様のアプローチを取る研究者が先に論文を書いていた。 筆記体英単語に限定すれば、われわれは後発である。

1996年にいくつかのアメリカの研究機関を訪問し、 相手のプレゼンテーションのお返しにこのアプローチを紹介したが、 先方ではこれを "oversegmentation" と呼んでいて、 ついこの前議論したというところが多いのには驚いた。

参考文献

  1. H. Fujisawa, Y. Nakano and K. Kurino; Segmentation Methods for Character Recogntion, Proc. IEEE, 80[7], pp.1079-1092 (1992)
  2. H. Yamada and Y. Nakano; Cursive Handwritten Word Recognition Using Multiple Segmentation Determined by Contour Analysis, IEICE Transaction INF. & SYST., Vol.E79-D, pp. 464-470 (1996)
  3. K. Maruyama, M. Kobayashi, Y. Nakano and H. Yamada; Cursive handwritten word recognition by integrating multiple classifiers, Proc. Third IAPR Workshop on Document Analysis Systems, pp. 272-281 (1998)
  4. 丸山、小林、山田、中野; 複数の文字認識を用いた連続手書き英単語認識, 電子情報通信学会論文誌,J82-DII [9], pp.1435-1443 (1999)

[中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written December 22, 1998
Transplanted to KSU Before May 16, 2003
Transplanted to So-net May 4, 2005
Last Update July, 2005