研究テーマの詳細

[中野の研究紹介][中野の目次]


文書画像理解

文字認識と協調した文書理解システムを世界で初めて開発した (1984)。

文書理解とは、文書のレイアウトや論理構造を自動的に解析する技術であるが、 それまで画像解析に基づいた手法 (形状だけに着目) が主流だった。

本研究では、文字認識は文書理解に必須であることを指摘した。 文字認識と協調した文書理解システムの実現は世界で初めてである。 対象は表形式文書 (帳票) に限られると言わないと誇大宣伝だが、限定されているものの、 世界初の成果であることは確か (と思う)。

この技術と漢字 OCR を組み合わせた 「文書入力 OCR」 を昭和59年の日立技術展に出展した。

書式定義言語 (FDL) による文書理解

トップダウン型文書理解に適した言語 FDL を提案。文書理解エンジン FDE を用いて、 各種文書の解析に適用した。

FDL は定型文書の解析にしか使えないと誤解されているのは残念。 論文の書き方 (実現方法の説明の拙さと控えめな主張) を反省せねば。

FDL を共に提案し、研究の大半を担当された東野純一氏は、平成9年1月に逝去された。 40代初めの若さであり、これからの活躍が期待されていたが、誠に残念である。 氏の御冥福を祈る。

参考文献

  1. 中野康明他; 文字認識と協調した表形式文書の理解, 電子情報通信学会論文誌,J69-D [3], pp.400-409 (1986)
  2. 中野康明他; 文書画像の傾き補正のための一方式, 電子情報通信学会論文誌,J69-D [11], pp.1833-1834 (1986)
  3. Y. Nakano et al.; A Document Understanding System Incorporating Character Recognition, Proc. 8th ICPR, pp.801-803 (1986)
  4. J. Higashino, Y. Nakano, H. Fujisawa and M. Ejiri; A Knowledge-based Segmentation Method for Document Understanding Recognition, Proc. 8th ICPR, pp.745-748 (1986)
  5. 東野純一他; 書式定義言語を用いた文書画像の理解 , 画像電子学会誌, Vol.17, No. 5, pp.267-276 (1988)
  6. 中野康明他; 文書ファイリングのための文書理解の一方式 , 電子情報通信学会論文誌,J71-D [10], pp.2050-2058 (1988)

[中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written Before January 10, 1995
Transplanted to KSU Before May 16, 2003
Transplanted to So-net May 4, 2005
Last Update July 11, 2005