文書ファイリングのための文書理解の一方式

中野康明、藤澤浩道

電子情報通信学会論文誌, Vol.J71-D [10], pp.2050-2058 (1986)

あらまし

画像ファイルへの文書の自動登録を目的として、 ほぼ定形的な文書を対象とする文書理解のための一方式を提案した。 本方式では、入力文書画像に対して、短い白画素の連を消去する前処理を行った後、 文字行の候補領域を抽出する。一方、文書の種類ごとに、あらかじめ書式を定義しておき、 この書式定義と文字行の候補領域とを整合させる。書式定義と入力文書が整合したとき、 すなわち書式定義で指定された行に対応する候補領域がすべて存在するとき、 入力文書はこの書式の文書であると識別する。2種類の文書について実験を行い、 特許公報81ページについて 100%、特許明細書 106 ページについて 98% の識別率を得た。

[文書画像理解][中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written Before June 17, 1998
Transplanted to KSU Before May 16, 2003
Transplanted to So-net May 3, 2005
Last Update April 10, 2007

© Yasuaki Nakano 1998-2007