1997年頃、あるところでこの理論が紹介され、
(電子メイルと参加者限定ウェブ上で) 議論が展開された。
そのときに作られた安田氏論文の電子テキストはあるが、
公開されたものではないので著作権の観点から紹介せず、筆者の理解したところを紹介する。
したがって、このページに誤りがあれば全責任は筆者にある。
読んで戴けばわかるように、光学的文字認識 (OCR) をパターン認識の例としてとっている。
ここで述べるパターン認識の安定性に関する議論は、 1970年代に相関を利用する印刷文字認識手法の研究に携わっていた安田氏が、 その延長として考察したものである。
1.クラス概念を Ci (i=1, ..., n) とし、nは十分に大きいとする 2.学習は、iについて逐次的に行われるものとする 3.認識系が、未知パターンXをクラスCiと認識することを、つぎのように表記する ψ(X,C1,C2,...,Cn) ⇒ ci (1)ciは、クラスCiを表す記号であり、 クラス概念Ciと記号ciは一対一で対応する。 式(1)で、C1,C2,...,Cnは、 学習済みのクラス概念の全体である。
ψ(X,C1,C2,...,Cn)⇒ ci (2)であるとすると、新たなパターン概念Cn+1を学習することによる、 未知パターンXに対するパターン認識系の認識結果は、つぎの何れかである。
ψ(X,C1,C2,...,Cn,Cn+1) ⇒ ci または (3) ψ(X,C1,C2,...,Cn,Cn+1) ⇒ cn+1式(3)の性質を、パターン認識系の学習過程における安定性 と呼び、 パターン認識系が満たすべき基本的な性質であるとする。
安田氏はこの安定性が、人の通常のパターン認識でごく自然なものであると主張する。
たとえば、文字を始めて学習するさいに、まず算用数字を覚え、
ついで英字を学習する過程を踏むものとする。
安定性とは、算用数字だけ学習した段階で 0(ゼロ)と認識していた未知パターンを、
英字を併せて認識できるように学習した結果、
O(オ−)や B(ビ−)と認識するように変わることはあっても、
認識結果が同じ算用数字の 8(ハチ)に変わるようなことは起らないことを意味している、
とする。
Φ(X,Ci,Cj) ⇒ ci または ⇒ cj (4)すべてのj (j≠i) について、式(5)が成立したとする。
Φ(X,Ci,Cj) ⇒ ci (5)このとき、未知パターンX のクラスを ciと認識する。 このパターン認識系は、上記の学習過程における安定性を満たす。
このΦ(X,Ci,Cj)を、対判定(規則)と呼ぶ。
対判定 (規則) では、未知パターンは二つのクラスのどちらかであるかを判定する。
これに対し、通常採用される類似度法など、OCR商用機のほとんどが採用している認識手法では、
未知パターンと一つのクラスの類似度 (相違度) を用いて判定する。
このような手法は対判定規則の特別な場合であることを示している。
[不変則の紹介]
[不変則批判]
[不変則批判再論]
[対判定擁護]
←[パターン認識雑論]
←[中野の研究紹介]
←[中野の目次]
mail address: | ![]() |
← お手数ですが打ち込んで下さい |
First Written June 19, 2004
Transplanted to So-net May 3, 2005
Last Update April 22, 2007
© Yasuaki Nakano 2004-2007