研究テーマの詳細

[中野の研究紹介][中野の目次]


音声認識

1960年代終りに発表された、迫江博昭氏(日電、現九大教授)の Dynamic Programming 利用整合法 (DTW) による音声認識手法は世界にショックを与えた。これに刺激され、追試により DTW の有効性を確認した。 DTW 単独では不十分で使用する特徴が重要であることを指摘した。 ( DTW = "Dynamic Time Warping" という名称は後にアメリカで付けられたもので、 当時は "DP Matching" などと呼んでいた。 日本で開発された技術にアメリカで提案された用語の名がつく例はこれだけではないが、 残念なことである。 )

この研究成果を学会論文として投稿したが、これが私の学位審査で役に立ってくれた。

学位審査では第二外国語の試験がある。この試験は、ドイツ語の文字認識関係の論文を選んで訳し、 原論文のコピーと訳とを提出して複数の審査教授の前で説明するものである。 そのとき、私の選んだ論文の一つ前の論文が音声認識に関するものだったが、 これが下記の論文を引用してくれていて、 そのことが私の選んだ論文のコピーからわかった。

現在、多くの論文誌では論文ごとに改頁するので、コピーで前の論文が見える機会は少ない。 昔は紙面節約のため「追い込み」といって、前論文の終りに続けて次の論文を印刷していた。 したがって、先頭頁に前論文の参考文献欄が掲載されていることが多かった。

私自身は全く気付かなかったが、主査の教授が「これは中野君の論文ではないか」 と気付いて下さって、大いに面目を施した。

参考文献

  1. A. Ichikawa, Y.Nakano and K. Nakata; Evaluation of Various Parameter Sets in Spoken Digits Recognition, Trans. IEEE on Audio, AU-21 [3], pp.202-209 (1973)

[中野の研究紹介][中野の目次]

mail address: ← お手数ですが打ち込んで下さい

First Written Before January 10, 1995
Transplanted to KSU Before August 27, 2003
Transplanted to So-net May 4, 2005
Last Update July 11, 2005