弊社のライブラリを使用して2値化特徴成分をニューラルネットワーク入力層とした文字認識実験を行いました。
1. 入力画像を2値化
2. MSゴシックの数字0〜9までを学習
■特徴:文字を3×4に分割し1枠内の黒画素の個数
■学習係数:1.0
■学習回数:5000回
3. 特定枠内の文字を認識
1. MSゴシック
2. MS明朝
4. 結果:読み取り正解率
1. MSゴシック:60%
2. MS明朝:40%
結果としては、登録したフォントでの場合、ある程度認識は可能であるが異なったフォントの場合より読み取り率低下は免れないようです。
弊社のライブラリおよびコグネックス社のライブラリを使用してPatMax®特徴成分をニューラルネットワーク入力層とした文字認識実験を行いました。
1. 入力画像から“0”をモデルとして登録
2. MSゴシックの数字0〜9までを学習
■特徴:文字を3×4に分割した枠内のPatMax特徴点の個数
■学習係数:1.0
■学習回数:5000回
3. 特定枠内の文字を認識
1. MSゴシック
2. MS明朝
4. 結果:読み取り正解率
1. MSゴシック:100%
2. MS明朝:100%
結果としては、今回は2値画像を入力した場合と違い、登録したフォントでも異なったフォントでも 100%の読み取り結果が得られました。これはPatMax(R)の特徴が単純な2値化とは違い、形状を特徴成分としているためと考えられます。