基于多特征提取的手写汉字识别算法及其实现 第7页

基于多特征提取的手写汉字识别算法及其实现 第7页
4  算法实现结果和分析
4.1  模拟结果介绍
 MFC支持界面操作,在vc平台上建立一MFC AppWizard.exe文件,根据系统提示建立一对话框后拖入需要的控件(按扭、文本框等),在控件的消息响应里写如响应代码,按此步骤程序运行结果如下:   
图 4.1  程序运行界面
其中中间的白色区域是模拟手写板,用鼠标可以在里面进行写字操作,右边四个按扭的功能分别为:
  识别:对写如的汉字图像进行识别;
  清除:清除手写板中内容以重新书写;
  学习:若想要往字库中添加字符,可先写如要添加的汉字然后点击此键;
  退出:结束软件运行;
下面演示手写汉字的识别操作,首先写入汉字    
               图4.2  汉字的写入
   点击“识别”按扭进行识别操作    
                图4.3  系统识别写入的汉字图像
汉字被成功识别。若字库中没有写如的汉字,可以点击“学习”按扭向字库中添加此字。如下图所示:   
              图4.4 通过“学习”过程向字库添加汉字特征
4.2  结果分析
  通过前面几章的讲述,至此基于多特征提前的联机手写汉字识别算法及起计算机实现都已完成,下面是部分实验的识别效果和对算法的分析。
  在实验中能识别的汉字图像如:
                   图4.5 能够识别的汉字图像示例
                      图4.6 不能识别的汉字图像示例
算法对书写规范性不同的汉字图像的识别率见下表:
汉字书写的规范性 样本容量 能识别数量 不能识别数量 识别率
很规范 80 74 6 92.5%
较规范 80 68 12 85.0%
不规范 80 42 38 52.5%
                 表4.7 对不同程度规范汉字图像的识别率
其中,规范性主要是指笔划的标准程度,比如说“横”的歪曲度等。
下表给出了该算法对不同结构的汉字的识别效果:
汉字结构类型 样本容量 能识别数量 不能识别数量 识别率
上下结构 50 46 4 92.0%
左右结构 50 48 2 96.0%
半包围 50 41 9 82.0%
全包围 50 45 5 90.0%
复合 50 44 6 88.0%
                 表4.8 对不同结构汉字的识别率(很规范)
从上表可以看出,该算法对半包围和复合结构的汉字识别效果不太理想,主要因为这两种结构的汉字书写起来难度较大,用鼠标很难把每一笔划写得标准,这就直接导致了识别率的降低.
从以上实验结果,我们可以得出结论:基于多特征提取的识别算法通过两级识别机制,弥补了单纯基于笔划特征算法和单纯基于统计特征算法的不足,同时在计算量上也没有增大太多,多写的比较规范的汉字能识别90%以上,在实际应用中取得了比较好的效果,但有实现该算法有两点必须注意:
(1) 基于笔划特征提取算法强调书写每一个字时都要遵循一定的笔顺(此处的“笔顺”是广义的,即第一次向字库中读入该字时的书写顺序),不然将无法识别,现在字库中的常用字都是严格按笔顺写入的,如使用者的书写习惯不同,可在第一次使用时向字库中添加。此外还有一点,书写汉字时不能有连笔现象,这样将无法识别或得到错误结果。
(2) 由于手写体和印刷体差别很大,欲使通常应用于印刷体汉字识别的基于统计特征的算法在手写体汉字识别中取的较好效果,汉字的书写就必须强调规范、工整,不然可能无法正确识别。
      上述两点注意事项其实可以看做是本算法的不足,目前基于汉字特征点的识别算法和小波分析算法可以对以上不足做出比较好的补充,具体请查阅参考书目。

上一页  [1] [2] [3] [4] [5] [6] [7] [8] 下一页

Copyright © 2007-2012 www.chuibin.com 六维论文网 版权所有