1。连通区域分析,检测出字符区域(轮廓外形)以及子轮廓。在此阶段轮廓 线集成为块区域。

 

2。行检测。利用等间距检测与分割算法,包括识别出词与字符的空格区别, 由字符轮廓和块区域得出文本行。

3。单个字符识别。并对初次识别效果不佳的字符进行分割与联想,对于有多 种可能的情况,应用词典的距离计算,选择最佳的可能性。对于一些空格特征不 明显的语言,如中文,可以先识别标点符号。来`自+优-尔^论:文,网www.chuibin.com +QQ752018766-

4。多次识别。采用具有学习能力的自适应分类器,先分析的且识别效果佳的 字符也作为训练样本,tesseract 会对识别不太准确的字符进行重新识别,使识别 精确度得到提高。

4。 最后,识别含糊不清的空格,以及采用其他方法,如由笔画高度识别小 写字母的文本。


上一篇:移动平台即时通讯XMPP协议发展研究现状
下一篇:互联网预约排队系统的设计与实现

基于Android的电子拍卖系统设计与开发

基于Web应用的致胜公司企业内部培训系统设计

Matlab基于多旋翼飞行器的飞行控制系统设计

基于字典学习的多视图低维相关表示方法研究

基于android通讯与游戏的手...

C#移动无人指挥车系统设计

基于android的环境信息管理系统设计

个案管理茬老年糖尿病患...

淮安市高校足球运动损伤问卷调查表

激光模拟训练器材国内外研究现状

浅谈农村大气环境保护的制度构建【1868字】

发酵米粉优势菌株的发酵特性研究

大淘宝网的虚假交易研究

新疆农林高校學生昆虫生...

2021年什么行业赚钱,适合...

日语论文中日酒文化对比研究

肢体语言在小学英语教学中的应用浅谈