摘要:
针对在自然场景下,现有的手写体票据字符识别精度低的问题,提出了一种改进的端到端的网络文本识别方法.通过对Visual Geometry Group(VGG)卷积网络进行改进,从而获取深层次的图像特征;通过改进的双向长短时记忆网络(Long Short-Term Memory,LSTM)提取上下文信息,对不同长度的文本序列进行预测,改进的LSTM网络将遗忘门和输入门合并成一个更新门,使得LSTM网络可以获得更长时期的历史信息;使用最优路径的方法对文本进行转录,该方法可以找到概率最大路径,输出这条路径对应的最优序列.实验结果表明,使用该算法进行文本识别,可以使手写体中文和手写体数字准确率达到较好的效果.
关键词:
通讯作者信息:
电子邮件地址: