简单的BP网络识别液晶字符

时间：2020-10-19 17:48:51

关键字： AI 液晶显示神经网络

手机看文章

扫描二维码
随时随地手机看文章

[导读]关于经典网络重要的BP（误差反向传播网络）是所有学习人工神经网络最先接触到的一个实用网络，它的原理相对比较简单，在很多平台中都非常容易实现。

这学期的人工神经网络课程已经进行完了第三章内容，关于经典网络重要的BP（误差反向传播网络）是所有学习人工神经网络最先接触到的一个实用网络。它的原理相对比较简单，在很多平台中都非常容易实现。

学习神经网络的基本原理之后，更重要的是能够通过一些应用场合来应用它，使他能够帮助自己解决一些实际的工程问题。

近期购买到的 LC100-A^[1] 电感电容测量模块，用于测量一些实验中实验对象的电感、电容值随着其他一些物理变量（工作电压、距离、温度等）所产生变化规律。为了便于实验，需要能够将LC100-A测量数值自动记录。

<<< 左右滑动见更多 >>>

在开始的方式就是直接使用摄像头获取液晶显示数据，然后使用字符识别软件来完成其中数字的识别。

测试一下CNOCR识别效果。它对于屏幕截图中的文字识别效果还不错：

▲ 屏幕截取的一段文字

识别时间：1.98。* 识别结果：

[['●', '更', '新', '了', '训', '练', '代', '码', '，', '使', '用', 'm', 'x', 'n', 'e', 't', '的', 'r', 'e', 'c', 'o', 'r', 'd', 'i', 'o', '首', '先', '把', '数', '据', '转', '换', '成', '二', '进', '制', '格', '式', '，', '提', '升', '后', '续', '的'], ['训', '练', '效', '率', '。', '训', '练', '时', '支', '持', '对', '图', '片', '做', '实', '时', '数', '据', '增', '强', '。', '也', '加', '入', '了', '更', '多', '可', '传', '入', '的', '参', '数', '。'], ['●', '允', '许', '训', '练', '集', '中', '的', '文', '字', '数', '量', '不', '同', '，', '目', '前', '是', '中', '文', '1', '0', '个', '字', '，', '英', '文', '2', '0', '个', '字', '母', '。'], ['。', '提', '供', '了', '更', '多', '的', '模', '型', '选', '择', '，', '允', '许', '大', '家', '按', '需', '训', '练', '多', '种', '不', '同', '大', '小', '的', '识', '别', '模', '型', '。'], ['●', ' ', '内', '置', '了', '各', '种', '训', '练', '好', '的', '模', '型', '，', '最', '小', '的', '模', '型', '只', '有', '之', '前', '模', '型', '的', '1', '/', '5', '大', '小', '。', '所', '有', '模', '型', '都', '可', '免', '费'], ['使', '用', '。']]

那么对于前面液晶屏幕识别效果呢：

▲ 只是数字部分

识别结果：[['.', '。', '与', 'F', '早', 'H']]

好像驴唇不对马嘴。

这主要原因还是原来网络没有针对上述液晶实现数字进行训练过。由于液晶显示图片质量非常好，实际上只需要最简单的BP网络就可以达到很好的效果。

下面给出在MATLAB中构建网络并进行实验的过程。

使用神经网络解决问题，一个重要的环节就是进行训练数据的准备。通过对采集到的一些图片中的数字进行提取并手工标注，来完成对网络的训练。

1.数字分割

下面是桌面摄像头捕捉到的测量图片，通过简单的图片灰度投影，比较方便将显示数字所在图片中的位置定出。为了简单起见，也可以固定摄像头与LCD相对位置，这样手工定标出结果字符位置也可以适用于后面测量结果。

▲ 液晶数字显示以及数字部分

这个问题简单之处在于所有字符都是等宽，而且对比度非常好，简单的分离就可以将所有的字符单独分离出来。由于摄像头位置固定，所以简单分割之后的字符之后少量的上下左右平移，没有旋转。对于图片位置、尺寸就不再进行归一化。这些差异最后有神经网络来弥补。

▲ 分割出的数字

液晶显示字符的图片对比度很好。但就是有一个问题，在摄像头拍摄的时候，经常会遇到字符变化过程，这就会使得图片中字符呈现两个字符叠加的情况。下面是一些示例：

▲ 数字变化过程的图片

这些过程，说实在的，即使人工识别也会无法分辨。

后面通过人工输入标注了2000多个样本。

2.图片二值化

对于分割的图片进行二值化，可以消除环境光对于图片亮度的影响。在一定程度上，也可以消除液晶字符在变化时所引起的模糊。

<<< 左右滑动见更多 >>>

上面所有的字符的尺寸是23乘以38点阵。

1.构建网络和训练

简单的实验，就用简单的方法。对于前面所得到的字符，不再人工定义它们的特征。仅仅将原来的彩色图片变换成灰度图像，然后排列成23×38=874维向量。然后增加一层中间隐层便组成了最简单的分类网络。

net = patternnet(11)

▲ 构造一个单隐层神经网络

将前面人工标注的样本一半用于训练，全部样本用于测试。下面给出了测试的结果。

plotconfusion(xx, net(yy))

▲ 训练结果

2.训练结果与分析

整体的错误率大约为：ERR= 2.99%。

下面是识别正确的字符。

▲ 识别正确的字符

下面给出了部分识别错误字符的情况。基本上都是一些拍摄到液晶字符在变化过程中的重叠字符情况。这些情况本身在人工标注的时候就存在模糊。

<<< 左右滑动见更多 >>>

3.网络结构与错误率

下面给出了网络的隐层节点个数与识别错误样本个数之间的关系。可以看到当中间隐层节点大于5之后，识别性能就不再有明显的变化了。

隐层节点个数	2	3	4	5	6	7	8	9	10	11
错误数量	1810	656	216	77	69	66	65	72	58	68

▲ 隐层节点个数与错误率

使用神经网络解决问题，不是寻找最强大的网络，而是需要最合适的网络。

通过上面的测试结果来看，简单的单隐层网络便可以很好的满足液晶显示数字识别。那么对于那些由于数字跳动所引起的错误该怎么处理呢？

这个问题如果仅仅依靠增加训练样本和改进网络结构是很难进行彻底解决，规避这个错误可以通过对连续识别结果进行比对来解决。对显示数字进行连续快速采集5帧图像，其中液晶跳动往往只发生在其中一帧，或者两帧。那么对于五个图像识别出的数字进行对比，找到相同次数最多的数字作为输出结果。

参考资料

[1]

LC100-A: https://zhuoqing.blog.csdn.net/article/details/108997475

免责声明：本文内容由21ic获得授权后发布，版权归原作者所有，本平台仅提供信息存储服务。文章仅代表作者个人观点，不代表本平台立场，如有问题，请联系我们，谢谢！

简单的BP网络识别液晶字符

1.数字分割

2.图片二值化

1.构建网络和训练

2.训练结果与分析

3.网络结构与错误率

参考资料

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

从容应对未知风险----解密亚马逊云科技的韧性之道

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

独立自主！华为董事：致力打造不依赖西方的技术

华为张平安：数字世界话语权最终由生态繁荣决定！

中国通信服务公布2024年中期业绩

NVI技术创新联盟成立！自主生态将带动产业链高速发展

软通动力与长三角投资达成战略合作共谋数字生态新发展

海南区6家凯悦系酒店与岚图达成战略合作，共同推动新能源出行体验

安岚携手妮可•巴菲特开启疗愈之旅在秋日红叶的浪漫中疗愈身心

不惧美国封锁！华为：我们给大家提供系统、存储等

尼尔森IQ深耕中国四十载，共绘未来新篇章

第二十二届跨盈年度B2B营销高管峰会2025聚焦"营销竞取，打破市场内卷实现认知进化"

恒久动力驰骋天地美孚1号携手周冠宇邀您纵擎驰骋，劲享驾趣体验

美通社母公司Cision发布CisionOne平台，进军亚太地区媒体监测市场

移远通信推出大模型解决方案，重塑千行百业智能边界

高途公布2024年第二季度未经审计业绩

华为发布AI百校计划：培养AI人才每年获最高100万支持