矩课堂 | 全面剖析矩视云平台“OCR功能”如何自动解决99.99%的凹凸字符识别难题!

关注小矩👉 矩视智能 2022-04-06 07:30

收录于话题

近年来，移动互联、大数据等新技术飞速发展，倒逼传统行业向智能化、移动化的方向转型。

随着运营集约化、数字化的逐渐铺开，尤其是以OCR识别为代表的人工智能技术逐渐深入业务场景，为用户带来持续的经济效益和品牌效应。

今天小矩就带大家一起全面剖析“OCR识别”如何解决生活中出现的字符问题！

传统OCR识别技术缺陷渐露

字符识别（Optical Character Recognition，OCR）指自动识别图像中的文字内容，属于人工智能机器视觉领域的一个重要的分支，即把文本、卡证等载体上的文字通过光学等技术手段转化为计算机认识的电子化数据。

传统OCR识别采用统计模式，处理流程较长，典型的传统OCR识别流程如图所示：

传统OCR识别方法存在诸多弊端，汇总如下：

a）在进行版面分析时，使用大量的规则，导致程序维护成本很高。

b）行业域分析完全依靠图像二值化得到的二值图，对于扫描文档效果尚可，面对手机拍摄和高拍仪取图时，难取得效果良好的二值化图，造成二值化过程中大量信息的丢失。

c）传统OCR技术包含的模块其中任何一个模块的不完善都会产生误差，误差的累积将导致识别率大幅下降。

d）传统OCR识别灵活性差，对于自然场景下拍摄的复杂样本基本无法处理，没有修改提升空间，可用性不高。

e）传统的方法将OCR系统割裂成过多的环节，倚重人工规则，需要在每个环节上引入人工干预并根据场景设定方法参数，难做到端到端的训练。

深度学习算法可以有效地规避传统OCR识别的不足，通过组合低层特征形成更加抽象的高层表示属性类别或特征，挖掘数据的分布式特征表示。

借助神经网络来模拟人脑进行分析、学习和训练，即模仿人脑机制来分析图像、声音和文本等数据，被广泛应用于人工智能的模型构建和处理中。

基于深度学习的智能OCR大有可为

基于深度学习的机器视觉OCR技术是一次跨越式的升级，深度学习算法提升了OCR的识别率和识别速度，人工需要几分钟才能录入的文本，机器视觉OCR技术可以秒速进行精准识别。

智能OCR识别技术对识别流程进行了优化，优化后的识别流程包括检测、识别和后处理3个主要步骤，如图所示：

矩视智能低代码平台基于深度学习的OCR定位与识别，通过标注训练，可在图像上实现文字区域的自动定位和符号的识别，可自主学习各类场景下不同类型的字符，包含数字、字母、文字等其他特殊字符，解决了传统OCR技术在复杂场景下无法解决问题。

其在医药、食品、汽车、3C等众多行业均有应用并具有抗干扰能力强、准确率高、算法自升级等优势，识别率最高可达99.99%。

矩视智能低代码平台“OCR”识别解决方案

1、钢印OCR字符识别

在汽车、铸造、冶金等行业中常会用到钢印技术，钢印字符主要应用于各类硬质外表面上，多具有字符与背景颜色相近、背景易反光、字符印迹不明显、字符倾斜等特征。因此，使用传统方法对钢印字符进行检测时，容易受到各类因素的干扰导致检测准确率低。

例如，获取车身零件编码以保证零件在整个制造过程中的可追溯性。

汽车行业·制动鼓铸字识别

铸造行业

在以上场景中，矩视智能低代码平台针对钢印类字符识别特设计专业底层神经网络架构，能够准确识别印迹不明显的字符，随着样本集的不断增加，准确率可达99.99%。

2、模糊字符识别

在检测物外表面上，很容易出现印迹不明显的字符，若使用传统机器视觉算法检测，在进行字符识别后还需要人工抽检，不仅耗费大量人力，识别准确率也偏低。

矩视云低代码平台，利用深度学习算法，识别速度等同于4~6个工人的检验速度，7*24小时不间断识别工作，释放更多劳动力的同时，也提高检测准确率。

3、复杂背景字符识别

金属零部件表面会受到环境或油污等影响，导致打光后的字符也会以不同灰度值的形式呈现，传统OCR算法在设置阈值参数时难以选择。

例如，因货车的不确定性比较大而且容易出错，编号时间久且容易磨损，辨别起来比较困难。

矩视低代码开发平台针对这类字符设计了底层神经网络专用架构，突破了传统识别技术的瓶颈，不需选取阈值，仅需简单的标注训练就可直接进行字符的定位与识别。

平台详细操作过程：

>>>点击查看《铁路货车“车厢编号”识别》

4、倾斜字符识别

因生产需要，零部件的形状大小种类较多，导致字符行会出现倾斜、弯曲等情况，传统框架进行处理字符后，还需要对字符进行轮廓分割，无法直接识别弯曲字符。

矩视智能低代码平台OCR识别功能可支持旋转标注，如字符在图片中发生旋转时，开启旋转框即可对任意角度字符进行标注和识别，便捷且灵活。

比如在检测汽车轮胎字符时，字符根据轮胎曲线发生角度倾斜，开启旋转框功能，便可轻松解决识别问题。

汽车行业·轮胎字符识别

5、低对比度字符识别

一些产品表面会根据实际需求进行喷涂等操作，导致字符颜色和背景颜色对比度较低，传统图像拍照识别难度大，造成识别信息不全、误识别以及识别速度慢等情况，无法适应实际生产中的字符识别需求。

药盒三期字符

例如药盒上三期字符的检测，产品表面平滑，较反光，符号颜色与药盒颜色融合。矩视智能低代码平台云针对背景颜色和字符颜色相近情况进行底层的算法优化，通过精准标注训练，完美适配低对比度字符的定位和识别，排除背景颜色的干扰，识别速度可以达到毫秒级别。

医疗行业·药品三期字符检测

平台详细操作过程：

>>>点击查看《矩视智能低代码平台"OCR识别"技术，高效解决医疗药盒字符检测难题》

更多强大功能等你发掘

扫描下方二维码免费申请试用哦！

👇👇👇

申请后我们会有工作人员第一时间与您联系

请耐心等待！

—往期回顾—

更多功能正在开发中，最新信息会第一时间在官方公众号进行公布，大家持续关注哦！

收录于话题 #矩课堂

3个

下一篇实用！全面剖析矩视云平台“像素分割”模块在工业检测中的应用（附案例详解）