不论你有没有听过,OCR 技能现已进入到咱们日子中的方方面面。
无妨回想一下,轿车收支停车场时的车牌辨认、金融事务开户时的银行卡辨认、身份证辨认、乃至是许多商务运用中的手刺辨认等,其实都是依据 OCR 技能的。
OCR 的开展能够追溯到 70 年代初,在数十年的开展中,OCR 的辨认速度和辨认成功率在不断地进步,运用场景也在不断地拓宽。
从杂乱布景中提取出文字、多种混合字体辨认、低分辨率图画中辨认、多语言混合是被、错行辨认乃至是杂乱多行板式辨认等关于如今的 OCR 技能来说其实都现已不算什么样的问题。
但开展到现在,关于 OCR 技能来说仍旧有一个瓶颈没有打破,那便是曲折文字。
什么是曲折文字?
像这样,
这样,
还有这样的。
实际上,Captcha & reCAPTCHA,也便是你登录网站常常输入错的歪歪扭扭的文字验证码,也是依据 OCR 的这个缺点,来避免被进犯的。
曩昔的 OCR 大多是处理水平文字的检测或许歪斜文字的检测,但其实像上图的曲折在日子中非常常见。
近来,亚马逊的研究人员就开发出了一项名为‘TextTubes’来 OCR 辨认算法来处理这样的一个问题。
简略来说,该算法首要会对方针图画进行建模,树立一个曲线函数,然后再剖析出出半径以及中心轴,继而生成一个文本选取分区。
作用怎么样?
论文展现了三种不同 OCR 技能针对同一个含有曲折字体的广告牌的辨认作用。
成果显现,(b)和(c)会呈现辨认框重复的现象,(b)傍边还呈现了曲折辨认框未能彻底掩盖文字的状况。
这样会带来什么成果呢,一便是会呈现导出的文字成果会有重复,而二便是会导致辨认成果过错。
至于 TextTubes 所辨认出来的作用则很完美地对广告牌上的每一个文字区域进行分区,既不会呈现堆叠区域,而每一个分区也都很好地掩盖一切文字。
为了更好地测验 TextTubes 的功能,亚马逊在 CTW- 1500 以及Total-Text 两个练习体系上进行评价。傍边CTW- 1500 含有 1500 张图画、超越 10000 个文本实体,每张图画至少还有一个曲折文本,而Total-Text 则共有 1255 个练习图画、300 个测验图画,每张图片也是含有一个或多个曲折文本。
那么成果怎么?TextTubes 在两个测验中都获得了优异的成果,在 CTW- 1500 则更为杰出,准确率为 83.65%,相比之下,排第二名的那位学生,准确率只要 75.6%。
亚马逊表明,当 TextTubes 正式投入到正常的运用中之后,关于那些高度依靠 OCR 技能打开事务的企业来说,是一个福音。依据 Grand View Research 的数据,商场关于 OCR 的需求仍在不断增大,估计到 2025 年 OCR 处理方案商场规模将到达 133.8 亿美元。
等等,不是说文字验证码是依据 OCR 的这个缺点的吗?假如打破了,验证码还安全吗?
这不所以推出了从一堆刘翔中找出王自若的验证码吗?
编 辑:章芳