能“读懂”古文还可反合合信息智能文字识别技术亮相2022WAIC

2022-09-10 16:46:34

摘要：　　能“读懂”古文还可反合合信息智能文字识别技术亮相2022WAIC...

　　9月1日消息，今年是世界人工智能大会举办的第五年，“科技风向标、产业加速器”是这场全球AI领域的行业盛会对参展技术与产品的期许。针对图像处理及内容识别中，文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等全球性难题，合合信息重点展示了智能文字识别技术的创新成果及产业应用示范，用科技探索产研融合新方向。

　　据介绍，合合信息智能文字识别技术主要由以“弯曲矫正”为代表的智能图像处理，基于深度学习的复杂场景文字识别，自然语言处理（NLP）三大核心模块组成。智能图像处理技术可对曲面、阴影、摩尔纹等复杂场景下的文档图像进行精准的矫正处理，为接下来的文字信息提取、识别创造了良好的条件；复杂场景文字识别技术主要利用手写印刷混排识别，抗强干扰识别，扭曲文字识别等一系列深度学习技术进行文字提取及识别，并结合领先的NLP技术，对识别出的结果进行语义理解。

　　本次展示的钟鼎文识别项目，是继去年的甲骨文识别之后，合合信息向古文字识别发起的又一次冲锋。大会现场还可使用公司旗下产品“扫描全能王APP”，用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》，将其转化为易于阅读的横排、简体版本。

　　合合信息技术人员介绍：“选择钟鼎文、古籍等素材来识别，是因为与常规文本相比，鼎面的文字形小细密，竖排的格式也与正常的文本不同。从载体上看，青铜鼎面存在弯曲、反光、凹凸不平的状况，古籍表面也可能有模糊、框线等因素的干扰，整体识别难度极大。这些问题的解决不仅对文物保护和文化传承意义重大，也有助于技术在各行业的应用向纵深拓展。”

　　合合信息“PS检测”功能是智能文字识别技术的另一大亮点。从个人证件、票据到各类商业材料，团伙经常会使用PS过的材料来进行伪装行骗，受害者不计其数。该技术主要采用神经网络捕捉图像在过程中留下的细微痕迹，基于百万级的数据学习图像被后统计特征的变化，不仅可以判断图片是否被，还能定位修改区域，以热力图形式展示图片的PS区域置信度，检测准确率远超传统技术方法和人眼判断。

　　“PS检测”是合合信息智能图像处理技术优势的集中体现，这种直接针对图像特征信息的检测方法在行业中属于创新应用，覆盖身份证、护照等多种证照识别，适用于保险、银行、证券、政务等多种场景。

　　公开资料显示，创立于2006年的合合信息在智能文字识别领域中已有十多年深耕经验，相关技术已广泛落地各行业，为全球百余个国家和地区的亿级用户提供数字化服务。据权威机构认定，扫描全能王APP针对常规的印刷体文档字符平均识别率达到99。77%，手写体文档字符平均识别率为97。00%；“AI+OCR”行业解决方案可识别上百种卡证、票据、行业单据内容，支持五十多种主流语言的信息提取。据悉，近三年来，合合信息先后在ICDAR、ICPR等人工智能国际竞赛中斩获15项冠军，学术成果在CVPR、AAAI、ACL、ACMMM等顶会上发表，相关项目获中国图象图形学学会（CSIG）科技进步奖二等奖。在今年8月的CSIG图像图形技术挑战赛中，合合信息参与的赛队夺得总冠军。