新闻

产品

新闻

News Information

百度OCR技术现身ICDAR 产学结合展示百度AI雄厚实力

来源:沐金官网浏览次数:1317 时间:2017-11-16 11:14:13.0

  近来,百度OCR(文字辨认)技能团队露脸文档剖析与辨认国际会议(International Conference on Document Analysis and Recognition,ICDAR2017),进行了名为《RTRS:Building a RobustText Reading System for Unconstrained Scene Images》的技能研讨会(tutorial)。研讨会上,来自百度OCR的工程师团队与全球顶尖OCR专家共享了百度OCR辨认技能的近期开展状态和产品运用方面的经历及考虑。据悉,在ICDAR2017会议进行研讨会(tutorial)共享的技能团队中,百度OCR技能团队是仅有一支来自企业界的技能团队。他们以共同的产学结合技能风格,和丰厚工业级技能敞开生态,招引了来自全球的近百位文字辨认专家的重视。
  ICDAR是全球OCR范畴公认最威望的学术会议之一,由其安排的Robust Reading比赛也是当时OCR技能范畴全球最具影响力的比赛,其间最具应战的OCR比赛使命是"Incidental Scene Text"(天然场景随拍文字辨认)。在这项高难度比赛应战中,百度OCR技能在检测、辨认和端到端三个中心技能范畴,近两年来屡次取得并坚持了世界第一的排名,具有显着的抢先优势。
  在ICDAR技能细节研讨会上,百度OCR团队梳理了近些年业界技能开展的脉络,自动共享了百度OCR技能开展的经历总结,与参会的技能专家们一同讨论文字辨认前沿技能开展趋势。另一方面,百度OCR团队作为工业界的代表,也详细介绍了团队在OCR工业体系研制和产品化过程中的一些成功经历,协助业界同仁处理技能落地过程中的实际问题。最终,百度工程师介绍了运用于百度系产品生态的根据天然图画查找/网络图画场景的通用文字辨认的产品运用矩阵,和聚焦在证照辨认、收据辨认的场景运用处理计划。丰厚的干货共享,使得整个研讨会的沟通气氛反常热烈,原定3个小时会议,足足继续了4个多小时。
  百度视觉技能部部属的OCR团队组建于2011年,经过多年的研制,现在现已将根据深度学习的OCR技能运用在多个运用场景下,支撑中、英、日、韩、葡、德、法、意、西、俄等十国语言。一起,结合产品运用场景不断采集训练数据,再经过百度大脑优化算法,然后取得越来越好的OCR作用和产品体会。现在,百度OCR现已在百度系各个产品生态中落地,并构建起根据天然图画查找/网络图画场景的通用文字辨认的产品运用矩阵,和抢先的证照辨认、收据辨认等场景的运用处理计划。
  为了确保用户运用根据百度OCR技能的产品体会越来越好,百度OCR团队活泼进行考虑、立异、敞开的良性开展路途,尽力坚持技能计划和体系作用业界抢先。近两年,百度OCR的多个立异技能成果,在ICDAR比赛上屡次取得世界第一的排名,并有多篇业界尖端会议论文发布。在最近的计算机视觉尖端国际会议ICCV2017上,百度发表的根据全卷积神经网络的文字检测论文:WordSup:Exploiting Word Annotations for Character based Text Detection,取得了业界的共同好评。
  技能不断打破的一起,百度OCR技能也经过百度AI技能敞开渠道(ai.baidu.com)全面敞开给第三方运用,打破关闭的研制生态,为开发者和合作伙伴赋能,活泼推进技能在详细产品上的落地。此前,开发者陶新乐也体会了百度OCR技能的智能快捷。他研制的白描APP经过百度OCR敞开渠道接入百度OCR技能,可将APP内的图片转换成文字,准确率极高,有效地满意用户的智能化需求。白描APP因为图片转文字的功用大获好评,成为Apple Store东西类付费下载榜的前几名,并被网友称为“准确率高到没朋友的文字辨认OCR APP”。百度OCR技能可运用于不同场景,便利敞开者探究通用文档图片录入和检索、天然场景输入和翻译、多种证照检测辨认、多种收据表格检测辨认等丰厚的产品功用。现在,百度OCR经过AI技能敞开渠道现已稀有千日活泼开发者,并成功与泰康人寿、太保人寿、百信银行等多家企业进行深化技能合作。
  业界人士称,百度OCR再次露脸世界级学术会议,体现出百度AI技能在业界的先发优势、完好布局和深沉堆集。随着根底才能的进一步敞开,百度OCR技能将取得更多的业界专家和开发者的支撑,然后堆集更为抢先的技能,探究更多的运用场景,赋能更多的合作伙伴,创造更多的价值。