助力中文文字识别突破,美团公开首个真实场景招牌图像数据集

美团作为全球最大的本地生活服务平台,拥有由遍布全国的市场人员所拍摄的众多门脸招牌图片数据。每张图片都是由全国的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同目标,是难得的可以公正评价算法鲁棒性和识别效果的图片数据,挑战也非常大。

近年来业界围绕着文字检测和文字识别提出了许多有效的算法和技术方案。由于之前公开的数据集普遍以英文为主,因此所提出的技术方案对中文特有问题关注不足。表现在以中文为主的实际应用场景中,这些技术方案的结果与应用预期差距较大。以美团掌握的某典型中文图片数据为例,在6000张图的图片数据集上(已去除文字无法辨识的图片),测试了国内最知名的三个AI开放平台,按字段统计识别率分别是94%,91% 和 86%,经过努力我们也只达到 98%。中文OCR在实际应用场景的表现并不乐观。

在此次 ICDAR2019上,我们挑选出很能代表中文特点的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有自然场景文字识别中普遍存在的拍照角度、光照变化等干扰因素。我们希望通过竞赛引起同行们对中文识别的关注,群策群力解决中文识别的实际问题。

会议与大赛介绍

国际文档分析与识别国际会议 (International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,专注于文本领域的识别与应用。ICDAR大会每两年举办一次,目前已发展成文字识别领域的旗舰学术会议。为了提高自然场景的文本检测和识别水平,国际文档分析和识别会议(ICDAR)于2003年设立了鲁棒文本阅读竞赛(“Robust Reading Competitions”)。至今已有来自89个国家的3500多支队伍参与。

ICDAR 2019将于今年9月20-25日在澳大利亚悉尼举办。 美团今年联合国内外知名科研机构和学者,提出了"中文门脸招牌文字识别"比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。

组织者

  • 王栋、张睿、刘曦、周永生,美团
  • 白翔、廖明辉、杨明锟,华中科技大学
  • Baoguang Shi, Microsoft (Redmond,USA)
  • Shijian Lu, Nanyang Technological University (Singapore)
  • Dimosthenis Karatzas,Computer Vision Centre,UAB(Spain)
  • C. V. Jawahar,IIIT Hyderabad(India)

数据集介绍

美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共25000张。每张图片是由完全独立的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同商家。该数据集以中文文字为主,也包含一定数量的英文和数字,英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本。是难得的用于研发和评估中文识别技术的数据集。其中,20000张图片用于训练,2000张用于验证,3000张用于测试。

比赛内容

本次门脸招牌识别,共定义了 4 个任务,分别如下:

  • TASK 1:招牌端到端文字识别
  • TASK 2:招牌文字行定位
  • TASK 3:招牌区域内单字识别
  • TASK 4:招牌区域内字符串识别

奖励方式

颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。 比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。 奖金详细如下:

重要日期

  • 2019年3月1日:报名通道开放
  • 2019年3月18日:训练数据集开放
  • 2019年4月15日:测试数据集分批开放
  • 2019年4月16日:提交通道开放
  • 2019年4月30日:提交截止日期
  • 2019年5月10日:比赛最终报告提交
  • 2019年9月20日:ICDAR 2019 大会召开

参赛报名

扫描下方二维码,直接进入报名链接报名。

报名链接地址: http://rrc.cvc.uab.es/?ch=12 报名链接二维码:

参赛答疑与交流

参赛答疑邮箱:mtdptech@meituan.com(邮件标题请注明 “ICDAR2019”) 加入参赛交流微信群

步骤1:微信添加 “MTDPtech02” 为好友(昵称:美美),或扫描下方二维码直接添加:

步骤2:回复美美 “ICDAR2019”,则会自动将您加入ICDAR2019-ReCTS技术交流群

下一章:根因分析初探:一种报警聚类算法在业务系统的落地实施

背景 众所周知,日志是记录应用程序运行状态的一种重要工具,在业务服务中,日志更是十分重要。通常情况下,日志主要是记录关键执行点、程序执行错误时的现场信息等。系统出现故障时,运维人员一般先查 ...