近日,在国际顶级的计算机视觉竞赛Pascal VOC挑战赛目标检测comp4赛道上,创新奇智(AInnovation)研发的AInnoDetection 目标检测算法获得综合成绩排名第一的好成绩,超越Google、Microsoft、CMU(美国卡耐基-梅隆大学)、清华大学、阿里巴巴、平安科技、搜狗、Yi+、腾讯优图等众多国内外知名人工智能企业和高校人工智能实验室,在Pascal VOC共20项的评测指标中,其中10项指标排名第一,充分体现了创新奇智人工智能算法能力,尤其是AI视觉算法的创新和设计能力。


创新奇智在20项评测指标中取得10项指标第一、总分第一的成绩

(单项第一使用黑粗体显示)

(图片来源:Pascal VOC官网)

Pascal VOC 数据集

目标检测是图像领域三大基本任务之一,同时也是图像领域非常具有挑战的算法难题。Pascal VOC挑战赛是世界最权威的三大计算机视觉挑战赛之一,其数据集标注质量高、场景复杂、目标多样、检测难度大,是快速检验算法有效性的首选。Pascal VOC数据量小但是场景丰富,更加考验人工智能算法的设计和创新能力。ImageNet、MSCOCO数据量大,侧重考查人工智能算力的建设能力。

Pascal VOC是国内外AI公司竞相展开激烈竞争的主赛场。截至目前,Pascal VOC挑战赛吸引了全球近百支专业队伍参赛,包括Google、Microsoft、CMU(美国卡耐基-梅隆大学)、清华大学、阿里巴巴、腾讯、搜狗、Yi+、平安科技等国内外知名图像领域的顶尖团队参与比赛。

Pascal VOC的数据集包括数十个类别,包括人类、动物、交通工具、室内物体等。创新奇智视觉算法团队参加了Object Detection (Competition4) 子任务,在20类不同的目标检测上获得了10个类别的检测MAP(准确率)第一、总分第一的成绩。


Pascal VOC数据集部分样本

创新奇智AInnoDetection算法

创新奇智提出的AInnoDetection模型算法,使用著名的二阶段检测算法,采用数据增强来扩充训练数据,包括填充小物体和mixup的方法。

通过以上步骤,使检测模型能够对小物体检测效果更好,同时能够使模型预测效果更好,更健壮。

 

模型选择著名的二阶段检测网络,骨干网络使用ResneXt152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更丰富的多尺度卷积特征金字。在这之后,连接两个共享子网,一个子网负责分类目标框,另一个网络负责将目标框回归到真实框,最后使用focal-loss作为二分类的损失。同时采用多尺度测试融合,这样能够使网络根据不同的图像尺度来关注不同的目标框信息。


让小图片更加关注大物体,大图片更加关注小物体。

最后采用多模型融合的方法,输出最优的结果。

目标检测算法的商用价值

创新奇智自成立伊始就瞄准高精尖的人工智能算法在零售、制造、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提升了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了算力资源。

据悉,创新奇智的人工智能视觉算法已经应用在零售渠道陈列监控的商品识别、智能货柜、工业视觉、智慧园区社区等领域,商用效果处于行业领先水平。此次夺冠的目标检测算法在创新奇智的商品检测、工业视觉缺陷检测、渠道陈列监控等产品中已经使用。除了这次Pascal VOC赛事夺冠之外,创新奇智在多个世界顶级人工智能算法大赛上夺冠,比如最近,创新奇智在WIDER FACE人脸检测赛事中夺冠。

关于参赛团队

创新奇智本次Pascal VOC竞赛夺冠队伍由张发恩、吴佳洪、杨志铮、曹浩天、宋剑飞和范馨予组成。其中团队Leader张发恩现任创新奇智CTO、创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职Microsoft、Google和百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。

创新奇智是创新工场的AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM、微软、SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用“技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。

 

创新奇智拥有优异的技术研发团队,结合AI技术商业化的特点,制定了科学技术人才三级体系建设方案,三级体系形成一个金字塔结构,从顶到下分别是:“创新奇智科研委员会— 创新奇智创新研究院— 创新奇智工程算法研发团队”。其中,“创新奇智科研委员会” 由世界顶级人工智能科学家及知名专家担任,包括前腾讯AI Lab负责人张潼、 百度研究院三维视觉首席科学家杨睿刚、密歇根州立大学教授张弥、创新工场人工智能工程院执行院长王咏刚、创新奇智CTO张发恩。