5月18日,阿里云刷新全球权威机器视觉算法测评平台KITTI的世界纪录。阿里云将其车辆检测的准确率拉升至90.46%。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,有大量的微小目标、欠曝和过曝、多种视角变化以及各种遮挡情况。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。
据了解,此次重大技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。华先胜是视觉识别和搜索领域的国际级权威学者,曾获选国际电气与电子工程协会院士、美国计算机协会ACM杰出科学家。
他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的多视角,多姿态以及车辆遮挡等问题的车辆检测任务。在网络结构设计上,团队利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。
通过这项技术,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析。通过这些数据,管理人员可以进行多种智能交通优化。阿里云的这项技术在视频数据处理规模上,全球罕有。城市大脑旨在构建一个城市级的人工智能中枢,让城市能够与人类友好互动。这其中分析视频是城市大脑获取信息的关键。目前,阿里云已经将这样的技术集成到阿里云ET当中,并在城市大脑中得以应用。它能够帮助城市大脑准确地看懂车流信息,快速地做出全局性判断。
新思界
行业研究人士认为:阿里云对该项技术世界纪录的刷新不仅仅是意味着他们在自动驾驶场景下计算机视觉算法上的突破,对于交通治理管理部门来说,该项技术将为其治理交通,改善交通状况提供极大的便利。