自动驾驶数据掘金像大海捞鱼,你有什么样的捕鱼工具?
2021年7月7日,亮道智能受邀亮相世界人工智能大会(WAIC),作为智能驾驶论坛的合作伙伴,与行业同仁交流人工智能和自动驾驶的最新话题。
世界人工智能大会(WAIC)是具有全球影响力的国际峰会,上海作为人工智能产业发展和人才汇聚的高地,承办了本届盛会。会议秉承「智联世界」的理念,各个行业、不同领域人工智能「大脑」在这里碰撞思想、交流沟通,推动了全球科技创新协同,打造人工智能世界级的产业集群。
亮道智能一直在关注自动驾驶的工程化和产品化,我们帮助客户从自动驾驶产生的海量数据中挖掘价值金矿。
如果说自动驾驶掘金像大海捕鱼,我们在做的,就是为你提供一张好用的渔网。
△Photo by Nathan Fertig on Unsplash
一、「自动驾驶数据掘金」就像大海捕鱼
与人类开车类似,自动驾驶系统通过「眼睛」(传感器)收集周围信息,经过「大脑」(中央计算机)分析判断后,做出最优驾驶决策,以上过程环环相扣,都离不开软件和算法。对于L3及以上高级自动驾驶,系统要处理的信息更加复杂,人工智能与神经网络的重要性更为凸显。
为了训练出可靠的模型,数据在自动驾驶整个生命周期中扮演了非常重要的角色。工程师给系统「投喂」数据,让算法学会应对不同工况,变得更加强大可靠。
当然,数据训练的方式并非漫无目的。从海量数据中寻找有价值的场景,就像在大海中捕捞鱼群。
• 数据足够真实吗?这些训练的数据一定要来自真实的驾驶环境,避免在仿真环境中创造的场景维度不足且过于理想化,导致决策模型从实验环境迁移到真实环境时,发生系统性偏差等问题。而训练过程全部依赖于路测,既不经济,也不高效。如何实现真实世界的场景在仿真环境的孪生,是自动驾驶功能开发者与测试工程师面临的难题。
• 数据能快速提纯吗?我们往往要从海量数据中提取功能相关并且最有价值的部分。就像高速公路开车时,大部分时间我们都在跟车,但自动驾驶的功能设计,最关注的是复杂驾驶场景,例如自车意图变道时,突然有左前车切入,正前方车辆急减速。
而在现有的模型训练中,我们发现车辆和其他交通参与者之间的相互作用往往因为难以提取,而被人为忽略。
• 数据能快速结构化吗?采集到的信息要快速处理成算法可以理解的结构化数据,为接下来的数据应用和挖掘奠定基础。
△图片来源:欧盟PEGASUS项目
在自动驾驶量产项目中,结构化的数据被进一步沉淀为「场景」,支撑起整个产品生命周期的开发、测试、迭代与更新。
通过建设贯穿功能开发与测试全程的场景数据库,自动驾驶数据资源得到充分利用,最终形成自动驾驶功能开发与测试一体两面的数据闭环。场景数据库可以支持开发阶段的功能需求导入与功能定义,也可以在测试阶段为仿真测试、SiL/HiL测试、台架测试等输出系统化的测试用例。而量产前的整车路测,又能继续补充以往没有发现的新场景,形成自动驾驶场景库的数据闭环。
前一款车型积累的经验,在下款车型中得以延续。场景库在不断丰富与更新中,变成自动驾驶功能开发最宝贵的财富。财富累积的过程,就是对数据层层筛选,抓到最有价值的大鱼。
二、你拥有什么样的「捕鱼工具」?
如果说寻找有价值的场景是在捕鱼,那么你能抓到什么样的鱼群,很大程度取决于拥有什么样的工具。
△来源:欧盟PEGASUS项目
场景的构成非常多元,其中与算法开发关系最密切的是目标(Objects)数据。它包括参与交通的动态目标物相对位置、尺寸、分类(比如车辆、自行车、行人),还包括目标物如何活动等各类信息。同时,描述车辆周围的车道线、道路边缘等静态目标物(Traffic Infrustructure),也关系到自动驾驶系统的定位和导航。
正如上文所说,我们要把采集到的信息处理成机器可以理解的结构化数据。
数据的准确度、质量以及维度是否丰富,决定了我们能按照哪些维度来调用数据,后续数据挖掘又有多大潜力。
得益于传感器特性,
激光雷达擅长目标级数据的采集。高分辨率的激光雷达可以精准探测动态目标物的3D轮廓,测距更准确。激光雷达比视觉传感器更容易实时追踪动态目标物。同时,它也支持车道线、道路边缘等静态目标物的识别。
亮道智能在激光雷达和软件工具开发领域,有很深的积累。我们提供的产品是涵盖数据采集、建立真值、提取场景的大数据工具链——LDCompass™。从数据源头开始控制质量,提升数据处理的效率,支持客户自动驾驶开发测试和场景库建设。同时,高精度的数据必须通过严格的脱敏合规处理才能支持自动驾驶开发。在数据合规方面,亮道智能与合作伙伴携手,一起为量产项目搭建合规的数据中心,以确保自动驾驶开发过程中的数据合规使用。
△搭载LDCompass™数采系统的实车,您可以在WAIC2021现场看到实车
通过亮道智能自主开发的激光雷达离线算法,我们可以提供多维度的目标级数据,包括:
• 识别分类汽车、卡车、行人、摩托车、自行车等动态目标物,持续输出动态目标物的位置方向、速度、加速度、转向角、物体间时距/间距等参数。
• 道路边缘、路面标识、隧道、高速出入口等静态目标物信息。
△LDCompass™自动化标注效果
值得注意的是,这些由算法自动化标注的数据,拥有人工标注无法比拟的优势。
一方面,
自动标注的效率对比人工标注得到极大提升。可以通过使用更大算力、多线程工作等方式,获得人工无法达到的标注效率。另一方面,
算法可以自动标注目标物速度、加速度、转向角度等人工无法准确标注的信息。我们也使用来深度学习算法,来进一步提升数据标注的准确率。
正是因为有了维度丰富,质量可靠的数据,我们可以在结构化数据的基础上,建立交通参与者的行为模型,并且通过软件工具自动化提取非常具体的场景。当客户想要检索同时满足“左侧切入、切入车辆位于某速度区间、切入车型为摩托车”的数据时,我们就可以快速反应。
在亮道智能承接的欧洲主机厂场景分析项目中,我们和客户在上路采集数据之前,就一同探讨如何用精细的数据训练决策规划模型。通过LDCompass™中融合多个激光雷达的数据采集工具、高度集成的数据处理工具,获得前车与自车的碰撞时间(TTC)、碰撞距离(DTC)、反应时间(TTR)来细化场景分类。LDCompass™自动化提取的车辆和其他交通参与者的交互模型,对训练优化决策规划算法有很大的帮助。
在实际应用中,LDCompass™也在大数据的灌溉下持续成长,完善优化。2020年,亮道智能与上海国际汽车城集团共同开发的「自动驾驶白盒测试平台」项目落地交付,为自动驾驶车辆在开放道路测试提供了客观的测试与评价方案。白盒平台系统构建了一套完整、开放、安全的标准化智能网联汽车软硬件测试平台,可服务于智能网联汽车环境感知能力测试、整车线控性能测试、V2X测试、自动驾驶功能测试工作,进一步推动实现自动驾驶汽车可运行、可推广、可监控、可认证及可提升的目标。
小 结
千里之行,始于足下。自动驾驶的起点,就是从数据挖掘这件「小事」开始的。使用激光雷达提供目标级数据,并实现数据流转和闭环,将成为推动自动驾驶不断迭代的新引擎。在数据流转形成场景的过程中,LDCompass™将成为你挖掘数据价值的生产力工具,因为它足够高效,也足够好用。
亮道智能是一家技术领先的激光雷达系统方案提供商,产品核心是激光雷达及多传感器融合的应用开发。
公司服务于自动驾驶和智慧交通领域,提供基于大数据的测试验证与功能迭代服务,激光雷达感知算法开发,以及路侧感知融合系统等解决方案。
亮道智能是一家具有中德基因的科技企业,总部位于北京,并配置了面向客户的大数据中心与工程中心;在柏林建有研发中心,在慕尼黑和上海成立了商务中心。
亮道智能创始团队于2015年初从德国归国创业,研发团队80%的人员为德国精英大学或国内名牌高校硕博士,具有国际视野与全球化项目落地经验。
亮道智能已经与长城汽车、大众集团(包括旗下 VW, Audi, Porsche 三大品牌)、Magna、Ibeo、Ouster、Innovusion、NVIDIA 等自动驾驶核心技术企业建立了深度合作关系。
公司网址:
www.liangdao.ai