【GeoScience Café】禾多科技:立足中国,面向量产

2018-09-25
  • 阅读:

核心提示:禾多科技由自动驾驶领军人物倪凯博士创建,专注于打造基于前沿人工智能技术和汽车工业技术的自动驾驶方案。此次分享会,倪凯博士从自动驾驶行业的现状和前景出发,解析禾多科技面向中国可量产的发展战略和聚焦场景。禾多科技高精定位负责人骆沛博士和高精地图负责人戴震博士与同学们分享了如何通过高精地图和高精定位的结合实现自动驾驶的关键技术上的突破。

文字:龚婧摄影:陈必武 摄像:邓拓 主持:龚婧

>>>人物名片

倪凯:禾多科技CEO,毕业于清华大学自动化系本科,清华大学计算机系硕士,期间参与清华无人车THMR-V的研发;后在佐治亚理工学院计算机系获博士学位。曾任职于百度深度学习研究院,担任高级科学家。在此期间,他创建了百度的无人驾驶团队,负责百度无人车的研发和部分高精度地图的工作,并于2015年底实现百度无人车在北京公共道路的路测和展示。倪凯还曾在微软的美国西雅图总部工作,参与三维地图和HoloLens增强现实眼镜的研发项目。

洛沛:禾多科技研发总监,毕业于北京航空航天大学,获得计算机应用博士学位。骆沛目前担任禾多科技研发总监,主要负责高精度定位研发工作。加入禾多科技之前,他曾就职于百度深度学习研究院,作为百度无人车项目核心成员负责高精地图以及3D视觉研发工作,并在2015年参与完成了百度无人车的路测展示。

戴震:禾多科技高精度地图及模拟器负责人,毕业于德国锡根大学,获硕士和博士学位,主要研究方向为卫星定位和导航。他拥有丰富的基于多传感器的组合导航系统研发经验以及车辆内置地图导航引擎算法研发经验。在德国航空航天中心任职期间,戴震博士曾协助国际航海组织(IMO)研发出针对组合导航系统的质量检测算法,并参与讨论IMO国际新标准的制定。戴震博士加入禾多科技后,负责高精地图及模拟器方面的研发和技术管理工作。

>>>报告现场

9月10日晚7点,来自禾多科技的三位负责人做客GeoScience Café第204期学术交流活动。倪凯博士结合当前自动驾驶行业的发展和前景为大家介绍了中国自动驾驶的机遇和意义,并解析禾多科技的聚焦场景和团队现状。之后,洛沛分享了高精度定位在自动驾驶中的重要意义,介绍了禾多科技在高精度定位方面的技术方法及解决方案,最后戴震介绍了在自动驾驶解决方案中高精度地图扮演的角色和相关算法。报告现场座无虚席,反响热烈,报告结束之后,仍有许多观众与嘉宾进行交流探讨。

图1 报告现场

禾多科技的现状及未来

四年前,倪凯曾作为百度深度学习研究院的一员访问过武汉大学测绘遥感国重实验室,四年过去了,自动驾驶行业受到了越来越多的关注,关于这个行业,倪凯及其同事做了很多思考,在现场倪凯为大家分享了创立禾多科技以来的心路历程和一些感悟。

德勤2017年的一项消费者对自动驾驶接受程度的调查显示,中国在被调查的主要市场国家中,消费者接受程度是比较高的,而随着自动驾驶等级的升高,部分国家消费者的信心有一定的下滑。倪凯提到,我们需要尊重工程技术在自动驾驶这个行业的发展进程,自动驾驶技术的成熟和不断积累是需要一定时间的,禾多科技也并没有在一开始就将实现完全自动驾驶作为目标,而是希望在一些限定场景下把自动驾驶技术尽快做到量产,这与消费者的接受程度也有关系。

图2 消费者对自动驾驶水平的偏好比例

交通事故给社会带来了非常沉重的成本,在中国这个情况尤其严重,所以自动驾驶技术(L2或L3级别)在中国的普及会给我们整个社会带来非常好的效益。回到中国,自动驾驶有其独特的机遇和意义,中国的交通状况和人们的驾驶习惯与欧美等国家是非常不同的,其次,中国的智能城市交通系统发展迅速,自动驾驶是其背后一个有力的推手,第三点是政府的支持和资源调度力度的加大。

随后,倪凯为我们介绍了禾多科技的几项大事记。禾多成立于2017年6月,7月获天使融资,10月与四维图新建立高精度地图和数据采集方面的合作,11月发布了“轩辕”自动驾驶平台,12月与主机厂合作项目签署协议。18年1月第一版高速公路自动驾驶系统HoloPilot正式发布,2月成立了上海子公司,3月和4月分别现身日内瓦车展和北京国际车展,5月智能代客泊车系统HoloParking的初始版本在上海亮相。

将眼光放得更长远一些,整个自动驾驶未来出行主要分为三个部分,第一是高速公路上的自动驾驶,第二是城市工况,第三是最后一公里。城市工况是自动驾驶领域最复杂的场景,使用大量的传感器才能在小范围路程实现,所以当前禾多科技将其更多的精力放在高速自动驾驶和最后一公里,希望能够分别做到L3级别和L4级别。

图3 倪凯博士做报告

面向量产的高精定位解决方案

之后洛沛给大家介绍了自动驾驶中高精定位的作用和常用的定位算法以及禾多当前的解决方案。

高精定位对自动驾驶的三个模块具有很重要的影响,分别是规划控制、检测感知和高精地图。现在有很多做高精地图的公司,大家都有一个比较一致的任务就是实现高精地图和高精定位的配合,因为有了高精定位之后才能把高精地图里的信息使用起来。

现有的比较通用的定位方法有GPS+IMU,这种方法具有高精度、高稳定性、更新频率高等优点,但也存在高成本、基站部署、精度依赖于IMU等缺点。还有一种是多传感器融合的方法,比如反射值地图加高程图的方法,这种方法是先通过SLAM算法把激光点云做融合,之后把三维点云投影到二维平面上去生成特征图像,定位时将特征图像与点云做实时的匹配,这是一种二维的定位方法,要求激光反射值是比较稳定的结果,在使用算法之前要做激光标定,但在实际标定时产生的结果没有十分一致的规律,这会影响方法的扩展性。除了2D方法,还有用3D点云做scan matching的方法,得到的是6自由度的结果,同时用视觉里程计的方法计算出相对定位结果。除了上述两种方法,还有用视觉的方法。相对来说,视觉的方法成本较低,如果能够正常工作的话得到的精度也是相当高的,除了定位之外,视觉的方法还提供了额外的丰富的信息,比如场景的结构信息。

那么高精地图和高精定位是怎样的关系呢?高精度地图首先具有非常高的精度,在自动驾驶里关心的是它的相对精度,第二点,高精地图里有大量的信息,另外,它还能够进行实时更新。地图可以分为语义地图和定位地图,现在的无人驾驶公司大多使用的是定位地图,定位地图是拿到原始数据之后生成的专门用于定位的地图,除了提供语义信息,定位地图中还包含着提取的no level的特征,比如直线、角点,还有基于学习的一些特征。高精地图能够为定位提供很多的好处,比如提供定位特征,包括语义、几何和外观,其次能为定位提供先验信息,比如将干扰定位的障碍物进行过滤,第三能为定位提高鲁棒性。

接下来洛沛为我们介绍了高速和泊车两个应用场景下的定位。高速的场景主要分成了两类,第一类是车辆在主路上行驶并且没法接入高精地图,在这种情况下的定位只用保证两点——平滑性和准确的相对位置变换,有了这两点,如果车道线感知结果完全正确,就能够有很好的定位了。但实际上车道线检测结果一般只有在检测车辆所在车道时的结果比较好,相邻车道的结果一般没有这么稳定,在这种情况下,如果要进行变道或超车是很危险的,这种情况就需要高精地图的支持,有了高精地图,就能得到比较精准的车道级定位和更好的导航结果,其次,可以减少感知模块的计算量并提升感知效果,高精地图辅助进行高精定位,使得我们对车辆有更好的控制。高速的第二类场景是匝道,分为两种情况,第一种是高架桥对GPS信号产生很大的干扰,第二种是有些匝道的道路曲率非常大,这对车道线感知算法的稳定工作产生一定的影响。

图4 高架桥和匝道场景对定位的影响

低速L4也有三类场景,停车、接泊和运输,现在的解决方案一般是在车辆上加装很多的传感器以期在车端去解决定位感知的问题,但是车场对在车辆加装传感器这件事非常敏感,所以禾多科技引入了智能场端的概念以减少车端传感器的需求,将一些计算放在智能场端,用这种方式来达到量产的可能性。

图5 洛沛做精彩分享

高精地图的解决方案及成果

最后,戴震为大家分享了禾多科技在高精地图模块近期的成果和心得。

没有高精地图,自动驾驶只能实现L2级别,有了地图就能实现导航,比如自主并道、自主超车、上下匝道等等功能。戴博士从地图模块和模拟器两个角度展开介绍。在快速制图方面,目前所说的众包地图是指车道线环境,禾多科技使用的传感器能够提供四条车道线信息,把一条车道跑完之后就可以获取到车道线的情况信息,再对地图进行裁剪、编译就能生成一幅车道线级别的高精地图。随着技术逐渐成熟,加上图商提供的地图数据,禾多科技现在的测试路段已经进行了很大程度的扩展,但是地图的扩展不是简单的数据上的增加,从数据编译、各种服务、执行效率上都意味着新的挑战。

图6 禾多科技Demo路段自制高精地图

戴震接下来为大家分享了地图用于导航和在对辅助其他模块方面的工作。传统的导航主要分为地图匹配、路径规划、导航指令三个模块,这在高精地图中同样也有。在路径规划方面,自动驾驶的算法也是基于传统的DJ算法、A*算法,只是在加权时要做新的考虑,不仅仅是最短、最快,而是最适合,要考虑到安全性、舒适性。在导航指令方面分为建议性指令和接管性指令,建议性指令会告诉车辆是直行、左并道或右并道,接管性指令往往出现在上下匝道或者进出一些关键区域时,比如当道路快要分叉时以车道引导线的形式发出指令引导其进入正确的道路上。

地图作为一个服务性模块可以给很多其他功能模块提供很多支持,比如给控制决策模块提供可安全行驶区域的信息。地图还能辅助感知模块,感知模块可以检测路面上的移动物体,而对方向车道或旁边匝道的信息对当前行驶的车辆是没有影响的,感知模块不能很容易地得到这些信息,但地图在这方面是强项,只需要把可能造成影响的范围画出来,感知模块就能将它的计算资源放在少数的物体上,这样可以极大降低计算耗能。除了辅助规划和感知,地图还能辅助定位。

模拟器模块是一个辅助测试的模块,用于完成可视化和场景模拟两个功能。模拟器可以从多个视角多个传感器来模拟各类信息以及选择是否要显示这些信息。场景模拟功能是指在高精地图已经搭建好的场景上分布不同的车,对每辆车的走势进行描述和控制,这样可以在电脑上测试一些场景来检查控制决策的算法。

最后,戴震与观众分享了关于在高精地图工作方面的心得。从研究的角度,大家听的比较多的是成图的技术,从工程角度来讲,怎么充分把地图用起来、用得更快更好都是需要研究的问题,现阶段这方面工作做的是不够的,一方面这与每家公司的解决方案不同有关,也与这个领域目前发展阶段有关,如果对工程感兴趣,可以多关注一下。第二点,地图模块是需要其他模块辅助的,只有定位、感知、决策和控制等等模块充分发展起来了才会发现地图当中更多宝贵的值得研究的东西,随着各个模块的发展,地图能提供的功能会越来越多,戴震建议大家把眼界放宽一些,看看其他几个领域是怎么做的,这样才能把地图用得更好。

图7 戴震与观众进行交流

>>>互动交流

观众A:戴博士你好,我是资环学院的博士生,是做地图的,有个问题想问一下就是你们的这个高精度地图是怎么来的?是四维图新提供给你们的还是你们边跑边测出来的?

戴震:最开始我们头几个月的测试用的是我们自己的地图,主要是采集车道线的信息,后期我们陆续拿到了四维图新的地图对其进行了解析和应用。

观众A:如果他们提供给你们的地图没有实时更新的话,出现不同的路况是不是车就不能控制了?

戴震:这就是我刚说的众包地图要干的一件事,如果我们实际的传感器发现道路信息和地图里的先验信息不同就会上报给图商做进行进一步的勘察。从我们的感觉来讲,众包地图是需要大的图商,我们作一些修修补补的工作,最后的质检是由图商来完成。

观众A:关于探测,你们的计算都是放在后台来完成吗?如果前面出来一个人,从检测到这个人到车停下会有多大的时间差?

戴震:这个一方面涉及到我们感知模块的准确度能不能实时地发现前方的物体,同时也跟我们的控制流程的效率有关,第三涉及到控制命令下达之后车进行响应的问题。

观众A:那你们现在进行实体车测试的时候有没有模拟这样的场景?效果怎么样?

倪凯:不管是什么传感器都会有延迟,我们的计算也会有延迟,从决策到控制的延迟也是有的,我们自己用的轩辕平台的车辆是一个百毫秒级的延迟,总的加起来都比人一般的判断要快一些。

观众B:三位禾多科技的博士好,我不太懂自动驾驶,平时比较感兴趣。我在想一个问题,现在自动驾驶的解决方案都是在每一台车上分别装传感器,有没有一种可能性就是所有的车都在一个城市里面共用一套传感器,在关键的道路安装,城市里面所有的车都装入一个系统,比如有一个新的车进来了,就可以告诉这个车所在的位置,但前提是这个城市的相关的传感器的配置非常完善,我想问有没有这种可能性?因为在每台车上都安装传感器,车商可能不太愿意,而且成本非常高,如果我们的智慧城市建设好的话,能把我们的地图建得非常完善,我们的传感器也非常丰富,会不会有这种可能性?

倪凯:我觉得这个问题非常好,场端和车端的配合是未来的一个趋势,但是我们可能需要仔细地想一下,我们现在还没有完全自动驾驶,场和车都没有的情况下怎么能去过渡到最后的配合模式,我觉得任何一个技术在演进的过程中,比如您提到的这个方案,需要考虑到的事情是它的造价是什么样的,有没有可能在一定的场景下实现这种商业模式,车场造车想要适应场端的节奏,可能需要考虑做这么一个产品要卖给什么样的用户,用户能不能在用车的时候享受到这个场,比如用户更多的是跑高速公路路段,但结果只在北京的很小的一段高速公路支持场端的视觉或激光雷达的配合,那么这件事情对这个用户就没有什么意义。我觉得最理想的是一个人做慈善把整个全国的道路都铺上传感器,这件事情肯定是没有人愿意做的,政府也不会做这件事情,政府在这个角度上也不知道什么样的场端是最优的,这件事情一开始寄希望于在整个大的交通环境下去变动某一个规范是不太现实的,从这个角度出发,我们禾多并没有觉得在场端是完全没可能的,我们认为在某些闭环的场景下这些事情还是有可能的,但是还是要解决谁来装这些传感器,以及车要卖给的用户,不管是C端还是B端,能不能把这个场景跑起来的问题,只有跑起来了,场端的标准才能不断地去被验证,然后才能做更大范围的推广。

图8 嘉宾与GeoScience Café 成员合影

GeoScience Café以“谈笑间成就梦想”为目标,于每周五晚7:00在实验室四楼休闲厅,邀请1-4位嘉宾,为大家带来学术报告或经验分享。报告内容包括摄影测量与遥感、地理信息系统、导航与定位服务等研究方向,听众可在报告结束后向嘉宾提问、与嘉宾交流探讨,同时每学期还会举办2期人文类讲座和2场导师信息分享会。每期报告会根据嘉宾意愿在B站开设直播,使不能来到现场的听众同步参与。报告PPT和视频会在征得嘉宾同意的情况下在qq群和B站上发布。

更多精彩内容(讲座预告、讲座回顾、报告PPT、报告视频)敬请通过以下方式获取: