【GeoScience Café】杨雪:基于众源时空轨迹数据的城市精细路网获取研究

2018-03-22
  • 阅读:

主持:邓拓 摄影:于智伟、郑镇奇 文字:于智伟、史祎琳

>>>人物名片

杨雪,武汉大学测绘遥感信息工程国家重点实验室2014级博士,以第一或通讯作者发表论文共11篇(SCI论文5篇,EI论文3篇,中文核心1篇,会议论文2篇);已授权国家发明专利4项;获得2017年测绘科技进步一等奖;GIS领域TOP期刊IJGIS及智能交通领域TOP期刊IEEE ITS等审稿人。研究兴趣为时空轨迹数据挖掘与变化检测。

>>>报告现场

2018年3月18日,杨雪博士做客Geoscience Cafe第188期学术交流活动,介绍了基于众源时空轨迹数据的城市精细路网获取研究的报告,同时向大家分享她的科研心得以及马里兰大学访学一年的经历。

研究背景与意义

众所周知,无人车驾驶技术十分火爆,自15年以来,每年很多不同类型的无人车上路测试。在无人车半自动到高自动再到全自动的过程中,高精度车道级道路地图已成为重要的技术支撑,获得了各大公司的关注,成为国际学术界和工业界竞相争夺的战略制高点。

数据方面:相较于传统测绘领域所获得的高分辨率影像、LIDAR点云及高精度GPS数据,众源车载大数据具有成本低、周期短、动态信息丰富等特点,并藉由互联网的发展、定位技术的普及得以广泛应用。

街道信息获取方面:借助常用的车道偏离预警系统、自适应巡航控制平台以及车道变化辅助系统等方式获取道路细节信息,易受限于采集区域范围,且更新速度慢、成本高、容易受环境影响。面对未来小区域自动驾驶以及跨省市自动驾驶,区域内复杂、细节的道路网络信息是关键,而如何快速、低成本的获取这些道路信息目前还处于待研究的状态。

针对现有的基于激光、影像特征提取与DGPS/IMU装备车采集等道路获取方法所存在的采集周期长、成本高、更新慢等缺点,本期讲座杨雪从众源车载轨迹大数据清洗、城市道路交叉口识别与空间结构提取、路网拓扑与集合信息获取、路网变化检测四个方面,为我们讲解了如何实现城市车道级精细路网生成与变化监测。

研究现状与趋势

车载轨迹数据清洗目前有两种方法,第一种修正原始GPS轨迹坐标,这种方法可修复异常噪音点,但是对数据采样率要求高,需要的参数多(航向、速度)。第二种是原始GPS轨迹坐标位置不变仅去除异常值,这种方法可去除大量漂移点,但是无法去除夹杂在高密度类簇内的异常值,对数据覆盖率要求高。

在道路交叉口识别与结构获取中,目前有根据交叉口类型和转向特征,构建交叉口分类器识别交叉口,也有根据交叉口交通功能,利用聚类方法和空间统计方法识别交叉口。

在城市车道级道路信息获取方面,目前有基于高分辨率图像、视频等资料的车道线识别,基于车载/机载激光雷达数据的城市车道路面识别及路坎提取,基于DGPS/IMU的高精度轨迹信息的道路车道数量确定。但是这些方法成本高、获取周期长、易受环境影响(如:植被、行人遮挡;图像模糊,过渡曝光)。

目前的道路变化检测方法主要存在以下几种:旧影像数据叠加新影像数据;旧的路网数据叠加新影像数据;旧的路网数据叠加新路网数据;旧路网数据叠加实时的GPS轨迹数据来获取变化的道路结构与拓扑信息。尽管,每一种方法都可以完成一定程度上的路网变化检测,但是大多针对于道路中心线以及车行道级别的变化检测。目前,国内外在车道级道路信息变化检测方面还处于有待研究的状态。

众源车载轨迹大数据清洗

众源车载轨迹大数据清洗的基本过程:首先对众源轨迹大数据进行质量分析,然后提出基于运动一致性模型的车载轨迹大数据清洗方法,最后利用实地采集轨迹数据对提出的方法进行了实验例证与分析。

高精度的轨迹数据是车辆移动模式的直观体现。正常车辆行驶往往沿着当前车道中心线行驶,但是在实际情况下,由于车载GPS定位技术的限制会使得其精度受到一定影响。对比同步高低精度GPS轨迹数据在空间上的分布特征,发现高精度轨迹数据在空间上存在高度一致性。于是这些高精度轨迹数据的存在可以使得轨迹数据整体更加平滑,因此如果想从数据中清洗出优质轨迹,就需要设置平滑度评价方法及参考。

针对这个问题,杨雪提出了基于运动一致性模型的车载轨迹大数据清洗方法。先基于运动惯性约束的轨迹分割来确保同一段轨迹处于相同的运动模式,构建平滑评价方法及参考,由于高精度轨迹在空间位置和航向存在高度一致性,便可利用随机采样一致性算法(RANSAC)构建空间参考。然后利用采样空间相似性模型,评价轨迹点与参考位置的相似性。通过实验发现,基于运动一致性模型的数据清洗方法能有效对数据进行清洗并能改善数据量(见图1)。

图1 GPS轨迹数据清洗方法对比结果

平面交叉口识别与空间结构提取

城市道路平面交叉口识别与空间结构探测是构建车道级道路网络的重要环节。通过对平面交叉口功能以及车辆在交叉口的运作情况进行分析,从轨迹数据找出特征点,然后利用聚类方法识别交叉口,并根据轨迹来追踪获取城市平面交叉口空间结构(见图二)。

图 2 以武汉市出租车数据为对象获取的交叉口识别及空间结构提取结果

路网拓扑与集合信息获取

车道级道路网主要包括路段和交叉口两部分。通过上述研究,已经可以从轨迹数据中获取城市交叉口的空间结构。对于道路路段车道级道路信息获取,则依然以轨迹数据为研究对象,采用优化的约束高斯混合模型完成对应路段车道数量、车道中心线以及车道宽度信息的获取。

考虑到实际道路情况,城市道路车道存在增设和削减的情况,因此可以采用移动窗口来对轨迹覆盖路段车道宽度进行探测,然后再根据实际情况对车道信息进行优化。对于车道转向渠化信息的提取,则可以采用轨迹追踪算法。完成交叉口与路段车道信息获取后,再利用空间匹配方法完成交叉口与相应路段的自动匹配,实现完整车道级路网数据的生产(见图三)。

图3 利用滴滴数据获取的车道级路网数据

路网变化检测

城市车道级路网变化主要包括几何变化与拓扑变化。几何变化主要包括车道增设或者减少,拓扑变化主要包括增设调头机制、车道变道规则的变化。轨迹数据匹配则采用模糊逻辑方法,确定模糊因子,构建隶属度函数,再利用OSTU算法去模糊化来实现匹配过程。

针对几何变化类型,首先找到无法成功寻找到可以匹配路段的GPS轨迹数据,对其进行聚类,判断类簇中心线与其相邻的同向车道中心线在空间距离和方向差异是否满足车道宽度约束和角度差异约束,同时判断类簇中心线长度是否满足城市增设车道长度约束。如果满足约束则认为是新增的车道;对于关闭车道这种情况,寻找路网数据中一些路段没有相对应匹配的GPS轨迹数据(见图4)。针对拓扑变化类型,通过对比匹配轨迹数据的连通关系与该匹配路段连通关系来探测。

图4 车道级路网几何变化检测结果(车道增设与车道关闭)

留学经历分享

随后,杨雪博士介绍了她的留学经历。杨雪博士于2016年赴美国马里兰大学进行访学,导师是Kathleen Stewart,主要是从事GIS理论的研究,更多关注的是健康地理学。在美访学期间她还参加了AAG会议ASSOCIATION OF AMERICAN GEOGRAPHERS、UCGIS会议University Consortium of Geographical Information Science、CPGIS会议ASSOCIATION OF CHINESE PROFESSIONALS IN GEOGRAPHIC INFORMATION SYSTEMS,也是收获颇丰。

>>>互动交流

提问环节,观众们热情高涨,嘉宾选取了几位观众进行交流,并送出了由café出版的第二部《我的科研故事》作为提问奖励。

观众A杨雪博士您好!请问您在对城市道路交叉口语义的定义中只停留在左转,直行这些二维空间,在例如高架桥这些地方是否应该提出更多的语义信息?在研究过程中使用了出租车的数据也采用了高精度GPS数据,那么这些不同精度的数据是用于不同的研究中吗?

杨雪:针对立体交叉口语义这方面,我的研究主要关注的是平面交叉口,对于立体交叉口,它本身结构是比较复杂的,因为它在立体空间上有分层,但是在转向语义中,它还是左转右转直行这些转向语义只不过是在不同的立体空间层完成的。在质量清洗的研究中,采用高精度的GPS数据是作为实验的真值去验证实验方法的有效性。在车道信息获取与交叉口识别方面,我都是采用出租车的轨迹数据,先不考虑出租车轨迹数据的定位精度,而是考虑到信息识别准确率时是没有任何影响的。而在变化检测这一方面,确实是一定要采用高精度的轨迹数据,在做车道级变化检测的时候,采用低精度的轨迹数据是没有意义的。

观众B杨雪博士您好!我现在在做校园路网的提取,相对于您的研究,尺度会小很多。关于您在时空轨迹采集上,采集的标准有没有什么参考?在采集的过程中,针对有些区域数据覆盖率较低的问题您是如何处理的?针对校园路网数据的精度检验上您有什么好的想法?

杨雪:针对你所要做的数据的精度,采集的标准是不同的,如果你只是想做道路行车线的提取的话,那么在这条道路上哪怕只有一条轨迹也是可以提取出来的。如果是想要做校园路网的话,采样间隔一般在10秒以内都是可以的,在采样数据量上,你可以发动周边的同学帮你一起采集一些数据。之前我在国外访问Google Earth能够看到很清晰的遥感影像,而在国内的话,可能需要用仪器去实地采集一些数据了。

观众C杨雪博士您好!我想了解一下如何在美国获取一些科研资源?在美国学习和国内有什么区别?

杨雪:美国校园网站里提供学校各个院系的资源链接,也包括一些数据的链接。另外有的研究团队内部会有服务器,对一些不涉密的数据都可以放在服务器上。还有一些方法就是从周边的同学那里获取。当然在国外可以利用Google,也可以利用很多政府网站来获取一些你想要的数据。在中国学习科研,一般都会给你一个限期,在这个限期中你必须要做多少事情。而在美国,研究比较单一,科研的环境比较单一,自由度会高一些,当你需要问导师问题时,你自己主动预约联系,国外老师比较喜欢主动一点的学生。国内老师都比较负责,定期开会看看大家都在做些什么。而在补助这方面,国内是学校直接发放,而国外则需要你去做助教等来获取一定的补助。

观众D杨雪博士您好!我想问一下,关于路网结构,组织GPS数据时是根据全部的数据组织,还是根据单个司机来组织的?有的主干道上数据较多,有的偏僻的路上数据较少,对路网信息提取有影响吗?

杨雪:我们存储的时候确实是根据车辆ID来存储的,这样能够看出这辆车一天走了多远的路之类的。在实际做的过程中,我们是根据研究的需求,比如说我们需要提取这个位置的数据,则只需要在数据库中制定一定的经纬度约束来提取出我们需要的数据就可以了。数据量的多少确实对路网信息的提取有一定的影响,我在做实验的过程中主要还是选择走的人多的路,比较偏僻的路,出租车走的少数据也会少很多。

图5 杨雪博士作报告

图6 观众提问

图7 杨雪(前排中)与GeoScience Café团队成员合影留念

GeoScience Café谈笑间成就梦想为口号,采取最自由的交流方式,每期邀请1-4位报告人,针对自己正在进行的研究展开报告。每周五晚7:30,在测绘遥感信息工程国家重点实验室四楼休闲厅举行当期活动。报告内容不仅涉及一切与测绘有关的学科内容及学术方法,如测绘基础学科、地理信息系统、摄影测量与遥感、全球定位系统、激光雷达技术、信号处理,还包括地理信息科学以外的话题,如法律和艺术等。让任何感兴趣的人——不仅是地理信息相关专业的师生,还包括其他专业的师生,甚至是文科生——都可以听取报告,并当场向主讲嘉宾提问或者会后与其交流。

更多精彩内容(报告PPT、新闻稿及下期活动消息等)敬请关注Geoscience Café(QQ群号:532362856),微信公众号:GeoScienceCafe

欢迎扫描二维码: