核心提示:伦敦大学学院(UCL)时空数据实验室(SpaceTime Lab)由全球著名GIS专家程涛教授创立,专注于时空大数据分析、建模、模拟和可视化方面。此次交流讲座,程涛教授从智能服务的角度出发,分享自己在十几年科研与项目的案例中对时空数据分析的研究,为现场同学们开阔了眼界和思维。
文字:卢祥晨、龚婧 摄影:卢祥晨 摄像:张彩丽 主持:杜卓童
>>>人物名片
程涛:全球著名的GIS专家,伦敦大学学院(UCL)时空数据实验室(SpaceTime Lab)的创立人和主任。她在时空大数据分析、建模、模拟和可视化方面均有很深的造诣,已发表了学术论文250余篇。她多次承担欧盟、英国及中国的973和863项目。近十年来获取科研经费逾千万磅,与伦敦大警察局(London Metropolitan Police) 伦敦交通管理局(TfL),英国公众健康局(Public Health England) ,Arup和Bosch等政府和企业界有深入的合作。她于2012年在UCL创建时空实验室,开创了时空一体化分析的理念,将其实践于“时空大数据”的预测、模拟、分类、画像和可视化中,为政府和企事业提供洞察时空现象的理论基础和计算平台,目前已服务于城市治安、交通出行、公共健康、零售商务及减灾防灾等智慧城市领域。
>>>报告现场
9月19日晚7点,来自伦敦大学学院 (UCL)时空数据实验室(SpaceTime Lab)的创立人和主任——程涛教授做客GeoScience Café第205期学术交流活动。程涛教授首先以自身的求学经历与创立时空数据实验室的初衷,即时空一体化概念,引出今晚的讲座主题——智慧城市与时空智能。紧接着,从交通出行、智能警务、智能商圈与减灾防灾四个研究角度展开,分享了自己这些年来的研究和案例。报告结束后,程涛教授对存有疑惑的同学逐一耐心细致地回答问题。报告现场坐无缺席,反响热烈,即使在报告结束之后,仍有许多观众留下与嘉宾进行讨论交流。
十几年前,程涛教授是武汉大学测绘遥感信息工程国家重点实验室的一名研究生;十几年后,程涛教授带着她在英国进行科研工作的经历回到这里,与学弟学妹们一起分享交流。
讲座伊始,程涛教授向大家介绍了自己的学习经历,从本科学习工程测量,到硕士学习摄影测量与遥感,再到博士阶段在荷兰学习地理信息,从地面控制到天上控制,再到信息的融合与表达,经历了几次思维模式的转变,这让程涛教授在伦敦大学学院(UCL)做科研时习惯用多角度思考。基于当时合作的交通项目需要兼顾时间与空间,于是程涛教授基于时空一体化的理念,在伦敦大学学院 (UCL)成立了时空数据实验室(SpaceTime Lab),这也成为了程涛教授团队主要的研究方向。
智慧城市是指可实时感知的、互联的和智能的城市,程涛教授将其分为了三个层面Instrumented、Interconnected以及Intelligent,从Intelligent层面出发,程涛介绍了时空数据实验室专注的研究及其应用,大致可分为交通出行,智能警务,智能商圈与减灾防灾四个方向,同时也与大家分享了一些实际案例的思路与成果。
交通出行
单纯的手机GPS轨迹数据是没有什么可用的信息的,但是如果通过一些算法,将其变成具有运动模式信息的手机GPS轨迹,则可以有非常大的用处。例如程涛教授提出的,如果知道整座城市里所有人在出行时的运动模式数据,就可以讨论分析在这座城市设计里面,从一个运动模式转换到另一个运动模式时,各衔接点设计得好不好、是否人性化和便利的问题。通过对伦敦一条繁忙的道路上已有的OD数据、实际的路况、车速限制、单行道等条件进行模拟,程涛团队的预测结果与实际情况十分吻合且计算迅速。之后,程涛教授提出了在此方面的应用,比如若碰到交通意外或者其他原因,需要封路等交通决策时,通过模拟可以预测出之后的交通情况,有利于提前布置安防等。
拥有一百五十多年历史的伦敦地铁,时常需要对老化的地铁线路进行维修,因此需要设置交通替换的巴士。通过对过去的地铁交通时空数据进行分析,可以精确地判断需要替换巴士的地点、班次频度以及巴士容量并进行规划布置。针对早高峰可变通的人群,可以根据其上班打卡时间的弹性程度,推荐合适的地铁出行时间,不仅避免了早高峰的影响,还缓解了不可变通工作时间的人群的早高峰压力。根据公交卡使用的时空数据,还可以建立合适的周末24小时地铁运营线,既可以服务到大多依赖公共交通的底层人民,也降低了伦敦交通管理局(TfL)运营地铁的成本压力。
程涛教授介绍的第三个研究项目是,她的团队通过对使用自行车的私人用车数据与伦敦交通管理局(TfL)的官方数据这两种时空数据进行融合使用,评估它们对伦敦交通的影响。此外,由于伦敦的地铁是有自行车站的,自行车需要锁在自行站里面,针对这种特殊性,如何平衡“借车有车取,还车有空放”也成为一个值得研究的问题。结合中国共享单车火爆的情况,程涛教授在2017年上海开放数据创新应用大赛(SODA)中对摩拜单车开放的两周OD数据研究了最佳的站点选择与最佳的投放量,获得SODA明日之星的奖。之后,程涛教授向大家分享了她们的分析结果:原始数据中投放了三十万辆车,仅有七万人骑行,共享单车并没有共享,反而造成了浪费。根据分析提出的解决方案是七八万辆车即可满足90%人群的需求,不用走不超过175米的路,摩拜的工作人员也不需要每天搬运单车,仅需一周搬运一次即可。
智能警务
程涛教授接着为大家介绍了她的团队与伦敦警署合作的犯罪相关和出境与市民(CPC)项目,目的是发现警察活动记录的事件和公众的犯罪观念时空模式之间的关系,以提高出警效率和城市安全。项目的关注点包括:1.基于网络的犯罪预测 2.警察移动时空聚类 3.在线优化巡逻路线 4.警察活动战略规划模拟 5.公众对警察信任度时空分析。
相较于政府进行的网格化管理,程涛教授提出,网格化其实并不是最好的模式,因为人是在道路上行走的,从执行者的角度看,对于犯罪预测出犯罪热点应当告知在哪条路上,而不是在哪块区域有犯罪热点,这无法指导巡逻的路径与方向。通过使用过去犯罪记录的数据进行对比,程涛团队发现,基于路网的预测方法在相同巡逻面积下的命中率是传统网格方法的1.5倍到2倍。在功能方面,通过分析还可以预计罪犯分布、派出所位置和各派出所的警员数量,控制中心可使用智能算法来协调调度多名警员,这使得警员的巡逻方式得到了改善,让警员在恰当的时机出现在恰当的街区,如果这个目标真的实现,那么这种方法能提前预防犯罪的发生;或者,一旦发生犯罪,附近的警员也能及时地对罪犯实施逮捕。
智能商圈
通过对公交卡数据进行分析,如出行时间点和出行时长等,结合每年对伦敦市民随机抽样做出行问卷调查的结果,就可以进行一些数据分析、绘制人群画像,甚至对人群的社会经济背景进行分类,以便继续分析。根据人群画像的情况,还可以做进一步的地方归类——哪些地点是高资或者高薪人员出现的地方,绘制地方画像。
通过对英国推广的智能电表所提供的用电数据进行分析,程涛教授选取了六张具有代表性的用电情况曲线,带领现场观众一起读图分析,推测每条曲线对应的家庭情况、工作情况、甚至是生活习惯,引起观众们热烈互动与讨论。
除此之外,程涛教授还介绍了时空分析在其他方面的应用,比如可以分析预测人流与消费的关系、到访英国的人员情况与发布推特消息之间的关系、推特信息与目标广告投放的关系、个人健康问题与社交媒体影响的关系及其预防工作。
减灾防灾
程涛教授所在的时空数据实验室用机器学习的方法对自然灾害的时空频度进行了分析学习,可以评估特大自然灾害对关键基础设施破坏的可能,并模拟道路网络受损后的交通堵塞状态。这是时空数据实验室参加欧盟第7框架的InfraRisk的课题,该课题的目的是评估和测试欧盟的关键基础设施承受特大自然灾害的能力。程涛教授作为其中子课题的负责人,以近期登陆深圳地区的“山竹”为例,向在场观众介绍了此类“黑天鹅事件”。
除了“黑天鹅事件”外,程涛教授还详细讲解了自然灾害发生以后,到底对基础设施造成什么影响,会对经济带来何种损失。例如,特大降雨之后可能会造成滑坡,随后可能会冲撞桥梁道路,或造成桥梁道路的堵塞,紧接着造成交通等各方面影响,导致经济受损。通过历史的滑坡数据,可以对滑坡风险进行预测、分类以及后续的分析工作。除此之外,程涛教授还提到,在做时间序列中平稳序列的问题不难,而针对较难的洪峰预测,他们通过机器学习等方法,可以很好地预测三天之内的洪峰流量,这可为减灾防灾等后续工作提前做好准备。
>>>互动交流
观众A:程老师您好,您的这个报告非常精彩,我博士期间的研究也是在做这个时序/时空数据这方面的研究,我可能关注从这个车行的轨迹里面去提路网的集合和一些动态信息,我看您讲到了在交通模式上的判断,其实我在美国的时候,大概花了大半年的时间在也做交通模式,从轨迹数据里面去识别交通模式的这一方面的研究,我有几个问题就是:
您与您的团队在做交通模式预测方面,是做到实时的么?
您们在做这方面研究的时候,拿的数据是手机上的数据还是单纯的GPS轨迹数据?
在做这个过渡点(模式与模式之间的过渡)研究的时候,是更多关注于它的准确率的识别,还是关注于现有基础模型对模式之间转换的影响?
您做的交通模式预测是更倾向于我们手机上APP的应用,还是更倾向于做数据处理方面?
程涛:数据不是实时的,因为当初做的时间比较早,当时手机上GPS轨迹没有那么多,所以我们当时是与一家把GPS接收机装在相机上的公司合作,使用他们所提供的数据与赞助,进行研究。
转换点和转换点之间的问题,其实我们当初的目的并不是拿来研究交通规划的问题,是为了研究模式的问题,模式转换之间(转换点)是用在了模式判别的算法模型里面。
而当时做这个研究的动机很简单,因为拿着他们的数据,他们就想让我们做这个事情,因为是PHED这个公司赞助的,他们就想让我们分析这个模式,从他们那里提供的数据,我们可以把它变成有用的信息。
观众B:老师您好,前面讲到的一个基于路网的交通流预测还有基于路网的犯罪路径预测,我想问一下,关于这个基于路网的模型,它是针对整个伦敦所有的路网去处理的,还是分区域分别去处理然后再联合起来?
关于预测精度,时间精度的问题,是以一分钟的精度,还是十分钟的精度或是半小时的这样的精度问题?
放在空间上来看,路网属于比较稀疏的东西,那么这种稀疏的东西是怎么解决的?以及相关问题,关于路网,是把整个原始的路网影像给计算机作为预测的学习,还是说进行了某种的转换?
程涛:非常好的问题。交通和犯罪的预测,它们都是通过路网,是分区还是不分区,这个都取决于你应用的情况,在警署是分为三十二个区,每个区都有高级警官管理的,但是对于伦敦希望是一个大区,当然在处理上可以用于平行处理,这就是另外一个事情,这个就是跟你的应用相关的。
时间尺度的问题,实际上也是取决于你的数据的来源,当初他们(伦敦)给我们的数据最新的是五分钟的,所以我们可以做五分钟的,也可以做十五分钟的,或者是半个小时到一个小时的。所以你也知道,预测的时间间隔越长,你的预测精度是越低的。
交通问题和犯罪问题是两个非常不同的问题,交通问题是个连续性的问题,犯罪问题是一个稀疏的点的问题,实际上没有很好的模型来处理的,所以如果感兴趣,我们是有开课来讲这个问题,是用时空和网络的办法来处理这个问题的。
我们没有用任何原始的影像数据,因为我们有交通路网的数据,我们是用原始的路网来做的预测,没有进行转换。
观众C:老师您好,我提一个比较简单的问题,在做时空分析的时候,在选择空间单元上是一个非常重要的步骤,我看到您用到的很多的数据都是一些个体的数据,个体的数据在空间上可能都是一些点的形式,我们在进行一些空间分析的时候,需要将它聚合在单元上。在单元的选择上,我个人的理解是有两种的选择,一种是有语义特征,一种是没有语义特征。有语义特征的,可能比如说就是一些行政区或者是交通、小区,这些考虑路网约束,或者是考虑一些区域的经济属性,还有一种没有语义特征,我觉得是像格网,比如说有些研究会把它分成500米乘500米,1000米乘1000米的格网形式。我想问的是,在您做这几项研究中,关于空间单元的选择上,您是怎么考虑的?
程涛:这也是一个很好的问题。The Modifiable Areal Unit Problem (MAUP)知道吗?如果不知道的话,我建议你们去学一学,这是一个非常经典的问题,他刚刚问的就是说你空间单元的划分的大小,划分得好不好最后是会影响到你空间分析的结果的,这是MAUP,一个没有解的问题,为什么我们要做网络,因为网络就解决了这个问题,就没有这种单元上划分的问题。回到他刚才的问题,到底怎么选,你说的很对,取决于你的应用,到底是服务于什么,但是确实这个The Modifiable Areal Unit Problem会影响到你的结果,所以你分析单元的时候,要得非常小心,为什么要这么选,到底选多大,我也没有一个定值,但是这也是为什么我们选择网络,网络可以避免这个问题。
第二点,我想说的是,实际上,如果你们有读我的文章,有一篇文章TMUP(Time Modifiable Unit Problem)就是一个时间上的单元划分,时间尺度也很重要,拿来的原始数据是一秒的数据,五秒的数据,最后是用什么时间频度处理,同样也很重要,对你的结果也会有影响,所以我有一篇文章发表在PlosOne上,大家可以去看看那篇文章。
图3 嘉宾与GeoScience Café 成员合影
以“谈笑间成就梦想”为目标,于每周五晚7:00在实验GeoScience Café室四楼休闲厅,邀请1-4位嘉宾,为大家带来学术报告或经验分享。报告内容包括摄影测量与遥感、地理信息系统、导航与定位服务等研究方向,听众可在报告结束后向嘉宾提问、与嘉宾交流探讨,同时每学期还会举办2期人文类讲座和2场导师信息分享会。每期报告会根据嘉宾意愿在B站开设直播,使不能来到现场的听众同步参与。报告PPT和视频会在征得嘉宾同意的情况下在qq群和B站上发布。
更多精彩内容(讲座预告、讲座回顾、报告PPT、报告视频)敬请通过以下方式获取: