核心提示:基于沉淀的大量时空轨迹及位置数据,利用机器学习/深度学习、运筹优化等技术,可以解决快递员&车辆运力调度、订单分配、网络规划等核心问题,并提升物流的揽收与配送效率。在2018年10月11日10:00,吴黎霞老师报告展示了城市及末端在揽收与配送包裹场景上智能化的近期研究工作,并特别介绍几个和大家生活紧密相关的应用产品背后的算法,如裹裹上门揽件、淘宝物流详情上的2小时时效&轨迹透出等。
文字:崔宸溶 摄影:米晓新 主持:纪艳华
>>>人物名片
吴黎霞(浪迹),菜鸟人工智能部高级算法专家,目前负责菜鸟末端智能化&城市计算的团队,主要从事机器学习、运筹优化、城市计算、轨迹挖掘等研究方向,解决末端网络规划、快递员&车辆运力调度、线下商业化等问题。加入菜鸟之前,在1688及阿里妈妈从事搜索&展示广告的机器学习的工作,有非常丰富的线上&线下的算法实战工作经验。
>>>报告现场
随着移动互联网的快速发展,基于时空轨迹和位置数据的服务与我们的生活息息相关,如快递配送、车辆调度、订单分配等问题。通过机器学习、城市计算、轨迹挖掘等方法,如何提升物流的揽收与配送效率,如何更加智能化服务大众生活,成为越来越多学者和企业的研究方向。
2018年10月11日,菜鸟人工智能部高级算法专家吴黎霞进行了学术交流活动.他结合自己丰富的算法实战工作经验,展示了城市及末端在揽收与配送包裹场景上智能化的近期研究工作。
城市及末端揽配网络
随着人工智能、智慧城市和物联网等技术的发展,物流行业在不断推进智能化服务以更好改善人们的生活,对于快递派送,背后关键是快递员和车辆的运力调度问题,而从我们每天拿到包裹上贴着的电子面单,到包裹自动分拣机器人,都涉及到许许多多的智能化场景。
菜鸟网络提出三个使命:做到全国24小时送达;全球72小时送达;做未来商业的基础设施。为此将不断推进“三网两刀”战略,三网是指:快递网络,联合各快递公司帮助解决在淘宝各平台上的物流体验;仓配网络,针对天猫超市等业务,从仓储到配送全链路都有专门的合作伙伴来完成包裹履行;末端网络,进行快递员和车辆运力调度,解决最后物流的一公里问题。两刀指的是跨境网络和农村物流。菜鸟网络将互联网技术基因更多的植入物流体系之中,以期打造一个开放的社会化物流大平台。
整个物流网络,是指从包裹生产到消费者手中的整个实物流通环节,城市及末端网络是其中重要环节,它包括分拨中心和网点间车辆运输和临时车辆调度、网点和驿站、网点和网点之间的快递运力调度和配送。网络中连接百万级快递员,几十万中间干线和城市车辆,在此过程中产生大量时空数据和位置数据。而末端调度是指各网点最后一公里派送问题,其调度过程最为复杂,包括快递派件揽件、零星订单处理、派件上门或驿站自取,以及智能决策等其他业务。
实现实物流转的关键:首先,快递员及时揽收订单;其次,车辆怎么从网点到网点间送包裹;最后,快递员派送包裹时作出选择,即送到驿站、物业、或送货上门。在这些使用场景下就产生了大量数据:百万级的快递员轨迹,轨迹点间隔是10-20s;几十万级的车辆轨迹;亿级的包裹地址。
轨迹处理算法场景及应用
原始轨迹存入轨迹管理平台之后,首先进行轨迹预处理,然后分层标注语义轨迹,通过语义轨迹挖掘,最后建立服务接口,提供给用户实时位置查询服务、ETA查询服务、实时取件判定服务和实时签收判定服务。
1.物流详情2小时时效&轨迹透出
在“查包裹”物流详情上,可以提供2小时时效的轨迹预测,这类似于单个OD(Origin to Destination)的时效预测,在末端包裹配送中一趟Trip包含多个社区,每个社区有多个包裹。失效时间包括快递员在路上的时间加上在社区内的时间。通过LTSM网络(long short term memory)建立时间预测模型。
2.AOI(Area of Interest)服务
表征包裹位置,将地址聚合成area(如社区、校园),还原真实配送情况,同时降低复杂度。以往表征轨迹转换常用网格匹配方法,但无法解决跨河流跨道路的问题,所以提出AOI来把各个轨迹点预测到和实际情况更贴切的多边形里面去。利用城市路网数据,将整体城市进行语义分割,切分成小区域,快递员配送轨迹构成小区域之间的流通,进行Graph操作,生成更符合社区校园的AOI。
“裹裹”背后的城市及末端揽配运力调度问题
“裹裹”背后的城市及末端揽配运力调度构建了车辆调度仿真平台,当运力调度平台选择相应的时效要求或配送类型,就会出现合理的车辆路线规划。其中涉及到的主要问题有以下方面。
1.快递员运力调度问题
快递员运力调度的经典问题包括:
1)供需分析和平衡。需要做单量预测,容量预测,即时服务质量预测,然后给相应运力做相应部署。
2)订单决策过程。进行预约单合并(求解TSP问题),做出订单分配最终排序和决策。
2.派单分配问题
一种情况是根据快递员实时轨迹指派快递员,另一种是根据快递员行为实时对快递员负责区块进行划分,做出动态分区,有效平衡供需问题。首先将整个城市AOI化,通过快递员行为轨迹抽取到AOI级别,然后在AOI级别上建立快递员选择模型,抽出快递员状态特征,进行路径学习,若路径相似度非常高的话就同属于一个快递员配送范围,这样分配可以有效平衡快递员工作量,以防有的地区因工作量太大而降低快递员服务质量。
3.车辆调度问题
车辆调度的目标是在保证时效的前提下尽量降低成本,因为点到点配送成本太高,因此要把大量订单合并到一起。首先选择设计Hub点,3公里内订单基本由快递员负责,然后进行订单在时空上的聚合,构建有向图,用基GraphMinimum path cover求解得到最短路径覆盖数。
4.电子面单&分拨:智能分单
现在快递采用电子面单三段码(分拨中心编码-网点编码-快递员编码),把各物流环节的码直接印到订单上,以节省以往看地址的时间。分拨过程中采用基于大规模机器学习的融合算法,从地址中提取文本特征、关键字特征、地理围栏特征、规则特征等,建立融合模型,通过在线学习和交互式学习,用ML的方法来挖掘分单规则,分单准确率目前可达99.9%。
5.智能发货:未来方向
智能发货是未来要做的方向,用机器学习方法预测时效、成本、服务水平,综合考虑指标最优和商业约束,利用优化算法对每一个订单做最优的决策,推荐更合理的快递公司给商家。
>>>互动交流
观众A:老师您好!设计建立模型时考虑构造什么特征?采用强化学习方法的目标和功能设定是什么?这块有什么动力或者标准来进行强化学习吗?
吴黎霞:不同问题特征选择不同,简单LRmodel特征维数都是是千万级特征,没必要用太多,用Lasso做特征,我们刚才提到的EPA用的feature也是根据领域知识和专家知识挑出来的,这些可以用简单model做,我们现在也在思考,应用深度学习的话就不需要做太多特征的事情,这些是我们将来要做的工作。强化学习在解决订单分配上我们的目标是服务质量,现在主要是时效,如果订单在2小时内没有送到,或拒绝订单,我们就认为服务质量差,这些也和天气、工作量等都有关,自动分配对后面的订单都有影响,用强化学习的方法可以帮助这些问题。
观众B:老师您好!轨迹数据管理用什么工具管理?整个管理平台大概是什么规模和计算能力?
吴黎霞:系统存储原来用Hbase,后面用阿里推出新的架构Ha3,它是实时更新的索引,可处理高性能检索问题,上面封装了一层空间处理结构,可以把所有快递员轨迹按照原来的商品方式处理,还有空间计算等采用的存储器来做线上的存储和查询,每天大概百万到千万的查询量,给定一个范围查询效率在秒级之内。
观众C:刚才介绍到订单信息三段码的时候,快递员信息怎么得到呢?快递员涉及到离职和变动,这个怎么分析呢?
吴黎霞:每个地区由哪个快递员配送,这个码是快递公司绑定后提供给我们的,我们存入系统中,只有快递公司知道快递码对应哪个快递员。
图4 GeoScience Café成员与嘉宾(右三)合影
GeoScience Café以“谈笑间成就梦想”为目标,于每周五晚7:00在实验室四楼休闲厅,邀请1-4位嘉宾,为大家带来学术报告或经验分享。报告内容包括摄影测量与遥感、地理信息系统、导航与定位服务等研究方向,听众可在报告结束后向嘉宾提问、与嘉宾交流探讨,同时每学期还会举办2期人文类讲座和2场导师信息分享会。每期报告会根据嘉宾意愿在B站开设直播,使不能来到现场的听众同步参与。报告PPT和视频会在征得嘉宾同意的情况下在qq群和B站上发布。
更多精彩内容(讲座预告、讲座回顾、报告PPT、报告视频)敬请通过以下方式获取: