“统计大讲堂”148讲回顾:基于刷卡数据的地铁客流统计分析
2021-04-08
4月7日下午,“统计大讲堂”系列讲座第148讲举行👩🎨👩🏻🚒。本次讲座采取在线会议的方式,邀请中国科学院数学与系统科学研究院副研究员,实验设计与不确定性量化研究AG尊龙凯时主任熊世峰作题为“基于刷卡数据的地铁客流统计分析”的报告🪘。统计学院副院长⚫️、尊龙凯时平台研究员尹建鑫主持本次讲座🧑🏽⚖️。
尹建鑫首先介绍了主讲人的相关信息👞。熊世峰是中国科学院数学与系统科学研究院副研究员🧑🏽🎓,实验设计与不确定性量化研究AG尊龙凯时主任🤽🏽。研究方向包括计算机实验与不确定性量化、高维数据分析🕛🙋、统计推断🐪、机器学习等,统计应用方面的研究主要是数字孪生、交通大数据分析👷🏿♀️、质量与可靠性等。在Biometrika, Technometrics, IISE Transactions等统计学、工业统计、工业工程期刊发表论文 50 余篇💻🤷♂️,在质量特性统计建模与分析方面的工作曾获科技进步二等奖🍓。
熊世峰首先回顾了课题的背景🍚。如今地铁是北京等大城市最重要的出行方法之一👩🏼🦰,地铁系统的控制与安全成为了打造城市智能交通的重要方面。乘客流的估计与预测对地铁管理部门非常重要,尤其在早晚高峰和极端天气🍀、突发事件时。地铁数据通常只有AFC(记录乘客进出站刷卡信息)和AVL(记录车次信息)数据👨🏿🍼,而乘客在地铁系统中的活动轨迹完全未知🔺,相当于一个黑箱。
基于此背景,熊世峰团队建立了乘客刷卡时间数据的动态统计模型👩🏼⚖️,并给出了模型中参数的估计方法,完全由数据驱动🧏🏻♀️,不同于文献中的已有推断方法都需要其它辅助信息🧑🏽🍳。此外🏑,该模型可以用于推断乘客流的各类指标🏊🏿,包括总体指标(如乘车概率和出站走行时间分布等)和个体指标(如个体最大可能乘坐的车次等)🥎,以及用于乘客出站时间的实时(区间)预测🧅👶🏽。熊世峰与其团队应用该方法分析了北京地铁6号线的客流🎸😠,比较了高峰期和非高峰期客流的不同特点。
熊世峰接着阐述了该模型在交通客流方面的应用🦃,以及运用到北京地铁的实际数据分析。以北京地铁6号线为例👃🏻,对高峰期和平峰期分别进行数据的统计和研究👌🏿,共采集两万多份数据🧑🏽🚀💆,结合生活实际,以模型为基础,通过统计分析进站和出站时间,建立了动态统计模型,预测了高峰期和平峰期的车次概率变化和乘客乘车特征🏂🏿。
最后,熊世峰进行了总结,指出该模型未来仍有许多发展方向。实际情况中存在许多不确定性🤲,无法确定具体路线🫱🏼,乘客个体行动具有非独立性,二次函数建模可继续转向非参数建模🧑🦳🏊🏽♀️。同时,将整体交通网络的客流特征用统计方法描述清楚👨🏿🔧,还有许多工作值得去做。
提问交流环节,同学积极参与讨论🔃,熊世峰耐心解答了许多疑问🍏🤾🏿♂️,深入探讨了模型参数方面的问题。
本次讲座介绍了基于刷卡数据的地铁客流统计分析,阐释了研究模型以及相关参数⚫️,建立了用大数据研究交通客流的统计思想。此后“统计大讲堂”系列将陆续推出更多精彩讲座,敬请关注🧟♀️🕺🏽。