更全的杂志信息网

多元数据下的公交站点客流不确定性分析

更新时间:2009-03-28

0 引言

传统的公交客流数据采集主要通过人工问卷调查法获取,需要耗费大量的人力、物力,且样本数量少、精度不高.近年来,GPS系统、公交IC卡数据及地铁数据的广泛应用,为公交乘客出行特征分析、公交出行OD获取提供了新的思路[1].

经常性团建聚餐、每周分享会、按员工意愿与特长分配工作、老父亲般慈祥地对待员工失职借口。我还亲手在公司搭健身角,鼓励大家多锻炼身体,保持良好状态。

国外对结合大数据的公交客流OD研究较早,也相对成熟.James等[2]依托大数据分析实现了对纽约市的公交客流OD推导.Zhao等[3]针对地铁—地铁,地铁—公交的两类出行链做了公交客流推导,Cui等[1]对于不同规模的公交客流研究了相应的推导方法.国内对于公交客流OD的推导研究较晚.胡郁葱等[5]通过IC卡数据挖掘技术获取了公交OD矩阵.胡继华等[6]提出结合出行链的IC卡公交客流研究方法.李海波等[7]提出了公交IC卡与AVL数据相结合的公交客流OD研究方法.综上国内学者研究主要集中与单个IC卡数据的下车站点的推导问题.

实际上,复杂的公共交通环境及乘客的个体随机出行特征,使得上下车客流往往在一个区间范围内波动.大数据背景下,对同一对象的观测值是多个的,利用长时间观测的多个数值分析公交客流,并未得到学者足够的重视[8].给定一个区间客流值给决策者提供更好地支撑,也更有实际作用.本文通过区间不确定性理论与交通大数据相结合,以出行链的思想,对1天刷卡次数行为进行分析,结合乘客出行站数和乘客个体出行特征,以公交IC卡数据和GPS数据为基础,对公交客流区间OD推导方法进行系统研究,并以深圳市公交数据为实例进行分析研究.

1 公交数据处理与上车站点的确定

1.1 公交数据处理

研究数据来源于深圳市公交IC卡和公交GPS数据,公交线路及站点基础数据,需要对这些数据进行预处理,剔除不需要的数据,筛选得到研究需要的公交基础数据,如表1所示.依据车辆编号与车牌号之间的对应关系,终端ID与车牌号之间的对应关系,得到公交融合数据,包括IC卡编号、车辆编号、终端ID、刷卡时间与接受时间、车辆GPS经纬度和站点经纬度等.

 

表1 公交基础数据Table 1 Bus basic data

  

IC GPS线路及站点卡编号终端ID线路名称车辆编号GPS系统时间车辆编号线路编号接受时间站点名称刷卡时间GPS经纬度站点经纬度

1.2 基于时间匹配的上车站点的确定

上车站点的确定可通过2步数据融合得到,第1步为GPS数据与静态的公交站点数据的融合,得到车辆到达各个站点的时间;第2步为车辆到达各个站点的时间与IC卡刷卡数据的融合,得到各个站点在各个时间的刷卡数据,如图1所示.

  

图1 基于公交IC卡数据和GPS数据的上车站点识别Fig.1 Based on bus IC card data and GPS data on the site identification

Step 1 公交GPS数据与站点静态数据匹配方法.

(1)利用公交GPS经纬度坐标与站点经纬度坐标于MySQL数据库中做笛卡尔积,并进行行车方向的判断(上行或下行).

(2)运用SQL查询语句筛选得到站点经纬度坐标50 m范围内公交GPS经纬度坐标,选取2个离公交站点最近GPS经纬度Si(xi,yi),Si+1(xi+1,yi+1),相应的时间分别为Ti,Tj.SiSi+1分别为行车方向上的前后两个经纬度坐标点.

Gq非空,则站点j对特定乘客q的站点吸引权为

(3)到离站时间判断.公交站点经纬度坐标为Pi(xi,yi),若Pi位于SiSi+1连接线之间,如图 1(a)所示,则认定相应的Ti,Tj分别为到站时间和离站时间;若Pi位于Si之前,如图1(b)所示,则认定Ti为离站时间,Ti-30 s为到站时间;同样,若Pi位于Si+1之后,如图1(c)所示,则认定Tj为到站时间,Tj+30 s为离站时间.

孕妈妈要保证均衡营养的膳食,避免摄入过多碳水化合物和热量,而应补充丰富的维生素、矿物质以及富含蛋白质的食物,如黑木耳、银耳等,但不要一下子吃太多。此外,孕妈妈也要多吃含有维生素C的水果,以促进胶原蛋白的生成,使肌肤更有活力。

本文采用第3类非线性区间数优化方法,对于1组数据集合A=[μ1,μ2,μ3,…,μn],从小到大排列,得到n个数据排列新集合,采用统计学中置信区间概念进行取值优化,通过专家经验法和实际数据分析,设显著性水平β,置信水平(1-β )×100%,=1-βA1A2为置性区间的两个上下界值,得到n个数据的区间集合[A1,A2].

对于公交IC卡任意刷卡记录i,若刷卡记录i的刷卡时间tbi和一对进离站时间区间(t a k,tck)满足式(1),则该时间区间所在站点Sk即为记录i的上车站点.

  

图2 公交站点经纬度与GPS数据位置关系判断Fig.2 Judgment of the relationship between latitude and longitude of the bus station and GPS data location

 

式中:tak为公交车到站时间;tck为公交车离站时间.

教材不是教师的“圣经”,而是教师要去加工和二次创造的东西,教师有责任去个性化地解读教材。对于教材,教师要敢于突破教师用书上的条条框框,打破陈旧的观点,敢于融入自己的独特见解,要根据课程内容并结合学生实际对教材加以科学的、灵活的、有效的处理,合理地选择教学材料和教学资源。只有这样,教师才会放手去改组教材,拓展教材,进而超越教材,让教材亲近学生,服务学生,从而保持教师自我处理教材的独立性和创造性。

在描述学校的校园氛围时,53.87%的大学生以强调活跃的校园氛围、兴盛的校园景象为价值取向,带有积极的情感价值取向;而46.13%的大学生以强调缺乏活力、死气沉沉的校园氛围为价值取向,带有消极的情感价值取向,所占比例较大。

结合现实生活中一卡多刷的现象,提出和人共乘行为的假设:如果同一卡号的连续2次以上的刷卡记录的时间间隔小于对应站点间的行程时间,则后几条刷卡记录判定为和人共乘记录.假设和人共乘人员出行路径一致,即两者下车站点一致(假设1).

 

式中:φa为公交车到站弹性时间;φc为公交车离站弹性时间;φaφc皆大于0.

2 区间不确定性理论与公交刷卡行为分析

2.1 区间不确定性理论

区间不确定性理论在数学上叫做区间数优化方法[8].通过一个参数取值的波动区间集合,对该区间集合进行优化即区间数优化.区间数优化方法一般以概率大小来确定不确定约束及控制的满意程度,不确定性目标函数的性能由多个约束保证,具有更好的灵活性和柔性.区间数优化方法分为3类:①基于区间数序关系的线性区间数优化,②基于最大最小后悔准则的线性区间数优化,③非线性区间数优化.

Step 2 公交IC卡数据和GPS数据相结合的上车站点识别方法.

2.2 上车刷卡行为分析

实际生活中公交乘客存在1天多次的刷卡行为,对1天刷卡次数1~4次的行为进行了分析,如表2所示,对于刷卡次数超过4次以上的少数情况忽略不计.

实际公交运营中,对于公交多换乘站点,大量公交车同时在站点排队,导致存在站前站后刷卡现象,为增加认知精度,对进离站时间区间(tak,tck)进行弹性改进.

结合刷卡行为分析,结合实际运营中,公交乘客于同一站点间换乘,提出换乘假设:乘客下次刷卡站点位于当次乘客刷卡上车站点的下游站点(当次乘客线路行驶方向向下)且时间间隔为当次乘车所用时间波动区间内,则乘客当次乘车的下车站点为下次乘车上车站点(假设2).

同时,为了更好地促进农产品与互联网结合,要鼓励功能性、专业化冷链物流服务商的发展,提升农村物流配送的能力和效率。

3 下车站点推导及上下车区间客流的确定

3.1 下车站点推导模型

现有公交IC卡信息中无乘客下车信息,依本研究上车站点确定方法,可得乘客上车站点,下车站点通过乘客个体出行特征和乘客出行距离相结合的站点吸引概率模型来进行推导.

依据本文上车站点确定方法,得到线路l上的每条公交IC卡刷卡记录的上车站点,再依据乘客前n天公交IC刷卡记录,其前n天的上车站点推导仍用本文推导方法,乘客下车站点的推导算法流程如图3所示.

 

式中:为线路l上公交特定乘客q从站点i上车到站点j下车出行途径h个站点的概率;h为乘客所乘站数;λ为乘客平均所乘站数.

考虑乘客个体特征,在任意站点i上车的特定乘客q,在线路l下游任意站点j下车,定义如下:

(1)下游站点集合Eq,运行方向下线路l在上车站点i的下方所有站点集合.

(2)高频站点集合Fq,下游站点集合中,乘客上下车频次高的站点.由于每个乘客的高频站点各不相同,Fq为乘客前n天上车站点记录的集合与Eq的交集.Fq中的站点需满足条件:乘客在该站点的前n天上车次数高于数值x.x的取值由前n天的时间跨度所决定,从而得到高频站点集合Fq.依据高频站点性质分类为商业中心站点集合F1q、学校中心站点集合F2q、居住中心站点集合F3q、办公中心站点集合F4q,其数学关系为F1qFqF2qFq,F3qFq,F4qFq,F1q+F2q+F3q+F4q=Fq.

(3)换乘枢纽站点集合Gq,乘客下次乘车的上车站点与当次乘车的下车乘车的交集.

 

表2 1天中不同刷卡次数行为分析Table 2 Analysis on the behavior of different scrap cards in one day

  

注:括号内数字为卡共乘次数,且无换乘.

 

上下车站点的确定依据刷卡站点即为上车站点第1次刷卡站点为上车站点第2次刷卡站点为下车站点第1次刷卡站点为上车站点第1次刷卡站点即为2人第1次出行的上车站点刷卡站点即为上车站点忽略不计忽略不计忽略不计第1,3次的刷卡站点为上车站点第2,4次的刷卡站点为下车站点,其余情况忽略不计第1次刷卡站点为上车站点第4次刷卡站点为下车站点,其余情况忽略不计第1次刷卡站点为上车站点第3次刷卡站点为下车站点,其余情况忽略不计忽略不计第1次刷卡站点为上车站点第3次刷卡站点为下车站点,其余情况忽略不计第1次刷卡站点为上车站点第2次刷卡站点为下车站点,其余情况忽略不计刷卡/次 和人共乘 换乘(共乘)/次 上车/次 下车/次 出行/次1 2 3否否 是 否是 否0 0 1(1)012(1)4 0 1 2 >2(1)是(2)1 1 1 1 11—1 1 1 1 — 1 1 0 1 0 0 11—1 1 1 1 — 1 1 2 2 2 4 32—4 4 4 4 — 5 4

这3大集合的数学关系为:GqFqEq,其中,Gq最多包含1个元素,Gq,Fq可为空集.

综上所述,变革中的大学面临诸多挑战,知识载体由古代结绳发展到现代数字化,知识传播形式由口口相传转变为网络交互,教师由传统训导者改变为现在的学习伙伴,课堂的物理空间被打破,人才评价标准也由单一的学者变为领导者,大学走出了象牙塔。为适应时代需求,跟上改革步伐,大学必须融入变革之中,顺应时代要求,解放思想,积极应对,在结构系统上不断优化,在方式上不断创新,才能够发挥大学在社会发展中的优势作用,为国储才,为科教兴国、民族复兴贡献力量。

 

式中:为线路l上,在任意站点i上车的特定乘客q,经过h个站点在线路下游任一站点j下车时,该站点j的站点吸引权重.

施工环节是工程建设的重要环节。施工人员的技术水平与工作态度会影响到工程完成情况,从而影响工程质量。在我国小型水利工程建设过程中,各项施工材料都需要经过专业人员与专业机构的检验。对施工的每一个环节、每一个具体施工步骤,都应由专门人员进行记录,以便出现问题时能够快速寻找原因所在。现场施工人员必须经过专业单位审核确认,无关人员不应进入施工现场。

车门的锁被冻住?雾气缭绕的挡风玻璃模糊了你的视线?想要将雾除去而不弄花车窗和玻璃,可以将一个黑板擦放在车里。或者是把车窗摇下来,让新鲜的空气进入到车里,这样可以很快让雾散去。

Gq为空,Fq非空,则站点j吸引权重为

 

式中:Iljqn为在线路l上,特定乘客q在前n天在站点j的上车次数;s为高频站点集合包含的站点个数;ps个高频站点的任意站点;Ip为乘客q在高频站点p的近期上车次数.

Gq为空,Fq为空,则站点j吸引权重为

 

以深圳市21路公交2015年11月13~12月25日全天单向(紫薇阁总站—中山园场站)的IC卡刷卡数据为例,对其中30天工作日每日的公交IC卡数据进行上车站点确定,共63 891条数据.通过计算分析,弹性时间φaφc,分别取进站前和出站后的站间行驶时间的1/5,即依据上车站点确定法则,通过编程匹配得到98.2%的数据确定上车站点,1.4%的数据需人工匹配确定上车站点,得到每天各站点工作日的上车人数.依据上车站点的确定数据和上车客流区间推导方法,取显著性水平β1=0.1.通过python数据预处理,R数据筛选分析处理,得21路公交2015年11月13日~12月25日期间工作日全天单向(紫薇阁总站—中山园场站)的各站点的上车客流区间数分布,如图4和图5所示.

综上,考虑乘客个体特征和乘客出行距离,线路l上在站点i上车的特定乘客q,经过h个站点在站点j下车的概率为

个别计价法计算的销售成本,能以实际采购成本为基础,期末资产价值具有真实性。这种方法适用于一般不能替代使用的存货、为特定项目专门购入或制造的存货等,如珠宝、名画等价值高,数量少的贵重物品。但是,个别计价法在实际操作中,手续繁琐,一个一个地单独计价,耗费的时间成本及人力成本均较高,对存货品种多,数量多的企业来说不太实用,同时就业务本身来说,毕竟像珠宝等贵重物品存货的企业不多,因而不具有普遍性。

 

式中:plijhq为线路l上在站点i上车的特定乘客q,经过h个站点在站点j下车的概率;为线路l上在站点i上车的特定乘客q,经过h个站点在站点j下车的出行距离概率;ωlijhq为在线路l上,在站点i上车的特定乘客q,经过h个站点在站点j下车的站点吸引权重.

3.2 下车站点推导流程

乘客出行站数分布具有一定的统计分布规律,本文采用泊松分布,即

  

图3 下车站点推导流程图Fig.3 Get off the site to derive the flow chart

3.3 上下车区间客流的推导

线路lnk个站点的公交IC卡刷卡数据为:天数集合N={1,2,…,n},站点数集合K={1,2,…,k}.依据上车站点识别方法,下车站点推导算法得到线路l上各站点的当天上下车人数集合分别为S={αi,i=1,2,…,k} ,X={λj,j=1,2,…,k} ;线路l上前n天的各站点的上下车人数集合分别为S1={αxi,x=1,2,…,n,i=1,2,…,k},X1={λxj,x=1,2,…,n,j=1,2,…,k} ;对集合S1X1中的各站点的前n天上下车人数进行从小到大重新排列得到新集合S2=

由于前n天第k个站点每天的上下车人数集合中某些元素不符合常规,不符合该站点下车人数规律的变化,结合区间不确定性理论,利用区间数优化理论,对新集合S2X2进行区间取值优化,本文采用统计学中置信区间概念进行取值优化,通过实际调查和专家经验法,分别设上下车显著性 水 平 为 β1β2;置 信 水 平 分 别 为Yi1Yi2Zj1Zj2分别为两个置性区间的两个上下界值.则前nk个站点的每天上下车客流区间值分别为[Yi1,Yi2],,从而得到线路l上前n天的各站点的上下车人数区间数集合分别为

4 实例分析

4.1 上车客流区间推导

式中:为在线路l上站点j全天的上车次数;g为当前线路l沿当前行驶方向在上车站点i的下游所有站点集合包含的站点个数;p′为g个下游站点的任意站点;为站点p的全天上车次数.

4.2 下车客流区间推导

依据本研究下车站点客流推导流程法则,进行下车站点推导,高频站点集的频次约束不低于3次,乘客近期出行的历史数据为2015年11月13日~12月25日,判断出下车站点的数据总数共61 610条,占确定的上车站点数据的96.6%,其部分计算结果和下车站点客流区间如表3和图6所示.

  

图4 上车站点确定结果汇总图Fig.4 On the site to determine the results of the summary map

  

图5 上车客流区间分布图(单向)Fig.5 On the bus passenger flow distribution map(one way)

 

表3 算法部分计算结果Table 3 The algorithm part calculates the result

  

注:深圳常规公交中存在香蜜湖①,香蜜湖②的站点,且两站相隔甚远.

 

下车站点香蜜二村香梅深南路口香蜜湖①中山公园东门香蜜二村香蜜二村香蜜湖①福田外语学校东IC卡编号6653159462015-12-21.06:20:31DF501 2913820392015-12-21.06:22:26D9080 3222548172015-12-21.06:24:46D9092 3234868002015-12-21.06:55:55D9092 2919522512015-12-21.06:29:24DF501 6678750562015-12-21.07:15:50D9110 2918620322015-12-21.08:12:26DF528 3253242742015-12-21.08:32:34DF525刷卡时间 车辆编号21772032线路方向中山园场站中山园场站中山园场站中山园场站中山园场站中山园场站中山园场站中山园场站上车站点紫薇阁总站紫薇阁总站紫薇阁总站深大北门②紫薇阁总站福田外语学校东龙塘景蜜村

  

图6 下车客流区间分布图(单向)Fig.6 On the bus passenger flow distribution map(one way)

5 结论

结合交通大数据和区间不确定性理论,以公交IC卡和GPS海量数据为基础,改进上下车站点推导方法,增加进离站时间弹性时间,提高了上车站点识别率;依据乘客个体特征,对乘客刷卡行为进行分析,提出乘客出行线路的多种组合模式;结合既有的下车站点距离吸引概率推导模型,提出增加各个站点吸引权重,得到乘客下车站点推导模型.最后考虑海量数据在同一对象上具有多个数据,加入区间不确定性理论,以置信区间区间数优化方法得到上下车站点的公交客流区间,有利于决策者在分析客流时的客观性.在此基础上,以深圳市21路公交IC卡和GPS数据为例进行实例分析,验证了方法的有效性.

对于乘客上下车客流区间值分布研究,得到每天的客流区间分布,对于每个时段的客流区间分布将是下一步研究重点,同时将通过可靠的居民出行OD数据结合交通大数据,得到公交交通出行区间OD.

参考文献:

[1]CUIA.Bus passengerorigin-destination matrix estimation using automated data collection system[D].Boston:Massachusetts Institute of Technology,2006.

[2]BARRY J J,NEWHOUSER R,RAHBEE A,et al.Origin and destination estimation in New York City with automated fare system data[J].Transportation Research Record,2002,18(17):183-187.

[3]ZHAO J H.The planning and analysis implications of automated data collection systems:Rail transit OD matrix inference and path choice modeling examples[D].Cambridge:Massachusetts Institute of Technology,2004.

一般情况下,企业在进行物资采购的过程中,供应商通常会对招标环境进行协调与控制。也就是说,企业在实施物资招标的过程中,供应商预先会对企业产品所需要的材料、基础生产工具与设备等等相关信息,并结合当前市场价格进行分析。而各个供应商为了获取高额利润,可能会存在相互串通的现象,主要体现在将价格恶意提高,而且企业在完成物资采购之后,市场价格还可能会出现持续降低的情况,从而直接引发原材料采购风险等等问题,这样会导致企业在具体采购时可能会出现非常严重的经济损失。针对该问题来讲,企业自身需要对所要采购物资相关信息进行全面、客观的分析,并制订合理的限制模式。

水利建设与融资租赁运行规律契合,即投资额大,期限长,回收慢,现金流稳定。水利建设需要融资租赁的助力,体现在:水利建设增速需要资金提前预支,水利建设提质需要资金有效集中,水利建设增值需要资金时间价值,水利资产盘活需要资金有效利用。融资租赁对于水利建设的优势包括:对信贷政策紧缩的逆向支撑作用,激活社会物流和资金流投入水利建设,税收优势可以携手水利施工企业更好地实现双赢,带动工业生产向水利建设倾斜。

[4]ALEX C.Bus passenger origin-destination matrix estimation using automated data collection systems[D].Cambridge:Massachusetts Institute ofTechnology,2006.

四川省目前大概拥有各类家庭服务机构5000个。其中,家政服务公司约3000个,公益性家庭服务组织2000个。家政服务公司主要分布在成都、绵阳、乐山等经济比较发达的城市,以中介式服务为主,采取员工制管理模式的公司不足10%。公益性家庭服务组织主要是城市街道办事处、社区(居委会)开办的家庭服务项目,各级妇联、工会、就业指导中心设立的家政服务机构。全省拥有家政服务员培训资格的培训机构约300个,年培训规模20000人左右。

[5]胡郁葱,梁杰荣,梁枫明.基于IC卡数据挖掘获取公交OD矩阵的方法[J].交通信息与安全,2012,30(4):66-70.[HU Y C,LIANG J R,LIANG F M.A way to get bus regional OD matrix based on mining IC card information[J].Journal of Transport Information and Safety,2012,30(4):66-70.]

这个蜘蛛精……是人?青辰一边听着天葬师的话,一边仔细打量。那唐飞霄矮小瘦弱,整个身子都裹在硬甲中,只有一颗硕大的光头露在外面,看起来怪诞而不合比例。自己先入为主,竟将其当做了蜘蛛精,着实闹了个笑话。

[6]胡继华,邓俊,黄泽.结合出行链的公交IC卡乘客下车站点判断概率模型[J].交通运输系统工程与信息,2014,14(2):62-67.[HU J H,DENG J,HUANG Z.Trip-chain based probability model for identifying alighting stations of smart card passengers[J].Journal of Transportation Systems Engineering and Information Technology,2014,14(2):62-67.]

[7]李海波,陈学武,陈峥嵘.基于公交IC卡和AVL数据的客流OD推导方法[J].交通信息与安全,2015,33(6):33-39.[LI H B,CHEN X W,CHEN Z R.Amethod for estimating origin-destination matrix of public transit based on smart card and AVL data[J].Journal of Transport Information and Safety,2015,33(6):33-39.]

[8]周和平,全维杰,杨启福,等.基于区间情景的不确定性OD反推模型与算法[J].系统工程,2013,31(10):75-80.[ZHOU H P,QUAN W J,YANG Q F,et al.Uncertain optimization model and algorithm of estimating origin-destination matrices based on interval scenarios[J].Systems Engineering,2013,31(10):75-80.]

 
柳伍生,周向栋,谭倩
《交通运输系统工程与信息》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息