2.1 变量相关性检验
首先采用全局莫兰指数(Global Moran's I)[13]检验因变量及候选解释变量是否存在空间自相关性.结果如表2所示,四个因变量的z得分均远超临界值1.65,p值低于0.1,在空间层面存在显著的正自相关性.解释变量中,商业用地面积(Land_B)、是否端头站(Terminal)、是否换乘站(Transfer)的z得分及p值未通过检验,空间相关性不显著,因此被纳入全局变量; 其余解释变量的两个指标均通过检验,具有显著的空间相关性,被纳入局部变量.
表2 变量空间自相关性检验结果
Tab.2 Test results of spatial autocorrelation of variables
为进一步研究站点客流的局部差异性,采用安瑟伦局部莫兰指数(Anselin Local Moran's I)对因变量进行局部自相关分析.由图2可知站点在空间层面存在聚集效应,以早高峰出站客流为例,高-高(H-H)聚集区主要分布于中心区域,该范围区位优势较高,用地及业态功能分布相对成熟,因此站点客流效益好,且更容易聚集; 低-低(L-L)聚集区主要位于外围区域,受区位、用地成熟度的影响,该范围站点客流相对较低,且较难聚集; 另外,低-高(L-H)聚集区分布在H-H型和L-L型站点之间,由于区位优势比H-H型站点差,因此客流相对较低,但相比L-L型站点,客流聚集效应则相对较强.另外,考虑到所选变量可能存在多重共线问题,对估计结果造成偏差,采用皮尔逊(Pearson)相关系数识别变量间的共线性.解释变量中是否端头站(Terminal)与四个因变量的相关性均较低,在0.05水平下不显著,居住人口数(N_Pop)与就业岗位数(N_Job)的相关系数大于0.7,多重共线性较强,因此剔除就业岗位数、是否端头站两个变量.以早高峰出站客流为例,利用方差膨胀因子(VIF)再次检验,如表3所示,各变量的VIF值均未超过10,通过显著性验证.
图2 因变量局部自相关分析图
Fig.2 Local autocorrelation analysis of dependent variables
表3 多重共线性检验结果
Tab.3 Multicollinearity test results
2.2 模型对比及选择
多元线性回归是定量描述轨道站点客流影响因素最基本的模型之一,通常采用最小二乘(OLS)模型进行参数估计,计算公式为
式中:yi为站点i的客流量(因变量); β0为模型截距; n为站点影响因素(解释变量)个数; xij、βij分别为站点i的第j个影响因素和对应的回归系数; εi为误差项.
由于OLS模型假设各变量独立分布,解释变量与因变量均为全局变量,往往忽略了由于变量间的空间异质性所引起的局部变化[14].而结合前文分析,轨道站点客流及建成环境等影响因素在空间范围存在自相关性,因此,用全局模型解释性相对较差.
地理加权回归(GWR)模型考虑到变量的空间异质性,在OLS模型的基础上将地理坐标纳入模型,回归系数随站点位置的变化而改变,使每个站点都有其独立的回归模型,由于GWR模型允许局部参数估计,也能更合理地解释一些变量的空间非平稳性特征,计算公式为
式中:(ui,vi)为站点i的地理坐标; ui为纬度; vi为经度.
GWR模型默认所有变量均为局部变量,影响系数都随着空间位置的变化而改变,过分强调了局部影响的重要性,而实际上存在某些变量在全局范围系数变化不大,空间相关性较弱.因此,相关学者在此基础上进行优化,建立了同时包含局部变量和全局变量的混合地理加权回归(MGWR)模型[15],假设有p个全局变量,模型计算公式为
MGWR模型允许部分影响因素回归系数保持一致,即认为该变量对客流的影响程度在整个区域没有变化; 而其他因素的回归系数在各站点间有所差异,会随地理位置的变化而改变.模型由线性回归和地理加权回归两部分构成,回归拟合结果更符合实际[6].
结合2.1分析结果,本次研究所选的变量中,全局变量(如是否换乘站等)和局部变量(如居住人口数等)同时存在,因此,为兼顾具备和不具备空间非平稳性的影响因素对轨道站点客流的影响,本文将选择MGWR模型进行拟合,为了进一步评价论证模型的解释能力,同步构建OLS模型,对比两个模型的拟合优度.
2.3 模型运算结果
使用MGWR2.2软件构建模型,选择AdaptiveBisquare为空间核函数,Golden Section搜索带宽[16],为消除不同量纲的影响,采用Z-score进行变量标准化处理,运行后得MGWR模型回归结果.同时构建OLS全局模型进行对比,两模型运算结果如表4所示.以早高峰出站客流为例,MGWR模型拟合优度R2为0.755,相比OLS模型提高了约20%,残差平方和(RSS)和赤池信息量准则(AICc)均有所降低,说明考虑变量空间相关性的MGWR模型能更准确地反映不同时段进出站客流与影响因素间的变化关系.
表4 模型运算结果
Tab.4 Model operation results
对比各高峰时段进出站客流的MGWR拟合效果,早高峰出站、晚高峰进站、晚高峰出站客流的R2均大于0.7,表明模型解释能力较强,早高峰进站客流的R2为0.693,解释力相对较弱,这是就出行行为而言,早高峰进站客流多来源于居住人口的通勤目的,而由空间自相关分析可知,居住人口分布在地理位置层面的差异相对较弱,对客流的影响程度偏低.