基于主成分分析和BP神经网络的网约车服务质量评价
邵春福1, 王菁1, 彭金栓2
1.北京交通大学 交通运输学院,北京 100044
2.重庆交通大学 交通运输学院,重庆 400074

第一作者:邵春福(1957—),男,河北沧县人,教授,博士,博士生导师.研究方向为交通规划、交通管理和智能交通. email: cfshao@bjtu.edu.cn.

摘要

为客观、科学评价网约车服务质量,从顾客满意度角度出发,通过分析网约车服务过程,建立网约车服务质量评价指标体系;为消除指标间的相关性,利用主成分分析法提取累计贡献率超过85%的主成分作为BP神经网络模型输入;通过分析BP神经网络模型的原理构建具体BP神经网络拓扑结构;以网约车乘客满意度调研问卷为数据基础,对BP神经网络模型进行训练、仿真,并与传统BP神经网络模型及SERVQUAL模型评价结果进行对比.结果表明: 本文构建模型收敛效率高、评价误差小,能够反映网约车服务质量的水平,可以为评价网约车服务质量提供有效理论支撑.

关键词: 城市交通; 服务质量; 主成分分析; BP神经网络模型; 网约车
中图分类号:U491 文献标志码:A 文章编号:1673-0291(2018)03-0010-06
Internet private hire vehicle service quality evaluation based on principal component analysis and BP neural network
SHAO Chunfu1, WANG Jing1, PENG Jinshuan2
1.School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China
2. School of Traffic and Transportation, Chongqing Jiaotong University, Chongqing 400074, China
Abstract

In order to objectively and accurately evaluate the quality service of internet private hire vehicle, the evaluation index system of service quality is established by analyzing the service process from the perspective of customer satisfaction. Then, in order to eliminate the correction among indexes, the principal components of cumulative contribution rate over 85% are selected as the input of BP neural network model by principal component analysis. Further, by analyzing the principle of BP neural network model, a specific BP neural network topology is constructed. Finally, the BP neural network model is trained and simulated based on the data of passenger satisfaction questionnaire and compared with the evaluation results of traditional BP neural network model and SERVQUAL model. The results show that the proposed model is high, and the evaluation error is small which can well reflect the service quality of internet private hire vehicle and provide a theoretical basis to evaluate the service quality of internet private hire vehicle.

Keyword: urban traffic; service quality; principal component analysis; BP neural network model; internet private hire vehicle

网约车作为“ 互联网+交通” 环境下的新型出租车服务业态, 其健康运营对我国交通运输行业的发展具有重要意义.然而, 自网约车出现伊始, 社会各界对其监管制度便存在较大争议, 明确的网约车服务质量管理内涵难以形成, 导致行业缺乏科学的管理体系和评价依据[1].因此, 需要科学构建网约车服务质量评价体系.

国内外学者对于网约车服务质量评价的研究尚较少, 大多仍停留在对传统出租车服务质量的研究.Bruce Schaller讨论了出租车数量管制对其服务质量的影响, 提出取消出租车数量管制会造成出租车质量和驾驶人员质量下降, 进而导致出租车服务质量下降[2]; 文献[3]根据波尔图的出租汽车数据提出了一种基于出租汽车网络的出租汽车乘客需求预测模型, 从分析出租汽车乘客需求视角提出了提高出租车服务质量的策略.文献[4, 5]以杭州出租车为研究对象, 以有形性、保证性、可靠性和关怀性4个维度构建乘客服务质量评价指标体系, 同时根据 SERVPERF 模型结合区间估计法建立了服务质量的重要度-绩效分析矩阵; 文献[6]在基于马斯洛需求理论的基础上, 提出快速乘车、安全乘车、舒适乘车、满意乘车4个层面的城市出租车系统服务评价体系; 文献[7]根据网约车运营的特点, 基于乘客视角从有形性、可靠性、响应性、保证性、移情性5方面构建了网约车服务质量评价指标体系, 并应用SERVQUAL模型对网约车服务质量进行评价.

本文作者在分析网约车服务质量影响因素的基础上构建网约车服务质量评价体系, 利用主成分分

析法对原始样本进行特征提取以消除评价指标间的相关性, 选用BP神经网络模型对网约车服务质量进行评价, 以克服评价过程中的主观性和模糊性, 提高评价的客观性、准确性及科学性.

1 网约车服务质量评价指标体系
1.1 网约车服务过程

完整的网约车服务过程包括如图1所示的7个步骤.本文选取网约车服务的安全效度、时间效度、费用效度、可靠效度、移情性效度[8]5个维度, 构建网约车评价一级指标体系.其中安全效度评价乘客在乘车期间不受到损害的保障程度; 时间效度指乘客从发出网约车乘车需求到目的地的总用时是否存在用时浪费; 费用效度考量乘客花费的乘车费用是否经济、实惠, 在遇到违约情况下是否得到经济赔偿; 可靠效度检验网约车服务的诚信度, 是否存在爽约、拒载以及迟到或就地下客的情况; 移情性效度检验驾驶员是否设身处地为乘客着想.

图1 网约车服务过程Fig.1 Service process of internet private hire vehicle

1.2 评价指标体系

通过对网约车服务中5个维度的分析, 选取12项二级指标, 构建网约车服务质量评价体系, 见表1.

表1 网约车服务质量评价指标体系 Tab.1 Evaluation index system for service quality of internet private hire vehicle
1.3 样本数据的获取

为获得网约车服务质量评价样本数据, 采取网络问卷与纸质问卷并行的方式面向全国各地网约车用户及其行业专家进行了网约车服务质量满意度调研.本次问卷分为对用户基础信息的调查和问卷主体两部分, 根据表1, 采用“ 0~10” 分制调查用户对各评价指标的评分.本次调研共收集整理到192份有效问卷, 有效回收率为87.3%, 其中男性用户占48.2%, 女性用户占51.8%, 18~50岁用户占83.9%.

1.4 主成分提取

为使评价结果更科学、可靠, 根据主成分分析原理[9], 运用SPSS 20.0的主成分分析功能对原始样本数据进行特征值提取, 以消除指标之间的相关性.

1)样本数据标准化.原始指标体系之间存在量纲、数量级不同的问题, 首先对原始数据进行标准量化.由于原始指标都是正向指标(即得分越高表示服务质量越好), 因此均采用ri=(xi-ximin)/(ximax-ximin)对数据进行规范化处理.

2)主成分分析条件判断.由主成分分析结果可知各变量之间的相关系数大部分大于0.5, 说明各指标间相关性强; KMO检验统计量为0.79, 接近于1, Bartlett’ s球度检验的统计量数值为1 809.601, 小于显著水平.综上说明原始数据适合做主成分分析.

3)主成分分析结果.采用SPSS 20.0对评价指标数据进行主成分分析, 提取得到累计方差贡献率超过85%的前6个主成分[9].由表2主成分方差贡献率及表3因子定义得, 主成分X1贡献方差率为60.349%, 在c7~c12上载荷较大, 是反应时间效度、可靠效度和移情效度的重要指标; X2c1c4~c6上的载荷较大, 主要是反应费用效度的指标; 同样, X3, X5主要是反应费用效度的指标; X4主要是反应安全效度的指标; X6主要反应时间效度的指标.

表2 主成分特征值及方差贡献率 Tab.2 Eigenvalues of principal components and variance contribution rate
表3 因子载荷矩阵 Tab.3 Factor load matrix
2 基于主成分分析BP神经网络模型

BP神经网络模型优点在于可以处理大量数据且尤其适用于非线性问题[10].考虑到网约车服务质量评价是一个非线性问题且涉及到的评价指标较多、评价数据复杂.因此, 本文选择BP神经网络模型求解网约车服务质量评价问题.

2.1 BP神经网络模型训练样本及检验样本确定

由主成分分析原理[9]可知, 主成分Xi与原评价指标c1, c2, …, c12之间的关系为

Xi=li1c1+li2c2+li3c3+li4c4+li5c5+li6c6+li7c7+li8c8+li9c9+li10c10+li11c11+li12c12(1)

其中, lij(i, j=1, 2, 3, …, 6)表示第i个主成分在第j个指标上的载荷值, 如表3所示.

综上可得

X1=0.562c1+0.696c2+0.753c3+0.672c4+

0.678c5+0.675c6+0.864c7+0.887c8+

0.878c9+0.896c10+0.851c11+0.823c12,

X2=0.518c1+0.288c2+0.286c3+0.395c4+

0.369c5-0.306c6-0.207c7-0.184c8-

0.115c9-0.235c10-0.192c11-0.241c12,

X3=0.253c1-0.490c2-0.349c3+0.366c4+

0.141c5+0.396c6+0.085c7+0.035c8-

0.055c9+0.022c10-0.134c11-0.132c12,

X4=-0.516c1+0.002c2+0.198c3+0.074c4+

0.465c5+0.245c6-0.053c7-0.082c8-

0.106c9-0.09310+0.067c11+0.046c12,

X5=0.273c1-0.185c2+0.098c3-0.440c4+

0.244c5+0.132c6-0.148c7-0.059c8-

0.036c9-0.08610+0.162c11+0.113c12,

X6=0.093c1+0.246c2+0.134c3-0.104c4-

0.233c5+0.440c6+0.025c7-0.098c8+

0.058c9-0.09610-0.180c11-0.170c12 (2)

将标准化后的评价样本数据代入式(2)得到主成分X1, X2, …, X6的样本数据, 即BP神经网络模型输入, 见表4.由1.3节中所述, 调查共得到192份有效数据, 本文选取其中180份作为BP神经网络模型训练样本, 12份作为模型检验样本.

表4 BP神经网络模型样本数据 Tab.4 Sample data of BP neural network model
2.2 BP神经网络建模

BP神经网络由输入层、输出层及隐含层组成.通过比较期望输出与实际输出之间的误差值达到模型的训练目的, 若训练样本的误差均达到允许范围, 则学习过程结束; 否则, 进行网络的反向传递, 修改网络之间的连接权重, 最后实现网络输出与期望输出误差最小.据调查[11], 3层BP神经网络模型即可解决大部分评价问题, 过高的层数反而会影响模型的精度.因此, 本文采用3层神经网络模型求解进行网约车服务质量评价.

1)网络输入层即为6个主成分, 因此确定输入层节点为6; 2)网络输出关注每个样本最终的整体评价结果, 因此输出节点数设置为1; 3)学习函数选择.常用于BP神经网络模型的传递函数有logsig、tansig和purelin.研究表明[12]:对于一个3层神经网络模型, 使用“ logsig+purelin” 作为传递函数就能对任意连续有界的函数进行模拟.因此, 本文选取logsig作为输入层及隐含层的传递函数, purelin作为隐含层及输出层的传递函数.Matlab中常用的训练函数有[13]TRAINGLM, TRAINGDX, TRAINGDA, TRAINGD.为了选取合适的训练函数, 本文通过输入训练样本, 设定参数为:6个输入神经元、9个隐含神经元、1个输出神经元、最大训练次数为2 000次、训练精度为0.01, 比较不同算法的训练结果以选取最优的训练函数.如表5所示, 通过多次训练, TRAINGLM仅通过23次迭代精度达到0.009 938 6, 其无论在迭代效率或迭代精度上均优于其他函数, 因此, 选取TRAINGLM为BP神经网络的训练函数.

4)隐含层神经元数的计算还没有确定的公式, 大多采用理论推导和试错结合的方法选择的合适的节点数[14], 在此基础上加上一个常量.具体如下:

①隐含层节点数范围确定.

a=I+J2LI+J+c=b(3)

式中:I表示输入层节点数; J输出层节点数; L表示隐含层节点数; c为1~10间的常数, 本文中I=6, J=1, 则通过计算可得L在4~12之间.

②试错比较.

g1=0.618·(b-a)+ag2=0.382·(b-a)+a(4)a', b'=a, g1, E(g1)> E(g2)g1, b, E(g1)< E(g2)g1, g2, E(g1)=E(g2)(5)

式中:E(g1)、E(g2)表示g1g2的均方差.

③不断重复②中的步骤, 直到无法得到更小的g1g2为止.最后选取

E(L)=minE(a), E(g1), E(g2), E(a'), E(b'), (6)

L即为最终的理想隐含层节点数, 求解步骤结束.

表5 各训练函数训练效果对比 Tab.5 Performance comparison of different training function

表6所示, 通过输入训练样本, 使用Matlab循环模式对网络进行训练, 设置最高训练的次数为2 000次, 目标精度设定为 0.01, 可得9个BP神经网络训练模型中, 当隐含层数为10时, 无论是在迭代效率或是训练精度中均优于其他网络, 因此确定隐含层节点数为10.

表6 不同隐含节点网络训练效率对比 Tab.6 Performance comparison of different hidden layer nodes network
2.3 训练结果

将180份训练样本输入构建好的BP神经网络拓扑结构, 由图2所示, 训练5步后, 网络训练精度达到0.0 073 438, 下降到目标值0.01.如图3所示, 网络训练输出结果曲线与期望输出曲线基本一致.

图2 训练精度曲线Fig.2 Precision curves of training

通过计算, 180份训练样本中网络输出与期望输出的误差在0.04%~4.79%之间, 训练结果较好.

图3 网络输出与期望输出对比Fig.3 Comparison of network output and expected output

2.4 模型仿真及结果分析

为探究模型的适应性, 对剩余12份检验样本进行仿真评价.对比表7中12份检验样本在不同评价模型下的结果可知, 3种评价模型中, 本文模型评价结果相对误差在0.01%~4.20%, 误差最小.12份样本中本文模型评价误差均小于SERVQUAL模型, 有效克服了SERVQUAL模型评价指标权重难以确定, 随着样本的增大误差增大的缺点[15]; 同时, 本文模型在收敛速度及模型精度上均优于传统BP神经网络模型, 即进行主成分提取后的BP神经网络模型能提高传统BP神经网络模型的收敛效率, 降低由原有评价指标间的耦合性带来的对模型评价精度的影响, 使评价结果更为科学、可靠.

表7 不同模型评价结果 Tab.7 Evaluation results of different models
3 结论

1)从顾客满意度出发, 建立网约车服务质量评价指标体系.为消除指标间的耦合性, 利用主成分分析法将原有指标变为6个互不相关的综合指标.构建了合理的BP神经网络拓扑结构, 并利用调研数据对网约车服务质量进行评价分析.通过与传统BP神经网络模型及SERVQUAL模型对比可知, 本文构建模型能够有效提高传统BP神经网络模型的收敛效率及运算精度, 评价结果更为科学、可靠, 能为实际网约车服务质量评价提供有效依据.

2)我国的网约车监管制度在不同地区采取不同的管理措施, 而本文选取了来自全国各地网约车专家及用户对网约车服务质量的打分数据作为训练样本及检验样本, 忽略了政策影响下用户感知网约车服务质量的差异性对评价结果的影响, 下一步将对不同政策影响下的网约车服务质量进行评价分析.

The authors have declared that no competing interests exist.

参考文献
[1] 侯登华. 网约车规制路径比较研究[J]. 北京科技大学学报(社会科学版), 2015, 31(6): 96-103.
HOU Denghua. Legitimacy and supervision system of Internet private hire vehicles[J]. Journal of University of Science and Technology Beijing (Social Sciences Edition), 2015, 31(6): 96-103. (in Chinese) [本文引用:1]
[2] 薛志远. 网约车数量管制问题研究[J]. 理论与改革, 2016, 29(6): 108-114.
XUE Zhiyuan. Research on regulating amount of internet private hire vehicles[J]. Theory and Reform, 2016, 29(6): 108-114. (in Chinese) [本文引用:1]
[3] MOREIRA-MATIAS L, GAMA J, FERREIRA M, et al. A predictive model for the passenger demand on a taxi network[C] // IEEE Conference on Intelligent Transportation Systems, 2012: 1014-1019. [本文引用:1]
[4] 姚志刚. 客运出租汽车服务质量的重要度-绩效分析[J]. 交通运输系统工程与信息, 2011, 11(5): 181-186.
YAO Zhigang. Importance-performance analysis of taxi service quality[J]. Journal of Transportation Systems Engineering and Information Technology, 2011, 11(5): 181-186. (in Chinese) [本文引用:1]
[5] 姚志刚, 裘爱红, 袁球明, . 城市出租汽车客运服务质量的乘客感知特性分析[J]. 长安大学学报(社会科学版), 2011, 13(2): 35-39.
YAO Zhigang, QIU Aihong, YUAN Qiuming, et al. Characteristics of passengers’ perception of taxi service quality[J]. Journal of Chang’ an University (Social Science Edition), 2011, 13(2): 35-39. (in Chinese) [本文引用:1]
[6] 张绍阳, 焦红红, 赵文义, . 面向出行者的城市出租汽车服务水平评价体系及指标计算[J]. 中国公路学报, 2013, 26(5): 148-158.
ZHANG Shaoyang, JIAO Honghong, ZHAO Wenyi, et al. Traveler-oriented service level evaluation system for urban taxis and its indexes calculation[J]. China Journal of Highway and Transport, 2013, 26(5): 148-158. (in Chinese) [本文引用:1]
[7] 任其亮, 王磊. 网约车服务质量评价研究[J]. 公路与汽运, 2017, 33(2): 44-49.
RENG Qiliang, WANG Lei. Research on service quality evaluation of internet private hire vehicles[J]. Highways & Automotive Applications, 2017, 33(2): 44-49. (in Chinese) [本文引用:1]
[8] 李春丽. 顾客满意度指数测评研究[D]. 呼和浩特: 内蒙古工业大学, 2005.
LI Chunli. A study of testing and assessing about customer satisfaction index[D]. Hohhut: Inner Mongolia University of Technology, 2005. (in Chinese) [本文引用:1]
[9] 罗志忠, 张丰焰. 主成分分析法在公路网节点重要度指标权重分析中的应用[J]. 交通运输系统工程与信息, 2005, 5(6): 78-81.
LUO Zhizhong, ZHANG Fengyan. Application of principal component analysis method in calculating the weights of the indexes of the highway nodes’ importance[J]. Journal of Transportation Systems Engineering and Information Technology, 2005, 5(6): 78-81. (in Chinese) [本文引用:3]
[10] 聂昌成. 基于多元数据的出租车信息化服务质量评价研究[D]. 西安: 长安大学, 2016.
NIE Changcheng. Research on evaluation of taxi informatization service quality based on multivariate data[D]. Xi’an: Chang’an University, 2016. (in Chinese) [本文引用:1]
[11] 王永骥, 涂键. 神经元网络控制[M]. 北京: 机械工程出版社, 1998.
WANG Yongji, TU Jian. Neuron network control[M]. Beijing: Mechanical Engineering Press, 1998. (in Chinese) [本文引用:1]
[12] 张文鸽, 吴泽宁, 逯洪波. BP神经网络的改进及其应用[J]. 河南科学, 2003, 21(2): 2-6.
ZHANG Wenge, WU Zening, LU Hongbo. Improvement and application to BP neural network[J]. HENAN Science, 2003, 21(2): 2-6. (in Chinese) [本文引用:1]
[13] ROBERT L, JULES T, JACQUES L. Process modeling with neural networks using small experimental datasets[J]. Computers & Chemical Engineering, 1999, 23(9): 1167-1176. [本文引用:1]
[14] 杨国元, 史天运, 张秋亮. 基于BP神经网络的铁路客运服务质量评价研究[J]. 交通运输系统工程与信息, 2016, 16(5): 33-39.
YANG Guoyuan, SHI Tianyun, ZHANG Qiuliang. Railway passenger service quality evaluation based on BP neural network[J]. Journal of Transportation Systems Engineering and Information Technology, 2016, 16(5): 33-39. (in Chinese) [本文引用:1]
[15] 李鹏. 服务质量评价SERVQUAL模型比较及其修正[J]. 统计与决策, 2007, 23(21): 33-35.
LI Peng. Comparison and correction of service quality evaluation models[J]. Statistics & Decision, 2007, 23(21): 33-35. (in Chinese) [本文引用:1]