基金项目:中国建筑科学研究院有限公司青年科研基金资助项目(20161602331030048); 国家自然科学基金资助项目(51508520); 河南省住房城乡建设科技计划资金资助项目(K-1817、K-1818、K1816、K-1940)
第一作者:李翔宇(1984-),男,博士,高级工程师.主要从事岩土工程及地下结构工程方面的研究.E-mail:leexiangyu@126.com
(1.建筑安全与环境国家重点实验室,北京 100013; 2.中国建筑科学研究院有限公司 地基基础研究所,北京 100013; 3.徐州工程学院 土木工程学院,江苏 徐州 221018; 4.郑州大学 土木工程学院,河南 郑州450001; 5.中铁十五局集团城市轨道交通工程有限公司,河南 洛阳 471499; 6.新华通讯社机关事务管理局,北京 100803)
(1.State Key Laboratory of Building Safety and Built Environment,Beijing 100013,China;2.Institute of Foundation Engineering,China Academy of Building Research,Beijing 100013,China;3.School of Civil Engineering,Xuzhou Institute of Technology,Xuzhou 221018,China;4.School of Civil Engineering,Zhengzhou University,Zhengzhou 450001,China;5.Urban Rail Transit Engineering Company Limited of China Railway 15th Bureau,Luoyang 471499,China;6.Government Offices Administration,Xinhua News Agency,Beijing 100803,China)
shield tunnel; prediction model of the long-term subsidence; GA-BP neural network model; PSO-BP neural network model; empirical curve model
DOI: 10.15986/j.1006-7930.2021.02.006
盾构法是在地面下暗挖隧道的一种施工方法,可以有效控制施工对周围环境影响,在城市地铁施工中得到了广泛应用[1].在盾构隧道施工结束后,周围土体因受到扰动存在大量潜在的变形,而且运营期间隧道也会受地铁线路周围工程地质条件变化和人类活动等因素的影响,致使盾构隧道发生长期沉降,其中,建设在软弱、高压缩性土体中的隧道沉降最为显著[2-3].运营隧道的沉降实测数据综合反映了隧道在多种因素共同作用下的变形情况,基于隧道沉降实测数据,选取合理的预测模型,来推算隧道沉降规律,是研究隧道沉降预测的重要方法[4].目前,对地铁隧道长期沉降的预测研究还比较少,主要从经验曲线模型、灰色系统理论、BP神经网络模型等方法进行研究.李明宇(2011)[5]采用函数g=ae-lgt/b+c对隧道长期变形规律进行了分析.余腾等(2017)[6]基于南京地铁二号线部分区间沉降监测数据,采用GM(1,1)灰色模型对轨行区沉降进行预测研究.但曲线模型需要较多原始速度,且收敛速度较慢,灰色预测模型所需参数较少,但预测结果精度较低.朱伟刚等[7]、乔金丽等[8]采用BP神经网络对长春地铁2号线、广州地铁2号线的地表沉降进行了预测,取得了较好的成果.影响隧道长期沉降的因素具有很大的模糊性和随机性,BP神经网络由于其独特的联结结构和并行信息处理方法,具有良好的非线性映射能力、自学习功能和较高的鲁棒性,可以对现有的沉降数据进行自我学习,并将学习结果存储在神经元的阀值和神经元间的连接权值中,具有良好的自适应性和容错性,因此,对于隧道长期沉降预测问题具有一定的适用性.近年来,随着对BP神经网络研究的进一步深入,其收敛速度慢、多个局部最小点、隐含层节点不确定性等固有缺陷对其实际应用带来了很大的阻碍[9].因此,如何优化人工神经网络以克服其缺点已成为人工神经网络研究的热点之一.
本文将基于上海地铁二号线的实测沉降数据,利用遗传算法(GA)和粒子群算法(PSO)对BP网络进行优化,从而建立GA-BP和PSO-BP神经网络预测模型,并通过对比多种模型方法的预测结果,探讨其中最优的隧道长期沉降预测模型.
BP(Back Propagation)神经网络是由Rumelhart和McCelland等人在1986年提出的,该神经网络在多层神经网络模型的基础上加入了误差反向传播学习算法,该算法的基本思想主要为梯度下降法,即在网络学习过程中,使网络的输出与期望输出的误差在向后传播的同时修正连接权值,以实现其误差均方值最小,从而解决多层前向神经网络的学习问题.
为了实现更好地拟合与预测地铁隧道长期沉降,对BP神经网络的缺陷进行优化十分必要.在优化过程中应重点解决以下两个问题:一是要求寻找全局最优点,二是要求有较高的收敛速度.本文分别采用遗传算法和粒子群算法对BP神经网络进行优化,下面将对这两种算法的原理和工作流程进行介绍.
遗传算法(Genetic Algorithm,简称GA)是1962年由美国Michigan大学Holland教授提出的,其借鉴自然界遗传机制和生物进化论思想,是一种启发式群体概率性迭代优化方法.GA算法将问题的求解转化成了“染色体”适者生存的过程,“染色体”群体通过选择、交叉和变异等遗传操作不断迭代进化,最终收敛到“最适应环境”的个体,求得问题的最优解[10].遗传算法具有简单实用、自适应性好、并行处理及全局寻优能力强、不易陷入局部最优解等优点,但也存在个体容易早熟等缺点.图1描述了遗传算法的基本流程[11-12].
图1 遗传算法的工作流程图[11-12]
Fig.1 Work flow chart of GA
粒子群算法(Particle Swarm Optimizationm,简称PSO)是1995年由Eberhart和Kennedy提出的一种基于种群的随机迭代算法[13-14].该算法受鸟群觅食行为的启发,假设一个由m个粒子组成的群体在D维搜索空间中以一定的速度飞行[15],每个粒子在搜索时,根据自己搜索到的历史上的最优位置和在整个群体的历史最优位置对其位置和速度进行变化,以尽快到达全空间最优位置附近.PSO算法保留了基于种群的全局搜索策略,具有计算简单、高效等优点[16].PSO算法中粒子位置在每一代的更新方式可用图2来描述[17-18].
遗传算法(GA)和粒子群算法(PSO)作为优化算法,具有很多相同点[17]:它们都力图在自然特性的基础上模拟个体种群的适应性; 都属于全局优化方法,采用一定的变换规则求解; 都通过随机优化方法更新种群和搜索最优点; 搜索过程都是从问题解的一个集合开始,具有隐含并行搜索特性; 都根据个体的适配信息进行搜索,均不受函数约束条件的限制等.
同时,GA算法和PSO算法也存在很大的不同,具体如下:
图2 粒子位置更新示意图[17-18]
Fig.2 Schematic diagram of particle position update
(1)PSO算法相对于GA算法,不但具有全局寻优能力,而且具有较强的局部寻优能力.
(2)PSO算法具有记忆性,所有粒子保存以前较优的知识; 而GA算法没有记忆性,随着种群的改变以前的知识会被破坏.
(3)GA算法中需要编码和遗传操作,较为复杂,而PSO算法中的粒子通过自己的速度和位置进行更新,参数较少,一般情况下收敛速度也要快于GA算法.
(4)两者共享机制不同.在GA算法中,染色体之间相互共享信息,使得整个种群都向最优区域移动; 而PSO算法中的粒子仅通过当前搜索到最优点进行共享信息,属于单项信息共享机制.
通过把遗传算法和BP神经网络相结合,利用遗传算法中的选择、交叉、变异等操作寻找最优的BP神经网络初始权值与阀值,再由BP算法进行训练,从而建立基于遗传算法优化BP神经网络(简称GA-BP神经网络),以期克服传统BP神经网络的缺点,获得较快的收敛速度和较高的预测精度.
GA-BP神经网络的基本流程[12]具体如下:
①种群初始化,即:首先确定BP神经网络结构,通过对其权值和阈值编码得到遗传算法的初始种群.
②根据个体的进化不断更新BP神经网络的初始权值和阀值,用实测数据训练BP神经网络后预测输出,将式(1)所示均方误差函数作为适应度函数,计算每个个体的适应度,并判断是否符合优化标准.如果符合,则转向③.如不符合,则按适应度对个体进行选择、交叉、变异操作,产生新的个体,重新进行适应度判断,直至符合.
式中,M为测试样本总数; m=1,2,…,M; ym为测试样本真实值,(^overy)m为测试样本预测值.
③将以上得到的最优个体按顺序拆分,作为BP神经网络的初始权值和阈值.
④进行BP神经网络的前向传播,计算全局误差,并判断是否符合要求,如果符合,则结束网络的学习.如果不符合,则进行BP神经网络的反向传播,更新权值和阀值后重新进行前向传播和误差判断,直至符合.
粒子群算法具有收敛速度快、鲁棒性高、全局搜索能力强等特点,本节将建立粒子群算法优化的BP神经网络(简称PSO-BP神经网络).主要构建思路为:首先把BP神经网络的权值和阈值转换为粒子的维度,之后采用误差函数或预测准确率作为粒子的适应度定义,通过PSO算法迭代得到最优的权值和阀值,之后赋予BP神经网络进行预测,以期改善传统BP神经网络对初始权值过于敏感以及容易陷入局部极小值等不足.
PSO-BP神经网络的工作流程[19]具体如下:
①初始化.初始化BP神经网络结构,包括设定网络的输入层、隐含层、输出层的神经元个数和学习率参数等; 初始化粒子群,包括粒子的规模M及每个粒子的位置向量xi及速度向量vi、每个粒子的个体极值pi和全局最优值pg、迭代误差精度ε、加速度因子c1和c2、最大惯性权重wmax、最小惯性权重wmin、最大速度vmax、最大位置xmax及最大迭代次数K等.
②利用式(2)更新每个粒子的速度,限制在区间[-vmax,vmax]中; 利用式(3)更新每个粒子的位置,限制在区间[-xmax,xmax]中.
式中,i=1,2,…,m; d=1,2,…,D; k表示第k次迭代; c1和c2为加速度因子,为非负常数; r1和r2为[0,1]上均匀分布的随机数; wi为惯性权重,调整大小可改变搜索能力的强弱.
③利用下式(4)计算各个粒子的适应度值,为
其中,N是训练集的样本数,Tij是第i个样本的第j个网络输出节点的理想输出值,Oij是第i个样本的第j个网络输出节点的实际输出值.
④计算粒子群的全局最小适应值fg=min(f1,f2,…,fN); 若当前迭代次数达到最大迭代次数或网络的训练误差达到精度要求(f<ε),则迭代停止,转到步骤⑤; 否则,计算各个粒子的个体极值pi和全局极值pg位置,转到②继续更新粒子的速度和位置.
⑤输出全局极值pg的位置所确定的网络权值和阀值,代入BP神经网络求出预测值,最后得出与实际值的误差平方和.
按照1.2节基本流程,本文建立了基于GA-BP神经网络的隧道沉降预测模型,并采用MATLAB软件编写了相关程序以方便预测计算.
由对运营地铁隧道实测沉降数据的研究可知[5],地铁隧道沉降表现出与地面沉降趋于一致的变形规律,而且对地面沉降的观测较为方便,数据也较为容易采集.因此本文将地面沉降和监测时间作为输入参数,以隧道沉降值作为输出参数,建立了多参数GA-BP神经网络模型,同时也建立了以时间为输入参数的单参数GA-BP神经网络作为对比.
本文采用上述建立的两种遗传算法优化BP神经网络模型对上海地铁二号线隧道测点S2205(里程1.3 km)的长期沉降数据进行预测分析.分析过程中,以第1~11样本作为输入数据,以第12~18样本作为输出数据.首先以第12~16个样本作为输出数据,对其进行预测试算,不断对神经网络模型的参数进行调整,经过多次验算得到了较为合理的网络参数.其中,遗传算法对应的运行参数为:初始种群为20,交叉概率0.8,变异概率0.05,进化代数为100; BP神经网络的运行参数为:学习速率为0.05,训练误差精度为0.000 1.通过预测计算得到试算值(12~16)和外推预测值(17~18),见表1.图3是以表1中的实测值和模型输出值为纵坐标,以监测时间为横坐标绘制的预测结果对比图.
从图3中可以看出,由单参数输入GA-BP和多参数输入GA-BP两种神经网络预测模型对测点S2205第1 613天~2 708天(第12~18个数据样本)的沉降预测结果均与现场实测值非常接近,且相比而言,多参数模型的预测精度较高.以第2 708天的预测结果为例,多参数与单参数两种模型预测的相对误差分别为0.4%和1.3%,可见效果是令人满意的.以上结果也说明,如果缺乏地面沉降数据,使用单参数模型进行预测也能保证预测的准确性.
图3 基于GA-BP神经网络的测点S2205长期沉降预测
Fig.3 Long-term settlement prediction of S2205 based on GA-BP neural network
根据1.3节工作流程,本文采用MATLAB软件编写了单参数输入和多参数输入两种PSO-BP神经网络预测模型的程序.其中,第一种网络模型输入层的两个节点为测量时间和隧道测点对应的地面沉降值,输出层为隧道的沉降值; 第二种网络模型输入层则只有测量时间1个节点.本文采用以上两种神经网络预测模型程序对隧道测点S2205(里程1.3 km)的长期沉降数据进行了预测研究.分析过程中,以第1~11样本作为输入数据,以第12~18样本作为输出数据.首先通过对第12~16个样本的预测试算获得了神经网络模型的具体参数(其中,PSO算法的运行参数为:初始粒子群规模为20个,进化次数为500,加速度因子c1=c2=1.9; BP神经网络运行参数为:学习速率为0.05,训练误差精度为0.000 1),之后利用以上模型对第2 557天和2 708天的隧道沉降进行了预测,具体结果见表2和图4.从图表中可以发现,采用PSO-BP神经网络预测模型对测点S2205第1 613天~2 708天(第12~18个数据样本)的隧道沉降进行预测得到的结果与实测值基本一致,多参数模型预测的精度和稳定性要优于单参数预测模型,且程序运行的速度要快于GA-BP神经网络模型.因此可以认为,采用PSO算法优化BP神经网络的连接权值和阀值,不仅发挥了神经网络的泛化能力,提高了神经网络的收敛速度和学习能力,而且也克服了传统BP神经网络易陷局部最优解的缺点.
表2 地铁二号线测点S2205沉降预测模型输出值与实测值
Tab.2 PSO-BP prediction model output values and the measured values of S2205 of metro line 2
由前文分析可知,通过遗传算法和粒子群算法优化BP神经网络的参数而形成的GA-BP和PSO-BP神经网络适应于预测盾构隧道的长期沉降问题,且随着监测数据的更新与增加,预测模型的可靠性也会不断提高.除了以上两种优化神经网络外,本节还基于相同的学习样本研究了传统BP神经网络和双曲线经验模型的预测效果,之后通过综合对比分析,探讨最适合的隧道长期沉降预测模型.
为了方便分析四种预测模型的准确性,本文将采用绝对误差(AE)、相对误差(RE)、平均绝对误差(MAE)和平均相对误差(MAPE)来评价预测的效果.它们的计算公式分别见式(4)~式(7),其中MAPE能真实地反映预测精度,是比较不同条件下误差大小的一个较优指标,预测精度设为A(A=1-MAPE).
式中,yi为实测沉降值,Yi为预测沉降值,N为待预测的沉降测点数.
表3显示了不同预测模型的相对误差和绝对误差,表4为不同预测模型的精度对比情况,图5为四种模型外推预测结果的对比示意图.综合分析上述图表可以得到以下结论:
(1)采用PSO-BP神经网络模型对7个检验样本预测的平均绝对误差为-0.04 mm,平均相对误差为0.31%; GA-BP神经网络模型得到的平均绝对误差为0.23 mm,平均相对误差为0.76%; 而BP神经网络的两种误差分别为-0.66 mm和1.50%.可见优化后BP神经网络的预测精度有了很大的提高,预测效果均优于原BP神经网络.四类模型中经验曲线模型预测误差最大,PSO-BP神经网络模型误差最小,这说明基于同样的训练样本和神经网络参数,PSO-BP神经网络模型的预测能力最优; 同时,在使用MATLAB程序运算过程中,优化后BP神经网络的收敛速度和运行时间均快于传统BP神经网络,而且PSO-BP神经网络明显快于GA-BP神经网络.
(2)双曲线经验模型拟合得到的结果误差最大,预测精度只有95.39%,明显低于神经网络模型的预测结果.由此可见,曲线经验模型可用于对隧道沉降进行粗略的估算,当进行较为精确的预测时应采用神经网络模型.主要原因是,运营地铁隧道的长期沉降规律复杂多变,采用公式简单、参数很少的经验曲线模型很难对其进行精准地拟合,而神经网络模型通过对实测数据样本的训练,能够自动修正网络参数以实现对隧道长期变形特性较好的非线性映射.
图5 不同预测模型对测点S2205沉降外推预测对比
Fig.5 Comparison of extrapolation prediction of S2205 by different prediction models
通过以上分析可以发现,本文建立的GA-BP和PSO-BP神经网络克服了传统BP神经网络存在的收敛速度慢、易陷入局部极小点等缺点,据此建立的预测模型对盾构隧道长期沉降具有很高的预测精度.其中,PSO-BP神经网络模型的预测效果最佳,运算速度最快,是本文介绍的四种模型中最为适用的隧道长期沉降预测模型.
隧道变形的稳定可控是地铁安全运营的重要保障之一,建立一种高精度、简便实用的隧道长期沉降预测模型,以实现对隧道未来变形的科学预报.本文利用遗传算法和粒子群算法对BP神经网络进行优化建立了GA-BP和PSO-BP两种神经网络预测模型.之后根据已整理统计的上海地铁隧道沉降数据,分别采用BP神经网络、GA-BP神经网络、PSO-BP神经网络和双曲线经验模型对隧道的长期沉降进行了预测研究,并对比分析了各模型的优缺点和预测效果.研究发现,以上各模型的预测精度均超过了95%,其中双曲线经验模型的误差最大,而PSO-BP神经网络模型的预测精度最佳,且运算速度最快,是文中所提方法中最为适用的盾构隧道长期沉降预测模型.