Journal of Hydrology:李博教授课题组 王浩、李博等 | 双流LSTM–XGBoost混合框架用于矿井涌水量预测——以龙凤煤矿为例

发布时间:2026-06-01阅读次数:10

近日,贵州大学喀斯特地质资源与环境教育部重点实验室李博教授课题组王浩李博等在国际水文顶级期刊Journal of Hydrology上发表研究成果,提出一种"过程信息驱动"的双流LSTM–XGBoost混合预测框架,以黔北金沙县龙凤煤矿为研究区,通过并行LSTM网络分别提取涌水量历史序列的时间特征和多源水文气象因素的时空特征,再以XGBoost元学习器融合静态地质属性,实现了高精度、可解释、不确定性量化的涌水量预报1

图1 双流LSTM–XGBoost方法框架

(1)预测精度优于各类基准模型。在该矿三年监测数据的测试集上,模型达到R² = 0.855RMSE = 23.65 m³/hMAPE = 5.82%NSE = 0.855的优异性能,远超TransformerR² = 0.574)、BiGRUR² = 0.667)等深度学习模型2,较优化的单流LSTM集成降低RMSE20.7%。消融实验表明,去除涌水量历史序列后RMSE劣化至45.64 m³/h,证实水动力持续性是可预测性的主要来源;双流设计仍在纯自回归基础上实现7.1%RMSE改善,且改进集中体现在峰值事件捕获上。

图2 各模型预测拟合曲线

(2)SHAP分析揭示"宏观均衡、微观集中"的特征贡献结构。特征流聚合层面,空间通路贡献40.2%,时间通路33.5%,静态地质通路26.4%。但在个体排名中,时间通路占据Top 3076.7%,空间通路仅占10%。这一"集体强、个体弱"的模式源于LSTM对多源变量的分布式混合编码——空间通路个体–集体放大因子高达192×,证实两个通路互补分工:时间通路捕捉惯性主导的"主旋律",空间通路识别外源扰动驱动的"偏差信号"

(3)不确定性量化为预测可靠性提供保障。基于Monte-Carlo Dropout的不确定性量化显示,名义95%预测区间下实际覆盖率高达97.24%;两次极端降水驱动的峰值事件中,观测值均落在预测区间上界以内(图3)。偶发不确定性占预测方差的87.5%,表明改进空间主要受系统固有随机性制约。残差近似正态分布且无自相关,确认模型已充分提取信号的时间结构。

图3 预测区间的预测结果

该研究为矿井水文预测提供了具有迁移潜力的方法论框架,其"过程信息驱动"的设计理念使特征贡献模式与地下水记忆效应和补给–排泄机制高度一致。研究进一步提出多矿区联邦验证、在线连续学习、物理信息耦合及不确定性感知预警界面四个未来方向。

论文信息:Wang Hao, Li Bo*, Zeng Yi Fan, Liu Pu, Chen Wei, Wang Ze Hui, Che Lu Lu. (2026). A dual-stream LSTM–XGBoost framework for mine water inflow forecasting: a case study of the Longfeng coal mine. Journal of Hydrology, 676, 135728.

论文链接:https://doi.org/10.1016/j.jhydrol.2026.135728