发布时间:2025-05-06
近日,实验室主任康绍忠院士团队在《Computers and Electronics in Agriculture》在线发表了题为《Predicting stomatal conductance of chili peppers using TPE-optimized LightGBM and SHAP feature analysis based on UAVs’ hyperspectral, thermal infrared imagery, and meteorological data》的研究论文,介绍了在耦合多源异构遥感数据预测辣椒气孔导度方面取得最新进展。
研究摘要:
作为衡量植物气体交换能力的核心指标,气孔导度(Gs)直接决定了光合作用和蒸腾作用的效率,进而影响作物生长动态和产量形成过程。及时、准确地预测气孔导度对于优化水分管理策略、提升作物产量和品质具有重要意义。然而,气孔导度受环境因子与植物生理特性的交互作用影响,其变异性具有显著的时空异质性,这不仅对关键特征的筛选与预测精度的提升带来巨大挑战,也限制了模型决策过程的可解释性和可信度。为克服上述难题,本研究提出了一种辣椒气孔导度新型预测框架,该框架通过耦合随机森林特征选择方法与TPE-LightGBM模型,以提升气孔导度预测的稳定性与精确性。实验结果显示,在特征数量为15时,预测模型表现最优,决定系数(R²)为0.862,均方根误差(RMSE)为0.037 mol/(m²·s),平均绝对误差(MAE)为0.029 mol/(m²·s)。借助SHAP分析方法,识别出光合有效辐射(PAR)、冠层温度(CT)和红边波段等关键影响因素,并进一步阐明了各关键因素与气孔导度之间的交互作用关系,增强了模型的可解释性与透明度。所提方法可为气孔导度的精准预测提供新思路,助力辣椒健康生长和水资源高效利用。
图1 气孔导度预测框架
主要研究结果:
(1)与互信息(MI)、连续投影算法(SPA)、递归特征消除(RFE)和LASSO回归等特征筛选技术相比,随机森林(RF)特征选择方法表现最优。结果表明,最优特征数量为15时,辣椒气孔导度预测精度最高。
(2)在与传统的随机搜索与网格搜索方法相比,基于贝叶斯优化的TPE(Tree-structured Parzen Estimator)策略能显著提升辣椒气孔导度预测性能。对比不同机器学习方法发现,TPE优化的LightGBM模型在辣椒气孔导度预测中表现最佳,决定系数为0.862,均方根误差为0.037 mol/(m²·s)。
(3)为增强模型的可解释性与决策透明度,引入SHAP值进行特征贡献度分析。结果表明,光合有效辐射(PAR)、冠层温度(CT)以及红边波段反射率是影响气孔导度变化的核心驱动因子。
图2 不同特征选择方法结果对比
图3 TPE优化LightGBM模型超参数过程
图4 气孔导度预测的空间分布图
图5 不同机器学习及超参数寻优方法对比。(a) TPE-RR, (b) TPE-PLSR, (c)TPE-RFR, (d) Random-LightGBM, (e) Grid-LightGBM, and (f) TPE-LightGBM
图6 关键特征重要性排序
中心博士后张海洋为论文第一作者,康绍忠教授和佟玲教授为通讯作者,中心博士生李雯雯、宋凡凡,硕士生王国龙、温兆琪,以及石河子大学硕士生张恒源共同参与了本研究工作。研究获得国家大宗蔬菜产业技术体系(CARS-23-B03)的资助。
原文链接:https://doi.org/https://doi.org/10.1016/j.compag.2025.110036