基于极限梯度提升算法和特征筛选方法的羊角月牙藻(Selenastrum capricornutum)急性毒性定量构效关系(QSAR)模型的建立与应用
其他题名Development and Application of Quantitative Structure-activity Relationship (QSAR) Model for Acute Toxicity of Selenastrum capricornutum Based on Extreme Gradient Boosting Algorithm and Feature Selection Method
滕跃发1,2,3; 王晓晴1,2,3; 李斐1,3; 吉成龙1,3; 吴惠丰1,3
发表期刊生态毒理学报
ISSN1673-5897
2023
卷号18期号:3页码:33-46
关键词多环芳烃 羊角月牙藻 定量构效关系 机器学习 极限梯度提升 特征筛选
英文摘要Algae as the main primary producers in aquatic food webs play an important role in ensuring the sustainability of aquatic ecosystems.However,a large number of chemicals have been released into the aquatic environment with the development of industrial production and countless other human activities,posing a great threat to algae.If algae are endangered,they will inevitably affect other aquatic organisms.Therefore,it is imperative to assess environmental toxicity on algae.The assessment requires a large amount of toxicity data through experimental measurements,which is costly and time consuming.Quantitative structure activity relationships (QSAR) is a good alternative method to solve these problems.In this study,QSAR models for the acute toxicity of Selenastrum capricornutum were constructed by using the extreme gradient boosting (XGB) algorithm and feature selection method.53 acute toxicity data were gathered from Web of Science and China National Knowledge Infrastructure.The optimal model achieved a coefficient of determination (R_(TR)~2) of 0.97 for training set,a coefficient of determination(Q_(EXT)~2) of 0.78 for validation set,and a leave-one-out cross-validation coefficient (Q_(LOO)~2) of 0.51,respectively.In addition,the results showed that the topological charge number,total atomic number and electronegativity of the compounds were the key factors affecting the acute toxicity of Selenastrum capricornutum.On this basis,the established QSAR model and EPI Suite were used to predict the acute toxicity of 16 typical polycyclic aromatic hydrocarbons(PAHs) to algae,respectively.This study provides an efficient predictive tool for obtaining acute toxicity data of algae and helps to accelerate environmental risk assessment of algae.
中文摘要藻类是水生食物网中主要的初级生产者,对水生生态系统的可持续性起着重要作用。随着社会发展、工业进步和人类活动,大量化学品被释放到水生环境中,对藻类产生了极大的威胁。若藻类受到危害势必会影响其他水生生物,因此有必要开展藻类的毒性评估。藻类的毒性评估需要大量的毒性数据,通过实验的方法获得水生毒性数据成本较高且比较耗时,定量构效关系(QSAR)是解决这类问题的一种良好的替代方法。本研究基于Web of Science与中国知网数据库文献中的53条急性毒性数据,利用极限梯度提升(XGB)算法和特征筛选方法建立了羊角月牙藻(Selenastrum capricornutum)急性毒性的QSAR模型。最优模型的训练集决定系数(R^(2)_(TR))达到了0.97,验证集决定系数(Q^(2)_(EXT))达到了0.78,留一法交叉验证系数(Q^(2)_(LOO))也达到了0.51,表明建立的QSAR模型具有较好的拟合优度、稳健性和预测能力。机理解释结果表明,化合物的拓扑电荷数、总原子序数和电负性是影响羊角月牙藻急性毒性的关键因素。在此基础上,采用建立的QSAR模型和EPI Suite分别预测了16种典型多环芳烃(PAHs)对藻类的急性毒性,并对其进行了毒性分级。研究结果为藻类的急性毒性数据的获取提供了一个高效预测工具,有利于加快化学品的水环境风险评估工作。
文章类型期刊论文
收录类别CSCD
语种中文
CSCD记录号CSCD:7523173
引用统计
文献类型期刊论文
条目标识符http://ir.yic.ac.cn/handle/133337/34196
专题中国科学院海岸带环境过程与生态修复重点实验室
中国科学院海岸带环境过程与生态修复重点实验室_海岸带环境过程实验室
作者单位1.中国科学院海岸带环境过程与生态修复重点实验室(烟台海岸带研究所),山东省海岸带环境过程重点实验室,中国科学院烟台海岸带研究所,烟台264003;
2.中国科学院大学,北京100049;
3.中国科学院海洋大科学中心,青岛266071
推荐引用方式
GB/T 7714
滕跃发,王晓晴,李斐,等. 基于极限梯度提升算法和特征筛选方法的羊角月牙藻(Selenastrum capricornutum)急性毒性定量构效关系(QSAR)模型的建立与应用[J]. 生态毒理学报,2023,18(3):33-46.
APA 滕跃发,王晓晴,李斐,吉成龙,&吴惠丰.(2023).基于极限梯度提升算法和特征筛选方法的羊角月牙藻(Selenastrum capricornutum)急性毒性定量构效关系(QSAR)模型的建立与应用.生态毒理学报,18(3),33-46.
MLA 滕跃发,et al."基于极限梯度提升算法和特征筛选方法的羊角月牙藻(Selenastrum capricornutum)急性毒性定量构效关系(QSAR)模型的建立与应用".生态毒理学报 18.3(2023):33-46.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[滕跃发]的文章
[王晓晴]的文章
[李斐]的文章
百度学术
百度学术中相似的文章
[滕跃发]的文章
[王晓晴]的文章
[李斐]的文章
必应学术
必应学术中相似的文章
[滕跃发]的文章
[王晓晴]的文章
[李斐]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。