更全的杂志信息网

香水百合头香成分色谱保留指数的人工神经网络预测

更新时间:2009-03-28

百合(Lillum spp)是单子叶植物亚纲百合科(Liliaceae)百合属(Lilium)所有种类的总称,是多年生鳞茎类球根草本植物[1]。百合是中药中的常用药材,中医认为百合性微寒平,其花和鳞状茎均可入药,是一种既可以食用又可以药用的花卉,具有清火、润肺、安神的功效。百合种类繁多,有白、黄、红、橙、粉色及复色等多种色彩,香水百合素有“百合女王”之美称,其香气独特寓意美好,越来越受到人们的关注与青睐。曹慧等[1]采用固相微萃取(SPME)/气相色谱-质谱(GC-MS)联用技术对香水百合的头香成分化合物进行了分析,通过气相色谱保留指数与质谱相结合的方法,鉴定出芳樟醇、苯甲酸甲酯、月桂烯等35种化合物,采用多元线性回归(MLR)方法建立定量结构-色谱保留关系(Quantiative structure-retention relationships,QSRR)预测模型,取得了较满意的预测结果。本文在多元线性回归的基础上,用最佳变量子集回归得到最佳变量组合,建立了香水百合头香成分色谱保留指数的人工神经网络模型,并用模型对35个化合物的色谱保留指数进行预测,结果优于文献。

1 材料与方法

1.1 数据来源

香水百合头香成分中35个化合物的色谱保留值取自文献[1],列于表1。

这是一场气势恢宏的改革,这是一场司法领域触及灵魂的革命,新时代推进全面依法治国的壮丽图景由此增添了浓墨重彩的一笔。

 

表1 香水百合头香成分35个化合物的拓扑指数和色谱保留指数

  

化合物序号化合物名称X1E9M9M10RI文献[1]实验值本文计算值1α-侧柏烯7.1460.000-0.6080.00093193626-甲基-5-庚烯-2-酮6.4000.0000.0000.0009859863月桂烯6.9830.0000.0000.00098810044α-水芹烯7.0940.0000.0000.000100310295柠檬烯6.9830.0000.0000.000102710046(Z)-罗勒烯7.1460.0000.000-7.584103610467(E)-罗勒烯7.1460.0000.0000.0001050104681,3,8-对孟三烯6.7760.0000.0000.0001057106294-甲基苯酚4.7571.4990.0000.0001080108110γ-萜品油烯7.1990.0000.0000.0001083106311苯甲酸甲酯5.7030.5880.0000.0001094109112芳樟醇7.7230.0000.0000.0001097109813新别罗勒烯7.3090.0000.0000.00011261101142,6-二甲基-1,3,5,7-辛四烯6.7240.000-6.4400.00011281125151-苯基-1-丁烯6.9561.293-4.853-2.0511145114116苯甲酸乙酯6.4100.606-0.583-2.3271169117117萘5.6192.6210.0000.00011821182184-甲基-2-甲氧基苯酚6.0881.794-5.1890.0001187117819水杨酸甲酯6.0730.134-0.6080.0001190119120苯甲酸-1-甲基-乙酯7.2810.6030.0000.0001201123321反式香芹醇7.3010.0000.0000.0001205122822香叶醇7.7230.0000.0000.0001249125223水杨酸乙酯6.7800.1620.0000.00012671236

 

续表1

  

化合物序号化合物名称X1E9M9M10RI文献[1]实验值本文计算值24苯甲酸异丙酯7.9880.6140.000-7.5841325135025丁子香酚7.0791.7640.0000.0001350138226苯甲酸丁酯7.8250.6240.0000.0001371134927β-榄香烯10.4750.0000.0000.0001384139928异丁子香酚7.2421.6980.0000.0001400140929长叶烯10.4750.0000.0000.0001404137930异石竹烯10.4750.0000.0000.0001410139831α-古云烯10.6380.0000.0000.0001414146332α-雪松烯10.6380.000-6.4400.0001419141433(E)-2-甲氧基-4-(1-丙烯基)-苯酚7.2421.698-4.853-2.0511447140934δ-杜松烯10.6380.000-0.583-2.3271512148335雪松醇11.2150.0000.0000.00016041603

1.2 方法

1.2.1 拓扑指数计算

获取分子结构信息的分子结构表征(MSC)方法有很多,其中拓扑指数法以其计算简便、取值客观等优点而获得广泛应用。本文用到3种拓扑指数:分子连接性指数Xi[2]、电性拓扑状态指数Ej[3]和分子电性距离矢量Mk[4,5]。这3种拓扑指数反映了分子的连接状态、拓扑环境及电子结构信息,所以可以全面表征分子结构。

应用Chemoffice2005 软件中的Chem3D Ultra9.0软件,构建文献[1]中香水百合头香成分35个化合物的分子结构,采用Matlab软件中的自编程序[6,7]得到上述3种共153个拓扑指数。

1.2.2 变量筛选

F=100.083

1.2.3 人工神经网络模型建立

人工神经网络(Artificial neural network,ANN)利用计算机来模拟生物神经网络的某些机构和功能,具有强大的非线性处理能力、自组织协调和容错能力[8]。其中,著名的反向传播(Back propagation,BP)网络是Rumelhart等提出的前馈型神经计算模型和用于调节该模型神经元联结强度的误差往回传播学习算法。本文采用筛选出来的最佳变量组合作为BP网络输入层的结点,建立了色谱保留指数RI的神经网络模型。

2 结果与讨论

2.1 多元线性回归分析——变量的筛选

将香水百合头香成分的35种化合物的色谱保留指数与其相应的3种分子拓扑指数输入Minitab 软件系统,由最佳变量子集回归方法构建的定量构效关系见表2,其中的RR2SF分别为相关系数、判定系数、估计标准误差、Fischer检验值。同时引入Kubinyi函数[9],其计算公式为

中银香港首席经济学家,曾供职于中国银行总部国际金融研究室,负责港澳台地区。1997年金融危机期间,作为国务院政策研究室派出的5名官方考察人员之一,出访受金融危机影响的国家和地区。

 

(1)

式中:y为样本的个数,b为变量数,R为模型的相关系数。模型的稳定性和预测能力随着FIT值的增大而增大。

 

表2 RI与Xi,Ej,Mk的最佳变量子集回归结果

  

序号RR2SFFIT变量10.7190.518121.43035.4110.99X120.8750.76685.88452.3792.69X1,E930.9540.91153.895105.4267.21X1,E9,M1040.9650.93048.416100.0837.80X1,E9,M10,M950.9700.94045.50191.6457.57X1,E9,M10,M9,E3

父亲浇水穿的雨靴很特别,靴帮子足有70厘米高,这是父亲用卡车废弃内胎加高过的。浇冻水的时候,父亲先穿上母亲缝制的棉布靴,外面再穿上高腰雨靴,在田间接近零度的水中穿梭,打坝、豁水口子,防水效果特别好。但站在没过膝盖的渠水中打坝时,刺骨的渠水还是无情地灌进了父亲的雨靴中,浸湿了父亲的双腿。父亲的双腿经常被冻得通红,为此落下了畏寒的病根。

主桥钢箱钢桁组合梁斜拉桥跨度布置为(99.3+238+588+224+85.3)m,主梁上层为板桁结合,下层为钢箱结合钢桁梁,三角型桁架,两片主桁,上层主桁中心距33.8m,下层主桁中心距为38m,桁高15.0m,节间长度14m,大桥效果如图1所示。

RI=194.051+120.402 X1+105.737 E9+

28.191 M10+15.041M9

(2)

n=35 R=0.965 R2=0.930 S=48.420

将计算得到的分子拓扑指数设为自变量,35个化合物的色谱保留指数RI作为因变量,运用多元线性回归分析中的最佳变量子集回归方法对变量进行筛选,得到最佳的变量组合。

根据文献[12]建议规则寻找最佳隐蔽层的单元数H,即

2.2 变量检验

用变异膨胀因子(Variance inflation factors,VIF)[10]评价变量之间是否存在自相关性。当VIF=1,表明各自变量之间没有自相关性;当VIF<5时,表明变量之间不存在明显的自相关性,所建的模型具有一定的稳定性;当VIF>5时,表明变量间具有明显的共线性,所建模型的预测能力较差

 

(3)

式中:R2为自变量集中的某一变量与其余变量的判定系数。所选4个结构参数X1,E9,M10,M9VIF值分别为1.859、1.305、1.546和1.220,所有变量的VIF值均<5,甚至<2,说明变量之间不存在明显的自相关性,模型的稳定性较高。

2.3 人工神经网络预测模型建立

基于误差的反向传播算法的三层神经网络在定量构效关系研究中应用广泛。本研究采用Matlab软件提供的神经网络工具(Neural network toolbox,NNT)箱中的三层BP网络[11]来建立模型。

2.3.1 人工神经网络结构的确定

(1)输入层单元的确定

输出层单元即香水百合头香成分35个化合物的色谱保留指数RI;

(2)输出层单元的确定

输入层单元选择用多元线性回归所确定的4个最佳变量组合,即X1,E9,M9,M10;

第一是构建符合中国市场发展的管理会计理论体系。即要求能够融合大数据的中国特色的管理会计理论体系的构建。该理论内要求能够包含管理会计的基本理论内容,融进我国企业在互联网+、大数据发展过程中的管理会计实践内容,并且还要将企业的战略绩效管理、预算管理、成本管理、经营与投融资决策管理、风险管理以及环境管理等目标内容一起融入进去,并且实现管理会计的工具的导入,从而形成一种套有目标、有基础、有内容、有工具并且有报告内容的管理会计理论体系。

(3)隐蔽层单元节点的确定

本研究表明,HER-2的表达随着FIGO分期增高其阳性表达率逐渐增高,HER-2蛋白的表达与卵巢癌患者是否出现淋巴转移有关,出现淋巴结转移,其表达增高,提示其恶性程度高以及患者不良预后。但是其阳性表达与年龄、组织病理分化程度、临床病理类型无关。

2.2>ρ(=N/M)≥1.4

对于这段开关互市的历史,在辽东满族民众的记忆中也有记载和表现。最有代表性的就是在桓仁地区采录的《老杲子》[注]夏秋主编:《满族民间故事·辽东卷》上卷,辽宁民族出版社,2010年,第12页。,其内容如下:

(4)

式中:N,M分别是样本数和网络总权重,M被定义为

M=(I+1)H+(H+1)Q

从表2可以看出,FIT4>FIT5>FIT3>FIT2>FIT1,故X1,E9,M9,M10为最佳变量组合,所得四元QSRR预测模型为

(5)

式中:I,H,Q分别是输入层、隐蔽层和输出层的单元数。

本文的I=4,Q=1及N=35,可得2.56<H≤4.0。取H=3。本研究采用4∶3∶1的网络结构(见图1)建立模型。

  

图1 BP神经网络结构图

2.3.2 BP神经网络对色谱保留指数RI的预测

为了进一步避免过拟合和过训练,将数据集分为3组:训练集(每5个数据中的第2、3、5个)、验证集(每个数据中的第1个)、和测试集(每个数据中的第4个),各集化合物个数依次为21个、7个、7个。由此得到的训练集、验证集和测试集的相关系数分别为0.995、0.993和0.996,均与总的相关系数0.993接近,说明模型的稳健性较强。该神经网络模型得到的预测值见表1。由表1可以看出,预测值与实验值接近,平均相对误差为1.165%。

4.2 预约优选和排序功能 输液时段设计是减少患者等候,均衡工作量的一个关键环节。我们广泛听取患者的意见和建议,总结手工预约的实践经验,常规状态下系统每天设置7个时间段,每50分钟为1个时间段,2个时间段之间有10 min的缓冲期,每个时间段预约50例患者。根据患者喜好和输液高峰时段的情况,系统默认为患者选择最早的时段,其中10:30~11:20时段只留给当日就诊后需要输液的患者预约,也可以根据患者的需求自由选择时间段。系统根据患者预约的先后为每个时段的患者自动排序。智能化的操作非常简便、高效和人性化。这一功能的实现 也是“关爱患者,从细节做起”的体现。

2.4 讨论

在柱温与固定相确定的情况下,气相色谱保留指数只与溶质的分子结构有关,即与溶质间的作用能有关[13],分子间作用能的本质是分子间作用力,包括色散力、诱导力、取向力和氢键,通常情况下以色散力为主。影响色散力的主要因素是分子的大小及支化度,分子的体积越大,其色散力越大。对于同分异构体,其支化度越大,色散力越小。本实验所研究的化合物有烯烃、醇、酚、酯等,它们之间的作用力包括色散力、诱导力、取向力及氢键。进入模型的X1,E9,M9,M10,其中X1是分子连接性指数中的零级路径指数,反映了分子的大小和支化度的差异;E9为电性状态拓扑指数,揭示了分子中原子的固有电性及原子所处的局部环境,反映了分子的电性结构;M9,M10为分子电性距离矢量,既反映了分子中成键原子的电性状态,又反映了成键原子之间的相互作用。从表1可以看出,香水百合头香成分中35个化合物种类较多,包括烯烃、酯、醇、酚等。化合物种类不同,性质差别较大,递变规律性也较差,所以无法用单一的指数来反映其结构特征,本研究中3种指数联合全面表征了分子间的作用力,揭示了影响香水百合头香成分色谱保留指数的本质因素。

3 结论

通过本文研究,可以得到如下结论:

(1)从连接性指数、电性状态拓扑指数和分子电性距离矢量3类指数中选取的4个自变量作为神经网络的输入层单元,建立了良好的神经网络模型,该模型具有优良的预测能力,说明所选指数有效地揭示了影响香水百合头香成分色谱保留指数的本质因素;

(2)四元回归模型(2)与BP-QSRR模型的相关系数分别为0.965和0.993,说明神经网络模型更高效,所选4个指数与色谱保留指数之间具有良好的非线性关系,而非简单的线性关系,所建网络结构较为合理,用该神经网络预测香水百合头香成分的色谱保留指数是可行的。

参考文献:

[1]曹慧,李祖光,杨美丹,等. 香水百合头香成分的定量结构-色谱保留关系研究[J]. 分析测试学报,2008,27(11):1198-1202.

Cao Hui,Li Zuguang,Yang Meidan,et al. The study on quantitative structure-retention relationships for volatile fragrance compounds in fresh flowers of Liliumspp[J]. Journal of Instrumental Analyseis,2008,27(11):1198-1202.

[2] Kier L B,Hall L H. Molecular connectivity in structure-activity analysis[M]. Taunton,US:Research Studies Press,1986:82.

[3] Hall L H,Kier L B,Brown B B. Molecular simmilarity based on novel atom-type electrotopological state indices[J]. Journal of Chemical Information and Computer Sciences,1995,35(6):1074-1080.

[4] Liu S S,Liu H L,Yin C S,et al.VSMP:A novel variable selection and modeling method based on the prediction[J]. Journal of Chemical Informationand Computer Sciences,2003,43(3):964-969.

[5] 冯长君. 茶叶上农药生物降解性的电性距离矢量预测[J]. 南京理工大学学报,2011,35(5):722-725.

Feng Changjun. Biodegradability prediction of pesticides in tea plant using molecular electronegativity distance vector[J]. Journal of Nanjing University of Science and Technology,2011,35(5):722-725.

[6] 胡黔楠,梁逸曾,王亚丽,等. 直观队列命名法的基本原理及其在矩阵与拓扑指数计算中的应用[J]. 计算机与应用化学,2003,20(4):386-390.

Hu Qiannan,Liang Yizeng,Wang Yali,et,al. The basic principles of heuristic queue notation and its applications in calculation of matrix and topological index for topological graphs[J]. Computers and Applied Chemistry,2003,20(4):386-390.

[7] 张婷,梁逸曾,赵晨曦,等. 基于分子结构预测气相色谱程序升温保留指数[J]. 分析化学,2006,34(11):1607-1610.

Zhang Ting,Liang Yizeng,Zhao Chenxi,et,al. Prediction of temperature-programmed retention indices from molecule structures[J]. Analytical Chemistry,2006,34(11):1607-1610.

[8] 赵筱萍,范骁辉,余杰,等. 一类基于组效关系神经网络模型的中药药效预测方法[J]. 中国中药杂志,2004,29(11):1082-1085.

Zhao Xiaoping,Fan Xiaohui,Yu Jie,et al. A method for predicting activity of traditional Chinese medicine based on quantitative composition-activity relationship of neural network model[J]. China Journal of Chinese MateriaMedica,2004,29(11):1082-1085.

[9] Urra L S,Gonza Lez M P,Teijeira M. 2D-autocorrelation descriptors for predicting cytotoxicity naphthoquinone ester derivatives against oral human epidermoid carcinoma[J]. Bioorg Med Chem,2007,15(10):3565-3571.

[10] 陈艳,堵锡华. 紫杉醇类似物抗癌活性与分子结构的定量构效关系[J]. 中草药,2011,42(2):318-322.

Chen Yan,Du Xihua. Relationship between anticancer activity and molecular structure of paclitaxel analogues[J]. Chinese Traditional and Herbal Drugs,2011,42(2):318-322.

[11] 李仲. 人工神经网络研究硝基苯化合物结构与毒性的关系[J]. 分子科学学报,2011,27(4):258-261.

Li Zhong. The study of the structure-toxicity relationships of nitrobenzene derivatives[J]. Journal of Molecular Science,2011,27(4):258-261.

[12] 许禄,邵学广. 化学计量学方法(第二版)[M]. 北京:科学出版社,2004.

[13] 冯长君,刘玉胜,冯慧. 储良龙眼挥发性成分的定量-保留指数分析[J]. 食品科学,2012,33(8):244-247.

Feng Changjun,Liu Yusheng,Feng Hui. Quantitative structure-retention relationship analysis of volatile compounds in longan[J]. Food Science,2012,33(8):244-247.

 
陈艳,瞿翠玲,闫远方
《南京理工大学学报》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息