基于近红外光谱的神经网络预测大米直链淀粉含量

2024-05-11

基于近红外光谱的神经网络预测大米直链淀粉含量(精选3篇)

篇1:基于近红外光谱的神经网络预测大米直链淀粉含量

基于近红外光谱的神经网络预测大米直链淀粉含量

借助主成分分析,确立了用于近红外光谱分析的BP神经网络的输入输出模式对;并用BP神经网络方法建立了不同类型、不同粒度的大米样品直链淀粉含量预测模型;考察了模型的预测能力,其预测值与用标准方法取得的.化学测定值间具有良好线性关系(相关系数达0.9)。用BP神经网络可降低因样品粒度的不同而对预测结果造成的差异。

作 者:刘建学 吴守一 方如明 Liu Jianxue Wu Shouyi Fang Ruming 作者单位:刘建学,Liu Jianxue(洛阳工学院机械设计工程系 博士,)

吴守一,Wu Shouyi(江苏理工大学生物与环境工程学院 教授 博士生导师,)

方如明,Fang Ruming(江苏理工大学生物与环境工程学院 教授)

刊 名:农业机械学报 ISTIC EI PKU英文刊名:Transactions of the Chinese Society of Agricultural Machinery年,卷(期):32(2)分类号:O433.4 S379.1关键词:大米 直链淀粉含量 光谱分析 神经网络 预测

篇2:基于近红外光谱的神经网络预测大米直链淀粉含量

大米主要化学成分是水分、淀粉、蛋白质、脂肪等。而粮油品质与化学成分的含量密切相关。淀粉和直链淀粉含量高低是衡量品质优劣主要指标。不同粮种的淀粉含量与性质有很大差别, 大米淀粉含量在80%~90%之间。目前缺乏快速检测的方法, 传统标准的检测方法繁琐, 耗时, 对大米的品质检测和评价受到很大的制约。近红外光谱可以快速测定化学成分, 但必须建立其化学成分数据模型才能进行。本项目通过对广西地产大米40多个主要品种, 收集具有代表性的样品393个, 进行光学数据采集, 通过数学方法 (MPLS法) 和数学转换 (2, 5, 5, 1) 模式, 将淀粉和直链淀粉光谱数据和常规方法测定数据进行回归法计算, 得出定标方程再用18个品种样品进行定标验证用标准常规方法对样品进行化学成分测定, 全面了解各品种化学组成的差异。以更为今后水稻的品种引入、培育、高产栽培技术、种植条件研究、等种植体系提供分析测定的技术保障。

(一) 实验部分

1. 仪器与操作环境

FOSS公司生产的5000SystemⅡVertical, WINISIⅢ近红外定标软件, Evolution300双光速紫外-可见光分光度计, 山特稳压电源, 佳能及惠普打印机等, 仪器在防震动, 温度.湿度均达标下进行光谱扫描。

2. 材料与方法

(1) 材料的收集制备

收集具有代表性的广西产大米油粘8号、桂丝粘、七桂粘、桂丰6号、八桂香、瑶山香米、瑶山小农粘、上林农乐香米、桂九九等40个样品共计393个样品。用FOSS公司和knifetecTM1095型刀口式样品磨将样品碎至40目 (需过筛) 。另取少许粉碎至100目, 分别装入塑料袋中封口存于干燥器中备用。

(2) 实验方法

1) 常规分析

淀粉的化学分析方法:用标准化学法测定大米中的淀粉含量, 严格按GB/T5009.9-2008《食品中淀粉的测定》第二法酸水解法测定淀粉含量, 结果以原样计。

2.直链淀粉的化学分析方法:用标准化学法测定大米中的直链淀粉含量, 严格按GB/T15683-2008《大米直链淀粉含量的测定》操作, 样品及系列标准溶液加入显色剂后在720nm下用Evolution300双光速紫外-可见光分光度计比色。结果以原样计。

从中随机留取18份样品作为校验样, 以便检验预测模型数据的效果。

2) NIRS扫描:选用漫反射1/4样品杯装填样品, 待仪器自检通过后在1100~25000nm范围内扫描, 每隔2nm采集反射强度 (R) 。每个样品扫描32次, 存于计算机中, 取平均值, 转化为lg (I/R) 。得到光谱数据, 大米的近红外光谱图1所示。

(二) 结果与分析

1. 从图1可见大米的近红外光谱图有多处吸收峰, 不同的大米吸收峰大小不同。

近红外在大米品质分析中, 尤其是含量较高的化学成分诸如淀粉, 直键淀粉和蛋白质的分析测定具有非常高的相关系数和较小的误差。广西是全国大米及优质大米的主要产区, 而这正是采用近红外分析仪快速检测不同品种大米淀粉含量的分析依据。

2. 建立定标模型

(1) 将大米样品实验室经化学方法实验方法1) 获得的准确数据输入电脑中相应的近红外分析仪采集的光谱数据库实验方法2) , 建立定文件。

(2) 利用WINISIⅢ近红外定标软件程序计算每一个样品与平均谱带的差异, 用H-statistic距离 (H距离) 表示, 对于H距离>3的样品, 重新进行实验方法1) 和实验方法2) 校正, 若不能吻合则予以追加此品种大米样品的收集和定标, 尽可能增加“库容量”确保大米数据模型的广泛性、实用性及准确性。

(3) 利用WINISIⅢ近红外定标软件对数据进行数学处理, 对375个大米样品用不同的数学算法和不同的数学转换可以得到不同的结果, 最终淀粉选择改进的偏最小二乘法 (MPLS) 和 (2, 5, 5, 1) 数学转换方法将散射处理方式设置为SNV+Detrend下定标效果最好;而直链淀粉则用改进的偏最小二乘法 (MPLS) 和 (2, 5, 5, 1) 数学转换方法将散射处理方式设置为SNV+Detrend下定标效果最好。如表1所示。定标相关系数 (RSQ) 高, 标准偏差 (SEC) 小和交差验证相关系数 (1-VR) 大的广西产大米淀粉及直链淀粉的定标模型。见表1, 表2。

(4) 随机留取18份样品作为校验样进行交互校验, 最后得到最好的大米淀粉及直链淀粉近红外光谱预测模型。定标样品与校正样品的淀粉含量的化学法测定结果见表2, 大米淀粉定标样品结果见表3, 定标样品的化学值与预测值及偏差表。

(三) 讨论

现代近红外光谱 (NIR) 分析技术是近年来分析化学领域迅猛发展的高新分析技术, 越来越引起国内外分析专家的注目。传统分析技术相比, 近红外光谱分析技术具有诸多优点, 仅通过对被测样品完成一次近红外光谱的采集测量可完成其多项性能指标的测定。光谱测量时不需要对分析样品进行前处理;分析过程中不消耗其它材料或破坏样品;不消耗或很少消耗试剂, 是一种安全的“绿色分析”技术。且分析重现性好、成本低。水稻是广西最主要的农作物之一, 广西地处亚热带, 山区气候的特点是昼夜温差大, 这有利于水稻, 尤其是晚稻光合产物的积累、转移和贮存, 以及淀粉的有序排列, 使米粒显得更为香甜, 广西水稻的生产条件在中国南方是首屈一指的。近红外在大米品质分析中, 尤其是含量较高的化学成分诸如淀粉, 直键淀粉和蛋白质的分析测定具有非常高的相关系数和较小的误差。样品选择、参与定标样品的数量、实验人员素质以及实验条件的差异及其设计, 直接影响定标模型预测的准确度, 在这一点上我们尽量充分考虑样品成分的含量分布、梯度以及样品的物理和化学特性, 以提高定标模型的稳定性, 扩大模型的实际应用范围。选择广西区产40个品种大米的393份是充分考虑到以上这些因素。近红外快速检测广西区产大米中淀粉及直链淀粉成分的研究成果将填补区内空白, 对广西发展粮油产业具有重要的意义。

参考文献

[1]吴建国, 石春海, 张小明, 等.用近红外反射光谱法分析稻米3种必需氨基酸含量的研究[J].作物学报, 2003, 29 (5) :688-692.

[2]Shu Y (舒庆尧) , Wu D.x (吴殿星) , Xia Y.W (夏英武) , GaoM·w (高明尉) , McClungA.Calibration optimizationforrice apparentamylose content by near infrared reflectance spectroscopy (NIRS) .J ofzhejiang university (Agric&Life Sci) [浙江大学学报 (农业与生命科学版) ], 1999, 25 (4) :343-346.

篇3:基于近红外光谱的神经网络预测大米直链淀粉含量

关键词:可见-近红外光谱;土壤类型;主成分分析;BP神经网络;RBF神经网络;分类鉴别

中图分类号: S155;O657.33 文献标志码: A 文章编号:1002-1302(2014)04-0284-03

收稿日期:2013-08-25

基金項目:国家自然科学基金-新疆联合基金(编号:U1203182);国家自然科学基金(编号:51279166);高等学校学科创新引智计划(编号:B12007);水资源与水电工程科学国家重点实验室项目(编号:2011B083);西北农林科技大学大学生创新创业训练计划(编号:1210712077)。

作者简介:马海姣(1990—),女,甘肃武威人,研究方向为“3S”技术在农业水土工程中的应用。E-mail:18700807193@163.com。

通信作者:崔晨风,博士,讲师,研究方向为“3S”技术在农业水土工程和水文水资源中的应用、大坝安全监测、精密工程测量。E-mail:cuichenfeng@163.com。光谱技术作为一种简单、快捷、非接触、非破坏的分析方法,已经被广泛地应用到土壤和植物研究、食品行业等领域[1-4]。由于土壤的光谱反射率能综合反映土壤理化特征和内在结构,所以土壤光谱测量为土壤光谱特征分析、土壤分类提供了新途径[5-6]。目前已有基于土壤光谱特征对土壤各项生理指标参数的研究[7],但是基于土壤近红外光谱和神经网络的土壤分类研究较少[8]。刘家雄[9]、付强等[10]分别利用土壤理化指标,结合主成分分析、聚类分析、神经网络等方法对土壤分类进行研究。由于土壤理化性质测量方法复杂,工程量大,无法快速、无损地对土壤进行分类。曾庆猛等利用土壤近红外光谱和聚类分析对土壤分类进行了研究[11],宋海燕等利用近红外光谱和正交信号-偏最小二乘法对土壤进行分类,但分类精度最高仅达到85%[12]。

神经网络模型作为一种强有力的学习系统,模拟了人脑思维过程,能够实现输入层、输出层的非线性映射,已经在很多领域得到广泛应用,并取得良好效果[13-14],但目前还没有基于土壤近红外光谱和神经网络[反向传播人工(BP)神经网络和径向基函数人工(RBF)神经网络]的土壤分类研究。本研究采用新疆土、土、沙土、阜阳土等4种类型土壤的室内可见-近红外光谱反射数据为研究对象,利用主成分分析方法,结合BP神经网络和RBF神经网络技术进行土壤分类研究,探讨基于土壤反射光谱特性的土壤分类技术,以期提高土壤分类精度和运行时间,为实现基于遥感方法进行土壤快速分类奠定基础。

1材料与方法

1.1仪器设备

使用美国ASD(analytical spectral device)公司的Handheld Field Spec 型光谱仪,其光谱测定范围为325~1 075 nm,采样间隔为10 nm,光谱分辨率为3.5 nm,探头视场角为15°。光源采用与光谱仪配套的14.5 V卤素灯。采用ASD View Spec Pro和Matlab R2009b软件分析数据。

1.2样本采集与制备

供试土壤分别为新疆土、土、沙土、阜阳土。每种土壤各取10个样本,每个样本扫描20次,取平均值作为最终光谱反射率数据。

1.3主成分分析(PCA)原理

PCA是一种降维映射方法,可以有效地压缩数据特征,把原有多维空间信息通过一系列线性变换在低维空间表现出来,从而消除众多信息中的重叠部分。提取的每个特征都是原来特征的函数,使新得到的特征数少于原有特征数,同时保存了原有特征的主要信息。

1.4神经网络原理

1.4.1BP神经网络BP神经网络是目前应用最广泛的神经网络方法之一,具有较强的信息处理能力,能够实现输入和输出之间的非线性映射。典型的神经网络具有1个输入层、数个隐含层、1个输出层,层与层之间采用全连接的方法,同层神经元之间不存在相互连接。理论上已证明,1个具有隐含层的3层网络可以逼近任何连续的非线性函数。隐含层中神经元多采用“S”型函数(tansig),输出层的神经元多采用线性传递函数(purelin)。

传统的BP算法存在很多未解决问题,如收敛速度较慢,易于陷入局部极小等。在实际应用中,该算法存在网络结构参数和学习训练参数难以确定的问题,这在一定程度上影响了神经网络的推广应用。

本研究采用3层BP神经网络,该网络由1个输入层、1个隐含层、1个输出层组成,隐含层采用“S”型函数,输出层采用线性传递函数,目标误差0.01,设定训练迭代次数 1 000 次。

1.4.2RBF神经网络多变量插值的RBF神经网络具有优秀的离散数据内插特性,可以提供最优逼近功能,其网络结构域与多层前向型网络类似,是一种3层前向型网络,由输入层、隐含层、输出层组成,隐含层神经元传递函数是对中心点径向对称且衰减的非负非线性函数(radbas),从输入层空间到隐含层的空间变换是线性的,从隐含层空间到输出层空间变换也是线性的。RBF具有结构简单,训练速度快,函数逼近能力和分类能力强,不存在局部最优问题等特点。

nlc202309011517

本研究采用3层RBF神经网络,径向基函数扩展速度(spread)为5.5。

2结果与分析

2.1可见-近红外光谱分析

2.2主成分分析

3结论

通过试验获得4种类型土壤的可见-近红外光谱特征曲线,结合主成分分析和有导师学习型的2种神经网络,分别建立了鉴别土壤类型的模型,2种模型预测效果很好,识别率均达到100%。其中RBF神经网络克服了BP神经网络运行时间长的缺点,在应用时更加快捷方便。利用可见-近红外光谱技术可以快速、准确、无损地对土壤类型进行鉴别,为土壤类型鉴别提供了一种可靠的新途径。

参考文献:

[1]何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[2]何勇,李晓丽. 用近红外光谱鉴别杨梅品种的研究[J]. 红外与毫米波学报,2006,25(3):192-194+212.

[3]李曉丽,何勇,裘正军.一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279-282.

[4]邵咏妮,何勇,潘家志,等. 基于光谱技术的桔子汁品种鉴别方法的研究[J]. 光谱学与光谱分析,2007,27(9):1739-1742.

[5]黄应丰,刘腾辉. 华南主要土壤类型的光谱特性与土壤分类[J]. 土壤学报,1995,32(1):58-68.

[6]刘焕军,张柏,张渊智,等. 基于反射光谱特性的土壤分类研究[J]. 光谱学与光谱分析,2008,28(3):624-628.

[7]张娟娟,田永超,姚霞,等. 基于高光谱的土壤全氮含量估测[J]. 自然资源学报,2011,26(5):881-890.

[8]王遵义,金春华,刘飞,等. 基于光谱技术的土壤快速分类方法研究[J]. 浙江大学学报:农业与生命科学版,2010,36(3):282-286.

[9]刘家雄. 主成分分析与聚类分析在土壤分类中的应用[J]. 上海农业学报,2011,27(3):110-113.

[10]付强,王志良,梁川. 自组织竞争人工神经网络在土壤分类中的应用[J]. 水土保持通报,2002,22(1):39-43.

[11]曾庆猛,孙宇瑞,严红兵. 土壤质地分类的近红外光谱分析方法研究[J]. 光谱学与光谱分析,2009,29(7):1759-1763.

[12]宋海燕,秦刚,韩小平,等. 基于近红外光谱和正交信号-偏最小二乘法对土壤的分类[J]. 农业工程学报,2012,28(7):168-171.

[13]吴桂芳,蒋益虹,王艳艳,等. 基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J]. 光谱学与光谱分析,2009,29(5):1268-1271.

[14]杨芳,李红睿,田学东. 基于RBF神经网络的汉字粗分类方法[J]. 计算机工程与应用,2009,45(6):170-172.

上一篇:孩子学英语下一篇:城管人员十条禁令