神经网络技术

2024-08-03

神经网络技术(精选十篇)

神经网络技术 篇1

1 人工神经网络技术

人工神经网络技术也称ANN, 是随着上个世纪八十年代人工智能发展兴起的一个研究热点, 它的主要工作原理对人脑神经网络进行抽象处理, 并仿造人脑神经网络建立简单的模型, 按照不同的连接方式组成一个完整的网络, 因此学术界也直接将它成为神经网络。神经网络其实就是一种运算模型, 它是通过大量的节点——神经元连接起来的, 其中不同的节点所代表的输出函数也不同, 也就是所谓的激励函数;当有两个节点连接起来时称之为通过该连接信号的加权值, 也称为权重, 这就相当人脑神经网络记忆。人工神经网络技术是采用并行分布式系统, 这种工作机理与传统的信息处理技术和人工智能技术完全不同, 是一种全新的技术, 它克服了传统基于逻辑符号的人工智能处理非结构信息化和直觉方面的缺陷, 具有实时学习、自适应性和自组织性等特点。

2 人工神经网络技术应用分析

随着人工神经网络技术的发展, 它在模式识别、知识工程、信号处理、专家系统、机器人控制等方面的应用较广。

2.1 生物信号的检测分析

目前大部分医学检测设备都是通过连续波形得到相关数据, 从而根据所得数据对病情进行诊断。人工神经网络技术就是应用了这样的方式将多个神经元组合起来构成, 解决了生物医学信号检测方面的难题, 其适应性和独立性强, 分布贮藏功能多。在生物医学领域该技术主要应用于对心电信号、听觉诱发电位信号、医学图像、肌电荷胃肠等信号的处理、识别和分析。

2.2 医学专家系统

传统的医院专家系统是直接将专家的经验、学历、临床诊断方面取得的成绩等存储在计算机中, 构建独立的医学知识库, 通过逻辑推理进行诊断的一种方式。进入到二十一世纪, 医院需要存储的医学知识越来越多, 每天产生新的病况和知识, 过去的一些专家系统显然已经无法适应医院的发展需求, 因此医院的效率很低。而人工神经网络技术的出现为医院专家系统的构建提出了新的发展方向, 通过人工神经网络技术, 系统能够自主学习、自己组织、自行推理。因此在医学专家系统中该网络技术应用面较广。麻醉医学、重症医学中生理变量分析和评估较多, 目前临床上一些还没有确切证据或者尚未发现的关系与现象, 通过人工神经网络便能有效地解决。

2.3 市场价格预测

在经济活动中, 传统统计方法受到一些因素的制约, 无法对价格变动做出准确的预测, 因此难免在预测的时候出现失误的现象。人工神经网络技术能够处理那些不完整的、规律不明显、模糊不确定的数据, 并作出有效地预测, 因此人工神经网络技术具有传统统计方法无法比拟的优势。例如人工神经网络技术可以通过分析居民人均收入、贷款利率和城市化发展水平, 从而组建一个完整的预测模型, 准确预测出商品的价格变动情况。

2.4 风险评价

在从事某一项特定的活动时, 由于社会上一些不确定因素, 可能造成当事人经济上或者其他方面的损失。因此在进行某一项活动时, 对活动进行有效的预测和评估, 避免风险。人工神经网络技术可以根据风险的实际来源, 构筑一套信用风险模型结构和风险评估系数, 从而提出有效地解决方案。通过信用风险模型分析弥补主观预测方面的不足, 从而达到避免风险的目的。

3 人工神经网络技术未来发展

人工神经网络克服了传统人工智能对语言识别、模式、非结构化信息处理的缺陷, 因此在模式识别、神经专家系统、智能控制、信息处理和天气预测等领域广泛应用。随着科学技术的进步, AI的快速发展, AI与遗传算法、模糊系统等方面结合, 形成了计算智能, 很多企业和国家开始大规模研发AI, 人工神经网络正在模拟人类认知的方向发展, 目前市场已经有很多不少人工智能产品面世。

4 结语

通过上述研究分析, 人工神经网络技术已经取得了相应的发展, 但还存在很多不足:应用范围狭窄、预测精度低、通用模型缺乏创新等, 因此需要我们在此基础上不断寻找新的突破点, 加强对生物神经元系统的研究和探索, 进一步挖掘其潜在的价值, 将人工神经网络技术应用在更多领域中, 为社会创造更大的财富。

摘要:随着计算机网络、信息技术、自动化技术的进步, 极大的改变了我们的生活。人工神经网络技术是一种全新的控制技术, 通过互联网进行动态模拟, 从而建立一种新的控制互联网的系统。经过十几年的发展, 人工神经网络技术研究取得了巨大的进步, 已经广泛应用在社会各个领域, 使现代计算机中的难题得到了解决。本文主要从人工神经网络技术的概念出发, 探讨了它在现代社会领域的具体应用。

关键词:人工神经网络,信息技术,发展趋势

参考文献

[1]周文婷, 孟琪.运动员赛前心理调控的新策略——基于人工神经网络技术的比赛场地声景预测 (综述) [J].哈尔滨体育学院学报, 2015, 33 (03) :15-21.

[2]张红兰.人工神经网络技术的应用现状分析[J].中国新通信, 2014 (02) :76-76.

神经网络应用 篇2

“神经网络”这个词实际是来自于生物学,而我们所指的神经网络正确的名称应该是“人工神经网络(ANNs)”。在本文,我会同时使用这两个互换的术语。

一个真正的神经网络是由数个至数十亿个被称为神经元的细胞(组成我们大脑的微小细胞)所组成,它们以不同方式连接而型成网络。人工神经网络就是尝试模拟这种生物学上的体系结构及其操作。在这里有一个难题:我们对生物学上的神经网络知道的不多!因此,不同类型之间的神经网络体系结构有很大的不同,我们所知道的只是神经元基本的结构。

The neuron

虽然已经确认在我们的大脑中有大约50至500种不同的神经元,但它们大部份都是基于基本神经元的特别细胞。基本神经元包含有synapses、soma、axon及dendrites。Synapses负责神经元之间的连接,它们不是直接物理上连接的,而是它们之间有一个很小的空隙允许电子讯号从一个神经元跳到另一个神经元。然后这些电子讯号会交给soma处理及以其内部电子讯号将处理结果传递给axon。而axon会将这些讯号分发给dendrites。最后,dendrites带着这些讯号再交给其它的synapses,再继续下一个循环。

如同生物学上的基本神经元,人工的神经网络也有基本的神经元。每个神经元有特定数量的输入,也会为每个神经元设定权重(weight)。权重是对所输入的资料的重要性的一个指标。然后,神经元会计算出权重合计值(net value),而权重合计值就是将所有输入乘以它们的权重的合计。每个神经元都有它们各自的临界值(threshold),而当权重合计值大于临界值时,神经元会输出1。相反,则输出0。最后,输出会被传送给与该神经元连接的其它神经元继续剩余的计算。

Learning

正如上述所写,问题的核心是权重及临界值是该如何设定的呢?世界上有很多不同的训练方式,就如网络类型一样多。但有些比较出名的包括back-propagation, delta rule及Kohonen训练模式。

由于结构体系的不同,训练的规则也不相同,但大部份的规则可以被分为二大类别它们可以被分为分类式或联想式。分类式网络可以接受一组数,然后将其分类。例如ONR程序接受一个数字的影象而输出这个数字。或者PPDA32程序接受一个坐标而将它分类成A类或B类(类别是由所提供的训练决定的)。更多实际用途可以看Applications in the Military中的军事雷达,该雷达可以分别出车辆或树。

联想模式接受一组数而输出另一组。例如HIR程序接受一个„脏‟图像而输出一个它所学过而最接近的一个图像。联想模式更可应用于复杂的应用程序,如签名、面部、指纹识别等。

The Ups and Downs of Neural Networks

神经网络在这个领域中有很多优点,使得它越来越流行。它在类型分类/识别方面非常出色。神经网络可以处理例外及不正常的输入数据,这对于很多系统都很重要(例如雷达及声波定位系统)。很多神经网络都是模仿生物神经网络的,即是他们仿照大脑的运作方式工作。神经网络也得助于神经系统科学的发展,使它可以像人类一样准确地辨别物件而有电脑的速度!前途是光明的,但现在...是的,神经网络也有些不好的地方。这通常都是因为缺乏足够强大的硬件。神经网络的力量源自于以并行方式处理资讯,即是同时处理多项数据。因此,要一个串行的机器模拟并行处理是非常耗时的。

神经网络的另一个问题是对某一个问题构建网络所定义的条件不足-有太多因素需要考虑:训练的算法、体系结构、每层的神经元个数、有多少层、数据的表现等,还有其它更多因素。因此,随着时间越来越重要,大部份公司不可能负担重复的开发神经网络去有效地解决问题。

NN 神经网络,Neural Network

ANNs 人工神经网络,Artificial Neural Networks

neurons 神经元

synapses 神经键

self-organizing networks 自我调整网络

networks modelling thermodynamic properties 热动态性网络模型

网格算法我没听说过

好像只有网格计算这个词

神经网络的秘密 篇3

人的智商与性格都是由大脑结构决定的,这是不争的事实。早年间科学家们主要关心脑细胞的数量和质量,后来发现人的脑细胞数量是基本固定的,质量也不容易评估,从这方面入手很难做研究。相比之下,脑细胞之间的神经联接却是不断在变化的,而且很可能更重要。

这一点不难理解。两台不同的电脑,一台非常高档但没有联网,另一台价格低廉但却联了网,哪台更好用?答案是不言而喻的。问题在于,大脑神经细胞的数量本身就是一个天文数字,它们之间的神经联接网络更是复杂异常,科学家们一直缺乏有效的研究手段,这方面的进展相当缓慢。

磁共振弥散张量成像(Diffusion Tensor Imaging)技术的出现解决了这个问题,这种技术可以实时测量大脑中水分子的流动情况,从而间接地衡量神经细胞之间信号通讯的强度和方向。有了这项技术,科学家们就可以研究活人的脑神经联接情况了,神经网络的秘密正在逐渐被揭开。

比如,曾经有研究显示,人在发育过程中大脑的神经联接会经历数次自我修整的过程,即把不必要的联接断掉,仿佛在剪枝一样。农民给果树剪枝是为了集中力量结果子,大脑的自我修整可以帮助主人更好地集中精力,不因周围的无效刺激而分散脑力。

这个自我修整过程是大脑发育当中极为重要的步骤,为了更准确地搞清这一过程的细节,来自英国纽卡斯尔大学(Newcastle University)的科学家马科斯·凯瑟(Marcus Kaiser)博士及其同事们招募了121位年龄在4-40岁之间的志愿者,用磁共振弥散张量成像技术扫描了他们的大脑,发现这个自我修整过程是有选择性的,同一区域(比如负责听觉的单元)内部的神经联接被清理的几率很高,而联接不同区域(比如负责听觉的单元和负责视觉的单元),尤其是距离较远的两个区域的神经联接则大部分被保留了下来。

仔细想想大脑这么做是有道理的。首先,距离越远的神经联接在建立的时候肯定越困难,因此也就越宝贵,不能轻易地被清理掉。其次,不同的区域之间的信息交流肯定比同一区域之内的信息交流更重要,比如你从闺蜜那里得来的信息很可能是重复的,而一个生活在异国他乡的朋友传递给你的信息往往就很宝贵了,这样的神经联接价值更大,理应保留。事实上,已知很多神经性疾病的患者都是在远距离神经联接上出了差错,比如癫痫、自闭症和精神分裂症等都是如此。

凯瑟博士将研究结果写成论文,发表在2013年12月15日出版的《大脑皮层》(Cerebral Cortex)杂志上。该文还提到了一个细节,女孩的大脑自我修整过程发生得比男孩早,也许这就是为什么女孩的智力发育开始得比男孩早的原因。

说到男女有别,这个话题可是相当敏感。如果只说体力上的差别没有问题,一旦涉及到男女之间的智商和情商就必须格外小心,否则很容易被人抓住把柄,指责你歧视。话虽如此,坊间关于男女性格差别的段子层出不穷,西方人甚至把男人安排到了火星,女人送到了金星。两者真的有那么大的差别吗?这可不能乱说,必须有科学根据。

2013年12月2日出版的《美国国家科学院院报》(PNAS)刊登了由美国宾夕法尼亚大学放射学系副教授拉吉尼·维尔马(Ragini Verma)博士及其同事们撰写的一篇论文,首次提出了看起来很有说服力的证据。同前文一样,研究者们使用磁共振弥散张量成像技术研究了男人和女人的脑神经联接,绘制出了大约1000名志愿者的神经联接分布图,从中发现男人和女人的大脑结构虽然没有火星和金星的差别那样大,但确实存在明显的差异。

具体来说,研究人员用这项技术扫描了428名男性和521名女性志愿者的大脑,结果显示女性大脑的左右联接比例较高,男性则正相反,前后的联接更多一些,只有一个部分例外,那就是小脑,男性在这个部位的左右联接也是比较多的。已知大脑的前半部分主要负责指挥四肢的运动,后半部分负责控制知觉系统,比如视觉和听觉等等,前后大脑联接紧密这个现象很好地解释了男人的运动能力为什么比女人高。另外,已知小脑也和运动能力密切相关,也许这就是为什么男人在这个部位的左右联接比女人发达。

大脑的左右两半球也是有分工的,左脑一般负责逻辑思维,右脑则更擅长直觉思维。女性在左右半球之间的神经联接比男性多,这个事实很好地解释了为什么女人比男人更擅长社交,记忆力也比男人好,而且善于一心多用。

从进化论的角度看,这个结果是有道理的。我们的祖先在很长一段时间内都是有分工的,男人负责出去打猎,自然需要灵巧的身体和专注的精神,女人负责在家采集野果并照顾孩子,或许在这一过程中完善了“多任务模式”和社交才能。

男女大脑之间的这种结构差异和年龄有着密切的关系。研究显示,两者在13岁之间大体相似,看不出明显差别。14-17岁这个年龄段开始分化,最终形成了两类不同结构的大脑。这个结果说明男女性格的差异是在青春期这段时间里形成的,很可能与激素的变化有关。

这篇论文发表后引起了诸多争议,维尔马教授坚持认为该项研究的主要目的是为了帮助医生们找到男女精神疾病的治疗方法,因为不少疾病存在性别差异,比如自闭症在男性中的发病率远比女性要高。但是媒体记者们显然不这么认为,大家一致把话题引到了男女性格的差异上,似乎该研究为“男人来自火星,女人来自金星”这个著名论断找到了科学根据。

不过,也有一些人提出了反对意见,比如英国《卫报》的科学编辑罗宾·麦基(Robin McKie)就专门为此事撰文指出,该研究只是说明男女大脑结构存在差异,没有说明这种差异到底是因还是果。麦基认为男女性格的差异只有很少部分来自遗传,大部分来自后天的教育,以及社会对男孩和女孩的不同期待。

这篇论文的作者维尔马教授在接受采访时表示过类似的看法,她认为这个结果只具有统计学上的意义,可以帮助科学家更好地了解男女这两个群体的行为模式,但无法帮助人们了解具体哪个人到底属于何种情况。比如,维尔马教授本人就是一名女性,却从事着在大多数人眼中相当“男性化”的职业。

也许,如果有人用这项技术扫描一下维尔马教授的大脑,也许就能明白她为什么能够当上教授了。

神经网络泛化增强技术研究 篇4

泛化 (Generalization) 是指训练后神经网络 (NN) 对来自同一样本集中的非训练样本给出正确输入输出关系的能力[1]。由于神经网络的非参数模型特性, 使得网络的一切信息来源于训练集, 导致训练结果极不稳定, 容易产生过拟合 (Overfitting) [2], 降低网络的泛化能力。

相关的文章多以网络对函数逼近作为研究对象[3,4,5], 这不够全面。因为网络的泛化能力与其类型和转移函数等均有关。例如, BP网络按照目的可粗分为函数逼近、数据分类和数据聚类3种[6]。数据聚类不依赖目标集, 因此不会产生过拟合问题。而函数逼近与数据分类的BP有很大区别:前者的转移函数是线性函数;后者的则为Sigmoid函数, 且神经元一般工作在Sigmoid函数的饱和区[7]。因此, 应该对这两种BP网络逐一讨论。实验也证实了对不同类型的NN, 算法得到的结论不尽相同。

1 过拟合

1.1 函数逼近

图1中虚线表示正弦函数, “·”表示对正弦函数采样得到的含噪样本, 实线表示对给定样本经过训练后NN的拟合曲线。其中BP网络的结构设为1-30-1。

可见, 由于网络过分逼近样本点, 虽然可保证拟合曲线与样本的误差很小, 但对新数据的泛化能力大幅降低, 这是不希望看到的。

1.2 分类

图2显示了数据分类的过拟合。其中蓝色点表示类型C1, 绿色点表示类型C2, 实线表示神经网络分类结果。

然而这种分类界面过于复杂, 虽然能够对训练样本完美分类, 但对新样本的推广能力却很差。例如图中标注“?”的新样本, 看起来应该是C1, 却被分类为C2。而图中虚线表示的分界面虽然简单, 对已有样本分类不够完美, 但泛化能力较强, 我们也更容易接受。

1.3 泛化定义

综上, NN泛化能力可以直观定义为在网络分解面的“复杂性”与“推广能力”中寻求一个折中。从客观角度定义, 即网络不仅对训练集有效, 而且应该对未知的测试集有效[8]。

2 拟合BP网络泛化增强研究

拟合问题定义为Sin函数逼近, 标准样本数为20, 噪声设为5%, 初始网络结构设为1-30-1。输入层的转移函数为Sigmoid函数, 隐层的转移函数为Linear函数。

2.1 额外样本法

如果能够随意增加样本数, 则网络的泛化能力可以有效改善。对上述问题, 如果将样本数分别增加至原来的5倍与10倍, 则结果如图3所示。可见, 样本数增加后, 网络的泛化能力有明显提高。

然而, 这种方法的缺点非常明显。首先, 实际情况下测量新的样本可能会非常困难, 不仅增加人力物力, 而且受物理条件限制;其次, 样本增加很多后, 网络的泛化能力改善不大;第三, 改善程度与样本的噪声、网络的结构有关, 而实际中噪声的种类与强度均未知, 故无法准确预测需要的样本数。

2.2 伪训练样本法

由于直接获得样本比较困难, 因此往往采用“伪训练样本法”, 即在已有的训练集上, 人工生成新的样本。目前伪训练样本法可分为如下两种[9]:1) 在训练样本中加入随机噪声;2) 随机扩展训练样本。

加入随机噪声的基本思想是:当训练样本被循环地作为网络的输入时, 由于每次添加噪声的随机性, 相当于增大了训练样本数目, 迫使NN不会对训练样本进行过度拟合, 从而使随机噪声起到了平滑作用, 避免了过拟合问题。然而, 如何添加随机噪声是该方法存在的主要问题, 对于噪声应采用何种分布、各训练样本的噪声幅度如何确定等问题, 目前都还没有明确的答案。

随机扩展训练样本方法的基本思想是:以某种方法根据原始训练样本模拟母体分布, 利用估计的母体分布生成扩展训练样本, 通过增大训练样本尺寸解决过拟合问题。然而, 其关键问题是如何根据原始训练样本模拟母体分布。一般假设母体分布为高斯混合分布, 当无法用高斯混合分布近似时, 则这种方法不仅无法改善网络性能, 反而会由于添加了一些错误样本而误导网络的学习。

图4 (a) 显示了加入高斯随机噪声, 图4 (b) 显示了采用随机扩展样本法。两者的样本数皆扩展至原来的5倍。可见, 由于无法事先预测噪声的分布, 所以这两种方法均表现较差。事实上, 伪训练样本法只有在噪声分布已知的情况下才能表现良好, 因此不实用。

2.3 构造法

构造法包含两个相对的方法:逐步增加法与剪枝法。前者是指从较小的网络开始, 逐步增长到一个合适的结构;后者则是指先从一个较大的网络开始训练, 然后逐步删去一些不重要的神经元。

对上述问题, 首先设定隐层神经元为30个, 然后逐渐减少, 重新训练网络, 然后测试, 计算误差的MSE。如此反复, 直至寻找到MSE最小点对应的隐层神经元个数, 如图5所示。

图6给出了隐层神经元为5的网络输出, 可见网络过拟合现象大幅度削弱, 输出曲线与真实曲线较为接近。

但是, 逐步增加法与剪枝法的一个共同缺点在于计算代价过大, 不实用。

2.4 早期停止

早期停止 (ES) 法将数据分为3类:第一类为训练集。第二类为验证集, 网络训练过程中, 不停地监视训练集的误差变化。当网络正常调整时, 训练集与验证集的误差均稳步减少;当网络过拟合时, 训练集的误差继续减少, 而验证集的误差增加。第三类为测试集, 用来保证对数据的分类有效, 如果测试集的误差衰减曲线与其他两类集合的误差衰减曲线有显著不同, 则说明数据分类不当[10]。一般地, 有如下3种数据分类方式:完全随机法、随机抽块法、交叉抽取法。

而反对意见认为, 当训练样本很少时, 过拟合问题已经相当严重, 应将全部样本用于网络学习, 此时ES再将样本分为3类, 反而会使过拟合问题更加严重。当训练样本充足时, 根本不会产生过拟合, 此时ES基本不起作用。因此, ES的使用范围有限。本文支持该观点, 以图7为例。

图7对样本数分别取20、40、60、80的Sin逼近问题进行仿真, 具体数据见表1。可见, 采用ES后, MSE反而增大, 即拟合曲线反而更加失真。而当样本数>100时, 此时也有足够多的样本, 过拟合程度也已显著降低, 不需要采取措施应付。

2.5 正则化技术

传统的性能函数选取网络的误差平方和, 即

式中, N表示训练集的样本数, ti表示输入样本对应的目标输出, ai表示网络模拟的输出。正则化技术[11]对性能函数增加正则项, 来改善网络的泛化能力。修正后的性能函数为

式中, γ表示性能比, msω表示网络的权值与偏置的均方, 即

γ的选择是一个难题:过大导致过拟合, 过小则网络不能很好地拟合数据。图8表明了MSEγ的关系。可见, γ的选择会导致MSE的大幅变化。

图9 (a) γ取值过小, 导致性能函数偏向于使网络权值更小, 而忽略了数据的拟合程度;图9 (c) γ取值过大, 导致正则化项几乎被忽略, 退化为传统的性能函数;图9 (b) γ取值适中, 得到的结果最好。

因此, Mac提出一种自适应的基于贝叶斯的正则化拟合方法[12], 已成为该类方法的经典。假设网络的权值和偏置满足特定的分布, 然后将正则化参数与分布参数关联起来, 从而起到自适应的效果。图10显示了采用贝叶斯正则化方法后网络的输出, 可见泛化能力得到增强。

2.6 小结

在主频1.6 GHz, 内存512 MB的P4 IBM PC上, 利用Matlab编程, 对上述7种方法从MSE与时间上进行小结, 列于表2。并综合MSE, 运行时间, 限制条件给出各算法的排名。

由于额外样本法、加入随机噪声法和随机扩展样本法不实用, 所以不参与排名。最好的是贝叶斯自适应正则化法, 不仅MSE最小, 而且时间也很少。紧随其后的是剪枝法与逐步增加法, 均能得到较优的结果, 但耗时较大。排名第4的是正则化法, 虽然效果不错, 但太多的时间用于选择γ。不采用任何方法排名第5。最差的是早期停止法, 尽管耗时最少, 效果却比什么都不做更差。

4 分类BP网络泛化增强研究

将隐层的转移函数也设置为Sigmoid函数, 则BP网络可用于分类。由于前面已经讨论了各种方法, 因此对5种实用方法进行比较。

采用胸腺癌 (Breast Cancer) 数据[13], 一共699个样本, 每个样本的输入向量是切片的9个属性, 输出向量表明肿瘤是良性还是恶性。为了验证泛化能力, 将数据的1/20作为训练样本, 以降低数据量来产生过拟合;将剩余数据作为测试样本, 观察各方法的泛化能力。网络初始结构设为9-20-2。每种方法训练20次, 取平均结果, 见表3。

可见, 当用于分类时, 早期停止法的性能突然大幅度变好, 从第6名上升到第4名, 表现在其精度高于不采用任何方法, 并且时间最快, 特别适用于大规模网络。其他算法的性能排名保持不变。

再以酒类酿造地 (Wine Vintage) 数据为例[14], 一共178个样本。每个样本的输入向量是通过化学分析得到的13种成分含量, 输出向量表明酿造地是意大利的3所酿造厂之一。将数据的1/10作为训练样本。网络初始结构设为13-20-3。其余同上。

可见, 最好的3类方法分别是贝叶斯正则化法、正则化法与剪枝法。同样地, 早期停止法的性能也可以接受, 其时间最少。

5 结论

传统的研究网络泛化的文章均只限于函数逼近, 本文则研究了各种方法对数据分类的泛化增强。通过介绍8种泛化能力增强方法, 并对其中5种能够实用化者予以详细讨论和实验验证, 可得以下结论:

1) 贝叶斯自适应正则化方法性能较好, 对函数逼近与数据分类都适用, 但耗时较多;

2) 早期停止法速度最快, 但用于函数逼近效果不是很好, 可用于数据分类;

3) 正则化方法、逐步增加法、剪枝法性能类似, 可用于函数逼近与数据分类, 但都需要估计一个参数, 因此耗时较多。

摘要:综述和比较现有改善神经网络泛化能力的方法, 特别对其中的5种实用方法进行详细的理论分析, 指出各自的优缺点。实验中将各种方法用于函数逼近与数据分类两大领域, 通过泛化能力与运行时间的对比, 给出其性能排序。发现贝叶斯自适应正则化方法性能最好, 其次是正则化法、逐步增加法、剪枝法;早期停止法速度最快, 但是用于函数逼近效果不佳, 只能用于数据分类。

人工神经网络论文 篇5

人工神经网络在信息领域中的应用主要体现在信息处理和模式识别两个方面。由于科技的发展,当代信息处理工作越来越复杂,利用人工神经网络系统可以对人的思维进行模仿甚至是替代,面对问题自动诊断和解决,能够轻松解决许多传统方法无法解决的问题,在军事信息处理中的应用极为广泛[4]。模式识别是对事物表象的各种信息进行整理和分析,对事物进行辨别和解释的一个过程,这样对信息进行处理的过程与人类大脑的思维方式很相像。模式识别的方法可以分为两种,一种是统计模式识别,还有一种是结构模式识别,在语音识别和指纹识别等方面得到了广泛的应用。

3.2 在医学领域的应用

人工神经网络对于非线性问题处理十分有效,而人体的构成和疾病形成的原因十分复杂,具有不可预测性,在生物信号的表现形式和变化规律上也很难掌握,信息检测和分析等诸多方面都存在着复杂的非线性联系,所以应用人工神经网络决解这些非线性问题具有特殊意义[5]。目前,在医学领域中的应用涉及到理论和临床的各个方面,最主要的是生物信号的检测和自动分析以及专家系统等方面的应用。

3.3 在经济领域中的应用

经济领域中的商品价格、供需关系、风险系数等方面的信息构成也十分复杂且变幻莫测,人工神经网络可以对不完整的信息以及模糊不确定的信息进行简单明了的处理,与传统的经济统计方法相比具有其无法比拟的优势,数据分析的稳定性和可靠性更强。

3.4 在其他领域的应用

人工神经网络在控制领域、交通领域、心理学领域等方面都有很广泛的应用,能够对高难度的非线性问题进行处理,对交通运输方面进行集成式的管理,以其高适应性和优秀的模拟性能解决了许多传统方法无法解决的问题,促进了各个领域的快速发展。

4总结

随着科技的发展,人工智能系统将进入更加高级的发展阶段,人工神经网络也将得到更快的发展和更加广泛的应用。人工神经网络也许无法完全对人脑进行取代,但是其特有的非线性信息处理能力解决了许多人工无法解决的问题,在智能系统的各个领域中得到成功应用,今后的发展趋势将向着更加智能和集成的方向发展。

参考文献

[1]徐用懋,冯恩波.人工神经网络的发展及其在控制中的应用[J].化工进展,1993(5):8-12,20.

[2]汤素丽,罗宇锋.人工神经网络技术的发展与应用[J].电脑开发与应用,(10):59-61.

[3]李会玲,柴秋燕.人工神经网络与神经网络控制的发展及展望[J].邢台职业技术学院学报,2009(5):44-46.

[4]过效杰,祝彦知.人工神经网络的发展及其在岩土工程领域研究现状[J].河南水利,(1):22-23.

机器人的神经网络 篇6

2016年春,韩国首尔四季酒店。谷歌人工智能围棋计算机程序“AlphaGo”与韩国九段棋手李世石进行了一场五番棋“人机大战”。最终,双方的比分定格在“1:4”,“AlphaGo”战胜人类代表李世石。

1000公里之外的北京,黄晓庆全程关注了这场比赛。他感慨:“从‘人机大战’在全球的热度来看,大家现在对人工智能、机器人的关注度越来越高,也普遍认同了这个产业。”

黄哓庆是科技界一名传奇人士。他19岁从华中科技大学毕业后留学美国,加入贝尔实验室。1995年,黄晓庆与陆弘亮、吴鹰等创立UT斯达康并担任公司CTO。2007年,黄晓庆回国担任中国移动研究院院长一职。他曾参与许多重要通信技术的开发工作,包括模拟调制解调器、接入网、IP电话等项目。

2015年3月,黄晓庆正式从中国移动离职。当所有人都在猜测他职业的下一站会是哪家大公司时,黄晓庆出乎所有人意料地选择了创业一一成立达闼科技有限公司(以下简称“达闼科技”),担任公司CEO兼CTO。

让黄晓庆在知天命的年纪重燃创业激情的就是人工智能。在他看来,机器人技术已逐渐成熟,3年内在服务领域有效取代人工的服务型机器人将会上量,10年内家庭保姆机器人将进入千家万户。达闼科技也成为第一家云端智能机器人公司。

“机器人产业的方向肯定是云端智能机器人。”黄晓庆预计,“达闼科技的目标就是要成为云端智能机器人时代的运营商。”黄晓庆表示,“不过,由于云端智能机器人还未出现,达闼科技首先要打造的是一个包括云端、网络、智能终端的产业链和生态环境。”

理论家

“做任何科技创新研究都要解决一个重要的问题——‘科学的基础’。”做了半辈子研究的黄晓庆谈到技术时更像一名学者,“2012年我提出的‘云端智能’概念就是从理论基础上佐证了云端智能机器人条件趋于成熟。”

首先,云端智能最核心的基础是电脑和人脑的差距。科学家们认为,人脑有1D0亿~10000亿个神经元,若想让已有技术完成一个集成如此多神经元的电路需要2000吨重的芯片,耗电27兆瓦。这意味着即便能造出一个拥有“人脑”的智能机器人,它也无法扛起自己2000吨重的“脑袋”。不过,人脑的速度比电脑的速度慢1D0万倍,这则意味着可让100万个机器人共享这个庞大的“大脑”。

其次,从生物学角度来看,通信网络的发展为机器人技术提供了第二个理论基础。人脑发出一个信号传到人体器官会延迟30到50毫秒。而3G移动通信网络延迟时间大概是150到300毫秒,4G移动通信网络延迟时间大概是50毫秒以下,即将到来的5G移动通信网络的延迟时间只有1毫秒,比人还要敏捷。移动通信网络就如同智能机器人的“神经系统”,解决了电脑反应速度问题。

再次,按照云端智能机器人的设想,若机器人“大脑”在云端,移动通信网络是机器人的“神经系统”,机器人还需要强大的传感器、电源、操作系统等支撑,而这些恰恰已被谷歌无人驾驶汽车等已经面世的产品所证明,能量存储技术、传感器技术、驱动技术都已达到一个凝聚点,在技术驱动之下云端智能机器人产业链应运而生。

“这就是达闼科技为什么相信10年内能制造出家庭保姆机器人的重要原因,这个产业已有了技术保障。”黄晓庆自信地表示,“不过,未来10年产业还是会由自然语言、视觉、听觉这类信息机器人走向护理、清洁等垂直服务机器人,然后才会出现通用型服务机器人,即人形、人性化机器人。”

黄晓庆是一位颇有前瞻性的技术专家。1997年他提出用lP技术实现下一代移动交换,即软交换,不过当时很多专家都认为时机远未成熟。但仅仅4年过后,全球所有主流设备制造商、运营商都开始研究和发展软交换。2004年,黄晓庆带领团队制造了世界上第一台支持1000万用户的软交换机,2007年在全球市场,软交换机完全取代传统程控交换机。

再次创业的黄晓庆也相信,虽然目前机器人产业看似遥远,但随着技术的不断进步,未来10年人工智能市场也将发生翻天覆地的变化,家庭保姆机器人将会走入寻常家庭,为普通家庭服务。

不过,技术和市场从来都是一步一步累积出来的。“我们很清醒地认识到,如果现在就瞄准去做家庭保姆机器人将来一定会死的很惨,我们一定是要把自己的核心技术不断变现,支持技术不断往前。”黄晓庆坦言。据他透露,达闼科技研发的Meta导盲机器人在云端、网络、智能终端整个体系开始进入产品阶段。

中国有600万盲人,加上重度弱视患者,总数接近2000万。Meta导盲机器人就是利用机器视觉、机器学习和智能语音等人工智能高科技手段,让盲人群体能更精准地感知周围环境、获取信息、参与社交,使盲人可以更为公平、自信、独立地融入社会,成为社会发展的参与者和贡献者。

实践者

著名科幻小说《星际迷航》中有一个名为“Data”的机器人角色。他“出生”于2336年,大脑有着相当出色的运算能力,在联邦星舰“进取号”上担任执行长官、二副职务,后又担任大副和指挥官职务。“Data”的制造者宋博士为他制造了一个情感芯片,只要插入此芯片,“Data”便有了人类的情感。

黄晓庆是个科幻迷,也是《星际迷航》的粉丝,他看了几百本《星际迷航》小说,100集《星际迷航》电视剧及电影。黄哓庆很喜欢“Data”这个角色,他认为“Data”就是人类理想中智能机器人的模型。所以,黄晓庆把公司命名为“达闼”,即是“Data”的音译。 《星际迷航》的长盛不衰折也射出人类对机器人、对人工智能的追求。一直关注人工智能市场的黄晓庆在2012年向中国移动提出“云端智能机器人”概念,但在庞大的中国移动体系内要推进一个看似毫不相干的项目异常困难。黄晓庆决定自己创业,并且要把达闼科技做成一个平台公司。

“达闼科技同时兼具了云计算、移动通信、智能终端领域的人才组合,就是为打造一个平台运营公司来设立的。未来机器人产业一个很重要的基础就是建立在规模上,规模越大就越成功。”黄晓庆这样理解。

nlc202309081607

不过,黄晓庆也承认:“云端智能机器人的产业链非常长、非常大,所以达闼科技绝对不能全部都做,而且也不应该全部都做,我们将聚焦两个领域——云端智能机器人的‘大脑’——云,以及支撑‘大脑’运行的信息网络。”

黄晓庆认为,这需要一家能构建云端大脑、神经网络、终端的运营公司来将三者连接起来,达闼科技正在着力构建机器人云端大脑体系,铺设一张全球互联的神经网络——“天网”,为实现云端智能机器人的运营打好基础。

“天网”必须具备两个特性——全球互联和安全互联。“只有实现全球互联,机器人才能实现全球知识共享;只有实现安全互联,才能保障机器人大脑的安全。”黄晓庆表示,“‘天网’的安全级别甚至能达到美国国防部的安全标准。”

2015年9月,达闼科技完成种子融资,融资金额3000万美元,估值1亿美元,投资人包括软银、富士康等。目前,A轮融资接近尾声,2016年6月左右将公布具体融资情况。融资将用于达闼科技的下一步研发和技术的产品化、市场化。

工程师

2014年6月,黄晓庆出差日本,对云端智能机器人仍恋恋不忘的他拜访了老熟人——软银创始人孙正义。黄晓庆把自己“云端智能机器人”的想法与孙正义进行了交流。

“在没有任何书面材料、只说了一个概念的情况下孙正义就答应要投资。”黄晓庆回忆,“我们创立UT斯达康时孙正义投资了,我第二次创业做软交换时他也投了,现在我要做机器人他更兴奋,因为他本人也特别喜欢机器人。”

2015年3月,黄晓庆正式从中国移动离职。一听“老大”要创业,中国移动研究院许多系统、移动标准、云计算平台专家也纷纷加入达闼科技。此外,大批来自BAT(百度、阿里巴巴、腾讯)、Google、三星、华为、IBM的技术人员也慕名而来。短短一年时间,达闼科技员工接近160人,技术人员占70%以上,在北京、深圳、成都、日本、美国硅谷都设有研发机构。

市场研究公司IDC发布的《全球商用机器人消费指南》显示,全球机器人行业及相关服务市场规模年复合增长率达17%,2019年行业规模将达到1354亿美元。而2015年机器人行业规模为710亿美元。达闼科技正全力练好内功争夺这个千亿美元的大市场。

事实上,达闼科技是黄晓庆的第三次创业。在外界看来,黄晓庆并不需要在功成名就之后还这么辛苦地创业。黄晓庆则有着自己的理解:“达闼科技让我实现了一个最伟大的梦想——让发明家和企业能够共享发明的成果。”

达闼科技有着有史以来对发明者最慷慨的回报政策:所有的发明创造只要在公司产品之外产生了收入,10%分给发明家,90%留给企业,这些收入包括授权、诉讼或转让等。

黄晓庆认为自己骨子里还是一名非常标准的工程师。他庆幸自己现在有更多的时间聚焦于科技创新。每天,他都能和一群优秀的工程师在一起。“我们共同将梦想照进现实。所以,我现在挺幸福的。”黄晓庆笑道。

不过,创业者黄晓庆也是一名创业导师。在与创业者交流时他也有私心。很多海外回国的创业者带来了许多独特的技术,如机器人控制技术、人工智能特殊算法等,通过与他们接触,黄晓庆可以为达闼科技找到合适的产业链合作者。

“我从小就有一个梦想,那就是‘做一名伟大的工程师’,老了后我还是想当一名工程师,达闼科技就是这个梦想的延续。”黄晓庆笑道,“我这一辈子可能都没办法退休,因为我总能看到一些伟大的技术,并很想把这些技术变成现实。”

现代神经影像学技术在神经科的应用 篇7

1 各种神经影像学检查的特点

CT和MRI显示的是组织器官解剖结构的形态变化, 是基于组织的密度差异或组织构成成分的差异而成像的, 影像的组织分辨率高。DSA (数字减影血管造影) 是利用数字技术, 将X线血管造影的影像与普通X线的影像相减, 形成清晰显示各种血管影像的一种显像设备或技术, 主要用于血管阻塞、狭窄及各种血管畸形疾病的诊断, 近年来还出现了CTA和MRA的血管影像检查。有人将CT、MRI及DSA影像统称为解剖影像。SPECT (single photon emission computed tomography) 即为单光子发射型电子计算机体层摄影仪, PET (positron emission computed tomography) 即为正电子发射型电子计算机体层摄影仪, 两者均是核医学的两大显像设备, 是将医用放射性核素或放射性核素的标记物引入体内, 在体内的放射性核素发射出核射线并穿透人体, 在体外使用相应显像设备进行探测成像的一种显像方法。所谓发射型是指射线来源于检查者体内, SPECT探测的射线是体内发射的单光子, PET探测的射线是体内发射的正电子。SPECT和PET显像机理均是根据脏器内外之间或病变组织与正常组织之间核素分布的浓度差别为基础的显像方法, 所用的显像剂能够被靶器官或靶组织的细胞进行选择性摄取或发生特异性结合, 能够显示组织的血流灌注和代谢水平以及受体密度等与功能有关的信息, 即该类显像方法是以显示组织细胞的代谢和功能为主的显像, 因此脑SPECT和PET影像被称为脑功能影像。SPECT和PET影像的不足之处是组织分辨率低, 解剖结构显示模糊, 毗邻结构难以显示, 因此, 需要与CT或MRI的影像进行结合, 发挥各自的优势, 互补各自的不足, 近年来的PET/CT或SPECT/CT以及图像融合技术的应用, 一次检查就同时产生了组织器官的解剖影像与功能影像, 并将两种影像进行准确融合, 形成了PET/CT或SPECT/CT的融合图像。我院是河南省首家拥有PET/CT的医疗机构, 在影像学技术应用方面积累了丰富的经验。作为神经科医生, 本文就神经影像学技术的基本原理、检查方法、常见病变表现进行介绍, 突出重点, 面向临床。

2 计算机体层扫描 (CT)

2.1 原理

(1) 利用各种组织对X线吸收系数不同, 通过电子计算机处理, 显示不同平面脑实质、脑室、脑池形态图像; (2) X线吸收高于脑实质显示高密度影, 如钙化、出血; (3) X线吸收低于脑实质显示灰黑色低密度影, 如坏死、水肿、囊肿、脓肿等。优点: (1) 无创, 简便迅速; (2) 敏感性较常规X线高100倍以上, 可确切显示脑组织、病变影像。

2.2 适应证

(1) 颅内血肿; (2) 脑外伤; (3) 脑出血、蛛网膜下腔出血; (4) 脑梗死; (5) 脑肿瘤; (6) 脑积水; (7) 脑萎缩; (8) 脑炎症性疾病、脑寄生虫病 (如脑囊虫) 等。

2.3 CT血管造影 (Computed tomography angiography, CTA)

原理:静脉注射含碘对比剂后, 用螺旋CT或电子束CT, 在对比剂充盈受检血管高峰期连续薄层扫描, 经计算机处理图像后重建血管立体影像[1]。优点:清晰显示Willis动脉环, 大脑前、中、后动脉及主要分支, 为脑血管病变提供诊断依据。见图1和图2。

3 磁共振成像 (MRI)

3.1 原理

利用人体内H质子在主磁场、射频场中被激发产生的共振信号, 经计算机放大、图像处理、重建后得到磁共振影像[2]。

3.2 临床应用

颅脑: (1) 脑梗死 (图3) ; (2) 脑肿瘤; (3) 脱髓鞘疾病; (4) 脑炎; (5) 脑出血; (6) 脑白质病变; (7) 脑变性疾病; (8) 脑萎缩; (9) 脑先天发育畸形; (10) 颅脑外伤。脊髓: (1) 脊髓肿瘤; (2) 脊髓空洞症; (3) 椎间盘脱出; (4) 脊椎转移瘤、脓肿。

3.3 MRI增强

原理:顺磁性对比剂钆 (gadolinium-DTPA) 通过改变氢质子磁性作用可改变弛豫时间, 获得高MR信号, 产生有效的对比效应。应用: (1) 增加对肿瘤、炎症病变敏感性; (2) 确定肿瘤手术、放疗范围。

3.4 磁共振成像血管造影 (MRA)

原理:利用血液中运动的质子作为内在流动标记物, 使血管与周围组织形成对比, 经计算机处理后显示血管影像、血流特征。临床应用: (1) 颅内动脉瘤; (2) 脑血管畸形; (3) 大血管闭塞性疾病; (4) 静脉窦闭塞。

3.5 MR弥散加权成像 (DWI)

原理:DWI是广义的功能性MRI技术, 测量病理状态下水分子布朗运动特征。优势:缺血性脑血管病发病2h内显示缺血病变。

3.6 MR灌注加权成像 (PWI)

原理:静脉注射顺磁性对比剂观察成像变化。优势:缺血性脑血管病发病2h内即显示缺血病变。用于显示: (1) 毛细血管网血流情况; (2) 局部脑血容量、局部脑血流量、平均通过时间; (3) 评价提供周围组织氧、营养物质的功能状态。DWI和PWI的意义: (1) 弥散成像-灌注成像 (DWI-PWI) 可早期诊断脑卒中; (2) DWI-PWI之差是治疗时间窗或半暗带存在时间的客观影像学依据[3]。

3.7 MR波谱

原理:MR波谱 (MRS) 分析组织中化学成分, 包括N-乙酰天门冬氨酸 (NAA) 、肌酸、胆碱、乳酸等, 以质子频谱图表示。特点:有助于病变定性但不能作为独立指标诊断疾病。

3.8 MRI脑功能成像 (f MRI)

原理:以脱氧血红蛋白的敏感效应为基础, 对皮质功能进行定位成像。特点: (1) 大脑皮质某一区域兴奋时, 局部氧、血红蛋白含量增加, T2WI信号强度增高; (2) 功能性与形态性影像结合, 为临床诊断提供重要信息。

4 数字减影血管造影 (DSA)

4.1 原理

应用电子计算机程序将组织图像→数字信号输入并储存, 经动脉或静脉注入对比剂获得第2次图像经计算机减影处理 (减去骨骼、脑组织等影像) , 保留充盈对比剂的血管图像, 经再处理传送到监视器。方法:采用股动脉或肱动脉插管法行全脑血管造影, 观察脑血管走行、移位、闭塞、异常血管等。优点:简便快捷、血管影像清晰、可选择性拍片。

4.2 适应证

(1) 头颈部血管病变, 如动脉瘤、血管畸形等; (2) 其他检查方法不能取代。见图4和图5。

5 单光子发射计算机体层脑显像 (SPECT)

5.1 原理

常用的放射性示踪剂如99mTc-HM-PAO, 注射后, 其在脑内分布与局部脑血流量呈正比, 在血流丰富脑组织中聚集并发射单光子, 利用体层扫描、影像重建获得与PET类似的结果[4]。

5.2 临床意义

(1) 主要检测脑血流、脑代谢; (2) 急性脑血管病、癫痫、帕金森病、痴呆分型; (3) 评估脑生理功能。特点: (1) 对颅内占位性病变诊断率约80%; (2) 脑膜瘤、高恶性度脑肿瘤检出>90%。

5.3 方法

(1) 静脉注射显像剂→SPECT系统探测器围绕受检者头部旋转360°采集→图像处理→重建横断面、矢状面、冠状面局部脑血流 (rCBF) 系列三维体层影像; (2) 利用计算机感兴趣区 (ROI) 技术提取各个局部脑放射性计数, 依据生理数学模型计算各部位rCBF。

6 正电子发射体层扫描 (PET)

6.1 原理、方法

(1) 用回旋或线型加速器产生正电子发射同位素 (11C、13N、15O、18F-脱氧葡萄糖、18F-多巴) →经吸入、静脉注射→通过血脑屏障进入脑组织→体外探测仪测定脑不同部位示踪剂浓度在彩色图像上显示差别。 (2) 计算脑血流、氧摄取、葡萄糖利用、18F-多巴分布等。特点: (1) PET是无创性研究人脑生化过程的技术; (2) 反映局部放射性活性浓度的体层图像, 客观描绘人脑生理、病理代谢活动。

6.2 临床意义

可用于: (1) 癫痫病灶定位; (2) 缺血性脑血管病、脑功能研究; (3) 肿瘤组织与放射性坏死组织鉴别; (4) 脑肿瘤分级; (5) 各种痴呆的鉴别:a.Alzheimer病 (AD) ;b.路易体痴呆 (LBD) ;c.血管性痴呆; (6) 帕金森病与帕金森综合征鉴别诊断。

总之, 随着社会的发展与科技的进步, 我们已进入知识快速更新的信息社会, 对临床医师的知识结构和能力提出了新的要求。影像医学作为科学技术发展在医学中的体现, 已成为临床医学诊断中非常重要的依据, 颅脑病变的各种影像学检查的合理应用在神经科专业疾病诊断与治疗方案的确定中极其重要。因此, 对于神经科专业医师的继续医学教育或者是进修学习, 颅脑病变的各种影像学诊断 (包括CT、MRI、DSA、SPECT及PET) 应成为一个非常重要的内容和不可缺少的重要环节, 对神经科专业医师诊断水平及治疗水平的提高, 将起到非常重要的作用。

关键词:神经科,神经影像学技术

参考文献

[1]宋锦宁, 张芬茹, 刘守勋, 等.颅内动脉瘤截瘤动脉闭塞术后局部脑血流的变化研究[J].中华神经外科, 2004, 20 (6) :463-466.

[2]Chung SC, Lee B, Tack GR, et al.The effect of oxygen administra-tion on visuospatial cognitive performance:time course data analysis of MRI[J].Int J Neurosci, 2006, 116 (2) :177-189.

[3]Hoeffner EG, Case I, Jain R, et al.Cerebral perfusion CT:technique and clinical applications[J].Radiology, 2004, 231 (3) :632-644.

利用神经网络技术预测图书借阅量 篇8

一、定性分析

1.单个要素的变化趋势。图书借阅量表面上看与高校扩招、网络普及有一定关系。在分析影响图书借阅量的诸多因素后, 得出最有影响的三大因素, 即教学质量、录取率和生源素质。

首先, 学生进入高校就要保证学业, 特别是在借阅这种行为上, 更是受到高校教学安排的影响。第二, 高校为了保证教学质量, 除了保证课程、课时没有其他的选择, 这种情况亦可造成借阅量下降。第三, 学生的自身素质受扩招的影响呈下降趋势, 其自身学习能力比较弱, 为完成学业, 必须把主要的时间用到课程学习上, 同样导致借阅量下降。

2.借阅倾向的综合评价。首先进行两两因素的关系分析: (1) 录取率 (a) 与教学质量 (b) 之间的关系:录取率高, 意味着教学质量不好保证, 维持教育质量不变, 意味着学生负担加重。因此, 两者与借阅之间的关系是a∧b。即:两个要素都要保证, 不能因为录取率的升高而降低教学质量。 (2) 录取率 (a) 与入学成绩 (c) 之间的关系:录取率高入学成绩就相对低, 这两个要素与借阅之间的关系很明确, 即a∧c。 (3) 教学质量 (b) 和入学成绩 (c) 之间的关系:教学质量与入学成绩代表两个阶段, 入学成绩c好教学质量b易保证, 两者之间借阅倾向关系为b∨c。

3..综合评价逻辑。 (2) 中提出的两两要素之间的关系, 向多个要素之间的逻辑关系转化。第一种逻辑:f (x) =[ (a∧b) ∨ (a∧c) ]∨ (b∨c) =b∨c第二种逻辑:f (x) =[ (a∧b) ∨ (a∧c) ]∧ (b∨c) =a∧ (b∨c) 第三种逻辑:f (x) =[ (a∧b) ∧ (a∧c) ]∧ (b∨c) =a∧b∧c第四种逻辑:f (x) =[ (a∧b) ∧ (a∧c) ]∨ (b∨c) =c∨b第一种逻辑与第四种逻辑相同, 因此, 有效逻辑只有三个。

下面讨论三种逻辑的适应性:第一种逻辑在b→0, 即课业负担很重时, 表达式并未失效, 值f (x) =c表示还能够借阅, 说明这些学生要高出一般同学一个档次。第二种逻辑, 在b→0, 即课业负担很重时, 表达式为f (x) =a∧c, 这个表达式说明, 虽然在高考录取率的情况下考入大学的, 成绩也不错, 因为a、c同时发生了, 能与正常的教学相匹配, 有借阅的倾向, 就看a与c哪个条件好了。第三种逻辑, 在b→0, 即课业负担很重的情况下, 表达式为0, 即f (x) =0, 表示不能借阅, 说明这群人刚够线就被录取, 水平差一些。第二种逻辑表达的信息比较完善, 由于在高录取率的环境下入学, 为了达到高校规定的学分, 必须全力以赴。因此, 我们采用可适应大部分学生的逻辑f (x) =a∧ (b∨c) 。

二、定量分析

1.根据最近几年的统计数据进行隶属函数的确定, 数据圈定在一个比较大的区间里, 目的是有超出统计范围数据时模型不致失效。根据学院图书文献借阅的统计数据建立借阅量隶属函数。2007———2011年借阅量分别为152567册、137377册、108263册、78047册、48695册。从离散点的趋势来看有点像抛物线。设表达式为:Y=f (u (x) ) =A+u2 (x) /k (1-u (x) ) 2 (1) 式中的数据u (x) 的值由第二种逻辑表达式获得, A是最低借阅量。

2.影响学生借阅的第一要素是学生的入学成绩, 入学成绩代表了学生在高中的综合素质, 因此这一要素作为参照, 它与借阅量是正相关的。以吉林省近年的录取分数来量化学生的入学成绩, 其变化趋势大概符合以下函数关系: (1) 当x<b时u (ax) 为0; (2) 当b≤x≤a时u (ax) 等于0.5+0.5*sin (3.14* (x- (a+b) /2) ) / (a-b) ; (3) 当x>a时u (ax) 为1。其中的a是重点线, b是专科线, x为本院录取线 (普通本科线) 。

将吉林省录取分数线代入表达式中, 将分数线量化值列入如下:吉林省分数线:数据来源http://news.xinhua net.com.cn。2007年至2011年重点线 (a) 分别为574、569、539、530、548;普通线 (x) 分别为487、493、466、427、443;专科线 (b) 分别为290、320、350、220、230;量化值u (ax) 分别为0.505、0.507、0.497、0.504、0.504。

3.影响学生借阅的第二要素是录取率, 但是录取率与借阅量呈反比关系。 (1) 当x<a时u (cx) 为1; (2) 当a<x<b时u (cx) 为 (a-x) / (a-b) ; (3) 当x>b时u (cx) 为0。其中a为录取率上限、b为录取率下限、x为本年度录取率。假设a=10%, b=90%, 则化简为下式 (1) x<10%对应u (cx) 为1; (2) 10%<x<90%对应u (cx) 等于 (100%-x) / (100%-10%) ; (3) 90%<x<100%时对应u (cx) 为0。将录取率量化如下:按国家公布的录取率为准量化此函数: (数据腾讯搜索全国录取率) 2007———2011年录取率分别为56%、59%、62%、69%、77%;量化值u (cx) 分别为0.49、0.46、0.42、0.36、0.26。

4.第三个影响因素是教学质量, 教学质量提高意味着课业负担加重, 反之减轻。扩招后不根据学生情况调整课程设置, 意味着负担加重, 借阅可能变小。我们将这个要素打成0分, 放弃此要素的讨论。

5.其他要素如软、硬件设施、网络等在模型要修正时讨论。

6.综合评价:利用第二种逻辑关系。2007———2011年u (cx) 分别为0.49、0.46、0.42、0.36、0.26;u (ax) 分别为0.493、0.494、0.489、0.493、0.485;u (x) =u (ax) ∧u (cx) 分别为0.49、0.46、0.42、0.36、0.25。

7.数据预测:将综合评价得到的u (x) =u (ax) ∧u (cx) 值代入表达式 (1) 中, 表达式中k值暂时定为0.065, A值暂定为3万册, 预测值Y如下:Y=3+u2 (x) /0.065[1-u (x) ]2

2007———2011年具体预测数值分别为:u (x) =u (ax) ∧u (cx) 分别为0.49、0.46、0.42、0.36、0.25;预测值x册, 分别为172016、141638、110673、78678、48024。实际借阅量分别为152567册、137377册、108263册、78047册、48695册。误差率分别为13%、3%、2%、1%、1.5%。

以上模型建立完毕, 下面调试借阅量函数看一年以后的借阅量变化。

借阅量利用原来的函数表达式 (1) , 将以上表格得到的上年度u (x) =u (ax) ∧u (cx) 值代入表达式 (1) 中计算一年后的借阅量, 修改表达式子中k值, 暂时定为0.16。

Y=3+u2 (x) /0.16[1-u (x) ]2

则2009———2011年u (ax) =a∧c分别为0.42、0.36、0.25。对应2010———2012年预测值x册分别为62773册、49775册、36766册;而2010———2011年实际借阅量分别为78047册48695册;对应误差率2010年为-19%、2011年为+2%

以上预测一年后的变化趋势, 误差来源主要是下一年度的录取率及录取线, 因此, 模型还要扩展这两个要素的预测数据, 但是数据可以指导工作。

综上所述, 本文中所提出的影响借阅量的三个因素对预测有实际意义, 并且利用这三个因素之间的逻辑关系得出的判断逻辑较准确可靠。但对于一些客观的潜在因素, 没有考虑进去, 比如高校教学资源的不足, 业余时间的减少, 同样会影响借阅量。另外, 图书馆的自身软硬件条件也是影响读者借阅的重要方面, 这些因素会在后续研究中予以说明。

参考文献

[1]王铭文.模糊数学[M].长春:东北师范大学出版社, 1988.

[2]谭文华.高校图书馆图书流通的灰色预测[J].现代情报, 2003 (10) .

[3]徐莹.图书馆阅览人次的预测[J].情报学报.1997 (12) .

神经网络技术 篇9

1 BP神经网络和Elman神经网络基础理论

1.1 BP神经网络

BP神经网络是一种多层前馈神经网络,其网络结构的模型如图1所示。

由图1所示,BP神经网络是一种具有三层或三层以上神经元的神经网络,包括输入层、隐含层和输出层[2]。其中,输入节点为xi,隐含层输出节点为yj,输出节点为ok,wjk,vij分别为隐含层到输出层,输入层到隐含层的连接权值。f(·)为神经元的激活函数,网络的期望输出为dk,输出误差为E,网络的各层输出关系为:[3]

1.2 Elman神经网络

与BP神经网络不同,Elman神经网络是一种反馈神经网络,该神经网络的结构模型如图2所示。

Elman神经网络由4层结构组成,包括输入层、隐含层、承接层和输出层。其中输入层节点为ur,隐含层输出节点为xn,承接层输出节点为xc,输出层节点为ym,w3,w2,w1分别为隐含层到输出层、输入层到隐含层、承接层到隐含层的连接权值,g(·)为输出神经元的激活函数,f(·)为隐含层神经元的激活函数[4],网络的期望输出为dk,输出误差为E,在k时刻各层之间的输出关系为:[5]

2 神经网络在模拟电路故障诊断中的实现方法

采用神经网络进行模拟电路故障诊断的过程是把故障特征空间向量映射到故障模式空间,从而解决模拟电路故障的识别和分类问题。其诊断步骤如下:

1)构造训练样本集:根据被测模拟电路的特点,选择合适的激励信号和测试点,利用PSpice仿真软件中的灵敏度分析找到对电路工作性能影响较大的元器件,并通过蒙特卡罗分析,针对这些元器件的正常状态和各种故障状态进行多次仿真,得出电路各测试点对应各种状态的输出数据,这些数据经过归一化等适当的处理后作为神经网络的训练样本集。

2)神经网络的结构设计及训练:通过分析仿真得出的训练样本集数据及模拟电路的各种工作状态,设计出合适神经网络结构。其中网络中间层神经元个数的选择是决定网络性能好坏的关键,通常是根据以往的经验以及不断的训练调整,最终确定理想的中间层神经元个数。将处理过的训练样本集输入已经设计好的神经网络中,通过训练算法对其进行训练。

3)神经网络的测试:对电路施加相同的激励信号,得到神经网络的测试样本。将其输入到训练好的神经网络中,进行相应的故障模式识别。并将实际输出的结果与期望诊断的结果进行对比,判断是否达到神经网络的性能要求。

3 实验仿真

待测电路如图3所示,实验针对电路中的单个电阻或电容发生的软故障进行诊断。使用PSpice9.2软件对该电路的正常和不同的故障情况分别进行仿真分析。各元器件标称值如图中所示,其中电阻和电容的容差分别5%和10%。通过灵敏度分析发现,元器件R1,R2,R3,R4,R6和C1的取值发生变化时,对电路输出Vout的波形影响最为显著。

3.1 训练样本集的构建

在电路输入端施加2V的正弦激励,当电路发生故障时,选择其中几个最能反映输出响应波形曲线波动的采样点,从而构成各种故障模式的特征向量,此处选取的采样频率分别为60Hz,120Hz,150Hz,180Hz,250 Hz,300Hz。其中Vout为输出测试点,实验假定电阻和电容在偏离其标称值的±50%时发生软故障。结果将故障分成两类:R↑,R↓和C↑,C↓,加上电路的正常工作状态共计13种故障模式,并采用二进制编码表示。为了提高实验的精度,分别对上述13种工作状态进行30次的蒙特卡罗(MC)分析,得到电路的30个故障样本,其中20个作为样本集进行神经网络的训练,其余的10个作为神经网络的测试样本。部分训练样本经过归一化处理后如表1所示。

3.2 BP神经网络结构的确定与训练

1)BP神经网络结构的确定:通过分析待测电路各种故障模式的特征向量,实验建立一个具有三层网络结构的BP神经网络,其中隐含层神经元个数n2和输入层神经元个数n1之间有以下近似关系:

由于神经网络的输入层神经元的个数为6个,输出层神经元的个数为4个,可得出隐含层的神经元个数近似为13个。隐含层的神经元个数不是固定的,需要经过多次训练进行调整,实验最终选取隐含层神经元个数为12比较理想。

2)BP神经网络训练:将20组的训练样本输入到BP神经网络,隐含层神经元的传递函数为S型正切函数tansig,输出层神经元传递函数采用S型对数函数logsig,误差为0.01,学习率为0.1,训练的误差变化曲线如图4所示,在经过135次训练后,神经网络的性能达到了要求。

3.3 Elman神经网络结构的确定与训练

1)Elman神经网络结构的确定:实验采用单隐层的Elman神经网络,其中由于输入故障特征向量的维数为6,则其输入层神经元的个数为6;而输出向量的维数为4,则输出层神经元的个数为4。为了使网络的诊断误差最小,经过多次训练检验,将隐含层神经元的个数设定为15,能够很好的满足网络的性能要求。

2)Elman神经网络训练:将20组的训练样本输入到BP神经网络,传递函数取tansig,误差为0.01。训练的误差变化曲线如图5所示,在经过75次训练后,网络的性能达到了要求。

3.4 BP神经网络和Elman神经网络的检测结果与对比分析

抽取3组测试样本对训练好的BP神经网络和Elman神经网络进行测试,测试结果如表2所示。

检测结果显示BP神经网络3次测试的误差分别为0.0382、0.0213和0.0676,Elman神经网络3次测试的误差分别为0.0871、0.0369和0.0846。对比两种神经网络的训练过程及检测结果,可以得出BP神经网络收敛速度相对较慢、训练时间长,而且有可能收敛于局部极小值;Elman神经网络的参数调整简单、训练时间短、与BP神经网络相比诊断误差要大一些,但这并不影响其检测的预期结果;另外,Elman神经网络的训练误差曲线要比BP神经网络平滑,性能更加稳定。因此,经过多次训练后,Elman神经网络更适合存在容差、非线性等问题的模拟电路故障诊断。

4 结论

模拟电路的故障诊断问题较为复杂,本文研究了基于BP神经网络和Elman神经网络的模拟电路故障诊断方法。并通过仿真实例对比验证了两种神经网络的训练过程及检测结果。最后分析得出相对于BP神经网络,Elman神经网络具有结构参数调整简单、训练时间短、性能稳定等优势,更适合存在容差、非线性等问题的模拟电路故障诊断。

参考文献

[1]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007:18-19.

[2]葛哲学,孙志强.神经网络理论与MATLABR2007实现[M].北京:电子工业出版社,2007:208-109.

[3]施彦,韩力群,廉小亲.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009:23-24.

[4]张良均,曹晶,蒋世忠.神经网络实用教程[M].北京:机械工业出版社,2008:53-54.

人工神经网络介绍 篇10

机器学习方法经常被应用到解决医学和生物信息学的问题。在这个报告中我列举了一些把机器学习方法应用到生物信息学领域的实例。比如:组建多重神经网络, 运用该神经网络对4种不同形势的肿瘤患者进行分类。

1 介绍

人工神经网络属于机器学习领域。关于人工神经网络的概念最早提出于1940年代。后来在1980年代后被推广应用, 尤其是在医学领域。

其中一个非常有用的用途是对疾病进行分类, 达到诊断的目的, 或者对基因表达进行分类。在这类神经网络里面, k点最近邻居算法是最常被采用的算法。

人工神经网络的优点是:不需要人们蛆关注神经网络里面的细节信息;人工神经网络可以很容易地被重新训练来应对不同地分类数据。人工神经网络可以用来解决有监督学习和无监督学习, 比如:自组织特征映射 (self-organized feature map) 就可以用来解决无监督学习的问题。

它的不足之处在于:人工神经网络往往需要大量的训练数据, 而这些训练数据往往不是很容易获得。人工神经网络可以被看作是一个黑盒, 它的细节隐藏在点点之间的权值里面。这些权值的意义是人类无法理解的。同时, 人工神经网络需要被仔细的训练以避免过拟合的情况出现。我们常常需也要降低高维数据的维度。下面, 我将分析介绍人工神经网络的具体应用。

人工神经网络的结构如图1所示:

X1, X2, X3是该神经网络的输入值, w0, w1, w2, w3是该神经网络的输入结点到内部节点的路径权值, 每个神经元的激活函数是如上图右侧所示的函数图像。

这个函数被称作为sigmoid函数, 表达式如下:

多重神经网络通常有3层, 事实上, 3层神经网络以能进行很好的分类效果。这三个层包括输入层, 隐藏层, 输出层。在每个神经元内部我们可以选择sigmoid激活函数或其他种类的激活函数。

如图2所示:

单个神经元仅能提供线性的分割面, 所以多层神经网络可以提供非线性的分类函数 (即:若干个线性分割面的复杂组合) 。这并不意味着4层神经网络就一定比3层神经网络能一共更好的分类效果, 因为层数越多, 需要的训练集就越庞大, 得到的效果也不会提高。

既然有训练问题, 就会涉及到训练算法。较为早的和著名的训练算法是delta规则。它于20世纪60年代被提出。它的原理是计算理论输出值和世纪输出值的均方差。tp为理论输出值, yp为实际输出值, 表示为:

训练的开始阶段, 我们通常设定一个随机选取值, 令该值等于:

该公式里, α是学习速率, 学习速率越大, 学习的过程就越快, 完成学习的时间短。但如果学习的速率过大, 可能导致网络的理想权值在合理结果的附近游摆而永远无法获得理想的权值。

神经网络被训练好了以后, 它就被用到解决目标问题。原始的数据集可以被分为两部分:一部分用来训练, 一部分用来测试。

有时候神经网络会把训练数据集里面的噪音点的特征纳入自己的权值表达里, 从而该神经网络无法真正体现该点集的真实特征。我们把这种情况叫做过拟合。过拟合是由于网络比待估函数复杂造成的。比如一个可以同3层网络解决的问题, 我们用4层网络或者由更多神经元的三层网络去解决该问题, 就容易造成过拟合。为了更好的明确训练时所采用的神经网络的隐藏层的层数, Livingstone和Manalack提出了如下计算公式:

该公式里m是训练样本的数目, o是该网络的输出值, w是网络权值的数目, D就是隐藏层的数目。

得到了隐藏层的数目之后, 我们可以以这个数目创建神经网络, 边训练边削减, 直到我们获得一个一半化的网络。对于没有隐藏网络层或只有一个隐藏网络层的神经网络, 我们需要先确定它要解决的问题是否是线性的。

适当的训练方案是能也可以使网络的复杂性和数据的复杂性得到合适的匹配。一个合适的训练方案应该是如下步骤:首先选择一个很大的网络并且把它的每个权值都设到一个很小的值上。通过训练, 这些权值可以逐渐游摆到一个合理的值。

由于初始数据集通常要被分为训练集和测试集。在医学领域, 我们能获得的数据集往往很小, 比如某种病的病人数目不会很大。所以我门需要采用交叉验证的技巧来是较小的数据集在被分为训练集和测试集之后能较好的训练神经网络。

摘要:机器学习方法经常被应用到解决医学和生物信息学的问题。本文列举了一些把机器学习方法应用到生物信息学领域的实例。比如:组建多重神经网络, 运用该神经网络对4种不同形势的肿瘤患者进行分类。

关键词:人工,神经网络,机器学习方法

参考文献

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【神经网络技术】相关文章:

神经网络网络舆情论文04-20

神经网络论文07-20

人工神经智能网络06-03

人工神经网络07-06

径向神经网络07-27

神经网络量化07-29

离散神经网络07-30

免疫神经网络08-16

混合神经网络08-22

复合神经网络08-29

上一篇:开放式系统架构下一篇:滨海滩涂地区