统计学习理论

2024-08-07

统计学习理论(精选九篇)

统计学习理论 篇1

统计学习理论(Statistical Learning Theory,简称SLT)是针对小样本统计问题建立的一种新理论,是V.N.Vapnik[1]等人提出的。其核心思想是学习机器要与有限的训练样本相适应。其主要内容包括关键定理,学习过程一致收敛速度的界,结构风险最小化原则和算法研究与应用。支持向量机(Support Vector Machine,简称SVM)就是在此基础上发展起来的新方法,在模式识别、函数拟合、数据挖掘、遥感图像分析等许多方面都有应用,这使得SLT和SVM成为了机器学习领域的研究热点。但统计学习理论也有局限性,比如它是建立在概率空间上的,所处理的样本是实随机样本等。为了使统计学习理论有更广的应用,学者们纷纷打破其局限性来研究统计学习理论。本文主要从三个方面介绍统计学习理论基础研究的新进展:即从概率空间扩展到非概率空间;随机样本变成复随机样本、噪声样本等;同时变换概率空间和随机样本,并提出了对统计学习理论未来发展的展望。

1 统计学习理论基础研究新进展

1.1 概率空间的扩展

概率空间上的集函数具有很强的可加性,而实际应用中有大量的非可加集函数,因此非概率空间引起了学者们的广泛关注,并将统计学习理论从概率空间推广到了各种非概率空间上。这里的非概率空间主要涉及到的有不确定空间、粗糙空间、拟概率空间、泛空间、可能性空间等,解决了非慨率空间上学习理论的关键定理;非慨率空间上学习过程一致收敛速度的界;部分非概率空间上结构风险最小化原则。

1.2 随机样本的变化

实随机样本是统计学习理论所研究的样本,现实中存在着大量非实随机样本,学者们给出了一系列非实随机样本的统计学习理论的新结论。主要有复随机样本、双重随机样本、模糊样本、随机粗糙样本、Hybrid样本等。解决了非实随机样本的统计学习理论基础理论。统计学习理论所研究的样本都是假定不受外界的干扰的。现实应用中样本往往受到外界各种因素的影响。考虑到样本受到等均值噪声影响的统计学习理论有了许多新成果,尤其是和非概率空间相结合在一起,解决了噪声样本的统计学习理论基础理论。

1.3 概率空间的扩展和随机样本的变化两者相结合

将非概率空间和非实随机样本、噪声样本相结合,得到了统计学习理论基础研究的更多更重要的新成果。文献[2]给出了基于Hybrid样本的学习过程一致收敛速度的界文献,文献[3]给出了拟概率空间上样本受噪声影响的SLT关键定理,文献[4]给出了受噪声影响的复Hybrid样本的学习理论关键定理,这些成果极大地拓宽了统计学习理论的研究范围,为其更广泛的应用奠定了理论基础。

2 统计学习理论基础研究总结和展望

统计学习理论作为机器学习的基础理论越来越受到重视。非概率空间上的非实随机样本的统计学习理论的建立不仅具有重要的理论价值,而且具有广阔的应用前景。本文结合近五年来统计学习理论基础研究工作,介绍了统计学习理论基础研究的新进展.从中看出统计学习理论基础研究工作中结构风险最小化原则[5]的研究有涉及但比较少,应用方面的研究更少。总之统计学习理论基础研究工作还有很多尚未解决的问题。目前,统计学习理论基础研究需要进一步做的主要工作有:

第一,进一步完善非概率空间上和非实随机样本的关键定理和学习过程一致收敛速度的界。

第二,进一步研究非概率空间上和非实随机样本的结构风险最小化原则,证明该方法的一致性。

第三,构建非概率空间上和非实随机样本对应的支持向量机(SVM)。

第四,在基础理论研究的基础上研究非概率空间上和非实随机样本的支持向量机在各个方面的应用。

相信统计学习理论的基础研究将不断深入,必将推动支持向量机走向更多更广的实际应用中。

摘要:统计学习理论是研究小样本情况下机器学习的理论。在该理论基础上发展起来的支持向量机在许多方面都有应用。系统地整理分析了统计学习理论基础研究的文献,将其主要划分为概率空间的扩展,随机样本的变化,以及两者相结合三个方面介绍了统计学习理论基础研究的新进展,并对未来的发展进行了展望。

关键词:统计学习理论,非概率空间,非随机样本

参考文献

[1]V.N.Vapnik.Statistical learningtheory[M].New York:AWiley-Interscience Publication,1998.

[2]李俊华,白鹤举.基于Hybrid样本的学习过程一致收敛速度的界[J].河北大学学报(自然科学版),2016(2):113-116.

[3]杜二玲,王英新,李俊华.拟概率空间上样本受噪声影响的SLT关键定理[J].模糊系统与数学,2015(6):119-123.

[4]李俊华,李海军.受噪声影响的复hybrid样本的学习理论关键定理[J].河北大学学报(自然科学版),2014(1):14-18;82.

统计学习理论 篇2

工作总结

统计局中心组理论学习和政治思想工作总结

2009年,××市统计局严格按照中共××市委办公室《关于印发<××市基层党组织中心组理论学习和思想政治工作考核办法>的通知》(万委办【2009】24号)精神,认真做好中心组理论学习和政治思想工作,建立健全了各种学习制度和考核措施,使中心组全体成员政治理论水平和政治思想素

质得到较大提高。

一、中心组理论学习工作

(一)加强领导,切实保障学习时间和效果

一是成立了以局党组书记、局长××同志任组长,副局长、支部书记××

槐任副组长,各股、队、室负责人为成员的中心组理论学习和思想政治工作领导小组,并制定了措施,落实了工作计划。二是坚持理论学习考勤制度、自学制度、发言制度、经验交流制度和通报制度,并做到了考勤规范、集体学习记录清晰、党员干部学习笔记完整。三是坚持集中学习和自学相结合,全年累计集中学习时间达20天,且参学率达98%以上。四是班子成员带头深入基层调查研究,全年班子成员累计调研时间达80多天,并撰写了分析调研文章12篇。五是建立了学习档案,并且做到了学习档案建设规范、完整有序。

(二)联系实际学以致用

一是中心组学习内容紧紧围绕中心,坚持服务大局;学习专题设置合理具有较强的针对性、指导性和创新性。二是通过理论学习,全局职工思想觉悟普遍提高,工作积极性得到充分调动,促进了全局工作的顺利开展,较好地完成了为民办实事的目标任务。三是精神文明建设、综合治安、环境保护、安全工作等方面良性发展,无违法犯罪和严重违纪问题发生。

(三)创新学习方法,确保学习效果

一是局中心组理论学习和思想政治工作领导小组认真履行职责,积 极组织党员干部和全局职工开展政治理论学习,学习方式采取集中学习和自学相结合,个别辅导和分组学习相结合,不断创新学习方式方法。二是完成了上级下达的学习资料征订任务,按规定参加了上级组织的年终理论考试考核工作,并及时报送相关资料。

二、政治思想工作

(一)加强组织领导

一是领导班子十分重视思想政治工作,做到了年初有计划,年终有总结。二是成立了思想政治工作领导小组,确定了局党组书记、局长××为第一责任人,分管领导和其他班子成员分工负责,责任明确。三是加强党支部建设,切实发挥支部的战斗堡垒专用,发挥工会、妇工委等群团组织的作用,形成了齐抓共管、广泛参与的思想政治工作格局。

(二)建立完善制度

建立了思想政治工作目标管理责任制,明确了岗位职责,并层层落实了责任,使思想政治工作制度化、规范化和经常化。二是制定了干部政治理论教育、党组织生活等工作制度。三是落实了党风廉政建设责任制,领导班子成员及党员领导干部廉洁奉公,率先垂范,起好了带头作用。四是建立了思想政治工作评比表彰制度,对优秀思想政治工作者进行表彰奖励,树立典型,推广经验。

(三)加强队伍建设

一是按照《中国共产党和国家机关基层组织工作条例》的规定,配齐了兼

职党务干部,并抓好兼职党务政工干部队伍政治理论学习、业务培训和工

作考核,提高了他们的政治和业务素质。二是把思想政治工作绩效作为考察使用干部的重要依据,把素质好、能力强的干部充实到党务和政工队伍中。

(四)加强阵地建设

一是加强机关文化阵地建设,积极建立学习园地、荣誉陈列室等。二是积极完成了党报党刊征订任务,利用党报党刊开展思想政治教育。

(五)落实工作任务

一是认真落实政治理论学习制度,用党的最新理论成果武装党员,教育广大干部职工树立正确的世界观、人生观、价值观和社会主义荣辱观。二是开展形势政策教育,增强干部职工大局意识、发展意识和服务意识。三是加强职业道德、勤政廉政教育,改进机关工作作风,提高服务效能。四是开展民主法治教育,普及法律知识,增强干部职工法纪观念。五是认真开展文明单位和诚信单位创建活动,努力丰富职工文化生活。今年“七一”前夕,局党支部与市审计局党支部联

合开展了拔河、乒乓球等比赛活动,同时对贫困党员进行了走访慰问,并给贫困党员发放了慰问金。六是深入开展“六型机关”创建活动,今年主要开展了廉洁型、创新型机关创建活动,收到良好效果。

(六)创新思路,更新观念

统计学习理论 篇3

统计理论是一门方法论科学,其在数据分析和处理中发挥着重要作用,把繁杂的数据进行归纳总结,形成理论化的指导,提升电力企业的工作效率,从而实现电力企业的资源最优化配置。在电力系统统计工作中,统计理论应用主要分为四个步骤,这四个步骤相互联系,组成一个完整的数据处理流程。其步骤具体分为:(1)调查设计,这是统计理论开展的首要工作,要对电力系统的应用目标有明确的认知,并根据统计内容来明确工作目标、对象和方法,加强数据统计的针对性;(2)数据收集,其结果直接影响统计结果的真实性和有效性,因此在数据收集时要保证数据的真实性和准确性;(3)数据整理,整理分析工作是把原始资料进行系统化分析,把数据归纳到某个计算系统中,通过对采集数据的分析和处理得出相应的结论;(4)数据应用,统计理论应用的目的是呈现数据背后的市场和企业信息,这些统计信息都是企业战略决策的重要依据。

2 分析统计理论在电力统计工作中的作用

电力行业作为国家支柱产业,带动我国经济的发展,电力企业的工作覆盖面较广,其经营过程中会产生大量的数据,因此对数据的统计是企业管理工作必不可少的工作,统计工作控制着整个企业资料,在第一时间内挖掘数据背后隐藏的市场信息和企业经营状况,从而让管理人员对企业有着清晰的认知,并对电力行业有整体的了解,为企业的战略决策提供可以参考的凭证。再者,统计理论在电力系统工作中应用可以优化工作效率,发挥工作的监督作用,例如统计理论应用于企业财务管理工作,可以明确财务管理各项工作事务,杜绝不法现象的发生,促进电力企业健康可持续发展,对于企业经营有积极的促进作用。

3 分析统计理论在电力统计工作中存在的问题

分析统计理论在电力统计工作中存在着以下的问题:首先是企业中的统计工作机制不完善,很多电力统计工作缺乏明确的目标,也没有建立规范的工作制度,从而影响了统计信息的可靠性,同时统计理论在实践工作中应用缺乏有效的部门沟通,没有采取有效的措施来完善统计理论的检验机制。再者,统计数据缺乏严谨性,电力企业的统计数据量较大,这需要统计人员具备良好的数据甄选能力,再加之信息传播速度较快,统计工作人员数量和质量不佳,从而造成很多统计数据没有纳入到系统中,影响了统计工作开展的有效性。

4 分析统计理论在电力统计工作中的应用

4.1 根据统计学理论建立完善的制度

分析统计理论在电力系统工作中应用首先应当建立完善的制度,尤其是要强化统计结构的分析和应用,电力企业要结合企业发展实际状况,根据企业员工组成、业务范围及地区特点等建立符合企业本身的各项管理体系指标。同时在设定体系指标时,要综合各个影响因素的相互作用,保证得出统计数据具有代表性和权威性,同时统计学理论建立要符合群众的实际需求,要将关系到需求的参数设定到体系中,对需求参数进行重点统计,加强电力企业统计工作的便民性。对电力企业工作中统计理论应用而言,要理清工作需求和工作要点,从繁琐的数据中找出具有参考价值的结论,利用完善的制度来挖掘潜在的信息,同时要掌握统计理论的相关内容,使统计工作具有实用性。

4.2 根据统计学开展实践工作

电力企业资料信息较为繁杂,包含了企业经营、决策及管理等各项工作内容,对统计人员而言,要针对各种数据进行相应的统计,对信息进行筛选处理,并加强各种信息的分析,把统计理论应用到数据分析中,并利用统计信息指导企业工作开展。统计人员要按照统计理论开展的流程,进行分层次分析,及时发现统计数据中发现的问题,并根据结果提出了相应的问题,避免由于统计数据分析不合理造成企业决策失误。再者统计理论在电力统计工作中,统计人员要开展实践工作,将理论体系应用到数据统计和分析中,采用最新的统计技巧和分析方式,发挥统计理论对数据处理的科学性和真实性,提升统计工作效率,得出最准确的统计结论。

4.3 统计理论中对电力统计工作的指导

统计理论应用到系统化的工作体系中,是一项较为复杂的项目工作,在统计理论的应用时,会遇到各种各样的问题,这就需要保证数据来源渠道的严谨性,从企业资料数据库中找出对应的数据,针对统计工作目的制定分析模型,将数据纳入到统计理论模型中,建立数据参数之间的关系,保证各个统计环节紧密联系。统计人员在统计理论应用过程中,对每一个环节工作都保持严谨的态度,以科学的心态来对待数据分析结果,提高得出结论的准确性。对电力企业统计工作人员而言,要具备扎实的统计理论知识和模型构建经验,合理分析数据库中的统计数据,强化统计理论对统计工作的指导。

5 结语

综上所述,对电力企业而言,要将统计理论作为研究基础,根据理论指导开展相应的统计工作,挖掘统计信息对于企业决策的指导性。电力企业要根据统计学理论建立完善的制度,根据统计学理论开展相应的实践工作,提高统计理论对统计工作的指导性。

摘要:当前信息技术飞速发展对电力系统而言,其工作覆盖面较广,业务范围直接扩展到基层,电力统计工作中会出现海量的原始数据,这就给其带来了沉重的工作负担。分析统计理论在电力统计工作中应用可以帮助企业挖掘数据价值,根据数据统计结果来引导企业战略决策,同时提高了企业统计工作效率。本文阐述了分析统计学的一般步骤,并分析了其在电力统计工作中的应用,最后提出了相应的应对策略。

关键词:统计理论,电力统计,工作应用

参考文献

[1]吴俊芳.统计理论对电力统计工作实践的指导作用探究[J].经济论坛,2013(12)

[2]吕一敏.浅谈统计理论对电力统计工作实践的指导作用[J].科技创新导报,2011(35)

统计学习理论 篇4

A.资产=负债+净值 B.金融净资产=资产负债差额-非金融资产

C.资产负债差额=非金融资产-负债

D.国民财产=国内非金融资产合计+对外持有金融净资产(增减符号与等式左边相反)

2.以下指标中,不能反映土地资源利用程度的是()。

A.垦殖率 B.耕地生产率 C.可耕地利用率 D.森林覆盖率

3.一些城市定期监测和公布的空气质量指标,这在环境统计指标体系中属于()。

A.环境压力指标 B.环境状态指标 C.环境反应指标 D.背景指标

4.文盲率是()文盲人口占同年龄组人口数的比率。

A.14岁以上 B.15岁以上 C.16岁以上 D.18岁以上

5.国家统计局每年发布的《国民经济与社会发展统计公报》()。

A.既是专题分析,又是宏观经济分析 B.既是专题分析,又是中观经济分析

C.既是综合分析,又是宏观经济分析 D.既是综合分析,又是中观经济分析

6.定量分析应当与定性分析相结合,两者关系中()。

A.定量分析是最重要的 B.定性分析是最重要的C.定量分析是基础 D.定性分析是基础

7.2006年我国城镇就业人员28310万人,比上年同期增长4.3%;年末城镇登记失业率为4.1%,比上年末下降0.1个百分点,()。

A.对两个指标的评价都属于相对比较

B.对两个指标的评价都属于相差比较

C.对第一个指标的评价属于相对比较,对第二个指标的评价属于相差比较

D.对第一个指标的评价属于相差比较,对第二个指标的评价属于相对比较

8.某地区城镇居民基尼系数为0.5,表明()。

A.该地区城镇居民的收入差距偏大 B.该地区城镇居民的收入比较平均

C.该地区城镇居民的收入差距较小 D.无法做出正确判断

9.欲对某企业的资产负债率(62%)和产品销售率(95%)进行相对化处理以消除量纲影响,分别取上期同行业的平均水平60%和96%作为这两项指标的标准值。正确的处理结果是()。

A.62%÷60%,95%÷96% B.60%÷62%,95%÷96%

C.62%÷60%,96%÷95% D.60%÷62%,96%÷95%

10.对于非单向变化的指标(如通货膨胀率),较为适宜的综合评价方法是()。

A.直接综合法 B.加权平均综合法 C.综合记分法 D.距离法

参考答案:

统计学习理论 篇5

作为工程结构中的梁主要承受弯曲应力和剪应力的作用, 在传统的强度计算中往往以载荷产生的最大的应力小于或等于材料的许用应力为条件来确定结构中梁的尺寸。然而这个许用应力值在不同的弯曲情况下是否相同, 并没有引起足够重视。虽然关于材料强度理论的研究成果非常多[1,2,3,4], 但多数的理论在使用时有特定条件的限制。对于塑性材料往往可用一定的数学表达式来反映材料的力学行为。而对于脆性材料, 由于材料的强度值有较大的离散性, 所以往往采用概率统计理论与强度理论相结合来描述材料的力学规律。作为早期的统计断裂理论, 即Weibull理论, 以“最弱链环节”假设为基础, 给出了用于统计分析脆性材料断裂宏观现象的一种基本方法。Weibull分布较好地反映脆性材料强度的统计规律, 所以为工程技术人员接受, 得到广泛应用。20世纪70~80年代, 以Batdorf[5], Matsuo[6]为首的一些学者分别以平面Griffith裂纹及圆盘裂纹模型模拟工程材料中的缺陷, 结合断裂力学和“最弱链环理论”, 并用破坏固体角反映裂纹分布的随机性, 建立了统计断裂理论, 从而为从简单应力状态下测得的实验数据去分析复杂应力状态下结构的可靠性奠定了科学的理论基础。

本文运用统计断裂理论, 主要针对工程结构中的承受弯曲应力的梁的许用应力作一些研究和探讨, 得到脆性材料在单轴弯曲应力情况下的期望强度和破坏概率的计算公式, 并且对各种应力状态下的期望强度的关系进行了比较, 得到了一些对工程实际有指导意义的结论。

1弯曲应力作用下梁的期望强度和破坏概率

受载体中任意一点的应力状态一般总是可用3个主应力 (σ1, σ2, σ3) 来表示, 当材料内部的裂纹面在应力空间的方位如图1所示, 那么垂直于和平行于裂纹面的正应力和剪应力可表示为:

σn=σ1cos2α+ (σ2cos2β+σ3sin2β) sin2α (1a) τ=[σ12cos2α+ (σ22cos2β+σ32sin2β) sin2α-σn2]1/2 (1b)

定义等效应力σef为:当σef垂直作用于裂纹面方向的无限远处产生的破坏效应与实际应力状态 (σ1, σ2, σ3) 产生的破坏效应相等, 若以分币裂纹模型模拟材料中的缺陷, 由文献[7]可得到等效应力σef为:

σef=σn2+τ2 (1-0.5ν) 2Η (σn, 0) +τ-f|σn|1-0.5νΗ (τf, |σn|) (1-Η (σn, 0) ) (2)

(2) 式中ν是材料的泊松比, H (·) 是Heaviside阶跃函数:

于是在任意应力状态下, 受载构件的破坏概率和期望强度可表示为:

Ρf (σ1, σ2, σ3) =1-exp[-k2πVdV]×0π/20π/2σefmsinαdαdβ (3)

(3) 式中K, m是材料的Weibull参数;V是受载构件的体积。

σ¯ (σ1, σ2, σ3) =01σdΡf (4)

对于单轴均拉应力状态下, 受载构件的破坏概率和期望强度可表示为:

Ρf (0, 0, σ) =1-exp[-kVλuσm] (5) σ¯ (0, 0, σ) =[1kVλu]1/mΓ (1m+1) (6)

式中:λu=01[x2+1-x2 (1-0.5ν) 2]m/2xmdx (7)

Г (·) 为Г函数。

对于如图2所示的弯曲情况, 梁中任意点的应力可表示为:

σ={σmh-zhyθlσm (h-z) (l-y) hl (1-θ) y>θl (8)

(8) 式中σm为:σm=3pl (1-θ) 2h2b (9)

p为弯曲荷载, 2l为支承跨度, b, h是构件的尺寸, 如图2所示。式中0≤θ<1。

于是由式 (1) , 式 (2) , 式 (3) , 式 (4) , 式 (8) 和式 (9) 可推导得到梁的累积断裂概率和期望强度分别为:

Ρf=1-exp[-kVφ (θ) σmmλu] (10)

和:σ¯m=[1kVφ (θ) λu]1mΓ (1m+1) (11)

式中V是受载粱的体积:V=4hbl,

φ (θ) =12 (m+1) (θ+1-θ1+m) (12)

因为0≤θ<1, 而且一般材料的Weibull模量m大于0, 所以可知: φ (θ) <1;而且单轴拉应力状态下材料强度的期望值与单轴弯曲应力状态下强度的期望值之比为:σ¯ (0, 0, σ) /σ¯m=Φ1/m (θ) , 所以弯曲应力状态下的构件的期望强度大于单轴均拉应力状态下的强度;在不同的Weibull模量m情况下, Φ1/m (θ) ~θ的关系由图3所示。由图3可见, Weibull模量m越大, Φ1/m (θ) 就越大;θ越大, Φ1/m (θ) 也就越大。也就是m或者θ越大, 单轴抗拉强度与弯曲强度之比就越大。

(2) 因为Φ (θ) 是单调增加函数, 由式 (11) 可见:θ增大, 构件的期望强度减小, 并且在弯曲应力状态下三点弯曲强度为最大;而在最大弯曲应力σm和受载体积相同的情况下, θ增大, 构件的破坏概率就越大。

2结论与展望

从本文的理论分析结果, 可得到如下结论: (1) 弯曲应力状态下脆性材料的期望强度大于均拉应力状态下的期望强度; (2) 三点弯曲应力状态下的期望强度大于四点弯曲应力状态下的期望强度; (3) 在四点弯曲状态下, 载荷的两作用点的距离越大, 材料的期望强度就越小, 或者在最大弯曲应力相同情况下, 载荷的两作用点的距离越大, 材料的破坏概率越大。可见对于不同弯曲情况下脆性材料的许用应力不能一概取相同的数值。脆性结构因有独特的性质, 所以被广泛用于工程结构中, 而脆结构的破坏往往具有突然发生, 而且后果往往十分严重, 所以应用统计断裂理论来研究此类材料的力学规律是十分必要的。本文只是就单轴弯曲应力状态下研究分析了脆性材料的力学规律, 得到了应该引起工程技术人员重视的一些结论, 其它应力状态下脆性材料的力学行为依有待于继续深入的进行研究。

摘要:基于统计断裂理论, 推导出了脆性材料在三点弯曲、四点弯曲情况下的期望强度和破坏概率的计算公式。研究分析了在以上各种受力状态下材料强度的大小关系。得到的结论为: (1) 弯曲应力状态下材料的期望强度大于均拉应力状态下材料的期望强度; (2) 三点弯曲应力状态下的期望强度大于四点弯曲应力状态下材料的期望强度; (3) 在四点弯曲状态下, 载荷的两作用点的距离越大, 材料的期望强度就越小, 或者在最大弯曲应力相同情况下, 载荷的两作用点的距离越大, 材料的破坏概率越大。这些均对工程实际具有重要的指导意义。

关键词:统计断裂理论,期望强度,破坏概率

参考文献

[1]Yu Maohong.Advancesin strength theori-es for materials under com-plex stress state in the20th Century.Appl Mech Rev, 2002;55 (3) :169—218

[2]朱乃龙.多轴应力状态下脆性材料强度的估算.武汉理工大学学报, 2004;26 (6) :29—31

[3]朱乃龙.脆性材料损伤的概率统计模型研究.武汉理工大学学报, 2004;26 (7) :68—71

[4]张明, 李仲奎, 苏霞.准脆性材料弹性损伤分析中的概率体元建模.岩石力学与工程学报, 2005;24 (23) :4282—4288

[5]Batdorf S B.Fundamentals of the statis-tical theory of fracture, in Fracture Mech-anics of Ceramics.Vol.3, Plenum Press, New York, 1978

[6]Matsuo Y.Statistical fracture theory for multiaxial stress using Weibull s three-parame tersfunction.Engineering Fracture Mechnics, 1981;14 (5) :527—538

统计学习理论 篇6

关键词:行为安全,事故致因“2-4”模型,化工行业,统计分析

0 引言

对以往化工事故进行原因分析,提出相应解决措施,是事故预防的有效方法。现阶段我国学者对化工事故的类型、时间、空间分布进行统计分析[1,2,3],对特定事故[3]或特定类型事故[4]进行原因分析,但鲜有将行为安全理论应用于事故分析中。本文应用基于行为安全理论的事故致因“2 - 4”模型,对10 起化工事故的直接、间接、根本、根源原因进行统计分析,以期提供一种系统、全面的化工事故分析方法和思路。

1 理论基础和事故样本说明

1. 1 理论基础

行为安全认为事故是行为链的运行结果,预防事故需要控制行为链的各环节[5,6]。事故致因“2 - 4”模型是基于行为安全理论,在Heinrich、Bird&Loftus和Reason事故致因链的基础上提出的[7,8,9]。该模型将事故原因分为事故引发人所在组织的内部原因和外部原因。将内部原因分为组织和个人两个行为层面。组织层面的事故原因为组织安全文化缺失( 根源原因) 和组织管理体系缺失( 根本原因) ,个人层面的事故原因为个人安全知识不足、安全意识不高、安全习惯不佳( 间接原因)和人的不安全动作和物的不安全状态( 直接原因) 。这4 类原因分别对应事故发生4 个阶段的行为,即指导行为、运行行为、习惯性行为、一次性行为和物态。正是由于2 个行为层面、4 个阶段的行为控制缺欠导致事故发生[10,11,12,13,14]。事故致因“2 - 4”模型表述为图1[11],图中模块1 ~ 9 都具有详细定义[11]。有效的事故模型是调查、分析、预防事故的基础[15],本文选取该模型作为事故分析的理论基础。

《中华人民共和国安全生产法》规定生产经营单位具有安全生产工作的主体责任,因此组织是预防事故的主体力量。主链条( 模块1 ~ 7) 阐述事故发生的组织内部原因。本文选取主链条对事故样本进行分析。

1. 2 事故样本说明

本文随机选取国家安全生产监督管理总局官方网站上公布的10 起化工事故,从事故调查报告中获取相关信息。10 起事故基本信息见表1。

注: ①事故类型按照《企业职工伤亡事故分类标准》( GB 6441 - 86) 分类; ②运营的合法性是指组织是否按照《中华人民共和国安全生产法》、《安全生产许可证条例》等经过监管部门审批。

2 化工事故原因分类和统计方法

2. 1 直接原因

事故的直接原因是不安全动作和不安全物态。不安全动作,是引起当次事故或对当次事故发生有重要影响的动作。不安全物态,指引起当次事故的不安全物态[11]。

一线操作员工与管理人员工作内容不同,因此表现出不同的不安全动作。本文统计事故报告中提及的、能从中分析出的、与事故直接相关的不安全动作,对一线操作员工和管理人员分开统计。

不安全物态是指事故报告中提到的设备、设施的设计、工艺缺陷。

2. 2 间接原因

事故的间接原因是个人的安全知识、安全意识、安全习惯的缺欠。安全知识是指引起不安全动作或物态的知识。安全意识指及时发现和及时消除危险源的能力。安全习惯指平时的习惯及平时的做法[11]。对于安全知识、安全意识、安全习惯三者的关系认为安全知识不足引起了安全意识不高和安全习惯不佳[10]。10 起事故报告中很少提及组织成员安全知识、安全意识的具体欠缺,本文根据逻辑分析认为违反法律法规、操作规程、安全常识的不安全动作或不安全物态的产生都是由安全知识不足引起的,进而分析出其欠缺的知识点,并且得到安全意识不高的结论。如果事故报告中提及个人多次出现不安全动作,则可认为其安全习惯不佳。此项内容一线操作员工和管理人员分开统计。

2. 3 根本原因

事故的根本原因是组织安全管理体系缺失。本文将职业健康安全管理体系( OHSMS) 作为参照,依据国家标准、行业标准[26,27],着重统计安全管理组织结构、安全管理程序的缺失。事故报告中,对此项原因缺乏直接描述,通过对个人行为的逻辑分析得到此项事故原因。

安全管理程序的缺失和未执行是管理体系的两种问题。安全管理程序缺失是指未将生产各环节形成程序文件。安全管理程序的未执行是安全管理体系未实现“PDCA”的运行模式,即未定期监测执行情况、未对体系执行效果进行评估,未实现体系的持续改进。为了统计方便,本文将某项管理程序的缺失和未执行归为一项。

2. 4 根源原因

事故的根源原因指组织安全文化的缺失。安全文化也称为安全理念,是组织安全指导思想的集合体[10]。我国学者傅贵等人将安全文化内容具体为32 个组成元素,构成安全文化元素表[28]。对照安全文化元素表,找到组织安全文化的缺失,进行统计。

3 化工事故原因统计与分析

3. 1 直接原因统计

10 起事故有一线操作员工违规操作触发的,也有事故发生后一线救援人员违规救援,造成的二次事故。事故1、6、7 的违规违章操作表现为在高温加热流程中反应温度控制不当或操作顺序错误,事故10 中一线员工过量投放反应物料,事故2 是在进入有限空间作业前未对有毒有害气体检测,事故3 是对带压反应釜违规维修,事故4、5、8 是在不满足动火作业条件下违规动火作业。事故1、2、10 是在事故发生后,一线救援人员未采取防护措施进行救援,造成损失扩大。因此,一线操作人员的不安全动作分为违规违章操作和违规救援。

管理人员的不安全动作多隐藏在日常管理活动中。10 起事故中管理人员的不安全动作可以归纳为3 类: ①未进行安全生产条件论证和审批; ②未建立、未运行安全管理体系; ③决策失误。未进行安全生产条件论证和审批指管理人员未依照《中华人民共和国安全生产法》、《危险化学品安全管理条例》等办理生产许可证,未对化工建设项目进行安全生产条件论证; 未建立或未运行安全管理体系是指管理人员未建立合理的安全管理组织机构、完善的安全管理程序,或者未按照管理体系程序进行管理; 决策失误表现在紧急情况下,管理者不能对当前的安全形势进行准确判断,做出决策。

事故1、4、5、9、10 存在不安全物态。事故1、10 中自行改装的反应装置存在缺陷,事故5 中自行设计的硫酸储罐刚度强度不达要求,且罐区没有存液池和防护提等安全设施。事故9 中采用高于正常工艺要求的反应温度并更换原料。事故4 中输油管道与市政排水暗渠交汇。

将10 起事故的直接原因统计如表2。

注: 事故编号与表1 相同。

表2 说明一线员工的不安全动作以违规违章操作为主,管理人员的不安全动作主要有未进行安全生产条件论证和审批,未建立或未运行安全管理体系。通过分析可知正是由于管理人员未进行安全生产条件论证以及在组织运行过程中未实施隐患排查等安全管理程序,才导致了不安全物态存在。所以,不安全物态与管理人员的不安全行为有关。

3. 2 间接原因统计

将10 起化工事故间接原因统计入表3。

注: 事故编号与表1 相同

通过对案例分析,一线操作人员安全知识不足情况如图2 所示,其安全意识不高表现在没有意识到岗位的危险因素( 案例1、2、3、4、5、8、9、10) ,没有意识到违章操作的危险性( 案例1、2、3、4、5、6、7、8、10) ,没有意识到贸然实施救援的危险性( 案例1、2、10) ,没有意识到岗位职责的重要性( 案例4、8) ,没有意识到非正常情况下随意操作的危险性( 案例10) 。安全习惯不佳体现在马虎对待日常安全检查( 案例4) 和随意堆放危化品的不良习惯( 案例9) 。管理人员安全知识不足情况如图3所示,安全意识不高表现为没有意识到缺失安全管理体系或体系运行不力的危险性( 案例1 ~ 10) ,没有意识到在不具备安全生产的条件下进行生产的危险性( 案例1、2、3、5、7、9、10 ) ,没有意识到有效应急预案和应急演练的重要性( 案例1、2、4、6、10) 。安全习惯不佳表现在养成违法经营的习惯( 案例3、5、9、10) 和忽视日常安全检查的习惯( 案例4) 。

从表3 看出: ①10 起事故都涉及一线员工和管理人员安全知识不足、安全意识不高。知识控制是解决这两类欠缺的有效手段。②管理人员的不安全习惯更突出。图2 和图3 得出: 一线操作人员与管理人员缺少的安全知识不同,在进行安全培训时,对缺少的知识重点教育。

3. 3 根本原因统计

通过对事故直接原因和间接原因的分析,对照《危险化学品从业单位安全标准化通用规范》( AQ3013 -2008) ,将10 起事故安全管理体系缺失列入表4。

表4 说明,化工企业安全管理体系不足主要表现在管理体系程序的缺失和未执行。安全教育培训、岗位安全操作、法律法规符合性管理、事故应急救援是安全管理体系中的主要缺失程序,其他化工企业在建立管理体系时更需注重这些程序的编写和执行。

3. 4 根源原因统计

根据前3 项原因分析,对照安全文化元素表找出每个事故组织安全文化元素的缺失,结果如表5 所示。

发生事故的组织都表现出对“安全的重要度”、“安全主要决定于安全意识”、“管理层的负责程度”、“安全培训的作用”、“安全管理体系的作用”这些安全理念理解的不足,说明组织对安全不够重视,没有重视通过解决人的习惯性行为和操作动作以预防事故,管理层对安全不够负责任,同时没能重视安全培训和安全管理体系的重要性。7 个事故组织表现出法律法规缺乏重视,5个组织不注重应急能力的培养。其余表现出的安全文化缺失不是发生事故的组织普遍存在的,但也是事故发生的根源力量。

4 结论及建议

1) 基于行为安全理论的事故致因“2 - 4 ”模型将事故原因具体为2 个层面、4 个阶段的行为控制欠缺,形成具有逻辑的链式结构,提供了层次清晰、定义明确的事故分析方法。本文证明该模型应用于化工事故分析的可行性与有效性,分析结果有助于指导化工行业安全管理实践。

2) 事故案例中一线员工和管理人员在个人行为层面出现不同缺失,因此组织需采取针对性的行为控制措施; 事故发生组织缺失特定的安全管理体系程序以及对特定安全文化元素理解不到位,表明这些组织行为层面缺失是化工行业普遍存在的,在日常安全管理中应给予重视。

关于统计指数理论研究的几点浅思 篇7

关键词:指数的定义,固定篮子,随机指数,经济指数,指数检验

现今, 统计指数分析方法已经是社会经济活动中一种应用非常广泛的分析方法, 大至国家经济发展、经济效益及综合国力的角度研究, 小至于人民生活息息相关的消费者价格指数, 通货膨胀及各种股票价格指数等, 都可以看到指数所扮演的重要角色。指数理论在其从产生到发展的这300多年中, 已经实现了由个体到总体, 由简单到综合, 由静态到动态, 由原子论方法到函数论方法等诸多方面的成熟蜕变, 也实现了从经济到社会甚至是自然领域科学研究的跨领域发展, 其理论本身得到了长足发展。纵观近年的指数理论的研究文献, 各种指数的应用研究不胜枚举, 却鲜有对指数理论的发展进行总结与回顾。正所谓“温故而知新”, 本文试图从指数的定义出发, 简要阐述指数研究内容的内在逻辑, 对指数统计的研究现状进行反思, 对统计指数的未来做出展望。

一、指数的定义之争

指数一词由来已久, 但对于指数的定义, 迄今尚无一个统一的定论。《现代经济辞典》 (2005) 对指数的定义表述为:指数为测定一种变量在时间上或空间上变动程度的相对数。测定一种经济指标在时间上或空间上变动程度的相对数, 称为经济指数。徐国祥 (2009) 在其《统计指数理论及应用研究》中将指数概括为两层含义:一是指数的概念, 即综合反映由多种因素组成的经济现象在不同时间或空间条件下平均变动的相对数;二是指数分析法, 即通过计量各种指数来反映某一经济现象的数量总变动及其组成要素对总变动影响程度的统计方法。

显然, 这些不同的表述并没有赋予统计指数区别于其他一般指数概念的内涵。亢大麟等 (2005) 认为, 统计指数是统计特有的方法之一, 应区别于其他指数 (包括在自然科学中与统计分析无关的一些指数) 的概念, 对其概念的描述应该包括它的性质、特征、核心功能和应用范围。特别是社会实践的进步已经赋予指数更加丰富的内涵, 从这个角度来看, 似乎应该对统计指数下一个更具时代特征的新的定义。

考虑到指数的应用范围的广泛性、方法体系的多样性、研究对象的多元性, 其内涵与外延在不断扩展, 却无统一的定义。正如上文中所述, 统计指数在其自身的发展历史与实践应用中发展成特点鲜明的几大分支, 这几类分支有其各自所能解决与研究的特殊困境与问题, 又相互交错, 共同构成完整又充实的统计指数理论的有机体。也许对统计指数理论下一个“特色”又“准确”的定义是必要的, 但若我们把研究重点转移到统计指数分化出的各个分支的具体的实践、应用与发展中, 统计指数理论自身已阐述其自身的区别于其他的内涵, 其定义已“不言自明”。类似于“大统计学”的称谓, 统计指数在其理论基础的不断深化下, 应用范围逐步扩展到工业生产、进出口贸易、铁路运输、工资、成本、生活费用、股票证券等各个方面, 统计指数已是分析社会经济和景气预测的重要工具, 也被应用于经济效益、生活质量、综合国力、社会发展水平的综合评价研究之中。由此及彼, 现代指数理论的研究与应用也已经趋向于“大指数”的方向。

二、指数研究内容的内在逻辑关系

纵观指数研究全景, 其研究内容可大致分为两方面:一是指数研究方法, 主要包括指数固定篮子方法、随机指数方法、指数检验方法及经济指数方法;二是指数公式形式, 主要有非加权指数公式、加权指数及对偶交叉指数公式。

需要强调的是, 指数的研究方法与公式的变迁是由简单到复杂, 不断发展丰富起来的, 其内在的依存关系是不可剥离开来的。从指数分析方法各自的起源可以看出一些脉络。固定篮子的起源:英国佛里伍德 (1707) 选取某大学学生的部分日常生活用品, 即“5夸特小麦、4桶啤酒和6码布”, 按照1460年与1707年的价格水平测算了该固定组合的货币价值, 其目的在于以该组合的价格变动来近似反映整个社会所有商品在此期间的价格水平变动;随机指数方法的起源:英国杰文斯 (1865) 认为, 两个不同时期的货币数量变动, 会导致所有个体商品价格在除去随机误差外, 价比等比例地发生变化, 而且其将以对数正态分布的形式独立并对称地分布在一个共同均值的周围;指数检验方法:不如前两者那么清晰, 以文献资料为基础, 它应源于对指数公式形式的优劣争鸣之中;经济指数方法:俄国康纽斯在其著作《真实生活成本指数问题》中指出, 指数固定篮子方法中的价格指数强制规定在价格水平不断变化的不同时期篮子内容恒定, 这显然忽视了消费者最优行为理论。他们的关系可以归结为:随机指数的方法致力于打破固定篮子的边界, 将特定的某一固定消费组合推广为整个社会的所有产品;指数检验方法主要应用于对固定篮子方法的公式孰优孰劣的考察中;微观经济放松了篮子的内容恒定的条件, 仅规定价格水平变化前后篮子带给消费者的效用恒定, 使指数研究本身更贴近于现实。所以, 理清了统计指数研究内容各部分的逻辑关系对于初学者来说, 更易抓住要领, 进而系统地学习统计指数理论。

三、对统计指数理论研究现状的述评与反思

在阅读了我国大量的统计指数的有关文献之后, 笔者发现, 对于统计指数理论的研究的文献较少, 对各种具体指数的应用实践的文献众多。早期我国学者主要是介绍国外的先进理论, 也不乏有突出贡献的学者, 如李丰 (1995) 对于实际经济统计数据算出的L氏指数总是大于P氏指数这一经验事实进行了论证, 解释了其背后的经济学意义在于生产发展对生产率提高的依赖性;徐国祥 (1999) 利用微积分理论形成的指数因素分析方法;重庆渝州大学经济系黄应绘 (2004) 设计出用增长速度指标来表示指数, 称其为共变影响增长指数体系, 它可以克服原有的指数体系的“虚增”和“实减”、各因素引起的价值增长百分比之和不等于总的价值增长百分比、“共变影响”及绝对数与相对数不一致的缺陷等。现今仅有的几篇理论方面的文章, 不过是重述前人的思想理论, 基本没有新发现, 更有甚者直接谎称前辈的研究成果为自己的新发现, 如汪慧玲等 (2011) 在其《指数交叉对偶理论及其本质探讨》一文中的两位置交叉对偶、时间交叉对偶乃至其自称创新的多位值交叉对偶的有关指数交叉对偶内容完全是对帕尔·科夫斯的《指数理论与经济现实》片段节选。虽然此个别不能代表全部, 但从中可以隐约感觉到对于统计指数理论研究的靡靡之音。实证研究的风靡之势的确有其道理, 但实证后的思考进而引发理论的前进还是很需要的。在有限的统计指数理论的文章中, 笔者们大都局限于梳理各类指数问题的发展史, 如焦鹏 (2007) 在其著文《关于统计指数型偏误理论的深层次思考》中从指数公式变迁演化的角度梳理了指数型偏误理论的发展史, 其所谓的深层次思考没能跳出前辈们的思考:零偏误的精确意义何在和时间的一维不可逆。其文末提到在国民经济核算领域的年度和季度核算中, 美国和加拿大都已经使用了链式费雪指数, 强调如此能多方面考虑价格指数理论和经济理论的成果。但也许此例背后的为什么比耳熟能详的型偏误的发展史更值得思考和研究。况且, 型偏误理论与统计指数公式的变迁是相辅相成、互相依存的, 或许不需强调是从谁的角度来看谁的发展。再如, 任栋等 (2012) 在其著文《关于统计指数研究的新思考》中总结了统计指数分析方法存在的多达十个方面的问题, 如目前对指数分析方法到底是确定性研究方法和非确定性研究方法的这一基本性质不明确;统计指数体系的应用于各因素变量关系的乘积关系的“经济方程式”导致了其应用范围的狭窄性;现行的以“综合指数分析的一般原则”的统计指数分析方法是一种确定性的分析方法等。其新思考主要从这十个问题展开具体而又乐观的展望。他们认为指数分析方法的确定性与非确定性是最基本的定性问题。然而, 对于指数分析方法的性质, 真的存在确定性与非确定性之争吗?统计指数理论本身就已经有了丰富而长足的发展, 其“固定篮子”方法, 检验理论与公式的变迁本身就是在确定性科学上发展起来的, 随机指数理论是建立在随机理论之上的。不能因为现代随机抽样的现实基础的制约而否定随机指数理论的科学性。况且, 换一种角度理解, 确定性本身就是非确定性的特殊状态。纵观统计指数理论的发展史与整体框架, 无不是确定性科学与随机科学的相互交错, 是否非要将其划分为“确定性指数理论体系”与“非确定性指数理论体系“还有待进一步探讨。其对后面几个问题的思考也主要集中在对指数理论存在的具体问题的梳理与极其乐观的展望上, 并没有给出解决问题本身的新思路。因此, 其在最后也只能得出一个大家公认的问题, 即我国统计学界对于统计指数研究的滞后及学界的些许靡靡之音。

至今, 我国统计指数成系统的教材只有徐国祥 (2009) 《统计指数理论及应用》, 单从这一点就能看出统计指数理论研究领域的人丁稀少。在其书中简要展现了对统计指数定义的争论, 简单阐述了统计指数理论研究分支, 着重介绍了指数因素分析方法和其对指数因素分析方法的改进, 在此基础之上介绍了几种主流的指数的编制, 如物价指数、证券市场价格指数、经济景气指数等的具体编制, 最后介绍了经济指数的季节调整。但纵观指数研究全景, 每种研究方法都已自成体系, 因而现今缺少对指数研究内容各分支的系统的介绍, 对各部分研究内容发展的逻辑关系的梳理也欠缺。值得一提的是, 《统计指数理论与经济现实》一书堪称这门学科的一本必读之物, 我国学者杨增武早在20世纪之末就已在其著文《我国指数理论研究改革刍议》中就已经提到了此书的重要性。然而, 虽然书中运用大量真实数据极尽详实地论述指数公式和指数检验理论的发展进程与研究成果, 强调了指数理论与经济理论的密切关系, 但毕竟其是那一阶段研究成果的产物, 所以局限性也是不可避免的。而从此至今, 统计指数理论乃至其某些分支已经得到长足发展, 更全面、更成体系而又更能展现各分支研究特色的教材是亟需的。

参考文献

[1]帕尔·科夫斯.指数理论与经济现实[M].北京:中国统计出版社, 1990.

[2]亢大麟, 王振龙, 朱文琦.统计指数研究的几点思考[J].统计与决策, 2005 (05) .

[3]郭德辉, 焦鹏.随机指数理论的本质探讨[J].统计与决策, 2008 (14) .

[4]徐国祥.统计指数理论及应用[M].北京:中国统计出版社, 2009.

[5]汪惠玲, 何永涛.指数交叉对偶理论及其本质探讨[J].统计与信息论坛, 2011 (10) .

[6]任栋, 王琦, 周丽晖.关于统计指数研究的新思考[J].统计与决策, 2012 (07) .

现代贝叶斯统计学理论与方法研究 篇8

贝叶斯统计方法是一种以贝叶斯公式为核心,以先验信息和后验信息为综合依据,以“辩证”推断为主要特征的统计方法。与经典的统计归纳推理方法相比,它采用了一种全新的思维范式,将不确定参数看作随机变量,并以贝叶斯理论(Bayes Theory)为基础,将获取数据前人们的主观信念作为先验信息与样本信息进行综合,再根据贝叶斯定理推导出参数的后验概率分布,最后以该后验分布为基础,利用模拟方法进行参数的统计推断。

1 贝叶斯基本统计理论

就基本统计理论而言,贝叶斯统计学与经典统计学存在着重大的差异,其中最主要的特征可以概括为以下三个方面:

1.1“主观”概率

在经典频率统计学中,概率通常被定义为:在同一条件下进行多次重复实验的基础上对事件出现可能性的一种测度,是一种基于数据的“客观”的概率。然而,在贝叶斯统计学中,概率被看作是人们对于一个不确定事件真实度的相信程度或者信念,不依赖事件能否重复,是一种“主观”概率。贝叶斯学派认为频率解释的概率只能应用于在一定时期内可以重复地、无限次地出现的事件,至少在理论上应该如此,然而事实上,一些事件的概率通过大量重复试验获得是不现实的,很多时候人们都是根据已有的知识和逻辑推理能力来对统计问题作出判断的。

1.2 先验信息

对于“客观“概率的经典频率统计学而言,统计推断一般只需要两方面的信息:—是模型信息,即已知(或假定)研究对象(数量特征)形成的总体服从某种概率分布,如正态分布等等。二是数据信息,即通过试验或者调查获得的相关样本数据信息。所有统计推断都仅依赖于这些“客观”样本数据来完成。然而,贝叶斯统计学除了以上两种信息外,还利用另外一种信息,那就是先验信息。基于“主观“概率的贝叶斯统计学认为在进行试验或者调查获取相关数据前,人们往往已经从理论分析、实践经验积累以及主观判断,长期积累了许多资料和信息,这些先验信息使得人们在没有数据的情况下仍然能对不确定事件给出一定的信度评价。如果能够利用这些信息,并与观察数据有机结合起来无疑能帮助提高统计推断的质量,特别是在可获数据较少的情况下,先验信息的作用更为明显。

1.3 未知参数的随机性

在经典统计学派看来,总体中的待估参数是一个普通的未知变量,其值是一个固定不变的常数。为了对这个未知参数进行推断,往往需要从总体中进行大量重复的抽样,被抽取的样本被看成是来自服从一定概率分布(如正态分布)总体的随机变量。因此,经典统计实际上是利用了所有可能的随机样本信息,来实现对某个参数的无偏估计。相反,贝叶斯统计学将任何一个未知参数都看作是随机变量,都具有不确定性,并且可以通过一个概率分布来描述。在获取数据之前可以根据经验或历史资料构建该参数的先验分布,在获得样本数据之后,可以利用样本数据对先验分布修正获得该参数的后验分布。因此,贝叶斯统计所研究的并不是样本空间,而是参数的取值规律,其利用的是已固定的一组样本信息,而非所有可能的随机样本。

2 贝叶斯统计推断方法

参数估计与假设检验构成统计推断的两大基本内容,贝叶斯统计学在这两个方面形成了与频率统计学相平行的理论方法,并赋予统计推断以新的解释。

2.1 点估计

2.2 区间估计

2.3 假设检验

对于假设检验问题,经典统计学运用的是反证思想进行推断。即认定在一次实验中,小概率事件不会发生的前提下,如果观察到的事件,是H0为真时不合理的小概率事件,则拒绝原假设H0。具体可表示为如果α代表小概率,那么在原假设H0为真的条件下,若样本y发生的概率P(y/H0)<α,则说明是小概率事件,原假设H0为假。

与之不同的是,贝叶斯统计学直接讨论H0和H1的后验概率,通过比较后验概率的大小进行判断。如果P(H0/y)和P(H1/y)分别为两个假设事件的后验概率,那么当P(H0/y)<P(H1/y)时,则拒绝原假设H0,反之则接受。

事实上,上述两种推断方法在一定程度上统一于贝叶斯公式。由贝叶斯公式容易得到:

因此,当P(H0)=P(H1),即H0与H1居于平等地位时,经典学派与贝叶斯学派的结果是一致的。然而,在进行假设检验的时候,原假设和备择假设的提法一般是有讲究的,它要求把带有倾向性的意见当作备择假设,而把与备择假设相对立的假设作为原假设。因此,H0常居于将被否定的位置,由于这种倾向性意见的存在,经典统计推断的结果很容易受到原假设和备择假设的位置的影响,当两种假设的位置互换后,其推断结果很可能不同。但对于贝叶斯统计推断而言,由于是基于各个假设的后验概率进行判断,因此其推断结果并不受到两者位置的影响。

此外,经典统计学中的假设检验也存在如同参数估计解释那样的问题。如果在给定的显著水平α下,根据经典统计学的解释是,在可能的CNn个样本中,共做CNn次假设检验,其中平均有αCNn次否定了原假设,而(1-α)CNn次没有拒绝原假设,因此,同样没有直接回答原假设成不成立的问题。而贝叶斯假设检验不要求接受或是拒绝某个假设,因为后验机会比就足以说明问题。

贝叶斯统计在检验问题中的另外一个优势在于多重检验问题,是经典统计所办不到的。例如将假设设为:H0∶θ=0;H1∶θ>0;H2∶θ<0。贝叶斯统计中只需分别计算H0、H1和H2的后验概率来做出推断,而经典统计方法则很难去处理此类问题。

3 结论与展望

由上所述,贝叶斯统计学能够不断发展壮大的原因在于,在很多方面它比经典统计有明显的优势。然而,贝叶斯统计学赖以与经典统计学叫板的地方,恰恰是其受到质疑的地方。贝叶斯学派受到的批评集中于两个方面:一是,将参数看成是随机变量是否妥当;二是,参数的先验分布的主观问题。其实在许多情况下,如果不考虑其中涉及到的统计思想和概率理论基础,用贝叶斯统计方法导出来的结果与经典统计学几乎没有二致。贝叶斯统计学与经典统计学不存在谁要取代谁的问题,解决二者之间争论的最好办法,恐怕还要着眼于相互取长补短,一切以能得到良好的统计推断为根本目的。

参考文献

[1]谢俊.贝叶斯统计方法与传统统计方法的比较分析与展望[J].中国商界,2009(4):115-117.

[2]余强,姚宗静.Bayes统计的起源、发展和若干应用[J].考试周刊,2010(01):193-194.

[3]王洪春.贝叶斯公式与贝叶斯统计[J].重庆科技学院学报(自然科学版),2010(6):203-205.

[4]刘乐平,袁卫.现代贝叶斯分析与现代统计推断[J].经济理论与经济管理,2004(6):12-17.

[5]成平,陈希孺.贝叶斯(Bayes)学派的统计思想[J].数学通报,1994(7):36-38.

[6]彭桂芳,陈洪.贝叶斯学派丰富和发展了古典统计学[J].东莞理工学院学报,1994(2):90-95.

统计学习理论 篇9

随着我国经济的发展,人们对理财的作用和功能越来越重视。而其中商业银行是大众理财的主要选择对象。为使理财产品有更加广阔的市场,就需要对产品特性及其组合进行深入研究,以实现在影响消费者购买决策中产生最显著的效用。人们希望在产品特性与效用之间建立起一种关系来对产品特性的效用进行明确的数量化解释,而且当产品的某种潜在特性组合得以确定后,其效用也可以预测。

本文通过联合分析的方法对理财产品进行分析,运用统计软件SPSS得出产品特性的效用函数后,对理财产品的市场前景进行预测分析并寻求各产品特性的最适组合。

2 联合分析在理财产品市场预测中的应用

2.1 确定理财产品的属性与属性水平

本文针对理财产品的各种属性以及查阅相关文献后挑选出最具代表性的四种属性及其相应水平如下表:

2.2 正交设计与产品模拟

本文选择的理财产品的属性有4种,每个属性下均有3个水平,若是全部组合,则共有81种组合,让被调查者对81种组合打分实在过于困难,因此通过正交试验设计的方法,挑出具有代表性的9种组合产品。

2.3 对虚拟产品进行打分评价

建立产品卡片之后,每一个卡片就成了一种购物的选择,同时要通过问卷调查的数据收集方式了解顾客对产品的爱好选择,1~9表示购满意愿的强烈程度。

假设某个被调查者对9种虚拟理财产品的购买意愿程度如表3所示,可基于此作进一步分析。

2.4 属性效用的计算

通过统计软件SPSS的联合分析CONJOINT模块进行分析,得到各属性及其水平效用值。

观察上表,首先对联合分析进行拟合优度检验,这里采用Pearson的R检验和Kendall的tau检验,可以得知两个相关系数的检验都非常显著(在0.05水平下),可以认为联合分析模型所做出的假设和得出的成分效用值是合理的。

因子比重表示此产品特征在此类消费者的选择中的影响程度。水平值的效度表示该水平值对于消费者而言的效度,效度越高表示此水平越受欢迎。

2.5 理财产品市场预测分析

由表4看出本文所调查的此类消费者最为关注的是理财产品的风险大小,其次是所能获得的收益,而该类消费者最不关注的是产品的流动性。收益是消费者购买理财产品的初衷,然而此类消费者同时期望尽可能地规避风险。为了进一步分析何种产品对此类消费者的效用最高,我们计算此虚拟理财产品的总效度。如产品序号为1的虚拟产品,其效度计算公式如下所示,同理计算得到9种虚拟理财产品的总效度结果如表5所示。

U1=U(风险+收益性+流动性+认购门槛)=1.111+0.111-0.222-0.222=0.778

由表5我们可以得出虚拟理财产品总效度最高的为8号产品,总效度最低的为9号产品,8号产品与9号产品的流动性都处于一般水平,然而它们的效度却相差4.001,也就是说比起流动性,风险更是消费者选择的关键。由此我们不妨挑选出风险低的几类产品来着重分析它们的市场前景,即1、2、8号产品。2号产品虽然是低风险产品,但低收益使得它的总效度为负值。而对于消费者来说,推出8号产品显然是他们乐意看到的。但商业银行既要保证客户的风险低水平,又要给予客户高收益显然对于银行来说是不经济的。因此综合考虑,商业银行可以考虑推出1号产品。

3 结论

本文通过联合分析的方法,为商业银行提供了良好的信息。他们可以了解消费者的偏好,制定出在未来市场中有竞争力的产品,同时银行也可以考虑自身情况,使理财产品的设计价值最优化。联合分析法在市场营销中就起着独特的作用,可推广应用于其他产品及服务领域。

参考文献

[1]张祖庆,姜雅莉.基于联合分析法的消费者对产品支付意愿和偏好研究[J].统计与决策,2011(3).

[2]于坤章,刘海涛.联合分析法在顾客价值测量中的运用[J].科技和产业,2005(10).

上一篇:高职排球下一篇:让压岁钱更有意义