统计应用

2024-05-17

统计应用(精选十篇)

统计应用 篇1

当前的分析软件大多采用传统的统计技术和多维分析技术, 这些技术是验证型的技术, 难以获得隐藏在数据背后的知识。为此, 笔者认为有必要更多地引入一些数理统计方法进行数据分析。例如, 从一家超市的数据中, 可以发现的一条典型关联规则可能是“买面包和黄油的顾客十有八九也买牛奶”, 也可能是“买食品的顾客几乎都用信用卡”。因此, 数理统计方法的应用是统计分析发展的必然趋势。

1 应用数据分析开展海关统计监测的有利条件

建国以来, 中国海关已经形成了一套有自己特色的海关制度, 并为我国的出口贸易事业做出了贡献。H2000系统的全国推广使“电子海关”的可靠性、安全性和可扩充性进一步得到提高, 信息化的应用效益发生了质的飞跃, 这就为统计监测的数据分析奠定了坚实的基础。

2 数理统计分析在海关统计监测中具有的发展潜力

海关业务工作中具备了极大的数据流, 在此基础上, 做好数据分析不仅成为一项重要工程;同时, 随着海关业务的不断变革, 数据分析又成为一项时刻面临新任务的工作。

然而, 随着海关统计工作的进一步发展, 人们自然也对统计数据的利用提出了更高的要求, 例如, 在业务统计中的货运量指标, 除了目前将单月货运量数据放到前12个月进行平均值比对, 将来是否可以将货运量数据与报关单量、集装箱量、进出口贸易值等数据相结合开展相关分析, 从而开展更有针对性的监测;同样, 在贸易统计工作中, 为了更好地应对我国入世后层出不穷的贸易壁垒, 如何提高贸易统计系统中进出口数据监测效果, 以更有效地进行统计预警?

这些也许都只是在海关统计工作中产生的一些设想, 为了达成这些目标, 笔者认为有必要在海关工作中更多地引入数理统计方法, 以数学的眼光追寻数字背后的规律。

3 介绍统计监测中可采用的数理统计分析方法

3.1 多元统计分析的概念介绍

在海关业务中, 受多种指标 (随机变量) 共同作用和影响的现象大量存在。如果把多个指标分开分析, 一次处理一个去分析研究, 不仅会丢失很多信息, 往往也不容易取得好的研究结论。更科学的做法是同时进行分析研究, 即用多元统计分析方法来解决, 通过对多个指标数据的分析, 来研究指标之间的相互关系以及揭示各指标的内在规律。所以, 多元统计分析就是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科, 也是笔者认为海关统计监测中可主要采取的统计分析方法。多元分析包括的主要内容有多元数据图表示法、聚类分析、判别分析、主成分分析、因子分析、对应分析、多重多元回归分析、典型相关分析、路径分析、多维标度法等。

3.2 在海关业务中几种应用情况的设想

首先, 以业务统计工作为例, 业务统计数据涵盖广泛, 包括了监管、保税、缉私、关税等多类指标, 不同类指标尽管数据源不同, 但作为对海关业务量和业务管理状况的反映, 指标间应该具有一定的相互联系。在目前情况下, 业务统计系统采用的指标检查方法主要是在同类指标间进行逻辑检查和经验值检查, 例如将某项指标与该指标前12月平均值进行对比, 但考虑到口岸贸易量存在一定变化幅度, 为此, 笔者设想可以通过开展不同类指标间的“相关分析”进行数据检测。首先确定这些指标之间是否相关, 如果相关则可以通过计算建立这些指标间的回归方程, 得出指标间关系的合理范围, 从而在某一项指标于其他指标间出现异常变化及时给与预警。

此外, 在目前经常出现的贸易争端中, 国外常指责我国某项商品的出口出现异常变动, 为此, 是否可以在贸易统计数据中采取多项商品联合分析的方法。例如, 在纺织品出口中, 是否可以将手套、袜子、围巾等类似商品近几年对美国的出口情况进行分析, 研究各种商品出口的内在规律, 从而在某类商品出口情况相对于其他商品发生异动时及时予以示警。

4 开展数据分析需要关注的问题

人们通常把数据分析的工具看得过分神秘, 认为只要有了一个工具, 就能自动挖掘出所需要的信息, 这是认识上的一个误区。要想真正做好数据分析, 数据分析的技术工具只是其中的一个方面, 更重要的是还需要对海关业务的深入了解和数据分析经验。因此海关统计的数据分析必须有来自不同部门的人员共同参与:包括技术专家、数据管理员、数据分析人员、业务分析人员等。因此要得到其他部门有效支持, 才能真正把分析出来的信息与实际业务相结合。

在统计应用发展的过程中, 数学仍是数据分析的基础, 而计算机等信息技术已经成为统计应用的首要工具。在海关统计工作中, 建立以数据挖掘为代表的计算机统计分析系统将是深入开展统计应用的关键需求和亟待开发的课题。相信在全体海关统计人的努力下, 通过切实加强海关统计分析预警监测能力, 我们一定能够为全面提高海关把关服务能力做出更大的贡献。

参考文献

[1]盛骤, 谢式千, 潘承毅.概率论与数理统计.

苏大应用统计与统计学考研完整攻略 篇2

(初试篇)

各位同学大家好,我希望当你们看到这篇文章时,心里已经有了自己明确的考研目标,无论你考苏大与否,我希望大家都要尽早确定目标,不要左顾右盼,浪费时间,好的,言归正传,以下是送给考苏州大学应用统计或者统计学研究生的同学的一些经验。

请各位同学注意,不要完全相信苏大网站上给的参考内容,因为苏大老师出题从不限于边框,他会根据苏大本科的学习内容来出题,近来我和出题老师(我的以前的任课老师)聊了一下,现在推出最新权威版苏大应用统计专硕初试和复试参考内容:初试包括统计学(贾俊平,人大出版,起码第四版),概率论(魏宗舒,高等教育出版社,第二版),应用时间序列(王燕,人大出版,第三版),复试包括多元统计(何晓群,人大出版,第四版),概率论(魏宗舒,高等教育出版社,第二版),回归分析(何晓群,刘文卿,第三版),应用时间序列(王燕,人大出版,第三版)(多元统计和回归分析比重较小,应用时间序列比重会加大,重点当然还是统计学)。

在了解了具体参考书目的基础上,在考研复习中更重要的是复习的方法与策略,群主总结了自身的复习方法,同时也走访了其他一些考研成功的同学,整合出一份相对科学的考研复习方法。

很多同学都不知道应该什么时候开始准备考研复习,群主认为,这个问题没有标准答案,看自身学习能力吧!但是群主还是建议大家可以早一点准备,特别是英语和专业课,毕竟时间充足对于考研成功至关重要,以下群主分享一下各科的复习经验。

①英语篇

英语属于一门从开始准备考研到考研前一天晚上每一天都要学习的科目,英语复习中,主要包含英语单词,阅读,作文三个主要部分,对于英语单词,群主当时每天背半个单元(50个单词左右,大家,切记,莫要贪多!),采取的方法是死缠烂打,重复记忆才能成为永久记忆。早上吃过饭背一次单词,中午吃过饭背一次单词,晚上睡前背一次单词,每天重复三次,一周回顾一次,一个月再回顾一次,方法虽然笨,但是有效!单词群主推荐红皮书,难度适中!对于阅读,建议大家每天做两篇,开始做阅读,大家一般会怀疑人生,被自己的错误率震惊到,坚持下去,你会发现会有意想不到的事情发生!阅读推荐张剑的!至于作文,有能力有条件的同学可以每周自己写一两篇考研作文,群主当时没怎么看作文,而是考前一个月左右背各种作文模板,万能金句等,群主再次提醒大家,英语一定要每天都看,坚持到最后走上考场那一天!

②专业课篇

专业课可能属于大家相对有些陌生的部分,所以建议大家早点准备专业课的复习,拿到专业课考试的参考书目是基本要求,苏大专业课特点在于考的知识点全面,需要考生掌握大量知识点,所以有时分数高低的区别往往在于是否对知识点的覆盖到位。对于专业课的参考教材,大家要至少过三遍,群主当时看了多少遍自己也记不清了。每一次都会有收获哦!对于专业课这一块,大家可以根据自身能力选择方法,感觉自身能力强的同学,可以自己完成专业课的复习工作。想要节省时间,提高复习效率的同学,群主这边代售复习笔记,具体在文后会有介绍。

③数学篇

数学属于考研中比较拉分的一个科目,学得好的同学分数很高,相反的可以很低,所以大家对于数学的复习要高度重视。数学同样属于一门需要早一点准备的科目,全程至少需要四轮复习,至于参考书目不需要多,只要一本李永乐的复习全书以及1000题就可以,后期再做一点真题就可以,如果各位同学可以保质保量地完成任务,这个题量其实已经足矣了,接下来说一下每一轮的具体复习时间。

第一轮:3月份--6月份,这一轮主要是对复习全书的初步学习,大家要尽量保证看懂每一个知识点,同时做一下对应的例题,加深理解,此时不用做课后习题,只要例题就可以,标记好错题,之所以花费三个月的时间复习,就是要大家要保证质量,不要贪快,否则第二轮的复习就会陷入困境,可能还要重新开始第一轮的复习,反而浪费时间了!

第二轮:7月份--9月份,在第一轮复习打好基础的前提下,第二轮的复习需要加大强度了,同时对于知识点的理解也会更透彻,复习知识点的同时要重新做一遍第一轮的错题,并且要做课后习题了,同样要标记好错题

第三轮:10月份--11月份,第三轮复习是完全做题的时间,前两轮的复习已经使大家对于知识点的理解与记忆达到一定水平,这时就是考察自己学习水平的时候了,每天给自己安排1000题的定量题目,做题的同时也是自己整合知识点融会贯通,打通自己任督二脉的时候,此时遇到不懂的地方一定做好笔记,因为在前两轮的基础上,在第三轮依然会碰到不会做的题目,这说明困难的地方就是你的盲点或者难点,对于这一部分,才是大家以后重点复习的地方!

第四轮:12月份,第四轮的复习需要大家做一些真题以及预测真题,不要抱有那种压中题目的侥幸心理,同时这时也需要大家以一个更高的角度去审视整个全书,而不是仅仅停留在某一章,大家要注意每一章之间的联系,以及一些相似知识点的区别,能够看到目录知道任何一章的内容。同时,大家在复习数学的时候要注意高数,线代和概率论要同时进行,不要按照全书给的页码顺序复习!

④政治篇

之所以把政治的复习放到最后,是因为政治的复习是最晚的,大家可以在暑假七八月份的时候开始看,注意,是单纯地看,不要背诵,也不需要真正理解(坦白地说,直至考完,能够完全真正理解政治中马原的同学也是凤毛麟角),只是熟悉一下就可以,这样后期大家碰到马原的时候也会有点心理准备,不至于那么慌。政治的复习资料推荐大家选择肖秀荣的复习全书,以及配套的题目,大家在九月份的时候开始有意识地复习全书,也就是要求自己理解知识点,但不要背诵,此时要做每一章节的配套题目,十月中旬的时候开始背诵知识点,后期肖秀荣的八套卷以及风中劲草对大家会有很大帮助,马原可能会让大家在复习时心烦意乱,但是只要大家和它死磕到底,最终你会发现慢慢也就理解很多内容了。

⑤四科总结篇

对于四门科目,数学和专业课是大家拿分的重点,英语和政治大家一般差也不会多差,好也不会多好,所以要求大家要合理分配好各科的复习时间,特别是政治,一旦时间不够,优先放弃政治,因为你会发现即使放弃,最终成绩也不见得比别人少几分,甚至不一定比别人低(这个是真的),我有一个同学从始至中没有完整复习一遍政治,最终成绩与我只差还不到10分,但是数学和专业课差10分简直就太容易了,所以大家要坚持能拿高分的拿高分,拿不了高分的也不比别人少几分,这才是必胜策略!!

(复试篇)

初试结束后,大家可以疯狂释放一下积攒许久的能量,初试成绩一般在2月中旬左右公布,苏大的复试线一般会在3月初左右公布(每年时间可能会有微小差别),复试时间一般在3月底。大家在查到自己的初试成绩之后,要结合个人情况与往年的复试线安排好后期的工作。成绩高的直接准备苏大复试,低的直接在研招网上寻找调剂院校,不高不低的两手准备。很多同学都有一个疑问,那就是查到初试成绩后需要联系院里导师吗?群主这边统一回复,其实没必要,首先,导师们不决定各位同学在复试中的成绩,即使各位联系也不会取得什么有用的信息,老师也不会因为之前和你联系过而在复试时给你特权,所以,一切都要靠自己的实力,公平复试。复试一般包括专业课笔试,专业课面试,以及英语与专业课混合面试。有幸通过复试的同学,苏大一般会电话通知,同时也会EMS发放录取通知书,各位同学在拿到录取通知书的时候再联系导师,这时导师们才会换一种态度和各位聊天!

(祝愿篇)

不想说什么酸溜溜的话,只是希望各位同学一旦选择考研就不要轻易放弃(虽然每年都有中途放弃的人),考研是一条走上更高台阶经过的孤独的小路,能走到最后的都是英雄!起码可以证明你是一个可以为了心中目标坚持到底的人!

群主会一路陪伴大家,时刻为大家提供院里各种最新内部考研信息,各位同学无论有学习上还是心理上的问题都可以找群主聊聊,群主一定知无不言,言无不尽!随时解答同学们的各种疑惑,同学们,有缘,我们苏大见!!

考研中重要的时间点

3月份:考研准备(群主建议)

十月初:预报名(此时的网上报名不一定是最终结果,可以更改)十月底:报名截止日期,此时报名的窗口会关闭,在此之前,会有现场确认的环节。

12月最后一个周六周日:初试时间 2月中旬:初试成绩公布 次年3月初:苏大复试线公布 次年3月底:苏大复试开始

关注统计 思考应用 篇3

所以从《课标》要求和《考纲》要求等方面来看,统计这一内容显得更为重要,考统计的解答题已成为高考的一种趋势,特别是文科.

抽样方法是统计学的基础.2001年天津卷首次考查抽样方法.《考纲》要求学生“理解”随机抽样的必要性和重要性.简单随机抽样要求的是“会用”,突出抽样的“等可能性”,与“古典概型”交汇考查较多,一般不单独考查.分层抽样和系统抽样的要求虽然是“了解”,但其方法的独特性使它成为高考的常考点.

例1(2006湖北文17)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定

(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例;

(Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数.

评注:本题在生活化应用的包装下,考查分层抽样知识.抽样方法考查的重点集中在分层抽样,注意其“成比例”,偶尔考查系统抽样,注意其“等距性”;在统计的解答题中,常常将抽样方法作为基础性知识先行考查,再利用所得数据考查其它知识,这种考查方式在文科试题中尤为明显.

《考纲》要求学生“了解”分布的意义和作用,会列频率分布表、会画频率分布直方图及频率折线图,“理解”它们各自的特点.图、表是数据统计分析的重要工具和手段.不同的图、表从各自的角度反映数据的特点,传递相应的统计信息.图、表的工具属性显示出其在基于“应用”的“统计”考查中不可替代的作用.2005年江西卷首次考查频率分布直方图.

例2(2010安徽文18)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):

61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,

91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.

(1)完成频率分布表;

(2)作出频率分布直方图;

(3)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.

请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.

评注:结合生活化背景考查频率分布表、频率分布直方图是高考的热点,其方式主要是理解频率分布表、频率分布直方图,并由图、表得到数据相关信息,在此基础上考查频率、频数、样本容量,并与概率或其它知识交汇考查.在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率,各个小矩形的面积的和等于1.对于像本例第(3)问这样的开放性问题的回答,要选择适当的数据特征进行考查,根据数据特征分析得出实际问题的结论.另外,值得注意的是,频率折线图还没有在高考试题中出现.

茎叶图是新课标新增的内容,它是用来表示样本数据分布的一种方法,在样本数据较少时,用茎叶图表示数据的效果更好.2008年山东卷、海南卷首次考查茎叶图.

例3(2009安徽文17)某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:

品种A: 357,359,367,368,375,388,392,399,

400,405,412,414,415,421,423,423,427,430,430,

434,443,445,445,451,454

品种B:363,371,374,383,385,386,391,392,

394,394,395,397,397,400,401,401,403,406,407,

410,412,415,416,422,430

(1)完成所附的茎叶图;

(2)用茎叶图处理现有的数据,有什么优点?

(3)通过观察茎叶图,对品种与亩产量及其稳定性进行比较,写出统计结论.

评注:本题源于课本而高于课本,不少学生由于缺乏对这部分内容的重视,以至对相关知识一知半解,造成不必要的失分,尤其是第(2)和第(3)问.分析样本数据,得出统计结论是本题命制的出发点,也是统计学的本质.因此,基于“应用”的“统计”考查应立足于此.本题对统计的考查有良好的导向作用.

众数、中位数、平均数是初中就学习了样本数据的基本数字特征.值得注意的是,高中课本新增了从频率分布直方图中估计样本的众数、中位数、平均数.2009年海南卷首次考查从频率分布直方图中估计样本的众数、中位数、平均数.

例4(2009海南文19)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).

(1)A类工人中和B类工人中各抽查多少工人;

(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.

①先确定x、y,再完成频率分布直方图,就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)

②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).

评注:本题首次考查从频率分布直方图中估计样本的平均数,2010年辽宁卷考查了从频率分布直方图中估计样本的中位数.在频率分布直方图中样本众数的估计值是图中最高矩形的中点的横坐标;利用中位数左边和右边的直方图面积相等估计样本的中位数;样本平均数的估计值等于每个小矩形的面积乘以底边中点的横坐标之和.

极差、标准差、方差也是初中就学习了样本数据的基本数字特征,高中没有新增知识.《考纲》要求“理解”样本标准差的意义和作用,会计算数据标准差,并给出合理的解释.2002年天津南卷首次考查标准差.

例5(2011辽宁文19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.

nlc202309031042

(1)假设n=2,求第一大块地都种植品种甲的概率;

(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm2)如下表:

分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?

评注:本题虽有生活化背景的包装,其本质还是应用有关公式计算基本数字特征(平均数和方差),是基本知识的应用,但要避免计算错误,并能根据平均数和方差,给出合理的解释.

线性回归自1999年进入高中数学选修教材、2005年进入高中数学必修教材以来,很长时间内高考数学试卷中几乎没见线性回归试题的身影.而在2007年高考结束后,关注高考的人都知道2007年广东高考数学有一道关于线性回归的解答题.2011年线性回归题更在6个省市卷中集中亮相.在此之前,大多数师生认为这部分内容即便是使用计算器,计算量也很大,更何况高考不允许使用计算器,因此这部分内容很难出考试题,所以学习线性回归时总是一带而过.导致原本简单的题目让不少考生无从下手,这不得不引起我们对这方面知识的思考、重视.

例6(2011安徽文20)某地最近十年粮食需求量逐年上升,下表是部分统计数据:

(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;

(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.

评注:线性回归的常考点:

独立性检验问题是新课改中增加的内容之一,具有很强的现实背景和较强的实践性.与它有关的试题往往情景新颖,富有时代气息,贴近生活实际,加之大家对模型都非常熟悉,能充分调动学生运用数学的思想和意识,从而激发他们对生活、对数学的热爱.正因为如此,它成为近三年高考的一大“亮点”.2009年辽宁卷首次考查独立性检验.

例7(2010海南文19理19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;

(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?

(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.

评注:解答独立性检验问题,首先应该判断该题是不是独立性检验问题(如2010年广东卷文科第17题第(1)问就不是独立性检验问题,不少考生用了独立性检验的方法,浪费了宝贵时间),然后确定a,b,c,d,以便利用公式计算观测值(计算时应充分约分,以便减小计算量),再查表判断.常见的两种提问方式为:在犯错误的概率不超过x的前提下,能否认为“某某与某某有关”;能否有x%以上的把握认为“某某与某某有关”.

责任编辑 赵玉渊

统计应用 篇4

统计理论是一门方法论科学,其在数据分析和处理中发挥着重要作用,把繁杂的数据进行归纳总结,形成理论化的指导,提升电力企业的工作效率,从而实现电力企业的资源最优化配置。在电力系统统计工作中,统计理论应用主要分为四个步骤,这四个步骤相互联系,组成一个完整的数据处理流程。其步骤具体分为:(1)调查设计,这是统计理论开展的首要工作,要对电力系统的应用目标有明确的认知,并根据统计内容来明确工作目标、对象和方法,加强数据统计的针对性;(2)数据收集,其结果直接影响统计结果的真实性和有效性,因此在数据收集时要保证数据的真实性和准确性;(3)数据整理,整理分析工作是把原始资料进行系统化分析,把数据归纳到某个计算系统中,通过对采集数据的分析和处理得出相应的结论;(4)数据应用,统计理论应用的目的是呈现数据背后的市场和企业信息,这些统计信息都是企业战略决策的重要依据。

2 分析统计理论在电力统计工作中的作用

电力行业作为国家支柱产业,带动我国经济的发展,电力企业的工作覆盖面较广,其经营过程中会产生大量的数据,因此对数据的统计是企业管理工作必不可少的工作,统计工作控制着整个企业资料,在第一时间内挖掘数据背后隐藏的市场信息和企业经营状况,从而让管理人员对企业有着清晰的认知,并对电力行业有整体的了解,为企业的战略决策提供可以参考的凭证。再者,统计理论在电力系统工作中应用可以优化工作效率,发挥工作的监督作用,例如统计理论应用于企业财务管理工作,可以明确财务管理各项工作事务,杜绝不法现象的发生,促进电力企业健康可持续发展,对于企业经营有积极的促进作用。

3 分析统计理论在电力统计工作中存在的问题

分析统计理论在电力统计工作中存在着以下的问题:首先是企业中的统计工作机制不完善,很多电力统计工作缺乏明确的目标,也没有建立规范的工作制度,从而影响了统计信息的可靠性,同时统计理论在实践工作中应用缺乏有效的部门沟通,没有采取有效的措施来完善统计理论的检验机制。再者,统计数据缺乏严谨性,电力企业的统计数据量较大,这需要统计人员具备良好的数据甄选能力,再加之信息传播速度较快,统计工作人员数量和质量不佳,从而造成很多统计数据没有纳入到系统中,影响了统计工作开展的有效性。

4 分析统计理论在电力统计工作中的应用

4.1 根据统计学理论建立完善的制度

分析统计理论在电力系统工作中应用首先应当建立完善的制度,尤其是要强化统计结构的分析和应用,电力企业要结合企业发展实际状况,根据企业员工组成、业务范围及地区特点等建立符合企业本身的各项管理体系指标。同时在设定体系指标时,要综合各个影响因素的相互作用,保证得出统计数据具有代表性和权威性,同时统计学理论建立要符合群众的实际需求,要将关系到需求的参数设定到体系中,对需求参数进行重点统计,加强电力企业统计工作的便民性。对电力企业工作中统计理论应用而言,要理清工作需求和工作要点,从繁琐的数据中找出具有参考价值的结论,利用完善的制度来挖掘潜在的信息,同时要掌握统计理论的相关内容,使统计工作具有实用性。

4.2 根据统计学开展实践工作

电力企业资料信息较为繁杂,包含了企业经营、决策及管理等各项工作内容,对统计人员而言,要针对各种数据进行相应的统计,对信息进行筛选处理,并加强各种信息的分析,把统计理论应用到数据分析中,并利用统计信息指导企业工作开展。统计人员要按照统计理论开展的流程,进行分层次分析,及时发现统计数据中发现的问题,并根据结果提出了相应的问题,避免由于统计数据分析不合理造成企业决策失误。再者统计理论在电力统计工作中,统计人员要开展实践工作,将理论体系应用到数据统计和分析中,采用最新的统计技巧和分析方式,发挥统计理论对数据处理的科学性和真实性,提升统计工作效率,得出最准确的统计结论。

4.3 统计理论中对电力统计工作的指导

统计理论应用到系统化的工作体系中,是一项较为复杂的项目工作,在统计理论的应用时,会遇到各种各样的问题,这就需要保证数据来源渠道的严谨性,从企业资料数据库中找出对应的数据,针对统计工作目的制定分析模型,将数据纳入到统计理论模型中,建立数据参数之间的关系,保证各个统计环节紧密联系。统计人员在统计理论应用过程中,对每一个环节工作都保持严谨的态度,以科学的心态来对待数据分析结果,提高得出结论的准确性。对电力企业统计工作人员而言,要具备扎实的统计理论知识和模型构建经验,合理分析数据库中的统计数据,强化统计理论对统计工作的指导。

5 结语

综上所述,对电力企业而言,要将统计理论作为研究基础,根据理论指导开展相应的统计工作,挖掘统计信息对于企业决策的指导性。电力企业要根据统计学理论建立完善的制度,根据统计学理论开展相应的实践工作,提高统计理论对统计工作的指导性。

摘要:当前信息技术飞速发展对电力系统而言,其工作覆盖面较广,业务范围直接扩展到基层,电力统计工作中会出现海量的原始数据,这就给其带来了沉重的工作负担。分析统计理论在电力统计工作中应用可以帮助企业挖掘数据价值,根据数据统计结果来引导企业战略决策,同时提高了企业统计工作效率。本文阐述了分析统计学的一般步骤,并分析了其在电力统计工作中的应用,最后提出了相应的应对策略。

关键词:统计理论,电力统计,工作应用

参考文献

[1]吴俊芳.统计理论对电力统计工作实践的指导作用探究[J].经济论坛,2013(12)

[2]吕一敏.浅谈统计理论对电力统计工作实践的指导作用[J].科技创新导报,2011(35)

统计软件及应用作业 篇5

sigama<-matrix(rnorm(60,0,1),60,1);

beta<-matrix(c(3,1.5,0,0,2,0,0,0),8,1);

y<-x%*%beta+sigama;

Pfunction<-function(s,v){ p<-0

if(s<=v){p=v}

else if(s>v){if(3.7*v>s){p=(3.7*v-s)/2.7}

else if(3.7*v<=s){p=0} }

return(p)

}

Q<-rep(1,500)

for(j in 1:500){

h<-rep(0.01*j,8)

g<-c(10,5,8,0.2,1,1,0.5,7)

t<-c(1,1,1,1,1,1,1,1)

for(i in 1:8){t[i]<-(Pfunction(g[i],h[i]))/g[i]}m<-diag(t)

s<-c(0,0,0,0,0)

for(i in 1:5){w=x[-(1+12*(i-1)):-(12*i),]

v=y[-(1+12*(i-1)):-(12*i),]

k=x[(1+12*(i-1)):(12*i),]

l=y[(1+12*(i-1)):(12*i),]

n=length(v)

Beta=solve(t(w)%*%w+n*m)%*%t(w)%*%vs[i]=t(l-k%*%Beta)%*%(l-k%*%Beta)}

S<-sum(s)

Q[j]<-S

}

gamma<-0.01*(which.min(Q));print(gamma)

h<-rep(gamma,8)

i<-1

while(i<20){i<-i+1;

for(i in 1:8){t[i]<-(Pfunction(g[i],h[i]))/g[i]}m<-diag(t)

解答双统计图应用题 篇6

例1 (2015年台州)某校想了解学生每周的课外阅读时间情况,随机调查了部分学生,对学生每周的课外阅读时间(单位:时)进行分组整理,并绘制了如图1所示的不完整的直方图和扇形图(图中x表示课外阅读时间)。

根据图中提供的信息。解答下列问题。

(1)补全直方图。

(2)求扇形图中m的值和E组对应的扇形圆心角度数。

(3)请估计该校3 000名学生中每周的课外阅读时间不少于6小时的人数。

解析:(1)由直方图和扇形图知,A组对应的人数是10,对应的百分比为10%,则随机调查的学生人数为10÷10%=100,D组对应的人数为100-(10+21+40+4):25。

所以直方图中需要补全的条形的高为25,补全直方图略。

(2)注意到随机调查的学生人数为100,C组对应的人数为40,且40/100×100%=40%,所以m=40。

因为E组对应的百分比为4/100×100%=4%,所以E组对应的扇形圆心角为360°×4%=14.4%。

(3)由D组和E组对应的百分比分别为25%、4%知,随机调查的学生中每周的课外阅读时问不少于6小时的人数的百分比为29%。

因为3000×29%=870,所以估计该校3000名学生中每周的课外阅读时间不少于6小时的人数是870。

例2(2015年桂林)某市团委在2015年3月初组成了300个学雷锋小组。现从中随机抽取6个小组,统计各小组在3月份做好事的件数,并绘制出两幅统计图(如图2。其中条形图不完整)。

(1)这6个学雷锋小组在2015年3月份共做好事多少件?

(2)补全条形图。

(3)请估计该市300个学雷锋小组在2015年3月份共做好事多少件。

解析:(1)由折线图知,从左到右6个学雷锋小组在2015年3月份做的好事分别为13件、16件、25件、22件、20件、18件。

因为13+16+25+22+20+18=114,所以这6个学雷锋小组在2015年3月份共做好事114件。

(2)注意到三小组在2015年3月份做的好事为25件,所以条形图中需要补全的条形的高为25。补全条形图略。

(3)由计算知,随机抽取的6个小组中平均每个小组做的好事件数为114÷6=19。

因为300x19=5 700,所以估计该市300个学雷锋小组在2015年3月份共做好事5700件。

1.(2015年衡阳)为了解义务教育阶段学生的体质状况,教育部门对我市某中学九年级的部分学生进行了体质抽测。体质抽测的结果分为四个等级:“优秀”“良好”“合格”“不合格”。根据调查结果绘制了两幅不完整的统计图(如图3),请你根据统计图提供的信息解答以下问题。

图3

(1)在扇形统计图中,“合格”的百分比为____。

(2)在本次体质抽测中,抽测结果为“不合格”等级的学生有____名。

(3)若该校九年级有400名学生,估计该校九年级体质为“不合格”等级的学生约有____名。

2.(2015年泰州)为了解学生参加社团的情况,从2010年起,某市教育部门每年都从全市所有学生中随机抽取2 000名学生进行调查。如图4是部分调查数据的统计图(参加社团的学生每人只能报一项),根据统计图提供的信息解答下列问题。

(1)求扇形图中“科技类”对应的扇形圆心角的度数。

(2)该市2012年抽取的学生中,参加“体育类”与“理财类”社团的学生共有多少名?

(3)该市2014年共有50 000名学生,请你估计该市2014年参加社团的学生人数。

参考答案:1.(1)40%(2)16(3)1282.(1)72°。(2)200名。(3)28 750。

统计应用 篇7

一、统计学的发展趋势对统计教学提出新的要求

统计学是一门定量研究认识自然及社会经济现象的方法论科学, 随着电子计算机技术、网络技术的飞速发展, 统计学在与其它学科不断结合、不断融合中自身理论日益丰富、不断发展并衍生出许多应用统计学分支学科。

1. 统计学与其他学科相融合的趋势, 使统计学的内容不断丰富。

统计学是认识社会和管理社会的有力工具, 作为一种“工具”, 统计学只有与其他学科相结合, 才能够发挥出其强大的数量分析功效。历史上一些著名的统计学家同时也是生物学家、物理学家、经济学家、社会学家、教育学家等, 而一些其他学科的专家也在从事统计理论与方法的研究, 他们在研究过程中也对统计方法进行改进和创新, 这样, 统计学科与其他学科相结合, 产生了相应的统计学分支, 如经济统计学、交通运输统计学、卫生统计学等。这些分支学科在解决学科研究中的有关定量分析问题时, 也使统计方法在这一应用过程中得以完善和发展。从培养经管类应用型人才出发, 在《统计学》教学过程中, 除了讲授统计学原理中的统计概述、统计调查、统计整理、综合指标、抽样调查、时间数列、统计指数、相关与回归分析等基础内容外, 还须系统地讲授推断统计的内容, 如参数估计、假设检验、统计预决策, 等等, 使《统计学》的教学内容更加丰富。

2. 统计与计算机的结合, 特别是大量统计软件的开发, 使

得数据处理更加便捷, 但对数据分析人员提出了更高的要求。随着计算机技术的快速发展, 使得原先复杂的数据处理工作变得更加容易。原先看起来十分复杂, 难以掌握的统计方法, 由于相应统计软件的开发, 使得非统计专业的人员也可以通过统计软件来处理现实的数据分析问题, 而不必先掌握原来的统计方法。从这个趋势可以看出, 通过计算机技术的普及可以使统计方法的应用更加容易。另一方面, 随着计算机应用的日趋广泛, 大量的数据被积累下来, 人们由此获得了大量的信息, 但也就产生了诸如:信息过量, 难以消化;信息真假, 难以辨识;信息安全, 难以保证等问题亟待解决, 这又促使计算机技术不断向前发展。对于学习统计学的学生而言, 就要求他们不仅要学好统计理论和方法, 也要会应用计算机软件来辅助进行数据处理。

二、从高等教育现状看, 经管类专业统计教学面临新的挑战

1. 学生学习统计畏难情绪比较大。

统计学具有这样的特点:概念多且概念之间的关系复杂, 公式多且不太容易记忆, 计算有一定难度。基于这些特点就需要学生多练习、多实践、多理解, 否则要掌握好统计学几乎是不可能的。特别对于部分数学基础不太扎实的经管类学生来说, 一看到公式、计算就有较大的畏难情绪。

2. 学生实践与应用能力有待加强。

随着我国市场经济的不断发展, 社会需要越来越多综合素质好、业务能力强的应用型人才, 这对统计教学工作提出了更高的要求, 这就要求我们培养的经管类人才既具备一定的理论知识, 又要求具有分析问题和解决问题的实践能力。当前, 《统计学》教学中, 虽增加了实训课时, 已有一定的实践及应用能力的培养, 但还不够, 以至于许多用人单位反映毕业生的实际能力还不够, 不会分析问题, 更谈不上提出解决问题的对策了。

3. 教学内容与课时之间矛盾突出, 教学目标难以达到。

随着统计教学内容的不断扩充和教学课时的不断压缩, 使得老师虽能在有限的课时里完成教学大纲要求内容的讲解, 却很难保证学生真正理解与消化。另外, 由于许多学生学习统计的热情不高, 很少做到课外阅读、练习和实践, 这就必然影响到《统计学》的教学效果, 所以教学目标难以达到。

三、非统计专业统计教学的几点建议

1. 运用案例教学, 提高学生学习统计学的积极性、主动性。

案例教学是指在教师的指导下, 学生运用所学的统计学知识和方法对案例中待决问题进行研究、思考、判别和分析, 选择相应的统计方法进行实际计算和处理并对结果进行讨论、分析、比较和评价, 从而选择一个比较优良的解决方案的过程。案例教学可以使学生真正成为学习上的主人, 有利于调动学生学习的积极性、主动性, 能收到良好的教学效果。案例教学, 采用以学生为主进行课堂讨论的方式, 因此学生必须预先准备, 认真阅读、分析案例素材并站在决策者的角度进行思考。学生要在课堂上完成任务或有好的表现, 就必须掌握所学的知识, 并在解决问题时能充分应用所学知识, 这种促使学生把所学知识、方法同解决实际问题相结合的方式有利于学生对统计知识的理解、掌握和应用, 有利于培养学生综合应用能力。

2. 加大实践教学在整个统计教学中的比重, 激发学生的学习兴趣。

统计学的基础知识对学生来讲, 抽象、枯燥, 概念复杂, 公式繁琐, 计算难度大, 普遍学习兴趣不佳、效果不好。而实践教学可以使学生在愉悦的氛围中有兴趣地完成统计知识的学习掌握, 不仅减轻了学生对学习统计的畏难情绪, 还能充分激发学生的主观能动性, 达到较好的教学效果。比如, 为了使学生对统计工作过程有一个全面的了解, 为以后走上工作岗位打好基础, 可以让学生做一个完整的统计工作方案。先让学生分组确定选题, 选一个感兴趣的、想去了解分析的选题, 然后, 制订详细周密的统计调查方案, 按方案去调查;把收集到的数据、情况进行整理, 当然是分组、汇总, 制表或制图, 最后利用统计整理的结果 (统计表成统计图) 进行详尽全面的分析, 写出分析报告。这样学生对所学的统计知识就有了更为深刻的理解, 学习的兴趣也就提高了。

3. 运用多媒体技术, 使教学过程更加便捷。

统计学教学中会涉及到大量数据、统计表、统计图, 大量复杂的公式和计算。如果仍使用传统方式来进行讲解, 费时、费力。为了使教学过程更加形象、直观, 运用多媒体技术, 运用相应统计软件辅助教学, 教、学相宜, 更加便捷。

4. 培养学生熟练运用EXCEL的能力。

SPSS、SAS、EXCEL都是目前较为普遍的统计软件, 而对于非统计专业, SPSS和SAS属于专业的统计软件, 使用者需要接受专门的培训, 不太适合, 而EXCEL则比较适合。微软公司开发的EXCEL软件作为一种优秀的表格软件, 其提供的统计分析功能虽然比不上专业统计软件, 但它比专业统计软件易学易用, 便于掌握, EXCEL的函数功能、电子表格功能、数据分析功能等满足了非统计专业学生分析数据的要求。

总之, 在新形势下必须改革非统计专业的统计教学, 才能满足社会对经管类应用型人才的大量需求, 才能真正实现高等学校的人才培养功能。

参考文献

[1]赵秀敏.浅谈新形势下的统计教学[J].邢台学院学报, 2007, (3) .

[2]颜泳红.非统计专业的统计教学思考[J].统计教育, 2005, (5) .

统计应用 篇8

利用医院信息资料来分析医院各科室的工作效率和社会经济效率, 这是医院财务统计工作的基本任务, 使得财务统计的服务和监督职能得到充分发挥[1]。随着科技的进步与网络信息时代的到来, 医院对于信息的需求量越来越大, 需要更加实时的财务统计信息, 其作用尤为重要, 不仅能够衡量医院的社会经济效益, 还可以对医院的各项管理工作提供支持, 从而使医院的可持续发展得以实现。

二、财务统计信息的利用和发展

1. 转变观念、促进财务统计的发展

随着医院改革的不断深化, 以及逐渐转变的医学模式, 财务统计信息在医院发展过程中的必要性和重要性已经得到了医院管理层的认识, 同时医院管理者也紧随信息化时代转变了观念, 对已有的财务统计信息资源进行充分和深度的开发利用, 让其为医院提供更好的服务, 使医院可以产生良好的经济效益和社会效益, 所以医院的财务统计工作不能在传统的服务方式上进行停留, 要从单纯的记账、算账工作向核算、监督转变, 将那些“死数据”变成活的有用的信息, 为医院发展进行服务。

2. 对制度进行健全和完善, 形成科学管理

医院要紧随时代发展步伐对财务管理制度进行完善, 在原本的财务制度基础上进行改革, 从单纯的统计收入、支出、纯利润、设备等相关费用的计算上, 要增加监督机制, 对工作人员的日常工作进行监督, 并对财务资料进行定期检查和整理, 做好资料保存工作, 进行出超和入超的原因检查, 并制定对应措施, 还要聘请优秀的财务管理人员, 对医院的财务工作进行科学的全面的管理, 逐渐的形成科学化制度化的管理模式[2]。

3. 实现医院财务信息统计的现代化

会计行业随着信息化的到来更为方便, 使得财务统计信息的速率和准确性都得到了极大的提升, 也使得财务工作人员复杂和繁琐工作得到了减轻, 而且也使得错误率明显得到降低。医院应该实现医院财务信息统计的现代化, 通过电算化工作和HIS系统来对数据挖掘的工作进行加强, 统计出更具针对性的财务数据, 为医院管理提供决策依据。

三、财务统计信息在医院财务统计中的应用意义

1. 可以使得医院资源得到有效的配置

每一位优秀的医院管理者对于如何能充分的配置医院的人力、物力、财力等资源都会不断思考, 而财务统计信息在医院财务统计中的应用可以使得医院资源得到有效的配置。医院根据财务统计信息进行分析, 能够合理的安排资金流, 使得有限的财力能够使用在医院发展急需的项目上, 从而确保医院建设的需要, 做到物有所值;与此同时, 在医院的管理服务方面, 管理者可以依据门诊量、床位周转率、业务收支等具体信息合理的规划病房的床位, 进而可以使得门诊和住院条件得到改善, 实现为患者提供更好服务的目标。

2. 是做出科学决策的前提保障

医院领导者做出科学决策的依据和前提保障就是财务统计信息。医院领导可以通过财务统计信息了解业务收入、医疗成本等经济效益, 还能够对服务地区的卫生需求得到了解, 还能够了解门诊的平均费用、药费比重等信息, 医院根据这些信息可以制定更适合医院业务发展的工作计划, 而且还能够对各科室人员的配置进行合理调整, 这样就做到了人、财、物的合理配置和使用。

3. 是对医院管理水平进行衡量的依据

各种医疗指标和经济指标是衡量医院管理水平高低的依据, 这些指标具体点说就是医院固定时间的门诊人次、单病种费用、住院人数、药品费用以及各项费用占医疗收入的比重等信息, 医院通过对这些财务统计信息的利用, 对医院财务统计工作进行完善和总结, 在成本核算的基础上, 调整了医疗费用的结构, 对药品费用的比重进行严格控制, 特别是对医保病人, 要使其平均费用能够在合理水平范围之内, 这样才能够使得患者和家属满意, 而且医院还获得了良好的经济效益和口碑, 能够确保医院的健康持续发展[3]。

4. 可以使对外投资管理得到加强, 财务岗位更加明晰

医院通过对财务统计信息的分析, 可以掌握医院的财务情况, 并为医院对外进行投资管理提供科学的决策依据, 医院要想更好的利用财务统计信息, 要建立现代化的科学化的管理决策机制, 在进行对外投资项目时候一定要严格按照决策执行程序进行, 做到科学合理论证[4]。医院根据财务统计信息, 可以制定更加合理的工作流程, 还能够合理的设置财务岗位, 提升工作效率, 使得权责明晰的财务管理机制逐步形成, 这样医院的财务统计工作就能向规范化的健康方向发展。

四、总结

通过对财务统计信息在医院财务统计中的应用意义进行研究, 首先论述了财务统计信息的利用和发展, 包含转变观念, 促进财务统计的发展、对制度进行健全和完善, 形成科学管理、实现医院财务信息统计的现代化, 然后论述了财务统计信息在医院财务统计中的应用意义, 包括可以使得医院资源得到有效的配置、是做出科学决策的前提保障、是对医院管理水平进行衡量的依据、可以使对外投资管理得到加强, 财务岗位更加明晰。医院领导能够从财务统计信息中对医院各方面的情况有一个全面的理解, 并据此做出合理的调整计划, 促进医院的健康持续发展, 所以可以说财务统计信息在医院财务统计中的应用意义非常的显著。

参考文献

[1]周燕颖.医院财务内控失控事件分析[J].中国卫生经济, 2012, 12 (4) :94.

[2]郑焰.运用杜邦模型构建医院财务评价体系[J].会计之友, 2012, 7 (4) :245.

[3]陈哲娟, 邱枫林, 董先雨.山东省医院财务主管现状调查[J].中国卫生经济, 2012, 5 (8) :142.

统计模式识别概论及应用 篇9

关键词:模式识别,特征提取,遗传算法,支持向量机

0 引言

模式识别诞生于20世纪20年代, 是对表征事物或现象的各种形式的信息进行处理和分析, 以对事物或现象进行描述、辨认、分类和解释的过程。该学科主要研究使机器通过学习能做以前只能由人类才能做的事, 具备人所具有的、对各种事物与现象进行分析、描述与判断的部分能力。模式识别所研究的理论和方法在很多科学和技术领域中得到了广泛的重视, 目前已成功应用于指纹识别、印刷体字符识别、语音识别、车牌识别、人脸识别、手写体字符识别、自动文本分类、多媒体数据挖掘等领域。

本文基于统计模式识别方法来研究车辆识别问题。对待定的区域应用特征提取、特征选择的方法提取统计特征, 根据统计模式识别原理对候选车辆区域行识别确认。特征提取采用PCA (主成分变换法) , 特征选择采用遗传算法, 分类器设计是SVM (支持向量机) 。

1 统计模式识别方法

基于统计方法的模式识别系统由四部分组成:数据获取、预处理、特征提取和选择、分类器设计和分类决策。

1.1 数据获取与预处理

数据获取就是通过一定的技术和手段对个别事物进行观测, 从而获取该事物的时间和空间分布信息。这里需要将各种测量的量转换成计算机可以直接处理的数据。测量到的信号通常有一维信号, 二维信号和逻辑信号。预处理阶段就是要将数据获取阶段所引入的噪声进行滤除, 并对数据获取阶段所造成的信号退化进行复原, 并为下一步特征提取提供必要的基础。

1.2 特征提取与特征选择

通常情况下, 在数据获取阶段获得的数据量是相当大的。直接应用这些数据进行模式识别, 数据量大, 计算复杂。当向量维数达到一定维数时, 就必须采取一定的措施能使系统能够处理这些数据和正常工作, 即特征降维, 模式识别中称为特征提取和选择。一般来说, 特征提取和选择是模式识别系统中关键的一步, 其好坏直接决定了模式识别系统的性能。

1.2.1 主成分变换法

主成分分析方法是应用最广泛的一种特征提取方法之一, 它是一种统计学方法, 在信号处理、模式识别、数字图像处理等领域得到了广泛的应用。主成分分析基本思想是提取出空间原始数据中的主要特征, 减少数据冗余, 使得数据在一个低维的特征空间被处理, 同时保持原始数据的绝大部分的信息, 从而解决数据空间维数过高的瓶颈问题。

所谓主成分就是原始数据的m个变量经线性组合后得到的变量, 该变化使得其变换后的变量方差为最大 (第一主成分) 的部分。各个主成分之间是相互线性无关的 (正交的) 从第一主成分往后, 主成分按方差大小的顺序排列。

1.2.2 遗传算法

遗传算法是建立在自然选择和遗传变异基础上的自适应概率性搜索算法, 在该算法中, 染色体是二进制字符串编码, 每一编码字符串为一候选解, 这种染色体有多个, 即有一群候选解。染色体像生物进化一样有繁殖、交叉和突变三种现象, 这些现象称为遗传算子。在每一代中, 保持一定数目M为定值的解群, 经过对各解的适应度值计算, 使解群中的各个解得到评价, 各个解的适应度值的大小作为染色体复制机会大小的先决条件。

遗传算法中有一个很重要的概念, 称为适应度函数。如何将遗传算法中的不断进化的染色体与现实问题中的优劣选择相联系是该算法成功的关键。一般的方法是构造一个与现实问题相联系的适应度函数。

1.3 分类器

从数学观点来看, 分类决策就是找出决策函数。当已知待识别模式的完整的先验知识时, 可据此确定决策函数的数学表达式。如果仅知待识别模式的定性知识, 则在确定决策函数的过程中, 通过反复训练、调整, 以达满意的决策函数表达式, 从而作为决策分类的依据。

支持向量机是一种基于统计的学习方法, 它是对结构化风险最小化归纳原则的近似, 由于其出色的学习性能, 使得SVM具有较好的推广能力。其原理是针对二值分类问题提出的, 其核心思想是将结构风险函数引入到分类中。支持向量机通过引入结构风险函数恰恰能完成这个任务, 从而提高了机器学习的泛化能力。这些特点使支持向量机能有效地克服高维问题。

2 实例分析

为了检验各个主成分变换特征提取方法和支持向量机分类器对车辆检测的识别率和有效性, 我们进行了对比实验:特征提取和特征选择的方法与不同分类器方法进行组合测试。

为了检验本论文中提出的车辆检测方法, 我们进行了实验测试。道路取景的来源国内城市道路。实验中选用的训练样本为3000, 其中车辆为1500, 其余为背景样本。

利用前文描述的方法, 获得的特征提取器为:

其中, 特征向量为:

同时增加了其它分类器配合进行测试, 选用的分类器有KNN (K最邻近结点算法) 、QDF (二次判别方程) 、COS (基于朴素贝叶斯分类器) 。测试样本为600, 其中车辆300, 背景300。测试结果为:SVM的车辆识别率为85.3%, 背景识别率为94%;KNN的车辆识别率为82.6%, 背景识别率为76.6%;QDF的车辆识别率为42.6%, 背景识别率为79.3%;COS的车辆识别率为52%, 背景识别率为97%。

通过对实验数据的分析, 可以得出, 特征提取的算法中, 采用主成分变换法进行特征提取是所实现的特征提取算法中性能较优。同时, SVM分类器具有是具有最高的识别率。所以最终选择的是主成分变换法、遗传算法支持向量机的车辆识别算法组合。

3 结论

本文分析并实现了基于车辆统计特征的车辆识别算法。算法包括三个部分:特征提取, 特征选择, 和分类器设计。利用特征提取方法 (PCA) 对待确定的区域应用特征提取的方法提取统计特征, 应用遗传算法对特征提取阶段的结果进行选择, 其选择结果用于训练SVM分类器。最后应用训练好的SVM分类器进行分类识别检测。此外, 还将此算法与其它车辆识别算法进行比较, 实验结果表明, 基于车辆统计特征的车辆识别算法不仅具有较好的有效性, 而且能有效的提高识别率和降低误识别率, 具有很好的应用前景。

参考文献

[1]边肇祺, 张学工.模式识别[M].2版.北京:清华大学出版社, 2007.

[2]杨和超, 宋海歌.模式识别的主要方法及其应用[J].电脑知识与技术, 2008 (S2) :156-157.

统计应用 篇10

生物统计学是应用数理统计的原理和方法, 处理、整理和分析生物科学研究中的资料, 揭示生物学本质的一门科学[1], 其在现代生物学和生产实践具有不可替代的作用[2]。通过向学生讲授数理统计的基本原理, 使学生能独立设计科学实验、正确处理和分析实验数据, 对实验结果作出科学合理的解释[3], 以培养学生科学运用统计学的方法分析和解决问题的能力、探索问题的能力, 激发学生的开拓创新精神[4]。

2.课程建设的必要性

大连民族大学生物技术专业于2011年开始招生, 作为新办专业, 原来的教学计划中没有“生物统计学”的课程, 只设置有32学时学校平台课程“概率论与数理统计”, 旨在使学生掌握数理统计的基本原理和分析方法。但在实际课程讲授过程中存在以下问题:一是概率论部分的讲授占用了超过2/3的学时, 数理统计部分讲授较少, 使学生缺乏数据处理与统计分析的必要训练。如在2014届本科生答辩过程中发现毕业论文中缺乏统计分析, 在答辩时也没有试验设计与假设检验的概念。二是强调数学属性, 而忽视实际应用。授课教师在讲授过程中过分强调公式的记忆和推导, 学生课后练习多通过查找书后附表与手工计算结合的形式, 长期忽略其应用性特点, 忽视了利用计算机软件进行试验设计和数据统计分析的能力培养[5]。三是缺乏足够的实践环节, 面对实践中的新问题不能采用恰当的统计方法。生物统计学是应用型学科, 实践环节的缺乏, 导致学生对生物统计学的应用能力偏低[6]。此外, 我校生物技术专业本科生在大二上半年需要进入各老师的实验室参与实验室工作, 课程的讲授与他们在实验室所见、所做和统计学联系不上, 不会设计实验和分析数据。因此, 更新教育理念、建立以应用能力培养为导向的生物统计学课程, 是培养社会适应型人才的急待解决的问题[7]。

针对上述生物统计学中的不足, 在教学中应注重思维培养和能力提高, 基本思路是以统计思维培养为主线, 以实际应用为主导, 理论教学与实践教学相互渗透融为一体的教学方式。

3.以统计思维培养为主线

所谓统计思维, 就是面对社会生活中的各种问题, 能够从统计学角度进行思考, 并能恰当运用数理统计的方法来分析和解决问题[8]。类似于美感、乐感、节奏感等, 当遇到有关问题时, 能想到从统计的视角收集数据和分析数据。以“参与式”教学方式与案例讲解作为统计思维培养的主要形式。

3.1通过“参与式”教学方式让学生理解生物统计学基本概念。

在教学中准备“参与式”的教学素材, 能够让学生深刻掌握统计背后的真正含义。如在讲授统计学基本知识时, 将他们通过“参与式”教学的形式引入统计学的大门。通过一个常识问题的逐步深入使学生加深思考:“如何比较两个同学的身高”, “如何比较学习本课程班级同学的身高”, “如何比较大连市全体本科生的身高”。使学生逐步了解均值、方差等常用统计指标, 并增加对抽样概念的感性认识。在讲授抽样分布内容时, 很多学生很难理解“统计数的抽样分布”与前面所讲授的各种分布函数之间的关系。因此, 采用“参与式”教学方式, 给出红、绿、蓝、白四个小球 (分别代表1、2、3、4) 。首先, 让学生做样本容量为n=2 (总体数为N=16) 的放回抽样;其次, 分别计算16次抽样的平均值、统计出均值为1、1.5、2、2.5、3、3.5和4情况出现的概率;再次, 根据概率绘制出概率分布图;最后, 给学生讲解总体 (16种抽样可能) 、样本 (每次抽的2个小球) 、样本抽样分布 (绘制的图形) 的概念与实验中哪些过程相对应。

3.2在教学方式上, 通过案例讲解让学生清楚理解不同统计方法背后的含义。

以方差分析为例, “处理”、“重复”、“处理效应”、“实验误差”和“总变异”等, 通过的公式描述和推导的形式很难使学生了解该方法背后的含义。因此, 选择“我国不同省市平均身高”为案例进行讲解。各个省市抽样出的人在理论上应该身高是相等的, 但由于其所处的地理环境和后天的生活习惯不同, 造成每个人的平均身高不同。不同的省份就是处理, 每个省份抽出的不同人就是重复;地理环境就是组间效应, 个体的差异/基因的微小差异就是试验误差, 即由组内效应造成的;方差分析实际上就是解每一个观测值 (抽取出个人的身高) 与总体平均数、组间效应和组内效应的线性方程的过程, 即方差分析的基本思想———将观测值出现变异分解为处理效应的变异和试验误差的变异。通过这个实例的讲解, 使学生对方差分析有了进一步的感性认识, 能让学生更加深刻理解各种统计方法。

3.3实际应用为主导。

注重实际应用, 本课程安排多次上机实训, 通过R统计软件和实践专题训练的形式, 帮助学生巩固和加深对统计学的理解。R语言具有开放的源代码, 完全不用担心版权问题, 具有丰富的统计函数及强大的图表制作功能, 并可以通过安装新的包进一步增强其功能[9]。国内外许多大学开始采用自由软件R作为统计教学辅助工具[10]。专题训练的数据都来自于本专业教师的相关的研究成果。设计的专题训练包括:“生物专业技术试验数据预处理与分析”、“不同水氮条件对文冠果产量的影响”、“盐碱梯度下吴屯杨长势分析”、“农家肥对蔬菜品质的影响”等。经过这些专题的训练, 学生能独立应用这些数据完成数据的统计和结果分析, 达到与本专业教师的科研项目相结合的目的。

实践专题的设计遵循“实验设计”、“资料整理在实施过程中始终以应用为主导, 与特征数的计算”、“统计推断”、“方差分析”、“直线回归与相关分析”、“图表制作”为主线, 通过教师的逐步操作讲解。将学生分为若干学习小组完成专题训练, 所有专题研究均要求撰写有一定水平的研究报告, 学生在课堂中向其他学生讲述:如何设计实验、如何提出异常数据、采用何种分析方法、如何得出具体结论, 等等, 最后老师评述学生在专题训练中的优点和不足, 初步实现了从被动接受知识向提升应用能力和创新潜能的转变。

4.结语

本文结合生物统计学教学中存在的问题, 以学生统计思维培养为主线, 以实际应用为主导, 在教学中注重思维培养和能力提高, 将传授知识、培养能力和提高素质有机结合。通过对2014级本科生的讲授, 在“2015年的辽宁省大学生市场分析大赛”过程中得到了许多指导老师的肯定:“学生在比赛准备过程中可以较熟练的应用统计学的基本原理和方法解决实际问题。”笔者希望通过本论文的“砖”为生物统计学的教学改革引出更多的“玉”。

摘要:统计学是现代生物科学研究和实践应用中不可缺少的工具。针对大连民族大学生物技术专业生物统计学课程中存在的“理论讲述占用学时长、强调数学属性、忽视实际应用, 导致学生实践应用能力低等”问题, 提出在教学中注重学生思维培养和能力提高, 以统计思维培养为主线, 以实际应用为主导, 采用理论教学与实践教学相互渗透融为一体的教学方式, 在教学过程中取得了较好的效果。

关键词:统计学思维,应用能力,R语言,案例教学,生物统计学

参考文献

[1]李春喜, 邵云, 姜丽娜.生物统计学 (第四版) [M].北京:科学出版社, 2008.

[2]王永立, 乔琳, 樊淑华.生物统计学课程教学改革探索与尝试[J].周口师范学院学报, 2011, 28 (5) :82-4.

[3]赵亮, 高贵珍, 刘小阳, 等.应用能力培养导向的生物统计学课程改革初探[J].宿州学院学报, 2013, 28 (11) :108-10.

[4]戚文华, 蒋雪梅.高校生物统计学课程教学改革与探索[J].教育教学论坛, 2014 (42) :109-11.

[5]朱香萍, 李桢, 张庭荣.信息时代《生物统计学》教学的探索与实践[J].农业网络信息, 2008 (2) :81-4.

[6]陈秀莉.生物统计学教学改革实践与体会[J].阴山学刊, 2014, 28 (3) :90-2.

[7]孙耀中.生物统计学课程教学中对学生的综合能力培养[J].河北科技师范学院学报, 2006 (1) :60-2.

[8]周建军, 张理, 唐年胜.统计学教学中统计思维培养的几点思考[J].科技信息, 2013 (23) :19, 29.

[9]张哲, 张豪.浅谈R语言在生物统计学教学中的应用[J].教育教学论坛, 2013 (27) :54-5.

上一篇:财务监督对策研究下一篇:课程教学计算机工程