中心极限定理及其应用

2024-07-02

中心极限定理及其应用(精选6篇)

篇1:中心极限定理及其应用

浅谈中心极限定理及其应用

李月20091103558

数学科学学院信息与计算科学09信息一班

指导老师韩文忠

摘要:概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。本文主要叙述中心极限定理在现实中的应用。关键字:中心极限定理 随机变量 正态分布

1.定理一(独立同分布的中心极限定理)设随机变量X1,X2,…,Xn,…相互独

立,服从同一分布,且具有数学期望和方差,E(Xk),n

D(Xk)=

>0(k=1,2,3),则随机变量之和Xk的标准化变量

k1

n

n

n

X

k

E(Xk)

k1n

=

k1

X

K

n

Yn=

k1

D(Xk)

k1

n的分布函数Fn(x)对于任意x满足

n

x

limFn(x)=limFn(x)=limP{

n

k

n

x

k1

n

}=

x

12



t

dt= (x).这就是说,均值为,方差为20 的独立同分布的随机变量

n

X1,X2,…,Xn之和Xk的标准化变量,当n充分大时,有

k1

n

k1

X

n

n

n

~N(0,1)

1.1:一加法器同时接收20个噪声电压Vk(k=1,2,3,20),设它们是相互独

立的随机变量,且都在区间(0,10)上服从均匀分布,记V

P{V105}的近似值。

V,求

k

k1

解:易知E(Vk)5,D(Vk)100/12(k=1,2,3,20),由定理一,随机

变量Z

V

K1

k

=

V205

近似服从正态分布N(0,1),于是

P{V105}P{

V20520

10520520

V20520

0.387}

1P{

V20520

0.387}

1

0.387

12



t

dt1(0.387)0.384.即有P{V105}0.34

2.(李雅谱诺夫(Lyapunov)定理)设随机变量X1,X2,…,Xn,…相互独立,它们具有数学期望和方差

0,k1,2,E(Xk),D(XK)K

nn

记k

k1

.k

k1

若存在正数,使得当n时,n

1B

2n

n

k1

E{Xkk

2

}0,则随机变量之和Xk的标准化变量

k1

nnnn

Zn

k1

X

k

E(Xk)

k1n

k1

X

k

Bn

k1

X

k

D(Xk)

k1

n

n

的分布函数limFn(x)limP{

n

n

k1

X

k

Bn



k1

k

x}

x

12

t

dt= (x).

此定理表明,在定理的条件下,随机变量

n

n

k

X

Zn

k1

Bn

X

k1

k

当n很大时,近似的服从正态分布

n

n

N(0,1),由此,当n很大,n

k1

X

k

BnZn



k1

k

近似的服从正态分布

N(k,Bn)

k1

.这就是说,无论各个随机变量

n

Xk(k1,2)

服从什么分布,只要满足定理的条件,那么它们的和k1

X

k

当n很大时就近似地服从正态

分布,在很多问题中所考虑的随机变量可以表示成很多个独立的随机变量之和。请看下面的例子。

2.1:设有一条河流经某城市,河上有一座桥,该桥的强度服从正态分布

N(300,40)(强度的单位是t(吨))。有很多车要经过此桥,如果各车的平

均重量是5t,方差是2t2。问:为保证此桥不出问题的概率(安全度)不小于0.99997.最多允许在桥上同时出现多少车辆?

解:用Y表示该桥的强度,若有M辆车在桥上,第i辆车的重量Xi

M

(i1,2M),则M辆车的总重量SM

i1

Xi,我们可以认为

Y,X1,X2XM是相互独立的,E(Xi)5,var(Xi)2,该桥不出现问

题的概率为

RP(M辆车的总重量不超过桥的强度)。

显然RP(SMY)RP(SMY0),我们要找满足不等式

R0.99997的最大的M,不难想到,这个M,由于

SM)

E(SM

=,M1,var(=

M1

(这里

1E(Xi)5

1var(Xi)2,i1,2M),由定理可知SM近似的服从

N(M1,M1)

.又N

(300,40),可知SMY

近似服从

N(M1300,M1240),于是

R[

0(M1300)

M

]

40

由于(4)=0.99997,故为了R0.99997,必须且只需

令x

0(M1300)

M

2M40

4

40

(x40),上述不等式化为,则M

x4x4000

((11.87)400))

由此知x11.87,从而M=50.就是说,最多允许50辆车

同时在桥上。

下面介绍另一个中心极限定理,它是定理一的特殊情况。

3.(棣莫弗-拉普拉斯(De Moirve-Laplace)定理)设随机变量(n1,2,)服从参数为n,p(0p1)的二项分布,则对于任意x,有limP{

n

npnp(1p)

x}=

x

12

t

dt=(x)。



这个定理表明,二项分布的极限分布式正态分布

n

Xk~N(np,npq)当n充分大时,服从二项分布的随机变量的概

k1

率计算可以转化为正态随机变量的概率计算。

3.1 :对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学

生无家长,1名家长,2名家长来参加会议的概率分别为0.05,0.8,0.15,若学校共有400名学生,设各学生参加会议的家长人数相互独立且服从同一分布。(1)求参加会议的家长人数x超过450的概率:

(2)求有1名家长来参加会议的学生人数不多于340的概率。

解(1)以Xk(k1,2,400)记第k个学生来参加会议的家长人数,则Xk的分布率为

400

易知E(Xk)1.1,D(Xk)0.19,k1,2400.而X随机变量

400

X。由定理一

k

k1

X

k1

k

4001.1

0.19

X4001.1400

0.19

400

近似服从正态分布N(0,1),于是

P{X450

}=P{

X4001.1400

0.19

4504001.1400

0.19

=1-P{

X4001.1400

0.19

1.147}

1(1.147)0.1251’

(3)以Y记有一名家长参加会议的学生人数,则Y~b(400,0.8),由定理三

P{Y340}

=P{

Y4000.84000.80.2Y4000.84000.80.2

3404000.84000.80.2

}

=P{2.5}(2.5)=0.9938

小结 中心极限定理表明,在相当一般的条件下,当独立随机变量的个数不断增加时,其和态分布趋于正态分布,这一事实阐明了正态分布的重要性,也揭示了为什么在实际应用中会经常用到正态分布,也就揭示了产生正态分布变量的源泉,另一方面,它提供了独立同分布变量随机变量之和Xk(其中Xk的方

k1

n

差存在的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布。都可以用正态分布来近似,这在应用上是有效和重要的。

参考文献

[1] 盛骤概率论与数理统计,高等教育出版社,2006 [2] 陈家鼎 郑中国概率与统计 高等教育出版社 2004

篇2:中心极限定理及其应用

【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。它们表明了当n充分大时,方差存在的n个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。本文讨论了中心极限定理的内容、应用与意义。

【关键词】:中心极限定理 正态分布 随机变量

一、概述

概率论与数理统计是研究随机现象、统计规律性的学科。随机现象的规律性只有在相同条件下进行大量重复的实验才会呈现出来,而研究大量的随机现象常常采用极限的形式,由此导致了对极限定理的研究。极限定理的内容很广泛,中心极限定理就是其中非常重要的一部分内容。中心极限定理主要描述了在一定条件下,相互独立的随机变量序列X1、X2、…Xn、…的部分和的分布律:当n→∞时的极限符合正态分布。因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使得中心极限定理有了广泛的应用。

二、定理及应用

1、定理一(林德贝格—勒维定理)

若

k1,=a,2,…是一列独立同分布的随机变量,且ED

k=kx2(2>0),k=1,2,…则有limp(k

1nnnax)n

n12et22dt。

当n充分大时,k1kna

n~N(0,1),k1nk~N(na,n)

22、定理二(棣莫弗—拉普拉斯中心极限定理)

在n重伯努利试验中,事件A在每次试验中出现的概率为错误!未找到引用源。, 错误!未

找到引用源。为n次试验中事件A出现的次数,则limp(nnnpnpqx)21xet22dt

其中q1p。这个定理可以简单地说成二项分布渐近正态分布,因此当n充分大时,可

以利用该定理来计算二项分布的概率。

同分布下中心极限定理的简单应用

独立同分布的中心极限定理可应用于求随机变量之和Sn落在某区间的概率和已知随机变量之和Sn取值的概率,求随机变量的个数。

例1:设各零件的重量都是随机变量,它们相互独立且服从相同的分布,其数学期望为0.5kg,均方差为0.1kg,问5000只零件的总重量超过2510kg的概率是多少?

解:设Xi(i=1,2,…,5000)表示第i个零件的重量X1,X2,…,X5000独立同分布且E(Xi)=0.5,D(Xi)=0.12。

由独立同分布的中心极限定理可知

[3]

=I-φ(1.414)=1-0.921

5=0.0785

例2:一生产线生产的产品成箱包装,每箱的重量是随机的且同分布,设每箱平均重50kg,标准差为5kg,若用最大载重为50吨的汽车承运,每辆车最多可以装多少箱才能保证不超载的概率大于0.977?

解:设Xi(i=1,2,…,n)是装运第i箱的重量,n为所求箱数。由条件可把X1,X2,…,Xn看作独立同分布的随机变量,而n箱的总重量为Tn=X1+X2+…+Xn,是独立同分布的随机变量之和。

由E(Xi)=50、D(Xi)=52得:E(Tn)=50n,D(Tn)=52n

根据独立同分布的中心极限定理:

[3]

即最多可以装98箱。

例3:报名听心理学课程的学生人数K是服从均值为100的泊松分布的随机变量,负责这门课的教授决定,如果报名人数不少于120,就分成两班,否则就一班讲授。问该教授讲授两个班的概率是多少?

分析:该教授讲授两个班的情况出现当且仅当报名人数x不少于120,精确解为P(x≥120)=e-100 100i/i!很难求解,如果利用泊松分布的可加性,想到均值为100的泊松分布随机变量等于100个均值为1的独立泊松分布随机变量之和,即X= Xi,其中每个Xi具有参数1的泊松分布,则我们可利用中心极限定理求近似解。[2]

解:可知E(X)=100,D(X)=100

教授讲授两个班的概率是0.023。

例4:火炮向目标不断地射击,若每次射中目标的概率是0、1。

(1)求在400次射击中击中目标的次数在区间[30,50]内的概率。

(2)问最少要射击多少次才能使击中目标的次数超过10次的概率不小于0.9?

分析:显然火炮射击可看作是伯努利实验。[1]即

我们知道,正态分布可近似于二项分布,而且泊松分布可近似于二项分布,当二项分布b(n,p),n较大、p较小时可用泊松分布估计近似值。如果p接近1,有q=l-p很小,这时也可用泊松分布计算;但是当n较大,p不接近0或1时,再用泊松分布估计二项分布的概率就不够精确了,这时应采用拉普拉斯定理来计算。

解:(1)设在射击中击中目标的次数为Yn,所求概率(30≤Yn<50)等于:

最小正整数n=147就是所要求的最小射击数。

以上例子都是独立同分布的随机变量,可以用中心极限定理近似估算,但是如果不同分布,中心极限定理是否也成立呢?

李雅普诺夫定理

当随机变量Xi独立,但不一定同分布时,中心极限定理也成立。定理3[2](李雅普诺夫定理):

设X1,X2,…,Xn,…为独立随机变量序列,且E(Xn)=an,D(Xn)=σn2存在,Bn2= σn2(n=1,2,…),若存在δ>0,使得:

也就是说,无论各个随机变量Xi服

从什么分布,只要满足李雅普诺夫条件,当n很大时,它们的和近似服从正态分布。由于在大学本科阶段接触的不同分布的样本较少,本文对它的应用将不举例说明。

中心极限定理以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似地服从正态分布。正是这个结论使得正态分布在生活中有着广泛的应用。

四、中心极限定理的意义

首先,中心极限定理的核心内容是只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。其次,中心极限定理对于其他学科都有着重要作用。例如数理统计中的参数(区间)估计、假设检验、抽样调查等;进一步,中心极限定理为数理统计在统计学中的应用铺平了道路,用样本推断总体的关键在于掌握样本特征

值的抽样分布,而中心极限定理表明只要样本容量足够地大,得知未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。参考文献

[1]邓永录 著 应用概率及其理论基础.清华大学出版社。

[2]魏振军 著 概率论与数理统计三十三讲.中国统计出版社。

篇3:中心极限定理的应用

大数定律和中心极限定理是统计学的两大基石, 前者确保了统计推断至少在样本增大时可以无限接近真相, 而后者则给出了大多数统计量分布的正态近似。大数定律只能从质的方面描述随机现象, 而中心极限定理可以更进一步从量的方面描述随机现象, 所以中心极限定理比大数定律深刻实用得多, 它是概率论与数理统计的基础。

中心极限定理解决了大量独立随机变量和的近似分布问题, 其结论表明:当一个量受许多随机因素的共同影响而随机取值, 则它的分布就近似服从正态分布, 而正态分布的许多完美理论, 能帮助我们获得实用简单的统计分析结果, 本文仅介绍其中的两个最基本的结论, 并通过举例加以应用。

1.独立同分布的中心极限定理

注1当n充分大时, 满足均值为μ, 方差为σ2>0的独立同分布 (无论服从什么分布) 的随机变量X1, X2, …, Xn…, 它们的和总是近似地服从正态分布, 记作:

当n充分大时, 记Sn=X1+X2+…+Xn, 可得如下的近似计算公式:

例1某炮兵阵地对敌人的防御地段进行100次射击, 每次射击中炮弹的命中数是一个随机变量, 其期望为2, 方差为1.69, 求在100次射击中有180颗到220颗炮弹命中目标的概率。

例2设各零件的质量都是随机变量, 他们相互独立且服从相同的分布, 其期望为0.5kg, 均方差为0.1 kg, 问5000个零件的总重量超过2510 kg的概率是多少?

解由题意可知, Xi表示第i个零件的质量, 且E (Xi) =0.5, D (Xi) =0.12, n=5000, 令表示5000个零件的总重量, 由独立同分布的中心极限定理:

2.棣莫弗-拉普拉斯定理

注2定理1和定理2这两个中心极限定理都是研究可列个相互独立的随机变量的和的分布的, 在一般条件下, 当独立的随机变量的个数增加时, 其和的分布趋于正态分布, 也说明正态分布的重要性。

例3一个复杂系统由100个相互独立的元件组成, 在系统运行时每个元件损坏的概率为0.1, 为使系统正常工作, 至少必须有85个元件工作, 求系统的可靠度 (正常工作的概率) 。

例4产品为废品的概率p=0.005, 求1000件产品中废品数不大于7的概率。

解1000件产品中的废品数X服从二项分布, n=1000, p=0.005, , 下面用三种方法计算

正态分布和泊松分布虽然都是二项分布的极限分布, 但后者以n→∞, 同时p→0, np→λ为条件, 而前者则只要求n→∞这一条件, 一般对于n很大p很小的二项分布, 用正态分布来近似不如用泊松分布计算精确。

大数定律是研究随机变量序列{X}n依概率收敛的极限问题, 而中心极限定理则是研究随机变量序列{X}n依分布收敛的极限问题, 他们都是讨论大量的随机变量之和的极限行为, 当X1, X2, …, Xn, …相互独立且服从同一分布, 且有大于0的有限方差时, 大数定律和中心极限定理同时成立, 但是通常中心极限定理比大数定律更为精确。

摘要:中心极限定理是概率论与数理统计课程中一个重要的定理, 衔接着概率论知识与数理统计的相关知识, 既是教学重点又是难点。中心极限定理在很一般的条件下证明了无论随机变量Xi服从什么分布, n个随机变量的和n∑k=1Xk的极限分布是正态分布, 本文仅介绍其中两个最基本的结论并举例应用。

关键词:中心极限定理,正态分布,应用

参考文献

[1]秦川.概率论与数理统计 (第二版) [M].湖南教育出版社, 2013.

[2]宗序平.概率论与数理统计 (第三版) [M].机械工业出版社, 2011.

[3]陶伟.概率论与数理统计习题全解[M].国家行政学院出版社, 2008.

[4]王伟珠.论中心极限定理及应用[J].赤峰学院学报, 2013 (10) .

篇4:中心极限定理及其应用

[关键词] 中心极限定理 随机变量 应用

中心极限定理是棣莫佛在18世纪首先提出的,至今其内容已经非常丰富。它不仅是概率论中的重要内容,而且还是数理统计中大样本统计推断的理论基础。 一种随机现象可能会受到许多不确定因素的影响,如果这些彼此之间没有什么依存关系,且谁也没有特别突出的影响,那么,这些影响的“累积效应”将会使现象近似地服从正态分布。中心极限定理在很一般的情况下证明了,无论随机变量服从什么分布,个随机变量的和当时的极限分布是正态分布。因此,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释在现实中为什么很多数量指标都服从或近似服从正态分布这一事实。在中心极限定理的教学中,通过列举一些用中心极限定理解决问题的实例,能使学生较深地理解中心极限定理的理论与实用价值。

一、两个常用的中心极限定理

根据不同的假设条件,有多个中心极限定理。这里只介绍两个常用的中心极限定理。

定理1 列维—林德伯格(Levy-Lindeberg)定理(独立同分布的中心极限定理)

设随机变量相互独立,服从同一分布,且具有数学期望和方差.则随机变量

的分布函数Fn(x)对于任意x满足

(5.7)

从定理1的结论可知,当n充分大时,有

或者说,当n充分大时,有

如果用表示相互独立的各随机因素。假定它们都服从相同的分布(不论服从什么分布),且都有有限的期望与方差(每个因素的影响有一定限度)。则(5.8)式说明,作为总和这个随机变量,当n充分大时,便近似地服从正态分布。

定理2(棣莫佛-拉普拉斯(De Moivre Laplace)定理)

设随机变量X服从参数为n,p (0<p<1)的二项分布,即,则

对于任意的x,恒有

. (5.11)

这个定理表明,二项分布以正态分布为极限。当n充分大时,我们可以利用上式来计算二项分布的概率。

说明:正态分布和泊松分布虽然都是二项分布的极限分布,但后者以同时为条件,而前者则只要求这一条件。一般说来,对于n很大,p(或q)很小的二项分布(np≤5)用正态分布来近似计算不如用泊松分布计算精确。

二、中心极限定理的应用举例

例1 设男孩出生率为0.515,求在10000个新生婴儿中女孩不少于男孩的概率为多少?

解法1 设X为10000个婴儿中男孩的个数,则要求女孩个数不少于男孩个数的概率,即求 P{X≤5000}。

由棣莫佛-拉普拉斯定理有

解法2 设X为10000个婴儿中男孩的个数,令

则,,且独立同分立同分布,

则女孩不少于男孩的概率为 P{X≤5000}.

由列维—林德伯格定理有

即在10000个新生婴儿中女孩不少于男孩的概率大约是0.00135.

例2 在一家保险公司里有10000个人参加人寿保险,每人每年付30元保险费。在一年内一个人死亡的概率为0.2%,死亡时其家属可向保险公司领得5000元的慰问金,问:

(1)保险公司在该项目上亏本的概率有多大?

(2) 保险公司在该项目上一年中获利不少于150000元的概率是多少?

解:(1) 设X表示一年内死亡的人数,则,

其中

设Y表示保险公司一年的利润,

Y=10000´30-5000X

于是由棣莫佛-拉普拉斯定理

(1)P{Y<0}=P{10000×30-5000X<0}

=1-P{X≤60}=1 - F(8.95)=0。

即保险公司在该项目上亏本的概率为0。

(2)由题意可知,即求

由棣莫佛-拉普拉斯定理,上式即为

=0.9874.

即保险公司在该项目上一年中以98.74%的概率获利不少于150000元。

除了以上这些问题外,中心极限定理还可以用来求极限.

例3 利用中心极限定理证明

证明:设随机变量序列独立同分布,均服从参数为的泊松分布,其分布律为

则由泊松分布的可加性知

服从参数为的泊松分布,且

于是由列维—林德伯格定理知

中心极限定理的应用非常广泛的,以上几个例子仅仅是其应用的一些方面。一般地,如果一个随机变量能够分解为相互独立且同分布的随机变量序列之和的问题,则可以直接利用中心极限定理进行分析,此外,在大样本的情况下,求未知非正态分布的置信区间也同样可用中心极限定理解决。

参考文献:

[1] 谢永钦.概率论与数理统计[M].北京:北京邮电大学出版社,2009.

[2] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2001.

[3] 苏淳.概率论[M].北京:科学出版社,2010.

作者简介:

李会葆(1970— )男,安徽安庆市人,安庆师范学院讲师,从事概率统计、高等数学等课程的教学研究。

项目:2007年度安徽省级教学研究项目(项目批准号:2007jyxm350)

篇5:中心极限定理证明

高尔顿钉板试验.图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且

那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.二、中心极限定理

设是独立随机变量序列,假设存在,若对于任意的,成立

称服从中心极限定理.设服从中心极限定理,则服从中心极限定理,其中为数列.解:服从中心极限定理,则表明

其中.由于,因此

故服从中心极限定理.三、德莫佛-拉普拉斯中心极限定理

在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则

用频率估计概率时的误差估计.由德莫佛—拉普拉斯极限定理,由此即得

第一类问题是已知,求,这只需查表即可.第二类问题是已知,要使不小于某定值,应至少做多少次试验?这时利用求出最小的.第三类问题是已知,求.解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.抛掷一枚均匀的骰子,为了至少有0.95的把握使出现六点的概率与之差不超过0.01,问需要抛掷多少次?

解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:的随机变量.求.解:

因为很大,于是

所以

利用标准正态分布表,就可以求出的值.某单位内部有260架电话分机,每个分机有0.04的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以0.95的把握保证各个分机在使用外线时不必等候.解:以表示第个分机用不用外线,若使用,则令;否则令.则.如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,查表得,故取.于是

取最接近的整数,所以总机至少有16条外线,才能有0.95以上的把握保证各个分机在使用外线时不必等候.根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.由德莫佛—拉普拉斯极限定理,有

其中,即有

四、林德贝格-勒维中心极限定理

若是独立同分布的随机变量序列,假设,则有

证明:设的特征函数为,则的特征函数为

又因为,所以

于是特征函数的展开式

从而对任意固定的,有

而是分布的特征函数.因此,成立.在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.设有个数,它们的近似数分别是,.,.令

用代替的误差总和.由林德贝格——勒维定理,以,上式右端为0.997,即以0.997的概率有

设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有

由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.作业:

p222EX32,33,34,3

5五、林德贝尔格条件

设为独立随机变量序列,又

令,对于标准化了的独立随机变量和的分布

当时,是否会收敛于分布?

除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.设是独立随机变量序列,又,这时

(1)若是连续型随机变量,密度函数为,如果对任意的,有

(2)若是离散型随机变量,的分布列为

如果对于任意的,有

则称满足林德贝尔格条件.以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.证明:令,则

于是

从而对任意的,若林德贝尔格条件成立,就有

这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.六、费勒条件

设是独立随机变量序列,又,称条件为费勒条件.林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.七、林德贝尔格-费勒中心极限定理

引理1对及任意的,证明:记,设,由于

因此,其次,对,用归纳法即得.由于,因此,对也成立.引理2对于任意满足及的复数,有

证明:显然

因此,由归纳法可证结论成立.引理3若是特征函数,则也是特征函数,特别地

证明定义随机变量

其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.林德贝尔格-费勒定理

定理设为独立随机变量序列,又.令,则

(1)

与费勒条件成立的充要条件是林德贝尔格条件成立.证明:(1)准备部分

(2)

显然(3)

(4)

以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)

这时

因此林德贝尔格条件化为:对任意,(6)

现在开始证明定理.设是任意固定的实数.为证(1)式必须证明

(7)

先证明,在费勒条件成立的假定下,(7)与下式是等价的:

(8)

事实上,由(3)知,又因为

故对一切,把在原点附近展开,得到

因若费勒条件成立,则对任意的,只要充分大,均有

(9)

这时

(10)

对任意的,只要充分小,就可以有

(11)

因此,由引理3,引理2及(10),(11),只要充分大,就有

(12)

因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.(2)充分性

先证由林德贝尔格条件可以推出费勒条件.事实上,(13)

右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,当时,当时,因此

(14)

对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.(3)必要性

由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,(15)

上述被积函数的实部非负,故

而且

(16)

因为对任意的,可找到,使,这时由(15),(16)可得

故林德贝尔格条件成立.八、李雅普诺夫定理

设为独立随机变量序列,又.令,若存在,使有

篇6:中心极限定理及其应用

概率论与数理统计是研究随机现象统计规律性的学科.而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性.例如, 大量的抛掷硬币的随机试验中, 正面出现频率;在大量文字资料中, 字母使用频率;工厂大量生产某种产品过程中, 产品的废品率等.一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性.这种稳定性就是我们将要讨论的大数定律的客观背景.在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示

★大数定理的引入 ★切比雪夫不等式

★例1

★例2 ★大数定理

★中心极限定理的引入 ★林德伯格—勒维定理

★例3 ★例6

★推论

大数定理

★棣莫佛—拉普拉斯定理 ★例4

★例5 ★例7

★例8 ★高尔顿钉板试验

中心极限定理

★内容小结

★课堂练习★习题4-4

内容要点:

一、依概率收敛

与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性.定义

1设X1,X2,,Xn,是一个随机变量序列, a为一个常数,若对于任意给定的正数,有 limP{|Xna|}1, 则称序列X1,X2,,Xn,依概率收敛于a, 记为

nXnaP(n).PP定理1 设Xna,Ynb,又设函数g(x,y)在点(a,b)连续, 则

g(Xn,Yn)g(a,b).P

二、切比雪夫不等式

定理2设随机变量X有期望E(X)和方差D(X)2,则对于任给0, 有

P{|X|}22.上述不等式称切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若2越小, 则事件

{|XE(X)|} 的概率越大, 即, 随机变量X集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.(ii)当方差已知时,切比雪夫不等式给出了X与它的期望的偏差不小于的概率的估计式.如取3, 则有

P{|XE(X)|3}9220.111.故对任给的分布,只要期望和方差2存在, 则随机变量X取值偏离E(X)超过3的概率小于0.111.三、大数定理 1.切比雪夫大数定律

定理3(切比雪夫大数定律)设X1,X2,,Xn,是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即D(Xi)K,i1,2,, 则对任意0, 有

1limPnnni1Xi1nni1E(Xi)

11nn注: 定理表明: 当n很大时,随机变量序列{Xn}的算术平均值学期望

2.伯努利大数定理 1nni1Xi依概率收敛于其数E(X).ii1定理4(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数, p是事件A在每次试验中发生的概率, 则对任意的0, 有

nnlimPAp1

或 limPAp0.nnnn注:(i)伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n充分大时, 事件A发生的频率nAn依概率收敛于事件A发生的概率p.定理以严格的数学形式表达了频率的稳定性.在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii)如果事件A的概率很小,则由伯努利大数定律知事件A发生的频率也是很小的,或者说事件A很少发生.即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛.但应注意到,小概率事件与不可能事件是有区别的.在多次试验中,小概率事件也可能发生.3.辛钦大数定理

定理5(辛钦大数定律)设随机变量X1,X2,,Xn,相互独立, 服从同一分布,且具有数学期望E(Xi),i1,2,, 则对任意0, 有

1limPnnni1Xi1.注:(i)定理不要求随机变量的方差存在;

(ii)伯努利大数定律是辛钦大数定律的特殊情况;

(iii)辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n块,计算其平均亩产量, 则当n较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.四、中心极限定理

在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外)的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理

定理6(林德伯格—勒维)设X1,X2,,Xn,是独立同分布的随机变量序列, 且

E(Xi),D(Xi),i1,2,,n,2

nXini1limPxnnx12et2/2dt

注: 定理6表明: 当n充分大时, n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下, 我们很难求出X1X2Xn的分布的确切形式, 但当n很大时, 可求出其近似分布.由定理结论有

ni1Xinn1近似n~N(0,1)ni1Xin近似/~N(0,1)X~N(,22/n),X1nni1Xi.故定理又可表述为: 均值为, 方差的0的独立同分布的随机变量X1,X2,,Xn,的算术平均值X, 当n充分大时近似地服从均值为,方差为2/n的正态分布.这一结果是数理统计中大样本统计推断的理论基础.2.棣莫佛—拉普拉斯定理

在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量Yn服从参数n,p(0p1)的二项分布, 则对任意x, 有

YnnplimPxnnp(1p)x12et22dt(x)

注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差

设n为n重贝努里试验中事件A发生的频率, p为每次试验中事件A发生的概率,q1p,由棣莫佛—拉普拉斯定理,有

nPpPnnpqnnpnpqn pqn1.pq

npqn2pq这个关系式可用解决用频率估计概率的计算问题:

4.李雅普诺夫定理

定理8(李雅普诺夫定理)设随机变量X1,X2,,Xn, 相互独立, 它们具有数学期望

n和方差: E(Xk)k,n时, D(Xk)2k0,i1,2,,记B2n.若存在正数, 使得当

k12k1Bn2nnE{|k1Xkk|2}0,则随机变量之和Xk的标准化变量: k1nZnk1nXkEXkk1DXkk1nnnkXk1Bnk1k 的分布函数Fn(x)对于任意x, 满足

nnXkkk1k1limFn(x)limPxnnBnx12et/22dt(x).注:定理8表明, 在定理的条件下, 随机变量

nnZnk1XkBnk1k.nn当n很大时,近似地服从正态分布N(0,1).由此, 当n很大时,XkBnZnk近似地服

k1k1n2.这就是说,无论各个随机变量Xk(k1,2,)服从什么分布,只要满从正态分布N,Bknk1n足定理的条件,那么它们的和Xk当n很大时,就近似地服从正态分布.这就是为什么正态随

k1机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:

切比雪夫不等式

例1(讲义例1)已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700.利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解 设每毫升白细胞数为X, 依题意, 7300,27002,P{5200X9400}P{52007300X730094007300}

P{2100X2100}P{|X|2100}.所求概率为

由切比雪夫不等式

P{|X|2100}1222/(2100)1(700/2100)11/98/9,即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 在每次试验中, 事件A发生的概率为0.75, 利用切比雪夫不等式求: 事件A出现的频率在0.74~0.76之间的概率至少为0.90? 解 设X为次试验中, 事件A出现的次数, 则

X~b(n,0.75), 0.75n, 20.750.25n0.1875n,所求为满足P{0.74X/n0.76}0.90的最小的n.P{0.74X/n0.76}可改写为

P{0.74nX0.76n}P{0.01nX0.75n0.01n}P{|X|0.01n}

在切比雪夫不等式中取0.01n, 则

P{0.74X/n0.76}P{|X|0.01n}122/(0.01n)2

10.1875n/0.0001n11875/n

依题意, 取n使11875/n0.9, 解得

n1875/(10.9)1875,0 即n取18750 时, 可以使得在n次独立重复试验中, 事件A出现的频率在0.74~0.76之间的概率至少为 0.90.中心极限定理

例3(讲义例2)

一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg的概率.解 设为第i个螺丝钉的重量, i1,2,,100,100且它们之间独立同分布, 于是一盒螺丝钉的重量为XXi1i,且由E(Xi)100,D(Xi)10,n100,知E(X)100E(Xi)10000,由中心极限定理有

P{X10200}PnD(X)100,i1Xinn10200nX10000pn1001020010000

100X10000X10000P21P2

1001001(2)10.977250.02275.例4(讲义例3)计算机在进行数学计算时, 遵从四舍五入原则.为简单计.现在对小数点后面第一位进行舍入运算, 则误差X可以认为服从[0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算, 求平均误差落在区间[3/20,3/20]上的概率.解 n100, 用Xi表示第i次运算中产生的误差.相互独立, 都服从[0.5,0.5]上的均匀分布, X1,X2,,X100且E(Xi)0,var(Xi)1/12,i1,2,,100, 从而

Y100100i1Xi1000100/1235100i1近似Xi~N(0,1).故平均误差X1100100i133,Xi落在2020上的概率为

3331PXP201002020100i1Xi320

3P35100i1Xi3(3)(3)0.9973.

例5(讲义例4)某公司有200名员工参加一种资格证书考试.按往年经验考试通过率为0.8,试计算这200名员工至少有150人考试通过的概率.解 1,令10,第i人通过考试第i人未通过考试,i1,2,,200,依题意,P{Xi1}0.8,np2000.8160,np(1p)32.200i1Xi是考试通过人数, 由中心极限定理4, 得

P{XiX160/32~N(0,1),150}P{X160/32}150160/200近似i1i200ii32

P{200i1Xi160/321.77}

1(1.77)(1.77)0.96, 即至少有150名员工通过这种考试的概率为0.96.例6(讲义例5)某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005, 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少? 解 记Xi1,若第i个被保险人发生重大事0,若第i个被保险人未发生重大故事故(i1,2,,5000)

于是Xi均服从参数为p0.005的两点分布, 且p{Xi1}0.005,np25.5000i1Xi是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此

5000i1项业务所得到的总收益为0.01650002于是

Xi万元.5000P200.01650002Xi40P20i15000i1Xi30

P2025250.9955000i1Xi25250.995(1)(1)0.6826

250.9953025 例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15.若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.求参加会议的家长数X超过450的概率.解 以Xk(k1,2,,400)记第k个学生来参加会议的家长数, 则Xk的分布律为

Xkpk00.0510.820.15

400易知E(Xk)1.1,D(Xk)0.19,k1,2,,400, 而XXk1k,由定理3, 随机变量

400Xk1k4001.1X4001.14000.190.19近似~400N(0,1), 故

X4001.14504001.1P{X450}P

4000.194000.19X4001.11P1.147

4000.191(1.147)0.1357.例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解 用Xi表示第i人能够按时进入掩蔽体, 令SnX1X2X1000.设至少有m人能进入掩蔽体, 则要求

P{mSn}0.95,Sn90090 {mSn}m10000.910000.90.1Sn900 90近似由中心极限定理, 有

~N(0,1), 所以

m900Sn900S900m900P{mSn}Pn1P

90909090查正态分布数值表, 得

m900901.65, 故m90015.65884.35884人.课堂练习

上一篇:八年级其中家长会下一篇:小学数学评课用语大全