《超几何分布与二项分布的联系与区别.docx》由会员分享,可在线阅读,更多相关《超几何分布与二项分布的联系与区别.docx(11页珍藏版)》请在第一文库网上搜索。
1、超几何分布与二项分布的联系与区别目录1 .正文12 .超几何分布是什么53 .离散型概率分布之二项分布101.正文在苏教版数学选修2-3的课本中,第二章概率的2.2节和2.4节分别介绍了两种离散型随机变量的概率分布,超几何分布(hyper-geometricdistribution)与二项分布(binomia1distribution)o通过实例,让学生认识模型所刻画的随机变量的共同特点,从而建立新的模型,并能运用两模型解决一些实际问题。然而在教学过程中,却发现学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,学生对这两模型的定义不能很好的理解,一遇至恰“取”或“摸”的题型,就认为
2、是超几何分布,不加分析,随便滥用公式。事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别。课本对于超几何分布的定义是这样的:一般的,若一个随机变量X的分布n-kF(X=左)=Y列为cAr,其中分=0,1,2,3,/,=mO,M),则称X服从超几何分布,记为XH5,M,拉兀其概率分布表为:X/OrIQ2,daUnzr*1yW-IW-2JMUN-MZn-1对于二项分布的定义是这样的:若随机变量X的分布列为P(X=k)=C纷Q-P)X4,其中OCPV1,p+q=1,上=1,2,力则称X服从参数为n,P的二项分布,记为XBS,P).其概率分布表为:(7=min(%,M)Xq(kIa2P*
3、小。(I-P)1C2(MTQCAQ-P超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求取有截然不同的表达式,但看它们的概率分布表,会发现构造上的相似点,如:随机变量X的取值都从O连续变化到=5,胫):,对应概率和N,n,1三个值密切相关.可见两种分布之间有着密切的联系。课本中对超几何分布的模型建立是这样的:若有N件产品,其中M件是废品,无返回地任意抽取n件,则其中恰有的废品件数X是服从超几何分布的。而对二项分布则使用比较容易理解的射击问题来建立模型。若将但超几何分布的概率模型改成:若有N件产品,其中M件是废品,有返回的任意抽取n件,则其中恰有的废品件数X是服从二项分布
4、的。在这里,两种分布的差别就在于“有”与“无”的差别,只要将概率模型中的“无”改为有,或将有改为无,就可以实现两种分布之间的转化。“返回”和不返回”就是两种分布转换的关键。如在2.2节有这样一个例题:高三(1)班的联欢会上设计了一项游戏:在一个口袋中装有10个红球、20个白球,这些球除颜色外完全相同,一次从中摸出5个球,摸到4个红球1个白球就是一等奖,求获一等奖的概率。本题采用的解法是摸出球中的红球个数X服从超几何分布,但是如果将“一次从中摸出5个球”改为“摸出一球记下颜色,放回后再摸一球,反复5次”,则摸出球中的红球个数X将不再服从超几何分布,而是服从二项分布。我们分别来计算两种分布所对应的
5、概率:XP0Ip23/45,超几何分布P.0.1087950.339986-10.3399850.159993p0.029472*0.OoI76%二项分布W0.131687/0.3292180.329218-0.164609K0.0411520.004115p从概率分布:100个红球,20衣中可以发现两种不同的分布其对应的1。个白球,其他条件不变再求相应概率概率相差并不大,若将题中I数据扩大为XrOr1323*5/超几何分布P0.12948%0.33031&0.3319960.164319c0.04004即0.003843二项分布PC0.131687/0.32921即0.329218+0.16
6、4609c0.04115230.004115这时发现发现两种不同的分布其对应的概率之间的差距进一步缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就是说版喈1=CQRiO下面我们对以上猜想作出证明:产品个数N无限大,设废品率为P,CZC念_初3-MXnN-n)4kM-k)N-k)N-M-n-k)M-k1(n-1c)1Mff(Mr+1)W-M(W-Af-1)W-mq-)+1NNNN.霭NN-N-Nn-kN因为n,k确定所以蹙MI=*E个N1.(&一般)(N-M-I
7、)W-M-5一切+1“、丸Iim=(1-z?)*jNNNx7个#以上的证明与我们的直观思想相吻合:在废品为确定数M的足够多的产品中,任意抽取n个(由于产品个数N无限多,无返回与有返回无区别,故可看作n次独立试验)中含有k个废品的概率当然服从二项分布。在这里,超几何分布转化为二项分布的条件是(1)产品个数应无限多,否则无返回地抽取n件产品是不能看作n次独立试验的.(2)在产品个数N无限增加的过程中,废品数应按相应的“比例”增大,否则上述事实也是不成立的。E(X)=n对于超几何分布的数学期望Nf二项分布的数学期望E(X)=号,当我们将“不返回”改为“返回”时,Rr=J两种分布的数学期望相等,方差之
8、间没有相等关系。超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?EX=n-事实上超几何分布的数学期望,方差1.Mcj+1.M1.阀MW4(N-M)”、Iim=puT,Iimn=np,Iimxnp(-p)当N*.NXNNKN2N-T)这两个极限值分别是二项分布的数学期望与方差。需要指明的是这一性质并非只为超几何分布与二项分布之间所具有,一般地,如果随机变量依分布收敛于随机变量,则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。这样超几何分布与二项分布达到了统一。一般说来,有返回抽样与无返回抽样计算的概率是不同的,特别在抽取对象数目不大时更是如此。但当被
9、抽取的对象数目较大时,有返回抽样与无返回抽样所计算的概率相差不大,人们在实际工作中常利用这一点,把抽取对象数量较大时的无返回抽样(例如破坏性试验发射炮弹;产品的寿命试验等),当作有返回来处理。那么,除了在有无“返回”上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?设想N件产品装在一个大袋中,其中M件为废品,无返回地从中抽取n件,那么其中废品件数X服从超几何分布。现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个小袋,无返回地从中任取一件产品,则这样任取n件,其中废品件数X就不再服从超几何分布,而应服从的二项分布了。事实上,我们把摸到正品袋中的产品看作“成功”
10、,摸到废品袋中的产品看作“失败,贝丁成功”与“失败”的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布去刻划其概率分布列。P(X-A)=Cf(;)吧严=/(;)”,(无=10n,就可用二项分布近似描述不合格品个数。超几何分布(hypergeometricdistribution)如果随机变X的分布律为px=A:=(A=0,1,min(f/)其中MM,均为自然数.则称随机变MX服从参数为(N,M力的超几何分布.各类石棉布出售一型号齐全.实地货源查看详情广告END应用举例:1一个口袋中有30个球,有10个红球,其余为白球,除颜色外完全相同。游戏者一次从中摸出5个球,
11、摸到至少4个红球就中一等奖,那么获一等奖的概率是多少?解油题意可见此问题归结为超几何分布模型。其中N=30,M=10.n=5.P(一等奖)=P(=4or5)=P(X=4)+P(X=5)由公式P(X=k)=C(k,M)*C(n-k,N-M)/CmN),k=0,1,2,得:P(X=4)=C(4,10)*C(1,20)C(5,30)P(X=5)=C(5,10)*C(0,20)C(5,30)P(一等奖)=106/3393在含有件次品的N件产品中.任取件,其中恰有*件次品,则PS=4=MrM,k=0,1.2.C-E.其中n=minM广告END期望的证明:1对XH(N,M,n),E(x)=nMN证明:引理
12、一:EC(x,a)*C(dx,b),x=O.mina,d=C(d,a+b),考察(1+x)a*(1+xrb中XAd的系数即得。(另:还可以由超几何分布I=XP(X=K),k=0,1,2.n得)引理二:k*C(k,n)=n*C(k-1,n-1),易得。正式证明:EX=k*C(k,M)*C(n-k,N-M)C(n,N),k=O.minM,n=1C(n,N)*M*C(k-1zM-1)*C(n-k,N-M)zk=1.minM,n(提取公因式,同时用引理二变形,注意k的取值改变)=MC(n,N)C(k-1M-1)*C(n-k,N-M),k=1.minM,n(提取,整理出引理一的前提)=M*C(n1,N1)C(n,N)(利用引理一)=MnN(化简即得)ProtakM1ityDensityFunction(POF)END方差的证明:1对XH(N,M,n),D(X)=n