《表格模板-分配数列统计表统计图 精品.ppt》由会员分享,可在线阅读,更多相关《表格模板-分配数列统计表统计图 精品.ppt(86页珍藏版)》请在第一文库网上搜索。
1、统计学第第2 2章章 统计整理统计整理 菏泽学院经济系菏泽学院经济系2022年9月23日/上午8时43分第第5 5节节 分配数列分配数列2022年9月23日/上午8时43分课程回顾课程回顾一、统计分组的概念一、统计分组的概念二、统计分组的目的二、统计分组的目的三、统计分组的作用三、统计分组的作用四、统计分组标志选择的原则四、统计分组标志选择的原则五、统计分组的分类五、统计分组的分类2022年9月23日/上午8时43分一、分配数列的概念和种类一、分配数列的概念和种类(一)分配数列的概念(一)分配数列的概念 是在分组的基础上,把总体的所有单位按组是在分组的基础上,把总体的所有单位按组归类整理,并按
2、一定的顺序排列,形成总体中各归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布,又称次数分配。个单位在各组间的分布,又称次数分配。次数:分布在各组的个体单位数,又称为频数;总次数:全部总体单位数;比率:各组次数与总次数之比,又称为频率。2022年9月23日/上午8时43分(二)2022年9月23日/上午8时43分例例月工资分组月工资分组(元元)工人数工人数(人人)占总数比重占总数比重(%)2000 以下以下210 39.62000-2500187 35.32500 以上以上133 25.1合合 计计530100.0 组别(变量) 频数(次数) 频率(比率)2022年9月23日/上午
3、8时43分思考:思考: 分配数列与分组的区别?分配数列与分组的区别? 分配数列是在分组的基础上加分配数列是在分组的基础上加上次数(频数)的分布。上次数(频数)的分布。2022年9月23日/上午8时43分1.品质分配数列品质分配数列 指按品质标志对总体分组形成的数列,简称为品质数列。2.变量分配数列变量分配数列 指按数量标志对总体分组形成的数列,简称为变量数列。按照标志的性质不同按照标志的性质不同2022年9月23日/上午8时43分变量数列变量数列离散型变量数列离散型变量数列连续型变量数列连续型变量数列变量数列变量数列单项数列单项数列组距数列组距数列2022年9月23日/上午8时43分(一)(一
4、) 品质数列品质数列二、分配数列的编制二、分配数列的编制 编制品质数列,只要根据统计研究目的,正确编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差选择分组标志,确定分组标准,则事物性质的差异可以明确地表现出采,也就容易划分总体中各异可以明确地表现出采,也就容易划分总体中各组的性质界限。因此,在通常情况下,品质数列组的性质界限。因此,在通常情况下,品质数列能够较准确地反映总体各单位的分布状态和特征能够较准确地反映总体各单位的分布状态和特征。 2022年9月23日/上午8时43分 某班学生的性别构成情况 例例按性别分组按性别分组绝对数人数绝对数人数比重比重(%)男
5、男30 75女女10 25合计合计40100 组别组别 次数次数 频率频率2022年9月23日/上午8时43分(二)变量数列(二)变量数列 按数量标志分组,就是将变量值即数量标按数量标志分组,就是将变量值即数量标志值划分为不同的区段,通过各组的数量差别志值划分为不同的区段,通过各组的数量差别和变化来区分现象的不同性质,反映总体各单和变化来区分现象的不同性质,反映总体各单位在各组间的分布状态和特征。位在各组间的分布状态和特征。 2022年9月23日/上午8时43分指每个组值只用一个具体的变量值表现的数列指每个组值只用一个具体的变量值表现的数列(1)(1)概念概念(3)(3)编制步骤编制步骤a.将
6、原始资料按照变量值大小顺序排列。将原始资料按照变量值大小顺序排列。b.按变量值分为若干组。按变量值分为若干组。c.设计综合表(整理表),整理出变量值出现的次数设计综合表(整理表),整理出变量值出现的次数。2022年9月23日/上午8时43分 己知某车间有己知某车间有24名工人,他们的日产量名工人,他们的日产量(件)分别是:(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资要求根据以上资料编制变量数列。料编制变量数列。20,20,20, 21,21,21,21,21, 22,
7、22,22,22,22,22,23,23,23,23, 24,24,24, 25,25, 26,排序后2022年9月23日/上午8时43分2022年9月23日/上午8时43分指每个组的变量值用一个区间来表现的变量数列指每个组的变量值用一个区间来表现的变量数列(1)概念概念2022年9月23日/上午8时43分(3)组距数列编制的步骤组距数列编制的步骤:a.排序,计算全距。排序,计算全距。b.确定组数、组距。确定组数、组距。c.确定组限及其表示法。确定组限及其表示法。d.计算频数、频率。计算频数、频率。e.制作组距数列统计表。制作组距数列统计表。2022年9月23日/上午8时43分指每组两端表示各
8、组界限的变量值,各组的最小指每组两端表示各组界限的变量值,各组的最小值为值为下限下限,最大值为,最大值为上限。上限。每组变量值变动区间的长度,为上下限之差每组变量值变动区间的长度,为上下限之差每组变量取值范围的中点数值每组变量取值范围的中点数值 2下限上限组中值2022年9月23日/上午8时43分先计算开口组的假定上、下限:先计算开口组的假定上、下限:22相邻组组距上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限2022年9月23日/上午8时43分销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)5
9、0以下以下50100100200200300300以上以上102030251514.211.410.19.28.5组中值组中值=U-d/2=50-25=25组中值=L+d/2=300+100/2 =3502022年9月23日/上午8时43分minmaxXXRq要能区分各组的性质差异要能区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5,1010,5050,100100,500500的的整数倍整数倍R组距组距(d) 组数(组数(k)2022年9月23日/上午8时43分等距数列与异距数列等距数列与异距数列等距数列等距数列 各组组
10、距均相等,一般适用于变量值比较均匀的情况。各组组距均相等,一般适用于变量值比较均匀的情况。异距数列异距数列 各组组距不全相等,不常用。各组组距不全相等,不常用。 2022年9月23日/上午8时43分异距数列适用于异距数列适用于 1. 1.标志值分布很不均匀的场合,在分布比较密标志值分布很不均匀的场合,在分布比较密集的区间内使用较短的组距,在分布比较稀少的部集的区间内使用较短的组距,在分布比较稀少的部分使用较长的组距。分使用较长的组距。2.等量的标志值具有不同意义的场合等量的标志值具有不同意义的场合例:进行人口疾病研究的年龄分组,应采用异例:进行人口疾病研究的年龄分组,应采用异距分组,即:距分组
11、,即:1岁以下按月分组,岁以下按月分组,1-10岁按照年岁按照年龄分组,龄分组,11-20按照按照5年分组,年分组,21岁以上按照岁以上按照10年年分组等。分组等。2022年9月23日/上午8时43分异距数列适用于异距数列适用于3.3.标志值按一定比例发展变化的场合标志值按一定比例发展变化的场合例:例: 大城市百货商店营业额差别很大的,比如营大城市百货商店营业额差别很大的,比如营业额从业额从5万到万到5千万元,可采取公比为千万元,可采取公比为10的不等距的不等距分组,即:分组,即:5-50万元,万元,50-500万元,万元,500-5000万万元,如果采用等距分组,即便组距为元,如果采用等距分
12、组,即便组距为100万元,万元,也得分也得分50组,显然是不合适的。组,显然是不合适的。2022年9月23日/上午8时43分1dRkdRkdRdR2022年9月23日/上午8时43分组数的经验公式组数的经验公式 如果现象近似于正态分布,则可如果现象近似于正态分布,则可参考美国统计学家参考美国统计学家 斯特杰斯提出的斯特杰斯提出的分组数的经验公式:分组数的经验公式:组数(组数(K)=1+3.322lgN其中,其中,N为总体单位数。为总体单位数。2022年9月23日/上午8时43分q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于
13、连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。2022年9月23日/上午8时43分例例 工业企业按照职工人数分组可以表示为:工业企业按照职工人数分组可以表示为:499人以下,人以下,500-999人,人,1000-1999人,人,2000人以上等。人以上等。 工业企业按照职工人数分组可以表示为:工业企业按照职工人数分组可以表示为:500人以下,人以下,500-1000人,人,1000-2000人,人,2000人以上等人以上等.2022年9月23日/上午8时43分2022年9月
14、23日/上午8时43分2022年9月23日/上午8时43分百万元)(27229minmaxXXRR组距组距(d) 组数(组数(k)组)(615271dRk2022年9月23日/上午8时43分适用于总体单位的标志值变适用于总体单位的标志值变动比较均匀的情况动比较均匀的情况2022年9月23日/上午8时43分 销售额销售额(百万元)(百万元)商店数商店数5以下以下51010151520202525以上以上合计合计50f4101613432022年9月23日/上午8时43分 销售额销售额(百万元)(百万元)商店数商店数频率频率()5以下以下51010151520202525以上以上410161343
15、820322686合计合计50100fff各组单位数占总体单位总数的比重各组单位数占总体单位总数的比重2022年9月23日/上午8时43分2022年9月23日/上午8时43分 休息是为了走更长的路,累了,迷茫时,就坐下来,静静地,想想未来路的方向2022年9月23日/上午8时43分 从变量值低的组开始,将各组次数和比率逐次从变量值低的组开始,将各组次数和比率逐次向变量值高的组累计。向变量值高的组累计。 组距数列中的向上累计,表明各组上限以下总组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少。共所包含的总体次数和比率有多少。(一)向上累计(以下累计、或较小制累计)(一)向上
16、累计(以下累计、或较小制累计)2022年9月23日/上午8时43分 从变量值高的组开始,将各组次数从变量值高的组开始,将各组次数和比率逐次向变量值低的组累计。和比率逐次向变量值低的组累计。 组距数列中的向下累计,表明各组组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率下限以上总共所包含的总体次数和比率由多少。由多少。(二)向下累计(二)向下累计2022年9月23日/上午8时43分 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100fff2022年9月23日/上午8时43分 销售额销售额(百万元)(百万元)商店数商店数频率频率()累计次数累计次数累计频率(累计频率()向下向下累计累计向下向下累计累计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计50100fff2022年9月23日/上午8时43分 销售额销售额(百万元)(百万元)商店