《医学统计重点知识总结.docx》由会员分享,可在线阅读,更多相关《医学统计重点知识总结.docx(6页珍藏版)》请在第一文库网上搜索。
1、一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。6、参数:描述某总体特征的指标称为总体参数。7、统计量:描述某样本特征的指标称为样本统计量。8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。小
2、概率原理是进行统计推断的依据。(8&9常写在一起)10.变异:是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。14、中心极限定理:从均数为,标准差为。的总体中独立随机抽样,当样本含量?增加时,样本均数
3、的分布将趋于正态分布,均数为P,标准差为。X从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。按一定的概率或可信度(Iy)用一个区间估计总体参数所在范围。这个范围称作可信度为1-的可信区间(COnfidenCeinterva1,C1),又称置信区间。17、第一类错误:Ho真实时被拒绝,这类“弃真”错误为第一类错误18、第二类错误:HO不真实时不拒绝,这类“存伪”错误为第二类错误19检验功效/检验效能/把握度:即1-B,又称
4、把握度,即两总体确实有差别,按。的水准能发现它们有差别的能力,对真实的H1作肯定结论之概率,常被用来表达某种假设检验方法的检验功效。20、秩次:是指全部观察值按某种顺序排列的位序。21、秩和:同组秩次之和。22、秩变换:将等级转换为秩次;对秩次作效应的参数检验23、秩和检验:通过秩次的排列求出秩和,对总体参数进行假设检验的方法。24、共变:当一个变量增大时,另一个变量也随之增大(或随之减少)25、正相关:若两个变量同时增加或减少,变化趋势是相同的,则两变量之间的的关系成为正相关26、负相关:若一个变量增加时,另一个变量减少,变化趋势是反向的,成为负相关27、相关关系:当一个变量增大,另一个也随
5、之增大(或减少),我们称这种现象为共变,或相关(corre1ation)。两个变量有共变现象,称为有相关关系。28、相关系数:是表达两变量间线性相关的程度和方向的一个统一指标。29、截距:即a。a的值表示,当X=O时,应变量Y的估计值P30、剩余标准差:称为标准估计误差,常用于评价RI归方程的拟合精度。(写上公式)31、P值(假设检验P含义):在原假设成立的条件下,得到现有差别或者更大差别的概率,即犯I型错误的所冒的风险。32、同质:观察单位具有相同的性质。33、相对数:是两个有联系的指标的比,是分类资料的描述性统计指标,计数资料的统计描述主要是相对数,常有率、构成比、比等。34、变异系数:公
6、式+亦称离散系数,是标准差S与均数X之比,常用于度量衡单位不同,或者均数相差悬殊的两组或多组资料。35、回归系数b的意义:表示自变量增加一个单位时,应变量的平均改变量。36、y:表示给定X时Y的平均值的估值。37、剩余平分和:在总变异中扣除由X解释的部分后剩余的部分,或不能由X对丫的线性影响解释的部分。(写上公式)38、数值变量:即定量变量,数值是定量的,表现为数值的大小,一般有度量衡单位亦为计量资料。39、标准误:统计理论上将样本统计量的标准差称为统计量的标准误。二、理论大题:1、 定量资料的统计描述指标描述:集中位置:算术均数、几何均数、中位数、百分位数离散程度:极差、标准差、方差、四分位
7、数间距、变异系数集中离散小结:(上集中、下离散)均数几何均数中位数百分位数适用资料单峰对称分布等比资料、对数正态分布各种分布、偏态分布、不确定值各种分布、偏态分布、不确定值计算特点用到全部数据用到全部数据中间数据部分数据极端值影响敏感敏感、不能同时有正负数不敏感不敏感极差四分位数间距标准差、方差变异系数适用资料任何分布常用于偏态分布正态分布度量衡单为不同、均数相差悬殊计算特点用到两端数据用到中间数据用到全部数据用到全部数据极端值影响敏感不敏感敏感敏感2、 正确应该相对数对数的分母不宜过小分析时不能以构成比代替率观察单位数不等的几个率,不能直接相加求其平均率(或称总率)算率时要注意资料的同质性,
8、对比分析时应注意资料的可比性率的比较应作假设检验3、 标准化法的注意事项选取不同的标准组,得到的标准化率是不一样的日)标准化率是相对的,其作用仅在于比较,并不表示实际水平标准化率不代表总体率,也不能完全代替分组比较4、 参考值范围确定的原则计算相对数的分母不宜过小分析时不能以构成比代替率对观察单位数不等的几个率不能相加求其平均率计算率时要注意资料的同质性,对比分析应注意资料的可比性对率的比较应作假设检验5、 容许区间与可信区间异同点1联系:两者均是从样本估计得到的区间。2.区别:可信区间c用于估计总体参数,总体参数只有一个;10.05,s容许区间。用于估计变量值的分布范围,变量值可能很多甚至无
9、限,95%容许区间的涵义是指有95%的变量值在该范围内。可信区间行c所基于的t分布是统计量的抽样分布,H().05.y*一般均可通;容许区间区劭05S所基于的正态分布是变量值的分布,只有当分布接近正态分布时方适用。6、 第一类第二类错误不拒绝HO正确推断(1-a)第二类错误(B)拒绝HO,接受H1HO真实第一类错误()HO不真实正确推断(1B)7、 方差变量变换的常用方法数变换A-=fog(A)数变换Xyx方根反正弦变换Varcsin(V|8、 四格表X2的检验应用条件(也有可能是选择题)N40且所有的T5时,用X2检验N40但有1VT5时,用四格表资料X2检验的校正公式;当nW40或TW1时
10、,用确切概率法当P值接近检验水准时,推荐使用确切概率法1、等级资料2、定量资料,但数据的某端或两端无确定数值3、定量资料,但数值的分布是极度偏态的4、定量资料,但各组分布离散程度相差悬殊,即使经变量变换,也难以达到方差齐性。5、定量资料,但分布型尚未确知,可先用秩和检验进行分析。6、兼有等级和定量的资料IK相关分析的正确应用相关关系是一种共变关系充分利用散点图识别离群值排除资料的间杂性12、 直线回归与直线相关的区别及联系(P131)13、 研究设计的三个因素:处理因素、受试对象、实验效应14、 实验设计基本原则对照、随机、重复15、 最小样本含量的影响因素数据种类指标间差值变异度相关程度研究
11、设计质量设计方法各组例数分配所定义Q、B水准16、 正态分布的特征(见书P17)17、 可信区间与假设检验的区别与联系在相同的之下,若假设检验拒绝HO(p=),那么可信度为Q-a)的可信区间必然不包括总体参数;并估计总体参数在H1所界定的范围内;反之亦然。可信区间与假设检验是对同一问题所作的不同结论,效果等价。18、 两组秩和检验基本思想如果HO成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和m(N+1)2;B组的实际秩和应接近理论秩和n2(N+1)2).或相差不大,差值很大的概率应很小。如果相差较大,超出了预定的界值,则可认为Ho不成立。如果HO成立,则理论秩和与实际秩和之差纯粹是由
12、抽样误差造成。19、 回归分析的应用条件线性、独立、正态、等方差20、 方差分析优点受比较组数的限制,可比较多组均数。可同时分析多个因素的作用。可分析因素间的交互作用。21、参考值范围的制定百分比正态分布法百分位数法双侧单(只有下限)(只有上限)双侧单(只有下限)(只有上限)90X均数1.64SX均数128SX均数+1.28sP5P95P10P9095X均数1.96SX均数164SX均数+1.64sP2.5P97.5P5P9599X均数土2.58sX均数-2.33sX均数+2.33sP0.5-P99.5P1P99Ps:选择题可能会问到各种自由度,要区分!计算题可能有关方差分析回归分析表格;编秩;最小理论数;什么设计类型;假设检验及其步骤选择题要多看看老师发的题库可能在里面会有原题喔!老师之前发了一张卷子也多看看!大家加油加油加油加油!!