《医学统计学重点知识总结 (2).docx》由会员分享,可在线阅读,更多相关《医学统计学重点知识总结 (2).docx(10页珍藏版)》请在第一文库网上搜索。
1、一、平均数应用的注意事项1 .同质的资料计算平均数才有意义。2 .均数适用于:单峰对称分布的资料3 .几何均数适用于:对数变换后单峰对称的资料:等比资料、滴度资料、对数正态分布资料4.中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数:偏态分布、分布不明资料、有不确定值的资料二、抽样误差1 .由抽样引起的样本统计量与总体参数间的差别。2 .原因:个体变异+抽样3 .表现:样本统计量与总体参数间的差别;不同样本统计量间的差别4 .抽样误差是不可避免的!5 .抽样误差是有规律的!三、中心极限定理(Centra1iimittheorem)1CaSe1:从正态分布总体N(
2、,2),中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。2Case2:从非正态(nonnorma1)分布总体(均数为,方差为2)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。四、统计推断的内容1 .参数估计:由样本统计量估计总体参数(1)点估计(2)区间估计:按一定的概率或可信度(1a)用一个区间估计总体参数所在范围,这个范围称作可信度为1a的可信区间(ConfidenCeinterVa1CI),又称置信区间。这种估计方法称为区间估计。2 .假设检验五、正
3、确理解可信区间的涵义1可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的可信度是针对可信区间的构建方法而言的。2 .以均数的可信区间为例,其涵义是:如果重复IOO次抽样,每次样本含量均为n,每个样本均按5”构建可信区间,则在此IoO个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。3 .在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值。例题:算得某95%的可信区间,则(E)A.总体参数有95%的可能落在该区间。B.有95%的总体参数在该区间内。C.该区间包含95%的总体参数。D.该区间有95%的可能包含总
4、体参数。E.该区间包含总体参数,可信度为95%。六、参考值范围(referenceinterva1)1 .参考值范围又称正常值范围(norma1range)t2 .什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。3 .确定参考值范围的意义:用于判断正常与异常。4 .“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。七.标准差与标准误的区别与联系联系1都是变异指标。2 .当n不变时,标准差3标准误fs区别1标准差描述原始数据的离散程度;3 .标准误反映均数的抽样误差大小。4 .结合样本均数和正态分布的规律,标准差估计参考值范围;
5、5 .结合样本均数和t分布的规律,标准误估计总体均数的可信区间。八、假设检验的步骤1建立假设(1)零假设(nu11hypothesis),记为HOHO:=;(2)备择假设(a1ternativehypothesis),记为H1H1:0o2 .确定检验水准:一般取。=0.05小概率事件的判断标准3 .选定检验方法计算检验统计量_X_4oIs/V711统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。这种偏离称为标准t离差。根据抽样误差理论,在HO假设前提下,统计量t服从自由度为n-1的t分布,即t值在0的附近的可能性大,远离0的可能性小,离。越远可能性越小。t值越小,越利于HO假设;t
6、值越大,越不利于He)假设4 .计算概率P(与统计量t值对应的概率)在HO成立的前提下,获得现有这么大的标准t离差以及更大离差的可能性。九、假设检验的基本步骤1建立检验假设2 .确定检验水准3 .计算检验统计量,界定P值4 .推断性结论:当PW时,拒绝HO,接受H1,差别有统计学意义。当P时,不拒绝H0,差别尚无统计学意义。十、均数的假设检验1样本均数与总体均数比较的t检验5 .配对设计计量资料的t检验6 .成组设计计量资料的t检验7 .成组设计计量资料的U检验十一、配对设计定量资料的t检验1 .配对设计是研究者为了控制可能存在的主要的非处理因素而采用的一种实验设计方法。(提高组间可比性)2
7、.自身配对:同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;3 .异体配对:将条件相近的实验对象配对,并分别给予两种处理。十二、配对t检验1 .首先求出各对数据间的差值d2 .若两处理因素的效应无差别,差值d的总体均数Ud应该为0,故可将该检验理解为样本均数日与总体均数d=0的比较。例4.5为研究某新的降压药对高血压患者舒张压的影响,随机抽取了10名高血压患者,分别在其用药前和用药后一个月测量其舒张压,试问该降压药对高血压患者的舒张压是否有影响?表4.210名高血压患者用药前后舒张压的测定值(InInHg)患者号(1)用药前(2)用药后(3)差值(4)=(2)-(
8、3)194886210292103110106441009465102106-4610696107114108689896291081026101041004合计SOH0z4=。,用药前后的舒张压相同:H1z产0,用药前后的舒张压不同。双侧a=0.05d_5.0sdyfn4.03=3.923按V=f1-1=10-1=9,曲值表,得0.005P0.002。按a=0.05水准,拒绝H。,接受H1,差别有统计学意义,可以认为高血压患者用药后舒张压降低。十三、两样本均数比较的t检验1完全随机设计:(1)受试对象被随机分配到两组中,分别接受不同的处理。(2)从两个总体中随机地抽取一部分个体进行研究O例如
9、手术组与非手术组、新药组与对照组等。2.目的:推断1=2?十四、第一类错误与第二类错误Ho真实Ho不真实不拒绝HO正确推断(1一。)第二类错误(B)拒绝HO,接受H1第一类错误()正确推断(1-B)统计学上规定:Ho真实时被拒绝为第一类错误(又称I型错误,typeIerror),HO不真实时不拒绝为第二类错误(又称II型错误,typeIIerror).Ps:a的意义1.1 型错误的概率。2 .根据研究者的要求在计算检验统计量之前设定的。3 .确定a=0.05,即I型错误的概率为0.05,理论上100次抽样中发生这样的错误平均有5次。PPS:P值的意义1从HO总体中随机获得等于或大于现有统计量值
10、的概率。2 .拒绝HO时所冒的风险十五、检验效能1又称把握度Powerofatest1-3 .两总体确有差别,按水准能发现它们有差别的能力。4 .例如1=0.9,意味着若两总体确有差别,则理论上IOo次抽样研究中,平均有90次能得出有差别的结论。十六、两样本率的比较1目的:推断两总体率是否相等2 .两样本率比较的U检验(citest)3 .两样本率比较的X2检验(chi-squaretest)例:某医院研究某种新降压药治疗高血压病人的疗效,结果如下,问该新药治疗高血压的痊愈率和对照组是否相同?例6.5表6.1两药治疗高血压瘁愈率的比较组别痊愈未痊愈合计痊愈率(%)试验组33(a)27(b)60
11、55.00对照组Is(C)35(d)5030.00合计486243.64四格表(fourfo1dtab1e)四格表的理论频数由下式求得:式中:TRC为第R行C列的理论频数,nR为相应的行合计,nC为相应的列合计第一步:建立检验假设H0:两总体有效率相等,即1=2;H1:两总体有效率不等,即12第二步:确定检验水准:O=0.05(双侧检验)2=(7)2第三步:计算检验统计量:T式中:A为实际频数,T为理论频数第四步:确定P值,下结论表四格表资料的基本形式处理组发生数未发生数合计甲aaxbb-xa+b乙CC-Xdd+c+da+cb+dn由于四格表资料为双边固定形式,即假设行合计与列合计均固定,所以
12、四格表的自由度V=Iv=(行数一1)(列数一1)本例X2=6.933.84得P0,则没有理由拒绝Ho十八、配对两分类资料的比较1配对设计是医学研究中常用的设计方法之一,二分类结果资料的配对研究常用于比较两种检验方法、两种培养方法、两种提取方法等的差别。3 .配对四格表2检验,又称作MCNemar检验。4 .目的:通过单样本分析,推断两处理结果有无差别。例:为研究静脉曲张是否与肥胖有关,观察122例同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体里记录得静脉曲张情况如下,试分析之正常一H1u.JFH_合计发生未发生发生IO1424未发生217798合计3191122计算公式=-C/b+c40
13、:()+c)2040时:直接计算X22 .当20b+cW40时:计算X2C3 .当b+cW20时:计算确切概率二十、两样本比较的秩和检验1检验假设HO:A、B两组等级分布相同;H1:A、B两组等级分布不同。=0.05o二十一、基本思想(质和检验)1如果Ho成立,即两组分布位置相同,则A组的实际秩和应接近理论秩n1(N+1)2;B组的实际秩和应接近理论秩和n2(N+1)2.或相差不大,差值很大的概率应很小。4 .如果相差较大,超出了预定的界值,则可认为Ho不成立。【例8.3】某实验室观察在缺氧条件下猫和兔的生存时间,结果见表8.2,试检验在缺氧条件下猫和兔的生存时间有无差别?彳列题假设不满足套数检验的爱求)表8.2缺京条件下狠和兔的生仔时间漏免生存时同,次生存时同(mn枝次25P.5141341315