PPTOK :您身边最贴心好用的PPT站!

您当前所在位置:澳门视频百家乐 > PPT课件 > 学校ppt > 高校大学PPT → 《医学统计学》完整课件-超级经典!!!ppt

《医学统计学》完整课件-超级经典!!!ppt

  • 素材大小:5.85 MB
  • 素材授权:免费下载
  • 更新时间:2016-10-23
  • 素材类别:高校大学PPT
  • 素材格式:.ppt
  • 关键提要:统计学
  • 素材版本:PowerPoint2003及以上版本(.ppt)
网友评分:
PPT介绍优秀PPT相关PPT精品PPT

这是一个关于《医学统计学》完整课件-超级经典!!!ppt,主要介绍医学统计学(medical statistics) ---是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。 欢迎点击下载哦。

PPT预览

《医学统计学》完整课件-超级经典!!!ppt

PPT内容

医学本科生用 医 学 统 计 学
The teaching plan for medical students
Dept. of Preventive Medicine
Taishan Medical College
程琮教授简介
    预防医学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程的教学及科研工作,每年听课学生500-800人。自2000年起连续六年,为硕士研究生开设《医学统计学》、《SPSS统计分析简明教程》、《卫生经济学》等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文30多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,,“行列相关的测度” 等。主编、副主编各类教材及专著8部,代表作有《医学统计学》、《SPSS统计分析简明教程》获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。
医学统计学总目录
第1章绪论  目录
第一章  绪论 第一节  医学统计学的定义和内容
医学统计学(medical  statistics) ---是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。
第二节  统计工作的基本步骤
一、统计设计
二、搜集资料
三、整理资料
统计分析包括以下两大内容:
第三节  统计资料的类型
二、定性资料
三、等级资料
第四节  统计学中的几个基本概念 一、同质与变异
同质(homogeneity) 是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)  由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
二、总体与样本
图示:总体与样本
三、参数与统计量
四、抽样误差
五、概率
第五节  学习医学统计学应注意的问题
课后作业
医学本科生用
The teaching plan for medical students
Dept. of Preventive Medicine
Taishan Medical College
第2章定量资料的统计描述 目录
第一节  频数分布表
二、频数分布表的编制
表2-2  某年某市120名12岁健康男孩身高(cm)的频数分布
二、频数分布表的用途
第二节 集中趋势的描述
一、算术均数
1. 直接法:用于观察值个数不多时
2.加权法(weighting method):用于变量值个数      较多时。
二、几何均数
几何均数(geometric mean,简记为G):表示其平均水平。
适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。
计算公式:有直接法和加权法。
1.直接法:  用于变量值的个数n较少时
2.加权法 : 用于资料中相同变量值的个数f(即频数)较多时。
①变量值中不能有0; ②不能同时有正值和负值; ③若全是负值,计算时可先把负号去掉,得出结果后再加上负号。
三、中位数及百分位数
㈠中位数
 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。
适用条件:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清。
㈡  百分位数
定义:百分位数(percentile)是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。
计算方法:有直接法和加权法
2.频数表法: 用于例数较多时
计算中位数及百分位数的步骤:
先找到包含Px的最小累计频率;
该累计频率同行左边的组段值为L;
L同行右边的频数为fx(或fm);
L前一行的累计频数为∑fL;
将上述已知条件代入公式计算Px或P50  。
计算结果:
第三节  离散趋势的描述
定义:用来说明变量值的离散程度或变异程度。
注意:仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。
常用离散指标有:极差、四分位数间距、标准差、方差、变异系数。
实例分析
甲组: 184  186  188  190  192
乙组: 180  184  188  192  196
两组球员的平均身高都是188cm,但甲组球员身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。
一、极差和四分位数间距
㈠极差
  极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差 。
特点:计算简单,不稳定,不全面,易变化;可用于各种分布的资料。
㈡四分位数间距
二、方差和标准差
自由度(degree of freedom)的概念
n-1是自由度,用希腊小写字母ν表示,读作[nju:]。
定义:在N维或N度空间中能够自由选择的维数或度数。
例:A+B=C,共有n=3个元素,其中只能任选2个元素的值,故自由度ν=n-1=3-1=2。
方差的特点
充分反映每个数据间的离散状况,意义深刻;
指标稳定,应用广泛,但计算较为复杂,不易理解;
方差的单位与原数据不同,有时使用时不太方便;
在方差分析中应用甚广而极为重要。
(二)标准差(standard  deviation) 
牢记:离均差平方和展开式:
标准差的特点:
意义同方差,是方差的开平方;
标准差的单位与原数据相同,使用方便,意义深刻,应用广泛;故一般已作为医学生物学领域中反映变异的标准,故称标准差。
标准差的计算方法:可分为直接法和加权法。
直接法:标准差计算实例:
例2.12  例2.2中7名正常男子红细胞数(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,计算其标准差。
 ∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46
∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99
计算结果:
加权法:标准差计算实例:
例2.13  对表2-4资料用加权法计算120名12岁健康男孩身高值的标准差。
三、变异系数
变异系数(coefficient of variation): 简记为CV ;
特征:①变异系数为无量纲单位,可以比较不同单位指标间的变异度;②变异系数消除了均数的大小对标准差的影响,所以可以比较两均数相差较大时指标间的变异度。
变异系数 计算实例
例2.14  某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm; 体重均数为53.72kg,
    标准差为4.96kg。试比较身高与体重的变异程度。
身高
第四节   正态分布
图2-1  120名12岁健康男孩身高的频数分布
㈠  正态分布的函数和图形
图2-2  频数分布逐渐接近正态分布示意
为了应用方便,常按公式(2.19)作变量变换
这样将正态分布变换为标准正态分布 (standard normal distribution)
图2-3  正态分布的面积与纵高
㈡正态分布的特征
图2-4  不同标准差的正态分布示意
二、正态曲线下面积的分布规律
标准正态分布表(u值表)
根据题意,按公式(2.19)作u变换
身高范围所占面积
三、正态分布的应用
THANK  YOU  FOR   LISTENING
本科生用 医学统计学教案
泰山医学院预防医学教研室
Zcheng@tsmc.edu.cn
The teaching plan for medical students
Dept. of Preventive Medicine
Taishan Medical College
第3章总体均数的区间估计和假设检验 目录
图示:总体与样本
第一节  均数的抽样误差与标准误
σ已知:
 实例:如某年某市120名12岁健康男孩,已求得  均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:
二、标准误的应用
1.表示抽样误差的大小 ;
2.进行总体均数的区间估计;
3.进行均数的假设检验等 。
第二节  t 分布   一、t 分布的概念
正态变量X采用u=(X-μ)/σ变换,则一般的正态分布N (μ,σ)即变换为标准正态分布N (0,1)。
又因从正态总体抽取的样本均数服从正态分布
    N(μ,     ),同样可作正态变量的u变换,即
 实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值, 此时就不是u变换而是t变换了,即下式:
t分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称Student t 分布(Students’ t-distribution)。
二、t分布曲线的特征
t分布曲线下双侧或单侧尾部合计面积
我们常把自由度为υ的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值α时,则横轴上相应的t界值记为tα,υ。如当υ =20, α=0.05时,记为t0.05, 20;当υ =22, α =0.01时,记为t0.01, 22。对于tα, υ值,可根据α和υ值,查附表2,t界值表。
第三节  总体均数的区间估计
参数估计:用样本指标(统计量)估计总体指标(参数)称为参数估计。
估计总体均数的方法有两种,即:
点值估计(point estimation )
区间估计(interval estimation)。
一、点值估计
点值估计:是直接用样本均数作为总体均数的估计值。
此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度 。
二、区间估计
区间估计是按一定的概率(1-α)估计包含总体均数可能的范围,该范围亦称总体均数的可信区间(confidence interval,缩写为CI)。
1-α称为可信度,常取1-α为0.95和0.99,即总体均数的95%可信区间和99%可信区间。
1-α(如95%)可信区间的含义是:总体均数被包含在该区间内的可能性是1-α,即(95%),没有被包含的可能性为α,即(5%)。
总体均数的可信区间的计算
1.未知σ且n较小(n<100)  按t分布的原理
例3.1  为了了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试求该地1岁婴儿的血红蛋白平均值95%的可信区间。
例3.2  上述某市120名12岁健康男孩身高均数为143.07cm,标准误为0.52cm,试估计该市12岁康男孩身高均数95%和99%的可信区间。
95%的可信区间为 143.07±1.96×0.52,即(142.05,144.09)。
99%的可信区间为 143.07±2.58×0.52, 即(141.73,144.41)。
注  意  点
标准误愈小,估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确;
反之,标准误愈大,估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差。
表3-1  标准差和标准误的区别
第四节  假设检验的意义和基本步骤
假设检验(hypothesis test):亦称显著性检验(significance test),是统计推断的重要内容。它是指先对总体的参数或分布作出某种假设,再用适当的统计方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。
例3.3  根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?
本例两个均数不等有两种可能性:
①山区成年男子的脉搏总体均数与一般健康成年男子的脉搏总体均数是相同的,差别仅仅由于抽样误差所致;
②受山区某些因素的影响,两个总体的均数是不相同的。如何作出判断呢?按照逻辑推理,如果第一种可能性较大时,可以接受它,统计上称差异无统计学意义(no statistical significance);
如果第一种可能性较小时,可以拒绝它而接受后者,统计上称差异有统计学意义(statistical significance)。
假设检验的一般步骤如下:
1.建立检验假设
 一种是无效假设(null  hypothesis),符号为H0;
一种是备择假设(alternative hypothesis)
符号为H1。
 表3-2  样本均数所代表的未知总体均数 与已知总体均数的比较
表3-3  两样本均数所代表的未知总体均数的比较
4.确定概率P值  P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。
│t│≥ tα,υ  ,则P≤ α ;│t│< tα,υ,则P > α。
下结论时的注意点:
P ≤α ,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现;
同理,P >α ,不拒绝H0,更不能认为H0肯定成立。由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误
第五节  均数的u检验
u 值的计算公式为:
例3.4  某托儿所三年来测得21~24月龄的47名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)
二、两样本均数比较的u检验
该检验也称为独立样本u检验(independent sample u-test),适用于两样本含量较大(如n1>50且n2>50)时,u值可按下式计算:
 例3.5  测得某地20~24岁健康女子100人收缩压均数为15.27kPa,标准差为1.16kPa;又测得该地20~24岁健康男子100人收缩压均数为16.11kPa,标准差为1.41kPa。问该地20~24岁健康女子和男子之间收缩压均数有无差别?
第六节  均数的 t 检验
当样本含量较小(如n<50)时,t分布和u分布有较大的出入,所以小样本的样本均数与总体均数的比较以及两个样本均数的比较要用t检验。
t检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相等。
一、样本均数与总体均数比较的t检验
亦称为单样本t检验(one sample t-test)。即样本均数代表的未知总体均数与已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较。这时检验统计量t值的计算在H0成立的前提条件下由公式(3.4)变为:
例3.6  对例3.3资料进行t检验。
(1)建立检验假设
 H0:μ =μ0 ,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数相同;
 H1:μ≠μ0 ,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数不同。
α =0.05(双侧)
(2)计算t值  本例n = 25 ,  s = 6.5 ,  样本均数=74.2 ,总体均数 =72 , 代入公式(3.10)
二、配对资料的t检验
医学科研中配对资料的三种主要类型:
同一批受试对象治疗前后某些生理、生化指标的比较;
同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;
配对动物试验,各对动物试验结果的比较等。
配对实验设计得到的资料称为配对资料。
例3.7  设有12名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重(kg),数据如表3-4所示。问此减肥药是否有效?
(1)建立检验假设
  H0:μd=0, 即该减肥药无效;
  H1:μd≠0 ,即该减肥药有效。
  单侧α=0.05
表3-4  某减肥药研究的体重(kg)观察值
例3.8  某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近配成8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,然后定期将大白鼠杀死,测得其肝中维生素A的含量如表3-5。 问不同饲料组的大白鼠肝中维生素A含量有无差别?                   (自学内容) 
三、两样本均数比较的t检验
两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independent samples t-test)。
适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。
若n1=n2时:
已知S1和S2时:
例3.9  测得14名慢性支气管炎病人与11名健康人的尿中17酮类固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无不同。
原始调查数据如下:
病  人X1:n=14;  10.05  18.75  18.99  15.94  13.96  17.67  20.51  17.22  14.69  15.10   9.42     8.21   7.24  24.60
健康人X2:n=11;   17.95  30.46  10.88  22.38  12.89  23.01  13.89  19.40  15.83  26.72  17.29
四、两样本几何均数t检验
比较两样本几何均数的目的是推断它们各自代表的总体几何均数有无差异。
适用于:
①观察值呈等比关系,如血清滴度;
②观察值呈对数正态分布,如人体血铅含量等。。
两样本几何均数比较的t检验公式与两样本均数比较的t检验公式相同。
只需将观察X用lgX来代替就行了
第七节  两总体方差的齐性检验和t'检验
一、两样本方差的齐性检验
用较大的样本方差S2比较小的样本方差S2
例3.11  某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。
深层水:n1=8,  样本均数=1.781(mg/L), S1=1.899 (mg/L)
表层水:n2=10,样本均数=0.247(mg/L), S2=0.210 (mg/L)
二、t' 检验
方差不齐时,两小样本均数的比较,可选用以下方法:
①采用适当的变量变换,使达到方差齐的要求;
②采用秩和检验;
③采用近似法t' 检验。
计算统计量t' 值
第八节 Ⅰ型错误和Ⅱ型错误
假设检验中作出的推断结论可能发生两种错误:
①拒绝了实际上是成立的H0,这叫Ⅰ型错误(typeⅠerror)或第一类错误,也称为α错误。
②不拒绝实际上是不成立的H0,这叫Ⅱ型错误(typeⅡerror)或第二类错误,也称为β错误。
两类错误的联系与区别
第九节   应用假设检验的注意问题
1.资料要来自严密的抽样研究设计
2.选用假设检验的方法应符合其应用条件
3.正确理解差别有无显著性的统计涵义
    正确理解差别有统计学意义 及临床上的差别的统计学意义。
4.假设检验的推断结论不能绝对化
5.要根据资料的性质事先确定采用双侧检验或单侧检验
医学本科生用
泰山医学院  预防医学教研室
Email:  zcheng@tsmc.edu.cn
Teaching Plan for Medical Students
第4章  方差分析  目录
第四章  方差分析
 学习要求:
1。掌握方差分析的基本思想;
2。掌握单因素、双因素方差分析的应用条件、意义及计
         算方法;
3。熟悉多个均数间两两比较的意义及方法;
4。了解方差齐性检验和t’检验的意义及方法;
5。熟悉变量变换的意义和方法。
第一节  方差分析的基本思想
一、方差分析的用途及应用条件
方差分析(analysis of variance,缩写为ANOVA)
是常用的统计分析方法之一。其应用广泛,分析效率高,节省样本含量。
主要用途有:
①进行两个或两个以上样本均数的比较;
②可以同时分析一个、两个或多个因素对试验结果的作用和影响;
③分析多个因素的独立作用及多个因素之间的交互作用;
④进行两个或多个样本的方差齐性检验等。
方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。
表4-2  PCNA在三种不同胃组织中的表达结果
5。正交试验设计的方差分析  如果要分析的因素有三个或三个以上,可进行正交试验设计(orthogonal experimental design)的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,得到更多的分析结果。
第二节  单因素方差分析
1 。特点  单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分,
     即SS总=SS组间+SS组内。
2。常用符号及其意义
(1)Xij 意义为第i组的第j个数据。其中下标 i 表示列,j 表示行。
(2)      意义为将第i组的全部j个数据合计。
表4-2  PCNA在三种不同胃组织中的表达结果
第三节  双因素方差分析
一、特点及意义
1.特点  按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。
但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:
SS总=SS处理+SS区组+SS误差
计算公式
表4-5  消毒液对不同细菌的抑制效果
第四节  多个样本均数间的两两比较
一、均数两两比较的特点和意义
1。当分析结果为P≤α,拒绝H0时,得出的结论只是指各总体均数不全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。
2。当有三个及三个以上样本均数比较时,如果仍使用一般的t检验对样本均数两两组合后进行比较,会使检验水平α值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较
第五节  多个方差的齐性检验
一、概念及意义
Bartlett 检验法的基本思想是,设各总体方差相等,均等于其合并方差。则各样本方差与合并方差相差不会很大。如果相差很大,则计算的样本的      值较大,当超过X2界值时,则P≤α。可以认为各样本所代表的总体方差不全相等。
注意:统计软件中,最常用的是Levene方差齐性检验 。可用于正态分布及非正态分布的资料。
Bartlett 检验法:主要用于正态分布的资料,对于非正态分布的资料不适用。
具体内容自学。
第六节  变量变换
一、概念及意义
(一)概念
变量变换(data transformation)也称为变量代换,是指将原始数据X经过某种数学方法转换为其它的数据形式,使其达到统计学上的某种要求,以利于对资料进行统计处理。如对变量X取对数lgX或取平方根等。常用的变量变换方法有:对数变换,平方根变换,倒数变换,平方根反正弦变换,概率单位变换,logit变换,乘方变换等。
平方根反正弦变换的用途:
THANK   YOU   FOR   LISTENING
医学统计学 
Chinese Teaching Plan for Medical Students
  第5章定性资料的统计描述  目录
第五章  定性资料的统计描述 第一节  常用相对数
一、率
常见率的指标如下:
 ⒈粗死亡率、出生率、人口自然增长率、婴儿死亡率、新生儿死亡率等人口学指标常用的比例基数是1000‰。
  2.恶性肿瘤的死亡率、发病率、患病率通用比例基数是100000/10万。
  3.生存率、病死率通用的比例基数是100%。
二、构成比
构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
常用来表示疾病或死亡的顺位、位次或所占比重。由于构成比之和为100%,一部分变化会影响其它部分的也发生变化。
率和构成比的区别(补充)
三、比(相对比)
比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几,通常用倍数或分数表示。计算公式为:
常用相对比指标
1.对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。
2.关系指标:指两个有关的、但非同类事物的数量的比。
3.计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。
表5-1  1993~1998年某地损伤与中毒病死率(%)与构成比(%)
第二节  应用相对数应注意的问题
1.计算相对数时分母一般不宜过小 ,一般不能小于30例。
2.分析时不能以构成比代替率 。
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.应当注意不能用构成比的动态分析代替率的动态分析。
5.在比较相对数时应注意可比性。
6.对样本率(或构成比)的比较应随机抽样,并做假设检验。
第三节  率的标准化法
表5-4  甲、乙两地各年龄组人口数及死亡率(‰)
二、标准化率的计算
标准化率(standardized  rate)亦称调整率(adjusted rate)。
常用的计算方法按已知条件有:
直接法:间接法:不讲。反推法:不讲。
2。选择标准人口的方法:
1)选择两地数据之一的人口数或构成比;
2)选择两地数据之和的人口数或构成比;
3)选择当地或全国的人口数或构成比;
4)国际间比较选用世界通用标准。
表5-6  按公式(5.4)用直接法计算标准化死亡率(‰)
标化结果
甲地标准化死亡率
乙地标准化死亡率
表5-7  按公式(5.5)用直接法计算标准化死亡率(‰)
三、标准化法使用注意事项
第四节  动态数列及其分析指标
动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
1.时间动态数列  各个指标在时点上的数据;
2.时期动态数列  各个指标在一定的时间间隔内陆续发生并积累的数据 。
表5-9  某地1990~1998年床位发展动态
例5.4   对表5-9第(1)、(3)栏资料作动态分析
例 根据表5-9数据,预测2003年床位数
第五节  常用的相对数指标
生存率常用于评价某些慢性病如癌症、心血管等的远期疗效。可以计算3年、5年或10年生存率。 
10.生存率(survival rate)  是指患某种疾病的人(或接受某种治疗的某病病人)经n年的随访,到随访结束时仍存活的病例数所占的比例。
主讲  程  琮
Chinese Teaching Plan for Medical Students
第6章总体率的区间估计和假设检验       目录
第六章  总体率的区间估计和假设检验 第一节  率的抽样误差与总体率的区间估计(1)
For example
For example
例6.2  求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。
95%的可信区间为:25%±1.96×1.53%   即(22.00%,28.00%)
 99%的可信区间为:25%±2.58×1.53%   即(21.05%,28.95%)
第二节 率的u 检验(1)
一、样本率与总体率比较的u检验
For example
例6.5  根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃溃疡病患者是否较一般胃溃疡病患者易发生胃出血。
计算结果及判断
判断:u=3.58 > u0.05=1. 64(单侧),  P<0.05。
在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义。  
第二节 率的u检验(3)
二、两样本率比较的u检验
适用条件为两样本的np和n(1-p)均大于5。
计算公式为
For example
表6-1  用药组和对照组流感发病率比较
计算结果
第三节  X2检验
X2检验(chi-square  test)或称卡方检验,是一种用途较广的假设检验方法,常用于检验两个或多个样本率及构成比之间有无差别,还用来检验配对定性资料及两种属性或特征之间是否有关系等。
一、四格表资料的检验
四格表资料的检验主要用于两个样本率(或构成比)的假设检验,一般制成表6-2的计算格式(以阳性和阴性为例)。
表6-2  四格表资料检验计算表
X2检验的基本公式为
四格表检验专用公式 
省去计算T值
例6.7   以例6.6资料为例
两种方法计算结果
结果判断
X2临界值:X20.05,1=3.84,
        请记住  :   X2 0.01,1=6.63,
                          X2=u2
本例  : X2=4.125> X20.05,1=3.84,  两组差别有统计学意义。与前面的结论相同。
四格表值的校正
例6.8 某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表6-4,问两疗法的治愈率是否相等?
计算结果及判断
本例:X2=2.71< X2 0.05,1=3.84
本例若对X2值不校正,α=4.06,得P<0.05,结论正好相反。
二、配对四格表资料的检验
1。用于配对定性资料差异性的假设检验 。
例6.9 有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如表6-5。问两种白喉杆菌培养基的效果有无差别?
表6-5  甲、乙两种白喉杆菌培养基的培养结果
本例检验步骤如下:
(1)建立检验假设 
    H0:总体B=C,即两种白喉杆菌培养基的效果相同
     H1:总体B≠C,即两种白喉杆菌培养基的效果不同
      α=0.05
    (2)计算值  本例b=9,c=1,b+c<40,
三、行×列表的检验
(一)多个样本率的比较
 例6.10  某市重污染区、一般市区和农村的出生婴儿的致畸情况如表6-6,问三个地区的出生婴儿的致畸率有无差别?
计算X2值
    (3)确定P值  本例υ =(3-1)(2-1)=2,查界值表,X20.05,2=5. 99。
(4)推断结论  在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可认为三个地区出生婴儿的致畸率有差别。
(二)多个构成比的比较
6.11 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表6-7,问其血型构成有无差别?
计算X2值
(三)双向有序分类资料的关联性检验
例6.12  某工厂在冠心病调查中研究冠心病与眼底动脉硬化的关系,共调查588人,资料如表6-8,问冠心病与眼底动脉硬化有无关系?
计算X2值
(3)确定P值:υ=(3-1)(3-1)=4,查X2界值表,X2 0.05,4=9.49,本例X2=53.18 > X2=9.49,P<0.05。
(4)推断结论  在α=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可认为冠心病诊断结果与眼底动脉硬化分级有关系。
计算列联系数(Pearson法)r值。
r值在0~1之间,0表示完全独立,1表示完全相关,r愈接近0,说明几乎没有关系,r愈接近1,说明关系愈密切。
 行×列表资料的检验的注意事项
 行×列表资料的检验的注意事项
2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用下述的行×列表的分割法。
3.对于行×列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。
四、行×列表的分割法
例6.13  对例6.10三个地区的出生婴儿的致畸率的分析结果作进一步的两两比较
第四节*  四格表的确切概率法 (Fisher’s exact test)
前已述及,四格表若有理论频数T小于1,或n<40时,尤其是用其他检验方法所得概率接近检验水准时,宜用四格表的确切概率法(exact probabilities in 2×2 table),即四格表概率的直接计算法。
本法的基本思想是:在四格表周边合计不变的情况下,获得某个四格表的概率为 :
 例6.14  抽查两批食品的卫生状况,作大肠杆菌检查,检查结果见表6-10。问两批食品的卫生状况有无差别?
计算 P 值
表6-10中甲批食品阳性率P1=0.4167,乙批食品阳性率P2=0.1000,两者之差| p1-p2 |=0.3167。在周边合计数不变的条件下,可能还有其它组合的四格表,其阳性率之差≥0.3167,所有这些比当前四格表更极端的情况都应考虑进去,因为这些极端情况在H0条件下都有可能发生。
   表6-11中| p1-p2 |≥0.3167的四格表为序号(0)、(1)、(5)、(6)的情形,按公式(6.16)求得序号(1)的概率为
THANK YOU FOR LISTENING
THE    END
Teaching Plan For  Medical Students
第7章二项分布与泊松分布   目录
第七章  二项分布与Poisson分布 第一节    二项分布及其应用
贝努里模型应具备下列三个基本条件。
二、 二项分布的概率函数
三、 二项分布的性质
由公式(7.2)可看出二项展开式有以下特点:
  至多有x例阳性的概率为:
3.二项分布的概率分布图形
4.二项分布的数字特征  这里的数字特征主要指总体均数、方差、标准差等参数。
四、二项分布展开式各项的系数
图7-2   杨辉三角模式图
杨辉三角的意义:
①杨辉三角中每行有几个数字,表示展开式有几项。当试验次数为n 时,有n+1项。
②杨辉三角中每行中的数字表示展开式中每项的系数大小。
③杨辉三角中的各数字项及其数字的排列很有规律。可依照规律继续写下去。第一行的第一、第二项均为数字1,以后每下一行的首项及末项均为1,中间各项为上一行相邻两项数字之和。
五、二项分布的应用
二项分布在生物学及医学领域中,主要应用在下列几个方面:
①总体率的可信区间估计,
②率的u检验,
③样本率与总体率比较的直接计算概率法。
(一)应用二项分布计算概率
例7.1  如出生男孩的概率=0.5,出生女孩的概率为(1-)=0.5。在一个妇产医院里有3名产妇分娩3名新生儿,其中男孩为X=0,1,2,3的概率按公式(7.1)计算的结果列于表7-1的第(3)栏中。
分析:根据题意,已知生育男孩为事件A,其概率P(A)=0.5(即π=0.5);生育女孩为事件,其概率为P()=1-P(A)=1-0.5=0.5(即1-π =0.5)。
  三个妇女生育一个男孩,两个女孩的概率为:
 三个妇女生育均为女孩(即无男孩)的概率为:
(二)样本率与总体率的比较的直接概率法
例7.2  A药治疗某病的有效率为80%。对A药进行改进后,用改进型A药继续治疗病人,观察疗效。①如果用改进型A药治疗20例病人,19例有效。②如果用改进型A药治疗30例病人,29例有效。试分析上述二种情形下,改进型A药是否疗效更好。
  分析:  A药有效率为80%,可以作为总体率,即π0=0.8 。治疗20例病人的样本有效率为(19/20)×100%=95%;治疗30例病人的样本有效率为(29/30)×100%=96.67%。两个样本率均大于总体率80%,故应计算大于等于有效例数的单侧累积概率。
情形一:治疗20例病人的疗效分析
(1)建立检验假设
H0:改进型A药的疗效与原A药相同, π=π0=0.80 H1: 改进型A药的疗效高于原A药, π > π0 =0.80
单侧α =0.05
(2)计算概率值    根据二项分布有:
情形二:治疗30例病人的疗效分析 (1)检验假设同情形一。 (2)计算单侧累积概率有:
(3)推断结论  本例P=0.0663,在=0.05水准上,不拒绝H0。尚不能认为改进型A药的疗效优于原A药。
(3)推断结论  本例P=0.0102,在=0.05水准上,拒绝H0,接受H1。可以认为改进型A药的疗效优于原A药。
 注意:治疗20例病人的有效率为95%,治疗30例病人的有效率为96.67%,两个样本有效率很接近。但最终得出的结论却不相同。一般地,临床上观察疗效,样本含量不能太小。随着观察例数的增加,疗效的稳定性及可靠性也相应增加,受到偶然因素影响的机会也变得较小。
分析:  本例总体率=1%。调查人群样本反应率为(1/300)×100%=0.33%。由于样本率小于总体率,故应计算小于等于阳性人数的累积概率。
例7.3  一般人群对B药的副作用反应率为1%。调查使用B药者300人,其中只有1人出现副作用。问该调查人群对B药的副作用反应率是否低于一般人群。
(1)建立检验假设
H0:调查人群反应率与一般人群相同, π=π0=0.01 H1: 调查人群反应率低于一般人群, π<π0 =0.01
单侧α =0.05
(2)计算单侧累积概率 :
第二节  Poisson分布及其应用
一、Poisson分布的概念及应用条件
(一)Poisson分布的概念
Poisson分布由法国数学家S.D.Poisson在1837年提出。该分布也称为稀有事件模型,或空间散布点子模型。在生物学及医学领域中,某些现象或事件出现的机会或概率很小,这种事件称为稀有事件或罕见事件。稀有事件出现的概率分布服从Poisson分布。
Poisson分布的直观描述:如果稀有事件A在每个单元(设想为n次试验)内平均出现λ次,那么在一个单元(n次)的试验中,稀有事件A出现次数X的概率分布服从Poisson分布。
Poisson分布属于离散型分布。在Poisson分布中,一个单元可以定义为是单位时间,单位面积,单位体积或单位容积等。如每天8小时的工作时间,一个足球场的面积,一个立方米的空气体积,1升或1毫升的液体体积,培养细菌的一个平皿,一瓶矿泉水等都可以认为是一个单元。一个单元的大小往往是根据实际情况或经验而确定的。若干个小单元亦可以合并为一个大单元。
(二)常见Poisson分布的资料
在实际工作及科研中,判定一个变量是否服从Poisson分布仍然主要依靠经验以及以往累积的资料。以下是常见的Poisson分布的资料:
1.产品抽样中极坏品出现的次数;
2.枪打飞机击中的次数;
3.患病率较低的非传染性疾病在人群中的分布;
4.奶中或饮料中的病菌个数;
5.自来水中的细菌个数;
6.空气中的细菌个数及真菌饱子数;
7.自然环境下放射的粒子个数;
8.布朗颗粒数;
9.三胞胎出生次数;
10.正式印刷品中错误符号的个数;
11.通讯中错误符号的个数;
12.人的自然死亡数;
13.环境污染中畸形生物的出现情况;
14.连体婴儿的出现次数;
15.野外单位面积某些昆虫的随机分布;
16.单位容积内细胞的个数;
17.单位空气中的灰尘个数;
18.平皿中培养的细菌菌落数等。
二、Poison分布的概率函数及性质
㈠ 定义 
若变量X的概率函数为                                                                                                                          
亦可用下列公式计算
P(0)= e-λ
(二)  性质
1. 所有概率函数值(无穷多个)之和等于1,即
(0≤x1<x2)
3.累积概率
(三)Poisson分布的图形
一般地,Poisson分布的图形取决于λ值的大小。λ值愈小,分布愈偏;λ值愈大,分布愈趋于对称。当λ=20时,分布接近正态分布。此时可按正态分布处理资料。当λ=50时,分布呈正态分布。见图7-3。这里通过计算一个具体实例来观察Poisson分布的概率分布趋势。
图7-3 Poisson分布的概率分布图
例7.4  计算Poisson分布X~P(3.5)的概率。
余类推。经计算得到一系列数据,见表7-2。
(四)Poisson分布的可加性
从同一个服从Poisson分布的总体中抽取若干个样本或观察单元,分别取得样本计数值X1,X2,X3,…,Xn,则∑Xi  仍然服从Poisson分布。根据此性质,若抽样时的样本计数X值较小时,可以多抽取几个观察单元,取得计数Xi,将其合并以增大X计数值。
三、Poisson分布与二项分布的比较
  Poisson分布也是以贝努里模型为基础的。实际上,Poisson分布是二项分布的一种特殊情形,即稀有事例A出现的概率很小,而试验次数n很大,也可将试验次数n看作是一个单元。此时, n或np =λ为一个常数,二项分布就非常近似Poisson分布。或p愈小,n愈大,近似程度愈好。
  设λ=1。当n=100, =0.01时,及n=1000, =0.001时,按照二项分布及Poisson分布计算概率P(X)。计算结果见表7-3。
表7-3  二项分布与Poisson分布计算的概率值比较
余类推。
1.按二项分布计算
已知:  n=100, π =0.01,  1-π =0.99 ,代入公式有:
2.按Poisson分布计算    代入公式有:
余类推。
四、Poisson分布的应用
Poisson分布有多种用途。
 主要包括总体均数可信区间的估计,
 样本均数与总体均数的比较,
 两样本均数的比较等。
 应用Poisson分布处理医学资料时,一定要注意所处理资料的特点和性质,资料是否服从Poisson分布。
(一)总体均数的估计
 总体均数的估计包括点估计和区间估计。
  点估计是指由样本获得的稀有事件A出现的次数X值,作为总体均数的估计值。该法的优点是计算简便,但缺点是无法得知样本代表总体均数的可信程度。
   区间估计可以确切获知总体均数落入一个区域的可信度,一般可信度取95%或99%。
估计总体均数可信区间一般分为小样本法和大样本法。小样本一般指样本均数或样本计数值X≤50的情形,可直接通过查表法得到可信区间。当样本均数X>50时,Poisson分布近似正态分布,可按正态分布处理资料。
1.小样本法  当样本均数或样本计数值X≤50时,可直接查附表9,“Poisson分布的可信区间”表,得到可信区间。
例7.5  在20ml的当归浸液中含某种颗粒30个。试分析该单元浸液中总体颗粒数的95%和99%的可信区间。
 分析:将20ml当归浸液看作一个单元,该单元的样本均数X=30,小于50。可查附表9,求出总体均数λ的可信区间。
  查附表9(205页)得:
  总体均数λ95%的可信区间为    (20.2 ,  42.8)
  总体均数λ99%的可信区间为    (17.7 ,  47.2)
2.正态近似法  当样本均数或计数X>50时,可按正态分布法处理。
总体均数λ95%的可信区间为
例7.6  某防疫站检测某天然水库中的细菌总数。平均每毫升288个细菌菌落。求该水体每毫升95%和99%的可信区间。
应用公式有:
    λ95%的可信区间
(1) 发病人数的95%可信区间为:
例7.7  调查1985年某市某区30万人,流行性出血热发病人数为204人。求该市发病人数及发病率(1/10万)95%的可信区间。
分析:已知样本均数X为204人,观察单元n=30万人。先计算出发病人数的可信区间,再按照发病率的要求以10万人作为观察单元,计算发病率可信区间的上下限值。
(2) 发病率的95%可信区间为:
上限值:
(二)样本均数与总体均数的比较
  常用的方法有两种。
  ①直接计算概率法:与二项分布的计算思路基本相同。即当λ<20时,按Poisson分布直接计算概率值。
  ②正态近似法:当λ≥20时,Poisson分布接近正态分布。按正态分布使用u检验处理资料。
1.直接计算概率法
    例7.8  某地区以往胃癌发病率为1/万。现在调查10万人,发现3例胃癌病人。试分析该地区现在的胃癌发病率是否低于以往的发病率。
H0:  现在胃癌发病率与以往相同,π =π0 =0.0001
H1: 现在胃癌发病率低于以往, π < π0
单侧α =0.05
(2)计算概率值
  已知:n=100000, =0.0001,=n=100000×0.0001=10。
根据题意,应计算小于等于3人发病的概率P(X≤3),       
          即:P(X≤3)=P(0)+P(1)+P(2)+P(3)
 应用公式(7.14)及(7.15)有:
(3)推断结论  本例P=0.0103,小于P=0.05。在α=0.05水准上拒绝H0,接受H1。可以认为现在该地区胃癌发病率低于以往发病率。
2.正态近似法 当λ≥20时,用u检验法。
  例7.9    根据医院消毒卫生标准,细菌总数按每立方米菌落形成单位(CFU/m3)表示。无菌间的卫生标准为细菌菌落数应不大于200(CFU/m3)。某医院引进三氧消毒机,每天自动对无菌间进行2小时消毒。对无菌间抽样调查显示,细菌总数为121CFU/m3。试问该医院无菌间的细菌总数低于国家卫生标准。
(1) 建立检验假设
H0: 无菌间的细菌总数符合国家卫生标准,λ=λ0=200
H1:  无菌间的细菌总数低于国家卫生标准,λ<λ0
单侧α=0.05
(2)计算u值:
已知:λ0=200 CFU/m3, X=121 CFU/m3,代入公式(7.23)有:
(3)确定P值  查附表2,t界值表(一栏),单侧u0.0005=3.2905,现u> u0.0005, 故P<0.0005。 ⑷推断结论  因P<0.0005,拒绝H0, 接受H1, 差异有统计学意义。可以认为该医院无菌间的细菌总数低于国家卫生标准。
例7.10  某地区以往恶性肿瘤发病率为126.98/10万人。今调查发现,该地区恶性肿瘤发病率上升为148.62/10万人。试分析现在的发病率是否高于以往的发病率。
(3)确定P值  本例u=1.92,大于单侧u0.05=1.64,则P<0.05。 (4)推断结论  在=0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为该地区恶性肿瘤发病率高于以往的发病率。
(1)建立检验假设
H0: 现在的发病率与以往的发病率相同,λ=λ0=126.98
H1: 现在的发病率高于以往的发病率,λ>λ0
单侧=0.05
(2)计算u值:
(三)两样本均数的比较
  应用条件要求资料服从Poisson分布,两个样本均数X1及X2均大于20。
1. 两样本观察单元相同    观察单元可以指单位面积、容积、体积、时间等。
注意:Poisson分布中的观察单元具有可加性,如∑X1和∑X2。检验公式为:
例7.11  空气中负离子状况可以反映空气的新鲜感及污染状况。现调查某风景名胜区不同地点的负离子状况。海拔较高的山上风景点负离子数为240个/cm3。该景区商业区的百货大楼内的负离子数为146个/cm3。试分析该风景区两个不同地点负离子状况有无差异。
(1) 建立检验假设
H0:  两地点负离子状况相同,λ1=λ2
H1:  两地点负离子状况不同,λ1≠λ2
双侧=0.05
(2)计算u值:
(3)确定P值  查附表2,u0.001=3.2905,现u> u0.001, 故P<0.001。 ⑷推断结论  因P<0.001,拒绝H0, 接受H1, 差异有统计学意义。   可以认为该风景区两个不同地点的空气负离子状况有差异。海拔较高的风景点空气状况要好于百货大楼。
例7.12  调查某地区人群死亡状况。结果显示,男性及女性的意外死亡率分别为62人/10万人和72人/10万人。试分析男女意外死亡率有无差异。
分析:该资料服从Poisson分布,每10万人可以作为一个观察单元。
(1)建立检验假设
 H0:男女意外死亡率相等,
H1:男女意外死亡率不相等,
α=0.05
(3)确定P值,推断结论  本例u=0.86,小于u0.05=1.96,则P>0.05。
在α =0.05水准上,不拒绝H0,无统计学意义。可以认为男女性意外死亡率无差异。
例7.13  某医院使用一定方法对住院病房进行消毒,并检测某一病房消毒前后的细菌菌落数(CFU/m3)。消毒前后均检测9次。消毒前的菌落数为18,10,9,15,5,2,6,5,2。消毒后的菌落数为5,4,5,6,7,2,3,2,1。试分析该病房消毒前后的卫生状况有无差异。
分析:该资料服从Poisson分布。根据Poisson分布的可加性,将9次取样的菌落数相加为一个观察单元。消毒前为∑X1=72;消毒后为∑X2=35。
(1)建立检验假设
 H0:消毒前后菌落数相等,λ1= λ2
 H1:消毒前后菌落数不等,λ1≠  λ2
α =0.05
(2)计算u值,应用公式(7.24)有:
2.两样本观察单元不同  当两样本观察单元不同时,不可直接比较或直接相加后进行比较。可以将两样本观察单元先转化为相等的观察单元后,再应用公式进行比较。
 一般可计算两样本均数和,再按下式计算u值。
例7.14  某防疫站检验某商场的两种品牌的矿泉水。检测每ml的细菌总数(CFU/ml)。品牌A抽查4瓶,结果为132,156,182,143;品牌B抽查6瓶,结果为313,298,356,384,348,306。试分析A、B两种品牌矿泉水的细菌总数有无差异。
分析:本例观察单元不相同,可以先求出均数。
(1)建立检验假设
 H0:两种品牌矿泉水菌落数相等, λ1= λ2
 H1:两种品牌矿泉水菌落数不等, λ1≠  λ2
α=0.05
(2)计算u值,应用公式(7.25)有:
(四)多个样本均数的比较
 当比较的样本为二个以上时,可进行多样本均数或样本计数值的检验。使用的方法为卡方检验。检验公式及步骤如下。
1.首先计算观察单元的均数估计值       。符号“∧”读作“hat”。英文为“帽子”之义。
2.将样本计数值Xi(即X1,X2,…,Xn)转换为Zi值。公式为:
3.计算值X2值:
自由度υ =组数-1 。
例7.15  某医院对三个病房进行空气采样,检测细菌污染状况。细菌总数用每立方米菌落形成单元(CFU/m3)来表示。检测结果如下。病房A为168 CFU/m3,病房B为131 CFU/m3,病房C为630 CFU/2m3。试分析三个病房的细菌污染状况有无差异。
分析:应注意病房A与B的观察单元为1个m3,病房C的观察单元则为2个m3,可以看作为2个观察单元。
(1) 建立检验假设
H0: 三个病房的细菌总数相同,λ1=λ2=λ3
H1: 三个病房的细菌总数不全相同。
双侧α =0.05
(2)计算均数估计值
应用公式(7.27)有:
(3)计算Zi值
已知:X1=168,  X2=131,  X3=630;  u1=1,  u2=1,  u3=2。
X1及X2均小于,
应用公式(7.28)有:
X3=630,大于
(5)确定P值  根据组数即病房数为3,自由度=3-1=2,查值表得:=10.60。  本例>,则P<0.005。
(6)推断结论  在=0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为三个病房的细菌总数不全相同,即三个病房的细菌污染状况不同。
(五)应用Poisson分布的注意事项
1.Poisson分布的观察单元具有可加性。当样本均数X或样本计数值<20时,可通过增加或合并观察单元以增大样本均数或样本计数值。当X>20时,Poisson分布近似正态分布,可按正态分布进行Poisson分布均数比较的u检验。
2. Poisson分布的观察单元可以由大缩小,而不可以由小扩大。例如,实际观察1个平皿中的细菌菌落数为34个,不能据此将其扩大而认为10个平皿的菌落数为340个。如果实际观察了10个平皿的菌落数为340个,可以将其缩小而认为2个平皿有68个菌落数。
3.判断一组数据或一个资料是否服从Poisson分布,主要是依靠以往积累的经验或专业知识。必要时也可进行拟合优度检验以确定资料分布类型。
第三节   二项分布与Poisson分布的 拟合优度检验
在实际工作中,科研人员经常需要了解取得的数据的分布特征。了解数据的分布特征一般有两种方法。一是根据以往积累的经验来判断,二是由公式进行检验。后者常用的方法为拟合优度检验(goodness of fit test),也称为配合适度检验。其目的是检验数据的频数分布与一个已知分布是否相符合。常用的拟合优度检验为检验。
其基本方法与步骤 :    略。
Chinese Teaching Plan for Medical Students
第8章秩和检验   目录
教学目的及要求
第一节  非参数统计的概念
非参数检验适用于以下类型的资料:
1.等级资料(有序分类资料)。如疗效按治愈、显效、有效、无效分组的资料;临床化验结果按“-、±、+、++、+++、++++”分组的资料等。
2.偏态分布资料。当观察值呈偏态或极度偏态分布,而又未经变量变换或虽经变换但仍未达到正态或近似正态分布。
3.分布不明的资料。如新指标分布形态不明;小样本,但不趋向正态分布资料。
4.各组方差明显不齐,且不易变换达到齐性。
5.组内个别观察值偏离过大的资料。这里指随机的偏离,而不是“过失误差”。
6.开口分组资料。数据分组某一端或两端无明确数值的资料,只给出一个下限或上限,而没有具体数值,如<0.01μg 、≥60岁等。
非参数检验的特点
非参数检验特点:
1。主要优点是不受总体分布的限制,适用范围广。
2。但对适宜用参数统计检验的资料,若用非参数检验处理,常损失部分信息,降低统计检验效率,即犯第二类错误的概率β比参数检验大。
3。对于适合参数统计检验条件的资料或经变量变换后适合于参数统计检验,应最好用参数检验。当资料不具备用参数检验的条件时,非参数检验是很有效的分析方法。
第二节  配对设计资料的秩和检验 (Wilcoxon配对法)
例8.1  12名宇航员航行前及返航后24小时的心率(次/分)变化如表8-1。问航行对心率有无影响?
(1)建立检验假设
  H0:宇航对心率无影响,即差值的总体中位数Md=0
  H1:宇航对心率有影响,即Md≠0
  α =0.05
(2)求差值  计算每对观察值的差值d  ,见表8-1第(4)栏。
表8-1  宇航员航行前后的心率比较
2)正态近似法 当n>50超出了附表10,T界值表的范围,可按公式(8.1)计算u值。
因为当n逐渐增大时,T值的分布将逐渐逼近于均数为n (n+4) /4 , 标准差为的正态分布,故可按正态分布进行u检验并作出结论。
有相同差数个数较多时,用校正公式: 
第三节  两样本比较的秩和检验 (两个独立样本比较的秩和检验)
1。两样本比较的秩和检验(Wilcoxon两样本比较法)适用于完全随机设计两组定量资料和等级资料的比较。
2。例8.2  测得铅作业与非铅作业工人的血铅值(mol/L)如表8-2第(1)、(2)栏,问两组工人的血铅值有无差别?
表8-2  两组工人血铅值的秩和检验
检验步骤(1)
检验步骤(2)
公式法:当n1或n2-n1超出附表11的范围,可按公式(8.4)求统计量u值。
当相同的秩次较多时(超过25%),应对u值进行校正,u值经校正后略大,P值相应减少。
表8-3  某药对支气管炎两种病情疗效的秩和检验
例8.3  用某药治疗不同病情的老年慢性支气管炎病人,疗效见表8-3第(2)、(3)栏,问该药对两种病情的疗效有无差别?
检验步骤(1)
检验步骤(2)
检验步骤(3)
5)确定P值和得出推断结论  查附表2,t界值表(υ=∞ 一行),u0.50=0.6745, 现uc< u0.50, 故P>0.50。按=0.05的检验水准,接受H0, 差异无统计学意义。尚不能认为该药对两种病情的疗效有差别。
两组疗效评价:表8-3可见,按照从控制到无效顺序排列,疗效等级愈好,平均秩次愈小;疗效等级愈差,平均秩次愈大,所以平均秩和小的组疗效优于平均秩和大的组。反之,如果按照从无效到控制顺序排列,疗效等级愈差,平均秩次愈小;疗效等级愈好,平均秩次愈大,这时平均秩和大的组疗效优于平均秩和小的组。
第四节 完全随机设计 多个样本比较的秩和检验
1。此方法也称为Kruskal-Wallis法,即H检验。
2。主要适用于非正态分布,而不宜用方差分析检验的定量资料以及多组等级资料的比较。
例8.4  某医生分别测定了10名正常人、单纯性肥胖和皮质醇增多症患者血浆中总皮质醇的含量见表8-4。问三组人的血浆总皮质醇含量有无差别?
检验步骤(1)
(1)建立检验假设 
H0:三组人的血浆总皮质醇的总体分布位置相同
H1:三个总体分布位置不同或不全相同
υ =0.05
(2)编秩  每组内数值由小到大依次排队,三组统一编秩。数值相同而不同组的均编为平均秩次,如正常人组和单纯肥胖组各有一个3.1,均取原秩次10及11的平均秩值次10.5;在同一组内的相同数值直接编相应秩次即可。
表8-4  三组人的血浆总皮质醇测定值(g/L)
检验步骤(2)
检验步骤(3)
检验步骤(4)
(4)确定P值和作出推断结论   ①若组数k=3,每组例数ni≤5时,可查附表12,H界值表。若H<Hα ,则P>α ;反之,H≥ Hα ,P≤ α 。②若组数k>3,或每组例数ni >5时,H分布近似服从X2分布,可查附表8,X2界值表,得P值。
本例ni均为10,υ =3-1=2,查X2界值表,
X2 0.05,2=5.99,现H=18.12> X2 0.05,2=5.99, 故P<0.05。按υ =0.05的水准,拒绝H0,接受H1,差异有统计学意义。三组人的血浆总皮质醇含量有差别。
例8.5   检验步骤(1)
 例8.5  五种病人阴道涂片按巴氏细胞学分级的检查结果,见表8-5第(1)~(6)栏,问五种病人的细胞学分级有无程度上的差别?
(1)建立检验假设 
H0:五种病人细胞学分级的总体分布位置相同
H1:五个总体的位置不同或不全相同,
      α =0.05
(2)编秩   先计算各等级的合计,见表8-5第(7)栏。再确定秩次范围和计算平均秩次,见第(8)、(9)栏。
表8-5  五种病人阴道涂片的细胞学分级比较
例8.5   检验步骤(2)
例8.5   检验步骤(3)
第五节  多个样本间 两两比较的秩和检验
一、各组样本含量相等时的两两比较
各组样本含量相等时的两两比较秩和检验(Nemenyi-Wilcoxon-Wilcox秩和检验)
第六节  随机区组设计 资料的秩和检验
第七节  随机区组设计资料的两两比较
当随机区组资料多个样本比较的秩和检验认为各总体的位置不同时,可进一步作两两比较的秩和检验。其方法和步骤与第五节完全随机设计各样本含量相等时的两两比较相同,作q检验,只是将公式(8.9)差值的标准误换为公式(8.16)即可。
THANK YOU FOR LISTENING
 医学本科生用 医学统计学
泰山医学院  预防医学教研室
zcheng@tsmc.edu.cn
Teaching Plan for Medical Students
第9章直线相关与回归   目录
教学目的及要求
第九章  直线相关与回归
掌握直线相关与回归的概念、意义及应用条件;
掌握直线相关与回归各指标的意义、应用及计算方法;
熟悉直线相关与回归的联系及区别;
了解曲线回归的概念、意义及类型。
第九章 直线相关与回归 第一节  直线相关
1。当两事物或现象在数量上的协同变化呈直线趋势时则称为直线相关(linear correlation),又称简单相关(simple correlation),用于分析双变量正态分布资料。表示两变量相关关系的重要指标就是相关系数。
图9-1  相关系数示意
第一节  直线相关
二、相关系数的计算
相关系数r的计算公式:
表9-1  身高与前臂长数据与计算表
第二节 直线回归
一、直线回归的概念
1。回归:反映两变量数量依存的关系,即指由一个变量推算另一个变量的数量关系。直线回归是回归分析中最基本最简单的一种,故又称简单回归(simple regression)。
2。反映回归关系的方程称为直线回归方程。
第三节  进行直线相关与回归分析时 应注意的问题
1.作相关回归分析要有实际意义。不要把毫无联系的两种现象作相关回归分析。
2.相关关系不一定是因果关系,也可能是伴随关系。
3.在进行直线相关与回归分析之前,应先绘制散点图,当观察到点的分布呈直线趋势时,方可进行分析,如散点图呈曲线趋势,应进行曲线回归分析。
第四节 等级相关
当遇到有些资料并不呈正态分布,对于此类资料就不宜用上述所讲的直线相关与回归分析,而常用等级相关处理资料。
等级相关(rank correlation)亦称为秩相关,适用于分布类型不明的资料、偏态分布资料和等级资料的相关分析。本节主要介绍Spearman等级相关法。
第五节  曲线直线化(1)
一、曲线直线化的概述
在医学研究中,有时两种变量间不呈直线关系,而是呈曲线关系。需要把这些关系变动的特征恰当地反映出来,需要根据实测资料的曲线类型找到能反映变量关系的曲线回归方程,求曲线回归方程的过程及方法叫曲线拟合。医学上常见的曲线类型有:指数曲线、对数曲线、双曲线、抛物线和“S”型曲线等。
(二)曲线拟合步骤
1.定曲线型  对实测数据选择何种曲线类型,一般要根据以下三个方面:
①根据专业知识及过去经验或文献资料;
②根据全部观察点在普通坐标纸上所呈现的总趋势;
③根据观察点在某种变换值的坐标纸上是不是呈现直线趋势。如半对数纸上点图呈现直线趋势可选用指数曲线或对数曲线;如在双对数纸上呈直线趋势可选用双曲线;如在对数概率单位纸上呈直线趋势时,可选用S型曲线。
第五节  曲线直线化(8)
图9-3  四型指数曲线的模型
医学统计学 
Teaching Plan for Medical Students
第10章实验设计   目录
第十章  实验设计
第一节  实验研究
第一节  实验研究
典型的社区干预试验的实例之一是在社区人群的饮水中加入氟化物以观察是否能够降低人群的龋齿发生率的试验。由于社区干预试验中涉及人群数量多,人群结构复杂,不易控制处理因素及背景干扰因素,且难以对人群给予处理因素时进行随机化分配,其试验效果及效应的确切性往往不易准确判断或确定。
第二节  实验设计的基本要素
实验设计有三个基本要素,即受试对象、处理因素和实验效应。三个基本要素是相互联系的。
在实验设计阶段,研究人员应根据实验研究的目的,紧紧抓住这三个基本要素,并应通盘考虑如何去合理有效地安排这三个基本要素。只有这样,实验设计才会有明确的方向。实验设计是实验研究中最为重要和关键的第一步。必须给予高度重视。
有些研究人员未能充分认识到这第一步的重要性。经常是先进行实验研究工作,其后才考虑实验设计问题。
第二节  实验设计的基本要素
三、实验效应
实验效应(experimental effect)是指处理因素施加于受试对象并经过一定时间,受试对象产生的各种反应及表现。这些反应可以是主观的,也可以是客观的。
实验效应可以用各种各样的具体指标来表示。观察实验效应,应尽可能选择客观指标以及容易检测及分析的指标。
6.特异性  是指检测指标的排它性,是观察指标对某种特殊试验效应及结果的反映能力。特异性越强,观察指标反映某种试验效应的能力越强。特异性对诊断严重疾病的意义非常重要。如果某检测指标特异性强,则该指标对确诊和早期发现严重疾病具有直接意义。如检测指标甲胎蛋白对确诊早期肝癌具有重要意义。
第三节  实验设计的基本原则
实验设计包括四项基本原则,即随机化的原则,对照的原则,重复的原则和均衡的原则。
一、随机化的原则
1.概念及用途  随机化(randomization)是指总体中的每一个个体都有均等的机会被抽取或被分配到实验组及对照组中去。随机化原则的核心是机会均等。使用随机化方法可以消除在抽样及分组过程中,由于研究人员对受试对象主观意愿的选择而造成试验效应的误差。
第四节  样本含量的估计
第五节  常用实验设计方法
  完全随机设计(completely  random design)    也称为单因素设计,该设计只能分析一个处理因素的作用。处理因素可有2个或2个以上水平,每个水平代表一个分组。可用抽签法、抓阄法或随机数字法等将受试对象随机分配到各实验组及对照组中。该设计的特点是,简单方便,应用广泛,容易进行统计分析;但只能分析一个因素的作用,效率相对较低。如果只有两个分组时,可用t检验或单因素方差分析处理资料。如果组数大于等于3时,可用单因素方差分析处理资料。
二、配对设计
六*、析因设计
(一)概念及特点
析因设计(factorial design)也称为析因实验(factorial experiment),是一种多因素的交叉分组设计。它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。
交互作用    是指两个或多个因素的作用相互影响,各因素间互不独立,一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变。交互作用的结果是使总的试验效应增强或降低。
2×2析因实验作用模式
 表10-10  2×2析因设计作用模式
(三)交互作用的类型
七*、正交试验设计
(一)  概念及特点
正交试验设计(orthogonal experimental design)是一种高效的多因素试验的设计方法。它利用一套规格化的正交表,合理地安排实验,通过对实验结果进行分析,获得有用的信息。
正交设计的特点是:
①可分析三个及三个以上因素的作用及其交互作用。②用最少的试验次数获得更多的信息。
③可用方差分析处理正交设计的测量数据,但计算十分繁琐。
(二)设计方法及步骤
(三)正交表应用实例分析
例10.9  根据研究目的选择一个L4(23)正交表,并对该正交表及其特点作出分析。
八、盲法设计
THANK  YOU  FOR  LISTENING
医学统计学
Teaching Plan for Medical Students
第11章调查设计   目录
第十一章  调查设计 第一节  调查研究的特点
调查设计:是统计研究设计的一个重要部分,是医学科学研究的重要手段。
调查研究的主要特点是研究过程中没有人为施加的干预措施,而是客观地观察记录某些现象的现状及其相关特征。
在调查中,与研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的最重要的特征。
第二节  调查计划
二、确定观察对象和观察单位
三、调查方法
四、搜集原始资料的方式
五、确定调查项目和调查表
表11-1  调查表举例
调查表
六、制订调查的组织计划
第三节  整理与分析计划
二、设计分析表和资料的分组
三、汇总方法
四、组织计划
第四节  四种基本抽样方法
二、系统抽样
三、整群抽样
四、分层抽样
第五节  样本含量估计
第六节  调查误差的控制
一、设计阶段
二、调查阶段
三、整理与分析阶段
第七节*  敏感问题的调查方法
医学统计学 
第12章统计表与统计图   目录
学习要求
第一节  统计表
统计表主要有表序、标题、标目、表体和线条等组成,其基本格式如下:
一、制表的基本要求
1.标题 : 简明扼要能概括表中内容,它应包括时间、地点、内容等。标题应写在表顶线的上端中间的位置 。
2.标目  用以说明表内数字含义的部分叫标目。
(1)横标目  横标目位于表左侧,是统计表所要叙述的主语,它说明同一横行数字的意义。
    (2)纵标目  纵标目位于标目线的上端,是被说明事物的宾语,一般是绝对数或统计指标。
二、统计表的种类
第二节  统计图
统计图有多种,医学研究工作中常用的统计图有:
直条图、百分直条图、圆形图、线图、半对数线图、直方图、散点图、箱式图和统计地图等。
1.根据资料性质和分析的目的, 正确选择合适的图型。
二、常用统计图及其绘制方法
1.  直条图(bar graph)
它是以等宽直条的长短来表示各指标的数值,用来表示各相互独立指标之间的对比关系。直条图有单式直条图(见图12-1)、复式直条图(见图12-2)两种。
图12-4   某地1983年五种主要死因构成
图12-5  某市市区人口各年度出生率(1‰)、死亡率(1‰)、自然增加率(1‰)
图12-6  某市市区各年度急性传染病、肺结核死亡率(1/10万)
图12-7  某市某年乙脑患者的年龄分布(正确图)     图12-8  某市某年乙脑患者的年龄分布(错误图)
图12-9  抑肿瘤药不同剂量组与对照组用药后小白鼠肿瘤重量的比较
THANK YOU FOR LISTENING

相关PPT

统计学基础知识素材ppt:这是一个关于统计学基础知识素材ppt,主要介绍概率论与数理统计就是研究和揭示随机现象统计规律的一门科学。欢迎点击下载。
统计学-统计指数分析ppt:这是一个关于统计学-统计指数分析ppt,主要介绍指数的一般问题、总指数的编制、指数体系及因素分析。欢迎点击下载哦。
社会统计学(卢淑华)-第二章ppt:这是一个关于社会统计学(卢淑华)-第二章ppt,主要介绍于社会统计学的详细内容。欢迎点击下载哦。
《《医学统计学》完整课件-超级经典!!!ppt》是由用户兔姬于2016-10-23上传,属于高校大学PPT。

标签:

优秀PPT

缩略图

  • 《医学统计学》完整课件-超级经典!!!ppt

下载地址

  • 《医学统计学》完整课件-超级经典!!!ppt

相关PPT

推荐

颜色分类黑色PPT模板橙色PPT模板紫色PPT模板蓝色PPT模板黄色PPT模板红色PPT模板绿色PPT模板彩色PPT模板黑白PPT模板

行业分类科技PPT模板医学PPT模板教育PPT模板工业PPT模板金融PPT模板音乐PPT模板汽车房地产互联网培训手机

实用必备个人简历自我介绍年终总结职业规划述职报告工作汇报工作总结岗位竞聘公司简介发布会年会论文答辩

PPT推荐语文课件数学课件英语课件美术课件物理课件科学课件化学课件地理课件生物课件主题班会家长会绘本故事

节日PPT新年元旦节农历春节情人节元宵节三八妇女节愚人节清明节五一劳动节母亲节六一儿童节端午节

节日PPT 父亲节七夕情人节教师节中秋节国庆节重阳节万圣节光棍节感恩节平安夜圣诞节纪念日

澳门葡京百家乐 江苏快3 安徽快3 澳门葡京百家乐 澳门百家乐游戏 澳门百家乐技巧 江苏快三 澳门百家乐论坛 pk10官网 pk10官网