9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 数学 >>

第十一章 分类变量资料的统计分析2014_图文

第十一章 分类变量资料的统计分析2014_图文

第十一章

分类变量资料的统计分析

温州医科大学环境与公共卫生学院 黄陈平

主要内容
第一节 分类变量资料的统计描述
第二节 分类变量资料的统计推断 第三节 卡方检验

第一节 分类变量资料的统计描述
? 什么是分类变量资料? ? 用什么指标进行描述?

? 甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿 50人,何地较为严重?
? 若甲地易感儿童667人,而乙地易感儿童250人。 ?甲地麻疹发病率为 ?乙地麻疹发病率为 100/667×100%=15% 50/250×100%=20%

用相对数能较好地反映分类变量资料的特征。

第一节 分类变量资料的统计描述
常用相对数 应用相对数时的注意事项

率的标准化法

相对数
相对数:是两个有关联的数值或指标之比。 常用的相对数有:
? ? ?



构成比
相对比

率(rate)
说明某现象发生的频率或强度。

实际发生某现象的观察 单位数 率? ?K 可能发生该现象的观察 单位总数
K为比例基数,其确定原则为:

(1)习惯用法;
(2)保留1~2位整数。

构成比(constituent ratio)
说明某一事物内部各部分所占的比重或分布。
事物内部某一部分的观察单位数 构成比= ?100% 事物内部各部分的观察单位数总和

常用百分数表示,故又称百分比。 构成比的两个特点:
①各部分构成比之和为100%。 ②此消彼长。

例11-1 2001年对某地中小学学生进行HbsAg检查, 结果见表 11-1 ,试计算各级学生 HbsAg 检出率及阳 性者构成比
表 11-1 学 生 小学生 初中生 高中生 合 计 2001 年某地中小学学生 HBsAg 检出率及构成比 检查人数 660 1115 1563 3338 阳性人数 6 49 56 111 检出率( % ) 阳性构成比 (%) 0.91 4.39 3.58 3.33 5.41 44.14 50.45 100.00

率和构成比不是同一指标,在应用时注意加以区分。

相对比
指两个有关指标之比,说明两个指标的比例 关系。

甲指标 相对比= (或 ? 100%) 乙指标
两个指标可以是绝对数、相对数、平均数,可 以是性质相同或性质不同,但两指标互不包含。

例 11-2 某地 2003-2005 年不同性别新生儿数见表
11-2,试计算该地不同年份新生儿性别比。
表 11-2 年 份 2003 2004 2005 某地 2003-2005 年新生儿性别比 新生儿数 90919 109671 125513 男性 48636 58908 66814 女性 42283 50763 58699 性别比 1.15 1.16 1.14

应用相对数的注意事项
计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率 对率和构成比进行比较时,应注意资料的可比性 样本率或样本构成比进行比较时要作假设检验

率的标准化
表 11-3 年龄 (岁)
20355065-

某市甲、乙两社区 20 岁以上居民高血压患病率比较 甲社区 年龄 患病 构成 人数
0.1981 0.2546 0.2430 0.3043 1.0000 72 183 282 544 1081

人数
663 852 813 1018 3346

患病率 (%)
10.86 21.48 34.69 53.44 32.31

人数
876 813 771 657 3117

乙社区 年龄 患病 构成 人数
0.2810 0.2608 0.2474 0.2108 1.0000 103 186 285 368 942

患病率 (%)
11.76 22.88 36.96 56.01 30.22

合 计

率的标准化法
在进行两个内部构成不同的合计率比较 时,采用统一的标准进行校正,然后计算 校正后的标准化率,再进行比较的方法称 为率的标准化法。

标准组选择:
计算标准化率时,首先要选定一个用于齐同构成的“标 准”。 ◆选择有代表性、稳定资料如大范围人口资料作为标准组 ◆两比较组资料合并作为标准组; ◆以其中一组为标准组,对另一组作标准化 根据获得的资料和选定的标准不同,率的标准化法可分为 直接法和间接法。

直接法
适用情况:已知被标化组各年龄组的实际率 pi , 用标准人口数或标准人口构成进行计算。

? N i pi p' ? 或p' ? ? Ci pi ? Ni
其中N i 为第i 组标准人口数, N 为标准组总人数,
pi为第i 组的实际率, Ci为第组标准人口构成。

表11-4 甲、乙两社区20岁以上居民高血压标准化患病率计算表(直接法)
甲社区 标准 年龄组 人口
Ni

乙社区 预期 患病数 实际患病率 (%) 预期 患病数

实际患病率 ( %)
p i1

N i pi1
167 358 549 895 1969 ( ? N i pi1 )

pi 2
11.76 22.88 36.96 56.01

N i pi 2
181 381 585 938 2085 ( ? N i pi 2 )

20~ 35~ 50~ 65~

1539 1665 1584 1675 6463

10.86 21.48 34.69 53.44

合计 (N)





甲社区标准化后的患病率 乙社区标准化后的患病率

p' ?

1969 ?100 % ? 30.47% 6463 2085 p' ? ?100 % ? 32.26% 6463

如根据选定的标准人口构成做标准,
表 11-5 甲、乙两社区 20 岁以上居民高血压标准化患病率计算表(直接法)
标准人 年龄组 口构成 甲社区 实际患病率 ( % ) 分配患病率 ( %) 乙社区 实际患病率 (%) 分配患病率 ( %)

Ci
20~ 35~ 50~ 65~
合计

p i1

Ci pi1
2.59 5.53 8.50 13.85 30.47

pi 2
11.76 22.88 36.96 56.01 30.22

Ci pi 2
2.80 5.89 9.06 14.51 32.26

0.2381 0.2576 0.2451 0.2592 1.0000

10.86 21.48 34.69 53.44 32.31

间接法
适用情况:已知被标化组的死亡总数及年龄别人 口数,但不知道各年龄组的实际死亡率。

r p' ? P ? ni Pi
标准化死亡比

标准化死亡比: 被标化组实际死亡数与预期死
亡 数 之 比 , 称 为 标 准 化 死 亡 比 ( standard

mortality ratio),简称为SMR。

SMR ? r /?? ni Pi ?
若SMR>1,表示被标化人群的死亡率高于标准组;

反之,若SMR<1,表示被标化人群的死亡率低于
标准组。

例 11-4

某地观察了吸烟者与不吸烟者各年龄组人数如表

11-6 ,同时观察期内吸烟者中有 432 人死于肺癌,不吸烟者 中有 210 人死于肺癌,试计算吸烟者与不吸烟者的标准化死 亡率。
表 11-6 两组肺癌死亡率( 1/10 万)的标化(间接法) 年龄 组 35~ 45~ 55~ 65~ 75~ 合计 标准肺 癌死亡 率 Pi 7.04 25.70 108.25 263.94 451.87 34.60 吸烟者 预期死亡人 观察人年 数 数 N i1
N i1 Pi

不吸烟者 观察人年 数 N i2 189370 104762 60043 27540 14532 396247 预期死亡人 数 N i 2 Pi 13.33 26.92 65.00 72.69 65.67 243.61

49705 42633 28117 10624 6137 137216

3.50 10.96 30.44 28.04 27.73 100.67

吸烟者的肺癌标准化死亡比

432 SMR ? ? 4.2912 100.67
非吸烟者的肺癌标准化死亡比

210 SMR ? ? 0.8620 243.67

吸烟者的肺癌标准化死亡率
' p1 ? 34.60/10万? 4.2912? 148.48/10万

非吸烟者的肺癌标准化死亡率
' p2 ? 34.60/10万? 0.8620? 29.83/10万

率的标准化应注意的问题
( 1 )当各比较组内部构成(如年龄、性别等)不同时, 应对率进行标准化后,再作比较。 ( 2 )标准化率只表明各标化组率的相对水平,而不代表 其实际水平。

( 3 )两合计率各分组对应的率有明显交叉时,则不能用
标准化率进行比较。 ( 4 )如为抽样研究资料,两样本标准化率的比较也应作 假设检验。

第二节 分类变量资料的统计推断
率的抽样分布(二项分布)
率的抽样误差与标准误

总体率的区间估计
率比较的Z 检验

二项分布(binomial distribution)
从某个二项分类总体中随机抽取含量一定的样本

,其样本率的分布概率是有规律的,这种规律为
服从二项分布,即样本中阳性数或样本阳性率的 分布概率等于二项式 ?? ? (1 ? ? )?n 展开后各项。

例:设小白鼠接受某种毒物一定剂量时,其死亡率为 80%。若 随机用甲、乙、丙三只小白鼠做试验,问出现各种死亡情况的概率?
小鼠存亡的组合方式 死亡数(x) 生存数(n-x)
0 1 3 2

排列方式 甲
生 死 生 生 死 死 生 死

每种组合的概率 丙
生 生 生 死 生 死 死 死 0.2× 0.2× 0.2 =0.008


生 生 死 生 死 生 死 死

2

1

0.8 × 0.2 × 0.2 0.2 × 0.8 × 0.2 0.2 × 0.2 × 0.8 } = 0.096 0.8 × 0.8 × 0.2 0.8 × 0.2 × 0.8 0.2 × 0.8 × 0.8 } = 0.384 0.8 × 0.8 × 0.8 = 0.512 P = 1.000

3

0

(0.2 +0.8)3=(0.2)3 + 3(0.8)(0.2)2 + 3(0.8)2(0.2) + (0.8)3
三生 二生一死 一生二死 三死

若总体阳性率为π、样本含量为n,阳性数为X, 则样本中出现X个阳性事件的概率可由下式求得。
n! P( X ) ? ? X (1 ? ? ) n? X X !(n ? X )! X ? 0, 1, 2,?, n

二项分布的图形

已知:①π =0.5,n =10;②π =0.3,n =5;③π =0.3,
n =10;④π =0.3,n =15。试根据式(11-6)求各阳 性数事件的概率并作概率分布图。

图11-1

率的抽样分布图

二项分布特征
1、为离散型分布;

2、当π=1-π时,呈对称分布;
3、当n增大时,逐渐逼近正态分布。 一般认为,当nπ和n(1-π)≥5时, 可近似看

作正态分布。

率的抽样误差和标准误
由于抽样所引起的样本率和总体率之间

的差异,称为率的抽样误差。用率的标
准误表示 。
?p ? ? ?? ? ? ?
n

sp ?

p?? ? p ? n

例11-6

为了解某地人群结核菌素试验阳性率情况,

某医疗机构在该地人群中随机检测了1773人,结核

菌素试验阳性有 682 人,阳性率为 38.47% ,试计算
其标准误。

0.3847 ?? ? 0.3847? sp ? ? 0.0116? 1.16% 1773

总体率的区间估计
总体率的估计:
? ?

点估计 区间估计
? 正态近似法
? 查表法

正态近似法
当样本含量n足够大,样本率p或1-p均不太小 时(如np和n(1-p)均大于5),样本率的分布近似 正态分布。
u?

p ? z? ? s p

Z? 是标准正态分布双侧临界值 ,在估计总体率的 95%置信区间时,其值为1.96;99%置信区间时,其值为 2.58。

例 11-6 中该地人群中结核菌素试验阳性率 95% 和
99%的置信区间为: 95%的置信区间: 38.47%?1.96?1.16%=36.20%~40.74%

99%的置信区间:
38.47%?2.58?1.16%=35.48%~41.46%

查表法
当n较小,如n?50,特别是p接近于0或1时,按 二项分布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体 率可信区间估计用表,可根据样本含量 n 和阳

性数x查阅统计学专著中的附表 。

两个率比较的Z 检验
当样本含量 n 足够大,样本率 p 或 1-p 均不太小时(如np和n(1-p)均大于5),样

本率的分布近似正态分布。样本率和总体
率之间、两个样本率之间的比较可用 Z 检 验。

样本率与总体率的比较

Z?

p ??

?p

?

p ?? ? (1 ? ? ) n

例 11-7

一般情况下,直肠癌围术期并发症发生

率为 30% ,现某医院手术治疗了 385 例直肠癌患者,

围术期出现并发症有 100 例,并发症发生率为 26% ,
问该院直肠癌患者围术期并发症发生率与一般情 况比较有无统计学差异。 本例,样本率为 26% , np 和 n(1-p) 均大于 5 , 可采用Z检验。

1. 建立检验假设
H0: ?=?0,H1: ???0,?=0.05 2. 计算Z值
Z ? 0.3 ? 0.26 ? 1.713 0.3(1 ? 0.3) 385

3. 确定P值,判断结果
本题Z=1.713<1.96,P>0.05,按?=0.05的水准不拒绝H0,
差异没有统计学意义,故尚不能认为该院直肠癌患者围 术期并发症发生率与一般情况不同。

两个样本率的比较
p1 ? p2 Z? ? s p1 ? p2 p1 ? p2 1 1 pc (1 ? pc )( ? ) n1 n2

X1 ? X 2 pc ? n1 ? n2

例 11-8

为了解某地小学生蛔虫感染率的城乡差异,抽样

调查了该地小学生22792人,其中城镇小学生8207人,粪检 蛔虫卵阳性数为 701 人,蛔虫感染率为 8.54% ,乡村小学生

14585 人 , 粪 检 蛔 虫 卵 阳 性 数 为 2167 人 , 蛔 虫 感 染 率 为
14.86% ,试比较该地小学生蛔虫感染率城乡差异有无统计 学意义。 1. 建立检验假设 H0: ?1=?2,H1: ?1??2,?=0.05 2. 计算Z值

701 ? 2167 Pc ? ? 0.1258 8207 ? 14585

S P1 ? P2

1 1 ? 0.1258 (1 ? 0.1258 )( ? ) ? 0.0046 8207 14585

0.0854 ? 0.1486 Z? ? ?13.739 0.0046
3. 确定P值,判断结果 确定P值和判断结果 有统计学意义。

本题 Z =13.739>2.58, P<0.01,按?=0.05的水准拒绝H0,接受H1,差异

课堂讨论
某地调查农村中不同人群的HbsAg阳性情况,结果如 下表,从中得出农民HbsAg阳性情况最严重,医务人 员最低的结论。问此结论是否可信?为什么?
人 农 群 民 检查人数 1013 21 99 326 437 47 1943 阳性人数 128 4 15 51 76 5 279 阳性百分比(%) 45.9 1.5 5.4 18.3 27.2 1.8 100.0

医务人员 中学生 小学生 学龄前儿童 其 他 合 计

第三节 卡方检验
基本思想

四格表资料的卡方检验
配对设计分类变量资料的卡方检验 行×列表资料的卡方检验

?2检验(Chi-square test)
? 是现代统计学的创始人之一,

英 国 统 计 学 家 K.Pearson 于
1900年提出的一种具有广泛用

途的假设检验方法。常用于分
类变量资料的统计推断。

基本思想
例 11-9 某医生欲比较用甲、乙两种药物治疗动脉硬化 的疗效,甲药治疗71例,有效52例, 乙药治疗42例, 有效39例,结果见表11-7。问两种药物的有效率是否有 差别?
表11-7 甲、乙两种药物治疗动脉硬化的疗效比较
药 甲 乙 合 物 药 药 计 有 效 无 效 合 计 有效率( % ) 73.24 92.86 80.53 52( 57.18 ) a 19( 13.82 ) b 39( 33.82 ) c 91(a+c) 3( 8.18 ) d 22(b+d) 71 (a+b) 42 (c+d) 113(n=a+b +c+d )

卡方检验的基本公式:

(A ?T) ? ?? T
2

2

A:实际频数
T:理论频数,即在H0条件下(π1 = π2), 基本格子中的频数。

nR nC T? n

由上式可以看出, x2值反映的是在检验假 设H0前提下实际频数与理论频数的吻合程度。

?2检验的自由度
指可以自由取值的基本格子数 ? ? (行数 ? 1)(列数 ? 1) 自由度一定时,其?2值的概率分布也就确定。 根据自由度?和检验水准?查表11-13 可得?2界 值,若?2值≥?20.05(?),则可按?=0.05的检验 水准拒绝H0;若?2值<?20.05(?),则还不能拒绝 H 0。

四格表资料的卡方检验
四格表资料
处理 A B + a c b d 合计 a+b c+d

合计

a+c

b+d

n(a+b+c+d)

表11-7 甲、乙两种药物治疗动脉硬化的疗效比较
药 甲 乙 合 物 药 药 计 有 效 无 效 合 计 有效率( % ) 73.24 92.86 80.53 52( 57.18 ) a 19( 13.82 ) b 39( 33.82 ) c 91(a+c) 3( 8.18 ) d 22(b+d) 71 (a+b) 42 (c+d) 113(n=a+b +c+d )

(1) 建立检验假设,确定检验水准 H0 :两药有效率相同,即?1=?2 H1 :两药有效率不同,即?1 ? ?2 ?=0.05

(2)计算检验统计量和自由度

2 ( A ? T ) 2 ? ?? T

2 2 2 2 ? ? ? ? ? ? ? ? 52 ? 57 . 18 19 ? 13 . 82 39 ? 33 . 82 3 ? 8 . 18 ?2 ? ? ? ? ? 6.48

57.18

13.82

33.82

8.18

? =(2-1)(2-1)=1

(3)确定P值,做出推论
? 20.025 ( 1 ) =5.02 ,本例 5.02<?2 ? ? 20.025 ( 1 ) ,所以,
P < 0.025,按?=0.05水准,拒绝H0,接受H1,故认为甲、
乙两药的疗效不同,乙药疗效要好于甲药。

四格表专用公式:

(ad ? bc) n ? ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

四格表资料
处理 甲 乙 合计 + a c a+c b d b+d 合计 a+b c+d n(a+b+c+d)

四格表专用公式:
表11-7 甲、乙两种药物治疗动脉硬化的疗效比较
药 甲 乙 合 物 药 药 计 有 效 无 效 合 计 有效率( % ) 73.24 92.86 80.53 52( 57.18 ) a 19( 13.82 ) b 39( 33.82 ) c 91(a+c) 3( 8.18 ) d 22(b+d) 71 (a+b) 42 (c+d) 113(n=a+b +c+d )

本例,

(52 ? 3 ? 19 ? 39) ? 113 ? ? ? 6.48 71? 42 ? 91? 22
2 2

四格表资料 ? 2检验的校正

?2分布是一种连续性分布,而分类变量资料属离散性分
布,由此得到的统计量也是不连续的。在下列条件时,需 对?2值进行校正。 n≥40, 且1≤T<5

校正公式:

2 ( A ? T ? 0.5) ?2 ? ? T



?2 ?

( ad ? bc ? n / 2)2 n (a ? b)(c ? d )(a ? c)(b ? d )

例 11-10

某医生研究比较 A 、 B 两种药物对急性细菌

性肺炎的疗效,有关资料见表11-8,问两种药物的疗 效差别有无统计学意义?
表11-8 A、B两药治疗急性细菌性肺炎的疗效比较
处 理 A 药 B 药 合 计 有 效 40( 36.75 ) 16 (19.25) 56 无 效 2(5.25) 6(2.75) 8 合 计 42 22 64 有效率( % ) 95.24 72.73 87.50

H0: ?1=?2 H1: ?1??2

?=0.05
T22=22?8/64=2.75 <5

? ?
2

? 40? 6 ? 2 ?16 ? 64 / 2?
42 ? 22 ? 56 ? 8

2

? 64

? 4.79

按?=1,查?2值表,?20.05,(1) =3.84,?2=4.79?3.84, P<0.05, 按?=0.05水准,拒绝H0,接受H1,认为两药的 疗效差别有统计学意义,A药疗效要好于B药。

四格表资料的确切概率法
当n ? 40或T ? 1时

(a ? b)! (c ? d )! (a ? c)! (c ? d )! P? a!b!c!d!n!

例11-11 某医师用比较新、旧两药治疗某病 的疗效,结果见表11-9,问两药疗效是否不 同?
表 11-9 药 新 旧 合 物 药 药 计 有 18 13 31 效 新、旧两药治疗某病疗效的比较 无 1 3 4 效 合 19 16 35 计 有效率( % ) 94.7 81.3 88.6

因本例n=35<40,故用确切概率法。

H0: ?1 = ?2 , H1: ?1 ? ?2

? = 0.05

列出周边合计不变的四格表组合,并计算各组合 △pi和Pi值
组合编号 1 19 0 12 4 △ p i (%) Pi 25.0 0.034 2 18 1 13 3 13.5 0.204 3 17 2 14 2 2.0 0.392 4 16 3 15 1 -9.5 0.296 5 15 4 16 0 -21.1 0.074

本例Pa=0.204,符合Pi≤Pa的组合为编号1、2、5,所以: P= P1+ P2+ P5=0.034+0.204+0.074=0.312,P> ?,不拒绝H0。 若单侧检验,则选择符合≤Pa且△pi≥△pa的Pi求和,此时: P= P1+ P2 =0.034+0.204=0.238 ,P> ?

在实际工作中,对于四格表资料,通常规定
(1)N≥40,且T≥5时,直接计算?2值,不用校正;

(2)N≥40, 且1≤T<5时,用连续性校正检验;

(3)N<40或T<1 ,不能用?2检验,用直接计算概率
的方法。

配对设计分类变量资料的?2检验

甲 + 合计

配对四格表形式 乙 + a b c d a+c b+d

合计 a+b c+d n

配对卡方检验又称McNemar检验:

b ? c ? 40,

(b ? c) ? ? (b ? c)
2
2

2

b ? c ? 40, ? ?

( b ? c ? 1) (b ? c)

2

例11-12 用两种血清学方法对100例肝癌患者进行
检测,有关检测结果见表11-10,问两种血清学方 法检测结果有无差别?
表11-10 两种血清学方法对肝癌检测的结果比较 甲法 + 合计 乙法 + 50 15 65 32 3 35 合计 82 18 100

( 1)

H0 :两种方法检出率相同,即B = C H1 :两种方法检出率不同,即B ? C ?=0.05

( 2)

? 32 ? 15? ? ?
2

2

32 ? 15

? 6.14

(3)查表得, P<0.025 ,按 ? =0.05 水准,拒绝 H0 ,接受 H1 ,

差别有统计学意义,可以认为两种方法的检出率不同, 甲法较高。

注意事项
由于该检验只考虑了不一致的情况(b

与c),而未考虑样本含量n及一致结果(a
与d),因此,当n很大而且两法一致率较

高(即a与d数值较大),b与c的数值相对
较小时,即使检验结果有统计学意义,但 实际意义并不大。

行×列表资料的卡方检验
行×列表卡方检验的通式:

A ? ? n(? ? 1) nR nC
2

2

? =(R-1)(C-1)

例 11-13 某研究者欲比较甲、乙、丙3家医院住院 病人院内感染情况,随机抽查同一时期各医院住 院病人院内感染情况结果见表 11-11,试比较三家 医院院内感染率有无差别。
表11-11 甲、乙、丙三家医院住院病人院内感染率比较
医院 甲 乙 丙 合计 感染 43 19 15 77 未感染 188 170 151 509 合计 231 189 166 586

(1)

H0 :三家医院院内感染率相同 H1 :三家医院院内感染率不同或不全相同 ?=0.05

2 2 2 2 2 43 188 19 170 15 (2) ? 2 ? 586( ? ? ? ? 231? 77 231? 509 189? 77 189? 509 166? 77 1512 ? ? 1) ? 10.09 166? 509

(3)

?=(3-1)(2-1)=2,查?2值表,?20.01(2)=9.21, ?2>?20.01(2),P<0.01, 按?=0.05的检验水准,拒绝H0,
接受H1,故可认为甲、乙、丙三家医院院内感染率总 的来讲有差别。

例 11-14 某研究者欲了解白内障发病是否与 ABO 血

型有关,收集有关资料见表 11-12 ,问白内障组与
对照组ABO血型分布有无差别?
表 11-12 白内障组与对照组 ABO 血型分布 组别 白内障组 对照组 合计 A 113 1123 1236 B 88 1013 1101 O 91 1075 1166 AB 33 460 493 合计 325 3671 3996

(1) H0 :白内障组与对照组ABO血型分布相同

H1 :白内障组与对照组ABO血型分布不同或不全相同

?=0.05
( 2)
2 ? ? A 2 ? ? n? ? ? n n ? 1? ? ? 3.25 R C ? ?

? =(2-1)(4-1)=3
(3)查表得, ? 20.05 ( 3 ) =7.81 ,

? 2<?20.05 ( 3 ) , P>0.05, 按

?=0.05的检验水准,不拒绝检验假设,尚不能认为白
内障组与对照组ABO血型分布不同。

行×列表卡方检验的注意事项:
理论数不宜太小。(不能有1/5以上格子的理论频数小 于5或者有一个格子的理论频数小于1)。处理方法 如假设检验的结果是拒绝无效假设,只能认为各总体 率或构成比之间总的来说有差别。若要进一步了解哪 两者之间有差别,可用卡方分割法,或者调整检验水 准。 对于单向有序行列表,在比较各处理组的效应有无差 别时,应该用秩和检验。

如:用某药治疗某病患者,5例中有3例治愈,计
算治愈率为 3/5×100%=60.0% ,如果有 4 例治愈,

则其治愈率为 80%。显然,这个结果是不稳定的。
在分母例数很少的情况下,个别的偶然因素会导 致结果明显变化,只有分母例数较大时,计算的 相对数才比较稳定。在例数较少时,通常直接用 绝对数表示。如果要用相对数表示,则需列出其

总体率的置信区间。

某产院拟分析当地畸形儿与母亲分娩年龄的关系, 检查了新生儿4470例,得以下资料,据此得出结 论:“母亲年龄在24-29岁时,畸形儿最多,占总数的 92.2%,表明该年龄段易发生畸形儿,符合一般规 律”。试分析该结论是否合理?
某地畸形儿与母亲分娩年龄的关系
母亲年龄(岁) 畸形儿例数 % 21 1 0.86 23 2 1.7 24 14 12.1 25 19 16.4 26 24 20.7 27 18 15.5 28 19 16.4 29 13 11.2 30 3 2.6 31 1 0.86 32 1 0.86 33 1 0.86 合计 116 100

表11-1
学生 小学生 初中生 高中生 合 计

2001年某地中小学学生HBsAg检出率及构成比
检查人数 660 1115 1563 3338 阳性人数 6 49 56 111 检出率(%) 0.91 4.39 3.58 3.33 阳性构成比 (%) 5.41 44.14 50.45 100.00

X1 ? X 2 ? X 3 ? ? PC ? n1 ? n2 ? n3 ? ?

在进行率或构成比比较时,除了要比较的因素 外,其他影响的因素应基本一致。 例如,分析比较两医院病死率的时,应注意两 个医院的条件应基本相同,如果上级医院的病死率

高于基层医院的病死率,并不能说明上级医院医疗
水平不如基层医院,这是因为许多疑难病人均由基

层医院转入上级医院所致。
在比较内部构成不同的两个合计率时,通常还 需要进行率的标准化。

当比较两个总率时,若其内部构成不 同,需要进行率的标准化。

理论频数太小的3种处理方法
1) 增大样本含量,以达到增大理论频数的目的;
2) 删去理论频数太小的格子对应的行或列;

3) 合理合并:结合专业,将理论频数太小的行或
列与性质相近的行或列合并。

单向有序行列表
表 11-13 药 物 中 药 西 药 合 计 中药和西药对某病的疗效比较 好 转 42 60 102 无 效 32 38 70 合 计 152 183 335

治 愈 78 85 163


网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com