9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 管理学 >>

统计学课件 第四章 统计资料的描述

统计学课件 第四章 统计资料的描述

第四章 统计资料的描述

多受些教育划算吗?
? 收入差距很大,1999年3月美国人口调查 高中毕业年薪最高为498606美元
? 比较中位收入 ? 高中毕业 16297美元 ? 大学肄业 18988美元 ? 学士学位 32581美元 ? 更高学位 47000美元

第四章 统计资料的描述
★ §4.1 总量指标(绝对数)
§4.2 相对指标(相对数) §4.3 平均指标 §4.4 变异指标 §4.5 分布偏态与峰度

统计总体和总体单位

统统计计 由客观存在的、在同一性质基础上结 总总体体 合起来的许多个别单位所形成的集合

具有客观性、大量性、同质 性、变异性、相对性等特点

总总体体 单单位位

指构成总体的个体即每一个单位

总体由总体单位构成,要认识总体必须从 总体单位开始,总体是统计认识的对象。

总体或总体单位的区分不是固定的, 在一定条件下可以相互转化。
总体、总体单位
总体、总体单位

总总量量指指标标
反映现象总体规模或水平的 综合指标,即总量指标,也 称为绝对数。

1

总量指标的基本分类
按反映的总体内容 不同分为:
按反映的时间状况 不同分为:
按计量单位不同分 为:

总体单位总数 总体变量总量
时期指标 时点指标
实物指标 劳动指标 价值指标

计量单位
自然单位 如:台、件 实物单位 度量衡单位 如:米、平方米
标准实物单位 如:标准吨 劳动单位 如:工日、工时
价值单位 如:元

计量方法

直接相加 折算相加

对于同类的计算对象按实际 计量单位直接加起来
对于同类的计算对象按标准 计量单位相加.(折算系数)

第四章 统计资料的描述
★ §4.1 总量指标(绝对数) ★ §4.2 相对指标(相对数)
§4.3 平均指标 §4.4 变异指标 §4.5 分布偏态与峰度

甲企业 乙企业

利润 资金 资金利 总额 占用 润率
500 3000 16.7% 万元 万元 不可比 不可比 可比 5000 40000 12.5% 万元 万元
比较两厂经济效益

相相对对指指标标
指应用对比的方法来反映相关事 物之间数量联系程度的指标,也 称为相对数。

2

相对指标的基本表现形式 有名数 用双重计量单位表示的复名数 无名数 用倍数、系数、成数、﹪、‰等表示

分母 分母为 分母 分母 分母为

为1

1.00 为10 为100 1000

倍数与成数通常用整数的形式来表述
5倍、3成、近7成

相对指标的种类

结结构构相相对对数数 比比例例相相对对数数 比比较较相相对对数数

动动态态相相对对数数
强强度度相相对对数数
计计划划完完成成程程度度 相相对对数数

结结构构相相对对数数((比比重重))

统计分组的基础上,利用总体的部分数值与总 体的全部数值的对比,来反映社会经济现象的 内部结构以及分布状况。

结构相对数

=

总体中的部分数值 总体的全部数值

?100%

例:我国某年国民收入使用额为19715亿元,其中 消费额为12945亿元,积累额为6770亿元。则

消费额占国民收入 使用额的比率

= 12945 ?100﹪ = 65.7﹪ 19715

积累额占国民收入 使用额的比率

= 6770 ?100﹪ = 34.3﹪ 19715

说 ⒈为无名数; 明 ⒉同一总体各组的结构相对数之和为1;
⒊用来分析现象总体的内部构成状况。

比比例例相相对对数数

是在总体分组的基础上,各组成部分之间的数量对 比的比值,反映总体内部的比例关系(结构性的比 例)。

比例相对数

=

总体中某一部分的数值 总体中另一部分的数值

?100%

例:我国某年国民收入使用额为19715亿元,其中 消费额为12945亿元,积累额为6770亿元。则

积累额与消费额 的比率 =

6770 ?100﹪= 12945

17 33

?

1:

2(或

=

51.52﹪)

说 ⒈为无名数,可用百分数或一比几或几比几表示; 明 ⒉用来反映组与组之间的联系程度或比例关系。

3

比比较较相相对对数数
相同时间不同空间同类现象数值的对比,用以 比较不同国家、不同地区、不同单位之间的经济势 力强弱和工作优劣。
比较 某地区或单位某一指标 数值 相对数 = 另一地区或单位同类指 标数值

例:某年某地区甲、乙两个公司商品销售额 分别为5.4亿元和3.6亿元。则

甲公司商品销售额 是乙公司的倍数

= 5.4 = 1.5 3.6

说 ⒈为无名数,一般用倍数、系数表示; 明 ⒉用来说明现象发展的不均衡程度。

动动态态相相对对数数 是同类指标数值在不同时间 上的对比

动态 某指标报告期数值 相对数 = 该指标基期数值

? 100﹪

说 ⒈为无名数; 明 ⒉用来反映现象的数量在时间上的变动程度。

国别、地区
美国 德国 日本 英国 法国 加拿大 意大利 荷兰 中国 中国香港

进出口总额

99年 17549

98年 16250

99年是 98年 的(%)
108.0

10131 10135 100.0

7271 6684 108.8

5891 5881 100.2

5850 5948 98.4

4588 4225 108.6

4468 4581 97.5

3931 3684 106.7

3607 3240 111.3

3543 3594 98.6

出口额

99年 6950

99年是 98年 的(%)
101.8

5405 99.6

4175 107.6

2684 98.4

2990 97.9

2386 111.3

2308 95.3

201

101.5

1949 106.0

1748 100.0

进口额

99年 10599

99年是 98年 的(%)
112.5

4726 100.4

3096 110.4

3207 101.7

2860 98.8

2202 105.8

2160 100.1

1890 112.9

1658 118.2

1795 97.2

强强度度相相对对数数

是性质不同但又有联系的两个现象的总量指标对比 的比值,用来反映现象的强度,密度和普遍程度。 例如人口密度、每万人拥有医院病床数、人均绿地 面积等均为强度相对数。

强度

某一总量指标数值

相对数 = 另一有联系但性质不同 的总量指标数值

年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

按人口平均的主要工业产量指标

布 (米)
16.6 15.8 15.9 19.6 17.7 21.6 17.2 20.2 19.4 19.9


(公斤)
5.1 5.6 7.0 6.5 5.0 4.6 5.2 5.7 6.6 6.9


(公斤)
58.4 61.7 69.5 76.0 77.7 79.2 82.3 88.6 93.1 99.1

原煤 (吨)
1.0 0.9 1.0 1.0 1.0 1.1 1.2 1.1 1.0 0.8

原油 (公斤) 122 123 122 123 123 125 129 131 130 128

发电量
(千瓦小时)
547 589 647 712 779 836 888 923 939 989

4

无无名名数数的的 强强度度相相对对数数

一般用﹪、‰表示。其特点是分子 来源于分母,但分母并不是分子的 总体,二者所反映现象数量的时间 状况不同。

例:某年某地区年平均人口数为100万人,在该 年度内出生的人口数为8600人。则该地区

人口 出生率

=

8600 1? 10 6

? 1000 ‰

=

8.6‰

有有名名数数的的 强强度度相相对对数数

为用双重计量单位表示的复名数, 反映的是一种依存性的比例关系或 协调关系,可用来 反映经济效益、
经济实力、现象的密集程度等。

例:某地区某年末现有总人口为100万人,医院 床位总数为24700张。则该地区

每千人口拥有 的医院床位数

=

24700 (张) 1000(千人 )

=

24

.7(张

千人 )

每所医院床位

1 ?106 =

= 40.5(人

张)

负担的人口数 24700

计计划划完完成成程程度度 相相对对数数
实际完成数与计划任务数对比的比值,是检 查计划完成情况的指标。

计划完成程度 相对数

=

实际完成数 计划任务数

?100﹪

计计划划任任务务数数为为绝绝对对数数 短期计划完成程度相对数 长期计划完成程度相对数
计计划划任任务务数数为为相相对对数数

A.计划任务数为绝对数 ⒈短期计划完成程度相对数

⑴ 计划数与实际数同期时,直接应用公式:

计划完成程度 相对数

=

实际完成数 计划任务数

?100﹪

⑵ 不同期时,考察计划执行进度情况:

计划完成 进度

=

累计至本期止实际完成 全期计划任务数



?100﹪

例:某企业2000年计划产量为10万件,而实际 至第三季度末已生产了8万件,全年实际共生 产11万件。则

第三季度末 计划完成进度

= 8 ? 100﹪ = 80﹪ 10

全年计划 完成程度

= 11 ? 100 ﹪ = 110 ﹪ 10

5

⒉长期计划完成程度相对数

(1)计划任务数为计划期内各年的总和

计划完成 程度

=

计划期内实际完成累计数 计划任务总数

?100﹪

提前完成 计划全 达到计划任务数 计划时间 = 部时间 - 所用时间

例:某市计划“九五”期间要完成社会固定资产投 资总额60亿元,计划任务的实际完成情况为:

年份

1996 1997 1998 1999 2000 合计

投资额(亿元)11.4 11.9 12.5 12.8 13.1 61.7

其中,2000年各月份实际完成情况为(单位:亿元):
月份 1 2 3 4 5 6 7 8 9 10 11 12 投资额 1.1 1.0 1.2 1.1 1.1 1.1 1.2 1.2 1.3 1.1 0.9 0.8

要求计算: ⒈该市“九五”期间固定资产投资计划的完成程度? ⒉提前完成计划的时间。

解:

计划完成 程度

=

61.7 60

?100﹪

=

102.8﹪

月份 1 2 3 4 5 6 7 8 9 10 11 12 投资额 1.1 1.0 1.2 1.1 1.1 1.1 1.2 1.2 1.3 1.1 0.9 0.8

已累计完成固定资产投资额60亿元
提前完成计划时间:
因为到2000年10月底已完成固定资产累计投资额60 亿元(61.7–0.8–0.9=60),即已完成计划任务,提前 完成计划两个月。

例:某市计划“九五”期间要完成社会固定资产投 资总额60亿元,计划任务的实际完成情况为:

年份

1996 1997 1998 1999 2000 合计

投资额(亿元)11.4 11.9 12.5 12.8 13.1 61.7

其中,2000年各月份实际完成情况为(单位:亿元):

月份 1 2 3 4 5 6 7 8 9 10 11 12

投资额 1.1 1.0 1.2 1.1 1.1 1.1 1.2 1.2 1.3 1.1 0.9 0.8

1.1

0.8

思思考考 如何确定提前完成计划的时间?

【分析】

可以判断出,计划任务应是在 2000年10月份的某一天完成的

月份 1 2 3 4 5 6 7 8 9 10 11 12 投资额 1.1 1.1 1.2 1.1 1.1 1.1 1.2 1.2 1.3 1.1 0.8 0.8

已累计完成固定资产投资额59亿元 已累计完成固定资产投资额60.1亿元
59亿元

60 60.1亿元

1亿元

0.1亿元

假定10月份每天都完成相等的投资额

则每天的投资额为 1.1/ 31 = 0.035

【方法一】在2000年10月为完成尚差的1.0亿元 投资额的计划任务需要的天数:
1.0 ? 31 = 28 .18 ? 29 (天 )
1.1 即提前完成任务两个月零两天。
【方法二】在2000年10月为完成超额的0.1亿元 的投资额所用的天数:
0.1 ? 31 = 2.82 ? 2(天 )
1.1
即提前完成任务两个月零两天。

6

⒉长期计划完成程度相对数

(2)计划任务数为计划末期应达到的水 平

计划完成 程度

=

计划末期实际达到的水平 计划规定末期应达到的水平

?100﹪

提前完成 计划全 出现连续12个月的实际完成数 计划时间 = 部时间 - 达到计划任务数所需要的时间

例:某自行车厂计划“九五” 末期达到年产自行车 120万辆的产量,实际完成情况为:

年份

1996 1997 1998 1999 2000

产量(万辆) 108 114 117 119 123

其中,最后两年各月份实际产量为(单位:万辆)::

月份 1 2 3 4 5 6 7 8 9 10 11 12

1999年 9.6 9.6 9.8 9.8 9.9 9.9 10.0 10.0 10.1 10.1 10.1 10.1

2000年 10.1 10.1 10.2 10.2 10.2 10.2 10.2 10.3 10.3 10.4 10.4 10.4

要求计算: ⒈该厂“九五”期间产量计划的完成程度;
⒉提前完成计划的时间。

解:

计划完成 程度

= 123 ?100﹪ = 102 .5﹪ 120

月份 1 2 3 4 5 6 7 8 9 10 11 12
1999年 9.6 9.6 9.8 9.8 9.9 9.9 10.0 10.0 10.1 10.1 10.1 10.1
2000年 10.1 10.1 10.2 10.2 10.2 10.2 10.2 10.3 10.3 10.4 10.4 10.4
+0.5 +0.5 =120
提前完成计划时间:
因为自1999年3月起至2000年2月底连续12个月的时间内该 厂自行车的实际产量已达到120万辆〔119+﹙10.1–9.6﹚+ (10.1–9.6)=120〕,即已完成计划任务,提前完成计划 10个月。

例:某自行车厂计划“九五” 末期达到年产自行车 120万辆的产量,实际完成情况为:

年份

1996 1997 1998 1999 2000

产量(万辆) 108 114 117 119 123

其中,最后两年各月份实际产量为(单位:万辆)::

月份 1 2 3 4 5 6 7 8 9 10 11 12

1999年 9.6 9.6 9.8 9.8 9.9 9.9 10.0 10.0 10.1 10.1 10.1 10.1

2000年 10.1 10.1 10.2 10.2 10.2 10.2 10.2 10.3 10.3 10.4 10.4 10.4

10.0 10.3

要求计算: 提前完成计划的时间。

月份 1 2 3 4 5 6 7 8 9 10 11 12 1999年 9.6 9.6 9.8 9.8 9.9 9.9 10.0 10.0 10.1 10.1 10.1 10.1 2000年 10.1 10.0 10.3 10.2 10.2 10.2 10.2 10.3 10.3 10.4 10.4 10.4
+0.5 +0.4 +0.5
119.9 120.4
即计划在1999年3月某天到2000年3月同 天前一天连续12个月完成。
假定每天完成相等的产量 则1999年3月每天的产量为 9.8 / 31 = 0.316
2000年3月每天的产量为 10.3 / 31 = 0.332

【方法一】 在1999年3月某天开始的连续12个月为完成尚 差的0.1万辆产量的计划任务需要的天数:
0.1 ? 31 = 6.2 ? 7(天 )
10 .3 - 9.8
即提前完成任务九个月零24天。 【方法二】 在1999年3月某天开始的连续12个月为完成超额 的0.4万辆产量所用的天数:
0.4 ? 31 = 24 .8 ? 24 (天 )
10 .3 - 9.8
即提前完成任务九个月零24天。

7

B. 计划任务数为相对数

计划完成程度 实际为上年的百分数 相对数 = 计划为上年的百分数

? 100﹪

1

±

实际

提高 降低

百分数

=

提高

? 100﹪

1 ± 计划 降低 百分数

例:己知某厂2000年的计划规定产品产量要比上年实 际提高5﹪而实际提高了7﹪。则

计划完成 程度

=

1+ 1+

57﹪﹪?100﹪

=

101.9﹪

第四章 统计资料的描述
★ §4.1 总量指标(绝对数) ★ §4.2 相对指标(相对数) ★ §4.3 平均指标
§4.4 变异指标 §4.5 分布偏态与峰度

集集中中趋趋势势
指总体中各单位的次数分布从两边向 中间集中的趋势,用平均指标来反映。
指同质总体中各单位某一数 量标志的一般水平,是对总 体单位间数量差异的抽象化

平均指标的种类及计算方法

㈠ 算术平均数 ㈡ 几何平均数 数值平均数

㈢ 中位数 ㈣ 众数

位置平均数

(一)算术平均数

基本形式:

算术 平均数 =

总体变量总量 总体单位总数

例: 平均工资 平均成本

工资总额 = 职工人数
总成本 = 总产量

直接承担者

算术平均数的计算方法

A. 简单算术平均数 ——适用于总体资料未经 分组整理、尚为原始资料 的情况

N

? X = X1 + X 2 + LL + X N = i=1 X i

N

N

式中:X 为算术平均数; N 为总体单位总数; X i 为第 i 个单位的变量值。

8

算术平均数的计算方法

【例】 某售货小组5个人,某天的销售额 分别为520元、600元、480元、750 元、440元,则

平均每人日销售额为:

X = ? X = 520 + 600 + 480 + 750 + 440

N

5

= 2790 = 558(元)
5

算术平均数的计算方法

B. 加权算术平均数 ——适用于总体资料经过 分组整理形成变量数列的
情况

m

?? X

=

X 1 f1 + X 2 f2 + LL + X m fm f1 + f2 + L L + fm

=

X i fi
i =1 m
fi

i =1

式中:X 为算术平均数; f i为第 i 组的次数; m为组数;X i 为第i 组的变量值或组中值。

算术平均数的计算方法

【例】某企业某日工人的日产量资料如下:

日产量(件) X

工人人数(人)
f

10

70

11

100

12

380

13

150

14

100

合计

800

计算该企业该日全部工人的平均日产量。

算术平均数的计算方法

?? 解:

X

=

m
X i fi
i=1 m
fi

= 10 ? 70 + L + 14 ? 100 70 + L + 100

i=1

= 9710 = 12 .1375 (件) 800

说说 明明

若上述资料为组距数列,则应取各组的组 中值作为该组的代表值用于计算;此时求 得的算术平均数只是其真值的近似值。

算术平均数的计算方法

权权数数

指变量数列中各组标志值出现的次 数,是变量值的承担者,反映了各

组的标志值对平均数的影响程度

绝对权数 表现为次数、频数、单位数;即
公式 X = ? Xf ? f 中的 f

相对权数 表现为频率、比重;即公式

? X = ? Xf

?

f

=

?

X

f
?

f

中的

f

f

算术平均数的主要数学性质
⒈变量值与其算术平均数的离差之和 恒等于零,即:
? (xi - x ) = 0
⒉变量值与其算术平均数的离差平方 和为最小,即:
? ? (xi - x)2 ? (xi - c)2

9

((二二))几几何何平平均均数数
是N项变量值连乘积的开N次方根。用于 计算现象的平均比率或平均速度
简单几何平均数 加权几何平均数

A. 简单几何平均数 ——适用于总体资料未经分组整 理尚为原始资料的情况
XG = N X1 × X2LXN = N PX
式中:X G为几何平均数; N 为变量值的 个数;Xi 为第 i个变量值。

【例】某流水生产线有前后衔接的五道工序。 某日各工序产品的合格率分别为95﹪、92﹪、 90﹪、85﹪、80﹪,求整个流水生产线产品 的平均合格率。
分析:
设最初投产100A个单位 ,则 第一道工序的合格品为100A×0.95; 第二道工序的合格品为(100A×0.95)×0.92;
…… 第五道工序的合格品为 (100A×0.95×0.92×0.90×0.85)×0.80;

因该流水线的最终合格品即为第五道工序 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为:

总合格品 总产品

= 100A ? 0.95 ? 0.92 ? 0.90 ? 0.85 ? 0.80 100A

= 0.95 ? 0.92 ? 0.90 ? 0.85 ? 0.80

因该流水线的最终合格品即为第五道工序 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80; 则该流水线产品总的合格率为:

解总:合格X品G
总产品

=
=

51000.A95??0.095.9?20?.902.?900.?900?.805.8?5

= 5 0.5349 = 8810.204A﹪

?00.8.800

= 0.95 ? 0.92 ? 0.90 ? 0.85 ? 0.80

B. 加权几何平均数
——适用于总体资料经过分组整理 形成变量数列的情况

? m

X = ? X × X LX = ? X G

fi
i=1

f1

1

f2 2

m

fm

fi m

fi

m

i=1

i

i=1

式中:XG为几何平均数; f i 为第 i组的次数; m 为组数;Xi为第i 组的标志值或组中值。

10

【例】某金融机构以复利计息。近12年来的年 利率有4年为3﹪,2年为5﹪,2年为8﹪,3年 为10﹪,1年为15﹪。求平均年利率。

分析:

设本金为V,则至各年末的本利和应为:第2年的

第1年末的本利和为: V (1+ 3﹪)

计息基础

第2年末的本利和为: [V (1+ 3﹪)](1+ 3﹪)

………

………

第12年的

第12年末的本利和为:

计息基础

[ ] V(1+3﹪)4(1+5﹪)2(1+8﹪)2(1+10﹪)3 (1+15﹪)

则该笔本金12年总的本利率为:

总的本利和 V(1+ 0.03)4 (1 + 0.05)2 L(1+ 0.15)

=

本金

V

= (1+ 0.03)4 (1+ 0.05)2 L(1 + 0.15)

即12年总本利率等于各年本利率的连乘积,符合几 何平均数的适用条件,故计算平均年本利率应采用 几何平均法。

解: X G = (4+2+L+1) (1 + 0.03)4 (1 + 0.05)2 L (1 + 0.15)
= 12 2.2154 = 106.85﹪ 平均年利率 = X G -1 = 106.85﹪-1 = 6.85﹪

((三三))中中位位数数
将总体各单位标志值按大小顺 序排列后,指处于数列中间位 置的标志值,用 M e 表示
中位数的作用: 不受极端数值的影响,在总体标志 值差异很大时,具有较强的代表性。

中位数的确定 (未分组资料)

【例A】某售货小组5个人,某天的销售额按

从小到大的顺序排列为440元、480元、520元、

600元、750元,则

中位数的位次为: N + 1 = 5 + 1 = 3

2

2

即第3个单位的标志值就是中位数 M e = 520(元)

中位数的确定 (未分组资料)

【例B】若上述售货小组为6个人,某天的销

售额按从小到大的顺序排列为440元、480元、

520元、600元、750元、760元,则

中位数的位次为:

N

+1 =

6 +1

= 3.5

22

中位数应为第3和第4个单位标志值的算术平

均数,即

Me

=

520

+ 600 2

= 560 (元 )

中位数的确定 (单值数列) 中位数的位次:
【例C】某企业某日8工002人+ 的1 日= 4产00量.5资料如下:
日产量(件) 工人人数(人) 向上累计次数

X

f

(人)

10

70

70

11

100

170

Me = 12

380

550

13

150

700

14

100

800

合计

800



计算该企业该日全部工人日产量的中位数。

11

中位数的确定

(组距数列) 中位数的位次:

【例D】某车间50名工50人+月1 =产2量5 .的5 资料如下:
2 月产量(件) 工人人数(人) 向上累计次数

X

f

(人)

200以下

3

3

200~400

7

10

400~600

32

42

600以上

8

50

合计

50



计算该车间工人月产量的中位数。

中位数的确定 (组距数列)

共有单位数
?f 2 - S m-1

该段长度应为

?f

2

- S m -1 ×d

fm

中位数下限公式为

?f

Me =L+

2

-Sm-1 ×d

fm

共 ? f 个单位 中位数 共 ? f 个单位

2

2

L 组距为d U

共 Sm-1个单位

中位数组 共 f m 个单位

共 Sm+1个单位

假定该组内的单

位呈均匀分布

中位数的确定

? (组距数列)

f

【月例产D量】(某件M车)e间=工5L0人名+人工数2人(月f人-m 产S)m量-1 的×向d上资累料计如次下数:

X

50f-10

(人)

200以M下e = 400 + 200~400

23 732

? (600 - 400)3= 493.75(件)
10

400~600

32

42

600以上

8

50

合计

50



计算该车间工人月产量的中位数。

((四四))众众数数
指总体中出现次数最多的变量 值,用 M0表示,它不受极端数 值的影响,用来说明总体中大 多数单位所达到的一般水平。

众数的确定
(单值数列)

【例A】已知某企业某日工人的日产量资料如下:

日产量(件) 工人人数(人)

M0

10 11

70 100

12

380

13

150

14

100

合计

800

计算该企业该日全部工人日产量的众数。

众数的确定

(组距数列)

【例B】某车间50名工M人o月=产L量的+ 资D 料1 D+如1 D下2:× d

( ) 月产量(件) 工人人数(2人5 )
X M o = 400 + 2f 5 + 24

?

向上累计次数
200(=人5)02 .04



200以下

3

3

200~400

7

10

400~600

32

42

600以上

8

50

合计

50



计算该车间工人月产量的众数。

12

众数的原理及应用
q当数据分布存在明显的集中趋势, 且有显著的极端值时,适合使用众 数; q当数据分布的集中趋势不明显或 存在两个以上分布中心时,不适合 使用众数(前者无众数,后者为双 众数或多众数,也等于没有众数)。

中位数、众数和平均数的关系:
中位数、众数和平均数之间的数量关系 取决于总体内次数分配的状况。

对称钟形分布情形下:
x = me = mo

非对称左偏分布情形下:
X < M e< M 0

非对称右偏分布情形下:
M 0< M e< X

在偏斜适度的情况下,不论左偏还是右 偏,则有如下的经验公式:

2 3 mo

1

3

me

x

1 me - x = 3 (mo - x)

13

第四章 统计资料的描述
★ §4.1 总量指标(绝对数) ★ §4.2 相对指标(相对数) ★ §4.3 平均指标 ★ §4.4 变异指标
§4.5 分布偏态与峰度

离离散散程程度度
指总体中各单位标志值背离 分布中心的规模或程度,用 变异指标来反映。
反映统计数据差异程度的综 合指标

设某车间有如下两个生产小组,某周5天的产量: 甲:171,172,172,172,173(件) 乙:220,190,170,150,130(件)
不难看出两组的平均日产量均为172。平均日 产量172件的代表性甲组比乙组好。
变异指标反映平均数的代表性,总体单位变 量值的离散程度。
变异指标值越大,平均指标的代表性 越小;反之,平均指标的代表性越大

变异指标的种类
位置变异指标

全全距距

四四分分位位差差

数值变异指标

平平均均差差 标标准准差差 离离散散系系数数

((一一))全全距距
指所研究的数据中,最大值与最小值 之差,又称极差。

R = X max - X min

最大变量值或最 最小变量值或最

高组上限或开口 低组下限或开口

组假定上限

组假定下限

【例A】某售货小组5人某天的销售额分别为 440元、480元、520元、600元、750元,则
R = X max - X min = 750 - 440 = 310(元)

【例B】某季度某工业公司18个工 业企业产值计划完成情况如下:

计划完成程度 组中值 企业数 计划产值

(﹪) 90以下

(﹪)X (个) (万元)f

85

2

800

90~100

95

3

2500

100~110

105 10

17200

110以上

115

3

4400

合计



18

24900

解:计R算=该X公m=a司x 1该-20季X-m度i8n 计0=划=(14完100成(﹪+程)10度)的- 全(90距-。10 )

14

全距的特点
q优点:计算方法简单、易懂; q缺点:易受极端数值的影响,不能 全面反映所有标志值差异大小及分 布状况,准确程度差
往往往往应应用用于于生生产产过过程程的的质质量量控控制制中中

((二二))四四分分位位差差
Q × D = Q3 - Q1 2
1、将观测值从小排到大,并在排好序的 序列中找出中位数
2、第一四分位数 Q1,是中位数左边所有 数字的中位数
3、第三四分位数 Q3,是中位数右边所有 数字的中位数

四四分分位位差差 (未分组资料)

【例A】麦奎尔各球季的全垒打计数按从小到 大的顺序排列为9、9、22、32、33、39、39、 42、49、52、58、65、70,

中位数的位次为:N + 1 = 13 + 1 = 7

2

2

M e = 39

第一四分位数: 6 + 1 = 3.5
2

22 + 32 Q1 = 2 = 27

第三四分位数: 7 ? 2 - 3.5 = 10.5

52 + 58 Q3 = 2 = 55

四分位差: Q × D = Q 3 - Q 1 = 55 - 27 = 14

2

2

四四分分位位差差 (未分组资料)

【例B】麦奎尔各球季的全垒打计数按从小到

大的顺序排列为9、9、22、32、33、39、39、

42、49、52、58、65、70、71,

中位数的位次为:N + 1 = 14 + 1 = 7.5

2

2

39 + 42 M e = 2 = 40.5

第一四分位数: 7 + 1 = 4
2

Q1 = 32

第三四分位数:7.5 ? 2 - 4 = 11 Q3 = 58

四分位差: Q × D = Q 3 - Q 1 = 58 - 32 = 13

2

2

四四分分位位差差 (组距数列)

共 ? f 个单位
4

共3? f个单位
4

共 S1个单第位L一1 四分U位1 数中共位S3个数单第位三L3四分U位3 数

? Q1 = L1 +

f

4

- S1 f1

× d1

? 3 f

Q3 = L3 +

4

- S3 f3

×d3

四四分分位位差差 (组距数列)

【例】某车间30名工人月产量的资料如下:

月产量X(件)Q1的工位人人次数为f (3人40)=

7.向5 上累计次数
(人)

200以下

3

3

200~400

7

10

400~600

12

22

600以上

8

30

合计

30



计算该车间工人月Q产3的量的位四次分为位34差0 ?。3 = 22.5

15

? Q1 = L1 +

f

4

- S1 f1

× d1

= 200 +

7.5 - 3 ? 200 7

= 328.5(7 件)

? 3 f

Q3 = L3 +

4

- S3 f3

× d3

=

600 +

22.5 - 22 ? 200 8

= 612.5(0 件)

Q × D = Q 3 - Q 1 = 612 . 5 - 328 . 57

2

2

= 141 .97(件)

五数综合
一个分布的五数综合(five?number summary), 从小写到大,包括:最小数、第一四分位数、 中位数、第三四分位数及最大数。用符号表 示的话,五数综合是:
最小数 Q1 M e Q3 最大数

箱形图
箱形图(boxplot)是显示出五数综合的图 ? 箱形图中间的箱体,是从第一四分位数
延伸到第三四分位数 ? 箱体里的直线标示出中位数的位置 ? 箱体两头有直线从外延伸到最小数和最
大数

不同教育程度收入的箱形图

((三三))平平均均差差

是各个数据与其算术平均数的离差绝对 值的算术平均数,用 A×D 表示

计算公式:

⑴ 简单平均差——适用于未分组资料

A×D =

X1- X

+L + XN - X N

N
? Xi- X
= i =1 N

第 i 个单位 总体单 总体算术 的变量值 位总数 平均数

【例A】某售货小组5个人,某天的销售额 分别为440元、480元、520元、600元、750 元,求该售货小组销售额的平均差。

解:

X = 440 + 480 + 520 + 600 + 750 = 2790 = 558(元)

5

5

N

? X i - X 440 - 558 + L + 750 - 558

A × D = i=1

=

N

5

= 468 = 93 .6 (元 )
5
即该售货小组5个人销售额的平均差为93.6元。

16

平均差的计算公式

⑵ 加权平均差——适用于分组资料

m

A×D =

X1- X

f1 + L + X m - X f1 + L + fm

? f m = i =1

Xi - X
m
? fi

fi

i =1

第 i 组的变量 第 i 组变量值 总体算术 值或组中值 出现的次数 平均数

【例B】计算下表中某公司职工月工资的平均差。

月工资(元)组中值(元)X 职工人数(人)f

300以下

250

208

300~400

350

314

400~500

450

382

500~600

550

456

600~700

650

305

700~800

750

237

800~900

850

78

900以上

950

20

合计



2000

解:X = 250? 208+L+ 950? 20 = 1045900 = 522.95(元)

2000

2000

m
? Xi - X f
A × D = i=1
?f

250 - 522 .95 ? 208 + L + 950 - 522 .95 ? 20 =
2000
= 277893 .6 = 138 .95 (元 )
2000

即该公司职工月工资的平均差为138.95元。

平均差的特点
q优点:能综合反映全部单位标志值的实 际差异程度;
q缺点:用绝对值的形式消除各标志值与 算术平均数离差的正负值问题,不便于 作数学处理和参与统计分析运算。
一一般般情情况况下下都都是是通通过过计计算算另另一一种种标标志志 变变异异指指标标————标标准准差差,,来来反反映映总总体体内内
部部各各单单位位标标志志值值的的差差异异状状况况

((四四))标标准准差差

是各个数据与其算术平均数的离差平方 的算术平均数的开平方根,用s 来表示; 标准差的平方又叫作方差,用s 2来表示。

计算公式:

⑴ 简单标准差——适用于未分组资料

s=

( ) N

2

? Xi- X

i=1

N

第 i 个单位 总体单 总体算术 的变量值 位总数 平均数

【例A】某售货小组5个人,某天的销售额分 别为440元、480元、520元、600元、750元, 求该售货小组销售额的标准差。

解:X = 440 + 480 + 520 + 600 + 750 = 2790 = 558(元)

5

5

? ( ) N

2

s=

Xi - X
i =1

(440 - 558 )2 + L + (750 - 558 )2
=

N

5

= 60080 = 109 .62 (元 )
5

即该售货小组销售额的标准差为109.62元。

17

标准差的计算公式 ⑵ 加权标准差——适用于分组资料

s=

( ) m

2

? X i - X fi

i =1

m

? fi

i=1

第 i 组的变量 第 i 组变量值 总体算术 值或组中值 出现的次数 平均数

【例B】计算下表中某公司职工月工资的标准差。

月工资(元) 组中值(元)X 职工人数(人)f

300以下

250

208

300~400

350

314

400~500

450

382

500~600

550

456

600~700

650

305

700~800

750

237

800~900

850

78

900以上

950

20

合计



2000

解:

X = 250? 208 +L+ 950? 20 = 1045900 = 522.95(元)

2000

2000

s = (250 - 522 .95 )2 ? 208 + L + (950 - 522 .95)2 ? 20
2000
= 56386595 .01 = 167 .9(元 )
2000

即该公司职工月工资的标准差为167.9元。

标准差的特点

q能综合反映全部单位标志值的实际差异 程度;
q用平方的方法消除各标志值与算术平均 数离差的正负值问题,可方便地用于数 学处理和统计分析运算.

由由同同一一资资料料计计算算的的标标准准差差的的结结果果一一般般要要略略大大于于平平均均差差。。

证证明明::当当aa,,bb,,cc≥≥00时时,,有有

a2 +b2 + c2 a +b + c

?

3

3

标准差的简捷计算

目的: 避免离差平方和计算过程的出现

( ) 变量值平方
的平均数

s = X2- X 2

变量值平均 数的平方

简简单单标标准准差差 加加权权标标准准差差

s=

?X
N

2

-

? ??è

?X
N

2
? ÷÷ ?

s=

?X2f ?f

-

?? ?è

? Xf ?f

2
? ÷ ÷ ?

(五)离散系数

Vs

=

s X

?100﹪

应用:
用来对比不同水平的同类现象,特别是 不同类现象总体平均数代表性的大小: ——离散系数小的总体,其平均数的代 表性大;反之,亦然。

18

s 大象 = 500kg 可比 s免子 = 0.5kg

x大象 = 3500kg

x免子 = 2.5kg

离散系数

【例】某年级一、二两班某门课的平均成绩分 别为82分和76分,其成绩的标准差分别为15.6 分和14.8分,比较两班平均成绩代表性的大小。

解: 一班成绩的离散系数为:

Vs 1

=

s1 X1

?100﹪ =

15.6 82

?100﹪ = 19.02﹪

二班成绩的离散系数为:

Vs

2

=

s2 X2

?100﹪ =

14.8 76

?100﹪ =

19.47﹪

因为 Vs 1 ? Vs 2 ,所以一班平均成绩的代

表性比二班大。

第四章 统计资料的描述
★ §4.1 总量指标(绝对数) ★ §4.2 相对指标(相对数) ★ §4.3 平均指标 ★ §4.4 变异指标 ★ §4.5 分布偏态与峰度

§4.5 分布偏态与峰度
★ 一、偏态及其测度 二、峰度及其测度

偏态:
对分布偏斜方向及程度的测度

偏态系数:

K
? ( X i - X )3 Fi

a3 = i=1

K

? s 3 Fi

i =1

偏态系数说明
? 分布对称时,离差三次方后正负离差相 互抵消,偏态系数为0
? 分布不对称时,偏态系数为正,表示正 离差值较大,可以判断为正偏或右偏
? 偏态系数为负,表示负离差值较大,可 以判断为负偏或左偏
? 偏态系数绝对值越大,表示偏斜程度越 大
19

例:1997年农村居民家庭年纯收入情况
按纯收入分(百元) 5以下 5~10 10~15 15~20 20~25 25~30 户数比重(%) 2.28 12.45 20.35 19.52 14.93 10.35 按纯收入分(百元) 30~35 35~40 40~45 45~50 50以上 户数比重(%) 6.56 4.13 2.68 1.81 4.94

计算过程如下表所示:

按纯收入分(百元) 5以下 5~10 10~15 15~20 20~25 25~30 30~35 35~40 40~45 45~50 50以上 合计

组中值X i 户数比重(%)Fi (X i - X )3 Fi

2.5

2.28

-154.64

7.5

12.45

-336.46

12.5

20.35

-144.87

17.5

19.52

-11.84

22.5

14.93

0.18

27.5

10.35

23.16

32.5

6.56

89.02

37.5

4.13

171.43

42.5

2.68

250.72

47.5

1.81

320.74

52.5

4.94

1481.81



100

1689.25

其中,
K
? X = X i Fi = 21.42(9 百元) i =1
K
? s = ( X i - X )2 Fi = 12.08(9 百元)
i =1

则偏态系数为:

K

11

? ? ? a3

=

( X i - X )3 Fi
i =1 K
s 3 Fi

=

( Xi - 21.429)3 Fi
i =1
(12.089)3

= 1689.25 = 0.956 1766.7339

i =1

农村居民家庭年纯收入为右偏分布,即收入较低的 家庭占据多数。

§4.5 分布偏态与峰度
★ 一、偏态及其测度 ★ 二、峰度及其测度

峰度:
分布集中趋势高峰的形状

峰度系数:

K
? ( X i - X )4 Fi

a 4 = i=1

K

? s 4 Fi

i =1

峰度系数说明
? 归化到同一方差时,若分布的形状比正 态分布更瘦更高,则称为尖峰分布;若 比正态分布更矮更胖,则称为平峰分布。
? 正态分布的峰度系数为3,则 a4>3时为尖 峰分布,a4 <3时为平峰分布
20

例:1997年农村居民家庭年纯收入情况
按纯收入分(百元) 5以下 5~10 10~15 15~20 20~25 25~30 户数比重(%) 2.28 12.45 20.35 19.52 14.93 10.35 按纯收入分(百元) 30~35 35~40 40~45 45~50 50以上 户数比重(%) 6.56 4.13 2.68 1.81 4.94

计算过程如下表所示:

按纯收入分(百元) 5以下 5~10 10~15 15~20 20~25 25~30 30~35 35~40 40~45 45~50 50以上 合计

组中值X i 户数比重(%)Fi (X i - X )4 Fi

2.5

2.28

2927.15

7.5

12.45

4686.51

12.5

20.35

1293.53

17.5

19.52

46.52

22.5

14.93

0.20

27.5

10.35

140.60

32.5

6.56

985.49

37.5

4.13

2755.00

42.5

2.68

5282.94

47.5

1.81

8361.98

52.5

4.94

46041.33



100

72521.24

其中,

K
? X = X i Fi = 21.42(9 百元) i =1

K
? s = ( X i - X )2 Fi = 12.08(9 百元)
i =1

则峰度系数为:

K

11

? ? ? a4

=

(Xi
i =1
s4

- X )4 Fi
K
Fi

=

( Xi - 21.429)4 Fi
i =1
(12.089)4

=

72521.24 = 3.4 21358.05

i =1

农村居民家庭年纯收入为尖峰分布,即分布比正态分布 更集中,低收入家庭占据更多的比重。

总体分布的描述:

均值

标准差



偏态系数

峰度系数

中位数 四分位差

总结

总量指标 相对指标

1、时期指标、时点指标的含义
2、直接相加、折算相加的含义 1、结构、比例、比较、动态、强度相对数的含义 2、计划完成程度相对数的计算(重点为两种情况下 长期计划完成程度相对数和提前完成计划时间的计算)

平均指标

1、算术平均数、几何平均数的计算 2、中位数的计算(重点:组距数列)

3、众数的计算(重点:组距数列)

变异指标

4、众数、中位数和平均数的关系公式 1、四分位差的计算(重点:组距数列)

2、平均差、标准差的计算(重点:标准差

分布偏态与峰度 的简捷公式)

3、离散系数的计算

总结
1、偏态系数的说明 2、峰度系数的说明

21

拖拉机混合产量=4台 =
拖拉机标准实物产量=5台

f C
f-1 F A B

E G
f +1
D

L

U

d

Q DABC @ DADE

\ AF / AG = BC / DE

又Q FG = d,BC = f - f-1 = D1,DE = f - f+1 = D2

\M0

=

L

+

AF

=

L

+

BC BC + DE

FG

=

L

+

D1 D1 + D 2

d

众数的原理及应用

160

(无众数)

140

120
100 没有突出地集 80 中在某个年份
60

40

20

0 1975.0

1976.0

1977.0

1978.0

1979.0

1980.0

1981.0

出生
413名学生出生时间分布直方图

出现了两个明

60

显的分布中心

50

40

(双众数)

30

20

10
0 148.5 150.5 152.5 154.5 156.5 158.5 160.5 162.5 164.5 166.5 168.5 170.5 172.5 174.5 176.5 178.5 180.5 182.5 184.5 186.5 188.5 190.5 192.5
413名学生的身高分布直方图

时期指标

表明现象总体在一段时期内发展过 程的总量,如在某一段时期内的出

生人数、死亡人数

具有可加性、数值大小与时期长短有 直接关系、需要连续登记汇总

表明现象总体在某一时刻(瞬间) 时点指标 的数量状况,如在某一时点的总
人口数
不具有可加性、数值大小与时期长短没 有直接关系、由一次性登记调查得到

读博士是为了什么?
念小学的时候总是考第一,因此总是斗志昂扬,把清华北大当作最低理想;
上了初中第一的机会是零,但仍然是老师的宠儿,现实的目标变成了考上重点高 中
高中尽管也还优秀,但已经忘记了儿时的理想,因为学校历史上几乎没有过清华 和北大,好歹进了一所所谓的重点大学;
本科快毕业的时候,发现专科毕业的同学已经开了自己的公司,每年有10?20万 的进帐,我暗自下决心,好歹也该找个月薪5000的工作吧;
不幸保送了研究生,快毕业的时候发现工作已经比较难找,于是把标准放到了 3000;而本科毕业的同学拿个3?5000是一般情况;
又不幸被保送了博士,毕业了发现研究生毕业的同学正在北京筹划买房子,而我 进了北京高校当了一名老师,拿着1200的工资;
再过几个月,我就28岁了,我已经没有了理想,只是希望工资能够涨到2000,能 在食堂吃饱饭。 经常问自己的一个问题是:读博士是为了什么?

22

离差的概念

8

·

7

6

5

?1

4

·

3
· ?2

1· ?1 ·

x =5

3

·

2 1

Sx(1xi

-x)
x2

=-1+0+(-2)
x3 x4 x5

+3+1+(-1)
x6

=

0

x = ? xi
n

S( xi

- x) = Sxi

- nx

= Sxi

- n Sxi n

=0

离差的概念

8

·

7

6

5

?1

4

·

3
· ?2

· 1
?1 ·

x =5

3

·

S2(xi -x)2 =(-1)2 +02 +(-2)2 +32 +12 +(-1)2 =16

S1(xi -6)x21=(-x22)2 +x(3-1)x2 4+(-3x)52 +2x26+02 +(-2)2 = 22

S(xi -4)2 =02 +12 +(-1)2 +42 +22 +02 = 22

设c = X + e
? ? (xi - c)2 = (xi - (x + e ))2 ? = ((xi - x) - e )2 ? ? = (xi - x)2 - 2e (xi - x) + Ne 2 ? = (xi - x)2 + Ne 2
Q Ne 2 > 0
? ? \ (xi - x )2 ? (xi - c)2

s=

( ) N

2

? Xi- X

i =1

=

N

?N

(

X

2 i

- 2X

Xi +

X

2
)

i=1

N

N

?X

2 i

N
2X ? Xi

?N

2

X

=

i=1

-

N

i=1

+ i=1

N

N

N
? Xi
Q i=1 = X N

s=

N

?X

2 i

i=1

- 2X ? X

+

2
NX

=

N

N

N

?X

2 i

i =1

-X 2

N

23


推荐相关:

统计学课件 第四章 统计资料的描述.pdf

统计学课件 第四章 统计资料的描述 统计学课件统计学课件隐藏>> 多


[课件]统计学第四章统计资料的初步描述(PPT_图文.ppt

[课件]统计学第四章统计资料的初步描述(PPT - 统计学第四章统计资料 的初步描述( 二、计量单位:实物单位、货币单位和 劳动单位。 1、实物单位:是根据事物的...


应用统计学课件 第四章描述性统计_图文.ppt

应用统计学课件 第四章描述统计 - 潘手 鸿机 ? 13756072931 ?


统计学第四章数据的描述性分析_图文.ppt

统计学第四章数据的描述性分析 - 第四章 数据的描述性分析 本章内容 一、 集中


统计学课件 第四章 数据的概括性度量_图文.pdf

统计学课件 第四章 数据的概括性度量_经济学_高等教育_教育专区。第 4 章 ...用Excel计算描述统计量并进行分析作者:青岛科技大学经济与管理学院 张占贞 数据...


统计学课件第四章 统计指标_图文.ppt

统计学课件第四章 统计指标_自然科学_专业资料统计学课件 统计学概论内容 ? 第一章 ? 第二章 ? 第三章 ? 第四章 ? 第五章 ? 第六章 ? 第七章 ? ...


统计学课件第四章.ppt

大学经济类专业必修课统计学课件大学经济类专业必修课统计学课件隐藏>> 第四章 数据描述分析集中趋势 (位置) 位置) 离中趋势 (分散程度) 分散程度) 偏态和峰态...


统计学第四章_图文.ppt

统计学第四章 - 第四章 统计数据分布特征的描述 ? 分布集中趋势的测度平均指


统计学课件 第四章数据分布特征的测度_图文.ppt

统计学课件 第四章数据分布特征的测度 - 第四章 总体特征的 测度与描述 统计学 STATISTICS 制作时间:20042005 4-1 基本内容 1、总体总量的测度 2、总体数量...


统计学课件笔记整理.pdf

统计学课件笔记整理 - 第一章 统计数据 描述统计(Descriptive Statistics) :用表格、图形和数字来概括、显示数据特 征的统计方法 推断统计(Inferential St...


统计学全套课件 PPT_图文.ppt

第一章 第二章 第三章 第四章 总论 图表描述描述性统计量参数估计 2 统计...统计资料 理论与实践 统计学 7 《统计学》第一章 总论 统计的含义之一 STAT...


统计学课件.ppt(2014年)_图文.ppt

统计学内容第一章 第二章 第三章 第四章 第五...统计工作者搜集、整理、计算分析或推断统计资料 的...描述统计学 研究如何搜集、加工处理、显示及计算分析...


统计学第四章数据分布特征的测度1_图文.ppt

统计学第四章数据分布特征的测度1 - 第四章 总体特征的 测度与描述 统计学 S


统计学课件(贾俊平)人大课件4_图文.ppt

经济、管理类 基础课程 统计学 第四章 数据分布特征的测度 4-1 经济、管理类...离中趋势的各测度值是对数据离散程度所作的描述 3. 反映各变量值远离其中心值...


统计学原理完整课件_图文.ppt

统计学原理完整课件 - 目录 ?第一章 导论 ? 第二章 统计数据的调查与收集 ? 第三章 统计数据的整理 ? 第四章 数据分布特征的描述 ?第五章 时间序列分析 ...


《统计学》课件_图文.ppt

统计学课件 - 统计学 第一章 统计和统计数据的收集 第二章 统计数据的整理和展示 第三章 数据的描述性分析 第四章 第五章 第六章 概率基础 区间估计和...


《统计学》PPT完整_袁卫_贾俊平_图文.ppt

统计学PPT完整_袁卫_贾俊平 - 统计学 第一章 统计和统计数据的收集 第二章 统计数据的整理和展示 第三章 数据的描述性分析 第四章 第五章 第六章 概率...


统计学原理课件_图文.ppt

统计学原理 课件李 源 铜陵职业技术学院管理系 学习要求: 1、任何课程的知识都...第三章 统计数据的整理 ? 第四章 数据分布特征的描述 ?第五章 时间序列分析...


《统计学原理》精品PPT课件_图文.ppt

统计学原理》精品PPT课件_经济学_高等教育_教育专区。21世纪经济管理专业应用...第三章 统计数据的整理 ? 第四章 数据分布特征的描述 ?第五章 时间序列分析...


统计学 人大 第四版 ppt_图文.ppt

统计学 人大 第四版 ppt - 统计学 安徽建筑工业学院 第一章 总论 第二章 统计数据的描述分析 第三章 概率与概率分布 第四章、统计量及其抽样分布 第五章 ...

网站首页 | 网站地图
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com