9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 数学 >>

第三节 变量间的相关关系、统计案例_图文

第三节  变量间的相关关系、统计案例_图文

变量间的相关关系、统计案例

1.会作两个有关联变量数据的散点图,会利用 散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性 回归方程系数公式建立线性回归方程.

3.了解下列常见的统计方法,并能应用这些方 法解决一些实际问题. (1)了解独立性检验(只要求2×2列联表)的基本思 想、方法及其简单应用. (2)了解回归的基本思想、方法及其简单应用.

[理 要 点]
一、变量间的相关关系 1.常见的两变量之间的关系有两类:一类是确定性的函 数关系,另一类是相关关系;相关关系是指变量间确实 存在关系,但又不具备函数关系所要求的 确定性 ,它 们的关系是带有 随机性 的. 2.如果一个变量的值由小变大,另一个变量的值 也由小变大 , 这种相关称为正相关,如果一个变量的值由小变大时,另 一个变量的值 由大变小 ,这种相关称为负相关.

二、两个变量的线性相关
1.如果散点图中点的分布从整体上看都分布在一条直线附近,

y 我们用直线 ^=bx+a拟合 散点图中的这些点,象这样能用

y 直线 ^=bx+a近似 表示的相关关系叫做线性相关关系.
Q= ? ?yi-bxi-a?2的最小值而得到回归直线,由于 2.通过求
i=1 n

平方又叫二乘方,所以这种使“离差平方和为最小”的方 法,叫做 最小二乘法 .

?xiyi-n x y
3.回归直线方程为

n

^=b x+a ^ y ^

i=1

^ ,其中b =



?x2-n x 2 i
i=1

n

^= y -b x . ^ a 4.样本相关系数

? ?xi- x ??yi- y ?
i=1

n

r=

? ?xi- x ? ? ?yi- y ?2
2 i =1 n i =1

n

n

?xiyi-nx y
i=1

- -


n 2 2 ? xi -n x ?? y2-n y 2? i =1 =1 i i

.

?

n

?

当r>0时,表明两个变量 正相关 ;
当r<0时,表明两个变量 负相关 . |r|≤1,当r的绝对值越接近于1,表明两个变量的线性相 关程度 越强.r的绝对值越接近于0时,表明两个变量之 间线性相关程度越弱.通常|r|大于 0.75 时,认为两个变

量有很强的线性相关性.

三、独立性检验 1.2×2列联表:假设有两个分类变量A和B,它们的值域 分别为{A, A }和{B, B },其样本频数列联表(称2×2 列联表)为:
B A A 合计 n11 n21 n+1 B n12 n22 n+2 合计 n1 + n2 + n

n?n11n22-n12n21?2 χ2= (其中n=n11+n12+n21+n22为样 n1+n2+n+1n+2 本容量). 2.用χ2的大小可以决定是否拒绝原来的统计假设H0,若χ2 值较大,就拒绝H0,即拒绝事件A与B无关. 3.当χ2>3.841时,则有 95% 的把握说事件A与B有关; 当χ2>6.635时,则有 99% 的把握说事件A与B有关; 当χ2≤3.841时,则认为事件A与B 无关 .

[究 疑 点] 1.相关关系与函数关系有何异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:(1)函数关系是一种确定关系,相关关系是一 种非确定的关系;

(2)函数关系是一种因果关系,而相关关系不一定是因
果关系,也可能是伴随关系.

2.根据独立性检验的基本思想,得出的两个分类变量有 关系,这样的结论一定是正确的吗? 提示:在实际问题中,独立性检验的结论仅仅是一种 数学关系,得出的结论也可能犯错误,比如:在推测 吸烟与肺癌是否有关时,通过收集、整理、分析数据,

我们得到“吸烟与患肺癌有关”的结论,并且有超过
99%的把握说明吸烟与患肺癌有关系,或者这个结论 出错的概率为0.01以下.但实际上一个人吸烟也不一 定会患肺癌,这是数学中的统计思维与确定性思维差 异的反映.

[题组自测] 1.对变量x、y有观测数据(xi,yi)(i=1,2,?,10),得散点图1; 对变量u、v有观测数据(ui,vi)(i=1,2,?,10),得散点图2. 由这两个散点图下列判断正确的是________.

A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关

C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关

解析:由题图1可知,各点整体呈递减趋势,x与y负

相关,由题图2可知,各点整体呈递增趋势,u与v正
相关. 答案:C

2.在关于人体的脂肪含量(百分比)和年龄关系的研究中,
得到如下一组数据: 年龄 23 27 39 41 45 49 51 53

脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6

判断它们是否有相关关系,若有作一回归直线.

解:以年龄作为x轴,脂肪含量为y轴,可得相应散点图:

由散点图可见,两者之间具有相关关系.

3.下面是水稻产量与施化肥量的一组观测数据:

施化肥量

15

20

25

30

35

40

45

水稻产量 320 330 360 410 460 470 480 (1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么 关系吗?水稻产量会一直随施化肥量的增加而增长吗?

解:(1)散点图如图:

(2)从图中可以发现施化肥量与水稻产量具有线性相关关 系,当施化肥量由小到大变化时,水稻产量由小变大, 图中的数据点大致分布在一条直线的附近,因此施化肥

量和水稻产量近似成线性相关关系,但水稻产量只是在
一定范围内随着化肥施用量的增加而增长.

[归纳领悟] 相关关系的直观判断方法就是作出散点图,若散

点图呈带状且区域较窄,说明两个变量有一定的相关
性,否则不具有相关性.

[题组自测]
1.一位母亲记录了儿子3~9岁的身高,数据(略),由此建 立的身高与年龄的回归模型为 ^ =7.19x+73.93,用这 y 个模型预测这个孩子10岁时的身高,则正确的叙述是 ( A.身高一定是145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm左右 D.身高在145.83 cm以下 )

解析:用回归模型y=7.19x+73.93,只能作预测其结果, 不一定是个确定值. 答案:C

2.已知回归方程 ^ =4.4x+838.19,则可估计x与y的增长 y 速度之比约为________.
解析:x与y的增长速度之比即为回归方程的斜率的倒数 1 5 = . 4.4 22

5 答案: 22

3.若施化肥量x与水稻产量y的回归直线方程为 ^ =5x+250, y 当施化肥量为80 kg时,预计水稻产量为________.

解析:将x=80代入 ^ =5x+250中即可得水稻的产量约 y 为650 kg.

答案:650 kg

4.某电脑公司有6名产品推销员,其工作年限与年推销金 额的数据如下表: 推销员编号 工作年限x/年 推销金额y/万元 1 3 2 2 5 3 3 6 3 4 7 4 5 9 5

(1)以工作年限为自变量x,推销金额为因变量y,作出散

点图;
(2)求年推销金额y关于工作年限x的线性回归方程.

解:(1)依题意,画出散点图如图所示,

(2)从散点图可以看出,这些点大致在一条直线附近,设所 ^ ^ ^ 求的线性回归方程为y =b x+a .

? ?xi- x ??yi- y ?
i=1

5

^ 则b =

? ?xi- x ?2
i=1

5

10 ^ ^ = =0.5,a = y -b x =0.4, 20

∴年推销金额y关于工作年限x的线性回归方程为 ^=0.5x+0.4. y

在本题条件下,若第6名推销员的工作年限为11年,试估

计他的年推销金额?
解:由本题(2)中,当x=11时, ^ =5.9万元,∴可估计他 y 的年推销金额为5.9万元.

[归纳领悟] 1.利用相关系数r进行判断相关性时的步骤: (1)求出相关系数r,计算时要细心,避免计算错误. (2)根据r的值检验结果,若|r|>0.75,表示有很强的线性相关 关系. 2.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关; ^ ^ (2)如果是,则用公式求a 、b ,写出回归方程; (3)根据方程进行估计. 3.回归直线方程恒过点( x , y ).

[题组自测]
1.下面是一个2×2列联表 y1 x1 a y2 21 总计 73

x2
总计

2
b

25
46

27

则表中a、b处的值分别为 A.94、96 C.52、54 B.52、50 D.54、52

(

)

解析:∵a+21=73,∴a=52,又a+2=b ∴b=54.

答案:C

2.某高校“统计初步”课程的教师随机调查了选该课程
的一些学生的情况,具体数据如下表: 专业 性别

非统计专业

统计专业




13
7

10
20

为了判断主修统计专业是否与性别有关系,根据表中的数 据,得到 50×?13×20-10×7?2 χ2= ≈4.844,因为K2≥3.841,所以 23×27×20×30 判定主修统计专业与性别有关系,那么这种判断出错的可 能性为________.

解析:由χ2 ≈4.844>3.841, 故判断出错的可能性为5%. 答案: 5%

3.(2010· 新课标全国卷)为调查某地区老年人是否需要志 愿者提供帮助,用简单随机抽样方法从该地区调查了 500位老年人,结果如下: 性别 男 40 160 女 30 270

是否需要志愿者
需要 不需要

(1)估计该地区老年人中,需要志愿者提供帮助的老年人 的比例; (2)能否有99%的把握认为该地区的老年人是否需要志愿 者提供帮助与性别有关?

(3)根据(2)的结论,能否提出更好的调查方法来估计该地
区的老年人中,需要志愿者提供帮助的老年人的比例? 说明理由.

解析:(1)调查的500位老年人中有70位需要志愿者提供帮 助,因此该地区老年人中,需要帮助的老年人的比例的估 70 计值为 =14%. 500 500×?40×270-30×160?2 (2)K2= ≈9.967. 200×300×70×430 由于9.967>6.635,所以有99%的把握认为该地区的老年人 是否需要帮助与性别有关.

(3)由(2)的结论知,该地区老年人是否需要帮助与性别有 关,并且从样本数据能看出该地区男性老年人与女性老

年人中需要帮助的比例有明显差异,因此在调查时,先
确定该地区老年人中男、女的比例,再把老年人分成男、 女两层并采用分层抽样方法.

[归纳领悟] 1.独立性检验的一般步骤: (1)根据样本数据制成2×2列联表; n?ad-bc?2 (2)根据公式χ2= ,计算K2的值; ?a+b??c+d??a+c??b+d? (3)查表比较χ2与临界值的大小关系,作统计判断. 2.在实际问题中,独性性检验的结论也仅仅是一种数学关系, 得到的结论也可能犯错误.

一、把脉考情 从近两年高考试题来看,高考对此部分内容的考查 部分地区呈上升趋势(如辽宁卷),其他地区仍以客观题 为主,属容易题,多考查基本思想与概念理解的应用. 对于回归分析及回归直线方程的求法复习时要引起 重视,预测2012年应为命题的热点.

二、考题诊断 1.(2010· 湖南高考)某商品销售量y(件)与销售价格x(元/件) 负相关,则其回归方程可能是 ^ A.y =-10x+200 ^ C.y =-10x-200 ( ^ B.y =10x+200 ^ D.y =10x-200 )

解析:可判断B、D正相关,C不合实际意义. 答案:A

2.(2010· 广东高考)某市居民2005~2009年家庭年平均收 入x(单位:万元)与年平均支出Y(单位:万元)的统计资 料如下表所示:

年份
收入x 支出Y

2005
11.5 6.8

2006
12.1 8.8

2007
13 9.8

2008
13.3 10

2009
15 12

根据统计资料,居民家庭年平均收入的中位数是 __________,家庭年平均收入与年平均支出有 ________线性相关关系.

解析:由表中所给的数据知所求的中位数为13,画出x与

Y的散点图知它们有较强的线性相关关系.
答案:13 较强的

3.(2010· 辽宁高考)为了比较注射A,B两种药物后产生的 皮肤疱疹的面积,选200只家兔做试验,将这200只家 兔随机地分成两组,每组100只,其中一组注射药物A, 另一组注射药物B.下表1和表2分别是注射药物A和药物

B后的试验结果.(疱疹面积单位:mm2)

表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数 30 40 20 10

表2:注射药物B后皮肤疱疹面积的频数分布表 疱疹 面积 频数 [60,65) [65,70) [70,75) [75,80) [80,85) 10 25 20 30 15

(1)完成下面频率分布直方图,并比较注射两种药物后疱疹 面积的中位数大小;

(2)完成下面2×2列联表,并回答能否有99.9%的把握认 为“注射药物A后的疱疹面积与注射药物B后的疱疹面积 有差异”.

表3: 疱疹面积小于2 注射药物A 注射药物B 合计
n?ad-bc?2 附:χ2= ?a+b??c+d??a+c??b+d?

疱疹面积不小于2 合计 b= d= n=

a= c=

P(χ2 ≥k) k

0.100 2.706

0.050 3.841

0.025 5.024

0.010 6.635

0.001 10.828

解:(1)

从频率分布直方图中可以看出注射药物A后皮肤疱疹面 积的中位数在65至70之间 ,而注射药物B后皮肤疱疹面 积的中位数在70至75之间,所以注射药物A后疱疹面积 的中位数小于注射药物B后疱疹面积的中位数.

(2)表3:
疱疹面积小于2 疱疹面积不小于2 注射药物A a=70 b=30 合计 100

注射药物B
合计

c=35
105

d=65
95

100
n=200

200×?70×65-35×30?2 χ2= ≈24.56. 100×100×105×95 由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B后的疱疹面积有差异”.

点 击 此 图 片 进 入“课 时 限 时 检 测”


网站首页 | 网站地图 | 学霸百科
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com