9299.net
大学生考试网 让学习变简单
当前位置:首页 >> >>

【课堂新坐标】2016-2017学年高中数学 第一章 统计案例章末分层突破课件 新人教a版选修1-2_图文

【课堂新坐标】2016-2017学年高中数学 第一章 统计案例章末分层突破课件 新人教a版选修1-2_图文

巩 固 层

拓 展 层

章末分层突破
提 升 层 章 末 综 合 测 评

[自我校对]

⑤分类变量 ⑥等高条形图 2 n ⑦ K = ? x - x ?? y - y ? ? i i n?ad-bc?2 i=1 ② ?a+b??c+d??a+c??b+d?
①散点图

? ? x i- x ? 2
i= 1

n

^ ③ y -b- x ④残差分析

线性回归直线方程
^ ^ ^ ^ 在回归直线方程y=bx+a中,b代表 x 每增加一个单位,y 平均增加的单位 ^ 数.一般来说,当回归系数b>0 时,说明两个变量呈正相关关系,它的意义是: ^ ^ 当 x 每增加一个单位时,y 就平均增加b个单位;当回归系数b<0 时,说明两个 ^ 变量呈负相关关系,它的意义是:当 x 每增加一个单位时,y 就平均减少|b|个单 位.

某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 需求量(万吨) 2008 236 2010 246 2012 257 2014 276 2016 286

^ ^ (1)利用所给数据求年需求量与年份之间的回归直线方程^ y=bx+a ; (2)利用(1)中所求出的直线方程预测该地 2018 年的粮食需求量.

【精彩点拨】 确性.

正确利用求回归直线方程的步骤求解,注意数据计算的准

【规范解答】

(1)由所给数据看出,把年份看作点的横坐标,对应的需求

量看作点的纵坐标,画出散点图草图,通过观察知这些点大致分布在一条直线 附近,下面求回归直线方程,为此对数据预处理如下: 年份—2012 需求量—257 -4 -21 -2 -11 0 0 2 19 4 29

对预处理后的数据,容易算得 x =0, y =3.2, ^ ?-4?×?-21?+?-2?×?-11?+2×19+4×29-5×0×32 260 b= = 40 =6.5, ?-4?2+?-2?2+22+42-5×02 ^ - ^ = y -b a x =3.2, 由上述计算结果,知所求回归直线方程为 ^ ^ ^=6.5(x-2012)+3.2, y-257=b(x-2012)+a 即^ y=6.5(x-2012)+260.2.(*)

(2)利用直线方程(*),可预测 2018 年的粮食需求量为 6.5×(2018-2012)+ 260.2=6.5×6+260.2=299.2(万吨).

[再练一题] 1.某企业的某种产品产量与单位成本统计数据如下: 月份 产量(千件) 单位成本(元/件) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

?xiyi-n x y
i=1

n

b=

2 - n x ?x2 i i =1

n

,a= y -b x (用最小二乘法求线性回归方程系数公式

2 2 2 2 注:?xiyi=x1y1+x2y2+…+xiyi+…+xnyn,?x2 = x + x +…+ x +…+ x i 1 2 i n). i=1 i=1

n

n

(1)试确定回归方程; (2)指出产量每增加 1 件时,单位成本下降多少? (3)假定产量为 6 件时,单位成本是多少?单位成本为 70 元/件时,产量应 为多少件?

【解】 (1)设 x 表示每月产量(单位:千件),y 表示单位成本(单位:元/件), 作散点图.由图知 y 与 x 间呈线性相关关系,设线性回归方程为 y=bx+a.

由公式可求得 b≈-1.818,a=77.364,∴回归方程为 y=-1.818x+77.364.

(2)由回归方程知,每增加 1 件产量,单位成本下降 1.818 元. (3)当 x=6 时,y=-1.818×6+77.364=66.456; 当 y=70 时,70=-1.818x+77.364,得 x≈4.051 千件. ∴产量为 6 件时,单位成本是 66.456 元/件,单位成本是 70 元/件时,产量 约为 4 051 件.

线性回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其 步骤是先画出散点图,并对样本点进行相关性检验,在此基础上选择适合的函 数模型去拟合样本数据,从而建立较好的回归方程,并且用该方程对变量值进 行分析; 有时回归模型可能会有多种选择(如非线性回归模型), 此时可通过残差 分析或利用相关指数 R2 来检查模型的拟合效果,从而得到最佳模型.

一个车间为了规定工时定额,需确定加工零件所花费的时间,为 此进行了 10 次试验,测得的数据如下表: 零件数 x/个 加工时间 y/min 10 20 30 40 50 60 70 80 90 100

62 72 75 81 85 95 103 108 112 127

经分析加工时间 y 与零件个数 x 线性相关, 并求得回归直线方程为^ y=0.670x +55.133.

(1)求出相关指数; (2)作出残差图; (3)进行残差分析.

【精彩点拨】 作残差分析时,一般从以下几个方面予以说明:(1)散点图; (2)相关系数;(3)相关指数;(4)残差图中异常点样本点的带状分布区域的宽窄.

【规范解答】 ^ yi y i- ^ yi y i- y ^ yi y i- ^ yi y i- y

(1)利用所给回归直线方程求出下列数据. 61.833 0.167 -30 95.333 -0.333 3 68.533 3.467 -20 75.233 81.933 88.633

-0.233 -0.933 -3.633 -17 -11 115.433 -7 122.133 4.867 35

102.033 108.733 0.967 11

-0.733 -3.433 16 20

y i? 2 ? ?yi-^
i=1

10

∴R2=1-

? ? yi- y ? 2
i=1

10

≈0.983.

(2)∵^ ei=yi-^ yi,利用上表中数据作出残差图,如图所示.

(3)由 R2 的值可以看出回归效果很好. 由残差图也可以观察到,第 2、5、9、10 个样本点的残差比较大,需要确 认在采集这些样本点的过程中是否有人为的错误.

[再练一题] 2.已知 x,y 之间的一组数据如下表: x y 1 1 3 2 6 3 7 4 8 5

(1)从 x,y 中各取一个数,求 x+y≥10 的概率; 1 1 (2)针对表中数据,甲、乙两同学给出的拟合直线分别为 y=3x+1 与 y=2x 1 +2,试利用“最小二乘法”判断哪条直线拟合程度更好. 【导学号:19220007】

【解】 (1)从 x,y 中各取一个数组成数对(x,y),共有 25 对,其中满足 x +y≥10 的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共 9 9 9 对,故所求概率为 P=25,所以使 x+y≥10 的概率为25.

1 (2)用 y=3x+1 作为拟合直线时,y 的实际值与所得的 y 值的差的平方和为
? ? 4?2 10?2 ? 11?2 7 2 2 s1=?1-3? +(2-2) +(3-3) +?4- 3 ? +?5- 3 ? =3. ? ? ? ? ? ?

1 1 用 y=2x+2作为拟合直线时,y 的实际值与所得的 y 值的差的平方和为 s2 =(1-1) +(2-2)
2 2

? ? 7?2 9?2 1 2 +?3-2? +(4-4) +?5-2? =2. ? ? ? ?

1 1 因为 s1>s2,故直线 y=2x+2的拟合程度更好.

独立性检验
独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个 分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是 否有关系,而独立性检验可以精确地得到可靠的结论. 独立性检验的一般步骤: (1)根据样本数据制成 2×2 列联表. (2)根据公式计算 K2 的观测值 k. (3)比较 k 与临界值的大小关系作统计推断.

某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌带菌情况, 结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异. 带菌头数 屠宰场 零售点 总计 8 14 22 不带菌头数 32 18 50 总计 40 32 72

【精彩点拨】 这是一个 2×2 列联表,可以用 K2 来检验屠宰场与零售点 猪肉带菌率有无差异.

【规范解答】

72×?8×18-14×32?2 k= ≈4.726. 40×32×50×22

因为 4.726>3.841,所以在犯错误的概率不超过 0.05 的前提下,认为屠宰场 与零售点猪肉带菌率有差异.

[再练一题] 3.(2016· 沈阳高二检测)某班主任对全班 50 名学生进行了作业量多少的调 查,数据如下表: 认为作业多 认为作业不多 总计 喜欢玩电脑游戏 不喜欢玩电脑游戏 总计 18 8 26 9 15 24 27 23 50 )

则认为喜欢玩电脑游戏与认为作业多少有关系的把握大约为(

A.99% C.90%

B.95% D.无充分依据

【解析】

由表中数据计算

50×?18×15-8×9?2 k= ≈5.059, 26×24×27×23 而 k≈5.059>3.841,所以约有 95%的把握认为两变量之间有关.

【答案】 B

转化与化归思想
非线性回归方程转化为线性回归问题求解步骤. (1)确定变量,作出散点图. (2)根据散点图,选择恰当的拟合函数. (3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求 出线性回归方程. (4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. (5)根据相应的变换,写出非线性回归方程.

某种书每册的成本费 y(元)与印刷册数 x(千册)有关, 经统计得到数 据如下: x y 1 2 3 5 10 20 30 50 100 200 1.15

10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21

1 检验每册书的成本费 y 与印刷册数的倒数x 之间是否具有线性相关关系.如 有,求出 y 对 x 的回归方程.

1 【精彩点拨】 令 z=x ,使问题转化为 z 与 y 的关系,然后用回归分析的 方法,求 z 与 y 的回归方程,进而得出 x 与 y 的回归方程.

【规范解答】

1 1 把x 置换为 z,则有 z= x,

从而 z 与 y 的数据为 z 1 0.5 0.333 0.2 0.1 0.05 0.033 0.02 0.01 0.005

y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15 可作出散点图(图略), 从图可看出, 变换后的样本点分布在一条直线的附近, 因此可以用线性回归方程来拟合.

1 z =10×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1, 1 y =10×(10.15+5.52+4.08+…+1.15)=3.14,
2 2 2 2 2 ?z2 i =1 +0.5 +0.333 +…+0.01 +0.005 ≈1.415, i=1 10

2 2 2 2 ?y2 i =10.15 +5.52 +…+1.21 +1.15 =171.803, i=1

10

?ziyi=1×10.15+0.5×5.52+…+0.005×1.15
i=1

10

=15.221 02,

?ziyi-10 z y
^ 所以b=
i=1 10

10

≈8.976,

?zi2-10 z 2
i=1

^ ^ a= y -b z =3.14-8.976×0.225 1≈1.120, 所以所求的 z 与 y 的回归方程为^ y=8.976z+1.120. 1 8.976 ^ 又因为 z=x ,所以y= x +1.120.

[再练一题] 4.在某化学实验中,测得如下表所示的 6 对数据,其中 x(单位:min)表示 化学反应进行的时间,y(单位:mg)表示未转化物质的质量. x/min y/mg 1 39.8 2 32.2 3 25.4 4 20.3 5 16.2 6 13.3

(1)设 y 与 x 之间具有关系 y=cdx,试根据测量数据估计 c 和 d 的值(精确到 0.001); (2)估计化学反应进行到 10 min 时未转化物质的质量(精确到 0.1).

【解】

(1)在 y=cdx 两边取自然对数,令 ln y=z,ln c=a,ln d=b,则 z

=a+bx.由已知数据,得 x y z 1 39.8 3.684 2 32.2 3.472 3 25.4 3.235 4 20.3 3.011 5 16.2 2.785 6 13.3 2.588

^ ^ 由公式得a≈3.905 5, b≈-0.221 9, 则线性回归方程为^ z =3.905 5-0.221 9x. 而 ln c=3.905 5,ln d=-0.221 9, 故 c≈49.675,d≈0.801, 所以 c,d 的估计值分别为 49.675 和 0.801.

(2)当 x=10 时,由(1)所得公式可得 y≈5.4(mg). 所以,化学反应进行到 10 min 时未转化物质的质量约为 5.4 mg.

1.(2015· 福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机 调查了该社区 5 户家庭,得到如下统计数据表: 收入 x(万元) 支出 y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8

^ ^ ^ ^ ^ ^ 根据上表可得回归直线方程y=bx+a,其中b=0.76,a= y -b x .据此估计, 该社区一户年收入为 15 万元家庭的年支出为( A.11.4 万元 C.12.0 万元 B.11.8 万元 D.12.2 万元 )

【解析】

8.2+8.6+10.0+11.3+11.9 由题意知, x = =10, 5

6.2+7.5+8.0+8.5+9.8 y= =8, 5 ^=8-0.76×10=0.4, ∴a ∴当 x=15 时,^ y=0.76×15+0.4=11.8(万元).

【答案】 B

2.(2014· 湖北高考)根据如下样本数据 x y 3 4.0 4 2.5 5 -0.5 6 0.5 ) 7 -2.0 8 -3.0

得到的回归方程为^ y=bx+a,则( A.a>0,b>0 C.a<0,b>0

B.a>0,b<0 D.a<0,b<0

【解析】

作出散点图如下:

观察图象可知,回归直线^ y=bx+a 的斜率 b<0,当 x=0 时,^ y=a>0.故 a >0,b<0.
【答案】 B

3.四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得 回归直线方程,分别得到以下四个结论: ①y 与 x 负相关且^ y=2.347x-6.423; ②y 与 x 负相关且^ y=-3.476x+5.648; ③y 与 x 正相关且^ y=5.437x+8.493;④y 与 x 正相关且^ y=-4.326x-4.578. 其中一定不正确的结论的序号是( A.①② C.③④ B.②③ D.①④ )

【解析】 由正负相关性的定义知①④一定不正确. 【答案】 D

4.(2015· 江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性 别有关联的可能性最大的变量是( ) 表1 成绩 性别 男 女 总计 不及格 6 10 16 及格 14 22 36 总计 20 32 52

表2 视力 性别 男 女 总计 好 4 12 16 差 16 20 36 总计 20 32 52

表3 智商 性别 男 女 总计 偏高 8 8 16 正常 12 24 36 总计 20 32 52

表4 阅读量 性别 男 女 总计 丰富 14 2 16 不丰富 6 30 36 总计 20 32 52

A.成绩 C.智商

B.视力 D.阅读量

2 n ? ad - bc ? 注:K2= . ?a+b??c+d??a+c??b+d?

【解析】

A 中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a

+c=16,b+d=36,n=52, 52×?6×22-14×10?2 13 k= =1 440. 20×32×16×36 B 中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b +d=36,n=52, 52×?4×20-16×12?2 637 k= =360. 20×32×16×36

C 中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d =36,n=52, 52×?8×24-12×8?2 13 k= =10. 20×32×16×36

D 中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+ d=36,n=52, 52×?14×30-6×2?2 3 757 k= = 160 . 20×32×16×36 13 13 637 3 757 ∵1 440<10<360< 160 , ∴与性别有关联的可能性最大的变量是阅读量.
【答案】 D

5.(2014· 全国卷Ⅱ)某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单 位:千元)的数据如下表: 年 份 年份代号 t 人均纯收入 y 2007 2008 2009 2010 2011 2012 2013 1 2.9 2 3.3 3 3.6 4 4.4 5 4.8 6 5.2 7 5.9

(1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均 纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: - ^ ∑ ^ i=1 ?ti- t ??yi- y ? ^ - b= , a = y - b t. n 2 ∑ =1 ?ti- t ? i
n

【解】

1 (1)由所给数据计算得 t =7(1+2+3+4+5+6+7)=4,

1 - y =7(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
2 ∑ ( t - t ) =9+4+1+0+1+4+9=28, i i=1 7

- ∑ i=1 (ti- t )(yi- y )= (- 3)×(- 1.4)+ (-2)×(- 1)+( - 1)×(- 0.7) + 0×0.1+ 1×0.5+2×0.9+3×1.6=14, - 14 ^ ∑ i=1 ?ti- t ??yi- y ? b= =28=0.5, 7 2 ∑ =1 ?ti- t ? i
7

7

^ ^=- a y -b t =4.3-0.5×4=2.3, 所求回归方程为^ y=0.5t+2.3.

^ (2)由(1)知,b=0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收 入逐年增加,平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得 ^ y=0.5×9+2.3=6.8, 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.


网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com