9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 数学 >>

高中数学第三章统计案例3.1回归分析的基本思想及其初步应用第2课时线性回归分析课件新人教A版选修23_图文

高中数学第三章统计案例3.1回归分析的基本思想及其初步应用第2课时线性回归分析课件新人教A版选修23_图文

第三章

统计案例

3.1

回归分析的基本思想 及其初步应用

第 2 课时

线性回归分析

[学习目标]

1.了解残差平方和、 相关指数 R2 的概念 3.会用残差 4.

(重点). 2.了解回归分析的基本步骤(难点)

平方和与相关指数对回归模型拟合度进行评判(重点) 了解简单的非线性回归分析方法(难点).

1.残差 对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的 随机误差 ei=yi-bxi-a,i=1,2,…,n,其估计值为 ^ ^ ^ ^ ei=yi- y i=yi- b xi- a , e i 称为相应于点(xi,yi)的残差.

2.残差图及相关指数 (1)残差图:我们可以利用图形来分析残差特征,作 图时纵坐标为残差,横坐标可以选为样本编号,或解释 变量或预报变量等,这样作出的图形称为残差图.

(2)相关指数:计算公式是 R2=___________.其中残

R2 越大说明残差平方和越小,也就是说模型的拟合 效果越好,R2 表示解释变量对于预报变量变化的贡献率, R2 越接近于 1,表示回归的效果越好.

温馨提示

相关指数的计算公式中, 分子是残差平方

和,分母是总偏差平方和,计算时不要弄错,同时要清楚 R2 的大小与拟合效果的关系.

1.思考判断(正确的打“√”,错误的打“×”). (1)在残差图中,纵坐标为残差,横坐标可以作为样 本编号.( )

(2)在残差图中,残差点分布的带形区域越窄,则拟 合效果越好.( )

(3)残差平方和越大,则 R2 越小,模型拟合效果越 差.( )

解析: 根据残差分析的概念知, 这三个说法都是正确 的. 答案: (1)√ (2)√ (3)√

2.下列数据符合的函数模型为(

)

x 1

2

3

4

5

6

7

8

9

10

y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3 1 A.y=2+ x 3 1 C.y=2ex B.y=2ex D.y=2+ln x

解析: 分别将 x 值代入解析式判断知满足 y=2+ln x. 答案:D

3.甲、乙、丙、丁四位学生在建立变量 x,y 的回归 模型时,分别选择了 4 种不同模型,它们的相关指数 R2 如下表: 学生 R2 甲 乙 丙 丁

0.98 0.78 0.50 0.85

四位学生中建立的回归模型拟合效果最好的是 ( ) A.甲 B.乙 C.丙 D.丁

解析:相关指数 R2 越大,表示回归模型的拟合效果 越好. 答案:A

4. 若一个样本的总偏差平方和为 80,残差平方和为 60,则相关指数 R2 为________ . 解析: 回归平方和=总偏差平方和-残差平方和=80 20 60 2 -60=20,故 R = =0.25 或 R =1- =0.25. 80 80
2

答案:0.25

5.在研究两个变量的相关关系时,观察散点图发现 样本点集中于某一条指数曲线 y=ebx+a 的周围,令^ z =ln y,求得回归直线方程为 ^ z =0.25x-2.58,则该模型的回 归方程为__________________. ^ ^ 解析:因为 z =0.25x-2.58, z =ln y,所以 y=e0.25x
-2.58.

答案:y=e0.25x-2.58

类型 1 线性回归分析(自主研析) [典例 1] 为研究重量 x(单位: 克)对弹簧长度 y(单位:

厘米)的影响,对不同重量的 6 个物体进行测量,数据如 下表所示:

x y

5 7.25

10 8.12

15 8.95

20 9.90

25 10.9

30 11.8

(1)作出散点图,并求线性回归方程; (2)求相关指数 R2,并判断模型的拟合效果; (3)进行残差分析.

解:(1)散点图如图所示:

— =1×(5+10+15+20+25+30)=17.5, x 6 — = 1 × (7.25 + 8.12 + 8.95 + 9.90 + 10.9 + y 6
11.8)≈9.487,

0.013 18 所以 R =1- ≈0.999 1, 14.678 4
2

所以回归模型的拟合效果较好.

(3)由表中数据可以看出残差点比较均匀地落在不超 过 0.15 的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高, 由以上分析可知, 弹簧长度与拉力成线 性关系. 由残差表中的数值可以看出第 3 个样本点的残差 比较大, 需要确认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型.

[迁移探究 1] 差图.

在典例 1 条件不变的情况下,画出残

解:如图所示.

[迁移探究 2] 计 y 的值.

在典例 1 的条件下,当 x=35 时,估

解:当 x=35 时,y=6.285+0.183×35=12.69.

归纳升华 解决线性回归分析问题的一般方法和步骤 1.作散点图,或计算相关系数,判断两个变量之间 的线性相关关系. 2.列表计算,求线性回归方程.

3.计算相关指数 R2,或进行残差分析,作残差图, 判断模型拟合效果. 4.做出预报.

类型 2 非线性回归分析 [典例 2]
x 21

下表为收集到的一组数据:
23 25 27 29 32 35

y

7

11

21

24

66

115

325

(1)作出 x 与 y 的散点图,并猜测 x 与 y 之间的关系; (2)建立 x 与 y 的关系,预报回归模型并计算残差; (3)利用所得模型,预报 x=40 时 y 的值.

解:(1)作出散点图如图所示,从散点图可以看出 x 与 y 不具有线性相关关系,根据已 有知识可以发现样本点分布在某一 条指数函数曲线 y=c1ec2x 的周围, 其中 c1,c2 为待定的参数.

(2)对两边取对数把指数关系变为线性关系,令 z=ln y,则有变换后的样本点应分布在直线 z=bx+a(a=ln c1, b=c2)的周围,这样就可以利用线性回归模型来建立非线 性回归方程了,数据可以转化为:
x 21 23 25 27 29 32 35

z

1.946 2.398 3.045 3.178 4.190 4.745 5.784

利用公式求得回归直线方程为^ z =0.272x-3.849, ^ 所以 y =e0.272x-3.849 残差:
yi 7 11 21 24 66 115 325

yi 6.443 11.101 19.125 32.950 56.770 128.381 290.325 ei 0.557 -0.101 1.875 -8.950 9.23 -13.381 34.675

(3)当 x=40 时,^ y =e0.272×40-3.849≈1 131.

归纳升华 1.非线性回归方程的求法: (1)根据原始数据(x,y)作出散点图; (2)根据散点图,选择恰当的拟合函数; (3)做恰当的变换,将其转化成线性函数,求线性回 归方程;

(4)在(3)的基础上通过相应的变换,即可得非线性回 归方程. 2.非线性相关问题常见的几种线性变换: (1)y=aebx,令 y′=ln y,x′=x,a′=ln a,则有 y′=a ′+bx′; (2)y=a+bln x,令 y′=y,x′=ln x,则有 y′=a+bx′;
(3)y=bx2+a,令 y′=y,x′=x2,则有 y′=bx′+a.

[变式训练]

以模型 y=cekx 去拟合一组数据时,为

了求出回归方程,设 z=ln y,其变换后得到线性回归方 程 z=0.3x+4,求 c 的值. 解: 因为 y=cekx, 所以两边取对数, 可得 ln y=ln(cekx) =ln c+ln ekx=ln c+kx,令 z=ln y,可得 z=ln c+kx, 因为 z=0.3x+4,所以 ln c=4,所以 c=e4.

类型 3 弄不清回归模型的类型致误(误区警示) [典例 3] 在一次抽样调查中测得样本的 5 个样本点

数值如下表所示:

x y

0.25 16

0.5 12

1 5

2 2

4 1

试建立 y 与 x 之间的回归方程.

易错提示: 本题易犯的错误是直接使用最小二乘法求 出线性回归直线方程, 实际上, 本题中的数据在散点图上 并不在某条直线附近,因此不能用线性回归模型求解.

防范措施: 只有当两变量间呈线性相关关系时, 才可 ^ ^ ^ 以求回归系数,得到回归直线方程 y = b x+ a .若两变量间 的关系不是线性相关关系, 应观察分析其散点图, 找出拟 合函数,通过变量代换再作线性回归.

[规范解答] 由数值表可作散点图如图所示: 根据散点图可知 y 与 x 近似地呈反 比例函数关系, k 1 设 y= ,令 t= ,则 y=kt, x x 原数据变为:
t y 4 16 2 12 1 5 0.5 2 0.25 1

由置换后的数值表作散点如图所示:

由散点图可以看出 y 与 t 呈近似的线性相关关系,列 表如下:

i 1 2 3 4 5

ti 4 2 1 0.5 0.25

yi 16 12 5 2 1

t iy i 64 24 5 1 0.25

t2 i 16 4 1 0.25 0.062 5

y2 i 256 144 25 4 1

∑ 7.75 36 94.25 21.312 5 430

— =7.2. 所以— = 1.55 , t y

[类题尝试]

为了研究某种细菌随时间 x 变化时,繁

殖个数 y 的变化,收集数据如下:
天数x/天 1 2 3 4 5 6

繁殖个数y/个

6

12

25

49

95

190

(1)用天数 x 作解释变量,繁殖个数 y 作预报变量, 描述解释变量 x 与预报变量 y 之间的关系; (2)计算相关指数.

解:(1)散点图如图所示:由散点图看出样本点分布 在一条指数函数 y=c1ec2x 的图象的周围, 于是令 z=ln y, 则由计数器得如下数表:

x z

1 1.79

2 2.48

3 3.22

4 3.89

5 4.55

6 5.25

由公式得:^ z =0.69x+1.115,则有^ y =e0.69x+1.115.
(2)由计数器得如下数表:

^ 6.08 12.12 24.17 48.18 96.06 191.52 y y 6 12 25 49 95 190

4.816 1 R =1- ≈0.999 8, 24 642.8
2

即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.

1.线性回归分析中拟合效果的评判问题: (1)求出线性回归模型(即线性回归直线方程)、 残差平 方和 越小,

拟合效果越好;②R2 越大(越接近于 1),拟合效果越好. (2)对于同一个问题可以有 n 个不同的拟合模型,要

分别求出各个模型的线性回归直线方程、残差平方和、 相关指数,残差平方和小的拟合效果好,相关指数大的, 拟合效果好.

2.非线性回归分析中的问题: (1)根据实验数据,画出散点图,从中观察其变化规 律,并与已知函数的图象对比,看接近于什么函数,根 据实践经验来决定选取公式的类型,所选的类型是否符 合实际,还需要通过实践来检验.有时候还需要选择不 同的模拟函数作比较.

(2)如果观察散点图,发现点的分布不呈条状分布, 而是与某种曲线相近,这时可选择这条曲线对应的函数 作为拟合函数,作恰当变换,转化为线性函数,用线性 回归模型求解. 常见的非线性回归模型: b 1 ①反比例函数 y=a+x可作变换 t=x,得 y=a+bt. ②幂函数型 y=axb(a>0)可作变换 Y=ln y, m=ln a, t=ln x,则有 Y=m+bt.

③指数型函数 y=kabx(a>0 且 a≠1,k>0),可作变 换 Y=ln y,m=ln k,则有 Y=m+(bln a)x.


网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com