9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 数学 >>

高中数学(人教版)选修2-3教学设计:3.2 回归分析(1)

高中数学(人教版)选修2-3教学设计:3.2 回归分析(1)


普通高中课程标准实验教科书—数学选修 2-3[苏教版]

§3.2 回归分析(1)
教学目标 (1)通过实例引入线性回归模型,感受产生随机误差的原因; (2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点 线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境 1. 情境:对一作直线运动的质点的运动过程观测了 8 次,得到如下表所示的数据,试估计 当 x=9时的位置 y 的值. 时刻 x /s 位置观测值 y /cm

1 5.54

2 7.52

3 10.02

4 11.73

5 15.69

6 16.12

7 16.98

8 21.06

根据《数学 3 (必修) 》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示: 从散点图中可以看出,样本点 呈直线趋势,时间 x 与位置观测值 y 之间有着较好的线性关系.因此 可以用线性回归方程来刻画它们之 间的关系.根据线性回归的系数公
n ? xi yi ? nx y ? ? i ?1 ? ?b ? n 式, ? xi2 ? n( x)2 ? ? i ?1 ? ? ?a ? y ? bx

可以得到线性回归方为 ? y ? 3.5361? 2.1214x ,所以当 x ? 9 时,由线性回归方程可以 估计其位置值为 ? y ? 22.6287 2.问题:在时刻 x ? 9 时,质点的运动位置一定是 22.6287cm 吗? 二.学生活动 思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映 x 与 y 之 间的关系, y 的值不能由 x 完全确定,它们之间是统计相关关系, y 的实际值与估计值 -1-

之间存在着误差. 三.建构数学 1.线性回归模型的定义: 我们将用于估计 y 值的线性函数 a ? bx 作为确定性函数;

y 的实际值与估计值之间的误差记为 ? ,称之为随机误差;
将 y ? a ? bx ? ? 称为线性回归模型. 说明: (1)产生随机误差的主要原因有: ①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差. (2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决) ; ②在模型合理的情况下,如何估计 a , b ? 2.探求线性回归系数的最佳估计值: 对于问题②,设有 n 对观测数据 ( xi , yi ) (i ? 1, 2,3,?, n) ,根据线性回归模型,对 于每一个 xi ,对应的随机误差项 ? i ? yi ? (a ? bxi ) ,我们希望总误差越小越好,即要使

??
i ?1

n

2 i

越小越好.所以,只要求出使 Q(? , ? ) ?

?( y ? ? x ??)
i ?1 i i

n

2

取得最小值时的 ? ,

? ,b ?. ? 值作为 a , b 的估计值,记为 a
注:这里的 ? i 就是拟合直线上的点 ? xi , a ? bxi ? 到点 P i ? xi , yi ? 的距离.

? ,b ?? 用什么方法求 a
回忆《数学 3(必修) 》 “2.4 线性回归方程”P71“热茶问题”中求 a , b 的方法: 最小二乘法.

? ,b ? 的计算公式为 利用最小二乘法可以得到 a
n n ? ( x ? x )( y ? y ) xi yi ? nx y ? ? i i ? i ?1 i ?1 ? ? ? n ?b ? n 2 ? ( xi ? x) xi2 ? n( x) 2 , ? ? ? i ?1 i ?1 ?? ? ? ?a ? y ? bx

-2-

其中 x ?

1 n 1 n xi , y ? ? yi ? n i ?1 n i ?1

? ? bx ? 就称为这 n 对数据的回归直线,此直线方程即为线性回 由此得到的直线 ? y?a
? ,b ? 分别为 a , b 的估计值, a ? 称为回归截距, b ? 称为回归系数, ? 归方程.其中 a y称
为回归值.

? ? 3.5361 , b ? ? 2.1214 . 在前面质点运动的线性回归方程 ? y ? 3.5361 ? 2.1214x 中, a

? ,b ? 的意义是:以 a ? 为基数, x 每增加 1 个单位, y 相应 ? ? bx ? 中a 3. 线性回归方程 ? y?a ? 个单位; 地平均增加 b
4. 化归思想(转化思想) 在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业 知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为 线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化 为线性回归方程的换元公式. (1) y ? a ?
b

b 1 ,令 y ' ? y , x ' ? ,则有 y ' ? a ? bx ' . x x

(2) y ? ax ,令 y ' ? ln y , x ' ? ln x , a ' ? ln a ,则有 y ' ? a '? bx ' .
bx (3) y ? ae ,令 y ' ? ln y , x ' ? x , a ' ? ln a ,则有 y ' ? a '? bx ' .
b x

(4) y ? ae ,令 y ' ? ln y , x ' ?

1 , a ' ? ln a ,则有 y ' ? a '? bx ' . x

(5) y ? a ? b ln x ,令 y ' ? y , x ' ? ln x ,则有 y ' ? a ? bx ' . 四.数学运用 1.例题: 例 1 .下表给出了我国从 1949 年至 1999 年人口数据资料,试根据表中数据估计我国 2004 年的人口数.

1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999 人口数/百万 542 603 672 705 807 909 975 1035 1107 1177 1246
年份 解:为了简化数据,先将年份减去 1949 ,并将所得值用 x 表示,对应人口数用 y 表示, -3-

得到下面的数据表:

x
y

0 542

5 603

10 672

15 705

20 807

25 909

30 975

35 40 45 50 1035 1107 1177 1246

作出 11 个点 ? x, y ? 构成的散点图, 由图可知,这些点在一条直线附近,可以用线性回归模型 y ? a ? bx ? ? 来表示它们之 间的关系. 根据公式(1)可得

? ? ?b ? 14.453, ? ? ? ?a ? 527.591.

?, b ? 分别为 a , b 的估 这里的 a
计值,因此线性回归方程 为? y ? 527.591 ?14.453x 由 于 2004 年 对 应 的 x ? 55 , 代 入 线 性 回 归 方 程 ? y ? 527.591 ?14.453x 可 得

? y ? 1 3 2 2 . 5(百万) 0 6 ,即 2004 年的人口总数估计为 13.23 亿.
例 2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的 人均资本 x (万元)与人均产出 y (万元)的数据: 人均 资本 x /万元 人均 产出 y /万元

3

4

5.5

6.5

7

8

9

10.5

11.5

14

4.12

4.67

8.68

11.01

13.04
b

14.43

17.50

25.46

26.66

45.20

(1)设 y 与 x 之间具有近似关系 y ? ax ( a , b 为常数) ,试根据表中数据估计 a 和 b 的 值; (2)估计企业人均资本为 16 万元时的人均产出(精确到 0.01 ) . y 分析:根据 x , 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归 方程处理.但由对数运算的性质可知,只要对 y ? ax 的两边取对数,就能将其转化为
b

线性关系.
b 解(1)在 y ? ax 的两边取常用对数,可得 lg y ? lg a ? b lg x ,设 lg y ? z , lg a ? A ,

-4-

lg x ? X ,则 z ? A ? bX .相关数据计算如图 3 ? 2 ? 7 所示.
A
1 2 3 4
人均资本

B
3 4.12
0.47712

C
4 4.67
0.60206

D
5.5 8.68
0.74036

E
6.5 11.01
0.81291

F
7 13.04
0.8451

G
8 14.43
0.90309

H
9 17.5
0.95424

I
10.5 25.46
1.02119

J
11.5 26.66
1.0607

K
14 45.2
1.14613

x /万元
人均产出

y /万元

X ? lg x

z ? lg y

0.6149

0.66932

0.93852

1.04179

1.11528

1.15927

1.24304

1.40586

1.42586

1.65514

? 分别为 仿照问题情境可得 A , b 的估计值 ? A ,b ?

? A ? ?0.2155, ?? ? ? ?0.2155 可得 由 lg a ? ? ?b ? 1.5677,

? ? 0.6088 ,即 a , b 的估计值分别为 0.6088 和 1.5677 . a
5 .6 7 7 (2)由 (1)知 ? y ?0 .6 0 8 8 x1

.样本数据及回归曲线的图形如图 3 ? 2 ? 8(见书本 P 102

页) 当 x ? 16 时, ? ,故当企业人均资本为 16 万元时, y ? 0.6088?161.5677 ? 47.01(万元) 人均产值约为 47.01 万元. 2.练习: P 104 练习第 1 题. 五.回顾小结: 1. 线性回归模型 y ? a ? bx ? ? 与确定性函数 y ? a ? bx 相比,它表示 y 与 x 之间是统计相 关关系(非确定性关系)其中的随机误差 ? 提供了选择模型的准则以及在模型合理的情

? ,b ? 的工具; 况下探求最佳估计值 a ? ,b ? 的意义是:以 a ? 为基数, x 每增加 1 个单位, y 相应 ? ? bx ? 中a 2. 线性回归方程 ? y?a ? 个单位; 地平均增加 b
3.求线性回归方程的基本步骤. 六.课外作业: P 106 第 2 题. -5-


推荐相关:
网站首页 | 网站地图
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com