9299.net
大学生考试网 让学习变简单
当前位置:首页 >> >>

突破2019年高考+数学总复习+第十章算法初步抽样概率统计——备考基础查清+热点命题悟通(学生版)

突破2019年高考+数学总复习+第十章算法初步抽样概率统计——备考基础查清+热点命题悟通(学生版)

第十章

算法初步、抽样、统计、概率案例

高考分值比例 17 分左右, 算法初步即为 程序框图简单,高考必拿 5 分,统计概率, 题型简单固定高考易拿分。但是概率中的几 何概型以及抽样中线性回归直线方程、 2*2 列联表计算量较大,需要花费时间计算,高 考难易难度基础偏中等。本教案主要内容: 备考基础查清+热点命题悟通。 下面内容是 必记知识点+必明易错点+必会方法 目录:
第十章 算法初步、抽样、统计、概率案例 第一节算法与程序框图-------------------------------------------------2 第二节随机抽样-------------------------------------------------------9 第三节用样本估计总体------------------------------------------------14

页 页 页 页

第四节变量间的相关关系、统计案例-------------------------------------20

1

第十章 算法初步、统计、统计案例

第一节

算法与程序框图

1.算法与程序框图 (1)算法的定义: 算法是指按照一定规则解决某一类问题的明确和有限的步骤. (2)程序框图: ①程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形. ②程序框图通常由程序框和流程线组成. ③基本的程序框有终端框(起止框)、输入、输出框、处理框(执行框)、判断框. (3)三种基本逻辑结构: 名称 内容 顺序结构 由若干个依次执行 定义 的步骤组成的,这 是任何一个算法都 离不开的基本结构 条件结构 算法的流程根据条件是否 成立有不同的流向,条件结 构就是处理这种过程的结 构 循环结构 从某处开始,按照一定的 条件反复执行某些步骤的 情况,反复执行的步骤称 为循环体

程序框图

2.基本算法语句 (1)输入、输出、赋值语句的格式与功能:

2

语句 输入 语句 输出 语句 赋值 语句

一般格式 INPUT“提示内容”;变量

功能 输入信息

PRINT“提示内容”;表达式

输出常量、变量的值和系统信息

变量=表达式

将表达式所代表的值赋给变量

(2)条件语句的格式及框图: ①IF-THEN 格式:

②IF-THEN-ELSE 格式:

(3)循环语句的格式及框图: ①UNTIL 语句:

②WHILE 语句:

1.易混淆处理框与输入框,处理框主要是赋值、计算,而输入框只是表示一个算法输入 的信息. 2.易忽视循环结构中必有条件结构,其作用是控制循环进程,避免进入“死循环”,是 循环结构必不可少的一部分. 3.易混淆当型循环与直到型循环.
3

直到型循环是“先循环,后判断,条件满足时终止循环”;而当型循环则是“先判断, 后循环,条件满足时执行循环”;两者的判断框内的条件表述在解决同一问题时是不同的, 它们恰好相反. [试一试] 1.执行如图所示的程序框图,若输入 x=2,则输出 y 的值为( )

A.5 C.14

B.9 D.41

2.如图是一个算法流程图,则输出的 k 的值是________

识别程序框图运行和完善程序框图的步骤 识别运行程序框图和完善程序框图是高考的热点.解答这一类问题,第一,要明确程序 框图的顺序结构、条件结构和循环结构;第二,要识别运行程序框图,理解框图所解决的实 际问题; 第三, 按照题目的要求完成解答. 对程序框图的考查常与数列和函数等知识相结合, 进一步强化框图问题的实际背景. [练一练] 1.(2014· 深圳调研)若执行图中的框图,输入 N=13,则输出的数等于________.

4

2. 运行如图所示的程序框图, 若输出的结果是 62, 则判断框中整数 M 的值是________.

考点一

算法的基本结构

1.(2013· 新课标卷Ⅰ)执行右面的程序框图,如果输入的 t∈[- 1,3],则输出的 s 属于( A.[-3,4] B.[-5,2] C.[-4,3] D.[-2,5] )

2.(2013· 安徽高考)如图所示,程序框图(算法流程图)的输出结果为(

)

5

3 A. 4 11 C. 12

1 B. 6 25 D. 24

3.(2013· 南昌模拟)若如下框图所给的程序运行结果为 S=20,那么判断框中应填入的关 于 k 的条件是( )

A.k=9? C.k<8?

B.k≤8? D.k>8?

[类题通法] 1.解决程序框图问题要注意几个常用变量: (1)计数变量:用来记录某个事件发生的次数,如 i=i+1. (2)累加变量:用来计算数据之和,如 S=S+i. (3)累乘变量:用来计算数据之积,如 p=p×i. 2.处理循环结构的框图问题,关键是理解并认清终止循环结构的条件及循环次数. 考点二 算法的交汇性问题

算法是高考热点内容之一,算法的交汇性问题是新课标高考的一大亮点,归纳起来常见 的命题角度有: ?1?与统计的交汇问题; ?2?与函数的交汇问题; ?3?与概率的交汇问题. 角度一 与统计的交汇问题 1.(2013· 荆州模拟)图(1)是某高三学生进入高中三年来的数学考试成绩茎叶图,第 1 次

6

到第 14 次的考试成绩依次记为 A1,A2,…,A14.图(2)是统计茎叶图中成绩在一定范围内考试 次数的一个算法流程图.那么算法流程图输出的结果是( )

A.7 C.9

B.8 D.10

角度二 与函数的交汇问题 2.(2014· 北京海淀模拟)执行如图所示的程序框图,输出的 k 值是( )

A.4 C.6

B.5 D.7

角度三 与概率的交汇问题 3.(2013· 洛阳统考)执行如图所示的程序框图,任意输入一次 x(0≤x≤1)与 y(0≤y≤1), 则能输出数对(x,y)的概率为( )

7

1 A. 4 2 C. 3

1 B. 3 3 D. 4

[类题通法] 解决算法的交汇性问题的方法 (1)读懂程序框图、明确交汇知识; (2)根据给出问题与程序框图处理问题; (3)注意框图中结构的判断. 考点三 基本算法语句 )

[典例] (2014· 东北三校模拟)下面程序运行的结果为( n=10 S=100 DO S=S-n n=n-1 LOOP UNTIL S<=70 PRINT n END A.4 C.6 B.5 D.7

[类题通法] 1.输入语句、输出语句和赋值语句基本对应于算法的顺序结构. 2.在循环语句中也可以嵌套条件语句,甚至是循环语句,此时需要注意嵌套格式,这些 语句需要保证算法的完整性,否则就会造成程序无法执行. [针对训练]

8

运行下面的程序时,WHILE 循环语句的执行次数是( N=0 WHILE N<20 N=N+1 N=N*N WEND PRINT N END A.3 C.15 B.4 D.19

)

第二节

随机抽样

1.简单随机抽样 (1)抽取方式:逐个不放回抽取; (2)每个个体被抽到的概率相等; (3)常用方法:抽签法和随机数法. 2.系统抽样的步骤 假设要从容量为 N 的总体中抽取容量为 n 的样本. (1)先将总体的 N 个个体编号; N N (2)确定分段间隔 k,对编号进行分段.当 (n 是样本容量)是整数时,取 k= ; n n (3)在第 1 段用简单随机抽样确定第一个个体编号 l(l≤k); (4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l+k,再加 k 得到第 3 个个体编号 l+2k,依次进行下去,直到获取整个样本. 3.分层抽样 (1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

9

(2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样.

1.简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到 的概率相等. N 2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当 不是整数时,注意剔除, n 剔除的个体是随机的,各段入样的个体编号成等差数列. 样本容量n 3.分层抽样中,易忽视每层抽取的个体的比例是相同的,即 . 总体个数N [试一试] 1.下列抽取样本的方式是简单随机抽样的有( ①从无限多个个体中抽取 50 个个体作为样本; ②箱子里有 100 支铅笔,今从中选取 10 支进行检验.在抽样操作时,从中任意拿出一支 检测后再放回箱子里; ③从 50 个个体中一次性抽取 5 个个体作为样本. A.0 个 C.2 个 B.1 个 D.3 个 )

2.用系统抽样法(按等距离的规则)要从 160 名学生中抽取容量为 20 的样本,将 160 名 学生从 1~160 编号.按编号顺序平均分成 20 组(1~8 号,9~16 号,…,153~160 号),若 第 16 组应抽出的号码为 125,则第一组中按此抽签方法确定的号码是( A.7 C.4 B.5 D.3 )

3.某社区有 500 个家庭,其中高收入家庭 125 户,中等收入家庭 280 户,低收入家庭 95 户.为了调查社会购买力的某项指标,采用分层抽样的方法从中抽取一个容量为若干户的 样本,若从高收入家庭中抽取了 25 户,则低收入家庭被抽取的户数为________.

1.系统抽样的步骤 (1)先将总体的 N 个个体编号; N N (2)确定分段间隔 k(k∈N*),对编号进行分段.当 (n 是样本容量)是整数时,取 k= ; n n (3)在第 1 段用简单随机抽样确定第 1 个个体编号 l(l≤k);
10

(4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号(l+k),再加上 k 得到第 3 个个体编号(l+2k),依次进行下去,直到获取整个样本. 2.分层抽样的步骤 (1)分层:按某种特征将总体分成若干部分; (2)按比例确定每层抽取个体的个数; (3)各层分别按简单随机抽样或系统抽样的方法抽取个体; (4)综合每层抽样,组成样本. [练一练] 1.(2014· 中山模拟)为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为 1 到 50 的袋装奶粉中抽取 5 袋进行检验, 用每部分选取的号码间隔一样的系统抽样方法确定所 选取的 5 袋奶粉的编号可能是( A.5,10,15,20,25 C.1,2,3,4,5 ) B.2,4,8,16,32 D.7,17,27,37,47

2.(2013· 广州调研)某市 A,B,C,D 四所中学报名参加某高校今年自主招生的学生人 数如下表所示: 中学 人数 A 30 B 40 C 20 D 10

为了了解参加考试的学生的学习状况,该高校采用分层抽样的方法从报名参加考试的四 所中学的学生当中随机抽取 50 名参加问卷调查,则 A,B,C,D 四所中学,抽取学生数分 别是多少名( ) B.15,20,10,5 D.3,4,2,1

A.10,20,15,5 C.10,15,20,5

考点一

简单随机抽样

1.(2014· 河北省冀州中学期末)某公司在甲、乙、丙、丁四个地区分别有 150,120,180,150 个销售点. 公司为了调查产品销售情况, 需从这 600 个销售点中抽取一个容量为 100 的样本, 记这项调查为①; 在丙地区有 20 个大型销售点, 要从中抽取 7 个调查其销售收入和售后服务 等情况,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法
11

)

D.简单随机抽样法,分层抽样法

2.(2013· 江西高考)总体由编号为 01,02,…,19,20 的 20 个个体组成.利用下面的随机 数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次 选取两个数字,则选出来的第 5 个个体的编号为( )

7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 C.02 [类题通法] 抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况. 考点二 系统抽样 B.07 D.01

[典例] (2013· 陕西高考)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调 查,将 840 人按 1,2,…,840 随机编号,则抽取的 42 人中,编号落入区间[481,720]的人数 为( ) A.11 C.13 B.12 D.14

在本例条件下,若第三组抽得的号码为 44,则在第八组中抽得号码为多少?

解:在第八组中抽得的号码为(8-3)×20+44=144. [类题通法] 1.当总体容量较大,样本容量也较大时,可用系统抽样法. 2.在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,这时可以先从总 体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除. [针对训练] 从 2 007 名学生中选取 50 名学生参加全国数学联赛,若采用下面的方法选取:先用简单 随机抽样从 2 007 人中剔除 7 人, 剩下的 2 000 人再按系统抽样的方法抽取, 则每人入选的概 率( ) A.不全相等 C.都相等,且为 50 2 007 B.均不相等 D.都相等,且为 1 40

12

考点三

分层抽样

[典例] (1)(2013· 湖南高考)某学校有男、女学生各 500 名.为了解男、女学生在学习兴 趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取 100 名学生进行调查,则宜采用 的抽样方法是( A.抽签法 C.系统抽样法 ) B.随机数法 D.分层抽样法

(2)(2014· 抚顺模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类 分别有 40 种、10 种、30 种、20 种,现从中抽取一个容量为 20 的样本进行食品安全检测.若 采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( A.4 C.6 B.5 D.7 )

[类题通法] 进行分层抽样时的注意事项 (1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要 小,两层之间的样本差异要大,且互不重叠. (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同. (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. [针对训练] 某报社做了一次关于“什么是新时代的雷锋精神”的调查,在 A,B,C,D 四个单位回 收的问卷数依次成等差数列,且共回收 1 000 份,因报道需要,再从回收的问卷中按单位分 层抽取容量为 150 的样本,若在 B 单位抽取 30 份,则在 D 单位抽取的问卷是________份.

第三节

用样本估计总体

13

1.频率分布直方图 (1)作频率分布直方图的步骤: ①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图. (2)频率分布折线图和总体密度曲线: ①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线 图. ②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率 折线图会越来越接近于一条光滑曲线,即总体密度曲线. 2.茎叶图 用茎叶图表示数据有两个突出的优点: 一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; 二是茎叶图可以随时记录,方便记录与表示. 3.样本的数字特征 数字特征 众数 定 义

在一组数据中,出现次数最多的数据叫做这组数据的众数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数

中位数

据的平均数)叫做这组数据的中位数 在频率分布直方图中,中位数左边和右边的直方图的面积相等

平均数

1 样本数据的算术平均数.即 x = (x1+x2+…+xn) n 1 s2= [(x1- x )2+(x2- x )2+…+(xn- x )2] n 其中 s 为标准差

方差

1.易把直方图与条形图混淆: 两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机 变量,连续随机变量在某一点上是没有频率的.

14

频率 2.易忽视频率分布直方图中纵轴表示的应为 . 组距 3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混 淆茎叶图中茎与叶的含义. [试一试] 1.为了解一片大约一万株树木的生长情况,随机测量了其中 100 株树木的底部周长(单 位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周 长小于 110 cm 的株数大约是( )

A.3 000 C.7 000

B.6 000 D.8 000

2.某同学进入高三后,4 次月考的数学成绩的茎叶图如图.则该同学 数学成绩的方差是 ( ) 11 s12 A.125 C.45 B.5 5 D.3 5 13

4 6 2 8

利用频率分布直方图求众数、中位数与平均数 利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率 分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘 以小长方形底边中点的横坐标之和. [练一练] 15 16 5 1 5 3 7 3 8 5

15

1.如图是根据某校 10 位高一同学的身高(单位:cm)画出的

17

1

2

茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表 示学生身高的个位数字,从图中可以得到这 10 位同学身高的中位数是( A.161 C.163 B.162 D.164 )

2.为了了解某校今年准备报考飞行员的学生的体重情况,将所 得的数据整理后,画出了频率分布直方图(如图),已知图中从左到 右的前 3 个小组的频率之比为 1∶2∶3,第 2 小组的频数为 12,则 报考飞行员的学生人数是________.

考点一

频率分布直方图

1.(2014· 滨州模拟)在样本的频率分布直方图中,共有 11 个小长方形,若中间一个小长 1 方形的面积等于其他 10 个小长方形的面积和的 ,且样本容量为 160,则中间一组的频数为 4 ( A.32 C.40 B.0.2 D.0.25 )

2.(2013· 辽宁高考)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的 分组依次为:[20,40),[40,60),[60,80),[80,100].若低于 60 分的人数是 15,则该班的学生 人数是( )

A.45 C.55

B.50 D.60

3.(2013· 湖北高考)从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 至 350 度之间,频率分布直方图如图所示.
16

(1)直方图中 x 的值为________; (2)在这些用户中,用电量落在区间[100,250)内的户数为________.

[类题通法] 在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于这一 组的频率,所有小矩形的面积之和为 1. 考点二 [典例] 茎叶图

(2013· 重庆高考)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试

中的成绩(单位:分).已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x,y 的值 分别为( ) 甲组 9 X 7 A.2,5 C.5,8 2 4 0 1 2 乙组 9 5 4 B.5,5 D.8,8 y 8

在本例条件下:(1)求乙组数据的中位数、众数; (2)求乙组数据的方差.

[类题通法] 茎叶图的优缺点 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率 分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便 于记录和表示.其缺点是当样本容量较大时,作图较繁琐.
17

[针对训练] (2013· 合肥模拟)一次数学测验后,从甲、乙两班各抽取 9 名同学的成绩进行统计分析, 绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( 甲 8 7 6 7 3 A.8 C.4 3 2 2 7 7 8 9 10 B .5 D.2 2 1 5 9 乙 5 3 6 9 8 )

考点三

样本数字特征

[典例] (2013· 江苏高考)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结 果如下: 运动员 甲 乙 第一次 87 89 第二次 91 90 第三次 90 91 第四次 89 88 第五次 93 92

则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.

[类题通法] 1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际 应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况. 2. 若给出图形, 一方面可以由图形得到相应的样本数据, 再计算平均数、 方差(标准差); 另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据 的波动性大小比较方差(标准差)的大小. [针对训练] (2014· 济南模拟)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况, 从两块地各随机抽取了 10 株树苗, 用茎叶图表示上述两组数据, 对两块地抽取树苗的高度的 平均数 x 甲、 x 乙和中位数 y 甲、y 乙进行比较,下面结论正确的是( ) 甲 乙

18

9 9 5 3 7 1 3 0 2 1

1 2 3 4

0 6 0 4 0 6 4 6 7 7

A. x 甲> x 乙,y 甲>y 乙 C. x 甲< x 乙,y 甲>y 乙

B. x 甲< x 乙,y 甲<y 乙 D. x 甲> x 乙,y 甲<y 乙

19

第四节

变量间的相关关系、统计案例

1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系 不同,相关关系是一种非确定性关系. (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为 正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近, 称两个变量之间具有线性相关关系,这条直线叫回归直线.

^ ^ ^ ^ (2)回归方程为y=bx+a,其中b=

i=1

?xiyi-n x ?x2 i -n x
n 2

n

y ^ ^ ,a= y -b x .

i=1

2 (3)通过求Q=? ?yi-bxi-a? 的最小值而得出回归直线的方法,即求回归直线,使得样 i=1

n

本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法. (4)相关系数: 当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0 时,表 明两个变量之间几乎不存在线性相关关系.通常|r|大于 0.75 时,认为两个变量有很强的线性 相关性. 3.独立性检验 假设有两个分类变量 X 和 Y, 它们的取值分别为{x1, x2}和{y1, y2}, 其样本频数列联表(称 为 2×2 列联表)为: y1 x1 x2 a c y2 b d 总计 a+b c+d

20

总计

a+c

b+d

a+b+c+d

n?ad-bc?2 K2= (其中 n=a+b+c+d 为样本容量). ?a+b??a+c??b+d??c+d?

1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系 是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是 伴随关系. 2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过 ( x , y )点, 可能所有的样本数据点都不在直线上. 3. 利用回归方程分析问题时, 所得的数据易误认为准确值, 而实质上是预测值(期望值). [试一试] 1.(2013· 石家庄调研)下列结论正确的是( ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系; ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A.①② C.①②④ B.①②③ D.①②③④ )

2.已知 x,y 之间的数据如表所示,则回归直线过点( x y A.(0,0) C.(3,2.5) 1 1.2 2 1.8 3 2.5 4 3.2

) 5 3.8

B.(2,1.8) D.(4,3.2)

1.求回归直线方程的步骤 (1)依据样本数据画出散点图,确定两个变量具有线性相关关系; (2)计算出 x , y , ?x2 i , ?xiyi 的值;
i=1 i=1 n n

^ ^ (3)计算回归系数a,b; ^ ^ ^ (4)写出回归直线方程y=bx+a. 2.独立性检验的一般步骤
21

(1)根据样本数据制成 2×2 列联表; n?ad-bc?2 (2)根据公式 K2= 计算 K2 的值; ?a+b??a+d??a+c??b+d? (3)查表比较 K2 与临界值的大小关系,作统计判断. [练一练] 1. 在研究吸烟与患肺癌的关系中, 通过收集数据、 整理分析数据得“吸烟与患肺癌有关” 的结论,并且在犯错误概率不超过 0.01 的前提下认为这个结论是成立的,则下列说法中正确 的是( )

A.100 个吸烟者中至少有 99 人患有肺癌 B.1 个人吸烟,那么这人有 99%的概率患有肺癌 C.在 100 个吸烟者中一定有患肺癌的人 D.在 100 个吸烟者中可能一个患肺癌的人也没有

2.在 2012 伦敦奥运会期间,某网站针对性别是否与看奥运会直播有关进行了一项问卷 调查,得出如下表格: 性别 是否看奥运会直播 看奥运会直播 不看奥运会直播 n?ad-bc?2 (附:K = ),则 K2=( ?a+b??c+d??a+c??b+d?
2





6 000 2 000 )

2 000 2 000

A.700 C.800

B.750 D.850

考点一

相关关系的判断

1.对变量 x,y 有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量 u,v 有观测 数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )

22

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关

2.已知变量 x,y 呈线性相关关系,线性回归方程为 y=0.5+2x,则变量 x,y 是( A.线性正相关关系 B.由回归方程无法判断其正负相关 C.线性负相关关系 D.不存在线性相关关系

)

3.(2014· 镇江模拟)如图所示,有 A,B,C,D,E,5 组数据,去掉________组数据后, 剩下的 4 组数据具有较强的线性相关关系.

[类题通法] 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量 有一定的线性相关性, 若呈曲线型也是有相关性, 若呈图形区域且分布较乱则不具备相关性. 考点二 [典例] 回归方程的求法及回归分析

某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气

象局与某医院抄录了 1 到 6 月份每月 10 号的昼夜温差情况与因患感冒而就诊的人数, 得到如 下资料: 日期 昼夜温 差 x(℃) 就诊人 数 y(个) 1 月 10 日 10 2 月 10 日 11 3 月 10 日 13 4 月 10 日 12 5 月 10 日 8 6 月 10 日 6

22

25

29

26

16

12

该兴趣小组确定的研究方案是:先从这 6 组数据中选取 2 组,用剩下的 4 组数据求线性 回归方程,再用选取的 2 组数据进行检验. (1)若选取的是 1 月与 6 月的 2 组数据,请根据 2 至 5 月份的数据,求出 y 关于 x 的线性
23

^ ^ ^ 回归方程y=bx+a; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2,则认为得 到的线性回归方程是理想的,试求该小组所得的线性回归方程是否理想?

在本例(1)条件下,试预测昼夜温差为 5℃时,因感冒而就诊的人数约为多少?

[类题通法] 利用线性回归方程可以对总体进行预测估计,线性回归方程将部分观测值所反映的规律 进行延伸,是我们对有线性相关关系的两个变量进行分析和控制的依据,依据自变量的取值 估计和预测因变量的值,在现实生活中有广泛的应用. [针对训练] ^ (2013· 大连模拟 ) 已知下列表格所示数据的回归直线方程为 y = 3.8x + a ,则 a 的值为 ________. x y 2 251 3 254 4 257 5 262 6 266

考点三

独立性检验

[典例] (2013· 福建高考)某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工 人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取 了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组, 再将两组工人的日平均生产件数分成 5 组: [50,60),
24

[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.

(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周 岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列 联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”? P(χ2≥k) k n?n11n22-n12n21?2 附:χ2= n1+n2+n+1n+2 n?ad-bc? ?注:此公式也可以写成K2= ? ? ? ?a+b??c+d??a+c??b+d?? ?
2

0.100 2.706

0.050 3.841

0.010 6.635

0.001 10.828

[类题通法] 1.在 2×2 列联表中,如果两个变量没有关系,则应满足 ad-bc≈0.|ad-bc|越小,说明 两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强. 2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论. [针对训练] 2012 年欧洲杯期间, 某一电视台对年龄高于 40 岁和不高于 40 岁的人是否喜欢西班牙队
25

进行调查,40 岁以上调查了 50 人,不高于 40 岁调查了 50 人,所得数据制成如下列联表: 不喜欢西班牙队 40 岁以上 不高于 40 岁 总计 p 15 a 喜欢西班牙队 Q 35 B 总计 50 50 100

3 已知工作人员从所有统计结果中任取一个, 取到喜欢西班牙队的人的概率为 , 则有超过 5 ________的把握认为年龄与西班牙队的被喜欢程度有关. n?ad-bc?2 附:K2= ?a+b??c+d??a+c??b+d? P(K2≥k) k 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828

26


网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com