9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 教育学 >>

教育统计学

教育统计学

引言 一.关于学习教育与心理统计学的几点说明 (一)确定为教育与心理统计学的依据 教育与心理统计,实际上是教育统计与心理统计的合称,如今,教育问题的研究与心理问题 的研究,关系愈益密切,对教育教学问题的深层次的微观研究,常常离不开心理学,因此, 统计方法通常运用于既包含教育问题、又包含心理问题的场合。如,考试理论研究中所运用 的因子分析, 既涉及可观察的学生学习行为结果的知识测量, 又涉及到不可观察的学生潜在 心理特质的测量。此外,运用在教育研究领域的统计方法,在心理研究领域也基本可用,正 因为如此, 教育统计学中的基本统计理论、 原理和方法实际上就是心理研究领域中的统计理 论、 原理和方法。 教育统计与心理统计的差异主要是形式上即材料上的差异而非本质的差异 ——即教育统计主要运用教育教学中的数据材料来阐明统计原理和方法, 而心理统计则主要 运用心理实验数据或心理测验数据来阐明统计原理和方法。 也就是说, 统计原理和方法一样, 仅仅是数据材料不同。 (二)掌握统计技术另需具备的工具和书刊 1. 具统计功能的计算器或 excel 电子表格的数据编辑处理方法。 2. spss 统计软件全称是 statistics package for social science(Statistical Products-- Services Solution) ,没有统计软件的支撑,统计知识和方法也基本上只能停留在理论层面和少量的 数据处理,难以真正运用到实践中。 3. 统计软件处理技术必备的自学书籍。 《spss 在教育统计中的应用》,主编杨晓明高等教育 出版社; 《心理实验设计及其数据处理》,主编金志诚, 广东高等教育出版社; 《数据统计分析 与 spss 应用》主编余建英人民邮电出版社。 4. 教育及心理问卷调查必备测量工具书刊《心理卫生评定量表手册》中国心理卫生杂志社 汪向东等共 112 个心理与教育方面问题的量表。 二. 教育与心理统计学产生的背景及意义 随着科技的发展,人类认识、改造世界的能力不断更新,教育工作者已不再满足于对教育和 心理现象只进行哲学的思辨或经验的描述, 而开始要求并强调作系统的思考与定量的研究和 分析。 (学科发展背景)这一学科发展的背景也正好符合——当代社会科学向数量化、综合 化发展的社会趋势。因此,教育与心理科学的定量化研究,乃是 20 世纪以来的世界性潮流。 (社会背景)因为教育与心理统计学,就是阐述怎样运用数理统计学原理,对教育和心理问 题进行定量研究的方法论科学,是了解教育与心理状态、认识教育与心理规律的有力工具, 是推进教育和心理研究方法科学化进程的重要基石。因而,学好教育与心理统计学,是跟上 这种教育与心理问题定量化研究的趋势, 提高自己的研究水平和研究力度, 以及确保教务管 理科学化,等等,都具有积极的意义。 三、教育与心理统计学学习难度的根源解析 覆盖多门学科知识;思维基础的限制;学习习惯方面定势的不良影响;讲授的深浅度难于把 握。

第一章绪论 教学目的 : 了解教育与心理统计学的作用及其产生发展情况以及学习时应注意的基本问题; 理解教育与心理统计学的性质;掌握教育与心理统计学的主要内容;熟练掌握教育与心理统 计学中的几个基本概念和符号。

教学重点:教育与心理统计学的性质;教育与心理统计学中的几组基本概念和常见符号 教学方法:讲授法讨论法 第一节 教育与心理统计学的性质和作用 一、 教育与心理统计学的性质 教育与心理统计学:是以数理统计的理论和方法来研究教育与心理现象中数据资料的搜集、 整理、分析和推断,以便发现教育与心理现象的特点和规律的应用科学。 (手段、内容、目的和特性) 为深入理解教育与心理统计学的上述性质,请思考讨论下面两个问题: 1. 统计学、数理统计学与教育与心理统计学,三门学科之间有何逻辑联系? 2. 教育与心理统计学为什么要以数理统计学为其理论基础? (或者说,教育与心理现象的研究为什么要借用数理统计的原理和方法?) 对于问题 1?? 对于问题 2,数理统计是通过对随机现象所表现的数量进行搜集、整理、描述和推断,从而 发现其统计规律的一门学科。 数理统计学研究的是随机现象 (即因存在不确定因素而导致结 果带有偶然性同时又蕴涵一定规律性的现象) 。比如,??与此同时,教育与心理领域中也 存在大量的随机现象,这些随机现象之所以难以确定,是因为难界定、难控制、难测量、难 比较、 难归因。 如, 性格的形成、 表现及影响, 对个体而言, 都是难以确定的, 具有偶然性, 但同时也潜藏一定的规律性,对同类性格的大多数人来说,性格的形成、表现及影响,又涵 盖了不少规律性的东西。 为了能更好地研究这样一些随机现象, 就需要以数理统计学为理论 基础,就应该借用数理统计学的原理和方法来加以研究。 二、教育与心理统计学的作用 …… (一)明确教育、心理现象的性质 (二)比较两种教育、心理现象的差异 (三)分析影响教育、心理现象变化的因素 (四)由局部推测总体 (五)设计最优抽样方案

第二节 教育与心理统计学的基本内容 一、 根据研究问题的实质分为以下几项内容 (一)描述一件事物的性质 (二)比较两件事物的差异 (三)分析影响事物变化的因素 (四)一件事物两种不同属性之间的相互关系 (五)取样方法 二、 根据统计方法的功能分为三种 (一)描述统计 主要研究如何整理心理与教育科学实验或调查得到的大量数据。用于描述一件事物的全貌, 表达一种事物的性质。描述统计又有两方面的内容: 1、 绘制统计图、统计表 把收集来的杂乱无序的数据简缩成清晰而易于理解的形式,以图表、数字的形式表现出来。 使研究者从中能够非常直观且迅速地获得有价值的信息。 2、计算出统计量

集中量数差异量数偏态量与峰态量相关系数,等等。 (二)推断统计:用于在一定可靠程 度上,据样本信息对相应总体特征进 行合理推断。 参数估计假设检验(4 大检验) :Z 检验;T 检验;F 检验;检验 (三)实验设计 用于研究如何科学、经济、以及更有效地设计实验。?? 描述统计是基础和前提,推断统计来自描述统计,是描述统计的深化 第三节 学习和应用教育与心理统计学应注意的基本问题 一、 在学习教育与心理统计学时要注意以下几个问题 (一)树立学习信心,克服畏难情绪,提高学习积极性 (二)重点掌握各种统计方法的使用条件 (三)进行一定的练习 (四)把握好学习的三个环节:预习、听讲、复习 二、 在应用教育与心理统计学的各种方法时要切记以下几点 (一)克服统计无用和统计万能的思想,注意科研道德 (二)需认真分析要处理的实验数据,正确选用统计方法,防止乱用统计 1、分析实验是否合理,即所获得的数据能否用统计方法去处理 2、分析实验数据的类型 一般说来,实验数据按由什么方法获得,可分为两大类,一类是通过计算个数的数据,叫计 数数据。如,男女数。另一类是借助于一定测量工具,或一定测量标准而获得的,叫测量数 据。如身高。此外,实验数据按其是否具有连续性,又可分为连续数据和离散数据。连续数 据——在某一区间,允许取无限个数量。离散数据——取有限个或者可数的数量 3、分析数据的分布规律 第四节 教育与心理统计学中的 几组基本概念和符号 一、 随机现象、随机试验、随机事件和随机变量 随机现象:是指在一定的条件下, 有多种可能结果出现,事先不能断言 哪种结果会出现的现象。如:抛一枚硬币。 随机试验:对随机现象的一次观察,称为一次随机试验,简称试验。 随机事件:指随机现象中的每一种可能结果,简称事件(常用 A、B、C 表示) 。在 SPSS 统计 软件中,为了统计处理方便,对于不是以数值表示的随机事件,应将其数量化。如:?? 随机变量:对于每一个给定的随机 现象,定义在事件集合上的函数,称为随机变量,简称变量(常用 X、Y、Z 表示) 例如:抛掷一枚硬币,观察其落地后是“正面朝上”还是“反面朝上” 。这一现象只有两个 可能结果:A 代表正面朝上(用 1 表示) ,B 代表反面朝上(用 0 表示) 。于是可定义一个随 机变量 X: 1 当 A 发生时 X=0 当 B 发生时 这样,X =1 表示“正面朝上”事件; X=0 表示“反面朝上”事件。有人做过大量实验,事 件 A 和事件 B 发生的概率几乎相等, 均为 0.5。 这个结果可表示为这样的函数关系式: P (X =1)= P (X =0)=0.5 二、 总体、个体、样本和样品

总体:具有某种特征的一类事物的全体,又称“母体” 个体:构成总体的每个基本单元 样本: 为了调查总体的性质而从总体中随机抽取的一部分个体所组成的集合成为总体的一个 样本。 (常用“n”表示) 样品:样本中的个体称为样品。样本中包含的个体数称为样本容量 特别注意两个问题: 1. 总体和样本是相对的。比如,从徐州市随机抽取 6 所学校,对其学生家长的职业进行调 查。这时,6 所学校的学生可作为整个徐州市所有学生的样本,同时也可作为 6 所学校各班 学生的总体。 2. 大样本和小样本也是相对的。一般说来,n 大于或等于 30 为大样本 n 小于 30 为小样 本但这种划分不是绝对的。 必须根据具体问题加以确定。 如要对全国中学生心理素质状况进 行调查,那么抽取 n=50 甚至 100 仍然不能算是大样本。因为这样的数量相对于全国的中学 生而言,是微乎其微的。 三、 次数、频率、概率和概率分布 次数:某一随机事件在某一类别中出现的数目,又称为频数。统计学上往往将人数、只数、 个数、头数等等统称为次数或频数。 (用“f”表示) 。如: 频率:又称相对次数,某一事件的次数被总的事件数目除,也就是某一数据出现的次数占数 据总数目的比例。用公式表示为: 频数 /总数目═频率 频率常用比例表达,有时也用百分数表示。 概率:又称机率,是指在一定条件下,对一个事件出现的“可能性大小”的度量(用“p” 表示) 概率分布:说明一个随机变量可能 取哪些值以及有多大的概率取到那些值的表达式。如:P(X=χ i)=p i (i =1,2,3?) 表示 的就是,若 X 为离散型随机变量,可能的取值范围是χ 1 ,χ 2 ,χ 3 ?,取值χ i 的概率 为 p i ,于是把上述表达式称为 X 的概率分布或者概率密度 常用的概率分布有:两点分布、二项分布、正态分布、分布、t 分布和 F 分布 6 种。 四、 统计量和参数 统计量:又称统计特征数,是指在 研究中对样本信息计算得到的各种 量数,它能描述一组数据的特征。如 平均数、中数?? 参数:又称总体参数,是指从已知 的统计量推论得到的相应总体的各种量数,它能描述一个总体的情况。比如,由样本平均数 推论得到的总体平均数, 由样本标准差推论得到的总体标准差, 以及由样本相关系数推论得 到的总体相关系数等等。 几种常用的统计量和参数的符号 名称 统计量 参数 算术平均数 κ 标准差 S 方差 S2 相关系数 r ξ

希腊字母表及其读音与意义 序号大写小写英文注音国际音标注音中文注音意义 1 Α α alpha a:lf 阿尔法角度;系数 2 Β β beta bet 贝塔磁通系数;角度;系数 3 Γ γ gamma ga:m 伽马电导系数(小写) 4 Γ δ delta delt 德尔塔变动;密度;屈光度 5 Δε epsilon ep`silon 伊普西龙对数之基数 6 Εδ zeta zat 截塔系数;方位角;阻抗;相对粘度;原子序数 7 Ζ ε eta eit 艾塔磁滞系数;效率(小写) 8 Θ ζ thet ζ it 西塔温度;相位角 9 Η η iot aiot 约塔微小,一点儿 10 Κ θ kappa kap 卡帕介质常数 11 ∧ι lambda lambd 兰布达波长(小写) ;体积 12 Μ κ mu mju 缪磁导系数;微(千分之一) ;放大因数(小写) 13 Ν λ nu nju 纽磁阻系数 14 Ξ μ xi ksi 克西 15 Ο ν omicron omik`ron 奥密克戎 16 ∏π pi pai 派圆周率=圆周÷直径=3.1416 17 Ρ ξ rho rou 肉电阻系数(小写) 18 ∑ζ sigma `sigma 西格马总和(大写) ,表面密度;跨导(小写) 19 Τ η tau tau 套时间常数 20 Υ υ upsilon jup`silon 宇普西龙位移 21 Φ θ phi fai 佛爱磁通;角 22 Φ χ chi phai 西 23 Χ ψ psi psai 普西角速;介质电通量(静电力线) ;角 24 Ψ ω omega o`miga 欧米伽欧姆(大写) ;角速(小写) ;角 五、误差、系统误差、随机测量误差和抽样误差 误差:测得值与真值之差,以及样本统计量与总体参数之差。 系统误差:在搜集资料的过程中,因仪器不足,主试者暗示或对一些实验指标掌握过宽或过 严,可导致测量结果呈倾向性的偏大或偏小。应力求避免。 随机测量误差:在搜集资料的过程中,即使方法能够统一,仪器得以校正,但由于各种偶然 因素影响, 会造成对用同一方法对同一对象多次测定的结果不完全相同, 这种误差往往没有 固定的倾向,而是有的稍高,有的稍低。如,被试自身带到实验中来的各种因素和特征:象 被试的年龄、性别、智力水平、学习经验以及被试实验过程中的兴趣、态度和疲劳等因素。 随机测量误差可尽量缩小,但一般难以完全避免。 抽样误差:随机样本的统计量与总体参数之差。 第五节教育与心理统计的常见问题类型与 SPSS 一. 问题类型 ①对采集数据的一般性统计。如频数、频率、均值和方差等。例如,抽样调查某地区家庭义 务教育支出,其中问卷调查项目有家庭人口、父母受教育年限、子女人数、上学人数、家庭 人均收入、家庭人均支出、教育支出、少数民族比例。要对整个抽样加以统计,说明此地区 的上述指标情况,就要做一般性统计分析。

②两个总体之间某类特征数据的差异显著性。 例如, 研究我国重点与非重点两类大学毕业生 收入有无差异问题。 ③多个总体之间某类特征数据的差异显著性。例如,研究具有博士学位、硕士学位和学士学 位毕业生的期望收入有无差异的问题。 ? 一个或多个因素对结果影响的显著性。例如,不同性别、不同地区、不同家庭背景的学生 接受高等教育情况有无差异;教学手段与课外科研活动是否对学生学习成绩有影响。 ⑤两个特征变量数据的相关性(相关程度)大小。例如,个人受教育年限与个人收入关系的 密切程度。 ⑥一变量和另一变量或多个变量之间的近似函数关系。 例如, 一个地区人均教育支出与人均 国内生产总值近似的函数关系。 ⑦某变量是否服从特定分布。例如,某校学生月生活费支出是否服从正态分布。 ⑧如何将多个研究对象进行分类(聚类) 。例如,将我国 31 个省市按人均教育经费多少分成 五大类。 ⑨如何将多个指标描述的对象简化成少量指标描述。例如,影响小学辍学率的因素有很多, 比如人均国内生产总值、人均教育经费、农民人均收入、当地文盲率等十几个因素,能否简 化成几个综合因素(因子) 。 ⑩如何将多个用不同量纲指标描述的研究对象进行综合排序。 例如, 衡量一个地区现代化水 平有多个指标,而且这些指标量纲都不一样,现有几个地区,按教育现代化水平这一量纲指 标排序,如何进行。 二. 数据类型 按照统计学处理问题的方法分类, 不同的数据类型有不同的统计分析方法。 一般分为定性数 据和定量数据。定量数据中又分为:服从或近似正态分布的数据;非正态分布数据。 三. SPSS 如何解决教育与心理统计中的问题 解决上述 10 种问题的 SPSS 统计方法如下表所示:

解决 方法 问题 类型 定性 数据

数据类型

定量数据 服从或近似非正态分布 服从正态分布 ? 数据清理与基本统计分析 数据清理与基本统计分析 数据清理与基本统计分析 ? 卡方检验 一般卡方检验 T 检验 配对 T 检验 两组独立样本的 T 检验 非参数检验;两组独立样本非参数检验; 两配对非参数检验

? 卡方检验 方差分析 非参数检验;多独立样本非参数检验; 多配对非参数检验 ? 方差分析 多独立样本非参数检验; 多配对非参数检验 ? 卡方检验 相关分析 相关分析 ? 回归分析 回归分析 ? 非参数检验;单样本 K-S 检验 ? 聚类分析 聚类分析 聚类分析 ? 因子分析与主成分分析 因子分析与主成分分析 因子分析与主成分分析 ? 因子分析与主成分分析 因子分析与主成分分析 因子分析与主成分分析 注: 基本统计分析包括频数统计、 描述性统计、 均值、 均值标准误差、 中位数、 众数和全距、 方差和标准差、四分位数、十分位数和百分位数、峰度和偏度、参数估计(总体均值与总体 方差的估计?参数的点估计、计算总体均值的置信区间?参数的区间估计) 课后作业与练习: 1、 什么是教育与心理统计学?它的作用和内容有哪些? 2、名词解释 随机现象、随机试验、随机事件、随机变量、次数、频率、概率和概率分布、误差、系统误 差、随机测量误差和抽样误差 3、举例说明什么是总体、个体、样本和样品?什么是统计量和参数? 4、熟练掌握 Excel 数据录入及图表制作方法。

第二章 数据的搜集、整理和表达 教学目的了解数据整理和表达的意义; 掌握各类数据的区别和联系; 掌握数据整理和表达的 主要方法;熟练掌握数据分组和编制次数分布表的步骤及方法。 教学重点各种数据资料的异同及适用统计量; 数据整理和表达的主要方法; 数据分组和编制 次数分布表的步骤及方法。 教学方法讲授法讨论法 第一节 数据资料的搜集 一、搜集数据资料的意义 (一)搜集数据资料是统计工作的第一步 (二)搜集数据资料是统计整理和统计分析、推断的前提和基础 (要求:根据研究目的和实事求是原则、运用科学方法、准确并及时搜集统计资料) 二、数据资料的来源 在教育与心理研究中, 统计资料主要来自教育与心理实验、 教育与心理测验以及教育与心理 调查三种途径。 (一)实验数据 通过教育与心理实验得到的数据,应采用何种统计方法,与实验设计的方法有关。这部分内 容属于《心理科学研究方法》这门学科,因此这里不再展开。 (二)测量数据

教育与心理测验是一种特殊的调查, 但由于测验已经形成一套相当完整的理论, 因而不再归 于调查而自成体系。 (三)调查资料 1、按调查对象的范围划分,有全面调查和非全面调查 2、按调查时间划分,有经常性调查和一次性调查 3、按调查的组织方式划分,有统计报表调查和专门调查 统计报表主要指教育部门逐级向上呈报的各种表格, 教职工情况登记表、 学生情况登记表和 经费收支情况登记表等等。 4、按调查方法划分,有观察法、访谈法、报告法、问卷法、文献法 其中,报告法是按隶属关系逐级呈报资料的方法。 运用上述调查方法搜集数据资料,需要首先制定调查方案。调查方案的制定包括以下工作: 明确调查的目的和任务是什么;确认调查的对象和范围;理清调查的内容和项目;运用什么 调查方法和方式;对调查活动的组织领导——又包括思想准备、组织准备、人员训练、力量 配备、文件及表格的拟制和经费预算等。 第二节数据资料的整理 当我们从?? 一、变量与数据的基本问题 (一) 变量的基本问题 1、 变量的涵义:表示事物某一特性的量。由于事物总是发展变化的,??在某一变量中, 一旦某个值被确定,就把这个值称之为这个变量的一个数据。比如,??变量是上位概念, 数据是从属于变量的下位概念。 2、 变量的种类 (1) 按变量的测量水平即标定(或表示)事物的明确程度分为以下几种 A 称名变量(又叫定类变量或类别变量) (Ⅰ)涵义:按事物的某一特性,划分并区别事物不同种类后,用数字化的方式来表示所形 成的变量。如,?? 二分称名变量:只有两项类别或两种变化结果的称名变量。 (Ⅱ)特点及适用统计方法: a 表示称名变量的数只能叫数字或数码,而不能叫作数值或数据,只起分类标记作用,而无 数量和序列的涵义。如学号,我是 1 号,你是 2 号,所以我比你高明吗?69 路公交车就一 定比 67 路公交车的服务质量好吗? b 不能直接进行量化分析和加、减、乘、除四则运算。男(1)+女(0)=?对+错=? c 在相关分析中,可用点二列相关系数和相关系数等统计指标来表示变量间的特征;在描述 统计分析中,统计图/统计表/频数/频率;在统计假设检验中,可采用卡方检验 B 等级变量(又叫定序变量) (Ⅰ)涵义:在对事物的分类过程中,依据事物某种特征或属性的程度大小而排列成序所形 成的变量。如,?? (Ⅱ)特点: a 既无绝对零点,也无相等单位 所谓无绝对零点,是指无绝对的从 0 开始的起始点或参照点。?? 此外, 所谓无相等单位, 有两层涵义: 一是指, 各等级间差距的意义不同即不相等。 如, 优、 良、中、各等级间的差距是不相等的;二是指,评定各等级时使用的评定标准即单位值是不

一致的即不相同的。如:某同学成绩在徐师大评为中等,但在九州大学则可能评为优等,或 者相反,显然是由于衡定、度量各等级的标准(单位值)不等造成的。而体重、身高等则不 会出现上述情况。 b 等级变量不能进行加、减、乘、除四则运算。因为加减法运算有一个前提:参加运算的数 据须有相同的单位。1 只苹果+1 只橘子=?1 名+2 名=?这里的“名”不是它的单位,优等+ 良等=? c 如果是等级变量,在描述统计中,可用中位数、百分位数、频数、频率、统计图、统计 表;在相关分析中,可采用等级相关系数等统计指标,表示其变量间的特征;在统计假设检 验中,可采用卡方检验。 C 等距变量(又叫定距变量或间距变量) (Ⅰ)涵义:依据某一特性划分事物类别时,既编排了顺序,又具有相等度量单位的变量。 (Ⅱ)特点: a 单位相等(即数据等距、度量的单位值相同) ,如温度,摄氏 10 度与摄氏 9 度,同摄氏 9 度与摄氏 8 度,都是相差 1 度,所以这种数据是等距的,具有相同单位的。一般有相对参 照点,但无绝对参照点,温度为 0 不是一点温度都没有,所以这里的 0 不是绝对零点即并非 绝对的起始点,而只是一个相对的参照点,是一个人为规定的相对参照点,是“1 个大气压 下纯水结冰的温度” ,如果当时物理学家将“1 个大气压下煤油结冰的温度”规定为摄氏 0 度,这样一来,纯水结冰时的温度就不是 0 度,而会高于 0 度。 b 可以进行加、减运算但不能进行乘、除运算。如,可在 2 个温度之间进行加减运算,可 以说今天最高气温(30 度)比昨天最高气温(20)高 10 度,这是减法运算的结果,但不能 说今天最高气温(30 度)是昨天最高气温(20 度)的 1.5 倍,即不可以进行 30/20=1.5 这样 的乘除法运算,因为乘除运算的前提是:须有绝对零点。 c 如果是等距变量,既可用前述描述统计的方法,也可用平均数、标准差等统计分 析方法;相关分析中,可采用积差相关系数等统计指标,表示其变量间的特征;统计假设检 验中,适用于各种检验方法。 D 比率变量(定比变量) (Ⅰ)涵义:表示事物某一特性的变量,既有绝对参照点,又有相同单位的变量。如长度、 重量、 体积等数量, 其绝对零点都是 0, 就长度而言, 0 米就是在始发地,一点距离都没有; 就重量而言 0 千克就是一点质量都没有, 并且这样的 0 作为起始点是不以人的意志为转移的, 因而是绝对的零点。 同时 3 米和 2 米, 2 米和 1 米相差的距离始终是相等的, 所以单位相等。 (Ⅱ)特点: a 可以进行加、减、乘、除四则运算? b 适合等距变量的统计指标和方法,都适合比率变量 讨论:5 分制和 100 分制是定序变量还是定距变量? (2)据变量的性质不同,可分为以下两种 A、 连续变量 (Ⅰ)涵义:在变化范围内,可取得任何数值的变量。?? (Ⅱ)特征: a 数值可以是小数或分数 b 借助于某种测量工具得到的,称之为测量数据或计量数据 (Ⅲ)几何意义及表达式 a 数轴上的一段距离 b 具有实数的稠密性

实限: 连续变量的取值所确定的区间界限, 其中较大的界限值称实上限, 较小的称为实下限。 确定法:向连续变量的取值的上下各移动最末一个数位的半个单位值而得到的两个数。 10 米的最末一个数位是个位, 表明是用以 1 米为一个单位值去度量得到的长度, 所以它的一半 就是 0.5,于是上实限为 10+0.5=10.5;下实限为 10-0.5=9.5 。 例 1:确定连续变量取值 19.6 的实限。 例 2:确定确定连续变量取值 10.00 的实限。 练习:74.825;80.00005 表达法:大于等于下限,小于上限 [ )左闭右开 B、非连续变量(离散变量) (Ⅰ)涵义:在变化范围内,只能取一定数值,且彼此不连续的变量。 附:数值是整数,通过计算个体数目多少而得到的称之为计数数据。 (Ⅱ)几何意义及其表达:代表数轴上的一个独立的点值,取值是有限的。对于非连续变量 来说,其变量值不存在实限问题。所以可直接表达。1,2,3,4? (二)数据的基本问题 1、数据的涵义:事物关系的具体表 现形式, 它是从量的方面去反映和标志事物某种特征的有单位的数值。 它是对具体事物进行 计数或测量的结果。如, 2、数据的特点: A 变异性(波动性) :即用同一方 法对同一样本的各个个体进行测 试所获得的结果不同,甚至用同一方法多次测试同样个体,结果也不完全相同。?? B 规律性:在一定时空范围内,数据呈现差异的同时又存在一定的规律性。?? 3、数据的种类: (1)数据的获得方式不同:可分为 A 计数数据:计算个数的方式得到的数据,以整数的数量形式表示。 B 测量数据:借助一定的测量工具或一定的测量标准而得到的数据 既可以是整数,又可以用分数来表示。它只是一个代表值。 (2)根据数据是否具有连续性,可分为离散性数据和连续性数据。 一般说来,数据测量水平(等级)越高,应用范围越广泛;反之,应用范围越受限。等级高 的数据可兼有等级低数据的功能;而不能相反。统计学上也将数据分为两大类型:定性数据 和定量数据。 定性数据也称品质数据, 它说明的是研究对象的品质特征, 不能用数值来表现, 主要代表定类数据和定序数据。在 spss 中为处理方便,常用数字或数码去标示它,但这时 的数字或数码 只起分类标记作用, 而无数量和序列的涵义, 因而不是数值或数据; 定量数据也称数量数据, 它说明的是研究对象的数量特征,能用数值来表现,主要代表定距数据和定比数据。对于这 两类不同类型的数据, 要采用不同的统计方法进行处理和分析。 对品质数据通常计算出频数 和频率,并进行卡方检验;而数量数据则可以用均值和其它更为复杂的统计方法进行分析, 并进行 Z 检验、F 检验和 T 检验。 二、数据资料整理的意义 1、统计资料的整理是对统计调查的进一步深化 2、统计资料的整理是统计分析的前提 三、数据资料整理的方法 (一)鉴别资料的真实性 方法:计算检查;逻辑检查

(二)分组和次数分布 1、分组。分组也叫归类,即根据形式不同,可分为 (1)性质类别——按照事物的不同性质进行分类。如,将学生作文成绩分为:甲、乙、丙、 丁,将健康状况分为:好、中、差,将员工对工作的满意度分为:很满意、基本满意、不满 意。等等。然后再把具有相应性质的人归入某个等级组中,以便查明各等级组的人数情况和 总体的情况。 (2)数量类别——按照数值大小排序分组 A 等级排列,即按等级大小排列成序。究竟是数值大的还是数值小的排在第一等,这要看 事物本身所反映的性质。如果是学习成绩或能力测验分数,当然是数值大的为第一等级;如 果是反应时及完成一项工作所需要的时间,数值小的当然为第一等级。此外,在对一组数据 按等级排序时,常遇到等级数值相同的数据,如:61,60,60,58,57,57,57,55,这 时又应当怎样排等级呢? 具体方法是:不管相同数目的个 数是多少, 将其各相同数据应占的等级相加再平均 (相同数据所在的等级相加再除以数据的 个数) ,所得的平均等级作为这几个相同数据的共同等级。?? 1(61) ,2.5(60) ,2.5(60) ,4(58) ,6(57) ,6(57) ,6(57) ,8(55) 这里应注意两点:等级数应与数据的个数相同,即 8 个数据应有 8 个等级数;在相同数据后 面的数据,其等级应与相同数据等级平均之前所占等级相连接。如:58 为第 4 等,那么相 隔 3 个书后的 55 应为第 8 等。 B 按照数值大小直接由小到大排列。如果数据太多,就要编制一个次数分布表。 2、编制次数分布表 (1)次数分布表的涵义:表现总体单位在各组的次数分配情况的统计表,叫做次数分布表 (2)几种常见的次数分布表的编制 A 简单次数分布表 结构:组别(观测值分组)和次数(频率)构成。见 P35 a 整列并求全距 全距:最大值与最小值间的距离,即该组数据最大值减最小值之差用 R 表示 b 定组数:分组的数目即为组数。 用 K 表示。组数要根据数据多少来确定,但编制次数分布表的前提是“数据较多” ,所以数 据就不会很少。如果数据在 100 左右或更多,那么根据经验,组数一般确定为 10—15;或 者按照计算公式精确计算,如 P32 公式。 c 求组距 组距:各组数据的组内间距。组距内的各数据即便数值有大小之别,但统计学上,每个数据 都有平等分享组距空间的权益, 也就是说, 组距内的每个数据所占的组距内的距离是等长的。 用 i 表示 i = R / K 即分组后上下限之间的距离。组距一般取整数值。 d 定组限 组限:各组数据的起止范围,即各组数据在数值上的起点值和终点值。但为了计算方便,常 把最高或最低组组限稍作延伸。见 P34。组距和组限确定后,如果从最低组开始分组,那么 第一组为 60~63,按照连续数据的性质,该组的实际上下限应当的 59.5~62.5,再根据左闭 右开的数据区间的归属原则,小于 62.5 的数据应归入该组;等于或大于 62.5 的数据应归入

63~66 这一组, 因为 63~66 的实际范围是 62.5~65.5 , 其余类推。 按照习惯, 次数分布表中, 各组的上限常常省略。见 P35 次数分布表。 e 求组中值 组中值是居于各组数据分布中点位置的数值, 是各组数据的代表值。 如 85~89 这组内有 85, 85,85,88 四个数据,虽然有 3 个数都不与组中值 87 相等,但我们在对次数分布表中的分 组数据进行统计量的计算时,都用 87 这一组中值代表组内 4 个数据,这虽然与原始数据计 算的统计量有一定误差,但正负抵消之后的误差一般都在允许的范围内。正因为如此,我们 才能以组中值作为该组内所有数据的代表值。组中值用符号 M 或 Xc 表示 f 归类划记 g 记录次数 h 核对 B、累计次数分布表 以简单次数分布表的基础,就可编制出累计次数分布表。见 P37 C、相对次数分布表即频率分布表 此外, 还有累计百分比分布表和双列次数分布表, 只要简单次数分布表的编制方法和技术掌 握后,??

第三节数据的表达 (重点.自学) 一、统计表 (一)统计表及其作用 (二)统计表的结构:标题、表号、标目、线条(两边不封闭) 、数字、表注 (三)统计表编排原则和要求 (四)统计表的种类及其编制步骤 二、统计图 (一)统计图及其特点作用 (二)统计图的结构:标题、图号、标目、图形、图注 (三)统计图的编排规则 (四)统计图的种类及其编制步骤 提醒:请熟练掌握 excel(电子)表格的数据录入和图表制作方法。该技术可用于基本的信 息统计和教务管理以及简单的定量研究。 *** spss 中两种数据录入及数据排序方法 见 P10 对中学家长的问卷调查 spss 中如何定义变量及录入数据(spss 配套数据 EG2-1 中学 家长问卷) 。 课后作业与练习: 1、定类变量、定序变量、定距变量和定比变量的涵义、特点与适用条件 2、调查方案的制定应作好哪些工作? 3、写出下列各数的精确限 832.9,7.675,23.0,78,1.302 4、编制统计表和统计图各应遵循哪些原则? 5、条形图、圆形图和次数分布图分别适合什么样的统计资料?

6、名词解释:连续变量、离散变量、品质数据、数量数据 7、P53 第 4、6、7 题。 1. 定性数据/品质数据/离散数据/计数数据/等级数据等-----适用的基本统计分析方法有------频数/频率/统计图/统计表/卡方检验以及一些相关分析方法 2. 定量数据/数量数据/连续数据/测量数据/定距数据/定比数据-----适用的基本统计分析方 法有-------频数/频率/统计图/统计表/平均数/标准差/各种检验方法以及一些相关分析方法

第三章集中量数 教学目的:了解集中量数的作用与种类;理解集中量数、集中趋势、权数、权重与加权;掌 握集中量数性质、特点、适用范围和优缺点;熟练掌握各集中量数的计算及使用。 教学重点: 权数、 权重与加权; 集中量数性质、 特点、 适用范围和优缺点; 加权算术平均数、 几何平均数和中位数的应用 教学方法讲授法讨论法 第一节 集中量数的概述 前面我们讨论了数据资料的搜集、整理和表达?? 一、什么是集中量数 代表一组数据典型水平或集中趋势的量,又称代表值。如,常用平均水平(平均数)代表一 个班级或一个群体的整体水平或一般水平。 二、什么是集中趋势 数据向某一点集中或靠近的现象,称为数据的集中趋势。如,全年级同学的成绩都会在平均 数上下或左右波动, 距离平均数远一点的数据即高分和低分会相对较少, 离平均数越近的数 据会逐渐增多,数据的这种向某一点(比如平均数)集中或靠近的现象,就是数据的集中趋 势。

三、集中量数的作用和种类 (一)作用 1、能反应大量数据向某一点集中的情况。据此,我们一旦知道某个群体的平均水平,也就 能确认这个群体中绝大多数个体的水平与平均水平差不多。 2、它把研究对象各量数的差异抽象 化(模糊化) ,用一个概括一般 的简单数据来描述和代表研究对象的一般水平, 并且可用它对同质的另一个研究对象作比较, 还为进一步的统计分析奠定基础。 (二)种类 1、算术平均数(M 或)___Mean 2、中位数(Md)——Median 3、众数(Mo)____Mode 4、几何平均数(Mg)___geometric mean 5、调和平均数(MH)—harmonic mean 第二节算术平均数 一、算术平均数的概念及特性 (一)算术平均数的概念 各观测值的总和 / 观测值的个数所得之商,可称为均数、均值、平均数,它是统计学中最 常用的。公式为: (二)算术平均数的特性(数学性质) 1、平均数与观测值个数的乘积等于各观测值的总和 2、如果对每个观测值加减一个任意值 A ,那么平均数也增加或减少这个数 A。 3、如果每个观测值乘以或除以任意一个值 A ,那么也等于平均数乘以或除以该数 A。 4、各观测值与其算术平均数之差的总和等于 0。即离均差或离差之总和为 0。 5、各观测值与平均数离差平方和同各观测值与其它任意值的离差平方和相比为最小。这 就是推论统计中常用到的“离差平方和最小”原则,即由该性质推导而来。并且,根据该原 则,可推定“样本平均数是总体平均数的最佳估计值” 。 二、算术平均数的计算方法 (一)简单算术平均数(据原始数据计算) (二)加权算术平均数 1、相关概念: A、 权数:即各变量值出现的次数或在一个总体中所占的比重(通常用分数、频率或比率表 示) 。 B、 权重:即某数据出现次数的多少,可以权衡其在该组数据中的重要性或代表性程度,有 权衡轻重的意思。 C、 加权:用权数乘以各变量值,即所谓对变量值进行加权。 2、计算方法: ①据原始数据求平均数 原始数据还在,且各原始数据的权数(次数或比重)已知,则按下列公式计算。

例 1 某年级 4 个班的学生人数分别为 50,52,48,51,期末各班数学考试平均成绩依次为

90,85,88,92,求年级的平均成绩。 例 2 某小学三年级数学期末总平均成绩规定为平时占 20%,期中占 30%,期末占 50%。某 学生数学平时成绩为 96, 期中考试成绩为 80, 期末考试成绩为 92。 求该生期末总平均成绩。 ②据分组后的数据求平均数 若数据资料已分组,原始数据已不见,但每组数据的个数或次数已知或可求出,那么,可用 组中值代表该组内各数据。这时的计算公式为: 其中,f 为各组的数据个数即代表组内各数据的组中值的权数,Xc 为各组组中值,为为数据 总数目即 N。例题见 P 58 三、算术平均数的优缺点 (一)优点 1. 一般优点: (1)反映灵敏 (2)确定严密 (3)简明易懂 (4)适合代数运算 2. 特殊优点: (1)只知一组观测值的总和与总频数即可求算术平均数。 (2)用加权法可求出几个平均数的总平均数 (3) 据样本数据求得的算术平均数最接近于总体平均数的真值, (这是与中数和众数等集中 量数相比而言)它是总体平均数的最好估计值。 (4)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它 (二)缺点 1、易受两极端数值的影响 2、一组数据中,某个数据的大小,糊涂不清或不够确切,就无法计算平均数。 3、整理的数据,组距不等距的情况和分组出现开口组的情况 四、算术平均数的适用条件 (一)适用于同质数据,不同质的数据,不能计算算术平均数 (注:同质数据——指使用同一个观察手段,采用相同观测标准,能反应某一个问题的同一 方面特质的数据) 2、要求一组数据中每个数据都比较准确、可靠,若数据模糊不清或分组资料有不确定 组限时,不能计算平均数。 3、无极端值出现,这是平均数受极端数据影响较大的缘故 4、需要得到一个相对精确可靠的集中量数或进一步参与其它运算。 5、只适合用几何平均数的情境则不宜用算术平均数

第三节中位数 一、中位数的概念 是指一组数据按大小顺序排序后,位于一组有序数据中间位置的量数,又叫中数,或中点数 二、中位数的计算方法 (一)数据较少时由原始数据求中位数 若数据个数 N 为奇数,那么位于中间位置(N+1)/ 2 ,若数据个数 N 为偶数,那么居于中

间位置 N/2 和 N/2+1 上的、那两个数的平均数是这组数据的中位数。 例 1,5 名学生的语文考分 60,68,71,80,83 的中位数是? 例 2,8 名学生的数学考分 58,64,70,74,79,81,89,92 的中位数是? (二) 当数据个数较多既可直接通过 spss 操作得到, 也可在次数分布表求中位数, 公式为: 见 P58 次数分布表。由于中位数所在位置与次数累积方向有关,所以,我们仅以自下而上累 积的次数分布情况为例, 讨论如何计算中位数。 自上而下累积的次数分布情况基本思路一样。 具体步骤: 1、求 N/2,为中位数所在的位置,并找出中位数所在的分组区间 2、确定中位数所在的分组区间的精确下限,记为 Lmd 3、求含有中位数那一区间组下限 Lmd 以下的累积次数,记为 ni 4、求 N/2 与 ni 之差,记为 (N/2—ni) , 表示中位数所在位置到该组的精确下限 Lmd 这一段距离内有多少个数据。 ?? (三)在中位数附近出现重复数据时求中位数 具体步骤: 1、将这些相同数据视其在组距为 1 的次数分布的同一组中 2、确定中位数所在组的精确下限 3、根据 求它 如:求数据 2,3.8,5,5,5,8,8.7,10 的中位数 三、中位数的优缺点 (一)优点 1、不受两极端特殊量数的影响 例: 一项研究通过调查得到 19 名中学教师月收入情况如下 (单位, 元) : 1200, 1270, 1300, 1310,1320,1320,1350,1360,1370,1390,1400,1450,1460,1490,1530,1580, 1600,3200,4000。请问,他们的月平均收入情况如何? 解:因这 19 名教师的收入中存在极端数据,M=1626.3 元,已不能很好反映他们的平均收入 情况 (19 人中有 17 人月收入低于 1626.3 元) , 故应用中位数来代表其一般水平。 于是, Md= (19+1)/2=10,即 1390 元。 2、在两端界限不明确的分布中,即分组出现开口组时,不能求平均数,但可以求中位数。 3、一组数据中有个别数据不确切、不清楚时,要用中位数反映其平均水平。 (二)缺点 1、不适合进一步代数运算。如,不能将 N 个中位数综合求出一个总的中位数。 2、反应不够灵敏。求中位数不是每个数都参与计算,而主要由数据的个数决定,所以它反 应不够灵敏,但这正是中位数的特殊价值所在。 四、中位数的适用条件 (一)当一组数据有极端值时。 (二)当一组有序数据有个别数据模糊不清时。 (三)当需要快速估计一组数据的代表值时。 (四)分组资料有不确定组限即分组出现开口组时。

第四节几何平均数 一、几何平均数的涵义及基本公式 (一)涵义 当一组数据中存在极端数据且分布呈偏态时, 或者当一组数据中任何相邻数据之比, 接近于 某个常数,即数据按一定比例关系变化时,用来表示其平均水平的量数。 如第一种情况:3,6,9,10,35。 因出现极端数据 35,且呈偏态。 第二种情况,如,某高校自 93 至 96 年的招生数分别为:1000,1600,1680,1728。因相 邻两数据之比为常数 1,如果要了解这几年的平均变化情况以及平均增长情况,就必须用几 何平均数来表示。当然,如果只需了解这几年的平均招生人数,则用算术平均数表示。 (二)基本公式 二、几何平均数的应用与计算 (一)当一组数据存在少数极端数据,分布呈偏态时,直接用基本公式计算几何平均数 例:有一研究者想研究介于 S1 与 S2 两感觉的物理刺激量是多少,他随机抽取 10 名被试, 让其调节一个可变的物理量的刺激,使所产生的感觉恰好介于 S1 与 S2 之间,然后测试所 调节的物理刺激量,10 名被试的结果如下:5.7,6.2,6.7,6.9,7.5,8.0,7.6,10.0,15.6, 18.0 因发现有 15.6 和 18.0 两极端数据,且分布呈偏态,所以直接用基本公式计算。经计算,结 果为 8.552。如果计算算术平均数,则为 9.22,显然偏大。相比之下,几何平均数更能代表 该组数据的集中趋势。 (二) 当一组数据间的变化是按一定比例关系变化时, 如果想了解平均变化情况和平均增长 情况,要用几何平均数基本公式的变式计算 ①每年的变化率已给出,直接用公式 例: 已知某校四年中各年度的学生人数分别为上一年的 1.12 倍, 1.09 倍, 1.08 倍和 1.06 倍, 求年度的平均变化率。 注意:此时的 1.12 等比率值即是原始数据。两者相同的是,表示的都是平均水平;不同的 是,前者求的是几何平均数,而后者求的是平均变化率。 ②每年的变化率没给出,只有原始数据,则用公式 注意:1、其中 a1 表示一组数据中最先的原始数据,a N 表示最后的原始数据。 2、a2/ a1 相当于基本公式中的 X1 基本公式中的 N 表示 N 个数据,而据原始数据求平均变化率中的 N-1 表示 N-1 个比率值。 ★如果要了解平均变化情况或平均变化比率,就直接用上述公式。可见,平均变化情况或平 均变化比率,既可根据比率求出也可根据原始数据求出。 ★在平均变化情况或平均变化比率求出后, 如果要进一步了解教育经费的平均增长率、 学习 进步率或提高率等,可据得到的平均变化率或平均发展速度,再用公式:平均增长率=平均 变化率—1,求出平均的增长率、学习进步率或提高率。如上例。 ★在得到平均增长率后, 如果还要进一步了解——从某一年开始预测未来几年的情况, 那么 可用上述公式的又一变式 X=X′ *(Mg)N 其中 X 表示想了解的未来情况的预测数 X′表示预测基础数,从哪一年开始预测,这一年的基础数是多少 Mg=1+平均增长率即平均变化率,N 表示预测的年度数目(3 年后??,那么 N 为 3) ,或 者,从 2005 年开始预测,到 2010 年该校的招生人数是多少?这种情况下,

N =预测终止年-预测的起始年 练习: 例 1:某生第一到第五周分别记住英语单词数为:20,23,26,30,34。问该生记英语单词 的平均变化率是多少?进步率又是多少? 例 2:某校连续四年的毕业人数分别依次是:980,1100,1200,1300,问毕业生平均增长 率是多少?若该校毕业生一直照此速度增长,那么再过 5 年,该校毕业人数是多少? 例 3:某校 1970 年的教育经费是 10 万元,2002 年是 121 万元,问该校教育经费的年增长 率是多少?若一直按此比率增加,问 2010 年该校的教育经费是多少? (三)几何平均数的适用条件 1、求一组等比或近似等比数据的平均数时 2、一组数据中有少数偏大或偏小的数据,数据分布呈偏态,求平均数时(此时算术平均数 已不能很好反映数据的典型情况) ,当然这种情况下求中数、众数也可。 3、在教育领域,主要应用几何平 均数求平均发展速度、增长率、 进步率、提高率,以便对某个理 想目标进行预测估计 *** 见 P69 对中学家长的问卷调查 spss 基本统计分析中如何计算集中量数 (spss 配套数据 EG2-1 中学家长问卷与 EG13-1 某班学生成绩) 。 应用 crosstabs 进行分析----实例----潘 P62 课后作业与练习: 1.名词解释:集中量数,集中趋势,权数,权重,加权

2. 简答题: ①算术平均数的优缺点及其适用条 件 ②几何平均数在教育上的作用 ③中位数的适用条件 3. 计算题: ①某年级有 5 个实验小组,第一组 8 人,第二组 13 人,第三组 11 人,第四组 9 人,第五组 10 人,在一次实验后得知各组平均分依次分别为:81,79,84,90,73,求全年级 5 个实 验小组的总平均分。 ②某初中最近 4 年毕业生统一会考的平均成绩如下, 问, 该校初中毕业成绩的平均变化率是 多少? 时间:1992 1993 1994 1995 成绩:52.31 60.65 63.78 71.42 ? 某市 1998 年至 2002 年高中毕业生人数分别为:2000,2200,2430,2600,2880,问, 该市这几年高中毕业生人数的年均变化率和年均增长率是多少?照此速度增长,到 2010 年 该市有多少高中毕业生? ④ P80 第 4 题、第 5 题

第四章差异量数 教学目的:了解差异量数的种类及其与集中量数的区别;理解差异量数、离中趋势、绝对差 异量数和相对差异量数;掌握百分位差、标准差、差异系数和标准分数的性质、特点、适用 范围和优缺点;熟练掌握百分位差、标准差、差异系数和标准分数的计算与运用。 教学重点: 绝对差异量数和相对差异量数; 百分位差、 标准差、 差异系数和标准分数的性质、 特点、适用范围和优缺点及其运用。 教学方法:讲授法讨论法 在进入差异量数讨论之前,我们先看看下面的问题: 某班有甲、乙两位同学,数学的平时测验分数为: 甲:54,63,70,82,90,74,99 乙:67,70,72,82,78,79,84 现在要从中选 1 名学生参加全市的数学竞赛,请问,该选谁去最好??? 第一节差异量数的概述 一、什么是差异量数 所谓差异量数就是用来衡量数据离中(注意与集中量数的区别)趋势大小程度的量数。 二、什么是离中趋势 一数列中各数据离开集中量数(如平均数)距离远近的趋势 三、差异量数的种类有哪些 全距百分位差平均差方差或标准差差异系数标准分数 T 分数等 四、在数轴上,集中量数与差异量数有何不同 在数轴上集中量数表现为量尺上的一点,是点值。 而差异量数表现为量尺上的一段距离。 全距是最大值与最小值之间的一段距离; 百分位差是 两个百分位数之间的一段距离; 平均差是每个数据与平均数之间的平均距离; 标准差是总体 数据与平均数的标准距离(经过标准化处理的平均距离) ,即以平均数为 1 个单位值对总体 数据的差异程度进行度量,表示差异程度有多少个平均数。标准差的平方就是方差,反之, 方差的算术平方根就是标准差; 差异系数是以平均数为 1 个单位值对标准差的大小进行度量, 表示标准差的大小有多少个平均数。 标准分数是以标准差为 1 个单位值去度量每个数据距离 平均数有多远,也就是有多少个标准差。可见,差异量数表示的都是量尺上的一段距离,只 不过这段距离的单位不同而已。 第二节全距和百分位差 一、全距(极差) (一)全距的性质 ??R=Xmax—Xmin (二)全距的计算方法(spss) (三)全距的作用和适用情况 ??一般情况下,全距只用于资料的预备性检查,目的在于大体了解数据的分散范围,以便 确定分组的方法。但是?? A:1,2,5,10,15,18,19 B:2,8,9,10,14,19,17,20 二、百分位差(百分位距)

(一)涵义 用次数分布中,两个百分位数之间的差距,来描述数据离中趋势的一种差异量数。即在一定 范围内求全距。 常用的百分位差:P90—P10 ,P93 —P7 ,P75—P25 百分位差在意义上与全距一样, 都是用来表示数据的离散程度的, 只是表示离散程度的数据 范围不同而已。 如果把一个次数分布看成是一个整体或一个基本单位, 那么全距是在一个次 数分布中的 100%的范围内求全距,而百分位差可理解为是在一个次数分布中的一定范围内 求全距,所以全距和百分位差可理解为同类型的差异量数,只不过当数据两端出现特大、特 小值时, 全距的代表性低, 为提高差异量数的代表性, 就必须考虑在数据集中的位置或地段, 求一定范围内的数据的“全距” ,于是产生了百分位差和四分位差这样的差异量数或统计方 法。 (二)常用的百分位差(包含四分位差)的计算方法(spss) 1、P90-P10,P93-P7 ①首先计算百分位数 据百分位差的定义,它是两个百分位数之差,因此要计算百分位差,首先要计算百分位数。 在中位数的讨论中我们已经知道,N/2 表示的是中位数所在的位置,如果把一组数据看成是 一个整体或一个基本单位,然后把它 100 等分,那么中位数所在的位置就在第 50 分位,即 可表示为 N*50/100,即 N/2;如果用 PP 表示第 P 个百分位,那么 P50 就表示第 50 个百分 位数即中位数,依次类推:P90 就表示?其位置就在 N*90/100,P10 就表示?其位置在?同 理,P93 和 P7 表示的统计意义和位置也可明确。 据在次数分布表计算中位数的公式 若用以上分析的百分位数表示,那么在次数分布表计算中位数的公式,也可表示为: 这样,把该公式推广为第 P 个百分位数,就得到计算百分位数的一般公式: 按照理解中位数计算公式的思路,来理解百分位数的公式,就不难得出:因为中位数的统计 意义是----把一组数据分为对等的两部分即中位数上下的数据各为 50%,由此,第 P 个百分 位数 Pp 的统计意义就是----在 Pp 以下包含数据分布中全部数据的 P%,在 Pp 以上包含数据 分布中全部数据的(100-P)% 思考: P90 和 P10 上下的数据个数分别是多少, 于是不难得到这样的结论:百分位数是中位数的推广(普遍情况) ,中位数是百分位数的特 例。 百分位数的计算步骤与中位数基 本相同: (1)即第 P 个百分位数所在的位 置 P*N/100,并找出该百分位数 所在的分组区间 (2)确定百分位数所在组的精确下限 L p (3)算出 L p 以下的各组次数和,计为 ni (4)求 P%N 与 ni 之差 (5)将上述结果代入公式: 例 1:某班数学成绩分布表,求 P90—P10,P93—P7

组别 次数 自下而上 累计次数 90—95 3 45 85—90 13 42 80—85 8 29 75—80 11 21 70—75 5 10 65—70 3 5 60—65 2 2 解:P90 = 84.5 + ( 45*90/100-29 ) *5/13 = 84.5+ 4.423 = 88.923 P10 = 64.5 + (45*10/100-2)*5/3 = 64.5 +4.167 =68.667 P90-P10=88.923-68.667 = 20.256 表示有 80%的数据分布在全距为 20.256 这样的范围内 P93 = 84.5 + ( 45*93/100-29 )*5/13 = 89.442 P7 = 64.5 +(45*7/100-2)*5/13=66.417 P93 - P7 =89.442—66.417=23.025 表示有 86%的数据分布在全距为 23.025 这样的范围内 例 2:某地区参加高考的学生共 200000 人,计划录取 18000 人,初选拟定 20000 人,试问 分数线应如何划定? 某地区高考成绩次数分布表 成绩 次数 自下而上累计 自上而下累计 500 以上 258 200000 258 490—500 557 199742 815 480—490 784 199185 1599 470—480 1386 198401 2985 460—470 1639 197015 4624 450—460 2073 195376 6697 440—450 3642 193303 10339 430—440 4256 189661 14595 420—430 6317 185405 19912 410—420 6425 180088 26337 400—410 7374 173663 33711 400 以下 166289 166289 200000

步骤: 第一步,编制累计次数分布表

第二步,确定 Pp 所在位置,此题要求自上而下累计次数为 20000 人,那么自下而上的累计 次数就为 180000 人 (录取分数线以下考生人数) , 实际上就是所确定的百分位数以下的人数, 据百分位数的统计意义,该百分位数就是 180000/200000,即 90%分位。因此,百分位数就 在自下而上累积的 180088 所在的组,即 410—420 这一组。 第三步,确定 P90 所在组的精确下限 第四步,确定小于 Lp 的各组次数累计和 解: 录取线以上人数为总人数的: 20000/200000=10%, 则录取线以下人数为总人数的 90%, 于是需要求出 P90 这一百分位数。 P90=409.5+(200000*90/100-173663)* 10/6425 =419.36 2、P75-P25 和四分位差 如果按前面讨论的把一个次数分布看成是一个整体或一个基本单位,然后把它 100 等分, P75-P25 就是百分位差; 而如果把它 4 等分, 那么第 1/4 处即为第 25 个百分位数所在的位置, 也就是 25N%(1N/4) ,该点通常被称为前四分位数,同理,第 3/4 处即为第 75 个百分位数 所在的位置,也就是 75N%(3N/4) ,该点通常被称为后四分位数。把一组数据 100 等分后 两个百分位数之差称为百分位差, 那么,把一组数据 4 等分后,第 3/4 处的后四分位数( P75)与第 1/4 处的前四分位数之差 的一半就是四分位差。用公式表示为: Q = (Q3-Q1)/2 意义:表示一个次数分布中,中间 50%的数据的一半 四分位差的计算方法是:不管数据分组还是未分组,其基本公式都是

但 Q1 和 Q3 的具体计算方法不同。 A、未分组数据 Q1 和 Q3 的求法 1、 先排序,确定 N 为偶数还是奇数 2、 若 N 为偶数,Q1 和 Q3 所在的位置(并非四分位数)分别为:

例:计算下面数据的四分位差: 25,22,29,12,40,15,14,39, 37,31,33,19,17,20,35,30 解:首先排序 据公式 =12.5 =(33+35)/2 =34 =4.5 =(17+19)/2 =18

于是,所求四分位差为: =(34-18)/2 =8 3、若 N 为奇数,Q1 和 Q3 所在的位置分别为:

具体计算方法与偶数情况的计算类似。 B、已分组数据 Q1 和 Q3 的求法

=P25 =P75 例:据某班学生数学成绩的次数分布情况表求 P75-P25 和四分位差。 某班学生数学成绩的次数分布情况表 组别 次数 自下而上 累积次数 90- 3 45 85- 13 42 80- 8 29 75- 11 21 70- 5 10 65- 3 5 60- 2 2 根据前面公式: =P25=74.5+5/11*(11.25-10)=75.07

=P75 =84.5+5/13*(33.75-29)=86.33 于是得 P75-P25 的百分位差为: P75-P25=86.33-75.07=11.26 四分位差为: =11.26/2=5.63 (三)百分位差与四分位差的适用条件 1、当数据两端出现极端数值时,用百分位差与四分位差能较好反映一组数据的差异程度。 2、一组数据的两端有个别数据模糊不清或分组资料有不确定组限时 注意:1、P90-P10、P93-P7、P75-P25 都表示位于次数分布表中间两个百分位数之间的分布 范围,分别表示占 80%、86%、50%的数据的“全距” ,是根据实际的需要和数据分布的情况 及特征来确定的。 2、后面要讨论的计算差异系数时:其基本公式为 ,公式表明,是用平均数来表示一组数

据的集中趋势的,因而分子用标准差 S,但当一组数据必须用中位数来表示其集中趋势时, 那么,计算差异系数的公式将变成,可见此时分子只能用四分位差 Q,而不能用标准差 S

第三节平均差与标准差 在本章第二节的内容中介绍的?? 一、平均差 (一)概念: 各量数与其平均数之差的绝对值之 和的平均数,也就是离均差或离差 的绝对值之平均数,通常用“AD” 表示公式为: 思考讨论:为什么要用绝对值? (二)计算方法 1、 原始数据的计算方法 2、 分组数据的计算方法 各组组中值代表组内各数据的数值 平均差虽然是一种易于理解、 计算简便的差异量数, 可以用来说明一数列各量数的平均离中 趋势或差异情况,但是,平均差是用离差的绝对值来计算的,因而不适合用代数方法作进一 步处理。?

(因为打开绝对值要讨论三种情况)这就在很大程度上限制了平均差的使用范围。 因此,现在的问题是,要是能找到一种差异量数,既保证每个数的离均差是一个正数,又能 方便作进一步处理。有没有? 于是数学家带着这样问题, 在此基础上, 通过研究找到了另一种更好的差异量数——标准差。 二、标准差 (一)概念 各量数与其平均数离差的平方和的平均数的平方根。用 S 或 SD 表示 其基本公式为 思考讨论:为什么要平方?又为什么要开方?平方之后是否会改变其性质? (二)计算方法(spss) 1、原始数据计算的方法 ① ②

2、分组数据的计算方法

(三)标准差的组合(合成) 只有在运用同一种观测手段,测量的是同一种属性,仅仅是样本不同。

例:某年级有 4 个班,各班某科成绩如下:1 班 35 人,平均成绩 80 分,标准差 8 分;2 班 40 人,平均成绩 75 分,标准差 10 分;3 班 40 人,平均成绩 78 分,标准差 9 分;4 班 37 人,平均成绩 70 分,标准差 10 分。求 4 个班的总平均成绩和总标准差。 (三)标准差的适用条件 1、 与算术平均数配合使用, 且与算术平均数适用条件相同。 即一组数据的一般水平适合用 算术平均数描述时,其离散程度适合用标准差描述。 2、 计算其他统计量,如差异系数、相关系数、标准分数等,需要用到标准差。 3、 在推断统计中,尤其是进行方差分析时,常用方差(标准差的平方)表示数据的离散程 度。 第四节相对差异量数和相对位置量数 一、绝对差异量数和相对差异量数 (一)绝对差异量数 前面讨论的几种差异量数, ??所谓绝对差异量数, 是指结果都附有与原资料相同单位的差 异量数。 其适用条件是: 当所观测的样本水平比较接近, 并对同一种属性使用同一测量工具进行测量时, 要比较不同 样本之间离散程度的大小,一般考虑直接比较标准差或方差即绝对差异量数。 否则,考虑其它的差异量数,如差异系数、相对位置量数等相对差异量数。这是因为,在科 学研究中,只根据其绝对差异量数比较离散程度的大小,有时是不合理的,这时就得用相对 差异量数进行比较。 (二)相对差异量数 1、涵义、种类及公式 相对差异量数,是指不具有单位 的差异量数。如差异系数或变异 系数 CV-coefficient of variation) 。差异系数有: 平均差与平均数的百分比,即平 均差的差异系数,公式为 四分位差与中位数的百分比,即 四分位差的差异系数,公式为 标准差与平均数的百分比,即标准差的变异系数,简称标准差异系数或相对标准差。公式为

在三种差异系数中,标准差异系 数或相对标准差使用最多。 2、标准差异系数或相对标准差的意义 由上式可知,差异系数已经没有 单位。使用这样的相对差异量数 比较数据离散程度的大小,其意 义如下:以平均数作为比较的起始点或参照点。 ? 以平均数为 1 个单位值, 对标准差进行量度, 表示一组数据中的全体数据的平均差异程 度或总体差异程度,相对于该组数据的平均数而言,占平均数百分比的大小,即百分之多少 个平均数,也就是该组数据相对于自身平均数的离散程度。可见,差异系数主要应用于平均 数不等于零的连续数据。 差异系数越大表明离散程度越大,反之表明离散程度越小。这一点也可从公式中得到证实。 CV 与 S 成正比还是反比关系? 接下来的问题是, 什么情况下不可直接用绝对差异量数而必须用相对差异量数去比较两列变 量的差异情况呢? 3、相对差异量数的适用条件或者需要解决如下问题时: ? 比较不同单位资料的差异程度。如,一组变量值是身高变量,另一组变量值是体重变量 ? 比较单位相同而平均数相差较大的两组资料的差异程度 ? 可判断特殊差异情况 根据经验,一般 CV 值常在 5%-35%之间。如果 CV 大于 35%时,可怀疑所求得的平均数 是否失去了意义;如果 CV 小于 5%时,可怀疑平均数与标准差是否计算有误。 ◆可衡量学校教学是否面向全体,并作为分析学生成绩是否两极分化的指标。 量化判断的标准是: CV≤8.75%表明无分化现象 8.75%<CV<33.4% 表明有分化倾向 若 CV≥33.4% 表明已有分化现象,应引起教师与管理者重视。 例 1:某班学生的物理和化学的平均分分别为 85、72,标准差分别为 6.82、6.82,请问这两 门学科成绩哪科更整齐?(比较标准差相同而但平均数不同的两组资料的差异程度) CV1=(6. 82/85)*100%=8.02% CV2 = (6. 82/72)*100%=9.47% 如果就算能直接比较,显然差异程度是一样的。 例 2:已知某小学一年级学生的平均体重为 25 Kg, S1=3.7Kg,平均身高为 110cm, S2=6.2cm,请 比较体重与身高的离散程度哪个更大?(比较计量单位不同的数据资料的差异程度) CV1=(3.7/25)*100=14.8% CV2 = (6. 2/110)*100%=5.64% 如果就算能直接比较,差异程度则刚好相反。 例 3: 1975 年上海市区两组女童体重的数据 平均数 标准差 差异系数 2 个月组 5.45 千克 0.62 千克 11.38%

6 岁组 19.02 千克 2.12 千克 11.15% (比较单位相同而平均数相差较大的两组资料的差异程度) 二、相对位置量数 在教育与心理的科研及评价实践中,人们经常?? 讨论:我院 02 级心理班曾转入一名体育系学生,现在要进行素质测评,排列名次,能否直 接比较?若不能,应如何解决??? 在统计实践中,解决这一两难问题的方法之一就是?? 表明研究对象某一属性的数量化指标, 即原始变量在其所处分布中的地位或位置的量数, 称 为地位量数或位置量数。 因为它是相对于各自的次数分布或平均水平而言, 所以又称为相对地位量数或相对位置量数。 常见的相对位置量数有:标准分数、百分等级数、百分位数和 T 分数等。在教育与心理测 量研究实践中,位置量数被用来表示各种常模。我们重点讨论标准分数,T 分数。 (一)标准分数及意义 1、标准分数的定义标准分数又叫基分数或 Z 分数,它是以标准差为单位,表示一个分数 在团体中所处位置的相对位置量数, 它是某个原始分数与平均数之差, 除以标准差所得之商。 公式为:

例:一组原始分数的平均数为 40,标准差为 5,请确定原始分数 45 和 35 的相对地位或位 置。?? 离差智商正是利用了 Z 分数的这一性质。1949 年韦克斯勒在他编制的儿童智力量表中首次 采用了离差智商取代比率智商。 这是因为比率智商的基本假定是智力发展和年龄增长呈正比, 是一种直线关系,但随着人年纪的增长,到约到 26 岁左右智商就停止增长进入了高原期, 所以比率智商不适用于年纪大的时候。 离差智商采用了一种新的方法,放弃了智龄,运用了离差。其基本原理是:把每个年龄 段的儿童的智力分布看着常态分布,被试的智力高低由其与同龄人的智力分布的离差的大小 来决定。 离差智商(Deviation IQ),是用统计学中的均数和标准差计算出来的,表示被试者成绩偏 离他自己这个年龄组平均成绩的数量(单位为标准差),是依据测验分数的常态分布来确定的。 它以每个年龄组的 IQ 的均值为 100,标准差为 15。 具体公式为:IQ=100+15Z=100+15(X-M)/S X 为某人实得分数,M 为某人在年龄组的平均分数,S 为该年龄组分数的标准差. Z 是标准分数, 其值等于被测人实得分数减去同龄人平均分数, 除以该年龄组的标准差。 2、标准分数的意义 ①标准分数的平均数为 0, (因为离差之和为 0)标准分数的标准差为 1, ②由于标准分数是原始分数的线性转换。 所以标准分数的分布情况和原始分数的分布情况相 似,因此它总能代表一组原始分数。 ③凡大于平均数的原始分数的标准分数为正值, 凡小于平均数的原始分数的标准分数为负值, 如果原始分数分布呈正态分布, 或近似正态分布, 各原始分数的标准分数的取值范围大致是 -3S━━3S。因为,如果上述条件满足,99.73%数据必定在 Z = +3S 这一段距离范围内, 而在该范围以外的数据只有? 3、标准分数的用途

①作为地位量数能确定每个原始分数在分布中的相对地位。 因为当原始数据呈正态分布的时 候,原始分数分布的范围情况如下: 在 Z = + 1 S 内有 68.27% 在 Z = + 1.96 S 内有 95% 在 Z = + 2S 内有 95.4% 在 Z = + 2.58 S 内有 99% 在 Z = +3S 内有 99.73% ②作为差异量数,能比较两种测验成绩优劣 两种测验的原始分数,因无相等单位和相同参照点,因而严格地说,不能直接进行比较。但 将其转换成以 1 个 S 为基本单位、以 0 为参照点的 Z 分数后,就可进行比较。 如:某班期末外语和语文考试分数的平均数与标准差如下: 外语:52,6 ;语文:75,7 某生外语为 62 分,语文 73 分,请问,究竟哪科成绩相对更好? 据上述统计思想,思考讨论:不同测验的两个原始分数 85 分和 60 分是否可能等值? ③计算不同测验的总分和平均分 原始分数不等值或没有共同的参照标准,严格说来只是顺序变量,不能进行加、减、乘、除 四则运算或运算毫无意义。但当数据分布为正态时,可转换为 Z 分数,然后求出总的 Z 分 数或平均 Z 分数,即可进行比较。 下表是两名学生高考成绩,若直接按总分高低则录取乙生。但各科成绩难易度不同,离散程 度也不同,因此各门学科的成绩分数是不等价的,亦即数据不同质,此时,若以总分高低作 为录取的依据,不够科学,科学的方法应当用 Z 分数的总分或平均分的高低,作为录取依 据。那么应如何求出 Z 分数总分或平均分? 据求 Z 分数的公式 从公式不难看出,要求出 Z 分数,首先应知道要比较的双方的各门学科成绩即原始分数, 然后通过欲比较的双方所在群体(如班级)的各门学科的原始分数,求出各门学科的平均成 绩、各门学科的标准差。 这样两生各门学科成绩的 Z 分数即可求出, 然后可得到两生各自的 Z 分数的总分或平均分。

科目 语文 政治 外语 数学 理化 348 350

甲原分 85 89 70 62 68 72 53 40 72 87

乙原分 全体平 全体标 70 10 65 5 69 8 50 6 75 8

可以发现, 若按原始分数总分高低, 录取的应当是乙生, 但按 Z 分数的总分或平均分录取, 则应当录取甲生,因为 Z 甲=2.5>Z 乙=1.505。因此,Z 分数在解决此类问题时就具有非常 重要的意义。 从上面 Z 分数的讨论可以发现,将原始分数直接转换为 Z 分数时,常会出现负数和带小数 点的值,实际使用过程中很不方便。因此,有时候,可根据需要,对 Z 分数进一步加以线

性转换, 使其成为正值或整数。 最典型的一种 Z 分数线性转换, 就是 T 分数。 转换公式为: T=10Z +50 下面我们通过 spss 对原始数据进行 Z 分数到 T 分数的线性转换(统计分析参见余建英 P87 —89) 数据材料见 spss 配套数据 Z--T 线性转换: EG13-1 某班学生成绩------- 原始分数转换为 Z 分数( analyse — descriptive statistics--- descriptives) ,并进一步把 Z 分数线性转换为 T 分数(transform---compute) ;原始 分数总成绩、Z 分数总成绩(transform---compute) ;总成绩排名(data---sort cases) 参见教科院 05 级应用心理学专业学生考试成绩----原始分数总成绩与 Z 分数总成绩排名的变 化情况。 *** 见 P69 对中学家长的问卷调查 spss 基本统计分析中如何计算差异量数 (spss 配套数据 EG2-1 中学家长问卷) 。 课后作业与练习: 1、练习 spss 配套数据 EG2-1 中学家长问卷和杨晓明 P85 习题 1 2、选定已排出名次的 1 个班级,再据班级学生的原始分数计算出各同学的 Z 分数的总分或 平均分,最后比较全班同学的名次是否有所变化。 3、名词解释:离中趋势、差异系数、绝对差异量数、相对差异量数、标准分数、相对位置 量数 4、 某班甲、 乙两生考试的各科成绩及该班各科成绩的平均数和标准差如下表, 试比较两位 考生总成绩的优劣。 两考生成绩及班级各科成绩的平均数和标准差统计表 科目 语文 数学 外语 物理 化学 380 376 5、简述标准分数的意义及其在教育与心理研究实践中的应用。 6、P107 第 7、8、9 题 甲原分 84 86 69 80 72 62 70 68 85 80 乙原分 平均数 标准差 80 8 78 7 66 10 70 11 84 9

第五章相关与回归分析 教学目的:了解相关的意义及种类;掌握相关分析的方法;理解积差相关,等级相关和点二 到相关的性质;熟练掌握积差相关、等级相关和点二列相关的计算与使用

教学重点:积差相关系数公式的产生;等级相关和点二列相关的应用 教学方法:讲授法讨论法 从前面讨论的内容中,我们已经知道?? 第一节相关与回归分析的概述 一、相关的概念? 联系无处不在, 孤立的现象或事物是不存在的。 现象之间的相互联系可区分为两种不同的类 型:? (一)函数关系。它反映现象之间存在的严密依存关系,在这种关系中,对于某一变量的一个 数值,都有另一变量的一个确定的值与之对应,如:S=π R2 圆的面积 S 与半径 R 是函数关 系,R 值发生变化,则有确定的 S 值与之对应。函数关系广泛存在于客观世界中。? (二)相关关系。它是指现象之间的关系确实存在,但关系值不固定的相互依存关系。即对于 某一变量的每一个数值,另一变量会有若干个数值与之相对应。如:身高 1.75 米的人可以 表现为许多不同的体重;再如,施肥量与亩产量之间,一定的施肥量,其亩产量数值可能各 不相同。之所以发生这种情况,是因为体重、亩产量受很多因素的影响。但是很明显施肥量 与亩产量之间、 身高与体重之间的关系是非常密切的。 分析这种关系的内在联系和表现形式 是统计研究的一项重要任务。? 为进一步理解相关关系,有必要厘清相关关系与其它关系的区别与联系。? 相关关系和函数关系的区别: 函数关系是指两变量间的关系值是固定的,而相关关系的变量之间,其关系值是不固定的。 相关关系与函数关系的联系: 由于有观察或测量误差等原因, 相关关系是函数关系的前提, 函数关系往往通过相关关系表 现出来。换句话说,相关关系包含可能存在的函数关系。 相关关系与因果关系的区别 从相关关系的内容看,有许多是单因果关系,如施肥量和亩产量,劳动生产率和成本等,但 也包括互为因果的关系,如身高和体重,生产量和销售量。同时,相关关系除真实的因果关 系或者说是一种直接关系, 它还包括非真实的因果关系即彼此间不具有因果关系或者说是一 种间接关系。 如: 哥哥高, 妹妹也高。 我们可以认为, 哥哥的身高与妹妹的身高有相关关系, 但不是真实的因果关系。这产生于同一原因,父母的身材比较高。可见,相关关系比因果关 系的概念要宽泛。? 如果相关关系是因果关系,通常会表现为两种形式:一是确定性因果关系,即原因变量和结 果变量是确定的、固定的----吸烟与肺癌的关系;二是不确定性因果关系,即原因变量和结果 变量可以互换(互为因果关系)----用电量与工业产值的关系? 二、相关与回归的关系 相关关系是变量之间关系值不确定的相互依存关系, 但在一定条件下, 变量之间又可能存在 某种确定的函数关系,要找出这种函数关系,需要进行回归分析,建立起回归方程,把彼此 间的关系数量化、精确化。 正因为如此,对现象之间关系的研究,通常从两方面进行:一方面,研究变量之间关系的紧 密程度,并用相关系数或指数来表示,这种研究称为相关分析。另一方面,确认自变量和因 变量之间的数量变动关系(函数关系) ,并用数学方程表达之,在统计上称为回归分析。 相关-回归分析的目的是对相关的密切程度和变化的规律性在数量上加以表现,进而进行各 种推算和预测。 需要注意的是,如果通过相关分析,发现两变量之间的关系并不密切,相关没有达到显著性

水平,就不必重视它,也就不必花费大量的精力进一步进行回归分析。 三、相关关系的种类 (一)据其所涉及的变量因素的多少,可分为简相关和复相关 简相关是两个变量之间的相互关系。如教学方法与学生学习成绩 复相关是三个或三个以上变量的相互关系。如教学方法、性别,教材与学生学习成绩 (二)据其表现形式分 直线相关:两变量在变动趋势上具有某种一致性,即单向性,在坐标系上表现为一条直线。 曲线相关:两变量在变动趋势上符合一定规律,在坐标系上表现为一条曲线。 (三)据两变量变化方向是否一致,可以分为正相关和负相关 正相关是指两变量的变化方向一致,即一个变量值变大时,另一个变量值也随之变大;一个 变量值变小时,另一个变量值也随之变小。请同学们试着举例说明。 负相关是指两变量的变化方向相反,即一个变量值变大时,另一个变量值随之变小;一个变 量值变小时,另一个变量值随之变大。如? 此外,还有一种情况是,当两变量值变化方向无一定规律,即一个变量值变大时,另一个变 量值有时变大,有时变小,并且变大变小的机会趋于相同(若变大变小的机会不等,表明也 存在一定的相关关系) ,这种情况下,两变量间的关系为零相关,也就是说两者之间没有相 关。如,天气变化与性别。 (四)根据相互关联的密切程度分为高相关中相关低相关。三者之间的区分程度,我们将在 下面的问题中讨论。 四、相关关系的分析方法 (一)定性分析 1、定性分析:对两变量有无相关和有什么类型或性质的相关,以及相关紧密程度进行判断 和描述 (1)相关散布图 (2)基于相关散布图的相关性质分析 A、直线相关和曲线相关的判断 B、正相关、负相关和零相关的判断 C、高度相关和低度相关的判断 (二)定量分析 定量分析:对两列变量值相关性质和程度进行量化判断与分析,常用相关系数进行分析 1、相关系数及大致判断法则 相关系数: 两列变量值之间相关程度的数值表现形式, 或者说是表示相关程度的指标 (指数) 。 若是样本之间用 r 表示,若是总体用表示,并且只限于直线相关。 相关系数取值范围-1.00 —— +1.00 之间,因此,相关系数通常是用小数表示的。若 r 值为 1.00,表示完全正相关;若 r 值为-1.00 表示完全负相关;若 r 值为 0 表示零相关。 需要注意的是,正负号仅表示相关方向不同,而不反应相关程度的高低。也就是说, r=+1 与 r=-1,其绝对值都是 1,因此相关程度是一样的,只是两者相互影响的方向不一样。 接下来的问题是, 当 r 的取值为-1 至+1 的其它数值时, 应如何根据 r 值对样本间相关程度进 行判断? 通常的判断法则是: 当-0.2≤r < 0 或 0 < r≤ 0.2 时,为最低相关,可以说是一种忽略不计的相关 当-0.4≤r < -0.2 或 0.2< r≤ 0.4 时,为低相关,可以说是一种弱相关

当-0.7≤r < -0.4 或 0.4< r≤ 0.7 时,为显著相关, 当-0.9≤r < -0.7 或 0.7< r≤0.9 时,为高相关, 当-1< r < -0.9 或 0.9< r< 1 时,为极显著相关,可以说是非常高 的相关。 同学们需要注意的是, 在根据样本的相关对样本所属总体的相关进行推断时, 必须做统计假 设检验,即对相关系数的进行相关程度的显著性检验,以确定相关是否显著。这在统计推断 中经常遇到。 在教育与心理现象中, 完全的正相关与完全的负相关是很难遇到的, 绝大多数为不完全的正 相关和不完全的负相关。 2、使用相关系数必须注意的几个问题 (1)相关系数不是对被测对象直接测得的量,更不具备相等的单位,因此,不能说相关系 数 0.5 是 0.25 的两倍,只能说相关系数 0.5 比 0.25 的相关程度高,同时,也不能说相关系 数 0.4—— 0.6 与 0.7—— 0.9 的相关程度的变化是一样的。 相关系数不能直接用于四则运 算,也不能直接计算相关系数的平均数。只有经过转换之后,才可对相关系数进行合并。 (2)一定的相关系数在一定的时空范围内作解释。如, (3)不同类型的数据,使用的统计原理和方法不同,故务必注意各相关系数的使用条件, 不要误用或滥用 (4)依据样本得到的相关,推测总 体的相关,必须做统计假设检验 (5)研究两类现象间相关关系时, 首先,要求数据成对。即每个个体要有两种不同的观测值。比如, 其次,相关成对数据的数目一般以 30 以上为宜。 第二节积差相关(数量数据的积差相关) 相关系数的计算方法很多,?? 我们主要讨论:两列数量数据的积差相关;两列数量数据等级相关;两列品质数据的相关; 运用 SPSS 对上述相关程度是否显著进行的显著性检验以及对检验结果的定性分析(讨论与 解释) 。 一、积差相关系数的基本公式 讨论:考察两列数量的相关程度,最好办法是什么? A:1,2,3,4,5,?10 B: 19,18,17,16,15,?10 两列数量对应值的加、减、乘、除即 A+B、A-B、A*B 和 A/B 的哪一个结果更能够反映两列 数量的相关程度?

当 A+B=20 时,A*B 有何特点?

A 1 2 3 ? 9 10

B 19 18 17 … 11 10

A*B 19 36 51 … 99 100

可以看出,A*B 愈大,A 与 B 之差越小,即表明 A 与 B 两数值越接近,也就表明 A 与 B 相关 程度越高。 并且,每一对的积,仅反映其一对数量的相关程度,若要反映总的相关情况,那么? 就须求各对积的平均数,即 其中 X*Y 为成对的变量值,N 为成对数据的数目。据此思路,如果以两列数量各自的平均数 作为各自的起始点,求各数的离差,并以离差之积 (X—)*(Y—) ,表示每对数据的相关程度,那么,两列变量离差积之和的平均数,也表示 两列变量总体的相关程度,即 。其中 χ = XУ = Y- 为各成对变量值的离差,N 为成对数据的数目。可见,我们现在已从用 成对数据乘积之和的平均数表示两列变量的总体相关, 演变为用成对数据的各自离差的乘积 之和的平均数来表示两列变量的总体相关。 要理清从到之间的逻辑线路需追问两个问题:第一,为什么要这样做?第二,为什么能这样 做?之所以要这样做,是为了简化数据;之所以能这样做,是因为两者在性质上并未改变, 分子的大小与相关程度即 rXY 的大小都是成正比关系。 从上述分析不难得出这样的结论, 两列变量各成对变量值离差乘积之和的平均数的大小, 能 反映两列变量值的相关程度。 叫协方差,所以,换句话说,协方差是反映两列变量相关程度的指标,它是积差相关系数的 基础。然而,该协方差是带有具体单位的绝对量数,所以不能在单位不同的资料中进行比较 (因为 X 与 Y 两列变量的测量单位是不同的) ,因此,为了使它能够在不同单位的资料中直 接进行比较,就应当使协方差变成相对量数, (思考)办法是:将各成对变量值的离差先除 以各自的标准差,于是变成了标准分数,合并后即为,也就是,其意义是,两列变量各成对 变量值的标准分数的乘积之和, 同样道理, 一对成对变量值各自标准分数的乘积仅反映一对 原始变量值的相关程度, 要反映两列变量值总体的相关程度, 还必须除以成对数据的数目 N, 即 = * ,于是得到积差相关系数 rXY= = * = * 。上述分析,说明了为什么要从到。然而,为 什么能够从到,前后性质上发生了变化吗? 实际上,分子部分与都仍然与 rXY 成正比关系。 据此,两列变量的积差相关系数可解释为:两列成对变量值 Z 分数乘积之和的平均数,也就 是成对变量值的标准分数的乘积之和除以 N。 其中,各符号的意义分别为: 二、计算积差相关系数的方法 (一)用基本公式计算 基本步骤为: 1、计算、 、 、

2、计算 3、计算 4、将有关数据代入上面公式 例:某校为调查学生学习各科目之间的能力迁移问题,于是随机抽取 10 名学生的政治和语 文成绩如下表,问政治和语文的相关程度如何? 序号 X 政治 Y 语文

1 2 3 4 5 6 7 8 9 10

74 71 80 85 76 77 77 68 74 74

82 75 81 89 82 89 88 84 80 87

-1.6 -4.6 4.4 9.4 0.4 1.4 1.4 -7.6 -1.6 -1.6

-1.7 -8.7 -2.7 5.3 -1.7 5.3 4.3 0.3 -3.7 3.3

平均数 75.6 83.7 标准差 4.454 4.337 (二)用原始数据计算(见 P117) 各符号及算式的意义为: 计算步骤为: 1、计算、 、 2、计算、 、 3、计算 XY、 4、将有关数据代入公式 以上题数据为例运用该公式计算。 (三)用 spss 计算 实例解析见 spss 配套数据 EG7-1 教育投资与经济增长以及 EG7-2 数学语文成绩。 统计分析过 程见杨晓明 P152-154 三、积差相关系数的适用条件 (一)两变量均应是由测量得到的连 续变量。即两列变量的各观测值都是通过某种测量工具或测量标准得到的连续性数据 (二)两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。教育与心理现象 的研究中得到的连续变量一般都呈正态分布,所以一般不需作正态性检验。 (三)变量必须是成对数据,且成对数据数目 N 不能小于 30。这样计算出的相关系数才较 为可靠、有效。 (见备问题五) (四)两变量间为线性关系即两变量在变动趋势上是一致的、单向的,在坐标系上表现为一 条直线而非曲线。

四、相关系数的合并(重点) (一)步骤 1、先将各样本的 R 转换成费希尔 Z 分数 2、对查到的 Z 分数先加权,再求和相加,即 3、求平均的 Z 分数 4、再查费希尔 Z 转换表,将其转换为 R 例: ,见 P123 样本 1 50 0.419

0.448

21.056

2 3 得

264 37

0.390 0.425 =351-9

0.412 0.454

107.532 15.436 =144.02

(二)适用条件 1、综合前后多次出自不同研究者的研究 2、科研协作时,不同地区对同一课题进行研究所得到的相关系数的合成 3、在心理测量与教育测验中对效度和信度的估计 五、解释积差相关系数时应注意的问题 (一) 若相关关系是不确定性因果关系, 说明 X 为因,Y 为果,同时也说明 Y 为因, X 为果。 如,假定据 50 名学生的政治和语文成绩计算出的相关系数表明:政治和语文有显著相关,那 么,? (二)若两个变量都随一个共同的因 素在变化, 即使计算出的积差相关系数很高, 也不要轻易判断这两个变量之间存在高度相关。 例如,如:树的生长和小孩的生长,假如根据数据计算出来是正相关,不可得出:树的生长 影响到小孩的生长。因为实际上,两者都受“时间因素”影响,而两者本身毫无关系。 再比如,两门学科之间可能计算出来有很高的相关,但实际上,两者都受“智力” )这一共 同因素影响, 其实两科成绩之间并无关系。 也就是说, 智力高者, 两科成绩都好, 智力低者, 两科成绩都差。 当然, 如果有共同因素存在, 又要探寻两者之间是否有相关, 通常的办法是: ?

在实验设计和实施过程中,对共同影响因素加以控制(衡定、匹配、消除和随机化处理) 。 比如,保证考试学生的智力水平等基本相同,这样得到的相关系数就具有解释力,就可以判 定两门学科成绩之间有很高的相关。

第三节其它相关统计方法 一、等级相关 (一)斯皮尔曼二列等级相关 1、概念及其适用范围 所谓等级相关是指以等级次序排列或以等级次序表示的两个变量之间的相关。 我们重点讨论 的是斯皮尔曼二列等级相关。 当两列变量值以等级次序排列或以等级次序表示时, 两个相应总体并不一定呈正态分布, 样 本容量也不一定大于 30。在这一情况下,表示两列数据的相关称为二列等级相关。 根据某种标准对某项成绩所评定的等级,如优、良、中、差;或者按某种指标的优劣程度所 排列的名次等,都属于等级秩序性分数,都是等级评定的资料。对这类等级评定的资料,一 般采用等级相关的统计方法。 与积差相关相比,等级相关的优越性在于:它不涉及变量的分布形态以及 N 的数目大小, 计算较方便,所以应用范围也比较广泛。 连续变量也可进行等级相关分析。连续变量(定距变量或数量数据)也可以等级化之后成为 定序变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等) ,再进 行等级相关分析。 2、二列等级相关系数的公式及计算方法 (1)无相同等级的情况 采用下面基本公式计算 计算步骤为:?? 例 1: 序号 X(语文等级) 1 8 2 6 3 5 4 3 5 2 6 4 7 7 8 9 9 1 10 10 例 2:见 P125 (2)有相同等级的情况 采用下面统计公式:见 P127

Y(阅读能力) 8 7 4 2 1 5 6 10 3 9

其中,表示 X 一列变量中相同等级的校正数 表示 Y 列变量中相同等级的校正数

注意:N 为成对数据的数目;t 为两列变量各自的相同等级数目而非等级序数 例 1:见 P127 例 2: 序号 X(能力) 等级 Y(成绩)等级 1 90 3.5 88 4 2 85 7 80 6 3 70 10 80 6 4 85 7 79 8 5 90 3.5 95 2.5 6 80 9 70 10 7 85 7 75 9 8 100 1 98 1 9 87 5 80 6 10 92 2 95 2.5 3、二列等级相关的优缺点 优点:它不涉及变量的分布形态以及 N 的数目大小,计算较方便;定序数据和数量数据都 适用,只不过须首先对数量数据加以排序。 缺点:相同等级数目太多时,若不进行校正,会影响相关的精确度。 (二)肯德尔多列(至少 3 列)相关 1.概念及适用范围(使用条件) 当两列以上变量值以等级次序排列或以等级次序表示时, 用来表达多列变量值之间的一致性 程度即相关程度的量数。称为肯德尔和谐系数。P129 2.肯德尔多列相关的公式与计算 (1)无相同等级的情况(P130) 其中 例题,见 P131 (2)有相同等级的情况 P132 其中 二、点二列相关 1、点二列相关的概念及其适用范围 P134 一个变量是连续变量, 另一个变量是二分称名变量, 考察这两个变量之间的一种相关分析方 法。 点二列相关多用于某一是非题的得分与总分的一致性程度即估计某题的区分度 (区分度高表

明该试题的鉴别力强,使总分高、综合能力强的学生,该题的得分情况也比较好;反之,使 总分低、综合能力差的学生,该题的得分情况也会比较差。而区分度与相关度的关系为:区 分度高, 该题与总分之间的一致性程度高即该题得分高低与总分高低有着密切关系, 反之也 成立,相关程度高,表明区分度高。 ) 2、点二列相关的公式及计算 计算步骤为: 例: 序号 1 2 3 4 5 6 7 8

9 10 11

12 13 14 15 1 1 1 1 1

第二题得分(1 表示答对;0 表示答错) 1 0 1 0 0 0 1 1 0 1

15 名学生的试卷总分 69 71 79 86 87 87 81 89 81 92 91 93 92 93 93 三、品质相关 P142-146

SPSS 中的相关分析: 一、二元定距变量的相关分析 EG7-2 语文与数学成绩的相关分析 EG7-1 教育投资与经济增长和学生增长率的相关分析 二、二元定序变量的相关分析 EG7-2 语文与数学成绩的等级相关分析 三、点二列相关分析 张 P136-137 四、肯德尔多列相关分析 杨 P221 例 2 EG9-7 五、品质相关分析 杨 P229 例 1 EG10-1

课后作业与练习: 1、名词解释:相关系数、正相关、负相关、积差相关 2、使用相关系数时应注意的问题 3、解释积差相关系数时应注意的 问题 5、 积差相关系数的使用条件 6、 P154 第 2 题,第 4 题,第 6 题 第 8 题,第 11 题

第六章 概率及概率分布 教学目的理解随机事件和概率的定义、概率的性质、掌握概率最基本的计算公式,正态分布 及标准正态分布的特点; 熟练掌握标准正态分配曲线表的应用和正态分布曲线下面积的应用。 教学重点概率的定义和性质标准正态分配曲线表的应用正态分布曲线下面积的应用。 教学方法讲授法讨论法 在前述各章的描述统计部分??

第一节概率的基本问题 一、随机现象与随机事件 讨论下例现象有何不同: 1、5 门主科不及格是否要留级 2、一字不识的人能否考上大学 3、随机向上抛一枚硬币,是正面朝上还是反面朝上 4、买体育彩票能否中奖 在一定条件下不能完全决定结果的现象——随机现象。也就是说,在相同的条件下,反复进 行试验,其结果产生无法预见的现象。 必然确定性现象(肯定会发生的) 必然确定性现象(肯定不会发生的) 随机的不确定性现象 随机的不确定性现象 3 和 4 这类现象??抛掷硬币一次,就是一个随机试验,一次随机试验就是一个随机现象, 而试验的各种可能结果,或者说随机现象所包含的各种可能结果就称为随机事件,简称事 件。?? 相关概念:基本事件复合事件必然事件不可能事件 二、概率的定义 对概率进行定义, 就是从数量上去反映一个随机事件发生的可能性大小。 按照寻求概率的方 法不同,对概率的定义有两种: (一)后验概率 以随机事件 A 在大量重复试验中,出现的稳定频率值,作为随机事件 A 的概率估计值,这 样寻得的概率称为后验概率 0 ≤ F(A)= a/ N ≤ 1 是在试验之后通过计算随机变量发生的频率而获得的(用计算出的频率值作为估计的概率 值) ,故又叫统计概率,或概率的统计定义或经验概率 (二)先验概率 在试验之前,当试验满足两个条件(试验所有可能结果是有限的;每一种可能结果出现的可

能性不变或者相等时即是等可能的。如果所有的可能结果总数为 N ,随机事件 A 又包含 K 个可能结果那么,随机事件 A 的概率为该事件包含的 K 个可能结果除以试验中所有可能结 果的总数 N。用公式表示即为:P(A)= k/N(如:将硬币抛三次,一次正面朝上的概率即 可能性是多少?) HHH HHT HTH THH HTT THT TTH TTT

三、概率的性质 1、任何随机事件 A 的概率都是不小于 0,不大于 1 的正数 2、不可能事件的概率为 0 3、必然事件的概率为 1 4.小概率事件实际上是不可能发生的(小概率事件实际不可能原理) 将一次试验中发生的概率小于或等于 0.05 的事件称为小概率事件。该事件在一次试验中几 乎是不可能发生的。 四、概率的两个基本法则 P159 (一)概率的加法法则 两个互不相容的事件和的概率等于两个事件的概率之和。公式为:P(A+B)=P(A)+P(B) (1)互不相容事件,在一次试验中不可能同时出现的事件,也称互斥事件。 (2)两个事件概率之和指两个互不相容的事件至少有一个发生。 (3)对立事件:有且只有两个互不相容的事件(所有可能发生的结果只有两种) (二)概率的乘法法则 两个彼此独立事件积的概率等于两个事件分别发生的概率的积 P(A*B)=P(A)*P(B) (1)两个彼此独立的事件是指一个事件发生的概率不影响另一个事件概率的发生(不影响 发生可能性的大小) 。 (2)两个事件的积是指两个事件同时发生(注意与两个事件之和的区别)。 五、概率分布的类型(P160) 第二节正态分布 如果按?? 一、正态分布的涵义及数学模型 正态分布是连续型随机变量概率分布的一种。在一个概率分布中,中间频数多,两端频数对 称地减少,成一种“钟”形对称的理论分布。也叫常态分布,高斯分布,误差分布。 正态分布的数学模型为 Y 表示某一连续变量所对应的曲线高度,也就是各连续变量值的相对次数 ζ 为各连续变量值的总标准差 e=2.71828 若把总次数视为一个基本单位,各连续变量值的相对次数之和为 1 ,因此,曲线与横轴间 包含的面积也就是 1。 正态分布曲线图形就是根据正态分布的数学模型绘制出来的。 特别地,当 u=0,δ =1 正态分布的数学模型变成标准正态分布的数学模型,为: 或 标准正态分布曲线图形就是根据标准正态分布的数学模型绘制出来的

当随机变量服从标准正态分布时,可直接查附录中的标准正态分布表,但是,当随机变量服 从正态分布而不服从标准正态分布时,不能直接查附录中的标准正态分布表,而是要先对 X 变量进行转换,转换为 Z 分数,使其成为服从标准正态分布的随机变量(因为 Z 的平均数 为 0,标准差为 1) ,之后才能查表。 二、标准正态分布曲线的特点 1、标准正态曲线的平均数为 0,标准差为 1 2、曲线和横轴间包含的面积为 1 3、曲线以 Z=0,即 =0 为中心,以 Y 轴为对称轴,左右完全对称的,两边曲线下的面积都 等于 0.5 4、曲线与对称轴交点处的 Y 值最大,两边曲线先快后慢,下降并慢慢渐进横轴,但永不会 与横轴相交,横轴为曲线的渐进线 5、横轴上绝对值相等,符号相反的两个数 Z 和-Z 对应的区间是相等的,以 Z 和-Z 所对应的 点作 Y 轴的平行线和 Y 轴与曲线,三者所包含的面积也相等。 6、标准正态分布曲线向左右两个方向无限伸长,从理论上说,标准分数 Z 既没有最大值, 也没有最小值。 三、标准正态曲线下面积的求法 (一)正态分布表 横轴表示 Z 各个可能值。正态分布表有如下特点: 1、表内仅列有标准正态曲线下的右侧面积。查表前要首先将原始分数 X 值转换成标准分数 2、表内仅有从 Z=0 到右边 Z 值为 3.99 之间的面积 3、表内第一列列出的是 Z 值第二列是表示与 Z 值相对应的过 Z 点纵高 Y 值第三列为 P 值, 即 Z=0 到 Z= 3.99 之间的面积。 (二)标准正态分布表的使用 1、 已知 Z 求面积 (1)求 Z=0 至某一 Z 值之间的面积

(2)求两个 Z 值之间的面积 a、若 Z 值符号相反,它们之间的面积等于两个 Z 值分别到 Z=0 之间的面积之和 b、若 Z 值符号相同,它们之间的面积等于两个 Z 值分别到 Z=0 之间的面积之差 (3)求某一 Z 值以上或以下面积 a、 某 Z 值以上的面积(右侧面积) Ⅰ、若 Z 为正值。那么该 Z 值以上的面积为 Z=0 到 Z=无穷大之间的面积(即 0.5)—(Z=0 到该 Z 之间的面积) Ⅱ、若 Z 为负值。那么该 Z 值以上的面积为 Z=0 到 Z=无穷大之间的面积(即 0.5)+(Z=0 到 该 Z 之间的面积) b、某 Z 值以下的面积(左侧面积) Ⅰ、若 Z 为负值。那么该 Z 值以下的面积为 Z=0 到 Z=无穷大之间的面积(即 0.5)—(Z=0 到该 Z 之间的面积) Ⅱ、若 Z 为正值。那么该 Z 值以下的面积为 Z=0 到 Z=负无穷大之间的面积(即 0.5)+(Z=0 到该 Z 之间的面积) 2、 已知面积求 Z 值 1)求 Z 值以上或以下某一面积相对应的 Z 值

2)求与正态曲线上端(右尾、右端)或下端(左尾、左端)面积相对应的 Z 值 3)求与正态曲线中央部位某一面积相对应的 Z 值。先将已知面积除以 2 查找相应的 Z 值 3、 求 Z 值或 P 值的近似法、平均法与内插法 ① 近似法 ② 平均法 ③ 内插法 据 Z 值求 P 值: P 值 = P1+(Z—Z1) (P2—P1)/(Z2—Z1) 其中:Z1 为最接近且小于已知 Z 值的那个 Z 值 P1 为 Z1 的对应面积值 Z2 为最接近且大于已知 Z 值的那个 Z 值 P2 为 Z2 的对应面积值 如:求 Z 值为 2.587 以下的面积。 据 P 值求 Z 值: Z 值 = Z1+(P—P1) (Z2—Z1 )/(P2—P1) 其中: P1 为最接近且小于已知 P 值的那个 P 值 Z1 为 P1 的对应 Z 值 P2 为最接近且大于已知 P 值的那个 P 值 Z2 为 P2 的对应 Z 值 如:求 P 值为 0.45 的面积对应的 Z 值 练习:求 Z=1.055 对应的面积;求面积 P=0.3516 所对应 Z 值。 四、正态分布曲线下的面积的应用 (一)推求考试成绩中特定区间的人数(据 Z 值求面积) 1、先明确是根据 Z 值求面积还是根据面积求 Z 值。如果是第一种情况,就将原始分数 X 值 转换成标准分数 Z 值 2、据附表 1,按照 Z 值寻得各 Z 值对应的面积。 3、将面积比率乘以总人数。 例 1, 某班 48 个学生, 语文测验分数假如呈正态分布, 其平均分为 80 分, 标准差为 10, 问: 从理论上说,70 分至 88 分之间应当有多少人? (二)推求考试成绩中某一特定人数比率的分数界限(据面积求 Z 值) 例 1 ,某次测验是正态分布,平均分为 72,标准差为 6,问在平均数上下多少分中间包括了 95%的学生?(99%的学生) 例 2 某项职业录取考试(如公务员) ,在参加考试的 1600 人中准备录取 200 人,考试分布接 近正态分布,平均分为 74,标准差为 11,问录取分数线应是多少? (三)确定按能力或成绩高低进行等级分组时的各组人数 1、 假定正态分布基线上(-3s—3s)之间 6 个标准差范围内包含全部学生,然后用 6S 除以想要分组或者评定等级的数目,以确定各等级组的临界 Z 值。 2、 据各等级两个 Z 值分界,查正态表寻得两个 Z 值之间的面积即各等级的比率。 例 1 如果 100 个学生的某种能力呈正态分布,拟将其分成优、良、中、差四个等距的等级 组,问各等级组应有多少人? (四)将等级评定结果转化为连续变量型分数 步骤:P169 例题见 P169-171 (五)确定测验题目的难易度 P171-172

课后作业:P194-195:1、2(问题 1) 、4、7、10、13(全距定为平均数上下 6 个标准差)

第七章参数估计 教学目的:了解统计推断的意义和基本内容;掌握随机抽样的原则、方法和样本容量确定的 标准;掌握抽样分布的概念、标准误差;熟练掌握参数估计原理、统计假设检验原理。 教学重点:随机抽样的原则、方法;抽样分布和标准误差;参数估计原理、统计假设检验原 理。 教学方法:讲授法讨论法 一般说来,统计推断的内容由两部分组成:一是参数估计,二是假设检验。在讨论参数估计 这种统计推断方法之前,有必要先弄清统计推断的一些基本问题。 第一节统计推断的概述 一、统计推断的涵义 就是根据样本提供的信息,在一定可靠性程度上,对相应总体特征所进行的估计或推测。由 于?? 二、统计推断的意义(必要性) 统计推断是由样本推断总体, 由部分推断全体, 由已知推断未知的统计理论和方法。 根据?? 统计推断的意义产生于抽样研究。 这是因为, 科研的最终目的在于发现某一类事物全体的本 质特点和规律,但由于受各种客观因素和条件的制约,比如??,因此,当对一类事物的每 个个体进行研究几乎不可能时, 就只能进行抽样研究, 即从总体中抽取若干个个体组成样本, 以便借助样本资料具有的特征,如-——集中趋势、离中趋势和相关程度等,由此及彼,由 表及里地认识相应总体的特征。 然而,是不是知道了样本统计量,就能马上知道总体参数呢?显然不是。实际上,样本统计 量与总体参数通常是不相等的。——样本平均数??.在对样本的研究对象进行的实验处理 与抽样设计合理的前提下,究其原因,有两种可能:一是,可能产生了实验效应(样本对象 受到特殊因素或条件的制约)--样本的性质特征与总体的性质特征有本质差异,导致样本发 生了质的变化,所以与总体大不一样;二是,可能产生了抽样误差,使样本统计量与总体参 数有了差异---但样本的性质特征与总体的性质特征没有本质差异。 到底这种差异是由上述哪 一种原因造成的?这就必须依据一定的方法和原理进行统计推断。如果通过统计假设检验, 排除第一种可能,那么就可推断,差异原因是由抽样误差造成的;如果通过统计假设检验, 排除第二种可能,那么就可推断,差异原因是由实验效应导致的。并在此基础上,对导致差 异的实验因素作进一步分析,探寻规律性的认识。 三、统计推断的前提 由于统计推断一般只能通过--对一个样本的分析结果,即得到的有关统计量所反映的事物特 征,去推断相应总体是否也具有同样的特征。因此,进行统计推断的前提是: 首先, 要求赖以推断总体的样本必须是随机样本。 如果推断总体的样本是特殊的、 非随机的,

就难以保证统计推断的有效性。 因此, 通过随机抽样获得的样本, 是统计推断有效性的前提。 关于随机抽样的有关问题?? 其次, 要明确样本统计量的分布形态 (分布规律) , 以便确定推论正确或错误的概率是多少。 比如,要依据样本的平均数去推论总体的平均数(参数之一)?? 第二节抽样分布 一、抽样分布的概念 指样本的某种统计量的概率分布。 即把某种统计量看作随机变量, 这种随机变量的全部可能 值所形成的分布, 就是该种统计量的抽样分布。 例如: ??。 为进一步明确抽样分布的概念, 须注意区分下述三种性质不同的分布: 1、总体分布:总体内个体数值的频数分布 2、样本分布:样本内个体数值的频数分布 3、抽样分布:指某种统计量所有的可能值构成的概率分布 例如,将某市 600 个学生数学竞赛的分数作为一个总体,?? 二、抽样分布的主要统计指标 总体分布和样本分布都有描述其分布特征的统计指标和计算方法。 就抽样分布而言, 同样有 描述其分布特征的统计指标和计算方法。仅就平均数的抽样分布来看,常用的有以下几种: (一)用平均数抽样分布的平均数来描述其集中趋势 用表示, (二)用平均数抽样分布的标准差(标准误 SE——Standard Error)来描述其离中趋势 用 SE 表示 通常用平均数抽样分布的标准误 用表示标准差抽样分布的标准误 用表示比率抽样分布的标准误 用表示相关系数抽样分布的标准误 各种统计量的标准误的计算变化较多, 通常要根据所抽取的样本容量的大小和抽样分布的形 态不同,而采用不同的公式计算,并且,标准误的大小将直接影响到统计推断的可靠性。这 是同学们在以后的学习中,尤其要注意的。当然,在 SPSS 中会自动处理。 三、抽样分布的形态 (一)呈正态分布和渐近正态分布 1、样本平均数抽样分布的形态 该问题阐述的是:平均数抽样分 布呈正态分布和渐近正态分布的 几种情况,揭示了样本平均数抽样分布与总体分布在形态上的关系。 在前面的讨论中,我们已经明确了:如果总体服从正态分布,那么来自总体的样本中随机变 量的取值转化为标准分数后,其取值范围大致是-3 ━━3 。样本中随机变量的取值落在某 个区间的概率如下: 在Z 在Z 在Z 在Z 在Z = + 1 内有 68.27% = + 1.96 内有 95% = + 2 内有 95.4% = + 2.58 内有 99% = +3 内有 99.73%

于是,总体分布和样本分布情况下随机变量的取值落入的区间,可用通式表示为: 总体分布中某一个随机变量的取值落入的区间为: 样本分布随机变量的取值落入的区间为: 以这样的思想为基础, 在平均数抽样分布中, 如果平均数抽样分布呈正态分布或渐进正态分布, 那么样本平均数这 一随机变量的取值落入的区间就应该是: 接下来的问题是样本平均数的抽样分布在哪些情况下会呈正态分布呢? 平均数抽样分布呈正态分布或渐进正态分布分 3 种情形 (注意: 总体分布形态——是否正态、 总体方差——是否已知和样本容量——是否大于或等于 30,三个条件的变化) 凡是?? 1)当总体分布为正态,总体方差已知时,无论样本容量 n 的大小,样本平均数的抽样分布 为正态分布。这时标平均数准误的计算公式为 2)当总体分布为正态,总体方差未知时,只要样本容量大于或等于 30,样本平均数的抽样 分布为近似正态分布。这时平均数标准误的计算公式为 3)当总体分布为非正态或未知,但总体方差已知时,只要样本容量 n 大于或等于 30,则样 本平均数的抽样分布为近似正态分布。这时平均数标准误的计算公式为 2、样本平均数抽样分布的特征 随机变量的分布形态特征是由平均数和标准差决定的。 标准差的大小--表达或决定正态分布曲线的“高矮胖瘦”程度,标准差越大曲线越“矮胖” , 数据越分散(越远离平均数) ,标准差越小,曲线越“高瘦” ,数据越集中(越靠近总体平均 数) ; 平均数的大小--表达或决定正态分布曲线的位置, 当较小时, 正态分布曲线左移, 当较大时, 正态分布曲线右移。 该问题阐述的就是:决定样本平均数抽样分布形态特征(形状和位置)的两个重要参数--样本平均数的平均数和样本平均数的标准差。 1)样本平均数的平均数等于总体的平均数 2)样本平均数的标准差等于总体的标准差除以样本容量的算术平方根。 (二)呈 t 分布(P185-187;spss 中使用最多的) 1、t 分布的基本理论 ?? (1)t 分布(学生氏分布)的基本概念 所谓 t 分布,是指取自同一总体,且容量相同的小样本(这里的小样本是相对的)的抽样分 布。t 分布是一种关于小样本的抽样分布,是统计分析中运用较多的一种抽样分布。 (2)t 分布曲线的特点: 如果??P185 A、 两侧对称,曲线峰形较狭, 两尾翘得略高 B、曲线的形态随样本容量 n 的大小而变化。当样本容量比较小时,曲线低平,当样本容

量越大时,越接近正态分布。 (3)t 值 在 t 分布曲线中?? 即 t 值的意义相当于正态分布中的 z 值,表示某个样本平均数所处的位置,即它与样本平 均数的平均数(总体平均数)的距离有多少个(标准误) 。 (4)自由度及其意义 自由度是决定小样本分布特征的一个重要因素, 它是统计运算与统计推断中变量值独立自由 变化的数目。用符号“df”表示,它与统计运算和推断中样本容量和限制因素的个数有关。 自由度的确定通常有下面两种方法: A、 在统计计算过程中, 自由度的个数等于样本容量 n 减去限制因素的个数。 n=5,平均数 6, 若前 4 个数可任意定为 3、9、7、6,则第五个数必须是 5。因为受总和 30 这 1 个条件的限 制,所以自由度为 n-1=4 B、 在推断统计过程中,看估计总体参数时,所用统计量的个数 样本容量减去所用统计量的个数 ?? 需要注意的问题是,为什么在小样本的统计值 t 的计算和统计推断中要用自由度如代替 n 呢? 这是因为如果样本 n 的数目太少,在估计总体标准差时,用 n 作为分母就会低估偏差,即 S 偏小。若改用,就可增大 S,即 S 增大,于是降低估计偏差。至于<, 统计学家已经证明 了这一点。 尽管在大样本中也存在同样的情况, 但由于 n 的数目较大, 分母用 n 和用所得结论差异不大。 而当 n 的数目较小时就必须用自由度 df。 可见,在 t 分布这种小样本分布中,自由度就具有非常重要的意义。 (5)t 分布与正态分布 的异同 通过这样的比较可进一步明确 t 分布的特点。 A、 相同点: Ⅰ、两者平均数都位于中央,在平均数这一点有单一的高峰 Ⅱ、曲线两侧对称,且从中央向两侧逐渐降低,尾线无限延长,终不与底线相交 Ⅲ、分布的左侧是负值,右侧为正值,t 变量取值与 Z 变量取值都在负无穷大到正无穷大 B、 不同点: Ⅰ、 t 分布在平均数这一点上的峰度更尖峭, 尾部更高, 即扩展程度大于正态曲线, 并且 n 或 df 越小,扩展越大 Ⅱ、正态曲线的形态不随 n 的大小而改变,而 t 分布曲线却有很多,它的形态随 n 或 df 的 大小而不同。样本容量或 df 越小,分布的离散程度越大,标准误越大,同时,它和正态分 布的形态也相差更大 Ⅲ、随着 n 或 df 变大,t 分布逐渐接近正态分布,当 n 为无穷大时,t 分布曲线和正态曲线 重合。 因此,可以得出这样的结论:正态曲线是 t 分布曲线的极限。 (6)t 分布表的使用 A 、表内左列、最上面一行、最下面一行数值的意义 B 、查 t 分布表的两种情况

一是根据自由度和面积即概率查 t 值。如, 二是根据自由度和 t 值查面积即相应概率。如, 2、总体方差未知时,样本平均数抽样分布的情况(t 分布的两种情况) (1)当总体为正态,但总体方差未知,且容量小于 30 时,则样本平均数的抽样分布为 t 分布。 = (2) 当总体分布为非正态或者分布形态不清楚, 且总体方差未知时, 只要样本容量大于 30, 则样本平均数的抽样分布为近似正态分布,但同时也近似 t 分布 = 在上述 t 分布的两种情况下,样本平均数与总体平均数有如下关系: 若既为近似正态分布,又为近似 T 分布,最好按照 T 分布理论进行处理。 因为 t 分布的概率计算更为精确。 正因为如此,在 SPSS 中使用较多的是 t 检验的又一原因是:把样本平均数的抽样分布为近 似正态分布的情况,均按照 t 分布处理。 (因为总体分布情况一般未知;再有,抽取的样本 即便大于 30,但相对于容量很大的总体而言,也只能算是小样本。 ) (三)样本平均数与总体平均数离差统计量的形态 1、当平均数抽样分布为正态分布,或者渐进正态分布时,样本平均数与总体平均数的离差 统计量(常用 Z 值表示)也服从正 态或渐进正态分布。 其含义是,某个样本平均数与距离总体平均数有多少个标准误,或者说,某个样本平均数会 在总体平均数附近多少个标准误的范围内出现。请注意体会理解与 的异同。 因为样本平均数呈正态或渐近正 态分布,所以其 Z 值即标准分数 就呈标准正态分布。如果 Z 值服从标准正态分布,那么,我们就可据此推断出:某个样本平 均数会在总体平均数附近多少个标准误的范围内出现的可能性大小即概率,用通式表示为: 其意义是: 如果上述条件满足, 那么某个样本平均数会在总体平均数附近多少个标准误的范 围内出现的可能性大小即概率为 100% (Z 为正负无穷大) 相反,我们能否据此推断出总体平均数将会在某个样本平均数附近(上下或左右)什么样的 范围内出现的概率呢?如果能解决这个问题, 我们就能根据进行随机抽样调查得到的一个样 本的平均数去推断该样本所从属的总体平均数落入某区间范围的概率了, 从而就可解决统计 推断的可靠性问题,以及样本平均数与总体平均数差异的两种原因到底是实验效应造成的, 还是抽样误差造成的。 这实际上就是我们在抽样分布这一节中前面所有讨论的逻辑终点, 即 我们最终想要解决的问题! 那么,到底能否据此推断出总体平均数将会在某个样本平均数附近(上下或左右)什么样的 范围内出现的概率呢? 回答当然是肯定的。对下列通式仅仅进行简单移项处理 就可得到 这就是:总体平均数将会在某个样本平均数附近(上下或左右)波动的范围内出现的概率为 100%(Z 为正负无穷大)

依据上述分析和正态分布的规律 当时, 总体平均数将会在某个样本平均数附近(上下或左右)波动的范围是: 并且在该范围内出现的概率为 95% 换句话说,前述条件满足的话,有 95%的可能性总体平均数将会在某个样本平均数附近(上 下或左右)波动的范围是: 显然,这也是作出这种推断的可靠性程度,也将作为前述 2 种差异原因判定的统计依据(后 面在加以讨论) 。 同理,当时,总体平均数将会在某个样本平均数附近(上下或左右)波动的范围是:?可能 性为? 2、当平均数抽样分布为 t 分布,样本平均数与总体平均数离差的统计量(即 t 值)也服从 t 分布。 其含义是, 样本平均数距离总体平均数有多少个标准误差, 或者说某个样本平均数会在总体 平均数附近(左右)多少个标准误的范围内出现。 t 值服从 t 分布。如果知道了某个样本统计量呈 t 分布,其 t 值也服从 t 分布,根据 t 分布的 概率理论,可在一定概率要求下依据 去推论总体平均数在样本平均数附近波动的区间范围。即:? 当然,如果其它的样本统计量的分布情况确认后,也可依据上述“以样本平均数推论总体平 均数” 的思路寻得其接近相应总体参数的概率, 或者说在一定概率要求下寻得其接近的相应 总体参数,如,以样本的标准差、相关系数或比率等去推论相应的总体参数。

第三节参数估计 根据样本信息?? 一、参数估计的基本原理 根据样本统计量对相应总体参数所作的估计叫总体参数估计。 又可分为点估计和区间估计两 种形式。 (一)点估计 1、点估计的概念 指用样本的某一统计量的确定值来估计相应总体参数值的方法。例如: 2、点估计量的评价标准(略.自学) (1)无偏性 (2)一致性 (3)有效性 (4)充分性 3.点估计的优缺点 优点:意义简单明了,使用方便。缺点:由于误差的存在,因而容易得到错误的信息,并很 难发现错误;同时,也不能指出错误和正确的概率各有多大。为了克服这一缺点,解决这样 的问题,又提出了参数估计的另一种形式——区间估计。 (二)区间估计 1.区间估计的几个概念

讨论:甲乙两人相遇?? 精准性与可靠性之间有怎样的关系? (1)区间估计 所谓区间估计,就是以样本统计量的抽样分布形态为理论依据,并按一定概率要求,由样本 统计量的值去估计总体参数值的所在范围。如:天气预报 区间估计也同样存在优缺点: 缺点:不如点估计那样能推断出总体参数的精确值是多少。 优点: 能用数轴上的一段距离表示总体参数可能落入的范围且还能指出正确率 (或错误率) 。 因为当?? (2)置信区间与置信度 置信区间:指在某一置信度下,总体参数所在的区域距离或区域长度。总体参数所在的范围 界限称为置信界限。 置信度:指估计总体参数落在某区间正确的概率或可能性,也就是区间估计的可靠程度。置 信区间越小或窄(推断的精准性越高) ,置信度越低(出错的可能性越大) ;反之? 通常,置信度用概率 1-а 表示;而估计时允许犯错误的概率称为显著性水平,通常用а 表示。а 的值越大,犯错 误的可能性越大,显著性水平越低。а 的大小是根据研究的需要来确定的。 当显著性水平а 确定时,?? 接下来的问题是,显著性水平а 、置信度与置信区间三者有怎样的关系? 先尝试比较:在正态分布前提下,置信度分别为 99%和 95%时,依据同样的样本信息推断总 体参数的置信区间大小 如:5-4----5+4 的范围是? 5-1----5+1 的范围是? 请同学们尝试归纳出а 、置信度与置信区间三者的关系。 再请同学们判断以下命题:?? 请同学们注意:估计正确的可能性(置信度)+估计错误的可能性(显著性水平)=100%=1 2、区间估计的基本原理 区间估计能解决总体参数在某一样本统计量附近的范围大小和正确估计的概率两个问题。 运 用区间估计的方法对总体参数进行区间估计,必须首先明确相应统计量的分布形态和特征, 从而在一定置信度下, 推测样本统计量将落在以总体参数为中心的一个什么样的区间内, 然 后通过对数学公式的简单变形(移项)就可在同样的置信度下,推断出在这个样本统计量附 近波动的总体参数所在的区间。 根据前面的讨论,我们已经明确: 在正态分布或近似正态分布情形下的区间范围是: 在 t 分布情形下即 3、区间估计的一般步骤 A、根据样本数据计算与总体参数相对应的样本统计量的值。如, B、确认抽样分布形态,并据此确定标准误的计算公式。 C、计算抽样分布的标准误 D、据置信度要求和抽样分布形态,确定并查出与某种可靠程度相对应的临界值

E、计算总体平均数置信区间的上下限 如:在 95%和 99%的置信度下,计算总体平均数置信区间上下限的公式分别如下: 一是平均数抽样分布为正态分布或接近正态分布时,在 95%的置信度下使用的公式为: 二是平均数抽样分布为 t 分布时,在 95%的置信度下使用的公式为:

同理, 也可得到置信度为 99%时, 两种分布形态不同情况下计算总体平均数置信区间上下限 的公式分别为:

F、解释总体参数的置信区间 如果置信度为 95%, 那么所得总体参数的置信区间可解释为: 估计总体参数在该区间的概率 为: 或者

作出这种估计正确的可能性为 95%,出错的可能性为 5%;或者说冒着犯 5%错误的风险来作 出这种估计(推断或推论) 。 同样道理,如果置信度为 99%,也可用同样的方式作出解释。 二、参数估计的应用 关于参数估计在教育与心理研究中的具体应用,我们重点讨论一下: 依据样本平均数对总体平均数进行区间估计的问题。 (一)总体平均数的区间估计 1、总体方差已知时总体平均数的区间估计 …… 置信区间的计算方法是:

例题:P202 P203 例 3:某小学三年级全体学生历年来身高的标准差为 4.2cm,现从该校三年级学生中随机抽 取 40 名学生,经身体检查,其平均身高为 130.4cm,试在 99%的置信度下估计该小学三年 级全体学生的平均身高。 2、总体方差未知时,对总体平均数的区间估计 ①当总体方差未知,总体为正态分布,且样本容量 n<30 时,样本平均数的抽样分布为 t 分 布,样本平均数与总体平均数的离差统计量 t 值也呈 t 分布,因此,对总体平均数的区间估 计,按 t 分布的理论处理。 置信区间的计算方法是: 需要注意的是:t 分布情况下与正态分布情况下的区间推断有 2 点特别不同之处:?? 我们还是通过一个例题来说明,在这种情况下如何确定总体平均数的置信区间。 例 1: 某小学三年级数学测验成绩呈正态分布, 现从中随机抽取 19 名学生的成绩如下: 80, 69,82,75,92,99,67,78,83,100,82,75,69,83,78,88,95,82,74,试估计

该三年级数学测验平均成绩的 0.95 和 0.99 的置信区间。 按照前面区间估计的 6 个步骤,来确定总体平均数的置信区间。 A、 根据样本数据计算与总体参数相对应的样本统计量的值。 据样本数据, 算得平均数为 81.63, 样本的标准差为 9.40 。 B、确认抽样分布形态,并据此确定标准误的计算公式。 本题为:总体呈正态分布,总体方差未知,且 n=19 小于 30,故,样本平均数的抽样分布为 t 分布,因此应依据 t 分布的理论进行估计。同时要特别注意标准误的计算公式变化为: C、计算抽样分布的标准误 经计算得 2.22 D、据置信度要求和抽样分布形态,确定并查出与某种可靠程度相对应的临界值 这时需要注意的是,呈正态分布时,仅仅根据置信度 0.95 或 0.99 就可在正态分布表中查得 临界 Z 值,但呈 t 分布时,要在 t 分布表中查得临界 t 值,必须依据两个条件:置信度和自 由度,并且查表时还需要把置信度转换为а 即 1-置信度=а ,а 才是 t 分布表中的临界 t 值 对应的面积。 因此,当 df=n-1=18,置信度为 0.95 时,а =0.05,于是查 t 值表得 t(18)0.05/2=2.101 ;当 df=n-1=18,置信度为 0.99 时,а =0.01,于是查 t 值表得 t(18)0.01/2=2.878 E、计算总体平均数置信区间的上下限 平均数抽样分布为 t 分布时,在 95%的置信度下使用的公式为: 经计算得,0.95 的置信区间为 76.96——86.29 置信度为 99%时,t 分布情况下计算总体平均数置信区间上下限的公式为: 经计算得,0.99 的置信区间为 75.24---88.02 F、解释总体参数的置信区间 即三年级数学测验平均成绩(总体平均数)在 76.96——86.29 之间的概率为 95%,作出这样 的推断,犯错误概率为 5%;在 75.24---88.02 之间的概率为 99%,作出这样的推断,犯错误 概率为 1% 。 例 2 : 从 某 小 学 三 年 级 随 机 抽 取 12 名 学 生 阅 读 能 力 得 分 分 别 为 28,36,22,32,34,30,33,25,31,33,29,26.试估计该校学生阅读能力 95%的置信区间。 例 3 某校教务主任检查高一化学课程的情况,除随机听课、检查作业外,还随机抽取 6 名学 生的化学考试成绩,即 91,83,76,72,56,42.试问,这位教务主任将怎样估计全年级学 生的化学成绩? ②当总体方差未知,总体为非正态或者分布情况不清楚,只有 n 大于 30 时,才可使用样本 平均数的抽样分布理论来估计总体平均数。 由于此时样本平均数的抽样分布既呈正态分布也 呈 t 分布,因而既可依据正态分布理论,也可根据 t 分布理论来估计总体平均数,两者都是 近似值,但后者更为精确。 3、关于使用平均数标准误应注意的问题 ① ② ③

(二)总体比率的区间估计(自学) P216-218

第四节抽样设计 在教育与心理现象的研究中?? 推断的可靠性与下列几种因素有关: ①所获得样本数据的质量即样本数据能否准确反映所观察或测试的某种事物属性的实际情 况。这又同观察的方法、试卷的质量以及测验实施时对无关因素的控制有关。 ②运用数据分析处理的统计方法的恰当性和准确性。 ③样本对总体的代表性即能充分地反映总体的情况。 这又与抽样的随机性和样本规模即容量 有关。 可见,?? 一、随机抽样的涵义 从总体中抽取一定数量的个体组成样本时, 每一个体的抽取是独立的, 并且机会均等。 其中, 每一个体?? 二、随机抽样的作用(意义)P417-418 三、随机抽样的方法 (一)简单随机抽样 即单纯随机抽样,如果总体中每一个体被抽取的机会均等(也叫抽样随机性)并且每一个体 是否被抽取与其它个体是否被抽取,彼此间无任何牵连。具体方法如下: 1、抽签法 2、随机数码表法(附表) (二)机械抽样 又叫等距抽样,就是把总体中的 所有个体按一定顺序编号,然后依固 定的间隔距离取样(间隔大小视所需 样本容量与总体中个体数目——两 者的比率而定) 。如?? (三)分层抽样 也叫分类抽样或类型抽样,它是 按与研究内容有关的因素或指标,先 将总体划分成几部分(即几个层) , 然后从各部分(即各层)中进行简单 随机抽样。 1、 各层的人数比率分配 如:对某校 800 个学生的品德情况进行了解,拟取 40 个学生作为样本。那么,可先根据一 定标准将 800 个学生分成四部分:优(160 人) ,良(320 人) ,中(240 人) ,差(80 人) 。

然后从各部分中用单纯随机抽样或机械抽样的方法,各抽 40/800=1/20,按照这一比率在上 述四层中抽取相应人数,即:优等中抽取的人数为 160*1/20=8(人) ;良等中抽取的人数为 320*1/20=16 (人) ; 中等中抽取的人数为 240*1/20=12 (人) ; 差等中抽取的人数为 80*1/20=4 (人) 。最后就可组成容量为 40 的一个样本。 2、最优配置法(自学) (四)整群抽样 从总体中抽出的研究对象,不是以个体为单位而是以整群为单位的抽样方法。 例如,要了解某市某年物理学科高考的成绩,可以以学校为单位进行抽样。这种抽样方法就 是整群抽样 在整群抽样时,为了增强样本对总体的代表性,弥补整群抽样的不均匀性,可以与分层抽样 相结合。也就是先按一定的标准把全市所有中学分成几部分(即几类或几层) 。比如,可以 把所有的中学按重要性程度分为三类:市重点、区重点和普通中学。然后根据样本容量与总 体中个体数目的比率,从三类学校中抽取若干所学校组成整群抽样的样本。如从全市 100 所学校中抽取 20 所学校的样本,那么比率为 1/5,假定市重点 10 所、区重点 25 所和普通 中学 65 所, 那么按照 1/5 的比率, 市重点抽取 2 所 (10*1/5=2) , 区重点抽取 5 所 (25*1/5=5) , 普通中学抽取 13 所 (65*1/5=13) 。于是抽取的 20 所中学的学生某年物理学科高考的成绩就 是采用整群抽样方法得到的样本。 这种方法,在大规模的调查研究中常用,因为相比而言更节省人力、物力和财力。 上述四种方法, 简单随机抽样和分层抽样是最基本的两种方法, 而机械抽样和整群抽样为特 殊情况下的两种抽样方法。

三、样本容量的确定 样本对总体的代表性除要求抽样 的随机性外,还需要一定的样本规模 来保证。因为在其它条件相同时,样本越小,抽样误差越大;样本越大,抽样误差越小。为 此,在抽样研究之前,往往需要知道样本容量数定为多少才合适。如果样本容量数不能按科 学的方法确定下来,那么我们在抽样时就可能抽得太多,或者抽得太少。如果太多,虽然不 会影响统计结果,但却造成不必要的人力、物力和财力的浪费,并且,样本容量和抽样误差 及推断的可靠度与准确性之间不呈线性关系, 因为当样本容量增大到一定程度, 抽样误差减 小的速度会越来越慢,而推断的可靠度与准确性增强的速度也会越来越慢,这也说明,并不 是样本容量越大越好。如果抽得太少,又会使调查结果误差很大,从而影响研究结果的准确 性。这就需要我们制定一个标准,事先规定一个误差范围和一定可靠度要求,再根据这两个 既定的已知条件通过有关公式求出与规定相符合的样本容量。 当然, 对于总体容量并不太大 的研究对象,不存在这个问题,因为,还可以进行全面调查。 样本容量的确定主要应考虑:总体数目;总体异质度;抽样的精确性(允许的估计误差限) (一)估计误差限与样本容量的确定方法(略) (二)样本容量确定方法的应用(略) 1、由样本平均数估计总体平均数时样本容量的确定 2、由样本比率估计总体比率时样本容量的确定

当总体比率未知时,用 代替 ***另外,介绍一种简便易行的适合大家常用的问卷调查的样本容量的确定方法。即: 样本容量=问卷(量表)题目数╳5

*** spss 中如何从实际采集的样本数据来进行总体均值和总体方差这两个参数的点估计与区间 估计。P 83 _P 85(spss 配套数据 EG2-1 中学家长问卷) 课后作业与练习: 1、名词解释:统计推断、抽样分布、总体分布、样本分布、参数估计、点估计、区间估计、 置信度、置信区间、自由度、显著性水平、机械抽样、分层抽样、整群抽样、T 分布。 2、统计推断的前提有哪些? 3、随机抽样的方法有哪些?试举例说明。 4、什么是 t 分布,它与正态分布有何异同? 5、区间估计的基本步骤是什么? 6、区间估计的基本原理是什么? 7、 点估计和区间估计各有哪些优缺点? 8、 影响统计推断可靠性的因素有哪些? 9、 计算题:P222-223 第 5、6、7 题

第八章参数的假设检验 教学目的: 理解统计假设检验的基本思想和一般原理; 掌握统计假设检验中的两种方式及两 类错误;掌握两类平均数差异的显著性检验及比率的假设检验 教学重点: 统计假设检验的基本思想和一般原理以及一般步骤; 统计假设检验中的两种方式; 两类平均数差异的显著性检验及比率的假设检验。 教学方法:讲授法讨论法 除上一章所讨论的参数估计外, 假设检验是统计推断理论和方法的又一非常重要的内容。 假 设检验又包括参数的假设检验和非参数的假设检验。 参数检验是在总体分布形式已知的情况下, 对总体分布的参数如均值、 方差等进行推断的方 法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定, 此时参数检验的方法就不再适用了。 非参数检验正是一类基于这种考虑, 在总体方差未知或 知道甚少的情况下, 利用样本数据对总体分布形态等进行推断的方法。 由于非参数检验方法 在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。简单地说,参数检 验其实检验的是参数也就是两个或几个统计量间的差异,而非参数检验其实检验的是分布是 否相同而不是看参数或统计量的差异。

两者的具体差异如下表: 参数检验和非参数检验对照表 参数检验 非参数检验 1.检验对象 总体参数 总体分布或非参数 2. 检验前提 正态分布 总体分布情况不明 3.数据类型 连续数据(等距数据、比率数据) 连续数据、离散数据(称名数据、顺序数 据、等距数据、比率数据) 4.检验的灵敏度 高 低 非参数检验主要依据样本数目与样本间关系分为常见的 8 种。 本章讨论的是参数的假设检验,之所以要对总体参数进行假设检验,这是因为,我们在处理 调查和实验数据时, 除了用样本统计量对相应总体参数进行估计外, 还经常要对一个统计量 与一个总体参数或者两个统计量之间的差异进行比较。如,两个平均数,两个相关系数、两 个比率和两个方差之间的差异。 这些差异一般又分为两种情况: 一是样本统计量与相应总体 参数之间的差异; 二是两个样本统计量之间的差异。 那么如何对这两种情况下的差异进行统 计假设检验和推断呢? 就样本统计量与相应总体参数之间的差异这种情况而言, 进行统计假设检验和推断的思路和 意义是: 如果我们通过统计假设检验, 确认样本统计量的值与相应总体参数值有差异并且这种差异超 过了统计学所规定的某个量化标准, 就表明这种差异已不属于抽样误差, 而表明该样本统计 量的值与总体参数值有本质的差异,并由此推论,该样本已基本不属于所比较的总体(原总 体) ,而是来自另一总体(新总体) ,从而证明差异的产生是由实验效应引起的而非抽样误差 造成的。 比如,在教法改革方面的实验中,要探明教学方法是否有效,就要首先确认研究对象如徐州 市小学二年级在实验前的平均成绩(如实验前的统考平均成绩,假定为 83 分) ,然后进行随 机抽样,获得随机样本作为实验班,进行随机实验(实施新的教学方法) ,实施一年或几年 后,测查样本实验班的成绩,可得到一个平均成绩,这就是样本统计量的代表值(假定为 85 分) 。如果样本统计量的值与该样本所在总体的总体参数值(实验前全市小学二年级的统 考平均成绩)产生了差异,如 85——83,那么不能仅仅依据这 2 分之差去推断所采用的教 法有效,而必须根据这 2 分的差异,按照统计推断的理论和方法进行统计假设检验,只要这 2 分之差达到统计学规定的某一量化标准,就可推论该样本已经不属于实验前所在的总体 (平均成绩为 83 的总体, 即原总体) , 而是来自另一总体 (新总体, 即平均水平更高的总体) , 从而证明这 2 分之差不是由抽样误差造成的, 而是由实验效应引起的, 即施行新教学方法引 起的。进一步说明新教学方法有效,值得推广! ! ! ! 反之, 同样的思路和方法可推论新的教学方法无效——尽管采用新的教学方法前后有 2 分之 差,但这种差异是由抽样误差造成的。 以上是对样本统计量与相应总体参数的之间的差异这种情况, 进行统计假设检验和推断的思 路及意义。 另一种情况是, 就两个样本统计量之间的差异这种情况而言。 进行统计假设检验和推断的思 路及意义又是怎样的呢? 如果我们通过检验, 确认两个样本统计量之间的差异显著——达到了统计学上规定的量化标 准,那么也可推论这两个样本所分别来自的总体的总体参数之间也存在本质的差异。比如, 要研究新旧两种教学方法是否有差异, 就可对两种教学方法下条件相同的随机样本进行比较, 如果新教学方法下的样本统计量的值与旧教学方法下的样本统计量的值之间的差异达到规 定的量化标准, 就可推论各自所代表的总体也有显著差异, 从而证明新教学方法比旧教学方

法更好。 同样的道理, 即便两样本统计量的值, 表面上有差异, 但没有达到规定的标准, 就可推论新、 旧两种教学方法差不多,也就没有必要采用新的教学方法。 我们将在??

第一节统计假设检验的基本原理 一、统计假设检验的基本思想 统计假设检验的基本逻辑思想或逻辑思路:提出虚无假设,证伪,再确认研究假设是否成立 (反证法) 。 它与一般的科学研究相比, 相同点在于: 都是根据已知信息去验证和推断未知。 不同点在于:一般的科学研究是“证实” ,即根据已知信息去证明所提出的假设是真实的、 一致的、相符合的。相反,如果提出的假设与已知信息不符合、不一致、差异较大,那么就 证明该假设是不对的、不真实的;而统计假设检验是“证伪” ,即根据已知信息去证明所提 出的假设是虚假的、不真实的、是错误的,那么反过来就可证明——与所提出的假设相“对 立的假设”就是真实的、正确的,故也叫反证法。 可见,不管通过哪一种方式,要证明的结论是相同的,两者的根本差异在于得出结论的方式 (路径或思路)不同:一般的科学研究是直接证明所提假设是否成立(陈老师是好人) ,而 统计假设检验是先证明与所提假设相反的假设(陈老师是坏人)是否成立,然后再间接证明 与其对立的假设(陈老师是好人)是否成立。 讨论:西方国家与我国法律对犯罪嫌疑人罪行的推断有何不同? 请男女同学分别采用两种不同思路证明“陈老师是好人”这一命题。 二、假设与假设检验 所谓假设, 就是根据已知理论与事实对研究对象的未知情况所作的假定性说明或猜想。 统计 学中的假设一般专指用统计学术语对总体参数所作的假定性说明或猜想。 在进行任何一项研 究时, 研究者对研究结果必然有一个期望, 并希望根据已有理论和经验去证实预先作出的假 设,这种假设叫科学假设或者希望假设,用统计学术语表示时叫研究假设或者备择假设、有 差假设,记作 H1(Hypothesis) 在统计学中,因为无法对 H1 的真实性直接检验,需要建立与之对立的假设,称为虚无假设 或原假设、无差假设、零假设,记作 H0 。建立与研究假设 H1 对立的虚无假设 H0,目的是 运用反证法, 即从虚无假设出发, 希望通过从样本中得到的有关信息来说明虚无假设是假的, 会被推翻的,从而证实----希望接受的研究假设是真的。 例如,某班学生数学成绩的平均分为 75.6 分(总体平均数κ ) ,标准差为 7.4 分,现在为了 改进教学方法, 从这些学生中随机抽出 30 名学生进行新教学方法的实验, 结束时这 30 名学 生的测验成绩平均为 80 分(样本平均数) ,试问这种新教学方法的效果怎样? 讨论:应怎样建立研究假设和虚无假设?

研究假设 H1 是——研究者希望证实新教学方法有效即期待实验有效果,也就是希望样本的 平均分 80 分()与该样本所在的总体的平均分 75.6 分(κ )这两者间不仅仅是表面分数上 的差异,而是在实验前后发生了真正的或本质的差异,可用符号表示为, H1:κ 或者 80 75.6 由于无法直接证明κ 即不能直接证明两者间存在本质差异, 所以, 现在就要考虑建立一个与之对立的假设即虚无

假设 H0(无本质差异的假设), 即样本平均数 80 分与原总体平均数 75.6 分,只是一种表面 上的分数差异,实际上没有真正的(本质的)差异也就是说实质上两者是相等的,可用符号 表示为 H0: =κ 或者 80= 75.6 这样一来,按照证伪的思路,如果我们能够依据样本的有关信息证明 H0: =κ ,即两者间 无本质的差异这一假设是错误的、虚假的,是不可能的,从而也就间接证明与此对立的假设 H1:κ 这一假设是正确的、真实的,即两者间有真正的或本质的差异。 接下来的问题是,如何才能证明 H0 是错误的、不可能的?这就要根据样本信息进行假设检 验。 所谓假设检验就是从虚无假设出发, 根据样本某一统计量所遵从的概率分布情况和一个确定 的数量标准(显著性水平和临界值)来判断其(H0)是否成立(是承认还是拒绝 H0、是接 受还是否定 H0)的过程。 一种情况是,如果根据样本信息,经过检验后不得不否定虚无假设的真实性时,按照反证法 的思路, 我们就不得不承认与之对立的研究假设的真实性, 也就是要拒绝虚无假设而接受研 究假设。 另一种情况是,如果根据样本的信息,经检验后无法否定虚无假设的真实性时(不能证明 H0 是错误的)就只好接受背离研究者初衷的“残酷”现实) ,也就是不得不保留虚无假设, 而拒绝研究假设。 (直面现实) 在假设检验中,请同学们注意以下几个问题: 1、由于研究假设是否被接受,是否被选定,要视虚无假设是否成立才能确定,所以又称研 究假设为备择假设, 意即准备选择的假设。 而虚无假设也就叫原假设, 意即 “初始” 的假设。 2、因为与研究假设对立的是虚无假设,相反,与虚无假设对立的就是研究假设,两者是互 相对立的、非此即彼的关系。 3、因为假设检验的目的是验证样本样本统计量如与相应的总体参数κ 两者间有无真实的、 本质的差异, 而所建立的虚无假设是——假设两者间没有本质的差异, 它们之间即使表面上 有差异,也只是抽样误差所造成的,这时就把样本和总体的差异视为零(0)---即便表面数 值上存在差异,所以又称虚无假设为零假设。当零假设成立时,表明样本和总体没有本质的 不同, 意味着实验无效果即没有产生实验效应。 如上例中, 当通过假设检验无法推翻 H0: = κ ,就证明样本与总体没有本质的不同,也就表明新教学方法无效。因此,这时的虚无假设 又叫做无效假设。需要注意的是,这里的无效是指实验没有产生效果(效应) ,而并非假设 本身无效。 4、由于统计中的——假设检验的目的在于检验是否存在本质差异,所以这种检验又叫差异 的显著性检验。有本质差异即差异显著,无本质差异即差异不显著。这就引出下面两个重要 概念。 三、小概率事件和显著性水平 (一)小概率事件 将一次试验中发生的概率小于或等于 0.05 的事件称为小概率事件。统计学认为,小概率事 件实际是不可能的(即小概率事件实际不可能原理) 。该事件在一次试验中几乎是不可能发 生的。 需要注意的是,小概率事件虽然不是不可能事件,但在一次试验中几乎不会发生。所以在统 计检验时,一般是把 P(A)≤0.05 或 P(A)≤0.01 作为小概率事件是否发生的量化判断标 准。? 前面的内容中已经讨论过: 某一样本统计量的所有可能值形成的以总体参数值为中心的分布 就是抽样分布。我们进行的参数假设检验是依据一次性抽样、得到的是一个样本的信息,如

果一次抽样所得到的某个统计量的值——落入某区间的可能性达到了事先规定的小概率事 件是否发生的水平,我们就可据此判断小概率事件是否发生了。因此,某一样本统计量的值 在其抽样分布上落入某区间的概率小于或等于 0.05 即 5%时的这一随机事件也就是小概率事 件。 因为在随机抽样的条件下, 一次抽样就抽到了与总体参数值差异这么大的样本——即该 样本值远离总体参数值这个中心, 这种可能性是极小的, 实际中是罕见的, 几乎是不可能的。 所以就不得不承认此样本不是来自该总体,从而得出两者间有本质差异的结论。可见,小概 率事件是否出现即发生,成为判断 H 0 假设是否成立的数量化依据。 下面我们仍以前面的例子: 例如,[某班学生数学成绩的平均分为 75.6 分(总体平均数κ ) ,标准差为 7.4 分,现在为了 改进教学方法, 从这些学生中随机抽出 30 名学生进行新教学方法的实验, 结束时这 30 名学 生的测验成绩平均为 80 分(样本平均数) ,试问这种新教学方法的效果怎样?] 来讨论---如何进行假设检验, 以及说明如何运用小概率事件是否出现来判断 H 0 假设是否成 立。 建立的两个假设分别是: H0: =κ ;H1:κ 根据前面所讲的抽样分布理论,我们知道,从同一总体中随机抽出许多容量为 n(30)的样 本,那么其平均数的抽样分布服从正态分布。因总体方差已知(7.4) ,并且,如果 =κ 意即 是来自取样时所从属的总体的话,由此假设出发,下面的推论也就成立: 因为 n=30,κ =75.6, =7.4, =1.655 所以,样本平均数从理论上讲,就有 95%的可能性,应落入 这一区间,经计算即应落在之间的可能性为 95%,落在此区间外的可能性仅有 5%,也就是 说,做 100 次实验(抽取一个样本、进行一次抽样调查就是一次实验) ,有 95 次的样本平均 数应该落在该区间,而只有 5 次在该区间以外,也就是 20 次实验才可能出现“1 次在该区 间以外” 。这就是小概率事件。 现在我们来看一下为什么这就是小概率事件?或者说, 是否就表明小概率事件就发生了呢? 因为,从理论上讲,做 20 次实验样本平均数就只应当会出现在 72.6——78.84 这一区间之 外 1 次, 但实际上, 只做了一次实验——抽样一次, 样本平均数 =80 落在该区间没有呢? 80 分已出现在该区间以外,本来 20 次才能出现一次的小概率事件要发生都几乎不可能,而现 在仅一次实验,就发生了这种情况,这显然是不正常的。究其原因,推论过程本身是没有问 题的,问题的根源——只能是推论之前建立的虚无假设 H0: =κ 不对,是错误的,也就是 说,样本 =80 与总体κ =75.6,只是一种“表面上的分数差异、实际上没有差异”这样的假 设是错误的。 于是, 反过来就不得不承认样本平均数与总体平均数κ 之间有本质的差异—— =80 不是来自实验前采用旧教学方法的那个总体, 而是来自实验后因新教法的使用并已产生 实验效应的另一总体,由此说明新教学方法与旧教学方法有本质的区别,值得推广! 假如我们把例题改为: “结束时 30 名学生的测验成绩平均为 78 分() 。可以发现,78 分和 实验前的总均分 75.6 分从表面上看仍有差异,但是却刚好落入了 72.6-78.84 这一区间内, 那么可以说,本来 100 次可能发生 95 次,即 1 次有 0.95 次的可能,但是现在只随机做了一 次,就发生了 1 次,于是可认定小概率事件没有发生。那么就得接受 H0: =κ 这一假设,而放弃或拒绝 H1:κ 这一希望成立的假设,由此证明与κ 没有本质的 差异,两者间的差异仅仅是由抽样误差造成的,表明新教学方法没有效果。 这里需要注意两点: 1、 如果通过检验认为此假设是合理的, 只是说此假设在事先规定的标准下 (0.05 或 0.01) 可接受,但并不是说此假设被完全证实。 2、差异不大或差异不显著,并非没有差异,只是说在预定的差异程度的要求下,差异的意

义不大。 (二)显著性水平 由于统计假设检验的目的是确认样本统计量与相应总体参数之间的差异程度即差异的显著 性水平。 判断差异显著性水平高低的标准是小概率事件发生的水平即发生的可能性大小, 简 称显著性水平。用表示。国际上通用 =0.05 或者 =0.01,即 5%或 1%作为显著性水平;也可 以说是拒绝零假设的概率或者临界值。以显著性水平 =0.05 下的双侧检验为例,经检验,如 果大于 0.05, 表明样本统计量的值落入该概率平分在两尾端即 0.025 的概率即面积对应的正 态分布下的左右两个临界值之间, 通常称这个区间为接受区域, 于是就应当接受零假设并拒 绝希望假设。与此相反,如果经检验,等于或小于 0.05,那么表明一次抽样获得的样本统计 量的值---就落入了两个临界值之外,而这个区域正是拒绝零假设而接受备择假设的区域,通 常称为拒绝区域;同时还可以说显著性水平是统计推断时,可能犯错误的概率, =0.05,意 指 100 次中有 95 次判断正确,仅有 5 次因为偶然因素而判断不准,同理 =0.01,意指 100 次中有 99 次判断正确,只有 1 次失误;并且也可以说显著性水平是样本统计量以相应总体 参数值为中心波动在某一区间的可靠性为 95%或 99%。如果估计的可靠性达到 95%或 99% 便可认为估计正确。之所以要作出上述规定,是因为统计推断只是一种推测性判断,因此也 就不可能 100%的可靠、正确,那么达到什么样的水平才算可靠、正确呢,于是统一规定为 5%或 1%这两个表示 “水平、 程度的概率值” 。 那么, 到底什么时候用 1%?什么时候又用 5%? 在实际研究中,事先确定的显著性水平(或 P 值) ,是由研究者根据实际情况或问题需要确 定的。大多数情况下尤其是社会科学的研究均采用 0.05 或者 0.01。如果错误地拒绝 H0,对 社会或经济造成的后果是轻微的,则可以增大显著性水平的值,如 0.1,0.2 等(选定 0.1 表 明作出 100 次推断,允许犯错的次数是多少次?) ;如果后果是严重的,则可减小到 0.001, 0.005 等(选定 0.001 表明作出 1000 次推断,允许犯错的次数是多少次?) 。显著性水平一 旦确定,在抽样分布为正态分布情况下---其临界值也就确定,而在抽样分布为 t 分布情况下 ---则还得依据样本容量或自由度才能确定。 四、统计假设检验的两种方式 统计假设检验的方式有单侧检验和双侧检验之分, 到底采用哪种检验方式, 要依据对两个量 数差异方向的了解、研究者的关心程度以及研究者对研究问题有关材料的把握和经验而定。 (一)单侧检验(单尾检验) 当研究人员根据已有研究成果或对所研究的问题有一定把握时,应采用单侧检验。如,所要 研究的教学改革在其它一些学校已经取得一定成效——即差异方向实际上已经知道 (教学改 革后要好于教学改革之前, 所以就应当进行单侧检验的右侧检验。 这时建立的虚无假设和研 究假设是 右侧检验模式: H0: 0 H1:> 0 其中,表示教改后样本所从属的总体即新总体的总平均成绩(总体参数 1) , 0 表示教改前 样本所从属总体即原总体的总平均成绩(总体参数 2) 这种检验模式又叫右单尾检验模式。 假如能根据已有资料或经验确认教改后的成绩显著低于教改前的成绩, 这时建立虚无假设和 研究假设是左侧检验模式: H0: 0 H1:< 0 这种检验模式又叫左单尾检验模式。 (二)双侧检验(双尾检验)

当研究人员不关心两量数的差异方向而只关心有无差异, 或者无法根据相关研究成果确认其 差异方向时, 应采用双侧检验。 如, 不关心两种教学方法哪一种更好, 只关心是否有所不同, 或者采用一种新教学方法时, 事先也无相关研究结论证明这种教学方法好, 这时建立的虚无 假设和研究假设是 H0: 1= 2 H1: 1≠ 2 双侧检验时,显著性水平а 这个概率值被平均分配在双尾。 在实际的研究中, 通常由于变量间差异方向不清楚, 所以使用最多的还是双尾检验 (2-tailed) 。 五、统计假设检验的一般步骤 根据统计假设检验的逻辑思路,检验的一般步骤可概括如下: (一)根据问题要求选择检验方式,建立假设 如果所研究问题的两量数间差异方向有明确要求,就采用单尾检验。 当要求检验其中一个量数是否低于另一个量数或者两者相比是否有所减弱或下降, 就选用左 单尾检验。这时建立的假设是: H0: 1≥ 2 H1: 1< 2 当要求检验其中一个量数是否高于或优于另一个量数或者两者相比是否更好或有所提高, 就 选用右单尾检验。这时建立的假设是: H0: 1≤ 2 H1: 1> 2 如果对所研究的两量数间差异方向不关心、不明确,就采用双尾检验 当要求检验两者是否一致、 一样、 有差异或相同, 就采用双尾检验。 这时建立的假设形式是: H0: 1= 2;或 =κ H1: 1≠ 2;或κ (二)确定统计量的抽样分布形态与相应检验类型并计算相应统计量 常用的统计量的抽样分布形态有正态分布、 t 分布、F 分布和(卡方)分布等。与上述各种 分布相对应的检验类型分别是 Z 检验、t 检验 F 检验和检验等,计算的相应统计量就是 Z 值、t 值、F 值和值。在实际研究中,一般都需要确认样本所来自的“原总体”的总体平均 数,并根据所得样本的信息计算出, ,等 (三)根据研究问题性质选取适当显著性水平,并依据检验方式(单尾或双尾检验)确定查 表的是否平分,以寻取对应临界值。 (四)据判断规则判定并解释结果即作出检验结论

双侧 Z 检验统计决断规则表 据样本计算的 Z 值与查表得到的临界值的比较P 值 检验结果 |Z|<1.96 0.05 < P 在 0.05 显著性水平上保留 H0 拒绝 H1 1.96≦ |Z| < 2.58 0.01 < P ≦0.05 在 0.05 显著性水平上拒绝 H0 保留 H1 2.58≦ |Z| P ≦ 0.01 在 0.01 显著性水平上拒绝 H0 保留 H1

单侧 Z 检验统计决断规则表 据样本计算的 Z 值与查表得到的临界值的比较P 值 检验结果 |Z|<1.65 0.05 < P 在 0.05 显著性水平上保留 H0 拒绝 H1 1.65≦ |Z| < 2.33 0.01 < P ≦0.05 在 0.05 显著性水平上拒绝 H0 保留 H1 2.33≦ |Z| P ≦ 0.01 在 0.01 显著性水平上拒绝 H0 保留 H1

双侧 t 检验统计决断规则表 据样本计算的 t 值与查表得到的临界值的比较 P 值 检验结果 |t|< 0.05 < P 在 0.05 显著性水平上保留 H0 拒绝 H1 ≦ |t| < 0.01 < P ≦0.05 在 0.05 显著性水平上拒绝 H0 保留 H1 |t| ≥ P ≦ 0.01 在 0.01 著性水平上拒绝 H0 保留 H1 同样单侧 t 检验统计决断规则表也可得到,只是临界值在自由度没有确定时也无法确定。 下面仅以在 0.95 置信度下双侧 t 检验统计决断规则为例,阐明如何判断并解释结果。 根据双侧 t 检验统计决断规则表可知,如果实际计算出的|t|<,表明样本统计量的值在 0.05 的显著性水平上未落如拒绝区域 (即拒绝零假设的区域) 。 且概率 P 为 95%即 P=0.95>0.05, 于是作出保留零假设而拒绝备择假设的决断, 并解释为: 实验前样本所从属的总体平均数 0 与假设的 (因为在检验之前我们还不知道是否产生了实验效应, 现在只是假设其产生了实验 效应)实验后已产生实验效应的新总体平均数这两个总体是一个水平的、无显著性差异的, 表明没有产生实验效应;如果实际计算出的 ≦ |t| <, 表明样本统计量的值在 0.05 的显著 性水平上落入了拒绝区域, 而在 0.01 的显著性水平上未落入拒绝区域, 且概率为 0.01 < P ≦ 0.05。 于是作出在 0.05 显著性水平上拒绝零假设而接受备择假设的决断, 样本所属的实验前 的总体平均数与实验后假设已经发生本质变化的总体平均数在 0.05 显著性水平上有显著性 差异。下这一结论的可靠性为 95%,这时通常在实得的 t 值右上角打上一个星号*表示,如 |t|=2.3*;如果实际计算出的|t| ≥,表明表明样本统计量的值在 0.01 的显著性水平上落入 了拒绝区域,且概率为 P ≦ 0.01,于是作出在 0.01 显著性水平上拒绝零假设而接受备择假 设的决断, 样本所属的实验前的总体平均数与实验后---假设已经发生本质变化的总体平均数 在 0.01 显著性水平上有极其显著性差异。下这一结论的可靠性为 99%,这时通常在实得的 t 值右上角打上两个星号**表示,如|t|=3.94**。 第二节总体平均数的显著性检验 (单样本检验或者单总体检验) 对平均数之间的差异是否显著进行检验,包括两种类型。第一种类型是,对总体和它的一部 分进行比较, 看局部与总体的情况是否一致, 也就是对样本平均数和某个已知的总体平均数 之间的差异是否显著进行检验。 一般称其为总体平均数差异显著性检验, 又叫单总体检验 (单 样本检验) 。本节内容探讨的就是这种类型的检验;另外第二种类型是:对两个样本平均数 之间的差异, 是否显著进行比较, 并进而推断两样本所来自的相应总体的总体平均数之间的 差异是否显著, 一般把这种类型的检验称为平均数差异的显著性检验又叫双总体检验 (双样

本检验) ,这种类型的检验是教育与心理研究中最常见、最基本的类型。我们将在下一节内 容中讨论。 请同学们判断以下两种情况属于哪一种检验类型: ①?? ②?? 仅就总体平均数的显著性检验而言, 样本平均数用表示, 某个已知总体平均数用表示, 差异检验的目的就是要确定样本平均数与 某个已知总体平均数间的差异是否由抽样误差造成, 或者是否来自该已知总体。 如果我们假 定样本已是来自总体平均数为的、 产生了实验效应的某个总体, 那么就可认为是的一个代表 值, 就是来自的真正总体的平均数——这也是假定它是真正的, 而则不一定是来自实验前的 总体的平均数,因为这还有待检验,经过检验后,如果 = ,那么,就来自该已知总体,也 就可以认定和是水平相等的同一总体;如果经检验,那么就不是来自该已知总体,而是来自 已经产生实验效应的总体,于是就可认定和不是水平相等的同一总体。 由此建立假设的形式可表示为: H0:= 0 H1:≠ 0 总体平均数的显著性检验,其检验类型或检验方法,随总体分布形态、总体方差是否已知和 样本容量大小等情况不同而不同——因为这些因素或条件决定了样本统计量的抽样分布形 态,从而决定检验类型和方法。不过在前述两种类型平均数差异的检验中,因为平均数的抽 样分布形态通常为正态分布或 t 分布,所以,检验类型或方法也常常采用 Z 检验或 t 检验。 下面仅重点讨论总体平均数显著性检验的不同检验方法的运用情况。

一、总体正态分布,总体标准差已知时(总体平均数的显著性检验) 在上述条件下,无论样本大小,平均数的抽样分布为正态分布,平均数的离差统计量也呈正 态分布,因此采用 Z 检验法,计算统计量的公式为 Z= - 0/ 例 1:某小学历届毕业生汉语拼音测验平均分数为 66,标准差为 11.7。现以同样试题测验应 届毕业生(假定应届与历届毕业生条件基本相同) ,并从中抽取 18 份试卷,算得平均分为 69,问该校应届与历届毕业生汉语拼音测验成绩是否一样? 例 2:某市高中入学考试数学平均分数为 68 分,标准差为 8.6 分。其中某所中学参加此次考 试的 46 名学生的平均分数为 63 分。过去的资料表明,该校数学成绩低于全市平均水平。问 此次考试该校数学平均分数是否低于全市的平均水平? 例 3:某校利用一套能力测试题测验本校初二学生,平均成绩为 48 分,标准差为 6 分,其 中初二年级二班参加测试 49 人, 平均成绩 51 分, 问二班能力测试成绩是否高于年级的平均 成绩?已知学生能力测试成绩服从正态分布。 例 4,P235 二、总体正态分布,总体标准差未知时(总体平均数的显著性检验) 在这一前提条件下,又分为两种情况: (一)小样本的情况(n<30) 因总体标准差未知且 n<30,所以计算标准误时,要用样本标准差代替总体标准差,即 ,在上述条件下,平均数的抽样分布服从自由度为 n-1 的 t 分布,平均数的离差统计量也

呈 t 分布,故采用 t 检验法。 例 1:某区初三英语统一测验平均分数为 65,该区某校 20 份试卷的分数为:72,76,68, 78,62,59,64,85,70,75,61,74,87,83,54, 76,56,66,68,62 。问该校 初三英语平均分数与全区是否一样? 根据统计假设检验的 4 个基本步骤 (一)根据问题要求选择检验方式,建立假设 如果对所研究的两量数间差异方向不关心、不明确,就采用双尾检验 当要求检验两者是否一致、一样或相同,就采用双尾检验。这时建立的假设是: H0:= 0 H1:≠ 0 或者就该题而言,还可建立这样等 价的假设形式: H0:=65 H1:≠65 (二)确定统计量的抽样分布形态与相应检验类型并计算相应统计量 据已知条件,统计量的抽样分布形态为 t 分布,与之对应的检验类型分别是 t 检验,计算的 相应统计量就是 t 值。根据样本的信息, ,但总体标准差未知,再计算出,即,于是计算得 样本统计量的 t 值为 (三)根据研究问题性质选取适当显著性水平,并依据检验方式(单尾或双尾检验)确定查 表的是否平分,以寻取对应临界值。 假定本题选定 0.05 的显著性水 平,那么据 =0.05,df=20-1=19 查得 t 分布表中双侧面积对应临 界值为 2.093;这时因 所以仍需再查 =0.01,df=19, 得 (四)据判断规则判定并解释结果即作出检验结论 比较实得 t 值和查表得到的临界 t 值的大小,因为,即,于是在 0.05 显著性水平上拒绝零假 设、 接受备择假设, 而在 0.01 水平上接受零假设, 于是可在实得 t 值右上角打上一个星号*, 即 2.093<2.266*<2.861,并解释为:样本所从属的某个已知总体平均数与假设的另一总体平 均数这两个总体不是一个水平的、 而是有显著性差异的, 表明该校初三英语平均分数与全区 平均成绩有本质不同,或者说样本的 69.8 分已经不属于平均分为 65 的总体。 (二)大样本的情况 当总体为正态分布,总体标准差未知且 n≥30,计算标准误时,要用样本标准差代替总体标 准差,即 ,在上述条件下,平均数的抽样分布接近正态分布或者 t 分布,平均数的离差统计量也呈正 态分布或者 t 分布,故既可采用 Z 检验法,又可采用 t 检验法。 例:某年高考中,某市数学平均分为 60,现从参加此次考试的文科学生中,随机抽取 94 份 试卷,算得平均分数为 58,标准差为 9.2,问文科数学成绩与全市考生是否相同? 首先,选择检验方式并建立假设。 因差异方向不明确,故采用双侧检验,于是, H0:= 0 H1:≠ 0

或者 H0:=60 H1:≠60 其次,确定检验类型并计算相应统计量 如采用正态分布近似处理,于是据 = =-2.108 再次,选定显著性水平,确定其是否平分并寻取临界值。 取显著性水平为 0.05,查 0.05-0.025=0.475 得 Z=1.96 最后,据决断规则判断并作出检验结论 由于 1.96<2.108<2.58,则 0.01<P<0.05,因此,在 0.05 显著性水平上拒绝零假设而接受备择假设,其结论为:某市文 科数学高考成绩与全市考生平均分数有本质区别,或者说它不属于平均数为 60 的总体。 如果按照 t 分布来处理,那么检验统计量为:2.11 然后按照相应检验步骤和思路进行即可。 1.98 2.617 从本章总体平均数的推断的讨论中可以看出, 总体参数的区间估计与假设检验都是对总体参 数的统计推断,在条件相同的情况下,两者用的是同一统计量如都使用样本的平均数。其不 同之处在于, 区间估计对总体参数事先并不提出一个假设的值, 而假设检验对总体参数事先 提出一个假设的值,即假设“未知的新总体的平均数即总体参数为” ,最后视其被拒绝的情 况而定。 需要大家注意的是, 本节内容讨论的 Z 检验和 T 检验, 其共同的前提是: 总体应为正态分布。 如果总体为非正态分布,只要样本容量大于等于 30,可采用 Z 检验,但不可采用 T 检验。 如果是教育与心理研究中的问题, 在总体分布形态不明的情况下, 一般可在假设检验之前 “假 定为正态分布” 。

第三节两样本平均数间差异的显著性检验 (双样本检验或者双总体检验) 上一节讨论的是?? 一、两样本平均数间差异显著性检验的基本问题 两个样本平均数差异的显著性检验与 “一个样本平均数同某个已知总体平均数差异的显著性 检验” , 其思路是一样的。 第一, 也要对两个相应的总体平均数之间提出没有差异的零假设, 即 H0: 1- 2=0 也就是 1= 2 H1: 1- 2≠0 也就是 1≠ 2 第二, 以两个样本平均数之差的抽样分布即以两个总体平均数之差等于 0 为中心的一切可能 个样本平均数之差的分布为理论依据, 来考察 “两个样本平均数之差在其抽样分布上出现的 概率”如何。当两个样本平均数之差较大,并且在其抽样分布上出现的概率足够小时,就可 以作为小概率事件实际不可能来否定两者间没有本质差异的零假设的理由, 于是拒绝零假设

而接受备择假设。 这就意味着两样本平均数之差不是来自于两个总体平均数为零的总体。 也 就是说, 两个总体平均数之间确实有差异, 两样本平均数之差是因两个相应总体平均数不同 所致;当两个样本平均数之差较小,并且在其抽样分布上出现的概率足够大时,那么就应保 留零假设而拒绝备择假设。 这就意味着两样本平均数之差是来自于两个总体平均数为零的总 体。 也可以说两样本平均数是来自同一个总体或来自平均水平相同的两个总体, 即便两样本 平均数之间有差异,也是由抽样误差导致的。 二、两独立样本平均数差异的显著性检验 所谓独立样本, 是指两个样本内的个体是随机抽取的、 是可以独立颠倒顺序而不对问题产生 影响的,它们之间不存在一一对应关系。如,调查对象是某高校的教师,一组样本是男教师 的工资,另一组样本是女教师的工资,职工的顺序任意颠倒后,也不会对问题产生影响。又 如, 对 12 名来自城市的学生与 14 名来自农村的学生进行心理素质测验, 试分析城市学生与 农村学生心理素质有无显著差别。 (一)总体为正态,总体方差已知时(两独立大样本平均数间差异的检验) 可采用 Z 检验法 检验统计量 Z 值的计算公式为: 例:某高一学生英语测验成绩如下表,问男女生英语测验成绩有无显著差异(或有无性别差 异) 某高一男女生英语测验结果 性别人数平均数总标准差估计值 男 女 180 160 76.5 78.2 11.53 10.53

(二)总体为正态,总体方差未知时(两独立小样本平均数间差异的检验—两个样本中,只 要其中 1 个的容量小于 30) 可采用 t 检验法 检验统计量 t 值的计算公式为:

例,从高二年级随机抽取两个小组,在化学教学中实验组采用启发探究法,对照组采用传统 讲授法,后期统一测验结果如下表所示,问,两种教学方法是否有显著性差异? 实验组和对照组化学测验成绩对照表 序号 1 2 3 4 5 6 7 8 9 10 实验组 64 58 65 56 58 45 55 63 66 69 对照组 60 59 57 41 38 52 46 51 49

三、两相关样本平均数差异的显著性检验 相关样本指两个样本内个体之间顺序不可以颠倒, 否则会对问题产生影响, 两样本内个体之

间存在一一对应的关系。 有两种情况: 1、 用同一个测试对同一组被试在实验前后两次测验, 所获得的两组测量结果就是相关样本。 如,32 人组成的射击小组经过 3 天集中训练,那么训练前后的两组成绩就是相关样本。 2、根据某些条件基本相同的原则先把被试一一匹配成对,然后把每对被试随机分入实验组 和对照组, 再对两组被试实行不同的实验处理, 最后用一个测验如同一套试卷对两组被试同 时进行测试,这样的实验研究所获得的两组实验结果,也是相关样本。如,为了探究小学二 年级的两种识字教学法是否有明显不同,根据学生的智力水平、努力程度、识字量多少、家 庭辅导力量等初始条件基本相同的原则,可随机抽取 20 个学生,然后将学生配成 10 对,再 将每对学生随机分入实验组和对照组各 5 对, 实验组施以分散识字教学法, 而对照组施以集 中识字教学法,最后进行统一测验,那么所获得的两组测验结果就是相关样本。 相关样本平均数的检验与独立样本平均数的检验相比,主要有以下两点不同: 第一, 标准误不同,计算检验统计量的也不同(Z 值或者 T 值) 。 第二, 对相关样本平均数的检验而言,只要相应总体服从正态分布,不管方差是否相等, 都可直接进行检验,而不必首先考虑对方差是否齐性(相等)再进行检验。 两者在检验的先决条件方面,存在的共同点是:在总体为正态的前提下,也要根据总体方差 是否已知和样本容量大小的不同而采取不同的检验方法。 (一)总体方差已知,无论 n 的大小 采用 Z 检验法 计算检验统计量的公式为:

(二)总体方差未知,n>=30 仍采用 Z 检验法 计算检验统计量的公式为:

(三)总体方差未知,N<30 采用 t 检验法 计算检验统计量的公式为 :

以上三种情况下, 计算检验统计量的公式有一个共同的已知条件即两相关样本的积差相关系 数 r 是已知的。当积差相关系数 r 未知,尤其是 n<30, 进行 t 检验时,计算检验统计量 t

值的公式中——其标准误的计算又有所不同。 例 1,在小学三年级学生中,随机抽取刚学完英语字母的学生 26 人,让其用反复阅读的方 法记单词,单位时间内平均只能识记 45 个,标准差为 6.5 。后来教他们用识记和试背相结 合的方法识记单词,单位时间内平均能识记 50 个,标准差为 5.5,前后两种方法识记成绩的 相关系数为 0.65 。问后一种方法是否好于前一种? 例 2,一般认为弟弟比哥哥更有创造性,现对 10 对兄弟进行创造性测验的结果如下,问弟 弟真的比哥哥更有创造性吗? 弟兄创造性测验成绩表 弟兄对数 1 2 3 4 5 6 7 8 9 10 弟弟 64 48 63 52 61 53 63 70 65 66 哥哥 61 42 66 52 47 58 65 62 64 69 *** 一、 Spss 中的 T 检验 在统计数据资料中, 经常需要进行组与组之间平均水平或均数的比较。 对于两组数据资料的 均数做显著性检验可用 T 检验。进行 T 检验的条件是:第一,要求两组数据资料都服从正态 分布或近似正态分布。第二,要求两组数据资料的方差齐性(相等) ,如果不等,则要进行 校正(spss 会自动进行校正) 。T 检验包括两相关样本 T 检验和两独立样本 T 检验。 (一)两相关样本(两配对样本)T 检验 例:对 12 名学生进行培训之后,其培训前后某项心理测试得分如 spss 配套数据 EG5-1 学生 培训前后心理测试得分。运行见 P110_P113 (二)两独立样本 T 检验 例: 对 12 名来自城市的学生与 14 名来自农村的学生进行心理素质测验, 试分析城市学生与 农村学生心理素质有无显著差异。测验得分数值如 spss 配套数据 EG5-2 城市与农村学生心 理素质测试得分。统计分析过程及讨论见 P 杨晓明 114-116 二、spss 中的方差分析 前面讨论的都是两个平均数间差异的显著性检验, 但在教育与心理的实际研究中, 还会经常 遇到对 3 个或 3 个以上平均数间差异情况进行比较的问题。 如, 同时进行 4 种教学方法的实 验,比较哪种教学方法效果更明显。不同教学方法、不同教材、学生接受能力等因素,都会 对教学效果产生影响,比较哪个因素影响最大,等等。这些就都涉及到对多个平均数间差异 进行比较的问题, 这时采用的方法就得使用方差分析 (当然方差分析也适用于两组均数的比 较) 。 方差分析又称为变异数分析, 它是英国统计学家 R.A.Fisher 首先提出的一种统计方法, 也因之而称为 F 检验。方差分析简写为 ANOV(Analysis of Variance)或者 ANOV A。 (一)方差分析的逻辑思想 如果把实验获得的多个平行样本的全部数据视为一个整体,则数据间存在差异(变异) ,即 参差不齐。造成差异的因素是多方面的,既可能是各样本组的控制变量(如 3 个班组采用 3 种不同教学方法)造成的,也可能是随机抽样误差造成的。如下表资料,是把 18 个学生随 机分成 3 组,每组接受一种教学方法实验处理的结果。 不同教法的成绩 A B C 80 85 84 84 90 80

82 78 75 87

88 78 85 90

76 80 82 72

总和 486 516 474 平均数 81 86 79 不难看出,A、B、C 3 种教学方法效果的代表值——平均数之间存在差异(81,86,79) , 每个实验样本组内的各个学生成绩之间也存在差异(如 A 组内各学生成绩存在差异) ,前者 称为样本组间差异(控制变量造成的差异) ,后者称为样本组内差异(不可控制的变量造成 的随机误差) ,把两部分差异相加,就构成了全部数据总体的差异。方差分析就是将总体差 异分解为两部分:控制变量造成的样本组间差异;不可控制的变量造成的样本组内差异。并 在此基础上分析这两部分差异哪一个更大。 如果样本组间差异显著大于样本组内差异, 那么 就认为样本组间有实质性差异, 也就表明控制变量 (3 种教学方法) 对学生成绩 (教学效果) 有实质性影响,相反,表明 3 种教学方法无效。因此,方差分析就是在差异分解的基础上, 通过组间方差与组内方差之比(即 F 值) ,实现对多个平均数间差异的显著性检验的。 根据上述方差分析思想,可得到下面两个公式: SS 总= SS 组间+ SS 组内 F= SS 组间/ SS 组内 SS 总表示总均方,即所有数据分别与总平均数的离差平方之和除以“N 减 1” ,SS 组间表示 组间均方,即各样本平均数与总平均数的离差平方之和除以“组数减 1” , SS 组内表示组内均方, 即各样本内每个数据与本组平均数的离差平方之和除以 “N 减组数” 。 需要注意的是:在方差分析中,一般称方差为均方,即离均差的平方。 对多个平均数间差异进行 F 检验的原假设是: 各样本来自的总体平均数相等, 即控制变量不 同水平下的总体均值无显著差异, 就上例而言, 也可以说是不同教学方法下的总体均值无显 著差异,即不同教学方法本质上没有什么不同。备择假设是:其中至少有一对平均数不等, 即控制变量不同水平下的总体均值有显著差异,就上例而言,也可以说是---不同教学方法下 的总体均值有显著差异, 即至少有两种教学方法有本质不同。 如果检验结果拒绝各平均数相 等的原假设, 则接受的备择假设仅仅表明多个平均数中至少有一对不相等。 但究竟是哪一对 不等, 即哪一种教学方法更好, 还得进一步进行平均数的逐对比较, 才能弄清楚。 在 spss 中, 将自动计算 F 值,并给出对应的相伴概率值,如果相伴概率值小于或等于用户的显著性水 平a(如) ,则应拒绝原假设,接受备择假设,认为教学方法有效;如果相伴概率值大于用 户的显著性水平a(如 P>0.05) ,则接受原假设,而放弃备择假设,认为教学方法无效。 (二)spss 中方差分析实例解析 1、单因素方差分析 单因素方差分析中的控制变量仅有 1 个, 分析的是这 1 个控制变量的不同水平对因变量是否 产生了显著影响。如:教学方法是否对教学效果造成了显著影响;不同地区的考生成绩是否 有显著的差异等等。其中,如果施行的是 3 种不同教学方法的实验,那么,教学方法 1、教 学方法 2、 教学方法 3 被称为教学方法这 1 个控制变量下的 3 种处理水平; 地区 1、 地区 2、 地区 3、地区 4 被称为地区这 1 个控制变量下的 4 种水平 例:研究 3 个组(分别接受了 3 种不同的教学方法)在英语成绩上是否有显著差异,见 SPPS 实际操作附表。Spss 配套数据 EG6-1 三组教学方法英语成绩。统计分析过程见 P121-126 又例,配套数据材料 3 组学生数学成绩有显著差异比较。 2、多因素方差分析 多因素方差分析中的控制变量在 2 个或 2 个以上, 分析的目的是要查明多个控制变量的作用

(主效应) 、多个控制变量的交互作用(简单效应)以及其它随机变量是否对实验结果产生 了显著影响。如:教学方法和教材这 2 个控制变量对教学效果是否有显著影响,两变量间有 无交互影响等; 地域和教学方案等多个控制变量对学生成绩是否有显著影响, 多个控制变量 间有无交互影响等。多因素方差分析实际上是将观察变量(因变量)总的离差平方和分解为 3 个部分:多个控制变量单独作用引起的离差平方和;多个控制变量交互作用引起的离差平 方和;其它随机因素(不可控变量)引起的离差平方和。以两个控制变量为例,总差异的平 方和可用公式表示为: SS 总差异= SS 控制变量 1+ SS 控制变量 2+ SS 控制变量 1,2+ SS 随机变量 其中 SS 控制变量 1+ SS 控制变量 2 是主效应部分(Main Effects) , SS 控制变量 1,2 称为多 向交互影响部分 (N-Way) , 反映两个控制变量下各种水平相互组合对实验结果造成的影响, 是简单效应部分。 主效应部分和交互影响部分的均方和称为可解释部分——可用来解释其对 总差异的平方和的贡献力度 (即控制变量的影响程度) , SS 随机变量部分是其它随机变量 (即 不可控制变量)共同引起的部分,也称为剩余部分。如果经 SPSS 自动处理的 F 统计量的值 对应的相伴概率值小于或等于用户的显著性水平, 就认为各变量与变量间的交互作用对实验 结果产生了显著影响。也就是说,如果 F 控制变量 1 的相伴概率小于或等于显著性水平, 则认为第 1 个控制变量的不同水平对观察变量的结果产生了显著影响;如果 F 控制变量 2 的相伴概率小于或等于显著性水平, 则认为第 2 个控制变量的不同水平对观察变量的结果产 生了显著影响;如果 F 控制变量 1,2 的相伴概率小于或等于显著性水平,则认为第 1 个控 制变量和第 2 个控制变量的各个水平的交互作用对观察变量的结果产生了显著影响。 倘若与 上面所有表述完全相反的话,则认为不同水平对实验结果没有显著影响。 例:研究一个班 3 组(分别接受 3 种 不同的教学方法) 不同性别的同学在数学成绩上是否有显著差异。 该问题实际上就是研究不 同教学方法和不同性别对数学成绩的影响情况。 (有教学方法和性别 2 个控制变量) 。 数据如 下表: 3 组不同性别学生的数学成绩 人名 数学 组别 性别 a 99.00 0 Male b 88.00 0 Female c 99.00 0 male d 89 0 male e 56 1 male f 94.00 0 female g 90.00 0 male h 79.00 2 male i 56.00 2 female j 89.00 2 male k 99.00 2 male l 70.00 2 female m 89.00 2 male n 55.00 1 female o 50.00 1 male p 67.00 1 female

q r s

67.00 56.00 56.00

1 1 0

male female male

配套数据三组不同性别学生的数学成绩,统计分析及讨论见余建英 P151-157 3、协方差分析 ? 问题的提出 协方差分析是将那些很难控制的因素作为协变量 (如施加实验影响前的学生入学成绩、 实验 前的前测成绩等基础水平) ,在排除协变量影响的条件下,分析控制变量对观察变量(因变 量)的影响,从而更加准确地对控制变量的影响程度进行评价。 无论是单因素方差分析还是多因素方差分析, 有些因素是很难人为控制的, 但它们又会对结 果产生影响。如果忽略这些因素的影响,则有可能得到不正确的结论。 例如,研究 3 种不同教学方法---教学效果的好坏。检查教学效果是通过学生考试的成绩来反 映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察时应当排除这种影响。 又如,考察受教育程度对个人工资是否有显著影响,这时就必须考虑工作年限因素,因为, 一般情况下,工作年限越长,工资就越高,显然在研究此问题时就应当排除工作年限因素的 影响,才能得出正确的结论。 可见, 为了更准确地研究控制变量不同水平对结果的影响, 就应当尽量排除其它因素对分析 结果的影响。 利用协方差分析可解决这样的问题---协方差分析将那些很难控制的随机变量作 为协变量,在分析中将其影响排除,然后再分析控制变量对观察变量的影响,从而实现对控 制变量影响程度(效果)的准确而有效的评价 协方差分析要求协变量应是连续数值型, 且与控制变量之间没有交互影响, 多个控制变量间 互相独立。 前面单因素方差分析和多因素方差分析中的控制变量都是定性变量, 而协方差分 析中既包含了定性变量(控制变量) ,又包含了定量变量(协变量) ? 统计方法(计算公式) 以单因素协方差分析为例,总的变异平方和表示为: SS 总差异= SS 控制变量+ SS 协变量+ SS 随机变量 协方差分析仍然采用 F 检验,其零假设与备择假设以及判断法则基本相同。 ? SPSS 实例解析 研究一个班 3 组同学(分别接受 3 种不同教学方法)在数学成绩上是否有显著差异。已知这 些同学在接受教学方法影响前后的入学成绩和测验成绩如下表。 配套数据 EG6-4 三组学生数 学成绩,统计分析及讨论见杨晓明 P146-149

姓名 成绩 A 99 B 88 C 99 D 89 E 94

网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com