普通高中课程标准实验教科书选修 1 - 2
description
Transcript of 普通高中课程标准实验教科书选修 1 - 2
普通高中课程标准实验教科书选修 1 -2
北京师范大学数学科学院 李勇
2005 年 8月
第一章 统计案例
简 介
人教版高中数学课标教材( A 版)
1. 教学目标
a. 通过典型案例的探究,进一步了解回归分 析的基本思想、方法及其初步应用。
b. 通过典型案例的探究,了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其初步应用。
统计案例( 10 课时)统计案例
( 10 课时)
独立性检验模型( 3 课时)
独立性检验模型( 3 课时)
回归分析模型( 4 课时)
回归分析模型( 4 课时)
实习作业( 2 课时)实习作业( 2 课时)
2. 结构设置与课时分配
( 4 学时)
3. 回归分析模型
a. 比《数学 3 》中“回归”增加的内容数学3——统计
1. 画散点图2. 了解最小二乘法
的思想3. 求回归直线方程
y = bx + a
4. 用回归直线方程解决应用问题
选修1 -2——统计案例5. 引入线性回归模型
y = bx + a + e
6. 了解模型中随机误差项 e 产生的原因
7. 了解相关指数 R2 和模型拟合的效果之间的关系
8. 了解残差图的作用9. 利用线性回归模型解决一类
非线性回归问题10.正确理解分析方法与结果
b. 函数模型与“回归模型”的关系
GDP中国 散点图
0
20000
40000
60000
80000
100000
120000
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
年
GDP
函数模型: abxy
回归模型: eabxy
不能提供选择模型的准则
可以提供选择模型的准则
问题背景分析
线性回归模型
两个变量线性相关
最小二乘法
两个变量非线性相关
非线性回归模型残差分析
相关指数
散点图 线性相关系数
应用
c.
回归分析知识结构图
d.教学建议
① 散点图;
② 回归方程:
③ 通过探究“身高 172 cm 的女大学生的体重一定是 60.23 kg 吗?”引入线性回归模型。此处可以引导学生们体会函数模型与回归模型之间的差别。
案例 1 :女大学生的身高与体重
172.85849.0ˆ xy
④ 使学生理解:在回归模型中,预报变量(因变量)是解释变量(自变量)与残差变量共同作用的结果。
⑤ 解释残差变量的来源 (可以推广到一般):• 其它因素的影响:影响身高 y 的因素不只是体重 x ,
可能还包括遗传基因、饮食习惯、生长环境等因素;• 用线性回归模型近似真实模型所引起的误差;• 身高 y 的观测误差。
⑥ 使学生正确理解相关指数的含义,他是度量模型拟合效果的一种指标。在线性模型中,他代表自变量刻画预报变量的能力。
n
iii
n
ii
n
ii yyyyyy
1
2
1
2
1
2 )ˆ()ˆ()(
总偏差平方和:预报变量的变化
程度
回归平方和:解释变量引起的
变化程度
残差平方和:残差变量的变化
程度
在线性模型中,
并不要求学生掌握
偏差平方和分解公式
可以直接由相关指数的定义理解其含义
⑦ 使学生了解残差图的制作及作用。• 坐标纵轴为残差变量,横轴可以有不同的选择;• 若模型选择的正确,残差图中的点应该分布在以
横轴为心的带形区域;• 对于远离横轴的点,要特别注意。
身高与体重残差图
异常点
• 错误数据• 模型问题
⑧ 在教学的过程中,要注意把所蕴含的统计思想提炼出来。如在本例结尾提到“用身高预报体重时,需要注意下列问题:……”,这些论述适用于所有的回归模型。• 模型适用的总体;• 模型的时间性;• 样本的取值范围对模型的影响;• 模型预报结果的正确理解。
⑨ 教科书上所列“建立回归模型的基本步骤”,不仅适用于线性回归模型,也适用于一般回归模型的建立。
① 散点图:
从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。
案例 2 :红铃虫的产卵数与温度
0
50
100
150
200
250
300
350
20 22 24 26 28 30 32 34 36
温度
产卵
数
yz ln② 令 ,则 x 与 z 的散点图为
0
1
2
3
4
5
6
7
20 22 24 26 28 30 32 34 36
温度
z
x 和 z 之间的关系可以用线性回归模型来拟合 baxz axecy 1
2xt ③ 令 ,则 t 与 y 的散点图为
散点并不集中在一条直线的附近,因此用线性回归模型拟合他们的效果不是最好的。
0
50
100
150
200
250
300
350
400 500 600 700 800 900 1000 1100 1200 1300
温度平方
红铃
虫产
卵数
④ 教师在此处可以引导学生体会应用统计方法解决实际问题需要注意的问题:
现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:
.
,
,
2
12
xy
ecy
baxyxc
可以利用直观(散点图和残差图)、相关指数来确定哪一个模型的拟合效果更好。
bxcz 2
ty
对于同样的数据,有不同的统计方法进行分析,要用最有效的方法分析数据。
4. 两个分类变量的独立性检验
3 课时
a.反证法原理与假设检验原理
反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。
假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。
例 . 数学家庞加莱每天都从一家面包店买一块 1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为 950g 。于是庞加莱推断这家面包店的面包分量不足。
推断过程:• 假设“面包分量足”,则一年购买面包的质量
数据的平均值应该不少于 1000g ;• “ 平均值不大于 950g” 是一个与假设“面包分
量足”矛盾的小概率事件;• 这个小概率事件的发生使庞加莱得出推断结果。
b.假设检验问题假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用 H0 表示;另一个叫做备择假设,用 H1 表示。例如,在前面的例子中,原假设为: H0 :面包分量足,备择假设为: H1 :面包分量不足。
这个假设检验问题可以表达为:
H0 :面包分量足 ←→ H1 :面包分量不足
c. 求解假设检验问题考虑假设检验问题: H0←→ H1
1.在 H0 成立的条件下,构造与 H0 矛盾的小概率事件;
2.如果样本使得这个小概率事件发生,就能以一定把握断言 H1 成立;否则,断言没有发现样本数据与 H0 相矛盾的证据。
求解思路:
问题:判断应该是 H0 还是 H1正确?
d. 独立性检验
检验两个分类变量 x 和 y 之间是否有关系,即回答假设检验问题:
H0 : x 和 y 之间没有关系 ←→ H1 : x 和 y 之间有关系
只取两个值的变量
e. 知识结构图
分类变量之间关系
条形图 柱形图 列联表
独立性检验
背景分析
f. 教学建议
案例 1. 吸烟与肺癌
① 确定所涉及的变量是否为二值分类变量;
② 根据样本数据制作列联表:
③通过图形直观判断两个分类变量是否相关:
不吸烟 吸烟0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
不吸烟 吸烟
患肺癌比例
不患肺癌比例
在教学过程中强调:只有在此条件下,才能得到这个近似公式。
在教学过程中可以指出估算需要很多的概率统计知识,为学生指明还有更多的知识 需要学习。
④推导统计量 K2 ( 用于构造有利于 H 成立的小概率事件 ) ,使同学了解: K2越大, H 成立的可能性就越大。
⑤在“吸烟与患肺癌没有关系”成立的条件下,可以估算出: 01.0635.62 KP
④推导统计量 K2 ( 用于构造有利于 H 成立的小概率事件 ) ,使同学了解: K2越大, H 成立的可能性就越大。
⑤在“吸烟与患肺癌没有关系”成立的条件下,可以估算出: 01.0635.62 KP
当 n→∞ 时,变为等号。在实际应用中,当
近似的效果才可接受。
,5,,,min dcba
④推导统计量 K2 ( 用于构造有利于 H 成立的小概率事件 ) ,使同学了解: K2越大, H 成立的可能性就越大。
⑤在“吸烟与患肺癌没有关系”成立的条件下,可以估算出: 01.0635.62 KP
注:④⑤隐含了构造与原假设 H0 矛盾的小概率事件
的思想,基础好的学生可以深入体会。
635.62 KD
⑥由列联表中的数据计算随机变量 K2 的值:54.721k
用 k 是为了区分随机变量与其观测值⑧结果的解释: k≈54.721>6.635 解释为有 99%
的把握断定“吸烟与患肺癌有关” 。
若按如下规则进行判断,则把“吸烟与患肺癌没有关系”错判断成“吸烟与患肺癌有关系”的可能性不超过 0.01 。规则:若 K2≥6.635 ,就断定“吸烟与患肺癌有关”
两个分类变量独立性检验的基本思想:
当 很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。
dbcadcba
bcadnK
2
2
小概率事件发生
在前面案例中,由 k≈54.721>6.635 可得结论:有 99% 的把握断定“吸烟与患肺癌有关”。规则一:如果随机变量的观测值大于或等于 6.635 就认为“吸烟与患肺癌有关系” 。
另一方面,由 k≈54.721>10.828 还可得结论:有 99.9% 的把握断定“吸烟与患肺癌有关”。规则二:如果随机变量的观测值大于或等于 10.828 就认为“吸烟与患肺癌有关系” 。
问题:二者矛盾吗?不矛盾,他们是对两个不同评判规则的结论。
评判规则是在获取样本数据之前确定的。
例 1. 秃头与患心脏病
①在解决实际问题时,可以直接计算 K2 的观测值 k进行独立检验,而不必写出 K2 的推导过程 。
②本例中的边框中的注解,主要是使得学生们注意统计结果的适用范围(这由样本的代表性所决定)。
因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.
例 2. 性别与喜欢数学课
①本例主要是使学生理解独立性检验的原理。
②在教学过程中向同学们说明:在掌握了两个分类变量的独立性检验方法之后,就可以模仿例 1 中的计算解决实际问题,而没有必要画相应的图形。
图形可帮助向非专业人士解释所得结果;也可以帮助我们判断所得结果是 否合理
独立性检验结束