��zz��` � 0n��b 0kT 0Q0f

17
標本調査における標本の大きさを決める要因の探求 実験を通した推測統計の理解の試み 東京学芸大学附属竹早中学校 小野田 啓子 97回全国算数・数学教育研究(北海道)大会 中学校資料の活用分科会 2015.8.7

Transcript of ��zz��` � 0n��b 0kT 0Q0f

標本調査における標本の大きさを決める要因の探求 実験を通した推測統計の理解の試み

東京学芸大学附属竹早中学校

小野田 啓子

第97回全国算数・数学教育研究(北海道)大会 中学校資料の活用分科会

2015.8.7

どれ位の母集団に対して,何割くらいの標本を取れば,母平均との違いが1%未満になるか知りたい

生徒の疑問 標本調査の標本の大きさはどの程度にした

らよいのか

(1) 一部分の標本で全体の傾向を捉えることができることを理解す

る.

(2) 標本の大きさを決める要因を明らかにす

る.

(3) 標本調査の信頼度に対する評価をする.

「実験」を通して探求

中3女子50名のハンドボール投げ記録の標本平均

QT 標本数を多くすると,また取り出す回数を多くすると,標本平均が母平均に近づくのは何故か。

S答 「標本数が多くなると,データの偏りがなくなる可能性が大きくなるから」

【標本調査を行ってわかったこと】 ・たった数個の標本を取るだけで,全数調査を行ったときとほぼ同じ値になった。不思議だ。 ・標本数を多くすることで,母集団の平均との誤差は少なくなる。取り出す回数を多くすることでも,母集団の平均との誤差は少なくなる。

【生徒の課題設定】 『母集団の何割位の標本を取れば,母平均との誤差を適切な範囲にできるか』

【実験内容】 過去4年間の竹早中3年男子(母集団312)の平均身長を推定する標本調査

【結果】 「標本数を増やすと母平均との差がなくなっていくと予想したが,最初から変わらない」

【生徒の課題設定】 『母集団の何割位の標本を取れば,母平均との誤差を適切な範囲にできるか』

【実験内容】 過去4年間の竹早中3年男子(母集団312)の平均身長を推定する標本調査

【結果】 「標本数を増やすと母平均との差がなくなっていくと予想したが,最初から変わらない」

312人から (母平均166.8) 相対誤差% 312人から 相対誤差% 312人から 相対誤差%相対誤差の平均

117 161.8 87 166.9 214 163136 161 293 171.1 88 169.6203 168 78 163.5 33 165.535 174.2 71 163.8 5 152.582 165.3 5個の平均 166.06 0.417813 258 157.7 5個の平均 164.6 1.29334 184 166.4 5個の平均 163.4 2.012951 1.241368260 163 214 163 5 152.526 166.9 147 173.6 236 170.549 162.3 181 166.6 1 171.5268 171.4 14 161.3 212 175118 160.8 10個の平均 165.47 0.771621 36 164.4 10個の平均 165.19 0.939531 222 167.6 10個の平均 165.41 0.807602 0.839585305 161.9 150 167.5 47 168.9176 168.7 221 171.5 169 18164 177 68 177.1 116 167.454 169.9 155 168.6 111 171.1242 173 15個の平均167.0133 -0.15388 104 160.5 15個の平均166.4733 0.169947 202 163.3 15個の平均167.0533 -0.17787 -0.05393249 163.4 178 167.6 44 167.8284 158.4 7 167.2 155 168.6147 173.6 244 162.5 117 161.857 172.3 259 164.2 15 168179 173.3 20個の平均 167.31 -0.33178 50 179.5 20個の平均 166.905 -0.08891 104 160.5 20個の平均 166.625 0.078996 -0.1139116 167.4 264 165.1 83 168.1196 160.8 106 166.4 301 172.446 171 44 167.8 126 171.8299 165.2 154 166.3 33 165.516 175 25個の平均 167.424 -0.40015 37 169 25個の平均 166.908 -0.09071 273 158.8 25個の平均 166.764 -0.00436 -0.16507162 168.2 12 168.1 157 175.364 177 114 173 57 172.3237 182.1 263 163 55 166.7113 169.7 108 178.5 217 168.489 163.2 30個の平均168.1933 -0.8615 295 157.7 30個の平均 167.1 -0.20585 127 153 30個の平均166.8267 -0.04194 -0.36976

【新しい疑問】 「ハンドボール投げの時は誤差が大きかったのに,なぜ身長のデータは標本数が5でも誤差が1%以下になるのか」

【生徒の考え】 身長とハンドボール投げの資料では,広がり方に違いがあるからではないか

【問題】 異種の資料の広がり方をどのように比較できるのか

a. データの最大値÷最小値で,最小値の何倍の広がりがあるかで比べる。 身長=186.2/147.3=1.26倍 ハンドボール=20/6.9=2.90倍 →ハンドボールの方が広がっている。

b. [データの集まり]の割合が大きいほど,広がりが小さい。 身長=(249/312)×100=79.8%

ハンドボール=(30/50)×100=60% →ハンドボールの方が広がっている。 [データの集まり]=母平均を含む階級と その両側の3つの階級の度数の合計 (図3)中3男子312名(過去4年分)身長と中3女子50名ハンドボール投げヒストグラム

c.データの最大値と最小値の差(範囲)と母平均値との違いを比で比較。 (最大-最小)/母平均 → 身長(男)=0.233 ハンドボール=0.914 (母平均-最大(小))/母平均 →身長(小)=0.116,(大)=-0.116 →左右対称な形 ハンドボール投げ(小)=0.518,(大)=-0.396 →左右対称ではない

【新しい疑問】 「ハンドボール投げの時は誤差が大きかったのに,なぜ身長のデータは標本数が5でも誤差が1%以下になるのか」

【生徒の考え1】 身長とハンドボール投げの資料では,広がり方に違いがあるからではないか

【結論1】 身長は資料の広がりが小さく母平均近くに集まっているので,母平均に近い標本を取る確率が高いため,誤差が小さい

【生徒の考え2】 母集団の数の違い(身長312とハンドボール投げ50)が,誤差が小さい原因ではないか

【結論2】 母集団の大きさには因らない 312人から 相対誤差% 160人から 相対誤差% 80人から 相対誤差%

300 167.6 107 163.7 55 166.7198 169.8 6 163 56 168.7203 168 41 171 36 164.490 172 4 160.3 21 158.5210 163 5個の平均 168.08 -0.79353 150 167.5 5個の平均 165.1 0.993502 26 166.9 5個の平均 165.04 1.02948290 172 75 176 64 17766 160.1 122 170 51 174.966 160.1 51 174.9 49 162.3180 167 32 154.7 5 152.5246 163.3 10個の平均 166.29 0.279887 8 173.6 10個の平均 167.47 -0.42773 64 177 10個の平均 166.89 -0.07992269 161.5 62 161.9 54 169.954 169.9 69 152.2 54 169.94 160.3 74 173.8 67 165.6

185 163.7 101 173.3 63 166.9184 166.4 15個の平均165.6467 0.665679 109 156.1 15個の平均166.1333 0.373836 17 170.9 15個の平均167.4733 -0.42973273 158.8 151 165.3 52 160.2153 164.1 73 163.5 17 170.9274 169.1 95 165 46 17111 164.1 42 170.7 49 162.31 171.5 20個の平均 165.615 0.684668 52 160.2 20個の平均 165.835 0.55274 30 156.9 20個の平均 166.67 0.05201

239 156.3 50 179.5 75 176112 167 114 173 22 167.5299 165.2 147 173.6 21 158.596 150.8 114 173 25 162.6122 170 25個の平均 164.864 1.135025 2 160.2 25個の平均 167.04 -0.16987 55 166.7 25個の平均 166.588 0.10118435 174.2 154 166.3 23 160153 164.1 98 168.7 69 152.277 171.3 124 165.3 35 174.214 161.3 37 169 39 14851 174.9 30個の平均 165.58 0.705657 152 168 30個の平均 167.11 -0.21185 43 170 30個の平均165.6367 0.671675

【結論】 標本の大きさを決める要因は,母集団の大きさではなく,「資料の広がり具合」にある

【実験内容】 竹早中学校3年生159名の1週間の平均睡眠時間の推定値を,必要な標本数の予想を立てて標本調査で求める。

【結論】 「標本平均の信頼度は,標本平均の分布の幅から判断できる」

a. 母平均がわからないときは,標本数をどう決めて母数量を推定するか。 →(ⅰ) 母集団の広がり方を性質から予想して,およその標本数を決める。 (ⅱ) その標本数で何回か標本調査を行い,標本平均のばらつき具合を手掛かりに,ほぼよい値と考えられる標本平均を決める。標本平均が大きくばらつくときは,標本数を増やして同じことを調べる。→〔理由〕α 母平均はわかっていないが,もし標本平均がほぼ正確なら,何回か取った標本平均値は母平均に近い値になり,大きくばらつかないと考えられるから。 β 標本平均は母集団の中の何個かのデータの平均だから,分布が1つの山型なら,生のデータよりも標本平均の分布は中心近くに集まる。標本平均が母平均に近い値なら,大きくばらつかない。 (ⅲ) 標本平均のばらつき具合は,どれ位ならよいと判断するかは,調べる目的によって決める。

身の回りのことから調べたい問題を取り上げ,標本調査によって推定値を出してみよう。標本調査の計画を立て,実施して,結果の信頼度を評価する。

【課題】「竹早中3年生の1週間の平均睡眠時間はどれ位か,標本調査を行って調べよう。信頼できると考える標本平均(平均睡眠時間)と標本の大きさを求める。」

・竹早中3年生の1週間の平均睡眠時間のデータ(期間は2014年10月1日~7日) ・データはエクセルの中に,生徒に分からないように入っている状態で実験を行う

S18 6.~は一定。また,6.5を上回ることもないので,6≦母平均≦6.5位だと思う。

S19 標本15個のときからばらつきの幅が0.5時間と小さくなったから,これ位のばらつきならよいとして,標本平均の平均値を求めて,推定値6.27時間。

【結論】 「標本平均の信頼度は,標本平均の分布の幅から判断できる」

【課題】「竹早中3年生の1週間の平均睡眠時間はどれ位か,標本調査を行って調べよう。信頼できると考える標本平均(平均睡眠時間)と標本の大きさを求める。」

【結論】 ・標本平均の信頼度は,標本平均の分布の幅から判断できる ・睡眠時間のデータの広がりは,標本平均の分布の幅から,身

長と比べると広いと考える

S21:標本を多く取らないといけなかったから,身長と比べると分布は広いと考えられる。身長は最大値/最小値=190/150=1.3位の広がり。ハンドボール投げは,20/7=2.9位の広がり。50m走は10/6.5=1.5。睡眠時間は,10/4=2.5位と予想すると,ハンドボール投げに近い広がりと考えられる。

TQ:母集団が一つの山型の分布であると仮定して,身長とハンドボール投げ等のデータと比べて,竹中3年生平均睡眠時間の母集団の分布の広がり具合はどうなっていると推測するか。

(1)標本数を増やすと標本平均が母平均に近付く理由を,確率的な考え方で理解するためには,教師からの問いかけが重要であると感じた.

【生徒の感想】 ・標本数を多くしたら,標本平均の散らばりが小さくなったことに関する理由を考えることが難しかった。理由の考察が,毎回難しかった。

・標本として多くのものの中から少しだけをランダムに選んだだけなのに,一定の個数を超えたら全数調査を行ったときの値とほぼ同じになったので,とても不思議に思い,また面白いとも思った。

(2) 標本の大きさを決める要因が何かを知りたいという動機から,探求が続いたことが実践の特徴である.

標本数は母集団の何割かということではなく,資料の広がり具合と誤差の大きさに関係することを,身近な資料から実験という操作的な方法によって見出すことができた.

これらの活動は,推測統計を理解する素地となると考える.

【生徒の感想】

・標本数は,母集団のデータの広がり具合,誤差の大きさによって変わることが分かった。

・統計授業の中で,データのばらつきからデータの分布を予想し,そこから取る標本の数を決めることができるということを学ぶことができた。また,標本平均と母平均との違いが適切な範囲になる標本数を調べるとき,相対誤差を使えばより分かりやすくデータがまとまりやすかったので,「相対誤差」が大事なキーワードだと思った。

(3) 平均睡眠時間の資料の広がり具合を推測して,標本数を決め標本調査実験を行った.結果に対する検証を考えると全数調査ができる資料である方がよいが,標本調査を行う必要性を感じにくい.

今後も,教材の開発を試みて行きたいと考える.

【生徒の感想】

・自分たちに関係するような,身近なデータを調べられたことがよかった。

・母集団の数が本当にわからない(身近でない)ものは,標本数をどのように決めるのか。

・「竹中3年生の平均睡眠時間」の授業のとき,標本数を決めることがとても難しかった。差が30分以内であるとか,分布の形が似ているとか,いろいろな理由が発見できたことは面白かった。

・TV視聴率,1日の勉強時間,他のスポーツテスト種目等,身近な事がらの標本調査を行ってみたい。

〔資料2〕

竹早中3年生(159名)の1週間の平均睡眠時間(期間2104年10

月1日~10月7日)データ

平均=6.246時間 標準偏差=1.114

(左:全データのヒストグラム,右:両側値を除いた時の度数分布多角形と正規曲線との比較)

0

5

10

15

20

25

30

35

40

45

2 3 4 5 6 7 8 9 10

竹中3年生平均睡眠時間

-5

0

5

10

15

20

25

30

35

40

45

1 2 3 4 5 6 7 8 9 10 11

竹中3年1週

間平均睡眠

時間(154名)

正規曲線

μ=6.27,σ=0.

9

〔資料3〕

資料が平均,分散 2 の正規分布 ),( 2N に従うとき,

相対誤差

X(X :標本平均, :母平均, 10 )に対して,標準正規分布の両側 100 %の点を

)(Z とすると,

nZX

)( となる信頼度は( 1 )となることより,両式から

nZ

)(

これより,母平均を推定するときの標本数

22)(

Zn

ハンドボール投げ σ/μ=3.17/14.328=0.221 ε=5% 信頼区間95% n=75人

竹早中3年男子身長 σ/μ=6.3/166.8=0.037 ε=5%(8cm) 信頼区間95% n=2人

ε=2%(3cm) 信頼区間95% n=13人

竹早中3年男子50m走 σ/μ=0.62/7.48=0.083

ε=5%(0.4秒) 信頼区間95% n=10人

竹早中3年平均睡眠時間 σ/μ=1.11/6.24=0.178

ε=8%(30分) 信頼区間95% n=18人

標本数 n 10 100 1000 10000

変動係数 σ/μ 0.0806 0.2551 0.8067 2.5510

資料の例 身長,50m走, ボール投げ,

座高 上体起こし,握力,

長座体前屈

ご清聴ありがとうございました。