データサイエンス(統計・データマイニング)実習strnun.fool.jp/pov-ray_strnun/for20180809.pdf2018(平成30).08.09...

21
2018(平成 30).08.09 川崎市立橘高校 情報 布村 データサイエンス(統計・データマイニング)実習 目:情報の科学(必修科目) 象: 1 学年普通科・国際科・スポーツ科 書:実教出版「最新情報の科学新訂版」 3 章問題解決のための コンピュータ活用 1 節「問題解決」 2 節「アルゴリズム」 教科連携:数学 数学Ⅰ第 5 章「データの分析」のうち四分位数を除く実習部分を情報で指導 関連事項:文科指針「数理及びデータサイエンスに係る教育強化」への取組 過去の実習:データマイニング 決定木、クラスタリング、アソシエーション 1クラスを 5 人×8 班に分けディベート コンペを実施し、6 観点で相互評価 (論理性、論拠、反駁、応答、発表、提示) 7クラス 56 班分の評価表作成 表を決定木、クラスタリングにより分析 ディベートで高評価を得る要素の発見 教科書の内容との整合性から 2016 年度より数学Ⅰに準拠した基礎的統計実習に修正 料:個人 WEB サイト strnun mountain view で検索 http://outdoor.geocities.jp/strnun/ コンテンツを開き「教科情報」からアクセス -1- 第11回 全国高等学校情報教育研究会全国大会(秋田大会)大会発表資料

Transcript of データサイエンス(統計・データマイニング)実習strnun.fool.jp/pov-ray_strnun/for20180809.pdf2018(平成30).08.09...

2018(平成 30).08.09

川 崎 市 立 橘 高 校

情 報 布 村 覚

データサイエンス(統計・データマイニング)実習

科 目:情報の科学(必修科目)

対 象: 1学年普通科・国際科・スポーツ科

教 科 書:実教出版「最新情報の科学新訂版」

3章問題解決のための コンピュータ活用

→1節「問題解決」 2節「アルゴリズム」

教科連携:数学 数学Ⅰ第 5章「データの分析」のうち四分位数を除く実習部分を情報で指導

関連事項:文科指針「数理及びデータサイエンスに係る教育強化」への取組

過去の実習:データマイニング 決定木、クラスタリング、アソシエーション

→ 1クラスを 5人×8班に分けディベート

→ コンペを実施し、6観点で相互評価 (論理性、論拠、反駁、応答、発表、提示)

→ 7クラス 56班分の評価表作成

→ 表を決定木、クラスタリングにより分析

→ ディベートで高評価を得る要素の発見

→ 教科書の内容との整合性から 2016年度より数学Ⅰに準拠した基礎的統計実習に修正

資 料:個人 WEBサイト strnun mountain viewで検索

http://outdoor.geocities.jp/strnun/

コンテンツを開き「教科情報」からアクセス

-1-

第11回 全国高等学校情報教育研究会全国大会(秋田大会)大会発表資料

(1)データの整理と分析導入 1時間

目的と評価 代表値の定義概要を理解する

展開 1-1 上表を定義に従った手計算で完成

展開 1-2 ExcelSUM,COUNT,MIN,MAX,MEDIAN,AVERAGE,MODE 関数で完成

展開 1-3 Excelのオートフィル機能と絶対参照、相対参照の理解をさせる

(2)データの整理と分析 1時間(学科によって 1.5時間)

目的と評価 標準偏差の定義概要、標準偏差とヒストグラムの関係を理解する

前提 片方の集団の表を完成した後、他方へ数式コピーを行うことを見越した絶対参照

相対参照の組み合わせを考えさせる。

展開 2-1 偏差~偏差合計~(偏差)2~その平均値…㋐~その正の平方根…㋑

これらをを Excel 上の立式で求める。

展開 2-2 ExcelSUM,COUNT,MIN,MAX,MEDIAN,AVERAGE,MODE 関数により代表値を求める。

展開 2-3 Excel VARP 関数で分散を求め㋐と同値であることを確認

展開 2-4 Excel STDEVP 関数で標準偏差を求め㋑と同値であることを確認

展開 2-5 妥当な階級を設定させたうえで Excel FREQUENCY 関数で度数分布を求める。

展開 2-6 他方の集団に数式コピーを行い表を完成させる。

展開 2-7 度数分布表からヒストグラムを描かせる。

展開 2-8 標準偏差とヒストグラムから集団の分散を考察させる。

展開 2-9 Excel データ分析ツールから度数分布表を作成する

-2-

甲 乙 丙 丁1 1 1 12 2 2 23 3 3 24 4 4 25 5 5 36 6 6 37 0 5

合 計個 数最小値最大値中央値平均値最頻値 ー ー ー階級1.993.995.997.99

度数

データ

分散・標準偏差・偏差値は定義に基づく式から求めた値と表計算ソフトの関数処理による値が合

致することを確認させる。偏差値に関しては固有の定義式であるが、進路指導に鑑み指導している。

-3-

母集団A ポイント 偏差 (偏差)2 分散 偏差値 順位 母集団B ポイント 偏差 (偏差)2 分散 偏差値 順位A1 42 B1 45A2 25 B2 54A3 36 B3 72A4 38 B4 33A5 55 B5 64A6 14 B6 36A7 65 B7 42A8 67 B8 55A9 78 B9 51A10 63 B10 65A11 39 B11 66A12 59 B12 55A13 57 B13 53A14 86 B14 23A15 53 B15 63A16 75 B16 42A17 48 B17 52A18 45 B18 55A19 86 B19 56A20 29 B20 78合計 合計個数 個数

最小値 最小値最大値 最大値中央値 中央値平均値 平均値最頻値 最頻値分散 分散

標準偏差 標準偏差階級 度数 階級 度数

集団A 集団B

課題 母集団「A」「B」に対して合計,個数,最小値,最大値,中央値,平均値,最頻値、頻度を求めた後に、偏差,(偏差)2 ,分散,標準偏差,偏差値を求め、さらにヒストグラム(度数分布をグラフで表したもの)を描き母集団の傾向を比較する

p.3 補足 Excelによる正規分布発生(ランダム)→標準偏差とヒストグラム

R/C A B C

1 平均 50、標準偏差 10 平均 50、標準偏差 20

2 =RAND() =NORM.INV(A2,50,10) =NORM.INV(A2,50,20)

3 =RAND() =NORM.INV(A3,50,10) =NORM.INV(A3,50,20)

4 =RAND() =NORM.INV(A4,50,10) =NORM.INV(A4,50,20)

5 =RAND() =NORM.INV(A5,50,10) =NORM.INV(A5,50,20)

6 =RAND() =NORM.INV(A6,50,10) =NORM.INV(A6,50,20)

7 =RAND() =NORM.INV(A7,50,10) =NORM.INV(A7,50,20)

8 =RAND() =NORM.INV(A8,50,10) =NORM.INV(A8,50,20)

500 =RAND() =NORM.INV(A500,50,10) =NORM.INV(A500,50,20)

501 =RAND() =NORM.INV(A501,50,10) =NORM.INV(A501,50,20)

-3補足-

0

20

40

60

80

100

120

140

160

180

200

0 10 20 30 40 50 60 70 80 90 100

平均50、標準偏差10

平均50、標準偏差20

⇒教材研究メモ:教材として提示する「正規分布に従う」データ作成を Excelに依存した場合、必

ずしも望ましい結果にならない。標本数が多いほど安定する。

母集団A ポイント 偏差 (偏差)2 偏差値 順位A1 42 =B5-B$30 =C5^2 =50+(B5-B$30)*10/B$33 =RANK(B5,B$5:B$24)A2 25 =B6-B$30 =C6^2 =50+(B6-B$30)*10/B$33 =RANK(B6,B$5:B$24)A3 36 =B7-B$30 =C7^2 =50+(B7-B$30)*10/B$33 =RANK(B7,B$5:B$24)A4 38 =B8-B$30 =C8^2 =50+(B8-B$30)*10/B$33 =RANK(B8,B$5:B$24)A5 55 =B9-B$30 =C9^2 =50+(B9-B$30)*10/B$33 =RANK(B9,B$5:B$24)A6 14 =B10-B$30 =C10^2 =50+(B10-B$30)*10/B$33 =RANK(B10,B$5:B$24)A7 65 =B11-B$30 =C11^2 =50+(B11-B$30)*10/B$33 =RANK(B11,B$5:B$24)A8 67 =B12-B$30 =C12^2 =50+(B12-B$30)*10/B$33 =RANK(B12,B$5:B$24)A9 78 =B13-B$30 =C13^2 =50+(B13-B$30)*10/B$33 =RANK(B13,B$5:B$24)A10 63 =B14-B$30 =C14^2 =50+(B14-B$30)*10/B$33 =RANK(B14,B$5:B$24)A11 39 =B15-B$30 =C15^2 =50+(B15-B$30)*10/B$33 =RANK(B15,B$5:B$24)A12 59 =B16-B$30 =C16^2 =50+(B16-B$30)*10/B$33 =RANK(B16,B$5:B$24)A13 57 =B17-B$30 =C17^2 =50+(B17-B$30)*10/B$33 =RANK(B17,B$5:B$24)A14 86 =B18-B$30 =C18^2 =50+(B18-B$30)*10/B$33 =RANK(B18,B$5:B$24)A15 53 =B19-B$30 =C19^2 =50+(B19-B$30)*10/B$33 =RANK(B19,B$5:B$24)A16 75 =B20-B$30 =C20^2 =50+(B20-B$30)*10/B$33 =RANK(B20,B$5:B$24)A17 48 =B21-B$30 =C21^2 =50+(B21-B$30)*10/B$33 =RANK(B21,B$5:B$24)A18 45 =B22-B$30 =C22^2 =50+(B22-B$30)*10/B$33 =RANK(B22,B$5:B$24)A19 86 =B23-B$30 =C23^2 =50+(B23-B$30)*10/B$33 =RANK(B23,B$5:B$24)A20 29 =B24-B$30 =C24^2 =50+(B24-B$30)*10/B$33 =RANK(B24,B$5:B$24)合計 =SUM(B5:B24) =SUM(C5:C24)個数 =COUNT(B5:B24)

最小値 =MIN(B5:B24)最大値 =MAX(B5:B24)中央値 =MEDIAN(B5:B24)平均値 =AVERAGE(B5:B24) =AVERAGE(D5:D24) =AVERAGE(E5:E24)最頻値 =MODE(B5:B24)分散 =VARP(B5:B24)

標準偏差 =STDEVP(B5:B24) =SQRT(D30)区間 頻度

9.99 =FREQUENCY(B5:B24,A35:A44)19.99 =FREQUENCY(B5:B24,A35:A44)29.99 =FREQUENCY(B5:B24,A35:A44)39.99 =FREQUENCY(B5:B24,A35:A44)49.99 =FREQUENCY(B5:B24,A35:A44)59.99 =FREQUENCY(B5:B24,A35:A44)69.99 =FREQUENCY(B5:B24,A35:A44)79.99 =FREQUENCY(B5:B24,A35:A44)89.99 =FREQUENCY(B5:B24,A35:A44)99.99 =FREQUENCY(B5:B24,A35:A44)

集団A

平均50、標準偏差10 平均50、標準偏差20

=RAND() =NORM.INV(A2,50,10) =NORM.INV(A2,50,20)=RAND() =NORM.INV(A3,50,10) =NORM.INV(A3,50,20)=RAND() =NORM.INV(A4,50,10) =NORM.INV(A4,50,20)=RAND() =NORM.INV(A5,50,10) =NORM.INV(A5,50,20)=RAND() =NORM.INV(A6,50,10) =NORM.INV(A6,50,20)=RAND() =NORM.INV(A7,50,10) =NORM.INV(A7,50,20)=RAND() =NORM.INV(A8,50,10) =NORM.INV(A8,50,20)=RAND() =NORM.INV(A9,50,10) =NORM.INV(A9,50,20)=RAND() =NORM.INV(A10,50,10) =NORM.INV(A10,50,20)=RAND() =NORM.INV(A11,50,10) =NORM.INV(A11,50,20)=RAND() =NORM.INV(A12,50,10) =NORM.INV(A12,50,20)=RAND() =NORM.INV(A13,50,10) =NORM.INV(A13,50,20)=RAND() =NORM.INV(A14,50,10) =NORM.INV(A14,50,20)=RAND() =NORM.INV(A15,50,10) =NORM.INV(A15,50,20)=RAND() =NORM.INV(A16,50,10) =NORM.INV(A16,50,20)=RAND() =NORM.INV(A17,50,10) =NORM.INV(A17,50,20)=RAND() =NORM.INV(A18,50,10) =NORM.INV(A18,50,20)=RAND() =NORM.INV(A19,50,10) =NORM.INV(A19,50,20)=RAND() =NORM.INV(A20,50,10) =NORM.INV(A20,50,20)=RAND() =NORM.INV(A21,50,10) =NORM.INV(A21,50,20)

=AVERAGE(B2:B21) =AVERAGE(C2:C21)=STDEVP(B2:B21) =STDEVP(C2:C21)B列度数分布 C列度数分布

0 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)10 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)20 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)30 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)40 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)50 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)60 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)70 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)80 =FREQUENCY(B2:B21,A25:A35) =FREQUENCY(C2:C21,A25:A35)

0

2

4

6

8

10

0 10 20 30 40 50 60 70 80 90 100

系列1 系列2

平均50、標準偏差10 平均50、標準偏差20

0.381217 47 440.198809 42 330.37564 47 44

0.019967 29 90.060021 34 190.682568 55 590.763722 57 640.50005 50 50

0.131532 39 280.080267 36 220.039793 32 150.707151 55 610.636431 53 570.422664 48 460.820561 59 680.099721 37 240.822842 59 690.821374 59 680.370048 47 430.478598 49 49

47 449.3 18.6

-4-

母集団A ポイント 偏差 (偏差)2 偏差値 順位 母集団B ポイント 偏差 (偏差)2 偏差値 順位A1 42 -11.0 121.0 44.4 14 B1 45 -8.0 64.0 43.9 15A2 25 -28.0 784.0 35.6 19 B2 54 1.0 1.0 50.8 11A3 36 -17.0 289.0 41.3 17 B3 72 19.0 361.0 64.5 2A4 38 -15.0 225.0 42.3 16 B4 33 -20.0 400.0 34.8 19A5 55 2.0 4.0 51.0 10 B5 64 11.0 121.0 58.4 5A6 14 -39.0 1521.0 30.0 20 B6 36 -17.0 289.0 37.0 18A7 65 12.0 144.0 56.2 6 B7 42 -11.0 121.0 41.6 16A8 67 14.0 196.0 57.2 5 B8 55 2.0 4.0 51.5 8A9 78 25.0 625.0 62.8 3 B9 51 -2.0 4.0 48.5 14A10 63 10.0 100.0 55.1 7 B10 65 12.0 144.0 59.1 4A11 39 -14.0 196.0 42.8 15 B11 66 13.0 169.0 59.9 3A12 59 6.0 36.0 53.1 8 B12 55 2.0 4.0 51.5 8A13 57 4.0 16.0 52.1 9 B13 53 0.0 0.0 50.0 12A14 86 33.0 1089.0 66.9 1 B14 23 -30.0 900.0 27.1 20A15 53 0.0 0.0 50.0 11 B15 63 10.0 100.0 57.6 6A16 75 22.0 484.0 61.3 4 B16 42 -11.0 121.0 41.6 16A17 48 -5.0 25.0 47.4 12 B17 52 -1.0 1.0 49.2 13A18 45 -8.0 64.0 45.9 13 B18 55 2.0 4.0 51.5 8A19 86 33.0 1089.0 66.9 1 B19 56 3.0 9.0 52.3 7A20 29 -24.0 576.0 37.7 18 B20 78 25.0 625.0 69.1 1合計 1060 0.0 合計 1060 0.0個数 20 個数 20

最小値 14.0 最小値 23.0最大値 86.0 最大値 78.0中央値 54.0 中央値 54.5平均値 53.0 379.2 50.0 平均値 53.0 172.1 50.0最頻値 86.0 最頻値 55.0分散 379.2 分散 172.1

標準偏差 19.5 19.5 標準偏差 13.1 13.1階級 度数 階級 度数9.99 0 9.99 019.99 1 19.99 029.99 2 29.99 139.99 3 39.99 249.99 3 49.99 359.99 4 59.99 869.99 3 69.99 479.99 2 79.99 289.99 2 89.99 099.99 0 99.99 0

集団A 集団B

0

1

2

3

4

5

6

7

8

9

9.99 19.99 29.99 39.99 49.99 59.99 69.99 79.99 89.99 99.99

系列1 系列2

-5-

(3)新体力テスト結果の分析 3時間

分析素材:某年度の本校実施結果 802人分を基に、学年内で行を数回シャッフルしたもの

教材:新体力テスト本校データ(3年生、2年生について過年度分のデータ付き)の一部

Row\Col A B C D E F G H I J

1 学年 性別 氏名 部活動 握力 反復横飛 シャトルラン 50m 走(秒) 立ち幅飛 ボール投

2 1 1 t-001 野球 39 53 92 7.8 219 21

3 1 2 t-002 その他 27 43 50 9.2 155 10

4 1 1 t-003 硬テニス 42 58 76 8.1 200 11

5 1 2 t-004 バスケ 27 52 66 8.7 191 13

6 1 2 t-005 26 43 20 10.2 172 10

7 1 2 t-006 26 46 45 9.8 138 8

8 1 1 t-007 水泳 47 64 114 7.6 250 27

9 1 1 t-008 軟テニス 41 63 109 7.8 205 30

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

801 3 2 t-800 陸上投 34 57 40 8.1 210 26

802 3 1 t-801 野球 55 63 125 7.1 240 22

803 3 2 t-802 バド 25 56 79 9.2 157 13

補足教材:文部科学省 WEBページより同一年度の全国データ

(7)全国新体力テスト年度別平均値 〔表8〕

年齢 年度 男子 男子 女子 女子

11 9.60 25.51 27.54 14.85

12 9.49 24.90 27.11 14.60

11 11.44 26.79 28.90 20.75

12 11.12 27.10 29.43 20.57

11 13.16 28.98 31.65 25.25

12 13.47 28.35 30.97 26.12

11 15.19 30.46 34.00 31.73

12 15.18 30.97 33.40 31.82

11 17.33 32.68 35.64 37.22

12 17.41 32.60 35.46 38.19

11 21.05 34.60 38.69 42.07

12 20.62 34.43 37.66 42.56

11 25.39 37.55 40.91 44.56

12 25.20 38.46 40.47 47.11

11 31.34 40.77 43.78 52.07

12 31.53 42.31 43.29 53.19

11 36.85 44.20 45.02 52.89

12 36.30 45.39 44.97 54.26

11 39.17 44.82 44.32 43.42

12 39.94 46.06 45.22 44.87

11 41.26 46.25 45.66 46.62

12 42.43 47.84 45.34 46.82

11 43.25 47.24 45.74 48.09

12 43.50 47.68 46.18 46.37

年齢 年度

11

12

11

12

11

12

11

12

11

12

11

12

11

12

11

12

11

12

11

12

11

12

11

12

※6~11歳はソフトボール投げ,12~17歳はハンドボール投げ

17 372.21 307.11 7.31 9.07 228.52 167.44 27.42 15.21

365.72 304.25 7.30 9.02 229.11 167.12 27.62 15.04

16 376.45 304.87 7.42 9.04 224.32 168.25 26.65 15.07

369.70 301.61 7.38 9.03 226.05 166.70 27.08 14.76

15 386.66 307.36 7.59 9.13 216.04 164.39 25.01 14.32

378.54 303.74 7.52 9.05 220.09 165.52 25.70 14.38

14 368.22 289.70 7.56 8.74 212.38 171.35 24.76 14.71

375.53 298.73 7.63 8.89 210.71 168.19 24.39 14.18

13 383.16 285.00 7.96 8.89 198.83 166.56 21.99 13.56

385.46 292.77 7.95 8.90 197.67 165.26 22.06 13.43

12 418.95 292.89 8.47 9.05 182.57 162.04 19.35 12.76

426.97 301.06 8.56 9.09 180.11 160.74 18.88 12.27

11 ― ― 8.93 9.26 168.94 155.38 30.25 17.06

― ― 8.89 9.24 168.12 154.33 30.43 17.03

10 ― ― 9.34 9.57 156.82 148.26 25.69 15.21

― ― 9.34 9.59 157.04 148.23 26.46 14.98

9 ― ― 9.72 10.03 149.15 139.93 21.85 12.54

― ― 9.70 10.02 149.21 139.30 22.20 12.68

8 ― ― 10.16 10.50 139.48 129.40 17.27 9.99

― ― 10.20 10.46 139.17 128.94 17.83 10.02

7 ― ― 10.73 11.04 130.08 118.63 13.28 7.74

― ― 10.81 11.10 127.17 117.44 13.22 7.86

6 ― ― 11.68 11.96 115.92 106.05 9.46 5.94

― ― 11.68 11.93 117.25 107.54 9.55 6.20

種 目 持 久 走(秒) 50 m 走(秒) 立ち幅とび(cm) ソフトボール投げ

男子 女子 男子 女子 男子 女子 男子 女子

17 27.01 27.33 18.88 51.30 41.79 86.07

27.27 28.61 19.96 52.68 42.79 86.36

16 26.54 26.84 18.69 50.61 41.71 82.71

26.59 28.37 19.30 51.94 42.34 86.23

15 25.67 25.51 17.80 48.80 40.89 76.34

25.87 26.90 18.70 51.06 41.97 80.76

14 25.83 25.97 18.98 50.16 42.46 85.64

25.40 26.51 19.52 51.03 42.85 86.42

13 24.20 24.67 18.17 48.29 41.72 79.66

24.19 25.27 19.47 49.01 42.47 80.96

12 21.85 21.60 17.22 44.65 40.00 64.01

21.75 21.88 17.38 44.41 40.16 63.85

11 20.05 19.75 16.77 42.43 38.67 55.65

19.57 20.62 16.83 43.50 39.67 56.44

10 16.73 17.84 15.67 39.22 37.04 46.28

16.56 17.98 15.92 40.41 37.29 47.63

9 14.09 16.18 14.80 36.08 34.11 40.85

14.09 16.76 14.87 36.88 34.57 41.24

8 12.07 14.72 13.35 33.24 31.10 34.18

12.23 14.63 13.67 33.41 31.74 33.04

7 10.47 13.22 12.24 29.84 28.29 26.48

10.20 12.77 11.90 29.78 28.55 25.30

6 8.84 10.50 10.23 25.63 25.25 17.74

8.55 10.85 10.13 25.83 25.18 16.04

種 目 握 力(kg) 上体起こし(回) 長座体前屈(cm) 反復横とび(点) 20mシャトルラン

女子 男子 女子 男子 女子 男子

-6-

展開 3-1 既習方法により各種目の代表値・標準偏差・(偏差値)を求める

展開 3-2 既習方法により、ヒストグラムを描かせる。

展開 3-3 種目ごとに考察をさせ、派生的な仮説を立てさせる

展開 3-4 仮説を実証させる(男女別の分析、各種目偏差値上位の分析、学年別の分析…)

展開 3-5 二項目の関連性に推測を立てさせる

展開 3-6 散布図を描かせ、相関係数を EXCELCORREL関数により求める

展開 3-7 3種類前後の分析例をトレースさせ理解を確認後、生徒独自の視点で予想を立て

させた上で統計処理・分析をさせる。

展開 3-8 考察を含めてプレゼンテーションソフトにまとめさせる。

例 50m走ヒストグラムにおける二峰性の理由について仮説(異なる性質の集団混在=学年、性別、

所属部活…)を立てさせた上で分析させる。結果を仮説と検証させる。

分析例をガイド…生徒にトレースさせる

例 50m走と関連性の強い種目について仮説を立てさせた上で相関分析させる。結果を仮説と検証

させる。

0

20

40

60

80

100

120

140

160

5.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5 12

50m走記録ヒストグラム(縦軸:人,横軸:秒)

50m走-ボール投げ

遠投

速い

考察・分析

遠投の必須条件:短距離走の速さ同じ速さで遠投に偏差がある2項目に強い相関がある相関係数 -0.79 50m走を時間で計測→負の相関

50m走-たち幅跳び

相関係数 -0.87 強い相関

0

20

40

60

80

100

120

140

160

5.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5

男子

女子

全体

男女別のヒストグラム描画

-7-

以下生徒分析(スポーツ科のケース)例

-8-

反復横飛び 3年間分布

学年をあがるにつれて

グラフの頂点が右にずれてきている

→回数が上がっている

橘高校男子と全国男子 平均分布

20mシャトルラン全体分布 20mシャトルラン 男女別

女子のピークは幅が広くピークから下がっていく。

男子のピークは女子のピークの幅より狭い。

橘高校男子と全国男子 平均分布

考察・分析

握力 +0.5反復横とび +12.920mシャトルラン +14.950m走 +2.7たち幅跳び -0.6ボール投げ -12.7

たち幅跳びとボール投げ以外の種目では、全国平均を上回っている。また走ることに関しては、すべて+で

あることがわかる。

時間的推移を分析した生徒例…指導点は縦軸目盛り設定

反復横飛び3年生(推移) 反復横飛び3年生(推移)

反復横飛び60以上-部活反復横飛び男女別分布

サッカー, 12

バレーボー

ル, 14

硬テニス, 1 水泳, 4

軟テニス, 1

野球, 8

陸上ー

走, 9

陸上ー

跳, 5

陸上ー投

1 なし, 3

ボール投げ上位 60 位と部活動

-9-

握力 男女の比較

女子よりも男子の標準偏差が高い

男子のほうがバラつきがある

握力 3年間の比較

学年が上がるにつれて握力も強くなっている

握力 考察

• 3学年の握力の差はあまり見られなかったが、3年間の握力の変化を比較したところ、特に45kg以上の人たちに変化が見られた。

• 野球部や陸上の投擲種目などの、元からある程度握力の強い人がさらに練習に励むために、45kg以上の人たちに変化が見られたのではないだろうか。

反復横とび男女別

0

50

100

150

200

250

20 25 30 35 40 45 50 55 60 65 70

全員

20mシャトルラン男子 学年別 平均

80.76

86.23 86.36

94.94

103.86

99.19

70.00

75.00

80.00

85.00

90.00

95.00

100.00

105.00

110.00

1 2 3

全国平均 橘高校平均

橘高校男子 学年、部活別 人数割合

82%

0%

18%

1年

運動部

文化部

87%

0% 13%

2年

運動部

文化部

76%

0%

24%

3年

運動部

文化部

橘高校男子 全体 運動部割合 82%

-10-

握力 男子 学年別 平均

39.94

42.43

43.50

40.08

43.11

43.74

39.50

40.00

40.50

41.00

41.50

42.00

42.50

43.00

43.50

44.00

1 2 3

全国平均

橘高校平均

・考察、分析

・橘高校男子の20mシャトルランの記録は全国平均を2割上回る。(図1参照)

・これは橘高校の運動部加入生徒がどの学年も3/4を占めているからだと考えられる。(図2参照)

・全国の運動部に加入している男子は56%(文部科学省より)に対し、橘高校では 82%と大きく上回っている。

・握力でも全国を上回る結果を出している。(図3参照)

・ここから橘高校の生徒は部活動に意欲的に参加している生徒が多いと考えられる。

部活別50m走7秒以下

サッカー

17%

陸上-走

43%

バレーボール

7%

野球

13%

水泳

1%

60%

70%

軟テニス

2%

バドミントン

2%陸上-跳

8%

バスケ

2%陸上-投

5%

130%

140%

部活別50m走7秒以下

予想通りの結果になった。

ハンドボール投げ3年生(推移)

14.5

15.0

15.5

16.0

16.5

17.0

17.5

18.0

18.5

1 2 3

系列2

3年生になって記録が縮んでいる。

1年、2年、3年と記録が伸びると思ったが3年のときに記録が下がった。

その理由は、部活などでラストシーズンなので無理をしないようにしたと考えた。

-11-

(4)応用 政府統計の総合窓口 https://www.e-stat.go.jp/より参照

総務省家計調査報告から「国民(個人)の経済」について統計から仮説を立てさせる

ヒント例 貯蓄高の平均値・中央値の乖離からうかがえること

負債なしが最頻値であることからうかがえること

-12-

(5)進路指導への応用の可能性

進路実績(入試合否結果)を分析し、業者のデータ分析と合わせて志望校決定の戦略を立てる

例① 英語 SS偏差値と大学(全体)一般受験合否結果

例② 英語 SS偏差値と某大学(P)一般受験合否結果

例③ 英語 SS偏差値と某大学(Q)一般受験合否結果

例④ 英語 SS偏差値と某大学(R)一般受験合否結果

-13-

0

20

40

60

80

100

120

140

160

180

40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72

0

2

4

6

8

10

12

14

40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72

0

2

4

6

8

10

12

40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72

0

5

10

15

20

25

40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72

(6)確率的シミュレーション モンテカルロ法 理論+実習 1時間

目的と評価 現象をモデル化し,コンピュータによる模擬実験により理論値や起こりうる事象を

予測可能であることを理解する

-14-

左の空欄を考えさせる

Excelから新規作成~以下下記の手順

① 2行目の式を考えさせる(乱数など数式~関数の検索で調べさせる)

② →1,000,001行を指定し数式コピー

Row\Col A B C D

1 x y x2+y2 x2+y2<=1 なら 1、でなければ 0

2 =RAND() =RAND() =A2^2+B2^2 =IF(C2<=1,1,0) 3

4

5

6

1,000,001

下表のように値が入る

Row\Col A B C D

1 x y x2+y2 x2+y2<=1 なら 1、でなければ 0

2 0.890116957 0.48192255 1.024557542 0

3 0.379809573 0.002238576 0.144260323 1

4 0.992009231 0.844278875 1.696889132 0

5 0.111067752 0.983513753 0.979635348 1

F列以降に下表の式をガイドする

F G H I J

繰返し回数 n 円内打点数 m 全打点数 n 円内確率

m/n π=4 * m/n

1 =COUNTIF($D$2:D2,1) =COUNT($D$2:D2) =G2/H2 =4*I2

10 =COUNTIF($D$2:D11,1) =COUNT($D$2:D11) =G3/H3 =4*I3

100 =COUNTIF($D$2:D101,1) =COUNT($D$2:D101) =G4/H4 =4*I4

1000 =COUNTIF($D$2:D1001,1) =COUNT($D$2:D1001) =G5/H5 =4*I5

10000 =COUNTIF($D$2:D10001,1) =COUNT($D$2:D10001) =G6/H6 =4*I6

100000 =COUNTIF($D$2:D100001,1) =COUNT($D$2:D100001) =G7/H7 =4*I7

1000000 =COUNTIF($D$2:D1000001,1) =COUNT($D$2:D1000001) =G8/H8 =4*I8

下表のように値が入る

F G H I J

繰返し回数 n 円内打点数 m 全打点数 n 円内の確率 m/n π=4 * m/n

1 1 1 1 4

10 10 10 1 4

100 88 100 0.88 3.52

1000 810 1000 0.81 3.24

10000 7873 10000 0.7873 3.1492

100000 78535 100000 0.78535 3.1414

1000000 785382 1000000 0.785382 3.141528

発生回数\試行回数 1 回 2 回 3 回 4 回 5 回 6 回

1 0 4 4 4 4 0

10 2.4 3.6 3.2 3.6 3.2 2

100 2.8 3.08 3.08 3.24 3.12 3.08

1,000 3.168 3.14 3.16 3.176 3.116 3.092

10,000 3.1576 3.1552 3.1368 3.1324 3.1288 3.1824

100,000 3.13904 3.14884 3.14108 3.13556 3.13328 3.13776

1,000,000 3.139152 3.143168 3.139124 3.142348 3.141348 3.142568

考察 理論値に対して±1%に収まる試行回数は( )回以上である。

-16-

3.1

3.12

3.14

3.16

3.18

3.2

1 10 100 1000 10000 100000 1000000

系列1 系列2 系列3 系列4 系列5 系列6

(7)論理モデル・シミュレーション 物体投射の時間と変位 理論+実習 0.5時間

Excelから新規作成~以下下記の手順

① 本校 1 年次「物理基礎」では物体投射を未習、「数学Ⅰ」ではラジアン、三角関数を未習のた

め、Cells(2,2)=初速、Cells(4,2)=投げ上げ角をパラメータと設定したうえで、A列の式を設定

しておく。

② C列以降に下表の式をガイドする

R\C A B C D E

1 初速 v0 時間 t 鉛直速度 vy 水平距離 x 鉛直距離 y

2 60 0 =$A$2-9.8*B2 =$A$8*B2 =$A$10*B2-0.5*9.8*B2^2 3 投射角θ 0.1 =$A$2-9.8*B3 =$A$8*B3 =$A$10*B3-0.5*9.8*B3^2 4 45 0.2 =$A$2-9.8*B4 =$A$8*B4 =$A$10*B4-0.5*9.8*B4^2 5 radian 0.3 =$A$2-9.8*B5 =$A$8*B5 =$A$10*B5-0.5*9.8*B5^2 6 =RADIANS($A$4) 0.4 =$A$2-9.8*B6 =$A$8*B6 =$A$10*B6-0.5*9.8*B6^2 7 水平初速 v0x 0.5 =$A$2-9.8*B7 =$A$8*B7 =$A$10*B7-0.5*9.8*B7^2 8 =$A$2*COS($A$6) 0.6 =$A$2-9.8*B8 =$A$8*B8 =$A$10*B8-0.5*9.8*B8^2 9 鉛直初速 v0y 0.7 =$A$2-9.8*B9 =$A$8*B9 =$A$10*B9-0.5*9.8*B9^2 10 =$A$2*SIN($A$6) 0.8 =$A$2-9.8*B10 =$A$8*B10 =$A$10*B10-0.5*9.8*B10^2 11 0.9 =$A$2-9.8*B11 =$A$8*B11 =$A$10*B11-0.5*9.8*B11^2 12 1 =$A$2-9.8*B12 =$A$8*B12 =$A$10*B12-0.5*9.8*B12^2

③ 初速と投射角を入力させたうえでグラフ化を行う。単位:MKS系

初速v0 時間t 鉛直速度v 水平距離x 鉛直距離y

60 0 60 0 0投射角θ 0.1 59.02 4.242640687 4.193640687

45 0.2 58.04 8.485281374 8.289281374radian 0.3 57.06 12.72792206 12.28692206

0.785398163 0.4 56.08 16.97056275 16.18656275

水平初速v0x 0.5 55.1 21.21320344 19.98820344

42.42640687 0.6 54.12 25.45584412 23.69184412

鉛直初速v0y 0.7 53.14 29.69848481 27.29748481

42.42640687 0.8 52.16 33.9411255 30.80512550.9 51.18 38.18376618 34.21476618

1 50.2 42.42640687 37.526406871.1 49.22 46.66904756 40.740047561.2 48.24 50.91168825 43.85568825

-40

-20

0

20

40

60

80

100

120

0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 420 440 460 480 500

-17-

(8)評価問題

Ⅰ 次のデータから統計値を求めよ

①データ数:(48) ②合 計 値:(49) ③最 大 値:(50)

3, 4, 4, 4, 5, 5, 7, 8

④最 小 値:(51) ⑤平 均 値:(52) ⑥中 央 値:(53)

⑦分 散 値:(54) ⑧標準偏差:(55) ⑨最 頻 値:(56)

Ⅱ 文中の( )に適する語句を答えよ

・データ分布の様子や特徴を示すとき、データをいくつかの区間(25)に分けて、データの個数を

対応させた表を(26)、グラフにしたものを(27)という。

・分散は、(28)を二乗した値の平均値であり、その正の平方根を(29)という。

・標準偏差が(30)ほど、データのばらつきは大きい。

・度数分布表を作成するときに階級を定めるためにはじめに必要な値は(31)である。

・2項目に相関があるとき、相関関係が(32)ほど散布図に直線的な傾向が現れるが(33)は、

これを数値化したものである。

Ⅲ 下の散布図からそれぞれ 2項目の関係を答えよ。

(34) (35) (36) (37) (38)

(9-1) 残留課題

・FREQUENCY関数は、配列数式 Ctrl + Shift + Enterの実行が、一般的ではない。

・FREQUENCY関数で度数分布を求める際、階級を n未満に設定できない。⇒COUNTIF

の差分でも良いが…従って階級 2,4,6,8を 1.99,3.99~に設定(教科書と不一致)

・同様にヒストグラムの横軸を階級値に自動設定することもできない。

・下記のような相関係数の絶対値と相関評価は、様々な論文に見受けられるが、

定義としての確立は?

・相関を評価(統計値算出)するための、妥当なデータ数の縛り?

→メンデルは約 7,800の「エンドウの種子」を調べて優性の法則 2.96(3):1発見

例 0.9以上 極めて強い相関

0.7以上 強い相関

0.4以上 相関あり

0.2以上 弱い相関

0.2未満 相関なし

・Excelによって発生させる乱数の評価

-18-

(9-2) 考察

中学校学習指導要領解説 数学 統計関係部分抜粋から、本件に関して中学校で既習内容であるべ

きであるが一部を除き、入学段階で学習痕跡がない。

http://www.stat.go.jp/teacher/dl/pdf/c3index/guideline/middle/math.pdf

生徒のあらゆる学習においてデータから帰納法的に原則・法則を導いた上で、未知の問題解決に

対して演繹法的に思考することが論理の根本を成すとすれば、「数学Ⅰ」や「情報の科学」での学

習内容における重複を避け発展的な学習のために、高校入試問題の出題内容に含めることで中学生

段階の確実な学習を期待したい。

-19-

集団に対する調査

結果(数値)

合理的集計・加工

法則の発見

未経験の事案に対する

演繹法的な戦略構築の

足場

経年データ⇒時系列、 地理的隔たりによる差異、

母集団のサイズと分析結果など

⇒現状の年間授業計画枠での工夫

第3節 各学年の内容

[第1学年] D 資料の活用

(1) 目的に応じて資料を収集し,コンピュータを用いたりするなどして表やグラフに整理し,

代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする。

ア ヒストグラムや代表値の必要性と意味を理解すること。

イ ヒストグラムや代表値を用いて資料の傾向をとらえ説明すること。 〔用語・記号〕

平均値 中央値 最頻値 相対度数 範囲 階級

以下省略

10 教科情報と他教科・教科外学習の連携例

月 情報の科学指導計画 他教科・教科外学習との連携及び支援

4 ①DTM/MTR実習

シーケンス制御

(含パラレル制御)

スポーツ科生徒主体で新体力テスト企画・運営

ドキュメンテーション、音声コンテンツ⇔①

5 ②動画編集/理論 新体力テスト実施

6 教科書理論 全クラス 生徒会行事「歌合戦(ミュージカル)」のための音源作成

(MTR) ⇔①

7 定期考査/理論 生徒会行事「歌合戦(ミュージカル)」のための音源作成(MTR) ⇔①

8

9 教科書理論/統計 生徒会行事「体育祭」「文化祭」のための音源 (MTR)と映像作成⇔①②

10 ③統計/VBA実習 体育科より過去の新体力テスト DBの供給を受ける

11 教科書理論

12 定期考査/理論

1 アルゴリズム実習 数学Ⅰ第 5章「データ分析」⇔③

2 アルゴリズム実習 スポーツ科学科発表⇔②③、生徒会行事「三送会」のためのコンテン

ツ作成⇔①②

3

11 参照文献・WEBサイト(公知の事実を省略)

・中学校学習指導要領解説

http://www.stat.go.jp/teacher/dl/pdf/c3index/guideline/middle/math.pdf

・政府統計の総合窓口

https://www.e-stat.go.jp/

-20-