仮説検証型 (hypothesis testing)の研究仮説を立て...

仮説検証型 (hypothesis testing)の研究

仮説を立てる

データ収集

分析

解釈

質問紙やテストなどの測定具

目に見えない能力を評価

測りたい能力を測れてる？ (妥当性)

安定して正確な結果が得られる？ (信頼性)

仮説検証型 (hypothesis testing)の研究

仮説を立てる

データ収集

分析

解釈

データを解釈可能な形にする

平均値に差はある？

得点間にはどんな関係がある？

どのくらいの差があった？

その結果は偶然ではない？統計分析が欠かせない＝本書を学ぶ理由

ライティング能力を測りたいけど，採点に時間かかるから多肢選択式で出題しちゃおう！

採点が大変でも実際にエッセイを書かせよう…

評価にはいろーんな問題がある

社交性診断

1. 宿題は必ずやってくるほうだ

2. 期限は守れる方だ

当てはまらない　　　　　　　　どちらでもない　　　　　　　　　当てはまる1 2 3 4 5

この2つは同じような質問のため，同じ人が回答すれば似たような回答になる→信頼性はある

社交性を測るための質問項目として適切か？ →妥当性は満たされない

妥当性といってもいろいろありまして米国教育学会，米国心理学会，全米教育測定協議会 (1966)妥当性の種類定義検証法

内容的妥当性測りたい能力や特性を測るのに十分な項目があるか専門家の判断

基準関連妥当性 1．併存的妥当性 2．予測的妥当性

1．外部の基準との関連 2．ある時点の結果が将来のパフォーマンスをどの程度予測できるか

相関分析

構成概念妥当性尺度が測定しようとしている構成概念をどの程度反映しているか

相関分析因子分析 MTMM

表面的妥当性測定したいもの測定しようとしているように見えるか

構成概念 (construct)

理論上仮定されている能力や特性のこと

例スピーキング力

ライティング力

思考力

社交性

構成概念妥当性 (construct validity)

測定したい能力がちゃんと測定できているか？

結局は☝を検証できれば良いわけで…

妥当性の検証＝構成概念妥当性の検証

単一の概念

妥当性テスト得点を用いたある特定の推論が，

適切であるか，意味があるか，有用であるかをこと

テストの妥当化その推論を裏付けるための証拠を累積するプロセス

単一の概念とは言っても妥当性に関する証拠はたくさんあったほうが良いわけで… Messick (1995, 1996)

妥当性の側面証拠収集法の例内容的内容的妥当性にあたる専門家の判断

本質的項目やタスクに回答する実際のプロセスが理論と一致している

質問紙発話プロトコル

構造的尺度の得点が，構成概念の次元を反映している

SEM 因子分析

一般化可能性母集団が同じであれば，データの理論的特性（e.g., 平均点）が一

貫している

一般化可能性理論アルファ係数

外的併存的妥当性にあたる SEM

結果的特定の尺度を使用することによる悪影響がない波及効果の分析

MTMM (多特性・多方法行列分析法)収束的妥当性と弁別的妥当性から，構成概念妥当性を検証

異なる方法で，同じ能力を測定　→ 得点の相関は高い同じ方法で，異なる能力を測定　→ 得点の相関は低い

p. 8の例を参照

p. 8の表

波及効果テストが指導や学習に与える影響のこと有益な効果と有害な効果がある

テストが社会に与える影響はインパクトという

(washback/backwash effect)

Messick以降はというと

妥当性を，適切な証拠を積み上げていくことによって論証するという考え方が提唱される

妥当性に関して詳しく知りたい方は小泉 (2018) がおすすめ

Kane (2006) の妥当性の論証によるアプローチ解釈的論証と妥当性論証の2段階の論証

解釈的論証テスト得点の解釈および使用に関わる推論とその前提を明確にする

妥当性論証推論の前提の裏付けとなる証拠を提供し，根拠や論拠を提示する．

具体的には，(1) 得点化，(2) 一般化，(3) 外挿，(4) 決定の4つの推論に対し，前提を明らかにし，根拠を提示する

Chapelle et al. (2008) およびChapelle (2015)6＋1の合計7つの推論に基づく妥当性検証

(1) 領域定義　測定する構成概念が明確である (2) 評価　　　パフォーマンスが適切な形で素点になる (3) 一般化　　一貫した結果が得られる(4) 説明　　　構成概念を測定しているという分析結果 (5) 外挿　　　テスト以外の状況で同じ能力を発揮できる (6) 使用　　　 (7) 影響

Bachman and Palmer (2010)論拠と反証を明示し，正当化を行う

(1) 評価記録は一貫している (2) 解釈は意義がある (3) 偏見がない (4) 一般化できる (5) 関連性がある (6) 充足する

評価タスクから観測されたパフォーマンスに対し

得点に基づく決定に対し(7)価値がある (8) 公平である

信頼性については…得点の安定性や一貫性のこと

• 同じ人が同じ項目に回答すれば，結果はそこまで変わらないはず

• 似たような能力/特性を反映する項目は，同じような結果になるはず

古典的テスト理論では

得られたテスト得点は以下の前提を含む

• 誤差はランダムに生ずる，つまり真値との相関はゼロ

• 誤差はプラスとマイナスどちらの値もあり平均はゼロ

• 誤差同士の相関もゼロ

観測値＝真値＋誤差

古典的テスト理論では

得られたテスト得点は以下の前提を含む

• 分散とは，各データが平均からどのくら離れているかの平均（実際は2乗してプラスマイナスを打ち消す）

• 信頼性係数ρは真値の分散/観測値の分散

観測値の分散＝真値の分散＋誤差の分散

.80以上が良いとされる

※ただし，真値がわからないので求めることができない

信頼性係数の推定方法方法

再テスト同一被験者に同じテストを実施

同等フォーム同一被験者に同じ形式のテスト

を2回テストを実施

内的一貫性同じ構成概念を測定する項目が，受験者内で似た結果になってるかを調査

評価者間信頼性評価者間信頼性または評価者内一貫性を算出

仮説検証型 (hypothesis testing)の研究 仮説を立て...

Documents

Transcript of 仮説検証型 (hypothesis testing)の研究 仮説を立て...

言語処理のための仮説推論エンジン Phillip

関与負荷仮説に対する一考察...(Laufer and Hulstijn, 2001) together with the empirical study on the hypothesis by Hulstijn and Laufer (2001) and with one of the comparative

超伝導のふしぎ - 京都大学cond.scphys.kyoto-u.ac.jp/~norio/siminkouza.pdfKyoto University 3. ボーアの原子構造理論 「プランクの仮説」 ＋「アインシュタインの仮説」

ホーエル 『 初等統計学 』 第８章 ４ 節～６節 仮説の検定（２）

新規事業開発の進め方と事業計画書の作り方 · ①仮説と情報収集とデータ分析 ②仮説思考の体系的な整理 ③どのように仮説思考を事業開発に生かすのか？

確率・統計 B 推定・仮説検定 - Hiroshima Universitywakaki/lecture/probstatB13/slide0122.pdf · 復習(仮説検定) 一様最強力検定 確率・統計B 推定・仮説検定

ソーシャルワーカーが立てる仮説ニーズと クライエント等と …ソーシャルワーカーが立てる仮説ニーズとクライエント等との合意ニーズの生成～

統計的仮説検定・指数分布hig/course/probstat2... · 2015-07-28 · 統計的仮説検定・指数分布 統計的仮説検定の有意水準と検定力 自由に仮説検定を設計して,

Statistical Semantic入門 ~分布仮説からword2vecまで~

Think user first #2 フリルの機能改善における仮説と検証

伊達市霊山町仮設焼却炉説明会 New

超⼩型衛星開発とアントレプレナーシップ教育を通じた 宇宙 ......宇宙システム活 材の育成（PERSEUS）とは 仮説検証を仮説検証を 学ぶための

系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

2013年度秋学期 統計学 第１４回「分布についての仮説を検証する ― 仮説検定」

衛生仮説 - NCCHDnrichd.ncchd.go.jp/imal/Publication/0604SaitoHygiene_Kokyu.pdfキーワード：アレルゲン特異的IgE抗体 衛生仮説 Thl／Th2パラダイム Tolr様受容体

仮想デスクトップ (VDI) 導入検討ポイント解説download.microsoft.com/download/C/0/F/C0F19DBA-0889-4DAA...仮想デスクトップ(VDI) 導入検討ポイント解説

LPIC 304 技術解説セミナー - lpi.or.jp · ②LPIC304を学習する上でのポイント ③技術解説 主題330：仮想化 330.1 仮想化の概念と理論 330.2 Xen 330.3

仮説検定とその手順 - u-toyama.ac.jp of statistical...•仮説検定（Hypothesis testing) •推定・信頼区間（Estimation/ Confidence interval） •仮説検定とは

統計理論 - nichibyo.co.jp6-10-2 仮説検定の手順 6-10-3 帰無仮説と対立仮説 ... たソフトウェアで、マニュアル本も出ているので初心者でも利用しやすい。

フリーキャッシュフロー仮説による台湾企業の 自社株買い行 …フリーキャッシュフロー仮説による台湾企業の 自社株買い行動の分析

仮説検証型 (hypothesis testing)の研究仮説を立て...

Transcript of 仮説検証型 (hypothesis testing)の研究仮説を立て...

超伝導のふしぎ - 京都大学cond.scphys.kyoto-u.ac.jp/~norio/siminkouza.pdfKyoto University 3. ボーアの原子構造理論「プランクの仮説」＋「アインシュタインの仮説」

ホーエル『初等統計学』第８章４節～６節　仮説の検定（２）

確率・統計 B 推定・仮説検定 - Hiroshima Universitywakaki/lecture/probstatB13/slide0122.pdf · 復習(仮説検定) 一様最強力検定確率・統計B 推定・仮説検定

ソーシャルワーカーが立てる仮説ニーズとクライエント等と …ソーシャルワーカーが立てる仮説ニーズとクライエント等との合意ニーズの生成～

統計的仮説検定・指数分布hig/course/probstat2... · 2015-07-28 · 統計的仮説検定・指数分布統計的仮説検定の有意水準と検定力自由に仮説検定を設計して,

超⼩型衛星開発とアントレプレナーシップ教育を通じた宇宙 ......宇宙システム活材の育成（PERSEUS）とは仮説検証を仮説検証を学ぶための

系統樹・系統仮説の可視化と系統仮説間の統計的比較講義編

2013年度秋学期　統計学　第１４回「分布についての仮説を検証する ― 仮説検定」

衛生仮説 - NCCHDnrichd.ncchd.go.jp/imal/Publication/0604SaitoHygiene_Kokyu.pdfキーワード：アレルゲン特異的IgE抗体衛生仮説 Thl／Th2パラダイム Tolr様受容体

LPIC 304 技術解説セミナー - lpi.or.jp · ②LPIC304を学習する上でのポイント ③技術解説主題330：仮想化 330.1 仮想化の概念と理論 330.2 Xen 330.3

フリーキャッシュフロー仮説による台湾企業の自社株買い行 …フリーキャッシュフロー仮説による台湾企業の自社株買い行動の分析