原 康暢 畜産経営管理講座 (統計研究室)

17
1 相相相相相相相相相相相相相相相相相 相相相相相相 相 相相 相相相相相相相相 相相相相相相 ()

description

平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究. 原 康暢 - PowerPoint PPT Presentation

Transcript of 原 康暢 畜産経営管理講座 (統計研究室)

Page 1: 原 康暢 畜産経営管理講座 (統計研究室)

1

平成14年2月8日卒業研究報告

相関行列に基づく非計量多次元尺度法

に関する研究

原 康暢畜産経営管理講座(統計研究室)

Page 2: 原 康暢 畜産経営管理講座 (統計研究室)

2

  

   1.はじめに     

    MDS:多次元尺度構成法

 MDSの特徴

類似度データ

非類似度データ背後の構造を視覚化

似ているものは近く 似てないものは遠く

Page 3: 原 康暢 畜産経営管理講座 (統計研究室)

3

MDS の種類 計量 MDS

 データが間隔尺度・比尺度の場合  トーガソンの方法

非計量 MDS データが順位尺度の場合 クラスカルの方法

Page 4: 原 康暢 畜産経営管理講座 (統計研究室)

4

研究目的

非計量MDS非類似度

類似度適用可能

クラスカルの方法・適用 ・分析

研究目的

類似度

相関行列で定義有効性?

変量間

Page 5: 原 康暢 畜産経営管理講座 (統計研究室)

5

2.クラスカルの方法

 対象i,j間の類似度  (データの値)とn次元空間上の距  離  の順位を適合させる。

     

  類似度              単調減少関数        非類似度             単調増加関数

 空間上の距離と単調変換の値の誤差を   とする 

ijijd

ijeijd

)( ijf

ijeijd

ijd

)f(

空間上の距離ijd と単調関係 

ij

(a)

単調回帰法

単調変換

Page 6: 原 康暢 畜産経営管理講座 (統計研究室)

6

    

   ストレス( Stre

ss )          すべての誤差  の二乗和        

ije

ji ij

ji ijij

d

ddS

2

2)(

この値が最も小さくなるような単調関数と対象の布置を求める。

データと、空間上の距離の      適合度

( 1 )

Page 7: 原 康暢 畜産経営管理講座 (統計研究室)

7

3.モンテカルロシミュレーション実験

変量1・2・3     第1ブロック変量4・5       第2ブロック      となるよう相関係数を定め

変量6・7・8     第3ブロック       乱

数を用いそれぞれを  変量9~13      第4ブロック       1000組発生させる。 変量14~20     第5ブロック                                                                                                                                              

 変量間の相関行列を算出

相関行列を入力データとし、クラスカルの方法へ適用

Page 8: 原 康暢 畜産経営管理講座 (統計研究室)

8

相関行列で定義された類似度

有効な分析可能!

 実験結果 2次元選択 ( Stress;0.183)

Stressの値高いが無視

視覚的に見やすいことを前提

5個のブロックを形成

相関行列を正確に反映

クラスカルの方法適用

(図3)最終布置 2D散布図 1 次元

2

次元

VAR1

VAR2

VAR3

VAR4

VAR5

VAR6 VAR7

VAR8

VAR9VAR10

VAR11

VAR12

VAR13

VAR14VAR15

VAR16VAR17

VAR18VAR19

VAR20

-1.0

-0.6

-0.2

0.2

0.6

1.0

1.4

-1.2 -0.8 -0.4 0.0 0.4 0.8 1.2

Page 9: 原 康暢 畜産経営管理講座 (統計研究室)

9

4 . 実際のデータへの適用中学生166人の12教科の評点 12教科の相関行列を算出

生徒番号 1 2 3 ・・・ 166国語 32 38 30 ・・・ 60社会 41 23 30 ・・・ 85数学 50 46 25 ・・・ 88理科 64 60 59 ・・・ 82音楽 64 69 68 ・・・ 59美術 66 72 72 ・・・ 78体育 37 54 36 ・・・ 85技家 43 66 54 ・・・ 47英語 22 12 10 ・・・ 83

小4配当漢字 62 48 28 ・・・ 79小5配当漢字 68 46 36 ・・・ 84小6配当漢字 52 32 42 ・・・ 74

2    (表 )中学2年生166人 2学期 12教科の評点

Page 10: 原 康暢 畜産経営管理講座 (統計研究室)

10

入力データとしクラスカルの方法へ適用・分析

国語 社会 数学 ・・・ 小5配当 小6配当国語 1 0.7825 0.735 ・・・ 0.7819 0.7595社会 0.7825 1 0.7873 ・・・ 0.6757 0.696数学 0.735 0.7873 1 ・・・ 0.6076 0.5651

・ ・ ・ ・ ・ ・・ ・ ・ ・ ・ ・・ ・ ・ ・ ・ ・

小5配当 0.7819 0.6757 0.6076 ・・・ 1 0.8842小6配当 0.7595 0.696 0.5651 ・・・ 0.8842 1

3(表 )12教科の相関行列

Page 11: 原 康暢 畜産経営管理講座 (統計研究室)

11

分析結果

) (図4 最終布置 2次元選択 中学生 成績 1次元

2

次元

国語

社会 数学

理科音楽

美術体育

技家

英語

小4配当 小5配当 小6配当

-0.3

-0.2

-0.1

0.0

0.1

0.2

-4 -3 -2 -1 0 1

  2次元選択      ( Stress;0.0113) 

3次元を選択し、計算     をやり直す。

他のすべての教科と

 相関の低い体育

2次元最終布置退化

Page 12: 原 康暢 畜産経営管理講座 (統計研究室)

12

 3次元選択 ( Stress;0.023)                                      

シェパード・ダイアグラム    単調関数と科目の組を比較    

    

科目の組 と 単調関数

データ(相関係数)

布図

中の

科目

間距

-0.5

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

0.0 0.2 0.4 0.6 0.8 1.0

相関係数は類似度     単調関数は右下がり

=)f(

ij

ijd

・ ),( ji

.

.

.

.

.ijd

ije

(図5)シェパード・ダイアグラム

 データ  と散布図中の距離  の当てはまりの良さを示す。 

 ij ijd

Page 13: 原 康暢 畜産経営管理講座 (統計研究室)

13

           3次元選択した場合の最終布置                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             ・ 生徒の持つ体力                       ・ 手先の器用さ                       ・ 感性の強さ  に左右される。

国語

社会

数学 理科

音楽美術

体育

技家

英語

小4配当

小5配当小6配当

中学2年生の12教科の成績の評点

解釈

(図6)最終布置 3次元選択 中学生 成績次元1 体力

次元2 器用

次元3 

感性

Page 14: 原 康暢 畜産経営管理講座 (統計研究室)

14

5.おわりに相関行列により定義されたの変量間の類似度を、クラスカルの方法へ適用する分析方法は、データの特性を 知るうえでたいへん有効であることがわかった。

結論

経営診断

経営管理

心理学生物学

 応用分 野

MDSと相関ルールの関連性

Page 15: 原 康暢 畜産経営管理講座 (統計研究室)

15

牛乳パン

お茶

弁当

お菓子

タバコ

つまみ

雑誌

コスメ

パンツ

スーパーの経営管理

MDS による(仮想的)商品配置図

Page 16: 原 康暢 畜産経営管理講座 (統計研究室)

16

酪農経営 経営診断

Page 17: 原 康暢 畜産経営管理講座 (統計研究室)

17

, 1 vs 2 vs 3因子負荷量 因子 因子 因子: 回転法 バリマックス 法: 抽出法 主成分分析

国語

社会

数学 理科音楽美術

体育技家

英語

小4配当 小5配当小6配当

主成分分析の結果