データマネジメントと...
Transcript of データマネジメントと...
データマネジメント とIRデータ統合化の状況
2019年 3月 8日久留米工業大学丸山 研二
継続的改善のためのIR/IEセミナー2018 IR実務担当者セッション1
1. IRの役割: データマネジメントとICTインフラ
2. 調査方法: 質問紙調査
3. 質問紙調査の結果と分析
4. 今後に向けて
5. 謝辞
6. 参考文献
Copyright 2019 Kurume Institute of Technology
内容
1
比較: 米国の大学では統合DBが整備されている現状把握: 日本のIR部門の「データマネジメント」とICTインフラである「統合DB, DWH」の状況はどうなっているのか?
問題意識:1. IR責任者は情報管理者として責務を果たしているのか?2. 統合DB, DWH無しに効率良く成果物を得ているのか?3. IR部門は、大学経営に貢献しているのか?
Copyright 2019 Kurume Institute of Technology
データ分析に無駄な手間がかかる、価値創出が遅い
本テーマを始めたきっかけ
2
Copyright 2019 Kurume Institute of Technology
Volkwein(2008)の「IRの4つの顔」を拡張した
IRの6つの顔* *丸山(2018)
3
IR 対象とする人
役割
情報管理者 情報広報者
分析者 研究者
IRインフラ管理者
IR教育推進者
内部の人 外部の人
プロセスやり方コンテンツ内容ICTインフラ
ICTリテラシーインフラ
データマネジメント
ICTインフラ(統合DB, DWH)
IRリテラシー
IRリテラシ-トップのIR知識分析スキルデータ分析システム
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
43大学にメールで問合せ、36大学より回答 (84%)
質問紙調査
4
■ 大学執行部(学長、副学長など)のICT知識はどのようなものでしょうか? データマネジメント、統合DB, DWHに関する知識は深いでしょうか?0) 不明1) データマネジメント、統合DB, DWHに関する
知識は、あまりない。2) 概念を知っているが、助言無しで的確な判断
が出来るほどでは無い3) 概念を知っていて、助言無しで的確な判断が
できる4) 詳細を知っており、的確な判断ができる
※ 全質問文は、補足資料に掲示
結果と分析
Copyright 2019 Kurume Institute of Technology5
Copyright 2019 Kurume Institute of Technology
包絡線は大学の規模に反比例
トップのIR知識
6
一部のトップにIR知識が豊富な方がいる。全体の11% 44%は、知識はあまりないと回答
トップ
のIR
知識
0
1
2
3
4
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
4) 詳細を知っていて、的確な判断ができる3) 概念を知っていて、的確な判断ができる2) 概念は知っているが的確な判断はできない1) 知識は、あまりない。0) 不明
大学の規模(収入), 億円
Copyright 2019 Kurume Institute of Technology
中心線は大学の規模に比例
分析スキル
7
収入500億円未満の大学で分析スキルの高い方が多い 大半は、Excelが使えるスキル。最高のレベル7は、20%
分析
スキ
ル
大学の規模(収入), 億円
1
2
3
4
5
6
7
0 500 1000 1500 2000
7) ETLツールが使える6) PythonやRなどで統計分析ができる5) BIが使える4) SQLやAccessが使える3) SPSSなどの統計解析ソフトが使える2) Excelで高度な操作ができる1) Excelが使える
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
Copyright 2019 Kurume Institute of Technology
包絡線は大学の規模に比例
データ分析システム(方法)
8
4大学を除きcsvなどから分析、その割合は89% 収入1000億円以上の大学の中にはExcelだけで分析しているところがある
デー
タ分析
シス
テム
(方
法)
大学の規模(収入), 億円
1
2
3
4
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
4) DB、DWHからBIサーバで分析3) csvなどからBIソフトで分析2) DBからSQLで抜き出したファイルをExcelや統計ソフトで分析1) csvなどからExcelや統計ソフトで分析
Copyright 2019 Kurume Institute of Technology
統合DHWの概念図
9
データ収集
データ取出
データ入力
データ・ウェアハウス(DWH)
各研究科
・
・
各部門
・
・
IR部門
教学システム
財務システム
事務システム
CIFS/SMB
CSVなど
R, Python,BI など
IRレポート
ETL
Copyright 2019 Kurume Institute of Technology
統合DB, DWHを持っている大学は19%, しかし?
ICTインフラ - 統合DB, 統合DWH
10
81%の大学は、ファイルサーバ、あるいはディスク 統合DB, 統合DWHの保有は、大学の規模に比例しているわけではない
ICTイ
ンフラ
-統
合D
B, 統
合D
WH
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
5) 統合DWHから分析4) 統合DBから分析3) ファイルサーバにcsvなどで保管し、分析2) 学務システムから帳票を抜き出し、分析1) クライアントPCで分析
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
Copyright 2019 Kurume Institute of Technology
ExcelとDWHの間には大きなギャップがあるデータベースの発展モデル
11
Eckerson, W. (2006) “Are You Stuck In BI Adolescence?” The Data Administration Newsletter. http://www.tdan.com/view-articles/5027
Copyright 2019 Kurume Institute of Technology
DMBOK本
12
データマネジメントの体系:DMBOK (Data Management Body of Knowledge)質問紙調査の項目はDMBOKから採った
DAMA International (2018) 『データマネジメント知識体系ガイド 第二版』 日経BP社.
第1章 データマネジメント第2章 データ取扱倫理第3章 データガバナンス第4章 データアーキテクチャ第5章 データモデリングとデザイン第6章 データストレージとオペレーション第7章 データセキュリティ第8章 データ統合と相互運用性第9章 ドキュメントとコンテンツ管理第10章 参照データとマスターデータ第11章 データウェアハウジングとビジネスインテリジェンス第12章 メタデータ管理第13章 データ品質第14章 ビッグデータとデータサイエンス第15章 データマネジメント成熟度アセスメント第16章 データマネジメント組織と役割期待第17章 データマネジメントと組織の変革
Copyright 2019 Kurume Institute of Technology
データマネジメントの体系
13
・業務プロセス・組織変革
Copyright 2019 Kurume Institute of Technology
19%の大学がデータガバナンスが出来ていると回答
データガバナンス データマネジメント(1/6)
14
42%の大学が出来ていないと回答 カバナンスの有無は、規模には依存関係はない
デー
タガバ
ナン
ス
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology
出来ている大学は2校のみ, 6%
データ アーキテクト マネジメント (2/6)
15
94%の大学で出来ていないと回答 データ アーキテクト マネジメントの意味が理解されていない?
デー
タア
ーキ
テクト
マネ
ジメン
ト
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology
出来ている大学は2校、6%、半分が53%
データ品質マネジメント (5/6)
16
データ品質マネジメントの意味が理解されているのだろうか? ファイルサーバーでは容易にコピーが取れるので品質は担保されないのだが
デー
タ品質
マネ
ジメン
ト
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology
質問紙調査のまとめ
17
大規模大学ではデータマネジメント体制が整備され、統合DB, 統合DWHなどのICTインフラが整備されている小規模大学でもデータマネジメント体制や、 ICTインフラが整備されている大学がある。トップのIR知識の深さやIR部門の個人の力量の高さで構築・運用されている
大規模大学は仕組みが組織に埋め込まれているが、小規模大学は個人で動いている
Copyright 2019 Kurume Institute of Technology
今後に向けて
18
統合DB, DWHが無ければデータマネジメントの実現は困難である統合DB, DWHとBI, R, Pythonなどを使いこなしてこそ付
加価値の大きいIR分析が、効率的にできる小規模大学では、このようなICTインフラを構築するには幾多
の障壁がある
IRデータの標準化、ICTインフラの標準化によって統合DB, DWHの導入を容易にする施策が望まれるこれまでの資産(分類コード、コモンデータセットなど)を、標
準化志向で活用することが望まれる
質問紙調査に協力いただきました方々に深く御礼申し上げます。
特に、自由記述欄に御記入いただいた内容は、お叱りあり、提案あり、と盛りだくさんでした。今後の調査に活かしていきたいと存じます。
Copyright 2019 Kurume Institute of Technology
謝辞
19
参考文献
Copyright 2019 Kurume Institute of Technology20
1. セイモア, D.T. (2000) 『大学個性化の戦略 -高等教育のTQM』 玉川大学出版部.2. Volkwein, J. F. (2008) “The Foundations and Evolution of Institutional
Research” New Directions for Higher Education, No.141, Spring, pp.5-20.3. 柳浦猛 (2009) 「アメリカのInstitutional Research:IR とはなにか?」, 国立大学財
務・経営センター研究. 報告, 第11号, 国立大学財務・経営センター, pp.220-253. (以下のURLに転載 http://www.postsecondaryanalytics.com/whatisir/)
4. Eckerson, W. (2006) “Are You Stuck In BI Adolescence?” The Data Administration Newsletter. http://www.tdan.com/view-articles/5027
5. 小林雅之, 山田礼子 (編著) (2016) 『大学のIR -意思決定支援のための情報収集と分析 』 慶應義塾大学大学出版会. (特に、浅野茂 執筆、「第六章 大学のデータを集める」)
6. DAMA International (2018) 『データマネジメント知識体系ガイド 第二版』 日経BP社.7. 長沼伸一郎 (2016) 『経済数学の直観的方法 確率・統計編』 講談社.8. マッキニー, W. (2018) 『Pythonによるデータ分析入門 第2版 ―NumPy、pandasを
使ったデータ処理』 オライリージャパン.9. 平井明夫、 岡安裕一 (2013) 『データ分析の基本と業務 (仕組みが見えるゼロからわか
る) 』 翔泳社.
Copyright 2019 Kurume Institute of Technology
参考文献
21
補足資料
質問紙調査の質問項目
質問紙調査の結果: データマネジメントの状況
Copyright 2019 Kurume Institute of Technology22
IRリテラシ-トップのIR知識分析スキルデータ分析システム
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
43大学にメールで問合せ、36大学より回答 (84%)
質問紙調査 (1/3)
23
■ 大学執行部(学長、副学長など)のICT知識はどのようなものでしょうか? データマネジメント、統合DB, DWHに関する知識は深いでしょうか?0) 不明1) データマネジメント、統合DB, DWHに関する知識は、
あまりない。2) 概念を知っているが、助言無しで的確な判断が出来
るほどでは無い3) 概念を知っていて、助言無しで的確な判断ができる4) 詳細を知っており、的確な判断ができる
IRリテラシ-トップのIR知識分析スキルデータ分析システム
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
IRリテラシ- -分析スキル
質問紙調査 (1/3)
24
■ IR部門の教職員のICTスキルはどのような状況でしょう? トップレベルの方のスキルの状況をお答えください1) Excelが使える2) Excelで、マクロ、データ抽出・整形など高度な操作ができる3) SPSSやSASなどの統計解析ソフトが使える4) SQLやAccessが使える5) BI(Tableau、Pentahoなど)が使える6) PythonやRなどで統計分析ができる7) ETLツールが使える
IRリテラシ-トップのIR知識分析スキルデータ分析システム(方法)
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
IRリテラシ- -データ分析システム(方法)
質問紙調査 (1/3)
25
■ データ分析システムはどのようなものをお使いでしょうか?1) csvなどからExcelや統計ソフトで分析2) DBからSQL, Accessなどで抜き出したファイルを、
Excelや統計ソフトで分析3) csvなどからBIソフトで分析(過去の静的な帳票やグ
ラフ)4) DB、DWHからBIサーバで分析(未来を予測した動
的な分析)
IRリテラシ-トップのIR知識分析スキルデータ分析システム
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
ICTインフラ - 統合DB, 統合DWH
質問紙調査 (2/3)
26
■ データベースシステムはどのようなものをお使いでしょうか?1) クライアントPCのみを使用。IRデータを一元的に
保管するファイルサーバやDBは無い2) IRデータは学務システムのDBから帳票を抜き出
し、クライアントPCで分析3) IRデータはファイルサーバ(CIFS/SAMBA)に
csvなどで保管し、クライアントPCで分析4) IRデータは統合DB (複数の学務システムのDB
を集めたDB)に保管し、クライアントPCで分析5) IRデータは統合DWHにあり、クライアントPCで
分析
IRリテラシ-トップのIR知識分析スキルデータ分析システム
ICTインフラ統合DB, 統合DWH
データマネジメントガバナンスアーキテクトセキュリティDWH,BI品質人材育成
Copyright 2019 Kurume Institute of Technology
データマネジメント
質問紙調査 (3/3)
27
■ 貴学のデータマネジメントの体制、仕組みはどのようになって(構築されて)いますでしょうか?[いいえ: 1点] - [半分: 3点] - [出来ている: 5点]
a)データガバナンスb)データアーキテクトマネジメントc)セキュリティマネジメントd)DWH, BIマネジメントe)データ品質マネジメントf)データマネジメント教職員の育成
Copyright 2019 Kurume Institute of Technology
出来ていない大学は14%、半分以上が86%
データ セキュリティ マネジメント (3/6)
28
データ セキュリティ マネジメントという言葉は浸透している 客観的にデータ セキュリティ マネジメントは出来ているのか?
デー
タセ
キュリ
ティ
マネ
ジメン
ト
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology
出来ている大学は4校、11%、出来ていないが64%
DWH,BI マネジメント (4/6)
29
DWHが無いのだから少ないのは当然 DWHとBIの両方を導入するのは自然
DW
H,B
I マ
ネジ
メント
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology
「品質」とほぼ等しい、出来ているは2校、半分が53%
人材育成 データマネジメント(6/6)
30
「データ品質マネジメント」の結果とほぼ等しいのは、なぜ?
人材
育成
大学の規模(収入), 億円
1
2
3
4
5
0 500 1000 1500 2000
● 国立・総合♦ 国立・単科〇 私立・総合◇ 私立・単科
5) 出来ている4) (中間)3) 半分2) (中間)1) 出来ていない
Copyright 2019 Kurume Institute of Technology