ビッグデータ利活用入門 - BODIK · 目次(ビッグデータ利活用入門) ......

52
1 ビッグデータ利活用入門 共通知識

Transcript of ビッグデータ利活用入門 - BODIK · 目次(ビッグデータ利活用入門) ......

1

ビッグデータ利活用入門

共通知識

2

目的

共通知識として、ビッグデータの特徴ビッグデータの利活用プロセスビッグデータの利活用を支えるICTとサービスビッグデータ利活用特有の法的事項

の4項目について学び、ビッグデータ利活用に必要となる基礎的な知識を得ること。

3

目標

ビッグデータ利活用の特徴として、データ特性や効果を述べることができる

ビッグデータ利活用プロセスの概観を説明できる

ビッグデータ利活用を支えるICTの進展や、技術的なキーワードにつき概要を説明できる

ビッグデータ利活用における、法的留意点を述べることができる

4

前提

ありません

5

目次(ビッグデータ利活用入門)

1. ビッグデータの特徴

2. ビッグデータ利活用の効果

3. ビッグデータ利活用の全体像

4. ビッグデータを支える技術

5. 法的に気をつけること

6. まとめ

7. その他、参考

6

目標

1. ビッグデータの特徴

ビッグデータ利活用で取り扱われるデータの特徴を、説明することができる

ビッグデータの具体例とその発生場所を述べることができる

オープンデータを活用した施策事例と、その特徴を列挙することができる

7

1. ビッグデータの特徴

1.1. ビッグデータとは

1.2. ビッグデータはどこにあるのか

1.3. ビッグデータの特性

1.4. ビッグデータ利活用の流れ

1.5. オープンデータの特徴

8

1.1. ビッグデータとは

膨大なデータ量

多様なデータ種類

非定形のデータ形式を含む

リアルタイムでのデータ処理

データの発生源が多様

というだけではなく、

という特性を持つ

データを組合せることで付加価値を創出する

本テキストでは、次のように捉えます。

活動

データ

9

1.2. ビッグデータはどこにあるのか

社内 一般関係先

自社基幹システム

他部門

顧客

取引企業

グループ企業

政府等の公共機関

提携して効果のある企業

データ提供事業者

財務・会計・人事等の社内状況を示す情報

営業や顧客の情報など、事業領域ごとに固有で管理されている情報

業務上のやり取り上で発生する情報

企業間で共有される情報

統計データや地図情報など公開されている情報

企業が保有している情報

利用目的に合わせて整理された各種情報サプライチェーンの情報

10

多様性 (Variety) 高頻度 (Velocity)

高解像度 (Veracity)多量性 (Volume)

1.3. ビッグデータの特性

SNSのデータ アクセスログ

位置情報 ICカードの履歴オフィス文書 電子メール

コールセンターの音声 センサ・データ

監視カメラ画像

POSデータ アクセスログ

ポイントカードの顧客情報、購買履歴

投稿サイトの静止画、動画

11

1.4. ビッグデータ利活用の流れ

発生源(市場) 収集・蓄積

ビジネスでの活用

アンケート診断

物流

取引

メール 気象

電力使用

道路状況

新規サービス/商品の開発

オフィス文書

アクセスログ

車載データ会計

運行状況

渋滞情報

気象情報

分析方法

平均と標準偏差

相関分析正規分布

回帰分析

分析ツール

新規インフラの構築

クーポン配信防犯システム

スマートシティ

SNS

宅配

GPS

分析

12

1.5. オープンデータの特徴

どのような性質があるのか

利用できる、そしてアクセスできる再利用と再配布ができる誰でも使える

誰が公開しているのか

政府・自治体研究機関民間企業など

具体的な事例は

情報通信白書(総務省)

新車乗用車販売台数月別ランキング(一般社団法人日本自動車販売協会連合会)

業界動向/ランキング(リサーチ会社)

など

13

医薬品メーカーが企業秘密にし、秘匿にしていた情報

1.5.1.オープンデータの海外事例

欧州医薬品庁の事例

公益性重視

医薬品の臨床試験データ

企業大学

医薬品情報を必要とする人たち

オープンデータにすることで、多くの人に価値をもたらす。

医薬品の臨床試験データ

オープンデータ化

14

1.5.2.情報流通連携基盤による実現

15

1.5.3.考えてみましょう

ビッグデータにはどのような特性がありますか?身近な例で説明してください。

16

目標

2. ビッグデータ利活用の効果

ビッグデータ利活用が、価値のある内容であることを認識する

ビッグデータ利活用の効果を、説明することができる

17

2. ビッグデータ利活用の効果

2.1. ビッグデータ利活用の期待分野

2.2. 業種業態ごとの期待される効果

2.3. ビッグデータ利活用による効果の例

2.4. ビッグデータ利活用の動向

18

2.1. ビッグデータ利活用の期待分野

セキュリティ

製品開発

コンプライアンス 社会インフラ

メンテナンス

マーケティング Big Data

製品の将来像

市場の動向の分析

故障の可能性予測

災害の予測文書の全文検索で不適切な行動を察知

サイバー攻撃の予兆把握

19

2.2. 業種業態ごとの期待される効果

1. Web販売サイトでの顧客の挙動を分析

2. チケットを購入しなかった顧客の理由を見出し

3. 割引サービスの改善

販売促進

運輸 金融 製造医療・健康

兆候の把握

利活用の事例

事例における効果

1. 自動車メーカーと組み、対応端末を搭載した車から情報を取得

2. 車の走行距離に応じて保険料を決めるサービスを開始

新サービス開発

1. 生産工程にまつわる約100項目の情報を収集して、分析

2. 品質改善の最も効果的な策を知る

3. 現場に反映

品質向上

1.SNS上のコメントを分析

2.温度や湿度と風に関するコメントの関連を割り出して、病気の流行の把握

3.予防を呼び掛け

20

2.2.1.業種業態ごとの動向

既存顧客が多く社内データを活用していることから、既存顧客を重点に置いた利活用が行われていると考えられる。

総務省請負事業(24-0049-0068)「高度ICT利活用人材育成カリキュラム(実践編)の開発等の請負」

高度ICT利活用人材の

能力・要件・人材に関する調査研究報告書

卸売・小売業や金融・保険業

通信業やサービス業

社外データ(GPSデータ、SNSデータ)の取り込みを図っていることから、新たなサービスの検討等に利活用が行われていると考えられる。

21

2.3. ビッグデータ利活用による効果の例

課題①顧客ニーズを捉えた商品の開発②購買機会を増加させる販売促進

POSデータ

個別クーポン購買履歴

商品開発

売上伸び悩み

高リピート率の商品

天候と連動したクーポン

リアルタイム性

全数調査

外部サービス

天気情報

データの組合せ

ポイントカード

22

2.4. ビッグデータ利活用の動向

出典: 総務省、「高度ICT利活用人材の能力・要件・人材に関する調査研究報告書」P38

企業が保有している情報を中心に利活用が行われている

社内に存在するデータに着目し、社内データと社外データを組合せて利活用することが行われ始めている

① ②

23

2.4.1.考えてみましょう

ビッグデータを利活用することで、どのような効果を期待しますか?ご自分の会社、現在の仕事を題材に考えてください。

24

目標

3. ビッグデータ利活用の全体像

ビッグデータの全体像を把握し、説明することができる

25

3. ビッグデータ利活用の全体像

3.1. ビッグデータ利活用のプロセスとICT

3.2. ビッグデータ利活用に必要なスキル

26

ビジネス展開(運用)

ビジネスでの実行

ビジネスへのデータ利活用の導入(企画・計画)

目的の明確化

シナリオの立案

シナリオの有効性評価

環境準備

オペレーションの設計

実行判断

ICT

データの収集

データの蓄積

データの分析

データの棚卸

施策の検討

結果の確認

業務の実施

施策の実行

データの収集

データの蓄積

データの分析

施策判断

3.1. ビッグデータ利活用のプロセスとICT

27

3.2. ビッグデータ利活用に必要なスキル

ビジネス力(企画・計画、

運用)

分析力 ICT力

28

3.2.1.考えてみましょう

ビッグデータ利活用に必要なスキルには何がありますか。

29

目標

4. ビッグデータを支える技術

ビッグデータ利活用を支えるICTの進展や技術的なキーワードの概要を、説明することができる

ビッグデータの生成を可能にした環境について説明できる

ビッグデータの利活用を支えるICTに関するキーワードを挙げて、その内容を説明できる

30

4. ビッグデータを支える技術

4.1. ビッグデータが生まれた背景

4.2. ビッグデータの生成を支えるICT環境

4.3. ビッグデータの蓄積・分析を支えるICT

4.4. ビッグデータ利活用のサービス

4.5. ビッグデータに関するICT関連の用語

31

4.1. ビッグデータが生まれた背景

1990年代(後半)ウェブシステムの商用利用

Google社が1998年に創業ハードウェアの進化、分散並列処理の実用化

2000年代(前半)ネット販売の登場

2000年代(後半)以降ソーシャルメディア、ICカード、スマートフォンの登場

スマートフォンの登場により、情報の収集が更に加速しており、収集されたデータを分析することの価値が増大している

インターネットの普及・拡大により情報インフラが成長し、新たなサービスにより様々な情報が収集できるようになった

1980年代インターネットの実用化

1990年代(前半)ウェブシステムの登場

Yahoo!社やAmazon社が1994年に創業

32

IoT(Internet of Things)

インターネット・サービス ソーシャルメディア

4.2. ビッグデータの生成を支えるICT環境

チップの小型化などハードウェアの進化ICTデバイス

33

4.3. ビッグデータの蓄積・分析を支えるICT

データ

支えるICT

クラウドコンピューティング

多量性 多様な機械処理(統計解析を含む)

高頻度生成

NoSQL

マッチング

Hadoop

KeyValue型データストア

パターンルール

機械学習

データマイニング

GPGPU

インデックス作成 CEP/ストリーミング処理

リアルタイムHadoop

フラッシュストレージ

現実世界

さまざまなICT技術

34

4.4. ビッグデータ利活用のサービス

サービス 概要

BIツールの提供 Business Intelligence(統計データ解析系)ツールベンダーが、利用方法を提供するサービス。

ディストリビューションサービス ビッグデータの処理環境をパッケージ化して提供するサービス。(代表的なものにHadoopがある)

コンサルティングサービス(導入時)

ビッグデータ利活用の導入コンサルティングを行うサービス。

コンサルティングサービス(データ分析時)

ビッグデータの分析を代行するサービス。

教育サービス 統計分析やデータ管理などビッグデータ利活用で必要な専門知識、もしくは啓発活動等の教育を行うサービス。

35

4.5. ビッグデータに関するICT関連の用語

概念

実装

36

4.5.1.考えてみましょう

データの特性を踏まえたICT技術には何がありますか?

37

目標

5. 法的に気をつけること

ビッグデータ利活用における法的留意事項を、説明することができる

38

5. 法的に気をつけること

5.1. 個人情報が含まれるデータの取扱い

5.2. 法的に留意すること

5.3. 国内外の法整備の動向

39

発生源(市場) 収集・蓄積

ビジネスでの活用 分析

5.1. 個人情報が含まれるデータの取扱い

二次利用

個人情報の利用許諾 個人情報の保護

個人の特定防止店舗

40

発生源(市場) 収集・蓄積

ビジネスでの活用

5.1.1.個人の特定防止の事例

ユーザが天気写真を投稿

天気写真以外も投稿される

人物が特定されないように、画像をチェック

お天気情報として公開

分析

41

5.2. 法的に留意すること

個人情報保護法 統計法

行政機関個人情報保護法

独立行政法人個人情報保護法

電気通信事業法(通信の秘密の保護、知的財産権の保護)

Big Data

情報公開法(不開示情報の保護)

パーソナルデータの保護に関する法律

パーソナルデータの利活用に関する法律

出典:総務省(平成25年6月)パーソナルデータの利用・流通に関する研究会報告書P4-6

42

5.3. 国内外の法整備の動向

東京本社 海外支社

情報

国・地域によって法律は異なる

43

5.3.1.考えてみましょう

法整備の動向として、どのような規制が敷かれようとしていますか?どのような理由で、規制が必要となっているのでしょうか?

44

6. まとめ(1/2)

ビッグデータ利活用の特徴

ビッグデータ利活用の効果とプロセス

ビッグデータ利活用を支えるICT技術

ビッグデータ利活用の法的留意点

45

6. まとめ(2/2)

発展学習への誘いビッグデータの利活用を行うためは、以降で行う、企画・計画力、解析力、ICT力を受講し、具体的にどのようなことなのかを理解してください。

46

7. その他、参考

用語

用語 解説

オープンデータ 「個人情報の保護に配慮した上で、2次利用可能な形で行政情報を公開し、原則としてすべてインターネットで容易に入手すること」が可能なデータ。

クラウドコンピューティング インターネット上にある複数のサーバーを利用して作業を行うサービス形態を表した概念の一つ。

ICT Information and Communication Technologyの略称。情報処理および情報通信、つまり、コンピュータやネットワークに関連する諸分野における技術・産業・設備・サービスなどの総称である。

47

1.5.3.考えてみましょう(回答例)

ビッグデータにはどのような特性がありますか?身近な例で説明してください。

• ICカードの利用などで発生する大量なデータ

48

2.4.1.考えてみましょう(回答例)

ビッグデータを利活用することで、どのような効果を期待しますか?ご自分の会社、現在の仕事を題材に考えてください。

• マーケティング商品の購入履歴やサービスの利用履歴を分析して、次回来店時期に合わせたクーポンを配信する。

49

3.2.1.考えてみましょう(回答例)

ビッグデータ利活用に必要なスキルには何がありますか。

• ビジネス力

• 分析力

• ICT力

50

4.5.1.考えてみましょう(回答例)

データの特性を踏まえたICT技術には何がありますか?

• Hadoop

• NoSQLデータベース

• クラウドコンピューティング

51

5.3.1.考えてみましょう(回答例)

法整備の動向として、どのような規制が敷かれようとしていますか?どのような理由で、規制が必要となっているのでしょうか?

• パーソナルデータの保護に関する法整備適切に保護することで、国民の安心・安全の確保と、ビジネスでの利活用を実現する

52

参考文献

Copyright (c) 2014 Ministry of Internal Affairs and Communications All Rights Reserved

出典:総務省(平成25年6月)パーソナルデータの利用・流通に関する研究会報告書P4-6

出典:総務省、「高度ICT利活用人材の能力・要件・人材に関する調査研究報告書」P38

出典:総務省「オープンデータ戦略に係る総務省の取組」平成24年10月24日

出典:総務省請負事業(24-0049-0068)「高度ICT利活用人材育成カリキュラム(実践編)の開発等の請負」

このテキスト(又はカリキュラム)は、総務省の『高度ICT利活用テキスト(実践編科目ビッグデータ利活用入門)』に改変を加えたものです。