3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める...

10
1 2 3 4 5 [コース1]データ収集 [コース2]データ蓄積 [コース3]データ分析 [コース4]データ利活用 3-5:人工知能と機械学習 [コース3]データ分析 総務省 ICTスキル総合習得教材 【概要版】 eラーニング用

Transcript of 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める...

Page 1: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

1 2 3 4 5 [コース1]データ収集 [コース2]データ蓄積 [コース3]データ分析 [コース4]データ利活用

3-5:人工知能と機械学習

[コース3]データ分析

総務省 ICTスキル総合習得教材

【概要版】 eラーニング用

Page 2: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

本講座の学習内容(3-5:人工知能と機械学習)

人工知能(AI)の分類と一般的なイメージを理解する。 人工知能に関する分析技術である機械学習の概要を説明します。 ニューラルネットワークとディープラーニングの特性と応用例を説明します。

座学

人工知能(AI)の分類と一般的なイメージとを理解する。

教師あり学習、教師なし学習、強化学習の分類を理解する。

ニューラルネットワークとディープラーニングのイメージと利用例を理解する。

[1]人工知能への期待とイメージ

【講座構成】

[2]人工知能と機械学習

[3]注目を集める ニューラルネットワークとディープラーニング

【学習のゴール】

【講座概要】

Page 3: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

現在は「人工知能ブーム」とされ、人工知能への期待が高まっています。 人工知能への期待

本コースのこれまでの講座では、人間がExcel等を使って行うデータクレンジング、データの可視化、データ分析の方法を紹介してきました。

一方で、データ分析をはじめとするデータの利活用を「人工知能(AI)に代行させる・任せる」といった人工知能(AI)への期待が高まっており、現在は第三次人工知能ブームとされています。 • 人工知能への期待が大きさが理由の一つとなって、共通の理解なく「人工知能」という言葉に使われるケースも増えています。

人工知能学会では、汎用型人工知能を「人間の知能そのものをもつ機械を作ろうとする立場」、特化型人工知能を「人間が知能を使ってすることを機械にさせようとする立場」として、実際の研究のほとんどは後者と記しています。 【出典】 人工知能って何?( (社) 人工知能学会)

分類 説明 イメージ・事例

汎用型人工知能 (強いAI)

様々な思考・作業を行うことができ、 初めて直面する状況に対応できる人工知能

将棋、碁、チェス、炊事、掃除、洗濯といった様々な分野の思考、作業に対応できる。

特化型人工知能 (弱いAI)

特定の内容に特化した・作業内容にだけに優れている人工知能

「将棋に関する思考のみできる人工知能」「掃除に関する思考のみできる人工知能」

人工知能は、汎用型人工知能(強いAI)と特化型人工知能(弱いAI)に大別することができます。

• プロの棋士に勝てるほどに将棋に強い人工知能があっても、将棋以外に対応できない人工知能は、「特化型人工知能(弱いAI)」に該当します。 • 「掃除のみ」「空調のみ」に対応できる「特化型人工知能(弱いAI)」は、既に家電製品としても発売されています。

汎用型人工知能(強いAI)と特化型人工知能(弱いAI)の分類

https://www.ai-gakkai.or.jp/whatsai/AIwhats.html

[1]人工知能への期待とイメージ

Page 4: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

「人工知能(AI)」の定義・イメージは人によって様々です。 人工知能の定義とイメージ

専門家や研究者の間でも「人工知能」に関する確立した定義、説明はありません。

様々な人工知能の定義・説明の中には、「知的」「知能を持つ」という言葉が含まれるケースがあります。ただし、何を「知的」「知能を持つ」と感じさせるかは、それを見る人間の考え方に依存する部分もあります。 • スマートフォンの音声アシスタントに「おはよう」と話して「おはようございます」と返事が返ってくることを「知能を持っている」と感じるかは、人それぞれです。 • 特定の思考・作業のみができる「特化型人工知能(弱いAI)」に対して「知能を持っている」と感じないという考え方もあり得ます。

この講座では、人工知能の厳密な定義を行わず、それぞれの人の考え方に依存する部分を含めて「人間が知的と感じる情報処理、技術」とします。

• 平成28年版 情報通信白書では「国内の主な研究者による人工知能(AI)の定義」として13人の研究者による定義・説明を紹介していますが、その内容は様々です。

人工知能(AI)のイメージを尋ねた調査結果においても、日本とアメリカでは回答傾向が異なっています。

調査への回答者 [回答者数]

複数回答における最大の回答割合となった選択肢 [回答割合]

日本の就労者

[1,106人] コンピューターが人間のように見たり、聞いたり、話したりする技術 [35.6%]

アメリカの就労者 [1,105人]

人間の脳の認知・判断などの機能を、人間の脳の仕組みとは異なる仕組みで実現する技術[42.3%]

【出典】 ICTの進化が雇用と働き方に及ぼす影響に関する調査研究[平成28年](総務省)

人工知能(AI)のイメージ(日米)において最大の回答割合の選択肢

[1]人工知能への期待とイメージ

Page 5: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

現在の人工知能ブームを牽引する分析技術として「機械学習」やそれに含まれる「ディープラーニング」が挙げられます。

人工知能に含まれる分析技術

機械学習は「データから規則性や判断基準を学習し、それに基づき未知のものを予測、判断する技術」を指しています。 • 機械学習の研究初期には「学習する」点に注目されてきましたが、現在では「学習に基づいて予測・判断する」点に注目されることが、多くなっています。

ディープラーニング(深層学習)は、機械学習の一手法である「ニューラルネットワーク」と呼ばれる神経構造を模した分析技術を拡張させたものです。

[2]人工知能と機械学習

• 現在着目されている機械学習は、統計学を利用するケースが多いことから「統計的機械学習」と呼ばれることもあります。

人工知能、機械学習、ディープラーニングの包含関係と隆盛

人工知能(AI) 初期のAIが注目を集める マシンラーニング

(機械学習) 機械学習が活発化し始める

ディープラーニング (深層学習) ディープラーニングのブレークスル―が AIブームを巻き起こす

1950年代 1960年代 1970年代 1980年代 1990年代 2000年代 2010年代 【出典】 グーグルに学ぶディープラーニング(日経BP社)に基づき作成

Page 6: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

利用可能なデータに基づく機械学習の分類として「教師あり学習」 「教師なし学習」「強化学習」の3種が挙げられます。

利用可能なデータに基づく機械学習の分類

続いて、統計的機械学習に当たる教師あり学習・教師なし学習の分析手法を説明します。

機械学習は、現実のデータや人間による判別から得られた正解に当たる「教師データ」の与えられ方によって分類することができます。

教師データの状況によって、機械学習は大きく「教師あり学習」「教師なし学習」「強化学習」に分類されます。

• 写真の画像から性別を分類する機械学習では、実際の性別や人間による判断が教師データとなります。

• 教師データがある標本とない標本が組み合わさったデータを利用する「半教師あり学習」という種類もあります。

入力に関するデータ

[質問] 出力に関するデータ

(教師データ)[正しい答え] 主な活用事例

教師あり学習 与えられる ○ 与えられる 出力に関する 予測、分類

教師なし学習 与えられる × 与えられない 入力に関する

グループ分け、要約

強化学習 与えられる (試行する)

△ (間接的)

正しい答え自体は与えられないが、評価(報酬)が与えられる

将棋、囲碁、 コンピュータゲーム

利用可能なデータに基づく機械学習の分類

「教師あり学習」は、予測や分類に利用されるケースが多く、「教師なし学習」はグループ分けや情報の要約に使われるケースが多くなっています。強化学習は、囲碁、将棋用の人工知能に応用されています。

[2]人工知能と機械学習

Page 7: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

「教師あり学習」「教師なし学習」には、それぞれ代表的な分析手法があります。

機械学習における代表的な分析手法

注目されている「ニューラルネットワーク」「ディープラーニング」といった分析手法は、一般に「教師あり学習」として活用されています。

代表的な「教師あり学習」の分析手法として、回帰分析や決定木が挙げられます。 • 講座3-4にて説明した回帰分析も、被説明変数を教師データとする「教師あり学習」と考えることができます。

代表的な「教師あり学習」の分析手法 分析手法名 分析手法・用途の概要

回帰分析 被説明変数と説明変数の関係を分析し、分析結果に基づく予測

決定木 段階的な選択肢の形(樹形図)で判別基準を設定し、データを分類

分析手法名 分析手法・用途の概要

k平均法 各標本を属するグループ(クラスター)へ分類

アソシエーション分析 商品の同時購入の確率等を算出し、推薦すべき商品の導出

ソーシャルネットワーク分析 氏名が同時掲載される頻度やSNS上で友人関係から人のつながりを分析

代表的な「教師なし学習」の分析手法

代表的な「教師なし学習」の分析手法として、「k平均法」「アソシエーション分析」が挙げられます。

[2]人工知能と機械学習

Page 8: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

ニューラルネットワークは脳の神経回路の仕組みを模したモデルで、文字や音声の認識といったパターン認識へ応用されています。

ニューラルネットワーク [3]注目を集めるニューラルネットワークとディープラーニング

ディープラーニングの基本となるニューラルネットワークは、脳の神経回路の仕組みを模した機械学習です。

ニューラルネットワークは予測、分類、画像認識、音声認識、翻訳といった様々な分野で応用されています。

ニューラルネットワークは、入力層、中間層(隠れ層)、出力層の3層から成り立ちます。 • 中間層(隠れ層)では、一つ前の層から受け取ったデータを「重み付け」と「変換」をして次の層へ渡します。

• ニューラル(neural)は「神経の」という意味があります。

出力は教師データ等と照合され、より一致度が高くなるように重みのつけ方を調整します。

中間層 (隠れ層) 出力層

入力3

入力2

入力1

重み付け

変換

重み付け

出力

教師 データ

教師データと 照合して重み付けを調整

重み付け

変換

入力層

ニューラルネットワーク(中間層が1層のケース)のイメージ

Page 9: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

ディープラーニング(深層学習)は、より高精度の認識などに活用されています。 ディープラーニング

ニューラルネットワークの中間層(隠れ層)を2層以上に多層化した機械学習を ディープラーニングといいます。

中間層が複数あることで、1層の場合に比べてより複雑な出力を作ることができます。 • ディープラーニングの原理はニューラルネットワークと同じですが、中間層が多層化することでその精度が向上しました。 • ニューラルネットワークは中間層が多層のケースを含み、ディープラーニングはニューラルネットワークの一種です。

• ディープラーニングの日本語訳は「深層学習」ですが、この「層」と言う言葉は「中間層が複数あること」に基づいています。

ディープラーニングによって、「特徴量」と呼ばれるデータ内で注目すべきポイントをコンピューター自身が検出できるようになりつつあります。 • 従来は、「リンゴは赤い」「リンゴは丸い」といった特徴量を人間が入力する必要がありました。

[3]注目を集めるニューラルネットワークとディープラーニング

中間層1 (隠れ層2) 出力層

入力3

入力2

入力1

重み付け

変換

重み付け

出力

教師 データ

重み付け

変換

入力層 中間層2 (隠れ層2)

重み付け

変換

重み付け

変換

教師データと 照合して重み付けを調整

ディープラーニングのイメージ

Page 10: 3-5:人工知能と機械学習 · 2018-07-16 · 機械学習が活発化し始める ディープラーニング (深層学習) ディープラーニングのブレークスル―

ニューラルネットワーク・ディープラーニングは、画像認識や翻訳に活用されています。 ニューラルネットワーク・ディープラーニングのサービス例

Microsoft Azureでは、ディープラーニングに基づく画像認識をウェブブラウザを使って体験できます。 • 例示として、総務省の建物(中央合同庁舎第2号館)の写真を指定します。

ニューラルネットワーク・ディープラーニングには様々なサービスにおける活用が期待されます。

https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/

[3]注目を集めるニューラルネットワークとディープラーニング

利用者が指定した画像 に対して outdoor(野外) sky(空) road(道路) building(建物) tall(高い) といった連想される キーワードを出力します。

Microsoft は、米国 Microsoft Corporation およびその関連会社の商標です。

Google翻訳は、2016年11月の「ニューラルネットワークに基づく機械翻訳 (Neural Machine Translation)」の導入により翻訳精度が向上しました。

https://japan.googleblog.com/2016/11/google.html 【出典】 Google 翻訳が進化しました。(Google Japan Blog)

Microsoft Azureのデモサイトにおける画像認識

• Google 翻訳チームは 「過去10年の開発の歴史を振り返っても、それを大きく上回る飛躍的な前進」と記しています。