20150404 jazug fukushima

15
初心者による Azure Machine Learning入門 2015/4/4 JAZUG福島 第一回 JAZUG仙台 真鍋俊之

Transcript of 20150404 jazug fukushima

初心者によるAzure Machine Learning入門

2015/4/4

JAZUG福島 第一回

JAZUG仙台 真鍋俊之

Azure Machine Learningについての紹介

機械学習初心者の方に、機械学習について興味を持ってもらう。

機械学習をやりたい!って思ってもらう。

そして、機械学習を使うときにAzure Machine Learningを使ってもらう。

本発表の目的

機械学習の概要の説明

機械学習とは?

なぜ、機械学習を学ぶのか?

なぜ、Azure Machine Leaningを使うのか?

Azure Machine Learningのデモ

回帰分析の例

API公開

今回の発表でやること

人工知能における研究課題の一つ

人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法

<引用:Wikipedia>

あらかじめ学習させることで、未知のデータが何かを判別する判別器を作成する

機械学習(Machine Learning)

機械学習の例(文字認識)

訓練データ

判別器

判別結果

「2」

未知のデータ

「1」 「2」 「3」

・・・

予測

売上予測

お勧め商品の提示

スパムフィルタ

パラメータ調整

KINECT:体の各部位の推定用パラメータ

機械学習を使って何ができる?

情報量が人間で処理できる限界にきている

(一部のデータを人が解析する)時代から(すべてのデータを機械が解析する)時代に!

人がすべての判断をする時代ではなくなってきた

なぜ、機械学習を学ぶのか

【機械】低レベルな判断• データの傾向解析• パラメータ調整

【人】高レベルな判断• 戦略• ビジョン

流行っている技術だが、廃れる技術ではない! エンジニアが持つべき基礎技術の一つ

「人に合わせたカスタマイズ」の実現には必須の技術 データの活用の仕方の技術であり、あらゆる分野で使える

機械学習を扱う基盤がそろってきた 時代が追いついた クラウド、GPUなどの並列処理技術の発達により、学習が実用的な時間に

フレームワークの発達により、未学習者でも手を出しやすくなっている

機械学習は流行りの技術?

機械学習のアルゴリズムの実装が困難

統計学の知識が必要

高度な数学的知識が必要

学習に多くの処理時間が必要

多くの場合で大量の学習データ処理が必要

複数のアルゴリズムでの実験が必要

機械学習習得の難しさ

Azure上で利用できる機械学習

プレビュー版を公開中<2014/7~>

一般提供開始<2015/2~>

総合開発環境(ML Studio)で開発可能

ソースコードを書かずに、多くの処理が実施可能

低コスト(習得的、設備的、実用的)で使用可能

Azure Machine Learning

習得的利点

複数の機械学習アルゴリズムが実装済み

ML-Studioを用いた簡単な操作で実験を構築可能

設備的利点

機械学習用のワークステーションの用意が不要

実用的利点

作った判別器をWeb APIとして公開可能

Azure Machine Learningの利点

教師あり学習 回帰分析

クラス分割 2クラス分割

多クラス分割

教師なし学習 クラスタリング

異常検知(anomaly detection)

Azure Machine Learningで使える機械学習

教師あり学習

入力とそれに対応すべき出力を写像する関数を生成する。

教師なし学習

入力のみ(ラベルなしの例)からモデルを構築する。

機械学習のアルゴリズム

前処理

学習しやすいようにデータを加工する

学習に不要なデータの除去

不正なデータの除去

学習

データを機械に学習させる

評価

作成した判別器が十分な性能を持つか判断する

機械学習の処理の流れ

教師あり学習(回帰分析)のデモ

車の性能から、車の価格を予想

Azure Machine Learningのサンプルデータセットを利用

http://azure.microsoft.com/ja-jp/documentation/articles/machine-learning-create-experiment/

デモの流れ