Power BI チュートリアル 導入・初級編

36
Power BI チチチチチチチ チチ チチチ チチ チチ チ チチ チ チ 281228 JapanTaxi チチチチ チチ チ

Transcript of Power BI チュートリアル 導入・初級編

Page 1: Power BI チュートリアル 導入・初級編

Power BI チュートリアル導入・初級編平成28年12月28日

JapanTaxi 株式会社増谷 修

Page 2: Power BI チュートリアル 導入・初級編

アジェンダ• Power BI で業務効率改善– セルフサービス BI を社内で普及させ、現場での分析力向上– これまで Excel 可視化に留まっていたレポートをグレードアップ– ファイルによるデータ展開から Web 上でのリアルタイム配信へ

• Power BI の基本概念と基本操作を理解– 通常の読み込み⇒グラフ化– 簡単な分析– データ加工テクニック ※ これだけで Excel + α のことが可能になる

Page 3: Power BI チュートリアル 導入・初級編

POWER BI で業務効率改善PowerBI を使う理由

Page 4: Power BI チュートリアル 導入・初級編

Power BI とは• Microsoft の BI(Business Intelligence)ツール– https://powerbi.microsoft.com/ja-jp/what-

is-power-bi/– リアルタイムに収集されるデータを1つのダッシュボードを通して全体像を把握する– 1クリックでデータを直感的に探索し、背後のインサイトを見出すことができる– データの共有、公開し全員が最新の情報を得られる

Page 5: Power BI チュートリアル 導入・初級編

セルフサービス BI• 分析の専門家以外の各ディビジョンの担当者が自ら BIを使いこなすことで業務効率向上• IT 部門に頼らない、実践的即効的なソリューション• 社員全員が分析屋– 現場知識*分析パワー

https://www.nttcom.co.jp/comware_plus/solution/201510_1.html

Page 6: Power BI チュートリアル 導入・初級編

Power BI の立ち位置• セルフサービス BI で躍進中• BI プラットフォームではリーダーに位置づけられる– ガートナー調査– Tablaeu, Qlik と Top3 を構成

Magic Quadrant for Business Intelligence and Analytics Platforms https://www.gartner.com/doc/reprints?id=1-2Y77IIA&ct=160208&st=sb

Page 7: Power BI チュートリアル 導入・初級編

Power BI 製品群• Power BI Desktop– デスクトップアプリ– 対話型ダッシュボード作成– データ接続、収集、変換– 分析、可視化

• Power BI Web– Web サービス– データ共有、公開

• Power BI Mobile– モバイルアプリ( iOS,Android,Win)

すべて無償今日からすぐ使える!

Page 8: Power BI チュートリアル 導入・初級編

Power BI のワークフロー• ツールを使い分ける

Power BI Desktop• データ収集、変換• 分析、可視化• ダッシュボード作成

Power BI Web• 監視、計測• グループ共有• Web 公開

Power BI Mobile• モバイル閲覧

Page 9: Power BI チュートリアル 導入・初級編

より大きなワークフローの一部として• SQL Server の Analytics Service との融合• Sharepoint との融合• Azure との融合– Stream Analytics, HDInsight など

Excel をフロントエンドとしていた製品群がPower BI にも対応

Page 10: Power BI チュートリアル 導入・初級編

Power BI の対応データソース• MS 以外のデータ、サービスに広く対応– ファイル– データベース– Azure– オンライン サービス– その他

• 急速に拡大中

ファイルExcel, CSV, XML, テキスト , JSON, フォルダ , Share Point フォルダ

データベースSQL Server, Access, SQL Server Analysis Services, Oracle, IBM DB2, MySQL, PostgreSQL, Sybase,Teradata SAP HANA, IBM Informix, SAP Business Warehouse, Amazon Redshift, Impala, Snowflake

AzureSQL Database, Data Warehouse, Marketplace, HDInsight, Blob, Table, HDInsight Spark, DocumentDB, DataLake Store オンライン サービス

SharePoint Online, Exchange Online, Dynamics 365. PowerApps, Facebook, Salesforce, Google アナリティクス , appFigures, comScore Digital Analytix, GitHub, MailChimp, Marketo, Mixpanel, Planview, Projectplace, QuickBooks, SparkPost, Smartsheet, SQL Sentry, Stripe, SweetIQ, Troux, Twilio, tyGraph, Webtrends, Zendesk

その他Web, SharePoint リスト , OData フィードHadoop ファイル (HDFS), Active DirectoryMicrosoft Exchange, ODBC, OLE DB, R スクリプト ,Spark (Beta), 空のクエリ

Page 11: Power BI チュートリアル 導入・初級編

Excel と何が違うの?• より可視化に特化している– データ入力やデータ編集の機能は省く

• Excel と比べたメリット– 複雑な解析(相関、スライス、探索)– 複数のデータソースからの ETL– 図や表が散らからない–範囲指定による間違いがない

グラフが散在して、よくわからなくなるデータ量が多く、データ範囲の指定がうまくいかずミス

データ統合が表データのみ

回帰、予測などはプラグインが必要Excel をデータ分析で使う時の難点

Page 12: Power BI チュートリアル 導入・初級編

他のツールとの比較• Tableau– 機能とパフォーマンスにおいて優れている– 数十万円から–無償版はデータ保存できない

• Qlik Sense–無償版がある– 共有が5人まで、公開できない

いろいろあるけど、“とりあえず“ Power BI から入るのが良い

Page 13: Power BI チュートリアル 導入・初級編

POWER BI を使ってみようPower BI 導入編

Page 14: Power BI チュートリアル 導入・初級編

取得、インストール• Power BI Desktop をダウンロード– https://powerbi.microsoft.com/ja-jp/desktop/– 64bit/32bit版、 Windows7 以降、 100MB強– 最新バージョン: 2.41.4581.361 (11 月版 )• 1月おきにアップデートがある

• セットアップ– インストーラ exe を普通に起動

• 数分でスタートラインに立てる

Page 15: Power BI チュートリアル 導入・初級編

データをロード• 身近なデータで試してみましょう– 最もありそうなシナリオは csv

• 今回の事例:紅白歌合戦データ(時節柄・・・)– まずは事前に用意した csv から

• Web から PowerBI でスクレイピングしエクスポート– 優勝、司会者データ

• http://www.geocities.jp/kouhaku_mania/shikai  1951 年~ 2016 年まで– 出場歌手データ

• http://www.asahi-net.or.jp/~QM4H-IIM/kohaku.htm 1951 年~ 2005 年まで• http://www.geocities.jp/n_quaker/kouhaku/ 2006 年以降

Page 16: Power BI チュートリアル 導入・初級編

データ読み込み• データを取得 ボタンから– CSV を読み込む– デフォルトでヘッダー指定される– カラムごとの型は自動認識

• 後で編集可能なので、デフォルトで OK

Page 17: Power BI チュートリアル 導入・初級編

データロードされた状態• 白紙のレポートページとフィールドリストから始める– 特にデータを加工することがなければここからスタート可能

• レポートページ– 可視化を並べてダッシュボードを作るペイン

• フィールドリスト– Excel でいう列、 DB でいうカラム

Page 18: Power BI チュートリアル 導入・初級編

いきなり可視化• 好きなフィールドをページへドラッグアンドドロップ– デフォルトでは、表が開く– “ 優勝“フィールドをドラッグ

「表」視覚化ページ

Page 19: Power BI チュートリアル 導入・初級編

勝敗表を作成• “ 回数”、”年”を [値 ] に追加(ドラッグ)• 回数でソート– 表のカラムにソートコントロールがある

• 表のメニューからエクスポート可能– 他の場所ではできないので重要

Page 20: Power BI チュートリアル 導入・初級編

円グラフで集計• 今度は視覚化からグラフを追加– 円グラフ視覚化を押すと空のグラフがレポートに出現– [値 ] に集計したいフィールドを入れる

• 数値以外の場合は「カウント」になる– [凡例 ] にグループ化したいフィールドを入れる

• 値と同じにすると、 nominal な値集計が可能になる• “優勝”のカウント内訳

Page 21: Power BI チュートリアル 導入・初級編

時系列用にデータを加工したい• ”年毎の優勝推移を見たい“• 時系列グラフ化するには値が数値である必要がある– クエリーエディタでデータを変換– ※ 変換ステップは保存されるので、後で修正が可能

クエリーエディタ

クエリーを編集ボタンから起動

Page 22: Power BI チュートリアル 導入・初級編

フィールドを適切な型へ変換• 文字列の”回”、“年”フィールドを適切な型に変換する– データ型プルダウンから宛先の型を選ぶだけ

• “ 回” ⇒ 整数• “年” ⇒ 日付 ⇒ 年

Page 23: Power BI チュートリアル 導入・初級編

フィールドを適切な型へ変換• 優勝チームを数値に変換– “紅”、“白”という値を含む文字列を数値化– 通常の変換では対応できないので条件列を修正

• 条件列の追加– “優勝 ID” フィールドを追加– [紅 ,白 ] ⇒ [-1,1]  にマッピング

• クエリーエディタを閉じて終了⇒レポートへ戻る

Page 24: Power BI チュートリアル 導入・初級編

時系列グラフ• 数値になった“優勝 ID“ フィールドで時系列プロット–軸:年、値:優勝 ID の平均–白組 (1) 、紅組 (-1)

• なんとなく白が連続勝利

Page 25: Power BI チュートリアル 導入・初級編

トレンドをみたい• 分析タブから傾向線を追加–回帰直線が得られる–白組への優勝偏移がわかる

Page 26: Power BI チュートリアル 導入・初級編

予測したい• 分析タブから予測を追加–予測時系列が得られる– やはり白組が勝ちそうだ

• 季節性なども加味できる

Page 27: Power BI チュートリアル 導入・初級編

司会者の統計を出したい• 司会者の文字列データから集計–棒グラフ Visual を選択

• 並びが名前順で読みにくい– Visual の右端のメニューから並べ替えを選択しカウント順に変更

Page 28: Power BI チュートリアル 導入・初級編

類型(グループ)化したい• 司会者クラスを作成• フィールドからグループ作成–「アナウンサー」「歌手」など

• 手作業で対応できる数ならこれで十分

通常はデータ中にグループデータが存在するが、ない場合はこの場で作成可能

Page 29: Power BI チュートリアル 導入・初級編

クラス情報の利用• 先ほどの棒グラフ:グラフの凡例に追加

• 内訳の円グラフ

棒グラフ

円グラフ

Page 30: Power BI チュートリアル 導入・初級編

勝敗と司会者クラスの相関をみたい• 白組が勝ちやすい司会者クラスは?• 100%積み上げグラフ–凡例に優勝を選択

• コメディアン、民放アナウンサークラスで顕著に白組が優勝–今年は?相葉君?

Page 31: Power BI チュートリアル 導入・初級編

グラフのデコレーション• 普通にグラフを描くとイメージに合わない配色になることがある

– 書式パネルで簡単に変更可能– Excel のグラフほどカスタマイズはできないが好ましく無い配色 好ましい配色

Page 32: Power BI チュートリアル 導入・初級編

スライシング• 同じデータソースに関するデータ選択は全グラフに反映される• テーマごとに別々のグラフを作る必要がない

白組選択白組が勝利したときの司会者 アイドル選択

アイドルが司会した時の勝敗

アイドルが司会した時の紅組司会者

Page 33: Power BI チュートリアル 導入・初級編

まとめ

Page 34: Power BI チュートリアル 導入・初級編

まとめ• Excel でやっていた作業が、– より効果的に分析可能• Excel では特殊機能だったものが簡単• 可視化までのパスが短い(ドラッグアンドドロップだけ)• スライシングが自由自在(スライサーの定義自体いらない)

– より効率的に作業可能• Web スクレイピングや DB などに直感的に接続可能

–ミスなく作業可能• 範囲指定などを考えなくてよい(100万件でも大丈夫)• 式などの処理履歴を保持でき、後で編集可能

Page 36: Power BI チュートリアル 導入・初級編

Japan Taxi での適用先候補• コーポレートデータ– 売上、営業成績、財務、人事– 営業所別経理、労務管理、パートナー

• Web データ– アプリ関連のメトリックス、 Web アクセス– マーケティングデータ

• 決済データ– PoS 、顧客管理

• 運行管理– トラッキングデータ、配車履歴