『アジャイルデータサイエンス』1章 理論

36
アジャイルデータサイエン 1章 理論 2014/05/13 1回「データ解析のための統計モデリング⼊⾨」読書会 @who_you_me

Transcript of 『アジャイルデータサイエンス』1章 理論

Page 1: 『アジャイルデータサイエンス』1章 理論

アジャイルデータサイエンス

1章 理論2014/05/13

第1回「データ解析のための統計モデリング⼊⾨」読書会@who_you_me

Page 2: 『アジャイルデータサイエンス』1章 理論

お前誰よ@who_you_me株式会社ハウテレビジョン所属 (2014/04〜)

Webエンジニアになったと思ったら名刺に「エンジニア」としか書いてない⾒習いスクラムマスターCakePHPでサービス作ってる会社でひとりPythonを書いてるchefのレシピ書くのがダルいのでdockerに置き換えたいついでにdocker上⼿く使ってイケてる開発環境つくりたい

Page 3: 『アジャイルデータサイエンス』1章 理論

#みどりぼん開催おめでとうございま

す!

Page 4: 『アジャイルデータサイエンス』1章 理論

統計の難しい話とかはわからないので、このLTではエンジニア寄りの話をしていきます

Page 5: 『アジャイルデータサイエンス』1章 理論
Page 6: 『アジャイルデータサイエンス』1章 理論
Page 7: 『アジャイルデータサイエンス』1章 理論

×

流⾏りモノ2つくっつければいいってもんじゃないだろ、、、

Page 8: 『アジャイルデータサイエンス』1章 理論

紹介してるツール

Page 9: 『アジャイルデータサイエンス』1章 理論

PythonApache PigMongoDBElasticsearchFlaskBootstrapD3.jsGithubdotCloudAmazon Web ServiceGoogle AnalyticsFluentdKibana

Page 10: 『アジャイルデータサイエンス』1章 理論

溢れ出るフルスタック感

Page 11: 『アジャイルデータサイエンス』1章 理論

あまりいい予感はしませんが、取り敢えず読み進めていきましょう^^

Page 12: 『アジャイルデータサイエンス』1章 理論

本書の⽬的1. Hadoopを使ってビッグデータを扱うデータアナリティクスアプリケーションの構築⽅法のハウツー形式のガイドを提供すること

2. アジャイルなスタイルでビッグデータのプロジェクトで複数のチームが協⼒し合うことの⽀援

3. この分野を発展させるようなやり⽅でアジャイルビッグデータアナリティクスを実践する上での仕組みを提供すること

Page 13: 『アジャイルデータサイエンス』1章 理論

要は

Page 14: 『アジャイルデータサイエンス』1章 理論

集合知プログラミングは読んだはじパタも読んだ⽬の前にデータらしきものはある

DBには何か⼊ってるログがどこかにある

Page 15: 『アジャイルデータサイエンス』1章 理論

さて、どこから⼿をつけたらいいんだろう^^;

Page 16: 『アジャイルデータサイエンス』1章 理論

そんな⼈のための本です

Page 17: 『アジャイルデータサイエンス』1章 理論

それでは、はじまりはじまり〜

Page 18: 『アジャイルデータサイエンス』1章 理論

データサイエンスの世界⼤量データを(以前より)容易に扱えるようになったため、データサイエンスが盛り上がりを⾒せているデータサイエンスのプロジェクトは⻑期間になるため、ウォーターフォール⽅式が未だに採⽤されいている

Page 19: 『アジャイルデータサイエンス』1章 理論

ソフトウェア開発の世界ウォーターフォールは失敗するアジャイル⾰命によってプロジェクトの成功率が上がった変化を受け⼊れる短いサイクルでリリースを繰り返す

Page 20: 『アジャイルデータサイエンス』1章 理論

本書の問題意識アジャイル開発とデータサイエンスを組み合わせることで(アジャイルビッグデータ)、研究とエンジニアリングを⽣

産的につなぎ合わたい

Page 21: 『アジャイルデータサイエンス』1章 理論

では、アジャイルビッグデータにどう取り組めばよい

Page 22: 『アジャイルデータサイエンス』1章 理論

1.チーム

Page 23: 『アジャイルデータサイエンス』1章 理論

求められる役割顧客ビジネス開発マーケッタ(ママ)プロダクトマネージャユーザーエクスペリエンスデザイナインタラクションデザイナWeb開発者エンジニアデータサイエンティスト応⽤リサーチャープラットフォームエンジニア運⽤/DevOpsプロフェッショナル

Page 24: 『アジャイルデータサイエンス』1章 理論

いっぱい

Page 25: 『アジャイルデータサイエンス』1章 理論

スペシャリストよりもジェネラリスト⼤規模なチームよりも⼩規模なチームクラウド、分散システム、PaaSの活⽤中間的な成果を継続的かつイテレーティブに共有

Page 26: 『アジャイルデータサイエンス』1章 理論

2.プロセス

Page 27: 『アジャイルデータサイエンス』1章 理論

チームの⽅向性の統⼀現実世界からの要求は常に変化変化に対応するため、モック作ったらすぐ実装

データは「主張する」事前に結果を予測し過ぎるのは危険

アプリケーションの「主要な性格」をまず構築する?

Page 28: 『アジャイルデータサイエンス』1章 理論

3.コードレビューとペアプロ

Page 29: 『アジャイルデータサイエンス』1章 理論

4.環境

Page 30: 『アジャイルデータサイエンス』1章 理論

メンバーはクリエイティブワーカーであり、オフィスワーカーではないオフィスよりもスタジオに近い環境づくり

3種類の空間コラボレーション空間プライベート空間パーソナル空間

Page 31: 『アジャイルデータサイエンス』1章 理論

5.⼤判プリンタ

Page 32: 『アジャイルデータサイエンス』1章 理論
Page 33: 『アジャイルデータサイエンス』1章 理論

以上なんちゅう終わり⽅やねん、、、

Page 34: 『アジャイルデータサイエンス』1章 理論

次回予告

Page 35: 『アジャイルデータサイエンス』1章 理論

2章 データ本書で使⽤するデータデータの保存先分析の視点

Page 36: 『アジャイルデータサイエンス』1章 理論

以上、ご清聴ありがとうございました!