20140614 tokyo r lt

18
2014年6月14日 Tokyo.R LT 「socceR!」 @tetsuroito 2014614日土曜日

Transcript of 20140614 tokyo r lt

Page 1: 20140614 tokyo r lt

2014年6月14日Tokyo.R LT

「socceR!」@tetsuroito

2014年6月14日土曜日

Page 2: 20140614 tokyo r lt

自己紹介

名前           バックボーン伊藤 徹郎       経済・ファイナンスtwitter ID R歴@tetsuroito 2年くらい

「W杯開幕してテンション上がっている!」

2014年6月14日土曜日

Page 3: 20140614 tokyo r lt

今、世界中でW杯の話題で盛り上がっているに違いない!

2014年6月14日土曜日

Page 4: 20140614 tokyo r lt

なんか確認できる術はないものか

2014年6月14日土曜日

Page 5: 20140614 tokyo r lt

Google トレンド

2014年6月14日土曜日

Page 6: 20140614 tokyo r lt

うん!盛り上がってる!

2014年6月14日土曜日

Page 7: 20140614 tokyo r lt

でも、今日はTokyo.R

2014年6月14日土曜日

Page 8: 20140614 tokyo r lt

話題のトピックをRで‥

2014年6月14日土曜日

Page 9: 20140614 tokyo r lt

そうだね!トピックモデルだね!

2014年6月14日土曜日

Page 10: 20140614 tokyo r lt

トピックモデルとは文書は何らかの話題について書かれている

ある文書内に出てくる単語は、意味的な関連性が強いと考えられる

トピックモデルは文書から何らかの話題(トピック)を発見するための統計的なモデル

2014年6月14日土曜日

Page 11: 20140614 tokyo r lt

トピックモデルいろいろ・Unigram Mixtureナイーブベイズとクラス数kと各パラメータをEMアルゴリズムで繰り返し推定していく

・Probablistic Latent Semantic IndexingPLSIと呼ばれる。潜在意味解析を確率的に解析、開発された生成モデル各単語ごとに別なトピックから生成されたと仮定する

・Latent Dirichlet allocationLDAと呼ばれる。階層ベイズモデルにしたもので、学習方法や応用・拡張研究が盛ん

2014年6月14日土曜日

Page 12: 20140614 tokyo r lt

よし!LDAや!

※詳細な説明は割愛しますので、個々に調べてください。(本人がちゃんと理解していないためw)

2014年6月14日土曜日

Page 13: 20140614 tokyo r lt

パッケージldaをインスコ!!

同様に、ggplot2やreshape2も入れておきましょう!

2014年6月14日土曜日

Page 14: 20140614 tokyo r lt

とりあえず、demo(lda)

2014年6月14日土曜日

Page 15: 20140614 tokyo r lt

ちーん!

2014年6月14日土曜日

Page 16: 20140614 tokyo r lt

求む!このエラーの解決方法!

2014年6月14日土曜日

Page 17: 20140614 tokyo r lt

一応データセットとかでごにょごにょしたら出て来た図

2014年6月14日土曜日

Page 18: 20140614 tokyo r lt

おわり!

ご清聴ありがとうございました

2014年6月14日土曜日