20140614 tokyo r lt

Post on 07-Jul-2015

896 views 0 download

Transcript of 20140614 tokyo r lt

2014年6月14日Tokyo.R LT

「socceR!」@tetsuroito

2014年6月14日土曜日

自己紹介

名前           バックボーン伊藤 徹郎       経済・ファイナンスtwitter ID R歴@tetsuroito 2年くらい

「W杯開幕してテンション上がっている!」

2014年6月14日土曜日

今、世界中でW杯の話題で盛り上がっているに違いない!

2014年6月14日土曜日

なんか確認できる術はないものか

2014年6月14日土曜日

Google トレンド

2014年6月14日土曜日

うん!盛り上がってる!

2014年6月14日土曜日

でも、今日はTokyo.R

2014年6月14日土曜日

話題のトピックをRで‥

2014年6月14日土曜日

そうだね!トピックモデルだね!

2014年6月14日土曜日

トピックモデルとは文書は何らかの話題について書かれている

ある文書内に出てくる単語は、意味的な関連性が強いと考えられる

トピックモデルは文書から何らかの話題(トピック)を発見するための統計的なモデル

2014年6月14日土曜日

トピックモデルいろいろ・Unigram Mixtureナイーブベイズとクラス数kと各パラメータをEMアルゴリズムで繰り返し推定していく

・Probablistic Latent Semantic IndexingPLSIと呼ばれる。潜在意味解析を確率的に解析、開発された生成モデル各単語ごとに別なトピックから生成されたと仮定する

・Latent Dirichlet allocationLDAと呼ばれる。階層ベイズモデルにしたもので、学習方法や応用・拡張研究が盛ん

2014年6月14日土曜日

よし!LDAや!

※詳細な説明は割愛しますので、個々に調べてください。(本人がちゃんと理解していないためw)

2014年6月14日土曜日

パッケージldaをインスコ!!

同様に、ggplot2やreshape2も入れておきましょう!

2014年6月14日土曜日

とりあえず、demo(lda)

2014年6月14日土曜日

ちーん!

2014年6月14日土曜日

求む!このエラーの解決方法!

2014年6月14日土曜日

一応データセットとかでごにょごにょしたら出て来た図

2014年6月14日土曜日

おわり!

ご清聴ありがとうございました

2014年6月14日土曜日