ドワンゴ勉強会 090731

Post on 13-Dec-2014

1.031 views 2 download

Tags:

description

 

Transcript of ドワンゴ勉強会 090731

サイエンス と エンジニアリング

“探す”“出くわす”

んじゃなくて,

─という体験

サイジニアの独自開発技術

ディスカバリーエンジン

「デクワス」TM

サイジニアのアプローチ

複雑ネットワーク理論で

膨大なデータから

価値を創造する

ネットワーク複雑

Complex Network

ネットワークとはたくさんのノードが、たくさんのリンクでつながっているもの

リンクノード

「『点と線』だけで考える」

Albert-László Barabási

Duncan J. Watts

M.E.J. Newman

スケールフリーネットワーク

スモールワールドネットワーク

コミュニティ構造分析

Albert-László Barabási

スケールフリーネットワーク

What’sスケールフリー

?

バブル崩壊の法則経済物理学 Econophysics

バブル崩壊

日常の値動き

右図は両対数グラフ(log-log scale)

Zipf 則

学習コストと文化レベルのtrade-off による自己組織化

言語発達の法則

図は両対数グラフ(log-log scale)

組曲『ニコニコ動画』

新・豪血寺一族 -煩悩解放 -レッツゴー!陰陽師

遊戯王AIBOvs王様・社長・凡骨・顔芸

【初音ミク】みくみくにしてあげる♪【してやんよ】

魔理沙は大変なものを盗んでいきました

クラッシャーは大変なキーボードを破壊していきました

1人で同時に情熱大陸を演奏してみた

ニコニコ動画の法則

図は両対数グラフ(log-log scale)

スケールフリー=

システムの一貫性を説明する

モデル

成長と優先的選択1.新しいノードを生成し、既存ノードとリンクをつなげる

2.リンクをつなげる相手は、多くのリンクを持っているノードを優先する

「金持ちはもっと金持ちに」

!(ki) =

ki + 1"j(kj + 1)

リンク数の分布がスケールフリー性を持つハブ(極端に多くのリンクを持つノード)が存在する

スケールフリーとハブの存在

「実世界との相似」

感染者数

メキシコ

スペイン

豚インフルの国別感染者数

Albert-László Barabási

Duncan J. Watts

M.E.J. Newman

スケールフリーネットワーク

スモールワールドネットワーク

コミュニティ構造分析

Duncan J. Watts

スモールワールドネットワーク

What’sスモールワールド

?

It’s a “Small World!!”

1. ケビン・ベーコンと共演した俳優のベーコン数は”1”2. ケビン・ベーコンと共演したことがなくても、以前共演した俳優の誰かがケビン・ベーコンと共演したことがある場合、ベーコン数は”2”

3. 以下、ケビン・ベーコンとの関係がみつかるまでこの作業を続ける

「ケビン・ベーコンゲーム」“The Oracle of Bacon”http://oracleofbacon.org

スモールワールド=

予想外な世界の狭さを説明するモデル

強いクラスタ性と狭い世界

「秩序と無秩序の共存」

1.格子状のネットワークをつくる2.ランダムにリンクを選び、どれかのノードにつなぎかえる

3.少数のリンクをつなぎかえた時のみ、スモールワールド性が現れる

弱い紐帯の力

「クラスタ間の架け橋」

1970年代に、人的ネットワークを介して 転職をした約200人に調査ちょっとした知り合い(弱い紐帯)から得た情報で転職した人のほうが、満足度が高い

マーク・グラノヴェッター“Strength of Weak Tie”

Albert-László Barabási

Duncan J. Watts

M.E.J. Newman

スケールフリーネットワーク

スモールワールドネットワーク

コミュニティ構造分析

M.E.J. Newmanコミュニティ構造

分析

What’sコミュニティ

?

明示的、暗黙的なコミュニティ明示的なコミュニティ

暗黙的なコミュニティ

コミュニティ=

社会が生み出す普遍の構造

コミュニティ構造を取り出す実世界を複雑ネットワークとしてモデル化し暗黙的なコミュニティを調査するコミュニティ構造は、密なリンクを持つノード群ととらえられる

「似た人・アイテムを抽出」

Modularityコミュニティのつながり度合い1.コミュニティ内部へのリンクの密度からModularityを計算する

2.Modularityが最も高くなる部分で、コミュニティを切り出す

「自然なつながり」

Albert-László Barabási

Duncan J. Watts

M.E.J. Newman

スケールフリーネットワーク

スモールワールドネットワーク

コミュニティ構造分析

柔軟な拡張何をノードにするか、何をリンクにするかによって、柔軟にネットワークをカスタマイズできる

サイジニアのアプローチ

複雑ネットワーク理論で

膨大なデータから

価値を創造する

複雑ネットワーク理論で

膨大なデータから

価値を創造する

膨大なデータ

Staggering Amount of Data

What’sデータ

?

集めるのは、ユーザの行動履歴現実世界の行動は、記録しづらい•視聴率調査•無作為抽出したアンケート

Web上の行動は、ログとして残る•全てのアクションを記録•無意識下の行動

データ=

Webによって獲得可能になった

財産

11,687,011Scigineer

月次取扱 unique user 数

Google Japan

34,526,000=34%

たくさんのユーザの行動履歴を収集し、データ解析の精度を向上させる

データの増大による学習効果

「正のフィードバックループ」

アルゴリズムを変更することなく、ユーザからのフィードバックデータの蓄積のみで、精度が向上する

0.00%

2.00%

4.00%

6.00%

8.00%

10.00%

12.00%

1 31 61 91 121

151

181

211

241

271

301

331

361

391

421

451

481

17ヶ月間

20万アイテム20万ユーザ

複雑ネットワーク理論で

膨大なデータから

価値を創造する

複雑ネットワーク理論で

膨大なデータから

価値を創造する

レコメンデーション

Recommendation

What’sレコメンデーション

?

善し悪しはエンジンだけではない

WhatWhyWhere

WhoWhenHow

情報ナビゲーションの5W1H

Whatこの商品には

このアイテムがオススメ

Where情報ナビゲーションの5W1H

ページの一番目立つ場所に商品紹介の下に

Why情報ナビゲーションの5W1H

最新型TVだから対応ケーブルあなたが買うべき理由

When情報ナビゲーションの5W1H

コンテンツを見終わった時ユーザの興味が移る前

情報ナビゲーションの5W1H

友人からのオススメで購入紹介者の信用

Who

How情報ナビゲーションの5W1H

商品画像を表示しアピールインタラクティブなデザイン

レコメンデーション=理想の

ナビゲーションの追求

並び順によるクリック率

「人間の特性を知る」

提示する商品をランダムに配置し、どの位置がクリック率が高いか調査する

並び順によるクリック率

「データは答えを知っている」

商品の内容によらず、左に位置するものほどクリックされやすい5個表示すると、左から4番目はクリック率が下がる

サイトB

サイトA

サイトC

サイトD

P1 P2 P3 P4

P1 P2 P3 P4 P5

サイジニアのアプローチ

複雑ネットワーク理論で

膨大なデータから

価値を創造する

Webは21世紀に生まれた Natureなのだ

by

サイエンスとエンジニアリング

提 供