写真ライフログにおける検索クエリを用いた想起補助 › proceedings › 2017 › data › pdf › 17INT...写真ライフログにおける検索クエリを用いた想起補助
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
-
Upload
yahoo -
Category
Technology
-
view
306 -
download
0
Transcript of 検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
2016年12月5日
D&S 関西 田村 健
検索クエリの時間差を可視化することで
わかる人の行動パターン
田村 健ヤフー株式会社データ&サイエンスソリューション統括本部 D&S関西
自己紹介
経歴
2009年4月 ヤフー新卒エンジニア入社(東京本社)
2009年10月 検索開発部配属(検索データの可視化チーム)
2012年10月 データソリューション開発部(現D&S統括本部)に異動
2015年10月 D&S関西に異動
お仕事:社内向けのデータ可視化ツールを作っています
ヤフー東京本社D&S統括本部には 300名以上在籍
(2016年10月時点)
D&S関西とは?(宣伝)
ヤフー福岡オフィスD&Sメンバは 1名在籍(2016年10月時点)
ヤフー大阪オフィスD&S関西チーム9名在籍(2016年10月時点)
関西のデータ&サイエンス人材に門戸を開きたい
主要なICT企業が東京に一極集中している中で、
関西で働きたい人材に、関西で輝ける場所を提供し、
地域の発展に貢献したい。
なぜ関西にD&Sチームを作ったか?
検索データを使った
• これまでのトレンド/人の行動理解の取り組みの事例
• 今取り組んでいる分析/可視化手法について
今日のお話
長い期間をかけて少しずつ検索回数が伸びるているものを検知2013年1月-2015年11月のYahoo!検索データ
“airbnb”
2013/1 2015/11
検索
回数
周期性のある検索クエリ
2013年1月1日~2015年10月10日
「ネクタイ 結び方」の検索数推移
1/15前後
4/1前後1/15前後
4/1前後
毎年1月前半と4月頭に検索数が増えるという周期性が存在する
地域性の可視化
今川焼き
大判焼き
回転焼き
回転焼き風おやつの検索数が多い呼び方分布
2015年4月6-12日の検索データ2015年3月30日-4月5日の検索データ
2015年4月6-12日の検索データ2015年3月30日-4月5日の検索データ
“花見”
インフルエンザの感染状況可視化
Yahoo!JAPAN ビッグデータレポート http://docs.yahoo.co.jp/info/bigdata/influenza/2015/01/
検索数 多
検索数 少
上昇傾向下降傾向
流行
蔓延峠をこえる
収束
ニーズを深掘りする
ダイソン ドライヤー
ドライヤー 人気
パナソニック ドライヤー
復元 ドライヤー
ドライヤー おすすめ
ナノケア ドライヤー
くるくるドライヤー
ドライヤー パナソニック
ドライヤー ヘアビューザー
パナソニックドライヤー
ドライヤー ランキング
リュミエリーナ ドライヤー
テスコム ドライヤー
“ドライヤー” を含む検索クエリ
• 人気のメーカー(ダイソン、パナソニック)• 人気のタイプ(復元、ナノケア、くるくる)• ドライヤーの探し方(人気、おすすめ)などがわかる。
検索量多
検索量少
第2ワードの抽出/可視化
ニーズを深掘りする
相関が高い(検索推移が似ている)検索クエリを抽出
“映画” と “漫画喫茶”
ニーズを深掘りする
想像もつかない競合をデータを導くこともできる。
“映画” と “焼肉”
検索推移だけを見ると・・
キーワードとキーワードの関係をユーザ軸に説明できない。
“映画” と “焼肉” は相関が高いクエリである(検索推移が似ている)
でも、それは、- 同じユーザが、“映画” と “焼肉” で悩んでいるのか?- “映画” と “焼肉” はまったく違うユーザセグメントなのか?
映画好き 焼肉好き
??
ここを調べたい あらゆる検索クエリに対応すると結構大変。
圧倒的なデータボリューム…年間の検索クエリの種類:約100億種類年間の検索データのレコード数:約7000億
検索クエリをハッシュ化し、256グループに分類。256回重複計算を実施。
映画好き 焼肉好き
??
重複ユーザ数を計算
あるワードを検索した人がよく検索している他のワード
“ユニクロ”
GU
H&M
Gap
“アルマーニ”
ドルチェ&ガッバーナ
gucchi
カルバンクライン
“映画”を検索している人は、他にどんなことを検索している?
“映画”を検索している人は、他にどんなことを検索している?
“天気”
“食べログ”
“デートプラン” “休日 一人”
“英語の勉強”
検索時間差を可視化することで物事の検討タイミング/行動パターンが可視化できるのでは?
映画 焼肉
time
検索時間差 映画 焼肉
time
映画 焼肉
time
“咳止め 薬” の検索時間差ワード
time
0 +2.0-2.0
集計期間 1週間
“咳止め 薬” の検索時間差ワード
time
0 +2.0-2.0
喉の痛み 治す
喉の痛み 薬
集計期間 1週間
“咳止め 薬” の検索時間差ワード
time
0 +2.0-2.0
喉の痛み 治す
喉の痛み 薬
咳を止める方法メジコン
集計期間 1週間
“咳止め 薬” の検索時間差ワード
time
0 +2.0-2.0
喉の痛み 治す
喉の痛み 薬
咳を止める方法メジコン
喘息咳 治療
肺炎 症状
集計期間 1週間
“失恋” の検索時間差ワード
time
0 +2.0-2.0
集計期間 1週間
“失恋” の検索時間差ワード
time
0 +2.0-2.0
好きな人にとる態度
告白 タイミング
集計期間 1週間
“失恋” の検索時間差ワード
time
0 +2.0-2.0
好きな人にとる態度
告白 タイミング LINE ブロック
告白 失敗
集計期間 1週間
“失恋” の検索時間差ワード
time
0 +2.0-2.0
好きな人にとる態度
告白 タイミング LINE ブロック
告白 失敗
タロット占い
情緒不安定
集計期間 1週間
“粉ミルク” の検索時間差ワード
time
0 +250-250
集計期間 1年間
“粉ミルク” の検索時間差ワード
time
0 +250-250
つわり対策
妊娠初期
集計期間 1年間
“粉ミルク” の検索時間差ワード
time
0 +250-250
つわり対策
妊娠初期
チャイルドシート口コミ
赤ちゃん命名辞典
集計期間 1年間
“粉ミルク” の検索時間差ワード
time
0 +250-250
つわり対策
妊娠初期
チャイルドシート口コミ
赤ちゃん命名辞典
集計期間 1年間
おっぱいの飲ませ方
新生児夜泣き
“粉ミルク” の検索時間差ワード
time
0 +250-250
つわり対策
妊娠初期
チャイルドシート口コミ
赤ちゃん命名辞典
離乳食 ベビーフード
集計期間 1年間
おっぱいの飲ませ方
新生児夜泣き
“粉ミルク” の検索時間差ワード
time
0 +250-250
つわり対策
妊娠初期
チャイルドシート口コミ
赤ちゃん命名辞典
離乳食 ベビーフード
1歳絵本
集計期間 1年間
おっぱいの飲ませ方
新生児夜泣き ベビースイミング
• 単純な手法でも、データボリュームと処理基盤があればインターネットのデータからリアルを可視化することができる。
• AIの時代だけど、人が理解出来る形での可視化は相変わらず重要だと思う。
• ヤフーにしかできない可視化はすごく楽しい!
最後に