빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

52
실시간 URL UV/PV 집계 사례를 통해 보는 '빅데이터 실시간 데이터 분석' 다음커뮤니케이션 유대은 [email protected] [email protected] [email protected]

description

URL 실시간 UV/PV 집계 사례를 통해 보는 빅데이터 실시간 데이터 분석

Transcript of 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Page 1: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

실시간 URL UV/PV 집계 사례를 통해 보는

'빅데이터 실시간 데이터 분석'

다음커뮤니케이션 유대은

[email protected]@[email protected]

Page 2: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

빅데이터 분석

Batch vs Real Time

Page 3: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Query = Function (All Data)

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/http://www.slideshare.net/Hadoop_Summit/realtime-analytics-with-storm

Big data analytics - Batch (Hadoop)

Page 4: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

MapReduce Job = Function (All Data)

Big data analytics - Batch (Hadoop)

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/http://www.slideshare.net/Hadoop_Summit/realtime-analytics-with-storm

Page 5: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

http://www.slideshare.net/Hadoop_Summit/realtime-analytics-with-storm

Big data analytics - Batch (Hadoop)

Page 6: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Big data analytics - Batch (Hadoop)

http://www.slideshare.net/Hadoop_Summit/realtime-analytics-with-storm

Page 7: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Big data analytics - Real Time (Storm)

Query = Function (Data Stream)

Data Stream을 바라보고 실시간으로 바로 분석Fast, Incremental algorithm

Page 8: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Topology = Function (Data Stream)

Big data analytics - Real Time (Storm)

Strom은 Data Stream을 바라보며 실시간으로 데이터를 처리하기 위한 좋은 인프라

Page 9: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

https://github.com/nathanmarz/storm

Page 10: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

http://www.infoq.com/presentations/Storm

spout

bolt

Page 11: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

http://www.infoq.com/presentations/Storm

A spout is a source of streams

A bolt consumes any number of input streams, does some processing

Page 12: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Storm - cluster

Page 13: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Storm - cluster

distributed realtime computation infra

Page 14: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL UV/PV 실시간 집계 사례

Page 15: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그수집

https://github.com/moongtook/kestrel_tail

Page 16: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그수집

Page 17: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

https://github.com/moongtook/kestrel_tail

로그수집

Page 18: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그분석

Page 19: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그분석

Page 20: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그 하나 꺼내오기

Page 21: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

로그 하나 꺼내오기

Page 22: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL의 UV/PV 카운트 올리기

Page 23: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL의 UV/PV 카운트 올리기

Inside of Redis

Page 24: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL의 UV/PV 카운트 저장하기

Page 25: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

row key 1 super column 1 super column 2 ...

column name 1 column name2 column name 1 column name2 ...

column value column value column value column value ...

Cassandra column family

row key 2 super column 1 super column 2 ...

column name 1 column name2 column name 1 column name2 ...

column value column value column value column value ...

... ... ... ...

URL의 UV/PV 카운트 저장하기

Page 26: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

6ed6a80a162365e78e2716d49508d974_2012-10-24

... 20:01 20:02 ...

... minutely_pv minutely_uv hourly_pv hourly_uv daily_pv daily_uv minutely_pv ... ...

... 212 202 5220 4576 233997 155723 151 ... ...

Henessy column family schema

bc2ed9981fae01adda327bcd7e2a3576_2012-10-24

... 20:01 20:02 ...

... minutely_pv minutely_uv hourly_pv hourly_uv daily_pv daily_uv minutely_pv ... ...

... 388 383 9839 8163 597338 299751 364 ... ...

... ... ... ... ...

URL의 UV/PV 카운트 저장하기

md5( reversed url) + date

Page 27: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Search, Aggregation, Ranking을 위해지난 1분동안 UV/PV 변화가 있었던 컨텐츠만...

Greenplum에도 저장하기

Page 28: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Secondary Index Pattern

2012-10-24_20_01 ... 6ed6a80a162365e78e2716d49508d974_2012-10-24 bc2ed9981fae01adda327bcd7e2a3576_2012-10-24 ...

... null null

Greenplum에도 저장하기

2012-10-24_20_02 ... 6ed6a80a162365e78e2716d49508d974_2012-10-24 bc2ed9981fae01adda327bcd7e2a3576_2012-10-24 ...

... null null

2012-10-24_20_03 ... 6ed6a80a162365e78e2716d49508d974_2012-10-24 bc2ed9981fae01adda327bcd7e2a3576_2012-10-24 ...

... null null

Page 29: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL UV/PV 실시간 집계 사례

Page 30: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 31: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 32: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 33: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 34: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 35: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 36: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 37: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 38: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 39: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 40: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Fault-tolerant

장애 허용 시스템(Fault tolerant system)은구성 부품의 일부가 고장나도 정상적으로 처리를

수행하는 시스템 이다. - 위키백과

http://ko.wikipedia.org/wiki/장애_허용_시스템http://en.wikipedia.org/wiki/Fault-tolerant_design

Page 41: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Human Fault-tolerant

Page 42: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Human Fault-tolerant

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/http://strataconf.com/strata2013/public/schedule/detail/27610

Page 43: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례
Page 44: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL UV/PV 실시간 집계 사례

Page 45: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

URL UV/PV 실시간 집계 사례

Page 46: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Lamda architecture

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/

Page 47: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Lamda architecture

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/

Page 48: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Lamda architecture

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/

Page 49: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Lamda architecture

Big data - Nathan Marz and James Warren, http://www.manning.com/marz/

Page 50: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Twitter summingbird - https://speakerdeck.com/sritchie/summingbird-streaming-mapreduce-at-twitter

Lamda architecture

Page 51: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

Lamda architecture

Twitter summingbird - https://speakerdeck.com/sritchie/summingbird-streaming-mapreduce-at-twitter

Page 52: 빅데이터 실시간 데이터 분석 - URL 실시간 UV/PV 집계 사례

끝!