· 2018-07-10 · 전공한 데이터 과학자도 80명가량 고용하고 있다.1) 이렇게 정밀한 큐레이션 서비스를 바탕으 로 고객
진화하는 소셜 큐레이션 서비스와 관련 기술
-
Upload
taegon-kim -
Category
Technology
-
view
2.325 -
download
7
description
Transcript of 진화하는 소셜 큐레이션 서비스와 관련 기술
진화하는소셜 큐레이션서비스와관련 기술
Thing Daemon, Inc.
Lead Front-end Developer
김태곤 Taegon Kim
큐레이션이란?
연관있는 정보를 찾아서 분류,조직화 하여 공유하는 것
인터넷 시대의화두는…
Photo Used under Creative Commons from tucamon
언제나소셜이었습니다
Photo Used under Creative Commons from jamescridland
응답하라 1998
국내 IT 업계를 있게 한 바로 그 사건
1999년
2003년
2000년
2004년
2006년
과거에는정보의 생산 주체가제한적이었습니다
Photo Used under Creative Commons from newmediacenter
Photo Used under Creative Commons from bmoyle
가치있는 정보를골라내는 것이중요해졌습니다
필요한 정보를 구하는 방법?
우린 바쁘고 다른 할 일도 많습니다.
어떤 사람들은지식인, 동호회 등의커뮤니티 서비스를이용합니다.
미드 추천 좀…
카메라 추천 좀…
핸드폰 조건 좋은 곳추천 좀…
영화 추천 좀…
어떤 사람들은셀러브리티를따릅니다.
정보의 가치가 모두에게 같지는 않다.
사람들은편파적이다
로맨스 불륜
나는 아니라고요?
모두를 만족시키는 방법은 없다.
그럼 하든가
훨씬 더 다양한 기준으로…
It’s not information overload.It’s filter failure.
- Clay Shirky
큐레이션서비스의특징
소셜 네트워크 서비스
사용자 수가 중요
정보를 수집,구성하는 데 초점
소셜 네트워킹의 기준은 취향
큐레이션서비스의기술
필요하면 다 사용합니다.
클라우드 서비스
RDBMS, NoSQL
캐시 서버
검색 서버
아이폰/안드로이드
HTML5
Amazon EC2
•가격이 싼 편이다.
장점
•원하는 만큼 사용할 수 있다.
•데이터 센터가 물리적으로 분산되어 있다.
•모든 서비스가 API로 만들어져 있다.
→ 용량 추가, 콘솔 출력 캡쳐, 오토 스케일링, 모니터링 등
Amazon EC2
•간혹 문제가 생긴다.
단점
- 아마존 서비스 자체에 문제가 생기면 물리적인 분산도 소용없다.
- In-house 데이터 센터로 백업 필요
기업, 연구소 등에서 자체적으로 구축한 데이터 센터
아마존 장애같은 자잘한 문제따윈…
잠깐, 근데 우린 돈이 없잖아?
저희도 답을 찾는 중입니다 ㅠ_ㅠ
Amazon EC2
•가격이 싼 편이다.
장점+1
•원하는 만큼 사용할 수 있다.
•데이터 센터가 물리적으로 분산되어 있다.
•모든 서비스가 API로 만들어져 있다.
→ 용량 추가, 콘솔 출력 캡쳐, 오토 스케일링, 모니터링 등
•아마존 서비스에 문제가 생기면 다른 회사 서비스에도 문제가생기므로 욕을 적게 먹는다.
Why ?
•빠르게 개발할 수 있다.
표현력(Expressive Power)이 가장 좋은 언어 중 하나
언어 C에 상대적인 수준
C 1
C++ 2.5
Java 2.5
Python 6
출처 : Code Complete (Steve McConnell)
표현력이좋다 = 생각을코드로 만들기 쉽다
•빠르게 개발할 수 있다.
•라이브러리 지원이 뛰어나다.
- 여러 API 서비스는 Python 또는 Ruby 라이브러리를 우선 제공한다.
- Python Package Index의편리함!
$> pypi install django
•빠르게 개발할 수 있다.
•라이브러리 지원이 뛰어나다.
•개발자를 구하기 쉽다 또는 배우기 쉽다.
- Python은발표된지 20년이 넘은언어이다.
- 개념이 명확하고 배우기 쉽다.
•빠르게 개발할 수 있다.
•라이브러리 지원이 뛰어나다.
•개발자를 구하기 쉽다 또는 배우기 쉽다.
• Django 역시 꽤 성숙한 웹 개발 프레임워크이다.
힘겨워하는 DB를 위하여
- 프로파일링을 통해 로직/쿼리 최적화
- 입출력이 잦은 단순 데이터는 NoSQL redis 서버로 분산
- 자주 변하지 않는 데이터는 memcached에 캐시
Photo Used under Creative Commons from nigelpepper
사람들은게으르다그래서 편리한 도구가 필요하다.
웹 브라우저 도구
북마클릿 장 : 브라우저 호환성이 뛰어나다.단 : 구동 시간이 필요하다. 기능에 제한이 있다.
장 : 북마클릿보다 반응이 빠르고 기능이 다양하다.단 : 파이어폭스 확장 기능보다 사용할 수 있는 기능이 적다.
장 : 원한다면 브라우저의 거의 모든 기능을 사용할 수 있다.단 : 크롬 확장 기능보다 만들기 훨씬 어렵다.
+Addon SDK장 : 파이어폭스 확장기능을 그냥 만드는 것보다는 그나마 쉽다.단 : SDK에서 지원하지 않는 기능은 사용하기 어렵다.
사람들은남이뭘 좋아하는지궁금해한다
소셜 큐레이션도 소셜 네트워크 서비스입니다.
실시간 추천
Content-based 방식과 Collaborative Filtering 방식컨텐트의 관련 메타 데이터가 너무 부족하다!
그런데, 비교해야 할 데이터가 너무 많다.
→ Hadoop MapReduce를 사용하자.
리얼 타임이라며? 하둡은 리얼타임이 아닌데?
→ 그럼, MinHash를 사용하자.
더 알고 싶으신 분은…MapReduce 기반 대용량 추천 알고리즘 개발 : http://readme.skplanet.co.kr/?p=2509
사람들은좋아하는 것을보고 싶어한다
왜 여자들은 잡지를 볼까?
광고가 절반이나 되는데!
그냥 예쁜 거 보면 좋으니까!
72%핀터레스트의 여성 이용자 비율
좋아하는 것에만 집중할 수 있게!
무한 스크롤, 팝업 대화창, N-Screen
사용자는 확보했는데…
뭐가 더 필요할까?
사람들은좋아하는 것을보고 싶어한다
그리고…
사람들은좋아하는 것을 보면사고 싶어한다
$15 $15 $100 $30
남 : 왜 여자들은 잡지를 볼까?
여 : 그냥 예쁜 거 보면 좋으니까!
남 : 만약 살 수 있으면?
여 :
From http://www.fastcodesign.com
잠깐, 우린 ActiveX 써야 하잖아?
사람들은구매자가 모이는 곳에서팔고 싶어한다물건+욕구 = 판매
$2,490 짜리 티셔츠가 하룻밤 사이에 5장이 팔렸다.
$2,490 * 5 = $12,450 (약 1354만원)
브랜드에서 소셜 큐레이션서비스를 주목하는 이유
기사 출처 : 뉴욕타임즈
가격 : $280만 (약 30억 4500만원)
배송비 : $2.1만 (약 2280만원)
아직은시작단계입니다.
하지만 다음 세대의 중심이 될 것입니다.
Photo Used under Creative Commons from joeshlabotnik
감사합니다.
twitter.com/taggon
thefancy.com/taggon
Thank you stamp from Fancy