위치 기반 서비스 사용자의 최고의 장소 사진 선택 요인 분석

Post on 17-Jan-2017

46 views 5 download

Transcript of 위치 기반 서비스 사용자의 최고의 장소 사진 선택 요인 분석

위치 기반 서비스 사용자의 최고의 장소 사진 선택 요인 분석

Analyzing Factors Affecting Decision of Best Photo of a Place in a Location-based Service

윤상훈 °, 김태훈 , 현순주

한국과학기술원 전산학부

shygiants@gmail.ac.kr

1. 서론

Abstract2 / 14

장소를 더 잘 설명하거나 표현하는 사진은 보통의 사진과 달리 어떤 특징을 가지고

있을까 ?

2. 분석 방법

데이터 수집

3 / 14

장소 별 사진 데이터 수집을 위해 Foursquare API 를 활용

•미국 뉴욕 내 ( 북위 40.78, 서경 73.98 중심 반경 13km)–사용자들의 활동이 가장 활발

•Food 유형의 장소–사진의 시각적 요소가 중요하다고 판단

•최근 6 개월 간

노이즈 제외

•Tip 의 개수가 20 개 미만–잘 알려지지 않았다고 판단

•사진의 개수가 20 개 미만–Best Photo 의 신뢰도가 떨어진다고 판단

2. 분석 방법

사진 벡터화

4 / 14

Google Vision API 를 활용하여 사진의 고차원 특징을 추출

•사진 크기–[ 너비 , 높이 ]

•주조색 (Dominant color)–[ 색 비중 , 빨강 , 초록 , 파랑 ] × 2

•얼굴–[ 얼굴 유무 , 얼굴 수 , 평균 얼굴 비중 , 얼굴 비중의 분산 ]

•레이블 (Label)–[ 레이블 1 의 확신도 , 레이블 2 의 확신도 , …]–총 2,469 개의 레이블

2. 분석 방법

K-Means Clustering 기반 분석

5 / 14

사용자 투표에 의해 장소를 가장 잘 표현하는 사진으로 선정된 Best Photo (BP) 와 그렇지 않은 사진 Ordinary Photo (OP) 의 비교 분석

0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8012345678

Best Photo

0.4 0.6 0.8 1 1.2 1.4 1.6 1.8012345678

Ordinary Photo

• 특징 A (Cluster 1)• 특징 B (Cluster 2)

• 특징 A (Cluster 1)• 특징 C (Cluster 2)

BP 와 OP 각각에 대해 각 클러스터의 의미적 특징을 나열하여 비교한다 .예 )

2. 분석 방법

K-Means Clustering 기반 분석 ( 계속 )

6 / 14

•K-means clustering 의 K 값을 정할 때 Gap Statistic 을 이용한다 .

•사진 벡터의 차원 (D=2,483) 이 매우 높아서 K-means clustering 의 성능이 나빠진다 .

•게다가 , 사진 벡터의 특징 중에는 클러스터의 특성을 설명하는 데에 무의미하거나 서로 연관이 있을 수 있다 .

•따라서 , 벡터의 차원을 축소하기 위해 주성분분석 (PCA) 을 적용하였다 .

•Best Photo 는 210 개의 컴포넌트 , Ordinary Photo 는 485 개의 컴포넌트로 차원 축소

3. 분석 결과

기술 통계에 대한 비교 분석

7 / 14

Feature Best Photo (BP) Ordinary Photo (OP)사진

너비 , 높이M=(X=831.92, Y=823.01)SD=(X=504.7, Y=446.24)

M=(X=895.24, Y=933.90)SD=(X=440.52, Y=469.07)

얼굴 수 M=0.025, SD=0.16 M=0.18, SD=0.60

Best Photo

Ordinary Photo

3. 분석 결과

Clustering 결과 비교 분석

8 / 14

BP, OP 에 대해 K-means clustering 을 수행해 각각 17 개의 클러스터를 추출하였다 .각 클러스터의 특징들을 통해 의미를 추출해내면 다음으로 분류할 수 있다 .

•음식•음료•디저트•얼굴•인테리어 디자인•폰트 ( 텍스트 )•간판 ( 상표 )•주조색 밝음•주조색 어두움

Best Photo 의 인테리어 디자인 클러스터의 상위 10 개 레이블 ( 좌 ) 과 표본 사진 ( 우 )

Ordinary Photo 의 얼굴 클러스터의 표본 사진

•간판은 BP 에만 존재했고 얼굴은 OP 에만 존재했다 .•인테리어 디자인의 경우 , BP 가 OP 보다 비율이 훨씬 높았다 .

(BP: 27.2%, OP: 9.60%)

4. 결론

결론

9 / 14

Best Photo 와 Ordinary Photo 의 비교 분석

•Best Photo 는 인물 사진보다는 가게 간판이나 안내물을 나타내며 , 실내 인테리어 디자인에 대한 사진이 사용자들로부터 선택됨을 알 수 있다 .•따라서 , 이것이 장소를 잘 설명하기 위한 요소가 될 수 있음을 알 수 있다 .

향후 연구

•장소 개개 별로 사진을 통해 장소의 특성을 추출하여 장소 추천 시스템에 연계하는 방법론 연구•Food 뿐만 아니라 . 보다 다양한 장소의 유형에 대해서 적용될 수 있는지 연구