Роман Степанов: "Анализ данных о местоположении...
Transcript of Роман Степанов: "Анализ данных о местоположении...
Анализ данных о местоположении
клиентовProvectus
Казань 2016
Основные задачи• Понять специфику клиентов определенного бизнеса:• Что их привлекает? • Какие тренды?• Где размещать рекламу?• Как развиваться дальше?
• Кто конкуренты? Что с ними происходит во времени?• Оценить влияние рекламы• Убедиться в качестве и полноте данных.
Данные• Сигналы с устройств (местоположение, время, идентификатор
устройства)• Профили владельцев устройств• Справочник адресов• Справочник бизнесов• Географические данные (штаты, DMA, дороги, и т.д.)• Данные переписи населения• Данные от партнеров• И т.д.
Примеры• Стандартные отчеты• Cadillac custom analysis• Profiles index• Mariano’s custom analysis• Double Geocoding with Google Places API
Смещение данных
Male Female00%10%20%30%40%50%60%70%
Gender
ProfilesCensus
Age 18-24 Age 25-34 Age 35-44 Age 45-54 Age 55-64 Age 65+0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
Age distribution
ProfilesCensus
Смещение данных в пользу более активных соц.-дем. групп пользователей
Проблемы• Удаление «выбросов»;• Propensity Score Matching для уточнения всевозможных
результатов с использованием контрольных групп (демографические профили, характеристика клиентов по типам посещаемых мест);• Автоматизация double geocoding;• Определение временных трендов посещаемости с учетом
изменений в объемах сигналов