Персонализированный...

40
Персонализированный мир Виктор Кантор

Transcript of Персонализированный...

Page 1: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Персонализированныймир

ВикторКантор

Page 2: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Работа:Руководительслужбымашинногообучения ианализаданныхЯндекс.Такси,ранееруководилподразделениямивYandex DataFactoryиABBYY

Преподавание:Coursera,МФТИ,ШАД, Яндекс, Яндекс.Такси,ABBYY,Мегафон,МТС, Сбертех идр.

Докладчик

Page 3: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Планрассказа

• Рекомендательныесистемы:ранееисейчас• Оценкаэффекта• Другие применениярекомендаций

Page 4: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Рекомендательныесистемы:ранееисейчас

Page 5: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтохотимнаучитьсяделать

• Естьбазапользователейибазаобъектов(фильмов,музыки,товароввинтернет-магазине)• Естьобратнаясвязьотпользователей:оценки,просмотры,покупки• Нужнонаучитьсярекомендоватьпользователюто,чтоемупонравится

Page 6: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Рекомендациифильмов:возможнаяпостановказадачи• Естьизвестныеоценки,которыепользователипоставилиужепросмотреннымфильмам• Нужно:• Спрогнозироватьоценки,которыепоставилибыпользователидругимфильмам• Порекомендоватьпользователямто,чтоимбольшепонравится

Page 7: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

РекомендациифильмовПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 8: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

РекомендациифильмовПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2 ?

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 9: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

User-based kNNПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 10: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

User-basedkNNПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2 ?

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 11: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Item-basedkNNПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2 ?

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 12: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Item-basedkNNПила Улица Вязов Ванильное

небо1+1

Маша 5 4 1 2

Юля 5 2 ?

Вова 3 5

Коля 3 4 5

Петя 4

Ваня 5 3 3

Page 13: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Матричныеразложения

Пила Улица Вязов Ванильноенебо

1+1

Маша 5 4 1 2

Юля 5 5 2

Вова 3 5

Коля 3 ? 4 5

Петя 4

Ваня 5 3 3

𝑖

𝑗

𝑥$% ≈ 𝑢$, 𝑣% = ,𝑢$-𝑣%-

.

-/0

𝑢$ - «интересыпользователей»𝑣% - «параметрыфильмов»

Page 14: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Какизмеритькачество?

Качествомодели=качествопрогнозаоценок?• Среднеквадратичноеотклонение(RMSE)• Среднееабсолютноеотклонение(MAE)

Page 15: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Правильнолимыживем?

• Чтомыоцениваем:качествопрогнозаоценок• Чтонужнооценивать:качестворекомендаций

Page 16: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Другойпример:рекомендациитоваров

Вечернееплатье

Кеды Джинсы Футболка

Маша 1 1

Юля 1 1 1

Вова 1 1

Коля 1 ? 1

Петя 1 1

Ваня 1 1

𝑖

𝑗

Page 17: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Отличияотпрошлойзадачи

• Нетнегативныхпримеров• Понятнейсвязьсприбылью

Page 18: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтоможемделать

• Прогнозировать,какиетоварыбудуткуплены• Максимизироватьприбыль

Page 19: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Товар1 Товар2 Товар3 Товар4

Максимизациядохода

Page 20: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Товар1 Товар2 Товар3 Товар4

Максимизациядохода

Вероятность: 𝒑𝟏 𝒑𝟐 𝒑𝟑 𝒑𝟒Цена: 𝑐1 𝑐2 𝑐3 𝑐4

Page 21: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Максимизациядохода

Вероятность: 0.05 0.02 0.015 0.009

Цена: 3490 1990 1590 1970

Page 22: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Максимизацияприбыли

Вероятность: 0.05 0.02 0.015 0.009

Цена: 3490 1990 1590 1970

Маржинальность: 0.1 0.4 0.4 0.2

Page 23: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Прогнозированиевероятности

• Объекты:тройки(пользователь,товар,моментвремени)• Классы:1- товарбудеткуплен,0– товарнебудеткуплен• Признаки:параметрыпользователя,товара,моментавременииих«взаимодействие»

Page 24: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Отборкандидатов

• Популярные• Из техжекатегорий• Частопокупаемыесужепросмотренными/понравившимися• Иззаранееподготовленныхсписковпохожихтоваров

Page 25: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Генерациянегативныхпримеров

• Добавитьккаждомупозитивномупримерувеськаталогкакнегативный(нереально)• Случайныесравномернымраспределением• Случайные,свероятностями,пропорциональнымипопулярностиобъекта• Самыепопулярныепримеры• Теобъекты,которыерекомендовалбыкакой-тоалгоритм,ноонинебыликуплены

Page 26: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Оценкаэффекта

Page 27: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Онлайноваяоценкакачества

Допустим,наисторическихданныхкачествоалгоритмавысокое,абудетлионовысокимвреальности?

Page 28: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Онлайноваяоценкакачества

Допустим,наисторическихданныхкачествоалгоритмавысокое,абудетлионовысокимвреальности?

Идеи:1. А/Втест2. Оценкастатзначимости результата

Page 29: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

A/Bтест

1. Случайнымобразомделимклиентовнаравныегруппы2. Измеряемцелевыеметрики(например,доходскаждойгруппы

клиентов)вкаждойгруппезадлительныйпериодвремени3. Получаемкакое-точислодлякаждойгруппы4. Чтодальше?

Page 30: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Cтатистическая значимость:пример

Page 31: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Однакриваяотличаетсяотдругихна10%Норазбиениенасамомделе– случайное

Cтатистическая значимость:пример

Page 32: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Другиеприменениярекомендательныхсистем

Page 33: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

ПрогнозированиеточкиБвТакси

Page 34: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтоделаем

Какаяпостановказадачимашинногообучениядолжнабыть?1. УгадатьточкуB

Page 35: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтоделаем

Какаяпостановказадачимашинногообучениядолжнабыть?1. УгадатьточкуB2. Задачарегрессии:объекты– пользователи,целевоезначение–

координатыточкиВ

Page 36: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтоделаем

Какаяпостановказадачимашинногообучениядолжнабыть?1. УгадатьточкуB2. Задачарегрессии:объекты– пользователи,целевоезначение–

координатыточкиВ3. Задачаклассификации:объекты- пары(пользователи,момент

времени),классы– адресамест,кудаможетпоехать

Page 37: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Чтоделаем

Какаяпостановказадачимашинногообучениядолжнабыть?1. УгадатьточкуB2. Задачарегрессии:объекты– пользователи,целевоезначение–

координатыточкиВ3. Задачаклассификации:объекты- пары(пользователи,момент

времени),классы– адресамест,кудаможетпоехать4. Задачаклассификации:объекты- тройки(пользователь,место,

моментвремени,классы– 1и0(поехалилинет),1приточномпопаданиивадресиливокрестность20метров

Page 38: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Результаты

• Былодонас:(эвристическийалгоритм)recall@1=63,7%;recall@2=78,5%;

• Стало:recall@1=72,1%;recall@2=82,6%;

Page 39: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Ещепримеры

• Рекомендацииметодовудержанияклиента• Персонализацияконтентасайта• Персонализацияпривлеченияклиентов• …

Page 40: Персонализированный мирfiles.runet-id.com/2017/riw/presentations/3nov.riw17-grey.16-00... · Руководитель службы машинного обучения

Спасибозавнимание

ВикторКантор

[email protected]

@vkantor