Михаил Хохлов «Математическая модель для...

42

description

Научно-технический семинар «Яндекс.Пробки: прогнозируем ситуацию на дороге» в московском офисе Яндекса, 13 декабря 2012 Михаил Хохлов, разработчик инфраструктуры Яндекс.Пробок, Москва.

Transcript of Михаил Хохлов «Математическая модель для...

Page 1: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 2: Михаил Хохлов «Математическая модель для прогнозирования пробок»

Яндекс.Пробки: прогнозируем ситуацию на дороге

Михаил ХохловРазработчик

Page 3: Михаил Хохлов «Математическая модель для прогнозирования пробок»

3

Page 4: Михаил Хохлов «Математическая модель для прогнозирования пробок»

4

Page 5: Михаил Хохлов «Математическая модель для прогнозирования пробок»

5

Page 6: Михаил Хохлов «Математическая модель для прогнозирования пробок»

6

???

Page 7: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 8: Михаил Хохлов «Математическая модель для прогнозирования пробок»

Входные данные

Постановка задачи

Методы решения

Оценка качества

Математика

Page 9: Михаил Хохлов «Математическая модель для прогнозирования пробок»

9

20 км/ч

Способ получения данных

35 км/ч 15 км/ч

Page 10: Михаил Хохлов «Математическая модель для прогнозирования пробок»

10

Данные от пользователей

10

Время

Скорость

120

100

80

60

40

20

0

Page 11: Михаил Хохлов «Математическая модель для прогнозирования пробок»

11

Данные от пользователей

11

Время0

Скорость

Page 12: Михаил Хохлов «Математическая модель для прогнозирования пробок»

Итерационное сглаживание

1212

Page 13: Михаил Хохлов «Математическая модель для прогнозирования пробок»

Итерационное сглаживание

10:009:40 9:50 10:10

1313

Page 14: Михаил Хохлов «Математическая модель для прогнозирования пробок»

1414

Время проезда Скорость

Случай #1 10 сек. 36 км/ч

Случай #2 100 сек. 3,6 км/ч

Среднее 55 сек. (~ 7 км/ч) ~ 20 км/ч

Случай #1100 метров

36 км/ч

Случай #2100 метров

3,6 км/ч

Page 15: Михаил Хохлов «Математическая модель для прогнозирования пробок»

1515

Время проезда Скорость

Случай #1 10 сек. + 10 сек. 36 км/ч

Случай #2 100 сек. + 10 сек. 6,5 км/ч

Случай #3 10 сек. + 100 сек. 6,5 км/ч

Случай #4 100 сек. + 100 сек. 3,6 км/ч

Среднее 110 сек. (~ 7 км/ч) ~ 13 км/ч

100 метров 100 метров

? км/ч

20 км/ч 20 км/ч

Page 16: Михаил Хохлов «Математическая модель для прогнозирования пробок»

16

Предсказать время проезда по каждому участку дороги через 15–30–45–60 мин, наблюдая времена проезда сейчас и имея историю таких наблюдений в прошлом.

Постановка математической задачи

Page 17: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 18: Михаил Хохлов «Математическая модель для прогнозирования пробок»

18

Физическое моделированиеПотоковые моделиИмитационные модели

Машинное обучениеАвторегрессияK ближайших соседей

Методы решения

Page 19: Михаил Хохлов «Математическая модель для прогнозирования пробок»

19

Имитационные модели

Page 20: Михаил Хохлов «Математическая модель для прогнозирования пробок»

20

Потоковые модели

Page 21: Михаил Хохлов «Математическая модель для прогнозирования пробок»

21

Поток от плотности

Page 22: Михаил Хохлов «Математическая модель для прогнозирования пробок»

22

Поток от плотности

Page 23: Михаил Хохлов «Математическая модель для прогнозирования пробок»

23

Метод авторегрессии

23

Прогноз:

Page 24: Михаил Хохлов «Математическая модель для прогнозирования пробок»

24

Метод авторегрессии

24

Минимизируемые критерии:Сумма квадратов подразумевает нормальное распределение ошибок, очень чувствительна к выбросам.Сумма модулей менее чувствительна к выбросам, но гораздо вычислительно сложнее.

Выбор предикторов:Геометрические соседи могут включать в себя много лишних ребер (например, в центре Москвы).Топологические соседи могут упустить что-то важное (например, проспект и дублер).Автоматический выбор предикторов выглядит перспективно.

Page 25: Михаил Хохлов «Математическая модель для прогнозирования пробок»

25

LARS

25

Процедура регуляризации LARS.

Page 26: Михаил Хохлов «Математическая модель для прогнозирования пробок»

26

Метод k ближайших соседей

26

Картина пробок #1

Page 27: Михаил Хохлов «Математическая модель для прогнозирования пробок»

27

Метод k ближайших соседей

27

Картина пробок #2

Page 28: Михаил Хохлов «Математическая модель для прогнозирования пробок»

28

Метод k ближайших соседей

28

Картина пробок #3

Page 29: Михаил Хохлов «Математическая модель для прогнозирования пробок»

29

Прогноз:

Метод k ближайших соседей

29

Page 30: Михаил Хохлов «Математическая модель для прогнозирования пробок»

3030

Оценка качества

Задача сравнить:

Разные математические модели.

Дороги с разным количеством данных.

Дороги с разной степенью загруженности.

Page 31: Михаил Хохлов «Математическая модель для прогнозирования пробок»

3131

Оценка качества

Page 32: Михаил Хохлов «Математическая модель для прогнозирования пробок»

3232

Оценка качества

Page 33: Михаил Хохлов «Математическая модель для прогнозирования пробок»

3333

Оценка качества

Page 34: Михаил Хохлов «Математическая модель для прогнозирования пробок»

34

Граф дорог

Граф дорог —100GbИстория наблюдений — десятки Tb

Page 35: Михаил Хохлов «Математическая модель для прогнозирования пробок»

35

Метод k ближайших соседей

Метод авторегрессии

Page 36: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 37: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 38: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 39: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 40: Михаил Хохлов «Математическая модель для прогнозирования пробок»

40

Наш прогноз

+12…15%

Маршрут безучета пробок

Статистикапробок

Пробки намомент выезда

Провидец

Качество

Page 41: Михаил Хохлов «Математическая модель для прогнозирования пробок»
Page 42: Михаил Хохлов «Математическая модель для прогнозирования пробок»

Разработчик

Спасибо

Кандидат физико-математических наук

Михаил Хохлов