Методы статистического прогнозирования и использование в научно-технической сфере
Михаил Хохлов «Математическая модель для...
description
Transcript of Михаил Хохлов «Математическая модель для...
Яндекс.Пробки: прогнозируем ситуацию на дороге
Михаил ХохловРазработчик
3
4
5
6
???
Входные данные
Постановка задачи
Методы решения
Оценка качества
Математика
9
20 км/ч
Способ получения данных
35 км/ч 15 км/ч
10
Данные от пользователей
10
Время
Скорость
120
100
80
60
40
20
0
11
Данные от пользователей
11
Время0
Скорость
Итерационное сглаживание
1212
Итерационное сглаживание
10:009:40 9:50 10:10
1313
1414
Время проезда Скорость
Случай #1 10 сек. 36 км/ч
Случай #2 100 сек. 3,6 км/ч
Среднее 55 сек. (~ 7 км/ч) ~ 20 км/ч
Случай #1100 метров
36 км/ч
Случай #2100 метров
3,6 км/ч
1515
Время проезда Скорость
Случай #1 10 сек. + 10 сек. 36 км/ч
Случай #2 100 сек. + 10 сек. 6,5 км/ч
Случай #3 10 сек. + 100 сек. 6,5 км/ч
Случай #4 100 сек. + 100 сек. 3,6 км/ч
Среднее 110 сек. (~ 7 км/ч) ~ 13 км/ч
100 метров 100 метров
? км/ч
20 км/ч 20 км/ч
16
Предсказать время проезда по каждому участку дороги через 15–30–45–60 мин, наблюдая времена проезда сейчас и имея историю таких наблюдений в прошлом.
Постановка математической задачи
18
Физическое моделированиеПотоковые моделиИмитационные модели
Машинное обучениеАвторегрессияK ближайших соседей
Методы решения
19
Имитационные модели
20
Потоковые модели
21
Поток от плотности
22
Поток от плотности
23
Метод авторегрессии
23
Прогноз:
24
Метод авторегрессии
24
Минимизируемые критерии:Сумма квадратов подразумевает нормальное распределение ошибок, очень чувствительна к выбросам.Сумма модулей менее чувствительна к выбросам, но гораздо вычислительно сложнее.
Выбор предикторов:Геометрические соседи могут включать в себя много лишних ребер (например, в центре Москвы).Топологические соседи могут упустить что-то важное (например, проспект и дублер).Автоматический выбор предикторов выглядит перспективно.
25
LARS
25
Процедура регуляризации LARS.
26
Метод k ближайших соседей
26
Картина пробок #1
27
Метод k ближайших соседей
27
Картина пробок #2
28
Метод k ближайших соседей
28
Картина пробок #3
29
Прогноз:
Метод k ближайших соседей
29
3030
Оценка качества
Задача сравнить:
Разные математические модели.
Дороги с разным количеством данных.
Дороги с разной степенью загруженности.
3131
Оценка качества
3232
Оценка качества
3333
Оценка качества
34
Граф дорог
Граф дорог —100GbИстория наблюдений — десятки Tb
35
Метод k ближайших соседей
Метод авторегрессии
40
Наш прогноз
+12…15%
Маршрут безучета пробок
Статистикапробок
Пробки намомент выезда
Провидец
Качество
Разработчик
Спасибо
Кандидат физико-математических наук
Михаил Хохлов