Коллекции изображений

103
Коллекции изображений Many slides adapted from Alexei Efros and Jean-François Lalonde CSEDays-2010

Transcript of Коллекции изображений

Page 1: Коллекции изображений

Коллекции изображений

Many slides adapted from Alexei Efros and Jean-François Lalonde

CSEDays-2010

Page 2: Коллекции изображений

Люди

• Alexei (Alyosha) Efros • Associate professor

Carnegie Mellon University

• Antonio Тorralba • Associate professor

Massachusetts Institute of Technology

Page 3: Коллекции изображений

10 в степениЧисло картинок на диске: 104

Число картинок, виденных за 10 лет: 108 (3 images/second * 60 * 60 * 16 * 365 * 10 = 630720000)

Число картинок,виденных всем человечеством: 1020

106,456,367,669 humans1 * 60 years * 3 images/second * 60 * 60 * 16 * 365 = 1 from http://www.prb.org/Articles/2002/HowManyPeopleHaveEverLivedonEarth.aspx

Число картинок во вселенной: 10243

1081 atoms * 1081 * 1081 =

Число всех картинок 32x32 : 107373

256 32*32*3 ~ 107373

Slide by Antonio Torralba

Page 4: Коллекции изображений

Доступные данные

Lenaa dataset in one picture

1972

100

105

1010

1020

Number of

pictures

1015

Human Click Limit(all humanity takingone picture/secondduring 100 years)

Time 1996

40.000

COREL

2007

2 billion

2020?

Slide by Antonio Torralba

Page 5: Коллекции изображений

Все фотографии уникальны и интересны…

Slide by Antonio Torralba

Page 6: Коллекции изображений

Ха!

Slide by Antonio Torralba

Page 7: Коллекции изображений

Методы обучения

Число изображений

1 10 102 103 104 105

Задача экстраполяцииОбобщение

Transfer learning

∞106

Source by Antonio Torralba

Обычныеданные

Задача интерполяцииСопоставлениеПоиск разницы

Page 8: Коллекции изображений

Hays & Efros, SIGGRAPH‘07

Page 9: Коллекции изображений
Page 10: Коллекции изображений

Что мы можем сказать о изображении?

Page 11: Коллекции изображений

Семантика сцены

Page 12: Коллекции изображений
Page 13: Коллекции изображений
Page 14: Коллекции изображений
Page 15: Коллекции изображений
Page 16: Коллекции изображений

Дескриптор изображения

Page 17: Коллекции изображений

Дескриптор изображения

Gist scene descriptor (Oliva and Torralba 2001)

Page 18: Коллекции изображений

Дескриптор изображения

+

Gist scene descriptor (Oliva and Torralba 2001)

Page 19: Коллекции изображений
Page 20: Коллекции изображений

… 200 изображений

Page 21: Коллекции изображений
Page 22: Коллекции изображений

Graph cut + Poisson blending

Page 23: Коллекции изображений
Page 24: Коллекции изображений
Page 25: Коллекции изображений
Page 26: Коллекции изображений

… 200 ближайших

Page 27: Коллекции изображений
Page 28: Коллекции изображений
Page 29: Коллекции изображений
Page 30: Коллекции изображений
Page 31: Коллекции изображений
Page 32: Коллекции изображений
Page 33: Коллекции изображений
Page 34: Коллекции изображений
Page 35: Коллекции изображений
Page 36: Коллекции изображений

… 200 ближайших

Page 37: Коллекции изображений
Page 38: Коллекции изображений
Page 39: Коллекции изображений

Почему это работает?

Page 40: Коллекции изображений
Page 41: Коллекции изображений

10 ближайших из 20,000 изображений

Page 42: Коллекции изображений

10 ближайших из 2х миллионов изображений

Page 43: Коллекции изображений

Общая идея

Небо, Вода, Холм, Пляж, Солнце,

Полдень

«Метод грубой силы»

Page 44: Коллекции изображений

Photo Clip Art

Jean-François Lalonde, Derek Hoiem, Alexei Efros, Carsten Rother, John Winn, Antonio Criminisi «Photo Clip Art», SIGGRAPH 2007.

Page 45: Коллекции изображений

Inserting objects in images [Debevec ‘98]

Фотореалистичная визуализация

Дорого и «домохозяйке» не под силу

Высокодетализированная модельКачественные материалы

Page 46: Коллекции изображений

Альтернатива: картинки

Быстро и дешево

Далеко от реальности….

Page 47: Коллекции изображений

Почему не получается?

Вставим машинку с другой фотографии…

Ориентация и освещение Ориентация и освещение

неправильныенеправильные

Ориентация и освещение Ориентация и освещение

неправильныенеправильные

Page 48: Коллекции изображений

Опять много-много данных…

Возьмём подходящую картинку из коллекции…

Page 49: Коллекции изображений

Идея системы

Этап I: Аннотация (разметка) базы примеров

Этап II: Вставка объекта

Name: personSubgroup: person, standingHeight: 1.5m Local context: in shadowIllumination: sunny, bright day, no cloudSegmentation quality: excellent, >40 pointsUpsampling blur: low

Page 50: Коллекции изображений

Источник данных: LabelMe [Russell et al., 2005]

В сети (http://labelme.csail.mit.edu)

170,000 объектов в 40,000 изображениях

Именованные полигоны

Page 51: Коллекции изображений

Организация данных

16 вручную выбранных категорий

Подкатегории (кластеризация)

Page 52: Коллекции изображений

Аннотация всех объектовАннотация всех объектов

Page 53: Коллекции изображений

Параметры камеры

Высота камеры

Наклон камеры

Page 54: Коллекции изображений

Рост человека1.7 +/- 0.085 m(National Center for Health Statistics)

Рост человека1.7 +/- 0.085 m(National Center for Health Statistics)

Высота автомобиля1.5 +/- 0.19 m(automatically learned)

Высота автомобиля1.5 +/- 0.19 m(automatically learned)

Параметры камеры

Page 55: Коллекции изображений

Object Estimated average height (m)

Car 1.51

Man 1.80

Woman 1.67

Parking meter 1.36

Fire hydrant 0.87

Оценка высоты объектов

1.0 m

Car

0.5 m

Man Woman Parkingmeter

Firehydrant

1.5 m

Page 56: Коллекции изображений

Одной камеры не хватает…

Page 57: Коллекции изображений

Освещенность сцены

ИзображениеКарта сцены

Можно оценить освещенность сцены

Разные приближенные модели [Khan et al., ‘06]

Page 58: Коллекции изображений

Оценка освещенияDatabase image P(pixel|class) CIE L*a*b* histograms

Automatic Photo PopupHoiem et al., SIGGRAPH ‘05

Automatic Photo PopupHoiem et al., SIGGRAPH ‘05

Page 59: Коллекции изображений

Поиск по освещенности

Page 60: Коллекции изображений

Локальный контекст

Page 61: Коллекции изображений

Качество сегментации

Все размечают пользователи

Качество сегментации разительно отличается

38 points / polygon 4 points / polygon

Page 62: Коллекции изображений

Резкость изображения

Разрешения должны соответствовать!

x3 up-sampling

Page 63: Коллекции изображений

Текущая схема

Этап I: Разметка базы

Этап II: Вставка картинки

3-D height Segmentation Blur

Object properties (used for sorting the database)

Label Illumination contextCluster Local contextCamera

Page 64: Коллекции изображений

Вставка объекта

Заметные границы склейки при использовании исходной сегментации

Page 65: Коллекции изображений

Сегментация

Мето должен быть автоматическим!

Работать со сложными объектами

ОбъединениеОбъединение

Drag-and-Drop Pasting[Jia et al., ’06]

СмешениеСмешениеСмешениеСмешение

Poisson image editing[Pérez et al., ’03]

Spline blending[Burt and Adelson, ‘83]

СегментацияСегментацияСегментацияСегментация

GrabCut[Rother et al., ’04]

Lazy Snapping[Li et al., ’04]

Graph cut segmentation[Boykov and Jolly, ’01]

Page 66: Коллекции изображений

Уточнение сегментации

Graph Cut [Boykov and Jolly, 2001]

Flux shape prior [Kolmogorov and Boykov, 2005]

Не ужимаем объект чересчур

Не сглаживает слишком сильно

Band restriction for GC GC segmentation With fluxDatabase image

Page 67: Коллекции изображений

Смешение

Объект Результат смешения

Page 68: Коллекции изображений

Тени [Kersten et al., ‘96]

Page 69: Коллекции изображений

Перенос тени

++++ ====

Изображение Оценка тени Уточнение тени

Перенос объекта Перенос тени Результат

Page 70: Коллекции изображений

Авария

Page 71: Коллекции изображений

Мост

Page 72: Коллекции изображений

Картина

Page 73: Коллекции изображений

Улица

Page 74: Коллекции изображений

im2gps

Hays & Efros, CVPR 2008

• Собрали 6М картинок из Flikr с проставленными GPS-метками

• Умеем искать похожие изображения в большой базе

• Кластер из 400 машин для аннотации всех 6М изображений

• Найдем, вот эту картинку:

Page 75: Коллекции изображений
Page 76: Коллекции изображений
Page 77: Коллекции изображений

Найдем теперь такую:

Page 78: Коллекции изображений

Что мы нашли:

Page 79: Коллекции изображений

Отображение результатов на карте

200 результатов, кластеризуем и покажем центрыи распределение картинок

Page 80: Коллекции изображений

im2gps

Page 81: Коллекции изображений
Page 82: Коллекции изображений
Page 83: Коллекции изображений
Page 84: Коллекции изображений
Page 85: Коллекции изображений
Page 86: Коллекции изображений
Page 87: Коллекции изображений
Page 88: Коллекции изображений
Page 89: Коллекции изображений
Page 90: Коллекции изображений
Page 91: Коллекции изображений

Категории данных

Page 92: Коллекции изображений
Page 93: Коллекции изображений

Скорость = 112 м / км

Page 94: Коллекции изображений

Уклон

Ранжирование изображений по уклону (от макс к мин)

Page 95: Коллекции изображений
Page 96: Коллекции изображений

Ранжирование по плотности населения

Page 97: Коллекции изображений
Page 98: Коллекции изображений

Пустыни

Page 99: Коллекции изображений

Города и здания

Page 100: Коллекции изображений

Снег и лед

Page 101: Коллекции изображений

Саванна

Page 102: Коллекции изображений

Вода

Page 103: Коллекции изображений

• Понять одну картинку проще всего используя все остальные картинки!

Выводы