Geo sib 2012

26
НЕКОТОРЫЕ ВОПРОСЫ ТЕМАТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ Бучнев А.А., Пяткин В.П. ИВМиМГ СО РАН

description

 

Transcript of Geo sib 2012

Page 1: Geo sib 2012

НЕКОТОРЫЕ ВОПРОСЫ ТЕМАТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ

ЗЕМЛИ

Бучнев А.А., Пяткин В.П.

ИВМиМГ СО РАН

Page 2: Geo sib 2012

Центральные вопросы тематической обработки (интерпретации) данных дистанционного зондирования Земли (ДДЗЗ) – вопросы повышения качества дешифрирования – непосредственно связаны с проблемой выбора адекватных алгоритмов распознавания. Возникающие при этом трудности обусловлены следующими причинами:

Page 3: Geo sib 2012

1. Структура реальных данных не соответствует модели данных, используемой в алгоритме. Например, невыполнение предположения о нормальном распределении векторов данных или невыполнение условия, что поле измерений является случайным.

2. Непрезентативность обучающих последовательностей – недостаточное количество данных для восстановления параметров решающего правила.

3. Несоответствие обучающих данных и данных, предъявляемых на распознавание (“загрязнение” выборок смешанными векторами измерений, т.е. векторами, которые образуются при попадании в элемент разрешения съемочной системы нескольких природных объектов).

Page 4: Geo sib 2012

4. Неточное соответствие обучающих данных, получаемых с помощью кластеризации, истинным тематическим классам.

5. Помехи аппаратуры, атмосферных условий и т.п. Таким образом, можно сказать, что современный опыт автоматизированного распознавания ДДЗЗ показывает: заранее практически невозможно уста- новить, какой алгоритм будет лучше с точки зрения точности классификации. Поэтому в распознающую систему целесообразно закладывать несколько алгоритмов и выбор оптимального алгоритма проводить эмпирически.

Page 5: Geo sib 2012

Наличие смешанных векторов в ДДЗЗ является, вероятно, одним из наиболее серьезных источников ошибок при построении тематической карты классификации.

В классификации ДДЗЗ чаще других используются методы, которые можно разбить на две группы: классификация с обучением (контролируемая классификация) и кластерный анализ (автоматическая классификация).

Большинство алгоритмов классификации для отнесения векторов признаков классам вычисляют для каждого вектора значения подходящей функции «правдоподобия».

Page 6: Geo sib 2012

Классификатор Байеса для нормальнораспределенных векторов признаков

Поэлементный и объектные классификаторы. Поскольку физические размеры реально

сканируемых пространственных объектов, как правило, больше разрешения съемочных систем, между векторами признаков существуют взаимосвязи. Использование информации подобного рода дает возможность повысить точность классификации, если пытаться распознавать одновременно блок смежных векторов квадратной или крестообразной формы.

Page 7: Geo sib 2012

Необходимые для построения решающих функций классов оценки статистических характеристик – векторов средних и ковариационных матриц, коэффициентов пространственной корреляции между значениями координат соседних векторов в горизонтальном и вертикальном направлениях – определяются на основе векторов из обучающих выборок (полей).

Page 8: Geo sib 2012

Алгоритмы кластеризации:• Иерархические - Восходящие (аггломеративные): отдельная связь, полная

связь, связь центроидов,… - Нисходящие М. Жамбю. Иерархический кластер-анализ и соответствия.

Пер. с фр. М., Финансы и статистика, 1988.• Squared-Error Based К-средних, ISODATA (Iterative Self-Organizing Data

Analysis Technique), ..• pdf оценивание через плотности смеси (Mixture Densities)• Graph Theory-Based• Fuzzy (Fuzzy C-means)• Neural Networks-Based• Sequential Data

Page 9: Geo sib 2012
Page 10: Geo sib 2012
Page 11: Geo sib 2012
Page 12: Geo sib 2012

МЕТОД АНАЛИЗА МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ

Алгоритм К-средних может быть отнесен к классу параметрических, т.к. он неявным образом предполагает природу плотности вероятности: кластеры стремятся иметь конкретную геометрическую форму, зависящую от выбранной метрики. Альтернативой является подход, основанный на предположении, что исходные данные являются выборкой из многомодового закона распределения, причем векторы, отвечающие отдельной моде, образуют кластер [1, 2]. Таким образом, задача сводится к анализу мод многомерных гистограмм.

1. P.M. Narendra, Goldberg. A non-parametric clustering scheme for landsat. Pattern Recognition, vol. 9, 1977, pp. 207-215.

2. В.А. Красиков, В.А. Шамис. Кластерная процедура на базе многомерной гистограммы распределения. Исследование Земли из космоса, № 2, 1982, с. 107-114.3. Асмус В.В. Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды.// Диссертация (научный доклад) на соискание ученой степени доктора физико-математических наук. На правах рукописи. Москва – 2002, - 75 с.

Page 13: Geo sib 2012

ГИБРИДНЫЙ МЕТОД: АНАЛИЗ МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ С ПОСЛЕДУЮЩЕЙ ИЕРАРХИЧЕСКОЙ

ГРУППИРОВКОЙ

Cистема кластеризации дополнена двухэтапной процедурой (с сохранением всех ранее существовавших функций): на первом этапе выполняется предварительное разбиение исходной выборки на кластеры с помощью модального анализа, а затем для получения окончательного результата используется иерархическая группировка. Применение иерархической группировки для кластеризации исходного набора векторов нереально из-за того, что используемая в алгоритме матрица расстояний состоит (в начале работы алгоритма) из N(N-1)/2 элементов, где N – количество векторов. Предварительное использование модального анализа позволяет сократить объем данных до разумных пределов. В качестве входных данных для иерархической группировки используются векторы средних группы векторов, связанных с каждой модой многомерной гистограммы. Напомним, что на каждом шаге восходящей иерархической классификации объединяются два кластера, расстояние между которыми минимально. Среди всех возможных расстояний между кластерами для ускорения вычислений используется простейшее – расстояние между векторами средних в кластерах.Достоинством иерархической группировки является то, что после построения иерархического дерева кластеризации можно “разрезать” его на любом уровне иерархии, т.е. получать разные кластерные карты, не запуская снова процесс кластеризации.

Page 14: Geo sib 2012

Паводок в районе Камня-на-Оби 04.05.2011

Page 15: Geo sib 2012

Контролируемая классификация (8 классов) икластеризация методом К-средних (10 кластеров)

Page 16: Geo sib 2012

Жесткая и нечеткая кластеризации

Page 17: Geo sib 2012

Объемы полученных кластеров

Se-ries1

0

25000

50000

75000

100000

125000

Page 18: Geo sib 2012

Затопление поймы Оби в районе пос. Молчаново (Томская область, 26.06.2010)

Page 19: Geo sib 2012

Контролируемая классификация

Page 20: Geo sib 2012

К-средних (80 кластеров, 1.5 сигма)

Page 21: Geo sib 2012

Кластеры воды

Page 22: Geo sib 2012

Усть-Чарыш: 29.05.2004 (Метеор-3М) и27.04.2010 (MODIS/Terra)

Page 23: Geo sib 2012

Контролируемая классификация икластерный анализ

Page 24: Geo sib 2012

Зона Обского водохранилища19.04.2011 (MODIS/Terra)

Page 25: Geo sib 2012

Метеор-М №1 03.04.2012

Page 26: Geo sib 2012

К-средних и С-средних (20 кластеров)