Geo sib 2012

Post on 24-Apr-2015

645 views 0 download

description

 

Transcript of Geo sib 2012

НЕКОТОРЫЕ ВОПРОСЫ ТЕМАТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ

ЗЕМЛИ

Бучнев А.А., Пяткин В.П.

ИВМиМГ СО РАН

Центральные вопросы тематической обработки (интерпретации) данных дистанционного зондирования Земли (ДДЗЗ) – вопросы повышения качества дешифрирования – непосредственно связаны с проблемой выбора адекватных алгоритмов распознавания. Возникающие при этом трудности обусловлены следующими причинами:

1. Структура реальных данных не соответствует модели данных, используемой в алгоритме. Например, невыполнение предположения о нормальном распределении векторов данных или невыполнение условия, что поле измерений является случайным.

2. Непрезентативность обучающих последовательностей – недостаточное количество данных для восстановления параметров решающего правила.

3. Несоответствие обучающих данных и данных, предъявляемых на распознавание (“загрязнение” выборок смешанными векторами измерений, т.е. векторами, которые образуются при попадании в элемент разрешения съемочной системы нескольких природных объектов).

4. Неточное соответствие обучающих данных, получаемых с помощью кластеризации, истинным тематическим классам.

5. Помехи аппаратуры, атмосферных условий и т.п. Таким образом, можно сказать, что современный опыт автоматизированного распознавания ДДЗЗ показывает: заранее практически невозможно уста- новить, какой алгоритм будет лучше с точки зрения точности классификации. Поэтому в распознающую систему целесообразно закладывать несколько алгоритмов и выбор оптимального алгоритма проводить эмпирически.

Наличие смешанных векторов в ДДЗЗ является, вероятно, одним из наиболее серьезных источников ошибок при построении тематической карты классификации.

В классификации ДДЗЗ чаще других используются методы, которые можно разбить на две группы: классификация с обучением (контролируемая классификация) и кластерный анализ (автоматическая классификация).

Большинство алгоритмов классификации для отнесения векторов признаков классам вычисляют для каждого вектора значения подходящей функции «правдоподобия».

Классификатор Байеса для нормальнораспределенных векторов признаков

Поэлементный и объектные классификаторы. Поскольку физические размеры реально

сканируемых пространственных объектов, как правило, больше разрешения съемочных систем, между векторами признаков существуют взаимосвязи. Использование информации подобного рода дает возможность повысить точность классификации, если пытаться распознавать одновременно блок смежных векторов квадратной или крестообразной формы.

Необходимые для построения решающих функций классов оценки статистических характеристик – векторов средних и ковариационных матриц, коэффициентов пространственной корреляции между значениями координат соседних векторов в горизонтальном и вертикальном направлениях – определяются на основе векторов из обучающих выборок (полей).

Алгоритмы кластеризации:• Иерархические - Восходящие (аггломеративные): отдельная связь, полная

связь, связь центроидов,… - Нисходящие М. Жамбю. Иерархический кластер-анализ и соответствия.

Пер. с фр. М., Финансы и статистика, 1988.• Squared-Error Based К-средних, ISODATA (Iterative Self-Organizing Data

Analysis Technique), ..• pdf оценивание через плотности смеси (Mixture Densities)• Graph Theory-Based• Fuzzy (Fuzzy C-means)• Neural Networks-Based• Sequential Data

МЕТОД АНАЛИЗА МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ

Алгоритм К-средних может быть отнесен к классу параметрических, т.к. он неявным образом предполагает природу плотности вероятности: кластеры стремятся иметь конкретную геометрическую форму, зависящую от выбранной метрики. Альтернативой является подход, основанный на предположении, что исходные данные являются выборкой из многомодового закона распределения, причем векторы, отвечающие отдельной моде, образуют кластер [1, 2]. Таким образом, задача сводится к анализу мод многомерных гистограмм.

1. P.M. Narendra, Goldberg. A non-parametric clustering scheme for landsat. Pattern Recognition, vol. 9, 1977, pp. 207-215.

2. В.А. Красиков, В.А. Шамис. Кластерная процедура на базе многомерной гистограммы распределения. Исследование Земли из космоса, № 2, 1982, с. 107-114.3. Асмус В.В. Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды.// Диссертация (научный доклад) на соискание ученой степени доктора физико-математических наук. На правах рукописи. Москва – 2002, - 75 с.

ГИБРИДНЫЙ МЕТОД: АНАЛИЗ МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ С ПОСЛЕДУЮЩЕЙ ИЕРАРХИЧЕСКОЙ

ГРУППИРОВКОЙ

Cистема кластеризации дополнена двухэтапной процедурой (с сохранением всех ранее существовавших функций): на первом этапе выполняется предварительное разбиение исходной выборки на кластеры с помощью модального анализа, а затем для получения окончательного результата используется иерархическая группировка. Применение иерархической группировки для кластеризации исходного набора векторов нереально из-за того, что используемая в алгоритме матрица расстояний состоит (в начале работы алгоритма) из N(N-1)/2 элементов, где N – количество векторов. Предварительное использование модального анализа позволяет сократить объем данных до разумных пределов. В качестве входных данных для иерархической группировки используются векторы средних группы векторов, связанных с каждой модой многомерной гистограммы. Напомним, что на каждом шаге восходящей иерархической классификации объединяются два кластера, расстояние между которыми минимально. Среди всех возможных расстояний между кластерами для ускорения вычислений используется простейшее – расстояние между векторами средних в кластерах.Достоинством иерархической группировки является то, что после построения иерархического дерева кластеризации можно “разрезать” его на любом уровне иерархии, т.е. получать разные кластерные карты, не запуская снова процесс кластеризации.

Паводок в районе Камня-на-Оби 04.05.2011

Контролируемая классификация (8 классов) икластеризация методом К-средних (10 кластеров)

Жесткая и нечеткая кластеризации

Объемы полученных кластеров

Se-ries1

0

25000

50000

75000

100000

125000

Затопление поймы Оби в районе пос. Молчаново (Томская область, 26.06.2010)

Контролируемая классификация

К-средних (80 кластеров, 1.5 сигма)

Кластеры воды

Усть-Чарыш: 29.05.2004 (Метеор-3М) и27.04.2010 (MODIS/Terra)

Контролируемая классификация икластерный анализ

Зона Обского водохранилища19.04.2011 (MODIS/Terra)

Метеор-М №1 03.04.2012

К-средних и С-средних (20 кластеров)