О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань

29
ПОДХОД К РАЗРАБОТКЕ МЕТОДОВ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ ИНФОРМАЦИОННОЙ ЦЕЛОСТНОСТИ ТЕХНИЧЕСКИХ ТЕКСТОВ О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань

description

ПОДХОД К РАЗРАБОТКЕ МЕТОДОВ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ ИНФОРМАЦИОННОЙ ЦЕЛОСТНОСТИ ТЕХНИЧЕСКИХ ТЕКСТОВ. О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань. Контроль информационной целостности технических текстов. - PowerPoint PPT Presentation

Transcript of О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань

Page 1: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

ПОДХОД К РАЗРАБОТКЕ МЕТОДОВ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ ИНФОРМАЦИОННОЙ ЦЕЛОСТНОСТИ ТЕХНИЧЕСКИХ ТЕКСТОВ

О.А Невзорова

НИИММ им. Н.Г. Чеботарева,

г. Казань

Page 2: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Контроль информационной целостности технических текстов

Технические тексты «Логика работы…» – основа для разработки спецификаций бортовых алгоритмов и алгоритмов деятельности членов экипажа проектируемого антропоцентрического объекта

Page 3: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Назначение документа«Логика работы…» разработка спецификаций бортовых

алгоритмов и алгоритмов деятельности экипажа;

определение состава информации (протоколы информационного обмена), передаваемой между бортовыми компьютерами, бортовыми измерительными и исполнительными устройствами.

Page 4: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Структура документа «Логика работы…» Структурирование процесса

функционирования сложного объекта через сеть типовых ситуаций и проблемных ситуаций в каждой из них;

Представление описаний каждой проблемной ситуации через полное множество обобщенных алгоритмов и бортовых алгоритмов.

Page 5: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Структура бортового алгоритма

входная информация (совокупность информационных сигналов или семантическое описанием входного информационного потока с указанием источника информации: конкретный алгоритм, конкретное измерительное устройство);

шаги преобразования информации (допустимый способ разрешения проблемы);

выходная информация (совокупность информационных сигналов или семантическое описанием выходного информационного потока).

Page 6: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Схема бортовых алгоритмов

Изм/устройство

Исп/устройство

Алгоритмы(БЦВМ-

алгоритмы / АДЭ)

Информационный поток на входе

Информационный поток на выходе

Page 7: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Методы автоматизированного контроля информационной целостности текста

Технологии морфосинтаксического анализа

Технологии взаимодействия с прикладной онтологией

Page 8: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Методы автоматизированного контроля информационной целостности текста

Распознавание ситуаций неполных алгоритмических описаний ("белых пятен")

Разрешение ситуаций «белых пятен» на основе специализированных активных диалогов

Page 9: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Ситуации «белых пятен» тексты содержат ссылку на

объект, не конструируемый последующим текстовым описанием;

построенное описание объекта является неполным и требует доопределения;

используются описания с нечеткой алгоритмической моделью;

Page 10: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Базовая архитектура программного комплекса

Редактирование словарной базы данных

Обслуживание внешних запросов к

словарной базе данныхМорфосинтаксический

анализ текста

Онтологическое покрытие текста. Построение дерева

сегментов

Подсистема "Анализатор"

Подсистема "OntoEditor+"Проектирование

онтологии

Построение лингвистической

оболочки онтологии

Обслуживание запросов по онтологии

Выводы по онтологии

Подсистема "Интегратор"Извлечение информации

Т е к с т т

Page 11: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Прикладная АвиаОнтология

1600 понятий (4700 текстовых единиц)

Отношения- иерархические (Выше- Ниже,

Часть-Целое)- концептуальной зависимости

АСЦ1- «зависит от» АСЦ2- «главное для»

Page 12: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

АвиаОнтология

Пуск ракеты с запуск ракеты с запустить ракету с отстрел ракеты с применение ракет с применение ракетного вооружения с пуск ракеты с пустить ракету с ракетная атака с ракетный удар

Page 13: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

АвиаОнтология (пуск ракеты) ВЫШЕ ПРИМЕНЕНИЕ ОРУЖИЯ НИЖЕ ЭФФЕКТИВНЫЙ ПУСК РАКЕТЫ ЧАСТЬ ДАЛЬНОСТЬ ПУСКА РАКЕТЫ ЧАСТЬ ЗОНА ВОЗМОЖНОГО ПУСКА ЧАСТЬ МАКСИМАЛЬНО ДОПУСТИМАЯ

ПЕРЕГРУЗКА ПРИ ПУСКЕ АСЦ1 РАКЕТА АСЦ2 ВЫХОД В ЗОНУ ВОЗМОЖНОГО

ПУСКА АСЦ2 КОМАНДА “ПУСК РАЗРЕШЕН” АСЦ2 ОШИБКА ПУСКА АСЦ2 УПРАВЛЕНИЕ РАКЕТОЙ

Page 14: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Инструментальная система визуального проектирования онтологий «OntoEditor+» Проектирование онтологий в

табличной и графической формах Исследовательский

инструментарий Лингвистический инструментарий

Page 15: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Архитектура системы «OntoEditor+»Система "OntoEditor +"

Блок настройки

Реляционные таблицы АвиаОнтологии

Интерпретатор командЛи

нгв

ист

ичес

ки

й

ин

струм

ен

тар

ий

Бл

ок в

изу

ал

иза

ци

и

Блок проектирования онтологий

Page 16: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Графический образ онтологии

Page 17: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Поиск цепочки отношений

Page 18: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Вывод связных поддеревьев по отношению

Page 19: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Лингвистический инструментарий системы «OntoEditor+» задачи корпусного исследования (загрузка

корпуса; сегментация на предложения; автоматическое ведение статистики по различным объектам корпуса)

построение лингвистической оболочки онтологии

задача покрытия текста онтологическими входами

построение выводов по онтологии поддержка протоколов информационного

обмена системы "OntoEditor+" с внешними программными модулями, в том числе с внешними информационными ресурсами

Page 20: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Подсистема «Анализатор»

Графематический анализ Морфосинтаксический анализ Покрытие текста

онтологическими входами (взаимодействие с системой «OntoEditor+»)

Page 21: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Подсистема «Интегратор» Анализ и исполнение внешнего запроса

(информационная модель алгоритма) Интерпретация внешнего запроса в

терминах прикладной онтологии (взаимодействие с системой «OntoEditor+»)

Интерпретация внешнего запроса в структурных компонентах дерева сегментов (взаимодействие с системой «Анализатор»)

Контроль информационной целостности (анализ компонент внешнего запроса)

Page 22: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Использование авиаонтологии Построение допустимых цепочек

связей между заданной парой понятий; Пошаговое тестирование построенных

цепочек. Пошаговое тестирование означает, что все элементы построенной цепочки допустимы в заданной проблемной ситуации, заявлены в данном тексте или выводимы по разрешенным правилам.

Page 23: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Использование авиаонтологии

Информационный анализ выделенных из текста концептуальных структур:

1. распознавании и анализ используемых в описаниях терминов;

2. установление семантических классов параметров алгоритмов и проверка их соответствия допустимым типам

Page 24: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Пример анализа текста 1 Алгоритм анализа структуры налёта. На вход алгоритма поступает информация

о взаимном расположении самолетов противника (структура его строя). Происходит сравнение со структурой строев, активизированных в БД. По некоторой метрике выбирается структура строя налета, наиболее близкая к наблюдаемой. В соответствии с отождествляемой структурой строя в наблюдаемом строю расставляются приоритеты атаки целей.

Page 25: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Пример анализа текста 2 Имя алгоритма: алгоритм анализа структуры налёта; Задача алгоритма: анализ структуры налета; Входная информация для алгоритма: взаимное расположение самолетов

противника (структура его строя); Точка возникновения входной информации: Вопрос: Откуда поступает информация? Ответ: Информация отсутствует. Действие_1: происходит сравнение (произвести сравнение). Что сравнивается: входная информация (=построен вывод) С чем сравнивается: со структурой строев, активизированных в БД. Действие_2: Выбирается структура строя налета, наиболее близкая к

наблюдаемому расположению самолетов противника (=построен вывод). Выбирается по некоторой метрике.

Действие_3: расставляются приоритеты атаки целей в наблюдаемом строю. Расставляются в соответствии с отождествляемой структурой строя.

Выходная информация для алгоритма: 1. Структура строя налета наиболее близкая к наблюдаемому расположению

самолетов противника. 2. Приоритеты атаки целей в наблюдаемом строю. Точка приема выходной информации: Вопрос: Что является приемником информации? Ответ: Информация отсутствует.

Page 26: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Текущая задача исследования

Проектирование онтологии мета-уровня, обеспечивающую эффективную трансляцию внешних запросов и взаимодействие с прикладной онтологией по выполнению внешних запросов

Page 27: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Пример: проблемная ситуация «Целераспределение»

Наблюдаемый на борту командира звена ИП воздушный противник (самолеты-цели) анализируется с учетом генеральной задачи вылета на предмет:

назначение для каждой цели (на множестве наблюдаемых целей, среди которых выделены ударные самолеты (УС) и истребители сопровождения (ИС)) приоритета для атаки,

назначения приоритетности на множестве критериев {K1,K2…,Kk}, по которым будет оцениваться исход настоящего боя.

Page 28: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Проблемная ситуация «Целераспределение»: «белые пятна» Текстовый вход наблюдаемый воздушный противник

требует установления источника поступления информации, связанного с процессом наблюдение.

Для текстового входа генеральная задача вылета должен быть построен вывод, позволяющий установить связь данного входа с понятием информация, для того чтобы рассматривать данный вход как источник информации.

Решение задачи назначения для каждой цели приоритетов для атаки требует описания общей семантики процедуры назначения. Семантика процедуры (алгоритма) назначения (распределения) суть построение некоторых пар элементов (A,B), где A И B – заданные множества; A- множество целей, B – множество приоритетов для атаки.

Для решения задачи назначения приоритетности на множестве критериев требуется установить источник поступления информации о множестве критериев для алгоритма назначения.

Page 29: О.А Невзорова НИИММ им. Н.Г. Чеботарева,  г. Казань

Спасибо за внимание!