Pustovit presentation
Click here to load reader
-
Upload
michael-pustovit -
Category
Technology
-
view
214 -
download
0
Transcript of Pustovit presentation
АРХИТЕКТУРА ИНФОРМАЦИОННОЙ
СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ
ДАННЫХ
студент IV курса
НТУУ «КПИ» ФИВТ ВТ
Пустовит Михаил
Киев-20111
ЦЕЛЬ И АКТУАЛЬНОСТЬ РАБОТЫ
Цель работы
Создание масштабируемой и легко
расширяемой системы статистической
обработки данных
Актуальность работы
Требуется при использовании методов
computational science.
Интеграция уже существующих подсистем
обработки.
2
ТРЕБОВАНИЯ К СИСТЕМЕ
Пользовательские требования
Легкость использования
Широкая доступность
Минимальные требования к пользовательскому оборудованию
Системные требования
Масштабируемость (вычислительная)
Расширяемость (функциональная)
Внутренние механизмы обработки должны быть скрыты от пользователя
3
СУЩЕСТВУЮЩИЕ РЕШЕНИЯ
Google Public Data Explorer
Gapminder
Нет функциональной расширяемости
Узкоспециализированные (только
визуализация)
Statsoft STATISTICA
Проприетарный продукт
Платформо-зависим
4
ВЫБОР АРХИТЕКТУРЫ
Клиент-серверная архитектура
Облачные вычисления
Software-as-a-Service (SaaS) Удобный и понятный интерфейс
Доступность через браузер
Service-oriented architecture (SOA)
Разрозненные, слабосвязанные службы решающие строго очерченный круг задач Масштабируемость (службы на разных компьютерах)
Расширяемость (легкое добавление новых служб)
Веб-службы
SOAP Web-services Протокол передачи: SOAP
Надежная и защищенная передача
RESTful web-services Протокол передачи: HTTP
5
ОБЩАЯ СТРУКТУРА СИСТЕМЫ
6
ВХОДНОЙ СКРИПТ
Входной скрипт – это последовательность команд вида:
resID = [подсистема].[команда] [inID]
На месте входных данных могут быть константы
Идентификаторы могут быть представлены:
В явном виде
Переменной
При повторном использовании переменной, связанные
данные уничтожаются
Скрипт проходит стадии:Пользовательский вид → XML пользовательского вида →
XML с идентификаторами
7
ПОДСИСТЕМЫ
У каждой системы есть XML-описатель, содержащий: Название системы
Список команд, состоящий из описатель команд:
Название команды
XSD (XML Schema Definition) для валидации входных параметров входных параметров
Интерфейсы всех подсистем единообразны: Функция запроса описателя (для регистрации подсистемы)
Функция выполнения команды
принимающая: Название команды
Идентификатор входных данных
возвращающая: Идентификатор результата
8
ПОДКЛЮЧЕНИЕ ПОДСИСТЕМ
9
Пользователь Диспетчер SubService
Запрос регистрации
Запрос метаданных
Получение метаданных
Регистрация
Подтверждение регистрации
ПОДСИСТЕМА УПРАВЛЕНИЯ ДАННЫМИ
Диспетчер хранит перечень всех доступных хранилищ и
данных
Диспетчер хранит список актуальных данных в таблице:
[URI данных] : [URL хранилища]
Каждая служба имеет локальный диспетчер
данных, который:
Размещает данные в локальном хранилище
Размещает данные в удаленном хранилище, через запрос к
Диспетчеру
До стадии фактической обработки данных, система
оперирует исключительно описателями
10
ВНУТРЕННИЕ ТИПЫ ДАННЫХ
Все данные передаются в виде XML-сообщений
Валидация всех типов данных может происходить при помощи
XSD-схем (XML Schema Definition)
Одиночные поля передаются в виде полей XML-
документа
Массивы и таблицы передаются в виде описателя и
двоичного (Base64) представления. Описатель
содержит:
Размерность передаваемого массива/таблицы
Тип ячеек массива/таблицы
11