Pustovit presentation

12

Click here to load reader

Transcript of Pustovit presentation

Page 1: Pustovit presentation

АРХИТЕКТУРА ИНФОРМАЦИОННОЙ

СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ

ДАННЫХ

студент IV курса

НТУУ «КПИ» ФИВТ ВТ

Пустовит Михаил

Киев-20111

Page 2: Pustovit presentation

ЦЕЛЬ И АКТУАЛЬНОСТЬ РАБОТЫ

Цель работы

Создание масштабируемой и легко

расширяемой системы статистической

обработки данных

Актуальность работы

Требуется при использовании методов

computational science.

Интеграция уже существующих подсистем

обработки.

2

Page 3: Pustovit presentation

ТРЕБОВАНИЯ К СИСТЕМЕ

Пользовательские требования

Легкость использования

Широкая доступность

Минимальные требования к пользовательскому оборудованию

Системные требования

Масштабируемость (вычислительная)

Расширяемость (функциональная)

Внутренние механизмы обработки должны быть скрыты от пользователя

3

Page 4: Pustovit presentation

СУЩЕСТВУЮЩИЕ РЕШЕНИЯ

Google Public Data Explorer

Gapminder

Нет функциональной расширяемости

Узкоспециализированные (только

визуализация)

Statsoft STATISTICA

Проприетарный продукт

Платформо-зависим

4

Page 5: Pustovit presentation

ВЫБОР АРХИТЕКТУРЫ

Клиент-серверная архитектура

Облачные вычисления

Software-as-a-Service (SaaS) Удобный и понятный интерфейс

Доступность через браузер

Service-oriented architecture (SOA)

Разрозненные, слабосвязанные службы решающие строго очерченный круг задач Масштабируемость (службы на разных компьютерах)

Расширяемость (легкое добавление новых служб)

Веб-службы

SOAP Web-services Протокол передачи: SOAP

Надежная и защищенная передача

RESTful web-services Протокол передачи: HTTP

5

Page 6: Pustovit presentation

ОБЩАЯ СТРУКТУРА СИСТЕМЫ

6

Page 7: Pustovit presentation

ВХОДНОЙ СКРИПТ

Входной скрипт – это последовательность команд вида:

resID = [подсистема].[команда] [inID]

На месте входных данных могут быть константы

Идентификаторы могут быть представлены:

В явном виде

Переменной

При повторном использовании переменной, связанные

данные уничтожаются

Скрипт проходит стадии:Пользовательский вид → XML пользовательского вида →

XML с идентификаторами

7

Page 8: Pustovit presentation

ПОДСИСТЕМЫ

У каждой системы есть XML-описатель, содержащий: Название системы

Список команд, состоящий из описатель команд:

Название команды

XSD (XML Schema Definition) для валидации входных параметров входных параметров

Интерфейсы всех подсистем единообразны: Функция запроса описателя (для регистрации подсистемы)

Функция выполнения команды

принимающая: Название команды

Идентификатор входных данных

возвращающая: Идентификатор результата

8

Page 9: Pustovit presentation

ПОДКЛЮЧЕНИЕ ПОДСИСТЕМ

9

Пользователь Диспетчер SubService

Запрос регистрации

Запрос метаданных

Получение метаданных

Регистрация

Подтверждение регистрации

Page 10: Pustovit presentation

ПОДСИСТЕМА УПРАВЛЕНИЯ ДАННЫМИ

Диспетчер хранит перечень всех доступных хранилищ и

данных

Диспетчер хранит список актуальных данных в таблице:

[URI данных] : [URL хранилища]

Каждая служба имеет локальный диспетчер

данных, который:

Размещает данные в локальном хранилище

Размещает данные в удаленном хранилище, через запрос к

Диспетчеру

До стадии фактической обработки данных, система

оперирует исключительно описателями

10

Page 11: Pustovit presentation

ВНУТРЕННИЕ ТИПЫ ДАННЫХ

Все данные передаются в виде XML-сообщений

Валидация всех типов данных может происходить при помощи

XSD-схем (XML Schema Definition)

Одиночные поля передаются в виде полей XML-

документа

Массивы и таблицы передаются в виде описателя и

двоичного (Base64) представления. Описатель

содержит:

Размерность передаваемого массива/таблицы

Тип ячеек массива/таблицы

11

Page 12: Pustovit presentation

ВОПРОСЫ

Пустовит Михаил [email protected]

12