НИР "Анализ информационной деятельности...

28
НИР «Анализ информационной деятельности территориальных органов МЧС России» п. 4.2-70/Б плана НТД МЧС России на 2011–2013 гг. Артюхин В. В., Чяснавичюс Ю. К., Олтян И. Ю.

description

Презентация к докладу 30.01.2014 г. по научно-исследовательской работе "Анализ информационной деятельности территориальных органов МЧС России" на научно-техническом совете Всероссийского научно-исследовательского института по проблемам гражданской обороны и чрезвычайных ситуаций МЧС России.

Transcript of НИР "Анализ информационной деятельности...

Page 1: НИР "Анализ информационной деятельности территориальных органов МЧС России"

НИР «Анализ информационной

деятельности территориальных органов

МЧС России»п. 4.2-70/Б плана НТД МЧС России на 2011–2013

гг.

Артюхин В. В., Чяснавичюс Ю. К., Олтян И. Ю.

Page 2: НИР "Анализ информационной деятельности территориальных органов МЧС России"

Основные сведения о работе Заказывающее подразделение: Управление

информации МЧС России.

Цель работы: повышение оперативности, эффективности и качества информационной деятельности территориальных органов МЧС России за счет использования передовых информационных технологий, включая интернет, быстрое формирование на их основе комплексной аналитической информации, необходимой для выработки и принятия управленческих решений.2

Page 3: НИР "Анализ информационной деятельности территориальных органов МЧС России"

Основные сведения о работе (2) Задачи работы:

провести анализ особенностей организации информационной деятельности территориальных органов МЧС России;

провести анализ перспективных информационных технологий, применяемых для оперативного информирования населения и быстрого формирования на их основе комплексной аналитической информации;

провести анализ средств технического обеспечения информационной деятельности территориальных органов МЧС России;

разработать Методические рекомендации по повышению оперативности, эффективности и качества информационной деятельности территориальных органов МЧС России за счет использования передовых информационных технологий, включая интернет.

3

Page 4: НИР "Анализ информационной деятельности территориальных органов МЧС России"

4

Средства ведения информационной деятельности

Веб-сайты

Социальные сервисы

Печатные издания

Телевидение и радио

Терминальные комплексы

Page 5: НИР "Анализ информационной деятельности территориальных органов МЧС России"

5

Как оценивать эффективность?Веб-

сайтыСоциальные сервисы по количеству «друзей»;

по количеству посетителей / подписчиков на рассылки;

по количеству публикаций и их регулярности;

Насколько информационная деятельность соответствует целям и задачам организации?

Какую цель преследует каждая отдельная публикация, и какую задачу она выполняет?

Насколько содержание публикаций отвечает интересам пользователей / граждан?

Интернет предполагает двухстороннюю связь, насколько широко используются ее возможности?

Page 6: НИР "Анализ информационной деятельности территориальных органов МЧС России"

6

Концептуальный каркас исследования Концептуальный каркас объясняет в графической

или описательной форме главные аспекты исследования – ключевые факторы, переменные или конструкции – и предполагаемые связи между ними.

Концептуальный каркас – это актуальная на данный момент «карта исследуемой местности», он позволяет очертить границы исследования, заключая в себе не только указания на то, что будет изучаться, но и на то, что изучаться не будет. В данном случае, каркас необходимо было построить из достаточно общих указаний в техническом задании и других документах.

Page 7: НИР "Анализ информационной деятельности территориальных органов МЧС России"

7

Первая версия концептуального каркаса

Page 8: НИР "Анализ информационной деятельности территориальных органов МЧС России"

8

Схемы кодирования «Коды» – это метки,

придающие символическое значение некоторым фрагментам данных (поскольку речь идет о текстовых данных, в качестве таких фрагментов могут выступать предложения, части предложений, абзацы – фрагменты не обязательно должны иметь одинаковый размер). Коды применяются для категоризации и извлечения из текстов похожих фрагментов данных. В чем именно фрагменты должны быть «похожи», зависит от типа и структуры выбранной схемы кодирования (или кодировки) и, естественно, интерпретации цели исследования / анализа и самих данных кодирующим исследователем.

Название

подхода к

кодирован

ию

Смысл присваиваемых кодов Примеры кодов

Описатель

ное

Код, присваиваемый фрагменту,

представляет собой короткое

обобщенное описание в виде слова

или фразы основной темы этого

фрагмента (такой подход мы

используем в нашем исследовании).

БИЗНЕС

САЙТ

ПРЕИМУЩЕСТВО

“In vivo” “In vivo” (лат. буквально «в (на)

живом»). В качестве кодов

используются слова или короткие

фразы непосредственно из текста

(например, интервью).

«ИМ ПЛЕВАТЬ»

«НИКТО НИЧЕГО НЕ

ПОНИМАЕТ»

«ВСЕ НЕПЛОХО»

Процессно

е

Кодами являются глаголы,

деепричастия или короткие фразы с

глаголами, деепричастиями.

РАСПРОСТРАНЯЯ СЛУХИ

ОБЕСПЕЧИВАЯ

ЦЕЛОСТНОСТЬ

Эмоцио-

нальное

Эмоции интервьюируемых. ГРУСТЬ

ИСПЫТАЛ РАДОСТЬ

ЗАВИСТЛИВЫЕ

Протоколь

ное

Кодировка формируется заранее и

накладывается на данные (этот

подход мы также используем).

ЦЕЛИ: ВЕЩАНИЕ

ЦЕЛИ: ОПОВЕЩЕНИЕ

ПРЕПЯТСТВИЯ:

КОНСЕРВАТИЗМ

Page 9: НИР "Анализ информационной деятельности территориальных органов МЧС России"

9

Выбор документов для кодированияРазновидность документа Преимущества использования Недостатки использования

руководящего или характера –

что должно быть сделано или

следовало бы сделать

(приказы, концепции,

технические задания и т. д.).

дают четкое представление о

легитимных целях;

хорошая (единая, понятная) структура;

достаточно «формальный» язык;

возможность ссылаться на документы в

общении с заказчиком или

заинтересованными лицами;

 

часто отсутствует информация о

технологиях достижения целей и об

оценке эффективности деятельности;

идеалистическое представление (есть

цель, но не существует инструментов

или ресурсов);

инструментального характера

– как можно или следует что-

либо делать (методические

рекомендации, отчеты по НИР,

научные статьи, популярная

литература и пр.).

могут содержать четкое представление

об инструментах, причем с привязкой к

целям;

могут содержать обоснование выбора

целей и инструментов;

может присутствовать новизна;

могут присутствовать сведения о

численной оценке эффективности

деятельности;

идеалистическое представление;

необязательная легитимность;

не учитывается специфика

организации;

значительное дублирование

материалов, искажающее картину;

частая невозможность ретроспективной

оценки того, насколько, например,

результаты НИР, были верны,

обоснованы и эффективны при

внедрении;

отчетные – что сделано

организацией или ее

отдельными подразделениями

(например, территориальными

органами в части

информационной

деятельности).

информация подразделений о работе по

конкретным целям с применением

конкретных инструментов;

могут присутствовать численные

показатели;

отчетные документы позволяют

наблюдать за процессами в динамике;

информация может быть неполной,

искаженной, характеризоваться

смещенной оценкой;

изучение материалов подмножества

или даже всех подразделений

организации может не давать полной

картины.

Page 10: НИР "Анализ информационной деятельности территориальных органов МЧС России"

10

Кодирование При выборе кодов мы опирались, в первую очередь: на цели и задачи МЧС; на существующие способы использования Интернета; на проблемы, связанные с использованием Интернета,

отмеченные в документах; …

Page 11: НИР "Анализ информационной деятельности территориальных органов МЧС России"

11

Полученная кодировка

Page 12: НИР "Анализ информационной деятельности территориальных органов МЧС России"

12

Рейтинг задач и форм использования Интернета

Page 13: НИР "Анализ информационной деятельности территориальных органов МЧС России"

13

Коды и связи: проблемные точки

Достижимость по прямым ссылкам текущих и потенциальных форм использования

Интернета из задач (согласно анализу документов) (слева – задачи, справа – формы

использования).

Достижимость по прямым ссылкам задач из текущих и потенциальных форм

использования Интернета (согласно анализу документов) (слева – формы использования,

справа – задачи).

Page 14: НИР "Анализ информационной деятельности территориальных органов МЧС России"

14

Коды и связи: проблемные точки (2)Алгоритм Флойда-Воршелла:

# edges_mat – матрица смежности графа до начала работы алгоритма и# матрица достижимости – после завершения его работыfor k in range(1,n+1): for i in range(1,n+1): for j in range (1,n+1): edges_mat[i,j] = edges_mat[i,j] or \ (edges_mat[i,k] and edges_mat[k,j])

Неэффективный алгоритм, имеющий сложность , однако он не накладывает требований по планарности или ацикличности графа (в отличие от более эффективных алгоритмов).

Page 15: НИР "Анализ информационной деятельности территориальных органов МЧС России"

15

Коды и связи: проблемные точки (3)

Достижимость по прямым и опосредованным ссылкам текущих и потенциальных форм

использования Интернета из задач (согласно анализу документов) (слева – задачи, справа –

формы использования).

Достижимость по прямым и опосредованным ссылкам задач из текущих и потенциальных

форм использования Интернета (согласно анализу документов) (слева – формы

использования, справа – задачи).

Page 16: НИР "Анализ информационной деятельности территориальных органов МЧС России"

16

Коды и связи: проблемные точки (3) Полученная информация может быть использована:

при общении с представителями организации; для выявления целей, обозначенных в проанализированных

документах, но не реализуемых ни в одной форме использования;

для выявления форм использования, которые используются с непонятными (согласно документам) целями;

для выявления форм использования Интернета, востребованных или развитых в системе интернет-представительств организации недостаточно (цели, которые технически могут достигаться с их использованием с ними не связаны, связанные цели вообще отсутствуют и т. д.);

впоследствии для сопоставления формам использования Интернета метрик эффективности, являющихся одновременно и метриками эффективности работ по достижению соответствующих целей.

Page 17: НИР "Анализ информационной деятельности территориальных органов МЧС России"

17

Новый концептуальный каркас

Абстрактн

ые

категории

/ темы

(отражаю

щие цели

и задачи)

Технический уровень (Т) Уровень контента (К)Уровень управленческих процессов

(У)

Технолог

ии, для

которых

характер

ен

вопрос

Вопросы

по

оценке

эффект.

(О)

Технолог

ии, для

которых

характер

ен вопрос

Вопросы

по

повыш.

эффект.

(П)

Технологи

и, для

которых

характере

н вопрос

Вопрос

ы по

оценке

эффект.

(О)

Технологии,

для которых

характерен

вопрос

Вопросы

по

повыш.

эффект.

(П)

Технолог

ии, для

которых

характер

ен

вопрос

Вопросы

по

оценке

эффект.

(О)

Технол

огии,

для

котор

ых

характ

ерен

вопросВопрос

ы по

повыш

.

эффек

т. (П)

С

о

ц

.

с

е

т

и

(

С

)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

С

о

ц

.

с

е

т

и

(

С

)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

С

о

ц

.

с

е

т

и

(

С

)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

Со

ц.

се

ти

(С)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

С

о

ц

.

с

е

т

и

(

С

)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

С

о

ц

.

с

е

т

и

(

С

)

В

е

б

-

с

а

й

т

ы

(

В

)

E

-

m

a

i

l

(

Э

)

Вещание /

пропаганд

а

 1                                                

Повышени

е статуса

доверия к

МЧС

 2                                                

Мониторин

г

информац

ии

 3                                                

…                                                  

Page 18: НИР "Анализ информационной деятельности территориальных органов МЧС России"

18

Новый концептуальный каркас (2)

Page 19: НИР "Анализ информационной деятельности территориальных органов МЧС России"

19

Новый концептуальный каркас (3) Графическая форма предпочтительна:

для «обзора территории»; принятия решений в части постановки научных задач; принятия решений в части ликвидации «белых пятен» в

методической и/или нормативной базе; планирования необходимых ресурсов.

Page 20: НИР "Анализ информационной деятельности территориальных органов МЧС России"

20

Открытые данные Для сбора данных из социальных сервисов было разработано и

реализовано порядка 20 программ на языке Python 2.7 (включая различные версии программ под Windows и Linux).

Сбор данных производился в течение 2-х месяцев круглосуточно, данные снимались с интервалами от 3 до 8 часов (в зависимости от их характера: базовая статистика по узлам МЧС в социальных сетях снималась каждые 8 часов, а информация о трендах – наиболее часто «проскакивающих» в сервисах словах – каждые 3 часа).

В общей сложности было собрано, сохранено и подверглось обработке более 10 Гб чисто текстовых данных (более 10 000 000 000 символов).

Для хранения и анализа данных была создана нереляционная база данных типа NoSQL, поддерживающая параллельную обработку данных во множестве потоков согласно парадигме MapReduce.

Анализу подверглось более 300 учетных записей, принадлежащих территориальным органам МЧС России в социальных сетях, а также 91 сайт.

Page 21: НИР "Анализ информационной деятельности территориальных органов МЧС России"

21

Результаты (1) Применение методов математической

статистики позволило выявить тренды в развитии социальных сетей МЧС России.

Была построена двойная частично логарифмическая регрессионная модель зависимости числа подписчиков в социальных сервисах от других параметров – числа публикаций, корреспондентов и т. д.

Page 22: НИР "Анализ информационной деятельности территориальных органов МЧС России"

22

Результаты (2) Применение базовых методов обработки естественного языка на основе

частотных словарей позволило выявить наиболее частые слова, встречающиеся в публикациях МЧС России, а также слова в этих публикациях, интересующие пользователей в наибольшей степени.

Частота слов в публикациях МЧСЧастота слов в публикациях МЧС,

перепубликованных пользователями

Page 23: НИР "Анализ информационной деятельности территориальных органов МЧС России"

23

Результаты (3) Усечение словаря из перепубликованных сообщений, удалением из него

слов, которые также наиболее часто встречаются во всех публикациях МЧС, позволяет понять, что пользователи считают наиболее полезным, но чему территориальные органы МЧС, возможно, не уделяют достаточно внимания.

Усеченный словарь из републикованных сообщений

Мы можем составить полную фразу

Page 24: НИР "Анализ информационной деятельности территориальных органов МЧС России"

24

Результаты (4) Предложено конкретизировать и уточнить значение ряда терминов,

применяемых в документах: Блог – регулярный по времени, предметной области, авторству и связи с

соответствующей организацией поток мультимедийного контента и библиотека (архив) этого контента, доступ к которым является свободным и всеобщим и предоставляется посредством интернет-технологий.

Социальная сеть – это совокупность полных и частичных контактных и других данных, связанных с людьми, организациями и другими сущностями, а также, возможно, информация о связях между ними, которые находятся в распоряжении субъекта и могут быть тем или иным образом отражены (зафиксированы) в рамках интернет-технологии (например, сайта) и использованы в его (субъекта) интересах.

Сервис или веб-служба, веб-сервис (англ. “web service”) — идентифицируемая веб-адресом программная система со стандартизированными интерфейсами. Как правило, имеет четкое и ограниченное назначение, может использоваться как непосредственно из браузеров, так и через открытые программные интерфейсы другими приложениями.

Блог-площадка – веб-сервис, позволяющий размещать блоги и управлять ими. Социальный сервис или онлайн социальный сервис – веб-сервис,

предоставляющий различные возможности по управлению социальными сетями и одновременно выступающий в качестве блог-площадки.

Page 25: НИР "Анализ информационной деятельности территориальных органов МЧС России"

25

Результаты (5) Анализ сайтов территориальных

органов МЧС России позволил сформулировать рекомендации по проектированию взаимодействия, корректировке информационного наполнения, внешнего вида, организации обратной связи и связи с социальными сервисами.

Page 26: НИР "Анализ информационной деятельности территориальных органов МЧС России"

26

Результаты (6) и направления дальнейшего сотрудничества

Методические рекомендации по повышению оперативности, эффективности и качества информационной деятельности территориальных органов МЧС России за счет использования передовых информационных технологий, включая интернет, быстрого формирования на их основе комплексной аналитической информации, необходимой для выработки и принятия управленческих решений (далее - Методические рекомендации), содержащие: предложения по созданию автоматизированной системы управления

информационной деятельностью в территориальных органах МЧС России; рекомендации по использованию перспективных технологий поддержки

принятия решений при организации информационной деятельности территориальных органов МЧС России;

рекомендации по разработке карт управленческих процессов при организации информационной деятельности в территориальных органах МЧС России;

предложения по постановке опытно-конструкторской работы по разработке / совершенствованию автоматизированной системы управления информационной деятельностью в территориальных органах МЧС России.

Направления дальнейшего сотрудничества с Управлением информации включают: определение требований и разработку технического задания для создания

автоматизированной системы управления информационной деятельностью в территориальных органах МЧС России;

применение разрабатываемой методологии для анализа информационной деятельности вне Интернета (например, с применением ОКСИОН и пр.);

разработку методики «корреспондент-анализа»: как наиболее эффективно расширять социальные сети в социальных сервисах и т. д.

Page 27: НИР "Анализ информационной деятельности территориальных органов МЧС России"

27

Программное обеспечение В ходе научно-исследовательской работы было применено 14

свободных программных продуктов: Ununtu – операционная система; Trello – онлайн программа управления проектом; Dia и Gliffy – для построения диаграмм (аналоги Visio); Gephi – программа для анализа графов; Python – интерпретатор и язык программирования; R – среда и язык обработки данных; R Studio – среда разработки для R; QDA Miner 4 Lite – программа поддержки анализа качественных

данных; GraphViz – библиотека программной визуализации графов для Ubuntu; ArcGIS Online – онлайн-ГИС; Tableau Public – для построения диаграмм по массивам данных; Apache CouchDB – нереляционная NoSQL система управления базами

данных; Wordle – онлайн программа для построения облаков тегов.

Page 28: НИР "Анализ информационной деятельности территориальных органов МЧС России"

28

Спасибо за внимание!