Text Analytics -- анализ неструктурированных данных

14
Copyright © 2011, SAS Institute Inc. All rights reserved. Анализ неструктурированных данных

description

тема новая, хитовая

Transcript of Text Analytics -- анализ неструктурированных данных

Page 1: Text Analytics -- анализ неструктурированных данных

Copyright © 2011, SAS Institute Inc. All rights reserved.

Анализ неструктурированных данных

Page 2: Text Analytics -- анализ неструктурированных данных

2

Copyright © 2011, SAS Institute Inc. All rights reserved.

CURRENT

TRENDS IN

ANALYTICS

LEVERAGE ANALYTICS TO UNLOCK

THE INFORMATION CONTAINED IN

UNSTRUCTURED DATA

Copyright © 2011, SAS Institute Inc. All rights reserved.

Page 3: Text Analytics -- анализ неструктурированных данных

Copyright © 2011, SAS Institute Inc. All rights reserved.

НЕСТРУКТУРИРОВАННАЯ ИНФОРМАЦИЯ

Структурированные

данные

Полуструктурированные

данные

Неструктурированные

данные

5%

25%

70%

Page 4: Text Analytics -- анализ неструктурированных данных

4

Copyright © 2011, SAS Institute Inc. All rights reserved.

Содержание

• Некоторые задачи текстовой аналитики • Повышение точности моделей целевого маркетинга

• Проверка информации о клиентах и повышение точности моделей Credit

Scoring

• Мониторинг брендов, продуктов, публичных лиц и других объектов в

Интернете

• Анализ жалоб и обращений

• SAS Text Analytics • Web Crawler

• SAS Enterprise Content Categorization

• SAS Sentiment Analysis

• SAS Text Miner

Page 5: Text Analytics -- анализ неструктурированных данных

5

Copyright © 2011, SAS Institute Inc. All rights reserved.

Некоторые задачи текстовой аналитики

• Повышение точности моделей целевого маркетинга

• Проверка информации о клиентах и повышение

точности моделей Credit Scoring

• Мониторинг брендов, продуктов, публичных лиц и других

объектов в Интернете

• Анализ жалоб и обращений

Page 6: Text Analytics -- анализ неструктурированных данных

6

Copyright © 2011, SAS Institute Inc. All rights reserved.

Повышение точности моделей целевого маркетинга Использование неструктурированных данных в составе предикторов

• Неструктурированные поля анкетных данных: профессия,

должность, сфера деятельности, графа «другое»

• Комментарии операторов звонковых центров

• Комментарии менеджеров по продажам

• Описание транзакций

Использование комментариев операторов звонковых центров

может повышать точность моделей оттока на 30%

Page 7: Text Analytics -- анализ неструктурированных данных

7

Copyright © 2011, SAS Institute Inc. All rights reserved.

Повышение точности моделей целевого маркетинга Обогащение базы данных по клиентам информацией из Интернет: например, сбор данных по SMB

• Автоматическая загрузка данных о компании из Интернет • Заданные сайты

• Поиск по ключевым словам, например, по названию компании, телефону, адресу…

• Обработка данных • Проверка существования компании

• Выявление направлений работы компании

• Выявление позитива/негатива к компании и ее продуктам

• Использование полученной информации в составе предикторов моделей

Page 8: Text Analytics -- анализ неструктурированных данных

8

Copyright © 2011, SAS Institute Inc. All rights reserved.

• Телеком:

• Matrix S.P.A., Italy

• Bell Canada

• Банки:

• Bancomer, Mexico

Повышение точности моделей целевого маркетинга Примеры использования

Page 9: Text Analytics -- анализ неструктурированных данных

9

Copyright © 2011, SAS Institute Inc. All rights reserved.

• Мониторинг динамики упоминаемости • Выделение сообщений по интересующим темам

• Выделение фактов • Мероприятия

• Люди

• Люди, с которыми встречался

• Места

• Даты

• …

• Анализ мнений – выделение позитива/негатива • В целом, к заданным объектам, к характеристикам объектов

• Сравнение мнений о компании и о ее конкурентах

• Мониторинг динамики позитива/негатива

Мониторинг брендов, продуктов, конкурентов, публичных лиц и других объектов в Интернет

Page 10: Text Analytics -- анализ неструктурированных данных

10

Copyright © 2011, SAS Institute Inc. All rights reserved.

• Банки: • Bancomer, Mexico

• ABSA, UK

• Телеком: • Matrix S.P.A, Italy

• Bell Canada

• Grameenphone Limited

• Государственные учреждения: • Karolinska,

• TNO,

• European commission, Anti-fraud office, …

Мониторинг брендов, продуктов, публичных лиц и других объектов в Интернет Примеры использования

Page 11: Text Analytics -- анализ неструктурированных данных

11

Copyright © 2011, SAS Institute Inc. All rights reserved.

• Письма с жалобами, предложениями, гарантийные обращения

• Данные с форумов в Интернет

• Записи операторов call-центров

• Анализ • Выявление ключевых тем жалоб

• Выявление предметов жалоб, обстоятельств инцидента/ поломки

• Анализ взаимосвязей между предметами жалоб

• Автоматизация • Настройка разбиения новых жалоб на категории

• Автоматическое распределение жалоб по подразделениям

• Мониторинг динамики числа жалоб по категориям

Анализ жалоб и обращений

Page 12: Text Analytics -- анализ неструктурированных данных

12

Copyright © 2011, SAS Institute Inc. All rights reserved.

• Анализ причин жалоб и их автоматическая маршрутизация • Банки: ABSA bank, UK

• Телеком: Bell Canada,

Grameenphone Limited

• Гос. учреждения: HONG KONG EFFICIENCY UNIT,

Government Accountability Office, US

• Выявление недостатков продуктов и услуг на ранних стадиях: • Honda America

• Hewlett-Packard Co.

Анализ жалоб и обращений Примеры использования

Page 13: Text Analytics -- анализ неструктурированных данных

13

Copyright © 2011, SAS Institute Inc. All rights reserved.

Примеры успешных внедрений

The World Bank

Page 14: Text Analytics -- анализ неструктурированных данных

14

Copyright © 2011, SAS Institute Inc. All rights reserved.

Copyright © 2011, SAS Institute Inc. All rights reserved.