Откривање законитости у подацима (Data...
Transcript of Откривање законитости у подацима (Data...
![Page 1: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/1.jpg)
Откривање законитости у подацима (Data Mining)
Факултет организационих наука
Центар за пословно одлучивање
![Page 2: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/2.jpg)
П4: DM Задаци
• Пословни проблеми
• Случајеви (Моб. телефонија, ГСС, DELL)
• Задаци дејта мајнинга
![Page 3: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/3.jpg)
Циљеви предавања
• Препознавање стандардних проблема пословања
• Препознавање задатака ДМ
• Увод у процес откривања знања
![Page 4: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/4.jpg)
ОЗП дефиниција
Дејта мајнинг (срп. Откривање законитости у подацима) је процес oтркивања
законитости у великој количини података користећи математичке, статистичке и
оптимизационе методе и технике.
![Page 5: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/5.jpg)
Случај 1: Моб. телефонија
Компанија Т је најстарија компанија моб. телефоније у САД. Има највећи број
корисника и тржишно учешће од око 70%. На тржиште су почели да улазе и други
моб. оператери, и компанија је почела да губи свој тржишни удео. Све више
корисника узима услуге других оператера. Изгубљено је 5% корисника и претпоставља
се да ће тренд да се настави.
![Page 6: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/6.jpg)
Случај 1: Моб. телефонија
Компанија Т не жели да губи више корисника и спремна је да побољша квалитет своје
услуге и да се суочи са новонасталим проблемима. Т води податке о својим
корисницима и то:
1. Податке о рачунима (задужења, плаћања, врсте услуга)
![Page 7: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/7.jpg)
Случај 1: Моб. телефонија
1. Како Т може да унапреди своје пословање?
2. Да ли Т познаје свог клијента?
![Page 8: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/8.jpg)
Пример уз случај 1: Подаци о кориснику
• Држава: категорички, 50 САД држава и Колумбија дистрикт
• Дужина рачуна: целобројни, колико је дуго рачун активан
• Код области: категорички
• Тел. број: део кључа за рачун
• Секретарица: биномни, да или не
• Укупна минута на дан: континуални, потрошени минути
• Укупан број позива: целобројни
• Укупно дневно задужење: континуални, базиран на претходна два
• Укупнио интернационалних минута: континуални,потрошени минути
• Укупан број интернационалних позива: целобројни
• Укупно интернационални задужење: континуални
• Број позива ка корисничком сервису: целовбројни тип
![Page 9: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/9.jpg)
Дистрибуција атрибута
![Page 10: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/10.jpg)
Дистрибуција атрибута (пример)
![Page 11: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/11.jpg)
Дистрибуција атрибута (пример)
![Page 12: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/12.jpg)
Дистрибуција атрибута
![Page 13: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/13.jpg)
Дистрибуција атрибута
![Page 14: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/14.jpg)
Дистрибуција атрибута
![Page 15: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/15.jpg)
Дистрибуција атрибута
![Page 16: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/16.jpg)
Подаци
![Page 17: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/17.jpg)
Корелација података
![Page 18: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/18.jpg)
Статистика
![Page 19: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/19.jpg)
Статистика
![Page 20: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/20.jpg)
Случај 2: Горска служба спасавања
Горска служба спасавања се бави спасавањем унесрећених лица на тешко приступачним теренима. Главна делатност ГСС-а током
зиме су ски патроле на Копаонику и Старој планини, а од 2008. године и на Златибору и Дивчибарима. ГСС прикупља податке о
повредама и уноси их у своју базу и на основу ње сваки дан предаје извештај
скијалишту о повредама.
![Page 21: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/21.jpg)
Случај 2: Повредна листа
1. Подаци о спашеном (лични подаци)
2. Подаци о повреди (тип, локација, време, врем. услови, врста транспорта, врста помоћи, опрема)
3. Подаци о спациоцу (лични, службени)
![Page 22: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/22.jpg)
Случај 2: ГСС
ГСС има жељу да унапреди скијашки спорт, у смислу, смањивања броја повреда, јер
сматра да има искуства и податке који им могу помоћи да то учине. С обзиром да је све више људи заинтересовано за скијање
и сноуборд и пошто је све већи број планина потребно покрити, ГСС жели да
смањи број повреда.
![Page 23: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/23.jpg)
Случај 2: Питања
1. Које акције ГСС треба да предузме да би унапредио скијашки спорт?
2. Да ли му подаци о повредама могу помоћи при томе?
3. Како се може помоћи скијашима у превенцији повреда? Да ли је ово
узалудан задатак?
![Page 24: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/24.jpg)
Пословне примене [TWM: Data and Text Mining]
1. Лојалност бренду и понашање купаца
2. Компетитивна предност
3. Моделовање одлучивања потрошача
4. Кредитна способност и откривање превара
5. Управљање односима са потрошачима
6. Директни и маркетинг на основу БП
7. Анализа потршачке корпе
![Page 25: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/25.jpg)
Пословне примене
8. Моделовање одзива тржишта и предвиђање продаје
9. Сегментација тржишта
10. Политика цена
11. Позиционирање производа
12. Управљање информацијама
![Page 26: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/26.jpg)
DM задаци
1. Редукција,
2. Процена (Регресија),
3. Класификација,
4. Кластеровање,
5. Предвиђање, и
6. Откривање асоцијативних правила
(АКО-ТАДА).
![Page 27: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/27.jpg)
Редукција
1. Редукција атрибута
1. Шта се дешава ако се у модел не укључи одређени атрибут?
2. Шта се дешава уколико се у модел укључи битан атрибут?
2. Редукција случајева
![Page 28: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/28.jpg)
Процена (Регресија)
1. Позвао сам 50 људи на прославу, колико пића би требао да набавим?
2. Ресторан припрема јела, колико од сваког јела треба да буде унапред припремљено?
![Page 29: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/29.jpg)
Класификација
1. На који начин банка одлучује да даје кредит?
2. На који начин се на основу крвне слике одређује да ли је неко болестан или није?
![Page 30: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/30.jpg)
Кластеровање
1. Који сегменти потрошача постоје?
2. Које групе студената постоје?
3. Како се групишу компаније у једној привреди?
![Page 31: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/31.jpg)
Предвиђање
1. Која ће бити температура сутра?
2. Како ће се кретати цене акција за десет дана?
3. Ко ће да победи на светском првенству у фудбалу?
![Page 32: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/32.jpg)
Асоцијативна правила
1. Ако купац купује Зајечарско пиво, тада ће купити и Домаћински чипс.
2. Ако запослени шаље више од 5 мејлова на сат не стиже да испуни своје радне задатке.
![Page 33: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/33.jpg)
Примери Бостон Селтикси би желели да процене колико ће поена наредни противник да постигне против њих. Војни обавештајац жели да сазна о односу Чијата и Сунита у одређеном стратешком подручју. НОРАД одбрамбени рачунар треба да одлучи тренутно да ли је трептај на радару јато гусака или нуклеарни пројектил.
![Page 34: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/34.jpg)
Примери
Политичар тражи најбољу групу да га подржи у одређеном округу донацијама.
Обевештајац жели да утврди да ли одређена секвенца (редослед) потеза на финансијском тржишту представља претњу терористичког напада.
Вол стрит аналитичар је замољен да анализира очекиване промене у цени акцији за скуп компанија са сличним рациом цена/принос.
![Page 35: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/35.jpg)
DM задаци и алгоритми
1. DM задаци стварају потребу за DM. Задаци представљају део свакодневног одлучивања ДО.
2. DM алгоритми решавају DM задатке. Они служе за откривање патерна (законитости).
![Page 36: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци](https://reader033.fdocuments.net/reader033/viewer/2022050315/5f77ebdc1c6e2271863a0fe0/html5/thumbnails/36.jpg)
Следећи пут
• ОЗП алгоритми кластеровања и асоцијације