dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf ·...

170

Transcript of dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf ·...

Page 1: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wprowadzenie do zbiorów przybli»onych

dr Agnieszka Nowak-Brzezi«ska

Instytut Informatyki, Uniwersytet �l¡ski, ul. B¦dzinska 39, Sosnowiec, PolskaTel (32) 2 918 381, Fax (32) 2 918 283

Wykªad II i III

Page 2: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wst¦p

• Teoria zbiorów przybli»onych zostaªa sformuªowana przez ZdzisªawaPawlaka w 1982 roku.

• Jest to matematyczne narz¦dzie pozwalaj¡ce wnioskowa¢ w warunkachniepewno±ci o nieostrych poj¦ciach. W najwi¦kszym skrócie jest to nowepodej±cie do problemów nieostrych poj¦¢.

• Jest ona wykorzystywana jako narz¦dzie do syntezy zaawansowanych iefektywnych metod analizy oraz do redukcji zbiorów danych. Znalazªa onazastosowanie m.in. w eksploracji danych i odkrywaniu wiedzy, zªo»onychzadaniach klasy�kacji oraz w komputerowych systemach wspomaganiadecyzji.

• Metodologia zbiorów przybli»onych zyskaªa sobie du»¡ popularno±¢. Jestona przedmiotem bada« wielu osób na caªym ±wiecie. Po±wi¦cono jejprzeszªo 2000 publikacji, w tym kilkana±cie ksi¡»ek. Cyklicznie odbywaj¡si¦ na jej temat mi¦dzynarodowe konferencje i seminaria (m.in. w USA,Kanadzie i Japonii).

Page 3: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiory przybli»one znane na caªym ±wiecie

Page 4: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiory przybli»one znane na caªym ±wiecie

Page 5: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wprowadzenie do teorii zbiorów przybli»onychCz¦±¢ I

De�nition

Wprowadzenie do teorii zbiorów przybli»onych.Cz¦±¢ I.

Page 6: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjny

Istnieje szereg struktur, które mog¡ by¢ wykorzystane do przechowywaniadanych. Sposób reprezentacji danych powinien jednak posiada¢ dwiepodstawowe cechy:

• uniwersalno±¢ - (powinien pozwala¢ na gromadzenie i przechowywaniezbiorów ró»norodnych danych, opisuj¡cych badane zjawiska i procesy),

• efektywno±¢ - (powinien umo»liwia¢ w ªatwy sposób komputerow¡ analiz¦tak zapisanych danych).

Obie te cechy posiada znany i cz¦sto wykorzystywany w praktyce tablicowysposób reprezentacji danych.

Page 7: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjny

De�nicjaSystem informacyjny SI zde�niowany jest jako dwójka: SI = (U,A) gdzie:

• U jest niepustym, sko«czonym zbiorem obiektów,

• A jest niepustym, sko«czonym zbiorem atrybutów.

• Zbiór Va jest dziedzin¡ atrybutu a ∈ A, V =⋃

a∈A Va.

De�niuje si¦ rownie» funkcj¦ informacyjn¡. f : U × A→ V , tak¡, »e ∀a∈A,x∈U ,f (a, x) ∈ Va.

Page 8: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjnyJak nale»y rozumie¢ de�nicj¦ SI?

Rysunek: Jak nale»y rozumie¢ de�nicj¦ SI?

f (C2, 1) = Niski, f (C2, 2) = Wysoki, f (C1, 4) = 2,

f (C1, 2) = 1, f (S , 3) = O�, f (S , 7) = On.

f : U × A→ V : ∀a∈A,x∈U f (a, x) ∈ Va gdzie Va jest dziedzin¡ atrybutu a ∈ A.

Page 9: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjnySystem informacyjny a tabela bazy danych?

Rysunek: Jak nale»y rozumie¢ de�nicj¦ SI?

Poj¦cie systemu informacyjnego odpowiada poj¦ciowo poj¦ciu tabeli (relacji) wbazach danych.

Page 10: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjny a system decyzyjny

System decyzyjny to rodzaj systemu informacyjnego, który przydziela obiektydo pewnych klas okre±lonych za pomoc¡ jednego z atrybutów, zwanegoatrybutem decyzyjnym.

Atrybuty zawarte w zbiorze A s¡ nazywane warunkowymi albo po prostuwarunkami, za± d jest nazywane konkluzj¡ b¡d¹ po prostu decyzj¡ systemu.Zbiory te s¡ zbiorami sko«czonymi.i-ta klasa decyzyjna to zbiór obiektów Ci = {x ∈ U : d(x) = di} , gdzie di jesti -t¡ warto±ci¡ decyzji odpowiadaj¡c¡ zbiorowi warto±ci decyzjiVd = {d1, . . . , d|V

d|} .

Reguªa decyzyjna jest formuª¡: (ai1 = v1) ∧ . . . ∧ (aik= vk)⇒ (d = vd ), gdzie

1 ≤ i1 < . . . < ik ≤ m, vj ∈ Vai j .

Page 11: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Indukcja reguª decyzyjnych

W procesie indukcji pomocna jest funkcja rozró»nialno±ci fA, która pozwalabudowa¢ reguªy minimalne (optymalne) dla danej tablicy decyzyjnej.Funkcja rozró»nialno±ci fA dla danego systemu informacyjnego A jest funkcj¡boolowsk¡ m zmiennych boolowskich a∗1 , . . . , a

∗m (odpowiadaj¡cych atrybutom

a1, . . . , am) zde�niowanym przez:

fA =∧{∨

c∗ij |1 ≤ j ≤ i ≤ n, cij 6= ∅}

gdzie c∗ij = {a∗|a ∈ cij}.

Page 12: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tablica decyzyjna

Tablic¡ decyzyjn¡ DT nazywa¢ b¦dziemy system informacyjny w postaci:DT = (U,A ∪ {d}), gdzie d /∈ A jest atrybutem decyzyjnym niezaliczanym dozbioru atrybutow A systemu.Atrybuty a ∈ A nazywamy atrybutami warunkowymi.

Page 13: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

System informacyjny - tablica decyzyjna

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Tabela przedstawia przykªadowy system informacyjny zawieraj¡cy wyniki bada«przeprowadzonych dla grupy pacjentów. System ten skªada si¦ z sze±ciuobiektów (1, 2, ..,6) oraz czterech atrybutów: Ból gªowy, Ból mi¦±ni,

Temperatura, Grypa.

Page 14: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

De�nicja przykªadowego SI

Rozpatrywany system informacyjny mo»e zosta¢ zapisany w nast¦puj¡cejpostaci: SI = (U,A,V , f ) gdzie:

• U={1, 2, 3, 4, 5, 6}

• A={Ból gªowy, Ból mi¦±ni, Temperatura, Grypa}

• V = VBolglowy ∪ VBolmiesni ∪ VTemperatura ∪ VGrypa

VBolglowy = {nie, tak}VBolmiesni = {nie, tak}VTemperatura = {normalna,wysoka, bardzowysoka}VGrypa = {nie, tak}

• f : U × A→ V (np. f(1, Ból gªowy)=nie; f(3, Grypa) = tak)

Page 15: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Powtórka � iloczyn kartezja«ski

Iloczyn kartezja«ski zbiorów A i B to zbiór wszystkich par uporz¡dkowanych(a, b), takich, »e a nale»y do zbioru A, za± b nale»y do zbioru B. Oznacza si¦go symbolem A× B. Formalnie:

A× B = {(a, b) : a ∈ A, b ∈ B}

Iloczyn kartezja«ski mo»e by¢ zbudowany na tym samym zbiorze, np. A×A, cobywa oznaczane A2. Formalnie:

A× A = {(a, b) : a ∈ A, b ∈ A}

Iloczyn kartezja«ski dla zbioru obiektów U tablicy decyzyjnej DT :Iloczyn kartezja«ski U × U to zbiór par obiektów.

U × U = {(x , y) : x ∈ U, y ∈ U}

U×U = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),

(3, 3), (3, 4), (3, 5), (3, 6), (4, 4), (4, 5), (4, 6), (5, 5), (5, 6), (6, 6)}

Page 16: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Powtórka � relacja

De�nition

Relacja pomi¦dzy elementami zbioru A a elementami zbioru B to wybranypodzbiór iloczynu kartezja«skiego A× B.

Relacj¦ tworz¡ pary elementów wybrane z iloczynu kartezja«skiego wedªugpewnego kryterium.W praktyce najpopularniejsze i najszerzej stosowane s¡ relacje dwuargumentowe(dwuczªonowe, binarne), zwykle nazywane po prostu relacjami.

De�nition

Je±li zaªo»ymy, »e relacja nazywa si¦ np. R, to zapis xRy oznacza, »e x jest wrelacji R z y .

Page 17: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci

O relacji nierozró»nialno±ci mówimy wówczas, gdy w rozpatrywanym systemiemamy do czynienia z obiektami o identycznych opisach, b¡d¹ obiektami o tejsamej warto±ci danego atrybutu (-ów [kilku, nie wszystkich]).

Analizuj¡c poszczególne obiekty z tabeli mo»na zaobserwowa¢, »e obiekty onumerach 1, 4 i 6 maj¡ te same warto±ci atrybutów: ból gªowy oraz ból mi¦±niza± obiekty o numerach 1 i 5 maj¡ t¦ sam¡ warto±¢ atrybutu temperatura. Oobiektach numer 1, 4 i 6 powiemy, »e s¡ nierozró»nialne ze wzgl¦du naatrybuty: ból gªowy oraz ból mi¦±ni , za± obiekty o numerach 1 i 5 s¡nierozró»nialne ze wzgl¦du na atrybut: temperatura.T¦ obserwacj¦ mo»na uogólni¢ i wyrazi¢ w sposób formalny stosuj¡codpowiednio zde�niowan¡ relacj¦.

Page 18: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci

Niech SI = (U,A,V , f ) b¦dzie systemem informacyjnym i niech B ⊆ A.

De�nition

Relacj¦ nie rozró»nialno±ci (ang. indiscernibility relation) na zbiorze obiektów U

generowan¡ przez zbiór atrybutów B okre±lamy jako:

IND(B) = {(x , y) ∈ U × U :∀

a ∈ Ba(x) = a(y)}

gdzie znak �=� mi¦dzy a(x) i a(y) nale»y rozumie¢ w ten sposób, »e dlaobiektów x i y , nale»¡cych do U, atrybut a przyjmuje tak¡ sam¡ warto±¢.

De�nition

Zapis w postaci: xIND(B)y oznacza, »e x jest w relacji IND(B) z y . Mówi¡ckonkretnie: obiekt x systemu informacyjnego SI jest nierozró»nialny od obiektuy tego» samego systemu, ze wzgl¦du na wybrany podzbiór atrybutów B.

Page 19: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wªasno±ci relacji nierozró»nialno±ci

Poszczególne pary obiektów nale»¡ do relacji wtedy, gdy posiadaj¡ te samewarto±ci dla wszystkich atrybutów ze zbioru B.Relacja nierozró»nialno±ci IND(B) jest relacj¡ równowa»no±ci, gdy» jest relacj¡:

• zwrotn¡, gdy»: ∀u∈U (u, u) ∈ IND(B)

• symetryczn¡, gdy»: ∀u,v∈U ((u, v) ∈ IND(B)⇒ (v , u) ∈ IND(B))

• przechodni¡, gdy»:∀

u,v,w∈U ((u, v) ∈ IND(B)∧(v ,w) ∈ IND(B)⇒ (u,w) ∈ IND(B))

Page 20: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci - cd

Dla systemu informacyjnego przedstawionego w tabeli mo»na wyznaczy¢ relacjenierozró»nialno±ci generowane przez ró»ne zbiory atrybutów:

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Tablica: System informacyjny / tablica decyzyjna

Niech: A1 = {g ,m, t},A2 = {t},A3 = {g ,m},A4 = {g , t, c},A5 = {g ,m, t, c}INDSI (A1) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (2, 5), (5, 2)}INDSI (A2) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (1, 2), (2, 1), (1, 5), (5, 1), (2, 5),(5, 2), (3, 4), (4, 3)}INDSI (A3) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (1, 4), (4, 1), (1, 6), (6, 1), (4, 6),(6, 4), (2, 5), (5, 2)}INDSI (A4) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}

Page 21: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Dowód, »e IND(B) jest relacj¡ zwrotn¡

1. Niech SI = (U,A) b¦dzie systemem informacyjnym i niech B ⊆ A.

2. Relacja IND(B) jest zwrotn¡, bo:

3. We¹my dowolny obiekt x ∈ U, mamy wi¦c:

∀a∈B , a(x) = a(x)

4. a wi¦c z de�nicji:(x , x) ∈ IND(B).

Page 22: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Dowód, »e IND(B) jest relacj¡ symetryczn¡

1. Niech SI = (U,A) b¦dzie systemem informacyjnym i niech B ⊆ A.

2. Relacja IND(B) jest symetryczn¡, bo:

3. We¹my dowolne obiekty x , y ∈ U,

4. zaªó»my, »e:(x , y) ∈ IND(B)

5. mamy wtedy:∀a∈B , a(x) = a(y)

6. st¡d:∀a∈B , a(y) = a(x)

7. a wi¦c:(y , x) ∈ IND(B)

Page 23: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Dowód, »e IND(B) jest relacj¡ przechodni¡

1. Niech SI = (U,A) b¦dzie systemem informacyjnym i niech B ⊆ A.

2. Relacja IND(B) jest przechodni¡, bo:

3. We¹my dowolne obiekty x , y , z ∈ U,

4. zaªó»my, »e (x , y) ∈ IND(B) oraz (y , z) ∈ IND(B),

5. mamy wtedy:∀a∈B , (a(x) = a(y) ∧ a(y) = a(z))

6. st¡d:∀a ∈ B, a(x) = a(z)

7. a wi¦c:(x , z) ∈ IND(B).

Page 24: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Klasy abstrakcji

• Relacja nierozró»nialno±ci IND(B) b¦d¡c relacj¡ równowa»no±ciow¡, dzielizbiór obiektów U na rozª¡czne, niepuste klasy abstrakcji.

• Klasy abstrakcji relacji nierozró»nialno±ci IND(B) oznacza si¦ U/IND(B).

• Ka»da klasa abstrakcji relacji nierozró»nialno±ci IND(B) to zbiór obiektównierozró»nialnych ze wzgl¦du na atrybuty ze zbioru B.

• Klasy abstrakcji U/IND(B) relacji nierozró»nialno±ci IND(B) to zatemzbiór zbiorów takich obiektów, które s¡ nierozró»nialne ze wzgl¦du naatrybuty ze zbioru B.

• Klasa abstrakcji dla obiektu x ∈ U relacji IND(B) zde�niowana jestnast¦puj¡co: [x ]IND(B) = {y ∈ U, ∀a∈B , a(x) = a(y)}

Page 25: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Klasy abstrakcji - cd

Powy»sze relacje dziel¡ zbiór obiektów systemu informacyjnego na nast¦puj¡ceklasy abstrakcji (zbiory elementarne):

• U/IND(A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/IND(A2) = {{1, 2, 5}, {3, 4}, {6}}• U/IND(A3) = {{1, 4, 6}, {2, 5}, {3}}• U/IND(A4) = {{1}, {2}, {3}, {4}, {5}, {6}}• U/IND(A) = {U/IND(A4)}

Na tej podstawie mo»na wyznaczy¢ przykªadowe klasy abstrakcji zawieraj¡ceposzczególne obiekty systemu informacyjnego:

• ISI ,A3(1) = {1, 4, 6}• ISI ,A3(2) = {2, 5}• ISI ,A3(3) = {3}

Page 26: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Aproksymacja zbiorów � przybli»enie dolne, górne, brzeg zbior

Problem z jednoznaczn¡ klasy�kacj¡ obiektów do pewnego podzbioru

• Jednym z celów wnioskowania w systemach decyzyjnych jest próbastwierdzenia czy obiekt (lub ich grupa) nale»y do pewnej klasy, lub nie.Inaczej mówi¡c � czy nale»¡ do pewnego poj¦cia czy nie.

• Proces taki opiera si¦ na opisie obiektu wyra»onym przy pomocyatrybutów.

• Wybrany podzbiór atrybutów systemu informacyjnego determinuje podziaªobiektów na rozª¡czne klasy abstrakcji.

• Wa»nym problemem jest zdolno±¢ radzenia sobie z niedoskonaªymidanymi. Jednym ze ¹ródeª trudno±ci w zadaniach opisu czy klasy�kacjijest istnienie niespójno±ci w dost¦pnych danych.

• Obiekty posiadaj¡ce identyczne (lub podobne) opisy, lecz zaliczone doró»nych poj¦¢, uniemo»liwiaj¡ stworzenie jednoznacznej de�nicji tych»epoj¦¢.

• Niespójno±ci nie powinny by¢ traktowane wyª¡cznie jako wynik bª¦du czyszumu informacyjnego. Mog¡ one tak»e wynika¢ z niedost¦pno±ci cz¦±ciinformacji, naturalnej granularno±ci i niejednoznaczno±ci j¦zykareprezentacji.

Page 27: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiory przybli»one a problem z jednoznaczn¡ klasy�kacj¡ obiektów

Teoria zbiorów przybli»onych (ang. rough sets) zaproponowana przez ZdzisªawaPawlaka jest dogodnym narz¦dziem analizy tego typu niespójno±ci informacji.Teoria oparta jest na zaªo»eniu, »e posiadaj¡c informacj¦ reprezentowan¡ zapomoc¡ atrybutów i ich warto±ci na obiektach, mo»liwe jest okre±lenie relacjizachodz¡cej pomi¦dzy tymi obiektami. Obiekty posiadaj¡ce ten sam opis,wyra»ony za pomoc¡ atrybutów, s¡ nierozró»nialne ze wzgl¦du na dost¦pn¡informacj¦.W przypadku niemo»liwo±ci precyzyjnego zde�niowania zbioru obiektów(poj¦cia, klasy decyzyjnej) tworzy ona dolne i górne przybli»enie tego zbioru napodstawie klas relacji nierozró»nialno±ci pomi¦dzy obiektami.

Page 28: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Poj¦cia nieostre a zbiór dokªadny oraz zbiór przybli»ony

• Operowanie poj¦ciami nieostrymi (nie±cisªymi, nieprecyzyjnymi) jest bezw¡tpienia jednym z gªównych problemów rozumowa« potocznych. Poj¦cianieostre ró»ni¡ si¦ tym od poj¦¢ ostrych, »e w przeciwie«stwie do tychostatnich nie zawsze mo»liwe jest jednoznaczne zaklasy�kowanie obiektudo poj¦cia, tzn. dla pewnej grupy obiektów z otaczaj¡cej nasrzeczywisto±ci nie mo»na � stwierdzi¢ jednoznacznie czy dany obiektnale»y do rozpatrywanego poj¦cia, czy te» nie nale»y. Na przykªad mog¡to by¢ poj¦cia takie jak: maªe dziecko, pi¦kna kobieta, wysoki czªowiek,

dobra ksi¡»ka, ªatwe zadanie itd.

• Teoria zbiorów przybli»onych proponuje zast¡pienie nieostrego(nieprecyzyjnego) poj¦cia,par¡ poj¦¢ precyzyjnych, zwanych dolnym igórnym przybli»eniem tego poj¦cia.

• Ró»nica mi¦dzy górnym i dolnym przybli»eniem jest wªa±nie tym obszaremgranicznym, do którego nale»¡ wszystkie przypadki, które nie mog¡ by¢prawidªowo zaklasy�kowane na podstawie aktualnej wiedzy. Im wi¦kszyobszar graniczny poj¦cia tym bardziej jest ono nieostre (nieprecyzyjne).

Page 29: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiór dokªadny oraz zbiór przybli»ony

Page 30: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Aproksymacja - de�nicje

De�nition

Niech SI = {U,A,V , f } b¦dzie systemem informacyjnym i niech B ⊆ A.

De�nition

Mówimy, »e zbiór P ⊆ U jest zbiorem B � dokªadnym (B � de�niowalnym)wtedy, gdy jest on sko«czon¡ sum¡ zbiorów B � elementarnych.

De�nition

Ka»dy zbiór, który nie jest sko«czon¡ sum¡ zbiorów B � elementarnych jestzbiorem B � przybli»onym.

Page 31: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad

Niech:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}• A1 = {g ,m, t},A2 = {t}

oraz

• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Wówczas:

Zbiór X1 jest zbiorem A1 � dokªadnym, gdy» jest sko«czon¡ sum¡ zbiorów A1 �elementarnych: X1 = {{1} ∪ {2, 5} ∪ {3}}

Ale:

Zbiór X2 jest zbiorem A1 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A1

� elementarnych (obiekty 2 i 5 nale»¡ do jednego zbioru B � elementarnego, za±zbiórX2 zawiera tylko obiekt numer 5, a nie zawiera obiektu numer 2)

Page 32: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad - cd

Niech:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}• A1 = {g ,m, t},A2 = {t}• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Mo»emy dalej stwierdzi¢, »e:• Zbiór X1 jest zbiorem A2 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A2 �

elementarnych (obiekty 3 i 4 nale»¡ do jednego zbioru C � elementarnego, za± zbiór X1

zawiera tylko obiekt numer 3, a nie zawiera obiektu numer 4)

• Zbiór X2 jest zbiorem A2 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A2 �elementarnych (obiekty 1, 2 i 5 nale»¡ do jednego zbioru C � elementarnego, za± zbiórX2 zawiera tylko obiekt numer 5, a nie zawiera obiektów numer 1 i 2)

Page 33: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Aproksymacja zbioru - de�nicja

Je±li SI = {U,A,V , f } jest systemem informacyjnym takim, »e B ⊆ A orazX ⊆ U to:

• B � dolnym przybli»eniem (aproksymacj¡) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BX = {x ∈ U : ISI ,B(x) ⊆ X}

• B � górnym przybli»eniem (aproksymacj¡) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BX = {x ∈ U : ISI ,B(x) ∩ X 6= ∅}

Page 34: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Aproksymacje zbiorów � interpretacja

• Za pomoc¡ dolnej i górnej aproksymacji jeste±my w stanie okre±li¢ nieostrepoj¦cie w ±cisªy sposób.

• Dolna aproksymacja poj¦cia, to wszystkie te obiekty, które nale»¡ bezw¡tpienia do poj¦cia X . Nale»¡ one bowiem do takich klas abstrakcji,które w caªo±ci zawieraj¡ si¦ w poj¦ciu X .

• Górna aproksymacja poj¦cia, to zbiór takich obiektów, co do których niemo»emy wykluczy¢, »e nale»¡ do poj¦cia X . Jest to spowodowane tym, »enale»¡ do klas abstrakcji maj¡cych niepuste przeci¦cie z poj¦ciem X . S¡zatem nierozró»nialne z pewnymi obiektami nale»¡cymi do tego poj¦cia.

• Brzeg zbioru X zawiera obiekty, których nie mo»na jednoznacznieprzydzieli¢ do X z uwagi na sprzeczny opis.

Page 35: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wspóªczynniki dokªadno±ci dla aproksymacji zbioru X

Zbiór przybli»ony X mo»e by¢ scharakteryzowany ilo±ciowo za pomoc¡:

• Wspóªczynnika dokªadno±ci przybli»enia: αBX = |BX ||BX | , gdzie |X | to

liczno±¢ niepustego zbioru X ,

• Wspóªczynnika dokªadno±ci przybli»enia dolnego: αBX = |BX ||U|

• Wspóªczynnika dokªadno±ci przybli»enia górnego:αBX = |BX ||U|

Page 36: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Obszary pozytywne i negatywne zbiorów

• B � pozytywnym obszarem (ang. positive area) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

POSB(X ) = BX

• B � brzegiem (granic¡) (ang. boundary)zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BNB(X ) = BX − BX

• B � negatywnym obszarem (ang. negative area) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

NEGBX = U − BX

Page 37: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Interpretacja dolnego i górnego przybli»enia zbioru

De�nition

Dolne przybli»enie poj¦cia jest to wi¦c poj¦cie, do którego nale»¡ wszystkieobiekty, co do których nie ma w¡tpliwo±ci, »e s¡ one reprezentantami tegopoj¦cia w ±wietle posiadanej wiedzy.

De�nition

Do górnego przybli»enia nale»¡ obiekty, których nie mo»na wykluczy¢, »e s¡reprezentantami tego poj¦cia.

De�nition

Brzegiem za± poj¦cia s¡ wszystkie te obiekty, co do których nie wiadomo czy s¡czy nie reprezentantami danego zbioru.

Z de�nicji powy»szych mo»emy wysnu¢ nast¦puj¡ce wnioski:

• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅

Page 38: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Interpretacja dolnego i górnego przybli»enia zbioru

De�nition

Dolne przybli»enie poj¦cia jest to wi¦c poj¦cie, do którego nale»¡ wszystkieobiekty, co do których nie ma w¡tpliwo±ci, »e s¡ one reprezentantami tegopoj¦cia w ±wietle posiadanej wiedzy.

De�nition

Do górnego przybli»enia nale»¡ obiekty, których nie mo»na wykluczy¢, »e s¡reprezentantami tego poj¦cia.

De�nition

Brzegiem za± poj¦cia s¡ wszystkie te obiekty, co do których nie wiadomo czy s¡czy nie reprezentantami danego zbioru.

Z de�nicji powy»szych mo»emy wysnu¢ nast¦puj¡ce wnioski:

• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅

• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅

Page 39: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Interpretacja dolnego i górnego przybli»enia zbioru

De�nition

Dolne przybli»enie poj¦cia jest to wi¦c poj¦cie, do którego nale»¡ wszystkieobiekty, co do których nie ma w¡tpliwo±ci, »e s¡ one reprezentantami tegopoj¦cia w ±wietle posiadanej wiedzy.

De�nition

Do górnego przybli»enia nale»¡ obiekty, których nie mo»na wykluczy¢, »e s¡reprezentantami tego poj¦cia.

De�nition

Brzegiem za± poj¦cia s¡ wszystkie te obiekty, co do których nie wiadomo czy s¡czy nie reprezentantami danego zbioru.

Z de�nicji powy»szych mo»emy wysnu¢ nast¦puj¡ce wnioski:

• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅

Page 40: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Liczbowa charakterystyka aproksymacji zbioru

Ka»dy zbiór (przybli»ony lub dokªadny) mo»na scharakteryzowa¢ ilo±ciowo zapomoc¡ wspóªczynnika dokªadno±ci aproksymacji (przybli»enia).

De�nition

Wspóªczynnik dokªadno±ci aproksymacji zbioru X w systemie informacyjnym SI

wzgl¦dem zbioru atrybutów B wyra»a si¦ wzorem:

αB(X ) =card(POSB(X ))

card(BX )=

card(BX )

card(BX )

gdzie card(X ) oznacza liczno±¢ zbioru X .

�atwo zauwa»y¢, »e:

• 0 ≤ αB(X ) ≤ 1

• je»eli X jest zbiorem dokªadnym to: αB(X ) = 1

• je»eli X jest zbiorem przybli»onym to: 0 ≤ αB(X ) < 1

Page 41: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Liczbowa charakterystyka aproksymacji zbioru

Ka»dy zbiór (przybli»ony lub dokªadny) mo»na scharakteryzowa¢ ilo±ciowo zapomoc¡ wspóªczynnika dokªadno±ci aproksymacji (przybli»enia).

De�nition

Wspóªczynnik dokªadno±ci aproksymacji zbioru X w systemie informacyjnym SI

wzgl¦dem zbioru atrybutów B wyra»a si¦ wzorem:

αB(X ) =card(POSB(X ))

card(BX )=

card(BX )

card(BX )

gdzie card(X ) oznacza liczno±¢ zbioru X .

�atwo zauwa»y¢, »e:

• 0 ≤ αB(X ) ≤ 1

• je»eli X jest zbiorem dokªadnym to: αB(X ) = 1

• je»eli X jest zbiorem przybli»onym to: 0 ≤ αB(X ) < 1

Page 42: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Liczbowa charakterystyka aproksymacji zbioru

Ka»dy zbiór (przybli»ony lub dokªadny) mo»na scharakteryzowa¢ ilo±ciowo zapomoc¡ wspóªczynnika dokªadno±ci aproksymacji (przybli»enia).

De�nition

Wspóªczynnik dokªadno±ci aproksymacji zbioru X w systemie informacyjnym SI

wzgl¦dem zbioru atrybutów B wyra»a si¦ wzorem:

αB(X ) =card(POSB(X ))

card(BX )=

card(BX )

card(BX )

gdzie card(X ) oznacza liczno±¢ zbioru X .

�atwo zauwa»y¢, »e:

• 0 ≤ αB(X ) ≤ 1

• je»eli X jest zbiorem dokªadnym to: αB(X ) = 1

• je»eli X jest zbiorem przybli»onym to: 0 ≤ αB(X ) < 1

Page 43: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad

Je±li:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}

oraz

• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Liczymy teraz dokªadno±¢ aproksymacji dla zbiorów X1 oraz X2 wzgl¦demzbioru atrybutów A1:

αA1(X1) =card(A1X1)

card(A1X1)= 4

4 = 1

αA1(X2) =card(A1X2)

card(A1X2)= 3

5 = 0.6

gdzie card(X ) oznacza liczno±¢ zbioru X .

Page 44: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Niespójno±¢ w danych

• Niespójno±¢ danych zachodzi wówczas, gdy dla takich samych danychwej±ciowych system podj¡ªby odmienne decyzje.

• Praca z systemem o niespójnej wiedzy jest niemo»liwa.

• Niespójno±¢ nale»y usun¡¢.

Page 45: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Niespójno±¢ w danych

• Niespójno±¢ danych zachodzi wówczas, gdy dla takich samych danychwej±ciowych system podj¡ªby odmienne decyzje.

• Praca z systemem o niespójnej wiedzy jest niemo»liwa.

• Niespójno±¢ nale»y usun¡¢.

Page 46: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Niespójno±¢ w danych

• Niespójno±¢ danych zachodzi wówczas, gdy dla takich samych danychwej±ciowych system podj¡ªby odmienne decyzje.

• Praca z systemem o niespójnej wiedzy jest niemo»liwa.

• Niespójno±¢ nale»y usun¡¢.

Page 47: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Dla obiektów 2 i 5 zachodzi niespójno±¢, gdy», dla tych samych atrybutówwarunkowych zachodz¡ ró»ne decyzje:ból gªowy=tak and ból mi¦±ni=nie and temp=wysokadla obiektu 2 podano decyzj¦: Grypa=takdla obiektu 5 podano decyzj¦: Grypa=nie

Page 48: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Usuwanie niespójno±ci z tablicy decyzyjnej

Wyró»ni¢ mo»na 5 metod usuwania niespójno±ci w tablicach decyzyjnych:

1. Zwróci¢ si¦ do EKSPERTA aby dla obiektów 2 i 5 podj¡ª jedn¡ decyzj¦.

2. Utworzenie dwóch (lub wi¦cej w przypadku ogólnym) spójnych tablicdecyzyjnych, poprzez rozdzielenie sprzecznych obiektów.

3. Usuni¦cie obiektów b¦d¡cych przyczyn¡ niespójno±ci(metoda ilo±ciowa).

4. Mo»na posªu»y¢ si¦ tutaj równie» metod¡ jako±ciow¡.

5. Metoda tworzenia nowego atrybutu decyzyjnego (metoda uogólnionegoatrybutu decyzyjnego)

Page 49: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Usuwanie niespójno±ci z tablicy decyzyjnejZwrócenie si¦ do EKSPERTA

Zwrócenie si¦ do EKSPERTA

Jest to sposób najprostszy przerzucaj¡cy ci¦»ar usuni¦cia niespójno±ci z tablicyna eksperta. Niestety bardzo cz¦sto zdarza si¦, »e ekspert nie potra� podj¡¢jednoznacznej decyzji. Twierdzi np. »e dla takich atrybutów (parametrów) razpodejmuje decyzje 1 innym razem decyzje 2. W takim przypadku metoda tanie daje rezultatu.

Page 50: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Usuwanie niespójno±ci z tablicy decyzyjnejUtworzenie dwóch (lub wi¦cej w przypadku ogólnym) spójnych tablic decyzyjnych, poprzez

rozdzielenie sprzecznych obiektów.

Jest to jednak tylko pozorne rozwi¡zanie problemu. Powstan¡ dwa zbiory reguªdla pierwszej i drugiej tablicy. Reguªy powstaªe na podstawie obiektu 2 wtablicy pierwszej i reguªa dla obiektu 5 w tablicy drugiej, b¦d¡ sprzeczne.

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna niePacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Page 51: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Metoda jako±ciowa

Metoda jako±ciowa

Usuniemy ten obiekt, którego warto±¢ decyzja jest "mniej wa»¡ca". "Mniejwa»¡ca"to znaczy maj¡ca mniejsz¡ dokªadno±¢ dolnego lub górnegoprzybli»enia.

Dla ka»dego X ⊆ U i B ⊆ A dokªadno±¢ dolnego przybli»enia γB(X ) obliczymyze wzoru:

γB(X ) =|BX ||U|

Dokªadno±¢ górnego przybli»enia γB(X ) obliczymy ze wzoru:

γB(X ) =|BX ||U|

Wówczas usuwamy ten obiekt, dla którego dokªadno±ci (górnego b¡d¹ dolnego)przybli»enia byªa mniejsza.

Page 52: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad usuwania niespójno±ci metod¡ jako±ciow¡

Najpierw dzielimy zbiór obiektów X ze wzgl¦du na decyzj¦ na dwa rozª¡cznepodzbiory X1 oraz X2.X1 = {1, 2, 3, 4}X2 = {5, 6}Generujemy teraz klasy rozró»nialno±ci dla caªego zbioru atrybutówwarunkowych:U/IND(C) = {{1}, {2, 5}, {3}, {4}, {6}}.B � dolnym przybli»eniem zbioru X w systemie informacyjnym SI nazywamyzbiór:

BX = {x ∈ U : ISI ,B(x) ⊆ X}B � górnym przybli»eniem zbioru X w systemie informacyjnym SI nazywamyzbiór:

BX = {x ∈ U : ISI ,B(x) ∩ X 6= ∅}

Page 53: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad - cd

Teraz mo»na juz wyznaczy¢ dla ka»dego ze zbiorów klasy decyzyjnych: X1 orazX2 przybli»enie dolne oraz górne.X1 = {1, 2, 3, 4}X2 = {5, 6}U/IND(C) = {{1}, {2, 5}, {3}, {4}, {6}}.• BX1 = {1, 3, 4}• BX1 = {1, 2, 3, 4, 5}• BX2 = {6}• BX2 = {2, 5, 6}

Teraz mo»na juz przyst¡pi¢ do wyliczenia dokªadno±ci górnego oraz dolnegoprzybli»enia:

• γB(X1) =|BX1||U| = 3

6 = 12

• γB(X2) =|BX2||U| = 1

6

• γB(X1) =|BX1||U| = 5

6

• γB(X2) =|BX2||U| = 3

6 = 12

Metoda mówi, aby usun¡¢ ten obiekt, dla którego uzyskano mniejsz¡dokªadno±¢ dolnego, b¡d¹ górnego przybli»enia w zale»no±ci od wybranegowariantu. W naszym przypadku usuniemy obiekt, który powodowaª niespójno±¢i wyst¦powaª w zbiorze X2.

Page 54: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Spójna tablica decyzyjna

Spójna juz teraz tablica decyzyjna wygl¡da nast¦puj¡co:

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna nie

Tablica: System informacyjny / tablica decyzyjna po usuni¦ciu niespójno±ci

Page 55: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Usuni¦cie obiektów b¦d¡cych przyczyn¡ niespójno±ci

Powstaje problem, który obiekt usun¡¢. Mo»na posªu»y¢ si¦ tutaj metod¡ilo±ciow¡.

Metoda ilo±coiwaWówczas usuniemy ten obiekt(-y), którego decyzja mniej razy byªapotwierdzana.

Page 56: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tworzenie nowego podziaªu (Systemu informacyjnego)

Tworzenie nowego podziaªu (Systemu informacyjnego)

Decyzja d wyznacza klasy�kacj¦: ClassA(d) = {X1, ...,Xr(d)}, (gdzie (d) - toilo±¢ ró»nych warto±ci atrybutu decyzyjnego.) Tworzymy nowy podziaª:

App − ClassA(d) = {A|X1, ...,A|Xr(d)}⋃{BdA(θ) : |θ| > 1}

Ten nowy podziaª tworzy tablice decyzyjn¡ spójn¡.

Tabela nr 1, (niespójna) po dodaniu do systemu informacyjnego, nowego,uogólnionego atrybutu decyzyjnego wygl¡da nast¦puj¡co:

Page 57: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Macierz, tablica, funkcja oraz wektor rozró»nialno±ci dla systemuinformacyjnego

Macierz rozró»nialno±ci

De�nition

Je±li SI = {U,A,V , f } jest systemem informacyjnym takim, »eU = {u1, u2, .., un} i A = {a1, a2, .., am} , to macierz rozró»nialno±ci(odró»nialno±ci) systemu informacyjnego SI M(SI ) (ang. discernibility matrix)de�niujemy nast¦puj¡co:

M(SI ) = (Hi,j )i,j=1,..,n = {a ∈ A : f (ui , a) 6= f (uj , a)}

dla i , j = 1, .., n, gdzie n = |U|.

• Macierz rozró»nialno±ci jest dwuwymiarow¡ macierz¡ kwadratow¡ owymiarach: |U| × |U|.

• Komórka M(SI )[i , j ] zawiera zbiór tych atrybutów, dla których obiektyuniwersum ui i uj maj¡ ró»ne warto±ci (s¡ rozró»nialne przy pomocy tychatrybutów).

Page 58: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Spójna juz teraz tablica decyzyjna wygl¡da nast¦puj¡co:

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna nie

Tablica: System informacyjny / tablica decyzyjna po usuni¦ciu niespójno±ci

1 2 3 4 61 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Tablica: Macierz rozró»nialno±ci dla system informacyjnego

Page 59: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),

• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Page 60: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Page 61: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Page 62: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Page 63: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie macierzy rozró»nialno±ci

Wej±cie: A = (U,A) system informacyjny taki, »e U = {u1, .., un} iA = {a1, .., am}.Wyj±cie: M(A) = (Cij )i,j=1,..,n macierz odró»nialno±ci systemu A,przyczymM(A) ma obliczone tylko te pola Cij dla których 1 ≤ j < i ≤ n.Metoda:

For i=1 to n do

For j=1 to i-1 do

Wstaw do Cij atrybuty, na których ró»ni¡ si¦ obiekty ui i uj

Page 64: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zªo»ono±¢:

• Aby obliczy¢ tablic¦ M(A), nale»y wyznaczy¢ zawarto±¢ n2−n2 pól macierzy.

• Zªo»ono±¢ obliczeniowa czasowa wyznaczania ka»dego pola jest zale»na odliczby atrybutów m.

• Dlatego zªo»ono±¢ obliczeniowa czasowa algorytmu jest rz¦du O(n2 ∗m),natomiast zªo»ono±¢ obliczeniowa pami¦ciowa algorytmu jest rz¦du O(C),gdzie C jest pewn¡ staª¡.

Powy»sze cechy sprawiaj¡, »e taka reprezentacja macierzy, jest bardzoniewygodna z programistycznego punktu widzenia. Macierz zawieraredundantne informacje, zawarto±ci komórek nie s¡ typami prostymi a ponadtonie maj¡ staªej wielko±ci (liczby elementów w zbiorze). W efekcie struktura tama bardzo du»¡ zªo»ono±¢ pami¦ciow¡, która dla systemu informacyjnegoSI = {U,A,V , f } wynosi: |U|2 ∗ |A|.

Page 65: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Funkcja rozró»nialno±ci

Funkcj¡ odró»nialno±ci systemu informacyjnego SI (ang. discernibility function)nazywamy funkcj¦ boolowsk¡ fSI zmiennych a∗1 , .., a

∗m odpowiadaj¡cych

odpowiednio atrybutom (systemu informacyjnego) a1, .., am zde�niowan¡nast¦puj¡co:

fSI (a∗1 , .., a

∗m) =

⋂{⋃

(Xi,j : 1 ≤ j ≤ n ∧ Hi , j 6= ∅)}

gdzie:n = |U|,m = |A|,⋃Xi,j jest alternatyw¡ wszystkich zmiennych

a∗ ∈ {a∗1 , .., a∗m} takich, »e a ∈ Hi , j .

1 2 3 4 61 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Obliczmy funkcj¦ rozró»nialno±ci dla macierzy odró»nialno±ci:fSI (g ,m, t, c) = (g+m)∗(g+t)∗(t)∗(g+m+c)∗(t+c)∗(m+t)∗(g+m+t)∗(c)∗(g+m+t+c)∗(g)∗(m+t+c)∗(g+t+c)∗(g+m+t+c)∗(t+c)∗(g+m+t)Wyra»enie to mo»na upro±ci¢ stosuj¡c m.in. prawo pochªaniania(a+ (a ∗ b)) = a do postaci:fSI (g ,m, t, c) = (t ∗ g ∗ c)

Page 66: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Redukcja atrybutów � poj¦cie j¡dra i reduktów

Nadmiar informacji jest szkodliwyW celu precyzyjnego i konkretnego opisana relacji pomi¦dzy obiektamiwyst¦puj¡cymi w bazie wiedzy, stosuje si¦ redukcj¦ liczby atrybutówopisuj¡cych owe relacje.Poszukuje si¦ takich podzbiorów atrybutów, które zachowuj¡ podziaª obiektówna klasy decyzyjne taki sam, jak wszystkie atrybuty.Te zbiory atrybutów nie mog¡ by¢ wyznaczone w dowolny sposób. W teoriizbiorów przybli»onych wykorzystuje si¦ koncepcj¦ reduktu b¦d¡cegoniezale»nym podzbiorem atrybutów zachowuj¡cym taki sam podziaª na klasydecyzyjne jak wszystkie atrybuty.W¦»szym poj¦ciem jest poj¦cie j¡dra, okre±laj¡cego zbiór atrybutówniezb¦dnych dla zachowania rozró»nialno±ci obiektów w systemie.

Page 67: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Redukt i Rdze« zbioru atrybutów

Niech SI = {U,A,V , f } b¦dzie systemem informacyjnym oraz B ⊆ A.De�nicja. Atrybut zb¦dny (niezb¦dny)Atrybut a ⊆ B jest zb¦dny, je»eli IND(B) = IND(B − {a}).W przeciwnym wypadku (tzn. je»eli IND(B) 6= IND(B − {a}) jest niezb¦dny.De�nicja. Zbiór atrybutów niezale»nych (zale»nych)A - zbiór atrybutów jest niezale»ny wtedy i tylko wtedy, gdy dla ka»dego a ⊆ A,a jest niezb¦dny. W przeciwnym wypadku zbiór jest zale»ny.

Page 68: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

De�nicja - Redukt i rdze« (j¡dro)

B ⊆ A nazywamy reduktem A wtedy i tylko wtedy, gdy B jest niezale»ny orazIND(B) = IND(A). Zbiór wszystkich reduktów oznaczamy przez RED(A).Zbiór wszystkich niezb¦dnych atrybutów w B b¦dziemy nazywali rdzeniem(j¡drem) B i oznaczali przez CORE(B).Powi¡zanie mi¦dzy reduktami i j¡dremZachodzi nast¦puj¡cy zwi¡zek:CORE(A) =

⋂RED(A),

gdzie RED(A) to zbiór wszystkich reduktów B, tzn. j¡dro atrybutów toprzekrój po wszystkich reduktach.

Page 69: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Spójna juz teraz tablica decyzyjna wygl¡da nast¦puj¡co:

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna nie

Tablica: System informacyjny / tablica decyzyjna po usuni¦ciu niespójno±ci

Page 70: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªad

Zbiór wszystkich reduktów zbioru atrybutów {g ,m, t, c} systemuinformacyjnego z tabeli 1 wynosi: REDSI ({g ,m, t, c}) = {g , t, c}.Aby udowodni¢, »e zbiór {g , t, c} jest reduktem nale»y pokaza¢, »e zachodz¡warunki z de�nicji:

• INDSI ({g ,m, t, c}) = INDSI ({g , t, c}),

Mo»emy to pokaza¢, usuwaj¡c z tego zbioru kolejne atrybuty i sprawdzaj¡c czyrelacja nierozró»nialno±ci wzgl¦dem takiego okrojonego zbioru jest ró»na odrelacji nierozró»nialno±ci wzgl¦dem caªego zbioru atrybutów. Je»eli tak b¦dzie,to zbiór {g , t, c} b¦dzie reduktem.

Page 71: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Metody generowania reduktów i rdzenia z TD

Redukty i rdze« z tablicy decyzyjnej generuje si¦ jedn¡ z dwóch dróg:

• z de�nicji,

• z macierzy rozró»nialno±ci.

Page 72: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie j¡dra (rdzenia) z de�nicji

• Wyznacz klasy abstrakcji relacji nierozró»nialno±ci U/IND(B), gdzie B jestto zbiór wszystkich rozwa»anych atrybutów.

• Wyznacz klasy abstrakcji z pomini¦ciem i-tego atrybutu U/IND(B − ai ) .

• Je»eli U/IND(B) = U/IND(B − ai ) to atrybut ai jest zb¦dny, wprzeciwnym wypadku ai jest niezb¦dny i wchodzi do j¡dra CORE(B).

• Powtarzaj pkt. 2, a» wykorzystane zostan¡ wszystkie atrybuty z B.

Page 73: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie j¡dra (rdzenia) z de�nicji

• Wyznacz klasy abstrakcji relacji nierozró»nialno±ci U/IND(B), gdzie B jestto zbiór wszystkich rozwa»anych atrybutów.

• Wyznacz klasy abstrakcji z pomini¦ciem i-tego atrybutu U/IND(B − ai ) .

• Je»eli U/IND(B) = U/IND(B − ai ) to atrybut ai jest zb¦dny, wprzeciwnym wypadku ai jest niezb¦dny i wchodzi do j¡dra CORE(B).

• Powtarzaj pkt. 2, a» wykorzystane zostan¡ wszystkie atrybuty z B.

Page 74: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie j¡dra (rdzenia) z de�nicji

• Wyznacz klasy abstrakcji relacji nierozró»nialno±ci U/IND(B), gdzie B jestto zbiór wszystkich rozwa»anych atrybutów.

• Wyznacz klasy abstrakcji z pomini¦ciem i-tego atrybutu U/IND(B − ai ) .

• Je»eli U/IND(B) = U/IND(B − ai ) to atrybut ai jest zb¦dny, wprzeciwnym wypadku ai jest niezb¦dny i wchodzi do j¡dra CORE(B).

• Powtarzaj pkt. 2, a» wykorzystane zostan¡ wszystkie atrybuty z B.

Page 75: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie j¡dra (rdzenia) z de�nicji

• Wyznacz klasy abstrakcji relacji nierozró»nialno±ci U/IND(B), gdzie B jestto zbiór wszystkich rozwa»anych atrybutów.

• Wyznacz klasy abstrakcji z pomini¦ciem i-tego atrybutu U/IND(B − ai ) .

• Je»eli U/IND(B) = U/IND(B − ai ) to atrybut ai jest zb¦dny, wprzeciwnym wypadku ai jest niezb¦dny i wchodzi do j¡dra CORE(B).

• Powtarzaj pkt. 2, a» wykorzystane zostan¡ wszystkie atrybuty z B.

Page 76: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Algorytm wyznaczania j¡dra z de�nicji

Dane:B = a1, a2, a3, ...ai , ...anTablica KRS

• CORE(B) := {}• Wyznacz U/INB(B)

• Dla ka»dego a ∈ B wykonaj

• Je»eli U/INB(B) 6= U/IND(B − ai ) To CORE(B) := CORE(B) ∪ aigdzie:

• CORE(B) - j¡dro (zbiór atrybutów),

• B - rozwa»any zbiór atrybutów,

• ai - i-ty atrybut ze zbioru B,

• U/INB(B) - klasa abstrakcji relacji nierozró»nialno±ci dla peªnego zbioruatrybutów,

• U/IND(B − ai ) - klasy abstrakcji relacji nierozró»nialno±ci dla zbioruatrybutów z pomini¦ciem atrybutu ai .

Page 77: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczenie rdzenia z de�nicji

• Wyznacz klasy abstrakcji U/IND(B), gdzie B jest to zbiór wszystkichrozwa»anych atrybutów.

• Sprawd¹, czy j¡dro CORE(B) nie jest reduktem.

• Poniewa» j¡dro to zbiór atrybutów niezb¦dnych, to sprawd¹, czyU/IND(B) = U/IND(CORE(B)), je»eli tak to j¡dro to jedyny redukt iprzejd¹ do Punktu 6.

• Sprawd¹ kolejne podzbiory atrybutów Bi ∈ B.

• Sprawd¹, czy podzbiór Bi jest niezale»ny. Je»eli tak, to sprawd¹ czyU/IND(B) = U/IND(Bi ), je»eli zachodzi równo±¢ to podzbiór Bi jestreduktem.

• Wypisanie reduktów.

Page 78: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Podzbiór atrybutów B ⊆ A nazywamy reduktem zbioru atrybutów A, gdy zbióratrybutów B jest niezale»ny oraz IND(B) = IND(A). Zbiór wszystkichreduktów oznaczamy przez RED(A). Redukt to najmniejszy zbiór atrybutów,przy którym zostaje zachowana dotychczasowa klasy�kacja (rozró»nialno±¢)obiektów.Wa»ne!Redukt musi speªnia¢ dwa kryteria:

1. musi by¢ niezale»nym zbiorem atrybutów (tylko atrybuty niezb¦dne),

2. musi zachowywa¢ tak¡ sam¡ rozró»nialno±¢ obiektów jak zbiór redukowany.

Uwaga!!!

Redukty mo»na wyznacza¢ dla dowolnego podzbioru A. Do tej pory

rozwa»ali±my zawsze jaki± podzbiór atrybutów B ⊆ A. Dla takiego

podzbiory B te» mo»emy liczy¢ redukty. Wtedy reduktem b¦dzie jaki±

podzbiór atrybutów C ⊆ B, a zbiór wszystkich reduktów B oznacza¢

b¦dziemy RED(B).

Page 79: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zwi¡zek pomi¦dzy j¡drem a reduktem

J¡dro systemu informacyjnego rozpatrywanego dla podzbioru atrybutów B ⊆ A

jest cz¦±ci¡ wspóln¡ wszystkich reduktów tego systemu.

CORE(B) =⋂

RED(A).

Uwaga! To wªa±ciwo±¢ wi¡»¡ca j¡dro i redukty a nie de�nicja j¡dra!

Page 80: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Algorytm generowania reduktu z de�nicji

Dane:B = {a1, a2, a3, ...ai , ..., an}Tablica KRS

• Wyznacz U/IND(B)

• Wyznacz CORE(B)

• RED(B) := CORE(B)

• Je»eli U/IND(B) = U/IND(CORE(B)) To RED(B) := CORE(B),w przeciwnym wypadku Dla ka»dego podzbioru atrybutów Bi ∈ B

wykonaj: Je»eli U/IND(B) = U/IND(Bi )ToRED(B) := RED(B) ∪ Bi

Page 81: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reduktu i rdzenia z de�nicji

Najpierw wyznaczamy klasy równowa»no±ci dla peªnego zbioru atrybutów:

IND(C) = {{1}, {2}, {3}, {4}, {6}}

Teraz b¦dziemy sprawdza¢ czy zmieni si¦ dotychczasowa klasy�kacja obiektów,jak¡ mamy dla peªnego zbioru atrybutów, je±li usuniemy jaki± atrybut ze zbioru.

IND((C)− {g}) = {{1}, {2}, {3, 4}, {6}}

czyli:IND((C)− {g}) 6= IND(C)

wi¦c atrybut {g} jest niezb¦dny w systemie, poniewa» je±li go usuniemy tostracimy informacje o rozró»nialno±ci dwóch obiektów 3i4.

Page 82: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reduktu i rdzenia z de�nicji - cd

IND((C)− {m}) = {{1}, {2}, {3}, {4}, {6}}czyli:

IND((C)− {m}) = IND(C)

wi¦c atrybut {m} jest zb¦dny w systemie, poniewa» je±li go usuniemy to niestracimy informacji o rozró»nialno±ci obiektów.

IND((C)− {t}) = {{1, 4, 6}, {2}, {3}}czyli:

IND((C)− {t}) 6= IND(C)

wi¦c atrybut {t} jest niezb¦dny w systemie, poniewa» je±li go usuniemy tostracimy informacje o rozró»nialno±ci obiektów.

Page 83: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reduktu i rdzenia z de�nicji - cd

Zatem CORE(C) to zbiór atrybutów niezb¦dnych w systemie wi¦c w naszymprzypadku stanowi¡ go dwa atrybuty:

CORE(C) = {gt}

Redukt zgodnie z de�nicj¡ jest to taki zbiór atrybutów niezb¦dnych, dlaktórego zapewniona jest dotychczasowa klasy�kacja obiektów, a wiec na pewnoredukt musi zawiera¢ w sobie j¡dro.Sprawdzamy wi¦c dla jakiej kombinacji atrybutów uzyskamy taki sam podziaªobiektów jaki daªa IND(C).

IND(gt) = {{1}, {2}, {3}, {4}, {6}}

Skoro IND(gt) = IND(C), to ten zbiór atrybutów {gt} jest reduktem zbioruatrybutów.RED(C) = {gt}.

Page 84: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Algorytm generacji j¡dra z macierzy rozró»nialno±ci

Dane: Macierz M[I , J]

• CORE(B) := {}• Dla I := 1 do N wykonajDla J := 1 do I − 1 wykonaj

• Je»eli card(M[I , J]) = 1 to CORE(B) := CORE(B) +M[I , J]

Page 85: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z macierzy

• Utworzenie wszystkich mo»liwych podzbiorów atrybutów.

• Wybranie tych, które zawieraj¡ rdze« CORE(B).

• Sprawdzenie, czy otrzymane podzbiory maj¡ niepuste przeci¦cie z ka»dymniepustym elementem macierzy rozró»nialno±ci M(S).

• Spo±ród otrzymanych podzbiorów atrybutów nale»y wybra¢ i usun¡¢ te,które stanowi¡ nadzbiory wyznaczonych reduktów.

• Pozostaªe podzbiory stanowi¡ redukty RED(B).

Page 86: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reduktu i rdzenia z macierzy rozró»nialno±ci

W tym celu generujemy macierz rozró»nialno±ci dla tablicy deecyzyjnej:

M(SI ) = (Hi,j )i,j=1,..,n = {a ∈ A : f (u1, a) 6= f (uj , a)}

dla i , j = 1, .., n,gdzien = |U|.

De�nition

Macierz odró»nialno±ci jest dwuwymiarow¡ macierz¡ kwadratow¡ o wymiarach:|U| × |U|. Komórka M(SI )[i , j ] zawiera zbiór tych atrybutów, dla którychobiekty uniwersum ui i uj maj¡ ró»ne warto±ci (s¡ rozró»nialne przy pomocytych atrybutów).

Page 87: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

1 2 3 4 61 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Tablica: Macierz rozró»nialno±ci dla system informacyjnego

Page 88: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Macierz rozró»nialno±ci a redukt i rdze« zbioru atrybutów

Istniej¡ nast¦puj¡ce zwi¡zki pomi¦dzy macierz¡ rozró»nialno±ci a j¡drem ireduktami:

CORE(A) = {a ⊆ A : cij = {a}}

dla pewnego 0 < i , j < n + 1, tzn. do j¡dra wchodz¡ te atry-buty, którewyst¦puj¡ w macierzy rozró»nialno±ci pojedynczo.

De�nition

B ⊆ A jest reduktem A wtedy i tylko wtedy, gdy B jest minimalny (w sensiezawierania zbiorów) oraz z ka»dym niepustym elementem macierzynierozró»nialno±ci M(S) ma niepuste przeci¦cie.

Innymi sªowy redukt jest to najmniejszy zbiór atrybutów, przy którym zostajezachowana dotychczasowa klasy�kacja (rozró»nialno±¢) obiektów:RED(C) = {gt} oraz CORE(C) = {gt} .

Page 89: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Podsumowanie cz¦±ci I

1. System informacyjny a system decyzyjny.

2. Tablicowa forma systemu decyzyjnego.

3. Relacja nierozró»nialno±ci, klasa abstrakcji rozró»nialno±ci.

4. Aproksymacja zbiorów obiektów.• Dolne przybli»enie, górne przybli»enie, brzeg zbioru,• dokªadno±¢ górnego i dolnego przybli»enia.

5. Usuwanie niespójno±ci z tablicy decyzyjnej.

6. Redukcja atrybutów, generowanie RED(C) oraz CORE(C):• z de�nicji,• z macierzy rózró»nialno±ci.

Page 90: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,
Page 91: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reguª minimalnych z tablic decyzyjnychCz¦±¢ II

De�nition

Generowanie reguª minimalnych z tablic decyzyjnych.Cz¦±¢ II.

Page 92: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tablica decyzyjna

Szczególnym rodzajem systemów informacyjnych s¡ tablice decyzyjne (TD).Tablic¡ decyzyjn¡ nazywamy uporz¡dkowan¡ pi¡tk¦:

TD = (U,C ,D,V , f )

gdzie:

• C ,D ⊂ A;C 6= ∅;C ∪ D = A;C ∩ D = ∅,• elementy zbioru C nazywamy atrybutami warunkowymi,

• elementy zbioru D nazywamy atrybutami decyzyjnymi,

• f nazywamy funkcj¡ decyzyjn¡.

• interpretacja U oraz V jest taka sama jak w przypadku systemuinformacyjnego, ponadto poszczególne warto±ci v dziedzin atrybutówD(v ∈ VD) b¦dziemy nazywa¢ klasami decyzyjnymi.

Page 93: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Podstawowa ró»nica mi¦dzy tablic¡ decyzyjn¡ a systemem informacyjnympolega wi¦c na tym, »e cz¦±¢ atrybutów traktujemy jako atrybuty warunkowe(C) a cz¦±¢ jako decyzyjne (D).

Page 94: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

PrzykªadTabel¦ 1 b¦dziemy traktowa¢ jako tablic¦ decyzyjn¡.Zbiór atrybutów systemu informacyjnego dzielimy na dwa podzbiory: podzbióratrybutów warunkowych (C) oraz podzbiór atrybutów decyzyjnych (D) wnast¦puj¡cy sposób:

• C = {Bol_glowy ,Bol_miesni ,Temperatura} = {g ,m, t}• D = {Grypa} = {c}

Page 95: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tablice decyzyjne deterministyczne i niedeterministyczne

Ka»dy obiekt u ⊂ U tablicy decyzyjnej TD = (U,C ,D,V , f ) mo»e zosta¢zapisany w postaci zdania warunkowego (postaci: je»eli warunki to decyzja) iby¢ traktowany jako reguªa decyzyjna.Reguª¡ decyzyjn¡ w tablicy decyzyjnej TD nazywamy funkcje:g : C ∪ D → V

je»eli istnieje x ∈ U, taki, »e g = fx .Obci¦cie g do C (g |C) oraz g do D (g |D) nazywamy odpowiednio warunkamioraz decyzjami reguªy decyzyjnej g .

Page 96: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy decyzyjne

Przykªad

Z przykªadowej tablicy decyzyjnej z tabeli 1 mo»emy wyprowadzi¢ nast¦puj¡cereguªy (odpowiadaj¡ce konkretnym obiektom):

1. je»eli (g=�nie�) i (m=�tak�) i (t=�wysoka�) to (c=�tak�)

2. je»eli (g=�tak�) i (m=�nie�) i (t=�wysoka�) to (c=�tak�)

3. je»eli (g=�tak�) i (m=�tak�) i (t=�bardzo wysoka�) to (c=�tak�)

4. je»eli (g=�nie�) i (m=�tak�) i (t=�bardzo wysoka�) to (c=�tak�)

5. je»eli (g=�tak�) i (m=�nie�) i (t=�wysoka�) to (c=�nie�)

6. je»eli (g=�nie�) i (m=�tak�) i (t=�normalna�) to (c=�nie�)

Page 97: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy decyzyjne - rodzaje reguª

Reguªy decyzyjne mo»na dzieli¢ na wiele ró»nych grup bior¡c pod uwag¦ ró»nekryteria. Jeden z podziaªów wyró»nia dwie grupy reguª:

• reguªy deterministyczne

• reguªy niedeterministyczne

Page 98: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy deterministyczne

De�nition

Reguªa w tablicy decyzyjnej TD jest deterministyczna, gdy równo±¢ atrybutówwarunkowych implikuje równo±¢ atrybutów decyzyjnych.

Mówi¡c ja±niej: reguªa jest deterministyczna gdy zawsze dla tych samych

warto±ci atrybutów warunkowych podaje na wyj±cie tak¡ sam¡ decyzj¦ systemu

- czyli tak¡ sam¡ warto±¢ atrybutu decyzyjnego. Fakt ten mo»emy wyrazi¢ przypomocy nast¦puj¡cej zale»no±ci dla obiektów tablicy decyzyjnej:

∀ x,y∈Ux 6=y

(∀c ∈ C

(f (x , c) = f (y , c))⇒ ∀d ∈ D

(f (x , d) = f (y , d)))

Page 99: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy niedeterministyczne

Reguªa w tablicy decyzyjnej TD jest niedeterministyczna, gdy równo±¢atrybutów warunkowych nie implikuje równo±ci atrybutów decyzyjnych, como»na wyrazi¢ nast¦puj¡c¡ zale»no±ci¡ dla obiektów tablicy decyzyjnej:

∀ x,y∈Ux 6=y

(∀c ∈ C

(f (x , c) = f (y , c)) ∧ ∃d ∈ D

(f (x , d) 6= f (y , d)))

Page 100: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy decyzyjne: deterministyczne i niedeterministyczne

Tablica decyzyjna jest deterministyczna (dobrze okre±lona, spójna), gdywszystkie reguªy w niej zawarte s¡ deterministyczne, w przeciwnym przypadkujest niedeterministyczna (¹le okre±lona,niespójna).

Tablica decyzyjna z tabeli jest niedeterministyczna, gdy» reguªy pochodz¡ce zobiektów: 2i 5 s¡ niedeterministyczne.

∀ 2,5∈U26=5

(∀c ∈ C

(f (2, c) = f (5, c)) ∧ ∃d ∈ D

(f (2, d) 6= f (5, d)))

a dokªadniej:

f (2, c) = f (5, c) : (g = tak) ∧ (m = nie) ∧ (t = wysoka)

f (2, d) 6= f (5, d) : bo(c = tak)|2 6= (c = nie)|5

Page 101: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji

Z uwagi na rzeczywiste zastosowania tablice decyzyjne najcz¦±ciej posiadaj¡tylko jeden atrybut decyzyjny, dlatego w dalszej cz¦±ci rozwa»a« przyjmiemy, »eD = {d}. Wszystkie de�nicje mog¡ jednak w prosty sposób zosta¢ uogólnionena przypadek, kiedy zbiór atrybutów decyzyjnych posiada wi¦cej ni» jedenelement.

Page 102: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Center for Machine Learning and Intelligent Systems at the University ofCalifornia

Page 103: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Center for Machine Learning and Intelligent Systems at the University ofCalifornia

Page 104: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Center for Machine Learning and Intelligent Systems at the University ofCalifornia

De�nition

171 zbiorów danych rzeczywistych

1. Zastosowanie: klasy�kacja (113),regresja (12),grupowanie (5),inne (43)

2. Typ atrybutów: porz¡dkowe (35), numeryczne (59), mieszane (54)

3. Typ danych: Multivariate (131), Univariate (3), ci¡gªe (8), Time-Series(13), Text (8), Domain-Theory (13), inne (21)

4. Obszar: Life Sciences (47), Physical Sciences (27),CS Engineering(26),Social Sciences (14) Business (5),Game (8),Other (43)

5. Liczba atrybutów: < 10 (39), (10, 100 > (81), > 100 (16)

6. Liczba obiektów: < 100 (10), (100, 1000 > (75), > 1000(63)

7. Format: Matrix (122), Non-Matrix (49)

Page 105: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 106: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 107: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 108: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 109: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 110: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 111: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 112: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Page 113: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Niech TD = (U,C , {d},V , f ) b¦dzie tablic¡ decyzyjn¡ i niech B ⊆ C .

De�nition

Relacj¦ nierozró»nialno±ci wzgl¦dem decyzji d na zbiorze obiektów U

generowan¡ przez zbiór atrybutów B de�niujemy jako:

IND(B, d) = {(x , y) ∈ U × U : (x , y) ∈ INDSI (B) ∨ f (x , d) = f (y , d)}

Page 114: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji

Relacja nierozró»nialno±ci wzgl¦dem decyzji ró»ni si¦ od relacjinierozró»nialno±ci tym, »e nie rozró»nia obiektów maj¡cych takie same warto±cidecyzji nawet wtedy, gdy obiekty te ró»ni¡ si¦ na rozwa»anym podzbiorzeatrybutów warunkowych B. Relacja nierozró»nialno±ci wzgl¦dem decyzji nie jestrelacj¡ równowa»no±ci. Jest co prawda zwrotna i symetryczna, ale nie jestprzechodnia.

Page 115: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Macierz, tablica, funkcja oraz wektor odró»nialno±ci dla tablicy decyzyjnej

Je±li TD = (U,C , {d},V , f ) jest tablic¡ decyzyjn¡ tak¡, »e U = {u1, .., un} iC = {c1, .., cm}, to macierz odró»nialno±ci tablicy decyzyjnej TDM(TD, d)de�niujemy nast¦puj¡co:

M(TD, d) = (Hi,j )i,j=1,..,n = {c ∈ C : f (ui , c) 6= f (uj , c)

∧f (ui , d) 6= f (uj , d)

dla i , j = 1, .., n gdzie n = |U|.

Page 116: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Macierz rozró»nialno±ci dla tablicy decyzyjnej - przykªad

Obliczmy macierz odró»nialno±ci dla tablicy decyzyjnej z tabeli 1.

U/U 1 2 3 4 5 61 ∅ ∅ ∅ ∅ g,m t2 ∅ ∅ ∅ ∅ ∅ g,m,t3 ∅ ∅ ∅ ∅ m,t g,t4 ∅ ∅ ∅ ∅ g,m,t t5 g,m ∅ m,t g,m,t ∅ ∅6 t g,m,t g,t t ∅ ∅

Tablica: Macierz odró»nialno±ci dla tablicy decyzyjnej

Zasada !Patrzymy tylko na te obiekty, które maj¡ przeciwn¡ decyzj¦, i wypisujemy wkomórce macierzy atrybuty warunkowe, które ró»ni¡ te obiekty.

Page 117: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Reguªy minimalne

Znanym algorytmem generuj¡cym reguªy na podstawie tablicy decyzyjnej jestalgorytm zamieszczony w pracy Z. Pawlaka i A. Skowrona z 1993 roku.Poniewa» algorytm dziaªa dla tablic spójnych, na pocz¡tku sprawdza si¦spójno±¢ tablicy decyzyjnej. W przypadku wyst¡pienia niespójno±ci usuwa si¦ j¡za pomoc¡ uogólnionego atrybutu decyzyjnego lub metody jako±ciowejusuwanianiespójno±ci z tablicy decyzyjnej.

Page 118: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Od tablicy decyzyjnej do reguª

Generowanie reguª minimalnych:

1. Doprowad¹ tablic¦ do spójno±ci, np. wprowadzaj¡c uogólniony atrybutdecyzyjny.

2. Usu« identyczne obiekty.

3. Utwórz macierz nierozró»nialno±ci

4. Dla ka»dej warto±ci atrybutu decyzyjnego:

5. Utwórz uogólnion¡ macierz nierozró»nialno±ci wzgl¦dem decyzji.

6. Zapisz funkcj¦ nierozró»nialno±ci, zminimalizuj j¡.

7. Zapisz reguª¦ decyzyjn¡ na podstawie zminimalizowanej funkcjirozró»nialno±ci.

Page 119: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generowanie reguª minimalnych � przypomnienie dziaªa« w algebrze Boola

Algebra Boola jest to struktura matematyczna A = (X ,+, ∗,¬, 0, 1)speªniaj¡ca nast¦puj¡ce aksjomaty:

• ª¡czno±¢ i przemienno±¢:• x + y = y + x• x ∗ y = y ∗ x• (x + y) + z = x + (y + z)• (x ∗ y) ∗ z = x ∗ (y ∗ z)

• 0 jest elementem neutralnym dla + : x + 0 = x

• 1 jest elementem neutralnym dla ∗ : x ∗ 1 = x

• x + (¬x) = 1

• x ∗ (¬x) = 0

• rozdzielno±¢ + i ∗ wzgl¦dem siebie:• x ∗ (y + z) = (x ∗ y) + (x ∗ z)• x + (y ∗ z) = (x + y) ∗ (x + z)

• dwa dziaªania ¬ si¦ znosz¡: ¬¬x = x

• prawa de Morgana• ¬(x ∗ y) = (¬x) + (¬y)• ¬(x + y) = (¬x) ∗ (¬y)

Page 120: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Macierz rozró»nialno±ci dla tablicy decyzyjnej

Tablica decyzyjna

Macierz rozró»nialno±ci dla tablicy decyzyjnej1 2 3 4 6

1 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Page 121: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Generujemy funkcje rozró»nialno±ci dla poszczególnych decyzjiUproszczony zapis

• funkcja dla reguªy nr 1: t

• funkcja dla reguªy nr 2: g +m + t

• funkcja dla reguªy nr 3: g + t

• funkcja dla reguªy nr 4: t

• funkcja dla reguªy nr 6: (t) ∗ (g +m + t) ∗ (g + t) ∗ (t)

co zapisujemy jako:

• fMG (A, {tak},X1) = t

• fMG (A, {tak},X2) = g +m + t

• fMG (A, {tak},X3) = g + t

• fMG (A, {tak},X4) = t

• fMG (A, {nie},X6) = (t) ∗ (g +m + t) ∗ (g + t) ∗ (t)ale po kolei...→ nast¦pna strona...

Page 122: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}dla obiektu X1

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X1:MG(A, {tak},X1) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {tak},X1).

1 2 3 4 61 ∅ g,m g,t t t

3. fMG (A, {tak},X1) = t

4. Minimalizujemy funkcj¦ fMG (A, {tak},X1) - nie ma co minimalizowa¢ !

5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X1) toPRIMEMG (A, {tak},X1) = {t}

Page 123: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {tak},X1) = {t} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. t = wysoka⇒ σA = {tak}

Page 124: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}dla obiektu X2

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X2:MG(A, {tak},X2) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {tak},X2).

1 2 3 4 62 g,m ∅ m,t g,m,t g,m,t

3. fMG (A, {tak},X2) = g +m + t

4. Minimalizujemy funkcj¦ fMG (A, {tak},X2) - nie ma co minimalizowa¢ !

5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X2) toPRIMEMG (A, {tak},X2) = {g +m + t}

Page 125: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na implikantach pierwszychPRIMEMG (A, {tak},X2) = {g +m + t} i oryginalnej tablicy mo»emyzapisa¢ 3 reguªy minimalne:

3. g = tak ⇒ σA = {tak}4. m = nie ⇒ σA = {tak}5. t = wysoka⇒ σA = {tak}

Page 126: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}dla obiektu X3

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X3:MG(A, {tak},X3) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {tak},X3).

1 2 3 4 63 g,t m,t ∅ g g,t

3. fMG (A, {tak},X3) = g + t

4. Minimalizujemy funkcj¦ fMG (A, {tak},X3) - nie ma co minimalizowa¢ !

5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X3) toPRIMEMG (A, {tak},X3) = {g + t}

Page 127: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na implikantach pierwszychPRIMEMG (A, {tak},X3) = {g + t} i oryginalnej tablicy mo»emy zapisa¢ 2reguªy minimalne:

3. g = tak ⇒ σA = {tak}4. t = bardzowysoka⇒ σA = {tak}

Page 128: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}dla obiektu X4

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X4:MG(A, {tak},X4) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {tak},X4).

1 2 3 4 64 t g,m,t g ∅ t

3. fMG (A, {tak},X4) = t

4. Minimalizujemy funkcj¦ fMG (A, {tak},X4) - nie ma co minimalizowa¢ !

5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X4) toPRIMEMG (A, {tak},X4) = {t}

Page 129: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {tak}

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {tak},X4) = {t} ioryginalnej tablicy mo»emy zapisa¢ 1 reguª¦ minimaln¡:

3. t = bardzowysoka⇒ σA = {tak}

Page 130: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {nie}dla obiektu X6

1. Wyliczamy reguªy minimalne dla σA = {nie} czyli reguªy postaciα⇒ σA = {nie}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X6:MG(A, {nie},X6) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {nie},X6).

1 2 3 4 66 g,t m,t g g,t ∅3. fMG (A, {nie},X6) = t ∗ (g +m + t) ∗ (g + t) ∗ (t)4. Minimalizujemy funkcj¦

fMG (A, {nie},X6) = tt ∗ (g +m+ t) ∗ (g + t) = (ttg + ttm+ ttt)(g + t) =(ttgg+ tttg+ ttmg+ tttm+ tttg+ tttt) = (tg+ tg+ tmg+ tm+ tg+ t) =(tg + tmg + tm + t) = tg(1+m) + t(1+m) = tg + t = t(g + 1) = t

5. Zatem implikanty pierwsze funkcji fMG (A, {nie},X6) toPRIMEMG (A, {nie},X6) = {t}

Page 131: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {nie}

1. Wyliczamy reguªy minimalne dla σA = {nie} czyli reguªy postaciα⇒ σA = {nie}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {nie},X6) = {t} ioryginalnej tablicy mo»emy zapisa¢ 1 reguª¦ minimaln¡:

3. t = normalna⇒ σA = {nie}

Page 132: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wygenerowane reguªy optymalne -baza: PACJENCI

1. if t = wysoka then grypa = tak

2. if g = tak then grypa = tak

3. if m = nie then grypa = tak

4. if t = bardzo wysoka then grypa = tak

5. if t = normalna then grypa = nie

Ostatecznie otrzymamy 2 optymalne reguªy decyzyjne:

• dla decyzji c = tak:if t = wysoka ∨ g = tak ∨m = nie ∨ t = bardzo wysoka then grypa = tak

• dla decyzji c = nie:if t = normalna then grypa = nie

Page 133: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Przykªadowa tablica decyzyjna

Page 134: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tablica jest niespójna

WniosekTablica jest niespójna!

Page 135: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wprowadzamy uogólniony atrybut decyzyjny σA

Decyzja:

Wprowadzamy uogólniony atrybut decyzyjny σA

Page 136: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Teraz w tablicy wyst¦puj¡ powielone obiekty

Obserwacja:

Teraz w tablicy wyst¦puj¡ powielone obiekty

Page 137: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Eliminujemy powielone obiekty

Decyzja:

Eliminujemy powielone obiekty

Page 138: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Tworzymy macierz nierozró»nialno±ci

Krok algorytmu:

Tworzymy macierz nierozró»nialno±ci

Page 139: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0}

1. Wyliczamy reguªy minimalne dla σA = {0} czyli reguªy postaciα⇒ σA = {0}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu x1:MG(A, {0}, x1) wyznaczamy funkcj¦ nierozró»nialno±ci fMG (A, {0}, x1).

3.1 2 3 4 6 8

1 ∅ b c ab abc ac

4. fMG (A, {0}, x1) = b ∗ c ∗ (a+ b) ∗ (a+ b + c) ∗ (a+ c)

5. Minimalizujemy funkcj¦ fMG (A, {0}, x1)6. fMG (A, {0}, x1) = bc(a+ b)(a+ b + c)(a+ c) =

(abc+bc)(a+b+c)(a+c) = (abc+abc+abc+abc+bc+bc)(a+c) =(abc + bc)(a+ c) = abc + abc + abc + bc = abc + bc = bc(a+ 1) = bc

7. Zatem implikanty pierwsze funkcji fMG (A, {0}, x1) toPRIMEMG (A, {0}, x1) = {bc}

Page 140: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0}

1. Wyliczamy reguªy minimalne dla σA = {0} czyli reguªy postaciα⇒ σA = {0}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0}, x1) = {bc} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. b = 0 ∧ c = 0⇒ σA = {0}

Page 141: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {1}

1. Wyliczamy reguªy minimalne dla σA = {1} czyli reguªy postaciα⇒ σA = {1}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux2 : MG(A, {1}, x2) oraz x4 : MG(A, {1}, x4), wyznaczamy funkcj¦nierozró»nialno±ci fMG (A, {1}, x2) oraz fMG (A, {1}, x4).

3. Macierz i funkcja rozró»nialno±ci dla obiektu x21 2 3 4 6 8

2 b ∅ bc a ac abc

4. fMG (A, {1}, x2) = b ∗ (b + c) ∗ (a+ c) ∗ (a+ b + c)

5. Minimalizujemy funkcj¦ fMG (A, {1}, x2)6. fMG (A, {0}, x1) = b ∗ (b + c) ∗ (a+ c) ∗ (a+ b + c) =

(b + bc) ∗ (a+ c) ∗ (a+ b + c) = (ab + bc + abc + bc)(a+ b + c) =(ab+abc+bc)(a+b+c) = ab+ab+abc+abc+abc+abc+abc+bc+bc =ab + abc + bc = ab(1+ c) + bc = ab + bc

7. Zatem implikanty pierwsze funkcji fMG (A, {1}, x2) toPRIMEMG (A, {1}, x2) = {ab, bc}

Page 142: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {1}Macierz i funkcja rozró»nialno±ci dla obiektu x4

1 2 3 4 6 84 ab a abc ∅ c bc

1. fMG (A, {1}, x4) = (a+ b) ∗ (a+ b + c) ∗ c ∗ (b + c)

2. Minimalizujemy funkcj¦ fMG (A, {1}, x4)3. fMG (A, {1}, x4) = (a+b)(a+b+c)c(b+c) = (a+b)(a+b+c)(bc+c) =

(a+ ab+ ac + ab+ b+ bc)(bc + c) = ac + abc + abc + abc + ac + abc +abc + bc + bc + bc + bc = abc + ac + bc = bc(a+ 1) + ac == ac + bc

4. Zatem implikanty pierwsze funkcji fMG (A, {1}, x4) toPRIMEMG (A, {1}, x2) = {ac, bc}

Page 143: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {1}

1. Wyliczamy reguªy minimalne dla σA = {1} czyli reguªy postaciα⇒ σA = {1}.

2. Implikanty pierwsze funkcji fMG (A, {1}, x2) toPRIMEMG (A, {1}, x2) = {ab, bc}

3. Implikanty pierwsze funkcji fMG (A, {1}, x4) toPRIMEMG (A, {1}, x4) = {ac, bc}

4. (a = 0 ∧ b = 1) ∨ (b = 1 ∧ c = 0) ∨ (a = 1 ∧ c = 0) ∨ (b = 1 ∨ c = 0)⇒σA = {1}

5. Po uproszczeniu:• (a = 0 ∧ b = 1)⇒ σA = {1}• (a = 1 ∧ c = 0)⇒ σA = {1}• (b = 1 ∧ c = 0)⇒ σA = {1}

Page 144: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {2}

1. Wyliczamy reguªy minimalne dla σA = {2} czyli reguªy postaciα⇒ σA = {2}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux8 : MG(A, {2}, x8) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {2}, x8).

3. fMG (A, {2}, x8) = (a+ c) ∗ (a+ b + c) ∗ a ∗ (b + c) ∗ b4. Minimalizujemy funkcj¦ fMG (A, {2}, x8)5. fMG (A, {2}, x8) = (a+ c)(a+b+ c)a(b+ c)b = (aa+ ab+ ac+ ac+bc+

cc)(abb+abc) = (aaabb+aabbb+aabbc+aabbc+abbbc+abbcc+aaabc+aabbc + aabcc + aabcc + abbcc + abccc) = ab + abc = ab(1+ c) = ab

6. Zatem implikanty pierwsze funkcji fMG (A, {2}, x8) toPRIMEMG (A, {2}, x8) = {ab}

Page 145: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {2}

1. Wyliczamy reguªy minimalne dla σA = {2} czyli reguªy postaciα⇒ σA = {2}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {2}, x8) = {ab} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. a = 1 ∧ b = 0⇒ σA = {2}

Page 146: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0, 2}

1. Wyliczamy reguªy minimalne dla σA = {0, 2} czyli reguªy postaciα⇒ σA = {o, 2}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux3 : MG(A, {0, 2}, x3) , wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {0, 2}, x3).

3.1 2 3 4 6 8

3 c bc ∅ abc ab a

4. fMG (A, {0, 2}, x3) = c ∗ (b + c) ∗ (a+ b + c) ∗ (a+ b) ∗ a5. Minimalizujemy funkcj¦ fMG (A, {0, 2}, x3)6. fMG (A, {0, 2}, x3) = c(b + c)(a+ b + c)(a+ b)a =

(bc + c)(a+ ab+ ac + ab+ ab+ abc) = (abc + abc + abc + abc + abc +abc + ac + abc + ac + abc + abc + abc) = abc + ac = ac(b + 1) = ac

7. Zatem implikanty pierwsze funkcji fMG (A, {0, 2}, x3) toPRIMEMG (A, {0, 2}, x3) = {ac}

Page 147: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0, 2}

1. Wyliczamy reguªy minimalne dla σA = {0, 2} czyli reguªy postaciα⇒ σA = {0, 2}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0, 2}, x3) = {ab}i oryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. a = 0 ∧ c = 1⇒ σA = {0, 2}

Page 148: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0, 1}

1. Wyliczamy reguªy minimalne dla σA = {0, 1} czyli reguªy postaciα⇒ σA = {0, 1}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux6 : MG(A, {0, 1}, x6) , wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {0, 1}, x6).

3.1 2 3 4 6 8

6 abc ac ab c ∅ b

4. fMG (A, {0, 1}, x6) = (a+ b + c) ∗ (a+ c) ∗ (a+ b) ∗ c ∗ b5. Minimalizujemy funkcj¦ fMG (A, {0, 1}, x6)6. fMG (A, {0, 1}, x6) = (a+ b + c)(a+ c)(a+ b)cb =

(a+ ba+ ca+ ac + bc + c)(abc + bc) = (abc + abc + abc + abc + abc +abc + abc + abc + abc + abc + bc + bc) = abc + bc = bc(1+ a) = bc

7. Zatem implikanty pierwsze funkcji fMG (A, {0, 1}, x6) toPRIMEMG (A, {0, 1}, x6) = {bc}

Page 149: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla σA = {0, 1}

1. Wyliczamy reguªy minimalne dla σA = {0, 1} czyli reguªy postaciα⇒ σA = {0, 1}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0, 1}, x6) = {bc}i oryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. b = 1 ∧ c = 1⇒ σA = {0, 1}

Page 150: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

reguªy minimalne dla caªego zbioru

Otrzymujemy nast¦puj¡ce reguªy minimalne:

• b = 0 ∧ c = 0⇒ σA = {0}• (a = 0 ∧ b = 1) ∨ (a = 1 ∧ c = 0) ∨ (b = 1 ∧ c = 0)⇒ σA = {1}• a = 1 ∧ b = 0⇒ σA = {2}• a = 0 ∧ c = 0⇒ σA = {0, 2}• b = 1 ∧ c = 1⇒ σA = {0, 1}

Page 151: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Podsumowanie cz¦±ci II

1. Tablica decyzyjna.

2. Deterministyczna i niedeterministyczna tablica decyzyjna.

3. Deterministyczna i niedeterministyczna reguªa decyzyjna.

4. Relacja nierozró»nialno±ci wzgl¦dem decyzji.

5. Algorytm generowania reguª minimalnych.

6. Algorytm generowania reguª minimalnych - przykªad.

Page 152: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zasi¦g teorii zbiorów przybli»onych

Research groups of International Rough Set Society

• Institute of Computer Science, Warsaw University of Technology

• Laboratory of Intelligent Information Systems, Pozna« University ofTechnology

• Linnaeus Centre for Bioinformatics, Uppsala, Sweden

• Group of Logic, Warsaw University

• Computational Intelligence Lab, University of Manitoba

Page 153: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Podsumowanie

1. System decyzyjny to system informacyjny z wyró»nionym atrybutemdecyzyjnym.

2. Metody redukcji zbioru atrybutów.

3. Usuwanie niespójno±ci z tablic decyzyjnych.

4. Generowanie reguª minimalnych z tablic decyzyjnych.

Page 154: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Relacja nierozró»nialno±ci � przykªadowa tablica decyzyjna

Iloczyn kartezja«ski:

U × U = {(1, 1), (1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4)}

Ró»ne wersje relacji nierozró»nialno±ci, uzale»nione od zawarto±ci zbioru B:

• Dla B = {a} : IND(B) = {(1, 1), (2, 2), (2, 3), (3, 3), (4, 4)}• Dla B = {c} : IND(B) = {(1, 1), (1, 3), (2, 2), (2, 4), (3, 3), (4, 4)}• Dla B = {b, c} : IND(B) = {(1, 1), (1, 3), (2, 2), (3, 3), (4, 4)}

Page 155: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Klasy abstrakcji � przykªadowa tablica decyzyjna

• Dla B = {a} : U/IND(B) = {{1}, {2, 3}, {4}}• Dla B = {b, c} : U/IND(B) = {{1, 3}, {2}, {4}}• Dla B = {a, b, c} : U/IND(B) = {{1}, {2}, {3}, {4}}• Dla B = {c} i x = 1 : [x ]IND(B) = {1, 3}• Dla B = {c} i x = 2 : [x ]IND(B) = {2, 4}• Dla B = {a, b} i x = 1 : [x ]IND(B) = {1}

Page 156: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie j¡dra z de�nicji

Zakªadamy, »e B = {a, b, c}1. U/IND(B) = {{1}, {2}, {3}, {4}}2. U/IND(B − a) = {{1, 3}, {2}, {4}} - a jest niezb¦dny

3. U/IND(B − b) = {{1}, {2}, {3}, {4}} - b jest zb¦dny

4. U/IND(B − c) = {{1}, {2}, {3}, {4}} - c jest zb¦dny

J¡dro CORE(B) = {a}

Page 157: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

1. Zakªadamy, »e B = {a, b, c}2. Potencjalne redukty to:{a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}

3. Ale wiemy ju», »e CORE(B) = {a}4. Skoro j¡dro utrzymuje rozró»nialno±¢ obiektów w systemie, to nie mo»emy

atrybutów z j¡dra zredukowa¢.

5. Pozwala to zaw¦zi¢ zbiór potencjalnych reduktów do:{a}, {a, b}, {a, c}, {a, b, c}

6. Samo j¡dro jest interesuj¡cym kandydatem na redukt. Z de�nicji speªniaju» pierwszy warunek dla reduktu � jest zbioremnie zale»nym.

7. Czy jednak U/IND({a}) = U/IND({a, b, c})?8. Sprawd¹my drugi warunek: U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}9. U/IND({a}) = {{1}, {2, 3}, {4}}10. J¡dro CORE(B) = {a} nie jest reduktem.

Page 158: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

Czy B1 = {a, b} jest reduktem?Czy B1 jest niezale»ny?

1. U/IND(B1) = {{1}, {2}, {3}, {4}}2. U/IND(B1− {a}) = {{1, 3}, {2}, {4}} - {a} jest niezb¦dny3. U/IND(B1− {b}) = {{1}, {2, 3}, {4}} - {b} jest niezb¦dny

Zbiór B1 jest niezale»ny, speªnia pierwszy warunek reduktu.

Page 159: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

Czy B1 = {a, b} jest reduktem?Czy B1 zachowuje tak¡ sam¡ rozró»nialno±¢ obiektów jak B?

1. U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}2. U/IND(B1) = {{1}, {2}, {3}, {4}}

Widzimy, »e:U/IND({a, b, c}) = U/IND(B1)ZatemZbiór B1 jest reduktem.

Page 160: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

Czy B2 = {a, c} jest reduktem?Czy B2 jest niezale»ny?

1. U/IND(B2) = {{1}, {2}, {3}, {4}}2. U/IND(B2− {a}) = {{1, 3}, {2, 4}} - {a} jest niezb¦dny3. U/IND(B2− {c}) = {{1}, {2, 3}, {4}} - {c} jest niezb¦dny

Zbiór B2 jest niezale»ny, speªnia pierwszy warunek reduktu.

Page 161: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

Czy B2 = {a, c} jest reduktem?Czy B2 zachowuje tak¡ sam¡ rozró»nialno±¢ obiektów jak B?

1. U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}2. U/IND(B2) = {{1}, {2}, {3}, {4}}

Widzimy, »e:U/IND({a, b, c}) = U/IND(B2)ZatemZbiór B2 jest reduktem.

Page 162: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczanie reduktów z de�nicji

Ostatecznie, dla rozwa»anego systemu informacyjnego i zbioru B = {a, b, c}zbiór reduktów RED(B) :

RED(B) = {{a, b}, {a, c}}

Page 163: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczenie j¡dra i reduktów z macierzy nierozró»nialno±ci

Wyznaczenie j¡dra i reduktow z de�nicji jest niewygodne. Wyznaczaniereduktów uªatwi macierz nierozró»nialno±ci. Dla danego systemuinformacyjnego SI = (U,A), gdzie U = {x1, x2, ..., xn} oraz podzbioruatrybutow B ⊆ A, macierz nierozró»nialno±ci M(SI ) = [cij ]nxn de�niujemynast¦puj¡co:

cij = {a ∈ A : a(xi ) 6= a(xj ), i , j = 1, 2, ..., n}

Ka»dy element macierzy cij jest zbiorem atrybutow ró»ni¡cych i-ty i j-ty obiektz U. Zakªadamy, »e B = {a, b, c}

Page 164: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Wyznaczenie j¡dra i reduktów z macierzy nierozró»nialno±ci

Wyznaczanie j¡dra CORE(B):Do rdzenia wchodz¡ atrybuty wyst¦puj¡ce w macierzy nierozró»nialno±cipojedynczo.

CORE(B) = {a ∈ A : cij = {a}}

, dla pewnego 1 <= i , j <= n

Wyznaczanie reduktów RED(B) :Pewien podzbiór atrybutów C ⊆ B jest reduktem je±li jest minimalny (w sensiezawierania zbiorów)oraz posiada niepuste przeci¦cie z ka»dym niepustym elementem macierzyM(SI ).

CORE(B) = {a} , bo c13 = {a}RED(B) = {{a, b}, {a, c}}poniewa»:{a, b} ∧ cij 6= ∅ i {a, c} ∧ cij 6= ∅i te zbiory s¡ minimalne.

Page 165: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Jeszcze jeden przykªad

a b c d e1 0 1 0 1 T2 1 0 0 1 T3 1 1 1 0 T4 1 1 1 1 T5 0 1 0 0 N

gdzie B = {a, b, c, d}

1. U/IND(B) = {{1}, {2}, {3}, {4}, {5}}2. U/IND(B − {a}) = {{1}, {2}, {3}, {4}, {5}}3. U/IND(B) = U/IND(B − {a})→ atrybut a jest zb¦dny

4. U/IND(B − {b}) = {{1}, {2}, {3}, {4}, {5}}5. U/IND(B) = U/IND(B − {b})→ atrybut b jest zb¦dny

6. U/IND(B − {c}) = {{1}, {2}, {3}, {4}, {5}}7. U/IND(B) = U/IND(B − {c}) → atrybut c jest zb¦dny

8. U/IND(B − {d}) = {{1, 5}, {2}, {3, 4}}9. U/IND(B) 6= U/IND(B − {d})→ atrybut d jest niezb¦dny,

10. CORE(B) = {d}

Page 166: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiory przybli»one w praktyce

• proces diagnozowania encefalomiopatii mitochondrialnych jest dªugi: bodªugi jest czas potrzebny do postawienia ostatecznej diagnozy. St¡dzastosowanie systemu ekspertowego, który ma ten czas skróci¢.

• Dane na podstawie których podejmowano decyzje (stawiano diagnoz¦), jakka»de dane rzeczywiste, byªy obarczone bª¦dami:• niepeªno±¢ informacji (niektóre badania, czy te» obserwacje, nie byªy

mo»liwe do wykonania dla wszystkich pacjentów),• nieostro±¢ (nieprecyzyjno±¢) poj¦¢ (warto±ci niektórych parametry podawane

byªy w sposób nieprecyzyjny),• sprzeczno±¢ informacji (pojawiali si¦ pacjenci, u którzy przy tych samych

warto±ciach analizowanych parametrów, postawione zostaªy ró»ne diagnozy).

Page 167: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zbiory przybli»one w praktyce

• baza wiedzy utworzona na podstawie wcze±niej zdiagno-zowanychpacjentów (dane treningowe).

• na podstawie bazy wiedzy powinna by¢ dokonywana klasy�kacja nowychprzypadków (pacjentów).

• W naszym przypadku zbiór treningowy zªo»ony byª z pacjentówpodejrzanych o encefalomiopatie mitochondrialne, którym postawiono ju»diagnoz¦. Dane, które byªy pó¹niej poddawane klasy�kacji to nowipacjenci podejrzani o MEM, wymagaj¡cy postawienia diagnozy.

Page 168: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Zastosowania teorii zbiorów przybli»onych

• Od czasu powstania w 1982 roku, teoria zbiorów przybli»onych znalazªabardzo liczne zastosowania w informatyce, w takich dziedzinach jak:systemy ekspertowe, systemy wspomagania decyzji, uczenie na podstawieprzykªadów, rozpoznawanie obrazów i wiele innych.

• Powstaªo wiele programów, zarówno dla komputerów osobistych (PC) jak istacji roboczych wykorzystuj¡cych teori¦ zbiorów przybli»onych. Programyte maj¡ zastosowanie w wielu dziedzinach »ycia, np. medycynie,farmakologii, przemy±le, naukach spoªecznych, nauce o ziemi i wieleinnych.

• Teoria zbiorów przybli»onych przewa»nie wykorzystywana jest do analizydanych. Dane te najcz¦±ciej s¡ niepeªne i/lub niepewne. Na przykªad wmedycynie warto±ci wielu parametrów takich jak temperatura ciaªa,ci±nienie krwi, itp. s¡ podawane w sposób jako±ciowy (np. temperatura wnormie, ci±nienie krwi podwy»szone, itd.), nie za± w dokªadnychwarto±ciach liczbowych (np. temperatura = 37, 1oC , ci±nienie krwi130/90). Gªówne problemy rozwi¡zywane przy pomocy teorii zbiorówprzybli»onych w analizie danych to redukcja danych, znajdowaniezale»no±ci mi¦dzy danymi, generowanie algorytmów decyzyjnych,odpowiednie klasy�kowanie danych, znajdowanie wzorców w danych i tympodobne.

Page 169: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

• Uczenie na podstawie przykªadów (uczenie maszynowe, automatycznepozyskiwanie wiedzy, systemy ucz¡ce si¦) to nast¦pna dziedzina w którejznalazªa zastosowanie teoria zbiorów przybli»onych. Pomimo i» do tej porynie ma powszechnie akceptowanych teoretycznych podstaw ucze-niamaszynowego, zbiory przybli»one daj¡ teoretyczne postawy dorozwi¡zywania problemów pojawiaj¡cych si¦ w uczeniu maszynowym.

• Teoria zbiorów przybli»onych jest równie» wykorzystywana w metodachgenerowania i minimalizowania obwodów steruj¡cych (switching circuits),oraz w systemach diagnozowania wad - bª¦dów (fault diagnosis).

• Przetwarzanie obrazów to inne pole na którym pojawiªy si¦ aplikacjewykorzystuj¡ce teorie zbi-rów przybli»onych. Powstaªy algorytmy na bazieRS sªu»¡ce na przykªad do rozpoznawania znaków.

Page 170: dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf · (dwuczªonowe, binarne), zwykle nazywane po prostu relacjami. De nition Je±li zaªo»ymy,

Pawlak Z., (1983) Information Systems - theoretical foundations [polish],WNT, W-wa.

Pawlak Z., (1982) Rough Sets. Int. J. of Information and Computer Sci11: 344-356.

Wakulicz-Deja A., Nowak A., (2007) From an Information System to aDecision Support System, Rough Sets and Intelligent Systems Paradigms,Lecture Notes in Computer Science,Springer Verlag, Volume 4585,454-464.