SZTUCZNE SIECI NEURONOWE

dr hab.inż. Krzysztof ZarembaInstytut RadioelektronikiPolitechnika Warszawska

Historia dziedziny• „Prehistoria”• Początki

– 1943 – W.McCulloch, W.Pitts – pierwszy formalny model neuronu;

– 1949 – Donald Hebb – „The organization of behaviour” – reguła uaktualniania wag połączeń neuronów.

Historia dziedziny• Pierwsze sukcesy

– 1957-58 – F.Rosenblatt, Ch. Wightman – PERCEPTRON;

– 1960 – B.Widrow, M.Hoff – ADALINE;– 1965 – N.Nillson – publikacja „Learning

Machines”

Historia dziedziny• Okres zastoju

– 1969 – M.Minsky, S.Papert – publikacja „Perceptrons”

– 1972, 1977 – Sun Ichi Amari – matematyczny opis sieci;

– 1980 - K. Fukushima – NEOCOGNITRON;– 1972-82 - T.Kohonen – pamięć

skojarzeniowa– 1977 – J.A.Anderson – pamięć

skojarzeniowa.– 1974,82 – S.Grossberg, G.Carpenter – teoria

sieci rezonansowych.

Historia dziedziny• Ponowny rozkwit

– ???????????????????????????

– 1983-86 – prace Johna Hopfielda;– 1986 - James McCleeland, David Rumelhard

„Parallel Distributed Processing” – „odkrycie” metody uczenia perceptronów wielowarstwowych.

– ???????????????????????????

„Parallel Distributed Processing” – „odkrycie” metody uczenia perceptronów wielowarstwowych. Metoda opublikowana wcześniej w pracy doktorskiej Paula Werbosa (1974 – Harvard).

– DARPA (Defense Advanced Research Project Agency) – dr Ira Skurnick – finansowanie badań;

„Parallel Distributed Processing” – „odkrycie” metody uczenia perceptronów wielowarstwowych. Metoda opublikowana wcześniej w pracy doktorskiej Paula Werbosa (1974 – Harvard).

Przykłady zastosowań:• Rozpoznawanie obrazów;• Rozpoznawanie i synteza mowy;• Analiza sygnałów radarowych;• Kompresja obrazów;• Prognozowanie sprzedaży;• Prognozowanie giełdy;• Interpretacja badań biologicznych i medycznych;• Diagnostyka układów elektronicznych;• Typowania w wyścigach konnych;• Dobór pracowników;• Selekcja celów śledztwa w kryminalistyce;• Typowanie w wyścigach konnych.....

KILKA PODSTAWOWYCH CECH MÓZGU• ODPORNY NA USZKODZENIA;• ELASTYCZNY – ŁATWO DOSTOSOWUJE SIĘ DO ZMIENNEGO OTOCZENIA;• UCZY SIĘ - NIE MUSI BYĆ PROGRAMOWANY;• POTRAFI RADZIĆ SOBIE Z INFORMACJĄ ROZMYTĄ, LOSOWĄ, ZASZUMIONĄ LUB NIESPÓJNĄ;• W WYSOKIM STOPNIU RÓWNOLEGŁY;• MAŁY, ZUŻYWA BARDZO MAŁO ENERGII.

KILKA PODSTAWOWYCH CECH MÓZGU

Komputer „widzi” inaczej

• LICZBA POŁĄCZEŃ SYNAPTYCZNYCH W MÓZGU: 1010 – 1011; • GĘSTOŚĆ POŁĄCZEŃ SYNAPTYCZNYCH: ~ 104/NEURON;• CZĘSTOTLIWOŚĆ GENERACJI SYGNAŁÓW PRZEZ NEURON: ~ 1 – 100 Hz;• SZACUNKOWA SZYBKOŚĆ PRACY: ~ 1018

OPERACJI/S (DLA PORÓWNANIA NAJSZYBSZE KOMPUTERY ~ 1012

OPERACJI/S.

PRZYSZŁOŚĆ - SZTUCZNY MÓZG ?????

„If the human brain were so simple that we could undrestand it,we would be so simple that we couldn’t”

- Emerson Pugh -

INSPIRACJE NEUROFIZJOLOGICZNE

Neuron (komórka nerwowa)

INSPIRACJE NEUROFIZJOLOGICZNE

Neuron (komórka nerwowa)

Model neuronu McCullocha-Pittsa

T. . . . . .

x0x1x2

yWi = 1

i=1,2,....,n Reguła pobudzenia neuronu:

Txwgdy

Txwgdyky

Model neuronu McCullocha-Pittsa

PRZYKŁADY ELEMENTARNYCH FUNKTORÓW LOGICZNYCH

-1 y NOR

SZTUCZNA SIEĆ NEURONOWAZbiór prostych elementów przetwarzających informację (sztucznych neuronów), które komunikują się między sobą za pomocą dużej liczby połączeń o zróżnicowanych wagach, zmienianych w procesie uczenia

GŁÓWNE ASPEKTY MODELOWANIA SIECI NEURONOWYCH:

• Architektura (topologia) sieci• Strategia (reguła) uczenia sieci

SZTUCZNY NEURON

ijiji xwnet. . . x1x2

F(neti) yi

neti – efektywny stan wejścia neuronui - zewnętrzne wzbudzenie (offset, bias)

TYPY NEURONÓW (TOPOLOGIA):- wejściowe; - ukryte;- wyjściowe.

SPOSÓB AKTUALIZACJI STANÓW NEURONÓW:- SYNCHRONICZNY – wszystkie neurony uaktualniają stan równocześnie;- ASYNCHRONICZNY:

- w każdym kroku aktualizujemy stan jednego, losowo wybranego neuronu;- każdy neuron aktualizuje swój stan w sposób niezależny od innych, z pewnym, z reguły stałym, prawdopodobieństwem modyfikacji w czasie t.

FUNKCJA WZBUDZENIA NEURONU

Przykładowe funkcje wzbudzenia:

Funkcja progowa (a) i funkcja aktywacji perceptronu

(a) (b)

Funkcja logistyczna (sigmoidalna): f(x) = 1/(1+e-x)

Funkcja tangens hiperboliczny (a) i przeskalowany arcus tangens (b)

(a) (b)

TOPOLOGIE (ARCHITEKTURY SIECI)

SIECI JEDNOKIERUNKOWE (FEEDFORWARD)

SIECI REKURENCYJNE

I1 I2 I3 In11 2 3 n

Podział ze względu na liczbę warstw:• Jednowarstwowe, dwuwarstwowe, ....• Jednowarstwowe, wielowarstwowe

METODY UCZENIA SIECI• Uczenie z nauczycielem (nadzorowane, asocjacyjne)• Uczenie bez nauczyciela (bez nadzoru)GŁÓWNE REGUŁY MODYFIKACJI WAG:

• REGUŁA HEBBA:wij = •yi•yj

• REGUŁA DELTA (WIDROWA-HOFFA):wij = •(di – yi)•yj

ADALINE

y Y’=sgn(y)

Tjjxwy

Błąd odpowiedzi sieci:

kk ydL

L – liczba wektorów w zbiorze uczącym;

ADALINE – metoda gradientowa uczenia

Kształt „powierzchni błędu” i zasada maksymalnego spadku

Estymacja gradientu E:

zatemE

)(2)()1(

:)( 22

ALGORYTM UCZENIA SIECI:1. Inicjalizuj wagi sieci jako niewielkie liczby

losowe;2. Oblicz wartość kwadratu błędu k(t);

k(t) = (dk-wTxk);

3. Oblicz zmianę wag w: w(t) = 2k(t)xk;

4. Uaktualnij wektor wag w(t+1):w(t+1)=w(t)+ w(t);

5. Powtarzaj kroki 1-4 dopóki błąd nie osiągnie akceptowalnej wartości.

(a) (b)

Idealna (a) i rzeczywista (b) trajektoria końca wektora wag w procesie uczenia sieci.

PERCEPTRONY JEDNOWARSTWOWE

. . . . .

. . . . . x

PERCEPTRONY JEDNOWARSTWOWEJednostki progowe: yi=sgn(neti+i)Dla i =0: yi=sgn(wi

Płaszczyzna decyzyjna:

i = 0: i 0:

FUNKCJE SEPAROWALNE LINIOWO

n Liczba możliwych funkcji

Liczba funkcji separowalnych liniowo

1 4 4 (100%)

2 16 14 (87,5%)

3 256 104 (40,6%)

4 65536 1882 (2,9%)

5 4,3109 94572 (2,2 10-3%)

6 1,81019 5028134 (2,8 10-11%)

REGUŁA UCZENIA PERCEPTRONUJednostki nieliniowe:Funkcja błędu (kosztu):

)()(21)(

i xxwww

))((' ki

ydnetfnety

kiijij xnetfydtwtw )(')()()1(

FORMY NIELINIOWOSCI NEURONUFunkcja logistyczna:

)1()exp(1

11)exp(1

1;)exp(1

1 yyxxdx

Bipolarna funkcja sigmoidalna:

;1)exp(1

2 yydxdy

Funkcja tangens hiperboliczny:

)1(1;)exp()exp()exp()exp()( yy

xxxxxtghy

PERCEPTRONY WIELOWARSTWOWE

. . . . .

wskaźnik j

wskaźnik h

wskaźnik k

REGUŁA UCZENIA WARSTWY WYJŚCIOWEJ:

kiih ynetfydw )(')(

netfydw

xnetfw

REGUŁA UCZENIA WARSTWY UKRYTEJ:

PROBLEMY UCZENIA SIECI:

• Minima lokalne• Paraliż sieci• Wolna zbieżność lub brak zbieżności;• Przetrenowanie sieci

Minima lokalne:

Przykładowy „krajobraz” funkcji kosztu Rozwiązania:• Wprowadzenie „bezwładności”;• Metoda symulowanego wyżarzania;• Uczenie genetyczne .....

Paraliż sieci:

Typowa nieliniowa charakterystyka neuronu

Rozwiązanie:Właściwa inicjalizacja wag

Niekorzystny punkt pracy

Wolna zbieżność lub brak zbieżności:

(a) – zbyt mała wartość współczynnika szybkości uczenia sieci;

(b) - zbyt duża wartość współczynnika szybkości uczenia;(c) - prawidłowa wartość współczynnika szybkości uczenia.

„Przetrenowanie” sieci:

Rozwiązanie:Właściwa struktura sieci oraz zbiorów: uczącego i testowego

Przykładowe zastosowanie: NETtalk

Przykładowe zastosowanie: autopilot

Parametry analizowane przez sieć

Struktura sieci

UCZENIE BEZ NADZORU

Przykładowe zadania stawiany sieciom uczonym bez nadzoru:• Klasyfikacja (grupowanie);• Redukcja wymiarowości (kompresja);• Wyodrębnianie cech znaczących;•...................

UCZENIE Z RYWALIZACJĄ (SIECI WTA – Winner Takes All)

. . . . .

. . . . . x1 x2 x3 xn

y1 y2 ym

Neuron zwycięski

Wektory wejść x i wag w znormalizowane do długości jednostkowej

Pobudzenie neuronu i:

neti = wiT·x = cos()

gdzie - kąt pomiędzy wektorami wi i x.

Zwycięża neuron najsilniej pobudzony i na jego wyjściu pojawia się stan „1”, na wyjściach pozostałych – stan „0”. Uczony jest wyłącznie neuron zwycięski:

Wi*j(t+1) = Wi*j(t) + [xjk - Wi*j(t)] (reguła Grossberga)

Idea uczenia konkurencyjnego:

Uczenie konkurencyjne: (a) początkowe i (b) końcowe położenia końców wektorów wag. - koniec wektora danych; - koniec wektora wag.

Sieci zachowujące topologię bodźców – wzorzec biologiczny

Homunculus – obraz rozmieszczenia obszarów mózgu odpowiedzialnych za funkcje motoryczne

Sieci zachowujące topologię bodźców – wzorzec biologiczny

Połączenia miedzyneuronowe realizujące oddziaływania boczne (lateralne)

Funkcja „meksykańskiego kapelusza” opisująca oddziaływania lateralne

Algorytm Kohonena (rozszerzenie metody WTA)

wi(t+1) = wi(t) + (t)•h(i,i*) •[x(t) – wi(t)]

gdzie: (t) – współczynnik szybkości uczenia (zmienny w czasie);

x(t) – wektor wejściowy;

h(i,i*) – funkcja sąsiedztwa;

i* - indeks neuronu zwycięskiego.

FUNKCJA SĄSIEDZTWA:h(i,i*) = exp(-|ri – ri*|2 / 2 (t)2)

gdzie: ri, ri* – wektory określające położenia neuronów i, i*;

(t) – wariancja rozkładu, determinująca zasięg działania funkcji sąsiedztwa.

Algorytm Kohonena – przykład zastosowania

Algorytm Kohonena – przykłady zastosowań

Mapa fonemów

Problem podróżującego komiwojażera

Przyszłość ??????

SZTUCZNE SIECI NEURONOWE

Documents

Transcript of SZTUCZNE SIECI NEURONOWE

Sztuczne sieci neuronowe w analizie procesów odlewniczychfluid.ippt.pan.pl/metro/CDROM-PL/kursy/METRO-pdf-pl/metro-ippt-lec… · Sieci neuronowe należądo systemów uczących się.

Klasyfikacja Bayesowska · • metody symboliczne (drzewa i reguły decyzyjne), • metody oparte na logice matematycznej (ILP), • sztuczne sieci neuronowe, • metody k-najbliższych

Sztuczne sieci neuronowe - aplikacje w analizie danych eksperymentalnych

Sieci neuronowe: pomysl - mimuw.edu.plawojna/SID/wyklady/sieci_neuronowe.pdf · Sieci neuronowe: pomysl Na±la d o w ani e mózgu dziaª a j ¡ cego jak o sie¢ k omó rek neurono

SID Wyk ad 8 Sieci neuronowe - Uniwersytet Warszawskiwjaworski/SI/wyklad8.pdf · 2014. 3. 19. · Sieci neuronowe: sztuczne i naturalne Komputer M.zg Jednostki obliczeniowe 1 CPU

Sieci neuronowe - wprowadzeniezsi.tech.us.edu.pl/~nowak/asi/w5.pdf · Diagnoza sieci neuronowej - odpowiednio nauczonej - poprawna w 92%, o 4% lepsza niż wynik lekarzy specjalistów.

Sieci neuronowe w problemach modelowania, identyfikacji i sterowania procesów

Sieci neuronowe – bezmodelowa analiza danych? K. M. Graczyk IFT, Uniwersytet Wrocławski Poland.

Optoelektroniczne sieci neuronowe

Sieci neuronowe - AGH University of Science and Technology · sieci neuronowe jako modele rzeczywistych mózgów, tłumacz ące ich zachowania w okre ślonych sytuacjach Szczególnie

formalnie: Jednokierunkowe sieci neuronowe i dane (z ominięciem efektu GIGO)...

Zastosowanie narzędzi klasyfikacyjnych opartych na ... · ciem technik statystycznych i metod sztucznej inteligencji oraz możliwość połączenia ... sieci neuronowe oraz inne

Seminarium: Sieci Neuronowe i Statystykaaba/SSNiS/subSSNiS/nowak.pdfSeminarium: Sieci Neuronowe i Statystyka 22.05.2006 Uczenie sieci MLP Celem jest wyznaczenie macierzy W wektorów

Sieci neuronowe

Wykorzystanie sieci neuronowych Analiza sygnału EKG do filtracji … · 2013. 6. 12. · sieci neuronowe także są przydatne, ale nie są jedynym dobrym rozwiązaniem, bo regresja

Sieci neuronowe w Statistica - zsi.tech.us.edu.plzsi.tech.us.edu.pl/~nowak/si/nnS.pdf · •Podstawowym elementem składowym sztucznej sieci neuronowej jest element przetwarzający

Sztuczne sieci neuronowe w doświadczeniach nad fizyką spinową w CERN

Sieci neuronowe - wprowadzenie - Zakład Systemów ...zsi.tech.us.edu.pl/~nowak/si/SI_w4.pdf · Sieci neuronowe - wprowadzenie Agnieszka Nowak - Brzezińska The brain - that's my

Sztuczne sieci neuronowe. Uczenie, zastosowania · a 2 Sztuczne sieci neuronowe •Metody uczenia •Budowa modelu •Algorytm wstecznej propagacji błędu •Zastosowania SSN

Sieci Neuronowe w Ujeciu Algorytmicznym Stanisław Osowski