Wykład 5 - "Modelowanie upadłości firm i modele skoringowe"

1

D. Ciołek

ZASTOSOWANIA EKONOMETRIIModelowanie zmiennych jakościowych

dr Dorota Ciołek

Katedra Ekonometrii

Wydział Zarządzania UG

http://wzr.pl/~dciolek

[email protected]

http://wzr.pl/~dciolek

2

D. Ciołek

Zmienne jakościowe jako zm. objaśniane

Zmienne dwumianowe - binarne – dychotomiczne: typu TAK/NIE np. firma ogłosiła upadłość lub nie

firma jest w złej lub dobrej kondycji finansowej

spółka jest lub nie jest celem przejęcia

firma prowadzi działalność eksportową lub nie

itp.

Konstruuje się tzw. modele zmiennej dwumianowej

modele wyboru binarnego (binary choice model)

modele danych binarnych (binary response model)

Narzędzia ekonometryczne:

Linowy model prawdopodobieństwa

Model probitowy

Model logitowy

Komplementarny model log-log

3

D. Ciołek

Zmienne jakościowe jako zm. objaśniane

Zmienne wielomianowe – takie, które mają wiele kategorii (wiele wariantów), charakteryzujących się naturalnym uporządkowaniem np.

w badaniu sondażowym – gdy firma nie chce ujawnić swoich wyników sprzedażowych może odpowiedzieć na pytanie: czy sprzedaż wzrosła, pozostała na tym samym poziomie , czy spadła lub w analizie sytuacji firmy czy notowania giełdowe w określonym czasie: spadły, nie zmieniły się, wzrosły

pomiar cech niemierzalnych w badaniach ankietowych: preferencje, poglądy, zadowolenie, czy ocena: satysfakcja z pracy pracownika (bardzo niezadowolony, trochę niezadowolony, neutralny, w miarę zadowolony, bardzo zadowolony)

zmienne przedziałowe – badany nie zawsze chce (a zazwyczaj nie chce) określić dokładną wysokość swojego dochodu – prosimy o wskazanie jednego z wymienionych przedziałów

miejsce w rankingu – ranking najlepszych uczelni, odpowiedź na polecenia: proszę uszeregować wyróżnione marki samochodów od najbardziej prestiżowych do najmniej prestiżowych

4

D. Ciołek

Cele modelowania

1) Ustalenie czynników, które w danej zbiorowości są istotne dla

określenia prawdopodobieństwa P(y=1) - weryfikacja hipotezy na temat

mechanizmu generującego wartości zmiennej Y. Co jest ważne, a co jest

nieistotne?

2) Prognoza prawdopodobieństwa zdarzenia lub wystąpienia stanu

polegającego na tym, że zmienna Y przyjmie wartość 1 – prognoza

wartości zmiennej Y dla konkretnego zestawu zmiennych objaśniających –

dokonanie klasyfikacji nowego obiektu.

3) Prognoza zmiany prawdopodobieństwa P(y=1) wywołanej zmianą

wartości jednej ze zmiennych objaśniających – odpowiedź na pytanie, Jak analizowana zmienna jakościowa reaguje na zmiany czynników objaśniających? Pozwala również określić ważności poszczególnych czynników objaśniających.

4) Konstrukcja funkcji zmiennych X pozwalającej rozróżnić

(dyskryminować) dwie grupy należące do danej zbiorowości:

jedną z y=1 oraz drugą z y=0.

5

D. Ciołek

Model dla zmiennej jakościowej:

model prawdopodobieństwa

gdzie jest tzw. zmienną ukrytą (latent varable) np. dla zm. binarenej:

(Raczej) nie wykorzystuje się klasycznej regresji liniowej (Liniowego Modelu Prawdopodobieństwa) ponieważ wartości teoretyczne wyliczone z takiego modelu mogą znajdować się poza przedziałem <0,1> - niezgodne z logika prawdopodobieństwa.

k

j

iijji uxy1

0

*

*

iy

0dla0

0dla1*

*

i

i

iy

yy

6

D. Ciołek

Model logitowy - założeniaBinarna zmienna Y może przyjąć dwie wartości:

Załóżmy, że prawdopodobieństwo

Rozkład prawdopodobieństwa zmiennej Y to zerojedynkowy rozkład Bernoulliego

Funkcja prawdopodobieństwa w tym rozkładzie jest następująca:

W modelu logitowym wyjaśniamy, jak określone zmienne X

wpływają na zmienną Y, a dokładnie na prawdopodobieństwo pi .

To pi reprezentuje swego rodzaju skłonność danego osobnika lub

danej jednostki do podejmowania decyzji lub przyjmowania stanu

odpowiadającego wartości y=1.

Dotyczy to zarówno jednostek świadomie podejmujących decyzję jak i tych, które trafiają do danej kategorii, nie decydując o tym.

iiii pyPpyP 1)0(oraz)1(

1,0dla1)(1

i

y

i

y

ii yppyf ii

0lub1 ii yy

7

D. Ciołek

Model logitowy - definicja Korzysta się z rozkładu logistycznego, którego dystrybuanta to:

W modelu logitowym zmienną objaśnianą jest tzw. logit:

logarytm ilorazu szans przyjęcia oraz

nieprzyjęcia wartości 1 przez zmienną y

Logit zapisuje się jako liniowa funkcję zmiennych objaśniających X:

Metoda estymacji:

Metoda Największej Wiarygodności (Maximum Likelihood Estimation)

Uwaga: Model probitowy w praktyce daje te same wyniki estymacji:

logit = 1,6 probit

Miary dopasowania modelu są identyczne.

)'(1

1ixi

ep

i

ii

p

pplogit

1ln)(

ikikiii XXXplogit ...)( 22110

8

D. Ciołek

Etapy budowy modelu

Zebranie danych i kodowanie zmiennych jakościowych.

Kontrola braków danych – w niektórych przypadkach braki danych są równie ważne jak zebrane informacje.

Identyfikacja i kontrola obserwacji nietypowych (outliers).

Sprawdzenie zmiennych objaśniających, jak silnie wyjaśniają zmienność zmiennej objaśnianej – siła predykcyjna, jakość zmiennych.

Sprawdzenie, czy nie zachodzi zbyt wysoka korelacja między wybranymi zmiennymi objaśniającymi – bliska współliniowość.

Oszacowanie modelu.

Ocena dobroci dopasowania.

Interpretacja.

Wykorzystanie – prognozowanie, symulacje

9

D. Ciołek

Interpretacja wyników oszacowania

Jaka jest wrażliwość prawdopodobieństwa pi na zmienne objaśniające?

1) Znak oszacowania parametru przy danej zmiennej X określa kierunek

wpływu X na Y (dodatni – wzrost szans, ujemny – spadek szans).

2) Efekty krańcowe – najczęściej wyliczane są dla średnich wartości wszystkich zmiennych objaśniających.

3) tzw. ilorazy szans (odds ratio) – exp()-1 mówi o ile procent

wzrasta prawdopodobieństwo sukcesu (Y=1), jeżeli zmienna przez tym

parametrze wzrośnie o jednostkę.

4) Wyliczając wartości teoretyczne (wartości przewidywane) możemy

określić prawdopodobieństwo sukcesu (Y=1) dla poszczególnych

przypadków.

10

D. Ciołek

Sprawdzenie dopasowania modelu

Istotność statystyczna poszczególnych parametrów –

statystyka z o rozkładzie normalnym N(0,1)

Istotność całego modelu – test ilorazu wiarygodności

Hipoteza zerowa w tym teście mówi, że wszystkie parametry przy zmiennych

równają się zero, czyli, że prawdziwy jest model tylko z wyrazem wolnym.

Normalność rozkładu reszt

Dopasowanie modelu do danych rzeczywistych:

- pseudo-R2 (np. R2 McFaddena) – wyższe wartości świadczą o lepszym dopasowaniu

- tablica trafności

- krzywa ROC (a dokładniej pole powierzchni pod krzywą ROC – więcej niż 0,5 oznacza klasyfikację lepszą niż losowa)

- kryterium Akaike’a (AIC) – do porównania różnych modeli

11

D. Ciołek

Tablica trafności

wszystkie przypadki z wartościami przewidywanymi (prawdopodobieństwami) mniejszymi lub równymi 0,5 są zaklasyfikowane jako y=0,

te z wartościami przewidywanymi większymi od 0,5 jako y=1.

iloraz szans (Statistica) oblicza się jako stosunek iloczynu poprawnie zaklasyfikowanych przypadków do iloczynu niepoprawnie zaklasyfikowanych przypadków.

ilorazy szans większe od 1 wskazują, że klasyfikacja jest lepsza od klasyfikacji losowej.

im większy iloraz szans tym lepiej dopasowany model.

procent trafnych prognoz (% poprawnych) – liczba wszystkich trafnych klasyfikacji do liczby wszystkich przypadków razy 100 –tzw. zliczeniowy R2

12

D. Ciołek

Dobór próby do modelu logitowego Model opisuje na ogół zjawiska (Y=1), dla których częstość

występowania zdecydowanie różni się od 50%. Np.:

- N1 firm jest zagrożonych finansowo (Y=1)

- N2 firm nie jest zagrożonych finansowo (Y=0).

W tym przypadku N1 jest diametralnie mniejsza niż N2.

Najczęściej w celu zapewnienia wyrazistości próby spośród obu grup firm losujemy n1 i n2 jednostek w taki sposób, aby zapewnić n1=n2. Oznacza to, że próba nie jest losowa lecz jest to tzw. próba dobierana.

Proponowane są dwa rozwiązania:

Ważony estymator parametrów (estymator Manskiego-Lermana)

Wystarczy jedynie korekta wyrazu wolnego (Maddala 1983)

Zaleca, aby brać do analizy przynajmniej około 10 do 20 razy więcej przypadków (obserwacji, pomiarów, respondentów) niż występuje w niej zmiennych (pytań). W przeciwnym wypadku oceny linii regresji będą bardzo niestabilne i będą się silnie zmieniać wraz ze wzrostem liczby przypadków.

13

D. Ciołek

Obserwacje nietypowe (outliers) Z definicji nietypowe i występują rzadko – obserwacja odstająca

Związek między zmienną objaśnianą a objaśniającą dla danej obserwacji jest inny niż dla reszty obserwacji w zbiorze danych.

Uwzględnienie w analizie obserwacji nietypowych może zaburzyć wyniki.

Szczególnie mało odporne są metody i współczynniki bazujące na założeniu rozkładu normalnego i zależnościach liniowych, takie jak korelacja Pearsona, regresja liniowa, analiza korespondencji, itp.

Nawet jedna obserwacja nietypowa może znacząco zmienić wartość i znak współczynnika kierunkowego linii regresji lub współczynnika korelacji.

Zazwyczaj zakładamy, że obserwacje nietypowa reprezentują błąd losowy, który chcielibyśmy kontrolować

Stosuje się testy diagnostyczne wykrywające obserwacje nietypowe oraz tzw. obserwacje wysokiej dźwigni (leverage)

14

D. Ciołek

Wykrywanie obserwacji nietypowych Nie istnieje jedna powszechnie stosowana metoda automatycznego

usuwania odstających obserwacji - zdefiniowanie tego, co uznajemy za obserwację nietypową, jest sprawą subiektywną (i taką musi pozostać) i decyzję o identyfikacji odstających obserwacji musi badacz podejmować indywidualnie opierając się na swoim doświadczeniu oraz powszechnie akceptowanej praktyce w danej dziedzinie badań.

Niektórzy badacze używają podejścia ilościowego: Na przykład wykluczają obserwację, która wychodzi poza przedział obejmujący ±2 odchylenia standardowe (lub nawet ±1,5 odchylenia standardowego) od wartości średniej grupowej.

Popularnym sposobem wykrywania obserwacji odstających jest stworzenie wykresu ramkowego (skrzynkowego) – tzw. wykres ramka-wąsy

Test Grubbsa - polega na wyliczeniu jak daleko potencjalna obserwacja odstająca znajduje się od pozostałych wartości w zbiorze danych. Statystyka testu Grubbsa (G) - stosunek największego bezwzględnego odchylenia od średniej wartości z próby do odchylenia standardowego próby.

15

D. Ciołek

Przykład 1

Modelowanie zagrożenia finansowego i bankructwa

16

D. Ciołek

Metody oceny ryzyka upadłości

Klasyczna analiza wskaźnikowa jednowymiarowa

Analiza dyskryminacyjna: np. Z-score Altmana

Mikroekonometria finansowa – analiza logitowa:

- modele dwumianowe

- modele wielomianowe

Modele czasu trwania (duration)

Sieci neuronowe

Drzewa decyzyjne, klasyfikacyjne

Teoria chaosu

Algorytmy genetyczne

17

D. Ciołek

Zagrożenie finansowe(financial distress, corporate insolvency)

* Całkowite zdrowie przedsiębiorstwa – sytuacja najlepsza

* Zagrożenie finansowe – sytuacja pośrednia

* Upadłość (bankructwo) - sytuacja ostateczna

Kategoria płynna i dynamiczna

Brak obiektywnej miary takiego zagrożenia

Należy wyraźnie rozdzielić

modelowanie upadłości

od modelowania zagrożenia finansowego

18

D. Ciołek

Zagrożenie upadłości a upadłość W sytuacji bankructwa lub wniosku o ustalenie bankructwa rzecz

jest zero-jedynkowa – złożenie formalnego wniosku o upadłość

Wniosek o upadłość wcale nie oznacza, że firma faktycznie kwalifikuje się do upadłości – ostatnio coraz częściej upadłość jest sposobem na przetrwanie/uratowanie/przekształcenie/zmianę własności

W Polsce definiuje się tzw. „upadłość na własne życzenie” – szacuje się, że jedynie 10% upadłości w Polsce to bankructwa faktyczne.

Badania zagrożenia finansowego powinno być znacznie ważniejsze niż badanie upadłości:

Firma zagrożona finansowo – określone prawdopodobieństwo zaprzestania działalności i dalszego funkcjonowania

Firma określona przez sąd jako upadała – przestaje działać, ale perspektywy jej dalszego funkcjonowania mogą być całkiem dobre.

19

D. Ciołek

Metoda określenia zagrożenia/niewydolności finansowej

Problemy finansowe – trudno jednoznacznie ustalić

(pomijając nawet problem zatajania faktycznego stanu)

W literaturze spotyka się od 2 do 5 stanów zagrożenia finansowego

Odmienna definicja zmiennej objaśnianej – model dwumianowy lub wielomianowy uporządkowany

Pytanie: W jaki sposób „mierzyć zagrożenie finansowe – gdzie leży punkt odcięcia pomiędzy firmą z kłopotami a firmą bez kłopotów?

20

D. Ciołek

Model 1. Platt i Platt (2006)

Model dwumianowy:

yi=1 jeżeli i-ta firma jest finansowo zagrożona

yi=0 jeżeli i-ta firma jest finansowo zdrowa

Punkt odcięcia pomiędzy firmą zagrożoną a nie zagrożoną: jednocześnie ujemne wartości EBITDA, EBIT i zysku netto

Próba składała się z 276 firm zagrożonych i 1127 firm pozostałych

Informacje o firmach z lat 1999 i 2000

Pięć zmiennych objaśniających:

1. rentowność sprzedaży = (zysk netto+amortyzacja)/sprzedaż

2. rentowność aktywów = EBITDA/aktywa ogółem

3. stopa zadłużenia = bieżąca rata kapitałowa zadłużania długookresowego/aktywa ogółem

4. zdolność spłaty odsetek = zysk netto skorygowany/odsetki

5. Stopa wysokiej płynności = (majątek obrotowy – zapasy)/ zobowiązania krótkoterminowe

21

D. Ciołek

Model 1. cd

Wymienione czynniki objaśniające obliczono jako odchylenia od średnich wartości wskaźników w każdej z 14 analizowanych branż –co w pewnym stopniu pozwoliło uchwycić zróżnicowanie pomiędzy branżami (specyfikę poszczególnych branż).

Ze znaków oszacowań parametrów wynika, że:

Zagrożenie finansowe jest mniejsze przy:

- większych przepływach pieniężnych

- większym operacyjnym zysku

- większym pokryciem odsetek

Zagrożenie finansowe jest większe przy:

- większym lewarowaniu

- większej płynności

22

D. Ciołek

Ograniczenia Badania statystyczno-ekonometryczne opierają się na próbach

statystycznych, które nie odzwierciedlają sytuacji bieżącej, ale sytuację sprzed jakiegoś czasu – wnioski mają operacyjne opóźnienie.

Oznacza to, że gdyby na podstawie takiego badania podejmować szybkie decyzje operacyjne (na przykład decyzje inwestycyjne), takie decyzje mogą nie być trafne.

Dlatego korzystne w przypadku modeli upadłości warto wykorzystać dane o zmiennych objaśniających z okresów poprzedzających:

prawdopodobieństwo upadłości firmy w roku t może być objaśnione za pomocą zmiennych objaśniających z roku poprzedniego (t-1) z przed dwóch lat (t-2) lub z przed trzech lat (t-3).

23

D. Ciołek

Model 2 Ciesielski (2005)

Próba 120 firm, z których 60 sklasyfikowano jako upadłe (orzeczenia

sądowe bankructwa ogłoszone w „Monitorze Sądowym i Gospodarczym”)

Informacje o tych firmach pochodziły z lat 2000-2002

Próba podzielona na część bazową (40 bankrutów i 40 niebankrutów) oraz część walidacyjną (kontrolnej) (20 bankrutów i 20 niebankrutów)

Zmienne objaśniające:

PMO – wskaźnik pokrycia majątku obrotowego kapitałem krótkoterminowym (rezerwy i zobowiązania krótkoterminowe/aktywa obrotowe

NKA – nadwyżka/niedobór kapitału obrotowego dzielona przez aktywa ogółem

KA – wskaźnik udziału kapitału obrotowego w finansowaniu aktywów ogółem (kapitał obrotowy/suma aktywów)

BP – wskaźnik bieżącej płynności finansowej

RZ – rotacja zobowiązań

24

D. Ciołek

Model 2 Ciesielski (2005) cd

OZ – wskaźnik ogólnego zadłużenia (zobowiązania ogółem/aktywa ogółem)

PO – wskaźnik pokrycia odsetek zyskiem

WO – wskaźnik wydajności operacyjnej majątku ogółem (przepływy pieniężne z działalności operacyjnej netto/aktywa ogółem)

ROA – wskaźnik rentowności majątku

KWA – wskaźnik pokrycia majątku kapitałem własnym (kapitał własny plus zobowiązania długoterminowe/aktywa ogółem).

Model był szacowany dla wielu różnych kombinacji zmiennych objaśniających.

Wybrano te, które okazały się najlepiej przyporządkowywać firmy, które znalazły się w grupie walidacyjnej (najlepszy: 83%).

25

D. Ciołek

Przykład 2

Modele scoringowe

26

D. Ciołek

Modele scoringowe

Wykorzystywane np.:

do oceny wiarygodności klientów lub kontrahentów (np. firmy telekomunikacyjne kredytujące swoich klientów oferując im telefony za złotówkę)

do wykrywania prób wyłudzeń – ograniczenie strat generowanych przez nieuczciwych klientów

w windykacji możliwość oceny prawdopodobieństwa odzyskania należności oraz wybór najskuteczniejszej metody windykacyjnej

w procesie utrzymania klienta wskazują osoby najbardziej zagrożone odejściem

we wsparciu procesów sprzedaży wskazując osoby, które z największym prawdopodobieństwem odpowiedzą na ofertę poszczególnych produktów

27

D. Ciołek

Scoring ma zastosowanie

gdy chcemy podzielić naszych klientów na kategorie:

spłaci zobowiązanie / nie spłaci

odpowie na ofertę / nie odpowie

przyniesie zysk / nie będzie dochodowy

zagrożony odejściem / pozostanie klientem

Na podstawie cech klienta np. demograficznych, behawioralnych, budujemy model, który przewiduje prawdopodobieństwo przynależności do pożądanej przez nas kategorii.

28

D. Ciołek

Metody

Na podstawie zachowań klientów w przeszłości (dane historyczne) określamy pewne wzorce zachowań, które następnie można zastosować dla nowych klientów.

karty scoringowe

regresja logistyczna

drzewa klasyfikacyjne

sieci neuronowe

metoda wektorów nośnych

k-najbliższych sąsiadów

29

D. Ciołek

Etapy budowy modelu scoringowego Przygotowanie danych historycznych

Kodowanie danych – oznaczenie odpowiednich kategorii np. kupił/nie kupił

Wybór zmiennych objaśniających (predyktorów) – budujemy ranking zmiennych i wybieramy tylko te, które są w sposób istotny powiązane z modelowanym zjawiskiem

Podział zmiennych na przedziały – dyskretyzacja zmiennych (np. algorytm CHAID)

Oszacowanie modelu np. regresji logitowej

Budowa modelu – np. zamiana modelu regresji logitowej na kartę scoringową

Ocena dobroci dopasowania modelu

Wykorzystanie modelu

Monitoring - po jakimś czasie model wymaga aktualizacji

30

D. Ciołek

Ocena dobroci dopasowania modelu

Wskaźnik IV (Information Value)

KS – wskaźnik Kołmogorowa-Smirnowa

Wskaźnik GINI

dywergencja

Wskaźnik Hosmera-Lemeshowa

AUC – pole powierzchni pod krzywą ROC

Lift

Wykład 5 - "Modelowanie upadłości firm i modele skoringowe"

Documents

Transcript of Wykład 5 - "Modelowanie upadłości firm i modele skoringowe"