Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a...
Transcript of Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a...
Általános statisztika IHavasy, György
Molnár, Máténé
Szunyogh, Zsuzsanna
Tóth, Mártonné
Korpás, Attiláné
Csernyák, László
Általános statisztika IHavasy, GyörgyMolnár, MáténéSzunyogh, ZsuzsannaTóth, MártonnéKorpás, AttilánéCsernyák, László
Publication date 1996Szerzői jog © 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt.
Szerkesztette:
Dr. Korpás Attiláné- főiskolai docens
Szerzők:
Dr. Havasy György - főiskolai docens (4. fejezet)
Dr. Molnár Máténé - főiskolai docens (3. fejezet)
Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet)
Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet)
A gyakorlófeladatokat:
Dr. Korpás Attiláné állította össze.
Szakmai lektor:
Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa
A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!
iii
Tartalom1. A statisztika alapfogalmai .......................................................................................................................................................................... 1
1.1. A statisztika tárgya és szerepe ....................................................................................................................................................... 11.2. A statisztikai sokaság és ismérv ...................................................................................................................................................... 21.3. Statisztikai adat .............................................................................................................................................................................. 61.4. Statisztikai csoportosítás és összehasonlítás ................................................................................................................................. 101.5. Viszonyszámok ............................................................................................................................................................................. 151.6. Átlagok ......................................................................................................................................................................................... 181.7. Gyakorlófeladatok ......................................................................................................................................................................... 25
2. Egy ismérv szerinti elemzés .................................................................................................................................................................... 302.1. A mennyiségi ismérv szerinti elemzés ........................................................................................................................................... 30
2.1.1. A mennyiségi ismérv .......................................................................................................................................................... 302.1.2. Gyakorisági sorok .............................................................................................................................................................. 322.1.3. Értékösszegsor .................................................................................................................................................................. 412.1.4. A gyakorisági sorok grafikus ábrázolása ............................................................................................................................. 472.1.5. Helyzetmutatók .................................................................................................................................................................. 542.1.6. Szóródási mutatók ............................................................................................................................................................. 712.1.7. Az aszimmetria mérőszámai .............................................................................................................................................. 812.1.8. A koncentráció elemzése ................................................................................................................................................... 83
2.2. Az időbeli ismérv szerinti elemzés ................................................................................................................................................ 872.2.1. Idősorok ............................................................................................................................................................................ 872.2.2. Dinamikus viszonyszámok .................................................................................................................................................. 892.2.3. Az idősorok grafikus ábrázolása ......................................................................................................................................... 932.2.4. Az idősorok elemzése átlagokkal ........................................................................................................................................ 94
2.3. Gyakorlófeladatok ....................................................................................................................................................................... 1003. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése .............................................................................................. 107
3.1. A statisztikai táblákról általában ................................................................................................................................................... 1073.2. Az egyszerű táblák elemzése ...................................................................................................................................................... 110
3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása ................................................................... 1113.2.2. A fejlődési tendenciák kimutatása, összehasonlítása ......................................................................................................... 117
3.3. A csoportosító táblák elemzése ................................................................................................................................................... 1233.3.1. Rész- és összetett viszonyszámok ................................................................................................................................... 1243.3.2. Szerkezet- és dinamikai változás vizsgálata ...................................................................................................................... 127
3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése .................................................................................................... 1333.4.1. Függvényszerű kapcsolat. Függetlenség ........................................................................................................................... 1393.4.2. Az asszociáció szorosságának mérése ............................................................................................................................. 141
Általános statisztika I
iv
3.4.3. A vegyes kapcsolat elemzése ........................................................................................................................................... 1493.4.4. A korreláció elemzése csoportosított adatokból kiindulva ................................................................................................... 165
3.5. Gyakorlófeladatok ....................................................................................................................................................................... 1724. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása ........................................................................................................... 180
4.1. A standardizálás módszere ......................................................................................................................................................... 1804.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire ............................................................ 184
4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása ........................................................................................... 1864.2.2. Az összetétel különbözőségének hatása ........................................................................................................................... 188
4.3. Indexszámítás standardizálás alapján (hányadosfelbontás) ........................................................................................................... 1894.3.1. A főátlagindex .................................................................................................................................................................. 1904.3.2. A részátlagindex .............................................................................................................................................................. 1924.3.3. Az összetételhatás indexe ................................................................................................................................................ 194
4.4. Alkalmazási területek .................................................................................................................................................................. 1954.4.1. Az átlagbérek időbeli változásának vizsgálata ................................................................................................................... 1964.4.2. Az átlagárak időbeli változásának vizsgálata ..................................................................................................................... 198
4.5. Gyakorlófeladatok ....................................................................................................................................................................... 2025. Érték-, ár- és volumenindexek ............................................................................................................................................................... 209
5.1. Az indexszám fogalma ................................................................................................................................................................ 2095.2. Érték-, ár- és volumenindex-számítás .......................................................................................................................................... 209
5.2.1. Indexszám számítása aggregát formában ......................................................................................................................... 2115.2.2. Az indexek átlagformái ..................................................................................................................................................... 213
5.3. Az indexek súlyozása ................................................................................................................................................................. 2185.4. Összefüggések az indexszámításban .......................................................................................................................................... 221
5.4.1. Az indexszámok közötti összefüggések ............................................................................................................................ 2215.4.2. Az aggregátumok közötti összefüggések .......................................................................................................................... 2225.4.3. Csoportosított sokaságra számított indexek ...................................................................................................................... 224
5.5. Az indexszámok gyakorlati alkalmazása ...................................................................................................................................... 2275.6. Indexsorok .................................................................................................................................................................................. 229
5.6.1. Az indexsorok közötti összefüggések ................................................................................................................................ 2345.7. Területi indexek .......................................................................................................................................................................... 2355.8. Gyakorlófeladatok ....................................................................................................................................................................... 238
A. Irodalom ............................................................................................................................................................................................... 2476. Tárgymutató .......................................................................................................................................................................................... 248
v
Az ábrák listája2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája ...................................................................................................................... 482.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja ................................................................................................................ 492.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok ............................................................................. 502.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja .......................................................................................................... 522.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja ................................................................................................... 532.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja .............................................................................................. 542.7. ............................................................................................................................................................................................................. 552.8. ............................................................................................................................................................................................................. 562.9. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 582.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése ...................................................................... 692.11. ........................................................................................................................................................................................................... 712.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe) ................................................................................................. 862.13. A takarékbetét-állomány alakulása ...................................................................................................................................................... 932.14. A Magyarországra érkező turisták számának alakulása ........................................................................................................................ 942.15. Az épített lakások számának alakulása ............................................................................................................................................... 983.1. A statisztikai táblák típusai .................................................................................................................................................................. 1103.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva ................................................................................................. 1213.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva ................................................. 1213.4. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 1323.5. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 1333.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat ................................................................................... 1685.1. ........................................................................................................................................................................................................... 224
vi
A táblázatok listája1.1. Példák a sokaságokra ............................................................................................................................................................................ 31.2. Csoportosító sor általános sémája ........................................................................................................................................................ 101.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban ............................................................................... 111.4. A népesség megyék szerinti megoszlása 1994. január 1-jén .................................................................................................................. 121.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál ............................................................................................................. 141.6. Az 1 főre jutó GDP néhány európai országban 1993-ban ....................................................................................................................... 141.7. A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén .......................................................................................... 161.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál ................................................................................................ 171.9. Magyarország 1993. évi idegenforgalmát jellemző adatok ...................................................................................................................... 172.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m3-ben) .................................................. 302.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m3-ben) ........................................................................................................ 312.3. A gyakorisági sorok általános sémája ................................................................................................................................................... 332.4. A lakások szobaszám szerinti eloszlása ................................................................................................................................................ 352.5. A társasház lakásainak megoszlása a vízfogyasztás szerint ................................................................................................................... 362.6. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 372.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában .............................................................................................. 382.8. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 392.9. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 402.10. Az értékösszegsor általános sémája .................................................................................................................................................... 412.11. A település háztartásainak taglétszám szerinti eloszlása ...................................................................................................................... 422.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint .......................................................................................... 422.13. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 432.14. Munkatábla az osztályközép meghatározásához .................................................................................................................................. 442.15. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 452.16. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 462.17. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................. 472.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint ......................................................... 502.19. Munkatábla a medián becsléséhez ...................................................................................................................................................... 612.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok ....................................................................................... 632.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok ......................................................................................... 652.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) .................................................................................... 702.23. Munkatábla az átlagos eltérés és a szórás számításához ..................................................................................................................... 752.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői ......................................................................................................................... 812.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén ........................................... 842.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) ..................................................................................... 85
Általános statisztika I
vii
2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én) ............................................................................. 882.29. Magyarországra érkező külföldi turisták számának alakulása ................................................................................................................ 882.30. A bázis- és láncviszonyszámok számítása ........................................................................................................................................... 902.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én) ......................................................................................... 902.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai ............................................................................................ 952.33. Az épített lakások számának alakulása Magyarországon ...................................................................................................................... 973.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok) ................................................. 1073.2. A magyarországi népesség életkor szerinti megoszlásának alakulása ................................................................................................... 1083.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.) .................................. 1093.4. Az orvosi ellátás néhány adata (december 31-i adatok) ....................................................................................................................... 1113.5. Orvosi ellátásra vonatkozó adatok ....................................................................................................................................................... 1143.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok) ................................................................................................... 1183.7. Az egészségügyi ellátásra vonatkozó adatok ....................................................................................................................................... 1183.8. A csoportosító tábla általános sémája ................................................................................................................................................. 1233.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) .............................................................. 1253.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.) .................................................................. 1263.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok) .................................................................... 1273.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása ............................................................ 1283.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok) .......................................... 1293.14. A magyarországi lakásállományra vonatkozó adatok .......................................................................................................................... 1313.15. A kontingenciatábla sémája ............................................................................................................................................................... 1353.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint(1990. január 1.) ....................................................................................................................................................................................... 1363.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal) ............................................................................ 1373.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint ............................................................................................... 1383.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint ................................................................................................. 1383.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok ..................................................................................................... 1393.21. Kontingenciatáblázat alternatív ismérvek esetén ................................................................................................................................. 1413.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 1433.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 144
3.24. A függetlenség feltételezésével számított gyakoriságok ( ) ............................................................................................................... 146
3.25. A számítása ................................................................................................................................................................................ 1473.26. A vegyes kapcsolat adatbázisa ......................................................................................................................................................... 1493.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben) ................................................ 1503.28. A kontingenciatábla sémája vegyes kapcsolat esetén ......................................................................................................................... 1523.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint ................................. 153
Általános statisztika I
viii
3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok ................................................................................................................ 1563.31. A vizsgált ipari szervezetekre vonatkozó adatok ................................................................................................................................. 1603.32. A korrelációs tábla sémája ................................................................................................................................................................ 1653.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint ........................................... 1663.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 1673.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 1714.1. Jövedelem- és létszámadatok két vállalkozásnál .................................................................................................................................. 1804.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása ........................................................................................... 1824.3. Két ország halandósági viszonyainak alakulása (fiktív adatok) .............................................................................................................. 1844.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben ........................................................................................................ 1904.5. A lakosság összetételének változása ................................................................................................................................................... 1954.6. Egy vállalkozás munkaügyi adatai ....................................................................................................................................................... 1964.7. 4.7. táblázat ....................................................................................................................................................................................... 1964.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai ....................................................................................................... 2005.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 1993–1994-es években ........................ 2105.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek ................................................................................ 2115.3. Az indexek kiszámítási képleteinek áttekintő táblázata ......................................................................................................................... 2175.4. A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket forgalmazó üzletben .............................. 2255.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években ......................................................................................... 2295.6. Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva ............................................................................................ 2305.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában ........................................................................... 236
1
1. fejezet - A statisztika alapfogalmai1.1. A statisztika tárgya és szerepe
A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információravan szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek ésegyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának.
A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység.
A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenységúgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, atermények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vettekezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak azegyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve – amihez nagy lendületetadott a valószínűség-számítás kialakulása és tételeinek elterjedése – önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellettszéles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntésekelőkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is.
A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása,elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése.
A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana.
A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatávalfoglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, azenergiatermelés, a lakosság fogyasztása stb.
A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikaimódszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést.
A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Idesorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredményekáttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait(tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majdcsoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb.A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük.
A statisztika alapfogalmai
2
A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körűmegfigyelés túl költséges – így gazdaságtalan – és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylagkis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire,tulajdonságaira.
Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségénekellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggésekvizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagyazok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét.
Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabbanhasznált elemzési eszközöket tárgyalja.
A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát.
Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkeláltalánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja.Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb.
1.2. A statisztikai sokaság és ismérvA statisztika – mint már említettük – mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik.
A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket – a halmaz elemeit – asokaság egységeinek nevezzük.
Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya;tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzettegységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb.
Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrétsokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaságegy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb.
A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatvaértelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás)1 és a vándorlási különbözet2 miatt állandóan változhat. Ezért e
1Az élveszületések és halálozások különbsége.
A statisztika alapfogalmai
3
sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor)3értelmezhető, „ragadható meg”. Ugyanakkor a Videoton-gyár termelése –mivel a termelés egy folyamat – időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Azidőpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknaknevezzük.
A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesensokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számúegyed megfigyelésével végezzük.
A sokaságok fajtáit szemlélteti az 1.1. táblázat:
1.1. táblázat - Példák a sokaságokra
A sokaságmegnevezése egysége fajtája
Zala megyeszemélygépkocsi-állománya1995. december 31-én
egy személygépkocsi diszkrét, álló, véges
A lakosság takarékbetét-állománya 1995. július 31-én
egymilliárd (millióstb.) Ft betétállomány
folytonos, álló, véges
1995-ben Nógrád megyében
született gyermekek
egy gyermek diszkrét, mozgó, véges
Magyarország 1995. évi
sörfogyasztása
egy liter (hektoliter,üveg stb.)
sörfogyasztás
folytonos, mozgó,véges
A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető.
Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok.
Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területielhelyezkedés, a vállalkozás profilja.
2A megyébe letelepülő és elköltöző népesség különbsége.3Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni.
A statisztika alapfogalmai
4
Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb.,a gépkocsi fogyasztása esetén pedig számadatok.
Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattalrendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyiváltozata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők.
Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységeiegyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznekegymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük.
Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I.évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozásidőpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elértpontszáma stb.
Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg.Az ismérvek fajtái:
– időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek.
Ismérvváltozatai: időpontok, időszakok.
(Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.)
– területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek.
Ismérvváltozatai: földrajzi egységek.
(Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.)
– minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai.
(Pl. a főiskolai hallgatók neme, a gépkocsik típusa.)
– mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük.
(Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.)
A statisztika alapfogalmai
5
Mérési szintek
A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetségesváltozatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1;nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azazmérésének tekinthető.
A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezekbizonyos tulajdonságaihoz.
A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg:
– névleges skála,
– sorrendi skála,
– intervallumskála,
– arányskála.
A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségiismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyennominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják,közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelmenincs.
A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatókosztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán – bár a sorszámokközötti különbség azonos (egy-egy) – az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyresorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésbőlszármazó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendiségekerül kihasználásra.
Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valósinformációt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározásaönkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok(pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak.A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 °C-os és a + 5 °C-os hőmérséklet összege + 25 °C, vagyhogy a 20 °C-os hőmérséklet kétszerese a 10 °C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető.
A statisztika alapfogalmai
6
Pl. az 5 °C és a 10 °C közötti különbség azonos a 15 °C és 20 °C közötti különbséggel. A 20 °C és 30 °C közötti különbség kétszerese az előbbibármelyik különbségnek.
Az arányskálán történő mérés – a legmagasabb mérési szint – nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont atulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhezszükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb.
1.3. Statisztikai adatA statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma.
A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérésieredmény.
A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adattehát nem pusztán a számérték maga.
Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt;1992-ről 1993-ra az
1 főre jutó reáljövedelem 5%-kal csökkent.
Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma).
Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992.december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat:
A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt.
Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő(pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk.
Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órárajutó termelés stb.
A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk.
A statisztika alapfogalmai
7
– Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntésekethozhatunk.
– Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatokalakításában.
– A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá.
E követelményeknek – az elfogadható pontosság, a gyorsaság és a gazdaságosság – egy időben általában tökéletesen megfelelni nem lehet(például a gyorsaság a pontosság ellen hat).
Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások,nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásaistb.)
A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetbenmegelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtásaelőtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennekelmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseketeredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát azadatgyűjtéstől kezdve az adatközlésig.
Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaságmegfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges.
A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani.A teljes körű megfigyelések jellegzetes példái a népszámlálások.
A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellellehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaságteljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabba teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is.
A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek.
Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaságkiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot.A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintábólszármazó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk.E mintából való következtetés – éppen a felvétel részlegessége miatt – csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk.
A statisztika alapfogalmai
8
Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várhatótermésmennyiség becsléséhez, a közvélemény-kutatásoknál stb.
A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyonrossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése.
Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, ésaz önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók azalapsokaságra.
A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatívmegfigyelés.
Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak.A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyátképező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat)gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén amegfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók.
A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat.
A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alaposszakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nemeléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást.
Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket,fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák.
Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibákszinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat ésa hibákkal torzított mért adat egymástól eltér.
A valóságos adat (A) és a mért adat különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük:
A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynélaz abszolút hiba biztosan nem nagyobb.
A statisztika alapfogalmai
9
Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának nevezzük. Így minden statisztikai adat megadható az módon. Ez a
megadási mód arra utal, hogy a valóságos adat (A) valahol az és határok között helyezkedik el.
A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyosnagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikánsszámjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el.
Ha a legutolsó kiírt számjegy helyi értéke akkor az abszolút hibakorlát:
Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban alegutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke . (Ez a közlési mód azt sugallja, hogy az utolsó három – százas, tízes, egyeshelyi értékű – számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.)
A statisztikai adat (népességszám) abszolút hibakorlátja:
Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani.
Az abszolút hiba (a) és a valóságos adat (A)
hányadosát relatív hibának, az abszolút hibakorlát és a mért adat
hányadosát a statisztikai adat relatív hibakorlátjának nevezzük.
A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni.
A statisztika alapfogalmai
10
A népességszám relatív hibakorlátja:
Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi.
A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan)lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Ígyelkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk.
1.4. Statisztikai csoportosítás és összehasonlításCsoportosítás
A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körűinformációt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerintosztályoznunk, csoportosítanunk kell.
A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint.
A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. Ekét követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik – de csak egy – kialakított osztályba.
Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzésenem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nemegyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozásoktevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú „listát” kapnánk, aminehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt.
A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat – szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozásirendszereket – alkalmazzák.
Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat):
1.2. táblázat - Csoportosító sor általános sémája
Osztály Egységek száma
A statisztika alapfogalmai
11
Összesen N
ahol a csoportképző ismérv alapján képzett i-edik osztály azonosítója,
a sokaság osztályba sorolt egységeinek száma, ún. gyakorisága,
k : a kialakított osztályok száma,
N : a sokaság egységeinek száma.
A sémából is látható, hogy a gyakoriságok összege egyenlő a sokaság elemszámával (N).
Tehát
A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorokképzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával.
Minőségi sor (1.3 táblázat):
1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban
Utazás jellege Külföldiek száma
(E fő)Turista
Kiránduló
22 804
11 719
A statisztika alapfogalmai
12
Átutazó 6 076Összesen 40 599
Területi sor (1.4. táblázat):
1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén
Megye Népesség száma (fő)BudapestBudapest egyik megyéhezsem tartozik közigazgatásilag, ezért astatisztikai kiadványokban külön sorbantüntetik fel.
Baranya
Bács-Kiskun
Békés
Borsod-Abaúj-Zemplén
Csongrád
Fejér
Győr-Moson-Sopron
Hajdú-Bihar
Heves
Jász-Nagykun-Szolnok
Komárom-Esztergom
Nógrád
Pest
1 955 696
416 405
538 560
401 323
743 835
436 639
422 448
426 738
548 942
328 754
418 858
312 295
221 032
964 939
338 245
560 888
A statisztika alapfogalmai
13
Somogy
Szabolcs-Szatmár-Bereg
Tolna
Vas
Veszprém
Zala
249 938
272 835
377 531
301 067
Összesen 10 276 968
Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Enneklényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjukterületi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.).
K: komfortos,
FK: félkomfortos,
KN: komfort nélküli.
A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó.
A statisztika alapfogalmai
14
Összehasonlítás
A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával.
Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása.
Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamataaz IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy adevizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosátszámítjuk ki.
A két szám különbsége:
A két szám hányadosa:
A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent.
Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (Akamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.)
Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket – acsoportosító sorokhoz hasonlóan – az ismérvek fajtája szerint is megkülönböztethetünk.
A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat).
1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál
Időpont Kamat (%)1995. június 23.
július 23.
3,437
3,375
Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sortszemléltet.
1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban
Ország 1 főre jutó GDP (USD)
A statisztika alapfogalmai
15
Albánia
Ausztria
Hollandia
Lengyelország
Magyarország
Németország
Portugália
Románia
Spanyolország
Svájc
Szlovákia
340
23 120
20 710
2 020
3 300
23 560
7 890
1 120
13 650
36 410
1 900
1.5. ViszonyszámokA csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám.
A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa.
Képlettel:
ahol V: a viszonyszám,
A: a viszonyítás tárgyát képező adat, amit viszonyítunk,
B: a viszonyítás alapját képező adat, amihez viszonyítunk.
A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból.
A statisztika alapfogalmai
16
Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, akoordinációs és a dinamikus viszonyszámok.
A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki.
1.7. táblázat - A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén
Nem Népesség száma (fő)Férfi
Nő
372 425
354 289Összesen 726 714
Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok:
– a férfiak aránya:
– a nők aránya:
A 20–24 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén.
A koordinációs viszonyszám a sokaság két részadatának hányadosa.
A 1.7. táblázat adataiból számítható koordinációs viszonyszámok:
– 1000 férfira jutó nők száma:
– 1000 nőre jutó férfiak száma:
A dinamikus viszonyszám két időszak (időpont) adatának hányadosa.
A statisztika alapfogalmai
17
1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál
Időpont Árfolyam (Ft/DEM)1994. július 10.
1995. július 10.
66,12
90,76
Dinamikus viszonyszám: (az 1.8. táblázat adataival számolva).
A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt.
A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük.
Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. Eviszonyszámok általában két – egymással valamilyen kapcsolatban álló – sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1-jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt.
Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma:
A különböző fajta, különböző mértékegységű – de egymással kapcsolatban álló – adatokat is statisztikai sorba rendezhetjük. Az így képzett sortleíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egyvállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példávalszemléltetjük (1.9. táblázat).
1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok
Megnevezés AdatKülföldre utazó magyarok száma (E fő)
Magyarországra érkező külföldiek száma (E fő)
– ebből turisták (E fő)
Idegenforgalom bevétele (M Ft)
12 115
40 599
22 804
110 312
A statisztika alapfogalmai
18
Idegenforgalom kiadása (M Ft) 68 961
1.6. ÁtlagokA viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni.
Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségiismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetesátlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg.
Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük:
ahol: N : a megfigyelt átlagolandó értékek száma,
az i-edik átlagolandó érték.
A különböző átlagok kiszámítását az alábbi, adatból álló számpéldával is szemléltetjük:
2 , 6 , 4 , 2 , 6 , 4 , 6 , 2 , 5 , 6.
Számtani átlag
A számtani átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.
Tehát
Ebből a számtani átlag:
Adataink alapján:
A statisztika alapfogalmai
19
Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot:
Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó
értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás -ig terjed. (Továbbra is 10 átlagolandóértékkel dolgozunk, de ezeket csoportba soroltuk be.)
Átlagolandó értékek száma
(gyakorisága) 2
4
5
6
3
2
1
4Összesen 10
A csoportosító sor sémájában bevezetett jelölések szerint:
ahol: k : az egymástól különböző átlagolandó értékek száma,
a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.
Ezt a számítási formát súlyozott formának nevezzük.
A statisztika alapfogalmai
20
A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a
gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket -vel jelölünk:
Jellemző, hogy
Példánkban:
2
4
5
6
0,3
0,2
0,1
0,4Összesen 1,0
Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk.
Számszerűen:
Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja:
a) az átlagolandó értékek abszolút nagysága.
A statisztika alapfogalmai
21
Az átlag mindig a legkisebb és legnagyobb érték közé esik:
b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el.
Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb asúlyaránya, akkor az átlag az intervallum felső határához esik közelebb.
A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak.
A számtani átlag tulajdonságai:
1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla.
Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák(különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható:
mert az átlag definíciója szerint
2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagyahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos.
Tehát
Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük.
A statisztika alapfogalmai
22
A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla:
Ebből:
Mivel pozitív, az valóban minimális.
3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg.
Tehát, ha ( ), akkor .
Ugyanis
4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik.
Tehát, ha ( ), akkor
Ugyanis
Harmonikus átlag
Aharmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad.
A statisztika alapfogalmai
23
Tehát
Ebből a harmonikus átlag :
Példánkban:
Súlyozott formában:
Adataink alapján:
Mértani átlag
Amértani átlag(jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok szorzata változatlan marad.
Tehát:
A statisztika alapfogalmai
24
Ebből a mértani átlag :
(Itt feltételezzük, hogy )
Példánkban:
Súlyozott formában:
Adataink alapján:
Négyzetes átlag
A négyzetes átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad.
Tehát:
Ebből a négyzetes átlag:
Példánkban:
A statisztika alapfogalmai
25
Súlyozott formában:
Adataink alapján:
Két nemnegatív szám számtani és mértani közepének összehasonlításáról már középiskolában is volt szó, itt bizonyítás nélkül közöljük a különbözőátlagok közötti összefüggéseket.
Ha ugyanazokból az átlagolandó értékekből, azonos súlyarányokkal számítunk különböző átlagokat, közöttük az alábbi nagyságrendi viszony áll fenn:
Példánkban:
(Az átlagok között egyenlőség csak akkor fordulhat elő, ha minden átlagolandó érték egyforma.)
1.7. Gyakorlófeladatok1. A főiskolai hallgatók anyagi és szociális helyzetét kívánjuk felmérni.
Feladat:
a) Definiáljuk a felméréshez szükséges sokaságot!
b) Fogalmazzunk meg olyan kérdéseket, amelyeket feltennénk egy elképzelt kérdőívben!
A statisztika alapfogalmai
26
c) Milyen ismérvek vannak az egyes kérdések mögött? Nevezzük meg ezeket, és adjuk meg ezek néhány lehetséges változatát!
d) Rendezzük a választott ismérveket aszerint, hogy hány változatuk van!
e) Képezzünk sorokat egy 30 fős csoportra vonatkozóan tetszőleges adatokkal!
2. Néhány sokaság:
– Az 1994-ben Magyarországon kiadott könyvek összessége.
– Az iskolai könyvtárak összes könyvállománya 1994. január 5-én.
– Színházlátogatások száma egy adott napon Budapesten.
– Egy áruház cipőosztályának forgalma a téli kiárusítás hetében.
– Üzembe helyezett beruházások nagysága 1994-ben.
– A lakosság villamosenergia-fogyasztása 1994 decemberében.
– Békés megye állatállományának nagysága 1994. március 31-én.
– Budapest népessége 1995. január 1-jén.
Feladat:
a) Nevezzük meg a fenti sokaságok típusait!
b) Mondjunk megkülönböztető ismérveket az egyes sokaságokra vonatkozóan!
c) Megfelelő módon bővítsük vagy szűkítsük az egyes sokaságokat!
d) Milyen mérési skálákon mérhetők az egyes ismérvek?
3. A közgazdaság-tudományi ághoz tartozó nappali tagozatos hallgatók adatai 1992-ben:
Nem Hallgatók száma (fő)Férfi
Nő
3731
5069
A statisztika alapfogalmai
27
Összesen 8800
Feladat:
Nevezzük meg a statisztikai sor típusát!
4. A gazdaságilag aktív népesség számának alakulása Magyarországon:
Év, január 1. Népesség (ezer fő)1985
1986
1987
1988
1989
1990
1991
1992
5591
5580
5595
5559
5519
5496
5404
5202
Feladat:
a) Nevezzük meg a statisztikai sor típusát!
b) Számítsuk ki, hogy mennyi egy-egy adat abszolút, illetve relatív hibakorlátja!
5. A hazánkba érkező turisták közül a legtöbben Romániából (5498 ezer fő), Németországból (2838 ezer fő) és Jugoszlávia utódállamaiból (2585ezer fő) érkeztek 1992-ben.
Ismerjük továbbá, hogy Európából összesen 16 688 ezer fő, Ázsiából 151 ezer fő, Afrikából 20 ezer fő, Amerikából 304 ezer fő, Ausztráliából ésÓceánia országaiból pedig 25 ezer turista érkezett.
Feladat:
Rendezzük az adatokat statisztikai sorokba!
A statisztika alapfogalmai
28
6. Statisztikai kiadványokból származnak az alábbi információk:
– 1991-ben a GDP 29,1%-a az ipari ágazatból származott.
– Az 1000 lakosra jutó élveszületések száma Magyarországon 1992-ben 11,8‰ volt.
– Az 1 főre jutó évi átlagos sertéshúsfogyasztás 1990-ben 38,8 kg volt.
– 1992-ben 25 807 lakás épült Magyarországon. A lakásépítések kedvezőtlen alakulását jellemzi, hogy 1970-hez képest 67,85%-kal épült kevesebblakás. Hány lakás épült 1970-ben?
– Az orvosellátottság jellemzésére kiszámított mutató számszerű értéke 1980-ban 28,8; 1992-ben 39,6 orvos/tízezer lakos.
– Az ipari ágazatban a maximum 500 főt foglalkoztató vállalkozások átlagos árbevétele 137 millió Ft volt 1992-ben.
– Svédországban a házasságkötési arányszám 1992-ben 4,3 ‰ volt.
– 100 aktív háztartásra 1991-ben 103 hűtőszekrény jutott.
Feladat:
Nevezzük meg az itt szereplő viszonyszámok fajtáját, adjuk meg kiszámítási módját!
7.
Átlagolandó értékek Súlyok6
16
20
6
3
1
Feladat:
a) Számítsuk ki a megadott értékek súlyozott: számtani, harmonikus, mértani és négyzetes átlagát!
b) Állapítsuk meg az átlagok nagyságrendjét!
c) Határozzuk meg a kifejezés értékeit a következő A értékek mellett: 5, 6, 8 és az esetén!
A statisztika alapfogalmai
29
8. Valamely ismérv két változata 10 és 15.
Feladat:
a) Rendeljünk ezen átlagolandó értékek mellé súlyokat többféleképpen úgy, hogy a súlyok összege először 20, majd 50, 10 és 7 legyen, továbbáa kapott átlagok mindig kisebbek legyenek a megelőzőnél!
b) Milyen súlyarányok mellett lesz az átlag éppen 12?
30
2. fejezet - Egy ismérv szerinti elemzés2.1. A mennyiségi ismérv szerinti elemzés2.1.1. A mennyiségi ismérv
A mennyiségi ismérvek rendkívül nagy szerepet töltenek be a statisztikai elemző munkában. A mennyiségi ismérveket változóknak,lehetséges kimeneteleiket (ismérvváltozataikat) ismérvértékeknek nevezzük. Az ismérvértékek intervallum- vagy arányskálán mért, valamilyenmértékegységgel bíró számértékek.
A mennyiségi ismérv lehet: diszkrét és folytonos.
A diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan végtelen, egymástól jól elkülönülő értéket vehet fel.
A folytonos mennyiségi ismérv egy adott intervallumon belül bármilyen, tehát kontinuumszámosságú értéket felvehet.
A lakásokat például (a megfigyelés időpontjában) jellemezhetjük szobaszámuk és alapterületük szerint. A lakások szobaszáma csak pozitív egészszám lehet, tehát diszkrét mennyiségi ismérv. A lakások alapterülete egy adott intervallumban (pl. 50 és 55 m2 között) bármilyen értéket felvehet,tehát folytonos mennyiségi ismérv.
A diszkrét mennyiségi ismérv értékei – elvileg, de általában gyakorlatilag is – pontosan, a folytonos mennyiségi ismérv értékei mindig csak bizonyospontosságra kerekítve adhatók meg.
Például a lakások alapterülete megadható két tizedes pontossággal: 53,78 m2, ugyanez egy tizedes pontossággal: 53,8 m2, egész számra kerekítve:54 m2. Ezért két háromszobás lakás szobaszáma biztosan azonos, de két 54 m2-es lakás alapterülete már nem biztos, hogy „pontosan” azonos (azegyik lehet 53,78 m2, a másik 54,11 m2, de a mérési – kerekítési – pontosság miatt mindkettőt 54 m2-nek tekintjük).
Ha egy sokaságot valamilyen mennyiségi ismérv szerint vizsgálunk, akkor első lépésként általában az ismérvértékeket sorba rendezzük, ún. rangsortkészítünk.
A rangsor a mennyiségi ismérv értékeinek monoton sorozata.
Szemléltető példánk a következő (2.1. és 2.2. táblázat):
2.1. táblázat - Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m3-ben)
36 14 21 23 23
Egy ismérv szerinti elemzés
31
10
20
23
16
31
24
22
20
18
34
40
26
16
17
28
29
21
12
22
18
25
31
30
22
19
17
19
26
16
17
19
21
33
24
32
11
20
22
21
15
23
18
27
17
36
Az adatok (ismérvértékek) rendezésének legegyszerűbb módja a rangsor készítése.
2.2. táblázat - A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m3-ben)
10
11
12
14
15
16
16
16
17
17
17
18
18
18
19
19
19
20
20
21
21
21
21
22
22
22
22
23
23
23
24
24
25
26
26
27
29
30
31
31
32
33
34
36
36
Egy ismérv szerinti elemzés
32
17 20 23 28 40
A lakások vízfogyasztása folytonos mennyiségi ismérv, a rangsorban található azonos értékek (pl. négy lakásnál 21 m3 a fogyasztás) 1valószínűséggel csak a mérési pontosság miatt nem különböznek egymástól.
2.1.2. Gyakorisági sorokA rangsor segít a vizsgált jelenség természetének vizsgálatában, azonban ha a megfigyelt sokaság elemszáma nagy – a statisztikai vizsgálatoknáláltalában ez jellemző –, a rangsor már nehezen áttekinthető, és nem teszi lehetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozószabályszerűség felismerését.
Ahhoz, hogy a sokaság összetételéről, szerkezetéről, belső arányairól áttekinthető képet kapjunk, az adatokat (ismérvértékeket) tömörítenünk kell.Az adatokban rejlő információk tömörítésének, sűrítésének legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása(csoportosítása). A rangsort általában éppen abból a célból készítjük, hogy megkönnyítse a sokaság egységeinek mennyiségi ismérv szerintiosztályozását.
Az osztályozás eredménye egy csoportosító sor, melynek általános sémáját az 1.4. alfejezetben már megismertük (1.2. táblázat). Ebben az esetben
a ( ) osztályok a mennyiségi ismérv lehetséges értékeinek részhalmazai. Ha az ismérvnek kevés változata van (pl. a lakások szobaszáma),akkor általában egy-egy ismérvváltozat képez egy-egy osztályt. Ha az ismérvváltozatok száma nagy (pl. ha a lakásokat alapterületük szerint, vagyaz aktív keresőket havi keresetük szerint csoportosítjuk), akkor az osztályok egynél több ismérvértéket magukba foglaló intervallumok (pl. 50–55 m2
közötti alapterület, 20 000–25 000 Ft közötti kereset stb.), melyeket osztályközöknek nevezünk.
Az 1.2. táblázatból látható, hogy a csoportosító sor tartalmazza a osztályok mellett a gyakoriságokat is.
A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik.
A gyakoriságok helyett a csoportosító sorban szerepeltethetjük a
relatív gyakoriságokat is, melyek nem mások, mint a gyakoriságokból számított megoszlási viszonyszámok. A relatív gyakoriságokat általában
százalékos formában (az hányadosok 100-zal szorzott értékei) fejezzük ki.
A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányadrésze (hány százaléka) tartozik.
Egy ismérv szerinti elemzés
33
A mennyiségi ismérv szerinti osztályozás eredményeként kapott speciális csoportosító sort gyakorisági sornak nevezzük. Ha az osztályok egyetlenismérvértékből állnak, a gyakorisági sort gyakorisági eloszlásnak, röviden eloszlásnak nevezzük, más esetekben gyakorisági megoszlásnak,röviden megoszlásnak nevezzük1.
Az eloszlás, illetve a megoszlás, mint a neve is jelzi, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között.Mint látni fogjuk, az általános az, hogy az osztályok közül némelyikben sok ismérvérték van (nagy a gyakoriság), másutt viszont kevés, és általábanminél távolabb vagyunk a nagy gyakoriságú osztályoktól, annál kevesebb.
2.3. táblázat - A gyakorisági sorok általános sémája
a) változat (eloszlás) b) változat (megoszlás)
Ismérvérték Gyakoriság Az osztályközök Gyakoriságalsó
határa felső határa
Összesen N Összesen Nc) változat (eloszlás) d) változat (megoszlás)
IsmérvértékRelatív
gyakoriságAz osztályközök
Relatív
gyakoriságalsó
határa felső határa
11 Megjegyezzük, hogy a statisztikai gyakorlatban az eloszlást és a megoszlást egymás szinonimáiként is használjuk, noha a fent leírtak elméletileg mindenképpen indokoltak. Bizonyos elméletitételek ugyanis csak az egyik esetben érvényesek.
Egy ismérv szerinti elemzés
34
Összesen 1 Összesen 1
ahol
az i-edik ismérvérték,
az i-edik osztályköz alsó határa,
az i-edik osztályköz felső határa,
az i-edik osztályhoz (osztályközhöz) rendelt gyakoriság,
az i-edik osztályhoz (osztályközhöz) rendelt relatív gyakoriság,
k : a kialakított osztályok (osztályközök) száma,
N : a sokaság elemszáma.
A gyakoriságok összege mindig egyenlő a sokaság elemszámával, azaz
A relatív gyakoriságok összege mindig egyenlő 1-gyel, tehát
és jellemző, hogy
Egy ismérv szerinti elemzés
35
A 2.3. táblázat c) és d) változatban felírt gyakorisági sorát relatív gyakorisági sornak nevezzük. (Az gyakoriságokat abszolút gyakoriságoknak
is szokás nevezni, a relatív gyakoriságoktól való megkülönböztetés érdekében.)
A gyakorisági (relatív gyakorisági) sorok képzésének – mint azt a 2.3. táblázat is mutatja – a mennyiségi ismérv fajtájától és az ismérvváltozatokszámától függően alapvetően két módja van:
a) Ha a mennyiségi ismérv diszkrét és kevés változattal rendelkezik, akkor a gyakorisági sorban minden ismérvértéket felsorolunk. Pl. a társasház50 lakását csoportosítjuk a lakások szobaszáma szerint (2.4. táblázat).
2.4. táblázat - A lakások szobaszám szerinti eloszlása
Szobák száma Lakások száma Szobák száma Lakások %-os
megoszlása
1
2
3
4
5
22
17
6
1
2
3
4
10
44
34
12Összesen 50 Összesen 100
b) Ha a mennyiségi ismérv sokféle értéket vesz fel, akkor az ismérvértékek tartományát egymást át nem fedő intervallumokra, ún. osztályközökrebontjuk. Az így képzett sort osztályközös gyakorisági (relatív gyakorisági) sornak (megoszlásnak) nevezzük. Az osztályközös gyakorisági sorképzésénél a következő követelményeknek kell eleget tenni:
– Az osztályközhatárokat úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy –osztályközbe.
– Annyi és olyan hosszúságú osztályközöket képezzünk, hogy a kapott gyakorisági sor jól tükrözze a sokaság mennyiségi ismérv szerinti összetételét.Mutassa meg a sokaság egységeinek az X ismérv (változó) nagysága szerinti megoszlásában mutatkozó szabályszerűséget.
Az első követelmény azt jelenti, hogy az osztályközhatárok megadásánál
kifejezésre kell juttatni, hogy egy adott, éppen az osztályközhatárra eső érték melyik osztályközbe tartozik. Ez elsősorban akkor okoz gondot,ha a mennyiségi ismérv folytonos. Például ha a lakásokat alapterületük szerint csoportosítjuk, az ismérv folytonos jellege azt kívánná, hogy az
Egy ismérv szerinti elemzés
36
intervallumok hézagmentesen illeszkedjenek egymáshoz, azaz az osztályközöket a következő módon jelöljük ki: 45–50 m2; 50–55 m2; 55–60 m2
stb. A hézagmentesen illeszkedő osztályközhatárokat valódi határoknak nevezzük. Ebben az esetben azonban gondot jelenthet, hogy az éppenosztályközhatárra eső 50, illetve 55 m2-es alapterület melyik osztályközbe tartozik.
Az egyértelmű besorolhatóságot a statisztikában kétféleképpen biztosíthatjuk. Az osztályközhatárokat a mérési pontosságnál nagyobb pontossággaladjuk meg (1. változat), vagy az osztályközök alsó határát a mérési pontosság egy egységével megnöveljük (2. változat). Az egyértelmű besorolásérdekében megkülönböztetett osztályközhatárokat közölt határoknak szokás nevezni.
A kétféle változatot az alábbi gyakorisági sorok szemléltetik (2.5. táblázat). Mindkét esetben 10 m3-es hosszúságú osztályközöket képezünk, ésfigyelembe vesszük, hogy az adatok 1 m3 pontosságúak .
2.5. táblázat - A társasház lakásainak megoszlása a vízfogyasztás szerint
1. változat 2. változatVízfogyasztás
(m3)Lakások száma Vízfogyasztás
(m3)Lakások száma
– 20,0
20,1 – 30,0
30,1 –
21
21
8
– 20
21 – 30
31 –
21
21
8Összesen 50 Összesen 50
Az osztályközök számának, illetve hosszának meghatározása már bonyolultabb feladat. Minden csoportosítás mindig bizonyosinformációveszteséggel: az egységek egyedi tulajdonságaira vonatkozó ismereteink elvesztésével jár. Ugyanakkor egy jó csoportosítás segíti avizsgált sokaság egészének megismerését, ami az alapadatokhoz képest többletinformációt eredményez. Ezért olyan osztályközök kialakítására kelltörekedni, amelyek jól tömörítik a vizsgált jelenség törvényszerűségeit, de még nem eredményeznek számottevő információveszteséget.
Az utóbbi feltétel az osztályközök számának növelését, míg az előbbi a csökkentését indokolja. Ezért minden osztályozás esetén törekedni kell atömörítés és részletezés közötti ésszerű kompromisszumra. Az osztályközök számának és hosszának meghatározásához a szakmai ismereteken túljó támpontot adnak a 2.1.4. alpontban ismertetendő grafikus ábrák és az alábbiakban közölt információelméleti eredményeken alapuló becslések is.
Az osztályközök száma megbecsülhető a következő módon. Az osztályközök száma azon legkisebb k, melyre már teljesül:
ahol k : az osztályközök száma,
Egy ismérv szerinti elemzés
37
N: a sokaság elemszáma.
Az osztályközök számának ismeretében az osztályközök hosszát – egyenlő hosszúságú osztályközök esetén – az alábbi módon határozhatjuk meg:
ahol h: az osztályköz hossza,
a legnagyobb ismérvérték,
a legkisebb ismérvérték.
Az osztályközök számának és hosszának meghatározásához megismert módszerek nem minden esetben alkalmazható és követendő szabályok.
Ezek csak támpontot adnak, és alkalmazásuk olyan esetben célszerű, amikor az különbség nem túl nagy, és az ismérvértékek zöme nem
az intervallum egy szűkebb szakaszán sűrűsödik.
A lakások vízfogyasztásának rangsorából (2.2. táblázat) látható, hogy e feltételek teljesülnek, így a fenti módszereket alkalmazva az osztályközökszáma meghatározható. Mivel
elegendő az ismérvértékeket 6 osztályközbe sorolni.
Az osztályközök hossza:
Így a gyakorisági (relatív gyakorisági) sor a 2.6. táblázatban látható:
2.6. táblázat - A lakások vízfogyasztás szerinti megoszlása
Vízfogyasztás
(m3)
Lakások
száma
Vízfogyasztás
(m3)
Lakások %-os
megoszlása– 15 5 – 15 10
Egy ismérv szerinti elemzés
38
16 – 20
21 – 25
26 – 30
31 – 35
36 –
16
15
6
5
3
16 – 20
21 – 25
26 – 30
31 – 35
36 –
32
30
12
10
6Összesen 50 Összesen 100
A gyakorisági sorok készítésénél azonban nem törvényszerű az egyenlő hosszúságú osztályközök képzése. A gyakorlatban sokszor különböző(egyenlőtlen) hosszúságú osztályközöket képezünk, hogy a megoszlásban mutatkozó szabályszerűség felismerhető legyen. Erre általában akkor
kerül sor, ha az különbség igen nagy és az ismérvértékek nem egyenletesen helyezkednek el az intervallumon belül, hanem zömmelaz intervallum egy vagy néhány szűkebb szakaszán sűrűsödnek. Ilyen esetben kevésbé hosszú osztályközöket képezünk az intervallum azonszakaszán, ahol az ismérvértékek zöme található, és hosszabbakat az intervallum más szakaszain. Különböző hosszúságú osztályközöket képezünkpéldául, ha a lakossági devizaszámlákat vagy betétkönyveket csoportosítjuk a betétösszeg nagysága szerint. A legnagyobb és legkisebb betétösszegközötti különbség igen nagy, és jellemző, hogy a kisebb betétösszegek nagyobb gyakorisággal, a nagyobb betétek kisebb gyakorisággal fordulnak
elő. Így az intervallum alsó szakaszán kisebb hosszúságú, a felső szakaszán nagyobb hosszúságú osztályközöket képezünk.
Ezt a megoldást választjuk a népesség 1 főre jutó jövedelem szerinti, illetve a nyugdíjasok nyugdíjnagyság szerinti csoportosításánál is.
A 2.7. táblázat szerinti – és az előző gyakorisági sorokban is – az első és utolsó (alsó és felső) osztályköz ún. nyitott osztályköz. A továbbiszámítások, elemzések során ezeket úgy kezeljük, mintha zártak lennének. Az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az
őt követőt az utolsót pedig, mint az őt megelőzőt
Kumulált gyakorisági sorok
A gyakorisági (relatív gyakorisági) sorokban rejlő információk tovább bővíthetők a gyakoriságok (relatív gyakoriságok) halmozott összeadásával,azaz kumulálásával.
2.7. táblázat - A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában
Nyugdíj
(Ft)
Nyugdíjas nők
száma (fő)
Osztályközök hossza
Egy ismérv szerinti elemzés
39
– 5 999
6 000 – 6 999
7 000 – 7 999
8 000 – 8 999
9 000 – 9 999
10 000 – 11 999
12 000 – 14 999
15 000 – 19 999
20 000 – 24 999
25 000 –
478
998
46 162
87 555
201 385
258 245
522 029
112 483
23 027
7 388
?
1000
1000
1000
1000
2000
3000
5000
5000
?Összesen 1 259 750 –
A kumulált gyakoriságok (jele: ), ill. kumulált relatív gyakoriságok (jele: ) adatai azt mutatják, hogy az adott osztályköz felső határának
megfelelő és annál kisebb ismérvértékek hányszor , ill. milyen arányban fordulnak elő. A kumulált gyakorisági, ill. kumulált relatív gyakorisági
sort úgy képezzük, hogy a gyakoriságokat , ill. relatív gyakoriságokat rendre halmozva összeadjuk.
A kumulált gyakoriságok (relatív gyakoriságok) számítását a lakások vízfogyasztására vonatkozó példa alapján mutatjuk be (2.8. táblázat).
2.8. táblázat - A társasház vízfogyasztására vonatkozó adatok
Lakások száma Lakások megoszlása (%)
Vízfogyasztás
(m3)tényleges kumulált
tényleges
( )
kumulált
( )– 15
16 – 20
5
16
5
21
10
32
10
42
Egy ismérv szerinti elemzés
40
21 – 25
26 – 30
31 – 35
36 –
15
6
5
3
36
42
47
50
30
12
10
6
72
84
94
100Összesen 50 – 100 –
Például:
A lakások 72%-ában – összesen 36 lakásban – a vízfogyasztás 25 m3 vagy annál kevesebb.
A gyakorisági (relatív gyakorisági) sorokból lefelé kumulált gyakorisági (relatív gyakorisági) sor is képezhető. E sorok adatai azt mutatják, hogy
az adott osztályköz alsó határánál nagyobb ismérvértékek hányszor , ill. milyen arányban fordulnak elő (2.9. táblázat).
2.9. táblázat - A társasház vízfogyasztására vonatkozó adatok
Lakások száma Lakások megoszlása (%)
Vízfogyasztás
(m3)
tényleges lefelé kumulált tényleges
( )
lefelé kumulált
( )– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
5
16
15
6
5
3
50
45
29
14
8
3
10
32
30
12
10
6
100
90
58
28
16
6
Egy ismérv szerinti elemzés
41
Összesen 50 – 100 –
Például:
A lakások 58%-ának – összesen 29 lakásnak – a vízfogyasztása 20 m3-nél nagyobb.
2.1.3. ÉrtékösszegsorAz előző alfejezetben a sokaság egységeit mennyiségi ismérv szerint osztályoztuk. Az osztályozás eredménye a gyakorisági sor, ami a mennyiségisorok egyik típusa. A másik típus az értékösszegsor.
Az értékösszegsor (2.10. táblázat) a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységekismérvértékeinek összegét rendeli.
A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (jele: ) nevezzük.
2.10. táblázat - Az értékösszegsor általános sémája
a) változat (eloszlás) b) változat (megoszlás)
Ismérvérték Értékösszeg Az osztályközök Értékösszeg
alsó határa felső határa
Összesen S Összesen S
ahol az i-edik osztályhoz (osztályközhöz) rendelt értékösszeg,
Egy ismérv szerinti elemzés
42
S : a sokaság teljes értékösszege.
Eloszlás esetén az egyes osztályokhoz tartozó értékösszegeket az ismérvértékek és a gyakoriságok szorzataként kapjuk:
A sokaság teljes értékösszege:
A következő gyakorisági sor valamely település háztartásainak taglétszám szerinti megoszlását mutatja (a megfigyelés időpontjában) (2.11. táblázat).
2.11. táblázat - A település háztartásainak taglétszám szerinti eloszlása
Taglétszám (fő) Háztartások száma
1
2
3
4
5
6
51
89
145
85
34
21Összesen 425
A gyakorisági sor alapján képzett értékösszegsort pedig a 2.12. táblázatban látjuk.
2.12. táblázat - A település lakosainak eloszlása az egyes háztartások taglétszáma szerint
Taglétszám (fő) Lakosok száma (fő)
Egy ismérv szerinti elemzés
43
1
2
3
4
5
6
51
178
435
340
170
126Összesen 1300
Például:
fő. Összesen 435 fő él 3 fős háztartásban.
fő. A település lakosainak száma 1300 fő.
Osztályközös gyakorisági sor esetén az egyes osztályközök tényleges értékösszegei csak akkor határozhatók meg, ha ismerjük az eloszlást.
A vízfogyasztás rangsora (adatok a 2.2. táblázatban) alapján a tényleges értékösszegsort a 2.13. táblázat mutatja.
2.13. táblázat - Az összes vízfogyasztás megoszlása
Vízfogyasztás Összes vízfogyasztás (m3)
(m3)
– 15
16 – 20
21 – 25
26 – 30
31 – 35
62
287
337
166
161
Egy ismérv szerinti elemzés
44
36 – 112Összesen 1125
Például: (a rangsorból az ötödik osztályközbe sorolt ismérvértékek összege).
A sokaság teljes értékösszege:
. A társasház összes vízfogyasztása 1125 m3.
Ha csak az osztályközös gyakorisági sor (a megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok és az osztályközepek szorzataként becsüljük.
Az i-edik osztályközépső:
Az értékösszegek becslését a lakások vízfogyasztás szerinti megoszlását mutató osztályközös gyakorisági sorból (2.6. táblázat) végezzük.
2.14. táblázat - Munkatábla az osztályközép meghatározásához
Vízfogyasztás
(m3)
Lakások száma Osztályközök
hossza
Osztályközép
– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
5
16
15
6
5
3
5
5
5
5
5
5
12,5
17,5
22,5
27,5
32,5
37,5Összesen 50 – –
Egy ismérv szerinti elemzés
45
A gyakorisági sor első és utolsó osztályköze nyitott, de a gyakorisági sor alapján végzett számítások során azokat úgy kezeljük, mintha zártaklennének:
Az osztályközepek meghatározásánál nem vesszük figyelembe az egyértelmű besorolás érdekében megkülönböztetett felső és alsóosztályközhatárokat, hanem a hézagmentesen illeszkedő, ún. valódi osztályközhatárok alapján számítjuk ki őket. Pl.
2.15. táblázat - Az összes vízfogyasztás megoszlásaVízfogyasztás Összes vízfogyasztás (m3)
(m3)
– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
62,5
280,0
337,5
165,0
162,5
112,5Összesen 1120,0
Például:
A 2.14. és 2.15. táblázat adataiból látható, hogy a tényleges és becsült értékösszegek eltérnek egymástól. Az eltérés abból adódik, hogy a becsléssorán az ötödik osztályközben feltételezzük pl., hogy az ide besorolt lakások mindegyike 32,5 m3 (az osztályközépnek megfelelő) vizet fogyaszt.
Az osztályközös gyakorisági sor alapján történő becslés annál jobban közelíti meg a tényleges értékösszegeket, minél egyenletesebb azismérvértékek eloszlása az osztályközökön belül.
Egy ismérv szerinti elemzés
46
Ha az értékösszegek – ismérvértékek szerinti – megoszlásáról is képet akarunk kapni, akkor relatív értékösszegsort képezünk.
Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét ( ) a teljesértékösszeghez (S) viszonyítja.
Az i-edik osztály relatív értékösszege (jele: ):
A relatív értékösszegekre is igaz, hogy
A 2.15. táblázat alapján a relatív értékösszegsor (2.16. táblázat):
2.16. táblázat - Az összes vízfogyasztás megoszlása
Vízfogyasztás
(m3)
Összes vízfogyasztás
megoszlása (%) – 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
5,6
25,0
30,1
14,7
14,5
10,1Összesen 100,0
A gyakorisági sorokhoz hasonlóan az értékösszegsorból és a relatív értékösszegsorból is képezhetünk kumulált, ill. lefelé kumulált sorokat (2.17.táblázat).
Egy ismérv szerinti elemzés
47
2.17. táblázat - A társasház vízfogyasztására vonatkozó adatok
Összes vízfogyasztás (m3) Összes vízfogyasztásmegoszlása (%)
Vízfogyasztás
(m3)
Kumulált
( )
Lefelé
kumulált
( )
Kumulált
( )
Lefelé
kumulált
( )– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
62,5
280,0
337,5
165,0
162,5
112,5
62,5
342,5
680,0
845,0
1007,5
1120,0
1120,0
1057,5
777,5
440,0
275,0
112,5
5,6
25,0
30,1
14,7
14,5
10,1
5,6
30,6
60,7
75,4
89,9
100,0
100,0
94,4
69,4
39,3
24,6
10,1Összesen 1120,0 – – 100,0 – –
Például:
A társasházban elfogyasztott vízmennyiség 60,7%-át – összesen 680 m3-t – azokban a lakásokban használták fel, amelyekben a vízfogyasztás25 m3 és annál kisebb volt.
2.1.4. A gyakorisági sorok grafikus ábrázolásaA statisztikai adatok szemléltetésének, a statisztikai adatok közötti arányok bemutatásának fontos eszköze a grafikus ábrázolás. A helyesenkészített ábrákkal áttekinthetőbbé válik a sokaság szerkezete, felismerhetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozószabályszerűség.
A gyakorisági (relatív gyakorisági) sorok ábrázolása derékszögű koordináta-rendszerben történik. A vízszintes tengelyen a mennyiségi ismérvértékeit, a függőleges tengelyen pedig a gyakoriságokat (relatív gyakoriságokat) vagy azok kumulált értékeit tüntetjük fel.
Egy ismérv szerinti elemzés
48
A kevés értéket felvevő diszkrét mennyiségi ismérvek esetén csak az ábrázolni kívánt gyakoriságokkal (relatív gyakoriságokkal) arányos hosszúságú,valamilyen feltűnő módon megjelölt végpontú egyenes szakaszokkal történhet az ábrázolás. Az ilyen típusú ábrát az eloszlás bot-ábrájánaknevezzük.
A 2.11. táblázat adatai alapján készített bot-ábra a 2.1. ábrán látható:
2.1. ábra - A háztartások taglétszám szerinti eloszlásának bot-ábrája
A 2.1. ábra jellege nem változna meg, ha a függőleges tengelyen az abszolút gyakoriságok helyett a relatív gyakoriságok szerepelnének.
Az osztályközös gyakorisági sorokat, amelyeket leggyakrabban folytonos mennyiségi ismérv szerinti csoportosítással képezünk, hisztogrammal ésgyakorisági poligonnal ábrázoljuk.
A hisztogram hézagmentesen egymás mellé illesztett téglalapokkal szemlélteti a gyakorisági (relatív gyakorisági) sort. (Mi a relatív gyakoriságokalapján készítettük a 2.2. ábrát.)
Egy ismérv szerinti elemzés
49
2.2. ábra - A lakások vízfogyasztás szerinti megoszlásának hisztogramja
A kumulált gyakorisági (relatív gyakorisági) sorok is szemléltethetők (2.3. ábra).
Egy ismérv szerinti elemzés
50
2.3. ábra - A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok
A hisztogram téglalapjainak területe arányos a relatív gyakoriságokkal, így a gyakoriságokkal is. A különböző osztályközhosszúságokkal képzettgyakorisági (relatív gyakorisági) sor ábrázolásánál az arányosság csak úgy biztosítható, ha az eredeti gyakoriságok (relatív gyakoriságok) helyett
az egységnyi osztályközhosszúságra jutó gyakoriságokat relatív gyakoriságokat vagy azok valamilyen többszörösét ábrázoljuk. Az eredetigyakoriságok (relatív gyakoriságok) alapján történő ábrázolás ugyanis torzítana, mivel a hosszabb osztályköz nagyobb súlyt kapna, a téglalap területeaz arányosnál nagyobb lenne. Ennek bemutatására szolgál a következő példa. Az adatokat a 2.18. táblázat tartalmazza.
2.18. táblázat - Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint
Biztosítás
díja (Ft)
Biztosítások
száma (db)
Osztályközök
hossza1000 osztályközhosszúságra
jutó gyakoriság
– 2000
2001 – 3000
15
50
1000
1000
15,0
50,0
Egy ismérv szerinti elemzés
51
3001 – 4000
4001 – 6000
6001 – 8000
8001 – 10 000
10 001 –
60
80
25
15
5
1000
2000
2000
2000
2000
60,0
40,0
12,5
7,5
2,5Összesen 250 – –
Az 1000 osztályközhosszúságra jutó gyakoriság: Pl. a negyedik osztályközben: (A hisztogramot a 2.4. ábra mutatja.)
Ha a relatív gyakoriságokat úgy ábrázoljuk, hogy az osztályköz az egység vagy a téglalapok magassága ( ), akkor a téglalapok összterülete1. Ebben az esetben sűrűséghisztogramról beszélünk.
A kumulált relatív gyakoriságok ábrázolásánál monoton növekvő függvényt kapunk, amelynek legkisebb értéke 0 és a legnagyobb 1 (százalékosformánál 100). Ilyen függvényt közvetlenül az eloszlásból is készíthetünk, ekkor eloszlásfüggvénynek nevezzük.
A gyakorisági poligon az osztályközepeknél felmért gyakoriságok (a különböző hosszúságú osztályközöknél az egységnyi osztályközhosszúságrajutó gyakoriságok) pontjait összekötő, egyenes szakaszokból álló vonaldiagram. Az első és utolsó pontot összekötjük az X tengelyen az elsőosztályközt megelőző (azzal azonos hosszúságú) osztályköz, ill. az utolsó osztályközt követő (azzal azonos hosszúságú) osztályköz középpontjával.
Egy ismérv szerinti elemzés
52
2.4. ábra - A biztosítások biztosítási díj szerinti megoszlásának hisztogramja
Egy ismérv szerinti elemzés
53
2.5. ábra - A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja
Egy ismérv szerinti elemzés
54
2.6. ábra - A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja
A 2.5 és 2.6. grafikus ábrák szemléletesen mutatják a gyakorisági eloszlás jellegzetességeit.
A következő alfejezetekben megismerkedünk azokkal a mutatószámokkal, amelyek további és egyben valamilyen számszerű információt nyújtanaka gyakorisági sorok jellegzetességeiről, az eloszlás helyzetéről, szóródásáról és alakjáról. E mutatószámok alapján, majd később látni fogjuk,akkor is képet kapunk az eloszlásról, ha nem állnak rendelkezésre az alapadatok és/vagy a grafikus ábrák.
Az eloszlás helyzete: a jellemzőnek tartott értékek – a középértékek (módusz, medián, átlag) és a kvantilisek – helye az X tengelyen. E mutatókatezért helyzetmutatóknak is szokás nevezni.
Az eloszlás szóródása: az ismérvértékek különbözősége, változékonysága, melyet a szóródás mérőszámaival vizsgálunk.
Az eloszlás alakja: szimmetrikus vagy aszimmetrikus, melyről az aszimmetriamérőszámai (alakmutatók) adnak számszerű információt.
2.1.5. HelyzetmutatókMódusz
A módusz (jele: Mo) azt az értéket jelöli, amelyik a szó hétköznapi értelmében a legáltalánosabb, amelyik a tipikus a sokaságban. Ezért tipikusértéknek is szokásnevezni .
Egy ismérv szerinti elemzés
55
Az eloszlás módusza a leggyakrabban előforduló ismérvérték, ha van ilyen érték.
A 2.11. táblázat (a háztartások taglétszám szerinti megoszlása) adataiból :
Mo = 3
A háztartások tipikus (leggyakoribb) taglétszáma 3 fő.
A gyakorisági megoszlás ún. nyers módusza a gyakorisági poligon maximumhelye, az az ismérvérték, amely körül az előforduló ismérvértékeklegjobban sűrűsödnek.
2.7. ábra -
A 2.7. ábrán látható gyakorisági poligonnak egy maximumhelye van. Az ilyen megoszlást (illetve eloszlást) egymóduszú megoszlásnak, illetveeloszlásnak nevezzük, és a móduszt mint helyzetmutatót elsősorban ilyen megoszlások, illetve eloszlások jellemzésére használjuk.
Ha a gyakorisági poligonnak több helyi maximuma van, a megoszlást, illetve az eloszlást többmóduszú megoszlásnak, illetve eloszlásnaknevezzük. Ilyen eloszlást szemléltet a 2.8. ábra.
Egy ismérv szerinti elemzés
56
2.8. ábra -
A többmóduszú eloszlások gyakran heterogén (nem egynemű) sokaságra utalnak, azaz az eloszlás több (a 2.8. ábrán kettő) egymóduszú eloszlástmutató részsokaságból tevődik össze. Ilyen esetben a teljes sokaság vizsgálata mellett – ha a heterogenitást okozó ismérv ismert – a sokaságotrészsokaságokra bonthatjuk, és az elemzést a részekre bontott sokaságokra is elvégezhetjük. Ennek részleteiről a 3. fejezetben lesz szó.
A folytonos (és a sok változattal rendelkező diszkrét) mennyiségi ismérv móduszát osztályközös gyakorisági sor alapján becsüljük.
A móduszt az az osztályköz tartalmazza, amelyben az egységnyi osztályközhosszúságra jutó gyakoriság (relatív gyakoriság) a legnagyobb. (Azismérvértékek sűrűsége, tömörülése ebben az osztályközben a legnagyobb.) A móduszt tartalmazó osztályközt modális osztályköznek nevezzük.
Azonos hosszúságú osztályközök esetén ez a legnagyobb gyakoriságú (relatív gyakoriságú) osztályköz. Különböző hosszúságú osztályközök eseténaz egységnyi osztályközhosszúságra jutó gyakoriságok (relatív gyakoriságok) alapján keressük meg a modális osztályközt.
A modális osztályköz közepét nyers módusznak nevezzük. Ha szimmetrikus a megoszlás, akkor a nyers módusz maga a módusz.
Ha nem szimmetrikus a megoszlás, akkor a módusz becsléséhez a modális osztályközzel szomszédos osztályközök gyakoriságát is figyelembevesszük. Ebben az esetben ugyanis a módusz közelebb van valamelyik osztályközhatárhoz. Feltételezhető, hogy a sűrűsödési hely közelebb esika modális osztályköz azon (alsó vagy felső) határához, amelynek nagyobb a gyakorisága.
A módusz becsült értéke:
ahol: a modális osztályköz alsó határa,
Egy ismérv szerinti elemzés
57
a modális és az azt megelőző osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,
a modális és az azt követő osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,
h : a modális osztályköz hossza.
A módusz becslését a lakások vízfogyasztásának gyakorisági sora alapján mutatjuk be (adatok a 2.6. táblázatban):
– modális osztályköz: 15–20 m3,
– osztályközök azonos hosszúságúak,
–
(mivel ezért a módusz az osztályköz felső határához esik közelebb),
A lakások tipikus vízfelhasználása 19,6 m3.
A tipikus vízfelhasználás becslése a relatív gyakorisági sor alapján (adatok a 2.6. táblázatban):
Egy ismérv szerinti elemzés
58
2.9. ábra - A lakások vízfogyasztás szerinti megoszlása
A módusz grafikus úton is becsülhető. A gyakorisági (relatív gyakorisági) sor jól szerkesztett hisztogramjának segítségével a módusz becsült értékeszerkeszthető. A 2.9. ábrán két hasonló háromszöget látunk:
Ebből:
A módusz becslését különböző hosszúságú osztályközös gyakorisági sor alapján is bemutatjuk.
A lakások tipikus biztosítási díjának becslése (adatok a 2.18. táblázatban):
Az egységnyi (1000) osztályközhosszúságra jutó gyakoriságok alapján a modális osztályköz: 3000 – 4000 Ft;
Egy ismérv szerinti elemzés
59
Medián
A medián (jele: Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint nagyobb érték fordul elő. A grafikus ábrákra gondolva,az X tengelyen az a pont, melyben az X tengelyre állított merőleges a hisztogram területét, illetve a gyakorisági poligon alatti területet felezi (kétegyenlő részre osztja).
A mediánnak van egy érdekes tulajdonsága. Ha minden ismérvértéket a mediánnal helyettesítenénk, akkor ezzel összességében a lehető legkisebb
hibát követnénk el, ha ezt a hibát az módon mérjük. Igaz ugyanis, hogy a
A mediánt az ismérvértékek rangsorából a következő módon határozzuk meg:
– Ha a megfigyelt sokaság elemszáma (N) páratlan, akkor a medián a rangsor
(azaz a középső) ismérvértékével azonos.
– Ha a sokaság elemszáma páros, akkor a a medián a két középső, azaz az
ismérvérték számtani átlaga.
A társasház vízfogyasztásának rangsora (2.2. táblázat) alapján a medián a következő módon számítható.
A megfigyelt lakások száma:
Egy ismérv szerinti elemzés
60
Tehát a medián a rangsor 25. és 26. ismérvértékének átlaga. A rangsor 25. ismérvértéke: 21 m3, a 26. ismérvértéke: 22 m3.
A lakások felében (50%-ában) a vízfogyasztás 21,5 m3-nél kevesebb, másik felében (50%-ában) ennél több.
Az osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt csak becsléssel tudjuk meghatározni.
A mediánt az az i-edik osztályköz tartalmazza, amelynél
teljesül, ahol: az i-edik osztályköz kumulált gyakorisága,
az i-edik osztályköz kumulált relatív gyakorisága,
az i-edik osztályközt megelőző osztályköz kumulált gyakorisága,
az i-edik osztályközt megelőző osztályköz kumulált relatív gyakorisága.
Feltételezve, hogy a mediánt tartalmazó osztályközön belül az ismérvértékek egyenletesen helyezkednek el, az osztályköz arányos részét azosztályköz alsó határához hozzáadva, a mediánra megfelelő becslést kapunk.
ahol: a mediánt magába foglaló osztályköz alsó határa,
a mediánt megelőző osztályköz kumulált gyakorisága,
a mediánt megelőző osztályköz kumulált relatív gyakorisága,
Egy ismérv szerinti elemzés
61
a mediánt magába foglaló osztályköz gyakorisága,
a mediánt magába foglaló osztályköz relatív gyakorisága,
h: a mediánt magába foglaló osztályköz hossza.
A medián becslését a vízfogyasztás gyakorisági sora alapján mutatjuk be (2.19. táblázat).
2.19. táblázat - Munkatábla a medián becsléséhez
Vízfogyasztás
(m3)– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
5
16
15
6
5
3
5
21
36
42
47
50
0,10
0,32
0,30
0,12
0,10
0,06
0,10
0,42
0,72
0,84
0,94
1,00Összesen 50 – 1,00 –
A harmadik osztályköz kumulált gyakorisága az első, amely már meghaladja a 25-öt, így a medián a közötti intervallumban van.
A medián becsült értéke:
illetve a relatív gyakoriságok alapján:
Egy ismérv szerinti elemzés
62
A gyakorisági sor alapján becsült érték (21,33 m3) jól közelíti a medián rangsor alapján meghatározott értékét (21,5 m3).
Az átlag
Az eloszlás helyzetének jellemzésére leggyakrabban az átlagot(jele: ) használjuk.
Az ismérvértékek átlaga egyenlő az ismérvértékek összegének és a sokaság elemszámának hányadosával, mely hányados azismérvértékek számtani átlaga.
A számtani átlag definíciója alapján könnyen belátható, hogy ha minden ismérvértéket az átlaggal helyettesítünk, akkor ezek összege egyenlő azeredeti értékek összegével:
A vízfogyasztás rangsora (2.2. táblázat) alapján a lakások átlagos vízfogyasztása:
Az ismérvértékek átlagát nemcsak az alapadatokból kiindulva, hanem
– a sokasághoz tartozó értékösszegből,
– egy gyakorisági sor adataiból, vagy
– egy értékösszegsor adataiból is számíthatjuk.
Az első esetben az átlag:
Egy ismérv szerinti elemzés
63
ahol S: a sokaság teljes értékösszege.
Példánkban a társasház összes vízfogyasztása: így az átlagos vízfogyasztás:
Gyakorisági sor alapján az ismérvértékek átlagát súlyozott számtani átlagformában számítjuk.
ahol az átlagolni kívánt ismérvértékek (osztályközös gyakorisági sor esetén az osztályközepek),
az egyes osztályokhoz (osztályközökhöz) tartozó gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.
A megoszlásból az osztályközepekkel történő számítás esetén az eloszlás átlagára becsült értéket kapunk.
2.20. táblázat - Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási díj
(Ft)
Biztosítások
száma (db)
– 2000
2001 – 3000
3001 – 4000
4001 – 6000
6001 – 8000
8001 – 10 000
10 001 –
15
50
60
80
25
15
5
1 500
2 500
3 500
5 000
7 000
9 000
11 000
0,06
0,20
0,24
0,32
0,10
0,06
0,02
Egy ismérv szerinti elemzés
64
Összesen 250 – 1,00
Az átlagos biztosítási díj (átlagdíj):
Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem az aránya befolyásolja, ezért súlyként a gyakoriságok helyett használhatók
a relatív gyakoriságok is.
Az átlagos biztosítási díj:
A számításokat a 2.20. táblázat adatainak felhasználásával végeztük.
Az ismérvértékek átlagát az értékösszegsorból súlyozott harmonikusátlag formában számítjuk. Mivel
ahol az i-edik osztály (osztályköz) értékösszege, ezért az átlag a következő formában is számítható:
mely nem más, mint az értékek (osztályközepek) súlyokkal számított harmonikus átlaga. Mivel az átlag nagyságát a súlyarányok befolyásolják,
ezért súlyként az értékösszegek helyett az hányadosok, azaz a relatív értékösszegek is használhatók:
Egy ismérv szerinti elemzés
65
A lakásbiztosításokra vonatkozó példa alapján (2.21. táblázat):
2.21. táblázat - Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási Összes bevétel
díj (Ft) (Ft) megoszlása (%) – 2000
2001 – 3000
3001 – 4000
4001 – 6000
6001 – 8000
8001 – 10 000
10 001 –
1500
2500
3500
5000
7000
9000
11 000
22 500
125 000
210 000
400 000
175 000
135 000
55 000
2,00
11,14
18,71
35,63
15,59
12,03
4,90Összesen – 1 122 500 100,00
Az átlagos biztosítási díj:
Egy ismérv szerinti elemzés
66
Kvantilisek
A középértékek mellett fontos helyzetmutatók a kvantilisek.
Legyen 0 < q < 1. Ha a rangsorba rendezett sokaságot egy X ismérvérték arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy
q-adik kvantilisnek nevezzük (jele: ).
Kumulált gyakoriságokkal, illetve kumulált relatív gyakoriságokkal felírva:
Ha a feltételnek két ismérvérték is eleget tesz, akkor ezen intervallumot arányban osztó pont lesz.
A gyakran előforduló kvantiliseket külön névvel és jelöléssel is illetjük.
Tercilisek: (alsó tercilis), (felső tercilis),
Kvartilisek: (alsó kvartilis), (medián), (felső kvartilis),
Kvintilisek:
Decilisek: ...,
Percentilisek: ...,
A kvartilisek – és egyben az összes kvantilis – rangsorból való meghatározásának és osztályközös gyakorisági (relatív gyakorisági) sorból történőbecslésének menete azonos a mediánnál ismertetett eljárással.
Ha a kvantilist a rangsorból kiindulva határozzuk meg, akkor legyen
ahol: az egész részt, a törtrészt jelöli.
Egy ismérv szerinti elemzés
67
Ekkor:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a kvartilisek meghatározása a következő.
Az alsó kvartilis számítása:
A szám egész része: törtrésze: Az alsó kvartilis tehát a rangsor 12. és 13. értéke között van; úgy határozzuk meg, hogy a rangsor 12.
ismérvértékéhez, az hozzáadjuk a 13. és 12. ismérvérték közötti különbség 0,75-szeresét:
A lakások 25%-ában a vízfogyasztás 17,75 m3-nél kevesebb, 75%-ában ennél több.
A felső kvartilis:
így és
A rangsor 38. ismérvértékéhez hozzáadjuk a 39. és 38. ismérvérték közötti különbség 0,25-szeresét:
A lakások 75%-ának a vízfogyasztása 26,25 m3-nél kevesebb, 25%-ának ennél nagyobb.
Osztályközös gyakorisági (relatív gyakorisági) sorból történő becslés esetén a kvantilist az az i-edik osztályköz tartalmazza, amelyre
illetve relatív gyakorisági sor esetén a
Egy ismérv szerinti elemzés
68
teljesül. Ekkor
ahol az i-edik osztályköz alsó határa,
az i-edik osztályköz hossza.
A kvartilisek becslését a vízfogyasztás gyakorisági sora (adatok a 2.19. táblázatban) alapján mutatjuk be.
Az alsó kvartilis becslése:
Az és a második osztályközben a kumulált gyakoriság már nagyobb, mint 12,5. Így az alsó kvartilis 15–20 m3 között van.
A felső kvartilis becslése:
A kumulált gyakoriság először a negyedik osztályközben nagyobb, mint 37,5. Ezért a felső kvartilis m3 között van.
(A gyakorisági sorból történő becslés – már a mediánnál is láttuk – elfogadható pontosságú.)
A kvantilisek jól szerkesztett ábra – a kumulált gyakoriságok (relatív gyakoriságok) hisztogramja – alapján is becsülhetők (2.10. ábra).
Egy ismérv szerinti elemzés
69
2.10. ábra - A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése
A lakossági jövedelmek vizsgálatánál gyakran a deciliseket számítjuk ki. A 2.7. táblázat a nyugdíjas nők nyugdíjnagyság szerinti megoszlását mutatja.A gyakorisági sorból a kvartilisek becslésénél megismert módon becsülhetjük a deciliseket is.
Az első decilis becslése:
A negyedik osztályközben a kumulált gyakoriság ennél nagyobb, így Ebből:
A nyugdíjas nők 10%-ának nyugdíja 8894 Ft-nál kisebb, 90%-ának ennél nagyobb volt 1994 áprilisában.
Egy ismérv szerinti elemzés
70
Az ötödik decilis (medián) becslése:
A nyugdíjas nők 50%-ának a nyugdíja 12 200 Ft-nál kevesebb, 50%-ának pedig több volt 1994 áprilisában. (A tehát valóban a mediánnal azonos.)
A többi decilist is hasonló módon kiszámítva (becsülve), az eredményeket sorba rendezve egy speciális gyakorisági (relatív gyakorisági) sort, ún.deciliseloszlást képezhetünk, melyet a 2.22. táblázat tartalmaz.
2.22. táblázat - A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)
Nyugdíj Nyugdíjas nők Nyugdíj Nyugdíjas nők(Ft) száma (fő) (Ft) megoszlása (%)
– 8894
8894 – 9579
9579 – 10 319
10 319 – 11 295
11 295 – 12 200
12 200 – 12 924
12 924 – 13 648
13 648 – 14 372
14 372 – 15 751
15 751 –
125 975
125 975
125 975
125 975
125 975
125 975
125 975
125 975
125 975
125 975
– 8894
8894 – 9579
9579 – 10 319
10 319 – 11 295
11 295 – 12 200
12 200 – 12 924
12 924 – 13 648
13 648 – 14 372
14 372 – 15 751
15 751 –
10
10
10
10
10
10
10
10
10
10Összesen 1 259 750 Összesen 100
Egy ismérv szerinti elemzés
71
A fenti osztályközös gyakorisági sorokban az osztályközök határai a decilisek, az osztályközök gyakorisága (relatív gyakorisága) pedig azonos.
Például a hetedik osztályköz alsó határa: a felső határa: 125 975 főnek, a nyugdíjas nők 10%-ának a nyugdíja 12 924 és13 648 Ft között volt, 70%-ának a nyugdíja pedig 13 648 Ft-nál kevesebb volt 1994 áprilisában.
Az olyan – nem egyenlő hosszúságú osztályközös gyakorisági (relatív gyakorisági) – sorokat, melyekben minden osztályköz gyakorisága (relatívgyakorisága) azonos és az osztályközhatárok a kvantilisek (kvartilis, kvintilis, decilis stb.), a gyakorlatban kvantilis eloszlásnak nevezzük. (Az eddighasznált terminológiák szerint indokoltabb lenne a kvantilis megoszlás elnevezés.)
2.1.6. Szóródási mutatókA középértékek és a kvantilisek csak egyetlen tulajdonságát rögzítik az eloszlásnak, az elhelyezkedését (a vízszintes tengelyen elfoglalt helyét).Ettől azonban a sokaság eloszlása még nagyon sokféle lehet.
2.11. ábra -
A 2.11. ábrán három eloszlás gyakorisági poligonját mutatjuk be. Mivel szimmetrikusak, az átlaguk, móduszuk és a mediánjuk ugyanakkora, mégislényegesen különböznek egymástól. Mi okozza az eltérést? Az, hogy az adatok szétszórtsága, ún. szóródása erősen különbözik az eloszlásokban.Az egyiknél az átlag körül tömörül az ismérvértékek zöme, a másiknál kevésbé, a harmadiknál teljesen szétszórtan helyezkednek el.
Egy ismérv szerinti elemzés
72
Ahhoz, hogy a középérték jellemző erejét értékelni tudjuk, szükséges, hogy az ismérvértékek szóródásáról is legyen ismeretünk. Az olyan középérték,amely körül kicsi az ismérvértékek szóródása, jobb jellemzője a sokaságnak, mint az olyan, amelytől az egyes ismérvértékek nagymértékbenkülönböznek.
Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékeinek) különbözőségét értjük. Önmagában tehát azt atényt jelenti, hogy pl. a megfigyelt társasház lakásainak vízfogyasztása különböző nagyságú.
Az ismérvértékek szóródásáról a gyakorisági sor és a grafikus ábrák is adnak információt, emellett azonban szükség van a szóródás mérésére, aszóródás jelenségének egyetlen számértékben való tömörítésére.
A szóródás mérése az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései vagy egymás közötti különbségeialapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezika megfigyelt ismérv mértékegységével.
A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől (általában %-os formában fejezzük ki őket), aszóródás térbeli vagy időbeli összehasonlítására szolgálnak.
Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát (ha minden ismérvérték egyenlő) nullával, meglétét pedig valamilyen nullátólkülönböző pozitív értékkel jelzi.
A leggyakrabban használt szóródási mérőszámok:
– a szóródás terjedelme,
– az átlagos eltérés,
– a szórás,
– az átlagos különbség és
– a relatív szórás.
A szóródás terjedelme
A szóródás terjedelme (jele: R) az előforduló legnagyobb és legkisebbismérvérték különbsége:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):
Egy ismérv szerinti elemzés
73
A terjedelem a szóródásnak igen szemléletes kifejezője (pl. egy adott termék legkisebb és legnagyobb fogyasztói árának különbsége, vagy egy adottévben befizetett legkisebb és legnagyobb személyi jövedelemadó különbsége), a gyakorlatban mégis kevésbé használatos a szóródás mérésére.Ennek az az oka, hogy értékét a véletlen szerepe számottevően befolyásolhatja, mivel nagysága csak a két legszélsőségesebb ismérvértéktől függ.Ezért gyakran használják a terjedelem helyett az ún. interkvantilis terjedelemmutatókat is, amelyek két szélső kvantilis különbségével azonosak(pl. az első és kilencedik decilis vagy az alsó és felső kvartilis különbsége).
Átlagos eltérés
Az átlagos eltérés (jele: δ) az ismérvértékek számtani átlagtól vett eltérésein alapul, ezen eltérések átlaga. Mivel az átlagtól vett
eltérések algebrai összege nulla – a számtani átlag első tulajdonsága, lásd 1.6. pont –, ezért az eltérések abszolút értékeit átlagoljuk.
Az átlagos eltérésaz egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga:
Az átlagos eltérés azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):
Az egyes lakások vízfogyasztása átlagosan 5,26 m3-rel tér el az átlagos fogyasztástól.
A gyakorisági sor adataiból az átlagos eltérést súlyozott formában számítjuk (osztályközös gyakorisági sor esetén becsüljük).
Egy ismérv szerinti elemzés
74
Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja, az átlagos eltérés számításánál súlyként a relatívgyakoriságok itt is használhatók.
A lakások vízfogyasztását vizsgáló példánkban (a részeredményeket a 2.23. táblázat tartalmazza):
illetve:
E mérőszámot a gyakorlatban viszonylag ritkán használjuk, mert az abszolút érték matematikailag elég nehézkesen kezelhető.
Szórás
A szórás (jele: ) a legfontosabb és egyben a leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett
eltérésein alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is „megszabadulhatunk”, hogy a eltéréseket négyzetre emeljük.
A értékekből tehát négyzetes átlagot számítunk.
A szórás az egyes értékek számtani átlagtól vett eltéréseinek négyzetes átlaga:
A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a szórás:
Egy ismérv szerinti elemzés
75
Gyakorisági sor alapján a szórást súlyozott formában számítjuk (osztályközös gyakorisági sor alapján becsüljük). Súlyként a gyakoriságokat
vagy a relatív gyakoriságokat használjuk.
vagy
A szórás azt mutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól. Jelentése tehát ugyanaz, mint az átlagos eltérésé, mivel
mindkettő a eltérések átlaga. Az átlagos eltérés (δ) a értékek számtani, a szórás pedig a értékek négyzetes átlaga. Ugyanazonértékek különféle átlagainak az 1.6. alfejezetben megismert nagyságrendi viszonya miatt az átlagos eltérés mindig kisebb értékkel méri a szóródást,
mint a szórás .
A szórás súlyozott formában történő számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A fejrovatokba csak a már korábban megismertjelöléseket írjuk.) (2.23. táblázat.)
2.23. táblázat - Munkatábla az átlagos eltérés és a szórás számításához
Vízfogyasztás
(m3)– 15
16 – 20
21 – 25
26 – 30
31 – 35
36 –
5
16
15
6
5
3
0,10
0,32
0,30
0,12
0,10
0,06
12,5
17,5
22,5
27,5
32,5
37,5
62,5
280,5
337,5
165,0
162,5
112,5
– 9,9
– 4,9
– 0,1
5,1
10,1
15,1
49,5
78,4
1,5
30,6
50,5
45,3
98,01
24,01
0,01
26,01
102,01
228,01
490,05
384,16
0,15
156,06
510,05
684,03
9,8010
7,6832
0,0030
3,1212
10,2010
13,6806
Egy ismérv szerinti elemzés
76
Összesen 50 1,00 – 1120,0 – 255,8 – 2224,50 44,4900
A szórás rangsor alapján számított (6,685 m3) és az osztályközös gyakorisági sor alapján becsült (6,67 m3) értéke közel esik egymáshoz.
Az egyes lakások vízfogyasztása átlagosan 6,7 m3-rel tér el az átlagos vízfogyasztástól.
A statisztikai elemző munkában – a következő fejezetben majd látni fogjuk – fontos szerepe van a szórás négyzetének is, amit szórásnégyzetnekvagy varianciának nevezünk és -tel jelölünk.
A variancia számlálója az eltérés-négyzetösszeg (jele: SS):
A szórás tulajdonságai
1. Ha az ismérvértékekhez hozzáadunk egy állandót (A), a szórás nem változik.
Tehát:
Mivel ilyenkor a számtani átlag is lesz2 2 , ezért
2. Ha az ismérvértékeket megszorozzuk egy állandóval (B), a szórás
2 Lásd az 1.6. pontbeli bizonyításokat.
Egy ismérv szerinti elemzés
77
-szeresére változik.
Tehát:
Mivel ilyenkor a számtani átlag lesz2 , ezért
3. A szórás az eredeti értékek négyzetes és számtani átlaga alapján is meghatározható.
Átlagos különbség
Az átlagos eltérés és a szórás a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymásközötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini olasz statisztikus javasolta, ezért szokás Gini-félemérőszámnak is nevezni.
Egy ismérv szerinti elemzés
78
Az átlagos különbség (jele: G) az ismérvértékek egymástól számított különbségei abszolút értékeinek számtani átlaga.
Mivel N db ismérvérték mindegyikének – önmagát is beleértve – N db ismérvértékkel vehetjük a különbségét, összesen különbség képezhető.Ezek abszolút értékeinek átlaga:
Gyakorisági sor alapján a mutatót súlyozott formában számítjuk (osztályközös gyakorisági sorból becsüljük).
Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Számítását a vízfogyasztás gyakoriságisora alapján mutatjuk be. (A 2.24. táblázatban kiszámított különbségek, illetve szorzatok az átlóra szimmetrikusak, ezért elegendő az átló alatti vagyfölötti különbségeket és szorzatokat kiszámítani és 2-vel szorozni.)
a) Az ismérvértékek különbségei:
Adatok: m3
12,5 17,5 22,5 27,5 32,5 37,5
12,5
17,5
22,5
27,5
32,5
37,5
0 5
0
10
5
0
15
10
5
0
20
15
10
5
0
25
20
15
10
5
0
Egy ismérv szerinti elemzés
79
b) Az ismérvértékekhez tartozó súlyok szorzatai:
5 16 15 6 5 3
5
16
15
6
5
3
* 80
*
75
240
*
30
96
90
*
25
80
75
30
*
15
48
45
18
15
*c) Az előző táblák megfelelő rovatainak szorzatai:
Adatok: m3
12,5 17,5 22,5 27,5 32,5 37,5 Összesen
12,5
17,5
22,5
27,5
32,5
37,5
0 400
0
750
1200
0
450
960
450
0
500
1200
750
150
0
375
960
675
180
75
0
2475
4320
1875
330
75
0Összesen 0 400 1950 1860 2600 2265 9075
Az ismérvértékek különbségeinek összege a táblázat c) részében kapott szorzatösszeg kétszeresével azonos: 2 · 9075 = 18 150 m3.
Egy ismérv szerinti elemzés
80
Az egyes lakások vízfogyasztása átlagosan 7,26 m3-rel tér el egymástól.
Relatív szórás
A szóródás eddig megismert mérőszámai a megfigyelt mennyiségi ismérv mértékegységében mérik a szóródást. Sok esetben szükség lehet arra,
hogy az értékek nagyságrendjétől és mértékegységétől elvonatkoztatott mérőszámmal mérjük és tegyük összehasonlíthatóvá a szóródást. Ilyenmérőszám a relatív szórás (jele: V):
Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük.
A képlet átalakításával belátható az is, hogy a relatív szórás az egyedi eltérések viszonylagos nagyságának, a hányadosoknak a négyzetesátlaga.
Ezért úgy is értelmezhető, hogy az egyes ismérvértékek átlagosan hány %-kal térnek el az átlagtól.
A lakások vízfogyasztására vonatkozó példánkban az átlagos vízfogyasztás 22,4 m3, a szórás pedig 6,67 m3 volt. A szóródás relatív mértéke :
A relatív szórást viszonyszámként értelmezve megállapíthatjuk, hogy a szórás az átlagnak közel 30%-a. Másként fogalmazva az egyes lakások
vízfogyasztása átlagosan 29,8%-kal tér el a 22,4 m3-es átlagtól. A értékek – %-ban kifejezve – rendre: 44,2; 21,9; 0,4; 22,8; 45,1 és 67,4.A relatív szórás ezen értékek közé esik.
Egy ismérv szerinti elemzés
81
2.1.7. Az aszimmetria mérőszámaiAz előző alfejezetekben megismerkedtünk azokkal a grafikus ábrákkal, melyekkel a gyakorisági sorok (gyakorisági eloszlások, illetve megoszlások)szemléltethetők, illetve azokkal a mutatószámokkal (középértékek, kvantilisek, szóródási mutatók), amelyek a gyakorisági sorok helyzetéről ésszóródásáról számszerű információt nyújtanak.
A gyakorisági sorokat ábrázolva megállapítható, hogy a görbék (poligonok) igen változatosak lehetnek, de nagy többségük bizonyosszabályszerűséget mutat, így besorolható néhány jellegzetes típusba.
Az eloszlások következő típusaival foglalkozunk:
– egymóduszú eloszlás
– szimmetrikus,
– aszimmetrikus (vagy ferde);
– többmóduszú eloszlás.
Az egymóduszú gyakorisági sorok poligonjának egy helyi maximuma (csúcsa) van. A helyzetmutatók elhelyezkedésétől függően az eloszlásszimmetrikus és aszimmetrikus lehet. Az egymóduszú eloszlások jellegzetességeit a 2.25. táblázat tartalmazza.
2.25. táblázat - A szimmetrikus és aszimmetrikus eloszlások jellemzői
Szimmetrikus Aszimmetrikus eloszláseloszlás bal oldali jobb oldali
A társadalmi-gazdasági jelenségek körében a bal oldali aszimmetria a leggyakoribb. Például a lakossági megtakarítások nagyságának, avállalkozások nyereségének, a családok egy főre jutó jövedelmének eloszlása tipikusan bal oldali aszimmetriát mutat.
Egy ismérv szerinti elemzés
82
A 2.25. táblázatból látható, hogy a már megismert grafikus ábrák (a hisztogram és a gyakorisági poligon), a középértékek és kvantilisek alapján azeloszlás típusát, az aszimmetria irányát meg tudjuk állapítani.
A továbbiakban olyan mutatókkal (mérőszámokkal) ismerkedünk meg, amelyek egy számba sűrítve kifejezésre juttatják az aszimmetria fennállását,irányát és fokát is. Arra a kérdésre kapunk választ, hogy milyen mértékűnek ítélhető a szimmetrikushoz képest a megoszlás aszimmetriája, másszóval ferdesége.
Az aszimmetria leggyakrabban használt mérőszámai a Pearson-féle mutatószám és az F mutató.
Az aszimmetria Pearson-féle mutatószáma (jele: A) a számtani átlag és a módusz egyes eloszlástípusok esetén jellemző nagyságrendi viszonyánalapul:
Az különbség nagysága a ferdeség fokán kívül a szóródás nagyságától is függ. Nagymértékű szóródás esetén ugyanis a különbség akkoris viszonylag nagy lehet, ha az aszimmetria viszonylag kisfokú. Ezért, ha a két középérték különbségét elosztjuk a szórással, olyan mérőszámotkapunk, melynek értékéből következtetni tudunk az aszimmetria mértékére. A mérőszám (önmagában a számláló) előjele az aszimmetria irányátmutatja. Bal oldali aszimmetria esetén , jobb oldali aszimmetria esetén Szimmetrikus eloszlás esetén A mérőszám abszolút értékéneknincs határozott felső korlátja, azonban már 1-nél nagyobb abszolút érték meglehetősen erős aszimmetriára utal.
A lakások vízfogyasztására vonatkozó példa alapján:
A lakások vízfogyasztás szerinti eloszlása mérsékelten bal oldali aszimmetriát mutat.
Az aszimmetria másik mérőszáma,az F mutató (jele: F) az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán
alapul. Bal oldali aszimmetria esetén a medián az alsó , jobb oldali aszimmetria esetén a felső kvartilishez esik közelebb.
Ha a eltérések különbségét elosztjuk azok összegével, olyan mérőszámot kapunk, amely abszolút értékének határozott felső korlátja
van: . Az F mutató lényegesen kisebb értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát, mint az A:
Egy ismérv szerinti elemzés
83
E mutatószám ugyanolyan feltételek mellett ad nulla, pozitív és negatív eredményt, mint az A mutató.
Az F mutatót nemcsak a kvartilisek, hanem a többi kvantilis, például a decilisek alapján is számíthatjuk.
vagy a illetve helyett akár a illetve is behelyettesíthető.
A lakások vízfogyasztására vonatkozó példánkban (a kvartiliseket felhasználva):
E mutató is enyhe bal oldali aszimmetriát jelez.
Az F mutató – szemben az A-val – többmóduszú eloszlásoknál is használható a ferdeség fokának vizsgálatára.
Több gyakorisági sor ferdeségének összehasonlításakor, valamint ugyanazon jelenség eloszlásának időbeli vizsgálatára mindig ugyanazt amérőszámot kell használni.
2.1.8. A koncentráció elemzéseValamely sokaságnak egy mennyiségi ismérv szerinti vizsgálata arra is irányulhat, hogy az értékösszeg mennyire koncentrálódik a sokaság bizonyosegységeire. Pl. vizsgálhatjuk a termelés, a jövedelem, a vagyon, a betétösszeg, a népesség stb. koncentrációját.
A koncentráción általában tömörülést, összpontosulást értünk. Pl. a népesség nagy része a nagyobb településeken, a városokban összpontosul,a magánvagyon egyre nagyobb része tömörül (koncentrálódik) a lakosság egy szűkebb körénél stb.
Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékössszeg jelentős része a sokaság kevés egységéreösszpontosul.
Ha a sokaság elemszáma (N) kicsi, akkor az már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg (S) a szó szoros értelmében kevésegységre összpontosul.
Ha a sokaság elemszáma nagy, akkor a definícióban szereplő „kevés egységet” relatív módon értelmezzük. Ilyen esetben a koncentráció abbannyilvánul meg, hogy a sokaság teljes értékösszege egyenlőtlenül oszlik meg a sokaság egységei között.
Egy ismérv szerinti elemzés
84
A koncentráció a relatív gyakoriságok és a relatív értékösszegek összehasonlításával mutatható ki. Ha az egyes osztályokhoz
(osztályközökhöz) tartozó értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.
2.26. táblázat - Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január1-jén
Települések Települések
Népesség-
nagyságszáma össznépessége
(fő)
számának össznépességének
(fő) (tényleges) %-os megoszlása
– 499
500 – 999
1000 – 1999
2000 – 4999
5000 – 9999
10 000 – 49 999
50 000 – 99 999
150
65
31
6
2
1
2
35 570
48 021
42 506
20 119
16 620
22 263
115 968
58,4
25,3
12,0
2,3
0,8
0,4
0,8
11,8
16,0
14,1
6,7
5,5
7,4
38,5Összesen 257 301 067 100,0 100,0
A 2.26. táblázatból látható, hogy a megye népességének 11,8%-a él a települések 58,4%-át kitevő kistelepüléseken, ugyanakkor a népesség nagyhányada (38,5%-a) a települések mindössze 0,8%-át kitevő nagytelepüléseken (városokban) koncentrálódik.
A koncentráció vizsgálatának egyik legfontosabb és egyben legelterjedtebb eszköze a Lorenz-görbe, amely a koncentráció meglétén kívül annakmértékét is szemléletesen mutatja. A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok
függvényében ábrázolja a kumulált relatív értékösszegeket .
A görbét úgy készítjük, hogy a
Egy ismérv szerinti elemzés
85
pontokat egyenes szakaszokkal összekötjük. (A görbe végpontja a pont.) Általában a illetve adatokat ábrázoljuk, mint ahogyan a2.12. ábrán is.
A koncentráció hiánya esetén a görbe egybeesik az átlóval. Ebben az esetben az egyes osztályokhoz (osztályközökhöz) tartozó és értékekazonosak (a teljes értékösszeg egyenletesen oszlik meg a sokaság egységei között).
Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció, így az ábra alkalmas a koncentráció időbeli vagy térbeli összehasonlításárais.
A 2.26. és 2.27. táblázat adatait felhasználva összehasonlítjuk Nógrád és Zala megye népességének koncentrációját (az 1994. január 1-jei adatokalapján).
2.27. táblázat - Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva)
Nógrád megye Zala megyeNépesség-
nagyság (fő)–499
500 –999
1000 –1999
2000 – 4999
5000 – 9999
10 000 – 49 999
50 000 – 99 999
22,4
35,2
25,6
12,8
0,8
3,2
–
4,0
14,7
19,.9
17,7
2,9
40,8
–
22,4
57,6
83,2
96,0
96,8
100,0
–
4,0
18,7
38,6
56,3
59,2
100,0
–
58,4
83,7
95,7
98,0
98,8
99,2
100,0
11,8
27,8
41,9
48,6
54,1
61,5
100,0Összesen 100,0 100,0 – – – –
Egy ismérv szerinti elemzés
86
2.12. ábra - A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)
A 2.12. ábráról leolvasható, hogy Zala megyében a népesség koncentrációja nagyobb fokú, mint Nógrád megyében.
A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha a koncentrációs területet a háromszög területéhezviszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció fokára. A koncentrációs terület arányát a koncentrációs együtthatóval(jele: K) mérjük.
Egy ismérv szerinti elemzés
87
A koncentrációs együtthatót – a bizonyítást nem részletezzük – számíthatjuk a következő módon is:
ahol G: az átlagos különbség (Gini-féle szóródási mérőszám),
az ismérvértékek átlaga.
Koncentráció hiánya esetén: ( a görbe egybeesik az átlóval); minél közelebb van K értéke az 1-hez, annál nagyobb fokú a koncentráció.
Zala megyében (a 2.26. táblázat adataiból számítva):
átlagos különbség:
átlagos népességszám:
Zala megyében a népesség koncentrációja viszonylag nagy fokú, a Lorenz-görbe is ezt jelzi (2.12. ábra).
2.2. Az időbeli ismérv szerinti elemzés2.2.1. Idősorok
A statisztikai elemzések során fontos szerepük van az időbeli összehasonlításoknak, az időbeli változások vizsgálatának. Segítik az elmúlt időszaktendenciáinak, összefüggéseinek feltárását és egyben támpontot is adnak a jövő várható folyamatainak előrejelzéséhez.
A társadalmi-gazdasági jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei idősorokat alkotnak, melyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek.
Az állapotidősorok az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. E soroksohasem csoportosítás eredményeként jönnek létre, így a bennük szereplő adatok összegezésének nincs tárgyi értelme.
A tartamidősorok mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik.
Egy ismérv szerinti elemzés
88
Mindkét típusú idősornál – éppen az időbeliség lényegéből következően – az ismérvváltozatok (időpontok, időszakok) sorrendje szigorúan kötött,a sor elemei nem cserélhetők fel tetszés szerint.
Az idősorokat a következő példák szemléltetik:
Állapotidősor (2.28. táblázat):
2.28. táblázat - Magyarország személygépkocsi-állományának alakulása (az évek december 31-én)Év Személygépkocsi (db)
1985
1986
1987
1988
1989
1990
1991
1992
1993
1 435 937
1 538 877
1 660 258
1 789 562
1 732 385
1 944 553
2 015 455
2 058 334
2 091 623
Tartamidősor (2.29. táblázat):
2.29. táblázat - Magyarországra érkező külföldi turisták számának alakulásaÉv Turisták száma (E fő)
1985
1986
1987
1988
9 724
10 613
12 087
10 766
Egy ismérv szerinti elemzés
89
1989
1990
1991
1992
1993
14 490
20 510
21 860
20 188
22 804
A továbbiakban azokkal az egyszerű elemzési eszközökkel foglalkozunk, amelyek alkalmasak az idősorban rejlő információk szemléltetésére,a tendenciák, törvényszerűségek feltárására. Az idősorok vizsgálatának általánosan alkalmazott eszközei a dinamikus viszonyszámok, agrafikusábrázolás és az átlagok.
2.2.2. Dinamikus viszonyszámokA dinamikus viszonyszám (az 1.5. alfejezetben már szóltunk róla) az összehasonlítás tárgyát képező tárgyidőszak (időpont) és az összehasonlításalapjául szolgáló bázisidőszak (időpont) adatának hányadosa.
A kettőnél több adatból álló idősor esetén kétfajta dinamikus viszonyszám számítható: bázis- és láncviszonyszám.
A bázisviszonyszámok (jele: ) az idősor egyes adatainak a bázisul választott időszak (időpont) adatához viszonyított arányát fejezik ki:
ahol az idősor egymást követő adatai, az pedig a bázisul választott időszak (időpont) adata.
Bázisul az idősor bármelyik időszaka (időpontja) választható, sőt az idősoron kívüli időszak (időpont) is. A bázis megválasztásánál alapelvkéntrögzíthetjük, hogy bázisként olyan időszak (időpont) adatát helyes választani, melynek nagyságát kivételes, véletlen körülmények nem befolyásolják,így reálisan lemérhető a vizsgált jelenség változása. A statisztikai elemzések során leggyakrabban az első időszakot (időpontot) választjuk bázisul.
A láncviszonyszámok (jele: ) az idősor egyes adatainak a közvetlenül megelőző időszak (időpont) adatához viszonyított arányát fejezik ki:
A bázis- és láncviszonyszámok számítását szemlélteti a 2.30. táblázat:
Egy ismérv szerinti elemzés
90
2.30. táblázat - A bázis- és láncviszonyszámok számítása
Időszak,
időpont
Idősor adata Bázisviszonyszám Láncviszonyszám
1. –
2.
3.
.
.
.
.
.
.
.
.
.
.
.
.
t.
.
.
.
.
.
.
.
.
.
.
.
.
n.
Vizsgáljuk meg bázis- és láncviszonyszámokkal a lakossági megtakarítások alakulását. Az alapadatokat és a megfelelő viszonyszámokat a 2.31.táblázatbanközöljük.
2.31. táblázat - A lakosság takarékbetét-állományának alakulása (az évek december 31-én)
Év Betétállomány(milliárd Ft) 1980 = 100,0% Előző év = 100,0%
1980 145,3 100,0 –
Egy ismérv szerinti elemzés
91
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
160,1
175,7
197,1
219,4
244,1
274,9
287,5
312,7
309,5
368,6
466,0
634,7
732,9
110,2
120,9
135,6
160,0
168,0
189,2
197,9
215,2
213,0
253,7
320,7
436,8
504,4
110,2
109,7
112,2
111,3
111,3
112,6
104,6
108,8
199,0
119,1
126,2
136,2
115,5
Az 1986. évi bázisviszonyszám:
Az 1986. évi betétállomány az 1980. évinek (a megfigyelés időpontja mindkét évben december 31.) 1,892-szerese, azaz 189,2%-a. Tehát abetétállomány 1980-ról 1986-ra 89,2%-kal nőtt.
Az 1986. évi láncviszonyszám:
1985-ről 1986-ra a betétállomány 12,6%-kal nőtt.
Egy ismérv szerinti elemzés
92
1980. évre nem tudunk láncviszonyszámot számítani, mert a példánkban nem ismert az 1979. évi betétállomány.
Az 1981. évi bázis- és láncviszonyszám (általában is igaz, hogy a bázisul választott időszak (időpont) utáni időszak (időpont) bázis- ésláncviszonyszáma) azonos, mindkettő az 1980-ról 1981-re bekövetkező változást mutatja. A betétállomány 1980-ról 1981-re 10,2%-kal nőtt.
A bázis- és láncviszonyszámok közötti összefüggés
A bázis- és láncviszonyszámok az idősor eredeti adatainak ismerete nélkül is közvetlenül kölcsönösen kiszámíthatók egymásból.
Bázisviszonyszámokból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Az összehasonlítani kívánt időszak (időpont)bázisviszonyszámát elosztjuk az őt közvetlenül megelőző időszak (időpont) bázisviszonyszámával.
A t-edik láncviszonyszám
Ugyanis a bázisviszonyszámokat úgy képezzük, hogy az idősor adatait rendre egy konstanssal (a bázisidőszak adatával) osztjuk, ezért abázisviszonyszámok egymás közötti aránya megegyezik az eredeti adatok egymás közötti arányával.
Példánkban az 1986. évi láncviszonyszám a bázisviszonyszámokból számítva:
Láncviszonyszámokból bázisviszonyszámokat a megfelelő láncviszonyszámok szorzataként kapunk. Az első számú láncviszonyszámszorzata a k-adik időszak (időpont) bázisviszonyszámával egyenlő.
A k-adik bázisviszonyszám:
ugyanis:
Egy ismérv szerinti elemzés
93
Példánkban az 1986. évi bázisviszonyszám a láncviszonyszámokból számítva:
2.2.3. Az idősorok grafikus ábrázolásaAz idősorok tendenciáinak tömör, áttekinthető jellemzésére gyakran használjuk a grafikus ábrákat. Az idősorokat – mivel általában az ábrákkala társadalmi-gazdasági jelenségek időbeli változásának tendenciáját szemléltetjük – derékszögű koordináta-rendszerben, vonaldiagrammalábrázoljuk. A vízszintes tengelyen az időszakokat (időpontokat), a függőleges tengelyen az idősor adatait mérjük fel. Az idősor egyes értékeit jellemzőpontokat – azért, hogy a változás tendenciája érzékelhető legyen – egyenes szakaszokkal (teljesen önkényesen) összekötjük. Tartamidősorok eseténaz idősor adatait jelölő pontok a megfelelő időintervallum közepén, állapotidősorok esetén pedig az intervallum megfelelő szélén helyezkednek el.
2.13. ábra - A takarékbetét-állomány alakulása
A 2.13. ábra a takarékbetét-állomány alakulását szemlélteti. Ez az idősor állapotidősor, a megfigyelések időpontja minden évben december 31-evolt. Ezért az idősor adatait jellemző pontok az időintervallumok (évek) végén helyezkednek el.
A 2.29. táblázat a Magyarországra érkező külföldi turisták számának alakulását mutató tartamidősor. Ábrázolásakor (2.14. ábra) az időintervallumok(évek) közepén felmért pontokat kötjük össze egyenes szakaszokkal. Az idősorban előforduló legkisebb érték 9724 ezer fő (a legnagyobb 22 804ezer fő), ezért a függőleges tengelyt megszakítva a beosztást 8000 ezer főnél kezdhetjük. (Ha a tengely beosztása ugyanis 0-tól folyamatos lenne,a vonaldiagram nagyon „magasra” kerülne.)
Egy ismérv szerinti elemzés
94
2.14. ábra - A Magyarországra érkező turisták számának alakulása
A grafikus ábrázolással az ábrázolt adatok közötti arányokat szemléltetjük. Mivel a bázisviszonyszámok között ugyanolyan arányok vannak, mintaz idősor eredeti adatai között, ezért a bázisviszonyszámok alapján is készíthetünk vonaldiagramot. Különösen indokolt a bázisviszonyszámokábrázolása akkor, ha több, egymással összefüggő jelenség időbeli alakulását egy koordináta-rendszerben akarjuk szemléltetni.
2.2.4. Az idősorok elemzése átlagokkalA középérték az azonos fajta adatok halmazának számszerű jellemzője. Az idősorok adatait úgy tekintjük mint ugyanazon jelenség különbözőidőszakokban (időpontokban) felvett értékeinek összességét, tehát azonos fajta adatok halmazát. Az átlagolás ezért idősorok esetén is indokolt lehet.
Az átlagolás célja egyrészt az idősor átlagos értékének meghatározása, másrészt az idősorban végbemenő átlagos változások kimutatása lehet.
Az idősorok átlagos értékének meghatározása
Az állapot- és tartamidősor adatait eltérő módon átlagoljuk.
Egy ismérv szerinti elemzés
95
A tartamidősorok adatai összegezhetők, ezért átlagolásukra a számtani átlagot használjuk.
Az így kiszámított átlag a megfigyelt jelenség egy időszakrajutóátlagos értékét mutatja.
Az állapotidősorok adatai egy-egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos
állomány- (készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga ,több időpont esetén pedig a két-két időpont közötti időszakokra számított átlagos állományok számtani átlaga.
Ezt az átlagot kronologikus átlagnak nevezzük (jele: ), és kizárólag állapotidősorok adatainak átlagolására használjuk. A megfigyelt időpontok
adataiból ( ) közvetlenül az alábbi egyszerűbb alakra hozott formában számítjuk:
A kronologikus átlag tehát olyan súlyozott számtani átlag, melynél az első és utolsó adat súlya a közbeeső adatok súlya pedig 1. A súlyokösszege (a nevezőben szereplő szám) így:
Tekintsük a következő példát (2.32. táblázat).
2.32. táblázat - Valamely utazási iroda valutakészletének és valutaértékesítésének adatai
Hónap
Valutakészlet
(a hónap utolsó napján)
(E USD)
Valutaértékesítés
(E USD)
Egy ismérv szerinti elemzés
96
június
július
augusztus
szeptember
október
november
december
18,8
19,6
20,2
19,8
21,1
20,3
19,2
....
35,8
35,2
34,3
33,5
32,4
35,8
A második félévben a havi átlagos valutaértékesítés (6 hónap átlaga):
Az adatok összegének van értelme (a II. félévben összesen 207 ezer USD valutát adott el az utazási iroda), ezért átlagolásukra a számtani átlagothasználtuk.
A második félévben az átlagos valutakészlet (július 1-je és december 31-e között):
( a július 1-jei készlet a június 30-ival – 18,8 E USD – azonos).
A valutakészlet csak időpontokban értelmezhető (példánkban a hónap utolsó napján záráskor), ezért átlagolásukra a kronologikus átlagot használtuk.
Az idősor átlagos változásának vizsgálata
Az idősor lényeges tulajdonságát kifejező tendenciát az időszakról időszakra (időpontról időpontra) bekövetkező változások átlagolásával ragadhatjukmeg. A változást kétféleképpen mérhetjük: abszolút és relatív módon. Az abszolútváltozás két egymást követő időszak (időpont) adatának különbsége
a relatív változás pedig valamely időszak (időpont) adatának a megelőző időszak (időpont) adatához viszonyított aránya Azátlagos változást (növekedést vagy csökkenést) két mutatóval mérhetjük: a fejlődés átlagos mértéke és a fejlődés átlagos ütememutatókkal.
Egy ismérv szerinti elemzés
97
A fejlődés átlagos mértéke (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos abszolút változást mutatja a vizsgáltjelenség mértékegységében.
Számítása úgy történik, hogy az egymást követő időszakokra (időpontokra) kiszámítjuk a növekedés (csökkenés) mértékét , majd azokat számtaniátlaggal átlagoljuk.
Ebből azonnal adódik:
A mutató elsősorban az időszakról időszakra (időpontról időpontra) közel azonos mértékben növekvő (csökkenő), azaz megközelítőleg lineárisfejlődést leíró idősorok fejlődési tendenciájának jellemzésére használható. Mivel értéke csak az idősor első és utolsó adatától függ, ezért csak akkorjellemzi jól a változás átlagos mértékét, ha ezek nem kiugróan magas vagy alacsony (esetleg változó előjelű) értékek.
2.33. táblázat - Az épített lakások számának alakulása Magyarországon
Év Épített lakásokszáma (db)
1985
1986
1987
1988
1989
1990
1991
1992
72 507
69 428
57 200
50 566
51 487
43 771
33 164
25 807
–
–3 079
–12 228
–6 634
921
–7 716
–10 607
–7 357
Egy ismérv szerinti elemzés
98
1993 20 925 –4 882
2.15. ábra - Az épített lakások számának alakulása
Az épített lakások számának alakulását mutató vonaldiagram (2.15. ábra) alapján látható, hogy a 2.33. táblázatban egy lineárisnak tekinthető változást
leíró idősor szerepel, ezért a mutató alkalmazása célszerű.
– Az évenkénti változások (növekedések, csökkenések) átlagaként:
– Az 1993-as és az 1985-ös év megfigyelt adata alapján:
Egy ismérv szerinti elemzés
99
Az épített lakások száma 1985 és 1993 között évente átlagosan 6448 db-bal csökkent.
A fejlődés átlagos üteme (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos relatív változást mutatja.
A mutató a láncviszonyszámok mértani átlaga. A mértani átlag alkalmazását az indokolja, hogy a láncviszonyszámok szorzatának van tárgyi értelme.Valamennyi láncviszonyszám szorzata ugyanis a megfigyelt utolsó időszak (időpont) bázisviszonyszámával azonos.
Mivel
ezért a fejlődés átlagos üteme az n-edik bázisviszonyszámból is kiszámítható.
Mivel
ezért a fejlődés átlagos üteme az idősor első és utolsó adatából az
alakban is számítható.
A mutató számítása olyan idősorok esetén célszerű, melyeknél az idősor adata időszakról időszakra (időpontról időpontra) közel azonos ütembennő (csökken), azaz közelítőleg exponenciális fejlődést mutat.
Ilyen idősor a takarékbetét-állomány alakulása (2.31. táblázat), jól szemlélteti az exponenciális növekedésnek tekinthető fejlődést a grafikus ábrais (2.13. ábra).
A fejlődés átlagos üteme:
Egy ismérv szerinti elemzés
100
– a láncviszonyszámok alapján:
– az utolsó bázisviszonyszámból:
– a megfigyelt adatokból:
A lakosság takarékbetét-állománya 1980 és 1993 között évenként átlagosan 1,133-szeresére, azaz 13,3%-kal nőtt.
Az idősorok fejlődési tendenciáit kifejező, itt ismertetett mutatószámok végeredményben csak az első ( ) és az utolsó ( ) adatra támaszkodnak.Ezért az ilyen számítások csak akkor adnak jellemző értékeket, ha az idősor alapvető tendenciája az egyenletes fejlődés (növekedés vagy csökkenés;lineáris vagy exponenciális értelemben). Tankönyvünk II. kötetében megismerkedünk majd az idősorok fejlődési törvényszerűségeinek függvényekkeltörténő leírásával, elemzésével. Az ott megismert eljárások pontosabb képet adnak a jelenségek, folyamatok alakulásáról.
2.3. Gyakorlófeladatok1. Háztartások élelmiszerre fordított egynapi kiadásai (Ft-ban) az alábbiak:
820,
880,
490,
830,
920,
1020,
520,
900,
760,
730,
1010,
600,
600,
520,
1200,
700,
650,
620,
750,
760,
720,
780,
630,
900,
680,
480,
700,
1200.
Feladat:
a) Készítsünk rangsort!
b) A rangsor alapján készítsünk gyakorisági sorokat különböző osztályközökkel!
Egy ismérv szerinti elemzés
101
c) A legjobbnak ítélt gyakorisági sor alapján készítsünk értékösszegsort és kumulált sorokat!
d) Számítsuk ki a napi élelmiszer-kiadás átlagát, móduszát, mediánját és kvartiliseit! Vizsgáljuk az aszimmetriát!
e) Készítsünk hisztogramábrát!
2. Egy budapesti pénzváltó helyen valamely napon 107-en váltottak valutát forintra. Az ügyfelek megoszlása a váltott összeg nagysága szerint azalábbi:
Összeg (1000 Ft) Fő– 10
10 – 20
20 – 30
30 – 40
40 – 50
50 – 60
60 felett
12
20
33
23
12
3
4Összesen 107
Feladat:
a) Ábrázoljuk a váltott összeg nagysága szerinti megoszlást!
b) Készítsük el a mennyiségi sor lehetséges típusait! Értelmezzük egy-egy adatát!
c) Számítsuk ki és értelmezzük az átlagot, móduszt, mediánt és a kvartiliseket! Jelöljük az a) pontbeli ábrán ezeket az értékeket!
d) Vizsgáljuk a szóródást!
e) Számítsuk ki az aszimmetria A és F mérőszámát!
3. A személyi jövedelemadó-bevallások alapján az adóalanyokat az alábbi kategóriákba sorolták:
Egy ismérv szerinti elemzés
102
Adóköteles jövedelem Az adót fizetők %-os megoszlása
(ezer Ft) 1991 19920 –90
90 – 150
150 – 240
240 – 360
360 – 600
600 – 1500
20,3
26,9
27,9
14,7
7,5
2,7
15,2
22,5
27,8
18,7
11,2
4,6Összesen 100,0 100,0
Feladat:
a) Ábrázoljuk a jövedelem szerinti megoszlást az egyes években hisztogrammal külön-külön!
b) Készítsünk gyakorisági poligont egy koordináta-rendszerben!
c) Mennyi az adóalanyok átlagos jövedelme az egyes években?
d) Melyik évben volt nagyobb a jövedelmek szóródása?
e) Jellemezzük a jövedelemeloszlás aszimmetriáját F mutatóval!
4. A saját jogú nyugdíjasok adatai 1993 márciusában:
Nyugdíj összege Férfiak Nők Összes nyugdíjas(1000 Ft) %-os megoszlása
–6
6 – 8
8 – 10
0,4
6,2
21,3
0,3
16,2
31,3
0,3
11,7
26,8
Egy ismérv szerinti elemzés
103
10 – 12
12 – 15
15 – 20
20 – 25
25 –
26,2
24,8
14,7
5,1
1,3
39,7
8,9
2,9
0,6
0,1
33,6
16,1
8,3
2,6
0,6Összesen 100,0 100,0 100,0
Kiszámított adatok: Az 1015,2 ezer férfi átlagos nyugdíja 12 679 Ft, a 1218,4 ezer nő átlagos nyugdíja pedig 10 205 Ft volt. A férfiaknál 4149 Ft azátlagtól való átlagos eltérés, a nőknél pedig 2483 Ft. (Az eltérések négyzetei alapján.)
Feladat:
a) Hasonlítsuk össze a nyugdíjak nagyságát a tanult helyzetmutatókkal!
b) Ábrázoljuk a nyugdíj összege szerinti megoszlást poligonnal, egy grafikonon!
c) Számítsuk ki az aszimmetria A mutatóját a férfiak és a nők csoportjára! Hasonlítsuk össze a kapott eredményeket!
5. Az ipari ágazatban tevékenykedő vállalkozások fontosabb adatai 1992-ben:
A foglalkoztatottak
nagyságcsoportjai (fő)
Vállalatok
száma
Árbevétel
(milliárd Ft)
Foglalkoztatottakszáma
(1000 fő)21 –50
51 –100
101 –300
301 –500
501 –1000
1001 –2000
1361
782
850
264
259
124
60
73
183
130
310
293
57
62
162
102
185
169
Egy ismérv szerinti elemzés
104
2001 –5000
5001 – 10 000
10 000-nél több
57
9
2
413
106
167
169
57
34Összesen 3708 1735 997
Feladat:
a) Hány főt foglalkoztat átlagosan egy vállalat?
b) A vállalatok hány %-a foglalkoztat maximum 500 főt? Mennyi ezen vállalatok összes foglalkoztatottjainak létszáma ténylegesen, illetve anagyságcsoportok alapján becsülve?
c) Számítsuk ki a vállalatok és az összes foglalkoztatottak %-os megoszlását! Hasonlítsuk össze az egyes létszámkategóriákhoz tartozó arányokat!Nevezzük meg a kiszámított viszonyszámokat!
d) Készítsünk Lorenz-görbét a vállalatok létszám szerinti koncentrációjának bemutatására!
e) Vizsgáljuk meg a létszámnagyság szerinti szóródást!
f) Becsüljük meg a mediánt és a kvartiliseket! Vizsgáljuk a létszám szerinti megoszlás aszimmetriáját!
6. Öt hallgató elért pontszáma egy 50 pontos zárthelyin a következő volt:
36; 40; 28; 48; 16.
Feladat:
a) Számítsuk ki, hogy:
1. egy-egy hallgató pontszáma mennyivel tér el az átlagos pontszámtól!
2. mennyivel térnek el az eredmények egymástól átlagosan!
b) A korábban írt 30 pontos zárthelyit a hallgatók átlagosan 20 pontra írták meg, 9 pontos szórással. Melyik zárthelyin volt nagyobb a pontszámokingadozása, szóródása?
7. Használjuk fel az 1.7. Gyakorlófeladatok 4. példájának adatait!
Egy ismérv szerinti elemzés
105
Feladat:
a) Vizsgáljuk meg az aktív népesség számának alakulását bázis- és láncviszonyszámokkal!
b) Értelmezzük a kiszámított viszonyszámokat!
c) Számítsuk ki a csökkenés átlagos mértékét és átlagos ütemét!
8. Nemzetközi idegenforgalmi bevételek és kiadások alakulása Magyarországon:
Milliárd FtÉv Bevételek Kiadások
1985
1986
1987
1988
1989
1990
1991
1992
25
27
37
39
48
63
78
98
10
10
12
33
59
38
38
53
Feladat:
a) Vizsgáljuk meg a bevételek és a kiadások alakulását 1985-höz képest, valamint évről évre!
b) Ábrázoljuk a két jelenség adatait egy grafikonon!
c) Hány Mrd Ft-tal nőttek évente átlagosan az idegenforgalmi bevételek?
d) Mennyi volt a bevételek, kiadások, illetve az egyenleg növekedési üteme a vizsgált időszakban átlagosan?
9. A takarékbetét-állomány alakulása Magyarországon:
Egy ismérv szerinti elemzés
106
Év Betétállomány(milliárd Ft) 1980 = 100% 1985 = 100% Előző év
= 100%1985
1986
1987
1988
1989
1990
1991
1992
244,1
274,9
287,5
...
...
...
466,0
...
168,0
189,2
...
...
...
...
...
436,8
100,0
112,6
...
...
126,8
...
...
260,0
–
...
...
108,8
...
119,1
...
...
Feladat:
a) Számítsuk ki a tábla hiányzó adatait!
b) Ábrázoljuk a betétállomány alakulását!
c) Évente átlagosan hány %-kal nőtt a betétállomány:
– 1985 és 1990 között?
– 1985 és 1992 között?
– 1980 és 1992 között?
d) Hány Mrd Ft volt a betétállomány 1980-ban? Mennyi volt a növekedés évi átlagos mértéke 1980 és 1992 között?
107
3. fejezet - A sokaságok több ismérv szerinti vizsgálata, astatisztikai táblák elemzése3.1. A statisztikai táblákról általában
A sokaságok több szempont szerinti megfigyelésének eredménye statisztikai táblák formájában is megadható.
Statisztikai táblának nevezzük a megfelelő külső formával ellátott statisztikai sorok összefüggő rendszerét.
A tábla külső formáján rovatokból álló hálózatot értünk. A rovatok egy része statisztikai adatokat, számokat, más része megnevezéseket, magyarázószövegeket tartalmaz. A megnevezéseket tartalmazó rovatok közül azokat, amelyek a tábla bal oldalán helyezkednek el, oldalrovatoknak nevezzük.Ezek a rovatok a vízszintesen elhelyezkedő sorok elnevezéseit tartalmazzák. A tábla felső részén elhelyezkedő feliratos, szöveges rovatokatfejrovatoknak nevezzük. A fejrovatokban található megnevezések a függőlegesen elhelyezkedő oszlopokra vonatkoznak. Az egyes sorok és oszlopokadatainak összegét, illetve a sokaság(ok) egészére jellemző adatokat tartalmazó rovatok az ún. összesen rovatok.
A statisztikai tábla definíciójából – amely szerint: „statisztikai sorok összefüggő rendszere” – következik, hogy a tábla minden egyes adata egyidejűlegtöbb, de legalább két (egy vízszintesen és egy függőlegesen elhelyezkedő) statisztikai sornak tagja.
Azt a számot, amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik, a statisztikai tábla dimenziószámának nevezzük.
Tehát az előbbi definíció szerint a statisztikai táblák legalább kétdimenziósak Definiálhatnánk a statisztikai táblát oly módon is, hogy a statisztikai sort is táblánaktekintenénk, mégpedig egydimenziós táblának.. A statisztikai táblákat – a dimenziószám mellett – leggyakrabban a csoportosításnak (az osztályozásnak) a táblaelkészítésében betöltött szerepe szerint különböztetjük meg.
A csoportosítás szerepe szerint a statisztikai táblák lehetnek egyszerű, csoportosító és kombinációs táblák.
Az egyszerű táblák
A csoportosítást nem tartalmazó adatsorok összefüggő rendszere az egyszerű tábla.
Az egyszerű táblákban általában leíró és összehasonlító sorok szerepelnek. Formai ismertetőjegyük, hogy nincsenek összesen rovataik.
Példaként nézzük a budapesti székhelyű külföldi érdekeltségű vállalkozások néhány fontosabb adatának alakulását tartalmazó táblát (3.1. táblázat).
3.1. táblázat - A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)Megnevezés 1989 1991 1993
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
108
Vállalkozások száma
Összes jegyzett tőke (Mrd Ft)
Ebből külföldi részesedés
886
64,3
15,5
5111
270,3
123,7
10 953,1
725,1
411,7
A tábla nem tartalmaz csoportosítást, ezért összesen rovatok sem szerepelnek benne. Három – vízszintesen elhelyezkedő – összehasonlító,állapotidősor és három – függőlegesen elhelyezkedő – leíró sor alkotja a táblát. A tábla minden adata egyidejűleg két statisztikai sornak tagja, teháta 3.1. táblázat egy kétdimenziós egyszerű tábla.
A csoportosító táblák
Az egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere a csoportosító tábla.
A csoportosító táblában egy ismérv szerinti csoportosítás eredményeként keletkezett csoportosító sorok összehasonlítással vagy (és) leíró sorokkalszerepelnek együtt. A csoportosító tábla egy irányban összesen rovatokat is tartalmaz.
A következő táblában az egy ismérv szerinti csoportosítás összehasonlítással társul (3.2. táblázat).
A tábla függőleges irányban tartalmazza a csoportosítást. A csoportosítás alapja – az életkor – mennyiségi ismérv, ezért a táblában függőlegesenhárom mennyiségi sor helyezkedik el. Vízszintesen kilenc összehasonlító, állapotidősor található. Ebben a táblában vízszintes irányban helyezkednekel az összesen rovatok. Az összesen rovatban lévő adatok alkotják azt az idősort, amely az egész népesség számának alakulását mutatja.
3.2. táblázat - A magyarországi népesség életkor szerinti megoszlásának alakulása
Korcsoport Népességszám (E fő)(év) 1980 1990 1995
(január 1.)0 – 5
6 – 14
15 – 24
25 – 29
30 – 49
1 045
1 296
1 465
892
2 814
738
1 392
1 445
620
3 014
720
1 151
1 619
675
2 897
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
109
50 – 59
60 – 69
70 –
1 368
928
902
1 206
1 116
844
1 198
1 058
927Összesen 10 710 10 375 10 245
A kombinációs táblák
A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat kombinációs vagy kontingenciatáblába foglalhatjuk.A kombinációs tábla legalább két ismérv szerinti kombinatív csoportosítást tartalmaz.
Az 1.4. pontban a magyarországi lakott lakások két ismérv szerinti kombinatív csoportosítása eredményeként adódó sémát közöltünk. A kétszeresencsoportosított adatokból kiindulva és az adatokat függőleges és vízszintes irányban elrendezve, felírhatjuk a statisztikai sorok olyan összefüggőrendszerét, amely kombinációs táblát alkot (3.3. táblázat).
3.3. táblázat - A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint(1990. január 1.)
Komfortosság Budapest A többi város Községek ÖsszesenKomfortos
Félkomfortos
Komfort nélküli
673
40
63
1259
88
193
780
159
433
2712
287
689Összesen 776 1540 1372 3688
A tábla kétféle minőségi ismérv – a komfortosság és a településtípus – szerinti kombinatív csoportosítást tartalmaz. Függőlegesen a komfortosságszerinti csoportosításból keletkezett négy minőségi sor helyezkedik el. Ezek a lakások számának komfortosság szerinti megoszlását mutatjáktelepüléstípusonkénti bontásban, valamint az összes lakásra vonatkozóan. A vízszintes irányban elhelyezkedő négy – ugyancsak – minőségi sora különböző komfortfokozatú lakások és az összes lakás településtípusonkénti megoszlását jellemzi. A kétféle csoportosításnak megfelelően kétirányban találhatók összesen adatok.
A statisztikai táblák három típusát szemlélteti a 3.1. ábra.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
110
3.1. ábra - A statisztikai táblák típusai
A különböző típusú statisztikai táblák formájában rendelkezésre álló adatok elemzésénél különböző jellegzetes elemzési esetek adódnak, avizsgálathoz különböző elemzési eszközöket, módszereket használunk.
A 3. fejezet további részében kétdimenziós statisztikai táblákhoz kapcsolódóan tekintünk át jellegzetes elemzési eseteket, és bemutatjuk, hogy azegyes esetekben milyen statisztikai elemzési eszközök, módszerek, mutatószámok alkalmazhatók.
3.2. Az egyszerű táblák elemzéseAz egyszerű táblák nem tartalmaznak csoportosítást, az ilyen táblákban általában leíró sorok és összehasonlító sorok – leggyakrabban idősorok– találhatók.
Az elemzés során intenzitási viszonyszámokat és összehasonlító viszonyszámokat számíthatunk, bizonyos esetekben a tábla információtartalmátmegfelelő grafikus ábrák segítségével is megjeleníthetjük.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
111
3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazásaAz eddigiekben már megismert (például dinamikus vagy megoszlási) viszonyszámok azonos fajta, azonos mértékegységű adatok hányadosai voltak.
Ezzel szemben az intenzitási viszonyszám két különböző fajta és általában különböző mértékegységű statisztikai adat hányadosa.
Az intenzitási viszonyszám azt mutatja meg, hogy az egyik sokaság milyen intenzitással fordul elő a másik sokaság környezetében. Általábanmértékegysége van, amely a viszonyszám számlálójában és nevezőjében szereplő adat – nem feltétlenül azonos – mértékegységéből adódik. Mivelaz egyszerű táblák általában leíró sorokat is tartalmaznak, elemzésük során az ilyen típusú viszonyszámok alkalmazására tág lehetőségek nyílnak.
Az intenzitási viszonyszámok jellegzetes típusai – a viszonyszám tartalma szerint – a következők:
– sűrűségmutatók,
– ellátottságot kifejező mutatók,
– arányszámok,
– átlagjellegű mutatók.
Sűrűségmutató például a népsűrűség mutatószáma, amely a népességnek a számára rendelkezésre álló területen való elhelyezkedéséneksűrűségét, intenzitását mutatja. Az ellátottsági mutatók a szociális, a kulturális stb. ellátás színvonalának mérőszámai. (Például a 10 000lakosra jutó kórházi ágyak száma, amely az egészségügyi ellátás egyik mutatószáma.) Az arányszám elnevezésű mutatószámokat főleg anépességstatisztikában használják, ilyenek a születési, halálozási stb. arányszámok. Átlagjellegű mutatók például az 1 főre jutó GDP nagysága, 1termék előállításához szükséges munkaidő stb.
Tekintsük át a 3.4. táblázat adatait.
3.4. táblázat - Az orvosi ellátás néhány adata (december 31-i adatok)
Megnevezés 1980 1993Népesség száma (E fő)
Orvosok száma (fő)
Háziorvosok száma (fő)
10 705
30 842
5 092
10 278
41 397
6 381
Az egészségügyi ellátás színvonalát jellemezni lehet például a
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
112
mutatóval, vagy az
mutatóval.
1980-ban:
a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,
az 1 orvosra jutó lakosok száma: lakos/orvos.
1993-ban:
a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,
az 1 orvosra jutó lakosok száma: lakos/orvos.
Példánk alapján látható, hogy az intenzitási viszonyszámok bizonyos körénél a viszonyítás tárgyát képező adat és a viszonyítás alapját képező adatfelcserélhető, vagyis az intenzitási viszonyszám számítása céljából kijelölhető tört számlálójában és nevezőjében szereplő adatok felcserélhetők.
Ha ugyanazon két sokaság adata alapján ilyen módon kétféle intenzitási viszonyszám képezhető, az egyiket egyenes, a másikat fordított intenzitásiviszonyszámnak szokás nevezni. A két intenzitási viszonyszám közül azt célszerű egyenesnek nevezni, amely értékének növekedése kedvezőirányú változást jelez.
A 10 000 lakosra jutó orvosok számának növekedése az orvosellátottság javulását jelzi, ezért ezt tekintjük egyenes intenzitási viszonyszámnak;az 1 orvosra jutó lakosok számát pedig fordított intenzitási viszonyszámnak, ugyanis ennek nagysága fordított arányban áll a vizsgált jelenségszínvonalával.
Az ugyanazon két adat alapján számított, egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok fordított arányban állnak egymással1.
12 Az orvosellátottság két említett mutatószámánál ügyeljünk arra, hogy az egyenes intenzitási viszonyszám 10 000 lakosra vetítve mutatja az orvosok számát.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
113
Ha abból a sokaságból – amelynek a nagyságát jellemző adat (B) az elemzés céljából kiszámítandó intenzitási viszonyszám nevezőjében szerepel– kiválasztható egy olyan részsokaság (a nagyságát b jellemzi), amely – az egész sokaságnál – közvetlenebb kapcsolatban áll a számlálóban levőadattal (A-val), akkor kétféle intenzitási viszonyszám számítható.
A viszonyítandó adatot a teljes viszonyítási alappal elosztva nyers intenzitási viszonyszámot a vele szorosabb kapcsolatban álló részsokaság
adatával osztva tisztított intenzitási viszonyszámot kapunk.
A kétféle viszonyszám kiszámításához felhasznált adatok lehetővé teszik még egy megoszlási viszonyszám kiszámítását is, amely a tisztítottintenzitási viszonyszám nevezőjében szereplő részsokaság adatának arányát mutatja a nyers intenzitási viszonyszám nevezőjében szereplő teljes
sokaság adatához viszonyítva Ezt az arányt a „tiszta” rész arányának szokás nevezni.
A két intenzitási viszonyszám és a megoszlási viszonyszám között fennáll a következő összefüggés:
a nyers intenzitási viszonyszám egyenlő a tisztított intenzitási viszonyszám és a tiszta rész arányának szorzatával.
Az összefüggés alapján bármelyik viszonyszám kiszámítható a másik kettő ismeretében. Az összefüggés arra is rámutat, hogy a nyers intenzitásiviszonyszám két tényező hatásának eredménye.
A nyers és tisztított intenzitási viszonyszámok alkalmazásának számos területe van, legjellemzőbb a használatuk a népességstatisztikábanalkalmazott arányszámok esetében. Például a születési arányszám számításánál a születések számát viszonyíthatjuk az egész népesség számához,illetve viszonyítási alap lehet a szülőképeskorú (15–49 éves) női népesség száma.
A korábbi példánkban az 1 orvosra jutó lakosok száma nyers intenzitási viszonyszámnak tekinthető. Az orvosok sokaságán belül ugyanis van egyolyan rész – a háziorvosok sokasága –, amely közelebbi kapcsolatban van az ellátandó népességgel. Ezért kiszámítható az 1 háziorvosra jutólakosok száma is, amely tisztított intenzitási viszonyszámnak minősül. Az orvosellátottság nyers és tisztított viszonyszámai 1980-ban:
a 1 orvosra jutó lakosok száma: lakos/orvos,
az 1 háziorvosra jutó lakosok száma: lakos/orvos.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
114
A háziorvosok aránya:
Összefüggésük:
1993-ban:
a 1 orvosra jutó lakosok száma: : lakos/orvos,
az 1 háziorvosra jutó lakosok száma: lakos/orvos.
A háziorvosok aránya:
Összefüggésük:
A 3.4. táblázatban megadott adatok nemcsak intenzitási, hanem dinamikus viszonyszámokkal is elemezhetők.
A 3.5. táblázatban megadjuk a kiszámított viszonyszámokat is és az összefüggések általánosításához szükséges jelöléseket.
3.5. táblázat2
3.5. táblázat - Orvosi ellátásra vonatkozó adatok
Megnevezés 1980
(0)
1993
(1)
1980=100,0%
2Annak érdekében, hogy az eredmények közötti pontos, számszerű összefüggéseket bemutathassuk, a viszonyszámok számításánál 2 tizedes pontossággal számoltunk.
A táblázatban található megoszlási viszonyszámok és dinamikus viszonyszámok százalékos formában kifejezett viszonyszámok. A viszonyszámok számításának képletszerű felírásakor a 100-zalvaló szorzás kijelölésétől eltekintettünk.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
115
Népességszáma (Efő)
A 10 705,11 10 278,11 96,01
Orvosokszáma (fő)
B 30 842,11 41 397,11 134,22
Háziorvosokszáma (fő)
b 5092,11 6381,11 125,31
10 000lakosra jutóorvosokszáma
28,81 40,28 139,81
1 orvosrajutó lakosok
száma
347,09 248,28 71,53
1háziorvosrajutó lakosokszáma
2102,31 1610,72 76,62
Háziorvosokaránya (%)
16,51 15,41 93,33
A táblázatban, amely ugyancsak egyszerű statisztikai tábla, az abszolút adatok mellett különféle típusú intenzitási viszonyszámok, megoszlásiviszonyszámok, az utolsó oszlopban pedig dinamikus viszonyszámok foglalnak helyet.
Mint látható, nemcsak az abszolút adatok összehasonlításából számíthatunk összehasonlító – jelen esetben dinamikus – viszonyszámokat, hanemaz intenzitási
viszonyszámokból is. Fontos megjegyezni, hogy a különféle típusú intenzitási viszonyszámok közötti összefüggések az azokból számított dinamikus(és egyéb összehasonlító) viszonyszámok között is fennállnak.
Intenzitási viszonyszámok dinamikus viszonyszámának számítása
Az intenzitási viszonyszámok összehasonlítása esetén a dinamikus viszonyszámot kétféleképpen is kiszámíthatjuk. Például az 1 orvosra jutó lakosokszámának változását jelző dinamikus viszonyszám kiszámítható:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
116
a) Az 1993-as és az 1980-as év intenzitási viszonyszámainak hányadosaként:
b) A népesség és az orvosok számának változását jelző dinamikus viszonyszámok hányadosaként:
Az 1 orvosra jutó lakosok száma tehát 28,47% -kal csökkent 1980-ról 1993-ra.
Általánosságban is igaz, hogy az intenzitási viszonyszám dinamikus viszonyszáma kétféleképpen számítható:
a) A tárgyidőszaki és a bázisidőszaki intenzitási viszonyszámok hányadosaként:
b) Az intenzitási viszonyszám számlálójában és nevezőjében szereplő adatok dinamikus viszonyszámának hányadosaként:
A kétféle számítás azonos eredményre vezet, mert megfelelő átrendezéssel:
Az ugyanazon két adat alapján számított egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok egymás reciprokai.
Egyenes intenzitási viszonyszám
fordított intenzitási viszonyszám
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
117
Összefüggésük:
Példánkban: orvos jutott 10 000 lakosra 1980-ban.
(A 10 000-rel való szorzást az indokolja, hogy az egyik viszonyszámnál a nevező 1 egységéről, a másik viszonyszámnál a nevező 10 000 egységérőlvan szó.)
A reciprok viszony fennáll az egyenes és fordított intenzitási viszonyszámok dinamikus viszonyszámai között is:
Például: a 10 000 lakosra jutó orvosok számának 1980-ról 1993-ra bekövetkezett változását jelző dinamikus viszonyszám kiszámítható akövetkezőképpen is:
3.2.2. A fejlődési tendenciák kimutatása, összehasonlításaHa az egyszerű táblában kettőnél több időpontra (időszakra) vonatkozó adatok vannak, akkor lehetőségünk van a vizsgált jelenség változási, fejlődésitendenciáinak kimutatására is.
Egy sokaság változásának tendenciája kirajzolódik a sokaság nagyságadatait tartalmazó – viszonylag hosszabb – idősorból, illetve szemléletesentükrözi ezt az idősor adatai alapján készített vonaldiagram.
Ha két vagy több – egymással valamilyen kapcsolatban lévő – sokaság változásának tendenciáját kívánjuk összehasonlítani, akkor az adatok eltérőnagyságrendje, eltérő mértékegysége miatt csak a dinamikus viszonyszámok alapján vonhatunk le következtetéseket. Követelmény továbbá, hogymindegyik adatsor összehasonlítási bázisa azonos legyen. Ha pedig grafikusan akarjuk szemléltetni a különböző jelenségek fejlődési tendenciáit,akkor célszerű közös (egyetlen) koordináta-rendszerben ábrázolni azokat.
Bemutató példánkat ismét az egészségügy területéről vesszük. A 3.6. táblázat az 1985 és 1993 közötti időszakra (kettőnél több időbeli adat alapján)mutatja be az ellátottságot jellemző néhány adatot.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
118
3.6. táblázat - Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok)Év Népesség száma
(ezer fő)
Orvosok száma
előző év = 100,00%
Kórháziágyak száma
1980 = 100,00%1985
1986
1987
1988
1989
1990
1991
1992
1993
10 560
10 509
10 464
10 421
10 375
10 355
10 337
10 310
10 278
–
101,17
101,40
102,10
101,72
103,70
103,50
103,44
101,29
107,13
108,62
109,46
109,73
109,85
110,00
108,93
106,56
105,12
Figyeljük meg, hogy a népességszám ezer főben adott, az orvosok számának a láncviszonyszámai, a kórházi ágyak számának pedig abázisviszonyszámai (1980-as bázison) ismertek.
A bekövetkezett változások jellemzése és reális összehasonlítása a három jelenség bázis- vagy láncviszonyszámai alapján lehetséges. Ezekismeretében történhet ezután a megfelelő intenzitási viszonyszámok dinamikus viszonyszámainak kiszámítása.
A 3.7. táblázat első három oszlopa az alapadatok bázisviszonyszámait, további oszlopai pedig a kiszámítható intenzitási viszonyszámok (1985-ösbázison számított) bázisviszonyszámait tartalmazzák.
3.7. táblázat - Az egészségügyi ellátásra vonatkozó adatok
ÉvNépesség
száma1985=100%
Orvosok
száma
1985=100%
Kórháziágyakszáma
1985=100%
10 000
lakosrajutó
orvosok
1 orvosrajutó
lakosok
10 000
lakosrajutó
kórházi
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
119
száma1985=100%
száma1985=100%
ágyakszáma
1985=100%1. 2. 3. 4. 5. 6.
1985
1986
1987
1988
1989
1990
1991
1992
1993
100,00
99,52
99,09
98,68
98,25
98,06
97,89
97,63
97,33
100,00
101,17
102,59
104,74
106,54
110,48
114,36
118,30
119,81
100,00
101,39
102,18
102,43
102,54
102,68
101,68
99,47
98,12
100,00
101,66
103,53
106,14
108,44
112,67
116,83
121,18
123,10
100,00
98,37
96,59
94,21
92,22
88,75
85,59
82,53
81,24
100,00
101,87
103,12
103,80
104,37
104,71
103,87
101,88
100,81
A 3.7. táblázatban található viszonyszámok számításával kapcsolatban a következőket említjük meg.
Mielőtt a táblázat adatait tanulmányoznánk, gondoljuk végig az alábbiakat.
– A Dinamikus viszonyszámok című 2.2.2. alpontban megismerkedtünk a bázis- és a láncviszonyszámok közötti összefüggésekkel.Láncviszonyszámokból bázisviszonyszámok közvetlenül számíthatók, a megfelelő láncviszonyszámok szorzataként.
Például az 1990. évi viszonyszám számítása (a táblázat 2. oszlopában):
– A kórházi ágyak számának alakulását jellemző viszonyszámok a 3.6. táblázatban 1980-as bázishoz viszonyítva mérik a változást. Ebázisviszonyszámokat az összehasonlíthatóság érdekében átszámítottuk 1985-ös bázisra.
Az átszámítás úgy történt, hogy az 1980. évi bázison számított bázisviszonyszámokat rendre elosztottuk az „új” bázisul választott 1985. év 1980-as bázison számított viszonyszámával, az 1,0713-del.
Például a kórházi ágyak számának 1990. évi bázisviszonyszáma, 1985-ös bázishoz viszonyítva
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
120
A két bázisviszonyszám hányadosa ugyanarra az eredményre vezet, mintha a két alapadatot osztottuk volna el egymással.
Általánosságban is megállapíthatjuk, hogy új bázisra úgy térünk át, hogy a viszonyszámsor minden elemét elosztjuk az új bázisnak választottidőszak (időpont) eredeti bázisviszonyszámával.
– A táblázat 4., 5. és 6. oszlopában szereplő intenzitási viszonyszámok bázisviszonyszámait az ebben a fejezetben megismert összefüggések alapjánszámítottuk ki.
Például
– a 10 000 lakosra jutó kórházi ágyak számának bázisviszonyszáma 1990-ben:
(Az eredeti viszonyszámtört számlálójának – a kórházi ágyak számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – a népességszámának – a viszonyszámával.)
– az 1 orvosra jutó lakosok számának bázisviszonyszáma 1993-ban:
(Az eredeti viszonyszámtört számlálójának – a népesség számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – az orvosokszámának – a viszonyszámával.)
A 3.7. táblázat alapján látható, hogy a népesség számának csökkenő tendenciája mellett az orvosok száma növekedést mutat. A népességszámés az orvosok számának bázisviszonyszámait összehasonlítva egyértelműen következtethetünk az orvosellátottság javulására, amelyet közvetlenüljeleznek a 10 000 lakosra jutó orvosok számának, illetve az 1 orvosra jutó lakosok számának bázisviszonyszámai.
A kórházi ágyak számának alakulását 1985 és 1991 között viszonylag egyenletes, de kismértékű növekedés jellemezte. A csökkenő népességszámmellett ez a 10 000 lakosra jutó kórházi ágyak számának növekedését eredményezte. 1991-től kezdődően azonban a kórházi ágyak száma évrőlévre csökkent, nagyobb arányban, mint a népességszám. Ezért 1991-től kezdődően a 10 000 lakosra jutó kórházi ágyak száma is – viszonylagosan– csökkent.
A változások alapvető tendenciáját – az előzőekben említett módon – vonaldiagramokkal szemléltethetjük.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
121
3.2. ábra - Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva
A 3.2. ábra alapján is következtethetünk az egészségügyi ellátás – különböző intenzitási viszonyszámokkal jellemzett – színvonalának alakulására.Az egészségügyi ellátottság változásának tendenciáját – egyértelműbben – a 3.3. ábra szemlélteti.
3.3. ábra - Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
122
A változás tendenciájának tömör jellemzésére alkalmazhatjuk az átlagos változás mérőszámait, nevezetesen a fejlődés átlagos mértéke és a
fejlődés átlagos üteme mutatószámokat.
Az ismert adatok alapján a fejlődés átlagos mértékének mutatószámával csak a népesség számának alakulását vizsgálhatjuk. (Az orvosokra és akórházi ágyakra ugyanis nem ismertek az abszolút számok.)
A népesség változásának átlagos mértékét a legegyszerűbben a következőképpen számíthatjuk:
Ezt úgy értelmezhetjük, hogy Magyarországon a népesség száma 1985 és 1993 között évenként átlagosan 35 250 fővel csökkent.
A népességszám változásának átlagos üteme pedig:
amely alapján megfogalmazható, hogy a népesség száma 1985 és 1993 között évenként átlagosan 0,34%-kal csökkent.
Nézzük meg, hány %-kal változott a kórházi ágyak száma 1985 és 1993 között:
tehát évenként átlagosan 0,24%-kal csökkent.
A 10 000 lakosra jutó kórházi ágyak számának 1985 és 1993 közötti átlagos relatív változására vonatkozó mutatószám értékét kiszámíthatjuk akórházi ágyak számának és a népesség számának mutatószámai alapján is a következőképpen:
Ez természetesen kiszámítható a 10 000 lakosra jutó kórházi ágyak számának adataiból közvetlenül is:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
123
Az orvosok számának, valamint az orvosellátottság 1985 és 1993 közötti alakulásának jellemzésére az előbbiekhez hasonló módon elvégezhetőka számítások.
3.3. A csoportosító táblák elemzéseA csoportosító táblában a sokaság(ok)nak egy ismérv szerinti csoportosítása (osztályozása) található, amely általában valamilyen leíró sorral vagyösszehasonlítással társul. Ha a sokaság(ok)nak a csoportosítással kialakított részeit külön-külön is fontosnak, vizsgálatra érdemesnek tartjuk,akkor a csoportokat, az osztályokat részsokaság(ok)nak tekintjük. Ebben az esetben az egész sokaságo(ka)t teljes sokaság(ok)nak vagyfősokaság(ok)nak nevezzük.
3.8. táblázat - A csoportosító tábla általános sémája
Részsokaságok
(csoportok)
Fősokaság
ahol:
valamely ismérv alapján képzett j-edik részsokaságok (csoportok) megnevezése,
a j-edik részsokaságokra vonatkozó adatok,
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
124
M: a képzett részsokaságok (csoportok) száma.
3.3.1. Rész- és összetett viszonyszámok
Csoportosított sokaság esetén az egyes részsokaságokra számított azonos típusú viszonyszámokat részviszonyszámoknak (jele: ), afősokaságra vonatkozó viszonyszámot összetett viszonyszámnak (jele: ) nevezzük.
A részviszonyszám képlete:
Az összetett viszonyszám képlete:
A részviszonyszám képletéből -t illetve -t kifejezve az összetett viszonyszám a következőképpen is felírható:
Ezek az összefüggések arra mutatnak rá, hogy az összetett viszonyszám egyúttal átlag is, a részviszonyszámok súlyozott számtani, illetve
harmonikus átlaga. Ez indokolja a jelölését is. Ebből következően minden összetett viszonyszám a legkisebb és legnagyobb részviszonyszám
között helyezkedik el, vagyis:
Az összetett viszonyszámra vonatkozó képleteket szövegesen megfogalmazva a következők mondhatók el. Az összetett viszonyszámháromféleképpen számítható ki:
1. a fősokaság(ok)ra vonatkozó adatok hányadosaként;
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
125
2. a részviszonyszámok súlyozott számtani átlagaként, ahol a súlyok szerepét a részviszonyszámok számítása céljából kijelölhető törtek
nevezőiben szereplő adatok töltik be;
3. a részviszonyszámok súlyozott harmonikus átlagaként, ahol a súlyok a részviszonyszámok számítása céljából kijelölhető törtek számlálóiban
szereplő adatok.
Az összetett viszonyszámok súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási
viszonyszámokkal. A adatok helyett a az adatok helyett az megoszlási viszonyszámok használhatók fel.
A következőkben a rész- és összetett viszonyszámoknak különböző elemzési helyzetekben betöltött szerepére mutatunk be példákat.
Az átlagos színvonal vizsgálata csoportosított sokaságok esetén
3.9. táblázat - Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.)
MegnevezésNépességszám
(ezer fő)
Lakások száma
(ezer db)
Budapest
A többi város
Községek
1 995,7
4 561,9
3 719,4
810
1692
1453Összesen 10 277,0 3955
A 3.9. táblázatban szereplő adatok felhasználásával jellemezhető a magyarországi lakásellátottság színvonala. Kiszámítható a lakásellátottság egyikleggyakrabban használt mutatószáma, a 100 lakásra jutó lakosok száma .
A lakásellátottság színvonalát tehát intenzitási viszonyszámmal fejezzük ki.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
126
Ebben az elemzési helyzetben a településtípusokra vonatkozó intenzitási viszonyszámok részviszonyszámok míg az egész országot jellemző
intenzitási viszonyszám összetett viszonyszámnak tekinthető.
A 3.9. táblázat adataiból – mivel azok részekre bontott sokaságok adatai – megoszlási viszonyszámok is számíthatók. Ezek a viszonyszámok anépesség, illetve a lakások településtípusonkénti összetételét jellemzik.
A 3.9. táblázatban szereplő adatokat a belőlük számítható viszonyszámokkal kiegészítve állítottuk össze a 3.10. táblázatot.
3.10. táblázat - A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.)
Népesség száma Lakások száma 100 lakásra
ezer fő%-os
megoszlásezer db
%-os
megoszlás
jutó
népesség (fő)
Megnevezés
Budapest
A többiváros
Községek
1 995,7
4 561,9
3 719,4
19,42
44,39
36,19
810
1692
1453
20,48
42,78
36,74
246
270
256
Összesen 10 277,0 100,00 3955 100,00 260
A 3.10. táblázat utolsó oszlopában található adatok rész- és összetett intenzitási viszonyszámok. Részintenzitási viszonyszám például a Budapestrevonatkozó 100 lakásra jutó népesség:
Az egész ország lakásellátottságát jellemző összetett viszonyszám kiszámítása a következő:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
127
Az átlagos viszonyszám a megismert összefüggések alapján az alábbiak szerint is kiszámítható:
– a részviszonyszámok súlyozott számtani átlagaként:
a településtípusonkénti lakásszámadatokkal súlyozva
vagy megoszlási viszonyszámokkal súlyozva
– a részviszonyszámok súlyozott harmonikus átlagaként:
a településtípusonkénti népességszámadatokkal súlyozva
vagy megoszlási viszonyszámokkal súlyozva
(Figyeljük meg, hogy az egész országot jellemző mutatószám értéke (260) a legkisebb (246) és a legnagyobb érték (270) közé esik.)
3.3.2. Szerkezet- és dinamikai változás vizsgálataHa egy sokaság belső szerkezetében bekövetkezett (összetétel vagy struktúra) változását kívánjuk vizsgálni, akkor is csoportosító táblából indulunkki (3.11. táblázat). A szerkezetváltozás mellett módunk van a jelenség dinamikai (időbeli) változásának vizsgálatára is.
3.11. táblázat - A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)
Ezer db
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
128
1980 1994Szobák száma
1
2
3 és több
973
1720
849
644
1710
1601Összesen 3542 3955
A lakásállomány szobaszám szerinti szerkezetét, összetételét a különböző időpontokban megoszlási viszonyszámokkal, az állomány nagyságának
változását pedig dinamikus viszonyszámokkal elemezhetjük. Az egyes csoportokra (részsokaságokra) részviszonyszámok a fősokaságokra
összetett dinamikus viszonyszám számítható. Számításukra és a közöttük levő összefüggésekre a korábbiakban elmondottak érvényesek.
Figyelmünket most elsősorban a szerkezetvizsgálat és a dinamikai változások összefüggéseire fordítjuk. A 3.12. táblázat az előző táblázat adataitkibővíti a kiszámítható viszonyszámokkal is.
3.12. táblázat - A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása
1980. 1994. 1994. éviévi állomány állomány az
Szobákszáma ezer db
%-os
megoszlásezer db
%-os
megoszlás
1980. évi
%-ában
1
2
3 és több
973
1720
849
27,47
48,56
23,97
644
1710
1601
16,28
43,24
40,48
66,2
99,4
188,6Összesen 3542 100,00 3955 100,00 111,7
A 3.12. táblázatban található viszonyszámok alapján a következőket fogalmazhatjuk meg.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
129
A lakásállomány szerkezetének 1980 és 1994 közötti változására az 1 szobás lakások arányának jelentős, a 2 szobások arányának kismértékűcsökkenése és a 3 szobás lakások arányának nagyfokú növekedése jellemző. (Lásd a %-os megoszlásokat.) 1980 és 1994 között az egészlakásállomány 11,7%-kal nőtt, miközben a különböző szobaszámú lakások száma ettől eltérő módon változott. Míg az 1 szobás lakások állományaszámottevően csökkent, a 2 szobásoké alig csökkent, addig a 3 szobás lakások száma nagymértékben megnőtt. E változások eredményezték alakásállomány szobaszám szerinti szerkezetének az előzőekben vázolt változását.
Az összetétel-változás viszonyszámokkal történő elemzésére tekintsük még a következő példát is (3.13. táblázat).
3.13. táblázat - Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jeiadatok)
1980. 1994. 1994. évi
évi népesség népességszámaz
Megnevezés ezer fő%-os
megoszlásezer fő
%-os
megoszlás
1980. évi
%-ában
Budapest
A többiváros
Községek
2 059,3
4 551,3
4 098,9
19,23
42,50
38,27
1 995,7
4 561,9
3 719,4
19,42
44,39
36,19
96,9
100,2
90,7
Összesen 10 709,5 100,00 10 277,0 100,00 96,0
Magyarország népessége 1980 és 1994 között 4,0%-kal csökkent. A budapesti népességszám ettől alig eltérően – de valamivel kisebb mértékben –,3,1%-kal csökkent, emiatt a budapesti népesség aránya csekély mértékben (19,23%-ról 19,42%-ra, tehát 0,19 százalékponttal) nőtt. A többi városbana népességszám igen kis mértékben, 0,2%-kal nőtt, mivel a teljes népességszám viszont csökkent, e településcsoport népességének részarányamegnőtt. A községekben élő népesség száma 1994-ben 9,3%-kal volt kevesebb, mint 1980-ban (tehát nagyobb mértékű csökkenés tapasztalható,mint az egész országban), ennek hatására a községekben élő népesség aránya 1994-ben kisebb, mint 1980-ban.
A példák alapján könnyen belátható, hogy összefüggés van a fősokaság és a részsokaságok nagyságának és a fősokaság szerkezetének változásaközött.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
130
A részsokaságok nagyságának eltérő mértékű változása mindig a fősokaság összetételének megváltozását eredményezi.
Ha a j-edik részsokaság (csoport) tárgyidőszaki adata,
a j-edik részsokaság (csoport) bázisidőszaki adata,
a j-edik részsokaság (csoport) rész-dinamikus viszonyszáma,
a fősokaság összetett dinamikus viszonyszáma,
M: a képzett részsokaságok (csoportok) száma,
akkor általánosságban megállapíthatók a következő:
a) Ha akkor ebből átrendezéssel következik, ami azt jelenti, hogy ha valamely részsokaság (csoport) dinamikusviszonyszáma kisebb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül csökkent.
Ehhez hasonlóan:
b) ha akkor tehát ha valamely részsokaság (csoport) dinamikus viszonyszáma nagyobb, mint az összetett dinamikus viszonyszám,akkor a részsokaság aránya a fősokaságon belül nőtt;
c) ha akkor ebből következik, ami azt jelenti, hogy a j-edik részsokaság aránya nem változott.
A dinamikus viszonyszámok ismeretében tehát következtetni tudunk a sokaság összetételében, szerkezetében bekövetkezett változásokra. Minéljobban eltér valamely részviszonyszám az összetett viszonyszámtól, annál nagyobb mértékű az adott sokaság részarányának változása.
Tekintsük a következő számszerű példát!
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
131
Tételezzük fel, hogy ismerjük a lakásépítések területi megoszlását 1980-ban és az 1994-re bekövetkezett dinamikai változást. Az adatok a 3.14.táblázatban találhatók.
3.14. táblázat - A magyarországi lakásállományra vonatkozó adatok
A lakások számának
%-os megoszlása 1980-ban
A lakásokszámának változása
1980-ról 1994-re
(1980=100,0%)
Megnevezés
Budapest
A többi város
Községek
20,53
34,27
45,20
111,4
139,4
90,8Összesen 100,00 ...
A teljes lakásállomány nagyságának 1980 és 1994 közötti változását jellemző összetett dinamikus viszonyszámot a 3.14. táblázatban szereplő adatok
alapján a településcsoportokra vonatkozó rész-dinamikus viszonyszámok súlyozott számtani átlagaként számíthatjuk ki.
Tehát megállapítható, hogy az egész lakásállomány 1980-ról 1994-re 11,7%-kal nőtt. A budapesti lakások száma ennél valamivel kisebb mértékben(11,4%-kal) nőtt, emiatt a budapesti lakások aránya a teljes lakásállományon belül 1980-ról 1994-re kissé csökkent. Tehát az 1994. évi részaránytjelző megoszlási viszonyszám 20,53%-nál (nem számottevően) kisebb. A többi városban a lakásállomány a teljes állomány növekedésénél nagyobbfokú növekedést mutat, e tényből az is következik, hogy a többi város részesedése az ország lakásállományából megnőtt, 1994-ben a részesedésiarány 34,27%-nál nagyobb. A községi lakások száma a vizsgált időszakban csökkent (míg az egész lakásállomány nőtt), így a községi lakásokaránya csökkent, az arány 1994-ben 45,20%-nál kisebb volt.
A sokaságok nagyságának és szerkezetének változására vonatkozó információkat nemcsak csoportosító táblák formájában jeleníthetjük meg, hanemmegfelelően megválasztott, megszerkesztett grafikon segítségével is.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
132
A sokaságok nagyságának és összetételének változását leggyakrabban osztott oszlopdiagramokkal vagy osztott kördiagramokkal szemléltetjük.
Oszlopdiagrammal történő ábrázolás esetén az adatokat célszerű eltérő szélességű, azonos magasságú oszlopokkal ábrázolni. Az oszlopok(téglalapok) eltérő szélességében a sokaság(ok) nagyságának időbeli változását juttatjuk kifejezésre, és az azonos magasságokat az adott időszakiösszetételnek megfelelően megosztjuk, így a szerkezetváltozás is érzékelhetővé válik.
3.4. ábra - A lakásállomány szobaszám szerinti összetételének alakulása
A 3.4. ábra elkészítéséhez szükséges viszonyszámok a 3.12. táblázatban találhatók.
A téglalapok szélességeinek arányai 1:1,117.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
133
A kördiagram a sokaság szerkezeti megoszlásának igen kifejező ábrázolási módja. Az összetételt a kör területének körcikkekre történő osztásávalszemléltetjük. A részsokaságok arányát jelző megoszlási viszonyszámoknak megfelelő körcikkeket abból az egyszerű összefüggésből határozzukmeg, hogy a kör területe, azaz a 360°-os középponti szög megfelel a 100%-nak, így 1%-nak 3,6°-os középponti szög, azaz a hozzátartozó körcikkterülete felel meg. Az összetétel ábrázolása mellett lehetőség van arra is, hogy a sokaságok nagyságának időbeli változását is érzékeltessük. Kétidőszak adatának összehasonlítása esetén két különálló (esetleg két koncentrikus), eltérő sugarú körrel ábrázolunk.
Síkidomokkal való ábrázolás esetén azok területe arányos az adatok nagyságával, viszont síkidomok megszerkesztésekor egydimenziósjellemzőkből indulunk ki, így a köröket a sugaruk segítségével szerkesztjük. Ehhez fontos tisztázni, milyen arányban áll a sugarak nagyságaegymással.
Ha azt akarjuk, hogy a körök területaránya a viszonyszámot fejezze ki – mivel a körök területaránya azonos a sugarak négyzetének arányával
–, a sugarak aránya lesz.
3.5. ábra - A lakásállomány szobaszám szerinti összetételének alakulása
Természetesen a 3.5. ábra elkészítéséhez is szükségesek a 3.12. táblázatból kiolvasható viszonyszámok. Az 1994-es lakásállomány nagyságát
szemléltető kör sugara a az 1980. évi állományt reprezentálóénak -szerese.
3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzéseAzok a gazdasági és társadalmi jelenségek, folyamatok, amelyek vizsgálatával a statisztika foglalkozik, összefüggésben állnak egymással. Az elemzőmunka során fontos feladat ezeknek az összefüggéseknek a feltárása, a statisztika eszközeivel történő leírása. A jelenségeket, folyamatokat azismérveik alapján jellemezhetjük, ezért a közöttük lévő összefüggések az ismérvek közötti kapcsolatként jelennek meg.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
134
Mielőtt a módszerek ismertetésére rátérnénk, ismerkedjünk meg az összefüggések lehetséges eseteivel.
Az ismérvek közötti kapcsolat lehet függvényszerű, lehet sztochasztikus, illetve az ismérvek lehetnek egymástól függetlenek.
Függvényszerű a kapcsolat két ismérv között, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) egyértelműen meghatározza a másik ismérvszerinti hovatartozást (ismérvváltozatot). Ilyen összefüggés van például a lakosok születési éve és életkora között.
Sztochasztikus kapcsolatról beszélhetünk akkor, ha az ismérvek között tendenciaszerű összefüggést észlelünk, ha az egyed egyik ismérv szerintihovatartozásából csupán a másik ismérv szerinti hovatartozásnak a valószínűsége határozható meg. Ilyen összefüggés van például a munkavállalókképzettsége és szakmai elismertsége között; a vállalkozások árbevétele és jövedelmezősége között stb.
A két ismérvet egymástól függetlennek mondjuk, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) ismerete semmiféle információt nem ada másik ismérv szerinti hovatartozásról (ismérvváltozatról). Pontos definícióját a 3.4.1. pontban adjuk meg.
A statisztika a sztochasztikus kapcsolat vizsgálatával foglalkozik. Ezt a kapcsolatot – az elmondottak alapján – úgy tekinthetjük, mint a két szélsőség(a teljes függvényszerűség, illetve a kapcsolat teljes hiánya) közötti átmenetet. A kapcsolat erősségét (intenzitását) aszerint ítéljük meg, hogy azmelyik szélsőséghez áll közelebb.
A kapcsolatot annál lazábbnak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál szorosabbnak, erősebbnek, minélközelebb áll a függvényszerű kapcsolathoz.
A sztochasztikus kapcsolatról elmondottak általánosíthatók kettőnél több ismérv esetére is, de ebben a fejezetben csak a két ismérv közötti(kétváltozós) sztochasztikus kapcsolatok vizsgálatának néhány egyszerű elemzési eszközével foglalkozunk.
A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak háromféle típusát különböztetjük meg:
a) Asszociáció(s)kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (nominális változók, illetve egyikük ordinálismérési szintű változó).
b) Vegyes kapcsolat: az egyik ismérv minőségi vagy területi ismérv (nominális, illetve ordinális skálán mért változó), a másik ismérv mennyiségiismérv (intervallum- vagy arányskálán mért változó).
c) Korreláció(s) kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (intervallum- és (vagy) arányskálán mért változó).
Tekintsük a következő példát: a közalkalmazottakat megfigyeljük az iskolai végzettség, a vezetésben betöltött szerep (beosztás), a közalkalmazottimunkaviszony hossza és a kereset nagysága szerint. Ha összefüggést tapasztalunk az iskolai végzettség és a beosztás között, ezt a kapcsolatotasszociációnak nevezzük, mert mindkét jellemző minőségi ismérv. Az iskolai végzettség (minőségi ismérv) és a kereset nagysága (mennyiségiismérv) közötti kapcsolat, illetve a beosztás (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat vegyes kapcsolat. Amunkaviszony hossza és a kereset nagysága közötti kapcsolatot pedig korrelációnak nevezzük, mert mindkét jellemző mennyiségi ismérv.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
135
Abból a szempontból, hogy melyik ismérv hat a másikra, háromféle összefüggés képzelhető el. Közvetlen ok-okozati kapcsolat, amikor az egyik ismérvaz ok, a másik az okozat, vagyis az egyik független, a másik függő változónak tekinthető. A munkaviszony hossza és a kereset nagysága közöttikapcsolatban például a munkaviszony hossza tekinthető független változónak, a kereset nagysága pedig függő változó. Az ismérvek kölcsönhatásbanlehetnek egymással, mint például az ár és a kereslet nagyságának összefüggésében. Egy termék árának nagysága befolyásolja a termék irántikeresletet, és viszont, a kereslet visszahat az árra. Közvetett kapcsolat, amikor az ismérvek között kizárólag azért tapasztalható összefüggés, mertazokat közös tényezők befolyásolják.
Az oksági összefüggések természetét általában a jelenségek szakmai ismerete alapján lehet tisztázni.
A sztochasztikus kapcsolatok statisztikai elemzéséhez a sokaság minden egységét egyidejűleg két (vagy több) ismérv szerint vizsgáljuk. Ebben afejezetben csak két ismérv összefüggésének vizsgálatával foglalkozunk.
Az asszociáció és a vegyes kapcsolat elemzése általában a sokaságnak a vizsgált két ismérv szerinti kombinatív csoportosításával (osztályozásával)kezdődik. A kombinatív csoportosítás során az egyik ismérv szerinti csoportosítással kapott részsokaságokon belül a másik ismérv szerintis osztályozunk. A kombinatív osztályozás eredményét kombinációs (kontingencia-) tábla formájában szokás megadni, emiatt tárgyaljuk asztochasztikus kapcsolatok vizsgálatát – a tananyagunknak ebben a részében – a kombinációs táblák elemzéséhez kapcsolódóan.
A kontingenciatáblák a korreláció bizonyos vizsgálataikor is kiindulópontot jelenthetnek, de a mennyiségi ismérvekben rejlő információk tökéletesebbkihasználása olyan módszerek3 alkalmazását igényli, amelyek másféle adatbázist kívánnak meg.
Két ismérv közötti kapcsolat vizsgálata a kombinációs tábla alapján történhet. A sokaságoknak két ismérv szerinti kombinatív csoportosítását(osztályozását) tartalmazó kontingenciatábla sémájaként tekintsük a 3.15. táblázatot.
3.15. táblázat - A kontingenciatábla sémájaD ismérv
E ismérv
N
3A korreláció elemzését lásd a tankönyv II. kötetében.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
136
ahol:
az E ismérv szerint képzett i-edik csoport (osztály) ( ),
a D ismérv szerint képzett j-edik csoport (osztály) ( ),
a sokaság azon egységeinek száma (gyakorisága), amelyek E ismérv szerint az osztályba és ezzel egyidejűleg D ismérv szerint a osztálybatartoznak ( ),
a sokaság azon egységeinek száma (gyakorisága), amelyek az E ismérv szerint a osztályba tartoznak ( ),
a sokaság azon egységeinek száma (gyakorisága), amelyek a D ismérv szerint a osztályba tartoznak ( ),
s : az E ismérv szerint képzett csoportok (osztályok) száma,
t : a D ismérv szerint képzett csoportok (osztályok) száma .
Az előbbiekből következik, hogy
Az gyakoriságok a sokaságoknak csak az E ismérv szerinti (függőleges irányú), az gyakoriságok a sokaságoknak csak a D ismérv
szerinti (vízszintes irányú) megoszlását mutatják. Ezeket a gyakoriságokat peremgyakoriságoknak, az ( ) gyakoriságokat együttesgyakoriságoknak nevezzük.
Nézzünk egy példát (területi és minőségi ismérvek esetén) (3.16. táblázat).
3.16. táblázat - A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyükés a tanintézet típusa szerint (1990. január 1.)
Megnevezés Szakmunkás-tanuló
Szakiskolaitanuló
Középiskolaitanuló
Egyetemi,főiskolai Összesen
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
137
hallgatóBudapest
Vidéki város
Község
28
85
84
12
20
13
66
128
77
22
42
16
128
275
190Összesen 197 45 271 80 593
Példánkban peremgyakoriságok, együttes gyakoriság.
A kontingenciatábla sémáját megoszlási viszonyszámokkal (relatív gyakoriságokkal) is felírhatjuk (3.17. táblázat).
3.17. táblázat - A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal)D ismérv
E ismérv
1
ahol:
a sokaság azon egységeinek aránya (relatív gyakorisága), amelyek egyidejűleg tartoznak az E ismérv szerint az osztályba és a D ismérv
szerint a osztályba ( ). Ezeket együttes megoszlási viszonyszámoknak(relatív gyakoriságoknak) nevezzük,
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
138
az E ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ),
a D ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ).
Ez utóbbiakat perem megoszlási viszonyszámoknak (perem relatív gyakoriságoknak) nevezzük.
A 3.16. táblázat adatai alapján készítsük el a relatív gyakoriságok táblázatát! (3.18. táblázat.)
3.18. táblázat - A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint
Megnevezés Szakmunkás-tanuló
Szakiskolaitanuló
Középiskolaitanuló
Egyetemi,
főiskolaihallgató
Összesen
(perem-
megoszlás)Budapest
Vidéki város
Községek
Összesen
(peremmegoszlás)
1
A statisztikai gyakorlatban általában ezek 100-szorosát adjuk meg, amely százalékos megoszlást jelent (3.19. táblázat).
3.19. táblázat - A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint
Megnevezés Szakmunkás-tanuló
Szakiskolaitanuló
Középiskolaitanuló
Egyetemi,főiskolai
hallgató
Összesen
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
139
Budapest
Vidéki város
Község
4,72
14,33
14,17
2,03
3,37
2,19
11,13
21,59
12,98
3,71
7,08
2,70
21,59
46,37
32,04Összesen 33,22 7,59 45,70 13,49 100,00
3.4.1. Függvényszerű kapcsolat. Függetlenség
Az E és D között függvényszerű a kapcsolat és E a független változó, ha abból, hogy a sokaság valamelyik eleme egy adott ismérvváltozathoz
tartozik, egyértelműen következik, hogy a D ismérv szerint melyik ismérvváltozatban van. Ebből azonnal adódik, hogy a 3.15. kombinációs tábla
minden sorában csak egy együttes gyakoriság különbözik nullától (az ). Hasonlóan látható be, ha D ismérv a független változó és függvényszerűa kapcsolat, akkor minden oszlopban csak egyetlen nullától különböző együttes gyakoriság található. A 3.16. táblázatot tekintve nincs az ismérvekközött függvényszerű kapcsolat.
Ha E és D mindegyike tekinthető független változónak és függvényszerű a kapcsolat, akkor ez csak úgy lehet, hogy valamint az E és D ismérvekváltozatai között kölcsönösen egyértelmű leképezés létesíthető. Ez a kontingenciatábla szempontjából azt jelenti, hogy minden sorban és oszlopbancsak egyetlen gyakoriság lehet nullától különböző. Ha nem hangsúlyozzuk, hogy melyik ismérv a független változó, akkor függvényszerű kapcsolatonez utóbbit értjük.
Most térjünk át a függetlenségre! Tekintsük a 3.15. táblázatot. Az E és D ismérv akkor független egymástól, ha az E ismérv szerinti megoszlás nemfügg a D ismérv szerintitől és fordítva.
A fősokaság E ismérv szerinti megoszlását jellemző (összetett) megoszlási viszonyszámok az viszonyszámok .
A részsokaságok E ismérv szerinti megoszlását jellemző (rész)megoszlási viszonyszámok az viszonyszámok .
Foglaljuk ezt táblázatba (3.20. táblázat)!
3.20. táblázat - Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok
D ismérv
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
140
E ismérv
1
Az E ismérvváltozatok szerinti megoszlási viszonyszámok nem függhetnek attól, hogy melyik D szerinti ismérvváltozatról van szó. Ezért ezeknekminden oszlopban egyenlőknek kell lenni. Írjuk fel ezt például az első sorra:
Általánosan:
Vagy ami ugyanaz:
;
Könnyű belátni, hogy ezen feltételek teljesülése esetén a D ismérv szerinti rész- és összetett megoszlás sem függ az E ismérvváltozattól. Vagyis aztmondhatjuk, hogy az E és D ismérv akkor függetlenek egymástól, ha ez az egyenletből álló
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
141
egyenletrendszer teljesül. Olyan megállapításnak tehát, hogy a D ismérv független E-től, nincs helye, mert a függetlenség szimmetrikus reláció.
Azonnal látható, hogy a fenti egyenletrendszer ekvivalens az
egyenletrendszerrel. A fenti definíció így is fogalmazható (lásd a 3.17. táblázatot): az E és D ismérvek akkor függetlenek egymástól, ha a peremmegoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő a megfelelő együttes viszonyszámokkal.
A 3.18. táblázat alapján könnyen ellenőrizhetjük, hogy a tanulók iskolatípus szerinti és település szerinti megoszlása nem független, mert pl.
3.4.2. Az asszociáció szorosságának méréseA sztochasztikus kapcsolat – mint már tudjuk – átmenetet képez a kapcsolat teljes hiánya (a függetlenség) és a függvényszerű kapcsolat között.Vizsgálni kell, hogy egy összefüggés mennyire áll közel a függetlenséghez, illetve mennyire közelíti a függvényszerű kapcsolatot. A két szélsőségeskapcsolathoz való viszonya alapján a sztochasztikus kapcsolatot annál szorosabbnak (erősebbnek) tekintjük, minél jobban közelít a függvényszerűkapcsolathoz, és annál lazábbnak (gyengébbnek), minél közelebb áll a függetlenséghez.
Az asszociáció szorosságának mérésére többféle mutatószámot szerkesztettek, ezeket asszociációs együtthatóknak nevezzük.
A következőkben a Yule-féle, a Csuprov-féle és a Cramer-féle asszociációs együtthatókat mutatjuk be.
A Yule-féle asszociációs együttható
Olyan esetekben, amikor mindkét ismérv alternatív (két változata van), gyakran alkalmaznak az asszociáció kimutatására koordinációsviszonyszámokat. A koordinációs viszonyszámok két részsokaság nagyságának egymáshoz viszonyított arányát mutatják. Kombinatív osztályozásesetén, a kontingenciatáblából kiindulva azonos tartalmú rész- és összetett koordinációs viszonyszámokat képezhetünk (3.21. táblázat).
3.21. táblázat - Kontingenciatáblázat alternatív ismérvek esetén
D
E
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
142
N
Ha E és D függetlenek, azaz
akkor
Úgy is mondhatjuk, hogy a főátlóban lévő együttes gyakoriságok szorzata egyenlő a mellékátlóban lévő együttes gyakoriságok szorzatával:
Ha ez nem teljesül, vagyis
akkor E és D között sztochasztikus kapcsolat van.
Ha e szorzatok különbségét elosztjuk ugyanezen szorzatok összegével, akkor a Yule-féle asszociációs együtthatóhoz (jele: Y) jutunk:
Általánosságban megállapíthatók a következők:
–
–
– a két ismérv függetlensége esetén Y = 0,
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
143
– függvényszerű kapcsolat esetén
– sztochasztikus kapcsolat esetén
Ha az együttható abszolút értéke 0-hoz áll közel, akkor laza kapcsolatról, ha pedig 1-hez áll közel, akkor szoros sztochasztikus kapcsolatrólbeszélhetünk.
Hiányossága a mérőszámnak, hogy abszolút értéke akkor is lehet 1, ha a kapcsolat nem függvényszerű. Könnyen belátható, ha akontingenciatáblában található egy 0 gyakoriság, akkor az együttható abszolút értéke 1 lesz, annak ellenére, hogy ebben az esetben nemegyértelműen határozható meg az egyik ismérv szerinti hovatartozás alapján a másik ismérv szerinti hovatartozás.
Az együttható képlete alapján belátható,
ha
ha
Tehát pozitív Y érték akkor adódik, ha az azonos indexszel jelzett gyakoriságok a nagyobbak (ezek adnak nagyobb szorzatot), más szóval, ha azegyik ismérv 1-es jelű változata a másik ismérvnek ugyancsak 1-gyel jelzett változatát „vonzza”, ugyanígy vonzzák egymást a 0-ás jelű változatokis, míg az egyik ismérvnél 1-gyel, a másik ismérvnél 0-val jelölt változatok „taszítják” egymást. Fordított esetben negatív értéket kapunk.
Nominális mérési szintű változók esetén általában önkényesen döntjük el, hogy melyik ismérvváltozatot tesszük az első helyre, ez a döntés azegyüttható abszolút értékét nem befolyásolja, csak az előjelet. Az előjelnek ilyenkor nem tulajdonítunk különösebb jelentőséget.
Ordinális skálán mérhető változók esetén (lásd később) az előjelnek már lesz értelme, jelentősége.
Nézzünk egy példát!
3.22. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Megnevezés Gazdaságilagaktív
Gazdaságilagnem aktív Összesen
Férfiak
Nők
2583,5
2431,5
2359,9
2935,3
4 943,4
5 366,8Összesen 5015,0 5295,2 10 310,2
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
144
A 3.22. táblázat alapján a nem és a gazdasági aktivitás nem független ismérvek (pl. ). Ugyanakkor nem függvényszerű a kapcsolat,hiszen ha választunk egy egyedet és tudjuk, hogy férfi (E első ismérvváltozata), mégsem tudjuk megmondani, hogy gazdaságilag aktív vagy nem.
Csupán azt tudjuk, hogy annak a valószínűsége, hogy gazdaságilag aktív, és annak a valószínűsége, hogy gazdaságilag nem aktív,
Így a kapcsolat közöttük sztochasztikus.
Vizsgáljuk meg a 3.22. táblázat adatai alapján a nem és a gazdasági aktivitás ismérve közötti asszociációs kapcsolat szorosságát a Yule-féleegyütthatóval:
A mérőszám a két ismérv között laza kapcsolatot jelez.
Nézzük meg, hogy hogyan alakul az együttható értéke, ha a 3.22. táblázat sorait megcseréljük, vagyis az új táblázatban a nők adatait írjuk az elsősorba, a férfiakét a második sorba (3.23. táblázat).
3.23. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Megnevezés Gazdaságilagaktív
Gazdaságilagnem aktív Összesen
Nők
Férfiak
2431,5
2583,5
2935,3
2359,9
5 366,8
4 943,4Összesen 5015,0 5295,2 10 310,2
A Yule-féle asszociációs együttható a 3.23. táblázatból:
A kapcsolat szorosságára ugyanakkora abszolút értékű számot kaptunk, mint korábban, csak negatív előjellel.
A Csuprov-féle és a Cramer-féle asszociációs együttható
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
145
A Yule-féle asszociációs együttható – mint az a számítás módjából egyértelműen látszik – csak alternatív ismérvek szorosságának mérésérealkalmas. Ha a két ismérv valamelyikének kettőnél több változata van, az eredeti adatokból nem számítható. Ilyen esetben is hasznosíthatjuk ugyan,de mérsékelt hatásfokkal, ha a nem alternatív ismérvet csoportok összevonásával alternatívvá alakítjuk.
Amennyiben az ismérvek nem alternatívak, az ismérvváltozatok összevonása helyett célszerűbb olyan mutatószámot választani az asszociációszorosságának mérésére, amely ebben az esetben is alkalmazható. Ilyenek – többek között – a Csuprov-féle és a Cramer-féle asszociációsegyütthatók.
A Csuprov-féle és a Cramer-féle asszociációs együtthatók alapgondolata a függetlenség feltételezésével számított gyakoriságokhoz ( ) kapcsolódik.
Mint láttuk, az ismérvek függetlenségének feltétele az
(lásd a 3.15. táblázatot) egyenletek teljesülése.
Ez azt jelenti, hogy bevezetve az
jelölést, az E és D ismérvek akkor függetlenek, ha
minden esetben. Ha nem egyenlők, akkor nincs függetlenség, és azt gondolhatjuk, hogy a függetlenség feltételezésével számított
értékek minél jobban eltérnek a tényleges értékektől, annál „messzebb” vagyunk a függetlenségtől, vagyis annál szorosabb a kapcsolat.
Például a 3.16. táblázat alapján meghatározhatjuk a függetlenség feltételezésével számított gyakoriságokat. Ezeket tartalmazza a 3.24. táblázat.
A 3.16. táblázat alapján a budapesti szakmunkástanulók száma függetlenség esetén:
A két ismérv függetlensége esetén a 28 ezer (lásd 3.16. táblázat), budapesti lakosú, szakmunkásképzőbe járó tanulóval szemben jóval több tanulótartozna ebbe a csoportba.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
146
3.24. táblázat - A függetlenség feltételezésével számított gyakoriságok ( )Ezer fő
Megnevezés Szakmunkás-tanuló
Szakiskolaitanuló
Középiskolaitanuló
Egyetemi,főiskolai
hallgató
Összesen
Budapest
Vidéki város
Községek
42,52
91,36
63,12
9,71
20,87
14,42
58,50
125,67
86,83
17,27
37,10
25,63
128,00
275,00
190,00Összesen 197,00 45,00 271,00 80,00 593,00
A 3.16. és 3.24. táblázat adatait összehasonlítva is megállapíthatjuk, hogy sztochasztikus kapcsolat van a két ismérv között, mert a tényleges
gyakoriságok eltérnek a függetlenség feltételezésével számított gyakoriságoktól. Ha nem lenne kapcsolat a két ismérv között, akkor a tényleges ( )
és a függetlenség feltételezésével számított ( ) gyakoriságok rendre megegyeznének.
Az (tényleges) és (feltételezett) gyakoriságok eltérésének mérésére szolgáló nevezetes mennyiség a (Khi négyzet)4
amely az eltérések négyzetének relatív nagyságát juttatja kifejezésre. Érvényes rá a következő egyenlőtlenség:
és
A a 0 értéket akkor veszi fel, ha a vizsgált két ismérv független egymástól, azaz ha i és j minden értékére teljesül az egyenlőség.
4 A szerepe a matematikai statisztikában igen széles körű. Az asszociációvizsgálat csupán egyik alkalmazási területe. A legjellegzetesebb alkalmazásával a Tankönyv II. kötetében, a Hipotézisekellenőrzése című fejezetben foglalkozunk.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
147
Függvényszerű kapcsolat esetén (ekkor s = t). Más szóval a ezt a maximális értékét akkor éri el, ha a kontingenciatábla minden sorábancsak egy 0-tól különböző gyakoriság található, és e gyakoriságok mind különböző oszlopba tartoznak.
Térjünk vissza bemutató példánkhoz. Az alapadatokat és a számításokat a 3.25. táblázat tartalmazza.
A mérőszám ismeretében képezhető a Csuprov-féle asszociációs együttható (jele: T):
A Csuprov-féle asszociációs együttható értéke 0 és 1 között van. A 0 értéket akkor veszi fel, ha a két ismérv független egymástól. Függetlenség
esetén ugyanis a = 0 (és fordítva, ha = 0, akkor a két ismérv független egymástól). A T = 1 értéket csak az s = t esetben érheti el (csak ilyenkorképzelhető el az, hogy az egyik ismérv szerinti hovatartozás kölcsönösen egyértelműen meghatározza a másik ismérv szerinti hovatartozást), az
esetekben T < 1. Az esetekben a T által elérhető maximális érték:
3.25. táblázat - A számítása
Megnevezés
Budapest
28
12
66
22
42,52
9,71
58,50
17,27
–14,52
2,29
7,50
4,73
210,83
5,24
56,25
22,37
4,96
0,54
0,96
1,30
Vidéki
város
85
20
128
42
91,36
20,87
125,67
37,10
–6,36
–0,87
2,33
4,90
40,45
0,76
5,43
24,01
0,44
0,04
0,04
0,65
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
148
Község
84
13
77
16
63,12
14,42
86,83
25,63
20,88
–1,42
–9,83
–9,63
435,97
2,02
96,63
92,74
6,91
0,14
1,11
3,62
Összesen 593 593,00 0,00 –
A középfokú és felsőfokú tanintézetekben tanulók településforma szerinti hovatartozása és a tanintézetük típusa közötti kapcsolat szorosságátjellemző Csuprov-féle asszociációs együttható:
Az asszociációs együttható alapján azt a megállapítást tehetjük, hogy a vizsgált ismérvek között laza kapcsolat van.
Az asszociációs összefüggések térbeli vagy időbeli összehasonlítására szolgál a Cramer-féleasszociációs együttható (jele: C). Ez a mutatószámkétféleképpen számítható.
1. A értékét viszonyítjuk annak maximális értékéhez:
2. A Csuprov-féle asszociációs együttható korrekciójával a következőképpen:
A Cramer-féle együttható az ismérvváltozatok számától függetlenül mindig 0 és 1 között veszi fel értékét .
Amennyiben s = t, akkor T = C, tehát ha a két ismérv változatainak száma azonos, akkor a Csuprov-féle és a Cramer-féle asszociációs együtthatószámszerű értéke megegyezik.
A Cramer-féle asszociációs együttható példánkban:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
149
illetve a Csuprov-féle együttható értékének módosításával:
A Cramer-féle együttható is gyenge sztochasztikus kapcsolatot jelez.
3.4.3. A vegyes kapcsolat elemzéseVegyes kapcsolatnak nevezzük a sztochasztikus kapcsolatnak azt a típusát, amelyben az ok (a független változó) szerepét minőségi (vagyterületi ismérv), az okozat (a függő változó) szerepét mennyiségi ismérv tölti be.
Egy minőségi és egy mennyiségi ismérvet tartalmazó vegyes kapcsolat elemzését a következőképpen rendezett adathalmazból kiindulva vizsgáljuk(3.26. táblázat).
3.26. táblázat - A vegyes kapcsolat adatbázisa
A mennyiségiismérv megfigyelt
értékeinek sorszáma
A minőségi ismérv változatai
ahol:
a minőségi ismérv j-edik változata (a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
150
a mennyiségi ismérvnek a j-edik részsokaság i-edik eleménél felvett értéke ( ),
a j-edik részsokaság elemszáma (a j-edik részsokasághoz tartozó megfigyelt X értékek száma). Megjegyezzük, hogy az egyes részsokaságok
elemszáma (az egyes részsokaságokhoz tartozó megfigyelések száma) különböző lehet, vagyis pl. nem feltétlenül egyezik meg -mel( ).
Például egy település ipari szervezeteit vizsgáljuk gazdálkodási forma (minőségi ismérv) és a foglalkoztatott létszám nagysága (mennyiségi ismérv)szerint. A megfigyelt létszámadatokat gazdálkodási forma szerint rendezve írhatjuk fel (3.27. táblázat).
3.27. táblázat - Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai(főben)
A megfigyeltszervezetsorszáma
VállalatKorlátolt
felelősségűtársaság
Részvénytársaság Szövetkezet
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
260
290
470
600
–
–
–
–
–
–
–
–
10
11
11
12
12
13
14
14
15
15
16
17
120
280
295
570
800
1500
–
–
–
–
–
–
55
70
88
97
143
150
215
244
260
305
–
–
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
151
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
17
18
18
18
19
19
19
20
21
22
25
26
28
29
30
35
40
45
48
50
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
152
33.
34.
35.
36.
37.
38.
39.
40.
–
–
–
–
–
–
–
–
55
58
60
65
90
150
200
302
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
–
Mivel általában nagyszámú megfigyelést végzünk, az adatokat célszerű kombinációs (kontingencia-) táblába rendezni (3.28. táblázat).
3.28. táblázat - A kontingenciatábla sémája vegyes kapcsolat esetén
D minőségi
ismérv
X mennyiségi
ismérv
N
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
153
ahol:
a minőségi ismérv j-edik változata (illetve a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),
az X mennyiségi ismérv alapján képzett i-edik csoport (osztály) azonosítója. Ha X diszkrét, akkor jelentheti az ismérvértéket, de jelölhetosztályközt is.
k: az X mennyiségi ismérv alapján képzett csoportok (osztályok) száma,
a sokaság azon elemeinek száma – gyakorisága –, amelyek a D minőségi ismérv szerint részsokaságba és ezzel egyidejűleg X mennyiségi
ismérv szerint a csoportba (osztályba) tartoznak ( ),
a sokaság azon elemeinek száma, amelyek az X ismérv szerint csoportba (osztályba) tartoznak ( ),
a sokaság azon elemeinek száma, amelyek a minőségi ismérv szerint a j-edik csoportba, részsokaságba tartoznak ( ), .
Például az ipari szervezeteket a megfigyelésekre támaszkodva csoportosíthatjuk – egyidejűleg – gazdálkodási forma és a létszám nagysága szerint,a két ismérvet egymással kombinálva. A mennyiségi ismérv szerinti osztályozás különösebb mérlegelést igényel. Látjuk, hogy a legkisebb éslegnagyobb létszámadat között nagy a különbség, és a kis létszámú szervezetek adják a cégek zömét. Ezért egyenlőtlen hosszúságú osztályközöketjelölünk ki. A kombinatív osztályozás eredményét a 3.29. táblázatban adjuk meg.
3.29. táblázat - Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma éslétszám szerint
Gazdálko-
dási forma
Létszám (fő)
VállalatKorlátolt
felelősségűtársaság
Részvény-társaság Szövetkezet Összesen
– 20
21 – 50
51 – 100
101 – 300
–
–
–
2
20
12
5
2
–
–
–
3
–
–
4
5
20
12
9
12
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
154
301 – 500
501 – 1000
1000 –
1
1
–
1
–
–
–
2
1
1
–
–
3
3
1Összesen 4 40 6 10 60
A vegyes kapcsolat vizsgálatának első mozzanata szintén annak a vizsgálata, hogy van-e sztochasztikus kapcsolat a vizsgálatba bevont ismérvekközött. A feladat ebben az esetben úgy is megfogalmazható, hogy szerepet játszik-e a minőségi ismérv a mennyiségi ismérv szerinti eloszlásban?Ez vizsgálható a kontingenciatáblából kiindulva a 3.4.1. pontban tárgyalt módszerekkel. Megjegyezzük, hogy ezen vizsgálatok eredményétbefolyásolhatja, hogy milyen módon választjuk az osztályközöket.
Mivel vegyes kapcsolat esetén az egyik vizsgálatba bevont ismérv mennyiségi ismérv, az összefüggés-vizsgálat során felhasználhatjuk az átlag-– részátlag-, főátlag- – számítást, szórásszámítást, a szórásnégyzet-felbontás módszerét. Ezek segítségével számszerűsíthetjük a minőségiismérv alapján képzett részsokaságok mennyiségi ismérv szerinti különbözőségét, a minőségi ismérv szerepét a mennyiségi ismérv értékeinekkülönbözőségében.
Rész- és főátlagok
A minőségi ismérv szerint csoportosított sokaságban az egyes részsokaságokra számított átlagot részátlagnak (jele: ), a fősokaságokra vonatkozóátlagot pedig főátlagnak (jele: ) nevezzük.
A j-edik csoport részátlaga (a 3.26. táblázat alapján)
ahol :
a j-edik részsokaság értékösszege ( ),
[MA :#-#]
A főátlag
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
155
Mivel a részátlagok és a főátlag között fennállnak az alábbi összefüggések:
Tehát a főátlag ( ) kiszámítható a részátlagok ( ) súlyozott átlagaként is:
– súlyozott számtani átlag formában, ahol a súly szerepét a részsokaságok elemszámai, az adatok töltik be,
– súlyozott harmonikus átlag formában, ahol súlyként a részsokaságok értékösszegadatai szerepelnek.
A főátlag súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási viszonyszámokkal.
A két ismérv függetlensége esetén (ha a minőségi ismérv szerinti hovatartozás semmiféle hatást nem gyakorol a mennyiségi ismérv nagyságára)
az egyenlőek (minden j-re megegyeznek). Ebből következően (minden j-re). Fontos: az állítás nem fordítható meg. A részátlagokegyenlőségéből nem következik a függetlenség. Ha arra vagyunk kíváncsiak, hogy az ismérvek függetlenek-e, a 3.4.1. pontban tárgyalt módon
járhatunk el. Ha a 3.28. kontingenciatáblát vizsgáljuk, két ismérv függetlensége esetén a minőségi ismérv szerint képzett részsokaságokban az relatív gyakoriságok i-t tetszőlegesen rögzítve minden j-re megegyeznek.
Függetlenség esetén tehát a minőségi ismérv szerint képzett részsokaságokban a relatív gyakorisági sorok azonosak. Az egyforma relatív gyakoriságisorokból pedig a részátlagokra azonos becslések származnak.
A részátlagok és a főátlag számításával, ezek összehasonlításával képet kaphatunk az ismérvek közötti kapcsolatról. Amennyiben a részátlagokjelentősen eltérnek egymástól és a főátlagtól, ez azt jelzi, hogy van kapcsolat az osztályozás alapját képező minőségi ismérv és mennyiségi ismérvközött.
A 3.27., illetve 3.29. táblázatból meghatározhatjuk a részátlagokat és a főátlagot, illetve azok becsült értékeit. Ha az eredeti adatokat nem ismerjük,akkor a kontingenciatáblából csak az utóbbiak számíthatók. Ezeket az átlagokat a 3.30. táblázat tartalmazza.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
156
3.30. táblázat - A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok
Megnevezés
Szervezetekszáma
Összlétszáma 3.27.táblázatalapján
Átlagos
létszám
3.29. táblázatsegítségével
becsültátlagos
létszám*
Vállalat
Korlátolt felelősségű
társaság
Részvénytársaság
Szövetkezet
4
40
6
10
1620
1687
3565
1627
405,0
42,2
594,2
162,7
387,5
47,4
558,3
170,0
Összesen 60 8499 141,7 141,6
*A számításnál az első osztályközépsőt 15-nek, az utolsót 1250-nek vettük.
Mivel a részátlagok egymástól és a főátlagtól is eltérnek (ez a helyzet a becsült értékeknél is), a két ismérv közötti kapcsolat megléte nyilvánvaló.
A vegyes kapcsolat szorosságának vizsgálata a szóródásszámítás segítségével történik. Ahhoz, hogy a mérőszámig eljuthassunk, meg kellismerkednünk néhány új fogalommal.
A rész- és fősokaságok szórása, szórásnégyzete
Amennyiben a sokaságot részsokaságokra bontva vizsgáljuk – a viszonyszámok és az átlagok számításához hasonlóan –, a fősokaságra ésa részsokaságokra vonatkozóan is számítunk szórást. A részsokaságokra vonatkozó szórást részszórásnak vagy részsokaságokon belüliszórásnak, a fősokaságra vonatkozó szórást teljes szórásnak nevezzük. A közöttük lévő összefüggés kevésbé egyszerű, mint a részviszonyszámokés az összetett viszonyszám vagy a részátlagok és a főátlag összefüggése. Az összefüggések bemutatásához nézzük a következőket!
Ha a sokaságot részekre bontva vizsgáljuk, akkor a szórásszámításra alkalmas, ún. átlagtól való eltérést háromféleképpen értelmezhetjük.
a) ( )
az ún. teljes eltérés, amely egy adott ismérvérték és a főátlag közötti eltérés.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
157
b) ( )
az ún. belső eltérés, amely egy adott j-edik részsokasághoz tartozó ismérvérték és j-edik részátlag közötti eltérés.
c) ( )
az ún. külső eltérés, amely a j-edik részátlag és a főátlag eltérése.
Könnyen belátható, hogy a háromféle eltérés között az alábbi összefüggés áll fenn:
Egy 800 fős Rt. esetén pl.
A 658,3 fős eltérés ebben az esetben azzal magyarázható, hogy a kiválasztott Rt. létszáma saját csoportján belül mintegy 206 fővel nagyobb, s azRt.-k létszámnagysága a szervezetek összességére jellemző átlagot is meghaladja.
A három eltérés közötti összefüggés alapján megállapíthatjuk, hogy adott érték főátlagtól való eltérését két tényező okozhatja:
– egyrészt a részsokaságokon belül különbözőek lehetnek az ismérvértékek, ezeket a különbségeket a eltérés fejezi ki,
– másrészt a részátlagok eltérhetnek egymástól, ingadozhatnak a főátlag körül. Ezt fejezi ki a eltérés, amelyben a csoportosító (minőségi) ismérvhatása mutatkozik meg.
Mind a háromféle eltérés alapján számítható valamilyen szórás, illetve szórásnégyzet.
A teljes eltérések felhasználásával adódó
szórás a teljes szórás.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
158
A teljes szórás négyzete a teljes szórásnégyzet.
A belső eltérésekből kiindulva számíthatók az egyes részsokaságokra vonatkozó
részszórások, vagy részsokaságokon belüli szórások.
A részszórások négyzetének az egész sokaságra vonatkozó átlaga a belső szórásnégyzet , tehát a belső szórás:
.
Ha az ( ) eltérésnégyzetek egész sokaságra vonatkozó átlagát vesszük, akkor a külső szórásnégyzetet kapjuk, és enneknégyzetgyöke a külső szórás:
A háromféle szórásnégyzet között a
összefüggés áll fenn.
Ennek igazolására (a definíciókat felhasználva) elegendő a megismert szórásnégyzetek számlálói – az ún. eltérés-négyzetösszegek – közötti összefüggés bizonyítása.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
159
Mivel
valamint minden j-re, ezért írhatjuk, hogy
Az eltérés-négyzetösszegeket a következőképpen is szokás jelölni:
teljes eltérés-négyzetösszeg: SS,
belső eltérés-négyzetösszeg:
külső eltérés-négyzetösszeg:
Az eltérés-négyzetösszegekre vonatkozó azonosság a következő formában is felírható:
A háromféle eltérés-négyzetösszeg, illetve szórásnégyzet összegszerű összefüggése természetesen arra is felhasználható, hogy kettő ismeretébenkiszámítsuk az ismeretlen harmadikat.
Az elmondottak alapján megfogalmazható az is, hogy a fősokaságra vonatkozó teljes szórás kétféleképpen számítható ki:
– az egyes ismérvértékek főátlagtól való eltérései alapján
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
160
– a háromféle szórásnégyzet összefüggése alapján
Ezek után nézzük a példánkat. A 3.27. és 3.30. táblázat alapján meghatározhatók a fenti paraméterek, értékeiket a 3.31. táblázat tartalmazza (atényleges és nem a becsült értékekkel számoltunk). A teljesség kedvéért a 3.30. táblázat néhány adatát is feltüntettük.
3.31. táblázat - A vizsgált ipari szervezetekre vonatkozó adatok
Szervezetek Összlét- Átlagos Eltérés-négy- Szórás
száma % szám(fő)
létszám(fő) zetösszeg (fő)
Megnevezés
Vállalat 4 6,67 1620 405,0 76 500 138,3Korlátoltfele-lősségűtársaság
40 66,67 1687 42,2 124 204 55,7
Részvény-
társaság6 10,00 3565 594,2 1 276 521 461,3
Szövetkezet 10 16,66 1627 162,7 69 700 83,5Összesen
60 100,00 8499 141,7 =1 546 925
=239,9 =
A táblázat adatait a következőképpen kaptuk:
Az eltérés-négyzetösszeg – a fejrovatban kijelölt képlet szerint – például a vállalatoknál a következő (lásd a 3.27. táblázatot is):
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
161
A szórás a vállalatoknál:
A teljes szórás:
Az egyes ipari szervezetek létszáma tehát átlagosan mintegy 240 fővel tér el – a négyzetes eltérések alapján számolva – a 60 szervezetre jellemző141,7 fős átlagtól.
A továbbiakban meghatározzuk a 3.31. táblázat alapján a háromféle eltérés-négyzetösszeget, és bemutatjuk azok összefüggését.
A teljes eltérés-négyzetösszeget (SS) a megfigyelt ipari szervezetek számával osztva kapjuk a teljes szórásnégyzetet:
amely a teljes eltérés-négyzetösszeghez hasonlóan bomlik összetevőkre.
Az összes ipari szervezetre vonatkozó belső eltérés-négyzetösszeg ( ) alapján a belső szórásnégyzet:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
162
A külső eltérés-négyzetösszegből ( ) kiindulva a külső szórásnégyzet:
A teljes szórásnégyzet tehát:
A teljes szórás az összetevők alapján:
Számítsuk ki a 60 megfigyelt ipari szervezet létszámának belső és külső szórását is.
A belső szórás
az előzőekben már bemutatott összefüggés alapján kiszámítható a különböző típusú gazdasági szervezetek létszámának szóródását jellemző
szórások súlyozott négyzetes átlagaként is:
a súly szerepét betöltő részsokasági elemszámadatok helyettesíthetők azok megoszlási viszonyszámaival, így
A belső szórás megmutatja, hogy az egyes ipari szervezetek – mind a 60 ipari szervezetet figyelembe véve – létszáma átlagosan 160,6 fővel tér ela „saját” gazdálkodási formáját jellemző átlagos létszámtól. (A négyzetes eltérések alapján számolva.)
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
163
A külső szórás
A külső szórás megmutatja, hogy a megfigyelt vállalatok, kft.-k, részvénytársaságok, szövetkezetek átlagos létszáma az együttes átlagos létszámuktólátlagosan 178,2 fővel tér el. (A négyzetes eltérések alapján számolva.)
A vegyes kapcsolat szorosságának mérése
Visszatérve a szórásnégyzetek összefüggésére, a teljes szórásnégyzet összetevői alapján az ismérvek sztochasztikus kapcsolatára a következőketállapíthatjuk meg.
a) Ha az -k egyenlőek (minden j-re), vagyis az egyes részátlagok megegyeznek egymással és ebből következően a főátlaggal, akkor a kétismérv között nincs kapcsolat. De ez nem jelenti azt, hogy a két ismérv független. Könnyű olyan példát mondani, amelyben a részátlagok egyenlőek ésa függetlenség 3.4.1.-ben megfogalmazott feltétele nem teljesül. Tehát a függetlenségből következik, hogy az E mennyiségi ismérv és a D minőségiismérv között nincs kapcsolat, de fordítva nem.
b) Ha ( ), vagyis a részsokaságokon belül nincs szóródás ( ), akkor Ebben az esetben az ismérvértékekszóródása teljes egészében a csoportosítás alapját képező minőségi ismérv következménye. A két ismérv között olyan függvényszerű kapcsolat van,hogy a minőségi ismérv a független változó. Ugyanis ekkor minden D szerinti részsokaságban egyetlen E ismérvváltozat gyakorisága különböziknullától. És fordítva, ha a két ismérv között ilyen függvényszerű kapcsolat van, azaz a minőségi ismérv egyértelműen meghatározza a mennyiségiismérv nagyságát, akkor:
c) Ha , akkor sztochasztikus kapcsolat van a két ismérv között.
A részekre bontott sokaságból képezhető háromféle szórásnégyzet – a teljes szórásnégyzet és összetevői – alapján következtethetünk a vizsgálatbabevont két ismérv kapcsolatára, illetve arra, hogy hatást gyakorol-e az osztályozás alapját képező minőségi ismérv a sokaság egységeinekmennyiségi ismérv szerinti hovatartozására.
Ismert a háromféle szórásnégyzet összefüggése:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
164
Ismert az is, hogy a külső szórásnégyzet ( ) a részátlagoknak a főátlagtól való eltérései alapján számított szórásnégyzet, ami éppen az osztályozásalapját képező minőségi ismérv hatásának tulajdonítható rész a teljes szórásnégyzeten belül.
A belső szórásnégyzet ( ) az egyéb, nem vizsgált tényezők együttes hatása.
Ezért a vegyes kapcsolat szorosságának vizsgálatakor kiemelt szerepe van a
ún. szórásnégyzet-hányadosnak, amely a mennyiségi ismérv szórásnégyzetének a minőségi ismérv által megmagyarázott hányada.
A szórásnégyzet-hányados kiszámítható a következő formában is:
A , illetve összefüggés következtében belátható, hogy a megismert hányados a intervallumban vehet fel értéket:
Ha , akkor azt mondjuk, hogy a két ismérv között nincs kapcsolat. A eset akkor fordulhat elő, ha a részátlagok mind egyformák, és
ezért
Ha , ez a két ismérv függvényszerű kapcsolatára utal. eset akkor következhet be, ha a részsokaságokban az X értékek nem szóródnak
( ). A minőségi ismérv szerinti hovatartozás egyértelműen meghatározza a mennyiségi ismérvet, a sokaság elemeinek mennyiségi ismérvszerinti hovatartozását.
Ha , a két ismérv között sztochasztikus kapcsolat van.
A szórásnégyzet-hányadost megoszlási viszonyszám jellege miatt százalékos formában szokás kifejezni.
A vegyes kapcsolat szorosságának mérőszámaként a szórásnégyzet-hányados négyzetgyökét, a szóráshányadost (jele: H) használjuk.
A szóráshányados – a szórásnégyzet-hányadossal ellentétben – nem értelmezhető megoszlási viszonyszámként, ezért nem fejezhető ki %-osformában.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
165
Az ipari szervezetek gazdálkodási formája és a foglalkoztatott létszám közötti kapcsolatot vizsgálva, a korábbiakban kiszámított adatok alapján
A gazdálkodási forma 55,2%-ban magyarázza meg a létszám szóródását (ingadozását). A fennmaradó 44,8% egyéb nem vizsgált (ebben azösszefüggésben véletlenként kezelt) tényezők hatása. A szóráshányados
meglehetősen szoros kapcsolatot jelez a gazdálkodási forma és a létszám nagysága között.
3.4.4. A korreláció elemzése csoportosított adatokból kiindulvaHa mindkét vizsgálatba bevont ismérv mennyiségi ismérv, akkor bizonyos egyszerűbb elemzési eszközök alkalmazásánál ugyancsak kiindulópontotjelenthet a kombinációs (kontingencia-) tábla.
Azt a statisztikai táblát, amely a sokaság egységeinek mennyiségi ismérvek szerinti kombinatív osztályozását tartalmazza, korrelációs táblánaknevezzük (3.32. táblázat).
3.32. táblázat - A korrelációs tábla sémájaY
X
N
A táblázatban X az ok szerepét játszó mennyiségi ismérvet (független változót, tényezőváltozót), Y az okozat szerepét betöltő mennyiségi ismérvet(függő változót, eredményváltozót) jelenti, amennyiben ilyenek egyáltalán megkülönböztethetők. Ha két ismérv kölcsönhatásban áll egymással, nincsjelentősége annak, hogy a vizsgált ismérvek közül melyiket jelöljük X-szel, illetve Y-nal.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
166
az X ismérv alapján képzett i-edik osztály azonosítója, jelenthet ismérvértéket, de jelölhet osztályközt is.
az Y ismérv alapján képzett j-edik osztály azonosítója, jelenthet ismérvértéket, illetve osztályközt.
Az együttes gyakoriságok, peremgyakoriságok jelentése és ezek összefüggései már ismertek.
Mindkét ismérv mennyiségi ismérv, de most is eljárhatunk úgy, hogy az egyik ismérvet (pl: X-et) csak osztályozásra, részsokaságok kialakításárahasználjuk, a másikat (az Y-t) pedig átlag- és szórásszámítás segítségével vizsgáljuk, vagyis ugyanúgy járunk el, mint a vegyes kapcsolatvizsgálatánál.
Tekintsük a következő példát (3.33. táblázat):
3.33. táblázat - Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek számaszerint
Személyek
száma (fő)
Szobák száma
1 2 3 4 5 6 7 Összesen
1
2
3
4
1
1
–
–
2
2
1
–
1
10
2
–
1
7
7
–
–
1
2
3
–
1
4
2
–
–
1
1
5
22
17
6Összesen 2 5 13 15 6 7 2 50
A társasház lakásait egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint figyeltük meg. Már a táblázat adataiból is kitűnik,hogy a kisebb szobaszámú lakásokban általában kevesebb személy lakik, a nagyobb szobaszámúakban pedig több.
Esetünkben, mivel mindkét jellemző tulajdonság mennyiségi ismérv, korrelációs kapcsolatról beszélünk. Attól függően, hogy az X ismérv nagyobb(kisebb) értékeihez az Y ismérv nagyobb (kisebb) értékei tartoznak vagy éppen fordítva, kétféle korrelációról beszélhetünk.
Pozitív korreláció áll fenn két ismérv között, ha az X nagyobb értékeihez általában Y nagyobb értékei, illetve X kisebb értékeihez Y kisebb értékeitartoznak. Fordított esetben negatív korrelációról beszélünk (X nagyobb értékeihez általában Y kisebb értékei tartoznak, illetve fordítva).
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
167
Ha a szobaszámot (X) csoportosító ismérvnek tekintjük és kiszámítjuk a különböző szobaszámú lakásokban élők átlagos számát akkortömörebben fejeződik ki a két ismérv sztochasztikus összefüggése.
Az X ismérv szerint képzett ( ) osztályok halmazán értelmezett függvényt, amely -hez az részátlagot rendeli, az Y változó X változóravonatkozó (X szerinti) tapasztalati regressziófüggvényének nevezzük.
Példánkban (3.34. táblázat):
3.34. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalatiregressziófüggvénye
Szobaszám Átlagos lakószám (fő)
1
2
3
4
2,40
3,36
4,53
5,67
Az egyszobás lakásokban élő személyek átlagos száma például:
A tapasztalati regressziófüggvény a két ismérv közötti kapcsolatra vonatkozó – a jelenlegi elemzési helyzetben a korrelációs táblába foglalt –
információt egyetlen statisztikai sorba ( -hez rendelt részátlagok sorozata) sűríti. Egyértelműen láthatóvá vált, hogy a két ismérv között vankorreláció, mégpedig pozitív irányú korreláció. (A szobaszámok nagyobb értékeihez az átlagos lakószám növekvő értékei tartoznak.)
A tapasztalati regressziófüggvény nemcsak a korreláció létezésének kimutatására alkalmas, hanem a kapcsolat lényegét, természetét is tömören
kifejezi. Grafikusan is ábrázolható a pontokat összekötő vonaldiagram formájában, ahol vagy az ismérvérték, vagy az X
szerint képzett i-edik osztályköz osztályközepe. A pontokat összekötő szakaszoknak mint függvényértékeknek ugyan nincs statisztikaijelentése, ennek ellenére a statisztikai gyakorlatban e pontokat összekötjük. Így alkothatunk szemléletesebb képet a két mennyiségi ismérv közöttisztochasztikus kapcsolat jellegéről, tendenciájáról.
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
168
A tapasztalati regressziófüggvényt célszerű az egyedi értékadatok alapján (a két mennyiségi ismérvnek a sokaság egyes egységeit jellemző,összetartozó értékpárjai alapján) készített pontdiagrammal közös koordináta-rendszerben ábrázolni. A vonaldiagram és a ponthalmaz kölcsönöshelyzete tájékoztat a korrelációs kapcsolat szorosságáról is.
Példánkban 50 lakást figyeltünk meg egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint. Minden lakást jellemez egy
szobaszám- és egy lakószám- adat. Az összetartozó értékeket derékszögű koordináta-rendszerben egy-egy pontként ábrázolvakészítjük el a korrelációt szemléltető pontdiagramot és ugyanebben a koordináta-rendszerben ábrázoljuk a tapasztalati regressziófüggvényt (3.6.ábra).
3.6. ábra - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat
A korreláció szorosságának mérése
A csoportosított adatokból kiinduló korrelációelemzés során a kapcsolat szorosságának mérése a vegyes kapcsolat szorosságának mérésével analóg
módon történik. Ha az osztályozást X ismérv szerint végezzük, úgy az Y értékekre vonatkozó részátlagokhoz ( ) és főátlaghoz ( ) háromféle
szórásnégyzet kapcsolódik. Az Y belső szórásnégyzete az Y külső szórásnégyzete az Y teljes szórásnégyzete (Az Y arra utal, hogya függő változó (Y) szórásnégyzetéről van szó.) Közöttük a
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
169
összefüggés áll fenn.
A szórásnégyzet-hányadoshoz hasonlóan képezhetjük a ún. determinációs hányadost. Megkülönböztetésül, a indexében elsőhelyen a „szóródó”, a második helyen a csoportosító ismérvet tüntettük fel.
A determinációs hányados azt mutatja meg, hogy az X ismérv mekkora hányadát magyarázza meg az Y ismérv szórásnégyzetének. Szokás %-os formában is kifejezni.
A korreláció szorosságának mérésére használhatjuk a determinációs hányados négyzetgyökét, a
A korrelációs hányados a szórásnégyzet-hányadoshoz hasonlóan a közötti intervallumban vehet fel értéket.
Függvényszerű kapcsolat esetén :
A korreláció hiánya esetén:
Korreláció esetén:
Ha az oksági kapcsolat nem egyirányú, akkor logikailag indokolt lehet, hogy az X ismérvnek az Y ismérv szerinti szorossági mérőszámait számítsukki, vagyis a
Ebben az esetben az X a „szóródó” ismérv, az Y pedig a csoportosító ismérv szerepét tölti be.
Ha az X és az Y közötti kapcsolat sztochasztikus, akkor általában a kétféle megközelítésből számított mutatószámok nem egyeznek meg:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
170
Ha az ismérvek (változók) függetlenek, akkor Ez azt is jelenti, hogy a tapasztalati regressziós függvény állandó. Fordítva nem igaz:
abból, hogy (ekkor is nulla), nem következik a függetlenség.
Ha akkor azt mondjuk, hogy az ismérvek (változók) korrelálatlanok. A korrelálatlanság is szimmetrikus reláció.
Függvényszerű kapcsolat esetén, mint az előző pontban is láttuk,
Vizsgáljuk meg a lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat szorosságát. A kapcsolat szorosságának jellemzésére
kiszámítjuk a determinációs hányadost és a korrelációs hányadost. E mutatószámok meghatározásához szükség van a Y ismérv
főátlagára, a megfigyelt lakásokban élő személyek átlagos számára ( ), a külső szórásnégyzetre, a teljes szórásnégyzetre.
Egy lakás lakóinak átlagos száma (a főátlag):
(Természetesen az kiszámítható az részátlagok súlyozott átlagaként is.)
A külső szórásnégyzet:
Az előző lépésben kiszámított főátlag, valamint a 3.34. táblázatban közölt részátlagok alapján:
A teljes szórásnégyzet:
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
171
A 3.33. táblázat adatai és a kiszámított főátlag alapján:
A determinációs hányados:
kifejezhető százalékos formában: = 42,0%.
Ez úgy értelmezhető, hogy a lakásokban levő szobák száma 42%-ban magyarázza meg a lakásokban élő személyek számának szóródását. (Afennmaradó 58% a szobaszámon kívüli, egyéb, most nem vizsgált tényezők hatása.)
A korrelációs hányados
A szorossági mérőszám alapján megállapítható, hogy a szobák száma és a lakásokban élő személyek száma között közepes erősségűsztochasztikus kapcsolat van.
A következőkben – a részletes számítás mellőzésével – felírjuk az ismérvek (a változók) felcserélésével értelmezett – X-nek Y-ra vonatkozó –
tapasztalati regressziófüggvényét (3.35. táblázat) és az ehhez rendelhető determinációs hányadost és korrelációs hányadost.
3.35. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalatiregressziófüggvénye
Lakószám (fő)Átlagos szobaszám
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
172
1
2
3
4
5
6
7
1,50
1,80
2,08
2,40
3,33
3,14
3,50
Az X-nek Y-ra vonatkozó tapasztalati regressziófüggvénye is jelzi, hogy pozitív irányú kapcsolat van az ismérvek között. A
pedig közepes erősségű kapcsolatra utalnak.
A számítások ellenőrzését az olvasóra bízzuk.
3.5. Gyakorlófeladatok1. Szerkesszünk olyan statisztikai táblát (adatok nélkül), amely tartalmazza a Magyarországon bejegyzett fuvarozócégek 1994. I. és II. féléviteljesítményeit (félévenként, külön-külön) a szállítás módja (közúti, vasúti, légi és egyéb) és cégforma (vállalat, gazdasági társaság, magánfuvarozó)szerint!
Elemezzük a megszerkesztett táblát! Állapítsuk meg típusát, dimenziószámát, sorait!
2. Szerkesszünk (adatok nélkül) olyan statisztikai táblát, amely a fogyasztói árak alakulását mutatja 1985-höz viszonyítva napjainkig kiadásifőcsoportok (élelmiszerek, élvezeti cikkek, ... egyéb iparcikkek és szolgáltatások) szerint!
3. A népességgel kapcsolatos adatok Magyarországon:
Megnevezés 1990 1993 1990=100%
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
173
Népesség (ezer fő)*
Nők száma (ezer fő)*
Élveszületések száma (fő)
10 375
5 390
125 679
10 310
5 367
111 033
99,37
99,57
88,35
*Január 1-jei adatok.
Feladat:
a) Állapítsuk meg a tábla típusát és dimenziószámát!
b) Elemezzük a népesség nemek szerinti összetételét és a dinamikai változást!
c) Számítsuk ki az ezer férfira jutó nők számát! Vizsgáljuk a változást!
d) Számítsunk nyers és tisztított születési arányszámokat! Elemezzük a változást!
4. Két megyében az orvosok és a lakosok számára, valamint az orvosellátottság mutatószámaira vonatkozóan az alábbi adatokat ismerjük:
Adatok: főben
Megye Orvosokszáma
Lakosokszáma
Egy orvosrajutó lakosok
száma
Tízezerlakosra jutó
orvosokszáma
A
B
640
...
...
400 000
312,5
...
...
35
Feladat:
a) Számítsuk ki a hiányzó adatokat és mutatószámokat!
b) Vonjunk le következtetéseket!
5. Néhány ország jellemző adata 1992-ben:
Megnevezés Magyarország Ausztria Spanyolország
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
174
Évközepi népesség (millió fő)
Terület (1000 km2)
A főváros népessége (1000 fő)
A születéskor várható átlagos élettartam (év)
a férfiaknál
a nőknél
Aktív keresők (1000 fő)
100 aktív keresőre jutó eltartott és inaktív
kereső
A munkanélküliek száma (1000 fő)
A GDP változása (1992/91, %)
10,31
93,0
2016
64,6
73,7
4242
143
663
–4,5
7,88
83,9
1505
72,6
79,2
3536
...
193
1,5
39,08
504,8
3108
73,1
79,6
150073
...
2260
1,0
Feladat:
a) Elemezzük a tábla adatait a megadott és a még kiszámítható viszonyszámok alapján!
b) Végezzünk területi összehasonlítást!
6. A környezeti feltételeket jellemző néhány adat 1992-ben:
Adatok:1000 m2
Megnevezés Debrecen PécsErdő
Park
346
2935
8260,0
3210,0Összes zöldterület 3281 11 470,0
Egy lakosra jutó zöldterület 15,1
200
67,0
255,0
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
175
A játszóterek területe
Feladat:
Hasonlítsuk össze a két várost a környezeti feltételek szempontjából!
7. Magyarország népességére és a villamosenergia-termelés alakulására vonatkozóan az alábbi adatokat ismerjük:
Év Népesség száma azév elején (ezer fő)
Villamosenergia-termelés
1988=100%1988
1989
1990
1991
1992
1993
10 464
10 421
10 375
10 355
10 337
10 310
100,0
101,4
97,2
102,6
107,0
111,8
A széntermelés 1988-ban 20 875 ezer tonna volt, ami 1993-ra 60,3%-ra csökkent.
Feladat:
a) Hogyan alakult évről évre az 1 főre jutó villamosenergia-termelés?
b) Mennyi volt 1993-ban az 1 főre jutó széntermelés?
c) Évente átlagosan hány %-kal változott (nőtt, csökkent)
– az 1 főre jutó villamosenergia-termelés,
– az 1 főre jutó széntermelés?
d) A kiszámított változási tendenciát feltételezve mennyi a várható termelés ezen ipari termékekből 1996-ban? (1993-ban 32 630 millió kWh villamosenergiát állítottak elő.)
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
176
8. A népesség megoszlása gazdasági aktivitás szerint január 1-jén:
Népességcsoportok 1990 1991 1992Munkavállalási kornál fiatalabb
Munkavállalási korú
Nyugdíjas korú
2 130,5
5 956,8
2 287,5
2 063,7
5 997,4
2 293,7
2 009,8
6 031,4
2 296,0Összesen 10 374,8 10 354,8 10 337,2
Feladat:
a) Nevezzük meg a tábla típusát és sorait!
b) Számítsuk ki, hogyan változott a munkavállalási korú népesség 1990-hez képest, illetve évről évre!
c) Számítsunk megoszlási viszonyszámokat 1990-ben és 1992-ben! Hasonlítsuk össze a két időszakot!
d) Számítsuk ki, hogy hány %-kal változott a népesség az egyes csoportokban és együttesen!
e) Hasonlítsuk össze a szerkezet- és dinamikai változást!
9. A gazdaságilag aktív népesség adatai Magyarországon:
Csoportok 1990. január 1. 1993. január 1.1993-
as év az1990. év
Ezer fő % Ezer fő % %-ában
Aktív keresők
GYES-en, GYED-en lévők
Foglalkoztatottnyugdíjasok
4795,2
244,7
432,0
87,2
4,5
7,9
3866,9
262,1
223,0
...
...
...
...
...
...
Foglalkoztatottak együtt 5471,9 99,6 4352,0 ... ...Munkanélküliek 24,2 0,4 663,0 ... ...Összesen 5496,1 100,0 5015,0 100,0 91,25
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
177
Feladat:
Számítsuk ki a hiányzó adatokat, és vonjuk le következtetéseket a szerkezet- és dinamikai változásra vonatkozóan!
10. Vállalkozásokat vizsgálunk jövedelmezőségük alapján két egymást követő évben. Az eredményeket az alábbi tábla tartalmazza:
1994-ben
1993-banAlacsony Közepes Magas Összesen
Alacsony
Közepes
Magas
100
60
–
80
90
30
–
10
30
180
160
60Összesen 160 200 40 400
Feladat:
a) Töltsük ki a tábla adatait:
1. függvényszerű kapcsolat feltételezésével,
2. függetlenséget feltételezve!
b) Számítsuk ki a Csuprov- és a Cramer-féle együtthatót a tényleges helyzetnek megfelelően! Értelmezzük a kapott eredményt!
11. Valamely városban a kereskedelmi szálláshelyek vendégforgalmát a szállás típusa és a turisták lakhelye szerint vizsgáltuk. A megfigyelt adatok1994-ben 1000 főben a következők voltak:
Szállás típusa Belföldi Külföldi EgyüttSzálloda
Turistaszállás
Kemping
Fizető-vendéglátás
50
30
60
160
150
10
120
220
200
40
180
380Együtt 300 500 800
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
178
Feladat:
a) Vizsgáljuk a sokaság megoszlását különböző módokon! Vonjunk le következtetéseket!
b) Számítsuk ki a két ismérv kapcsolatát jellemző szorossági mérőszámokat!
12. Főiskolai hallgatók lakáshelyzetét és havi kiadásuk nagyságát vizsgáltuk.
A szüleinél lakó 8 hallgató havi kiadásai Ft-ban:
1300; 1800; 2000; 2000; 2800; 3000; 3100 és 4000 Ft.
A kollégisták adatai:
2500; 3000; 3000; 3100; 3300; 3500; 3800; 4000; 4000; 4400 és 5000 Ft.
Az albérletben lakók havi kiadásai pedig:
4000; 4800; 5000; 5000 és 5200 Ft.
Feladat:
a) Számítsuk ki az átlagos havi kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket!
b) Vizsgáljuk a szóródást különböző módokon!
c) Számítsuk ki, hogy:
– a szóródás milyen mértékben magyarázható a lakáshelyzettel,
– milyen szoros kapcsolat van a lakáshelyzet és a havi kiadások nagysága között!
13. Egy tanulócsoport 15 hallgatójánál megvizsgáltuk, hogy van-e összefüggés a matematikafelvételin elért összpontszám és a felkészülés között.(Járt-e előkészítő tanfolyamra vagy sem.) A vizsgálat eredményéből a következő számítási eredmények ismertek:
Csoport Létszám (fő) Átlagos pontszám SzórásElőkészítős
Nem előkészítős
15
10
26
20
2,61
4,43Összesen 15 ... ...
A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése
179
Feladat:
a) Számítsuk ki a teljes szórásnégyzetet és a szórást!
b) Vizsgáljuk a felkészülés módja és a pontszám közötti kapcsolat szorosságát!
c) Írjuk le a jelentését!
14. Egy 25 pontos statisztika-zárthelyi eredményei:
Feladatsor Hallgatók száma Átlagos pontszám Relatívszórás (%)
A
B
C
11
8
6
17,00
16,25
18,30
16,47
31,63
18,03Összesen 25 ... ...
Feladat:
a) Számítsuk ki az összes
– belső eltérésnégyzetet,
– külső eltérésnégyzetet,
– teljes eltérésnégyzetet!
b) Határozzuk meg a belső, a külső és a teljes szórást!
c) Számítsuk ki, hogy a feladatsorok „nehézsége” és az elért pontszám között milyen szoros a kapcsolat!
d) A pontszámok ingadozását, szóródását hány %-ban befolyásolja az, hogy melyik feladatsort írta a hallgató?
180
4. fejezet - Összetett intenzitási viszonyszámok (főátlagok)összehasonlítása4.1. A standardizálás módszere
Ha valamilyen jelenség színvonalát (pl. termékek önköltségét, lakosok orvosellátottságát, munkavállalók átlagbérét stb.) akarjuk jellemezni, akkorerre a célra a 3. fejezetben megismert intenzitási viszonyszámokat használhatjuk fel. Ha a sokaság a vizsgált színvonal szempontjából heterogén,akkor a vizsgálatot a heterogenitást előidéző ismérv megfelelő homogén csoportjaira is el kell végezni. A sokaság egészére számított intenzitásiviszonyszámokat összetett intenzitási viszonyszámoknak neveztük és jelöltük, a csoportokra pedig intenzitási részviszonyszámokat számítottunk
és azokat jelöltük. Ha a vizsgált színvonalat átlaggal fejeztük ki, akkor a sokaság egészére főátlagot ( ), a homogén csoportokra pedig
részátlagokat ( ) számítottunk. Beláttuk, hogy az átlagos színvonalat kifejező mutatókat (összetett intenzitási viszonyszám, illetve főátlag) kéttényező befolyásolja:
1. milyen az egyes csoportokban a vizsgált színvonal nagysága,
2. milyen a sokaság szerkezete, összetétele.
Fejezetünkben azzal foglalkozunk, hogy hogyan történik az átlagos színvonal térbeli különbözőségének vagy időbeli változásának vizsgálata.Látni fogjuk, hogy a heterogenitás figyelembevétele ebben az esetben még fontosabb. Előfordulhat ugyanis, hogy nemcsak a vizsgált színvonal(önköltség, orvosellátottság, átlagbér) változik két időszak között, hanem a csoportosító ismérv szerinti összetétel is. (Pl. a különböző önköltséggeldolgozó üzemek termelésének, eltérő ellátottságú települések lakosainak, különböző átlagkeresetű dolgozók létszámának aránya.) Így előfordulhat,hogy minden csoportban csökken a részátlag (pl. az átlagbér), a főátlag (a sokaság egészére számított átlagbér) mégis nő. Ha térbeli összehasonlítástvégzünk (pl. két vállalkozást hasonlítunk össze), akkor az eltérésekre (különbségekre) irányítjuk figyelmünket.
Tekintsük a következő példát (4.1. táblázat). Két vállalkozásnál hasonlítjuk össze a dolgozók átlagos havi jövedelmét. A-nál 45 E Ft, B-nél 40 E Ft.Ebből megállapíthatjuk, hogy B-nél 5 E Ft-tal kevesebb az átlagos jövedelem. E megállapítás fedi a valóságot, de hogy elemzésünk kielégítő legyen,a különbség okait, tényezőit is vizsgálnunk kell. Valóban rosszabbak-e a kereseti lehetőségek B-nél? Nemek szerint is vizsgálva a jövedelmeketbővítsük a példát:
4.1. táblázat - Jövedelem- és létszámadatok két vállalkozásnálA B
NemÖsszes jövedelem Létszám
(fő) Összes jövedelem Létszám(fő)
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
181
(ezer Ft) (ezer Ft)Férfi
Nő
2400
300
50
10
1000
1000
20
30Összesen 2700 60 2000 50
Átlagos jövedelem A-nál:
Férfiak:
Nők:
Együtt:
Átlagos jövedelem B-nél:
Férfiak:
Nők:
Együtt:
Megállapíthatjuk, hogy B vállalkozásnál mind a férfiak, mind a nők jobban keresnek, mint A-nál. (A férfiak átlagos jövedelme 2 E Ft-tal, a nőké 3,3 EFt-tal magasabb.) Ez a megállapítás látszólag ellentmond annak, hogy B-ben alacsonyabb az átlagos jövedelem.
Két összetett intenzitási viszonyszám (főátlag) eltérése azonban nem magyarázható meg egyedül az intenzitási részviszonyszámok (részátlagok)
eltérésével. Az eltérésben a nemek szerinti eltérő összetétel is szerepet játszik. Példánkban A-nál a magasabb jövedelmű férfiak aránya 83% ,
B-nél pedig csak 40% . Ahhoz, hogy megállapításaink helytállók legyenek, külön kell választanunk e két ok hatását. Ez a standardizálásmódszerével történik.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
182
A standardizálás módszerével a térben (illetve időben) eltérő összetett intenzitási viszonyszámok (főátlagok) közötti különbséget (vagyhányadost) összetevőkre (illetve tényezőkre) bontjuk.
A standardizálás módszerét Kőrösy József (1844–1906) magyar származású statisztikus (demográfus) dolgozta ki és alkalmazta először. Különbözőterületeken élők korcsoportos halálozási arányszámait (1000 lakosra jutó halálozások száma egy adott területen vagy időszakban) vizsgálta,hasonlította össze. E tevékenysége során jött rá arra, hogy helytelen következtetések levonásához vezet az, ha csak az átlagos halálozásiarányszámok alapján végzi el az összehasonlítást. Ugyanis az egyes népességcsoportok életkörülményein, egészségügyi ellátásának színvonalánkívül a halálozások számát nagymértékben befolyásolja a népesség életkor szerinti összetétele is. Tudott dolog, hogy a csecsemőkortól (0–1 éveskor) eltekintve, minél idősebb korosztályt vizsgálunk, rendszerint annál nagyobb a halálozások előfordulása.
Tehát olyan népességcsoportoknál, ahol kedvezőbb életkörülmények, jobb orvosi ellátás hatására magasabb az átlagos életkor – ennélfogvanagyobb arányú az idősebb korosztály népességen belüli aránya –, magasabb lehet az átlagos halálozási arányszám, mint egyéb, kedvezőtlenebbkörülmények között élő népességcsoportoknál, annak ellenére, hogy az egyes korosztályoknál valószínűleg ellentétes irányú eltérés tapasztalható.
A felismert probléma megoldására dolgozta ki Kőrösy József a standardizálás módszerét. A különböző területek népességének átlagoshalálozási arányszámát úgy értelmezte, mint az egyes életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyeta részviszonyszámok nagysága és a népesség kor szerinti összetétele, megoszlása együttesen határoz meg. A két tényező hatását pedig úgyválasztotta el egymástól, hogy egy-egy tényező hatásának elemzésekor a másik tényezőt standardnak (állandónak) tételezte fel.
Az összetett intenzitási viszonyszámok (illetve főátlagok) térbeli összehasonlításánál azt vizsgáljuk, hogy azok mennyivel térnek el egy másik, azonosmódon csoportosított statisztikai sokaság összetett intenzitási viszonyszámától (vagy főátlagától), azaz a különbségeket képezzük.
Az időbeli elemzés során azt elemezzük, hogy az összetett intenzitási viszonyszám (vagy főátlag) hány %-kal változott az egyik időszakról a másikidőszakra, azaz a hányadosokat számítjuk ki.
Ismeretes, hogy az intenzitási viszonyszám és a számtani átlag között igen közeli a rokonság. Ugyanazt a színvonalmutatót általában kifejezhetjükviszonyszámként vagy átlagként, attól függően, hogy milyen adatokból számítottuk. Ebből következik, hogy megállapításaink mindkét mutatószámravonatkoznak. Ebben a fejezetben elsősorban olyan problémákat tárgyalunk, amelyek intenzitási viszonyszámokkal jellemezhetők. Ezért a
továbbiakban a módszert az intenzitási viszonyszámokra mutatjuk be, és a alapképletnek megfelelő jelöléseket használjuk. De mindaz, amitelmondunk, az átlagokra is érvényes.
Tekintsük át az adatbázist és a kiszámítható mutatószámokat a 4.2. táblázat szerinti formában:
4.2. táblázat - Két összetett intenzitási viszonyszám meghatározása és összehasonlítása
Összehasonlítandó területek, illetve időszakokVizsgált „0” „1” Különbség Hányados
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
183
csoportok
1
2
j
M
Vizsgáltsokaság K I
ahol a táblázat két utolsó oszlopában a részviszonyszámok összehasonlítására szolgáló különbségeket és az hányadosokat
helyeztük el. Az összesen sorban pedig a különbség és az hányados szerepel.
A két szóban forgó ok hatását oly módon fogjuk kimutatni, hogy a két összehasonlítandó összetett viszonyszám közötti (K) tényleges különbséget,illetve a két mutató tényleges hányadosát (I) úgy bontjuk fel két részre, hogy:
1. a illetve a megfelelő részviszonyszámok közötti különbségeknek, illetve a hányadosaiknak a két összetett viszonyszám különbségére,illetve hányadosára gyakorolt hatását, a illetve pedig a két sokaság eltérő összetételének a két összetett viszonyszám különbségére, illetvehányadosára gyakorolt hatását mutassa;
2. teljesüljön továbbá, hogy az egyes hatásokat kifejező különbségek összege a teljes különbséggel egyenlő: A hányadosok szorzatapedig az összetett viszonyszámok hányadosával egyenlő: .
A különbségfelbontást elsősorban térbeli, a hányadosfelbontást pedig időbeli összehasonlításnál használjuk.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
184
4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségénekfelbontása összetevőire
A statisztikai elemzésben gyakran kerül sor valamilyen jelenség átlagos színvonalának térbeli összehasonlítására. Az összehasonlítás korlátozódhataz eltérés irányának megállapítására, amikor csak azt vizsgáljuk, hogy a két összetett intenzitási viszonyszám közül melyik a nagyobb. Ezzel azonbanrendszerint nem elégszünk meg, hanem amint azt az előző pontban tárgyaltuk, az eltérést előidéző tényezők számszerű hatását a standardizálásmódszerével kimutatjuk.
Tekintsük a következő példát (4.3. táblázat):
4.3. táblázat - Két ország halandósági viszonyainak alakulása (fiktív adatok)A ország („0”) B ország („1”) Arány-
Korcso-portok
(év)
Meghaltak
száma
(fő)
Lakosság
(millió fő)
Halálozási
arányszám
(‰)
Meghaltak
száma
(fő)
Lakosság
(millió fő)
Halálozási
arányszám
(‰)
számok
különbsége
(‰)
0 −14
5 − 14
15 − 39
40 − 59
60 −11
25 200
1 900
11 200
26 400
124 800
1,8
3,8
8,0
4,0
2,4
14,0
0,5
1,4
6,6
52,0
9 460
880
7 280
24 700
117 990
1,1
2,2
5,6
3,8
2,3
8,6
0,4
1,3
6,5
51,3
–5,4
–0,1
–0,1
–0,1
–0,7Összesen 189 500 20,0 ... 160 310 15,0 ... ...
Halálozási arányszám (1000 lakosra jutó halálozások száma) =
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
185
B ország átlagos halálozási arányszáma:
Egyszerűbben írva:
Súlyozott számtani átlag formában1:
A ország átlagos halálozási arányszáma:
Egyszerűbben írva:
Súlyozott számtani átlag formában:
1 A „súlyok” szerepét a relatív súlyok (megoszlási viszonyszámok) is betölthetik (lásd itt is a 3.3.1. pontban leírtakat).
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
186
Példánkban: K = 10,7‰ – 9,5‰ = 1,2 ‰.
B országban tehát 1,2 ezrelékponttal nagyobb a halálozási arányszám.
Ha csak ezt az arányszámot ismernénk, azt gondolnánk, hogy B országban lényegesen rosszabbak az életkörülmények és az egészségügyiviszonyok. Ha azonban a korcsoportos halálozási arányszámokat vizsgáljuk (lásd a 4.3. táblázat adatait), egészen más következtetésre jutunk, mertB országban minden egyes korcsoportban alacsonyabb a halálozási arányszám.
E feltűnő ellentmondás magyarázata abban van, hogy B országban magasabb a viszonylag magas halandóságú idősebb korúak aránya.
A standardizálás módszerével kimutatjuk, hogy a megállapított 1,2 ezrelékpontos különbséget milyen mértékben magyarázhatjuk
a korcsoportonkénti halálozási arányszámok eltéréseivel , illetve
a népesség eltérő korösszetételével .
4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatásaAhhoz, hogy a részviszonyszámok különbözőségének hatását kimutathassuk, az összetétel szempontjából összehasonlíthatóvá tesszük a kétösszetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard (azonos, állandó) összetétellel számítjuk ki.
ahol: a j-edik csoport standard súlya, részaránya.
Egyszerűbben írva2:
2A továbbiakban az egyszerűbb formát használjuk, tehát nem tüntetjük fel a szummációs határokat.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
187
A részhatáskülönbség azt fejezi ki, hogy csupán a megfelelő részviszonyszámok eltérése milyen hatást gyakorolt az összetettintenzitási viszonyszámok eltérésére.
Példánkban a B ország lakossági adatait választjuk standardnak .
B ország összetett viszonyszáma nem változik:
A ország összetett viszonyszáma, ha súlyként a B ország megoszlási gyakoriságait használjuk (ez a standard), pedig:
A két arányszám különbsége:
Megállapíthatjuk, hogy 0,6 ezrelékponttal alacsonyabb az átlagos halálozási arányszám amiatt, hogy minden korcsoportban alacsonyabbak azarányszámok (lásd a 4.3. táblázat utolsó oszlopát).
A az intenzitási részviszonyszámok különbségeinek átlagaként is értelmezhető és kiszámítható:
Példánkban:
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
188
Mivel a átlag, ezért a mindig a és a között helyezkedik el. Példánkban a legkisebb eltérés –5,4 (az első korcsoportban), a legnagyobbeltérés –0,1 (pl. az 5−14 éves korcsoportnál).
4.2.2. Az összetétel különbözőségének hatásaAhhoz, hogy az összetétel különbözőségének hatását ( ) kimutathassuk, a vizsgált színvonal szempontjából összehasonlíthatóvá tesszük a kétösszetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard részviszonyszámok feltételezésével számítjuk ki.
ahol az egyes csoportok standard részviszonyszáma.
A összetételhatás-különbség azt fejezi ki, hogy csupán az összetétel különbözősége milyen hatást gyakorolt az összetett intenzitásiviszonyszámok eltérésére.
Ennek a tényezőnek a hatását példánkban úgy tudjuk kimutatni, ha mindkét ország halálozási arányszámát azonos részviszonyszámok(korcsoportonkénti halálozási arányszámok) figyelembevételével számítjuk ki és azután megállapítjuk a különbségüket. Megoldásunkat úgy folytatjuk,hogy az A ország korcsoportonkénti halálozási arányszámait tekintjük standardnak ( ).
B ország együttes viszonyszáma:
A ország együttes arányszáma nem változik:
A kimutatott pozitív előjelű 1,8‰ azt jelenti, hogy B országban, kizárólag abból adódóan, hogy a lakosság nagyobb hányadát teszik ki az idősebbek,1000 lakosra 1,8 ezrelékponttal több halálozás jutott.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
189
Ha a standard adatsorokat úgy választjuk meg, hogy A ország lakosság-összetételét és B ország korcsoportonkénti halálozási arányszámaitvesszük standardnak (tehát az előzőekkel éppen ellentétesen), az országos halálozási arányszámok különbségének felbontására (a számításokmellőzésével) az alábbieredményeket kapjuk:
A kétféle standard adatsor választása esetén a és számszerű eredménye ugyan eltér egymástól, de tendenciájukban hasonló módon mutatjákaz egyes tényezőknek a különbség kialakításában játszott szerepét.
Ha számításánál B ország a standard, akkor számításánál A országot kell standardnak venni (és fordítva). Ugyanis ekkor
mivel a két középső tag kiesik.
A 4.1. pontban szereplő problémafelvető példánk megoldását ( és kiszámítását) az olvasóra bízzuk.
4.3. Indexszámítás standardizálás alapján (hányadosfelbontás)Ha a tényleges, illetve (valamelyik tényező kimutatásának céljából) standardizált összetett intenzitási viszonyszámoknak nem a különbségét, hanema hányadosát képezzük, összehasonlító dinamikus viszonyszámokat kapunk. Ezeket összetettségük, komplex tartalmuk miatt indexeknek nevezzük.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
190
A tényleges összetett intenzitási viszonyszámok hányadosát főátlagindexnek, a standard összetétellel számított hányadost ( )részátlagindexnek, a standard részviszonyszámokkal számított hányadost ( ) pedig összetételhatás-indexnek nevezzük.3
Az indexek számítását a következő példán mutatjuk be (4.4. táblázat).
4.4. táblázat - Egy megye forgalmi és népességadatai az 1994. és 1995. évben
1994. év 1995. év 1 lakosra jutó
TelepülésForgalom
(1000 Ft)
Lakosság
(1000fő)
1 lakosrajutó forg.
(Ft/fő)
Forgalom
(1000 Ft)
Lakosság
(1000 fő)
1 lakosrajutó forg.
(Ft/fő)
forgalom
változása
(1994=100%)
Ipari 640 000 160 4000,0 774 000 180 4300,0 107,5Mezőgaz-dasági 1 440 000 480 3000,0 1 408 000 440 3200,0 106,7
Összesen 2 080 000 640 3250,0 2 182 000 620 3519,4 ...
4.3.1. A főátlagindexA főátlagindex azt fejezi ki, hogy az intenzitási viszonyszámmal kifejezhető átlagos színvonal hogyan változott egyik (bázis-) időszakróla másik (tárgy-) időszakra.
Példánkban az 1 lakosra jutó kereskedelmi forgalom változását vizsgáljuk.
A főátlagindexet háromféle módon is kiszámíthatjuk:
1. A viszonyszámtört számlálójának és nevezőjének ismeretében
3A szakirodalomban és néhány korábbi tankönyvben használatos terminológia szerint: I: változó állományú index; I': változatlan állományú index; I'': arányeltolódási index.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
191
2. A viszonyszámtört számlálójának és nevezőjének összetett dinamikus viszonyszáma alapján:
A forgalom változása:
A lakosság számának változása:
3. A részviszonyszámok súlyozott számtani átlagai alapján:
Mindhárom számítás ugyanarra az eredményre vezet. Míg az első kettőnek gyakorlati jelentősége van, addig a harmadik számítási forma bizonyítja,hogy a főátlagindex nagyságát két tényező befolyásolja:
a) az intenzitási részviszonyszámok változása,
b) az eltérő színvonallal jellemzett sokaság szerkezetének, összetételének változása.
A megyei átlagos 1 lakosra jutó forgalom 8,3%-os növekedését két tényező okozta:
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
192
a) a településenkénti 1 lakosra jutó forgalomnak 7,5%-os, illetve 6,7%-os növekedése, valamint
b) a lakosság településforma szerinti összetételének megváltozása.
4.3.2. A részátlagindexA részátlagindex a részviszonyszámok változásának az összetett viszonyszám változására gyakorolt hatását fejezi ki. Eltekint a sokaságösszetétel-változásától.
Ezért a részátlagindexet változó részviszonyszámokkal és standard összetétellel képzett hányadosként számítjuk ki. Mindig a tárgyidőszak tényleges
összetételét tekintjük standardnak .
Számítása tehát az alábbi módokon történhet:
1. A standardizált összetett intenzitási viszonyszámok hányadosaként:
2. Aggregát formában4:
Az előző képletet -gyel egyszerűsítve kapjuk az aggregát formát:
Példánkban:
4 Az 5. fejezetben ismertetésre kerülő indexek analógiájára. Jelentését lásd ott.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
193
3. Az aggregát forma átalakításával:
a) A csoportok színvonalváltozásainak (az egyedi indexeknek, ) súlyozott számtani átlagaként:
Példánkban:
b) A csoportok színvonalváltozásainak súlyozott harmonikus átlagaként:
Példánkban
Megállapíthatjuk, hogy az 1 lakosra jutó forgalom értékének településtípusonkénti növekedése 7,0%-kal növelte a megyei 1 lakosra jutó forgalmat.
A részátlagindex mindenkor a legnagyobb és legkisebb egyedi indexek ( ) között foglal helyet, mivel azok súlyozott átlaga. A főátlagindex, mivela részátlagok változásán kívül a sokaság összetétel-változásának hatását is tartalmazza, kerülhet az egyedi indexek közé, de mutathat az egyediindexeknél nagyobb vagy kisebb százalékos változást is.
(A képletek jobb megértéséhez tekintsük át ismét a 4.2. táblázatban közölt jelölésrendszert!)
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
194
4.3.3. Az összetételhatás indexeAz összetételhatás indexe megmutatja, hogy a részsokaság összetételében bekövetkezett változás milyen hatást gyakorolt az összetettintenzitási viszonyszám változására.
Az összetételhatás indexének számításánál mindig a bázisidőszak részviszonyszámait vesszük standardnak .
Számítási képlete a standardizált összetett intenzitási viszonyszámok hányadosaként:
Példánkban:
Megállapíthatjuk, hogy az összetétel-változás (1,2%-os mértékben) növelte az egy lakosra jutó forgalmat.
Ha a részátlagindex számításánál a tárgyidőszakot vettük standardnak, akkor ebből már következik, hogy itt a bázisidőszaknak kell standardnaklenni, mert ekkor igaz, hogy
azaz
főátlagindex = részátlagindex · összetételhatás-index
Még egyszer hangsúlyozzuk, hogy az egyenlőség fennállásának feltétele, hogy az -t tárgyidőszaki összetétellel, az -t pedig bázisidőszaki
intenzitási részviszonyszámokkal számoljuk. (Vagy fordítva: -t adatsorral; -t pedig adatsorral.)
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
195
Ebből következik, hogy:
Leggyakrabban az össszetétel-változás hatását számítjuk közvetett úton.
Példánkban:
Hogy az összetétel hogyan változott, azt a 4.5. táblázat szemlélteti megoszlási viszonyszámokkal.
4.5. táblázat - A lakosság összetételének változása
A megye népességeTelepülés 1994-ben 1995-ben
ezer főben %-ban ezer főben %-banIpari
Mezőgazdasági
160
480
25
75
180
440
29
71Összesen 640 100 620 100
A megoszlási viszonyszámok alátámasztják előbbi megállapításunkat. A megye népességén belül megnőtt az ipari települések népességénekaránya, ahol (érthetően) nagyobb az 1 főre jutó kereskedelmi forgalom.
4.4. Alkalmazási területekA statisztikai elemzésben a standardizálás módszerét a gazdaságstatisztika és a népességstatisztika számos területén alkalmazzák. Az ismertetettmódszerek segítségével vizsgálhatjuk pl. a munka termelékenységének, a termékek önköltségének, a költségszínvonalnak, a termésátlagoknak,a születési és halálozási arányszámoknak, az egy főre jutó fogyasztásnak az alakulását. Jelentős alkalmazási terület továbbá az átlagos bérek,jövedelmek alakulásának vizsgálata is. Az árak statisztikai elemzésének bizonyos területe is e témakörhöz kapcsolódik.
A továbbbiakban e két utóbbi alkalmazást mutatjuk be.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
196
4.4.1. Az átlagbérek időbeli változásának vizsgálataAz átlagbérek (pl. az egy főre jutó bruttó vagy nettó bér) időbeli változását általában állománycsoportonként, szakmánként, területi egységenkéntvizsgáljuk, ezek együttes, átlagos változását indexmódszerrel elemezhetjük.
Vizsgáljuk meg az átlagbérek alakulását egy vállalkozásnál 1994. és 1995. január hónapjában (4.6. táblázat).
4.6. táblázat - Egy vállalkozás munkaügyi adatai
1994. január 1995. január
Állománycsoport
Béralap
(1000 Ft)
Létszám
(fő)
Béralap
(1000 Ft)
Létszám
(fő)
Fizikai
Nem fizikai
28 800
6 000
800
150
33 660
4 400
850
100Együtt 34 800 950 38 060 950
A bruttó átlagkeresetet a béralap és a létszám hányadosaként ( ) mint intenzitási viszonyszámot értelmezzük. Az egyes állománycsoportokraés a vállalkozás dolgozóinak összességére kiszámított bruttó átlagkereseteket és azok időbeli változását a 4.7. táblázat tartalmazza:
4.7. táblázat - 4.7. táblázat
Bruttó átlagkereset (Ft)
Állomány-csoport
1994. január 1995. január
(%)
Fizikai
Nem fizikai
36 000
40 000
39 600
44 000
110,0
110,0Együtt 36 632 40 063 109,4
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
197
Megállapíthatjuk, hogy az átlagkereset mind a két állománycsoportban egyaránt 10–10%-kal nőtt. Ugyanakkor az együttes (átlagos) átlagkereset-növekedés csak 9,4%. Ennek a látszólagos ellentmondásnak az a magyarázata, hogy az egyes állománycsoportok összlétszámon belüli arányais megváltozott. Az alacsonyabb átlagkeresettel rendelkező fizikai állománycsoport összlétszámon belüli aránya növekedett (mert az összlétszámváltozatlansága mellett létszámuk nőtt), ugyanakkor a magasabb átlagkeresetű, nem fizikai állománycsoportban lévő dolgozók aránya csökkent(változatlan összlétszám mellett létszámuk csökkent).
A kiszámított 9,4%-os átlagkereset-növekedés az egyes állománycsoportonkénti átlagkereset-változást és az állománycsoportok létszámarány-változásának a hatását is tükrözi. Ebből következik, hogy a 109,4%-os index az átlagkeresetek elemzésének főátlagindexe.
Az állománycsoportonkénti átlagkeresetek változásának hatását az 1995-ös létszámadatok feltételezésével mutathatjuk ki.
A bruttó átlagkereset részátlagindexe:
Mint azt a 4.3.2. pontban bizonyítottuk, a részátlagindex az egyedi indexek között helyezkedik el. Példánk ebből a szempontból speciálisnaktekinthető, ugyanis mindkét állománycsoportban egyaránt 10%-kal nőtt az átlagkereset. Így a bruttó átlagkereset növekedésének átlagos nagysága iséppen 10%. A részátlagindex tehát az átlagkereset vizsgált csoportonkénti változásainak átlagát fejezi ki, rövidebben szólva az átlagkereset átlagosváltozását. Mint láttuk, az együttes bruttó átlagkereset ennél kisebb mértékben nőtt (I = 109,4%).
A létszámarányok változásának hatását az összetételhatás indexével mutatjuk ki. A számításnál feltételezzük, hogy 1995-re is az 1994-es keresetiadatok jellemzőek.
A bruttó átlagkereset összetételhatás-indexe:
A másik két index alapján:
Az átlagkereset változása különbségszámítással is elemezhető, bár azt mondtuk, hogy az időbeli változást általában az indexekkel elemezzük.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
198
A bruttó átlagkereset összes növekedése:
A növekedés tényezői:
(A számításnál a standardizálás egyes lépéseiben ugyanúgy jártunk el, mint a megfelelő és indexnél.)
A 3431 Ft-os keresetnövekedésben az állománycsoportonkénti átlagkereset-növekedések (fizikaiaknál 600 Ft, nem fizikaiaknál 4000 Ft) együtteshatása 3643 Ft volt, amit „lerontott” a kedvezőtlen összetétel-változás. (Az alacsony keresetű csoport létszámaránya nőtt meg 84,2%-ról 89,5%-ra.)
4.4.2. Az átlagárak időbeli változásának vizsgálataAz árakat (pontosabban az egységárakat) általában úgy értelmezzük, mint egy meghatározott egyedi termék (szolgáltatás) egy szokásosmértékegységben kifejezett mennyiségi egységére jutó forintértéket. A gyakorlatban azonban számtalan esetben előfordul, hogy több termék(szolgáltatás, cikk) árát egy adattal, egy átlagos árral kívánjuk jellemezni. A számítás szükségessége felmerülhet térben és időben is.
Az árstatisztikai vizsgálatnál megkülönböztetjük az egyedi (elemi) ár és az átlagár fogalmát. Egyedi ár fogalma alatt egy adott minőségű termék vagyszolgáltatás meghatározott körülmények között történt adásvétele során a termék vagy szolgáltatás egy egységéért fizetett pénzösszeget értjük. Azátlagár pedig bizonyos okok miatt különböző (pl. a termék minősége, a feljegyzés időpontja vagy helye) elemi árak átlaga.
Az átlagár számításainak két előfeltétele van:
– a vizsgált termékek, cikkek, szolgáltatások homogén csoportba tartozzanak, tehát olyan árucsoportba, amelybe tartozó cikkek, szolgáltatásokazonos szükségleteket elégítenek ki, az egyes cikkek, szolgáltatások eltérő árainak oka a minőségi különbségekben keresendő. (A statisztikaigyakorlatban meghatározott esetekben heterogén termékek, cikkek, szolgáltatások átlagárát is elemezzük, ezzel tananyagunkban nem foglalkozunk.)
– a termékek, cikkek természetes mértékegységben összesíthetők legyenek (ez ún. technikai előfeltétele az átlagárszámításnak).
Az átlagár tehát csak homogén csoportba tartozó és természetes mértékegységben összesíthető termékek, szolgáltatások körére értelmezhető.Átlagárat számíthatunk például a különböző minőségű kenyér elemi áraiból.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
199
Vezessük be a következő jelöléseket.
– az értékesített (fogyasztott, felhasznált stb.) mennyiség,
– az értékesített (fogyasztott, felhasznált stb.) termékek egyedi (elemi) ára,
n – a termékcsoporthoz tartozó termékek száma.
Az átlagár számításának lehetséges módozatai:
– intenzitási viszonyszámként, ha a mennyiségek mellett az értékesítési árbevétel ismert:
ahol v megfelel az A típusú adatnak, q pedig a B típusú adatnak. (Az összetett intenzitási viszonyszámra bevezetett jelölésrendszer szerint.)
– az egyedi (elemi) árak súlyozott számtani átlagaként számíthatjuk az alábbiak szerint:
– az egyedi (elemi) árak súlyozott harmonikus átlagaként, ha a mennyiségi adatok mellett a adatok ismertek:
A továbbiakban a képletek felírásakor eltekintünk a szummációs határok kijelölésétől.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
200
Az átlagár nagysága – nyilvánvalóan – függ az elemi árak nagyságától és a különböző nagyságú elemi árakkal jellemzett termékek értékesítésirészarányától.
A termékcsoport átlagárának időbeli változását, a változás okainak feltárását az itt megismert indexek szolgálják. Az alkalmazást a következő példasegítségével mutatjuk be (4.8. táblázat).
4.8. táblázat - Egy homogén árucsoportba tartozó három cikk értékesítési adatai
Március Április
Cikk
Forgalom
(1000Ft)
Értékesítettmennyiség
(db)
Ár
(Ft/db)
Forgalom
(1000Ft)
Értékesítettmennyiség
(db)
Ár
(Ft/db)
Árváltozás
(Március=
=100%)A
B
C
720,0
660,0
1000,0
800
600
500
900
1100
2000
940,5
1012,0
1440,0
950
800
600
990
1265
2400
110
115
120Összesen 2380,0 1900 ... 3392,5 2350 ... ...
Márciusi átlagár:
Áprilisi átlagár:
Főátlagindex:
Ha az átlagár 15,2%-os növekedésében csak az árak változásának hatását akarjuk kimutatni, akkor az átlagárat mindkét időszakban az áprilisbanforgalmazott cikkek áprilisi mennyiségi adataival kell súlyoznunk. Így az átlagár részátlagindexéhez jutunk:
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
201
Általánosítva
(A részátlagindex képlete azonos a következő fejezetben bemutatásra kerülő árindex képletével, tehát ténylegesen csak az árak változásáttükrözi.)
A részátlagindex súlyozott harmonikus átlag (esetleg súlyozott számtani átlag) formában is kiszámítható:
(A súlyozott számtani átlag formát a gyakorlatban nem használjuk, ezért ennek számszerű bemutatásától eltekintünk.)
A két időszak között megváltozott a forgalmazott mennyiség cikkek szerinti összetétele, ennek az átlagár változására gyakorolt hatását azösszetételhatás-index segítségével mutatjuk ki. Ebben az indexben a márciusi termékenkénti árakat használjuk mindkét időszak átlagáránakkiszámításához:
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
202
Általánosítva:
A három index között szintén fennáll a következő összefüggés:
Ennek feltétele, hogy a változatlannak tekintett tényezőt ( -nél a temékösszetételt, -nél az egyedi árakat) ellentétes időszakból válasszuk.
Példánkban:
Az átlagár változását tehát döntően az egyedi árak változása okozta (15,6%-os mértékben), valamelyest csökkentő hatást gyakorolt atermékösszetétel megváltozása. Megnőtt ugyanis a viszonylag olcsóbb B cikk aránya (31,6%-ról 34%-ra).
Nyomatékosan felhívjuk a figyelmet arra, hogy az itt ismertetett átlagárindexek csak a mennyiségben közvetlenül összesíthető termékek viszonylagszűkebb körére értelmezhetők. (Mint azt már a bevezetőben is hangsúlyoztuk.)
A következő fejezetben a közvetlenül nem összesíthető, különnemű, általában különböző mértékegységű termékek értékének, árának ésmennyiségének időbeli összehasonlítására szolgáló indexekkel ismerkedünk meg.
4.5. Gyakorlófeladatok1. Két országban (A és B) vizsgáljuk a születési viszonyokat. A születések számára és a szülőképes korú nők számára vonatkozó adatok az alábbiak:
Életkor A nők száma (millió fő) A születések száma (ezer)(év) A ország B ország A ország B ország
15 – 19
20 – 29
30 – 39
3,6
6,4
6,0
8,0
14,0
10,0
288
1280
260
400
2100
320
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
203
40 – 49 4,0 8,0 60 40Összesen 20,0 40,0 1888 2860
Feladat:
a) Hasonlítsuk össze az 1000 nőre jutó születést a szülőképes korú nők egyes korcsoportjaiban és az ország egészében!
b) Standardizálással mutassuk ki, hogy:
1. a születési arányszámok különbözősége miatt mennyivel (hány ezrelékponttal) magasabb az A ország arányszáma? (A ország összetételévelszámoljunk.)
2. az eltérő korösszetétel miatt kedvezőbb vagy kedvezőtlenebb-e A ország születési arányszáma? Megállapításainkat támasszuk alá a megoszlásiviszonyszámok kiszámításával is!
2. Az öregségi nyugdíjak adatai a nyugdíjasok életkora és nemek szerint 1994 áprilisában:
Férfiak Nők
Életkor (év)száma
(1000 fő)
nyugdíj összege
(1000 Ft/fő)
száma
(1000 fő)
nyugdíj összege
(1000 Ft/fő)11 – 54
55 – 59
60 – 64
65 – 69
70 – 74
75 – 79
80 – 11
7,1
19,5
144,6
168,7
143,7
64,6
91,4
19,8
20,1
16,3
16,4
16,0
16,5
15,4
6,7
171,2
221,3
205,2
170,4
75,2
103,4
12,6
12,0
12,3
12,2
12,3
12,7
12,6Összesen 639,6 16,3 953,4 12,3
Feladat:
Hasonlítsuk össze a férfiak és a nők átlagos nyugdíját! Mutassuk ki a különbséget kialakító tényezőket!
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
204
3. Két ország halandósági viszonyaira vonatkozó fiktív adatok:
A ország B ország
Életkor (év)Népesség
(millió fő)
Halálozási arány
(‰)
Népesség
(millió fő)
Halálozási arány
(‰)10 – 14
15 – 59
60 és felett
6
12
2
2,0
3,5
50,0
3
15
12
1,5
2,5
45,0Összesen 20 ... 30 ...
Feladat:
a) Hasonlítsuk össze a két országot a halandósági viszonyok szempontjából!
b) Mutassuk ki standardizálás segítségével a befolyásoló tényezőket!
c) Megállapításainkat szövegesen is fogalmazzuk meg!
4. A hozzáadott érték és a létszám alakulása valamely vállalkozásnál az alábbi volt:
ÜzemHozzáadott érték
(millió Ft)
Létszám
(fő)1993 1994 1993 1994
A
B
C
100
100
70
110
110
130
20
15
9
20
15
15Összesen 270 350 44 50
Feladat:
a) Számítsuk ki az egy főre jutó hozzáadott értéket mindkét évre üzemenként és a vállalkozás egészére! Vizsgáljuk a változást 1993-ról 1994-re!
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
205
b) Mutassuk ki megfelelő indexekkel, hogy milyen szerepet játszott a vállalkozás termelékenységének javulásában (romlásában):
1. a termelékenység üzemenkénti változása,
2. a különböző termelékenységi szinten dolgozó üzemek közötti létszámösszetétel-változás!
c) Írjunk szöveges elemzést!
5. Egy termékről, amelyet három gyáregységben termelnek, az alábbiakat ismerjük:
Gyáregység Önköltség (ezer Ft/db) A termelés megoszlása1993 1994 1994-ben (%)
I.
II.
III.
8
10
12
8,4
10,6
13,2
20
40
40Összesen ... ... 100
1993-ról 1994-re a termék átlagos önköltsége 4%-kal nőtt.
Feladat:
a) Számítsuk ki a részátlagindexet!
b) Hogyan hatott a termelés összetételének gyáregységek közötti megváltozása az átlagos önköltségváltozásra?
c) Melyik gyáregység(ek) részaránya nőhetett meg?
6. Magyarország kenyérgabona-termelésének adatai:
Vetésterület (1000 ha) Termésátlag (kg/hektár)Megnevezés
1991 1993 1991 1993Búza
Rozs
1152
358
986
429
5190
2370
3050
1660Kenyérgabona 1510 1415 ... ...
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
206
Feladat:
a) Hány %-kal nőtt (csökkent) az összes kenyérgabona-termelés Magyarországon?
b) Bontsuk fel ezt a változást a termésátlag, illetve a vetésterület változásának hatására!
c) Milyen tényezők befolyásolták az együttes termésátlag változását? Mutassuk ki e hatásokat a standardizálás módszerével!
7. Egy vállalatnál 1993-ban a vezető beosztásúak átlagos bruttó bére 60 ezer Ft, a beosztottaké pedig 24 ezer Ft volt. 1994-re a vezetők átlagbére21%-kal, a beosztottaké pedig 15%-kal nőtt. 1993-ban a vezetők aránya 20%, 1994-ben pedig 10% volt.
Feladat:
a) Rendezzük az adatokat statisztikai táblába!
b) Elemezzük a vállalatnál foglalkoztatottak átlagbérének változását indexekkel! Az eredményeket szövegesen is értékeljük!
8. Egy vállalkozás adatai:
Szakképzettség szerinti A kifizetett bruttó bérek A létszámcsoportok 1994-ben az 1990-es év %-ábanSzakmunkás
Betanított munkás
Segédmunkás
140
130
150
120
120
130Összesen 132 123
Ismert továbbá, hogy 1994-ben az összes kifizetett bruttó bérek 40%-át a szakmunkásoknak, 30%-át a betanított munkásoknak, a többit asegédmunkásoknak fizették ki.
Feladat:
Számítsuk ki, hogyan változott az átlagbér:
a) az egyes szakképzettségi csoportokban,
b) a munkások összességére vonatkozóan,
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
207
c) a szakképzettség szerinti csoportoknál átlagosan,
d) a munkások összességére vonatkozóan csupán a létszámarányok megváltozása következtében!
9. Egy terméket három telephelyen gyártanak. A termelékenység alakulását jellemző adatok:
Telephely Egy főre jutótermelés (db/fő)
A létszámmegoszlása
1990 1994 1994-ben (%)
A
B
C
20
30
40
18
15
36
20
40
40
A temelékenység főátlagindexe: 92,3%.
Feladat:
a) Az adatok tanulmányozása alapján (számolás nélkül) válasszuk ki, hogy az alábbi három változat közül melyik felelhet meg a valóságnak?
A létszám 1990-es (bázisidőszaki) megoszlása a telephelyek sorrendjében (%):
Telephely
VáltozatA B C
1.
2.
3.
20
10
60
40
40
20
40
50
20
Indokoljuk meg válaszunkat!
b) Számítsuk ki az és indexeket! Ellenőrizzük a létszámösszetétellel kapcsolatos döntésünket!
10. Egy felsőoktatási intézményben valamennyi oktatói csoportban (tanársegéd, adjunktus, docens, főiskolai tanár) 5,6%-kal nőttek az átlagbérekegyik időszakról a másikra. Az összes oktatóra számított átlagbér növekedése pedig csak 2%-os volt.
Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása
208
Feladat:
a) Állapítsuk meg az átlagbérekre számított főátlag-, részátlag- és összetételhatás-indexet!
b) Írjunk szöveges magyarázatot!
11. Egy magánkereskedő háromféle minőségű burgonyát értékesít. Az értékesítéssel kapcsolatos adatok az alábbiak:
Bázisidőszak Beszámolási időszakBurgonya
minőségeÉrtékesítés
árbevétele (Ft)Ár (Ft/kg)
Értékesítés
árbevétele (Ft)Ár (Ft/kg)
I osztályú
II osztályú
III osztályú
9 600
2 400
2 000
80
60
50
10 000
1 750
1 500
100
70
60Együtt 14 000 ... 13 250 ...
Feladat:
a) Számítsuk ki a burgonya átlagárát mindkét időszakban!
b) Elemezzük az átlagár változására ható tényezőket megfelelő indexekkel!
c) Írjunk szöveges értékelést
209
5. fejezet - Érték-, ár- és volumenindexek5.1. Az indexszám fogalma
A gazdasági elemzésekben kiemelkedő jelentősége van az összehasonlításnak. Az azonos jellegű, azonos mértékegységű adatoknál ez egyszerűmódon megoldható, pl. viszonyszámokkal. Gyakran van azonban szükség a közvetlenül nem összesíthető adatokra vonatkozó átlagos változásmeghatározására. A gazdasági egységeknél nagyon lényeges információ a termelés vagy a forgalom teljes volumenének alakulása, melynekmegállapítása – hacsak nem egyféle cikket gyárt, forgalmaz a cég – a már ismert számításokkal nem végezhető el. Nemzetgazdasági és nemzetköziszinten úgyszintén fontos az egyes gazdasági folyamatokban bekövetkezett mennyiségi változás kimutatása, s ez is megfelelő – az eddig tárgyaltaktóleltérő – módszerek alkalmazását követeli meg. Napjainkban az árváltozás mértékének ismeretére vonatkozó igény is különösen nagy, mikro- ésmakro-összehasonlítás vonatkozásában egyaránt. A mértékegységbeli különbözőség vagy a termékek eltérő volta nem teszi lehetővé direkt módona viszonyítást. Ezért olyan eljárásra volt szükség, amely az összehasonlíthatóság nehézségét kiküszöböli. Bizonyos termékeknél az átszámítotttermészetes mértékegységben történő számbavétel kivitelezhető (pl. égetett szeszes italoknál 50°-os szesz, állattenyésztésben számosállat stb.),többnyire azonban csak nagyon körülményesen vagy egyáltalán nem lehetséges. Olyan közös jellemzőt kell találni, melynek segítségével azösszehasonlítás a termékek széles körében megoldható. Ez a közös jellemző az ár, amellyel az értékben történő számbavétel elvégezhető. Az értéka mennyiség és az egységár szorzatából határozható meg. Az értékadatok összeadhatóak, tehát ily módon az egyes termékek, termékcsoportokmennyisége összesíthetővé válik.
Az értékben való összesítést aggregálásnak, az összesített értékadatot pedig aggregátumnak nevezzük.
A közvetlenül nem összesíthető, de valamilyen szempontból összetartozó adatok átlagos változását mutató összetett összehasonlító viszonyszámaz indexszám.
Az indexszám viszonyszámnak is és átlagnak is felfogható. Viszonyszám, mert két adat hányadosa, amely időbeli és területi összehasonlításnál isalkalmazható. Átlag, mert az egyes termékekre (jelenségekre) vonatkozó viszonyszámok átlagaként is meghatározható.
Indexek számításával már az előző fejezet is foglalkozott az összetett intenzitási viszonyszámok (főátlagok) összehasonlítása során. Ezeket azindexeket standardizáláson alapuló indexeknek is szokták nevezni.
Azokat az indexeket, amelyekkel ebben a fejezetben fogunk megismerkedni, értéken alapuló indexeknek nevezzük.
5.2. Érték-, ár- és volumenindex-számításAz egyes termékek, szolgáltatások érték-, ár- és volumenváltozását dinamikus viszonyszámokkal elemezhetjük. Az indexszámítás keretébena termékekre számított dinamikus viszonyszámokat egyedi indexeknek hívjuk. A termék egységárát p-vel, a termelt, eladott, fogyasztott stb.
Érték-, ár- és volumenindexek
210
mennyiséget q-val, a kettő szorzatát , az értéket v-vel jelöljük. Az összehasonlítandó két időszak jelölése bázisidőszak esetén 0, tárgyidőszak(vagy beszámolási időszak) esetén 1 indexszel történik. Így tehát az egyedi indexek meghatározásának módja:
egyedi értékindex
egyedi árindex
egyedi volumenindex
A számítások egy konkrét példa kapcsán (5.1. táblázat) a következőképpen végezhetők el:
5.1. táblázat - Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az1993–1994-es években
Eladott
mennyiség (db)
Ár
(Ft)
Eladás értéke (ezer Ft)
(aggregátumok)Televíziók
típusa 1993 1994 1993 1994 1993 1994
TS 3354TXT 43 39 43 900 49 900 1887,7 1946,1 1712,1 2145,7
TS 3353TXT 32 29 47 900 52 900 1532,8 1534,1 1389,1 1692,8
TS 5355TXT 40 37 55 900 62 900 2236,0 2327,3 2068,3 2516,0
Érték-, ár- és volumenindexek
211
TS 6354TXT 21 16 59 900 74 900 1257,9 1198,4 958,4 1572,9
Összesen – – – – 6914,4 7005,9 6127,9 7927,4
(Megjegyezzük, hogy a táblázat utolsó két oszlopában szereplő értékadatokra csak a későbbi számításoknál lesz szükség.)
5.2. táblázat - Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek
Egyedi indexek (%)Televíziók típusa Értékindex Volumenindex Árindex
TS 3354 TXT 103,1 90,7 113,7TS 3353 TXT 100,1 90,6 110,4TS 5355 TXT 104,1 92,5 112,5TS 6354 TXT 95,3 76,2 125,0
A fenti indexek tehát azt jelentik, hogy az egyes televíziótípusok forgalmának értéke, árai s az eladott mennyiségek miként alakultak a vizsgáltidőszakban. Pl. a TS 3354 TXT készülékből az eladás értéke 3,1%-kal emelkedett, ára 13,7%-kal nőtt, értékesített mennyisége pedig 9,3%-kalcsökkent 1994-ben 1993-hoz viszonyítva (5.2. táblázat).
Több termékre, termékcsoportra az átlagos érték-, ár- és volumenváltozást az indexszámok mutatják, melyek kiszámítása aggregátumokkal ésátlagolással történhet.
5.2.1. Indexszám számítása aggregát formában
Az értékindex (jele: ) a termékek vagy termékcsoportok meghatározott körére vonatkozó érték átlagos változását fejezi ki. Kiszámítása avizsgált termékek két időszakra vonatkozó összesített értékadataiból (aggregátumaiból) képzett hányadossal történhet.
Az értékindex aggregát formája:1
1 A továbbiakban már csak az „egyszerű” formát használjuk, tehát az összegzés határainak és az összegzési indexeknek a feltüntetését mellőzzük. Az összegzés mindig az egyidejűleg vizsgált ntermékféleségre értendő.
Érték-, ár- és volumenindexek
212
Az előző példa alapján kiszámított értékindex tehát azt mutatja, hogy a négyfajta teletextes televízió forgalmának értéke átlagosan 1,3%-kalemelkedett a vizsgált időszakban.
A képletből látható, hogy az értékváltozást két tényező befolyásolja:
– a termékek árváltozása és
– a termékek mennyiségváltozása.
Ezen hatások kimutatására szolgál a másik két index, az árindex és a volumenindex, melyek az értékindexből kiindulva is kiszámíthatóak.
Az árindex (jele: ) a különböző termékek, árucikkek, szolgáltatások árainak átlagos változását, az árszínvonal alakulását fejezi ki.
Az árindex is meghatározható két összesített értékadat (aggregátum) hányadosából. Miután azonban csak az árváltozást akarjuk mérni, amennyiségváltozás hatását ki kell szűrni. Ez oly módon történhet, hogy a két aggregátum csak az árakban tér el, a mennyiség mindkét időszakraazonos, tehát az csak a súlyszám szerepét tölti be. Attól függően, hogy a két vizsgált időszak közül melyik mennyiséget tekintjük állandónak (a
bázisidőszaki vagy a tárgyidőszaki adatokat), kétféle árindex számítása lehetséges:
bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A képletekben szereplő , illetve szorzatok összegzéseként kapott értékadatokat (ezek a valóságban nem léteznek) fiktív aggregátumoknaknevezzük.
Érték-, ár- és volumenindexek
213
A két árindex általában nem ad azonos eredményt az eltérő súlyszámok miatt. (A kétféle súlyozású index különbözőségének magyarázatáraa későbbiekben kerül sor.) Jelen példánkban is bázismennyiségekkel súlyozva 14,6, míg beszámolási súlyokkal számolva 14,3%-os átlagosáremelkedés mutatható ki a vizsgált időszakban.
A volumenindex (jele: ) különböző termékek volumenének átlagos változását mutatja meg.
Kiszámítása az árindexhez hasonlóan történhet, csak a hányadosban szereplő aggregátumok jelen esetben a mennyiségi adatokban különböznekegymástól. Az árak mint súlyszámok változatlanok. Attól függően, hogy a bázis- vagy a beszámolási időszak áradatait használjuk fel, a volumenindexis kétféle lehet:
bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A vizsgált cikkcsoportban tehát bázisárakkal súlyozva 11,4, beszámolási áradatokkal súlyozva pedig 11,6%-os átlagos volumencsökkenés mutathatóki 1993-ról 1994-re.
A szakirodalom a bázisidőszaki súlyozású ár- és volumenindexet Laspeyres-féle, a tárgyidőszaki súlyozású indexeket pedig Paasche-féleindexeknek nevezi, az alkotók nevéből kiindulva.
(Elvileg bármely más időszak árait is fel lehet használni a volumenindex kiszámításához, mint ahogy az árindex meghatározásához is többfélemennyiségi adat jöhet számításba. Közgazdasági megfontolásból és gyakorlati kivitelezhetőségi okokból azonban az előzőekben ismertetett bázis-és tárgyidőszaki súlyozás terjedt el.)
5.2.2. Az indexek átlagformáiAz előző fejezetben összetett viszonyszámokat súlyozott átlagként már számítottunk. Miután az indexszám összetett viszonyszám is egyben, ezt amódszert itt is alkalmazhatjuk. Az aggregát formát átalakíthatjuk átlagformára. Átlagolandó értékek a megfelelő egyedi indexek, a súlyok pedig azaggregát formában felírt törtek megfelelő értékadatai lesznek.
Az átlagformában való számítás a gyakorlatban azért jelentős, mert bizonyos esetekben nem a q és a p adatsorok, hanem értékadatok és egyediindexek állnak rendelkezésre.
Érték-, ár- és volumenindexek
214
Az értékindex átlagformái
Az értékindex ilyen formában történő kiszámítására a gyakorlatban ritkán kerül sor, miután a tényleges értékadatok (aggregátumok) többnyirerendelkezésre állnak, tehát az aggregát formában történő számolás általában megoldható. Esetenként azonban szükség lehet az átlagformábantörténő számításra is, melynek formái a következők:
számtani átlagforma
Az 1,3%-os átlagos értékváltozást oly módon számítottuk ki, hogy az egyes televíziótípusok egyedi értékindexeit az 1993-as, bázisforgalmakkalsúlyoztuk.
harmonikus átlagforma
Ez esetben az átlagos értékváltozás meghatározása az egyedi indexek 1994-es, beszámolási forgalmi adatokkal történő súlyozásával kerültkiszámításra.
Az árindex átlagformái
Az árindex meghatározása számtani átlaggal:
Laspeyres-féle árindex
Érték-, ár- és volumenindexek
215
Az átlagolandó értékek (egyedi árindexek) súlya a tényleges bázisidőszaki érték, azaz az index nevezőjében szereplő aggregátum .
Paasche-féle árindex
A fentiekben az egyedi árindexek súlya fiktív értékadat (tárgyidőszaki mennyiség bázisárakon).
Az árindex meghatározása harmonikus átlaggal:
Paasche-féle árindex
Ennél a formulánál a tárgyidőszaki tényleges forgalmi adatokkal történik az egyedi árindexek súlyozása.
Laspeyres-féle árindex
Érték-, ár- és volumenindexek
216
Itt a súly szerepét betöltő aggregátum nem valós adat, hanem a bázismennyiség tárgyidőszaki áron számított értéke.
A volumenindex átlagformái
Az árindexhez hasonlóan mindkét típusú volumenindex meghatározható átlagokkal is.
Volumenindex meghatározása számtani átlaggal:
Laspeyres-féle volumenindex
A számtani átlaggal számolt, bázissúlyozású volumenindexnél ez esetben az egyedi volumenindexek súlyszámai a bázisidőszaki, 1993-as forgalmiadatok.
Paasche-féle volumenindex
Ez esetben az egyedi volumenindexeket fiktív forgalomadatokkal (bázismennyiség beszámolási árakon) súlyozzuk.
Érték-, ár- és volumenindexek
217
Volumenindex meghatározása harmonikus átlaggal:
Paasche-féle volumenindex
Laspeyres-féle volumenindex
Természetesen az indexek értéke nem függ attól, hogy aggregát vagy átlagformában kerültek kiszámításra, tehát mint példánkból is kiderült, azonoseredményt ad mindkét számítási mód.
Az indexek kiszámításának lehetséges módozatait a következő oldalon, az 5.3. táblázatban foglaljuk össze.
5.3. táblázat - Az indexek kiszámítási képleteinek áttekintő táblázataÁtlagformák
Index neve Definíciója Egyedi indexek súlyozott számtani átlagaEgyedi indexek súlyozott harmonikus
átlagaKéplet Súlyok Képlet Súlyok
Értékindex, Bázisidőszakaggregátuma
Tárgy-(beszámolási)időszak
Érték-, ár- és volumenindexek
218
aggregátumaÁrindex
Bázisidőszaki súlyozású,
(Laspeyres-féle)
Bázisidőszakaggregátuma
Fiktív
aggregátum
Árindex
Tárgyidőszaki súlyozású,
(Paasche-féle)
Fiktív
aggregátum
Tárgy-(beszámolási)időszak
aggregátuma
Volumenindex
Bázisidőszaki súlyozású,
(Laspeyres-féle)
Bázis-
időszaki
aggregátum
Fiktív
aggregátum
Volumenindex
Tárgyidőszaki súlyozású,
(Paasche-féle)
Fiktív
aggregátum
Tárgyidőszak
aggregátuma
5.3. Az indexek súlyozásaAz indexszámításban a súly fogalmát kétféle értelemben használjuk. A szó egyik értelme az aggregát formával, a másik pedig az átlagformákkal
kapcsolatos. Az aggregát formánál attól függően, hogy az árak vagy a mennyiség változását kívántuk kimutatni, az a q, az a p adat vált
súlyszámmá. Az átlagformáknál a súly mindig valamely aggregátum értékadat.
A volumenindexnél, csakúgy, mint az árindexnél valós és fiktív (nem azonos időszakhoz tartozó mennyiség- és áradatok szorzatából számított –
illetve –) értékadatokkal is történhet a súlyozás. (Meg kell jegyezni, hogy a gyakorlatban a tényleges adatokkal történő súlyozásnak vanjelentősége, mert azok közvetlenül rendelkezésre állnak, míg a fiktív értékadatok csak számítással határozhatók meg.)
Már utaltunk rá s a számszaki példa is bizonyította, hogy a bázis- és beszámolási súlyozású indexek értékei nem egyeznek meg egymással.Az átlagolandó értékek mindkét esetben azonosak, a különbözőség egyértelműen a súlyozás eltéréséből fakad, abból, hogy a súlyarányok
Érték-, ár- és volumenindexek
219
megváltoznak. Ennek oka, hogy az egyedi volumen- és árindexek között sztochasztikus kapcsolat – többnyire negatív korreláció – található. Ez aztjelenti, hogy általában egy-egy termék áremelkedése az adott termék eladott mennyiségének csökkenését vonja maga után, jelentősebb árnövekedés
pedig erőteljesebb mennyiség-visszaesést eredményez. Tehát nagyobb értékhez kisebb érték tartozik és viszont, s ennek következtében
általában azon termékek mennyiségi aránya nő, melyeknél s azoké csökken, ahol Ez azt vonja maga után, hogy a bázissúlyozású indexszámszerű értéke magasabb, mint a tárgyidőszaki súlyozásúé:
(Pozitív korreláció esetén természetesen a nagyságrendi reláció fordított.)
Példánkban is nagyobb értékűek a bázissúlyozású indexek, mint a beszámolási súlyozásúak (114,6% és 114,3%, illetve 88,6% és 88,4%). A kétfélesúlyozású index értékének eltérése azonban kicsi, mert bár a negatív korreláció egyértelműen megfigyelhető, az egyedi indexek szóródása csaknagyon kis mértékű.
Bortkiewicz mutatta ki, hogy a bázis- és tárgyidőszaki súlyozású indexek számszerű értékének eltérése három tényezővel magyarázható:
– az egyedi árindexek relatív szórásával ( ),
– az egyedi volumenindexek relatív szórásával ( ) és
– a kétféle egyedi index közötti sztochasztikus kapcsolatot mérő lineáris korrelációs együtthatóval2 .
A kétféle súlyozású index hányadosa közötti összefüggés a Bortkiewicz-tétel szerint:
(A kétféle súlyozású index értéke tehát csak akkor egyezik meg, ha az egyedi ár- vagy az egyedi volumenindexek nem szóródnak, illetve az egyediár- és volumenalakulás között nincsen korreláció.)
Már szó volt róla, hogy mindkét index elfogadható, egyaránt jól jellemzi az ár-, illetve a volumenváltozást, bár mindkettő meghatározott feltételezésselél. (Tárgyidőszakban is bázisidőszaki árak, vagy bázisidőszakban is tárgyidőszaki árak.) Abban az esetben, ha a két index értéke közötti eltérésnem nagymértékű, elegendő csak az egyik alkalmazása. Nagyobb különbség esetén azonban célszerű a két alapforma eredményét átlagolni. Azátlagolással ún. keresztezett indexformulák képezhetők. A gyakorlatban legtöbbször a Fisher-féle keresztezett formula kerül kiszámításra a kétfélesúlyozású index mértani átlagaként:
22 A lineáris korrelációs együttható két mennyiségi ismérv közötti kapcsolat szorosságát jellemzi. Határai: Tankönyvünk második kötetében foglalkozunk vele.
Érték-, ár- és volumenindexek
220
Fisher-féle indexek
Árindex
Volumenindex
Különböző indexformulák használhatók tehát, a közülük való választást az ún. indexpróbákkal lehet megalapozottá tenni. Az indexpróbák azindexekkel szemben támasztott követelményeket fogalmazzák meg, melyek alapján az egyes mutatószámok értékelhetőek. A legfontosabbindexpróbák a következők:
Összemérhetőségi próba: az index értéke legyen független a volumenadatok mértékegységétől.
Időpróba: ugyanazon indexformulával számított index értéke az időszakok felcserélése mellett reciproka legyen az index eredeti értékének.
Tényezőpróba: az ugyanazon típusú formulával számított volumen- és árindex szorzata legyen egyenlő az értékindexszel.
Arányossági (átlag-) próba: az index legyen átlaga az egyedi indexeknek.
Láncpróba: a valamely formulával számított láncindexek szorzata legyen egyenlő az ugyanazon formulával számítható bázisindexszel.
(Ez a próba a később tárgyalásra kerülő indexsorok ismeretében válik érthetővé.)
A Fisher-index tekinthető az egyik legjobb formulának, mert az tesz leginkább eleget az indexekkel szemben támasztott követelményeknek (l. akövetkező pontot); az első négynek teljes mértékben, az utolsónak, a láncpróbának jó közelítéssel felel meg.
A Fisher-index mellett más keresztezett indexformulák is használatosak, így pl. az ún. Marshall–Edgeworth–Bowley-féle formulák:
Érték-, ár- és volumenindexek
221
Ez esetben nem az indexek eredményeit, hanem a súlyszámokat átlagolják.
5.4. Összefüggések az indexszámításban5.4.1. Az indexszámok közötti összefüggések
Az alapvető összefüggés következtében, mely szerint az ár (p) és a mennyiség (q) szorzata az értéket adja, megállapítható, hogy az egyedi indexekközött hasonló kapcsolat található. Tehát:
Példánkban a TS 3354 TXT típusú tv-készülék esetében:
Ez az összefüggés nemcsak az egyes termékeknél, hanem a vizsgált termékcsoportok körében is fennáll. Az értékindex egyenlő az ár- ésvolumenindex szorzatával, ha azok eltérő súlyozásúak. A Fisher-féle indexnél ez a feltétel nem szerepel, nincs is értelme.
(kerekítésből adódik az eltérés).
A vizsgált termékcsoportban 1993-ról 1994-re az átlagos, hozzávetőleges 14%-os árnövekedés és a kb. 12%-os volumencsökkenés hatására azárbevétel 1,3%-kal emelkedett.
Érték-, ár- és volumenindexek
222
Az indexszámok közötti összefüggéseknek a gyakorlatban nagy jelentőségük van, mert ezek felhasználásával két index ismeretében a harmadikelőállítható. Általában a volumenindexet számítják ki ilyen közvetett módszerrel. Ennek oka, hogy az értékindex meghatározása nem ütköziknehézségbe, hiszen a folyó áras forgalmi adatok teljes körűen rendelkezésre állnak, s az árindex kiszámítása is megoldható, bár többnyirecsak reprezentatív megfigyeléssel nyert adatokból. (Elvben az átlagos volumenváltozás is megállapítható reprezentatív felmérés eredményeként,azonban csak nagyobb hibával és olyan körülményes módon, annyi többletmunkával, hogy a gyakorlatban ezért ezt nem alkalmazzák.) Az átlagosvolumenváltozás meghatározása tehát a legegyszerűbben az alábbi módon történhet:
A példában szereplő adatok szerint:
Az árindexszel való osztás az árváltozás kiszűrését jelenti. A folyó áras aggregátum árindexszel történő osztását deflálásnak hívják, mely a gazdaságiszámításoknál gyakran alkalmazott eljárás. (Elvben csak a tárgyidőszaki súlyozású árindex töltheti be a deflátor szerepét, gyakorlatilag azonbanmás, az árszínvonal változását jól jellemző index is használható.)
5.4.2. Az aggregátumok közötti összefüggésekAz aggregátumok hányadosaiból az indexeket lehetett meghatározni. Nemcsak a hányadosok, hanem az aggregátumok különbségeinek vizsgálata
is jól hasznosítható a közgazdasági elemzésben. Ily módon az értékváltozás ( ) abszolút számokkal jellemezhető, s kimutatható, hogy az árak ( ),
illetve a mennyiség változása ( ) erre milyen hatással voltak. Az aggregátumokból a következő különbségek képezhetőek:
A közöttük levő összefüggés :
Érték-, ár- és volumenindexek
223
A volumenváltozás és az árváltozás hatásának számszerűsítése a kétféle felbontással általában eltér egymástól. (Ez az alkalmazott
indexformulák különbözőségével magyarázható.) A a mennyiségváltozásból fakadó bevételváltozást mutatja, míg a az árváltozásból adódó
bevételmódosulást jelzi. A pozitív előjel esetén az árváltozás okozta lakossági többletkiadást, negatív előjel esetén megtakarítást adja.
Az előző példa alapján:
1993-ról 1994-re az árbevétel 91,5 ezer Ft-tal emelkedett. A volumencsökkenés 786,5 ezer Ft bevételkiesést okozott, míg az áremelkedés 878 ezer Ftárbevétel-növekedést idézett elő. Az árnövekedésből eredő lakossági többletkiadás 878 ezer Ft, tehát az 1994-ben megvásárolt televíziómennyiség1993-as árakon 878 ezer Ft-tal kevesebbe került volna.
Az indexek és az aggregátumok összefüggését az 5.1. ábra szemlélteti:
Érték-, ár- és volumenindexek
224
5.1. ábra -
5.4.3. Csoportosított sokaságra számított indexekGyakran előfordul, hogy az átlagos érték-, ár- és volumenváltozást olyan áruk körére kell meghatározni, melyeknél a termékek valamilyenlényeges tulajdonság szerinti csoportosítása fontos lehet. Ez esetben az indexekből levonható helyes következtetésekhez szükséges az egyesárucsoportok elkülönült vizsgálata is, tehát az érték-, ár-, volumenindex árucsoportonkénti kiszámítása. Ekkor az egyes csoportokra kapott indexeket
részindexeknek , az összes termékre vonatkozó indexet főindexnek nevezik. A rész- és főindexek között ugyanolyan összefüggés van, minta részátlagok és a főátlag vagy a részviszonyszámok és az összetett viszonyszám között. A főindex kiszámítása tehát többféle módon is történhet:
1. Az azonos jellegű aggregátumok (részaggregátumok) összegeinek hányadosaként:
Érték-, ár- és volumenindexek
225
2. A részindexek részaggregátumokkal súlyozott átlagaként:
– súlyozott számtani átlagformában
– súlyozott harmonikus átlagformában
ahol:
a j-edik termék érték-, ár- vagy volumenindexe,
a vizsgált részindex számlálójában szereplő aggregátum,
a nevezőben található aggregátum.
Az előző feladatoknál az eladott Videoton teletextes tv-készülékek érték-, ár- és volumenváltozását számoltuk ki. Az ott kapott eredményekrészindexként kezelhetők abban az esetben, ha valamennyi, az üzlet által forgalmazott Videoton tv-készülékre vonatkozó átlagos változást vizsgáljuk,amely ez esetben főindexek segítségével történik (5.4. táblázat).
5.4. táblázat - A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeketforgalmazó üzletben
Árucsoport Forgalom (ezer Ft) Részindexek (%)
Érték-, ár- és volumenindexek
226
1993-ban 1994-ben
1994-ben
az 1993-as
árakon
Teletextes
Videoton készülék6 914,4 7 002,9 6 123,9 101,3 114,3 88,6
Nem teletextes
Videoton készülék6 361,1 5 591,1 4 945,1 87,9 113,1 77,7
Összesen: 13 275,5 12 594,0 11 069,0 – – –
A Videoton televíziók forgalmának értéke tehát összességében 5,1%-kal csökkent annak következtében, hogy bár a teletextes készülékek forgalmaátlagosan 1,3%-kal nőtt, a nem teletextes televíziók értékesítése átlagosan 12,1%-kal esett vissza. A valamivel nagyobb részarányt képviselőteletextes tv-k forgalomalakulása tehát erőteljesebb hatással volt az átlagra.
Az átlagos árváltozás a vizsgált termékcsoportnál a következőképpen alakult:
Érték-, ár- és volumenindexek
227
A két termékcsoport együttes volumenváltozása:
A forgalom 5,1%-os csökkenése tehát a két termékcsoport árainak átlagos 13,8%-os emelkedése és az eladott mennyiségük 16,6%-os visszaesésemiatt következett be.
Figyeljük meg, hogy a megfelelő főindexek az árucsoportokra számított részindexek közé esnek.
5.5. Az indexszámok gyakorlati alkalmazásaAz indexszámokat a gazdasági elemzésben nagyon sok területen alkalmazzák. Az értékindex segítségével elemezhető pl. a gazdasági egységektermelési értékének, árbevételének, forgalmának változása, a felhasznált anyagok, energia stb. értékének változása, az export és import értékénekalakulása, a fogyasztás változása stb.
Az árindexek alkalmazási területe is igen széles körű. A termelés, forgalom, fogyasztás elemzésében egyaránt fontos szerepet játszik. Az alábbiakbanfelhasználásának csak néhány lényeges aspektusa kerül kiemelésre.
A fogyasztói árindex az infláció általános mérőszáma és a gazdaság állapotának fontos jellemzője. A lakosság által vásárolt fogyasztási cikkek,szolgáltatások árainak átlagos változását fejezi ki, így fontos szerepe van az életszínvonal mérésében. Meghatározása hazánkban olyan módontörténik, hogy az ún. fogyasztói kosárba került mintegy 1800 termék, szolgáltatás „reprezentáns” árait figyelik havonta több alkalommal, s ezenárfeljegyzések számtani átlagát súlyozzák a háztartásoktól begyűjtött fogyasztási szerkezetadatokkal. A reprezentánsok egyedi árindexe a tárgyhaviés bázishavi átlagárak hányadosa. A fogyasztói árindex a reprezentások egyedi árindexeinek súlyozott átlaga, mégpedig bázissúlyozású, évenbelül változatlan súlyozással. A magyar gyakorlatban a Laspeyres-típusú árindexet számolják, mert a lakossági adatszolgáltatási rendszer 12ezer háztartást számláló reprezentatív mintájából nyert fogyasztási szerkezet aktuális adatai (a súlyszámok) csak bizonyos időeltolódással állnakrendelkezésre. A fogyasztói kosár árindexén kívül a termékek meghatározott körére is kiszámolják az árváltozást.
Az árindex jelenleg három fokozatú csoportosításban készül:
– a termékek és szolgáltatások részletes csoportjai (ezek száma 160),
– összegzőcsoportok a részletes csoportokból (számuk 40),
Érték-, ár- és volumenindexek
228
– főcsoportok, melyek az összegzőcsoportokból épülnek fel (számuk 8–10).
A teljes lakossági fogyasztásra vonatkozó árindexen kívül az egyes rétegekre külön is kiszámítják az átlagos árváltozás mértékét.
Az árindexeket havonta közzéteszik, jelezve az előző év hasonló hónapjához, az előző év decemberéhez és a közvetlenül megelőző hónaphozviszonyított áralakulást. Az éves árindexek a tárgyévi átlagos árakat veszik alapul, s kétféle viszonyítással, bázis- és láncárindexekként ismeghatározásra kerülnek.
Az árindexet az indexáláshoz is felhasználják, azaz a különféle jellegű ki- vagy befizetési kötelezettségeket (pl. bérek, biztosítási díj) az inflációhozigazítják.
Az árstatisztikában lényeges az árarányok változásának vizsgálata is. Ez szintén az árindexek segítségével történik. A különböző termékekárindexeinek összehasonlításával határozható meg az árolló.Azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonosvolumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe.
Az agrárolló a mezőgazdasági termékek értékesítési árindexének és a mezőgazdaságban felhasznált iparcikkek beszerzési árindexének hányadosa.
1993-ban Magyarországon például a mezőgazdasági termelői felvásárlási árak 18,5%-kal haladták meg az előző évit, míg a termelésben felhasználtiparcikkek árai 20%-kal emelkedtek, tehát a két árindex hányadosából kiszámítható az agrárolló:
Ez azt jelenti, hogy 1993-ban 1,3%-kal magasabb volumenű mezőgazdasági termék eladása szükséges annyi bevétel eléréséhez, amely az 1992-es szinttel azonos volumenű ipari termékek megvásárlását lehetővé teszi.
Az árollók másik jelentős alkalmazási területeként az ún. cserearány-mutatókat említhetjük. Ezek a gazdálkodó szervezetek által eladott termékekárindexét viszonyítják a vásárolt termékek árindexéhez. E mutatók értéke akkor kedvező, ha 100% felett van. A külkereskedelmi cserearány mutatójaaz ún. cserearányindex (terms of trade), az adott ország által exportált és az általa importált termékek árindexeinek hányadosa. A mutató értékeazt fejezi ki, hogy az azonos volumenű export az importtermékek fogyasztásának milyen változását teszi lehetővé.
Hazánkban 1993-ban az importált termékek árai 9,4%-kal haladták meg az előző évi árakat, míg az exportált cikkeknél 11,9%-os áremelkedéskövetkezett be. Így a cserearány-mutató a következőképpen alakult:
1993-ban 2,3%-kal nagyobb volumenű terméket importálhattunk volna, ha az exportból származó bevételt csak importra fordítjuk, tehát javult acserearány.
Érték-, ár- és volumenindexek
229
A volumenindexeket, mint már ismert, többnyire az árindexek segítségével számítják ki. A hagyományos felhasználási területeken túl pl. a fogyasztásreálértékének vagy a reálkereseteknek az alakulását is mérhetik vele, abból fakadóan, hogy az értékváltozásból az árváltozás hatását kiszűrve csaka volumenváltozás marad.
5.6. IndexsorokAz eddigiek során az indexszámok csak két időszak adatainak az összehasonlítására szolgáltak. A dinamikus viszonyszámokhoz hasonlóan azindexeket szintén ki lehet számítani hosszabb időszakra is. A kettőnél több időszakra vonatkozó indexek sorozatát indexsornak hívják.
Az indexsoroknak többféle fajtája különböztethető meg az alábbi szempontok alapján:
a) tartalma szerint (tehát, hogy milyen jelenség változását fejezik ki)
– értékindexsor,
– árindexsor,
– volumenindexsor;
b) a viszonyítás rendje szerint (a dinamikus viszonyszámokhoz hasonlóan)
– bázisindexsor;
– láncindexsor;
c) a súlyozás módja szerint az ár- és volumenindexsoroknál
– állandó súlyozású indexsor,
– változó súlyozású indexsor.
Az előzőek alapján tehát különböző indexsorokat lehet felírni, melyek konkrét kiszámítási módját néhány gyümölcs felvásárlására vonatkozó adatokalapján mutatjuk be (5.5. táblázat).
5.5. táblázat - Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években
Felvásárlás mennyisége
(1000 tonna)
Termelői felvásárlási átlagárak
(1000 Ft/tonna)Megne-
vezés1990 1991 1992 1993 1990 1991 1992 1993
Érték-, ár- és volumenindexek
230
Alma
Málna
Meggy
Szilva
462
15
22
18
268
10
26
18
277
12
41
17
237
6
22
7
10,4
33,3
28,5
11,3
13,8
35,3
56,6
22,1
10,9
76,7
29,0
12,3
8,8
142,9
21,5
14,2
A többféle indexsor meghatározásához célszerű egy összes lehetséges értékadatot ( ) tartalmazó táblát összeállítani oly módon, hogy azegyes évek volumenadatait megszorozzuk valamennyi év áradataival. Így minden, összegzésre alkalmas aggregátum rendelkezésre áll, amely azindexsorok kiszámításához szükséges (5.6. táblázat).
5.6. táblázat - Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva
1990 1991 1992 1993A felvásárlás
évi árakon számítva (ezer Ft)1990
1991
1992
1993
6134,7
4064,6
4641,0
3370,7
8548,1
5920,8
6942,5
4882,3
7045,7
4663,6
5337,8
3767,6
6937,7
4602,0
5275,3
3515,4
A táblázat adataiból néhány indexsor kiszámítását mutatjuk be.
Bázis-értékindexsor
ahol az idősor elemei: 0, 1, 2, ..., n;
Érték-, ár- és volumenindexek
231
lánc-értékindexsor
Figyeljük meg, hogy az értékindexekhez a táblázat „átlójában” szereplő értékadatokat használtuk fel.
Állandó súlyozású bázis-volumenindexsor (állandó súly a 0 időszak ára)
Érték-, ár- és volumenindexek
232
állandó súlyozású lánc-árindexsor (állandó súly a 0 időszak mennyisége)
változó súlyozású bázis-árindexsor
Érték-, ár- és volumenindexek
233
változó súlyozású lánc-volumenindexsor
Figyeljük meg, hogy a volumenindexsor egy-egy elemét mindig azonos oszlopban szereplő (tehát azonos árakon számított) értékadatokbólszámítottuk. Az árindexek számításánál pedig a táblázat vízszintes sorában szereplő (azonos felvásárlási mennyiségre vonatkozó) értékadatokalapján számítottuk ki az indexsor egy-egy elemét.
Az állandó súlyozású indexsornál tehát a súlyszám az indexsor minden egyes tagjánál azonos, míg változó súlyozásnál a súlyadatok indexenkéntkülönbözőek. Attól függően, hogy mely időszak ár-, illetve volumenadata állandó, lehet az indexsor Laspeyres- vagy Paasche-típusúnak megfelelő.Egyébként az indexsoroknál nem lehet egyértelmű Laspeyres- és Paasche-formuláról beszélni, csak az elvek követése szempontjából történhet abesorolás. A változó súlyozású indexsoroknál az egyes tagok kiszámításánál a kétféle formula pontosan használható. Az előző példában a változósúlyozású bázis-árindexsor elemei Paasche-típusúak, a volumenindexsor tagjai Laspeyres-típusúak. (Természetesen a súlyozás kérdése csak azár- és a volumenindexsoroknál merül fel.) A kétféle súlyozású indexsor számszerű eredményei eltérnek egymástól, de tartalmuk, mondanivalójuklényegileg megegyezik.
A különböző indexsorok más-más előnyökkel és hátrányokkal rendelkeznek.
Az állandó súlyozású indexsor számítása egyszerűbb, s amennyiben a legelső időszak mennyiségi, illetve áradata a súlyszám, az indexsor egymástkövető tagjait folyamatosan meg lehet határozni. Problémát a súlyok elavulása okoz, az, hogy a súlyarányok eltolódnak a tényleges arányoktól.Ennek oka, hogy hosszabb időszak alatt az első időszak arányai nagymértékben megváltozhatnak, és a termékcserélődés következtében jelentősenszűkülhet az összehasonlítható termékek köre is.
Érték-, ár- és volumenindexek
234
A változó súlyozású indexsor számítása bonyolultabb, de a súlyarányok jól követik a változásokat. A változó súlyozást elsősorban a láncindexeknélhasználják.
Az állandó és a változó súlyozás előnyeinek összekapcsolására a gyakorlatban a kétféle súlyozást általában kombináltan alkalmazzák, ún.szakaszosan állandó súlyú indexsort számolnak. Ez azt jelenti, hogy egy bizonyos időszakra (általában 5–10 év) a súlyadatokat rögzítik, majd azidőszak eltelte után megváltoztatják, felfrissítik azokat. A különböző periódusok indexeit pedig láncszerűen kapcsolják össze.
5.6.1. Az indexsorok közötti összefüggésekAz indexsorok rendszerében több összefüggés írható fel, melyek közül az alábbiakban a két legfontosabb került kiemelésre:
– az érték-, ár- és volumenindexsor közötti összefüggés és a
– bázis- és láncindexsorok közötti összefüggés.
1. Az érték-, ár-, volumenindexsor összefüggése szerint az ár- és volumenindexsor azonos időszakra vonatkozó tagjainak szorzata egyenlő az adottidőszak értékindexével. Ez az összefüggés azonban csak meghatározott feltételek mellett érvényesül:
a) változó súlyozású láncindexek között, ha az egyik indexsor Laspeyres-, a másik indexsor pedig Paasche-formulával került kiszámításra:
b) bázisindexsorok között, ha az egyik indexsor bázisidőszaki állandó súlyozású, a másik pedig a mindenkori tárgyidőszaki változó súlyozásúindexsor:
Érték-, ár- és volumenindexek
235
c) Fisher-formulával számított indexsorok között (bázis- és láncindexsoroknál egyaránt).
2. A bázis- és láncindexek összefüggése alapján a láncindexek szorzata egyenlő a bázisindexszel, illetve a két szomszédos bázisindex hányadosábóla láncindex meghatározható.
Az értékindexsorok között ez az összefüggés mindenkor fennáll, az ár- és volumenindexsoroknál azonban csak az állandó súlyozású indexsorokesetében.
Állandó súlyozású árindexek összefüggése:
(pl. ha az n-edik időszak mennyiségeivel számítjuk ki mindegyik láncindexet)
Mivel a változó súlyozású indexsor tartalmi mondanivalóját tekintve megegyezik az állandó súlyozásúval, a fenti művelet – a képletszerű összefüggésfennállása nélkül – a változó súlyozású indexsoroknál is elvégezhető.
Általában is megállapítható, hogy mivel a súlyozás módja nem érinti az index alapvető tartalmát, az indexekkel minden olyan művelet elvégezhető,amely a megfelelő egyedi indexek között logikus.
5.7. Területi indexekAz indexszámok, mint ahogyan arról szó volt, összehasonlító viszonyszámok. Összehasonlításra azonban nemcsak időben, hanem térben is sorkerülhet. A területi összehasonlítás eredményeként kapott indexek a területi indexek.
A területi volumenindex azt fejezi ki, hogy az összehasonlítandó területeken a termelés, értékesítés mennyisége hányszorosa, hányadrésze az összehasonlítás alapjául szolgáló terület termelésének, értékesítésének.
A területi árindex azt mutatja meg, hogy az egyik területen kialakult árszínvonal milyen arányban áll a másik terület árszínvonalával.
A területi értékindexet nem értelmezzük, az csak a területi volumenindex és területi árindex közötti összekötő kapocsként szerepel. Az előzőekbentárgyalt bármely indexformula területi indexként is értelmezhető, a különbség csak annyi, hogy az összehasonlítandó időszakok helyett két területi
Érték-, ár- és volumenindexek
236
egység adatainak viszonyítására kerül sor. Az eddigi jelölésben a 0, 1 (bázis-, tárgyidőszak) vagy más értelmet kap (0, 1 terület), vagy megváltozikpl. A-ra, B-re, az adott területek adatainak azonosítása céljából. A súlyszámok tehát A vagy B terület mennyiség-, illetve áradatai lehetnek, a bázis-vagy beszámolási súlyok helyett. A másik lényeges különbség a területiindex-számítás és az időbeli összehasonlítás között az, hogy míg az egyesidőszakok adatai a viszonyítás során nem felcserélhetőek – mindig a későbbit hasonlítjuk a korábbihoz –, addig a területi indexeknél a sorrend nemkötött. Bármelyik területi egység adatait viszonyíthatjuk a másikhoz és viszont. Ebből következik, hogy A/B relációjú összehasonlítás eredményereciprokviszonyban kell legyen a B/A relációjú összehasonlítás eredményével. Ez az ún. felcserélési próba, amely a már ismert időpróbának felelmeg. Másik követelmény a területi indexekkel szemben a tranzitivitás követelménye, ami az időszakok összehasonlítására használt indexeknél aláncpróba volt. Ez azt jelenti, hogy két terület közvetlen összehasonlítása a közvetett összehasonlítással azonos eredményt kell, hogy adjon. (AzazA és C területek közvetlen viszonyításánál az A/C index a B területen keresztüli közvetett összehasonlításnál az A/B és a B/C indexek szorzatávalmegegyező érték legyen.)
A különböző súlyozású indexformulák eredményei között lényegesen nagyobb eltérés lehet, mint az időbeli összehasonlításnál, ezért különösenindokolt a Fisher-féle index használata. Az összehasonlítandó területeket A-val és B-vel jelölve
a területi árindex Fisher-formája :
a területi volumenindex Fisher-formája:
A területi indexek kiszámításának módját az alábbi példán mutatjuk be (5.7. táblázat).
5.7. táblázat - Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában
A város B város
Termék
megnevezése
felhozatal
mennyisége
(kg)
átlagár
(Ft/kg)
felhozatal
mennyisége
(kg)
átlagár
(Ft/kg)
Burgonya
Sárgarépa
150 000
12 000
85,0
165,0
70 000
6 500
100,0
150,0
Érték-, ár- és volumenindexek
237
Vöröshagyma
Bab (száraz)
20 000
7 000
42,0
320,0
12 000
5 000
45,0
300,0
A két város felhozatalának összértéke mindkét város árain számolva
(ezer Ft-ban)
A felhozatal mennyiségeVárosok A város B város
árain számítvaA város
B város
17 810,0
9 126,5
19 800,0
10 015,0
A táblázat adatai alapján a területi árindex tehát:
A vizsgált termékek árszínvonala a Fisher-index szerint 9,5%-kal volt alacsonyabb A városban B városhoz viszonyítva.
A területi volumenindexek a példa alapján:
Érték-, ár- és volumenindexek
238
A négy vizsgált termék piaci felhozatalának mennyisége az A városba a Fisher-index alapján átlagosan 96,4%-kal haladta meg B város felhozatalánakmennyiségét.
A területi indexnél – mint arról szó volt – a viszonyítási alap és a viszonyítás tárgya felcserélhetőek, ezért vizsgálható jelen esetben az is, hogy Bváros piaci felhozatala A városhoz viszonyítva miként alakult. Pl.:
B város piaci felhozatalának árai a vizsgált cikkeknél tehát átlagosan 10,4%-kal voltak magasabbak A városhoz képest (a volumenalakulás ebbena relációban hasonlóképpen vizsgálható).
Miután a kétféle viszonyítású indexek egymással reciprokviszonyban állnak, a számítás a következő módon is elvégezhető, pl. az árindexek esetében:
A területi indexek legfontosabb alkalmazási területe a nemzetközi összehasonlítás. Ez esetben a területi indexeknek olyan sajátossága is jelentkezik,amely a különböző országok eltérő valutaegységéből fakad. Annak következtében, hogy az árindex számlálójának és nevezőjének nem azonosa mértékegysége, az eredmény nem fejezhető ki százalékos formában. Az árindex ilyenkor a két ország valutái vásárlóerejének arányát fejezi kia vizsgált termékek vonatkozásában. Azt mutatja tehát, hogy egy adott (az összehasonlítás alapjául szolgáló) ország egységnyi valutája a másik(összehasonlítandó) ország hány valutájával egyenlő az összehasonlított termékek körében. A volumenindex a különböző országok gazdaságifejlettségének, a lakosság életszínvonalának összehasonlítását is szolgálhatja. Kimutatható pl., hogy az egy főre jutó fogyasztás volumene mikéntalakul két ország vonatkozásában.
Amennyiben nem két, hanem több terület összehasonlítását végezzük el, az indexsoroknál leírt módon járhatunk el.
5.8. Gyakorlófeladatok1. A Magyar Statisztikai Évkönyvből (KSH, 1994) valók az alábbi információk:
– A magyar háztartások összes élelmiszer-fogyasztása 1991-ben 374 Mrd Ft, 1992-ben pedig 452 Mrd Ft volt folyó áron számolva.
Érték-, ár- és volumenindexek
239
– Az élelmiszerek fogyasztói ára 1992-ről 1993-ra Magyarországon 29,2%-kal, Ausztriában pedig 2,9%-kal nőtt.
– A nyerskávé-behozatal 1993-ban 3487 millió Ft volt.
– Behozatali forgalmunk folyó áron számítva 1992-ről 1993-ra 32,3%-kal nőtt, kiviteli forgalmunk pedig 2,8%-kal csökkent.
– 1992-ről 1993-ra az importált termékek volumene átlagosan 20,9%-kal nőtt, az exportált termékekre vonatkozóan pedig átlagosan 13,1%-oscsökkenés volt tapasztalható.
– A külkereskedelmi forgalom egyenlege – folyó áron számítva – 1993-ban –342 576 millió Ft volt.
– 1990-ben Magyarországon 427 ezer db színes tv-t gyártottak. 1993-ra a gyártott mennyiség 45,1%-ra csökkent.
Feladat:
Értelmezzük az információkat!
2. Egy piaci árus feljegyezte néhány termékének fontosabb értékesítési adatait:
Eladott mennyiség Egységár (Ft/kg)
Termék Mérték-egység márciusban áprilisban márciusban áprilisban
Alma
Narancs
Burgonya
Tojás
kg
kg
kg
db
150
200
60
200
130
240
80
300
100
130
70
10*
120
150
85
12*
*Ft/db
Feladat:
a) Mennyi volt az árus bevétele az egyes termékekből, valamint összesen? Vizsgáljuk meg a változást is!
b) Hogyan változott márciusról áprilisra:
– az értékesítés volumene (termékenként),
Érték-, ár- és volumenindexek
240
– a termékek ára?
c) Mennyi volt a négy termék árszínvonal-változása? A kapott eredményt vessük össze a termékenkénti árváltozásokkal!
d) Számítsuk ki az együttes volumenváltozást
– az alapadatokból,
– a már kiszámított indexekből,
– az egyedi volumenindexek alapján!
A számításokat Laspeyres-formula szerint végezzük el!
e) Hány Ft-tal volt több az árus bevétele:
– az árváltozások miatt,
– az értékesített mennyiségek változása miatt?
3. A 4.5. Gyakorlófeladatok 11. példájához kapcsolódva számítsuk ki:
a) a forgalom értékének változását, és
b) elemezzük az erre ható tényezőket!
4. Egy háztartási gépeket is forgalmazó vállalkozás értékesítésére vonatkozó adatok:
Értékesítettmennyiség (db) Árbevétel (ezer Ft)
Árucikk1993 1994 1993 1994
Hűtőszekrény
Hűtő-fagyasztó
Fagyasztószekrény
Fagyasztóláda
1400
300
500
700
1800
400
700
500
46 200
12 000
20 000
26 600
68 400
18 000
33 600
25 000
Feladat:
Érték-, ár- és volumenindexek
241
a) Vizsgáljuk az értékesítési forgalom alakulását árucikkenként és együttesen!
b) Számítsuk ki, hogyan változott az értékesítés mennyisége árucikkenként külön-külön és a felsorolt árucikkekre átlagosan!
c) Mutassuk ki az árszínvonal-változást és az ebből eredő forgalomnövekedést!
d) Melyik árucikknek nőtt legnagyobb mértékben az ára 1993-ról 1994-re?
5. Egy kisvállalkozás belkereskedelmi tevékenységére vonatkozó adatok:
Az értékesített
mennyiség
A folyó áras
árbevételÁrucsoport
Árbevétel
1990-ben(ezer Ft) 1995-ben az 1990. évi %-ában
A
B
C
D
3 000
8 000
1 000
10 000
140,0
120,0
150,0
95,0
154,0
126,0
150,0
114,0Összesen 22 000 ... ...
Feladat:
a) Számítsuk ki a négy árucsoportra vonatkozóan az érték-, ár- és volumenindexet!
b) Számítsuk ki, hogy hány millió Ft-tal nőtt az árbevétel:
– az árváltozás miatt,
– az értékesített mennyiségek változása miatt!
c) Határozzuk meg az ellentétes súlyozású ár- és volumenindexeket! Magyarázzuk meg a megfelelő indexek eltérését!
6. A háztartások fogyasztására vonatkozó adatok:
Fogyasztási javakÖsszes fogyasztás
folyó áron Mrd Ft-ban Volumenindex*
Érték-, ár- és volumenindexek
242
1991 1992 (%)
Élelmiszerek
Italok, kávé, tea
Dohányáru
Ruházkodás
374
143
37
99
452
165
43
120
100,4
99,6
93,4
98,6Együtt 653 780 ...
*Bázissúlyozású
Feladat:
a) Hány Mrd Ft-tal, illetve hány %-kal nőtt a fogyasztás nominálértékben?
b) Hogyan alakultak az árak az egyes fogyasztási javaknál, illetve átlagosan?
c) Hány Mrd Ft-tal nőtt a fogyasztás az árak növekedése miatt?
d) A fogyasztás csökkenő mennyiségei miatt hány Mrd Ft-tal lett kevesebb 1992-ben az összes fogyasztási kiadás?
7. Egy család 1992-ben összes kiadásának 30%-át élelmiszerekre, 20%-át ruházati cikkekre, 25%-át szolgáltatásokra, 15%-át tartós fogyasztásicikkekre, 10%-át pedig egyéb dolgokra költötte.
A termékcsoportok árváltozásáról az alábbiak ismertek:
Kiadási csoportÁrindex*
1991=100%Élelmiszerek
Ruházati cikkek
Szolgáltatások
Tartós fogyasztási cikkek
Egyéb
122
132
142
110
128
Érték-, ár- és volumenindexek
243
Összesen ...*1992-es fogyasztási mennyiségekkelszámolva
A család éves jövedelme 1991-ben 380 ezer Ft, 1992-ben pedig 460 ezer Ft volt, és sem 1991-ben, sem 1992-ben nem volt megtakarításuk.
Feladat:
a) Hány %-kal nőtt a család jövedelme nominálértékben?
b) Hogyan változott a fogyasztási cikkek árszínvonala?
c) Hogyan változott a család reáljövedelme (jövedelmének vásárlóértéke)?
8. A nominálkeresetek alakulása Magyarországon:
ÉvNominál átlagkereset*
1980=100%1990
1991
1992
1993
249,9
313,6
380,4
447,7
* Egy keresőre számítva
A fogyasztói árak 1990-ről 1991-re 35%-kal, 1991-ről 1992-re 23%-kal és 1992-ről 1993-ra további 22,5%-kal nőttek.
Feladat:
Hogyan alakultak a reálkeresetek 1990-hez képest, illetve évről évre?
9. Három termék értékesítésére vonatkozó adatok:
Termék Értékesítési forgalom1993-ban (millió Ft)
Mennyiségváltozás(%) Árváltozás (%)
Érték-, ár- és volumenindexek
244
1993-ról 1994-re 1993-ról 1994-re
A
B
C
40
60
100
+ 10
+ 20
+ 40
+ 15
+ 27
+ 60Együtt 200 ... ...
Feladat:
a) Számítsuk ki a volumenindexet mindkét súlyozással! Indokoljuk az eltérő eredményt, magyarázzuk meg a nagyságrendet!
b) Számítsuk ki a Fisher-féle árindexet! Ellenőrizzük számszerű nagyságát!
10. Egy kiskereskedő fontosabb áruinak mennyiségi és áralakulását vizsgálta. Az alábbi adatokat ismerjük:
Termék Volumenindex (%) Árindex (%)A
B
C
102
105
110
110
130
150
Feladat:
Állapítsuk meg, hogy az alábbi megállapítások közül melyek lehetnek „igazak” és melyek „hamisak”:
a) A három termék árszínvonala nőtt.
b) A három termék mennyiségének növekedése átlagosan nem több, mint 10%.
c) A Paasche-súlyozású árindex kisebb árnövekedést mutat, mint a Laspeyres-súlyozással számított index.
d) Az együttes árindex 110 és 150% között helyezkedik el.
e) A bázisidőszak forgalmiérték-adatainak ismeretében a kiskereskedő pontosan ki tudja számítani valamelyik árindexet (a három termékre).
f) A három termékre számított értékindex 100%-nál kisebb.
Érték-, ár- és volumenindexek
245
g) A Paasche-súlyozású volumenindex nagyobb, mint a Laspeyres-súlyozású .
11. A piacgazdálkodást folytató országokkal kapcsolatos külkereskedelmi forgalom adatai:
Behozatali forgalom Kiviteli forgalom
Év Mrd Ftfolyó áron
Árindex
Előzőév=100%
Év Mrd Ft folyó áronÁrindex
Előző év=100%
1985
1986
1987
1988
1989
1990
1991
1992
1993
175
186
209
234
291
344
637
649
805
–
105,5
110,8
114,0
114,6
116,2
126,5
111,7
110,9
1985
1986
1987
1988
1989
1990
1991
1992
1993
162
154
188
240
301
376
584
646
599
–
98,2
110,6
114,9
116,9
114,6
120,3
168,8
110,3
Az árindexek Fisher-formulával kerültek kiszámításra.
Feladat:
a) Vizsgáljuk meg a folyó áras forgalmak alakulását 1985-höz viszonyítva, valamint évről évre! Milyen indexsorokat számoltunk?
b) Vizsgáljuk meg a behozatali, valamint a kiviteli forgalom volumenének alakulását évről évre! Állapítsuk meg az indexsorok típusát!
c) Számítsuk ki, hogy 1985 és 1993 között melyik területen (az importnál vagy az exportnál) volt nagyobb az árváltozás átlagos növekedési üteme!
d) Számítsuk ki a cserearány-mutatókat!
Érték-, ár- és volumenindexek
246
12. Egy vállalat termelésének alakulására vonatkoznak az alábbi adatok:
A termelés értéke (millió Ft)Év 1990 1991 1992 1993
évi áron1990
1991
1992
1993
120
117
115
121
124
120
119
124
130
126
124
126
140
132
130
135
Feladat:
a) Vizsgáljuk meg a termelési érték változását!
b) Számítsunk állandó (1992-es) súlyozású lánc-volumenindexeket! Mutassuk be a lánc- és a bázisindexek közötti összefüggést!
c) Számítsuk ki a változó súlyozású lánc-árindexsor elemeit a Laspeyres- és a Paasche-féle súlyozásnak megfelelően is! Magyarázzuk meg az1993-ra számított indexek eltérését!
247
A. függelék - IrodalomHajdú–Pintér–Rappai–Rédey: Statisztika I–II. JPTE, Pécs, 1994.
Hunyadi László–Vita László: Statisztika I. Aula Kiadó, Budapest, 1991.
Hunyadi László–Mundruczó György–Vita László: Statisztika II. Aula Kiadó, Budapest, 1992.
Kerékgyártó Györgyné–Mundruczó György: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1995.
Korpás Attiláné–Molnár Máténé–Szűts István: Általános statisztika I. rész. Tankönyvkiadó, Budapest, 1992.
Köves Pál–Párniczky Gábor: Általános statisztika I–II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.
248
6. fejezet - Tárgymutatóadat
alap~
leszármaztatott ~
adatfelvétel
reprezentatív ~
részleges ~
teljes körű ~
aggregálás
aggregátum
agrárolló
aszimmetria
~ mérőszámai
asszociáció
~s együttható
Cramer-féle ~
Csuprov-féle ~
Yule-féle ~
ár
árindex
Tárgymutató
249
egyedi ~
Fisher-féle ~
fogyasztói ~
Laspeyres-féle ~
Marshall–Edgeworth–Bowley-féle
Paasche-féle
területi
árolló
átlag
fő~
harmonikus ~
kronologikus ~
mértani ~
négyzetes ~
rész~
számtani ~
~ tulajdonságai
átlagár
~változás
Bortkiewicz-tétel
bot-ábra
Tárgymutató
250
cserearány-index
csoportosítás
deflálás
determinációs hányados
egység (egyed)
megfigyelési
számbavételi
eltérés-négyzetösszeg
belső ~
külső ~
teljes ~
értékindex
egyedi ~
értékösszeg
kumulált ~
relatív ~
~sor
fejlődés átlagos mértéke
fejlődés átlagos üteme
főátlag
~index
Tárgymutató
251
~ok hányadosának elemzése
~ok különbségének elemzése
főindex
függetlenség
függvényszerű kapcsolat
gyakoriság
együttes ~
kumulált ~
perem~
relatív ~
~i eloszlás
~i megoszlás
~i poligon
~i sor
helyzetmutatók
hiba
abszolút ~
relatív ~
hibakorlát
hisztogram
idősor 82
Tárgymutató
252
állapot~
tartam~
indexpróbák
indexsor
ár~
érték~
volumen~
indexszám
ismérv
alternatív ~
diszkrét ~
folytonos ~
időbeli ~
közös ~
megkülönböztető ~
mennyiségi ~
területi ~
~változat
kérdőív
koncentráció
~s együttható
Tárgymutató
253
korreláció
~s hányados
~s tábla
kördiagram
kumulálás
kvantilis
~ eloszlás
kvartilis
alsó ~
felső ~
Lorenz-görbe
medián
mérési skála
arány~
intervallum~
névleges ~
sorrendi ~
módusz
mutatószám
oszlopdiagram
osztályköz
Tárgymutató
254
~határok
~ös gyakorisági sor
osztályközépső
összehasonlítás
összetételhatás-index
összetételhatás-különbség
rangsor
részátlagindex
részhatáskülönbség
részindex
sokaság
álló ~9
diszkrét ~
folytonos ~
fő~
mozgó ~
rész~
véges ~
végtelen ~
sor
csoportosító ~
Tárgymutató
255
idő~
leíró ~
mennyiségi ~
minőségi ~
összehasonlító ~
területi ~
statisztika
leíró ~
statisztikai következtetés
statisztikai tábla
csoportosító ~
egyszerű ~
kombinációs ~
kontingencia~
~dimenziószáma
szórás
~hányados
~négyzet-hányados
szórásnégyzet
belső ~
külső ~
Tárgymutató
256
teljes ~
~-felbontás
szóródás
~ mutatói
átlagos eltérés
átlagos különbség
relatív szórás
sztochasztikus összefüggés
vegyes kapcsolat
viszonyszám
bázis~
dinamikus ~
intenzitási ~
koordinációs ~
lánc~
megoszlási ~
összetett ~
rész~
volumenindex
egyedi ~
Fisher-féle ~
Tárgymutató
257
Laspeyres-féle ~
Marshall–Edgeworth–Bowley-féle ~
Paasche-féle ~
területi ~
vonaldiagram