Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a...

265
Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Transcript of Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a...

Page 1: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Általános statisztika IHavasy, György

Molnár, Máténé

Szunyogh, Zsuzsanna

Tóth, Mártonné

Korpás, Attiláné

Csernyák, László

Page 2: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Általános statisztika IHavasy, GyörgyMolnár, MáténéSzunyogh, ZsuzsannaTóth, MártonnéKorpás, AttilánéCsernyák, László

Publication date 1996Szerzői jog © 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt.

Szerkesztette:

Dr. Korpás Attiláné- főiskolai docens

Szerzők:

Dr. Havasy György - főiskolai docens (4. fejezet)

Dr. Molnár Máténé - főiskolai docens (3. fejezet)

Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet)

Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet)

A gyakorlófeladatokat:

Dr. Korpás Attiláné állította össze.

Szakmai lektor:

Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa

A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!

Page 3: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

iii

Tartalom1. A statisztika alapfogalmai .......................................................................................................................................................................... 1

1.1. A statisztika tárgya és szerepe ....................................................................................................................................................... 11.2. A statisztikai sokaság és ismérv ...................................................................................................................................................... 21.3. Statisztikai adat .............................................................................................................................................................................. 61.4. Statisztikai csoportosítás és összehasonlítás ................................................................................................................................. 101.5. Viszonyszámok ............................................................................................................................................................................. 151.6. Átlagok ......................................................................................................................................................................................... 181.7. Gyakorlófeladatok ......................................................................................................................................................................... 25

2. Egy ismérv szerinti elemzés .................................................................................................................................................................... 302.1. A mennyiségi ismérv szerinti elemzés ........................................................................................................................................... 30

2.1.1. A mennyiségi ismérv .......................................................................................................................................................... 302.1.2. Gyakorisági sorok .............................................................................................................................................................. 322.1.3. Értékösszegsor .................................................................................................................................................................. 412.1.4. A gyakorisági sorok grafikus ábrázolása ............................................................................................................................. 472.1.5. Helyzetmutatók .................................................................................................................................................................. 542.1.6. Szóródási mutatók ............................................................................................................................................................. 712.1.7. Az aszimmetria mérőszámai .............................................................................................................................................. 812.1.8. A koncentráció elemzése ................................................................................................................................................... 83

2.2. Az időbeli ismérv szerinti elemzés ................................................................................................................................................ 872.2.1. Idősorok ............................................................................................................................................................................ 872.2.2. Dinamikus viszonyszámok .................................................................................................................................................. 892.2.3. Az idősorok grafikus ábrázolása ......................................................................................................................................... 932.2.4. Az idősorok elemzése átlagokkal ........................................................................................................................................ 94

2.3. Gyakorlófeladatok ....................................................................................................................................................................... 1003. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése .............................................................................................. 107

3.1. A statisztikai táblákról általában ................................................................................................................................................... 1073.2. Az egyszerű táblák elemzése ...................................................................................................................................................... 110

3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása ................................................................... 1113.2.2. A fejlődési tendenciák kimutatása, összehasonlítása ......................................................................................................... 117

3.3. A csoportosító táblák elemzése ................................................................................................................................................... 1233.3.1. Rész- és összetett viszonyszámok ................................................................................................................................... 1243.3.2. Szerkezet- és dinamikai változás vizsgálata ...................................................................................................................... 127

3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése .................................................................................................... 1333.4.1. Függvényszerű kapcsolat. Függetlenség ........................................................................................................................... 1393.4.2. Az asszociáció szorosságának mérése ............................................................................................................................. 141

Page 4: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Általános statisztika I

iv

3.4.3. A vegyes kapcsolat elemzése ........................................................................................................................................... 1493.4.4. A korreláció elemzése csoportosított adatokból kiindulva ................................................................................................... 165

3.5. Gyakorlófeladatok ....................................................................................................................................................................... 1724. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása ........................................................................................................... 180

4.1. A standardizálás módszere ......................................................................................................................................................... 1804.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire ............................................................ 184

4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása ........................................................................................... 1864.2.2. Az összetétel különbözőségének hatása ........................................................................................................................... 188

4.3. Indexszámítás standardizálás alapján (hányadosfelbontás) ........................................................................................................... 1894.3.1. A főátlagindex .................................................................................................................................................................. 1904.3.2. A részátlagindex .............................................................................................................................................................. 1924.3.3. Az összetételhatás indexe ................................................................................................................................................ 194

4.4. Alkalmazási területek .................................................................................................................................................................. 1954.4.1. Az átlagbérek időbeli változásának vizsgálata ................................................................................................................... 1964.4.2. Az átlagárak időbeli változásának vizsgálata ..................................................................................................................... 198

4.5. Gyakorlófeladatok ....................................................................................................................................................................... 2025. Érték-, ár- és volumenindexek ............................................................................................................................................................... 209

5.1. Az indexszám fogalma ................................................................................................................................................................ 2095.2. Érték-, ár- és volumenindex-számítás .......................................................................................................................................... 209

5.2.1. Indexszám számítása aggregát formában ......................................................................................................................... 2115.2.2. Az indexek átlagformái ..................................................................................................................................................... 213

5.3. Az indexek súlyozása ................................................................................................................................................................. 2185.4. Összefüggések az indexszámításban .......................................................................................................................................... 221

5.4.1. Az indexszámok közötti összefüggések ............................................................................................................................ 2215.4.2. Az aggregátumok közötti összefüggések .......................................................................................................................... 2225.4.3. Csoportosított sokaságra számított indexek ...................................................................................................................... 224

5.5. Az indexszámok gyakorlati alkalmazása ...................................................................................................................................... 2275.6. Indexsorok .................................................................................................................................................................................. 229

5.6.1. Az indexsorok közötti összefüggések ................................................................................................................................ 2345.7. Területi indexek .......................................................................................................................................................................... 2355.8. Gyakorlófeladatok ....................................................................................................................................................................... 238

A. Irodalom ............................................................................................................................................................................................... 2476. Tárgymutató .......................................................................................................................................................................................... 248

Page 5: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

v

Az ábrák listája2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája ...................................................................................................................... 482.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja ................................................................................................................ 492.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok ............................................................................. 502.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja .......................................................................................................... 522.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja ................................................................................................... 532.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja .............................................................................................. 542.7. ............................................................................................................................................................................................................. 552.8. ............................................................................................................................................................................................................. 562.9. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 582.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése ...................................................................... 692.11. ........................................................................................................................................................................................................... 712.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe) ................................................................................................. 862.13. A takarékbetét-állomány alakulása ...................................................................................................................................................... 932.14. A Magyarországra érkező turisták számának alakulása ........................................................................................................................ 942.15. Az épített lakások számának alakulása ............................................................................................................................................... 983.1. A statisztikai táblák típusai .................................................................................................................................................................. 1103.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva ................................................................................................. 1213.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva ................................................. 1213.4. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 1323.5. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 1333.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat ................................................................................... 1685.1. ........................................................................................................................................................................................................... 224

Page 6: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

vi

A táblázatok listája1.1. Példák a sokaságokra ............................................................................................................................................................................ 31.2. Csoportosító sor általános sémája ........................................................................................................................................................ 101.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban ............................................................................... 111.4. A népesség megyék szerinti megoszlása 1994. január 1-jén .................................................................................................................. 121.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál ............................................................................................................. 141.6. Az 1 főre jutó GDP néhány európai országban 1993-ban ....................................................................................................................... 141.7. A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén .......................................................................................... 161.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál ................................................................................................ 171.9. Magyarország 1993. évi idegenforgalmát jellemző adatok ...................................................................................................................... 172.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m3-ben) .................................................. 302.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m3-ben) ........................................................................................................ 312.3. A gyakorisági sorok általános sémája ................................................................................................................................................... 332.4. A lakások szobaszám szerinti eloszlása ................................................................................................................................................ 352.5. A társasház lakásainak megoszlása a vízfogyasztás szerint ................................................................................................................... 362.6. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 372.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában .............................................................................................. 382.8. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 392.9. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 402.10. Az értékösszegsor általános sémája .................................................................................................................................................... 412.11. A település háztartásainak taglétszám szerinti eloszlása ...................................................................................................................... 422.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint .......................................................................................... 422.13. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 432.14. Munkatábla az osztályközép meghatározásához .................................................................................................................................. 442.15. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 452.16. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 462.17. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................. 472.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint ......................................................... 502.19. Munkatábla a medián becsléséhez ...................................................................................................................................................... 612.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok ....................................................................................... 632.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok ......................................................................................... 652.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) .................................................................................... 702.23. Munkatábla az átlagos eltérés és a szórás számításához ..................................................................................................................... 752.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői ......................................................................................................................... 812.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén ........................................... 842.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) ..................................................................................... 85

Page 7: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Általános statisztika I

vii

2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én) ............................................................................. 882.29. Magyarországra érkező külföldi turisták számának alakulása ................................................................................................................ 882.30. A bázis- és láncviszonyszámok számítása ........................................................................................................................................... 902.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én) ......................................................................................... 902.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai ............................................................................................ 952.33. Az épített lakások számának alakulása Magyarországon ...................................................................................................................... 973.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok) ................................................. 1073.2. A magyarországi népesség életkor szerinti megoszlásának alakulása ................................................................................................... 1083.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.) .................................. 1093.4. Az orvosi ellátás néhány adata (december 31-i adatok) ....................................................................................................................... 1113.5. Orvosi ellátásra vonatkozó adatok ....................................................................................................................................................... 1143.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok) ................................................................................................... 1183.7. Az egészségügyi ellátásra vonatkozó adatok ....................................................................................................................................... 1183.8. A csoportosító tábla általános sémája ................................................................................................................................................. 1233.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) .............................................................. 1253.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.) .................................................................. 1263.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok) .................................................................... 1273.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása ............................................................ 1283.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok) .......................................... 1293.14. A magyarországi lakásállományra vonatkozó adatok .......................................................................................................................... 1313.15. A kontingenciatábla sémája ............................................................................................................................................................... 1353.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint(1990. január 1.) ....................................................................................................................................................................................... 1363.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal) ............................................................................ 1373.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint ............................................................................................... 1383.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint ................................................................................................. 1383.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok ..................................................................................................... 1393.21. Kontingenciatáblázat alternatív ismérvek esetén ................................................................................................................................. 1413.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 1433.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 144

3.24. A függetlenség feltételezésével számított gyakoriságok ( ) ............................................................................................................... 146

3.25. A számítása ................................................................................................................................................................................ 1473.26. A vegyes kapcsolat adatbázisa ......................................................................................................................................................... 1493.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben) ................................................ 1503.28. A kontingenciatábla sémája vegyes kapcsolat esetén ......................................................................................................................... 1523.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint ................................. 153

Page 8: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Általános statisztika I

viii

3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok ................................................................................................................ 1563.31. A vizsgált ipari szervezetekre vonatkozó adatok ................................................................................................................................. 1603.32. A korrelációs tábla sémája ................................................................................................................................................................ 1653.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint ........................................... 1663.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 1673.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 1714.1. Jövedelem- és létszámadatok két vállalkozásnál .................................................................................................................................. 1804.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása ........................................................................................... 1824.3. Két ország halandósági viszonyainak alakulása (fiktív adatok) .............................................................................................................. 1844.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben ........................................................................................................ 1904.5. A lakosság összetételének változása ................................................................................................................................................... 1954.6. Egy vállalkozás munkaügyi adatai ....................................................................................................................................................... 1964.7. 4.7. táblázat ....................................................................................................................................................................................... 1964.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai ....................................................................................................... 2005.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 1993–1994-es években ........................ 2105.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek ................................................................................ 2115.3. Az indexek kiszámítási képleteinek áttekintő táblázata ......................................................................................................................... 2175.4. A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket forgalmazó üzletben .............................. 2255.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években ......................................................................................... 2295.6. Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva ............................................................................................ 2305.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában ........................................................................... 236

Page 9: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

1

1. fejezet - A statisztika alapfogalmai1.1. A statisztika tárgya és szerepe

A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információravan szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek ésegyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának.

A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység.

A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenységúgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, atermények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vettekezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak azegyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve – amihez nagy lendületetadott a valószínűség-számítás kialakulása és tételeinek elterjedése – önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellettszéles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntésekelőkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is.

A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása,elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése.

A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana.

A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatávalfoglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, azenergiatermelés, a lakosság fogyasztása stb.

A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikaimódszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést.

A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Idesorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredményekáttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait(tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majdcsoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb.A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük.

Page 10: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

2

A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körűmegfigyelés túl költséges – így gazdaságtalan – és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylagkis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire,tulajdonságaira.

Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségénekellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggésekvizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagyazok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét.

Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabbanhasznált elemzési eszközöket tárgyalja.

A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát.

Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkeláltalánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja.Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb.

1.2. A statisztikai sokaság és ismérvA statisztika – mint már említettük – mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik.

A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket – a halmaz elemeit – asokaság egységeinek nevezzük.

Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya;tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzettegységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb.

Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrétsokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaságegy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb.

A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatvaértelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás)1 és a vándorlási különbözet2 miatt állandóan változhat. Ezért e

1Az élveszületések és halálozások különbsége.

Page 11: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

3

sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor)3értelmezhető, „ragadható meg”. Ugyanakkor a Videoton-gyár termelése –mivel a termelés egy folyamat – időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Azidőpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknaknevezzük.

A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesensokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számúegyed megfigyelésével végezzük.

A sokaságok fajtáit szemlélteti az 1.1. táblázat:

1.1. táblázat - Példák a sokaságokra

A sokaságmegnevezése egysége fajtája

Zala megyeszemélygépkocsi-állománya1995. december 31-én

egy személygépkocsi diszkrét, álló, véges

A lakosság takarékbetét-állománya 1995. július 31-én

egymilliárd (millióstb.) Ft betétállomány

folytonos, álló, véges

1995-ben Nógrád megyében

született gyermekek

egy gyermek diszkrét, mozgó, véges

Magyarország 1995. évi

sörfogyasztása

egy liter (hektoliter,üveg stb.)

sörfogyasztás

folytonos, mozgó,véges

A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető.

Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok.

Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területielhelyezkedés, a vállalkozás profilja.

2A megyébe letelepülő és elköltöző népesség különbsége.3Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni.

Page 12: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

4

Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb.,a gépkocsi fogyasztása esetén pedig számadatok.

Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattalrendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyiváltozata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők.

Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységeiegyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznekegymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük.

Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I.évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozásidőpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elértpontszáma stb.

Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg.Az ismérvek fajtái:

– időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek.

Ismérvváltozatai: időpontok, időszakok.

(Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.)

– területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek.

Ismérvváltozatai: földrajzi egységek.

(Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.)

– minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai.

(Pl. a főiskolai hallgatók neme, a gépkocsik típusa.)

– mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük.

(Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.)

Page 13: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

5

Mérési szintek

A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetségesváltozatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1;nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azazmérésének tekinthető.

A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezekbizonyos tulajdonságaihoz.

A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg:

– névleges skála,

– sorrendi skála,

– intervallumskála,

– arányskála.

A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségiismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyennominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják,közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelmenincs.

A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatókosztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán – bár a sorszámokközötti különbség azonos (egy-egy) – az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyresorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésbőlszármazó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendiségekerül kihasználásra.

Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valósinformációt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározásaönkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok(pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak.A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 °C-os és a + 5 °C-os hőmérséklet összege + 25 °C, vagyhogy a 20 °C-os hőmérséklet kétszerese a 10 °C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető.

Page 14: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

6

Pl. az 5 °C és a 10 °C közötti különbség azonos a 15 °C és 20 °C közötti különbséggel. A 20 °C és 30 °C közötti különbség kétszerese az előbbibármelyik különbségnek.

Az arányskálán történő mérés – a legmagasabb mérési szint – nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont atulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhezszükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb.

1.3. Statisztikai adatA statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma.

A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérésieredmény.

A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adattehát nem pusztán a számérték maga.

Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt;1992-ről 1993-ra az

1 főre jutó reáljövedelem 5%-kal csökkent.

Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma).

Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992.december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat:

A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt.

Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő(pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk.

Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órárajutó termelés stb.

A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk.

Page 15: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

7

– Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntésekethozhatunk.

– Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatokalakításában.

– A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá.

E követelményeknek – az elfogadható pontosság, a gyorsaság és a gazdaságosság – egy időben általában tökéletesen megfelelni nem lehet(például a gyorsaság a pontosság ellen hat).

Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások,nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásaistb.)

A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetbenmegelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtásaelőtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennekelmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseketeredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát azadatgyűjtéstől kezdve az adatközlésig.

Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaságmegfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges.

A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani.A teljes körű megfigyelések jellegzetes példái a népszámlálások.

A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellellehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaságteljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabba teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is.

A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek.

Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaságkiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot.A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintábólszármazó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk.E mintából való következtetés – éppen a felvétel részlegessége miatt – csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk.

Page 16: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

8

Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várhatótermésmennyiség becsléséhez, a közvélemény-kutatásoknál stb.

A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyonrossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése.

Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, ésaz önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók azalapsokaságra.

A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatívmegfigyelés.

Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak.A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyátképező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat)gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén amegfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók.

A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat.

A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alaposszakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nemeléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást.

Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket,fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák.

Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibákszinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat ésa hibákkal torzított mért adat egymástól eltér.

A valóságos adat (A) és a mért adat különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük:

A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynélaz abszolút hiba biztosan nem nagyobb.

Page 17: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

9

Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának nevezzük. Így minden statisztikai adat megadható az módon. Ez a

megadási mód arra utal, hogy a valóságos adat (A) valahol az és határok között helyezkedik el.

A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyosnagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikánsszámjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el.

Ha a legutolsó kiírt számjegy helyi értéke akkor az abszolút hibakorlát:

Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban alegutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke . (Ez a közlési mód azt sugallja, hogy az utolsó három – százas, tízes, egyeshelyi értékű – számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.)

A statisztikai adat (népességszám) abszolút hibakorlátja:

Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani.

Az abszolút hiba (a) és a valóságos adat (A)

hányadosát relatív hibának, az abszolút hibakorlát és a mért adat

hányadosát a statisztikai adat relatív hibakorlátjának nevezzük.

A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni.

Page 18: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

10

A népességszám relatív hibakorlátja:

Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi.

A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan)lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Ígyelkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk.

1.4. Statisztikai csoportosítás és összehasonlításCsoportosítás

A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körűinformációt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerintosztályoznunk, csoportosítanunk kell.

A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint.

A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. Ekét követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik – de csak egy – kialakított osztályba.

Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzésenem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nemegyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozásoktevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú „listát” kapnánk, aminehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt.

A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat – szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozásirendszereket – alkalmazzák.

Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat):

1.2. táblázat - Csoportosító sor általános sémája

Osztály Egységek száma

Page 19: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

11

Összesen N

ahol a csoportképző ismérv alapján képzett i-edik osztály azonosítója,

a sokaság osztályba sorolt egységeinek száma, ún. gyakorisága,

k : a kialakított osztályok száma,

N : a sokaság egységeinek száma.

A sémából is látható, hogy a gyakoriságok összege egyenlő a sokaság elemszámával (N).

Tehát

A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorokképzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával.

Minőségi sor (1.3 táblázat):

1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban

Utazás jellege Külföldiek száma

(E fő)Turista

Kiránduló

22 804

11 719

Page 20: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

12

Átutazó 6 076Összesen 40 599

Területi sor (1.4. táblázat):

1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén

Megye Népesség száma (fő)BudapestBudapest egyik megyéhezsem tartozik közigazgatásilag, ezért astatisztikai kiadványokban külön sorbantüntetik fel.

Baranya

Bács-Kiskun

Békés

Borsod-Abaúj-Zemplén

Csongrád

Fejér

Győr-Moson-Sopron

Hajdú-Bihar

Heves

Jász-Nagykun-Szolnok

Komárom-Esztergom

Nógrád

Pest

1 955 696

416 405

538 560

401 323

743 835

436 639

422 448

426 738

548 942

328 754

418 858

312 295

221 032

964 939

338 245

560 888

Page 21: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

13

Somogy

Szabolcs-Szatmár-Bereg

Tolna

Vas

Veszprém

Zala

249 938

272 835

377 531

301 067

Összesen 10 276 968

Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Enneklényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjukterületi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.).

K: komfortos,

FK: félkomfortos,

KN: komfort nélküli.

A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó.

Page 22: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

14

Összehasonlítás

A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával.

Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása.

Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamataaz IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy adevizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosátszámítjuk ki.

A két szám különbsége:

A két szám hányadosa:

A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent.

Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (Akamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.)

Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket – acsoportosító sorokhoz hasonlóan – az ismérvek fajtája szerint is megkülönböztethetünk.

A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat).

1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál

Időpont Kamat (%)1995. június 23.

július 23.

3,437

3,375

Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sortszemléltet.

1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban

Ország 1 főre jutó GDP (USD)

Page 23: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

15

Albánia

Ausztria

Hollandia

Lengyelország

Magyarország

Németország

Portugália

Románia

Spanyolország

Svájc

Szlovákia

340

23 120

20 710

2 020

3 300

23 560

7 890

1 120

13 650

36 410

1 900

1.5. ViszonyszámokA csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám.

A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa.

Képlettel:

ahol V: a viszonyszám,

A: a viszonyítás tárgyát képező adat, amit viszonyítunk,

B: a viszonyítás alapját képező adat, amihez viszonyítunk.

A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból.

Page 24: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

16

Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, akoordinációs és a dinamikus viszonyszámok.

A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki.

1.7. táblázat - A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén

Nem Népesség száma (fő)Férfi

372 425

354 289Összesen 726 714

Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok:

– a férfiak aránya:

– a nők aránya:

A 20–24 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén.

A koordinációs viszonyszám a sokaság két részadatának hányadosa.

A 1.7. táblázat adataiból számítható koordinációs viszonyszámok:

– 1000 férfira jutó nők száma:

– 1000 nőre jutó férfiak száma:

A dinamikus viszonyszám két időszak (időpont) adatának hányadosa.

Page 25: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

17

1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál

Időpont Árfolyam (Ft/DEM)1994. július 10.

1995. július 10.

66,12

90,76

Dinamikus viszonyszám: (az 1.8. táblázat adataival számolva).

A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt.

A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük.

Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. Eviszonyszámok általában két – egymással valamilyen kapcsolatban álló – sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1-jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt.

Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma:

A különböző fajta, különböző mértékegységű – de egymással kapcsolatban álló – adatokat is statisztikai sorba rendezhetjük. Az így képzett sortleíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egyvállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példávalszemléltetjük (1.9. táblázat).

1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok

Megnevezés AdatKülföldre utazó magyarok száma (E fő)

Magyarországra érkező külföldiek száma (E fő)

– ebből turisták (E fő)

Idegenforgalom bevétele (M Ft)

12 115

40 599

22 804

110 312

Page 26: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

18

Idegenforgalom kiadása (M Ft) 68 961

1.6. ÁtlagokA viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni.

Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségiismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetesátlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg.

Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük:

ahol: N : a megfigyelt átlagolandó értékek száma,

az i-edik átlagolandó érték.

A különböző átlagok kiszámítását az alábbi, adatból álló számpéldával is szemléltetjük:

2 , 6 , 4 , 2 , 6 , 4 , 6 , 2 , 5 , 6.

Számtani átlag

A számtani átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.

Tehát

Ebből a számtani átlag:

Adataink alapján:

Page 27: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

19

Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot:

Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó

értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás -ig terjed. (Továbbra is 10 átlagolandóértékkel dolgozunk, de ezeket csoportba soroltuk be.)

Átlagolandó értékek száma

(gyakorisága) 2

4

5

6

3

2

1

4Összesen 10

A csoportosító sor sémájában bevezetett jelölések szerint:

ahol: k : az egymástól különböző átlagolandó értékek száma,

a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.

Ezt a számítási formát súlyozott formának nevezzük.

Page 28: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

20

A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a

gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket -vel jelölünk:

Jellemző, hogy

Példánkban:

2

4

5

6

0,3

0,2

0,1

0,4Összesen 1,0

Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk.

Számszerűen:

Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja:

a) az átlagolandó értékek abszolút nagysága.

Page 29: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

21

Az átlag mindig a legkisebb és legnagyobb érték közé esik:

b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el.

Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb asúlyaránya, akkor az átlag az intervallum felső határához esik közelebb.

A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak.

A számtani átlag tulajdonságai:

1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla.

Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák(különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható:

mert az átlag definíciója szerint

2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagyahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos.

Tehát

Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük.

Page 30: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

22

A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla:

Ebből:

Mivel pozitív, az valóban minimális.

3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg.

Tehát, ha ( ), akkor .

Ugyanis

4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik.

Tehát, ha ( ), akkor

Ugyanis

Harmonikus átlag

Aharmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad.

Page 31: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

23

Tehát

Ebből a harmonikus átlag :

Példánkban:

Súlyozott formában:

Adataink alapján:

Mértani átlag

Amértani átlag(jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok szorzata változatlan marad.

Tehát:

Page 32: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

24

Ebből a mértani átlag :

(Itt feltételezzük, hogy )

Példánkban:

Súlyozott formában:

Adataink alapján:

Négyzetes átlag

A négyzetes átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad.

Tehát:

Ebből a négyzetes átlag:

Példánkban:

Page 33: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

25

Súlyozott formában:

Adataink alapján:

Két nemnegatív szám számtani és mértani közepének összehasonlításáról már középiskolában is volt szó, itt bizonyítás nélkül közöljük a különbözőátlagok közötti összefüggéseket.

Ha ugyanazokból az átlagolandó értékekből, azonos súlyarányokkal számítunk különböző átlagokat, közöttük az alábbi nagyságrendi viszony áll fenn:

Példánkban:

(Az átlagok között egyenlőség csak akkor fordulhat elő, ha minden átlagolandó érték egyforma.)

1.7. Gyakorlófeladatok1. A főiskolai hallgatók anyagi és szociális helyzetét kívánjuk felmérni.

Feladat:

a) Definiáljuk a felméréshez szükséges sokaságot!

b) Fogalmazzunk meg olyan kérdéseket, amelyeket feltennénk egy elképzelt kérdőívben!

Page 34: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

26

c) Milyen ismérvek vannak az egyes kérdések mögött? Nevezzük meg ezeket, és adjuk meg ezek néhány lehetséges változatát!

d) Rendezzük a választott ismérveket aszerint, hogy hány változatuk van!

e) Képezzünk sorokat egy 30 fős csoportra vonatkozóan tetszőleges adatokkal!

2. Néhány sokaság:

– Az 1994-ben Magyarországon kiadott könyvek összessége.

– Az iskolai könyvtárak összes könyvállománya 1994. január 5-én.

– Színházlátogatások száma egy adott napon Budapesten.

– Egy áruház cipőosztályának forgalma a téli kiárusítás hetében.

– Üzembe helyezett beruházások nagysága 1994-ben.

– A lakosság villamosenergia-fogyasztása 1994 decemberében.

– Békés megye állatállományának nagysága 1994. március 31-én.

– Budapest népessége 1995. január 1-jén.

Feladat:

a) Nevezzük meg a fenti sokaságok típusait!

b) Mondjunk megkülönböztető ismérveket az egyes sokaságokra vonatkozóan!

c) Megfelelő módon bővítsük vagy szűkítsük az egyes sokaságokat!

d) Milyen mérési skálákon mérhetők az egyes ismérvek?

3. A közgazdaság-tudományi ághoz tartozó nappali tagozatos hallgatók adatai 1992-ben:

Nem Hallgatók száma (fő)Férfi

3731

5069

Page 35: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

27

Összesen 8800

Feladat:

Nevezzük meg a statisztikai sor típusát!

4. A gazdaságilag aktív népesség számának alakulása Magyarországon:

Év, január 1. Népesség (ezer fő)1985

1986

1987

1988

1989

1990

1991

1992

5591

5580

5595

5559

5519

5496

5404

5202

Feladat:

a) Nevezzük meg a statisztikai sor típusát!

b) Számítsuk ki, hogy mennyi egy-egy adat abszolút, illetve relatív hibakorlátja!

5. A hazánkba érkező turisták közül a legtöbben Romániából (5498 ezer fő), Németországból (2838 ezer fő) és Jugoszlávia utódállamaiból (2585ezer fő) érkeztek 1992-ben.

Ismerjük továbbá, hogy Európából összesen 16 688 ezer fő, Ázsiából 151 ezer fő, Afrikából 20 ezer fő, Amerikából 304 ezer fő, Ausztráliából ésÓceánia országaiból pedig 25 ezer turista érkezett.

Feladat:

Rendezzük az adatokat statisztikai sorokba!

Page 36: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

28

6. Statisztikai kiadványokból származnak az alábbi információk:

– 1991-ben a GDP 29,1%-a az ipari ágazatból származott.

– Az 1000 lakosra jutó élveszületések száma Magyarországon 1992-ben 11,8‰ volt.

– Az 1 főre jutó évi átlagos sertéshúsfogyasztás 1990-ben 38,8 kg volt.

– 1992-ben 25 807 lakás épült Magyarországon. A lakásépítések kedvezőtlen alakulását jellemzi, hogy 1970-hez képest 67,85%-kal épült kevesebblakás. Hány lakás épült 1970-ben?

– Az orvosellátottság jellemzésére kiszámított mutató számszerű értéke 1980-ban 28,8; 1992-ben 39,6 orvos/tízezer lakos.

– Az ipari ágazatban a maximum 500 főt foglalkoztató vállalkozások átlagos árbevétele 137 millió Ft volt 1992-ben.

– Svédországban a házasságkötési arányszám 1992-ben 4,3 ‰ volt.

– 100 aktív háztartásra 1991-ben 103 hűtőszekrény jutott.

Feladat:

Nevezzük meg az itt szereplő viszonyszámok fajtáját, adjuk meg kiszámítási módját!

7.

Átlagolandó értékek Súlyok6

16

20

6

3

1

Feladat:

a) Számítsuk ki a megadott értékek súlyozott: számtani, harmonikus, mértani és négyzetes átlagát!

b) Állapítsuk meg az átlagok nagyságrendjét!

c) Határozzuk meg a kifejezés értékeit a következő A értékek mellett: 5, 6, 8 és az esetén!

Page 37: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A statisztika alapfogalmai

29

8. Valamely ismérv két változata 10 és 15.

Feladat:

a) Rendeljünk ezen átlagolandó értékek mellé súlyokat többféleképpen úgy, hogy a súlyok összege először 20, majd 50, 10 és 7 legyen, továbbáa kapott átlagok mindig kisebbek legyenek a megelőzőnél!

b) Milyen súlyarányok mellett lesz az átlag éppen 12?

Page 38: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

30

2. fejezet - Egy ismérv szerinti elemzés2.1. A mennyiségi ismérv szerinti elemzés2.1.1. A mennyiségi ismérv

A mennyiségi ismérvek rendkívül nagy szerepet töltenek be a statisztikai elemző munkában. A mennyiségi ismérveket változóknak,lehetséges kimeneteleiket (ismérvváltozataikat) ismérvértékeknek nevezzük. Az ismérvértékek intervallum- vagy arányskálán mért, valamilyenmértékegységgel bíró számértékek.

A mennyiségi ismérv lehet: diszkrét és folytonos.

A diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan végtelen, egymástól jól elkülönülő értéket vehet fel.

A folytonos mennyiségi ismérv egy adott intervallumon belül bármilyen, tehát kontinuumszámosságú értéket felvehet.

A lakásokat például (a megfigyelés időpontjában) jellemezhetjük szobaszámuk és alapterületük szerint. A lakások szobaszáma csak pozitív egészszám lehet, tehát diszkrét mennyiségi ismérv. A lakások alapterülete egy adott intervallumban (pl. 50 és 55 m2 között) bármilyen értéket felvehet,tehát folytonos mennyiségi ismérv.

A diszkrét mennyiségi ismérv értékei – elvileg, de általában gyakorlatilag is – pontosan, a folytonos mennyiségi ismérv értékei mindig csak bizonyospontosságra kerekítve adhatók meg.

Például a lakások alapterülete megadható két tizedes pontossággal: 53,78 m2, ugyanez egy tizedes pontossággal: 53,8 m2, egész számra kerekítve:54 m2. Ezért két háromszobás lakás szobaszáma biztosan azonos, de két 54 m2-es lakás alapterülete már nem biztos, hogy „pontosan” azonos (azegyik lehet 53,78 m2, a másik 54,11 m2, de a mérési – kerekítési – pontosság miatt mindkettőt 54 m2-nek tekintjük).

Ha egy sokaságot valamilyen mennyiségi ismérv szerint vizsgálunk, akkor első lépésként általában az ismérvértékeket sorba rendezzük, ún. rangsortkészítünk.

A rangsor a mennyiségi ismérv értékeinek monoton sorozata.

Szemléltető példánk a következő (2.1. és 2.2. táblázat):

2.1. táblázat - Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m3-ben)

36 14 21 23 23

Page 39: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

31

10

20

23

16

31

24

22

20

18

34

40

26

16

17

28

29

21

12

22

18

25

31

30

22

19

17

19

26

16

17

19

21

33

24

32

11

20

22

21

15

23

18

27

17

36

Az adatok (ismérvértékek) rendezésének legegyszerűbb módja a rangsor készítése.

2.2. táblázat - A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m3-ben)

10

11

12

14

15

16

16

16

17

17

17

18

18

18

19

19

19

20

20

21

21

21

21

22

22

22

22

23

23

23

24

24

25

26

26

27

29

30

31

31

32

33

34

36

36

Page 40: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

32

17 20 23 28 40

A lakások vízfogyasztása folytonos mennyiségi ismérv, a rangsorban található azonos értékek (pl. négy lakásnál 21 m3 a fogyasztás) 1valószínűséggel csak a mérési pontosság miatt nem különböznek egymástól.

2.1.2. Gyakorisági sorokA rangsor segít a vizsgált jelenség természetének vizsgálatában, azonban ha a megfigyelt sokaság elemszáma nagy – a statisztikai vizsgálatoknáláltalában ez jellemző –, a rangsor már nehezen áttekinthető, és nem teszi lehetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozószabályszerűség felismerését.

Ahhoz, hogy a sokaság összetételéről, szerkezetéről, belső arányairól áttekinthető képet kapjunk, az adatokat (ismérvértékeket) tömörítenünk kell.Az adatokban rejlő információk tömörítésének, sűrítésének legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása(csoportosítása). A rangsort általában éppen abból a célból készítjük, hogy megkönnyítse a sokaság egységeinek mennyiségi ismérv szerintiosztályozását.

Az osztályozás eredménye egy csoportosító sor, melynek általános sémáját az 1.4. alfejezetben már megismertük (1.2. táblázat). Ebben az esetben

a ( ) osztályok a mennyiségi ismérv lehetséges értékeinek részhalmazai. Ha az ismérvnek kevés változata van (pl. a lakások szobaszáma),akkor általában egy-egy ismérvváltozat képez egy-egy osztályt. Ha az ismérvváltozatok száma nagy (pl. ha a lakásokat alapterületük szerint, vagyaz aktív keresőket havi keresetük szerint csoportosítjuk), akkor az osztályok egynél több ismérvértéket magukba foglaló intervallumok (pl. 50–55 m2

közötti alapterület, 20 000–25 000 Ft közötti kereset stb.), melyeket osztályközöknek nevezünk.

Az 1.2. táblázatból látható, hogy a csoportosító sor tartalmazza a osztályok mellett a gyakoriságokat is.

A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik.

A gyakoriságok helyett a csoportosító sorban szerepeltethetjük a

relatív gyakoriságokat is, melyek nem mások, mint a gyakoriságokból számított megoszlási viszonyszámok. A relatív gyakoriságokat általában

százalékos formában (az hányadosok 100-zal szorzott értékei) fejezzük ki.

A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányadrésze (hány százaléka) tartozik.

Page 41: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

33

A mennyiségi ismérv szerinti osztályozás eredményeként kapott speciális csoportosító sort gyakorisági sornak nevezzük. Ha az osztályok egyetlenismérvértékből állnak, a gyakorisági sort gyakorisági eloszlásnak, röviden eloszlásnak nevezzük, más esetekben gyakorisági megoszlásnak,röviden megoszlásnak nevezzük1.

Az eloszlás, illetve a megoszlás, mint a neve is jelzi, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között.Mint látni fogjuk, az általános az, hogy az osztályok közül némelyikben sok ismérvérték van (nagy a gyakoriság), másutt viszont kevés, és általábanminél távolabb vagyunk a nagy gyakoriságú osztályoktól, annál kevesebb.

2.3. táblázat - A gyakorisági sorok általános sémája

a) változat (eloszlás) b) változat (megoszlás)

Ismérvérték Gyakoriság Az osztályközök Gyakoriságalsó

határa felső határa

Összesen N Összesen Nc) változat (eloszlás) d) változat (megoszlás)

IsmérvértékRelatív

gyakoriságAz osztályközök

Relatív

gyakoriságalsó

határa felső határa

11 Megjegyezzük, hogy a statisztikai gyakorlatban az eloszlást és a megoszlást egymás szinonimáiként is használjuk, noha a fent leírtak elméletileg mindenképpen indokoltak. Bizonyos elméletitételek ugyanis csak az egyik esetben érvényesek.

Page 42: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

34

Összesen 1 Összesen 1

ahol

az i-edik ismérvérték,

az i-edik osztályköz alsó határa,

az i-edik osztályköz felső határa,

az i-edik osztályhoz (osztályközhöz) rendelt gyakoriság,

az i-edik osztályhoz (osztályközhöz) rendelt relatív gyakoriság,

k : a kialakított osztályok (osztályközök) száma,

N : a sokaság elemszáma.

A gyakoriságok összege mindig egyenlő a sokaság elemszámával, azaz

A relatív gyakoriságok összege mindig egyenlő 1-gyel, tehát

és jellemző, hogy

Page 43: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

35

A 2.3. táblázat c) és d) változatban felírt gyakorisági sorát relatív gyakorisági sornak nevezzük. (Az gyakoriságokat abszolút gyakoriságoknak

is szokás nevezni, a relatív gyakoriságoktól való megkülönböztetés érdekében.)

A gyakorisági (relatív gyakorisági) sorok képzésének – mint azt a 2.3. táblázat is mutatja – a mennyiségi ismérv fajtájától és az ismérvváltozatokszámától függően alapvetően két módja van:

a) Ha a mennyiségi ismérv diszkrét és kevés változattal rendelkezik, akkor a gyakorisági sorban minden ismérvértéket felsorolunk. Pl. a társasház50 lakását csoportosítjuk a lakások szobaszáma szerint (2.4. táblázat).

2.4. táblázat - A lakások szobaszám szerinti eloszlása

Szobák száma Lakások száma Szobák száma Lakások %-os

megoszlása

1

2

3

4

5

22

17

6

1

2

3

4

10

44

34

12Összesen 50 Összesen 100

b) Ha a mennyiségi ismérv sokféle értéket vesz fel, akkor az ismérvértékek tartományát egymást át nem fedő intervallumokra, ún. osztályközökrebontjuk. Az így képzett sort osztályközös gyakorisági (relatív gyakorisági) sornak (megoszlásnak) nevezzük. Az osztályközös gyakorisági sorképzésénél a következő követelményeknek kell eleget tenni:

– Az osztályközhatárokat úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy –osztályközbe.

– Annyi és olyan hosszúságú osztályközöket képezzünk, hogy a kapott gyakorisági sor jól tükrözze a sokaság mennyiségi ismérv szerinti összetételét.Mutassa meg a sokaság egységeinek az X ismérv (változó) nagysága szerinti megoszlásában mutatkozó szabályszerűséget.

Az első követelmény azt jelenti, hogy az osztályközhatárok megadásánál

kifejezésre kell juttatni, hogy egy adott, éppen az osztályközhatárra eső érték melyik osztályközbe tartozik. Ez elsősorban akkor okoz gondot,ha a mennyiségi ismérv folytonos. Például ha a lakásokat alapterületük szerint csoportosítjuk, az ismérv folytonos jellege azt kívánná, hogy az

Page 44: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

36

intervallumok hézagmentesen illeszkedjenek egymáshoz, azaz az osztályközöket a következő módon jelöljük ki: 45–50 m2; 50–55 m2; 55–60 m2

stb. A hézagmentesen illeszkedő osztályközhatárokat valódi határoknak nevezzük. Ebben az esetben azonban gondot jelenthet, hogy az éppenosztályközhatárra eső 50, illetve 55 m2-es alapterület melyik osztályközbe tartozik.

Az egyértelmű besorolhatóságot a statisztikában kétféleképpen biztosíthatjuk. Az osztályközhatárokat a mérési pontosságnál nagyobb pontossággaladjuk meg (1. változat), vagy az osztályközök alsó határát a mérési pontosság egy egységével megnöveljük (2. változat). Az egyértelmű besorolásérdekében megkülönböztetett osztályközhatárokat közölt határoknak szokás nevezni.

A kétféle változatot az alábbi gyakorisági sorok szemléltetik (2.5. táblázat). Mindkét esetben 10 m3-es hosszúságú osztályközöket képezünk, ésfigyelembe vesszük, hogy az adatok 1 m3 pontosságúak .

2.5. táblázat - A társasház lakásainak megoszlása a vízfogyasztás szerint

1. változat 2. változatVízfogyasztás

(m3)Lakások száma Vízfogyasztás

(m3)Lakások száma

– 20,0

20,1 – 30,0

30,1 –

21

21

8

– 20

21 – 30

31 –

21

21

8Összesen 50 Összesen 50

Az osztályközök számának, illetve hosszának meghatározása már bonyolultabb feladat. Minden csoportosítás mindig bizonyosinformációveszteséggel: az egységek egyedi tulajdonságaira vonatkozó ismereteink elvesztésével jár. Ugyanakkor egy jó csoportosítás segíti avizsgált sokaság egészének megismerését, ami az alapadatokhoz képest többletinformációt eredményez. Ezért olyan osztályközök kialakítására kelltörekedni, amelyek jól tömörítik a vizsgált jelenség törvényszerűségeit, de még nem eredményeznek számottevő információveszteséget.

Az utóbbi feltétel az osztályközök számának növelését, míg az előbbi a csökkentését indokolja. Ezért minden osztályozás esetén törekedni kell atömörítés és részletezés közötti ésszerű kompromisszumra. Az osztályközök számának és hosszának meghatározásához a szakmai ismereteken túljó támpontot adnak a 2.1.4. alpontban ismertetendő grafikus ábrák és az alábbiakban közölt információelméleti eredményeken alapuló becslések is.

Az osztályközök száma megbecsülhető a következő módon. Az osztályközök száma azon legkisebb k, melyre már teljesül:

ahol k : az osztályközök száma,

Page 45: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

37

N: a sokaság elemszáma.

Az osztályközök számának ismeretében az osztályközök hosszát – egyenlő hosszúságú osztályközök esetén – az alábbi módon határozhatjuk meg:

ahol h: az osztályköz hossza,

a legnagyobb ismérvérték,

a legkisebb ismérvérték.

Az osztályközök számának és hosszának meghatározásához megismert módszerek nem minden esetben alkalmazható és követendő szabályok.

Ezek csak támpontot adnak, és alkalmazásuk olyan esetben célszerű, amikor az különbség nem túl nagy, és az ismérvértékek zöme nem

az intervallum egy szűkebb szakaszán sűrűsödik.

A lakások vízfogyasztásának rangsorából (2.2. táblázat) látható, hogy e feltételek teljesülnek, így a fenti módszereket alkalmazva az osztályközökszáma meghatározható. Mivel

elegendő az ismérvértékeket 6 osztályközbe sorolni.

Az osztályközök hossza:

Így a gyakorisági (relatív gyakorisági) sor a 2.6. táblázatban látható:

2.6. táblázat - A lakások vízfogyasztás szerinti megoszlása

Vízfogyasztás

(m3)

Lakások

száma

Vízfogyasztás

(m3)

Lakások %-os

megoszlása– 15 5 – 15 10

Page 46: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

38

16 – 20

21 – 25

26 – 30

31 – 35

36 –

16

15

6

5

3

16 – 20

21 – 25

26 – 30

31 – 35

36 –

32

30

12

10

6Összesen 50 Összesen 100

A gyakorisági sorok készítésénél azonban nem törvényszerű az egyenlő hosszúságú osztályközök képzése. A gyakorlatban sokszor különböző(egyenlőtlen) hosszúságú osztályközöket képezünk, hogy a megoszlásban mutatkozó szabályszerűség felismerhető legyen. Erre általában akkor

kerül sor, ha az különbség igen nagy és az ismérvértékek nem egyenletesen helyezkednek el az intervallumon belül, hanem zömmelaz intervallum egy vagy néhány szűkebb szakaszán sűrűsödnek. Ilyen esetben kevésbé hosszú osztályközöket képezünk az intervallum azonszakaszán, ahol az ismérvértékek zöme található, és hosszabbakat az intervallum más szakaszain. Különböző hosszúságú osztályközöket képezünkpéldául, ha a lakossági devizaszámlákat vagy betétkönyveket csoportosítjuk a betétösszeg nagysága szerint. A legnagyobb és legkisebb betétösszegközötti különbség igen nagy, és jellemző, hogy a kisebb betétösszegek nagyobb gyakorisággal, a nagyobb betétek kisebb gyakorisággal fordulnak

elő. Így az intervallum alsó szakaszán kisebb hosszúságú, a felső szakaszán nagyobb hosszúságú osztályközöket képezünk.

Ezt a megoldást választjuk a népesség 1 főre jutó jövedelem szerinti, illetve a nyugdíjasok nyugdíjnagyság szerinti csoportosításánál is.

A 2.7. táblázat szerinti – és az előző gyakorisági sorokban is – az első és utolsó (alsó és felső) osztályköz ún. nyitott osztályköz. A továbbiszámítások, elemzések során ezeket úgy kezeljük, mintha zártak lennének. Az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az

őt követőt az utolsót pedig, mint az őt megelőzőt

Kumulált gyakorisági sorok

A gyakorisági (relatív gyakorisági) sorokban rejlő információk tovább bővíthetők a gyakoriságok (relatív gyakoriságok) halmozott összeadásával,azaz kumulálásával.

2.7. táblázat - A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában

Nyugdíj

(Ft)

Nyugdíjas nők

száma (fő)

Osztályközök hossza

Page 47: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

39

– 5 999

6 000 – 6 999

7 000 – 7 999

8 000 – 8 999

9 000 – 9 999

10 000 – 11 999

12 000 – 14 999

15 000 – 19 999

20 000 – 24 999

25 000 –

478

998

46 162

87 555

201 385

258 245

522 029

112 483

23 027

7 388

?

1000

1000

1000

1000

2000

3000

5000

5000

?Összesen 1 259 750 –

A kumulált gyakoriságok (jele: ), ill. kumulált relatív gyakoriságok (jele: ) adatai azt mutatják, hogy az adott osztályköz felső határának

megfelelő és annál kisebb ismérvértékek hányszor , ill. milyen arányban fordulnak elő. A kumulált gyakorisági, ill. kumulált relatív gyakorisági

sort úgy képezzük, hogy a gyakoriságokat , ill. relatív gyakoriságokat rendre halmozva összeadjuk.

A kumulált gyakoriságok (relatív gyakoriságok) számítását a lakások vízfogyasztására vonatkozó példa alapján mutatjuk be (2.8. táblázat).

2.8. táblázat - A társasház vízfogyasztására vonatkozó adatok

Lakások száma Lakások megoszlása (%)

Vízfogyasztás

(m3)tényleges kumulált

tényleges

( )

kumulált

( )– 15

16 – 20

5

16

5

21

10

32

10

42

Page 48: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

40

21 – 25

26 – 30

31 – 35

36 –

15

6

5

3

36

42

47

50

30

12

10

6

72

84

94

100Összesen 50 – 100 –

Például:

A lakások 72%-ában – összesen 36 lakásban – a vízfogyasztás 25 m3 vagy annál kevesebb.

A gyakorisági (relatív gyakorisági) sorokból lefelé kumulált gyakorisági (relatív gyakorisági) sor is képezhető. E sorok adatai azt mutatják, hogy

az adott osztályköz alsó határánál nagyobb ismérvértékek hányszor , ill. milyen arányban fordulnak elő (2.9. táblázat).

2.9. táblázat - A társasház vízfogyasztására vonatkozó adatok

Lakások száma Lakások megoszlása (%)

Vízfogyasztás

(m3)

tényleges lefelé kumulált tényleges

( )

lefelé kumulált

( )– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

5

16

15

6

5

3

50

45

29

14

8

3

10

32

30

12

10

6

100

90

58

28

16

6

Page 49: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

41

Összesen 50 – 100 –

Például:

A lakások 58%-ának – összesen 29 lakásnak – a vízfogyasztása 20 m3-nél nagyobb.

2.1.3. ÉrtékösszegsorAz előző alfejezetben a sokaság egységeit mennyiségi ismérv szerint osztályoztuk. Az osztályozás eredménye a gyakorisági sor, ami a mennyiségisorok egyik típusa. A másik típus az értékösszegsor.

Az értékösszegsor (2.10. táblázat) a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységekismérvértékeinek összegét rendeli.

A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (jele: ) nevezzük.

2.10. táblázat - Az értékösszegsor általános sémája

a) változat (eloszlás) b) változat (megoszlás)

Ismérvérték Értékösszeg Az osztályközök Értékösszeg

alsó határa felső határa

Összesen S Összesen S

ahol az i-edik osztályhoz (osztályközhöz) rendelt értékösszeg,

Page 50: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

42

S : a sokaság teljes értékösszege.

Eloszlás esetén az egyes osztályokhoz tartozó értékösszegeket az ismérvértékek és a gyakoriságok szorzataként kapjuk:

A sokaság teljes értékösszege:

A következő gyakorisági sor valamely település háztartásainak taglétszám szerinti megoszlását mutatja (a megfigyelés időpontjában) (2.11. táblázat).

2.11. táblázat - A település háztartásainak taglétszám szerinti eloszlása

Taglétszám (fő) Háztartások száma

1

2

3

4

5

6

51

89

145

85

34

21Összesen 425

A gyakorisági sor alapján képzett értékösszegsort pedig a 2.12. táblázatban látjuk.

2.12. táblázat - A település lakosainak eloszlása az egyes háztartások taglétszáma szerint

Taglétszám (fő) Lakosok száma (fő)

Page 51: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

43

1

2

3

4

5

6

51

178

435

340

170

126Összesen 1300

Például:

fő. Összesen 435 fő él 3 fős háztartásban.

fő. A település lakosainak száma 1300 fő.

Osztályközös gyakorisági sor esetén az egyes osztályközök tényleges értékösszegei csak akkor határozhatók meg, ha ismerjük az eloszlást.

A vízfogyasztás rangsora (adatok a 2.2. táblázatban) alapján a tényleges értékösszegsort a 2.13. táblázat mutatja.

2.13. táblázat - Az összes vízfogyasztás megoszlása

Vízfogyasztás Összes vízfogyasztás (m3)

(m3)

– 15

16 – 20

21 – 25

26 – 30

31 – 35

62

287

337

166

161

Page 52: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

44

36 – 112Összesen 1125

Például: (a rangsorból az ötödik osztályközbe sorolt ismérvértékek összege).

A sokaság teljes értékösszege:

. A társasház összes vízfogyasztása 1125 m3.

Ha csak az osztályközös gyakorisági sor (a megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok és az osztályközepek szorzataként becsüljük.

Az i-edik osztályközépső:

Az értékösszegek becslését a lakások vízfogyasztás szerinti megoszlását mutató osztályközös gyakorisági sorból (2.6. táblázat) végezzük.

2.14. táblázat - Munkatábla az osztályközép meghatározásához

Vízfogyasztás

(m3)

Lakások száma Osztályközök

hossza

Osztályközép

– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

5

16

15

6

5

3

5

5

5

5

5

5

12,5

17,5

22,5

27,5

32,5

37,5Összesen 50 – –

Page 53: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

45

A gyakorisági sor első és utolsó osztályköze nyitott, de a gyakorisági sor alapján végzett számítások során azokat úgy kezeljük, mintha zártaklennének:

Az osztályközepek meghatározásánál nem vesszük figyelembe az egyértelmű besorolás érdekében megkülönböztetett felső és alsóosztályközhatárokat, hanem a hézagmentesen illeszkedő, ún. valódi osztályközhatárok alapján számítjuk ki őket. Pl.

2.15. táblázat - Az összes vízfogyasztás megoszlásaVízfogyasztás Összes vízfogyasztás (m3)

(m3)

– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

62,5

280,0

337,5

165,0

162,5

112,5Összesen 1120,0

Például:

A 2.14. és 2.15. táblázat adataiból látható, hogy a tényleges és becsült értékösszegek eltérnek egymástól. Az eltérés abból adódik, hogy a becsléssorán az ötödik osztályközben feltételezzük pl., hogy az ide besorolt lakások mindegyike 32,5 m3 (az osztályközépnek megfelelő) vizet fogyaszt.

Az osztályközös gyakorisági sor alapján történő becslés annál jobban közelíti meg a tényleges értékösszegeket, minél egyenletesebb azismérvértékek eloszlása az osztályközökön belül.

Page 54: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

46

Ha az értékösszegek – ismérvértékek szerinti – megoszlásáról is képet akarunk kapni, akkor relatív értékösszegsort képezünk.

Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét ( ) a teljesértékösszeghez (S) viszonyítja.

Az i-edik osztály relatív értékösszege (jele: ):

A relatív értékösszegekre is igaz, hogy

A 2.15. táblázat alapján a relatív értékösszegsor (2.16. táblázat):

2.16. táblázat - Az összes vízfogyasztás megoszlása

Vízfogyasztás

(m3)

Összes vízfogyasztás

megoszlása (%) – 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

5,6

25,0

30,1

14,7

14,5

10,1Összesen 100,0

A gyakorisági sorokhoz hasonlóan az értékösszegsorból és a relatív értékösszegsorból is képezhetünk kumulált, ill. lefelé kumulált sorokat (2.17.táblázat).

Page 55: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

47

2.17. táblázat - A társasház vízfogyasztására vonatkozó adatok

Összes vízfogyasztás (m3) Összes vízfogyasztásmegoszlása (%)

Vízfogyasztás

(m3)

Kumulált

( )

Lefelé

kumulált

( )

Kumulált

( )

Lefelé

kumulált

( )– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

62,5

280,0

337,5

165,0

162,5

112,5

62,5

342,5

680,0

845,0

1007,5

1120,0

1120,0

1057,5

777,5

440,0

275,0

112,5

5,6

25,0

30,1

14,7

14,5

10,1

5,6

30,6

60,7

75,4

89,9

100,0

100,0

94,4

69,4

39,3

24,6

10,1Összesen 1120,0 – – 100,0 – –

Például:

A társasházban elfogyasztott vízmennyiség 60,7%-át – összesen 680 m3-t – azokban a lakásokban használták fel, amelyekben a vízfogyasztás25 m3 és annál kisebb volt.

2.1.4. A gyakorisági sorok grafikus ábrázolásaA statisztikai adatok szemléltetésének, a statisztikai adatok közötti arányok bemutatásának fontos eszköze a grafikus ábrázolás. A helyesenkészített ábrákkal áttekinthetőbbé válik a sokaság szerkezete, felismerhetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozószabályszerűség.

A gyakorisági (relatív gyakorisági) sorok ábrázolása derékszögű koordináta-rendszerben történik. A vízszintes tengelyen a mennyiségi ismérvértékeit, a függőleges tengelyen pedig a gyakoriságokat (relatív gyakoriságokat) vagy azok kumulált értékeit tüntetjük fel.

Page 56: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

48

A kevés értéket felvevő diszkrét mennyiségi ismérvek esetén csak az ábrázolni kívánt gyakoriságokkal (relatív gyakoriságokkal) arányos hosszúságú,valamilyen feltűnő módon megjelölt végpontú egyenes szakaszokkal történhet az ábrázolás. Az ilyen típusú ábrát az eloszlás bot-ábrájánaknevezzük.

A 2.11. táblázat adatai alapján készített bot-ábra a 2.1. ábrán látható:

2.1. ábra - A háztartások taglétszám szerinti eloszlásának bot-ábrája

A 2.1. ábra jellege nem változna meg, ha a függőleges tengelyen az abszolút gyakoriságok helyett a relatív gyakoriságok szerepelnének.

Az osztályközös gyakorisági sorokat, amelyeket leggyakrabban folytonos mennyiségi ismérv szerinti csoportosítással képezünk, hisztogrammal ésgyakorisági poligonnal ábrázoljuk.

A hisztogram hézagmentesen egymás mellé illesztett téglalapokkal szemlélteti a gyakorisági (relatív gyakorisági) sort. (Mi a relatív gyakoriságokalapján készítettük a 2.2. ábrát.)

Page 57: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

49

2.2. ábra - A lakások vízfogyasztás szerinti megoszlásának hisztogramja

A kumulált gyakorisági (relatív gyakorisági) sorok is szemléltethetők (2.3. ábra).

Page 58: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

50

2.3. ábra - A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok

A hisztogram téglalapjainak területe arányos a relatív gyakoriságokkal, így a gyakoriságokkal is. A különböző osztályközhosszúságokkal képzettgyakorisági (relatív gyakorisági) sor ábrázolásánál az arányosság csak úgy biztosítható, ha az eredeti gyakoriságok (relatív gyakoriságok) helyett

az egységnyi osztályközhosszúságra jutó gyakoriságokat relatív gyakoriságokat vagy azok valamilyen többszörösét ábrázoljuk. Az eredetigyakoriságok (relatív gyakoriságok) alapján történő ábrázolás ugyanis torzítana, mivel a hosszabb osztályköz nagyobb súlyt kapna, a téglalap területeaz arányosnál nagyobb lenne. Ennek bemutatására szolgál a következő példa. Az adatokat a 2.18. táblázat tartalmazza.

2.18. táblázat - Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint

Biztosítás

díja (Ft)

Biztosítások

száma (db)

Osztályközök

hossza1000 osztályközhosszúságra

jutó gyakoriság

– 2000

2001 – 3000

15

50

1000

1000

15,0

50,0

Page 59: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

51

3001 – 4000

4001 – 6000

6001 – 8000

8001 – 10 000

10 001 –

60

80

25

15

5

1000

2000

2000

2000

2000

60,0

40,0

12,5

7,5

2,5Összesen 250 – –

Az 1000 osztályközhosszúságra jutó gyakoriság: Pl. a negyedik osztályközben: (A hisztogramot a 2.4. ábra mutatja.)

Ha a relatív gyakoriságokat úgy ábrázoljuk, hogy az osztályköz az egység vagy a téglalapok magassága ( ), akkor a téglalapok összterülete1. Ebben az esetben sűrűséghisztogramról beszélünk.

A kumulált relatív gyakoriságok ábrázolásánál monoton növekvő függvényt kapunk, amelynek legkisebb értéke 0 és a legnagyobb 1 (százalékosformánál 100). Ilyen függvényt közvetlenül az eloszlásból is készíthetünk, ekkor eloszlásfüggvénynek nevezzük.

A gyakorisági poligon az osztályközepeknél felmért gyakoriságok (a különböző hosszúságú osztályközöknél az egységnyi osztályközhosszúságrajutó gyakoriságok) pontjait összekötő, egyenes szakaszokból álló vonaldiagram. Az első és utolsó pontot összekötjük az X tengelyen az elsőosztályközt megelőző (azzal azonos hosszúságú) osztályköz, ill. az utolsó osztályközt követő (azzal azonos hosszúságú) osztályköz középpontjával.

Page 60: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

52

2.4. ábra - A biztosítások biztosítási díj szerinti megoszlásának hisztogramja

Page 61: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

53

2.5. ábra - A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja

Page 62: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

54

2.6. ábra - A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja

A 2.5 és 2.6. grafikus ábrák szemléletesen mutatják a gyakorisági eloszlás jellegzetességeit.

A következő alfejezetekben megismerkedünk azokkal a mutatószámokkal, amelyek további és egyben valamilyen számszerű információt nyújtanaka gyakorisági sorok jellegzetességeiről, az eloszlás helyzetéről, szóródásáról és alakjáról. E mutatószámok alapján, majd később látni fogjuk,akkor is képet kapunk az eloszlásról, ha nem állnak rendelkezésre az alapadatok és/vagy a grafikus ábrák.

Az eloszlás helyzete: a jellemzőnek tartott értékek – a középértékek (módusz, medián, átlag) és a kvantilisek – helye az X tengelyen. E mutatókatezért helyzetmutatóknak is szokás nevezni.

Az eloszlás szóródása: az ismérvértékek különbözősége, változékonysága, melyet a szóródás mérőszámaival vizsgálunk.

Az eloszlás alakja: szimmetrikus vagy aszimmetrikus, melyről az aszimmetriamérőszámai (alakmutatók) adnak számszerű információt.

2.1.5. HelyzetmutatókMódusz

A módusz (jele: Mo) azt az értéket jelöli, amelyik a szó hétköznapi értelmében a legáltalánosabb, amelyik a tipikus a sokaságban. Ezért tipikusértéknek is szokásnevezni .

Page 63: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

55

Az eloszlás módusza a leggyakrabban előforduló ismérvérték, ha van ilyen érték.

A 2.11. táblázat (a háztartások taglétszám szerinti megoszlása) adataiból :

Mo = 3

A háztartások tipikus (leggyakoribb) taglétszáma 3 fő.

A gyakorisági megoszlás ún. nyers módusza a gyakorisági poligon maximumhelye, az az ismérvérték, amely körül az előforduló ismérvértékeklegjobban sűrűsödnek.

2.7. ábra -

A 2.7. ábrán látható gyakorisági poligonnak egy maximumhelye van. Az ilyen megoszlást (illetve eloszlást) egymóduszú megoszlásnak, illetveeloszlásnak nevezzük, és a móduszt mint helyzetmutatót elsősorban ilyen megoszlások, illetve eloszlások jellemzésére használjuk.

Ha a gyakorisági poligonnak több helyi maximuma van, a megoszlást, illetve az eloszlást többmóduszú megoszlásnak, illetve eloszlásnaknevezzük. Ilyen eloszlást szemléltet a 2.8. ábra.

Page 64: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

56

2.8. ábra -

A többmóduszú eloszlások gyakran heterogén (nem egynemű) sokaságra utalnak, azaz az eloszlás több (a 2.8. ábrán kettő) egymóduszú eloszlástmutató részsokaságból tevődik össze. Ilyen esetben a teljes sokaság vizsgálata mellett – ha a heterogenitást okozó ismérv ismert – a sokaságotrészsokaságokra bonthatjuk, és az elemzést a részekre bontott sokaságokra is elvégezhetjük. Ennek részleteiről a 3. fejezetben lesz szó.

A folytonos (és a sok változattal rendelkező diszkrét) mennyiségi ismérv móduszát osztályközös gyakorisági sor alapján becsüljük.

A móduszt az az osztályköz tartalmazza, amelyben az egységnyi osztályközhosszúságra jutó gyakoriság (relatív gyakoriság) a legnagyobb. (Azismérvértékek sűrűsége, tömörülése ebben az osztályközben a legnagyobb.) A móduszt tartalmazó osztályközt modális osztályköznek nevezzük.

Azonos hosszúságú osztályközök esetén ez a legnagyobb gyakoriságú (relatív gyakoriságú) osztályköz. Különböző hosszúságú osztályközök eseténaz egységnyi osztályközhosszúságra jutó gyakoriságok (relatív gyakoriságok) alapján keressük meg a modális osztályközt.

A modális osztályköz közepét nyers módusznak nevezzük. Ha szimmetrikus a megoszlás, akkor a nyers módusz maga a módusz.

Ha nem szimmetrikus a megoszlás, akkor a módusz becsléséhez a modális osztályközzel szomszédos osztályközök gyakoriságát is figyelembevesszük. Ebben az esetben ugyanis a módusz közelebb van valamelyik osztályközhatárhoz. Feltételezhető, hogy a sűrűsödési hely közelebb esika modális osztályköz azon (alsó vagy felső) határához, amelynek nagyobb a gyakorisága.

A módusz becsült értéke:

ahol: a modális osztályköz alsó határa,

Page 65: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

57

a modális és az azt megelőző osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,

a modális és az azt követő osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,

h : a modális osztályköz hossza.

A módusz becslését a lakások vízfogyasztásának gyakorisági sora alapján mutatjuk be (adatok a 2.6. táblázatban):

– modális osztályköz: 15–20 m3,

– osztályközök azonos hosszúságúak,

(mivel ezért a módusz az osztályköz felső határához esik közelebb),

A lakások tipikus vízfelhasználása 19,6 m3.

A tipikus vízfelhasználás becslése a relatív gyakorisági sor alapján (adatok a 2.6. táblázatban):

Page 66: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

58

2.9. ábra - A lakások vízfogyasztás szerinti megoszlása

A módusz grafikus úton is becsülhető. A gyakorisági (relatív gyakorisági) sor jól szerkesztett hisztogramjának segítségével a módusz becsült értékeszerkeszthető. A 2.9. ábrán két hasonló háromszöget látunk:

Ebből:

A módusz becslését különböző hosszúságú osztályközös gyakorisági sor alapján is bemutatjuk.

A lakások tipikus biztosítási díjának becslése (adatok a 2.18. táblázatban):

Az egységnyi (1000) osztályközhosszúságra jutó gyakoriságok alapján a modális osztályköz: 3000 – 4000 Ft;

Page 67: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

59

Medián

A medián (jele: Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint nagyobb érték fordul elő. A grafikus ábrákra gondolva,az X tengelyen az a pont, melyben az X tengelyre állított merőleges a hisztogram területét, illetve a gyakorisági poligon alatti területet felezi (kétegyenlő részre osztja).

A mediánnak van egy érdekes tulajdonsága. Ha minden ismérvértéket a mediánnal helyettesítenénk, akkor ezzel összességében a lehető legkisebb

hibát követnénk el, ha ezt a hibát az módon mérjük. Igaz ugyanis, hogy a

A mediánt az ismérvértékek rangsorából a következő módon határozzuk meg:

– Ha a megfigyelt sokaság elemszáma (N) páratlan, akkor a medián a rangsor

(azaz a középső) ismérvértékével azonos.

– Ha a sokaság elemszáma páros, akkor a a medián a két középső, azaz az

ismérvérték számtani átlaga.

A társasház vízfogyasztásának rangsora (2.2. táblázat) alapján a medián a következő módon számítható.

A megfigyelt lakások száma:

Page 68: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

60

Tehát a medián a rangsor 25. és 26. ismérvértékének átlaga. A rangsor 25. ismérvértéke: 21 m3, a 26. ismérvértéke: 22 m3.

A lakások felében (50%-ában) a vízfogyasztás 21,5 m3-nél kevesebb, másik felében (50%-ában) ennél több.

Az osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt csak becsléssel tudjuk meghatározni.

A mediánt az az i-edik osztályköz tartalmazza, amelynél

teljesül, ahol: az i-edik osztályköz kumulált gyakorisága,

az i-edik osztályköz kumulált relatív gyakorisága,

az i-edik osztályközt megelőző osztályköz kumulált gyakorisága,

az i-edik osztályközt megelőző osztályköz kumulált relatív gyakorisága.

Feltételezve, hogy a mediánt tartalmazó osztályközön belül az ismérvértékek egyenletesen helyezkednek el, az osztályköz arányos részét azosztályköz alsó határához hozzáadva, a mediánra megfelelő becslést kapunk.

ahol: a mediánt magába foglaló osztályköz alsó határa,

a mediánt megelőző osztályköz kumulált gyakorisága,

a mediánt megelőző osztályköz kumulált relatív gyakorisága,

Page 69: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

61

a mediánt magába foglaló osztályköz gyakorisága,

a mediánt magába foglaló osztályköz relatív gyakorisága,

h: a mediánt magába foglaló osztályköz hossza.

A medián becslését a vízfogyasztás gyakorisági sora alapján mutatjuk be (2.19. táblázat).

2.19. táblázat - Munkatábla a medián becsléséhez

Vízfogyasztás

(m3)– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

5

16

15

6

5

3

5

21

36

42

47

50

0,10

0,32

0,30

0,12

0,10

0,06

0,10

0,42

0,72

0,84

0,94

1,00Összesen 50 – 1,00 –

A harmadik osztályköz kumulált gyakorisága az első, amely már meghaladja a 25-öt, így a medián a közötti intervallumban van.

A medián becsült értéke:

illetve a relatív gyakoriságok alapján:

Page 70: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

62

A gyakorisági sor alapján becsült érték (21,33 m3) jól közelíti a medián rangsor alapján meghatározott értékét (21,5 m3).

Az átlag

Az eloszlás helyzetének jellemzésére leggyakrabban az átlagot(jele: ) használjuk.

Az ismérvértékek átlaga egyenlő az ismérvértékek összegének és a sokaság elemszámának hányadosával, mely hányados azismérvértékek számtani átlaga.

A számtani átlag definíciója alapján könnyen belátható, hogy ha minden ismérvértéket az átlaggal helyettesítünk, akkor ezek összege egyenlő azeredeti értékek összegével:

A vízfogyasztás rangsora (2.2. táblázat) alapján a lakások átlagos vízfogyasztása:

Az ismérvértékek átlagát nemcsak az alapadatokból kiindulva, hanem

– a sokasághoz tartozó értékösszegből,

– egy gyakorisági sor adataiból, vagy

– egy értékösszegsor adataiból is számíthatjuk.

Az első esetben az átlag:

Page 71: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

63

ahol S: a sokaság teljes értékösszege.

Példánkban a társasház összes vízfogyasztása: így az átlagos vízfogyasztás:

Gyakorisági sor alapján az ismérvértékek átlagát súlyozott számtani átlagformában számítjuk.

ahol az átlagolni kívánt ismérvértékek (osztályközös gyakorisági sor esetén az osztályközepek),

az egyes osztályokhoz (osztályközökhöz) tartozó gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.

A megoszlásból az osztályközepekkel történő számítás esetén az eloszlás átlagára becsült értéket kapunk.

2.20. táblázat - Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok

Biztosítási díj

(Ft)

Biztosítások

száma (db)

– 2000

2001 – 3000

3001 – 4000

4001 – 6000

6001 – 8000

8001 – 10 000

10 001 –

15

50

60

80

25

15

5

1 500

2 500

3 500

5 000

7 000

9 000

11 000

0,06

0,20

0,24

0,32

0,10

0,06

0,02

Page 72: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

64

Összesen 250 – 1,00

Az átlagos biztosítási díj (átlagdíj):

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem az aránya befolyásolja, ezért súlyként a gyakoriságok helyett használhatók

a relatív gyakoriságok is.

Az átlagos biztosítási díj:

A számításokat a 2.20. táblázat adatainak felhasználásával végeztük.

Az ismérvértékek átlagát az értékösszegsorból súlyozott harmonikusátlag formában számítjuk. Mivel

ahol az i-edik osztály (osztályköz) értékösszege, ezért az átlag a következő formában is számítható:

mely nem más, mint az értékek (osztályközepek) súlyokkal számított harmonikus átlaga. Mivel az átlag nagyságát a súlyarányok befolyásolják,

ezért súlyként az értékösszegek helyett az hányadosok, azaz a relatív értékösszegek is használhatók:

Page 73: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

65

A lakásbiztosításokra vonatkozó példa alapján (2.21. táblázat):

2.21. táblázat - Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok

Biztosítási Összes bevétel

díj (Ft) (Ft) megoszlása (%) – 2000

2001 – 3000

3001 – 4000

4001 – 6000

6001 – 8000

8001 – 10 000

10 001 –

1500

2500

3500

5000

7000

9000

11 000

22 500

125 000

210 000

400 000

175 000

135 000

55 000

2,00

11,14

18,71

35,63

15,59

12,03

4,90Összesen – 1 122 500 100,00

Az átlagos biztosítási díj:

Page 74: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

66

Kvantilisek

A középértékek mellett fontos helyzetmutatók a kvantilisek.

Legyen 0 < q < 1. Ha a rangsorba rendezett sokaságot egy X ismérvérték arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy

q-adik kvantilisnek nevezzük (jele: ).

Kumulált gyakoriságokkal, illetve kumulált relatív gyakoriságokkal felírva:

Ha a feltételnek két ismérvérték is eleget tesz, akkor ezen intervallumot arányban osztó pont lesz.

A gyakran előforduló kvantiliseket külön névvel és jelöléssel is illetjük.

Tercilisek: (alsó tercilis), (felső tercilis),

Kvartilisek: (alsó kvartilis), (medián), (felső kvartilis),

Kvintilisek:

Decilisek: ...,

Percentilisek: ...,

A kvartilisek – és egyben az összes kvantilis – rangsorból való meghatározásának és osztályközös gyakorisági (relatív gyakorisági) sorból történőbecslésének menete azonos a mediánnál ismertetett eljárással.

Ha a kvantilist a rangsorból kiindulva határozzuk meg, akkor legyen

ahol: az egész részt, a törtrészt jelöli.

Page 75: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

67

Ekkor:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a kvartilisek meghatározása a következő.

Az alsó kvartilis számítása:

A szám egész része: törtrésze: Az alsó kvartilis tehát a rangsor 12. és 13. értéke között van; úgy határozzuk meg, hogy a rangsor 12.

ismérvértékéhez, az hozzáadjuk a 13. és 12. ismérvérték közötti különbség 0,75-szeresét:

A lakások 25%-ában a vízfogyasztás 17,75 m3-nél kevesebb, 75%-ában ennél több.

A felső kvartilis:

így és

A rangsor 38. ismérvértékéhez hozzáadjuk a 39. és 38. ismérvérték közötti különbség 0,25-szeresét:

A lakások 75%-ának a vízfogyasztása 26,25 m3-nél kevesebb, 25%-ának ennél nagyobb.

Osztályközös gyakorisági (relatív gyakorisági) sorból történő becslés esetén a kvantilist az az i-edik osztályköz tartalmazza, amelyre

illetve relatív gyakorisági sor esetén a

Page 76: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

68

teljesül. Ekkor

ahol az i-edik osztályköz alsó határa,

az i-edik osztályköz hossza.

A kvartilisek becslését a vízfogyasztás gyakorisági sora (adatok a 2.19. táblázatban) alapján mutatjuk be.

Az alsó kvartilis becslése:

Az és a második osztályközben a kumulált gyakoriság már nagyobb, mint 12,5. Így az alsó kvartilis 15–20 m3 között van.

A felső kvartilis becslése:

A kumulált gyakoriság először a negyedik osztályközben nagyobb, mint 37,5. Ezért a felső kvartilis m3 között van.

(A gyakorisági sorból történő becslés – már a mediánnál is láttuk – elfogadható pontosságú.)

A kvantilisek jól szerkesztett ábra – a kumulált gyakoriságok (relatív gyakoriságok) hisztogramja – alapján is becsülhetők (2.10. ábra).

Page 77: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

69

2.10. ábra - A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése

A lakossági jövedelmek vizsgálatánál gyakran a deciliseket számítjuk ki. A 2.7. táblázat a nyugdíjas nők nyugdíjnagyság szerinti megoszlását mutatja.A gyakorisági sorból a kvartilisek becslésénél megismert módon becsülhetjük a deciliseket is.

Az első decilis becslése:

A negyedik osztályközben a kumulált gyakoriság ennél nagyobb, így Ebből:

A nyugdíjas nők 10%-ának nyugdíja 8894 Ft-nál kisebb, 90%-ának ennél nagyobb volt 1994 áprilisában.

Page 78: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

70

Az ötödik decilis (medián) becslése:

A nyugdíjas nők 50%-ának a nyugdíja 12 200 Ft-nál kevesebb, 50%-ának pedig több volt 1994 áprilisában. (A tehát valóban a mediánnal azonos.)

A többi decilist is hasonló módon kiszámítva (becsülve), az eredményeket sorba rendezve egy speciális gyakorisági (relatív gyakorisági) sort, ún.deciliseloszlást képezhetünk, melyet a 2.22. táblázat tartalmaz.

2.22. táblázat - A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)

Nyugdíj Nyugdíjas nők Nyugdíj Nyugdíjas nők(Ft) száma (fő) (Ft) megoszlása (%)

– 8894

8894 – 9579

9579 – 10 319

10 319 – 11 295

11 295 – 12 200

12 200 – 12 924

12 924 – 13 648

13 648 – 14 372

14 372 – 15 751

15 751 –

125 975

125 975

125 975

125 975

125 975

125 975

125 975

125 975

125 975

125 975

– 8894

8894 – 9579

9579 – 10 319

10 319 – 11 295

11 295 – 12 200

12 200 – 12 924

12 924 – 13 648

13 648 – 14 372

14 372 – 15 751

15 751 –

10

10

10

10

10

10

10

10

10

10Összesen 1 259 750 Összesen 100

Page 79: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

71

A fenti osztályközös gyakorisági sorokban az osztályközök határai a decilisek, az osztályközök gyakorisága (relatív gyakorisága) pedig azonos.

Például a hetedik osztályköz alsó határa: a felső határa: 125 975 főnek, a nyugdíjas nők 10%-ának a nyugdíja 12 924 és13 648 Ft között volt, 70%-ának a nyugdíja pedig 13 648 Ft-nál kevesebb volt 1994 áprilisában.

Az olyan – nem egyenlő hosszúságú osztályközös gyakorisági (relatív gyakorisági) – sorokat, melyekben minden osztályköz gyakorisága (relatívgyakorisága) azonos és az osztályközhatárok a kvantilisek (kvartilis, kvintilis, decilis stb.), a gyakorlatban kvantilis eloszlásnak nevezzük. (Az eddighasznált terminológiák szerint indokoltabb lenne a kvantilis megoszlás elnevezés.)

2.1.6. Szóródási mutatókA középértékek és a kvantilisek csak egyetlen tulajdonságát rögzítik az eloszlásnak, az elhelyezkedését (a vízszintes tengelyen elfoglalt helyét).Ettől azonban a sokaság eloszlása még nagyon sokféle lehet.

2.11. ábra -

A 2.11. ábrán három eloszlás gyakorisági poligonját mutatjuk be. Mivel szimmetrikusak, az átlaguk, móduszuk és a mediánjuk ugyanakkora, mégislényegesen különböznek egymástól. Mi okozza az eltérést? Az, hogy az adatok szétszórtsága, ún. szóródása erősen különbözik az eloszlásokban.Az egyiknél az átlag körül tömörül az ismérvértékek zöme, a másiknál kevésbé, a harmadiknál teljesen szétszórtan helyezkednek el.

Page 80: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

72

Ahhoz, hogy a középérték jellemző erejét értékelni tudjuk, szükséges, hogy az ismérvértékek szóródásáról is legyen ismeretünk. Az olyan középérték,amely körül kicsi az ismérvértékek szóródása, jobb jellemzője a sokaságnak, mint az olyan, amelytől az egyes ismérvértékek nagymértékbenkülönböznek.

Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékeinek) különbözőségét értjük. Önmagában tehát azt atényt jelenti, hogy pl. a megfigyelt társasház lakásainak vízfogyasztása különböző nagyságú.

Az ismérvértékek szóródásáról a gyakorisági sor és a grafikus ábrák is adnak információt, emellett azonban szükség van a szóródás mérésére, aszóródás jelenségének egyetlen számértékben való tömörítésére.

A szóródás mérése az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései vagy egymás közötti különbségeialapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezika megfigyelt ismérv mértékegységével.

A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől (általában %-os formában fejezzük ki őket), aszóródás térbeli vagy időbeli összehasonlítására szolgálnak.

Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát (ha minden ismérvérték egyenlő) nullával, meglétét pedig valamilyen nullátólkülönböző pozitív értékkel jelzi.

A leggyakrabban használt szóródási mérőszámok:

– a szóródás terjedelme,

– az átlagos eltérés,

– a szórás,

– az átlagos különbség és

– a relatív szórás.

A szóródás terjedelme

A szóródás terjedelme (jele: R) az előforduló legnagyobb és legkisebbismérvérték különbsége:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):

Page 81: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

73

A terjedelem a szóródásnak igen szemléletes kifejezője (pl. egy adott termék legkisebb és legnagyobb fogyasztói árának különbsége, vagy egy adottévben befizetett legkisebb és legnagyobb személyi jövedelemadó különbsége), a gyakorlatban mégis kevésbé használatos a szóródás mérésére.Ennek az az oka, hogy értékét a véletlen szerepe számottevően befolyásolhatja, mivel nagysága csak a két legszélsőségesebb ismérvértéktől függ.Ezért gyakran használják a terjedelem helyett az ún. interkvantilis terjedelemmutatókat is, amelyek két szélső kvantilis különbségével azonosak(pl. az első és kilencedik decilis vagy az alsó és felső kvartilis különbsége).

Átlagos eltérés

Az átlagos eltérés (jele: δ) az ismérvértékek számtani átlagtól vett eltérésein alapul, ezen eltérések átlaga. Mivel az átlagtól vett

eltérések algebrai összege nulla – a számtani átlag első tulajdonsága, lásd 1.6. pont –, ezért az eltérések abszolút értékeit átlagoljuk.

Az átlagos eltérésaz egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga:

Az átlagos eltérés azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):

Az egyes lakások vízfogyasztása átlagosan 5,26 m3-rel tér el az átlagos fogyasztástól.

A gyakorisági sor adataiból az átlagos eltérést súlyozott formában számítjuk (osztályközös gyakorisági sor esetén becsüljük).

Page 82: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

74

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja, az átlagos eltérés számításánál súlyként a relatívgyakoriságok itt is használhatók.

A lakások vízfogyasztását vizsgáló példánkban (a részeredményeket a 2.23. táblázat tartalmazza):

illetve:

E mérőszámot a gyakorlatban viszonylag ritkán használjuk, mert az abszolút érték matematikailag elég nehézkesen kezelhető.

Szórás

A szórás (jele: ) a legfontosabb és egyben a leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett

eltérésein alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is „megszabadulhatunk”, hogy a eltéréseket négyzetre emeljük.

A értékekből tehát négyzetes átlagot számítunk.

A szórás az egyes értékek számtani átlagtól vett eltéréseinek négyzetes átlaga:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a szórás:

Page 83: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

75

Gyakorisági sor alapján a szórást súlyozott formában számítjuk (osztályközös gyakorisági sor alapján becsüljük). Súlyként a gyakoriságokat

vagy a relatív gyakoriságokat használjuk.

vagy

A szórás azt mutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól. Jelentése tehát ugyanaz, mint az átlagos eltérésé, mivel

mindkettő a eltérések átlaga. Az átlagos eltérés (δ) a értékek számtani, a szórás pedig a értékek négyzetes átlaga. Ugyanazonértékek különféle átlagainak az 1.6. alfejezetben megismert nagyságrendi viszonya miatt az átlagos eltérés mindig kisebb értékkel méri a szóródást,

mint a szórás .

A szórás súlyozott formában történő számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A fejrovatokba csak a már korábban megismertjelöléseket írjuk.) (2.23. táblázat.)

2.23. táblázat - Munkatábla az átlagos eltérés és a szórás számításához

Vízfogyasztás

(m3)– 15

16 – 20

21 – 25

26 – 30

31 – 35

36 –

5

16

15

6

5

3

0,10

0,32

0,30

0,12

0,10

0,06

12,5

17,5

22,5

27,5

32,5

37,5

62,5

280,5

337,5

165,0

162,5

112,5

– 9,9

– 4,9

– 0,1

5,1

10,1

15,1

49,5

78,4

1,5

30,6

50,5

45,3

98,01

24,01

0,01

26,01

102,01

228,01

490,05

384,16

0,15

156,06

510,05

684,03

9,8010

7,6832

0,0030

3,1212

10,2010

13,6806

Page 84: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

76

Összesen 50 1,00 – 1120,0 – 255,8 – 2224,50 44,4900

A szórás rangsor alapján számított (6,685 m3) és az osztályközös gyakorisági sor alapján becsült (6,67 m3) értéke közel esik egymáshoz.

Az egyes lakások vízfogyasztása átlagosan 6,7 m3-rel tér el az átlagos vízfogyasztástól.

A statisztikai elemző munkában – a következő fejezetben majd látni fogjuk – fontos szerepe van a szórás négyzetének is, amit szórásnégyzetnekvagy varianciának nevezünk és -tel jelölünk.

A variancia számlálója az eltérés-négyzetösszeg (jele: SS):

A szórás tulajdonságai

1. Ha az ismérvértékekhez hozzáadunk egy állandót (A), a szórás nem változik.

Tehát:

Mivel ilyenkor a számtani átlag is lesz2 2 , ezért

2. Ha az ismérvértékeket megszorozzuk egy állandóval (B), a szórás

2 Lásd az 1.6. pontbeli bizonyításokat.

Page 85: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

77

-szeresére változik.

Tehát:

Mivel ilyenkor a számtani átlag lesz2 , ezért

3. A szórás az eredeti értékek négyzetes és számtani átlaga alapján is meghatározható.

Átlagos különbség

Az átlagos eltérés és a szórás a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymásközötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini olasz statisztikus javasolta, ezért szokás Gini-félemérőszámnak is nevezni.

Page 86: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

78

Az átlagos különbség (jele: G) az ismérvértékek egymástól számított különbségei abszolút értékeinek számtani átlaga.

Mivel N db ismérvérték mindegyikének – önmagát is beleértve – N db ismérvértékkel vehetjük a különbségét, összesen különbség képezhető.Ezek abszolút értékeinek átlaga:

Gyakorisági sor alapján a mutatót súlyozott formában számítjuk (osztályközös gyakorisági sorból becsüljük).

Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Számítását a vízfogyasztás gyakoriságisora alapján mutatjuk be. (A 2.24. táblázatban kiszámított különbségek, illetve szorzatok az átlóra szimmetrikusak, ezért elegendő az átló alatti vagyfölötti különbségeket és szorzatokat kiszámítani és 2-vel szorozni.)

a) Az ismérvértékek különbségei:

Adatok: m3

12,5 17,5 22,5 27,5 32,5 37,5

12,5

17,5

22,5

27,5

32,5

37,5

0 5

0

10

5

0

15

10

5

0

20

15

10

5

0

25

20

15

10

5

0

Page 87: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

79

b) Az ismérvértékekhez tartozó súlyok szorzatai:

5 16 15 6 5 3

5

16

15

6

5

3

* 80

*

75

240

*

30

96

90

*

25

80

75

30

*

15

48

45

18

15

*c) Az előző táblák megfelelő rovatainak szorzatai:

Adatok: m3

12,5 17,5 22,5 27,5 32,5 37,5 Összesen

12,5

17,5

22,5

27,5

32,5

37,5

0 400

0

750

1200

0

450

960

450

0

500

1200

750

150

0

375

960

675

180

75

0

2475

4320

1875

330

75

0Összesen 0 400 1950 1860 2600 2265 9075

Az ismérvértékek különbségeinek összege a táblázat c) részében kapott szorzatösszeg kétszeresével azonos: 2 · 9075 = 18 150 m3.

Page 88: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

80

Az egyes lakások vízfogyasztása átlagosan 7,26 m3-rel tér el egymástól.

Relatív szórás

A szóródás eddig megismert mérőszámai a megfigyelt mennyiségi ismérv mértékegységében mérik a szóródást. Sok esetben szükség lehet arra,

hogy az értékek nagyságrendjétől és mértékegységétől elvonatkoztatott mérőszámmal mérjük és tegyük összehasonlíthatóvá a szóródást. Ilyenmérőszám a relatív szórás (jele: V):

Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük.

A képlet átalakításával belátható az is, hogy a relatív szórás az egyedi eltérések viszonylagos nagyságának, a hányadosoknak a négyzetesátlaga.

Ezért úgy is értelmezhető, hogy az egyes ismérvértékek átlagosan hány %-kal térnek el az átlagtól.

A lakások vízfogyasztására vonatkozó példánkban az átlagos vízfogyasztás 22,4 m3, a szórás pedig 6,67 m3 volt. A szóródás relatív mértéke :

A relatív szórást viszonyszámként értelmezve megállapíthatjuk, hogy a szórás az átlagnak közel 30%-a. Másként fogalmazva az egyes lakások

vízfogyasztása átlagosan 29,8%-kal tér el a 22,4 m3-es átlagtól. A értékek – %-ban kifejezve – rendre: 44,2; 21,9; 0,4; 22,8; 45,1 és 67,4.A relatív szórás ezen értékek közé esik.

Page 89: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

81

2.1.7. Az aszimmetria mérőszámaiAz előző alfejezetekben megismerkedtünk azokkal a grafikus ábrákkal, melyekkel a gyakorisági sorok (gyakorisági eloszlások, illetve megoszlások)szemléltethetők, illetve azokkal a mutatószámokkal (középértékek, kvantilisek, szóródási mutatók), amelyek a gyakorisági sorok helyzetéről ésszóródásáról számszerű információt nyújtanak.

A gyakorisági sorokat ábrázolva megállapítható, hogy a görbék (poligonok) igen változatosak lehetnek, de nagy többségük bizonyosszabályszerűséget mutat, így besorolható néhány jellegzetes típusba.

Az eloszlások következő típusaival foglalkozunk:

– egymóduszú eloszlás

– szimmetrikus,

– aszimmetrikus (vagy ferde);

– többmóduszú eloszlás.

Az egymóduszú gyakorisági sorok poligonjának egy helyi maximuma (csúcsa) van. A helyzetmutatók elhelyezkedésétől függően az eloszlásszimmetrikus és aszimmetrikus lehet. Az egymóduszú eloszlások jellegzetességeit a 2.25. táblázat tartalmazza.

2.25. táblázat - A szimmetrikus és aszimmetrikus eloszlások jellemzői

Szimmetrikus Aszimmetrikus eloszláseloszlás bal oldali jobb oldali

A társadalmi-gazdasági jelenségek körében a bal oldali aszimmetria a leggyakoribb. Például a lakossági megtakarítások nagyságának, avállalkozások nyereségének, a családok egy főre jutó jövedelmének eloszlása tipikusan bal oldali aszimmetriát mutat.

Page 90: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

82

A 2.25. táblázatból látható, hogy a már megismert grafikus ábrák (a hisztogram és a gyakorisági poligon), a középértékek és kvantilisek alapján azeloszlás típusát, az aszimmetria irányát meg tudjuk állapítani.

A továbbiakban olyan mutatókkal (mérőszámokkal) ismerkedünk meg, amelyek egy számba sűrítve kifejezésre juttatják az aszimmetria fennállását,irányát és fokát is. Arra a kérdésre kapunk választ, hogy milyen mértékűnek ítélhető a szimmetrikushoz képest a megoszlás aszimmetriája, másszóval ferdesége.

Az aszimmetria leggyakrabban használt mérőszámai a Pearson-féle mutatószám és az F mutató.

Az aszimmetria Pearson-féle mutatószáma (jele: A) a számtani átlag és a módusz egyes eloszlástípusok esetén jellemző nagyságrendi viszonyánalapul:

Az különbség nagysága a ferdeség fokán kívül a szóródás nagyságától is függ. Nagymértékű szóródás esetén ugyanis a különbség akkoris viszonylag nagy lehet, ha az aszimmetria viszonylag kisfokú. Ezért, ha a két középérték különbségét elosztjuk a szórással, olyan mérőszámotkapunk, melynek értékéből következtetni tudunk az aszimmetria mértékére. A mérőszám (önmagában a számláló) előjele az aszimmetria irányátmutatja. Bal oldali aszimmetria esetén , jobb oldali aszimmetria esetén Szimmetrikus eloszlás esetén A mérőszám abszolút értékéneknincs határozott felső korlátja, azonban már 1-nél nagyobb abszolút érték meglehetősen erős aszimmetriára utal.

A lakások vízfogyasztására vonatkozó példa alapján:

A lakások vízfogyasztás szerinti eloszlása mérsékelten bal oldali aszimmetriát mutat.

Az aszimmetria másik mérőszáma,az F mutató (jele: F) az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán

alapul. Bal oldali aszimmetria esetén a medián az alsó , jobb oldali aszimmetria esetén a felső kvartilishez esik közelebb.

Ha a eltérések különbségét elosztjuk azok összegével, olyan mérőszámot kapunk, amely abszolút értékének határozott felső korlátja

van: . Az F mutató lényegesen kisebb értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát, mint az A:

Page 91: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

83

E mutatószám ugyanolyan feltételek mellett ad nulla, pozitív és negatív eredményt, mint az A mutató.

Az F mutatót nemcsak a kvartilisek, hanem a többi kvantilis, például a decilisek alapján is számíthatjuk.

vagy a illetve helyett akár a illetve is behelyettesíthető.

A lakások vízfogyasztására vonatkozó példánkban (a kvartiliseket felhasználva):

E mutató is enyhe bal oldali aszimmetriát jelez.

Az F mutató – szemben az A-val – többmóduszú eloszlásoknál is használható a ferdeség fokának vizsgálatára.

Több gyakorisági sor ferdeségének összehasonlításakor, valamint ugyanazon jelenség eloszlásának időbeli vizsgálatára mindig ugyanazt amérőszámot kell használni.

2.1.8. A koncentráció elemzéseValamely sokaságnak egy mennyiségi ismérv szerinti vizsgálata arra is irányulhat, hogy az értékösszeg mennyire koncentrálódik a sokaság bizonyosegységeire. Pl. vizsgálhatjuk a termelés, a jövedelem, a vagyon, a betétösszeg, a népesség stb. koncentrációját.

A koncentráción általában tömörülést, összpontosulást értünk. Pl. a népesség nagy része a nagyobb településeken, a városokban összpontosul,a magánvagyon egyre nagyobb része tömörül (koncentrálódik) a lakosság egy szűkebb körénél stb.

Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékössszeg jelentős része a sokaság kevés egységéreösszpontosul.

Ha a sokaság elemszáma (N) kicsi, akkor az már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg (S) a szó szoros értelmében kevésegységre összpontosul.

Ha a sokaság elemszáma nagy, akkor a definícióban szereplő „kevés egységet” relatív módon értelmezzük. Ilyen esetben a koncentráció abbannyilvánul meg, hogy a sokaság teljes értékösszege egyenlőtlenül oszlik meg a sokaság egységei között.

Page 92: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

84

A koncentráció a relatív gyakoriságok és a relatív értékösszegek összehasonlításával mutatható ki. Ha az egyes osztályokhoz

(osztályközökhöz) tartozó értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.

2.26. táblázat - Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január1-jén

Települések Települések

Népesség-

nagyságszáma össznépessége

(fő)

számának össznépességének

(fő) (tényleges) %-os megoszlása

– 499

500 – 999

1000 – 1999

2000 – 4999

5000 – 9999

10 000 – 49 999

50 000 – 99 999

150

65

31

6

2

1

2

35 570

48 021

42 506

20 119

16 620

22 263

115 968

58,4

25,3

12,0

2,3

0,8

0,4

0,8

11,8

16,0

14,1

6,7

5,5

7,4

38,5Összesen 257 301 067 100,0 100,0

A 2.26. táblázatból látható, hogy a megye népességének 11,8%-a él a települések 58,4%-át kitevő kistelepüléseken, ugyanakkor a népesség nagyhányada (38,5%-a) a települések mindössze 0,8%-át kitevő nagytelepüléseken (városokban) koncentrálódik.

A koncentráció vizsgálatának egyik legfontosabb és egyben legelterjedtebb eszköze a Lorenz-görbe, amely a koncentráció meglétén kívül annakmértékét is szemléletesen mutatja. A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok

függvényében ábrázolja a kumulált relatív értékösszegeket .

A görbét úgy készítjük, hogy a

Page 93: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

85

pontokat egyenes szakaszokkal összekötjük. (A görbe végpontja a pont.) Általában a illetve adatokat ábrázoljuk, mint ahogyan a2.12. ábrán is.

A koncentráció hiánya esetén a görbe egybeesik az átlóval. Ebben az esetben az egyes osztályokhoz (osztályközökhöz) tartozó és értékekazonosak (a teljes értékösszeg egyenletesen oszlik meg a sokaság egységei között).

Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció, így az ábra alkalmas a koncentráció időbeli vagy térbeli összehasonlításárais.

A 2.26. és 2.27. táblázat adatait felhasználva összehasonlítjuk Nógrád és Zala megye népességének koncentrációját (az 1994. január 1-jei adatokalapján).

2.27. táblázat - Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva)

Nógrád megye Zala megyeNépesség-

nagyság (fő)–499

500 –999

1000 –1999

2000 – 4999

5000 – 9999

10 000 – 49 999

50 000 – 99 999

22,4

35,2

25,6

12,8

0,8

3,2

4,0

14,7

19,.9

17,7

2,9

40,8

22,4

57,6

83,2

96,0

96,8

100,0

4,0

18,7

38,6

56,3

59,2

100,0

58,4

83,7

95,7

98,0

98,8

99,2

100,0

11,8

27,8

41,9

48,6

54,1

61,5

100,0Összesen 100,0 100,0 – – – –

Page 94: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

86

2.12. ábra - A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)

A 2.12. ábráról leolvasható, hogy Zala megyében a népesség koncentrációja nagyobb fokú, mint Nógrád megyében.

A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha a koncentrációs területet a háromszög területéhezviszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció fokára. A koncentrációs terület arányát a koncentrációs együtthatóval(jele: K) mérjük.

Page 95: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

87

A koncentrációs együtthatót – a bizonyítást nem részletezzük – számíthatjuk a következő módon is:

ahol G: az átlagos különbség (Gini-féle szóródási mérőszám),

az ismérvértékek átlaga.

Koncentráció hiánya esetén: ( a görbe egybeesik az átlóval); minél közelebb van K értéke az 1-hez, annál nagyobb fokú a koncentráció.

Zala megyében (a 2.26. táblázat adataiból számítva):

átlagos különbség:

átlagos népességszám:

Zala megyében a népesség koncentrációja viszonylag nagy fokú, a Lorenz-görbe is ezt jelzi (2.12. ábra).

2.2. Az időbeli ismérv szerinti elemzés2.2.1. Idősorok

A statisztikai elemzések során fontos szerepük van az időbeli összehasonlításoknak, az időbeli változások vizsgálatának. Segítik az elmúlt időszaktendenciáinak, összefüggéseinek feltárását és egyben támpontot is adnak a jövő várható folyamatainak előrejelzéséhez.

A társadalmi-gazdasági jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei idősorokat alkotnak, melyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek.

Az állapotidősorok az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. E soroksohasem csoportosítás eredményeként jönnek létre, így a bennük szereplő adatok összegezésének nincs tárgyi értelme.

A tartamidősorok mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik.

Page 96: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

88

Mindkét típusú idősornál – éppen az időbeliség lényegéből következően – az ismérvváltozatok (időpontok, időszakok) sorrendje szigorúan kötött,a sor elemei nem cserélhetők fel tetszés szerint.

Az idősorokat a következő példák szemléltetik:

Állapotidősor (2.28. táblázat):

2.28. táblázat - Magyarország személygépkocsi-állományának alakulása (az évek december 31-én)Év Személygépkocsi (db)

1985

1986

1987

1988

1989

1990

1991

1992

1993

1 435 937

1 538 877

1 660 258

1 789 562

1 732 385

1 944 553

2 015 455

2 058 334

2 091 623

Tartamidősor (2.29. táblázat):

2.29. táblázat - Magyarországra érkező külföldi turisták számának alakulásaÉv Turisták száma (E fő)

1985

1986

1987

1988

9 724

10 613

12 087

10 766

Page 97: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

89

1989

1990

1991

1992

1993

14 490

20 510

21 860

20 188

22 804

A továbbiakban azokkal az egyszerű elemzési eszközökkel foglalkozunk, amelyek alkalmasak az idősorban rejlő információk szemléltetésére,a tendenciák, törvényszerűségek feltárására. Az idősorok vizsgálatának általánosan alkalmazott eszközei a dinamikus viszonyszámok, agrafikusábrázolás és az átlagok.

2.2.2. Dinamikus viszonyszámokA dinamikus viszonyszám (az 1.5. alfejezetben már szóltunk róla) az összehasonlítás tárgyát képező tárgyidőszak (időpont) és az összehasonlításalapjául szolgáló bázisidőszak (időpont) adatának hányadosa.

A kettőnél több adatból álló idősor esetén kétfajta dinamikus viszonyszám számítható: bázis- és láncviszonyszám.

A bázisviszonyszámok (jele: ) az idősor egyes adatainak a bázisul választott időszak (időpont) adatához viszonyított arányát fejezik ki:

ahol az idősor egymást követő adatai, az pedig a bázisul választott időszak (időpont) adata.

Bázisul az idősor bármelyik időszaka (időpontja) választható, sőt az idősoron kívüli időszak (időpont) is. A bázis megválasztásánál alapelvkéntrögzíthetjük, hogy bázisként olyan időszak (időpont) adatát helyes választani, melynek nagyságát kivételes, véletlen körülmények nem befolyásolják,így reálisan lemérhető a vizsgált jelenség változása. A statisztikai elemzések során leggyakrabban az első időszakot (időpontot) választjuk bázisul.

A láncviszonyszámok (jele: ) az idősor egyes adatainak a közvetlenül megelőző időszak (időpont) adatához viszonyított arányát fejezik ki:

A bázis- és láncviszonyszámok számítását szemlélteti a 2.30. táblázat:

Page 98: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

90

2.30. táblázat - A bázis- és láncviszonyszámok számítása

Időszak,

időpont

Idősor adata Bázisviszonyszám Láncviszonyszám

1. –

2.

3.

.

.

.

.

.

.

.

.

.

.

.

.

t.

.

.

.

.

.

.

.

.

.

.

.

.

n.

Vizsgáljuk meg bázis- és láncviszonyszámokkal a lakossági megtakarítások alakulását. Az alapadatokat és a megfelelő viszonyszámokat a 2.31.táblázatbanközöljük.

2.31. táblázat - A lakosság takarékbetét-állományának alakulása (az évek december 31-én)

Év Betétállomány(milliárd Ft) 1980 = 100,0% Előző év = 100,0%

1980 145,3 100,0 –

Page 99: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

91

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

160,1

175,7

197,1

219,4

244,1

274,9

287,5

312,7

309,5

368,6

466,0

634,7

732,9

110,2

120,9

135,6

160,0

168,0

189,2

197,9

215,2

213,0

253,7

320,7

436,8

504,4

110,2

109,7

112,2

111,3

111,3

112,6

104,6

108,8

199,0

119,1

126,2

136,2

115,5

Az 1986. évi bázisviszonyszám:

Az 1986. évi betétállomány az 1980. évinek (a megfigyelés időpontja mindkét évben december 31.) 1,892-szerese, azaz 189,2%-a. Tehát abetétállomány 1980-ról 1986-ra 89,2%-kal nőtt.

Az 1986. évi láncviszonyszám:

1985-ről 1986-ra a betétállomány 12,6%-kal nőtt.

Page 100: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

92

1980. évre nem tudunk láncviszonyszámot számítani, mert a példánkban nem ismert az 1979. évi betétállomány.

Az 1981. évi bázis- és láncviszonyszám (általában is igaz, hogy a bázisul választott időszak (időpont) utáni időszak (időpont) bázis- ésláncviszonyszáma) azonos, mindkettő az 1980-ról 1981-re bekövetkező változást mutatja. A betétállomány 1980-ról 1981-re 10,2%-kal nőtt.

A bázis- és láncviszonyszámok közötti összefüggés

A bázis- és láncviszonyszámok az idősor eredeti adatainak ismerete nélkül is közvetlenül kölcsönösen kiszámíthatók egymásból.

Bázisviszonyszámokból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Az összehasonlítani kívánt időszak (időpont)bázisviszonyszámát elosztjuk az őt közvetlenül megelőző időszak (időpont) bázisviszonyszámával.

A t-edik láncviszonyszám

Ugyanis a bázisviszonyszámokat úgy képezzük, hogy az idősor adatait rendre egy konstanssal (a bázisidőszak adatával) osztjuk, ezért abázisviszonyszámok egymás közötti aránya megegyezik az eredeti adatok egymás közötti arányával.

Példánkban az 1986. évi láncviszonyszám a bázisviszonyszámokból számítva:

Láncviszonyszámokból bázisviszonyszámokat a megfelelő láncviszonyszámok szorzataként kapunk. Az első számú láncviszonyszámszorzata a k-adik időszak (időpont) bázisviszonyszámával egyenlő.

A k-adik bázisviszonyszám:

ugyanis:

Page 101: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

93

Példánkban az 1986. évi bázisviszonyszám a láncviszonyszámokból számítva:

2.2.3. Az idősorok grafikus ábrázolásaAz idősorok tendenciáinak tömör, áttekinthető jellemzésére gyakran használjuk a grafikus ábrákat. Az idősorokat – mivel általában az ábrákkala társadalmi-gazdasági jelenségek időbeli változásának tendenciáját szemléltetjük – derékszögű koordináta-rendszerben, vonaldiagrammalábrázoljuk. A vízszintes tengelyen az időszakokat (időpontokat), a függőleges tengelyen az idősor adatait mérjük fel. Az idősor egyes értékeit jellemzőpontokat – azért, hogy a változás tendenciája érzékelhető legyen – egyenes szakaszokkal (teljesen önkényesen) összekötjük. Tartamidősorok eseténaz idősor adatait jelölő pontok a megfelelő időintervallum közepén, állapotidősorok esetén pedig az intervallum megfelelő szélén helyezkednek el.

2.13. ábra - A takarékbetét-állomány alakulása

A 2.13. ábra a takarékbetét-állomány alakulását szemlélteti. Ez az idősor állapotidősor, a megfigyelések időpontja minden évben december 31-evolt. Ezért az idősor adatait jellemző pontok az időintervallumok (évek) végén helyezkednek el.

A 2.29. táblázat a Magyarországra érkező külföldi turisták számának alakulását mutató tartamidősor. Ábrázolásakor (2.14. ábra) az időintervallumok(évek) közepén felmért pontokat kötjük össze egyenes szakaszokkal. Az idősorban előforduló legkisebb érték 9724 ezer fő (a legnagyobb 22 804ezer fő), ezért a függőleges tengelyt megszakítva a beosztást 8000 ezer főnél kezdhetjük. (Ha a tengely beosztása ugyanis 0-tól folyamatos lenne,a vonaldiagram nagyon „magasra” kerülne.)

Page 102: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

94

2.14. ábra - A Magyarországra érkező turisták számának alakulása

A grafikus ábrázolással az ábrázolt adatok közötti arányokat szemléltetjük. Mivel a bázisviszonyszámok között ugyanolyan arányok vannak, mintaz idősor eredeti adatai között, ezért a bázisviszonyszámok alapján is készíthetünk vonaldiagramot. Különösen indokolt a bázisviszonyszámokábrázolása akkor, ha több, egymással összefüggő jelenség időbeli alakulását egy koordináta-rendszerben akarjuk szemléltetni.

2.2.4. Az idősorok elemzése átlagokkalA középérték az azonos fajta adatok halmazának számszerű jellemzője. Az idősorok adatait úgy tekintjük mint ugyanazon jelenség különbözőidőszakokban (időpontokban) felvett értékeinek összességét, tehát azonos fajta adatok halmazát. Az átlagolás ezért idősorok esetén is indokolt lehet.

Az átlagolás célja egyrészt az idősor átlagos értékének meghatározása, másrészt az idősorban végbemenő átlagos változások kimutatása lehet.

Az idősorok átlagos értékének meghatározása

Az állapot- és tartamidősor adatait eltérő módon átlagoljuk.

Page 103: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

95

A tartamidősorok adatai összegezhetők, ezért átlagolásukra a számtani átlagot használjuk.

Az így kiszámított átlag a megfigyelt jelenség egy időszakrajutóátlagos értékét mutatja.

Az állapotidősorok adatai egy-egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos

állomány- (készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga ,több időpont esetén pedig a két-két időpont közötti időszakokra számított átlagos állományok számtani átlaga.

Ezt az átlagot kronologikus átlagnak nevezzük (jele: ), és kizárólag állapotidősorok adatainak átlagolására használjuk. A megfigyelt időpontok

adataiból ( ) közvetlenül az alábbi egyszerűbb alakra hozott formában számítjuk:

A kronologikus átlag tehát olyan súlyozott számtani átlag, melynél az első és utolsó adat súlya a közbeeső adatok súlya pedig 1. A súlyokösszege (a nevezőben szereplő szám) így:

Tekintsük a következő példát (2.32. táblázat).

2.32. táblázat - Valamely utazási iroda valutakészletének és valutaértékesítésének adatai

Hónap

Valutakészlet

(a hónap utolsó napján)

(E USD)

Valutaértékesítés

(E USD)

Page 104: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

96

június

július

augusztus

szeptember

október

november

december

18,8

19,6

20,2

19,8

21,1

20,3

19,2

....

35,8

35,2

34,3

33,5

32,4

35,8

A második félévben a havi átlagos valutaértékesítés (6 hónap átlaga):

Az adatok összegének van értelme (a II. félévben összesen 207 ezer USD valutát adott el az utazási iroda), ezért átlagolásukra a számtani átlagothasználtuk.

A második félévben az átlagos valutakészlet (július 1-je és december 31-e között):

( a július 1-jei készlet a június 30-ival – 18,8 E USD – azonos).

A valutakészlet csak időpontokban értelmezhető (példánkban a hónap utolsó napján záráskor), ezért átlagolásukra a kronologikus átlagot használtuk.

Az idősor átlagos változásának vizsgálata

Az idősor lényeges tulajdonságát kifejező tendenciát az időszakról időszakra (időpontról időpontra) bekövetkező változások átlagolásával ragadhatjukmeg. A változást kétféleképpen mérhetjük: abszolút és relatív módon. Az abszolútváltozás két egymást követő időszak (időpont) adatának különbsége

a relatív változás pedig valamely időszak (időpont) adatának a megelőző időszak (időpont) adatához viszonyított aránya Azátlagos változást (növekedést vagy csökkenést) két mutatóval mérhetjük: a fejlődés átlagos mértéke és a fejlődés átlagos ütememutatókkal.

Page 105: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

97

A fejlődés átlagos mértéke (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos abszolút változást mutatja a vizsgáltjelenség mértékegységében.

Számítása úgy történik, hogy az egymást követő időszakokra (időpontokra) kiszámítjuk a növekedés (csökkenés) mértékét , majd azokat számtaniátlaggal átlagoljuk.

Ebből azonnal adódik:

A mutató elsősorban az időszakról időszakra (időpontról időpontra) közel azonos mértékben növekvő (csökkenő), azaz megközelítőleg lineárisfejlődést leíró idősorok fejlődési tendenciájának jellemzésére használható. Mivel értéke csak az idősor első és utolsó adatától függ, ezért csak akkorjellemzi jól a változás átlagos mértékét, ha ezek nem kiugróan magas vagy alacsony (esetleg változó előjelű) értékek.

2.33. táblázat - Az épített lakások számának alakulása Magyarországon

Év Épített lakásokszáma (db)

1985

1986

1987

1988

1989

1990

1991

1992

72 507

69 428

57 200

50 566

51 487

43 771

33 164

25 807

–3 079

–12 228

–6 634

921

–7 716

–10 607

–7 357

Page 106: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

98

1993 20 925 –4 882

2.15. ábra - Az épített lakások számának alakulása

Az épített lakások számának alakulását mutató vonaldiagram (2.15. ábra) alapján látható, hogy a 2.33. táblázatban egy lineárisnak tekinthető változást

leíró idősor szerepel, ezért a mutató alkalmazása célszerű.

– Az évenkénti változások (növekedések, csökkenések) átlagaként:

– Az 1993-as és az 1985-ös év megfigyelt adata alapján:

Page 107: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

99

Az épített lakások száma 1985 és 1993 között évente átlagosan 6448 db-bal csökkent.

A fejlődés átlagos üteme (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos relatív változást mutatja.

A mutató a láncviszonyszámok mértani átlaga. A mértani átlag alkalmazását az indokolja, hogy a láncviszonyszámok szorzatának van tárgyi értelme.Valamennyi láncviszonyszám szorzata ugyanis a megfigyelt utolsó időszak (időpont) bázisviszonyszámával azonos.

Mivel

ezért a fejlődés átlagos üteme az n-edik bázisviszonyszámból is kiszámítható.

Mivel

ezért a fejlődés átlagos üteme az idősor első és utolsó adatából az

alakban is számítható.

A mutató számítása olyan idősorok esetén célszerű, melyeknél az idősor adata időszakról időszakra (időpontról időpontra) közel azonos ütembennő (csökken), azaz közelítőleg exponenciális fejlődést mutat.

Ilyen idősor a takarékbetét-állomány alakulása (2.31. táblázat), jól szemlélteti az exponenciális növekedésnek tekinthető fejlődést a grafikus ábrais (2.13. ábra).

A fejlődés átlagos üteme:

Page 108: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

100

– a láncviszonyszámok alapján:

– az utolsó bázisviszonyszámból:

– a megfigyelt adatokból:

A lakosság takarékbetét-állománya 1980 és 1993 között évenként átlagosan 1,133-szeresére, azaz 13,3%-kal nőtt.

Az idősorok fejlődési tendenciáit kifejező, itt ismertetett mutatószámok végeredményben csak az első ( ) és az utolsó ( ) adatra támaszkodnak.Ezért az ilyen számítások csak akkor adnak jellemző értékeket, ha az idősor alapvető tendenciája az egyenletes fejlődés (növekedés vagy csökkenés;lineáris vagy exponenciális értelemben). Tankönyvünk II. kötetében megismerkedünk majd az idősorok fejlődési törvényszerűségeinek függvényekkeltörténő leírásával, elemzésével. Az ott megismert eljárások pontosabb képet adnak a jelenségek, folyamatok alakulásáról.

2.3. Gyakorlófeladatok1. Háztartások élelmiszerre fordított egynapi kiadásai (Ft-ban) az alábbiak:

820,

880,

490,

830,

920,

1020,

520,

900,

760,

730,

1010,

600,

600,

520,

1200,

700,

650,

620,

750,

760,

720,

780,

630,

900,

680,

480,

700,

1200.

Feladat:

a) Készítsünk rangsort!

b) A rangsor alapján készítsünk gyakorisági sorokat különböző osztályközökkel!

Page 109: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

101

c) A legjobbnak ítélt gyakorisági sor alapján készítsünk értékösszegsort és kumulált sorokat!

d) Számítsuk ki a napi élelmiszer-kiadás átlagát, móduszát, mediánját és kvartiliseit! Vizsgáljuk az aszimmetriát!

e) Készítsünk hisztogramábrát!

2. Egy budapesti pénzváltó helyen valamely napon 107-en váltottak valutát forintra. Az ügyfelek megoszlása a váltott összeg nagysága szerint azalábbi:

Összeg (1000 Ft) Fő– 10

10 – 20

20 – 30

30 – 40

40 – 50

50 – 60

60 felett

12

20

33

23

12

3

4Összesen 107

Feladat:

a) Ábrázoljuk a váltott összeg nagysága szerinti megoszlást!

b) Készítsük el a mennyiségi sor lehetséges típusait! Értelmezzük egy-egy adatát!

c) Számítsuk ki és értelmezzük az átlagot, móduszt, mediánt és a kvartiliseket! Jelöljük az a) pontbeli ábrán ezeket az értékeket!

d) Vizsgáljuk a szóródást!

e) Számítsuk ki az aszimmetria A és F mérőszámát!

3. A személyi jövedelemadó-bevallások alapján az adóalanyokat az alábbi kategóriákba sorolták:

Page 110: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

102

Adóköteles jövedelem Az adót fizetők %-os megoszlása

(ezer Ft) 1991 19920 –90

90 – 150

150 – 240

240 – 360

360 – 600

600 – 1500

20,3

26,9

27,9

14,7

7,5

2,7

15,2

22,5

27,8

18,7

11,2

4,6Összesen 100,0 100,0

Feladat:

a) Ábrázoljuk a jövedelem szerinti megoszlást az egyes években hisztogrammal külön-külön!

b) Készítsünk gyakorisági poligont egy koordináta-rendszerben!

c) Mennyi az adóalanyok átlagos jövedelme az egyes években?

d) Melyik évben volt nagyobb a jövedelmek szóródása?

e) Jellemezzük a jövedelemeloszlás aszimmetriáját F mutatóval!

4. A saját jogú nyugdíjasok adatai 1993 márciusában:

Nyugdíj összege Férfiak Nők Összes nyugdíjas(1000 Ft) %-os megoszlása

–6

6 – 8

8 – 10

0,4

6,2

21,3

0,3

16,2

31,3

0,3

11,7

26,8

Page 111: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

103

10 – 12

12 – 15

15 – 20

20 – 25

25 –

26,2

24,8

14,7

5,1

1,3

39,7

8,9

2,9

0,6

0,1

33,6

16,1

8,3

2,6

0,6Összesen 100,0 100,0 100,0

Kiszámított adatok: Az 1015,2 ezer férfi átlagos nyugdíja 12 679 Ft, a 1218,4 ezer nő átlagos nyugdíja pedig 10 205 Ft volt. A férfiaknál 4149 Ft azátlagtól való átlagos eltérés, a nőknél pedig 2483 Ft. (Az eltérések négyzetei alapján.)

Feladat:

a) Hasonlítsuk össze a nyugdíjak nagyságát a tanult helyzetmutatókkal!

b) Ábrázoljuk a nyugdíj összege szerinti megoszlást poligonnal, egy grafikonon!

c) Számítsuk ki az aszimmetria A mutatóját a férfiak és a nők csoportjára! Hasonlítsuk össze a kapott eredményeket!

5. Az ipari ágazatban tevékenykedő vállalkozások fontosabb adatai 1992-ben:

A foglalkoztatottak

nagyságcsoportjai (fő)

Vállalatok

száma

Árbevétel

(milliárd Ft)

Foglalkoztatottakszáma

(1000 fő)21 –50

51 –100

101 –300

301 –500

501 –1000

1001 –2000

1361

782

850

264

259

124

60

73

183

130

310

293

57

62

162

102

185

169

Page 112: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

104

2001 –5000

5001 – 10 000

10 000-nél több

57

9

2

413

106

167

169

57

34Összesen 3708 1735 997

Feladat:

a) Hány főt foglalkoztat átlagosan egy vállalat?

b) A vállalatok hány %-a foglalkoztat maximum 500 főt? Mennyi ezen vállalatok összes foglalkoztatottjainak létszáma ténylegesen, illetve anagyságcsoportok alapján becsülve?

c) Számítsuk ki a vállalatok és az összes foglalkoztatottak %-os megoszlását! Hasonlítsuk össze az egyes létszámkategóriákhoz tartozó arányokat!Nevezzük meg a kiszámított viszonyszámokat!

d) Készítsünk Lorenz-görbét a vállalatok létszám szerinti koncentrációjának bemutatására!

e) Vizsgáljuk meg a létszámnagyság szerinti szóródást!

f) Becsüljük meg a mediánt és a kvartiliseket! Vizsgáljuk a létszám szerinti megoszlás aszimmetriáját!

6. Öt hallgató elért pontszáma egy 50 pontos zárthelyin a következő volt:

36; 40; 28; 48; 16.

Feladat:

a) Számítsuk ki, hogy:

1. egy-egy hallgató pontszáma mennyivel tér el az átlagos pontszámtól!

2. mennyivel térnek el az eredmények egymástól átlagosan!

b) A korábban írt 30 pontos zárthelyit a hallgatók átlagosan 20 pontra írták meg, 9 pontos szórással. Melyik zárthelyin volt nagyobb a pontszámokingadozása, szóródása?

7. Használjuk fel az 1.7. Gyakorlófeladatok 4. példájának adatait!

Page 113: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

105

Feladat:

a) Vizsgáljuk meg az aktív népesség számának alakulását bázis- és láncviszonyszámokkal!

b) Értelmezzük a kiszámított viszonyszámokat!

c) Számítsuk ki a csökkenés átlagos mértékét és átlagos ütemét!

8. Nemzetközi idegenforgalmi bevételek és kiadások alakulása Magyarországon:

Milliárd FtÉv Bevételek Kiadások

1985

1986

1987

1988

1989

1990

1991

1992

25

27

37

39

48

63

78

98

10

10

12

33

59

38

38

53

Feladat:

a) Vizsgáljuk meg a bevételek és a kiadások alakulását 1985-höz képest, valamint évről évre!

b) Ábrázoljuk a két jelenség adatait egy grafikonon!

c) Hány Mrd Ft-tal nőttek évente átlagosan az idegenforgalmi bevételek?

d) Mennyi volt a bevételek, kiadások, illetve az egyenleg növekedési üteme a vizsgált időszakban átlagosan?

9. A takarékbetét-állomány alakulása Magyarországon:

Page 114: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Egy ismérv szerinti elemzés

106

Év Betétállomány(milliárd Ft) 1980 = 100% 1985 = 100% Előző év

= 100%1985

1986

1987

1988

1989

1990

1991

1992

244,1

274,9

287,5

...

...

...

466,0

...

168,0

189,2

...

...

...

...

...

436,8

100,0

112,6

...

...

126,8

...

...

260,0

...

...

108,8

...

119,1

...

...

Feladat:

a) Számítsuk ki a tábla hiányzó adatait!

b) Ábrázoljuk a betétállomány alakulását!

c) Évente átlagosan hány %-kal nőtt a betétállomány:

– 1985 és 1990 között?

– 1985 és 1992 között?

– 1980 és 1992 között?

d) Hány Mrd Ft volt a betétállomány 1980-ban? Mennyi volt a növekedés évi átlagos mértéke 1980 és 1992 között?

Page 115: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

107

3. fejezet - A sokaságok több ismérv szerinti vizsgálata, astatisztikai táblák elemzése3.1. A statisztikai táblákról általában

A sokaságok több szempont szerinti megfigyelésének eredménye statisztikai táblák formájában is megadható.

Statisztikai táblának nevezzük a megfelelő külső formával ellátott statisztikai sorok összefüggő rendszerét.

A tábla külső formáján rovatokból álló hálózatot értünk. A rovatok egy része statisztikai adatokat, számokat, más része megnevezéseket, magyarázószövegeket tartalmaz. A megnevezéseket tartalmazó rovatok közül azokat, amelyek a tábla bal oldalán helyezkednek el, oldalrovatoknak nevezzük.Ezek a rovatok a vízszintesen elhelyezkedő sorok elnevezéseit tartalmazzák. A tábla felső részén elhelyezkedő feliratos, szöveges rovatokatfejrovatoknak nevezzük. A fejrovatokban található megnevezések a függőlegesen elhelyezkedő oszlopokra vonatkoznak. Az egyes sorok és oszlopokadatainak összegét, illetve a sokaság(ok) egészére jellemző adatokat tartalmazó rovatok az ún. összesen rovatok.

A statisztikai tábla definíciójából – amely szerint: „statisztikai sorok összefüggő rendszere” – következik, hogy a tábla minden egyes adata egyidejűlegtöbb, de legalább két (egy vízszintesen és egy függőlegesen elhelyezkedő) statisztikai sornak tagja.

Azt a számot, amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik, a statisztikai tábla dimenziószámának nevezzük.

Tehát az előbbi definíció szerint a statisztikai táblák legalább kétdimenziósak Definiálhatnánk a statisztikai táblát oly módon is, hogy a statisztikai sort is táblánaktekintenénk, mégpedig egydimenziós táblának.. A statisztikai táblákat – a dimenziószám mellett – leggyakrabban a csoportosításnak (az osztályozásnak) a táblaelkészítésében betöltött szerepe szerint különböztetjük meg.

A csoportosítás szerepe szerint a statisztikai táblák lehetnek egyszerű, csoportosító és kombinációs táblák.

Az egyszerű táblák

A csoportosítást nem tartalmazó adatsorok összefüggő rendszere az egyszerű tábla.

Az egyszerű táblákban általában leíró és összehasonlító sorok szerepelnek. Formai ismertetőjegyük, hogy nincsenek összesen rovataik.

Példaként nézzük a budapesti székhelyű külföldi érdekeltségű vállalkozások néhány fontosabb adatának alakulását tartalmazó táblát (3.1. táblázat).

3.1. táblázat - A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)Megnevezés 1989 1991 1993

Page 116: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

108

Vállalkozások száma

Összes jegyzett tőke (Mrd Ft)

Ebből külföldi részesedés

886

64,3

15,5

5111

270,3

123,7

10 953,1

725,1

411,7

A tábla nem tartalmaz csoportosítást, ezért összesen rovatok sem szerepelnek benne. Három – vízszintesen elhelyezkedő – összehasonlító,állapotidősor és három – függőlegesen elhelyezkedő – leíró sor alkotja a táblát. A tábla minden adata egyidejűleg két statisztikai sornak tagja, teháta 3.1. táblázat egy kétdimenziós egyszerű tábla.

A csoportosító táblák

Az egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere a csoportosító tábla.

A csoportosító táblában egy ismérv szerinti csoportosítás eredményeként keletkezett csoportosító sorok összehasonlítással vagy (és) leíró sorokkalszerepelnek együtt. A csoportosító tábla egy irányban összesen rovatokat is tartalmaz.

A következő táblában az egy ismérv szerinti csoportosítás összehasonlítással társul (3.2. táblázat).

A tábla függőleges irányban tartalmazza a csoportosítást. A csoportosítás alapja – az életkor – mennyiségi ismérv, ezért a táblában függőlegesenhárom mennyiségi sor helyezkedik el. Vízszintesen kilenc összehasonlító, állapotidősor található. Ebben a táblában vízszintes irányban helyezkednekel az összesen rovatok. Az összesen rovatban lévő adatok alkotják azt az idősort, amely az egész népesség számának alakulását mutatja.

3.2. táblázat - A magyarországi népesség életkor szerinti megoszlásának alakulása

Korcsoport Népességszám (E fő)(év) 1980 1990 1995

(január 1.)0 – 5

6 – 14

15 – 24

25 – 29

30 – 49

1 045

1 296

1 465

892

2 814

738

1 392

1 445

620

3 014

720

1 151

1 619

675

2 897

Page 117: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

109

50 – 59

60 – 69

70 –

1 368

928

902

1 206

1 116

844

1 198

1 058

927Összesen 10 710 10 375 10 245

A kombinációs táblák

A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat kombinációs vagy kontingenciatáblába foglalhatjuk.A kombinációs tábla legalább két ismérv szerinti kombinatív csoportosítást tartalmaz.

Az 1.4. pontban a magyarországi lakott lakások két ismérv szerinti kombinatív csoportosítása eredményeként adódó sémát közöltünk. A kétszeresencsoportosított adatokból kiindulva és az adatokat függőleges és vízszintes irányban elrendezve, felírhatjuk a statisztikai sorok olyan összefüggőrendszerét, amely kombinációs táblát alkot (3.3. táblázat).

3.3. táblázat - A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint(1990. január 1.)

Komfortosság Budapest A többi város Községek ÖsszesenKomfortos

Félkomfortos

Komfort nélküli

673

40

63

1259

88

193

780

159

433

2712

287

689Összesen 776 1540 1372 3688

A tábla kétféle minőségi ismérv – a komfortosság és a településtípus – szerinti kombinatív csoportosítást tartalmaz. Függőlegesen a komfortosságszerinti csoportosításból keletkezett négy minőségi sor helyezkedik el. Ezek a lakások számának komfortosság szerinti megoszlását mutatjáktelepüléstípusonkénti bontásban, valamint az összes lakásra vonatkozóan. A vízszintes irányban elhelyezkedő négy – ugyancsak – minőségi sora különböző komfortfokozatú lakások és az összes lakás településtípusonkénti megoszlását jellemzi. A kétféle csoportosításnak megfelelően kétirányban találhatók összesen adatok.

A statisztikai táblák három típusát szemlélteti a 3.1. ábra.

Page 118: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

110

3.1. ábra - A statisztikai táblák típusai

A különböző típusú statisztikai táblák formájában rendelkezésre álló adatok elemzésénél különböző jellegzetes elemzési esetek adódnak, avizsgálathoz különböző elemzési eszközöket, módszereket használunk.

A 3. fejezet további részében kétdimenziós statisztikai táblákhoz kapcsolódóan tekintünk át jellegzetes elemzési eseteket, és bemutatjuk, hogy azegyes esetekben milyen statisztikai elemzési eszközök, módszerek, mutatószámok alkalmazhatók.

3.2. Az egyszerű táblák elemzéseAz egyszerű táblák nem tartalmaznak csoportosítást, az ilyen táblákban általában leíró sorok és összehasonlító sorok – leggyakrabban idősorok– találhatók.

Az elemzés során intenzitási viszonyszámokat és összehasonlító viszonyszámokat számíthatunk, bizonyos esetekben a tábla információtartalmátmegfelelő grafikus ábrák segítségével is megjeleníthetjük.

Page 119: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

111

3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazásaAz eddigiekben már megismert (például dinamikus vagy megoszlási) viszonyszámok azonos fajta, azonos mértékegységű adatok hányadosai voltak.

Ezzel szemben az intenzitási viszonyszám két különböző fajta és általában különböző mértékegységű statisztikai adat hányadosa.

Az intenzitási viszonyszám azt mutatja meg, hogy az egyik sokaság milyen intenzitással fordul elő a másik sokaság környezetében. Általábanmértékegysége van, amely a viszonyszám számlálójában és nevezőjében szereplő adat – nem feltétlenül azonos – mértékegységéből adódik. Mivelaz egyszerű táblák általában leíró sorokat is tartalmaznak, elemzésük során az ilyen típusú viszonyszámok alkalmazására tág lehetőségek nyílnak.

Az intenzitási viszonyszámok jellegzetes típusai – a viszonyszám tartalma szerint – a következők:

– sűrűségmutatók,

– ellátottságot kifejező mutatók,

– arányszámok,

– átlagjellegű mutatók.

Sűrűségmutató például a népsűrűség mutatószáma, amely a népességnek a számára rendelkezésre álló területen való elhelyezkedéséneksűrűségét, intenzitását mutatja. Az ellátottsági mutatók a szociális, a kulturális stb. ellátás színvonalának mérőszámai. (Például a 10 000lakosra jutó kórházi ágyak száma, amely az egészségügyi ellátás egyik mutatószáma.) Az arányszám elnevezésű mutatószámokat főleg anépességstatisztikában használják, ilyenek a születési, halálozási stb. arányszámok. Átlagjellegű mutatók például az 1 főre jutó GDP nagysága, 1termék előállításához szükséges munkaidő stb.

Tekintsük át a 3.4. táblázat adatait.

3.4. táblázat - Az orvosi ellátás néhány adata (december 31-i adatok)

Megnevezés 1980 1993Népesség száma (E fő)

Orvosok száma (fő)

Háziorvosok száma (fő)

10 705

30 842

5 092

10 278

41 397

6 381

Az egészségügyi ellátás színvonalát jellemezni lehet például a

Page 120: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

112

mutatóval, vagy az

mutatóval.

1980-ban:

a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,

az 1 orvosra jutó lakosok száma: lakos/orvos.

1993-ban:

a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,

az 1 orvosra jutó lakosok száma: lakos/orvos.

Példánk alapján látható, hogy az intenzitási viszonyszámok bizonyos körénél a viszonyítás tárgyát képező adat és a viszonyítás alapját képező adatfelcserélhető, vagyis az intenzitási viszonyszám számítása céljából kijelölhető tört számlálójában és nevezőjében szereplő adatok felcserélhetők.

Ha ugyanazon két sokaság adata alapján ilyen módon kétféle intenzitási viszonyszám képezhető, az egyiket egyenes, a másikat fordított intenzitásiviszonyszámnak szokás nevezni. A két intenzitási viszonyszám közül azt célszerű egyenesnek nevezni, amely értékének növekedése kedvezőirányú változást jelez.

A 10 000 lakosra jutó orvosok számának növekedése az orvosellátottság javulását jelzi, ezért ezt tekintjük egyenes intenzitási viszonyszámnak;az 1 orvosra jutó lakosok számát pedig fordított intenzitási viszonyszámnak, ugyanis ennek nagysága fordított arányban áll a vizsgált jelenségszínvonalával.

Az ugyanazon két adat alapján számított, egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok fordított arányban állnak egymással1.

12 Az orvosellátottság két említett mutatószámánál ügyeljünk arra, hogy az egyenes intenzitási viszonyszám 10 000 lakosra vetítve mutatja az orvosok számát.

Page 121: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

113

Ha abból a sokaságból – amelynek a nagyságát jellemző adat (B) az elemzés céljából kiszámítandó intenzitási viszonyszám nevezőjében szerepel– kiválasztható egy olyan részsokaság (a nagyságát b jellemzi), amely – az egész sokaságnál – közvetlenebb kapcsolatban áll a számlálóban levőadattal (A-val), akkor kétféle intenzitási viszonyszám számítható.

A viszonyítandó adatot a teljes viszonyítási alappal elosztva nyers intenzitási viszonyszámot a vele szorosabb kapcsolatban álló részsokaság

adatával osztva tisztított intenzitási viszonyszámot kapunk.

A kétféle viszonyszám kiszámításához felhasznált adatok lehetővé teszik még egy megoszlási viszonyszám kiszámítását is, amely a tisztítottintenzitási viszonyszám nevezőjében szereplő részsokaság adatának arányát mutatja a nyers intenzitási viszonyszám nevezőjében szereplő teljes

sokaság adatához viszonyítva Ezt az arányt a „tiszta” rész arányának szokás nevezni.

A két intenzitási viszonyszám és a megoszlási viszonyszám között fennáll a következő összefüggés:

a nyers intenzitási viszonyszám egyenlő a tisztított intenzitási viszonyszám és a tiszta rész arányának szorzatával.

Az összefüggés alapján bármelyik viszonyszám kiszámítható a másik kettő ismeretében. Az összefüggés arra is rámutat, hogy a nyers intenzitásiviszonyszám két tényező hatásának eredménye.

A nyers és tisztított intenzitási viszonyszámok alkalmazásának számos területe van, legjellemzőbb a használatuk a népességstatisztikábanalkalmazott arányszámok esetében. Például a születési arányszám számításánál a születések számát viszonyíthatjuk az egész népesség számához,illetve viszonyítási alap lehet a szülőképeskorú (15–49 éves) női népesség száma.

A korábbi példánkban az 1 orvosra jutó lakosok száma nyers intenzitási viszonyszámnak tekinthető. Az orvosok sokaságán belül ugyanis van egyolyan rész – a háziorvosok sokasága –, amely közelebbi kapcsolatban van az ellátandó népességgel. Ezért kiszámítható az 1 háziorvosra jutólakosok száma is, amely tisztított intenzitási viszonyszámnak minősül. Az orvosellátottság nyers és tisztított viszonyszámai 1980-ban:

a 1 orvosra jutó lakosok száma: lakos/orvos,

az 1 háziorvosra jutó lakosok száma: lakos/orvos.

Page 122: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

114

A háziorvosok aránya:

Összefüggésük:

1993-ban:

a 1 orvosra jutó lakosok száma: : lakos/orvos,

az 1 háziorvosra jutó lakosok száma: lakos/orvos.

A háziorvosok aránya:

Összefüggésük:

A 3.4. táblázatban megadott adatok nemcsak intenzitási, hanem dinamikus viszonyszámokkal is elemezhetők.

A 3.5. táblázatban megadjuk a kiszámított viszonyszámokat is és az összefüggések általánosításához szükséges jelöléseket.

3.5. táblázat2

3.5. táblázat - Orvosi ellátásra vonatkozó adatok

Megnevezés 1980

(0)

1993

(1)

1980=100,0%

2Annak érdekében, hogy az eredmények közötti pontos, számszerű összefüggéseket bemutathassuk, a viszonyszámok számításánál 2 tizedes pontossággal számoltunk.

A táblázatban található megoszlási viszonyszámok és dinamikus viszonyszámok százalékos formában kifejezett viszonyszámok. A viszonyszámok számításának képletszerű felírásakor a 100-zalvaló szorzás kijelölésétől eltekintettünk.

Page 123: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

115

Népességszáma (Efő)

A 10 705,11 10 278,11 96,01

Orvosokszáma (fő)

B 30 842,11 41 397,11 134,22

Háziorvosokszáma (fő)

b 5092,11 6381,11 125,31

10 000lakosra jutóorvosokszáma

28,81 40,28 139,81

1 orvosrajutó lakosok

száma

347,09 248,28 71,53

1háziorvosrajutó lakosokszáma

2102,31 1610,72 76,62

Háziorvosokaránya (%)

16,51 15,41 93,33

A táblázatban, amely ugyancsak egyszerű statisztikai tábla, az abszolút adatok mellett különféle típusú intenzitási viszonyszámok, megoszlásiviszonyszámok, az utolsó oszlopban pedig dinamikus viszonyszámok foglalnak helyet.

Mint látható, nemcsak az abszolút adatok összehasonlításából számíthatunk összehasonlító – jelen esetben dinamikus – viszonyszámokat, hanemaz intenzitási

viszonyszámokból is. Fontos megjegyezni, hogy a különféle típusú intenzitási viszonyszámok közötti összefüggések az azokból számított dinamikus(és egyéb összehasonlító) viszonyszámok között is fennállnak.

Intenzitási viszonyszámok dinamikus viszonyszámának számítása

Az intenzitási viszonyszámok összehasonlítása esetén a dinamikus viszonyszámot kétféleképpen is kiszámíthatjuk. Például az 1 orvosra jutó lakosokszámának változását jelző dinamikus viszonyszám kiszámítható:

Page 124: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

116

a) Az 1993-as és az 1980-as év intenzitási viszonyszámainak hányadosaként:

b) A népesség és az orvosok számának változását jelző dinamikus viszonyszámok hányadosaként:

Az 1 orvosra jutó lakosok száma tehát 28,47% -kal csökkent 1980-ról 1993-ra.

Általánosságban is igaz, hogy az intenzitási viszonyszám dinamikus viszonyszáma kétféleképpen számítható:

a) A tárgyidőszaki és a bázisidőszaki intenzitási viszonyszámok hányadosaként:

b) Az intenzitási viszonyszám számlálójában és nevezőjében szereplő adatok dinamikus viszonyszámának hányadosaként:

A kétféle számítás azonos eredményre vezet, mert megfelelő átrendezéssel:

Az ugyanazon két adat alapján számított egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok egymás reciprokai.

Egyenes intenzitási viszonyszám

fordított intenzitási viszonyszám

Page 125: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

117

Összefüggésük:

Példánkban: orvos jutott 10 000 lakosra 1980-ban.

(A 10 000-rel való szorzást az indokolja, hogy az egyik viszonyszámnál a nevező 1 egységéről, a másik viszonyszámnál a nevező 10 000 egységérőlvan szó.)

A reciprok viszony fennáll az egyenes és fordított intenzitási viszonyszámok dinamikus viszonyszámai között is:

Például: a 10 000 lakosra jutó orvosok számának 1980-ról 1993-ra bekövetkezett változását jelző dinamikus viszonyszám kiszámítható akövetkezőképpen is:

3.2.2. A fejlődési tendenciák kimutatása, összehasonlításaHa az egyszerű táblában kettőnél több időpontra (időszakra) vonatkozó adatok vannak, akkor lehetőségünk van a vizsgált jelenség változási, fejlődésitendenciáinak kimutatására is.

Egy sokaság változásának tendenciája kirajzolódik a sokaság nagyságadatait tartalmazó – viszonylag hosszabb – idősorból, illetve szemléletesentükrözi ezt az idősor adatai alapján készített vonaldiagram.

Ha két vagy több – egymással valamilyen kapcsolatban lévő – sokaság változásának tendenciáját kívánjuk összehasonlítani, akkor az adatok eltérőnagyságrendje, eltérő mértékegysége miatt csak a dinamikus viszonyszámok alapján vonhatunk le következtetéseket. Követelmény továbbá, hogymindegyik adatsor összehasonlítási bázisa azonos legyen. Ha pedig grafikusan akarjuk szemléltetni a különböző jelenségek fejlődési tendenciáit,akkor célszerű közös (egyetlen) koordináta-rendszerben ábrázolni azokat.

Bemutató példánkat ismét az egészségügy területéről vesszük. A 3.6. táblázat az 1985 és 1993 közötti időszakra (kettőnél több időbeli adat alapján)mutatja be az ellátottságot jellemző néhány adatot.

Page 126: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

118

3.6. táblázat - Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok)Év Népesség száma

(ezer fő)

Orvosok száma

előző év = 100,00%

Kórháziágyak száma

1980 = 100,00%1985

1986

1987

1988

1989

1990

1991

1992

1993

10 560

10 509

10 464

10 421

10 375

10 355

10 337

10 310

10 278

101,17

101,40

102,10

101,72

103,70

103,50

103,44

101,29

107,13

108,62

109,46

109,73

109,85

110,00

108,93

106,56

105,12

Figyeljük meg, hogy a népességszám ezer főben adott, az orvosok számának a láncviszonyszámai, a kórházi ágyak számának pedig abázisviszonyszámai (1980-as bázison) ismertek.

A bekövetkezett változások jellemzése és reális összehasonlítása a három jelenség bázis- vagy láncviszonyszámai alapján lehetséges. Ezekismeretében történhet ezután a megfelelő intenzitási viszonyszámok dinamikus viszonyszámainak kiszámítása.

A 3.7. táblázat első három oszlopa az alapadatok bázisviszonyszámait, további oszlopai pedig a kiszámítható intenzitási viszonyszámok (1985-ösbázison számított) bázisviszonyszámait tartalmazzák.

3.7. táblázat - Az egészségügyi ellátásra vonatkozó adatok

ÉvNépesség

száma1985=100%

Orvosok

száma

1985=100%

Kórháziágyakszáma

1985=100%

10 000

lakosrajutó

orvosok

1 orvosrajutó

lakosok

10 000

lakosrajutó

kórházi

Page 127: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

119

száma1985=100%

száma1985=100%

ágyakszáma

1985=100%1. 2. 3. 4. 5. 6.

1985

1986

1987

1988

1989

1990

1991

1992

1993

100,00

99,52

99,09

98,68

98,25

98,06

97,89

97,63

97,33

100,00

101,17

102,59

104,74

106,54

110,48

114,36

118,30

119,81

100,00

101,39

102,18

102,43

102,54

102,68

101,68

99,47

98,12

100,00

101,66

103,53

106,14

108,44

112,67

116,83

121,18

123,10

100,00

98,37

96,59

94,21

92,22

88,75

85,59

82,53

81,24

100,00

101,87

103,12

103,80

104,37

104,71

103,87

101,88

100,81

A 3.7. táblázatban található viszonyszámok számításával kapcsolatban a következőket említjük meg.

Mielőtt a táblázat adatait tanulmányoznánk, gondoljuk végig az alábbiakat.

– A Dinamikus viszonyszámok című 2.2.2. alpontban megismerkedtünk a bázis- és a láncviszonyszámok közötti összefüggésekkel.Láncviszonyszámokból bázisviszonyszámok közvetlenül számíthatók, a megfelelő láncviszonyszámok szorzataként.

Például az 1990. évi viszonyszám számítása (a táblázat 2. oszlopában):

– A kórházi ágyak számának alakulását jellemző viszonyszámok a 3.6. táblázatban 1980-as bázishoz viszonyítva mérik a változást. Ebázisviszonyszámokat az összehasonlíthatóság érdekében átszámítottuk 1985-ös bázisra.

Az átszámítás úgy történt, hogy az 1980. évi bázison számított bázisviszonyszámokat rendre elosztottuk az „új” bázisul választott 1985. év 1980-as bázison számított viszonyszámával, az 1,0713-del.

Például a kórházi ágyak számának 1990. évi bázisviszonyszáma, 1985-ös bázishoz viszonyítva

Page 128: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

120

A két bázisviszonyszám hányadosa ugyanarra az eredményre vezet, mintha a két alapadatot osztottuk volna el egymással.

Általánosságban is megállapíthatjuk, hogy új bázisra úgy térünk át, hogy a viszonyszámsor minden elemét elosztjuk az új bázisnak választottidőszak (időpont) eredeti bázisviszonyszámával.

– A táblázat 4., 5. és 6. oszlopában szereplő intenzitási viszonyszámok bázisviszonyszámait az ebben a fejezetben megismert összefüggések alapjánszámítottuk ki.

Például

– a 10 000 lakosra jutó kórházi ágyak számának bázisviszonyszáma 1990-ben:

(Az eredeti viszonyszámtört számlálójának – a kórházi ágyak számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – a népességszámának – a viszonyszámával.)

– az 1 orvosra jutó lakosok számának bázisviszonyszáma 1993-ban:

(Az eredeti viszonyszámtört számlálójának – a népesség számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – az orvosokszámának – a viszonyszámával.)

A 3.7. táblázat alapján látható, hogy a népesség számának csökkenő tendenciája mellett az orvosok száma növekedést mutat. A népességszámés az orvosok számának bázisviszonyszámait összehasonlítva egyértelműen következtethetünk az orvosellátottság javulására, amelyet közvetlenüljeleznek a 10 000 lakosra jutó orvosok számának, illetve az 1 orvosra jutó lakosok számának bázisviszonyszámai.

A kórházi ágyak számának alakulását 1985 és 1991 között viszonylag egyenletes, de kismértékű növekedés jellemezte. A csökkenő népességszámmellett ez a 10 000 lakosra jutó kórházi ágyak számának növekedését eredményezte. 1991-től kezdődően azonban a kórházi ágyak száma évrőlévre csökkent, nagyobb arányban, mint a népességszám. Ezért 1991-től kezdődően a 10 000 lakosra jutó kórházi ágyak száma is – viszonylagosan– csökkent.

A változások alapvető tendenciáját – az előzőekben említett módon – vonaldiagramokkal szemléltethetjük.

Page 129: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

121

3.2. ábra - Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva

A 3.2. ábra alapján is következtethetünk az egészségügyi ellátás – különböző intenzitási viszonyszámokkal jellemzett – színvonalának alakulására.Az egészségügyi ellátottság változásának tendenciáját – egyértelműbben – a 3.3. ábra szemlélteti.

3.3. ábra - Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva

Page 130: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

122

A változás tendenciájának tömör jellemzésére alkalmazhatjuk az átlagos változás mérőszámait, nevezetesen a fejlődés átlagos mértéke és a

fejlődés átlagos üteme mutatószámokat.

Az ismert adatok alapján a fejlődés átlagos mértékének mutatószámával csak a népesség számának alakulását vizsgálhatjuk. (Az orvosokra és akórházi ágyakra ugyanis nem ismertek az abszolút számok.)

A népesség változásának átlagos mértékét a legegyszerűbben a következőképpen számíthatjuk:

Ezt úgy értelmezhetjük, hogy Magyarországon a népesség száma 1985 és 1993 között évenként átlagosan 35 250 fővel csökkent.

A népességszám változásának átlagos üteme pedig:

amely alapján megfogalmazható, hogy a népesség száma 1985 és 1993 között évenként átlagosan 0,34%-kal csökkent.

Nézzük meg, hány %-kal változott a kórházi ágyak száma 1985 és 1993 között:

tehát évenként átlagosan 0,24%-kal csökkent.

A 10 000 lakosra jutó kórházi ágyak számának 1985 és 1993 közötti átlagos relatív változására vonatkozó mutatószám értékét kiszámíthatjuk akórházi ágyak számának és a népesség számának mutatószámai alapján is a következőképpen:

Ez természetesen kiszámítható a 10 000 lakosra jutó kórházi ágyak számának adataiból közvetlenül is:

Page 131: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

123

Az orvosok számának, valamint az orvosellátottság 1985 és 1993 közötti alakulásának jellemzésére az előbbiekhez hasonló módon elvégezhetőka számítások.

3.3. A csoportosító táblák elemzéseA csoportosító táblában a sokaság(ok)nak egy ismérv szerinti csoportosítása (osztályozása) található, amely általában valamilyen leíró sorral vagyösszehasonlítással társul. Ha a sokaság(ok)nak a csoportosítással kialakított részeit külön-külön is fontosnak, vizsgálatra érdemesnek tartjuk,akkor a csoportokat, az osztályokat részsokaság(ok)nak tekintjük. Ebben az esetben az egész sokaságo(ka)t teljes sokaság(ok)nak vagyfősokaság(ok)nak nevezzük.

3.8. táblázat - A csoportosító tábla általános sémája

Részsokaságok

(csoportok)

Fősokaság

ahol:

valamely ismérv alapján képzett j-edik részsokaságok (csoportok) megnevezése,

a j-edik részsokaságokra vonatkozó adatok,

Page 132: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

124

M: a képzett részsokaságok (csoportok) száma.

3.3.1. Rész- és összetett viszonyszámok

Csoportosított sokaság esetén az egyes részsokaságokra számított azonos típusú viszonyszámokat részviszonyszámoknak (jele: ), afősokaságra vonatkozó viszonyszámot összetett viszonyszámnak (jele: ) nevezzük.

A részviszonyszám képlete:

Az összetett viszonyszám képlete:

A részviszonyszám képletéből -t illetve -t kifejezve az összetett viszonyszám a következőképpen is felírható:

Ezek az összefüggések arra mutatnak rá, hogy az összetett viszonyszám egyúttal átlag is, a részviszonyszámok súlyozott számtani, illetve

harmonikus átlaga. Ez indokolja a jelölését is. Ebből következően minden összetett viszonyszám a legkisebb és legnagyobb részviszonyszám

között helyezkedik el, vagyis:

Az összetett viszonyszámra vonatkozó képleteket szövegesen megfogalmazva a következők mondhatók el. Az összetett viszonyszámháromféleképpen számítható ki:

1. a fősokaság(ok)ra vonatkozó adatok hányadosaként;

Page 133: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

125

2. a részviszonyszámok súlyozott számtani átlagaként, ahol a súlyok szerepét a részviszonyszámok számítása céljából kijelölhető törtek

nevezőiben szereplő adatok töltik be;

3. a részviszonyszámok súlyozott harmonikus átlagaként, ahol a súlyok a részviszonyszámok számítása céljából kijelölhető törtek számlálóiban

szereplő adatok.

Az összetett viszonyszámok súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási

viszonyszámokkal. A adatok helyett a az adatok helyett az megoszlási viszonyszámok használhatók fel.

A következőkben a rész- és összetett viszonyszámoknak különböző elemzési helyzetekben betöltött szerepére mutatunk be példákat.

Az átlagos színvonal vizsgálata csoportosított sokaságok esetén

3.9. táblázat - Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.)

MegnevezésNépességszám

(ezer fő)

Lakások száma

(ezer db)

Budapest

A többi város

Községek

1 995,7

4 561,9

3 719,4

810

1692

1453Összesen 10 277,0 3955

A 3.9. táblázatban szereplő adatok felhasználásával jellemezhető a magyarországi lakásellátottság színvonala. Kiszámítható a lakásellátottság egyikleggyakrabban használt mutatószáma, a 100 lakásra jutó lakosok száma .

A lakásellátottság színvonalát tehát intenzitási viszonyszámmal fejezzük ki.

Page 134: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

126

Ebben az elemzési helyzetben a településtípusokra vonatkozó intenzitási viszonyszámok részviszonyszámok míg az egész országot jellemző

intenzitási viszonyszám összetett viszonyszámnak tekinthető.

A 3.9. táblázat adataiból – mivel azok részekre bontott sokaságok adatai – megoszlási viszonyszámok is számíthatók. Ezek a viszonyszámok anépesség, illetve a lakások településtípusonkénti összetételét jellemzik.

A 3.9. táblázatban szereplő adatokat a belőlük számítható viszonyszámokkal kiegészítve állítottuk össze a 3.10. táblázatot.

3.10. táblázat - A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.)

Népesség száma Lakások száma 100 lakásra

ezer fő%-os

megoszlásezer db

%-os

megoszlás

jutó

népesség (fő)

Megnevezés

Budapest

A többiváros

Községek

1 995,7

4 561,9

3 719,4

19,42

44,39

36,19

810

1692

1453

20,48

42,78

36,74

246

270

256

Összesen 10 277,0 100,00 3955 100,00 260

A 3.10. táblázat utolsó oszlopában található adatok rész- és összetett intenzitási viszonyszámok. Részintenzitási viszonyszám például a Budapestrevonatkozó 100 lakásra jutó népesség:

Az egész ország lakásellátottságát jellemző összetett viszonyszám kiszámítása a következő:

Page 135: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

127

Az átlagos viszonyszám a megismert összefüggések alapján az alábbiak szerint is kiszámítható:

– a részviszonyszámok súlyozott számtani átlagaként:

a településtípusonkénti lakásszámadatokkal súlyozva

vagy megoszlási viszonyszámokkal súlyozva

– a részviszonyszámok súlyozott harmonikus átlagaként:

a településtípusonkénti népességszámadatokkal súlyozva

vagy megoszlási viszonyszámokkal súlyozva

(Figyeljük meg, hogy az egész országot jellemző mutatószám értéke (260) a legkisebb (246) és a legnagyobb érték (270) közé esik.)

3.3.2. Szerkezet- és dinamikai változás vizsgálataHa egy sokaság belső szerkezetében bekövetkezett (összetétel vagy struktúra) változását kívánjuk vizsgálni, akkor is csoportosító táblából indulunkki (3.11. táblázat). A szerkezetváltozás mellett módunk van a jelenség dinamikai (időbeli) változásának vizsgálatára is.

3.11. táblázat - A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)

Ezer db

Page 136: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

128

1980 1994Szobák száma

1

2

3 és több

973

1720

849

644

1710

1601Összesen 3542 3955

A lakásállomány szobaszám szerinti szerkezetét, összetételét a különböző időpontokban megoszlási viszonyszámokkal, az állomány nagyságának

változását pedig dinamikus viszonyszámokkal elemezhetjük. Az egyes csoportokra (részsokaságokra) részviszonyszámok a fősokaságokra

összetett dinamikus viszonyszám számítható. Számításukra és a közöttük levő összefüggésekre a korábbiakban elmondottak érvényesek.

Figyelmünket most elsősorban a szerkezetvizsgálat és a dinamikai változások összefüggéseire fordítjuk. A 3.12. táblázat az előző táblázat adataitkibővíti a kiszámítható viszonyszámokkal is.

3.12. táblázat - A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása

1980. 1994. 1994. éviévi állomány állomány az

Szobákszáma ezer db

%-os

megoszlásezer db

%-os

megoszlás

1980. évi

%-ában

1

2

3 és több

973

1720

849

27,47

48,56

23,97

644

1710

1601

16,28

43,24

40,48

66,2

99,4

188,6Összesen 3542 100,00 3955 100,00 111,7

A 3.12. táblázatban található viszonyszámok alapján a következőket fogalmazhatjuk meg.

Page 137: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

129

A lakásállomány szerkezetének 1980 és 1994 közötti változására az 1 szobás lakások arányának jelentős, a 2 szobások arányának kismértékűcsökkenése és a 3 szobás lakások arányának nagyfokú növekedése jellemző. (Lásd a %-os megoszlásokat.) 1980 és 1994 között az egészlakásállomány 11,7%-kal nőtt, miközben a különböző szobaszámú lakások száma ettől eltérő módon változott. Míg az 1 szobás lakások állományaszámottevően csökkent, a 2 szobásoké alig csökkent, addig a 3 szobás lakások száma nagymértékben megnőtt. E változások eredményezték alakásállomány szobaszám szerinti szerkezetének az előzőekben vázolt változását.

Az összetétel-változás viszonyszámokkal történő elemzésére tekintsük még a következő példát is (3.13. táblázat).

3.13. táblázat - Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jeiadatok)

1980. 1994. 1994. évi

évi népesség népességszámaz

Megnevezés ezer fő%-os

megoszlásezer fő

%-os

megoszlás

1980. évi

%-ában

Budapest

A többiváros

Községek

2 059,3

4 551,3

4 098,9

19,23

42,50

38,27

1 995,7

4 561,9

3 719,4

19,42

44,39

36,19

96,9

100,2

90,7

Összesen 10 709,5 100,00 10 277,0 100,00 96,0

Magyarország népessége 1980 és 1994 között 4,0%-kal csökkent. A budapesti népességszám ettől alig eltérően – de valamivel kisebb mértékben –,3,1%-kal csökkent, emiatt a budapesti népesség aránya csekély mértékben (19,23%-ról 19,42%-ra, tehát 0,19 százalékponttal) nőtt. A többi városbana népességszám igen kis mértékben, 0,2%-kal nőtt, mivel a teljes népességszám viszont csökkent, e településcsoport népességének részarányamegnőtt. A községekben élő népesség száma 1994-ben 9,3%-kal volt kevesebb, mint 1980-ban (tehát nagyobb mértékű csökkenés tapasztalható,mint az egész országban), ennek hatására a községekben élő népesség aránya 1994-ben kisebb, mint 1980-ban.

A példák alapján könnyen belátható, hogy összefüggés van a fősokaság és a részsokaságok nagyságának és a fősokaság szerkezetének változásaközött.

Page 138: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

130

A részsokaságok nagyságának eltérő mértékű változása mindig a fősokaság összetételének megváltozását eredményezi.

Ha a j-edik részsokaság (csoport) tárgyidőszaki adata,

a j-edik részsokaság (csoport) bázisidőszaki adata,

a j-edik részsokaság (csoport) rész-dinamikus viszonyszáma,

a fősokaság összetett dinamikus viszonyszáma,

M: a képzett részsokaságok (csoportok) száma,

akkor általánosságban megállapíthatók a következő:

a) Ha akkor ebből átrendezéssel következik, ami azt jelenti, hogy ha valamely részsokaság (csoport) dinamikusviszonyszáma kisebb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül csökkent.

Ehhez hasonlóan:

b) ha akkor tehát ha valamely részsokaság (csoport) dinamikus viszonyszáma nagyobb, mint az összetett dinamikus viszonyszám,akkor a részsokaság aránya a fősokaságon belül nőtt;

c) ha akkor ebből következik, ami azt jelenti, hogy a j-edik részsokaság aránya nem változott.

A dinamikus viszonyszámok ismeretében tehát következtetni tudunk a sokaság összetételében, szerkezetében bekövetkezett változásokra. Minéljobban eltér valamely részviszonyszám az összetett viszonyszámtól, annál nagyobb mértékű az adott sokaság részarányának változása.

Tekintsük a következő számszerű példát!

Page 139: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

131

Tételezzük fel, hogy ismerjük a lakásépítések területi megoszlását 1980-ban és az 1994-re bekövetkezett dinamikai változást. Az adatok a 3.14.táblázatban találhatók.

3.14. táblázat - A magyarországi lakásállományra vonatkozó adatok

A lakások számának

%-os megoszlása 1980-ban

A lakásokszámának változása

1980-ról 1994-re

(1980=100,0%)

Megnevezés

Budapest

A többi város

Községek

20,53

34,27

45,20

111,4

139,4

90,8Összesen 100,00 ...

A teljes lakásállomány nagyságának 1980 és 1994 közötti változását jellemző összetett dinamikus viszonyszámot a 3.14. táblázatban szereplő adatok

alapján a településcsoportokra vonatkozó rész-dinamikus viszonyszámok súlyozott számtani átlagaként számíthatjuk ki.

Tehát megállapítható, hogy az egész lakásállomány 1980-ról 1994-re 11,7%-kal nőtt. A budapesti lakások száma ennél valamivel kisebb mértékben(11,4%-kal) nőtt, emiatt a budapesti lakások aránya a teljes lakásállományon belül 1980-ról 1994-re kissé csökkent. Tehát az 1994. évi részaránytjelző megoszlási viszonyszám 20,53%-nál (nem számottevően) kisebb. A többi városban a lakásállomány a teljes állomány növekedésénél nagyobbfokú növekedést mutat, e tényből az is következik, hogy a többi város részesedése az ország lakásállományából megnőtt, 1994-ben a részesedésiarány 34,27%-nál nagyobb. A községi lakások száma a vizsgált időszakban csökkent (míg az egész lakásállomány nőtt), így a községi lakásokaránya csökkent, az arány 1994-ben 45,20%-nál kisebb volt.

A sokaságok nagyságának és szerkezetének változására vonatkozó információkat nemcsak csoportosító táblák formájában jeleníthetjük meg, hanemmegfelelően megválasztott, megszerkesztett grafikon segítségével is.

Page 140: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

132

A sokaságok nagyságának és összetételének változását leggyakrabban osztott oszlopdiagramokkal vagy osztott kördiagramokkal szemléltetjük.

Oszlopdiagrammal történő ábrázolás esetén az adatokat célszerű eltérő szélességű, azonos magasságú oszlopokkal ábrázolni. Az oszlopok(téglalapok) eltérő szélességében a sokaság(ok) nagyságának időbeli változását juttatjuk kifejezésre, és az azonos magasságokat az adott időszakiösszetételnek megfelelően megosztjuk, így a szerkezetváltozás is érzékelhetővé válik.

3.4. ábra - A lakásállomány szobaszám szerinti összetételének alakulása

A 3.4. ábra elkészítéséhez szükséges viszonyszámok a 3.12. táblázatban találhatók.

A téglalapok szélességeinek arányai 1:1,117.

Page 141: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

133

A kördiagram a sokaság szerkezeti megoszlásának igen kifejező ábrázolási módja. Az összetételt a kör területének körcikkekre történő osztásávalszemléltetjük. A részsokaságok arányát jelző megoszlási viszonyszámoknak megfelelő körcikkeket abból az egyszerű összefüggésből határozzukmeg, hogy a kör területe, azaz a 360°-os középponti szög megfelel a 100%-nak, így 1%-nak 3,6°-os középponti szög, azaz a hozzátartozó körcikkterülete felel meg. Az összetétel ábrázolása mellett lehetőség van arra is, hogy a sokaságok nagyságának időbeli változását is érzékeltessük. Kétidőszak adatának összehasonlítása esetén két különálló (esetleg két koncentrikus), eltérő sugarú körrel ábrázolunk.

Síkidomokkal való ábrázolás esetén azok területe arányos az adatok nagyságával, viszont síkidomok megszerkesztésekor egydimenziósjellemzőkből indulunk ki, így a köröket a sugaruk segítségével szerkesztjük. Ehhez fontos tisztázni, milyen arányban áll a sugarak nagyságaegymással.

Ha azt akarjuk, hogy a körök területaránya a viszonyszámot fejezze ki – mivel a körök területaránya azonos a sugarak négyzetének arányával

–, a sugarak aránya lesz.

3.5. ábra - A lakásállomány szobaszám szerinti összetételének alakulása

Természetesen a 3.5. ábra elkészítéséhez is szükségesek a 3.12. táblázatból kiolvasható viszonyszámok. Az 1994-es lakásállomány nagyságát

szemléltető kör sugara a az 1980. évi állományt reprezentálóénak -szerese.

3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzéseAzok a gazdasági és társadalmi jelenségek, folyamatok, amelyek vizsgálatával a statisztika foglalkozik, összefüggésben állnak egymással. Az elemzőmunka során fontos feladat ezeknek az összefüggéseknek a feltárása, a statisztika eszközeivel történő leírása. A jelenségeket, folyamatokat azismérveik alapján jellemezhetjük, ezért a közöttük lévő összefüggések az ismérvek közötti kapcsolatként jelennek meg.

Page 142: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

134

Mielőtt a módszerek ismertetésére rátérnénk, ismerkedjünk meg az összefüggések lehetséges eseteivel.

Az ismérvek közötti kapcsolat lehet függvényszerű, lehet sztochasztikus, illetve az ismérvek lehetnek egymástól függetlenek.

Függvényszerű a kapcsolat két ismérv között, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) egyértelműen meghatározza a másik ismérvszerinti hovatartozást (ismérvváltozatot). Ilyen összefüggés van például a lakosok születési éve és életkora között.

Sztochasztikus kapcsolatról beszélhetünk akkor, ha az ismérvek között tendenciaszerű összefüggést észlelünk, ha az egyed egyik ismérv szerintihovatartozásából csupán a másik ismérv szerinti hovatartozásnak a valószínűsége határozható meg. Ilyen összefüggés van például a munkavállalókképzettsége és szakmai elismertsége között; a vállalkozások árbevétele és jövedelmezősége között stb.

A két ismérvet egymástól függetlennek mondjuk, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) ismerete semmiféle információt nem ada másik ismérv szerinti hovatartozásról (ismérvváltozatról). Pontos definícióját a 3.4.1. pontban adjuk meg.

A statisztika a sztochasztikus kapcsolat vizsgálatával foglalkozik. Ezt a kapcsolatot – az elmondottak alapján – úgy tekinthetjük, mint a két szélsőség(a teljes függvényszerűség, illetve a kapcsolat teljes hiánya) közötti átmenetet. A kapcsolat erősségét (intenzitását) aszerint ítéljük meg, hogy azmelyik szélsőséghez áll közelebb.

A kapcsolatot annál lazábbnak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál szorosabbnak, erősebbnek, minélközelebb áll a függvényszerű kapcsolathoz.

A sztochasztikus kapcsolatról elmondottak általánosíthatók kettőnél több ismérv esetére is, de ebben a fejezetben csak a két ismérv közötti(kétváltozós) sztochasztikus kapcsolatok vizsgálatának néhány egyszerű elemzési eszközével foglalkozunk.

A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak háromféle típusát különböztetjük meg:

a) Asszociáció(s)kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (nominális változók, illetve egyikük ordinálismérési szintű változó).

b) Vegyes kapcsolat: az egyik ismérv minőségi vagy területi ismérv (nominális, illetve ordinális skálán mért változó), a másik ismérv mennyiségiismérv (intervallum- vagy arányskálán mért változó).

c) Korreláció(s) kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (intervallum- és (vagy) arányskálán mért változó).

Tekintsük a következő példát: a közalkalmazottakat megfigyeljük az iskolai végzettség, a vezetésben betöltött szerep (beosztás), a közalkalmazottimunkaviszony hossza és a kereset nagysága szerint. Ha összefüggést tapasztalunk az iskolai végzettség és a beosztás között, ezt a kapcsolatotasszociációnak nevezzük, mert mindkét jellemző minőségi ismérv. Az iskolai végzettség (minőségi ismérv) és a kereset nagysága (mennyiségiismérv) közötti kapcsolat, illetve a beosztás (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat vegyes kapcsolat. Amunkaviszony hossza és a kereset nagysága közötti kapcsolatot pedig korrelációnak nevezzük, mert mindkét jellemző mennyiségi ismérv.

Page 143: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

135

Abból a szempontból, hogy melyik ismérv hat a másikra, háromféle összefüggés képzelhető el. Közvetlen ok-okozati kapcsolat, amikor az egyik ismérvaz ok, a másik az okozat, vagyis az egyik független, a másik függő változónak tekinthető. A munkaviszony hossza és a kereset nagysága közöttikapcsolatban például a munkaviszony hossza tekinthető független változónak, a kereset nagysága pedig függő változó. Az ismérvek kölcsönhatásbanlehetnek egymással, mint például az ár és a kereslet nagyságának összefüggésében. Egy termék árának nagysága befolyásolja a termék irántikeresletet, és viszont, a kereslet visszahat az árra. Közvetett kapcsolat, amikor az ismérvek között kizárólag azért tapasztalható összefüggés, mertazokat közös tényezők befolyásolják.

Az oksági összefüggések természetét általában a jelenségek szakmai ismerete alapján lehet tisztázni.

A sztochasztikus kapcsolatok statisztikai elemzéséhez a sokaság minden egységét egyidejűleg két (vagy több) ismérv szerint vizsgáljuk. Ebben afejezetben csak két ismérv összefüggésének vizsgálatával foglalkozunk.

Az asszociáció és a vegyes kapcsolat elemzése általában a sokaságnak a vizsgált két ismérv szerinti kombinatív csoportosításával (osztályozásával)kezdődik. A kombinatív csoportosítás során az egyik ismérv szerinti csoportosítással kapott részsokaságokon belül a másik ismérv szerintis osztályozunk. A kombinatív osztályozás eredményét kombinációs (kontingencia-) tábla formájában szokás megadni, emiatt tárgyaljuk asztochasztikus kapcsolatok vizsgálatát – a tananyagunknak ebben a részében – a kombinációs táblák elemzéséhez kapcsolódóan.

A kontingenciatáblák a korreláció bizonyos vizsgálataikor is kiindulópontot jelenthetnek, de a mennyiségi ismérvekben rejlő információk tökéletesebbkihasználása olyan módszerek3 alkalmazását igényli, amelyek másféle adatbázist kívánnak meg.

Két ismérv közötti kapcsolat vizsgálata a kombinációs tábla alapján történhet. A sokaságoknak két ismérv szerinti kombinatív csoportosítását(osztályozását) tartalmazó kontingenciatábla sémájaként tekintsük a 3.15. táblázatot.

3.15. táblázat - A kontingenciatábla sémájaD ismérv

E ismérv

N

3A korreláció elemzését lásd a tankönyv II. kötetében.

Page 144: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

136

ahol:

az E ismérv szerint képzett i-edik csoport (osztály) ( ),

a D ismérv szerint képzett j-edik csoport (osztály) ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek E ismérv szerint az osztályba és ezzel egyidejűleg D ismérv szerint a osztálybatartoznak ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek az E ismérv szerint a osztályba tartoznak ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek a D ismérv szerint a osztályba tartoznak ( ),

s : az E ismérv szerint képzett csoportok (osztályok) száma,

t : a D ismérv szerint képzett csoportok (osztályok) száma .

Az előbbiekből következik, hogy

Az gyakoriságok a sokaságoknak csak az E ismérv szerinti (függőleges irányú), az gyakoriságok a sokaságoknak csak a D ismérv

szerinti (vízszintes irányú) megoszlását mutatják. Ezeket a gyakoriságokat peremgyakoriságoknak, az ( ) gyakoriságokat együttesgyakoriságoknak nevezzük.

Nézzünk egy példát (területi és minőségi ismérvek esetén) (3.16. táblázat).

3.16. táblázat - A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyükés a tanintézet típusa szerint (1990. január 1.)

Megnevezés Szakmunkás-tanuló

Szakiskolaitanuló

Középiskolaitanuló

Egyetemi,főiskolai Összesen

Page 145: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

137

hallgatóBudapest

Vidéki város

Község

28

85

84

12

20

13

66

128

77

22

42

16

128

275

190Összesen 197 45 271 80 593

Példánkban peremgyakoriságok, együttes gyakoriság.

A kontingenciatábla sémáját megoszlási viszonyszámokkal (relatív gyakoriságokkal) is felírhatjuk (3.17. táblázat).

3.17. táblázat - A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal)D ismérv

E ismérv

1

ahol:

a sokaság azon egységeinek aránya (relatív gyakorisága), amelyek egyidejűleg tartoznak az E ismérv szerint az osztályba és a D ismérv

szerint a osztályba ( ). Ezeket együttes megoszlási viszonyszámoknak(relatív gyakoriságoknak) nevezzük,

Page 146: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

138

az E ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ),

a D ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ).

Ez utóbbiakat perem megoszlási viszonyszámoknak (perem relatív gyakoriságoknak) nevezzük.

A 3.16. táblázat adatai alapján készítsük el a relatív gyakoriságok táblázatát! (3.18. táblázat.)

3.18. táblázat - A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint

Megnevezés Szakmunkás-tanuló

Szakiskolaitanuló

Középiskolaitanuló

Egyetemi,

főiskolaihallgató

Összesen

(perem-

megoszlás)Budapest

Vidéki város

Községek

Összesen

(peremmegoszlás)

1

A statisztikai gyakorlatban általában ezek 100-szorosát adjuk meg, amely százalékos megoszlást jelent (3.19. táblázat).

3.19. táblázat - A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint

Megnevezés Szakmunkás-tanuló

Szakiskolaitanuló

Középiskolaitanuló

Egyetemi,főiskolai

hallgató

Összesen

Page 147: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

139

Budapest

Vidéki város

Község

4,72

14,33

14,17

2,03

3,37

2,19

11,13

21,59

12,98

3,71

7,08

2,70

21,59

46,37

32,04Összesen 33,22 7,59 45,70 13,49 100,00

3.4.1. Függvényszerű kapcsolat. Függetlenség

Az E és D között függvényszerű a kapcsolat és E a független változó, ha abból, hogy a sokaság valamelyik eleme egy adott ismérvváltozathoz

tartozik, egyértelműen következik, hogy a D ismérv szerint melyik ismérvváltozatban van. Ebből azonnal adódik, hogy a 3.15. kombinációs tábla

minden sorában csak egy együttes gyakoriság különbözik nullától (az ). Hasonlóan látható be, ha D ismérv a független változó és függvényszerűa kapcsolat, akkor minden oszlopban csak egyetlen nullától különböző együttes gyakoriság található. A 3.16. táblázatot tekintve nincs az ismérvekközött függvényszerű kapcsolat.

Ha E és D mindegyike tekinthető független változónak és függvényszerű a kapcsolat, akkor ez csak úgy lehet, hogy valamint az E és D ismérvekváltozatai között kölcsönösen egyértelmű leképezés létesíthető. Ez a kontingenciatábla szempontjából azt jelenti, hogy minden sorban és oszlopbancsak egyetlen gyakoriság lehet nullától különböző. Ha nem hangsúlyozzuk, hogy melyik ismérv a független változó, akkor függvényszerű kapcsolatonez utóbbit értjük.

Most térjünk át a függetlenségre! Tekintsük a 3.15. táblázatot. Az E és D ismérv akkor független egymástól, ha az E ismérv szerinti megoszlás nemfügg a D ismérv szerintitől és fordítva.

A fősokaság E ismérv szerinti megoszlását jellemző (összetett) megoszlási viszonyszámok az viszonyszámok .

A részsokaságok E ismérv szerinti megoszlását jellemző (rész)megoszlási viszonyszámok az viszonyszámok .

Foglaljuk ezt táblázatba (3.20. táblázat)!

3.20. táblázat - Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok

D ismérv

Page 148: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

140

E ismérv

1

Az E ismérvváltozatok szerinti megoszlási viszonyszámok nem függhetnek attól, hogy melyik D szerinti ismérvváltozatról van szó. Ezért ezeknekminden oszlopban egyenlőknek kell lenni. Írjuk fel ezt például az első sorra:

Általánosan:

Vagy ami ugyanaz:

;

Könnyű belátni, hogy ezen feltételek teljesülése esetén a D ismérv szerinti rész- és összetett megoszlás sem függ az E ismérvváltozattól. Vagyis aztmondhatjuk, hogy az E és D ismérv akkor függetlenek egymástól, ha ez az egyenletből álló

Page 149: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

141

egyenletrendszer teljesül. Olyan megállapításnak tehát, hogy a D ismérv független E-től, nincs helye, mert a függetlenség szimmetrikus reláció.

Azonnal látható, hogy a fenti egyenletrendszer ekvivalens az

egyenletrendszerrel. A fenti definíció így is fogalmazható (lásd a 3.17. táblázatot): az E és D ismérvek akkor függetlenek egymástól, ha a peremmegoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő a megfelelő együttes viszonyszámokkal.

A 3.18. táblázat alapján könnyen ellenőrizhetjük, hogy a tanulók iskolatípus szerinti és település szerinti megoszlása nem független, mert pl.

3.4.2. Az asszociáció szorosságának méréseA sztochasztikus kapcsolat – mint már tudjuk – átmenetet képez a kapcsolat teljes hiánya (a függetlenség) és a függvényszerű kapcsolat között.Vizsgálni kell, hogy egy összefüggés mennyire áll közel a függetlenséghez, illetve mennyire közelíti a függvényszerű kapcsolatot. A két szélsőségeskapcsolathoz való viszonya alapján a sztochasztikus kapcsolatot annál szorosabbnak (erősebbnek) tekintjük, minél jobban közelít a függvényszerűkapcsolathoz, és annál lazábbnak (gyengébbnek), minél közelebb áll a függetlenséghez.

Az asszociáció szorosságának mérésére többféle mutatószámot szerkesztettek, ezeket asszociációs együtthatóknak nevezzük.

A következőkben a Yule-féle, a Csuprov-féle és a Cramer-féle asszociációs együtthatókat mutatjuk be.

A Yule-féle asszociációs együttható

Olyan esetekben, amikor mindkét ismérv alternatív (két változata van), gyakran alkalmaznak az asszociáció kimutatására koordinációsviszonyszámokat. A koordinációs viszonyszámok két részsokaság nagyságának egymáshoz viszonyított arányát mutatják. Kombinatív osztályozásesetén, a kontingenciatáblából kiindulva azonos tartalmú rész- és összetett koordinációs viszonyszámokat képezhetünk (3.21. táblázat).

3.21. táblázat - Kontingenciatáblázat alternatív ismérvek esetén

D

E

Page 150: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

142

N

Ha E és D függetlenek, azaz

akkor

Úgy is mondhatjuk, hogy a főátlóban lévő együttes gyakoriságok szorzata egyenlő a mellékátlóban lévő együttes gyakoriságok szorzatával:

Ha ez nem teljesül, vagyis

akkor E és D között sztochasztikus kapcsolat van.

Ha e szorzatok különbségét elosztjuk ugyanezen szorzatok összegével, akkor a Yule-féle asszociációs együtthatóhoz (jele: Y) jutunk:

Általánosságban megállapíthatók a következők:

– a két ismérv függetlensége esetén Y = 0,

Page 151: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

143

– függvényszerű kapcsolat esetén

– sztochasztikus kapcsolat esetén

Ha az együttható abszolút értéke 0-hoz áll közel, akkor laza kapcsolatról, ha pedig 1-hez áll közel, akkor szoros sztochasztikus kapcsolatrólbeszélhetünk.

Hiányossága a mérőszámnak, hogy abszolút értéke akkor is lehet 1, ha a kapcsolat nem függvényszerű. Könnyen belátható, ha akontingenciatáblában található egy 0 gyakoriság, akkor az együttható abszolút értéke 1 lesz, annak ellenére, hogy ebben az esetben nemegyértelműen határozható meg az egyik ismérv szerinti hovatartozás alapján a másik ismérv szerinti hovatartozás.

Az együttható képlete alapján belátható,

ha

ha

Tehát pozitív Y érték akkor adódik, ha az azonos indexszel jelzett gyakoriságok a nagyobbak (ezek adnak nagyobb szorzatot), más szóval, ha azegyik ismérv 1-es jelű változata a másik ismérvnek ugyancsak 1-gyel jelzett változatát „vonzza”, ugyanígy vonzzák egymást a 0-ás jelű változatokis, míg az egyik ismérvnél 1-gyel, a másik ismérvnél 0-val jelölt változatok „taszítják” egymást. Fordított esetben negatív értéket kapunk.

Nominális mérési szintű változók esetén általában önkényesen döntjük el, hogy melyik ismérvváltozatot tesszük az első helyre, ez a döntés azegyüttható abszolút értékét nem befolyásolja, csak az előjelet. Az előjelnek ilyenkor nem tulajdonítunk különösebb jelentőséget.

Ordinális skálán mérhető változók esetén (lásd később) az előjelnek már lesz értelme, jelentősége.

Nézzünk egy példát!

3.22. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)

Ezer fő

Megnevezés Gazdaságilagaktív

Gazdaságilagnem aktív Összesen

Férfiak

Nők

2583,5

2431,5

2359,9

2935,3

4 943,4

5 366,8Összesen 5015,0 5295,2 10 310,2

Page 152: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

144

A 3.22. táblázat alapján a nem és a gazdasági aktivitás nem független ismérvek (pl. ). Ugyanakkor nem függvényszerű a kapcsolat,hiszen ha választunk egy egyedet és tudjuk, hogy férfi (E első ismérvváltozata), mégsem tudjuk megmondani, hogy gazdaságilag aktív vagy nem.

Csupán azt tudjuk, hogy annak a valószínűsége, hogy gazdaságilag aktív, és annak a valószínűsége, hogy gazdaságilag nem aktív,

Így a kapcsolat közöttük sztochasztikus.

Vizsgáljuk meg a 3.22. táblázat adatai alapján a nem és a gazdasági aktivitás ismérve közötti asszociációs kapcsolat szorosságát a Yule-féleegyütthatóval:

A mérőszám a két ismérv között laza kapcsolatot jelez.

Nézzük meg, hogy hogyan alakul az együttható értéke, ha a 3.22. táblázat sorait megcseréljük, vagyis az új táblázatban a nők adatait írjuk az elsősorba, a férfiakét a második sorba (3.23. táblázat).

3.23. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)

Ezer fő

Megnevezés Gazdaságilagaktív

Gazdaságilagnem aktív Összesen

Nők

Férfiak

2431,5

2583,5

2935,3

2359,9

5 366,8

4 943,4Összesen 5015,0 5295,2 10 310,2

A Yule-féle asszociációs együttható a 3.23. táblázatból:

A kapcsolat szorosságára ugyanakkora abszolút értékű számot kaptunk, mint korábban, csak negatív előjellel.

A Csuprov-féle és a Cramer-féle asszociációs együttható

Page 153: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

145

A Yule-féle asszociációs együttható – mint az a számítás módjából egyértelműen látszik – csak alternatív ismérvek szorosságának mérésérealkalmas. Ha a két ismérv valamelyikének kettőnél több változata van, az eredeti adatokból nem számítható. Ilyen esetben is hasznosíthatjuk ugyan,de mérsékelt hatásfokkal, ha a nem alternatív ismérvet csoportok összevonásával alternatívvá alakítjuk.

Amennyiben az ismérvek nem alternatívak, az ismérvváltozatok összevonása helyett célszerűbb olyan mutatószámot választani az asszociációszorosságának mérésére, amely ebben az esetben is alkalmazható. Ilyenek – többek között – a Csuprov-féle és a Cramer-féle asszociációsegyütthatók.

A Csuprov-féle és a Cramer-féle asszociációs együtthatók alapgondolata a függetlenség feltételezésével számított gyakoriságokhoz ( ) kapcsolódik.

Mint láttuk, az ismérvek függetlenségének feltétele az

(lásd a 3.15. táblázatot) egyenletek teljesülése.

Ez azt jelenti, hogy bevezetve az

jelölést, az E és D ismérvek akkor függetlenek, ha

minden esetben. Ha nem egyenlők, akkor nincs függetlenség, és azt gondolhatjuk, hogy a függetlenség feltételezésével számított

értékek minél jobban eltérnek a tényleges értékektől, annál „messzebb” vagyunk a függetlenségtől, vagyis annál szorosabb a kapcsolat.

Például a 3.16. táblázat alapján meghatározhatjuk a függetlenség feltételezésével számított gyakoriságokat. Ezeket tartalmazza a 3.24. táblázat.

A 3.16. táblázat alapján a budapesti szakmunkástanulók száma függetlenség esetén:

A két ismérv függetlensége esetén a 28 ezer (lásd 3.16. táblázat), budapesti lakosú, szakmunkásképzőbe járó tanulóval szemben jóval több tanulótartozna ebbe a csoportba.

Page 154: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

146

3.24. táblázat - A függetlenség feltételezésével számított gyakoriságok ( )Ezer fő

Megnevezés Szakmunkás-tanuló

Szakiskolaitanuló

Középiskolaitanuló

Egyetemi,főiskolai

hallgató

Összesen

Budapest

Vidéki város

Községek

42,52

91,36

63,12

9,71

20,87

14,42

58,50

125,67

86,83

17,27

37,10

25,63

128,00

275,00

190,00Összesen 197,00 45,00 271,00 80,00 593,00

A 3.16. és 3.24. táblázat adatait összehasonlítva is megállapíthatjuk, hogy sztochasztikus kapcsolat van a két ismérv között, mert a tényleges

gyakoriságok eltérnek a függetlenség feltételezésével számított gyakoriságoktól. Ha nem lenne kapcsolat a két ismérv között, akkor a tényleges ( )

és a függetlenség feltételezésével számított ( ) gyakoriságok rendre megegyeznének.

Az (tényleges) és (feltételezett) gyakoriságok eltérésének mérésére szolgáló nevezetes mennyiség a (Khi négyzet)4

amely az eltérések négyzetének relatív nagyságát juttatja kifejezésre. Érvényes rá a következő egyenlőtlenség:

és

A a 0 értéket akkor veszi fel, ha a vizsgált két ismérv független egymástól, azaz ha i és j minden értékére teljesül az egyenlőség.

4 A szerepe a matematikai statisztikában igen széles körű. Az asszociációvizsgálat csupán egyik alkalmazási területe. A legjellegzetesebb alkalmazásával a Tankönyv II. kötetében, a Hipotézisekellenőrzése című fejezetben foglalkozunk.

Page 155: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

147

Függvényszerű kapcsolat esetén (ekkor s = t). Más szóval a ezt a maximális értékét akkor éri el, ha a kontingenciatábla minden sorábancsak egy 0-tól különböző gyakoriság található, és e gyakoriságok mind különböző oszlopba tartoznak.

Térjünk vissza bemutató példánkhoz. Az alapadatokat és a számításokat a 3.25. táblázat tartalmazza.

A mérőszám ismeretében képezhető a Csuprov-féle asszociációs együttható (jele: T):

A Csuprov-féle asszociációs együttható értéke 0 és 1 között van. A 0 értéket akkor veszi fel, ha a két ismérv független egymástól. Függetlenség

esetén ugyanis a = 0 (és fordítva, ha = 0, akkor a két ismérv független egymástól). A T = 1 értéket csak az s = t esetben érheti el (csak ilyenkorképzelhető el az, hogy az egyik ismérv szerinti hovatartozás kölcsönösen egyértelműen meghatározza a másik ismérv szerinti hovatartozást), az

esetekben T < 1. Az esetekben a T által elérhető maximális érték:

3.25. táblázat - A számítása

Megnevezés

Budapest

28

12

66

22

42,52

9,71

58,50

17,27

–14,52

2,29

7,50

4,73

210,83

5,24

56,25

22,37

4,96

0,54

0,96

1,30

Vidéki

város

85

20

128

42

91,36

20,87

125,67

37,10

–6,36

–0,87

2,33

4,90

40,45

0,76

5,43

24,01

0,44

0,04

0,04

0,65

Page 156: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

148

Község

84

13

77

16

63,12

14,42

86,83

25,63

20,88

–1,42

–9,83

–9,63

435,97

2,02

96,63

92,74

6,91

0,14

1,11

3,62

Összesen 593 593,00 0,00 –

A középfokú és felsőfokú tanintézetekben tanulók településforma szerinti hovatartozása és a tanintézetük típusa közötti kapcsolat szorosságátjellemző Csuprov-féle asszociációs együttható:

Az asszociációs együttható alapján azt a megállapítást tehetjük, hogy a vizsgált ismérvek között laza kapcsolat van.

Az asszociációs összefüggések térbeli vagy időbeli összehasonlítására szolgál a Cramer-féleasszociációs együttható (jele: C). Ez a mutatószámkétféleképpen számítható.

1. A értékét viszonyítjuk annak maximális értékéhez:

2. A Csuprov-féle asszociációs együttható korrekciójával a következőképpen:

A Cramer-féle együttható az ismérvváltozatok számától függetlenül mindig 0 és 1 között veszi fel értékét .

Amennyiben s = t, akkor T = C, tehát ha a két ismérv változatainak száma azonos, akkor a Csuprov-féle és a Cramer-féle asszociációs együtthatószámszerű értéke megegyezik.

A Cramer-féle asszociációs együttható példánkban:

Page 157: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

149

illetve a Csuprov-féle együttható értékének módosításával:

A Cramer-féle együttható is gyenge sztochasztikus kapcsolatot jelez.

3.4.3. A vegyes kapcsolat elemzéseVegyes kapcsolatnak nevezzük a sztochasztikus kapcsolatnak azt a típusát, amelyben az ok (a független változó) szerepét minőségi (vagyterületi ismérv), az okozat (a függő változó) szerepét mennyiségi ismérv tölti be.

Egy minőségi és egy mennyiségi ismérvet tartalmazó vegyes kapcsolat elemzését a következőképpen rendezett adathalmazból kiindulva vizsgáljuk(3.26. táblázat).

3.26. táblázat - A vegyes kapcsolat adatbázisa

A mennyiségiismérv megfigyelt

értékeinek sorszáma

A minőségi ismérv változatai

ahol:

a minőségi ismérv j-edik változata (a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),

Page 158: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

150

a mennyiségi ismérvnek a j-edik részsokaság i-edik eleménél felvett értéke ( ),

a j-edik részsokaság elemszáma (a j-edik részsokasághoz tartozó megfigyelt X értékek száma). Megjegyezzük, hogy az egyes részsokaságok

elemszáma (az egyes részsokaságokhoz tartozó megfigyelések száma) különböző lehet, vagyis pl. nem feltétlenül egyezik meg -mel( ).

Például egy település ipari szervezeteit vizsgáljuk gazdálkodási forma (minőségi ismérv) és a foglalkoztatott létszám nagysága (mennyiségi ismérv)szerint. A megfigyelt létszámadatokat gazdálkodási forma szerint rendezve írhatjuk fel (3.27. táblázat).

3.27. táblázat - Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai(főben)

A megfigyeltszervezetsorszáma

VállalatKorlátolt

felelősségűtársaság

Részvénytársaság Szövetkezet

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

260

290

470

600

10

11

11

12

12

13

14

14

15

15

16

17

120

280

295

570

800

1500

55

70

88

97

143

150

215

244

260

305

Page 159: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

151

13.

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

17

18

18

18

19

19

19

20

21

22

25

26

28

29

30

35

40

45

48

50

Page 160: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

152

33.

34.

35.

36.

37.

38.

39.

40.

55

58

60

65

90

150

200

302

Mivel általában nagyszámú megfigyelést végzünk, az adatokat célszerű kombinációs (kontingencia-) táblába rendezni (3.28. táblázat).

3.28. táblázat - A kontingenciatábla sémája vegyes kapcsolat esetén

D minőségi

ismérv

X mennyiségi

ismérv

N

Page 161: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

153

ahol:

a minőségi ismérv j-edik változata (illetve a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),

az X mennyiségi ismérv alapján képzett i-edik csoport (osztály) azonosítója. Ha X diszkrét, akkor jelentheti az ismérvértéket, de jelölhetosztályközt is.

k: az X mennyiségi ismérv alapján képzett csoportok (osztályok) száma,

a sokaság azon elemeinek száma – gyakorisága –, amelyek a D minőségi ismérv szerint részsokaságba és ezzel egyidejűleg X mennyiségi

ismérv szerint a csoportba (osztályba) tartoznak ( ),

a sokaság azon elemeinek száma, amelyek az X ismérv szerint csoportba (osztályba) tartoznak ( ),

a sokaság azon elemeinek száma, amelyek a minőségi ismérv szerint a j-edik csoportba, részsokaságba tartoznak ( ), .

Például az ipari szervezeteket a megfigyelésekre támaszkodva csoportosíthatjuk – egyidejűleg – gazdálkodási forma és a létszám nagysága szerint,a két ismérvet egymással kombinálva. A mennyiségi ismérv szerinti osztályozás különösebb mérlegelést igényel. Látjuk, hogy a legkisebb éslegnagyobb létszámadat között nagy a különbség, és a kis létszámú szervezetek adják a cégek zömét. Ezért egyenlőtlen hosszúságú osztályközöketjelölünk ki. A kombinatív osztályozás eredményét a 3.29. táblázatban adjuk meg.

3.29. táblázat - Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma éslétszám szerint

Gazdálko-

dási forma

Létszám (fő)

VállalatKorlátolt

felelősségűtársaság

Részvény-társaság Szövetkezet Összesen

– 20

21 – 50

51 – 100

101 – 300

2

20

12

5

2

3

4

5

20

12

9

12

Page 162: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

154

301 – 500

501 – 1000

1000 –

1

1

1

2

1

1

3

3

1Összesen 4 40 6 10 60

A vegyes kapcsolat vizsgálatának első mozzanata szintén annak a vizsgálata, hogy van-e sztochasztikus kapcsolat a vizsgálatba bevont ismérvekközött. A feladat ebben az esetben úgy is megfogalmazható, hogy szerepet játszik-e a minőségi ismérv a mennyiségi ismérv szerinti eloszlásban?Ez vizsgálható a kontingenciatáblából kiindulva a 3.4.1. pontban tárgyalt módszerekkel. Megjegyezzük, hogy ezen vizsgálatok eredményétbefolyásolhatja, hogy milyen módon választjuk az osztályközöket.

Mivel vegyes kapcsolat esetén az egyik vizsgálatba bevont ismérv mennyiségi ismérv, az összefüggés-vizsgálat során felhasználhatjuk az átlag-– részátlag-, főátlag- – számítást, szórásszámítást, a szórásnégyzet-felbontás módszerét. Ezek segítségével számszerűsíthetjük a minőségiismérv alapján képzett részsokaságok mennyiségi ismérv szerinti különbözőségét, a minőségi ismérv szerepét a mennyiségi ismérv értékeinekkülönbözőségében.

Rész- és főátlagok

A minőségi ismérv szerint csoportosított sokaságban az egyes részsokaságokra számított átlagot részátlagnak (jele: ), a fősokaságokra vonatkozóátlagot pedig főátlagnak (jele: ) nevezzük.

A j-edik csoport részátlaga (a 3.26. táblázat alapján)

ahol :

a j-edik részsokaság értékösszege ( ),

[MA :#-#]

A főátlag

Page 163: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

155

Mivel a részátlagok és a főátlag között fennállnak az alábbi összefüggések:

Tehát a főátlag ( ) kiszámítható a részátlagok ( ) súlyozott átlagaként is:

– súlyozott számtani átlag formában, ahol a súly szerepét a részsokaságok elemszámai, az adatok töltik be,

– súlyozott harmonikus átlag formában, ahol súlyként a részsokaságok értékösszegadatai szerepelnek.

A főátlag súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási viszonyszámokkal.

A két ismérv függetlensége esetén (ha a minőségi ismérv szerinti hovatartozás semmiféle hatást nem gyakorol a mennyiségi ismérv nagyságára)

az egyenlőek (minden j-re megegyeznek). Ebből következően (minden j-re). Fontos: az állítás nem fordítható meg. A részátlagokegyenlőségéből nem következik a függetlenség. Ha arra vagyunk kíváncsiak, hogy az ismérvek függetlenek-e, a 3.4.1. pontban tárgyalt módon

járhatunk el. Ha a 3.28. kontingenciatáblát vizsgáljuk, két ismérv függetlensége esetén a minőségi ismérv szerint képzett részsokaságokban az relatív gyakoriságok i-t tetszőlegesen rögzítve minden j-re megegyeznek.

Függetlenség esetén tehát a minőségi ismérv szerint képzett részsokaságokban a relatív gyakorisági sorok azonosak. Az egyforma relatív gyakoriságisorokból pedig a részátlagokra azonos becslések származnak.

A részátlagok és a főátlag számításával, ezek összehasonlításával képet kaphatunk az ismérvek közötti kapcsolatról. Amennyiben a részátlagokjelentősen eltérnek egymástól és a főátlagtól, ez azt jelzi, hogy van kapcsolat az osztályozás alapját képező minőségi ismérv és mennyiségi ismérvközött.

A 3.27., illetve 3.29. táblázatból meghatározhatjuk a részátlagokat és a főátlagot, illetve azok becsült értékeit. Ha az eredeti adatokat nem ismerjük,akkor a kontingenciatáblából csak az utóbbiak számíthatók. Ezeket az átlagokat a 3.30. táblázat tartalmazza.

Page 164: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

156

3.30. táblázat - A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok

Megnevezés

Szervezetekszáma

Összlétszáma 3.27.táblázatalapján

Átlagos

létszám

3.29. táblázatsegítségével

becsültátlagos

létszám*

Vállalat

Korlátolt felelősségű

társaság

Részvénytársaság

Szövetkezet

4

40

6

10

1620

1687

3565

1627

405,0

42,2

594,2

162,7

387,5

47,4

558,3

170,0

Összesen 60 8499 141,7 141,6

*A számításnál az első osztályközépsőt 15-nek, az utolsót 1250-nek vettük.

Mivel a részátlagok egymástól és a főátlagtól is eltérnek (ez a helyzet a becsült értékeknél is), a két ismérv közötti kapcsolat megléte nyilvánvaló.

A vegyes kapcsolat szorosságának vizsgálata a szóródásszámítás segítségével történik. Ahhoz, hogy a mérőszámig eljuthassunk, meg kellismerkednünk néhány új fogalommal.

A rész- és fősokaságok szórása, szórásnégyzete

Amennyiben a sokaságot részsokaságokra bontva vizsgáljuk – a viszonyszámok és az átlagok számításához hasonlóan –, a fősokaságra ésa részsokaságokra vonatkozóan is számítunk szórást. A részsokaságokra vonatkozó szórást részszórásnak vagy részsokaságokon belüliszórásnak, a fősokaságra vonatkozó szórást teljes szórásnak nevezzük. A közöttük lévő összefüggés kevésbé egyszerű, mint a részviszonyszámokés az összetett viszonyszám vagy a részátlagok és a főátlag összefüggése. Az összefüggések bemutatásához nézzük a következőket!

Ha a sokaságot részekre bontva vizsgáljuk, akkor a szórásszámításra alkalmas, ún. átlagtól való eltérést háromféleképpen értelmezhetjük.

a) ( )

az ún. teljes eltérés, amely egy adott ismérvérték és a főátlag közötti eltérés.

Page 165: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

157

b) ( )

az ún. belső eltérés, amely egy adott j-edik részsokasághoz tartozó ismérvérték és j-edik részátlag közötti eltérés.

c) ( )

az ún. külső eltérés, amely a j-edik részátlag és a főátlag eltérése.

Könnyen belátható, hogy a háromféle eltérés között az alábbi összefüggés áll fenn:

Egy 800 fős Rt. esetén pl.

A 658,3 fős eltérés ebben az esetben azzal magyarázható, hogy a kiválasztott Rt. létszáma saját csoportján belül mintegy 206 fővel nagyobb, s azRt.-k létszámnagysága a szervezetek összességére jellemző átlagot is meghaladja.

A három eltérés közötti összefüggés alapján megállapíthatjuk, hogy adott érték főátlagtól való eltérését két tényező okozhatja:

– egyrészt a részsokaságokon belül különbözőek lehetnek az ismérvértékek, ezeket a különbségeket a eltérés fejezi ki,

– másrészt a részátlagok eltérhetnek egymástól, ingadozhatnak a főátlag körül. Ezt fejezi ki a eltérés, amelyben a csoportosító (minőségi) ismérvhatása mutatkozik meg.

Mind a háromféle eltérés alapján számítható valamilyen szórás, illetve szórásnégyzet.

A teljes eltérések felhasználásával adódó

szórás a teljes szórás.

Page 166: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

158

A teljes szórás négyzete a teljes szórásnégyzet.

A belső eltérésekből kiindulva számíthatók az egyes részsokaságokra vonatkozó

részszórások, vagy részsokaságokon belüli szórások.

A részszórások négyzetének az egész sokaságra vonatkozó átlaga a belső szórásnégyzet , tehát a belső szórás:

.

Ha az ( ) eltérésnégyzetek egész sokaságra vonatkozó átlagát vesszük, akkor a külső szórásnégyzetet kapjuk, és enneknégyzetgyöke a külső szórás:

A háromféle szórásnégyzet között a

összefüggés áll fenn.

Ennek igazolására (a definíciókat felhasználva) elegendő a megismert szórásnégyzetek számlálói – az ún. eltérés-négyzetösszegek – közötti összefüggés bizonyítása.

Page 167: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

159

Mivel

valamint minden j-re, ezért írhatjuk, hogy

Az eltérés-négyzetösszegeket a következőképpen is szokás jelölni:

teljes eltérés-négyzetösszeg: SS,

belső eltérés-négyzetösszeg:

külső eltérés-négyzetösszeg:

Az eltérés-négyzetösszegekre vonatkozó azonosság a következő formában is felírható:

A háromféle eltérés-négyzetösszeg, illetve szórásnégyzet összegszerű összefüggése természetesen arra is felhasználható, hogy kettő ismeretébenkiszámítsuk az ismeretlen harmadikat.

Az elmondottak alapján megfogalmazható az is, hogy a fősokaságra vonatkozó teljes szórás kétféleképpen számítható ki:

– az egyes ismérvértékek főátlagtól való eltérései alapján

Page 168: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

160

– a háromféle szórásnégyzet összefüggése alapján

Ezek után nézzük a példánkat. A 3.27. és 3.30. táblázat alapján meghatározhatók a fenti paraméterek, értékeiket a 3.31. táblázat tartalmazza (atényleges és nem a becsült értékekkel számoltunk). A teljesség kedvéért a 3.30. táblázat néhány adatát is feltüntettük.

3.31. táblázat - A vizsgált ipari szervezetekre vonatkozó adatok

Szervezetek Összlét- Átlagos Eltérés-négy- Szórás

száma % szám(fő)

létszám(fő) zetösszeg (fő)

Megnevezés

Vállalat 4 6,67 1620 405,0 76 500 138,3Korlátoltfele-lősségűtársaság

40 66,67 1687 42,2 124 204 55,7

Részvény-

társaság6 10,00 3565 594,2 1 276 521 461,3

Szövetkezet 10 16,66 1627 162,7 69 700 83,5Összesen

60 100,00 8499 141,7 =1 546 925

=239,9 =

A táblázat adatait a következőképpen kaptuk:

Az eltérés-négyzetösszeg – a fejrovatban kijelölt képlet szerint – például a vállalatoknál a következő (lásd a 3.27. táblázatot is):

Page 169: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

161

A szórás a vállalatoknál:

A teljes szórás:

Az egyes ipari szervezetek létszáma tehát átlagosan mintegy 240 fővel tér el – a négyzetes eltérések alapján számolva – a 60 szervezetre jellemző141,7 fős átlagtól.

A továbbiakban meghatározzuk a 3.31. táblázat alapján a háromféle eltérés-négyzetösszeget, és bemutatjuk azok összefüggését.

A teljes eltérés-négyzetösszeget (SS) a megfigyelt ipari szervezetek számával osztva kapjuk a teljes szórásnégyzetet:

amely a teljes eltérés-négyzetösszeghez hasonlóan bomlik összetevőkre.

Az összes ipari szervezetre vonatkozó belső eltérés-négyzetösszeg ( ) alapján a belső szórásnégyzet:

Page 170: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

162

A külső eltérés-négyzetösszegből ( ) kiindulva a külső szórásnégyzet:

A teljes szórásnégyzet tehát:

A teljes szórás az összetevők alapján:

Számítsuk ki a 60 megfigyelt ipari szervezet létszámának belső és külső szórását is.

A belső szórás

az előzőekben már bemutatott összefüggés alapján kiszámítható a különböző típusú gazdasági szervezetek létszámának szóródását jellemző

szórások súlyozott négyzetes átlagaként is:

a súly szerepét betöltő részsokasági elemszámadatok helyettesíthetők azok megoszlási viszonyszámaival, így

A belső szórás megmutatja, hogy az egyes ipari szervezetek – mind a 60 ipari szervezetet figyelembe véve – létszáma átlagosan 160,6 fővel tér ela „saját” gazdálkodási formáját jellemző átlagos létszámtól. (A négyzetes eltérések alapján számolva.)

Page 171: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

163

A külső szórás

A külső szórás megmutatja, hogy a megfigyelt vállalatok, kft.-k, részvénytársaságok, szövetkezetek átlagos létszáma az együttes átlagos létszámuktólátlagosan 178,2 fővel tér el. (A négyzetes eltérések alapján számolva.)

A vegyes kapcsolat szorosságának mérése

Visszatérve a szórásnégyzetek összefüggésére, a teljes szórásnégyzet összetevői alapján az ismérvek sztochasztikus kapcsolatára a következőketállapíthatjuk meg.

a) Ha az -k egyenlőek (minden j-re), vagyis az egyes részátlagok megegyeznek egymással és ebből következően a főátlaggal, akkor a kétismérv között nincs kapcsolat. De ez nem jelenti azt, hogy a két ismérv független. Könnyű olyan példát mondani, amelyben a részátlagok egyenlőek ésa függetlenség 3.4.1.-ben megfogalmazott feltétele nem teljesül. Tehát a függetlenségből következik, hogy az E mennyiségi ismérv és a D minőségiismérv között nincs kapcsolat, de fordítva nem.

b) Ha ( ), vagyis a részsokaságokon belül nincs szóródás ( ), akkor Ebben az esetben az ismérvértékekszóródása teljes egészében a csoportosítás alapját képező minőségi ismérv következménye. A két ismérv között olyan függvényszerű kapcsolat van,hogy a minőségi ismérv a független változó. Ugyanis ekkor minden D szerinti részsokaságban egyetlen E ismérvváltozat gyakorisága különböziknullától. És fordítva, ha a két ismérv között ilyen függvényszerű kapcsolat van, azaz a minőségi ismérv egyértelműen meghatározza a mennyiségiismérv nagyságát, akkor:

c) Ha , akkor sztochasztikus kapcsolat van a két ismérv között.

A részekre bontott sokaságból képezhető háromféle szórásnégyzet – a teljes szórásnégyzet és összetevői – alapján következtethetünk a vizsgálatbabevont két ismérv kapcsolatára, illetve arra, hogy hatást gyakorol-e az osztályozás alapját képező minőségi ismérv a sokaság egységeinekmennyiségi ismérv szerinti hovatartozására.

Ismert a háromféle szórásnégyzet összefüggése:

Page 172: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

164

Ismert az is, hogy a külső szórásnégyzet ( ) a részátlagoknak a főátlagtól való eltérései alapján számított szórásnégyzet, ami éppen az osztályozásalapját képező minőségi ismérv hatásának tulajdonítható rész a teljes szórásnégyzeten belül.

A belső szórásnégyzet ( ) az egyéb, nem vizsgált tényezők együttes hatása.

Ezért a vegyes kapcsolat szorosságának vizsgálatakor kiemelt szerepe van a

ún. szórásnégyzet-hányadosnak, amely a mennyiségi ismérv szórásnégyzetének a minőségi ismérv által megmagyarázott hányada.

A szórásnégyzet-hányados kiszámítható a következő formában is:

A , illetve összefüggés következtében belátható, hogy a megismert hányados a intervallumban vehet fel értéket:

Ha , akkor azt mondjuk, hogy a két ismérv között nincs kapcsolat. A eset akkor fordulhat elő, ha a részátlagok mind egyformák, és

ezért

Ha , ez a két ismérv függvényszerű kapcsolatára utal. eset akkor következhet be, ha a részsokaságokban az X értékek nem szóródnak

( ). A minőségi ismérv szerinti hovatartozás egyértelműen meghatározza a mennyiségi ismérvet, a sokaság elemeinek mennyiségi ismérvszerinti hovatartozását.

Ha , a két ismérv között sztochasztikus kapcsolat van.

A szórásnégyzet-hányadost megoszlási viszonyszám jellege miatt százalékos formában szokás kifejezni.

A vegyes kapcsolat szorosságának mérőszámaként a szórásnégyzet-hányados négyzetgyökét, a szóráshányadost (jele: H) használjuk.

A szóráshányados – a szórásnégyzet-hányadossal ellentétben – nem értelmezhető megoszlási viszonyszámként, ezért nem fejezhető ki %-osformában.

Page 173: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

165

Az ipari szervezetek gazdálkodási formája és a foglalkoztatott létszám közötti kapcsolatot vizsgálva, a korábbiakban kiszámított adatok alapján

A gazdálkodási forma 55,2%-ban magyarázza meg a létszám szóródását (ingadozását). A fennmaradó 44,8% egyéb nem vizsgált (ebben azösszefüggésben véletlenként kezelt) tényezők hatása. A szóráshányados

meglehetősen szoros kapcsolatot jelez a gazdálkodási forma és a létszám nagysága között.

3.4.4. A korreláció elemzése csoportosított adatokból kiindulvaHa mindkét vizsgálatba bevont ismérv mennyiségi ismérv, akkor bizonyos egyszerűbb elemzési eszközök alkalmazásánál ugyancsak kiindulópontotjelenthet a kombinációs (kontingencia-) tábla.

Azt a statisztikai táblát, amely a sokaság egységeinek mennyiségi ismérvek szerinti kombinatív osztályozását tartalmazza, korrelációs táblánaknevezzük (3.32. táblázat).

3.32. táblázat - A korrelációs tábla sémájaY

X

N

A táblázatban X az ok szerepét játszó mennyiségi ismérvet (független változót, tényezőváltozót), Y az okozat szerepét betöltő mennyiségi ismérvet(függő változót, eredményváltozót) jelenti, amennyiben ilyenek egyáltalán megkülönböztethetők. Ha két ismérv kölcsönhatásban áll egymással, nincsjelentősége annak, hogy a vizsgált ismérvek közül melyiket jelöljük X-szel, illetve Y-nal.

Page 174: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

166

az X ismérv alapján képzett i-edik osztály azonosítója, jelenthet ismérvértéket, de jelölhet osztályközt is.

az Y ismérv alapján képzett j-edik osztály azonosítója, jelenthet ismérvértéket, illetve osztályközt.

Az együttes gyakoriságok, peremgyakoriságok jelentése és ezek összefüggései már ismertek.

Mindkét ismérv mennyiségi ismérv, de most is eljárhatunk úgy, hogy az egyik ismérvet (pl: X-et) csak osztályozásra, részsokaságok kialakításárahasználjuk, a másikat (az Y-t) pedig átlag- és szórásszámítás segítségével vizsgáljuk, vagyis ugyanúgy járunk el, mint a vegyes kapcsolatvizsgálatánál.

Tekintsük a következő példát (3.33. táblázat):

3.33. táblázat - Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek számaszerint

Személyek

száma (fő)

Szobák száma

1 2 3 4 5 6 7 Összesen

1

2

3

4

1

1

2

2

1

1

10

2

1

7

7

1

2

3

1

4

2

1

1

5

22

17

6Összesen 2 5 13 15 6 7 2 50

A társasház lakásait egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint figyeltük meg. Már a táblázat adataiból is kitűnik,hogy a kisebb szobaszámú lakásokban általában kevesebb személy lakik, a nagyobb szobaszámúakban pedig több.

Esetünkben, mivel mindkét jellemző tulajdonság mennyiségi ismérv, korrelációs kapcsolatról beszélünk. Attól függően, hogy az X ismérv nagyobb(kisebb) értékeihez az Y ismérv nagyobb (kisebb) értékei tartoznak vagy éppen fordítva, kétféle korrelációról beszélhetünk.

Pozitív korreláció áll fenn két ismérv között, ha az X nagyobb értékeihez általában Y nagyobb értékei, illetve X kisebb értékeihez Y kisebb értékeitartoznak. Fordított esetben negatív korrelációról beszélünk (X nagyobb értékeihez általában Y kisebb értékei tartoznak, illetve fordítva).

Page 175: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

167

Ha a szobaszámot (X) csoportosító ismérvnek tekintjük és kiszámítjuk a különböző szobaszámú lakásokban élők átlagos számát akkortömörebben fejeződik ki a két ismérv sztochasztikus összefüggése.

Az X ismérv szerint képzett ( ) osztályok halmazán értelmezett függvényt, amely -hez az részátlagot rendeli, az Y változó X változóravonatkozó (X szerinti) tapasztalati regressziófüggvényének nevezzük.

Példánkban (3.34. táblázat):

3.34. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalatiregressziófüggvénye

Szobaszám Átlagos lakószám (fő)

1

2

3

4

2,40

3,36

4,53

5,67

Az egyszobás lakásokban élő személyek átlagos száma például:

A tapasztalati regressziófüggvény a két ismérv közötti kapcsolatra vonatkozó – a jelenlegi elemzési helyzetben a korrelációs táblába foglalt –

információt egyetlen statisztikai sorba ( -hez rendelt részátlagok sorozata) sűríti. Egyértelműen láthatóvá vált, hogy a két ismérv között vankorreláció, mégpedig pozitív irányú korreláció. (A szobaszámok nagyobb értékeihez az átlagos lakószám növekvő értékei tartoznak.)

A tapasztalati regressziófüggvény nemcsak a korreláció létezésének kimutatására alkalmas, hanem a kapcsolat lényegét, természetét is tömören

kifejezi. Grafikusan is ábrázolható a pontokat összekötő vonaldiagram formájában, ahol vagy az ismérvérték, vagy az X

szerint képzett i-edik osztályköz osztályközepe. A pontokat összekötő szakaszoknak mint függvényértékeknek ugyan nincs statisztikaijelentése, ennek ellenére a statisztikai gyakorlatban e pontokat összekötjük. Így alkothatunk szemléletesebb képet a két mennyiségi ismérv közöttisztochasztikus kapcsolat jellegéről, tendenciájáról.

Page 176: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

168

A tapasztalati regressziófüggvényt célszerű az egyedi értékadatok alapján (a két mennyiségi ismérvnek a sokaság egyes egységeit jellemző,összetartozó értékpárjai alapján) készített pontdiagrammal közös koordináta-rendszerben ábrázolni. A vonaldiagram és a ponthalmaz kölcsönöshelyzete tájékoztat a korrelációs kapcsolat szorosságáról is.

Példánkban 50 lakást figyeltünk meg egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint. Minden lakást jellemez egy

szobaszám- és egy lakószám- adat. Az összetartozó értékeket derékszögű koordináta-rendszerben egy-egy pontként ábrázolvakészítjük el a korrelációt szemléltető pontdiagramot és ugyanebben a koordináta-rendszerben ábrázoljuk a tapasztalati regressziófüggvényt (3.6.ábra).

3.6. ábra - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat

A korreláció szorosságának mérése

A csoportosított adatokból kiinduló korrelációelemzés során a kapcsolat szorosságának mérése a vegyes kapcsolat szorosságának mérésével analóg

módon történik. Ha az osztályozást X ismérv szerint végezzük, úgy az Y értékekre vonatkozó részátlagokhoz ( ) és főátlaghoz ( ) háromféle

szórásnégyzet kapcsolódik. Az Y belső szórásnégyzete az Y külső szórásnégyzete az Y teljes szórásnégyzete (Az Y arra utal, hogya függő változó (Y) szórásnégyzetéről van szó.) Közöttük a

Page 177: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

169

összefüggés áll fenn.

A szórásnégyzet-hányadoshoz hasonlóan képezhetjük a ún. determinációs hányadost. Megkülönböztetésül, a indexében elsőhelyen a „szóródó”, a második helyen a csoportosító ismérvet tüntettük fel.

A determinációs hányados azt mutatja meg, hogy az X ismérv mekkora hányadát magyarázza meg az Y ismérv szórásnégyzetének. Szokás %-os formában is kifejezni.

A korreláció szorosságának mérésére használhatjuk a determinációs hányados négyzetgyökét, a

A korrelációs hányados a szórásnégyzet-hányadoshoz hasonlóan a közötti intervallumban vehet fel értéket.

Függvényszerű kapcsolat esetén :

A korreláció hiánya esetén:

Korreláció esetén:

Ha az oksági kapcsolat nem egyirányú, akkor logikailag indokolt lehet, hogy az X ismérvnek az Y ismérv szerinti szorossági mérőszámait számítsukki, vagyis a

Ebben az esetben az X a „szóródó” ismérv, az Y pedig a csoportosító ismérv szerepét tölti be.

Ha az X és az Y közötti kapcsolat sztochasztikus, akkor általában a kétféle megközelítésből számított mutatószámok nem egyeznek meg:

Page 178: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

170

Ha az ismérvek (változók) függetlenek, akkor Ez azt is jelenti, hogy a tapasztalati regressziós függvény állandó. Fordítva nem igaz:

abból, hogy (ekkor is nulla), nem következik a függetlenség.

Ha akkor azt mondjuk, hogy az ismérvek (változók) korrelálatlanok. A korrelálatlanság is szimmetrikus reláció.

Függvényszerű kapcsolat esetén, mint az előző pontban is láttuk,

Vizsgáljuk meg a lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat szorosságát. A kapcsolat szorosságának jellemzésére

kiszámítjuk a determinációs hányadost és a korrelációs hányadost. E mutatószámok meghatározásához szükség van a Y ismérv

főátlagára, a megfigyelt lakásokban élő személyek átlagos számára ( ), a külső szórásnégyzetre, a teljes szórásnégyzetre.

Egy lakás lakóinak átlagos száma (a főátlag):

(Természetesen az kiszámítható az részátlagok súlyozott átlagaként is.)

A külső szórásnégyzet:

Az előző lépésben kiszámított főátlag, valamint a 3.34. táblázatban közölt részátlagok alapján:

A teljes szórásnégyzet:

Page 179: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

171

A 3.33. táblázat adatai és a kiszámított főátlag alapján:

A determinációs hányados:

kifejezhető százalékos formában: = 42,0%.

Ez úgy értelmezhető, hogy a lakásokban levő szobák száma 42%-ban magyarázza meg a lakásokban élő személyek számának szóródását. (Afennmaradó 58% a szobaszámon kívüli, egyéb, most nem vizsgált tényezők hatása.)

A korrelációs hányados

A szorossági mérőszám alapján megállapítható, hogy a szobák száma és a lakásokban élő személyek száma között közepes erősségűsztochasztikus kapcsolat van.

A következőkben – a részletes számítás mellőzésével – felírjuk az ismérvek (a változók) felcserélésével értelmezett – X-nek Y-ra vonatkozó –

tapasztalati regressziófüggvényét (3.35. táblázat) és az ehhez rendelhető determinációs hányadost és korrelációs hányadost.

3.35. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalatiregressziófüggvénye

Lakószám (fő)Átlagos szobaszám

Page 180: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

172

1

2

3

4

5

6

7

1,50

1,80

2,08

2,40

3,33

3,14

3,50

Az X-nek Y-ra vonatkozó tapasztalati regressziófüggvénye is jelzi, hogy pozitív irányú kapcsolat van az ismérvek között. A

pedig közepes erősségű kapcsolatra utalnak.

A számítások ellenőrzését az olvasóra bízzuk.

3.5. Gyakorlófeladatok1. Szerkesszünk olyan statisztikai táblát (adatok nélkül), amely tartalmazza a Magyarországon bejegyzett fuvarozócégek 1994. I. és II. féléviteljesítményeit (félévenként, külön-külön) a szállítás módja (közúti, vasúti, légi és egyéb) és cégforma (vállalat, gazdasági társaság, magánfuvarozó)szerint!

Elemezzük a megszerkesztett táblát! Állapítsuk meg típusát, dimenziószámát, sorait!

2. Szerkesszünk (adatok nélkül) olyan statisztikai táblát, amely a fogyasztói árak alakulását mutatja 1985-höz viszonyítva napjainkig kiadásifőcsoportok (élelmiszerek, élvezeti cikkek, ... egyéb iparcikkek és szolgáltatások) szerint!

3. A népességgel kapcsolatos adatok Magyarországon:

Megnevezés 1990 1993 1990=100%

Page 181: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

173

Népesség (ezer fő)*

Nők száma (ezer fő)*

Élveszületések száma (fő)

10 375

5 390

125 679

10 310

5 367

111 033

99,37

99,57

88,35

*Január 1-jei adatok.

Feladat:

a) Állapítsuk meg a tábla típusát és dimenziószámát!

b) Elemezzük a népesség nemek szerinti összetételét és a dinamikai változást!

c) Számítsuk ki az ezer férfira jutó nők számát! Vizsgáljuk a változást!

d) Számítsunk nyers és tisztított születési arányszámokat! Elemezzük a változást!

4. Két megyében az orvosok és a lakosok számára, valamint az orvosellátottság mutatószámaira vonatkozóan az alábbi adatokat ismerjük:

Adatok: főben

Megye Orvosokszáma

Lakosokszáma

Egy orvosrajutó lakosok

száma

Tízezerlakosra jutó

orvosokszáma

A

B

640

...

...

400 000

312,5

...

...

35

Feladat:

a) Számítsuk ki a hiányzó adatokat és mutatószámokat!

b) Vonjunk le következtetéseket!

5. Néhány ország jellemző adata 1992-ben:

Megnevezés Magyarország Ausztria Spanyolország

Page 182: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

174

Évközepi népesség (millió fő)

Terület (1000 km2)

A főváros népessége (1000 fő)

A születéskor várható átlagos élettartam (év)

a férfiaknál

a nőknél

Aktív keresők (1000 fő)

100 aktív keresőre jutó eltartott és inaktív

kereső

A munkanélküliek száma (1000 fő)

A GDP változása (1992/91, %)

10,31

93,0

2016

64,6

73,7

4242

143

663

–4,5

7,88

83,9

1505

72,6

79,2

3536

...

193

1,5

39,08

504,8

3108

73,1

79,6

150073

...

2260

1,0

Feladat:

a) Elemezzük a tábla adatait a megadott és a még kiszámítható viszonyszámok alapján!

b) Végezzünk területi összehasonlítást!

6. A környezeti feltételeket jellemző néhány adat 1992-ben:

Adatok:1000 m2

Megnevezés Debrecen PécsErdő

Park

346

2935

8260,0

3210,0Összes zöldterület 3281 11 470,0

Egy lakosra jutó zöldterület 15,1

200

67,0

255,0

Page 183: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

175

A játszóterek területe

Feladat:

Hasonlítsuk össze a két várost a környezeti feltételek szempontjából!

7. Magyarország népességére és a villamosenergia-termelés alakulására vonatkozóan az alábbi adatokat ismerjük:

Év Népesség száma azév elején (ezer fő)

Villamosenergia-termelés

1988=100%1988

1989

1990

1991

1992

1993

10 464

10 421

10 375

10 355

10 337

10 310

100,0

101,4

97,2

102,6

107,0

111,8

A széntermelés 1988-ban 20 875 ezer tonna volt, ami 1993-ra 60,3%-ra csökkent.

Feladat:

a) Hogyan alakult évről évre az 1 főre jutó villamosenergia-termelés?

b) Mennyi volt 1993-ban az 1 főre jutó széntermelés?

c) Évente átlagosan hány %-kal változott (nőtt, csökkent)

– az 1 főre jutó villamosenergia-termelés,

– az 1 főre jutó széntermelés?

d) A kiszámított változási tendenciát feltételezve mennyi a várható termelés ezen ipari termékekből 1996-ban? (1993-ban 32 630 millió kWh villamosenergiát állítottak elő.)

Page 184: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

176

8. A népesség megoszlása gazdasági aktivitás szerint január 1-jén:

Népességcsoportok 1990 1991 1992Munkavállalási kornál fiatalabb

Munkavállalási korú

Nyugdíjas korú

2 130,5

5 956,8

2 287,5

2 063,7

5 997,4

2 293,7

2 009,8

6 031,4

2 296,0Összesen 10 374,8 10 354,8 10 337,2

Feladat:

a) Nevezzük meg a tábla típusát és sorait!

b) Számítsuk ki, hogyan változott a munkavállalási korú népesség 1990-hez képest, illetve évről évre!

c) Számítsunk megoszlási viszonyszámokat 1990-ben és 1992-ben! Hasonlítsuk össze a két időszakot!

d) Számítsuk ki, hogy hány %-kal változott a népesség az egyes csoportokban és együttesen!

e) Hasonlítsuk össze a szerkezet- és dinamikai változást!

9. A gazdaságilag aktív népesség adatai Magyarországon:

Csoportok 1990. január 1. 1993. január 1.1993-

as év az1990. év

Ezer fő % Ezer fő % %-ában

Aktív keresők

GYES-en, GYED-en lévők

Foglalkoztatottnyugdíjasok

4795,2

244,7

432,0

87,2

4,5

7,9

3866,9

262,1

223,0

...

...

...

...

...

...

Foglalkoztatottak együtt 5471,9 99,6 4352,0 ... ...Munkanélküliek 24,2 0,4 663,0 ... ...Összesen 5496,1 100,0 5015,0 100,0 91,25

Page 185: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

177

Feladat:

Számítsuk ki a hiányzó adatokat, és vonjuk le következtetéseket a szerkezet- és dinamikai változásra vonatkozóan!

10. Vállalkozásokat vizsgálunk jövedelmezőségük alapján két egymást követő évben. Az eredményeket az alábbi tábla tartalmazza:

1994-ben

1993-banAlacsony Közepes Magas Összesen

Alacsony

Közepes

Magas

100

60

80

90

30

10

30

180

160

60Összesen 160 200 40 400

Feladat:

a) Töltsük ki a tábla adatait:

1. függvényszerű kapcsolat feltételezésével,

2. függetlenséget feltételezve!

b) Számítsuk ki a Csuprov- és a Cramer-féle együtthatót a tényleges helyzetnek megfelelően! Értelmezzük a kapott eredményt!

11. Valamely városban a kereskedelmi szálláshelyek vendégforgalmát a szállás típusa és a turisták lakhelye szerint vizsgáltuk. A megfigyelt adatok1994-ben 1000 főben a következők voltak:

Szállás típusa Belföldi Külföldi EgyüttSzálloda

Turistaszállás

Kemping

Fizető-vendéglátás

50

30

60

160

150

10

120

220

200

40

180

380Együtt 300 500 800

Page 186: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

178

Feladat:

a) Vizsgáljuk a sokaság megoszlását különböző módokon! Vonjunk le következtetéseket!

b) Számítsuk ki a két ismérv kapcsolatát jellemző szorossági mérőszámokat!

12. Főiskolai hallgatók lakáshelyzetét és havi kiadásuk nagyságát vizsgáltuk.

A szüleinél lakó 8 hallgató havi kiadásai Ft-ban:

1300; 1800; 2000; 2000; 2800; 3000; 3100 és 4000 Ft.

A kollégisták adatai:

2500; 3000; 3000; 3100; 3300; 3500; 3800; 4000; 4000; 4400 és 5000 Ft.

Az albérletben lakók havi kiadásai pedig:

4000; 4800; 5000; 5000 és 5200 Ft.

Feladat:

a) Számítsuk ki az átlagos havi kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket!

b) Vizsgáljuk a szóródást különböző módokon!

c) Számítsuk ki, hogy:

– a szóródás milyen mértékben magyarázható a lakáshelyzettel,

– milyen szoros kapcsolat van a lakáshelyzet és a havi kiadások nagysága között!

13. Egy tanulócsoport 15 hallgatójánál megvizsgáltuk, hogy van-e összefüggés a matematikafelvételin elért összpontszám és a felkészülés között.(Járt-e előkészítő tanfolyamra vagy sem.) A vizsgálat eredményéből a következő számítási eredmények ismertek:

Csoport Létszám (fő) Átlagos pontszám SzórásElőkészítős

Nem előkészítős

15

10

26

20

2,61

4,43Összesen 15 ... ...

Page 187: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

A sokaságok több ismérv szerintivizsgálata, a statisztikai táblák elemzése

179

Feladat:

a) Számítsuk ki a teljes szórásnégyzetet és a szórást!

b) Vizsgáljuk a felkészülés módja és a pontszám közötti kapcsolat szorosságát!

c) Írjuk le a jelentését!

14. Egy 25 pontos statisztika-zárthelyi eredményei:

Feladatsor Hallgatók száma Átlagos pontszám Relatívszórás (%)

A

B

C

11

8

6

17,00

16,25

18,30

16,47

31,63

18,03Összesen 25 ... ...

Feladat:

a) Számítsuk ki az összes

– belső eltérésnégyzetet,

– külső eltérésnégyzetet,

– teljes eltérésnégyzetet!

b) Határozzuk meg a belső, a külső és a teljes szórást!

c) Számítsuk ki, hogy a feladatsorok „nehézsége” és az elért pontszám között milyen szoros a kapcsolat!

d) A pontszámok ingadozását, szóródását hány %-ban befolyásolja az, hogy melyik feladatsort írta a hallgató?

Page 188: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

180

4. fejezet - Összetett intenzitási viszonyszámok (főátlagok)összehasonlítása4.1. A standardizálás módszere

Ha valamilyen jelenség színvonalát (pl. termékek önköltségét, lakosok orvosellátottságát, munkavállalók átlagbérét stb.) akarjuk jellemezni, akkorerre a célra a 3. fejezetben megismert intenzitási viszonyszámokat használhatjuk fel. Ha a sokaság a vizsgált színvonal szempontjából heterogén,akkor a vizsgálatot a heterogenitást előidéző ismérv megfelelő homogén csoportjaira is el kell végezni. A sokaság egészére számított intenzitásiviszonyszámokat összetett intenzitási viszonyszámoknak neveztük és jelöltük, a csoportokra pedig intenzitási részviszonyszámokat számítottunk

és azokat jelöltük. Ha a vizsgált színvonalat átlaggal fejeztük ki, akkor a sokaság egészére főátlagot ( ), a homogén csoportokra pedig

részátlagokat ( ) számítottunk. Beláttuk, hogy az átlagos színvonalat kifejező mutatókat (összetett intenzitási viszonyszám, illetve főátlag) kéttényező befolyásolja:

1. milyen az egyes csoportokban a vizsgált színvonal nagysága,

2. milyen a sokaság szerkezete, összetétele.

Fejezetünkben azzal foglalkozunk, hogy hogyan történik az átlagos színvonal térbeli különbözőségének vagy időbeli változásának vizsgálata.Látni fogjuk, hogy a heterogenitás figyelembevétele ebben az esetben még fontosabb. Előfordulhat ugyanis, hogy nemcsak a vizsgált színvonal(önköltség, orvosellátottság, átlagbér) változik két időszak között, hanem a csoportosító ismérv szerinti összetétel is. (Pl. a különböző önköltséggeldolgozó üzemek termelésének, eltérő ellátottságú települések lakosainak, különböző átlagkeresetű dolgozók létszámának aránya.) Így előfordulhat,hogy minden csoportban csökken a részátlag (pl. az átlagbér), a főátlag (a sokaság egészére számított átlagbér) mégis nő. Ha térbeli összehasonlítástvégzünk (pl. két vállalkozást hasonlítunk össze), akkor az eltérésekre (különbségekre) irányítjuk figyelmünket.

Tekintsük a következő példát (4.1. táblázat). Két vállalkozásnál hasonlítjuk össze a dolgozók átlagos havi jövedelmét. A-nál 45 E Ft, B-nél 40 E Ft.Ebből megállapíthatjuk, hogy B-nél 5 E Ft-tal kevesebb az átlagos jövedelem. E megállapítás fedi a valóságot, de hogy elemzésünk kielégítő legyen,a különbség okait, tényezőit is vizsgálnunk kell. Valóban rosszabbak-e a kereseti lehetőségek B-nél? Nemek szerint is vizsgálva a jövedelmeketbővítsük a példát:

4.1. táblázat - Jövedelem- és létszámadatok két vállalkozásnálA B

NemÖsszes jövedelem Létszám

(fő) Összes jövedelem Létszám(fő)

Page 189: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

181

(ezer Ft) (ezer Ft)Férfi

2400

300

50

10

1000

1000

20

30Összesen 2700 60 2000 50

Átlagos jövedelem A-nál:

Férfiak:

Nők:

Együtt:

Átlagos jövedelem B-nél:

Férfiak:

Nők:

Együtt:

Megállapíthatjuk, hogy B vállalkozásnál mind a férfiak, mind a nők jobban keresnek, mint A-nál. (A férfiak átlagos jövedelme 2 E Ft-tal, a nőké 3,3 EFt-tal magasabb.) Ez a megállapítás látszólag ellentmond annak, hogy B-ben alacsonyabb az átlagos jövedelem.

Két összetett intenzitási viszonyszám (főátlag) eltérése azonban nem magyarázható meg egyedül az intenzitási részviszonyszámok (részátlagok)

eltérésével. Az eltérésben a nemek szerinti eltérő összetétel is szerepet játszik. Példánkban A-nál a magasabb jövedelmű férfiak aránya 83% ,

B-nél pedig csak 40% . Ahhoz, hogy megállapításaink helytállók legyenek, külön kell választanunk e két ok hatását. Ez a standardizálásmódszerével történik.

Page 190: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

182

A standardizálás módszerével a térben (illetve időben) eltérő összetett intenzitási viszonyszámok (főátlagok) közötti különbséget (vagyhányadost) összetevőkre (illetve tényezőkre) bontjuk.

A standardizálás módszerét Kőrösy József (1844–1906) magyar származású statisztikus (demográfus) dolgozta ki és alkalmazta először. Különbözőterületeken élők korcsoportos halálozási arányszámait (1000 lakosra jutó halálozások száma egy adott területen vagy időszakban) vizsgálta,hasonlította össze. E tevékenysége során jött rá arra, hogy helytelen következtetések levonásához vezet az, ha csak az átlagos halálozásiarányszámok alapján végzi el az összehasonlítást. Ugyanis az egyes népességcsoportok életkörülményein, egészségügyi ellátásának színvonalánkívül a halálozások számát nagymértékben befolyásolja a népesség életkor szerinti összetétele is. Tudott dolog, hogy a csecsemőkortól (0–1 éveskor) eltekintve, minél idősebb korosztályt vizsgálunk, rendszerint annál nagyobb a halálozások előfordulása.

Tehát olyan népességcsoportoknál, ahol kedvezőbb életkörülmények, jobb orvosi ellátás hatására magasabb az átlagos életkor – ennélfogvanagyobb arányú az idősebb korosztály népességen belüli aránya –, magasabb lehet az átlagos halálozási arányszám, mint egyéb, kedvezőtlenebbkörülmények között élő népességcsoportoknál, annak ellenére, hogy az egyes korosztályoknál valószínűleg ellentétes irányú eltérés tapasztalható.

A felismert probléma megoldására dolgozta ki Kőrösy József a standardizálás módszerét. A különböző területek népességének átlagoshalálozási arányszámát úgy értelmezte, mint az egyes életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyeta részviszonyszámok nagysága és a népesség kor szerinti összetétele, megoszlása együttesen határoz meg. A két tényező hatását pedig úgyválasztotta el egymástól, hogy egy-egy tényező hatásának elemzésekor a másik tényezőt standardnak (állandónak) tételezte fel.

Az összetett intenzitási viszonyszámok (illetve főátlagok) térbeli összehasonlításánál azt vizsgáljuk, hogy azok mennyivel térnek el egy másik, azonosmódon csoportosított statisztikai sokaság összetett intenzitási viszonyszámától (vagy főátlagától), azaz a különbségeket képezzük.

Az időbeli elemzés során azt elemezzük, hogy az összetett intenzitási viszonyszám (vagy főátlag) hány %-kal változott az egyik időszakról a másikidőszakra, azaz a hányadosokat számítjuk ki.

Ismeretes, hogy az intenzitási viszonyszám és a számtani átlag között igen közeli a rokonság. Ugyanazt a színvonalmutatót általában kifejezhetjükviszonyszámként vagy átlagként, attól függően, hogy milyen adatokból számítottuk. Ebből következik, hogy megállapításaink mindkét mutatószámravonatkoznak. Ebben a fejezetben elsősorban olyan problémákat tárgyalunk, amelyek intenzitási viszonyszámokkal jellemezhetők. Ezért a

továbbiakban a módszert az intenzitási viszonyszámokra mutatjuk be, és a alapképletnek megfelelő jelöléseket használjuk. De mindaz, amitelmondunk, az átlagokra is érvényes.

Tekintsük át az adatbázist és a kiszámítható mutatószámokat a 4.2. táblázat szerinti formában:

4.2. táblázat - Két összetett intenzitási viszonyszám meghatározása és összehasonlítása

Összehasonlítandó területek, illetve időszakokVizsgált „0” „1” Különbség Hányados

Page 191: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

183

csoportok

1

2

j

M

Vizsgáltsokaság K I

ahol a táblázat két utolsó oszlopában a részviszonyszámok összehasonlítására szolgáló különbségeket és az hányadosokat

helyeztük el. Az összesen sorban pedig a különbség és az hányados szerepel.

A két szóban forgó ok hatását oly módon fogjuk kimutatni, hogy a két összehasonlítandó összetett viszonyszám közötti (K) tényleges különbséget,illetve a két mutató tényleges hányadosát (I) úgy bontjuk fel két részre, hogy:

1. a illetve a megfelelő részviszonyszámok közötti különbségeknek, illetve a hányadosaiknak a két összetett viszonyszám különbségére,illetve hányadosára gyakorolt hatását, a illetve pedig a két sokaság eltérő összetételének a két összetett viszonyszám különbségére, illetvehányadosára gyakorolt hatását mutassa;

2. teljesüljön továbbá, hogy az egyes hatásokat kifejező különbségek összege a teljes különbséggel egyenlő: A hányadosok szorzatapedig az összetett viszonyszámok hányadosával egyenlő: .

A különbségfelbontást elsősorban térbeli, a hányadosfelbontást pedig időbeli összehasonlításnál használjuk.

Page 192: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

184

4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségénekfelbontása összetevőire

A statisztikai elemzésben gyakran kerül sor valamilyen jelenség átlagos színvonalának térbeli összehasonlítására. Az összehasonlítás korlátozódhataz eltérés irányának megállapítására, amikor csak azt vizsgáljuk, hogy a két összetett intenzitási viszonyszám közül melyik a nagyobb. Ezzel azonbanrendszerint nem elégszünk meg, hanem amint azt az előző pontban tárgyaltuk, az eltérést előidéző tényezők számszerű hatását a standardizálásmódszerével kimutatjuk.

Tekintsük a következő példát (4.3. táblázat):

4.3. táblázat - Két ország halandósági viszonyainak alakulása (fiktív adatok)A ország („0”) B ország („1”) Arány-

Korcso-portok

(év)

Meghaltak

száma

(fő)

Lakosság

(millió fő)

Halálozási

arányszám

(‰)

Meghaltak

száma

(fő)

Lakosság

(millió fő)

Halálozási

arányszám

(‰)

számok

különbsége

(‰)

0 −14

5 − 14

15 − 39

40 − 59

60 −11

25 200

1 900

11 200

26 400

124 800

1,8

3,8

8,0

4,0

2,4

14,0

0,5

1,4

6,6

52,0

9 460

880

7 280

24 700

117 990

1,1

2,2

5,6

3,8

2,3

8,6

0,4

1,3

6,5

51,3

–5,4

–0,1

–0,1

–0,1

–0,7Összesen 189 500 20,0 ... 160 310 15,0 ... ...

Halálozási arányszám (1000 lakosra jutó halálozások száma) =

Page 193: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

185

B ország átlagos halálozási arányszáma:

Egyszerűbben írva:

Súlyozott számtani átlag formában1:

A ország átlagos halálozási arányszáma:

Egyszerűbben írva:

Súlyozott számtani átlag formában:

1 A „súlyok” szerepét a relatív súlyok (megoszlási viszonyszámok) is betölthetik (lásd itt is a 3.3.1. pontban leírtakat).

Page 194: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

186

Példánkban: K = 10,7‰ – 9,5‰ = 1,2 ‰.

B országban tehát 1,2 ezrelékponttal nagyobb a halálozási arányszám.

Ha csak ezt az arányszámot ismernénk, azt gondolnánk, hogy B országban lényegesen rosszabbak az életkörülmények és az egészségügyiviszonyok. Ha azonban a korcsoportos halálozási arányszámokat vizsgáljuk (lásd a 4.3. táblázat adatait), egészen más következtetésre jutunk, mertB országban minden egyes korcsoportban alacsonyabb a halálozási arányszám.

E feltűnő ellentmondás magyarázata abban van, hogy B országban magasabb a viszonylag magas halandóságú idősebb korúak aránya.

A standardizálás módszerével kimutatjuk, hogy a megállapított 1,2 ezrelékpontos különbséget milyen mértékben magyarázhatjuk

a korcsoportonkénti halálozási arányszámok eltéréseivel , illetve

a népesség eltérő korösszetételével .

4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatásaAhhoz, hogy a részviszonyszámok különbözőségének hatását kimutathassuk, az összetétel szempontjából összehasonlíthatóvá tesszük a kétösszetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard (azonos, állandó) összetétellel számítjuk ki.

ahol: a j-edik csoport standard súlya, részaránya.

Egyszerűbben írva2:

2A továbbiakban az egyszerűbb formát használjuk, tehát nem tüntetjük fel a szummációs határokat.

Page 195: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

187

A részhatáskülönbség azt fejezi ki, hogy csupán a megfelelő részviszonyszámok eltérése milyen hatást gyakorolt az összetettintenzitási viszonyszámok eltérésére.

Példánkban a B ország lakossági adatait választjuk standardnak .

B ország összetett viszonyszáma nem változik:

A ország összetett viszonyszáma, ha súlyként a B ország megoszlási gyakoriságait használjuk (ez a standard), pedig:

A két arányszám különbsége:

Megállapíthatjuk, hogy 0,6 ezrelékponttal alacsonyabb az átlagos halálozási arányszám amiatt, hogy minden korcsoportban alacsonyabbak azarányszámok (lásd a 4.3. táblázat utolsó oszlopát).

A az intenzitási részviszonyszámok különbségeinek átlagaként is értelmezhető és kiszámítható:

Példánkban:

Page 196: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

188

Mivel a átlag, ezért a mindig a és a között helyezkedik el. Példánkban a legkisebb eltérés –5,4 (az első korcsoportban), a legnagyobbeltérés –0,1 (pl. az 5−14 éves korcsoportnál).

4.2.2. Az összetétel különbözőségének hatásaAhhoz, hogy az összetétel különbözőségének hatását ( ) kimutathassuk, a vizsgált színvonal szempontjából összehasonlíthatóvá tesszük a kétösszetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard részviszonyszámok feltételezésével számítjuk ki.

ahol az egyes csoportok standard részviszonyszáma.

A összetételhatás-különbség azt fejezi ki, hogy csupán az összetétel különbözősége milyen hatást gyakorolt az összetett intenzitásiviszonyszámok eltérésére.

Ennek a tényezőnek a hatását példánkban úgy tudjuk kimutatni, ha mindkét ország halálozási arányszámát azonos részviszonyszámok(korcsoportonkénti halálozási arányszámok) figyelembevételével számítjuk ki és azután megállapítjuk a különbségüket. Megoldásunkat úgy folytatjuk,hogy az A ország korcsoportonkénti halálozási arányszámait tekintjük standardnak ( ).

B ország együttes viszonyszáma:

A ország együttes arányszáma nem változik:

A kimutatott pozitív előjelű 1,8‰ azt jelenti, hogy B országban, kizárólag abból adódóan, hogy a lakosság nagyobb hányadát teszik ki az idősebbek,1000 lakosra 1,8 ezrelékponttal több halálozás jutott.

Page 197: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

189

Ha a standard adatsorokat úgy választjuk meg, hogy A ország lakosság-összetételét és B ország korcsoportonkénti halálozási arányszámaitvesszük standardnak (tehát az előzőekkel éppen ellentétesen), az országos halálozási arányszámok különbségének felbontására (a számításokmellőzésével) az alábbieredményeket kapjuk:

A kétféle standard adatsor választása esetén a és számszerű eredménye ugyan eltér egymástól, de tendenciájukban hasonló módon mutatjákaz egyes tényezőknek a különbség kialakításában játszott szerepét.

Ha számításánál B ország a standard, akkor számításánál A országot kell standardnak venni (és fordítva). Ugyanis ekkor

mivel a két középső tag kiesik.

A 4.1. pontban szereplő problémafelvető példánk megoldását ( és kiszámítását) az olvasóra bízzuk.

4.3. Indexszámítás standardizálás alapján (hányadosfelbontás)Ha a tényleges, illetve (valamelyik tényező kimutatásának céljából) standardizált összetett intenzitási viszonyszámoknak nem a különbségét, hanema hányadosát képezzük, összehasonlító dinamikus viszonyszámokat kapunk. Ezeket összetettségük, komplex tartalmuk miatt indexeknek nevezzük.

Page 198: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

190

A tényleges összetett intenzitási viszonyszámok hányadosát főátlagindexnek, a standard összetétellel számított hányadost ( )részátlagindexnek, a standard részviszonyszámokkal számított hányadost ( ) pedig összetételhatás-indexnek nevezzük.3

Az indexek számítását a következő példán mutatjuk be (4.4. táblázat).

4.4. táblázat - Egy megye forgalmi és népességadatai az 1994. és 1995. évben

1994. év 1995. év 1 lakosra jutó

TelepülésForgalom

(1000 Ft)

Lakosság

(1000fő)

1 lakosrajutó forg.

(Ft/fő)

Forgalom

(1000 Ft)

Lakosság

(1000 fő)

1 lakosrajutó forg.

(Ft/fő)

forgalom

változása

(1994=100%)

Ipari 640 000 160 4000,0 774 000 180 4300,0 107,5Mezőgaz-dasági 1 440 000 480 3000,0 1 408 000 440 3200,0 106,7

Összesen 2 080 000 640 3250,0 2 182 000 620 3519,4 ...

4.3.1. A főátlagindexA főátlagindex azt fejezi ki, hogy az intenzitási viszonyszámmal kifejezhető átlagos színvonal hogyan változott egyik (bázis-) időszakróla másik (tárgy-) időszakra.

Példánkban az 1 lakosra jutó kereskedelmi forgalom változását vizsgáljuk.

A főátlagindexet háromféle módon is kiszámíthatjuk:

1. A viszonyszámtört számlálójának és nevezőjének ismeretében

3A szakirodalomban és néhány korábbi tankönyvben használatos terminológia szerint: I: változó állományú index; I': változatlan állományú index; I'': arányeltolódási index.

Page 199: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

191

2. A viszonyszámtört számlálójának és nevezőjének összetett dinamikus viszonyszáma alapján:

A forgalom változása:

A lakosság számának változása:

3. A részviszonyszámok súlyozott számtani átlagai alapján:

Mindhárom számítás ugyanarra az eredményre vezet. Míg az első kettőnek gyakorlati jelentősége van, addig a harmadik számítási forma bizonyítja,hogy a főátlagindex nagyságát két tényező befolyásolja:

a) az intenzitási részviszonyszámok változása,

b) az eltérő színvonallal jellemzett sokaság szerkezetének, összetételének változása.

A megyei átlagos 1 lakosra jutó forgalom 8,3%-os növekedését két tényező okozta:

Page 200: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

192

a) a településenkénti 1 lakosra jutó forgalomnak 7,5%-os, illetve 6,7%-os növekedése, valamint

b) a lakosság településforma szerinti összetételének megváltozása.

4.3.2. A részátlagindexA részátlagindex a részviszonyszámok változásának az összetett viszonyszám változására gyakorolt hatását fejezi ki. Eltekint a sokaságösszetétel-változásától.

Ezért a részátlagindexet változó részviszonyszámokkal és standard összetétellel képzett hányadosként számítjuk ki. Mindig a tárgyidőszak tényleges

összetételét tekintjük standardnak .

Számítása tehát az alábbi módokon történhet:

1. A standardizált összetett intenzitási viszonyszámok hányadosaként:

2. Aggregát formában4:

Az előző képletet -gyel egyszerűsítve kapjuk az aggregát formát:

Példánkban:

4 Az 5. fejezetben ismertetésre kerülő indexek analógiájára. Jelentését lásd ott.

Page 201: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

193

3. Az aggregát forma átalakításával:

a) A csoportok színvonalváltozásainak (az egyedi indexeknek, ) súlyozott számtani átlagaként:

Példánkban:

b) A csoportok színvonalváltozásainak súlyozott harmonikus átlagaként:

Példánkban

Megállapíthatjuk, hogy az 1 lakosra jutó forgalom értékének településtípusonkénti növekedése 7,0%-kal növelte a megyei 1 lakosra jutó forgalmat.

A részátlagindex mindenkor a legnagyobb és legkisebb egyedi indexek ( ) között foglal helyet, mivel azok súlyozott átlaga. A főátlagindex, mivela részátlagok változásán kívül a sokaság összetétel-változásának hatását is tartalmazza, kerülhet az egyedi indexek közé, de mutathat az egyediindexeknél nagyobb vagy kisebb százalékos változást is.

(A képletek jobb megértéséhez tekintsük át ismét a 4.2. táblázatban közölt jelölésrendszert!)

Page 202: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

194

4.3.3. Az összetételhatás indexeAz összetételhatás indexe megmutatja, hogy a részsokaság összetételében bekövetkezett változás milyen hatást gyakorolt az összetettintenzitási viszonyszám változására.

Az összetételhatás indexének számításánál mindig a bázisidőszak részviszonyszámait vesszük standardnak .

Számítási képlete a standardizált összetett intenzitási viszonyszámok hányadosaként:

Példánkban:

Megállapíthatjuk, hogy az összetétel-változás (1,2%-os mértékben) növelte az egy lakosra jutó forgalmat.

Ha a részátlagindex számításánál a tárgyidőszakot vettük standardnak, akkor ebből már következik, hogy itt a bázisidőszaknak kell standardnaklenni, mert ekkor igaz, hogy

azaz

főátlagindex = részátlagindex · összetételhatás-index

Még egyszer hangsúlyozzuk, hogy az egyenlőség fennállásának feltétele, hogy az -t tárgyidőszaki összetétellel, az -t pedig bázisidőszaki

intenzitási részviszonyszámokkal számoljuk. (Vagy fordítva: -t adatsorral; -t pedig adatsorral.)

Page 203: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

195

Ebből következik, hogy:

Leggyakrabban az össszetétel-változás hatását számítjuk közvetett úton.

Példánkban:

Hogy az összetétel hogyan változott, azt a 4.5. táblázat szemlélteti megoszlási viszonyszámokkal.

4.5. táblázat - A lakosság összetételének változása

A megye népességeTelepülés 1994-ben 1995-ben

ezer főben %-ban ezer főben %-banIpari

Mezőgazdasági

160

480

25

75

180

440

29

71Összesen 640 100 620 100

A megoszlási viszonyszámok alátámasztják előbbi megállapításunkat. A megye népességén belül megnőtt az ipari települések népességénekaránya, ahol (érthetően) nagyobb az 1 főre jutó kereskedelmi forgalom.

4.4. Alkalmazási területekA statisztikai elemzésben a standardizálás módszerét a gazdaságstatisztika és a népességstatisztika számos területén alkalmazzák. Az ismertetettmódszerek segítségével vizsgálhatjuk pl. a munka termelékenységének, a termékek önköltségének, a költségszínvonalnak, a termésátlagoknak,a születési és halálozási arányszámoknak, az egy főre jutó fogyasztásnak az alakulását. Jelentős alkalmazási terület továbbá az átlagos bérek,jövedelmek alakulásának vizsgálata is. Az árak statisztikai elemzésének bizonyos területe is e témakörhöz kapcsolódik.

A továbbbiakban e két utóbbi alkalmazást mutatjuk be.

Page 204: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

196

4.4.1. Az átlagbérek időbeli változásának vizsgálataAz átlagbérek (pl. az egy főre jutó bruttó vagy nettó bér) időbeli változását általában állománycsoportonként, szakmánként, területi egységenkéntvizsgáljuk, ezek együttes, átlagos változását indexmódszerrel elemezhetjük.

Vizsgáljuk meg az átlagbérek alakulását egy vállalkozásnál 1994. és 1995. január hónapjában (4.6. táblázat).

4.6. táblázat - Egy vállalkozás munkaügyi adatai

1994. január 1995. január

Állománycsoport

Béralap

(1000 Ft)

Létszám

(fő)

Béralap

(1000 Ft)

Létszám

(fő)

Fizikai

Nem fizikai

28 800

6 000

800

150

33 660

4 400

850

100Együtt 34 800 950 38 060 950

A bruttó átlagkeresetet a béralap és a létszám hányadosaként ( ) mint intenzitási viszonyszámot értelmezzük. Az egyes állománycsoportokraés a vállalkozás dolgozóinak összességére kiszámított bruttó átlagkereseteket és azok időbeli változását a 4.7. táblázat tartalmazza:

4.7. táblázat - 4.7. táblázat

Bruttó átlagkereset (Ft)

Állomány-csoport

1994. január 1995. január

(%)

Fizikai

Nem fizikai

36 000

40 000

39 600

44 000

110,0

110,0Együtt 36 632 40 063 109,4

Page 205: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

197

Megállapíthatjuk, hogy az átlagkereset mind a két állománycsoportban egyaránt 10–10%-kal nőtt. Ugyanakkor az együttes (átlagos) átlagkereset-növekedés csak 9,4%. Ennek a látszólagos ellentmondásnak az a magyarázata, hogy az egyes állománycsoportok összlétszámon belüli arányais megváltozott. Az alacsonyabb átlagkeresettel rendelkező fizikai állománycsoport összlétszámon belüli aránya növekedett (mert az összlétszámváltozatlansága mellett létszámuk nőtt), ugyanakkor a magasabb átlagkeresetű, nem fizikai állománycsoportban lévő dolgozók aránya csökkent(változatlan összlétszám mellett létszámuk csökkent).

A kiszámított 9,4%-os átlagkereset-növekedés az egyes állománycsoportonkénti átlagkereset-változást és az állománycsoportok létszámarány-változásának a hatását is tükrözi. Ebből következik, hogy a 109,4%-os index az átlagkeresetek elemzésének főátlagindexe.

Az állománycsoportonkénti átlagkeresetek változásának hatását az 1995-ös létszámadatok feltételezésével mutathatjuk ki.

A bruttó átlagkereset részátlagindexe:

Mint azt a 4.3.2. pontban bizonyítottuk, a részátlagindex az egyedi indexek között helyezkedik el. Példánk ebből a szempontból speciálisnaktekinthető, ugyanis mindkét állománycsoportban egyaránt 10%-kal nőtt az átlagkereset. Így a bruttó átlagkereset növekedésének átlagos nagysága iséppen 10%. A részátlagindex tehát az átlagkereset vizsgált csoportonkénti változásainak átlagát fejezi ki, rövidebben szólva az átlagkereset átlagosváltozását. Mint láttuk, az együttes bruttó átlagkereset ennél kisebb mértékben nőtt (I = 109,4%).

A létszámarányok változásának hatását az összetételhatás indexével mutatjuk ki. A számításnál feltételezzük, hogy 1995-re is az 1994-es keresetiadatok jellemzőek.

A bruttó átlagkereset összetételhatás-indexe:

A másik két index alapján:

Az átlagkereset változása különbségszámítással is elemezhető, bár azt mondtuk, hogy az időbeli változást általában az indexekkel elemezzük.

Page 206: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

198

A bruttó átlagkereset összes növekedése:

A növekedés tényezői:

(A számításnál a standardizálás egyes lépéseiben ugyanúgy jártunk el, mint a megfelelő és indexnél.)

A 3431 Ft-os keresetnövekedésben az állománycsoportonkénti átlagkereset-növekedések (fizikaiaknál 600 Ft, nem fizikaiaknál 4000 Ft) együtteshatása 3643 Ft volt, amit „lerontott” a kedvezőtlen összetétel-változás. (Az alacsony keresetű csoport létszámaránya nőtt meg 84,2%-ról 89,5%-ra.)

4.4.2. Az átlagárak időbeli változásának vizsgálataAz árakat (pontosabban az egységárakat) általában úgy értelmezzük, mint egy meghatározott egyedi termék (szolgáltatás) egy szokásosmértékegységben kifejezett mennyiségi egységére jutó forintértéket. A gyakorlatban azonban számtalan esetben előfordul, hogy több termék(szolgáltatás, cikk) árát egy adattal, egy átlagos árral kívánjuk jellemezni. A számítás szükségessége felmerülhet térben és időben is.

Az árstatisztikai vizsgálatnál megkülönböztetjük az egyedi (elemi) ár és az átlagár fogalmát. Egyedi ár fogalma alatt egy adott minőségű termék vagyszolgáltatás meghatározott körülmények között történt adásvétele során a termék vagy szolgáltatás egy egységéért fizetett pénzösszeget értjük. Azátlagár pedig bizonyos okok miatt különböző (pl. a termék minősége, a feljegyzés időpontja vagy helye) elemi árak átlaga.

Az átlagár számításainak két előfeltétele van:

– a vizsgált termékek, cikkek, szolgáltatások homogén csoportba tartozzanak, tehát olyan árucsoportba, amelybe tartozó cikkek, szolgáltatásokazonos szükségleteket elégítenek ki, az egyes cikkek, szolgáltatások eltérő árainak oka a minőségi különbségekben keresendő. (A statisztikaigyakorlatban meghatározott esetekben heterogén termékek, cikkek, szolgáltatások átlagárát is elemezzük, ezzel tananyagunkban nem foglalkozunk.)

– a termékek, cikkek természetes mértékegységben összesíthetők legyenek (ez ún. technikai előfeltétele az átlagárszámításnak).

Az átlagár tehát csak homogén csoportba tartozó és természetes mértékegységben összesíthető termékek, szolgáltatások körére értelmezhető.Átlagárat számíthatunk például a különböző minőségű kenyér elemi áraiból.

Page 207: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

199

Vezessük be a következő jelöléseket.

– az értékesített (fogyasztott, felhasznált stb.) mennyiség,

– az értékesített (fogyasztott, felhasznált stb.) termékek egyedi (elemi) ára,

n – a termékcsoporthoz tartozó termékek száma.

Az átlagár számításának lehetséges módozatai:

– intenzitási viszonyszámként, ha a mennyiségek mellett az értékesítési árbevétel ismert:

ahol v megfelel az A típusú adatnak, q pedig a B típusú adatnak. (Az összetett intenzitási viszonyszámra bevezetett jelölésrendszer szerint.)

– az egyedi (elemi) árak súlyozott számtani átlagaként számíthatjuk az alábbiak szerint:

– az egyedi (elemi) árak súlyozott harmonikus átlagaként, ha a mennyiségi adatok mellett a adatok ismertek:

A továbbiakban a képletek felírásakor eltekintünk a szummációs határok kijelölésétől.

Page 208: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

200

Az átlagár nagysága – nyilvánvalóan – függ az elemi árak nagyságától és a különböző nagyságú elemi árakkal jellemzett termékek értékesítésirészarányától.

A termékcsoport átlagárának időbeli változását, a változás okainak feltárását az itt megismert indexek szolgálják. Az alkalmazást a következő példasegítségével mutatjuk be (4.8. táblázat).

4.8. táblázat - Egy homogén árucsoportba tartozó három cikk értékesítési adatai

Március Április

Cikk

Forgalom

(1000Ft)

Értékesítettmennyiség

(db)

Ár

(Ft/db)

Forgalom

(1000Ft)

Értékesítettmennyiség

(db)

Ár

(Ft/db)

Árváltozás

(Március=

=100%)A

B

C

720,0

660,0

1000,0

800

600

500

900

1100

2000

940,5

1012,0

1440,0

950

800

600

990

1265

2400

110

115

120Összesen 2380,0 1900 ... 3392,5 2350 ... ...

Márciusi átlagár:

Áprilisi átlagár:

Főátlagindex:

Ha az átlagár 15,2%-os növekedésében csak az árak változásának hatását akarjuk kimutatni, akkor az átlagárat mindkét időszakban az áprilisbanforgalmazott cikkek áprilisi mennyiségi adataival kell súlyoznunk. Így az átlagár részátlagindexéhez jutunk:

Page 209: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

201

Általánosítva

(A részátlagindex képlete azonos a következő fejezetben bemutatásra kerülő árindex képletével, tehát ténylegesen csak az árak változásáttükrözi.)

A részátlagindex súlyozott harmonikus átlag (esetleg súlyozott számtani átlag) formában is kiszámítható:

(A súlyozott számtani átlag formát a gyakorlatban nem használjuk, ezért ennek számszerű bemutatásától eltekintünk.)

A két időszak között megváltozott a forgalmazott mennyiség cikkek szerinti összetétele, ennek az átlagár változására gyakorolt hatását azösszetételhatás-index segítségével mutatjuk ki. Ebben az indexben a márciusi termékenkénti árakat használjuk mindkét időszak átlagáránakkiszámításához:

Page 210: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

202

Általánosítva:

A három index között szintén fennáll a következő összefüggés:

Ennek feltétele, hogy a változatlannak tekintett tényezőt ( -nél a temékösszetételt, -nél az egyedi árakat) ellentétes időszakból válasszuk.

Példánkban:

Az átlagár változását tehát döntően az egyedi árak változása okozta (15,6%-os mértékben), valamelyest csökkentő hatást gyakorolt atermékösszetétel megváltozása. Megnőtt ugyanis a viszonylag olcsóbb B cikk aránya (31,6%-ról 34%-ra).

Nyomatékosan felhívjuk a figyelmet arra, hogy az itt ismertetett átlagárindexek csak a mennyiségben közvetlenül összesíthető termékek viszonylagszűkebb körére értelmezhetők. (Mint azt már a bevezetőben is hangsúlyoztuk.)

A következő fejezetben a közvetlenül nem összesíthető, különnemű, általában különböző mértékegységű termékek értékének, árának ésmennyiségének időbeli összehasonlítására szolgáló indexekkel ismerkedünk meg.

4.5. Gyakorlófeladatok1. Két országban (A és B) vizsgáljuk a születési viszonyokat. A születések számára és a szülőképes korú nők számára vonatkozó adatok az alábbiak:

Életkor A nők száma (millió fő) A születések száma (ezer)(év) A ország B ország A ország B ország

15 – 19

20 – 29

30 – 39

3,6

6,4

6,0

8,0

14,0

10,0

288

1280

260

400

2100

320

Page 211: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

203

40 – 49 4,0 8,0 60 40Összesen 20,0 40,0 1888 2860

Feladat:

a) Hasonlítsuk össze az 1000 nőre jutó születést a szülőképes korú nők egyes korcsoportjaiban és az ország egészében!

b) Standardizálással mutassuk ki, hogy:

1. a születési arányszámok különbözősége miatt mennyivel (hány ezrelékponttal) magasabb az A ország arányszáma? (A ország összetételévelszámoljunk.)

2. az eltérő korösszetétel miatt kedvezőbb vagy kedvezőtlenebb-e A ország születési arányszáma? Megállapításainkat támasszuk alá a megoszlásiviszonyszámok kiszámításával is!

2. Az öregségi nyugdíjak adatai a nyugdíjasok életkora és nemek szerint 1994 áprilisában:

Férfiak Nők

Életkor (év)száma

(1000 fő)

nyugdíj összege

(1000 Ft/fő)

száma

(1000 fő)

nyugdíj összege

(1000 Ft/fő)11 – 54

55 – 59

60 – 64

65 – 69

70 – 74

75 – 79

80 – 11

7,1

19,5

144,6

168,7

143,7

64,6

91,4

19,8

20,1

16,3

16,4

16,0

16,5

15,4

6,7

171,2

221,3

205,2

170,4

75,2

103,4

12,6

12,0

12,3

12,2

12,3

12,7

12,6Összesen 639,6 16,3 953,4 12,3

Feladat:

Hasonlítsuk össze a férfiak és a nők átlagos nyugdíját! Mutassuk ki a különbséget kialakító tényezőket!

Page 212: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

204

3. Két ország halandósági viszonyaira vonatkozó fiktív adatok:

A ország B ország

Életkor (év)Népesség

(millió fő)

Halálozási arány

(‰)

Népesség

(millió fő)

Halálozási arány

(‰)10 – 14

15 – 59

60 és felett

6

12

2

2,0

3,5

50,0

3

15

12

1,5

2,5

45,0Összesen 20 ... 30 ...

Feladat:

a) Hasonlítsuk össze a két országot a halandósági viszonyok szempontjából!

b) Mutassuk ki standardizálás segítségével a befolyásoló tényezőket!

c) Megállapításainkat szövegesen is fogalmazzuk meg!

4. A hozzáadott érték és a létszám alakulása valamely vállalkozásnál az alábbi volt:

ÜzemHozzáadott érték

(millió Ft)

Létszám

(fő)1993 1994 1993 1994

A

B

C

100

100

70

110

110

130

20

15

9

20

15

15Összesen 270 350 44 50

Feladat:

a) Számítsuk ki az egy főre jutó hozzáadott értéket mindkét évre üzemenként és a vállalkozás egészére! Vizsgáljuk a változást 1993-ról 1994-re!

Page 213: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

205

b) Mutassuk ki megfelelő indexekkel, hogy milyen szerepet játszott a vállalkozás termelékenységének javulásában (romlásában):

1. a termelékenység üzemenkénti változása,

2. a különböző termelékenységi szinten dolgozó üzemek közötti létszámösszetétel-változás!

c) Írjunk szöveges elemzést!

5. Egy termékről, amelyet három gyáregységben termelnek, az alábbiakat ismerjük:

Gyáregység Önköltség (ezer Ft/db) A termelés megoszlása1993 1994 1994-ben (%)

I.

II.

III.

8

10

12

8,4

10,6

13,2

20

40

40Összesen ... ... 100

1993-ról 1994-re a termék átlagos önköltsége 4%-kal nőtt.

Feladat:

a) Számítsuk ki a részátlagindexet!

b) Hogyan hatott a termelés összetételének gyáregységek közötti megváltozása az átlagos önköltségváltozásra?

c) Melyik gyáregység(ek) részaránya nőhetett meg?

6. Magyarország kenyérgabona-termelésének adatai:

Vetésterület (1000 ha) Termésátlag (kg/hektár)Megnevezés

1991 1993 1991 1993Búza

Rozs

1152

358

986

429

5190

2370

3050

1660Kenyérgabona 1510 1415 ... ...

Page 214: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

206

Feladat:

a) Hány %-kal nőtt (csökkent) az összes kenyérgabona-termelés Magyarországon?

b) Bontsuk fel ezt a változást a termésátlag, illetve a vetésterület változásának hatására!

c) Milyen tényezők befolyásolták az együttes termésátlag változását? Mutassuk ki e hatásokat a standardizálás módszerével!

7. Egy vállalatnál 1993-ban a vezető beosztásúak átlagos bruttó bére 60 ezer Ft, a beosztottaké pedig 24 ezer Ft volt. 1994-re a vezetők átlagbére21%-kal, a beosztottaké pedig 15%-kal nőtt. 1993-ban a vezetők aránya 20%, 1994-ben pedig 10% volt.

Feladat:

a) Rendezzük az adatokat statisztikai táblába!

b) Elemezzük a vállalatnál foglalkoztatottak átlagbérének változását indexekkel! Az eredményeket szövegesen is értékeljük!

8. Egy vállalkozás adatai:

Szakképzettség szerinti A kifizetett bruttó bérek A létszámcsoportok 1994-ben az 1990-es év %-ábanSzakmunkás

Betanított munkás

Segédmunkás

140

130

150

120

120

130Összesen 132 123

Ismert továbbá, hogy 1994-ben az összes kifizetett bruttó bérek 40%-át a szakmunkásoknak, 30%-át a betanított munkásoknak, a többit asegédmunkásoknak fizették ki.

Feladat:

Számítsuk ki, hogyan változott az átlagbér:

a) az egyes szakképzettségi csoportokban,

b) a munkások összességére vonatkozóan,

Page 215: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

207

c) a szakképzettség szerinti csoportoknál átlagosan,

d) a munkások összességére vonatkozóan csupán a létszámarányok megváltozása következtében!

9. Egy terméket három telephelyen gyártanak. A termelékenység alakulását jellemző adatok:

Telephely Egy főre jutótermelés (db/fő)

A létszámmegoszlása

1990 1994 1994-ben (%)

A

B

C

20

30

40

18

15

36

20

40

40

A temelékenység főátlagindexe: 92,3%.

Feladat:

a) Az adatok tanulmányozása alapján (számolás nélkül) válasszuk ki, hogy az alábbi három változat közül melyik felelhet meg a valóságnak?

A létszám 1990-es (bázisidőszaki) megoszlása a telephelyek sorrendjében (%):

Telephely

VáltozatA B C

1.

2.

3.

20

10

60

40

40

20

40

50

20

Indokoljuk meg válaszunkat!

b) Számítsuk ki az és indexeket! Ellenőrizzük a létszámösszetétellel kapcsolatos döntésünket!

10. Egy felsőoktatási intézményben valamennyi oktatói csoportban (tanársegéd, adjunktus, docens, főiskolai tanár) 5,6%-kal nőttek az átlagbérekegyik időszakról a másikra. Az összes oktatóra számított átlagbér növekedése pedig csak 2%-os volt.

Page 216: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Összetett intenzitási viszonyszámok(főátlagok) összehasonlítása

208

Feladat:

a) Állapítsuk meg az átlagbérekre számított főátlag-, részátlag- és összetételhatás-indexet!

b) Írjunk szöveges magyarázatot!

11. Egy magánkereskedő háromféle minőségű burgonyát értékesít. Az értékesítéssel kapcsolatos adatok az alábbiak:

Bázisidőszak Beszámolási időszakBurgonya

minőségeÉrtékesítés

árbevétele (Ft)Ár (Ft/kg)

Értékesítés

árbevétele (Ft)Ár (Ft/kg)

I osztályú

II osztályú

III osztályú

9 600

2 400

2 000

80

60

50

10 000

1 750

1 500

100

70

60Együtt 14 000 ... 13 250 ...

Feladat:

a) Számítsuk ki a burgonya átlagárát mindkét időszakban!

b) Elemezzük az átlagár változására ható tényezőket megfelelő indexekkel!

c) Írjunk szöveges értékelést

Page 217: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

209

5. fejezet - Érték-, ár- és volumenindexek5.1. Az indexszám fogalma

A gazdasági elemzésekben kiemelkedő jelentősége van az összehasonlításnak. Az azonos jellegű, azonos mértékegységű adatoknál ez egyszerűmódon megoldható, pl. viszonyszámokkal. Gyakran van azonban szükség a közvetlenül nem összesíthető adatokra vonatkozó átlagos változásmeghatározására. A gazdasági egységeknél nagyon lényeges információ a termelés vagy a forgalom teljes volumenének alakulása, melynekmegállapítása – hacsak nem egyféle cikket gyárt, forgalmaz a cég – a már ismert számításokkal nem végezhető el. Nemzetgazdasági és nemzetköziszinten úgyszintén fontos az egyes gazdasági folyamatokban bekövetkezett mennyiségi változás kimutatása, s ez is megfelelő – az eddig tárgyaltaktóleltérő – módszerek alkalmazását követeli meg. Napjainkban az árváltozás mértékének ismeretére vonatkozó igény is különösen nagy, mikro- ésmakro-összehasonlítás vonatkozásában egyaránt. A mértékegységbeli különbözőség vagy a termékek eltérő volta nem teszi lehetővé direkt módona viszonyítást. Ezért olyan eljárásra volt szükség, amely az összehasonlíthatóság nehézségét kiküszöböli. Bizonyos termékeknél az átszámítotttermészetes mértékegységben történő számbavétel kivitelezhető (pl. égetett szeszes italoknál 50°-os szesz, állattenyésztésben számosállat stb.),többnyire azonban csak nagyon körülményesen vagy egyáltalán nem lehetséges. Olyan közös jellemzőt kell találni, melynek segítségével azösszehasonlítás a termékek széles körében megoldható. Ez a közös jellemző az ár, amellyel az értékben történő számbavétel elvégezhető. Az értéka mennyiség és az egységár szorzatából határozható meg. Az értékadatok összeadhatóak, tehát ily módon az egyes termékek, termékcsoportokmennyisége összesíthetővé válik.

Az értékben való összesítést aggregálásnak, az összesített értékadatot pedig aggregátumnak nevezzük.

A közvetlenül nem összesíthető, de valamilyen szempontból összetartozó adatok átlagos változását mutató összetett összehasonlító viszonyszámaz indexszám.

Az indexszám viszonyszámnak is és átlagnak is felfogható. Viszonyszám, mert két adat hányadosa, amely időbeli és területi összehasonlításnál isalkalmazható. Átlag, mert az egyes termékekre (jelenségekre) vonatkozó viszonyszámok átlagaként is meghatározható.

Indexek számításával már az előző fejezet is foglalkozott az összetett intenzitási viszonyszámok (főátlagok) összehasonlítása során. Ezeket azindexeket standardizáláson alapuló indexeknek is szokták nevezni.

Azokat az indexeket, amelyekkel ebben a fejezetben fogunk megismerkedni, értéken alapuló indexeknek nevezzük.

5.2. Érték-, ár- és volumenindex-számításAz egyes termékek, szolgáltatások érték-, ár- és volumenváltozását dinamikus viszonyszámokkal elemezhetjük. Az indexszámítás keretébena termékekre számított dinamikus viszonyszámokat egyedi indexeknek hívjuk. A termék egységárát p-vel, a termelt, eladott, fogyasztott stb.

Page 218: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

210

mennyiséget q-val, a kettő szorzatát , az értéket v-vel jelöljük. Az összehasonlítandó két időszak jelölése bázisidőszak esetén 0, tárgyidőszak(vagy beszámolási időszak) esetén 1 indexszel történik. Így tehát az egyedi indexek meghatározásának módja:

egyedi értékindex

egyedi árindex

egyedi volumenindex

A számítások egy konkrét példa kapcsán (5.1. táblázat) a következőképpen végezhetők el:

5.1. táblázat - Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az1993–1994-es években

Eladott

mennyiség (db)

Ár

(Ft)

Eladás értéke (ezer Ft)

(aggregátumok)Televíziók

típusa 1993 1994 1993 1994 1993 1994

TS 3354TXT 43 39 43 900 49 900 1887,7 1946,1 1712,1 2145,7

TS 3353TXT 32 29 47 900 52 900 1532,8 1534,1 1389,1 1692,8

TS 5355TXT 40 37 55 900 62 900 2236,0 2327,3 2068,3 2516,0

Page 219: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

211

TS 6354TXT 21 16 59 900 74 900 1257,9 1198,4 958,4 1572,9

Összesen – – – – 6914,4 7005,9 6127,9 7927,4

(Megjegyezzük, hogy a táblázat utolsó két oszlopában szereplő értékadatokra csak a későbbi számításoknál lesz szükség.)

5.2. táblázat - Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek

Egyedi indexek (%)Televíziók típusa Értékindex Volumenindex Árindex

TS 3354 TXT 103,1 90,7 113,7TS 3353 TXT 100,1 90,6 110,4TS 5355 TXT 104,1 92,5 112,5TS 6354 TXT 95,3 76,2 125,0

A fenti indexek tehát azt jelentik, hogy az egyes televíziótípusok forgalmának értéke, árai s az eladott mennyiségek miként alakultak a vizsgáltidőszakban. Pl. a TS 3354 TXT készülékből az eladás értéke 3,1%-kal emelkedett, ára 13,7%-kal nőtt, értékesített mennyisége pedig 9,3%-kalcsökkent 1994-ben 1993-hoz viszonyítva (5.2. táblázat).

Több termékre, termékcsoportra az átlagos érték-, ár- és volumenváltozást az indexszámok mutatják, melyek kiszámítása aggregátumokkal ésátlagolással történhet.

5.2.1. Indexszám számítása aggregát formában

Az értékindex (jele: ) a termékek vagy termékcsoportok meghatározott körére vonatkozó érték átlagos változását fejezi ki. Kiszámítása avizsgált termékek két időszakra vonatkozó összesített értékadataiból (aggregátumaiból) képzett hányadossal történhet.

Az értékindex aggregát formája:1

1 A továbbiakban már csak az „egyszerű” formát használjuk, tehát az összegzés határainak és az összegzési indexeknek a feltüntetését mellőzzük. Az összegzés mindig az egyidejűleg vizsgált ntermékféleségre értendő.

Page 220: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

212

Az előző példa alapján kiszámított értékindex tehát azt mutatja, hogy a négyfajta teletextes televízió forgalmának értéke átlagosan 1,3%-kalemelkedett a vizsgált időszakban.

A képletből látható, hogy az értékváltozást két tényező befolyásolja:

– a termékek árváltozása és

– a termékek mennyiségváltozása.

Ezen hatások kimutatására szolgál a másik két index, az árindex és a volumenindex, melyek az értékindexből kiindulva is kiszámíthatóak.

Az árindex (jele: ) a különböző termékek, árucikkek, szolgáltatások árainak átlagos változását, az árszínvonal alakulását fejezi ki.

Az árindex is meghatározható két összesített értékadat (aggregátum) hányadosából. Miután azonban csak az árváltozást akarjuk mérni, amennyiségváltozás hatását ki kell szűrni. Ez oly módon történhet, hogy a két aggregátum csak az árakban tér el, a mennyiség mindkét időszakraazonos, tehát az csak a súlyszám szerepét tölti be. Attól függően, hogy a két vizsgált időszak közül melyik mennyiséget tekintjük állandónak (a

bázisidőszaki vagy a tárgyidőszaki adatokat), kétféle árindex számítása lehetséges:

bázisidőszaki súlyozású

tárgyidőszaki súlyozású

A képletekben szereplő , illetve szorzatok összegzéseként kapott értékadatokat (ezek a valóságban nem léteznek) fiktív aggregátumoknaknevezzük.

Page 221: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

213

A két árindex általában nem ad azonos eredményt az eltérő súlyszámok miatt. (A kétféle súlyozású index különbözőségének magyarázatáraa későbbiekben kerül sor.) Jelen példánkban is bázismennyiségekkel súlyozva 14,6, míg beszámolási súlyokkal számolva 14,3%-os átlagosáremelkedés mutatható ki a vizsgált időszakban.

A volumenindex (jele: ) különböző termékek volumenének átlagos változását mutatja meg.

Kiszámítása az árindexhez hasonlóan történhet, csak a hányadosban szereplő aggregátumok jelen esetben a mennyiségi adatokban különböznekegymástól. Az árak mint súlyszámok változatlanok. Attól függően, hogy a bázis- vagy a beszámolási időszak áradatait használjuk fel, a volumenindexis kétféle lehet:

bázisidőszaki súlyozású

tárgyidőszaki súlyozású

A vizsgált cikkcsoportban tehát bázisárakkal súlyozva 11,4, beszámolási áradatokkal súlyozva pedig 11,6%-os átlagos volumencsökkenés mutathatóki 1993-ról 1994-re.

A szakirodalom a bázisidőszaki súlyozású ár- és volumenindexet Laspeyres-féle, a tárgyidőszaki súlyozású indexeket pedig Paasche-féleindexeknek nevezi, az alkotók nevéből kiindulva.

(Elvileg bármely más időszak árait is fel lehet használni a volumenindex kiszámításához, mint ahogy az árindex meghatározásához is többfélemennyiségi adat jöhet számításba. Közgazdasági megfontolásból és gyakorlati kivitelezhetőségi okokból azonban az előzőekben ismertetett bázis-és tárgyidőszaki súlyozás terjedt el.)

5.2.2. Az indexek átlagformáiAz előző fejezetben összetett viszonyszámokat súlyozott átlagként már számítottunk. Miután az indexszám összetett viszonyszám is egyben, ezt amódszert itt is alkalmazhatjuk. Az aggregát formát átalakíthatjuk átlagformára. Átlagolandó értékek a megfelelő egyedi indexek, a súlyok pedig azaggregát formában felírt törtek megfelelő értékadatai lesznek.

Az átlagformában való számítás a gyakorlatban azért jelentős, mert bizonyos esetekben nem a q és a p adatsorok, hanem értékadatok és egyediindexek állnak rendelkezésre.

Page 222: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

214

Az értékindex átlagformái

Az értékindex ilyen formában történő kiszámítására a gyakorlatban ritkán kerül sor, miután a tényleges értékadatok (aggregátumok) többnyirerendelkezésre állnak, tehát az aggregát formában történő számolás általában megoldható. Esetenként azonban szükség lehet az átlagformábantörténő számításra is, melynek formái a következők:

számtani átlagforma

Az 1,3%-os átlagos értékváltozást oly módon számítottuk ki, hogy az egyes televíziótípusok egyedi értékindexeit az 1993-as, bázisforgalmakkalsúlyoztuk.

harmonikus átlagforma

Ez esetben az átlagos értékváltozás meghatározása az egyedi indexek 1994-es, beszámolási forgalmi adatokkal történő súlyozásával kerültkiszámításra.

Az árindex átlagformái

Az árindex meghatározása számtani átlaggal:

Laspeyres-féle árindex

Page 223: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

215

Az átlagolandó értékek (egyedi árindexek) súlya a tényleges bázisidőszaki érték, azaz az index nevezőjében szereplő aggregátum .

Paasche-féle árindex

A fentiekben az egyedi árindexek súlya fiktív értékadat (tárgyidőszaki mennyiség bázisárakon).

Az árindex meghatározása harmonikus átlaggal:

Paasche-féle árindex

Ennél a formulánál a tárgyidőszaki tényleges forgalmi adatokkal történik az egyedi árindexek súlyozása.

Laspeyres-féle árindex

Page 224: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

216

Itt a súly szerepét betöltő aggregátum nem valós adat, hanem a bázismennyiség tárgyidőszaki áron számított értéke.

A volumenindex átlagformái

Az árindexhez hasonlóan mindkét típusú volumenindex meghatározható átlagokkal is.

Volumenindex meghatározása számtani átlaggal:

Laspeyres-féle volumenindex

A számtani átlaggal számolt, bázissúlyozású volumenindexnél ez esetben az egyedi volumenindexek súlyszámai a bázisidőszaki, 1993-as forgalmiadatok.

Paasche-féle volumenindex

Ez esetben az egyedi volumenindexeket fiktív forgalomadatokkal (bázismennyiség beszámolási árakon) súlyozzuk.

Page 225: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

217

Volumenindex meghatározása harmonikus átlaggal:

Paasche-féle volumenindex

Laspeyres-féle volumenindex

Természetesen az indexek értéke nem függ attól, hogy aggregát vagy átlagformában kerültek kiszámításra, tehát mint példánkból is kiderült, azonoseredményt ad mindkét számítási mód.

Az indexek kiszámításának lehetséges módozatait a következő oldalon, az 5.3. táblázatban foglaljuk össze.

5.3. táblázat - Az indexek kiszámítási képleteinek áttekintő táblázataÁtlagformák

Index neve Definíciója Egyedi indexek súlyozott számtani átlagaEgyedi indexek súlyozott harmonikus

átlagaKéplet Súlyok Képlet Súlyok

Értékindex, Bázisidőszakaggregátuma

Tárgy-(beszámolási)időszak

Page 226: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

218

aggregátumaÁrindex

Bázisidőszaki súlyozású,

(Laspeyres-féle)

Bázisidőszakaggregátuma

Fiktív

aggregátum

Árindex

Tárgyidőszaki súlyozású,

(Paasche-féle)

Fiktív

aggregátum

Tárgy-(beszámolási)időszak

aggregátuma

Volumenindex

Bázisidőszaki súlyozású,

(Laspeyres-féle)

Bázis-

időszaki

aggregátum

Fiktív

aggregátum

Volumenindex

Tárgyidőszaki súlyozású,

(Paasche-féle)

Fiktív

aggregátum

Tárgyidőszak

aggregátuma

5.3. Az indexek súlyozásaAz indexszámításban a súly fogalmát kétféle értelemben használjuk. A szó egyik értelme az aggregát formával, a másik pedig az átlagformákkal

kapcsolatos. Az aggregát formánál attól függően, hogy az árak vagy a mennyiség változását kívántuk kimutatni, az a q, az a p adat vált

súlyszámmá. Az átlagformáknál a súly mindig valamely aggregátum értékadat.

A volumenindexnél, csakúgy, mint az árindexnél valós és fiktív (nem azonos időszakhoz tartozó mennyiség- és áradatok szorzatából számított –

illetve –) értékadatokkal is történhet a súlyozás. (Meg kell jegyezni, hogy a gyakorlatban a tényleges adatokkal történő súlyozásnak vanjelentősége, mert azok közvetlenül rendelkezésre állnak, míg a fiktív értékadatok csak számítással határozhatók meg.)

Már utaltunk rá s a számszaki példa is bizonyította, hogy a bázis- és beszámolási súlyozású indexek értékei nem egyeznek meg egymással.Az átlagolandó értékek mindkét esetben azonosak, a különbözőség egyértelműen a súlyozás eltéréséből fakad, abból, hogy a súlyarányok

Page 227: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

219

megváltoznak. Ennek oka, hogy az egyedi volumen- és árindexek között sztochasztikus kapcsolat – többnyire negatív korreláció – található. Ez aztjelenti, hogy általában egy-egy termék áremelkedése az adott termék eladott mennyiségének csökkenését vonja maga után, jelentősebb árnövekedés

pedig erőteljesebb mennyiség-visszaesést eredményez. Tehát nagyobb értékhez kisebb érték tartozik és viszont, s ennek következtében

általában azon termékek mennyiségi aránya nő, melyeknél s azoké csökken, ahol Ez azt vonja maga után, hogy a bázissúlyozású indexszámszerű értéke magasabb, mint a tárgyidőszaki súlyozásúé:

(Pozitív korreláció esetén természetesen a nagyságrendi reláció fordított.)

Példánkban is nagyobb értékűek a bázissúlyozású indexek, mint a beszámolási súlyozásúak (114,6% és 114,3%, illetve 88,6% és 88,4%). A kétfélesúlyozású index értékének eltérése azonban kicsi, mert bár a negatív korreláció egyértelműen megfigyelhető, az egyedi indexek szóródása csaknagyon kis mértékű.

Bortkiewicz mutatta ki, hogy a bázis- és tárgyidőszaki súlyozású indexek számszerű értékének eltérése három tényezővel magyarázható:

– az egyedi árindexek relatív szórásával ( ),

– az egyedi volumenindexek relatív szórásával ( ) és

– a kétféle egyedi index közötti sztochasztikus kapcsolatot mérő lineáris korrelációs együtthatóval2 .

A kétféle súlyozású index hányadosa közötti összefüggés a Bortkiewicz-tétel szerint:

(A kétféle súlyozású index értéke tehát csak akkor egyezik meg, ha az egyedi ár- vagy az egyedi volumenindexek nem szóródnak, illetve az egyediár- és volumenalakulás között nincsen korreláció.)

Már szó volt róla, hogy mindkét index elfogadható, egyaránt jól jellemzi az ár-, illetve a volumenváltozást, bár mindkettő meghatározott feltételezésselél. (Tárgyidőszakban is bázisidőszaki árak, vagy bázisidőszakban is tárgyidőszaki árak.) Abban az esetben, ha a két index értéke közötti eltérésnem nagymértékű, elegendő csak az egyik alkalmazása. Nagyobb különbség esetén azonban célszerű a két alapforma eredményét átlagolni. Azátlagolással ún. keresztezett indexformulák képezhetők. A gyakorlatban legtöbbször a Fisher-féle keresztezett formula kerül kiszámításra a kétfélesúlyozású index mértani átlagaként:

22 A lineáris korrelációs együttható két mennyiségi ismérv közötti kapcsolat szorosságát jellemzi. Határai: Tankönyvünk második kötetében foglalkozunk vele.

Page 228: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

220

Fisher-féle indexek

Árindex

Volumenindex

Különböző indexformulák használhatók tehát, a közülük való választást az ún. indexpróbákkal lehet megalapozottá tenni. Az indexpróbák azindexekkel szemben támasztott követelményeket fogalmazzák meg, melyek alapján az egyes mutatószámok értékelhetőek. A legfontosabbindexpróbák a következők:

Összemérhetőségi próba: az index értéke legyen független a volumenadatok mértékegységétől.

Időpróba: ugyanazon indexformulával számított index értéke az időszakok felcserélése mellett reciproka legyen az index eredeti értékének.

Tényezőpróba: az ugyanazon típusú formulával számított volumen- és árindex szorzata legyen egyenlő az értékindexszel.

Arányossági (átlag-) próba: az index legyen átlaga az egyedi indexeknek.

Láncpróba: a valamely formulával számított láncindexek szorzata legyen egyenlő az ugyanazon formulával számítható bázisindexszel.

(Ez a próba a később tárgyalásra kerülő indexsorok ismeretében válik érthetővé.)

A Fisher-index tekinthető az egyik legjobb formulának, mert az tesz leginkább eleget az indexekkel szemben támasztott követelményeknek (l. akövetkező pontot); az első négynek teljes mértékben, az utolsónak, a láncpróbának jó közelítéssel felel meg.

A Fisher-index mellett más keresztezett indexformulák is használatosak, így pl. az ún. Marshall–Edgeworth–Bowley-féle formulák:

Page 229: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

221

Ez esetben nem az indexek eredményeit, hanem a súlyszámokat átlagolják.

5.4. Összefüggések az indexszámításban5.4.1. Az indexszámok közötti összefüggések

Az alapvető összefüggés következtében, mely szerint az ár (p) és a mennyiség (q) szorzata az értéket adja, megállapítható, hogy az egyedi indexekközött hasonló kapcsolat található. Tehát:

Példánkban a TS 3354 TXT típusú tv-készülék esetében:

Ez az összefüggés nemcsak az egyes termékeknél, hanem a vizsgált termékcsoportok körében is fennáll. Az értékindex egyenlő az ár- ésvolumenindex szorzatával, ha azok eltérő súlyozásúak. A Fisher-féle indexnél ez a feltétel nem szerepel, nincs is értelme.

(kerekítésből adódik az eltérés).

A vizsgált termékcsoportban 1993-ról 1994-re az átlagos, hozzávetőleges 14%-os árnövekedés és a kb. 12%-os volumencsökkenés hatására azárbevétel 1,3%-kal emelkedett.

Page 230: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

222

Az indexszámok közötti összefüggéseknek a gyakorlatban nagy jelentőségük van, mert ezek felhasználásával két index ismeretében a harmadikelőállítható. Általában a volumenindexet számítják ki ilyen közvetett módszerrel. Ennek oka, hogy az értékindex meghatározása nem ütköziknehézségbe, hiszen a folyó áras forgalmi adatok teljes körűen rendelkezésre állnak, s az árindex kiszámítása is megoldható, bár többnyirecsak reprezentatív megfigyeléssel nyert adatokból. (Elvben az átlagos volumenváltozás is megállapítható reprezentatív felmérés eredményeként,azonban csak nagyobb hibával és olyan körülményes módon, annyi többletmunkával, hogy a gyakorlatban ezért ezt nem alkalmazzák.) Az átlagosvolumenváltozás meghatározása tehát a legegyszerűbben az alábbi módon történhet:

A példában szereplő adatok szerint:

Az árindexszel való osztás az árváltozás kiszűrését jelenti. A folyó áras aggregátum árindexszel történő osztását deflálásnak hívják, mely a gazdaságiszámításoknál gyakran alkalmazott eljárás. (Elvben csak a tárgyidőszaki súlyozású árindex töltheti be a deflátor szerepét, gyakorlatilag azonbanmás, az árszínvonal változását jól jellemző index is használható.)

5.4.2. Az aggregátumok közötti összefüggésekAz aggregátumok hányadosaiból az indexeket lehetett meghatározni. Nemcsak a hányadosok, hanem az aggregátumok különbségeinek vizsgálata

is jól hasznosítható a közgazdasági elemzésben. Ily módon az értékváltozás ( ) abszolút számokkal jellemezhető, s kimutatható, hogy az árak ( ),

illetve a mennyiség változása ( ) erre milyen hatással voltak. Az aggregátumokból a következő különbségek képezhetőek:

A közöttük levő összefüggés :

Page 231: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

223

A volumenváltozás és az árváltozás hatásának számszerűsítése a kétféle felbontással általában eltér egymástól. (Ez az alkalmazott

indexformulák különbözőségével magyarázható.) A a mennyiségváltozásból fakadó bevételváltozást mutatja, míg a az árváltozásból adódó

bevételmódosulást jelzi. A pozitív előjel esetén az árváltozás okozta lakossági többletkiadást, negatív előjel esetén megtakarítást adja.

Az előző példa alapján:

1993-ról 1994-re az árbevétel 91,5 ezer Ft-tal emelkedett. A volumencsökkenés 786,5 ezer Ft bevételkiesést okozott, míg az áremelkedés 878 ezer Ftárbevétel-növekedést idézett elő. Az árnövekedésből eredő lakossági többletkiadás 878 ezer Ft, tehát az 1994-ben megvásárolt televíziómennyiség1993-as árakon 878 ezer Ft-tal kevesebbe került volna.

Az indexek és az aggregátumok összefüggését az 5.1. ábra szemlélteti:

Page 232: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

224

5.1. ábra -

5.4.3. Csoportosított sokaságra számított indexekGyakran előfordul, hogy az átlagos érték-, ár- és volumenváltozást olyan áruk körére kell meghatározni, melyeknél a termékek valamilyenlényeges tulajdonság szerinti csoportosítása fontos lehet. Ez esetben az indexekből levonható helyes következtetésekhez szükséges az egyesárucsoportok elkülönült vizsgálata is, tehát az érték-, ár-, volumenindex árucsoportonkénti kiszámítása. Ekkor az egyes csoportokra kapott indexeket

részindexeknek , az összes termékre vonatkozó indexet főindexnek nevezik. A rész- és főindexek között ugyanolyan összefüggés van, minta részátlagok és a főátlag vagy a részviszonyszámok és az összetett viszonyszám között. A főindex kiszámítása tehát többféle módon is történhet:

1. Az azonos jellegű aggregátumok (részaggregátumok) összegeinek hányadosaként:

Page 233: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

225

2. A részindexek részaggregátumokkal súlyozott átlagaként:

– súlyozott számtani átlagformában

– súlyozott harmonikus átlagformában

ahol:

a j-edik termék érték-, ár- vagy volumenindexe,

a vizsgált részindex számlálójában szereplő aggregátum,

a nevezőben található aggregátum.

Az előző feladatoknál az eladott Videoton teletextes tv-készülékek érték-, ár- és volumenváltozását számoltuk ki. Az ott kapott eredményekrészindexként kezelhetők abban az esetben, ha valamennyi, az üzlet által forgalmazott Videoton tv-készülékre vonatkozó átlagos változást vizsgáljuk,amely ez esetben főindexek segítségével történik (5.4. táblázat).

5.4. táblázat - A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeketforgalmazó üzletben

Árucsoport Forgalom (ezer Ft) Részindexek (%)

Page 234: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

226

1993-ban 1994-ben

1994-ben

az 1993-as

árakon

Teletextes

Videoton készülék6 914,4 7 002,9 6 123,9 101,3 114,3 88,6

Nem teletextes

Videoton készülék6 361,1 5 591,1 4 945,1 87,9 113,1 77,7

Összesen: 13 275,5 12 594,0 11 069,0 – – –

A Videoton televíziók forgalmának értéke tehát összességében 5,1%-kal csökkent annak következtében, hogy bár a teletextes készülékek forgalmaátlagosan 1,3%-kal nőtt, a nem teletextes televíziók értékesítése átlagosan 12,1%-kal esett vissza. A valamivel nagyobb részarányt képviselőteletextes tv-k forgalomalakulása tehát erőteljesebb hatással volt az átlagra.

Az átlagos árváltozás a vizsgált termékcsoportnál a következőképpen alakult:

Page 235: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

227

A két termékcsoport együttes volumenváltozása:

A forgalom 5,1%-os csökkenése tehát a két termékcsoport árainak átlagos 13,8%-os emelkedése és az eladott mennyiségük 16,6%-os visszaesésemiatt következett be.

Figyeljük meg, hogy a megfelelő főindexek az árucsoportokra számított részindexek közé esnek.

5.5. Az indexszámok gyakorlati alkalmazásaAz indexszámokat a gazdasági elemzésben nagyon sok területen alkalmazzák. Az értékindex segítségével elemezhető pl. a gazdasági egységektermelési értékének, árbevételének, forgalmának változása, a felhasznált anyagok, energia stb. értékének változása, az export és import értékénekalakulása, a fogyasztás változása stb.

Az árindexek alkalmazási területe is igen széles körű. A termelés, forgalom, fogyasztás elemzésében egyaránt fontos szerepet játszik. Az alábbiakbanfelhasználásának csak néhány lényeges aspektusa kerül kiemelésre.

A fogyasztói árindex az infláció általános mérőszáma és a gazdaság állapotának fontos jellemzője. A lakosság által vásárolt fogyasztási cikkek,szolgáltatások árainak átlagos változását fejezi ki, így fontos szerepe van az életszínvonal mérésében. Meghatározása hazánkban olyan módontörténik, hogy az ún. fogyasztói kosárba került mintegy 1800 termék, szolgáltatás „reprezentáns” árait figyelik havonta több alkalommal, s ezenárfeljegyzések számtani átlagát súlyozzák a háztartásoktól begyűjtött fogyasztási szerkezetadatokkal. A reprezentánsok egyedi árindexe a tárgyhaviés bázishavi átlagárak hányadosa. A fogyasztói árindex a reprezentások egyedi árindexeinek súlyozott átlaga, mégpedig bázissúlyozású, évenbelül változatlan súlyozással. A magyar gyakorlatban a Laspeyres-típusú árindexet számolják, mert a lakossági adatszolgáltatási rendszer 12ezer háztartást számláló reprezentatív mintájából nyert fogyasztási szerkezet aktuális adatai (a súlyszámok) csak bizonyos időeltolódással állnakrendelkezésre. A fogyasztói kosár árindexén kívül a termékek meghatározott körére is kiszámolják az árváltozást.

Az árindex jelenleg három fokozatú csoportosításban készül:

– a termékek és szolgáltatások részletes csoportjai (ezek száma 160),

– összegzőcsoportok a részletes csoportokból (számuk 40),

Page 236: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

228

– főcsoportok, melyek az összegzőcsoportokból épülnek fel (számuk 8–10).

A teljes lakossági fogyasztásra vonatkozó árindexen kívül az egyes rétegekre külön is kiszámítják az átlagos árváltozás mértékét.

Az árindexeket havonta közzéteszik, jelezve az előző év hasonló hónapjához, az előző év decemberéhez és a közvetlenül megelőző hónaphozviszonyított áralakulást. Az éves árindexek a tárgyévi átlagos árakat veszik alapul, s kétféle viszonyítással, bázis- és láncárindexekként ismeghatározásra kerülnek.

Az árindexet az indexáláshoz is felhasználják, azaz a különféle jellegű ki- vagy befizetési kötelezettségeket (pl. bérek, biztosítási díj) az inflációhozigazítják.

Az árstatisztikában lényeges az árarányok változásának vizsgálata is. Ez szintén az árindexek segítségével történik. A különböző termékekárindexeinek összehasonlításával határozható meg az árolló.Azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonosvolumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe.

Az agrárolló a mezőgazdasági termékek értékesítési árindexének és a mezőgazdaságban felhasznált iparcikkek beszerzési árindexének hányadosa.

1993-ban Magyarországon például a mezőgazdasági termelői felvásárlási árak 18,5%-kal haladták meg az előző évit, míg a termelésben felhasználtiparcikkek árai 20%-kal emelkedtek, tehát a két árindex hányadosából kiszámítható az agrárolló:

Ez azt jelenti, hogy 1993-ban 1,3%-kal magasabb volumenű mezőgazdasági termék eladása szükséges annyi bevétel eléréséhez, amely az 1992-es szinttel azonos volumenű ipari termékek megvásárlását lehetővé teszi.

Az árollók másik jelentős alkalmazási területeként az ún. cserearány-mutatókat említhetjük. Ezek a gazdálkodó szervezetek által eladott termékekárindexét viszonyítják a vásárolt termékek árindexéhez. E mutatók értéke akkor kedvező, ha 100% felett van. A külkereskedelmi cserearány mutatójaaz ún. cserearányindex (terms of trade), az adott ország által exportált és az általa importált termékek árindexeinek hányadosa. A mutató értékeazt fejezi ki, hogy az azonos volumenű export az importtermékek fogyasztásának milyen változását teszi lehetővé.

Hazánkban 1993-ban az importált termékek árai 9,4%-kal haladták meg az előző évi árakat, míg az exportált cikkeknél 11,9%-os áremelkedéskövetkezett be. Így a cserearány-mutató a következőképpen alakult:

1993-ban 2,3%-kal nagyobb volumenű terméket importálhattunk volna, ha az exportból származó bevételt csak importra fordítjuk, tehát javult acserearány.

Page 237: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

229

A volumenindexeket, mint már ismert, többnyire az árindexek segítségével számítják ki. A hagyományos felhasználási területeken túl pl. a fogyasztásreálértékének vagy a reálkereseteknek az alakulását is mérhetik vele, abból fakadóan, hogy az értékváltozásból az árváltozás hatását kiszűrve csaka volumenváltozás marad.

5.6. IndexsorokAz eddigiek során az indexszámok csak két időszak adatainak az összehasonlítására szolgáltak. A dinamikus viszonyszámokhoz hasonlóan azindexeket szintén ki lehet számítani hosszabb időszakra is. A kettőnél több időszakra vonatkozó indexek sorozatát indexsornak hívják.

Az indexsoroknak többféle fajtája különböztethető meg az alábbi szempontok alapján:

a) tartalma szerint (tehát, hogy milyen jelenség változását fejezik ki)

– értékindexsor,

– árindexsor,

– volumenindexsor;

b) a viszonyítás rendje szerint (a dinamikus viszonyszámokhoz hasonlóan)

– bázisindexsor;

– láncindexsor;

c) a súlyozás módja szerint az ár- és volumenindexsoroknál

– állandó súlyozású indexsor,

– változó súlyozású indexsor.

Az előzőek alapján tehát különböző indexsorokat lehet felírni, melyek konkrét kiszámítási módját néhány gyümölcs felvásárlására vonatkozó adatokalapján mutatjuk be (5.5. táblázat).

5.5. táblázat - Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években

Felvásárlás mennyisége

(1000 tonna)

Termelői felvásárlási átlagárak

(1000 Ft/tonna)Megne-

vezés1990 1991 1992 1993 1990 1991 1992 1993

Page 238: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

230

Alma

Málna

Meggy

Szilva

462

15

22

18

268

10

26

18

277

12

41

17

237

6

22

7

10,4

33,3

28,5

11,3

13,8

35,3

56,6

22,1

10,9

76,7

29,0

12,3

8,8

142,9

21,5

14,2

A többféle indexsor meghatározásához célszerű egy összes lehetséges értékadatot ( ) tartalmazó táblát összeállítani oly módon, hogy azegyes évek volumenadatait megszorozzuk valamennyi év áradataival. Így minden, összegzésre alkalmas aggregátum rendelkezésre áll, amely azindexsorok kiszámításához szükséges (5.6. táblázat).

5.6. táblázat - Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva

1990 1991 1992 1993A felvásárlás

évi árakon számítva (ezer Ft)1990

1991

1992

1993

6134,7

4064,6

4641,0

3370,7

8548,1

5920,8

6942,5

4882,3

7045,7

4663,6

5337,8

3767,6

6937,7

4602,0

5275,3

3515,4

A táblázat adataiból néhány indexsor kiszámítását mutatjuk be.

Bázis-értékindexsor

ahol az idősor elemei: 0, 1, 2, ..., n;

Page 239: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

231

lánc-értékindexsor

Figyeljük meg, hogy az értékindexekhez a táblázat „átlójában” szereplő értékadatokat használtuk fel.

Állandó súlyozású bázis-volumenindexsor (állandó súly a 0 időszak ára)

Page 240: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

232

állandó súlyozású lánc-árindexsor (állandó súly a 0 időszak mennyisége)

változó súlyozású bázis-árindexsor

Page 241: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

233

változó súlyozású lánc-volumenindexsor

Figyeljük meg, hogy a volumenindexsor egy-egy elemét mindig azonos oszlopban szereplő (tehát azonos árakon számított) értékadatokbólszámítottuk. Az árindexek számításánál pedig a táblázat vízszintes sorában szereplő (azonos felvásárlási mennyiségre vonatkozó) értékadatokalapján számítottuk ki az indexsor egy-egy elemét.

Az állandó súlyozású indexsornál tehát a súlyszám az indexsor minden egyes tagjánál azonos, míg változó súlyozásnál a súlyadatok indexenkéntkülönbözőek. Attól függően, hogy mely időszak ár-, illetve volumenadata állandó, lehet az indexsor Laspeyres- vagy Paasche-típusúnak megfelelő.Egyébként az indexsoroknál nem lehet egyértelmű Laspeyres- és Paasche-formuláról beszélni, csak az elvek követése szempontjából történhet abesorolás. A változó súlyozású indexsoroknál az egyes tagok kiszámításánál a kétféle formula pontosan használható. Az előző példában a változósúlyozású bázis-árindexsor elemei Paasche-típusúak, a volumenindexsor tagjai Laspeyres-típusúak. (Természetesen a súlyozás kérdése csak azár- és a volumenindexsoroknál merül fel.) A kétféle súlyozású indexsor számszerű eredményei eltérnek egymástól, de tartalmuk, mondanivalójuklényegileg megegyezik.

A különböző indexsorok más-más előnyökkel és hátrányokkal rendelkeznek.

Az állandó súlyozású indexsor számítása egyszerűbb, s amennyiben a legelső időszak mennyiségi, illetve áradata a súlyszám, az indexsor egymástkövető tagjait folyamatosan meg lehet határozni. Problémát a súlyok elavulása okoz, az, hogy a súlyarányok eltolódnak a tényleges arányoktól.Ennek oka, hogy hosszabb időszak alatt az első időszak arányai nagymértékben megváltozhatnak, és a termékcserélődés következtében jelentősenszűkülhet az összehasonlítható termékek köre is.

Page 242: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

234

A változó súlyozású indexsor számítása bonyolultabb, de a súlyarányok jól követik a változásokat. A változó súlyozást elsősorban a láncindexeknélhasználják.

Az állandó és a változó súlyozás előnyeinek összekapcsolására a gyakorlatban a kétféle súlyozást általában kombináltan alkalmazzák, ún.szakaszosan állandó súlyú indexsort számolnak. Ez azt jelenti, hogy egy bizonyos időszakra (általában 5–10 év) a súlyadatokat rögzítik, majd azidőszak eltelte után megváltoztatják, felfrissítik azokat. A különböző periódusok indexeit pedig láncszerűen kapcsolják össze.

5.6.1. Az indexsorok közötti összefüggésekAz indexsorok rendszerében több összefüggés írható fel, melyek közül az alábbiakban a két legfontosabb került kiemelésre:

– az érték-, ár- és volumenindexsor közötti összefüggés és a

– bázis- és láncindexsorok közötti összefüggés.

1. Az érték-, ár-, volumenindexsor összefüggése szerint az ár- és volumenindexsor azonos időszakra vonatkozó tagjainak szorzata egyenlő az adottidőszak értékindexével. Ez az összefüggés azonban csak meghatározott feltételek mellett érvényesül:

a) változó súlyozású láncindexek között, ha az egyik indexsor Laspeyres-, a másik indexsor pedig Paasche-formulával került kiszámításra:

b) bázisindexsorok között, ha az egyik indexsor bázisidőszaki állandó súlyozású, a másik pedig a mindenkori tárgyidőszaki változó súlyozásúindexsor:

Page 243: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

235

c) Fisher-formulával számított indexsorok között (bázis- és láncindexsoroknál egyaránt).

2. A bázis- és láncindexek összefüggése alapján a láncindexek szorzata egyenlő a bázisindexszel, illetve a két szomszédos bázisindex hányadosábóla láncindex meghatározható.

Az értékindexsorok között ez az összefüggés mindenkor fennáll, az ár- és volumenindexsoroknál azonban csak az állandó súlyozású indexsorokesetében.

Állandó súlyozású árindexek összefüggése:

(pl. ha az n-edik időszak mennyiségeivel számítjuk ki mindegyik láncindexet)

Mivel a változó súlyozású indexsor tartalmi mondanivalóját tekintve megegyezik az állandó súlyozásúval, a fenti művelet – a képletszerű összefüggésfennállása nélkül – a változó súlyozású indexsoroknál is elvégezhető.

Általában is megállapítható, hogy mivel a súlyozás módja nem érinti az index alapvető tartalmát, az indexekkel minden olyan művelet elvégezhető,amely a megfelelő egyedi indexek között logikus.

5.7. Területi indexekAz indexszámok, mint ahogyan arról szó volt, összehasonlító viszonyszámok. Összehasonlításra azonban nemcsak időben, hanem térben is sorkerülhet. A területi összehasonlítás eredményeként kapott indexek a területi indexek.

A területi volumenindex azt fejezi ki, hogy az összehasonlítandó területeken a termelés, értékesítés mennyisége hányszorosa, hányadrésze az összehasonlítás alapjául szolgáló terület termelésének, értékesítésének.

A területi árindex azt mutatja meg, hogy az egyik területen kialakult árszínvonal milyen arányban áll a másik terület árszínvonalával.

A területi értékindexet nem értelmezzük, az csak a területi volumenindex és területi árindex közötti összekötő kapocsként szerepel. Az előzőekbentárgyalt bármely indexformula területi indexként is értelmezhető, a különbség csak annyi, hogy az összehasonlítandó időszakok helyett két területi

Page 244: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

236

egység adatainak viszonyítására kerül sor. Az eddigi jelölésben a 0, 1 (bázis-, tárgyidőszak) vagy más értelmet kap (0, 1 terület), vagy megváltozikpl. A-ra, B-re, az adott területek adatainak azonosítása céljából. A súlyszámok tehát A vagy B terület mennyiség-, illetve áradatai lehetnek, a bázis-vagy beszámolási súlyok helyett. A másik lényeges különbség a területiindex-számítás és az időbeli összehasonlítás között az, hogy míg az egyesidőszakok adatai a viszonyítás során nem felcserélhetőek – mindig a későbbit hasonlítjuk a korábbihoz –, addig a területi indexeknél a sorrend nemkötött. Bármelyik területi egység adatait viszonyíthatjuk a másikhoz és viszont. Ebből következik, hogy A/B relációjú összehasonlítás eredményereciprokviszonyban kell legyen a B/A relációjú összehasonlítás eredményével. Ez az ún. felcserélési próba, amely a már ismert időpróbának felelmeg. Másik követelmény a területi indexekkel szemben a tranzitivitás követelménye, ami az időszakok összehasonlítására használt indexeknél aláncpróba volt. Ez azt jelenti, hogy két terület közvetlen összehasonlítása a közvetett összehasonlítással azonos eredményt kell, hogy adjon. (AzazA és C területek közvetlen viszonyításánál az A/C index a B területen keresztüli közvetett összehasonlításnál az A/B és a B/C indexek szorzatávalmegegyező érték legyen.)

A különböző súlyozású indexformulák eredményei között lényegesen nagyobb eltérés lehet, mint az időbeli összehasonlításnál, ezért különösenindokolt a Fisher-féle index használata. Az összehasonlítandó területeket A-val és B-vel jelölve

a területi árindex Fisher-formája :

a területi volumenindex Fisher-formája:

A területi indexek kiszámításának módját az alábbi példán mutatjuk be (5.7. táblázat).

5.7. táblázat - Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában

A város B város

Termék

megnevezése

felhozatal

mennyisége

(kg)

átlagár

(Ft/kg)

felhozatal

mennyisége

(kg)

átlagár

(Ft/kg)

Burgonya

Sárgarépa

150 000

12 000

85,0

165,0

70 000

6 500

100,0

150,0

Page 245: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

237

Vöröshagyma

Bab (száraz)

20 000

7 000

42,0

320,0

12 000

5 000

45,0

300,0

A két város felhozatalának összértéke mindkét város árain számolva

(ezer Ft-ban)

A felhozatal mennyiségeVárosok A város B város

árain számítvaA város

B város

17 810,0

9 126,5

19 800,0

10 015,0

A táblázat adatai alapján a területi árindex tehát:

A vizsgált termékek árszínvonala a Fisher-index szerint 9,5%-kal volt alacsonyabb A városban B városhoz viszonyítva.

A területi volumenindexek a példa alapján:

Page 246: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

238

A négy vizsgált termék piaci felhozatalának mennyisége az A városba a Fisher-index alapján átlagosan 96,4%-kal haladta meg B város felhozatalánakmennyiségét.

A területi indexnél – mint arról szó volt – a viszonyítási alap és a viszonyítás tárgya felcserélhetőek, ezért vizsgálható jelen esetben az is, hogy Bváros piaci felhozatala A városhoz viszonyítva miként alakult. Pl.:

B város piaci felhozatalának árai a vizsgált cikkeknél tehát átlagosan 10,4%-kal voltak magasabbak A városhoz képest (a volumenalakulás ebbena relációban hasonlóképpen vizsgálható).

Miután a kétféle viszonyítású indexek egymással reciprokviszonyban állnak, a számítás a következő módon is elvégezhető, pl. az árindexek esetében:

A területi indexek legfontosabb alkalmazási területe a nemzetközi összehasonlítás. Ez esetben a területi indexeknek olyan sajátossága is jelentkezik,amely a különböző országok eltérő valutaegységéből fakad. Annak következtében, hogy az árindex számlálójának és nevezőjének nem azonosa mértékegysége, az eredmény nem fejezhető ki százalékos formában. Az árindex ilyenkor a két ország valutái vásárlóerejének arányát fejezi kia vizsgált termékek vonatkozásában. Azt mutatja tehát, hogy egy adott (az összehasonlítás alapjául szolgáló) ország egységnyi valutája a másik(összehasonlítandó) ország hány valutájával egyenlő az összehasonlított termékek körében. A volumenindex a különböző országok gazdaságifejlettségének, a lakosság életszínvonalának összehasonlítását is szolgálhatja. Kimutatható pl., hogy az egy főre jutó fogyasztás volumene mikéntalakul két ország vonatkozásában.

Amennyiben nem két, hanem több terület összehasonlítását végezzük el, az indexsoroknál leírt módon járhatunk el.

5.8. Gyakorlófeladatok1. A Magyar Statisztikai Évkönyvből (KSH, 1994) valók az alábbi információk:

– A magyar háztartások összes élelmiszer-fogyasztása 1991-ben 374 Mrd Ft, 1992-ben pedig 452 Mrd Ft volt folyó áron számolva.

Page 247: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

239

– Az élelmiszerek fogyasztói ára 1992-ről 1993-ra Magyarországon 29,2%-kal, Ausztriában pedig 2,9%-kal nőtt.

– A nyerskávé-behozatal 1993-ban 3487 millió Ft volt.

– Behozatali forgalmunk folyó áron számítva 1992-ről 1993-ra 32,3%-kal nőtt, kiviteli forgalmunk pedig 2,8%-kal csökkent.

– 1992-ről 1993-ra az importált termékek volumene átlagosan 20,9%-kal nőtt, az exportált termékekre vonatkozóan pedig átlagosan 13,1%-oscsökkenés volt tapasztalható.

– A külkereskedelmi forgalom egyenlege – folyó áron számítva – 1993-ban –342 576 millió Ft volt.

– 1990-ben Magyarországon 427 ezer db színes tv-t gyártottak. 1993-ra a gyártott mennyiség 45,1%-ra csökkent.

Feladat:

Értelmezzük az információkat!

2. Egy piaci árus feljegyezte néhány termékének fontosabb értékesítési adatait:

Eladott mennyiség Egységár (Ft/kg)

Termék Mérték-egység márciusban áprilisban márciusban áprilisban

Alma

Narancs

Burgonya

Tojás

kg

kg

kg

db

150

200

60

200

130

240

80

300

100

130

70

10*

120

150

85

12*

*Ft/db

Feladat:

a) Mennyi volt az árus bevétele az egyes termékekből, valamint összesen? Vizsgáljuk meg a változást is!

b) Hogyan változott márciusról áprilisra:

– az értékesítés volumene (termékenként),

Page 248: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

240

– a termékek ára?

c) Mennyi volt a négy termék árszínvonal-változása? A kapott eredményt vessük össze a termékenkénti árváltozásokkal!

d) Számítsuk ki az együttes volumenváltozást

– az alapadatokból,

– a már kiszámított indexekből,

– az egyedi volumenindexek alapján!

A számításokat Laspeyres-formula szerint végezzük el!

e) Hány Ft-tal volt több az árus bevétele:

– az árváltozások miatt,

– az értékesített mennyiségek változása miatt?

3. A 4.5. Gyakorlófeladatok 11. példájához kapcsolódva számítsuk ki:

a) a forgalom értékének változását, és

b) elemezzük az erre ható tényezőket!

4. Egy háztartási gépeket is forgalmazó vállalkozás értékesítésére vonatkozó adatok:

Értékesítettmennyiség (db) Árbevétel (ezer Ft)

Árucikk1993 1994 1993 1994

Hűtőszekrény

Hűtő-fagyasztó

Fagyasztószekrény

Fagyasztóláda

1400

300

500

700

1800

400

700

500

46 200

12 000

20 000

26 600

68 400

18 000

33 600

25 000

Feladat:

Page 249: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

241

a) Vizsgáljuk az értékesítési forgalom alakulását árucikkenként és együttesen!

b) Számítsuk ki, hogyan változott az értékesítés mennyisége árucikkenként külön-külön és a felsorolt árucikkekre átlagosan!

c) Mutassuk ki az árszínvonal-változást és az ebből eredő forgalomnövekedést!

d) Melyik árucikknek nőtt legnagyobb mértékben az ára 1993-ról 1994-re?

5. Egy kisvállalkozás belkereskedelmi tevékenységére vonatkozó adatok:

Az értékesített

mennyiség

A folyó áras

árbevételÁrucsoport

Árbevétel

1990-ben(ezer Ft) 1995-ben az 1990. évi %-ában

A

B

C

D

3 000

8 000

1 000

10 000

140,0

120,0

150,0

95,0

154,0

126,0

150,0

114,0Összesen 22 000 ... ...

Feladat:

a) Számítsuk ki a négy árucsoportra vonatkozóan az érték-, ár- és volumenindexet!

b) Számítsuk ki, hogy hány millió Ft-tal nőtt az árbevétel:

– az árváltozás miatt,

– az értékesített mennyiségek változása miatt!

c) Határozzuk meg az ellentétes súlyozású ár- és volumenindexeket! Magyarázzuk meg a megfelelő indexek eltérését!

6. A háztartások fogyasztására vonatkozó adatok:

Fogyasztási javakÖsszes fogyasztás

folyó áron Mrd Ft-ban Volumenindex*

Page 250: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

242

1991 1992 (%)

Élelmiszerek

Italok, kávé, tea

Dohányáru

Ruházkodás

374

143

37

99

452

165

43

120

100,4

99,6

93,4

98,6Együtt 653 780 ...

*Bázissúlyozású

Feladat:

a) Hány Mrd Ft-tal, illetve hány %-kal nőtt a fogyasztás nominálértékben?

b) Hogyan alakultak az árak az egyes fogyasztási javaknál, illetve átlagosan?

c) Hány Mrd Ft-tal nőtt a fogyasztás az árak növekedése miatt?

d) A fogyasztás csökkenő mennyiségei miatt hány Mrd Ft-tal lett kevesebb 1992-ben az összes fogyasztási kiadás?

7. Egy család 1992-ben összes kiadásának 30%-át élelmiszerekre, 20%-át ruházati cikkekre, 25%-át szolgáltatásokra, 15%-át tartós fogyasztásicikkekre, 10%-át pedig egyéb dolgokra költötte.

A termékcsoportok árváltozásáról az alábbiak ismertek:

Kiadási csoportÁrindex*

1991=100%Élelmiszerek

Ruházati cikkek

Szolgáltatások

Tartós fogyasztási cikkek

Egyéb

122

132

142

110

128

Page 251: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

243

Összesen ...*1992-es fogyasztási mennyiségekkelszámolva

A család éves jövedelme 1991-ben 380 ezer Ft, 1992-ben pedig 460 ezer Ft volt, és sem 1991-ben, sem 1992-ben nem volt megtakarításuk.

Feladat:

a) Hány %-kal nőtt a család jövedelme nominálértékben?

b) Hogyan változott a fogyasztási cikkek árszínvonala?

c) Hogyan változott a család reáljövedelme (jövedelmének vásárlóértéke)?

8. A nominálkeresetek alakulása Magyarországon:

ÉvNominál átlagkereset*

1980=100%1990

1991

1992

1993

249,9

313,6

380,4

447,7

* Egy keresőre számítva

A fogyasztói árak 1990-ről 1991-re 35%-kal, 1991-ről 1992-re 23%-kal és 1992-ről 1993-ra további 22,5%-kal nőttek.

Feladat:

Hogyan alakultak a reálkeresetek 1990-hez képest, illetve évről évre?

9. Három termék értékesítésére vonatkozó adatok:

Termék Értékesítési forgalom1993-ban (millió Ft)

Mennyiségváltozás(%) Árváltozás (%)

Page 252: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

244

1993-ról 1994-re 1993-ról 1994-re

A

B

C

40

60

100

+ 10

+ 20

+ 40

+ 15

+ 27

+ 60Együtt 200 ... ...

Feladat:

a) Számítsuk ki a volumenindexet mindkét súlyozással! Indokoljuk az eltérő eredményt, magyarázzuk meg a nagyságrendet!

b) Számítsuk ki a Fisher-féle árindexet! Ellenőrizzük számszerű nagyságát!

10. Egy kiskereskedő fontosabb áruinak mennyiségi és áralakulását vizsgálta. Az alábbi adatokat ismerjük:

Termék Volumenindex (%) Árindex (%)A

B

C

102

105

110

110

130

150

Feladat:

Állapítsuk meg, hogy az alábbi megállapítások közül melyek lehetnek „igazak” és melyek „hamisak”:

a) A három termék árszínvonala nőtt.

b) A három termék mennyiségének növekedése átlagosan nem több, mint 10%.

c) A Paasche-súlyozású árindex kisebb árnövekedést mutat, mint a Laspeyres-súlyozással számított index.

d) Az együttes árindex 110 és 150% között helyezkedik el.

e) A bázisidőszak forgalmiérték-adatainak ismeretében a kiskereskedő pontosan ki tudja számítani valamelyik árindexet (a három termékre).

f) A három termékre számított értékindex 100%-nál kisebb.

Page 253: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

245

g) A Paasche-súlyozású volumenindex nagyobb, mint a Laspeyres-súlyozású .

11. A piacgazdálkodást folytató országokkal kapcsolatos külkereskedelmi forgalom adatai:

Behozatali forgalom Kiviteli forgalom

Év Mrd Ftfolyó áron

Árindex

Előzőév=100%

Év Mrd Ft folyó áronÁrindex

Előző év=100%

1985

1986

1987

1988

1989

1990

1991

1992

1993

175

186

209

234

291

344

637

649

805

105,5

110,8

114,0

114,6

116,2

126,5

111,7

110,9

1985

1986

1987

1988

1989

1990

1991

1992

1993

162

154

188

240

301

376

584

646

599

98,2

110,6

114,9

116,9

114,6

120,3

168,8

110,3

Az árindexek Fisher-formulával kerültek kiszámításra.

Feladat:

a) Vizsgáljuk meg a folyó áras forgalmak alakulását 1985-höz viszonyítva, valamint évről évre! Milyen indexsorokat számoltunk?

b) Vizsgáljuk meg a behozatali, valamint a kiviteli forgalom volumenének alakulását évről évre! Állapítsuk meg az indexsorok típusát!

c) Számítsuk ki, hogy 1985 és 1993 között melyik területen (az importnál vagy az exportnál) volt nagyobb az árváltozás átlagos növekedési üteme!

d) Számítsuk ki a cserearány-mutatókat!

Page 254: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Érték-, ár- és volumenindexek

246

12. Egy vállalat termelésének alakulására vonatkoznak az alábbi adatok:

A termelés értéke (millió Ft)Év 1990 1991 1992 1993

évi áron1990

1991

1992

1993

120

117

115

121

124

120

119

124

130

126

124

126

140

132

130

135

Feladat:

a) Vizsgáljuk meg a termelési érték változását!

b) Számítsunk állandó (1992-es) súlyozású lánc-volumenindexeket! Mutassuk be a lánc- és a bázisindexek közötti összefüggést!

c) Számítsuk ki a változó súlyozású lánc-árindexsor elemeit a Laspeyres- és a Paasche-féle súlyozásnak megfelelően is! Magyarázzuk meg az1993-ra számított indexek eltérését!

Page 255: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

247

A. függelék - IrodalomHajdú–Pintér–Rappai–Rédey: Statisztika I–II. JPTE, Pécs, 1994.

Hunyadi László–Vita László: Statisztika I. Aula Kiadó, Budapest, 1991.

Hunyadi László–Mundruczó György–Vita László: Statisztika II. Aula Kiadó, Budapest, 1992.

Kerékgyártó Györgyné–Mundruczó György: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1995.

Korpás Attiláné–Molnár Máténé–Szűts István: Általános statisztika I. rész. Tankönyvkiadó, Budapest, 1992.

Köves Pál–Párniczky Gábor: Általános statisztika I–II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.

Page 256: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

248

6. fejezet - Tárgymutatóadat

alap~

leszármaztatott ~

adatfelvétel

reprezentatív ~

részleges ~

teljes körű ~

aggregálás

aggregátum

agrárolló

aszimmetria

~ mérőszámai

asszociáció

~s együttható

Cramer-féle ~

Csuprov-féle ~

Yule-féle ~

ár

árindex

Page 257: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

249

egyedi ~

Fisher-féle ~

fogyasztói ~

Laspeyres-féle ~

Marshall–Edgeworth–Bowley-féle

Paasche-féle

területi

árolló

átlag

fő~

harmonikus ~

kronologikus ~

mértani ~

négyzetes ~

rész~

számtani ~

~ tulajdonságai

átlagár

~változás

Bortkiewicz-tétel

bot-ábra

Page 258: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

250

cserearány-index

csoportosítás

deflálás

determinációs hányados

egység (egyed)

megfigyelési

számbavételi

eltérés-négyzetösszeg

belső ~

külső ~

teljes ~

értékindex

egyedi ~

értékösszeg

kumulált ~

relatív ~

~sor

fejlődés átlagos mértéke

fejlődés átlagos üteme

főátlag

~index

Page 259: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

251

~ok hányadosának elemzése

~ok különbségének elemzése

főindex

függetlenség

függvényszerű kapcsolat

gyakoriság

együttes ~

kumulált ~

perem~

relatív ~

~i eloszlás

~i megoszlás

~i poligon

~i sor

helyzetmutatók

hiba

abszolút ~

relatív ~

hibakorlát

hisztogram

idősor 82

Page 260: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

252

állapot~

tartam~

indexpróbák

indexsor

ár~

érték~

volumen~

indexszám

ismérv

alternatív ~

diszkrét ~

folytonos ~

időbeli ~

közös ~

megkülönböztető ~

mennyiségi ~

területi ~

~változat

kérdőív

koncentráció

~s együttható

Page 261: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

253

korreláció

~s hányados

~s tábla

kördiagram

kumulálás

kvantilis

~ eloszlás

kvartilis

alsó ~

felső ~

Lorenz-görbe

medián

mérési skála

arány~

intervallum~

névleges ~

sorrendi ~

módusz

mutatószám

oszlopdiagram

osztályköz

Page 262: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

254

~határok

~ös gyakorisági sor

osztályközépső

összehasonlítás

összetételhatás-index

összetételhatás-különbség

rangsor

részátlagindex

részhatáskülönbség

részindex

sokaság

álló ~9

diszkrét ~

folytonos ~

fő~

mozgó ~

rész~

véges ~

végtelen ~

sor

csoportosító ~

Page 263: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

255

idő~

leíró ~

mennyiségi ~

minőségi ~

összehasonlító ~

területi ~

statisztika

leíró ~

statisztikai következtetés

statisztikai tábla

csoportosító ~

egyszerű ~

kombinációs ~

kontingencia~

~dimenziószáma

szórás

~hányados

~négyzet-hányados

szórásnégyzet

belső ~

külső ~

Page 264: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

256

teljes ~

~-felbontás

szóródás

~ mutatói

átlagos eltérés

átlagos különbség

relatív szórás

sztochasztikus összefüggés

vegyes kapcsolat

viszonyszám

bázis~

dinamikus ~

intenzitási ~

koordinációs ~

lánc~

megoszlási ~

összetett ~

rész~

volumenindex

egyedi ~

Fisher-féle ~

Page 265: Általános statisztika I · Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása,

Tárgymutató

257

Laspeyres-féle ~

Marshall–Edgeworth–Bowley-féle ~

Paasche-féle ~

területi ~

vonaldiagram