Prednášky z BIOŠTATISTIKY

34
Prednášky z BIOŠTATISTIKY Prednášajúci: doc. Ing. Peter OBTULOVIČ,CSc Prednášajúci: doc. Ing. Peter OBTULOVIČ,CSc Pracovisko: Katedra štatistiky a operačného Pracovisko: Katedra štatistiky a operačného výskumu FEM SPU Nitra výskumu FEM SPU Nitra S – pavilón 1 poschodie S – pavilón 1 poschodie Telefon: 4123 Telefon: 4123 E-mail: [email protected] E-mail: [email protected] 1

description

Prednášky z BIOŠTATISTIKY. Prednášajúci: doc. Ing. Peter OBTULOVIČ,CSc Pracovisko: Katedra štatistiky a operačného výskumu FEM SPU Nitra S – pavilón 1 poschodie Telefon: 4123 E-mail: [email protected]. Adresa: www.fem.uniag.sk/cvicenia. - PowerPoint PPT Presentation

Transcript of Prednášky z BIOŠTATISTIKY

Page 1: Prednášky z BIOŠTATISTIKY

Prednáškyz

BIOŠTATISTIKY

Prednášajúci: doc. Ing. Peter OBTULOVIČ,CScPrednášajúci: doc. Ing. Peter OBTULOVIČ,CScPracovisko: Katedra štatistiky a operačného výskumu FEM SPU NitraPracovisko: Katedra štatistiky a operačného výskumu FEM SPU NitraS – pavilón 1 poschodieS – pavilón 1 poschodieTelefon: 4123Telefon: 4123E-mail: [email protected]: [email protected]

Prednášajúci: doc. Ing. Peter OBTULOVIČ,CScPrednášajúci: doc. Ing. Peter OBTULOVIČ,CScPracovisko: Katedra štatistiky a operačného výskumu FEM SPU NitraPracovisko: Katedra štatistiky a operačného výskumu FEM SPU NitraS – pavilón 1 poschodieS – pavilón 1 poschodieTelefon: 4123Telefon: 4123E-mail: [email protected]: [email protected]

1

Page 2: Prednášky z BIOŠTATISTIKY

Adresa: www.fem.uniag.sk/cviceniaAdresa: www.fem.uniag.sk/cvicenia

2

Page 3: Prednášky z BIOŠTATISTIKY

3

Page 4: Prednášky z BIOŠTATISTIKY

4

Page 5: Prednášky z BIOŠTATISTIKY

5

Page 6: Prednášky z BIOŠTATISTIKY

V súčasnosti sme presycovaní informáciami najrôznejších druhov, tak v osobnom ako aj pracovnom  živote.  Ako  je  známe  informácie  sú  dáta  premenené  do  zrozumiteľnej formy  tým,  že  je  im  priradený  určitý  význam.  Každé  naše  rozhodnutie  je  z väčšej  či menšej miery  podložené   efektívnym využívaním informácií a schopnosťou premeniť dáta na informácie lepšie, ako to dokážu iní,  čo  je  bezpochyby  v priamej  úmere  ku kvalite týchto rozhodnutí. Ciest, ako z údajov dostať to dôležité a aktuálne je  viac,  ale  vždy  v popredí  takýchto postupov stoja metódy štatistickej analýzy dát. Existujú  rôzne  spôsoby premeny dát  na  informácie,  obvykle  sú navzájom veľmi  tesne poprepájané,  a každý  systém  ich  zahrňuje  hneď  niekoľko  (napr.  sumarizácia  dát, vizualizácia  dát,  triedenie,  výber  účelovo  relevantných  dát,  porovnávanie,  konštrukcia sekundárnych ukazovateľov, prepočty a štatistické metódy, šírenie informácií a pod.) 

Z latinského  slovného  spojenia  „status  rei  publice“,  (=  stav  veci  verejnej)  sa postupne vyvinulo označenie štatistika.

Štatistika mala teda v histórii význam súhrnu znalostí o významných štátnych záležitostiach. Štatistika  historicky vznikla z úradného zisťovania, univerzitnej štátovedy, politickej aritmetiky a teórie pravdepodobnosti.

6

Page 7: Prednášky z BIOŠTATISTIKY

K úradným zisťovaniam  dochádzalo  už  niekoľko  tisíc  rokov  pred  naším  letopočtom v starom Egypte, resp. v Číne, kedy vtedajší vládcovia potrebovali poznať čo najpresnejšie údaje pre vojenské účely  (  sčítanie mužov schopných bojovať  ), finančné účely  ( sčítanie všetkých  obyvateľov  povinných  platiť  dane,  súpis  ich  majetku  apod.  ).  Úradné  alebo úradnícke  zisťovania  sa  v priebehu  času  neustále  zdokonaľovali  až  k dnešnej  podobe sčítania  ľudu  (spojených často so súpisom domov a bytov), ktoré sa dnes vykonávajú vo všetkých kultúrnych štátoch sveta približne každých desať rokov.Od polovice 18. storočia , hlavne v Nemecku sa rozšírila tzv. univerzitná štátoveda, ktorá mala  za  cieľ  čo  najvierohodnejšie  popísať  obyvateľstvo,  územie,  obchod,  peňažníctvo, armádu atď. (znamenitosti resp. pozoruhodnosti ) vlastného a cudzích štátov. V hospodársky  vyspelejšom  Anglicku  sa  rozvíja politická aritmetika  skúmajúca  rôzne spoločenské  javy  na  podklade  objektívnych  záznamov  (hlavne  číselných).  Hlavný predstavitelia    John  Graunt  (1620  –  1674)  a Wiliam  Petty  (1623  –  1687)  skúmali predovšetkým  pravidelnosti  v rodení  a umieraní,  počet  obyvateľstva  a  zloženie  rodín, závislosti výšky príjmov od ich povolania  a veku. Skúmali teda hromadné javy, ktoré bolo možné  po  ich  preštudovaní  ovplyvňovať  mocensky  štátom  (politicky)  a používali  k tom čísla a rôzne  prepočty (aritmetika).

7

Page 8: Prednášky z BIOŠTATISTIKY

Zásadný význam pre rozvoj štatistiky mala teória pravdepodobnosti, ktorej základy sa vyskytovali v  prácach Geromina Cardana (1501 – 1576) ale aj Galileo Galilea (1564 –1642). K spoluzakladateľom teórie pravdepodobnosti patria aj francúzski matematici Blaise Pascal (1623-1662), Pierre de Fermat (1601-1665), Holanďan Christian Huygens (1629-1695). Významné miesto v rozvoji teórie pravdepodobnosti zohrali aj práce Jacoba Bernoulliho (1654-1748), Jána Bernoulliho (1667-1705), Daniela Bernoulliho (1700-1754), Thomasa Bayesa (1702-1761), Pierre Simeona de Laplacea (1749-1827), Simeona Denisa Poissona (1781-1840), Karla Fridricha Gaussa (1777-1855), Pafnutija Lvoviča Čebyševa (1821-1894), Andreja Andrejoviča Markova (1856-1922), a Alexandra Michajloviča Ljapunova (1857-1918).Významnú úlohu v procese budovania modernej štatistiky v 19. storočí zohral belgický matematik, astronóm a štatistik Lambert Adolphe Jacques Quételet (1796-1874), ktorý rozvíjal štatistiku ako disciplínu, ktorá má nielen  popisovať a pozorovať hromadné javy ale ich aj vysvetľovať. Od polovice 19. storočia dochádzalo k popisovaniu a analyzovaniu hromadných javov pomocou číselného hodnotenia aj v oblastiach prírodných a technických vied, obzvlášť v biológii, antropológii, meteorológii, fyzike a pod. Na rozvoji štatistiky sa podieľal celý rad významných vedcov, z ktorých spomeňme aspoň Francisa Galtona (1822-1911), Karla Pearsona (1857-1936), alebo Ronalda A. Fishera (1890-1962) a iní.

8

Page 9: Prednášky z BIOŠTATISTIKY

Slovo štatistika sa v bežnom živote veľmi často používa v rôznych významoch:

1.údaje ( číselné aj slovné )2.praktickú činnosť spočívajúca v získavaní údajov o hromadných javoch3.vednú disciplínu, ktorá skúma zákonitosti hromadných javov, hľadá v nich určité zákonitosti a zaoberá sa metódami ich skúmania.4.myslí sa ním úrad, ktorý zabezpečuje zber, spracovanie a poskytovanie štát. údajov,5.používa sa aj pre označenie výsledkov, grafov, tabuliek publikovaných v tlači, v televízii ako napr. kriminálna štatistika, štatistika nehodovosti, štatistika prístupu na stránku www.6.v rámci odbornej terminológie tejto vednej disciplíny sa pojmom štatistika označujú aj niektoré miery, vzorce a charakteristiky – napr.: priemer, rozptyl.

Čím sa teda zaoberá štatistika dnes? V podnikovej praxi je základnou úlohou štatistiky pomôcť analytikom pochopiť zmysel, alebo obsah dát. Získať z nich informácie nie v podobe napr. denných záznamov daného mesiac, ale v agregovanej podobe napr. ako priemer za daný mesiac. 

Štatistika vlastne zovšeobecňuje výsledok veľkého počtu pozorovaní (napr. priemerný hodinový zárobok vo firme). Z toho vyplýva náplň štatistiky - skúmanie hromadných javov.

9

Page 10: Prednášky z BIOŠTATISTIKY

Základné štatistické pojmy Pre pochopenie ďalšieho výkladu je nevyhnutné zadefinovať niektoré často používané pojmy: 

1. HROMADNÝ JAV. 2. ŠTATISTICKÁ JEDNOTKA 3. ŠTATISTICKÝ SÚBOR 4. ŠTATISTICKÝ ZNAK

1. Hromadný jav je  každý  jav  alebo  udalosť  ,  ktorá  sa  vyskytuje  u  veľkého  počtu individuálnych  jedincov  -  nositeľov  tohto  javu.  Konkrétna  podoba  javu  u  každého jednotlivca môže byť iná v závislosti od rôznych faktorov, činiteľov, ktoré ho ovplyvňujú.Napriek tomu, že konkrétne podoby sa odlišujú, pomocou štatistiky možno na ich základe spoznať  podstatu  hromadného  javu,  jeho  zákonitosti  a  pravidelnosti,  dospieť  k zovšeobecnejúcim záverom.Jednotlivý  individuálny  jav  je  pre  štatistiku  zaujímavý  len  ako  súčasť  hromadného  javu. Sám  o  sebe  nie  je  postačujúci  pre  realizáciu  štatistickej  analýzy.  Štatistické  skúmanie  si vždy vyžaduje hromadné pozorovanie javu.

Predpokladajme, že chceme skúmať koľko korún obyvatelia SR mesačne vynakladajú na rôzne druhy výrobkov. Javom, ktorý chceme skúmať bude teda nákup, alebo spotreba výrobku za mesiac. Je to jav hromadný, pretože sa vyskytuje u veľkého počtu jedincov. Na to, aby sme získali predstavu o tom, koľko obyvatelia SR mesačne vynakladajú na daný tovar, nám však nestačí spýtať sa len seba, alebo svojich známych, ak počet obyvateľov SR je viac ako 5 miliónov 10

Page 11: Prednášky z BIOŠTATISTIKY

2. ŠTATISTICKÁ JEDNOTKA - je nositeľ individuálnej podoby hromadného javu,  je to teda základný prvok, na ktorom možno skúmať konkrétny prejav určitého hromadného javu. Môžu to byť napr. poľnohospodárske podniky, zvieratá, plodiny, veci , udalosti, osoby a pod. 3. ŠTATISTICKÝ SÚBOR - je množina štatistických jednotiek, ktoré vyhovujú určitým vopred zadaným kritériám a sú, alebo by mohli byť nositeľom skúmaného hromadného javu. Podmienky, ktoré určujú, či daná štatistická jednotka bude súčasťou štatistického súboru, vymedzujú štatistický súbor: 

vecne -  stanovenie vlastností, ktoré musí spĺňať štatistická jednotka časovo - určenie časového úseku alebo okamihu, v ktorom sa štatistické jednotky zahŕňajú do skúmania  - dátum alebo čas zisťovaniapriestorovo - určenie miesta alebo územia, na ktorom sa vykoná štatistické zisťovanie 

ROZSAH ŠTATISTICKÉHO SÚBORU - je číslo vyjadrujúce počet štatistických jednotiek, ktoré spĺňajú stanovené kritéria a patria tak do štatistického súboru Štatistický súbor všetkých jednotiek, ktorý je predmetom skúmania nazývame základný súbor. Jeho rozsah môže byť konečný i nekonečný, spravidla je ale veľký. Z toho dôvodu sa z úsporných a časových dôvodov vykonáva výberové šetrenie, kedy sa zo základného súboru určitým spôsobom vyberú len niektoré jednotky, čím sa získa výberový súbor. Výsledky získané z výberových šetrení slúžia  potom k úsudkom o základnom súbore. 11

Page 12: Prednášky z BIOŠTATISTIKY

Každá štatistická jednotka je nositeľom určitých vlastností (atribútov), ktoré nazývame ŠTATISTICKÝMI ZNAKMI. 4. Štatistické znaky rozdeľujeme  z  rôznych  hľadísk.  Podľa  toho,  či  sa  vyskytujú  alebo nevyskytujú  rovnako  pri  všetkých  štatistických  jednotkách  daného  súboru,  rozoznávame štatistické znaky: a) spoločné , ktorých výskyt je podmienkou príslušnosti danej jednotky k štatistickému súboru a vyplýva z definície štatistickej jednotky, b) variabilné, ktoré sa pri jednotlivých štatistických jednotkách daného súboru môžu rôzne vyskytovať. Podľa toho, či sú štatistické znaky priamym výrazom vlastnosti štatistickej jednotky alebo ju charakterizujú iba sprostredkovane - nepriamo, rozdeľujeme ich na:a) priame (výška v cm, vek v rokoch, a pod.)b) nepriame (kvalitu výrobku pomocou jeho životnosti, a pod)Podľa počtu variantov, ktoré môžu nadobúdať, rozdeľujeme štatistické znaky na:a) alternatívne, ktoré nadobúdajú iba dva varianty (napr. pohlavie)b) množné, ktoré môžu nadobúdať mnoho (najmenej tri) varianty (národnosť, povolanie, a pod.)Podľa toho, z akého hľadiska charakterizujú štatistickú jednotku, rozdeľujeme štatistické znaky na:a) časové, ktoré charakterizujú štatistické jednotky z hľadiska času,b) priestorové, ktoré charakterizujú štatistické jednotky z hľadiska miesta,c) vecné charakterizujúce ich vecné stránky a rozdeľujeme ich na:     ◘ kvalitatívne (slovné tiež kategoriálne, nominálne) znaky, ktoré majú diskrétne neusporiadané znaky napr. farba, výrobná značka , národnosť, pohlavie...     ◘ kvantitatívne (číselné) vyjadrujú vlastnosti štatistických jednotiek pomocou čísiel, numericky.

12

Page 13: Prednášky z BIOŠTATISTIKY

Rozdelenie štatistických znakov

ŠTATISTICKÉ ZNAKYŠTATISTICKÉ ZNAKY

SPOLOČNÉ

SPOLOČNÉ

VARIABILNÉ

VARIABILNÉ

PRIAME

PRIAME

NEPRIAME

NEPRIAME

ČASOVÉČASOVÉ PRIESTOROVÉ

PRIESTOROVÉ

VECNÉVECNÉ

KVALITATÍVNEKVALITATÍVNE

KVANTITATÍVNEKVANTITATÍVNE

ALTERNATÍVNE

ALTERNATÍVNE

MNOŽNÉMNOŽNÉ SPOJITÉSPOJITÉ DISKRÉTNEDISKRÉTNE

VECNÉVECNÉ

13

Page 14: Prednášky z BIOŠTATISTIKY

Pokiaľ kvalitatívny štatistický znak môže nadobúdať len dve obmeny hovoríme o znaku alternatívnom (napr.: pohlavie). Znak ktorý pripúšťa viac ako dve obmeny nazývame znakom množným.

Kvantitatívne štatistické znaky sa ďalej členia na: poradové (ordinálne) - sú číselné znaky, ktoré majú diskrétne hodnoty, ktoré možno usporiadať, ale nevieme medzi nimi špecifikovať mieru rozdielu,merateľné (kardinálne) - ostatné číselné znaky, pri ktorých možno vyčísliť mieru rozdielu.

Z praktických dôvodov rozlišujeme kvantitatívne znaky na spojité a diskrétne (nespojité). 

Spojité štatistické znaky môžu nadobúdať v rámci určitého intervalu ľubovoľné hodnoty (hrubá mzda, spotreba materiálu, zisk, pridaná hodnota...). Nespojité štatistické znaky nadobúdajú len niektoré číselné hodnoty, najčastejšie prirodzené čísla alebo celé nezáporné čísla  (počet detí, počet členov domácností, počet porúch v sérii výrobkov...).  

V poslednej dobe sa veľmi často namiesto pojmu štatistický znak používa termín štatistická premenná (zo softvérového označenia „variable“). Oba tieto názvy však môžeme považovať za  celkom rovnocenné.     

14

Page 15: Prednášky z BIOŠTATISTIKY

Štatistickú prácu je možné rozdeliť do niekoľkých etáp. Ide spravidla o 

1.etapu štatistického zisťovania2.etapu štatistického spracovania3.etapu štatistického rozboru 1.Štatistické zisťovanie  je  praktická  činnosť,  ktorou  sa  zhromažďujú  údaje  o  skúmaných javoch.  Výsledky  štatistického  zisťovania  -  zistené  údaje  -  sú  predmetom  ďalšieho spracovania. Rozlišujeme primárne zisťovanie - ak sa údaje o určitých javoch zisťujú len na účely  štatistického  skúmania.  Sekundárne zisťovanie -  ak  sa  údaje  zaznamenané  na  iné účely  využívajú  pri  štatistickom  skúmaní.  Ak  sa  zisťovanie  neopakuje,  hovoríme  o jednorazovom  štatistickom  zisťovaní,  ak  sa  pravidelne  opakuje,  potom  hovoríme  o periodickom  zisťovaní,  ak  sa  nepravidelne  opakuje,  potom  hovoríme  o  nepravidelnom zisťovaní.

2. Štatistickým spracovaním  rozumieme  triedenie  údajov,  opis  štatistického  súboru pomocou číselných  charakteristík a  vyjadrenie podstatných poznatkov o ňom v  tabuľkách prípadne v grafoch.  3. Štatistický rozbor je konečnou fázou štatistického skúmania. Zahrňuje analýzu výsledkov štatistického spracovania a formulovanie záverov, ktoré z nich vyplývajú.

15

Page 16: Prednášky z BIOŠTATISTIKY

16

Triedenie a prezentácia štatistických dát Výsledkom  štatistického  zisťovania  je  spravidla  veľké  množstvo  údajov,  ktoré  sú neprehľadné, a ani skúsený pracovník z nich mnoho nevyčíta. Aby vynikli charakteristické rysy a zákonitosti analyzovaného štatistického znaku a aby sa údaje stali prehľadnými musíme ich obvykle najskôr zatriediť. Triedením rozumieme rozdelenie jednotiek súboru do takých skupín, aby čo najlepšie vynikli charakteristické vlastnosti skúmaných javov.  Triedením  dosiahneme  okrem usporiadania údajov do prehľadnej formy aj ich zhustenie. Štatistický znak podľa ktorého triedenie uskutočňujeme sa nazýva triediacim znakom. 

Štatistický súbor môžeme triediť podľa  ľubovoľného štatistického znaku, dôležité však  je voliť  taký  triediaci  znak,  ktorý  je  z hľadiska  cieľa  skúmania  podstatný  a umožní charakterizovať čo najlepšie podstatu skúmaných javov. 

Podľa  počtu  triediacich  znakov  rozlišujeme  triedenie  jednostupňové  (ak  ku  triedeniu používame  jeden  triediaci  znak)  resp.  viacstupňové  (ak  ku  triedeniu  používame  viac triediacich znakov). 

Page 17: Prednášky z BIOŠTATISTIKY

17

Pri triedení sa musia dodržať  dve hlavné zásady:1.zásada úplnosti2.zásada jednoznačnosti. Zásada úplnosti triedenia vyžaduje vytváranie skupín (tried) tak, aby sa do niektorej z nich dala zaradiť každá štatistická jednotka. Pri triedení nesmie vzniknúť situácia, že niektorú štatistickú jednotku nemôžeme do niektorej zo zvolených tried zaradiť. Zásada jednoznačnosti triedenia znamená, že triedy vytvárame tak, aby sa o každej štatistickej jednotke dalo explicitne rozhodnúť, do ktorej z nich patrí. Triedy sa nesmú vzájomne prekrývať, aby nevznikla pochybnosť ani o jednej štatistickej jednotke pri rozhodovaní.

Page 18: Prednášky z BIOŠTATISTIKY

18

Triedenie podľa kvalitatívnych znakovPri triedení štatistických jednotiek podľa kvalitatívneho štatistického znaku sa štatistický súbor rozdeľuje do tried podľa variantov, alebo obmien zvoleného kvalitatívneho znaku. Jednotlivé  triedy  volíme  tak,  aby  úplne a jednoznačne definovali  všetky  obmeny triediaceho  znaku.  Ak  má  triediaci  znak  len  dve  obmeny  nazývame  takéto  triedenie podvojné alebo dichotomické, ak  má  triediaci  znak  viac  ako  dve  obmeny  nazývame takéto triedenie množné alebo multinomické. 

Na  základe  podvojného  alebo  množného  triedenia  podľa  jedného,  dvoch  alebo  k kvalitatívnych  znakov  sa  získajú  početnosti prvého, druhého alebo k - tého stupňa. Celkový  počet  štatistických  jednotiek  v súbore  budeme označovať n,  a v súlade  z vyššie zavedeným členením budeme označovať túto početnosť ako početnosť nultého stupňa.  

Výsledky  triedenia  podľa  dvoch  kvalitatívnych  znakov  je  možné  usporiadať  do  tzv. asociačnej tabuľky:

početnosti prvého stupňa(a), (b)...

Početnosti druhého stupňa(ab), (αβ)...

početnosť nultého stupňan

Page 19: Prednášky z BIOŠTATISTIKY

19

Tabuľka má rozmer 2x2, pričom v jednotlivých políčkach tabuľky sú početnosti 2. stupňa, v súčtovom stĺpci a riadku (označenom Spolu) sú početnosti 1. stupňa a v pravom dolnom rohu je celkový počet jednotiek súboru n – početnosť nultého stupňa. 

Okrem  absolútnych  početností,  vyjadrujúcich  absolútny  počet  jednotiek  v príslušnej triede je možné uviesť aj relatívne početnosti (vo forme koeficienta alebo percent). Relatívne  početnosti  získame  ako  podiel  absolútnych  početností  a celkového  počtu jednotiek, poprípade podielu absolútnych početností a súčtových hodnôt v riadkoch alebo stĺpcoch. Také početnosti  je potom potrebné presne  interpretovať vzhľadom na zvolený základ pri výpočte relatívnych početností.Ak pri triedení štatistického súboru podľa kvalitatívnych znakov aspoň jeden triediaci znak nadobúda  viac  ako  dva  varianty,  hovoríme  o množnom (multinomickom)  triedení. V prípade  dvoch  kvalitatívnych  znakov  A a B,  ktoré  majú  m  a p variantov  sa  výsledky triedenia usporiadajú do tzv. kontingenčnej tabuľky

Page 20: Prednášky z BIOŠTATISTIKY

20

Príklad 1.1 Skúmali sme 36 firiem v Nitrianskom kraji zaoberajúcich sa výrobou plastových okien s klasickou technológiou označenou „a“, a novou technológiou, označenou „b“. Sledovali sme tržby celkom v mil. €,počet montážnych skupín vo firme a systém uzatvárania okien. Údaje sú uvedené v tabuľke 1.3.Definujeme najskôr základné pojmy:štatistický súbor – súbor 36 firiem Nitrianskeho krajaštatistická jednotka – firmaštatistické znaky– technológia výroby plastových okien, (kvalitatívny štatistický znak, alternatívny s dvomi obmenami znaku a, b) – Tržby celkom v mil. €, (kvantitatívny znak spojitý)– počet montážnych skupín vo firme, (kvantitatívny znak diskrétny )– systém uzatvárania okien, (kvalitatívny znak množný s počet obmien znaku tri, L,S,P)

Page 21: Prednášky z BIOŠTATISTIKY

21

Úloha : Zatrieďte súbor firiem podľa znaku  technológia výroby a systém uzatvárania okien vhodným spôsobom.Súbor zotriedime do kontingenčnej tabuľky ( tabuľka1.4 ): Tabuľka 1.4 Kontingenčná tabuľka k príkladu 1.1 - absolútne početnosti.

Otázky? (odpoveď):Aký je celkový počet firiem? (36) Koľko firiem používa technológiou a? ( 16 )Koľko firiem používa systém uzatvárania okien P? ( 11 )Koľko firiem používa systém uzatvárania okien S a technológiu výroby b. ( 9 ).

Page 22: Prednášky z BIOŠTATISTIKY

22

Triedenie podľa kvantitatívnych znakovTriedenie podľa kvantitatívneho znaku  (znakov) je proces usporiadania jednotiek do tried, ktoré získame usporiadaním variantov triediaceho znaku do rastúcej postupnosti a každej triede priradíme počty príslušných štatistických jednotiek. Tieto  počty  nazývame  triedne početnosti  a vzniknutú  tabuľku,  tabuľkou rozdelenia početností. Pri triedení štatistického súboru podľa kvantitatívneho znaku sa celkový počet štatistických jednotiek  n v štatistickom súbore  rozdelí do m skupín (tried) a to:

a)  ak  je  triediaci  znak diskrétny a nadobúda iba málo variantov  (orientačne ak m < 20), predstavuje každá jeho konkrétna obmena samostatnú triedu.

b) ak je triediaci znak diskrétny s veľkým počtom variantov (orientačne ak                    ) alebo  znak spojitý,  zostavia  sa  triedy  tak,  že  ich  tvorí  vždy určité  rozpätie hodnôt  znaku, triedny interval.

Kvantitatívne štatistické znaky sa spravidla označujú veľkými písmenami z konca abecedy X,  Y,  Z a pod.    Každý  kvantitatívny  štatistický  znak  je  vlastne  premenná  veličina,  ktorá v štatistickom súbore nadobúda rôzne hodnoty. Jednotlivé obmeny štatistického znaku  X potom označujeme 

20m

nxxx ,,, 21

Page 23: Prednášky z BIOŠTATISTIKY

23

Page 24: Prednášky z BIOŠTATISTIKY

24

Page 25: Prednášky z BIOŠTATISTIKY

25

Page 26: Prednášky z BIOŠTATISTIKY

26

Príklad 1.2 Zotrieďte súbor 36 firiem z príkladu 1.1 podľa triediaceho znaku počet montážnych skupín.

Počet  montážnych  skupín  je  diskrétny  štatistický  znak  s malým  počtom  obmien  (6),  preto  zvolíme triedenie  do  radu  rozdelenia  početností  s triedami  rovnými  priamo  obmenám  štatistického  znaku zoradenými od najmenšej hodnoty po najväčšiu. Výsledné triedenie je uvedené v tabuľke 1.7. 

Otázky ? a ( odpovede).:Koľko firiem má 3 montážne skupiny ?  ( 10 )Koľko percent firiem má 6 montážnych skupín ?  ( 8,33 % )Koľko PD v súbore má maximálne 4 montážne skupiny ? ( 27 )Koľko percent PD má v súbore maximálne dve montážne skupiny ?  ( 22,22 % ) 

Page 27: Prednášky z BIOŠTATISTIKY

27

Pri triedení podľa diskrétneho štatistického znaku s veľkým počtom obmien, alebo spojitého znaku je potrebné pred samotným triedením stanoviť :

- počet tried  m tj. počet skupín ( intervalov ), do ktorých sa rozdelí štatistický súbor,- šírku h ( rozpätie ) intervalov. Pri  stanovení  počtu  tried  a šírky  intervalov  treba  mať  na  zreteli,  že  intervalovým triedením sa zastrie časť pôvodných informácií o štatistickom súbore, ktoré sme mali k dispozícii pri individuálnych údajoch. Triedne  početnosti  udávajú  iba  počet  jednotiek  v príslušnej  triede  a zo  zotriedených údajov  sa  už  nedajú  zistiť  jednotlivé  hodnoty  znaku.  Počet  tried  by  nemal  byť  príliš malý, aby sa nestratila základná vypovedacia schopnosť údajov v štatistickom súbore. Na  druhej  strane  ani  veľký  počet  tried  nie  je  žiaduci,  lebo  dochádza  k zníženiu prehľadnosti triedenia a zastretiu určitých čŕt charakteristických pre rozloženie hodnôt znaku v súbore. Na stanovenie počtu tried nie je nijaké pevné pravidlo. Niektorí autori odporúčajú stanoviť počet intervalov od 5 do 20, pričom vychádzajú z prepočtu :

Page 28: Prednášky z BIOŠTATISTIKY

28

So  stanovením  počtu  tried  úzko  súvisí  aj  stanovenie  šírky  (rozpätia)  intervalov.  Triedne intervaly  sú  jednoznačne  stanovené,  ak  je určená  jeho dolná (DH) a horná hranica  (HH). Rozdiel  medzi  dolnou  a hornou  hranicou  je  šírka (rozpätie) intervalu.  Triedne  intervaly môžu byť:s rovnakou šírkou intervalu, kedy rozpätie každej triedy je rovnakés nerovnakou šírkou intervalu, kedy rozpätie zvolených tried je rôzne. Z hľadiska ďalšieho spracovania údajov štatistického súboru je výhodné voliť pre triedne intervaly rovnakú šírku, aj keď v niektorých prípadoch si však charakter skúmaného znaku vyžaduje voliť triedne intervaly s nerovnakým rozpätím.  Pre stanovenie šírky intervalu opäť neplatí žiadne jednoznačné pravidlo, avšak rozpätie intervalu závisí od rozdielu maximálnej a minimálnej hodnoty znaku a od počtu tried. Približne sa dá určiť zo vzťahu:

m

xxh minmax

Page 29: Prednášky z BIOŠTATISTIKY

29

V niektorých prípadoch sa necháva prvý a posledný interval otvorený, tj. na začiatku rozdelenia nemá stanovenú dolnú hranicu, alebo na konci rozdelenia nemá posledný interval hornú hranicu.  K takto stanoveným intervalom je však vhodné uviesť dodatočné informácie o štatistických jednotkách. Výsledkom triedenia podľa kvantitatívneho diskrétneho znaku s veľkým počtom obmien a podľa kvantitatívneho znaku spojitého je opäť rad rozdelenia početností resp. intervalové rozdelenie početností v tvare tabuľky (tabuľka 1.7 ).

Page 30: Prednášky z BIOŠTATISTIKY

30

Page 31: Prednášky z BIOŠTATISTIKY

31

Podľa toho, koľko triediacich znakov sa pri triedení používa, rozoznávame:•jednostupňové (jednoduché) triedenie, ak sa štatistický súbor triedi iba podľa jedného znaku•viacstupňové (kombinačné) triedenie, ak sa štatistický súbor triedi súčasne podľa  viacerých štatistických znakov.

Prezentácia údajov Grafické zobrazenie často poskytuje rýchlu a prehľadnú predstavu o tendenciách a charakteristických rysoch analyzovaných javov. Grafické zobrazenie je tiež účinným popularizujúcim prostriedkom štatistických výsledkov. O niektorých z nich sa teraz stručne zmienime.  Rozdelenie početností sa môže graficky znázorniť polygónom rozdelenia početností. V súradnicovom systéme spojíme úsečkami body o súradniciach (     ), pre i = 1, 2, ..., m, kde  sú hodnoty znaku a im zodpovedajúce absolútne početnosti početností. Ak nahradíme absolútne početnosti, relatívnymi početnosťami  , obdržíme polygón relatívnych početností.Pre údaje o počte montážnych skupín z tabuľky 1.7 je polygón rozdelenia početností na obrázku 1.1.

Page 32: Prednášky z BIOŠTATISTIKY

32

Page 33: Prednášky z BIOŠTATISTIKY

33

Pre  grafické  vyjadrenie  intervalového  rozdelenia  početností  sa  najčastejšie  používa histogram početností.  Jedná  sa  o stĺpcový  graf    tvorený  pravidelnými  rovnobežníkmi, ktorých  základne  majú  dĺžku  zvolených  triednych  intervalov  a výšku  zodpovedajúcu veľkosti  príslušných  triednych  početností  (  absolútnych  alebo  relatívnych  ).  Histogram rozdelenia početností z tabuľky 1.8 pre štatistický znak tržby uvádzame na obrázku 1.2.

Page 34: Prednášky z BIOŠTATISTIKY

34

Inou  formou  grafu  sú  bodové diagramy. Jedná  sa  o body  umiestnené  v súradnicovej sústave.  Slúžia  k znázorneniu  závislosti  medzi  dvoma  kvantitatívnymi  znakmi, podrobnejšie sa s bodovými grafmi oboznámime neskoršie pri korelačnom počte.K vyjadreniu  štruktúry  obmien  štatistického  znaku  slúžia kruhové grafy. V  kruhových grafoch sú znázornené triedne početnosti kruhovým výsekom, ktorý je úmerný podielu jednotlivých  tried  na  celku.  Kruhový  graf  pre  zobrazenie  rozdelenia  početnosti  počtu montážnych skupín v príklade 1.1 je na obrázku 1.3.