09 10-42-15statistica Eco 2014 Notize Laborator

25
ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015 ECO-STATISTICA: OBIECTIVE: A. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE In zona investigata cu o probabilitate de 90% (riscul asumat alfa =10%) presiunea este cuprinsa in intervalul: 771,444-0.011 mmHg 771,444+0.011 mmHg B. EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI Presiunea = -6.467* Temperatura + 890.9 Coeficient de corelatie: -0.89028 C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE Titlu diagramă y = -6.467x + 890.9 700.00 720.00 740.00 760.00 780.00 800.00 820.00 840.00 0.00 5.00 10.00 15.00 20.00 25.00 30.00 temperatura presiune presiunea-temperatura Liniară (presiunea-temperatura)

Transcript of 09 10-42-15statistica Eco 2014 Notize Laborator

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    ECO-STATISTICA: OBIECTIVE: A. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE

    In zona investigata cu o probabilitate de 90% (riscul asumat alfa =10%)

    presiunea este cuprinsa in intervalul:

    771,444-0.011 mmHg 771,444+0.011 mmHg

    B. EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI

    Presiunea = -6.467* Temperatura + 890.9 Coeficient de corelatie: -0.89028

    C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE

    Titlu diagram

    y = -6.467x + 890.9

    700.00

    720.00

    740.00

    760.00

    780.00

    800.00

    820.00

    840.00

    0.00 5.00 10.00 15.00 20.00 25.00 30.00temperatura

    pres

    iun

    e

    presiunea-temperaturaLiniar (presiunea-temperatura)

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    1. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE care depinde de

    a. Densitatea punctelor de observatie b. Variabilitatea caracteristicii studiate c. Riscul asumat

    Ex.: CONTINUTUL DE HUMUS DIN SOL IN PADUREA BANEASA este de 250ppm PLUS /MINUS 15ppm cu un RISC DE 10%.

    V+/-EROARE T=10GRADE Celsius+/-2 grade Celsius

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    DATELE UTILIZATE PENTRU PRELUCRARI STATISTICE

    Variabile/caracteristici ALFANUMERICE Ex.: LITOLOGIA: GRANIT, BAZALT,.... Pentru valorile alfanumerice operatiile posibile in cadrul prelucrarilor statistice sunt:

    COMPARAREA (identice sau diferite) CONCATENAREA (alaturarea celor doua valori)

    Pentru prelucrari suplimentare, valorile alfanumerice se codifica BINAR utilizand doua cifre:

    0 (zero) care semnifica absenta valorii alfanumerice

    1 (unu) care semnifica prezenta valorii alfanumerice

    Variabile/caracteristici NUMERICE Ex.: TEMPERATURA: 100C, 150C, ... PRESIUNEA: 760 mm colHg

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    ETAPELE PRELUCRARILOR STATISTICE

    1. ANALIZA VARIABILITATII GLOBALE (A.V.G)

    DATELE UTILIZATE: VALORILE variabilelor/caracteristicilor mediului: v(i); i=1,2,...n OBIECTIVUL: cea mai probabila valoare a caracteristicii studiate si eroarea de estimare a acestei valori

    ( )v

    ( )%10210 00 CC

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    PRELUCRAREA DATELOR ALFANUMERICE

    Cea mai simpla varianta de evaluare a celei mai probabile valori alfanumerice se bazeaza pe HISTOGRAMA NOMINALA.

    Frecventa absoluta a valorilor

    alfanumerice

    Valorile alfanumerice intr-o succesiune arbitrara

    arin salcie ?

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    PRELUCRAREA DATELOR NUMERICE a) Analiza valorilor extreme conduce la doua variante

    decizionale: a. Eliminarea: daca numarul valorilor extreme este

    redus b. Prelucrarea separata a grupului de valori

    extreme: daca grupul este numeros.

    Eliminarea valorilor extreme conduce la reducerea marimii erorii de estimare pentru cea mai probabila valoare a

    caracteristicii studiate in zona investigata.

    Aplicatie temperatura Tema T7:

    Nr.valorii

    Valoarea variabilei

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Din diagrama de variabilitate a temperaturii rezulta ca nu sunt valori extreme care sa fie eliminate din setul de date original. In continuare se vor prelucra toate cele 40 de valori disponibile.

    b) Analiza distributiei valorilor de temperatura utilizand HISTOGRAMA VALORILOR TEMPERATURII

    Normalitatea unei distributii (simetria histogramei) se cuantifica prin COEFICENTUL DE ASIMETRIE:

    ZERO cand histigrama este SIMETRICA NEGATIV daca asimetria este de STANGA POZITIV daca asimetria este de DREAPTA

    Dupa aplicarea transformarilor radical (valmax+1-v) si 1/v s-a decis sa se calculeze valoarea cea mai probabila cu valorile netrensformate ale temperaturii deoarece coeficientul de asimetrie corespunzator valorilor originale este cel mai mic: -0,27.

    c) calculul valorii celei mai probabile si a erorii de estimare a acesteia pentru un risc asumat de 10%.

    F.abs.T

    T

    Vmin VMAX

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    LABORATOR 1. 1.Crearea fisierului cu date:

    Date numerice: o Coordonatele punctelor de masura (x,y) [m] o Presiunea aerului [mmHg] o Temperatura aerului [oC]

    Date alfanumerice: o Litologia: granit, diorit

    2. Construirea diagramei de variabilitate pentru identificarea valorilor EXTREME

    c) Evaluarea distributiei valorilor caracteristicilor numerice

    Instrumentul utilizat: HISTOGRAMA

    V Vmin Vmax

    Frecventa absoluta

    D n1=2 n2=4

    n3=3 n4=1 0

    1

    2

    3

    4

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Frecventa absoluta: numarul de aparitii al unei valori

    in

    Amplitudinea selectiei de valori:

    minmax VVA =

    Interval de grupare (STURGESS):

    )ln(33,21 nAD

    +=

    Utilizarea HISTOGRAMEI pentru studiul distributiei valorilor

    In functie de tipul HISTOGRAMEI se stabileste modul de calcul al celei mai probabile valori din zona investigata:

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Tipuri de HISTOGRAME: si modul de prelucrare specific

    HISTOGRAMA UNIMODALA SI SIMETRICA

    DISTRIBUTIA VALORILOR ESTE NORMALA

    Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei

    HISTOGRAMA ESTE UNIMODALA SI ASIMETRICA

    Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei DAR

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    NORMALIZATE CU AJUTORUL UNOR FUNCTII ANALITICE ELEMENTARE (ex.: log(v)=t)

    DACA NU SE NOMRALIZEAZA DISTRIBUTIA VALORILOR , VALOAREA CEA MAI PROBABILA

    VA FI SUPRAESTIMATA/SUBESTIMATA IN FUNCTIE DE TIPUL DE ASIMETRIE (DE DREAPTA

    respectiv de STANGA)

    HISTOGRAMA BIMODALA SIMETRICA `

    Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    HISTOGRAMA BIMODALA ASIMETRICA

    Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE NORMALIZATE.

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    CALCULUL CELEI MAI PROBABILE VALORI DIN ZONA INVESTIGATA

    Cea mai PROBABILA valoarea a unui set de valori cu distributie NORMALA (HISTOGRAMA UNIMODALA-SIMETRICA) este MEDIA ARITMETICA A VALORILOR.

    n

    v

    v

    ni

    ii

    =

    =

    =1

    Daca distributia valorilor este NON-NORMALA (HISTOGRAMA este ASIMETRICA) valoarea cea mai probabaila calculata cu formula MEDIEI ARITMETICE va fi SUBESTIMATA/SUPRAESTIMATA in functie de tipul de asimetrie. Pentru eliminaea SUPRAESTIMARII/SUBESTIMARII celei mai probabile valori se NORMALIZEAZA distributia valorilor.

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    APLICATIE Calculul celei mai probabile valori a PRESIUNII in zona investigata. Etapele de prelucrare (dupa construirea histogramei):

    1) Evaluarea tipului de histograma: a. Unimodala b. Asimetrica

    i. de stanga ii. moderata

    2) Calculul mediei aritmetice a valorilor presiunii (nenormalizate), media care va subestima cea mai probabila valoare a presiunii.

    3) Normalizarea distributiei valorilor a. Transformarea valorilor folosind functia

    RADICAL de ordinul 2

    nivt ii ,...,2,1;2 ==

    b. Construirea histogramei cu valorile transformate c. Compararea histogramelor construite cu valorile

    originale si cu valorile transformate: i. Calitativ/vizual (aproximativ)

    ii. Cantitativ pe baza coeficientului de asimetrie (SKEWNESS) care este:

    1. ZERO pentru histograma SIMETRICA 2. NEGATIV pt.hist. asim. STANGA 3. POZITIV pt.hist.asim. DREAPTA

    4) Calculul mediei cu valorile transformate, daca distributia acestora are un coeficient de asimetrie mai mic decat al valorilor originale.

    mmHgv 444,771=

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    2. Calculul erorii de estimate a mediei cu formula:

    ( ) Hg0.011443mm),2

    1( == tn

    s

    ( )Hg0.164949mm

    11

    2

    =

    =

    =

    =

    n

    vv

    s

    ni

    ii

    CONCLUZIA analizei variabilitatii globale

    In zona investigata valoarea cea mai probabila a presiunii este 771,444 mmHg cu o eroare de estimare de 0,011443 mmHg in conditiile unui risc asumat de 10%.

    presiunea

    Probabilitatea de aparitie

    a valorii

    771,44mmHg

    0,014 0,014

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI

    Metodologia de evaluare a corelatiilor dintre caracteristicile mediului (numerice/alfanumerice) este constituita din urmatoarea succesiune de prelucrari:

    Identificarea corelatiei dintre variabilele selectate (exista corelatie in C1 si C2) prin metode grafice.

    Evaluarea intensitatii corelatiei dintre cele doua variabile selectate: o Standardizarea variabilitatii celor doua variabile

    selectate pe domeniul valoric [0,1] o Calculul coeficientilor de corelatie dintre cele

    doua variabile selectate; Coeficientul de corelatie lineara PEARSON

    C1

    C2

    C1

    C2

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Val minima: -1: indica o corelatie lineara perfecta de tip INVERS PROPORTIONAL.

    Val medie: 0: indica lipsa corelatiei lineare dintre cele doua variabile selectate

    Valoarea MAXIMA: +1 indica o corelatie lineara perfecta de tip DIRECT PROPORTIONAL

    Modelarea matematica a corelatiei dintre cele doua variabile selectate

    21 CbaC +=

    r = -1 r = 0 r = +1 C1 C1 C1

    C2 C2 C2

    a

    C1

    C2

    1C

    2C

    21

    CCb

    =

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    LABORATOR Se evalueaza/analizeaza corelatia dintre:

    PRESIUNE si TEMPERATURA

    1. Identificarea corlatiei: a. Realizarea diagramei de corelatie:

    EXISTA CORELATIE 2. Evaluarea intensitatii

    STANDARDIZAREA DIAGRAMA DE CORELATIE CU VALORILE STANDARDIZATE

    CALCULUL COEFICIENTULUI PEARSON: -0,89

    INTENSITATEA CORELATIEI INVERSE DINTRE PRESIUNE SI TEMPERATURA ESTE F.BUNA!

    3. Modelarea MATEMATICA a corelatiei dintre PRESIUNE si TEMPERATURA:

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE

    DATELE NECESARE Coordonatele punctelor de observatie: Xi,Yi ;

    i=1,2,...,n Valorile variabilei cercetate in toate punctele de

    observatie disponibile: Vi; i=1,2,...,n

    APLICATIA: DATELE utilizate sunt:

    n =40 puncte de observatie Variabilele investigate:

    o Alfanumerica: LITOLOGIA cu 2 valori distincte: Calcar Argila

    o Numerica: Presiunea [mmHg] Temperatura [oC]

    METODOLOGIA DE EVALUARE 1. ANALIZA VARIABILITATII GLOBALE are ca obiectiv evaluarea celei mai probabile valori a variabilei in zona investigata. APLICATIA:

    Evaluarea celei mai probabile valori a LITOLOGIEI in zona investigata.

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    2. ANALIZA VARIABILITATII SPATIALE a variabilelor investigate

    OBIECTIV: identificare LEGII DE VARIATIE SPATIALA variabilelor investigate ( )yxfV ,=

    ?????

    APLICATIA: Lege de variatie spatiala pentru

    Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura)

    3. EVALUAREA VALORII VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT

    APLICATIA: Evaluarea:

    Pentru LITOLOGIE Pentru presiune/temperatura

    4. EVALUAREA ERORII DE ESTIMARE A VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT.

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    PROGRAMUL SURFER: Realizeaza doua tipuri de fisiere:

    i. Worksheet (similare cu fisierele de tip excel) ii. Plot-pentru reprezentari grafice si aplicarea

    metodologiei de evalure a distributiei spatiale.

    APLICATIA: Evaluarea celei mai probabile valori a

    LITOLOGIEI in zona investigata.

    INSTRUMENTUL UTILIZAT: HISTOGRAMA NOMINALA REZULTAT:

    PROBABILITATE DE APARITIE CALCAR: 20/40*100=50%

    PROBABILITATE DE APARITIE ARGILA: 20/40*100=50%

    VALORILE ALFANUMERICE

    FRECVENTA ABSOLUTA

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    APLICATIA: Lege de variatie spatiala pentru

    Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura)

    Metodologia de lucru Reprezentarea distributiei spatiale a punctelor de

    observatie (SURFER< datele din fisierul excel: sheet: datasurfer (x,y pentru cele 40 de puncte de observatie)

    File+new Plot+Map+New+Post Map+ Evaluarea legii de variatie spatiala a variabilei

    alfanumerice:LITOLOGIE cu doua valori distincte: 1. argila

    codificarea binara a valorii argilei calculul variogramei experimentale

    omnidirectionale

    NOTA_CURS

    VARIOGRAMA EXPERIMENTALA (V.E.)-forma de exprimare sintetica a legii de variatie spatiala pentru caracteristicile alfanumerice si numerice. DATELE NECESARE pentru calculul V.E. sunt:

    coordonatele punctelor de observatie (x,y)

    valorile caracteristicii: o 0/1 pentru cele alfanumerice o Valorile pentru cele numerice

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    FORMULA DE CALCUL pentru V.E.

    ( ) ( ) ( )( )

    =

    dN

    ji vvdNd

    r

    rr

    1

    2

    21

    Calculul variogramei experimentale cu prg.SURFER 1. CREAREA UNUI FISIER DE TIP: PLOT File+New+Plot 2. LANSAREA PROGRAMULUI DE CALCUL

    AL VARIOGRAMEI Grid+Variogram+New Variogram 3. Selectarea fisierului cu date 4. Selectarea datelor: x, y, Cod_argila 5. Calculul si salvarea variogramei pentru

    argila:Variograma_ARGILA. 6. Calculul variogramei pentru calcar:

    Variograma_CALCAR OBSERVATIE:

    dr

    ( )dr

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Daca sunt doar DOUA valori alfanumerice DISTINCTE variogramele sunt identice pentru aceste valori. Variogramele pentru variabile/caracteristici ALFANUMERICE se numesc VARIOGRAME INDICATOARE

    7. Calculul variogramei experimentale pentru variabilele numerice:

    Presiune: Variograma_PRESIUNE

    MODELAREA MATEMATICA A VARIOGRAMEI EXPERIMENTALE consta in identificarea unei functii continui care interpoleaza cu abateri minime valorile variogramei experimentale

    1. modelarea matematica a Variogramei ARGILEI 2. etc.

    EVALUAREA DISTRIBUTIEI SPATIALE PENTRU VARIABILELE ALFANUMERICE

    NOTA CURS: Harta distributiei spatiale a variabilelor ALFANUMERICE este o harta cu distributia PROBABILITATII DE APARIATIE a valorii afanumerice studiate (ARGILA). De regula pe aceste harti se reprezinta numai zonele cu probabilitati mai mari de 50%.

    o Aplicatia: Reteaua de interpolare pentru probabilitatea

    de aparitie a argilei (GRID_ARGILA)

  • ECO-STATISTICA-NOTITZZE DE LABORATOR-2014-2015

    Reprezentarea grafica a distributiei spatiale a probabilitatilor de aparitie pentru ARGILA

    Definitivarea reprezentarii grafice