Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y...

Post on 16-Apr-2017

249 views 7 download

Transcript of Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y...

ESTADÍSTICA I

Tablas de Distribución de Frecuencias Bivariadas. Distribución

de Frecuencias marginales y Condicionales. Media Aritmética

Marginal. Covarianza

Ms. Ylder Helí Vargas Alva

CUADRO N° 01

NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD

CUADRO N° 02

NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD Y TURNO QUE ASISTEN

Supongamos que se toma una muestra de tamaño

n de una población y que se está investigando, o

se desea estudiar, dos características de la misma.

Sean estas características X e Y. Siguiendo los

procedimientos habituales, la Muestra se divide en

• r clases Ai para la variable X

• s clases Bj para la variables Y

Existirán elementos que pertenecerán simultánea-

mente a AiBj. Los datos los podemos ordenar en

una tabla o matriz llamada Tabla de Contingencia

Estadística Bivariada

Y B1 B2 ..... Bj ..... Bs Total

A1 n11 n12 ..... n1j ..... n1s n1

A2 n21 n22 ..... n2j ..... n2s n2

Ai ni1 ni2 ..... nij ..... nis ni

Ar nr1 nr2 ..... nrj ..... nrs nr

Total n1 n

2 ..... nj ..... n

s n

X

n

= n_

Tabla de Contingencia

Y B1 B2 ..... Bj ..... Bs Total

A1 f11 f12 ..... f1j ..... f1s f1

A2 f21 f22 ..... f2j ..... f2s f2

Ai fi1 fi2 ..... fij ..... fis fi

Ar fr1 fr2 ..... frj ..... frs fr

Total f1 f

2 ..... fj ..... f

s f

X

f

= 1_

Tabla de Contingencia

Notación:

fij := frecuencia conjunta = fr(xi,yj)

fi = = frecuencia marginal =

f j = = frecuencia marginal =

fi/j = = frecuencia condicional =

j

ijf j

iji xyx )(),( rr ff

i

ijf i

jji yyx )(),( rr ff

j

ij

f

f

)(

),()/(

j

ji

jiy

yxyx

r

r

rf

ff

Estadística Bivariada

s

j

iji nn1

Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r(Independiente de la clases Bj a la que estén asociadas

Suma de los valores de la fila i-ésima )

r

i

ijj nn1

Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s(Independiente de las clases Ai a la que estén asociadas.

Suma de los valores de la columna j-ésima)

nij Frecuencia Absoluta de la clase conjunta AiBj.(Valor observado en la celda (i,j) de la Tabla de Contingencia)

fij nij

nFrecuencia Relativa

“conjunta” de la clase

conjunta correspondiente a

la intersección de Ai y Bj.

s

j

ijf1

r

i 1

1

Tabla de Contingencia

Para frecuencias relativas , i = 1,....,r se tiene:

Además se verifica que:

s

j

iji ff1

(Suma de los valores de la fila i-ésima

de la tabla de contingencia de frecuencias)

r

i

ijj ff1

n

niif

n

n j

jfj

ij

n

n

j

ij

i/jf

ff

Tabla de Contingencia

niif

nn j

jf

Frecuencia (relativa) “marginal” de la variable X, Conjunto de valores pertenecientes a las clases Ai,

considerandolas independientemente de las calses Bj

Frecuencia (relativa) “marginal” de la variable Y, Conjunto de valores pertenecientes a las clases Bj,

considerandolas independientemente de las calses Ai

Dado el experimento anterior, cuando sólo interesa conocer la

frecuencia de ocurrencia de cada una de las variables por separado

se habla de Frecuencia Marginal de la variable

n

Frecuencia Marginal

Una tela se clasifica en tres categorías A, B y C según cantidad y

severidad de pequeñas imperfecciones. La empresa tiene 5

telares, en un mes dado de producción se registraron los

siguientes datos.

# piezas de tela en la clasificación

Telar A B C Marginal

1 185 16 12 213

2 190 24 21 235

3 170 35 16 221

4 158 22 7 187

5 185 22 15 222

Marginal 888 119 71 1078

Ejemplo

Tabla de Contingencia

Se dice que X es independiente de Y si las frecuencias

condicionales de X/Y son todas iguales; es decir, no

dependen de la clase condicionante, esto es

fi/1 = fi/2 = fi/3 = = fi/s = fi

A

i = 1, 2, 3, ... , r

i1n

1n

i2n

2n

i3n

3n

isn

Sn

i1n

1n

i2n

i3n

isn

2n 3n sn

+ +

+ +

+ +....

+ +....i

n

n

....

....

fi

ii/j ff j ffj/i

ji/jij fff ij if jff

Luego similarmente

j

i/j fijf

fComo

Independencia Estadística

ijn

jn

j

i/jf

ijff

• Cuando se “pregunta” por la frecuencia relativa de una de las varia-

bles, digamos X, restrigida a los elementos observados de una clase

dada de la otra; esto es, estudiar el comportamiento de una variable

dado un valor fijo de la otra.

Frecuencia (relativa) de la variable X en la

clase conjunta AiBj, “dado” que sólo nos

interesa respecto a lo observado en la clase Bj

de la variable Y; para i = 1, 2, .., r

f1/j, f2/j, f3/j, ... , fr/j

Constituye la distribución de frecuencia relativa

condicional de la variable X dada la clase Bj de

la variable Y.

Nótese que se trabaja “condicionado” sobre un

tamaño de muestra “reducido” al número de

observaciones de la clase Bj dada

Frecuencia Condicional

Notación:

Análogamente, se tiene:

fj/i = = frecuencia condicional =

i

ij

f

f

)(

),()/(

i

ji

ijx

yxxy

r

r

rf

ff

Independencia Estadística

X e Y son variables estadísticamente independientes ssi:

ó

ó

)()/( jij yxy rr ff )()/( iyi xyx rr ff

ii/j ff j ffj/i

Estadística Bivariada

Independencia Estadística

como ij/iij fff ijij fff

Asociación de Variables

Datos no agrupados Cov(x,y) =

Datos agrupados : Cov(x,y) =

Coeficiente de Correlación = r =

))((1

yyxxn

ii

))(( yyxx ii if

Cov (x,y)

Sx Sy

Estadística Bivariada

Fallas Anuales

Temperatura 120 140 160 MarginalAverías

2 20 15 10 45

3 12 7 5 24

4 4 10 2 16

5 - 5 10 15

Marginal 36 37 27 100

Obtener :Distribuciones marginales

Distribuciones condicionales (4 averías), Media

y Varianza condicional

Ejercicio

Fallas Anuales

Temperatura 120 140 160 MarginalAverías

2 0,20 0,15 0,10 0,45

3 0,12 0,07 0,05 0,24

4 0,04 0,10 0,02 0,16

5 0 0,05 0,10 0,15

Marginal 0,36 0,37 0,27 1,00

fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5

Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2

+1//8(160-137,5)2 =

Ejercicio

Curvas de Regresión

X

Y

x , y son variables independiente y dependiente

respectivamente. Además una variable estadística que

representa el error.

Los parámetros 0 y 1 pueden ser estimados a partir de

los datos {(xi , yi)}i=1,...,n mediante método de mínimos

cuadrados.

Entonces

xy 10

iiiii xyyye 10 ˆˆˆ Sea ;

Curvas de regresión (Lineal)

x

y

x: variable independiente y

y : variable dependiente

: una variable estadística que representa el error.

xmx 10

xy 10

Modelo Estadístico (Lineal)

x

y

xy 10

1

0

Modelo Estadístico (Lineal)

x

y xy 10

Los parámetros 0 y 1 pueden ser estimados a partir de los datos

{(xi , yi)}i=1,...,n mediante método de mínimos cuadrados.

Esto es, minimizar el error cuadrático medio min S ei2

xmx 10ii

ei

x

xyi 10

y

Modelo Estadístico (Lineal)

n

i

n

i

iii xy1 1

2

10

2)(minmin

1010

n

i

iE eSC1

2

x

xy

SC

SC1̂ xy 10 ˆˆ

n

i

ix xxSC1

2)(

))(( yyxxSC i

n

i

ixy 1

n

i

ieVNE1

2

Límites de Clase

Ingreso Estandarizado

de una Población

Marca de

Clase

105

Consumo

Promedio

de Leche

Semanal

N° de

Personas

Encuestadas

0 - 100000 0,5 2,13 532

100001 - 200000 1,5 2,82 647

200001 - 300000 2,5 3,70 692

300001 - 400000 3,5 4,25 867

400001 - 500000 4,5 4,86 865

500001 - 600000 5,5 5,16 513

600001 - 800000 7,0 5,23 530

800001 - 1000000 9,0 5,57 181

x

Ejemplo: Curvas de Regresión

x y SCx SCy SCxy SCE

0,5 2,13 14,06 4,35 7,82 2,70 0,32

1,5 2,82 7,56 1,95 3,84 3,10 0,08

2,5 3,70 3,06 0,27 0,90 3,51 0,04

3,5 4,25 0,56 0,00 -0,03 3,91 0,11

4,5 4,86 0,06 0,42 0,16 4,32 0,30

5,5 5,16 1,56 0,89 1,18 4,72 0,19

7,0 5,23 7,56 1,03 2,79 5,33 0,01

9,0 5,57 22,56 1,84 6,44 6,14 0,32

34,0 33,72 57,00 10,74 23,10 33,72 1,374,25 4,215 4,215

1 0.4135965

0 2.4697149

y

x = y =S

Modelo Estadístico: Ejemplo

0.4135965=

SCx

1ˆSCxy

=

ˆˆ 2.4697149 x1y0 = =

SCxy= 23,10

SCx = 57,00

y

x

= 4,215

= 4,25

10,74

% de Ajuste del Modelo =

1 =1,37

= 0,872 87,2%SCE

SCy

Ejemplo

Ejemplo: Curvas de Regresión

t 0 1 2 3 4 5 6

V(t) 30 60 46 32 10 4 17

20 40 26 14 8

20 12

V(t) 25 40 46 29 12 6 17

Sea xt = sen t yt = V(t)

Luego y(t) = 0 + 1 xt + t

t

tt xyQ 2

10,

10,

)(min),(min1010

3,25ˆˆ10 xy 20

),cov(ˆ21

xS

yx

12762yS 45222

,)ˆ( tt yy

% de Ajuste del Modelo =

%%,ˆ

9810098012

2

y

t

S

e

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

a = 2.4697149

b = 0.4135965

Linear Fit:

Y = a + bx

Ajuste Lineal

Ajuste Logarítmico

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Logarithm Fit:

Y = a + b*ln(x)

Ajuste Polinomial

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Power Fit:

Y = a xb

a = 2.6890974

b = 0.3543629

Modelo Logístico

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Logistic Model:

Y =a

1+b*e-cx

a = 5.6469463

b = 2.2230602

c = 0.55970905

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Richard’s Model:

Y =a

1+b*e(b-cx)(1/d)

a = 5.6606384

b = 0.5984401

c = 0.5415778

d = 0.8782331

Modelo de Richard

Asociación Exponencial

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Exponential Association (3):

Y = a (b - e-cx)

a = 4.6333776

b = 1.3115177

c = 0.2709334

Sea yi = h ( xi ) con i = 1,...,n

1. Lineales yi = axi + b

y = ax + b

Sy = a Sx

2. No lineales yi = h( xi )

y = h(x) + h”(x) SX2

Sy2 Sx

2 h’ (x)2

En particular

h(x) = ln x y = ln x - ( Sx2 / x2 )

Sy2 ( Sx

2 / x2 ) = CV 2

2

1

2

1

Transformaciones

Relaciones Linealizables

1. y = K x ln y = a0 + a1 ln x

2. y = K ( / x ) y = a0 a1 x-1

3. y = K ex ln y = a0 + a1 x

4. y = K e-/x ln y = a0 + a1 x-1

5. yt = K + cos t y = a0 + a1 xt

siendo xt = cos t

6. y() = y - 1 = a0 + a1 x

y-1 dy = a1 w = dy

dx dx

ln w = ln a1 + ( 1 - ) ln y

3. Box-Cox Transformaciones (1964)

h (x) = X() =

( x + m ) - 1 0 x > -m

ln ( x + m ) = 0 m > 0

Transformaciones

Sea yi = h ( xi ) con i = 1,...,n

1. Lineales 2. No lineales

• yi = a + bxi • y = a + b ln x

• y = a + bx • y = a e bx

• sy = b sx

3. Linealizables

• y = a x b ln y = ln a + b ln x

• y = a ( b / x ) y = a b x-1

• y = a e bx ln y = ln a + b x

• y = a e-b/x ln y = ln a - b x-1

• yt = a + b cos t y = a + b xt siendo xt = cos t

Transformaciones