Post on 07-Dec-2014
ANÁLISIS DE REGRESIÓN Y CORRELACIÓNNÚMEROS ÍNDICE. DISTRIBUCIÓN NORMAL
Asignatura: ESTADÍSTICA GENERAL
Docente:RISCO DÁVILA CARLOS
Ciclo:II-Grupo B
EJERCICIOS DE REGRESIÓN LINEAL SIMPLE
1. Un estudio para valorar la capacidad de sistemas de humedecimiento de suelos mediante flujo subsuperficial para eliminar la demanda de oxígeno bioquímico (BOD) y otros constituyentes químicos dio los datos adjuntos sobre x=carga masiva de oxigeno bioquímico (Kg/ha/d) y y=eliminación masiva de oxigeno bioquímico(Kg/ha/d).
x 3 8 10 11 13 16 27 30 35 37 38 44 103 142y 4 7 8 8 10 11 16 26 21 9 31 30 75 90
Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.
DIAGRAMA DE DISPERSIÓN
0 20 40 60 80 100 120 140 1600
10
20
30
40
50
60
70
80
90
100
f(x) = 0.652290200363518 x + 0.626140458004365R² = 0.955973574454454
Grafico 1. Carga & Eliminacion de BOD
Carga de BOD
Elim
inac
ion d
e BOD
Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE
ESTADÍSTICA GENERAL Página 2
y=A+Bx
Por método de los mínimos cuadrados.
n x y x2 y2 xy
1 3 4 9 16 122 8 7 64 49 563 10 8 100 64 804 11 8 121 64 885 13 10 169 100 1306 16 11 256 121 1767 27 16 729 256 4328 30 26 900 676 7809 35 21 1225 441 735
10 37 9 1369 81 33311 37 31 1369 961 114712 44 30 1936 900 132013 103 75 10609 5625 772514 142 90 20164 8100 12780
n=14 ∑ x=¿516
∑ y=¿346
∑ x2=¿¿39020
∑ y2=¿¿17454
∑ xy=¿25794
Ecuación de Regresión Lineal Simple Estimada:
y=0,6829+0,652 x
ERROR ESTÁNDAR DE ESTIMACIÓN
ESTADÍSTICA GENERAL Página 3
A=∑ x2∑ y−∑ x∑ xy
n∑ x2−(∑ x )2
A=(39020 x 346 )−(516 x25794)
(14 x 39020 )−(516)2
A=0,6829
B=n∑ xy−∑ x∑ y
n∑ x2−(∑ x )2
B=(14 x25794 )−(516 x346)
(14 x39020 )−(516)2
B=0,652
Sy / x=√∑ y2−A∑ y−B∑ xyn−2
S yx
=√ 17454−0,6829 x346−0,652 x2579414−2
Sy / x=5,7
COEFICIENTE DE DETERMINACIÓN
r2=A∑ y+B∑ xy−n y2
∑ y2−n y2
r2=0,6829 x346+0,652x 25794−14 x 24,72
17454−14 x 24,72
r2=0,98
2. La siguiente tabla muestra la combustión de la masa (x) y la longitud de flama (y), datos recogidos de la revista Combustion Science and Technology.
x 1,7 2,2 2,3 2,6 2,7 3,0 3,2 3,3 4,1 4,3 4,6 5,7 6,1y 1,3 1,8 1,6 2,0 2,1 2,2 3,0 2,6 4,1 3,7 5,0 5,8 5,3
Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.
DIAGRAMA DE DISPERSIÓN
ESTADÍSTICA GENERAL Página 4
y=∑ y
n
y=34614
y=24,7
1 2 3 4 5 6 70
1
2
3
4
5
6
7
f(x) = 1.08736540344008 x − 0.715487344427352R² = 0.944068952188387
Grafico 2. Combustión & Longitud
Combustion de la masa
Long
itud d
e la fl
ama
Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE
y=A+Bx
Por método de los mínimos cuadrados.
n x y x2 y2 xy
1 1,7 1,3 2,89 1,69 2,212 2,2 1,8 4,84 3,24 3,963 2,3 1,6 5,29 2,56 3,684 2,6 2 6,76 4 5,25 2,7 2,1 7,29 4,41 5,676 3 2,2 9 4,84 6,67 3,2 3 10,24 9 9,68 3,3 2,6 10,89 6,76 8,589 4,1 4,1 16,81 16,81 16,81
10 4,3 3,7 18,49 13,69 15,9111 4,6 5 21,16 25 2312 5,7 5,8 32,49 33,64 33,0613 6,1 5,3 37,21 28,09 32,33
n=13 ∑ x=¿45,8
∑ y=¿40,5
∑ x2=¿¿183,36
∑ y2=¿¿153,73
∑ xy=¿166,61
ESTADÍSTICA GENERAL Página 5
A=∑ x2∑ y−∑ x∑ xy
n∑ x2−(∑ x )2 B=
n∑ xy−∑ x∑ y
n∑ x2−(∑ x )2
Ecuación de Regresión Lineal Simple Estimada:
y=1,0874 x−0,7155
ERROR ESTÁNDAR DE ESTIMACIÓN
Sy / x=√∑ y2−A∑ y−B∑ xyn−2
Sy / x=√ 153,73−(−0,7155 ) x 40,5−1,0874 x166,6113−2
Sy / x=0,37
COEFICIENTE DE DETERMINACIÓN
r2=A∑ y+B∑ xy−n y2
∑ y2−n y2
r2=−0,7155 x 40,5+1,0874 x 166,61−13 x3,122
153,73−13 x3,122
r2=0,99
3. Los datos adjuntos se tomaron de una gráfica publicada en un artículo y muestra la variable dependiente (x) que es la tasa de acumulación de SO2 (mg/m2/d) y la variable dependiente (y) es la pérdida de peso de acero (g/m2)
ESTADÍSTICA GENERAL Página 6
A=∑ x2∑ y−∑ x∑ xy
n∑ x2−(∑ x )2 B=
n∑ xy−∑ x∑ y
n∑ x2−(∑ x )2
y=∑ y
n
y= 40,513
y=3,12
x 14 18 40 43 45 112y 280 350 470 500 560 1200
Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.
DIAGRAMA DE DISPERSIÓN
0 20 40 60 80 100 1200
200
400
600
800
1000
1200
1400
f(x) = 9.31156696380625 x + 137.875630974117R² = 0.989717856763519
Grafico 3. Tasa de acumulacion de SO2 y perdida de peso del acero
Tasa de acumulacion de SO2
Perd
ida d
e pe
so d
el ac
ero
Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE
y=A+Bx
Por método de los mínimos cuadrados.
n x y x2 y2 xy
1 14 280 196 78400 39202 18 350 324 122500 63003 40 470 1600 220900 18800
ESTADÍSTICA GENERAL Página 7
4 43 500 1849 250000 215005 45 560 2025 313600 252006 112 1200 12544 1440000 134400
n=6 ∑ x=¿272
∑ y=¿3360
∑ x2=¿¿18538
∑ y2=¿¿2425400
∑ xy=¿210120
Ecuación de Regresión Lineal Simple Estimada:
y=9,31x+137,88
ERROR ESTÁNDAR DE ESTIMACIÓN
Sy / x=√∑ y2−A∑ y−B∑ xyn−2
Sy / x=√ 2425400−(137,88 ) x3366−9,31 x2101206−2
Sy / x=38 ,42
COEFICIENTE DE DETERMINACIÓN
r2=A∑ y+B∑ xy−n y2
∑ y2−n y2
ESTADÍSTICA GENERAL Página 8
A=∑ x2∑ y−∑ x∑ xy
n∑ x2−(∑ x )2
A=(18538 x3360 )−(272x 210120)
(6 x18538 )−(272)2
A=137,88
B=n∑ xy−∑ x∑ y
n∑ x2−(∑ x )2
B=(6 x210120 )−(272x 3360)
(6 x18538 )−(272)2
B=9,31
y=∑ y
n
y=33666
y=561
r2=137,88 x3366+9,31x 210120−6 x5612
2425400−6 x5612
r2=0,99
EJERCICIOS DE REGRESIÓN NO LINEAL (parabólico, potencial y exponencial)
4. Se realizó un estudio sobre un camión de reparto ligero a diesel para ver si la humedad, temperatura del aire y presión barométrica influyen en la emisión de óxido nitroso (en rpm). Las mediciones de las emisiones se tomaron en diferentes momentos, con condiciones experimentales variantes. Los datos son los siguientes:
x 8,3 10,7 14,1 20,1 24 18,2 16,6 28,2y 0,0
50,11 0,21 0,63 0,8
70,52 0,3 1,19
Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión parabólica. Calcule el error estándar de estimación y coeficiente de determinación.
DIAGRAMA DE DISPERSIÓN
5 10 15 20 25 300
0.2
0.4
0.6
0.8
1
1.2
1.4
f(x) = 0.00151027295906128 x² + 0.00420425795125268 x − 0.110524236140145R² = 0.988137394236115
Grafico 4. Viscosidad & Derrame libre %
Eje x
Eje y
Calculo de ECUACIÓN DE REGRESION PARABÓLICA
y=a+bx+c x2
ESTADÍSTICA GENERAL Página 9
Ecuaciones Normales
∑ y=an+b∑ x+c∑ x2
3,88=a(8)+b (140,2)+c (2764,2)
∑ xy=a∑ x+b∑ x2+c∑ x3
86,1=a(140,2)+b(2764,2)+c (59573,3)
∑ x2 y=a∑ x2+b∑ x3+c∑ x4
2014,7=a(2764,2)+b (59573,3)+c (2764,2)
Cálculo matricial
[ 3,8886,12014,7]=[ 8 140,2 2764,2
140,2 2764,2 59573,32764,2 59573,3 2764,2 ] [abc ]
[abc ]=[−0,11050,00420,0015 ]
Ecuación de Regresión Parabólica Estimada:
y=−0,1105+0,0042 x+0,0015 x2
ERROR ESTÁNDAR DE ESTIMACIÓN
Sy / x=√∑ y2−a∑ y−b∑ xy−c∑ x2 yn−3
Sy / x=√ 2,99−(−0,1105 ) (3,88 )−(0,0042 ) (86,1 )−(0,0015 )(2014,7)8−3
Sy / x=0,08
COEFICIENTE DE DETERMINACIÓN
r2=a∑ y+b∑ xy+c∑ x2 y−n y2
ESTADÍSTICA GENERAL Página 10
y=∑ y
n
y=3,888
y=0,48
r2= (−0,1105) (3,88 )+(0,0042 ) (86,1 )+(0,0015 ) (2014,7 )−8(0,48)2
r2=0,98
5. En la producción de herramientas, el método para deformar acero a temperatura normal mantiene una relación inversa con la dureza del mismo ya que a medida que la deformación crece, se ve afectada la dureza del acero. Para investigar esta relación se ha tomado la siguiente muestra:
Donde: X: deformación (en mm)Y: dureza del acero (Kg/mm2)
x 6 9 11 13 22 26 28 33 35y 68 67 65 53 44 40 37 34 32
Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión potencial. Calcule el error estándar de estimación y coeficiente de determinación.
DIAGRAMA DE DISPERSIÓN
0 5 10 15 20 25 30 35 400
10
20
30
40
50
60
70
80f(x) = 175.60662539855 x -̂0.462107919471277R² = 0.947828891293398
Grafico 5. Deformación & Dureza del acero
Deformación (mm)
Dure
za d
el a
cero
(Kg/
mm
^2)
Calculo de ECUACIÓN DE REGRESION POTENCIAL
y=A x B
Cálculo para hallar la ecuación
ESTADÍSTICA GENERAL Página 11
n x y logx logy logx . logy (logx)2 (logy)2
1 6 68 0,78 1,83 1,43 0,61 3,362 9 67 0,95 1,83 1,74 0,91 3,333 11 65 1,04 1,81 1,89 1,08 3,294 13 53 1,11 1,72 1,92 1,24 2,975 22 44 1,34 1,64 2,21 1,80 2,706 26 40 1,41 1,60 2,27 2,00 2,577 28 37 1,45 1,57 2,27 2,09 2,468 33 34 1,52 1,53 2,33 2,31 2,359 35 32 1,54 1,51 2,32 2,38 2,27
n=9 ∑ x=¿183
∑ y=¿440
∑ ¿11,15
∑ ¿15 ∑ ¿18,37 ∑ ¿14,43
∑ ¿25,29
Ecuación de Regresión Potencial Estimada:
y=logA+Bx
y=2,244−0,462x
y=175 ,61 x−0,462
ERROR ESTÁNDAR DE ESTIMACIÓN
Sy / x=√∑ log y2−logA∑ logy−B∑ logxlogyn−2
ESTADÍSTICA GENERAL Página 12
logA=∑ logy∑ (logx)2−∑ logx∑ logxlogy
n∑ (logx)2−(∑ logx )2
logA=(15 x14,43 )−(11,15 x18,37)
(9 x14,43 )−(11,15)2
logA=2,244
B=n∑ logxlogy−∑ logx∑ logy
n∑ ¿¿¿
B=(9 x18,37 )−(11,15 x15)
(9 x14,43 )−(11,15)2
B=−0,462
Sy / x=√ 25,29−(2,244 ) (15 )−(−0,462 ) (18,37 )9−2
Sy / x=0,017
COEFICIENTE DE DETERMINACIÓN
r2=B∑ logxlogy−logA∑ logy−n(log y )2
∑ log y2−¿n( log y )2¿
r2=−0,462 x18,37+ (2,244 ) (15 )−9(0,223)2
25,29−9(0,223)2
r2=0,99
6. La solubilidad en el agua de cierto producto orgánico se hace más rápida con la ayuda de un agente químico. Según presumimos las siguientes observaciones registradas en la tabla de datos, donde 6 muestras de 20 gramos de productos y diversas dosis del agente químico.
Donde: X: agente químico (g)Y: tiempo de solubilidad (s)
x 3 2 1 3 5 4y 7 9 10 8 5 6
Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión potencial. Calcule el error estándar de estimación y coeficiente de determinación. DIAGRAMA DE DISPERSIÓN
ESTADÍSTICA GENERAL Página 13
y=∑ logy
n
y=159
y=1,67
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.50
2
4
6
8
10
12
Grafico 6. Agente químico & Tiempo de solubilidad
Tiempo de solubilidad (s)
Agen
te qu
ímico
(g)
Calculo de ECUACIÓN DE REGRESION POTENCIAL
y=A Bx
Cálculo para hallar la ecuación
n x y x2 logy x .logy
1 3 7 9 0,85 2,542 2 9 4 0,95 1,913 1 10 1 1,00 1,004 3 8 9 0,90 2,715 5 5 25 0,70 3,496 4 6 16 0,78 3,11
n=6 ∑ x=¿18
∑ y=¿45
∑ ¿64 ∑ ¿5,18 ∑ ¿14,76
Ecuaciones Normales
∑ logy=nlogA+logB∑ x
5,18=8 logA+18logB ¿
∑ xlogy=logA∑ x+logB∑ x2
14,76=18 logA+64 logB
ESTADÍSTICA GENERAL Página 14
Cálculo matricial
[ 5,1814,76]=[ 8 1818 64] [logAlogB ]
[ logAlogB ]=[0,350,13]
Ecuación de Regresión Potencial Estimada:
y=logA+xlogB
y=0,35+0,132 x
y=2.24¿
COEFICIENTE DE DETERMINACIÓN
r2=logB∑ logy+logA∑ logy−n(log y )2
∑ log y2−¿n(log y )2¿
r2=0,132 (5,18 )+0,35 (5,18 )−6(−0,06)2
25,29−6 (−0,06)2
r2=0,98
ESTADÍSTICA GENERAL Página 15
y=∑ y
n
y=5,186
y=0,86
EJERCICIOS DE CORRELACION SIMPLE (DISPERSION Y MEDIA ESTADISTICA CON GRAFICAS)
1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h, puede ponerse en función del número de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados.
a)
Calcula el coeficiente de correlación lineal.
b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de 120 km / h?
c) ¿Es buena la predicción?
SOLUCION:
ESTADÍSTICA GENERAL Página 16
Accidentes xi 5 7 2 1 9
Vehículos yi 15 18 10 8 20
DIAGRAMA DE DISPERSIÓN
0 1 2 3 4 5 6 7 8 9 1005
10152025
Accidentes & Vehículos
accidentes
vehí
culo
s
Cálculo para hallar la ecuación
ESTADÍSTICA GENERAL Página 17
2. Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de la tabla adjunta.
Psicología xi 3 4 5 6 6 7 7 8 10
Estadística yi 2 5 5 6 7 6 7 9 10
# de alumnos fi 4 6 12 4 5 4 2 1 2
a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respecto de las calificaciones de psicología.
b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4,5 en psicología?
Solución
DIAGRAMA DE DISPERSIÓN
ESTADÍSTICA GENERAL Página 18
4 6 8 10 12 14 160
2
4
6
8
10
12
f(x) = 0.704301075268817 x + 0.870967741935483R² = 0.849050069265783
Psicología & Estadística
psicologia
esta
disti
ca
Cálculo para hallar la ecuación
ESTADÍSTICA GENERAL Página 19
3. La empresa Bradford Electric Illuminating Co, analiza la relación entre el consumo de energía (en miles de kilowatts - hora,kwh) y el número de habitaciones en una residencia privada unifamiliar. Una muestra aleatoria de 10 casas produjo lo siguiente:
ESTADÍSTICA GENERAL Página 20
a. Determine la ecuación de regresión:
b. Evalué el consumo en kilowatts – hora, para una casa de 6 habitaciones
EJERCICIOS DE INDICE ESTADISTICO
1) La siguiente tabla muestra la evolución trimestral del número de parados en Andalucía :
ESTADÍSTICA GENERAL Página 21
4 6 8 10 12 14 160
2
4
6
8
10
12
f(x) = 0.666666666666667 x + 1.33333333333333R² = 0.816849816849817
Habitacion & Consumo
habitación
cons
umo
a) Calcular la serie de números índices simples con base el primer trimestre de 2002.
b) Calcular la serie de números índices en cadena.
c) Calcular la tasa de variación del número de parados del cuarto trimestre del año 2004 con respecto al primer trimestre de 2003.
d) Calcular la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004.
SOLUCIÓN:
a) Llamemos X: número de parados (miles de personas). El índice simple del periodo t con base el periodo 0, vendrá dado por:
Donde x es el número de parados en el periodo t y Xo es el número de parados en el periodo base. En nuestro caso el periodo base es el primer trimestre del año 2002, que representaremos por I-2002. Así, se tiene que:
ESTADÍSTICA GENERAL Página 22
Y así sucesivamente, obteniéndose:
Estos índices nos indican la variación porcentual del número de parados en cada periodo con respecto al periodo base.
Así, por ejemplo, el número de parados del cuarto trimestre de 2002 es un 9,64% superior al número de parados del primer trimestre de 2002, ya que 109,64 -100 = 9,64.
b) Los números índices en cadena los calculamos tomando como base en cada periodo, el periodo anterior:
Así, se tiene que:
ESTADÍSTICA GENERAL Página 23
Y así sucesivamente, obteniéndose:
Estos índices nos indican la variación porcentual del número de parados en cada periodo con respecto al periodo anterior.
Así, por ejemplo, el número de parados del segundo trimestre de 2004 es un 2,33% superior al número de parados del primer trimestre de 2004.
Evidentemente, para el primer periodo no podemos calcular el índice en cadena, ya que no disponemos el dato del periodo anterior.
c) La tasa de variación del número de parados del período t con respecto al período s viene dada por:
ESTADÍSTICA GENERAL Página 24
En nuestro caso, el periodo t es el cuarto trimestre del año 2004 y el periodo s es el primer trimestre de 2003.
Luego, el número de parados del cuarto trimestre del año 2004 descendió un 10,69% con respecto al primer trimestre del año 2003.
Esta tasa de variación también podríamos calcularla utilizando los índices simples de ambos periodos en lugar de los valores de la variable.
d) La tasa media acumulativa del número de parados del período t con respecto al período s viene dada por:
Así, la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004 viene dada por:
Por tanto, la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004 es de -0,686% .
Esta tasa media acumulativa también se podría haber obtenido a partir de los índices simples:
ESTADÍSTICA GENERAL Página 25
2) Se dispone de los siguientes datos sobre el índice anual de ventas de una cierta empresa:
Enlazar las tres series de números índices y expresar la serie enlazada en base el año 1994.
SOLUCIÓN:
Como las series de índices en base 1994 y en base 2000 tienen un único periodo en
común (el año 2000), para realizar el enlace de estas dos series expresamos ambas en
base el año 2000. Para ello, sólo tenemos que realizar un cambio de base en la serie
que está en base el año 1994.
ESTADÍSTICA GENERAL Página 26
Así, tenemos:
Ahora expresamos ambas series en base el año 1994.
Para la serie en base 1990, dividimos todos los índices
por el índice de 1994 en base 1990. Para la serie en base
2000, dividimos todos los índices por el índice de 1994 en
base 2000. De esta forma, ya tendremos las tres series
enlazadas:
ESTADÍSTICA GENERAL Página 27
3) Las empresas del sector informático de cierta región facturaron durante los años
2001, 2002 y 2003 las cantidades que se indican y a los precios que figuran en la
siguiente tabla:
a) Construir, con base el año 2001, el índice de valor y los índices de precios y cantidades de Laspeyres, Paasche y Fisher.
b) Hallar la repercusión y participación de cada tipo de ordenador en la variación del índice de precios de Laspeyres entre los años 2002 y 2003.
c) Hallar la repercusión y participación de cada tipo de ordenador en la variación del índice de precios de Paasche entre los años 2002 y 2003.
SOLUCIÓN:
a) Los índices de precios y cantidades de Laspeyres, Paasche y Fisher vienen dados
por:
El índice de valor viene dado por:
ESTADÍSTICA GENERAL Página 28
Calculemos las distintas sumas que aparecen en las expresiones de dichos índices,
teniendo en cuenta que el año base es el año 2001:
Una vez obtenidas las distintas sumas, calculamos los índices:
ESTADÍSTICA GENERAL Página 29
El índice de valor también se podría haber obtenido a partir de los índices de precios y
cantidades de Laspeyres, Paasche y Fisher:
b) Para calcular la repercusión y participación, tenemos que expresar el índice de
precios de Laspeyres como una media aritmética ponderada de índices simples
de precios.
Siendo la ponderación del artículo i, y
el índice simple de precios del artículo i.
Calculemos la ponderación y los índices simples de precios de cada tipo de
ordenador:
· Ponderación de los ordenadores personales:
ESTADÍSTICA GENERAL Página 30
· Ponderación de los ordenadores portátiles:
· Índices simples de precios con base el años 2001:
Como las ponderaciones son constantes en el tiempo, la repercusión de cada tipo
de ordenador en la variación del índice de precios de Laspeyres entre los años 2002
y 2003 viene dada por:
· Repercusión de los ordenadores personales:
· Repercusión de los ordenadores portátiles:
La participación de cada tipo de ordenador en la variación del índice de precios de
Laspeyres entre los años 2002 y 2003 viene dada por:
· Participación de los ordenadores personales:
ESTADÍSTICA GENERAL Página 31
· Participación de los ordenadores portátiles:
c) Para calcular la repercusión y participación, tenemos que expresar el índice de
precios de Paasche como una media aritmética ponderada de índices simples
de precios.
Siendo la ponderación del artículo i, y
el índice simple de precios del artículo i.
En este caso, como las ponderaciones son variables en el tiempo, la repercusión de
cada tipo de ordenador en la variación del índice de precios de Paasche entre los años
2002 y 2003 viene dada por:
Calculemos las ponderaciones de cada tipo de ordenador en los años 2002 y 2003:
· Ponderación de los ordenadores personales año 2002:
· Ponderación de los ordenadores portátiles año 2002:
· Ponderación de los ordenadores personales año 2003:
ESTADÍSTICA GENERAL Página 32
· Ponderación de los ordenadores portátiles año 2003:
Luego, la repercusión de cada tipo de ordenador en la variación del índice de precios
de Paasche entre los años 2002 y 2003 es:
· Repercusión de los ordenadores personales:
· Repercusión de los ordenadores portátiles:
La participación de cada tipo de ordenador en la variación del índice de precios de
Paasche entre los años 2002 y 2003 viene dada por:
· Participación de los ordenadores personales:
· Participación de los ordenadores portátiles:
ESTADÍSTICA GENERAL Página 33
EJERCICIOS NÚMERO ÍNDICE LASPAYER Y PEASCHE:
Se observa una cesta de la compra compuesta por pan, leche y carne. Los datos relativos a los precios y a las cantidades consumidas por una familia en el perıodo 2006-2008 aparecen en las siguientes tablas:
a) Calcula e interpreta los índices de precios de Laspeyres respecto a 2006.b) Calcula e interpreta los índices cuánticos de Laspeyres respecto a 2006.c) Calcula e interpreta los índices de precios de Paasche respecto a 2006.d) Calcula e interpreta los índices cuánticos de Paasche respecto a 2006.
SOLUCIÓN (a):
El objetivo del Apartado a) es ahora calcular en primer lugar el índice de precios de Laspeyres del año 2007 base 2006.
Método y Justificación: se calculará el índice de Laspeyres porque ese es el objetivo. Se puede utilizar cualquiera de las dos fórmulas.
Cálculos: a partir de los índices simples y las ponderaciones o gastos en cada bien (ver Tabla 10.1), se puede aplicar la primera fórmula.
ESTADÍSTICA GENERAL Página 34
Al aplicar directamente la segunda fórmula, se pierde un poco la visión del índice como media ponderada, aunque sale el mismo valor y se aprecia mejor la segunda interpretación.
Conclusión: la cesta de la compra subió en media un 2,6% del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2006. En el primer cálculo se ve perfectamente que el bien en el que más se invirtió fue la carne (es el que mayor gasto o valor presenta), y de ahí que su bajada influya bastante en la media ponderada. Equivalentemente, se puede decir que en el año 2007 se gastarían 1057,9e para comprar las mismas cantidades que en el año 2006, frente a los 1030,98e que se gastaron en 2006. Esto significa que el gasto aumentó un 2,61% debido a la variación de los precios.
ESTADÍSTICA GENERAL Página 35
SOLUCIÓN (b):
El primer objetivo del Apartado b) es calcular el ´índice cuántico de Laspeyres del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).
Cálculos: de nuevo, se puede utilizar cualquiera de las dos formulas que se conocen. A partir de los índices de cantidad simples de cada bien y las ponderaciones o gastos (ver Tabla 10.2), se aplica la primera fórmula.
También se puede utilizar la segunda fórmula:
ESTADÍSTICA GENERAL Página 36
Conclusión: el consumo subió 6,3 puntos porcentuales del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2006. Con el primer cálculo se aprecia que el bien en el que más se invirtió fue la carne (es el que mayor gasto o valor presenta), y de ahí que su subida influya bastante en la media ponderada. Con el segundo cálculo se ilustra mejor la segunda interpretación: en 2007 se gastarían 1095,92e de haberse mantenido los precios frente a los 1030,98e que se gastaron en 2006. En consecuencia, el gasto ha aumentado un 6,3% a causa del aumento del consumo.
SOLUCIÓN (c):
El objetivo del Apartado c) es calcular en primer lugar el ´índice de precios de Paasche del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).
Cálculos: a partir de los índices simples y las ponderaciones (ver Tabla 10.3), se puede aplicar la primera fórmula.
ESTADÍSTICA GENERAL Página 37
Al aplicar la segunda fórmula, se tendrían los siguientes cálculos:
Conclusión: la cesta de la compra subió en media un 2,3% del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2007 de haberse mantenido los precios de 2006. El valor es similar al del índice de Laspeyres, y eso se debe al que la valoración de los bienes no cambió en exceso en este caso (sigue teniendo la mayor ponderación la carne y la menor el pan). Atendiendo a la segunda fórmula también se puede decir que el gasto en 2007 fue de 1121,35e, mientras que para comprar las mismas unidades a precios del 2006 se habrían gastado 1095,92. Esto significa que el gasto aumentó un 2,3% a causa de la subida de precios.
SOLUCIÓN (d):
El objetivo del Apartado d) es calcular en primer lugar el índice cuántico de Paasche del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).
Cálculos: de nuevo a partir de los índices simples y las ponderaciones (ver Tabla 10.4), se puede aplicar la primera fórmula.
ESTADÍSTICA GENERAL Página 38
Con la segunda fórmula:
Conclusión: el consumo subió un 6% del año 2006 al año 2007 teniendo en cuenta el valor que hubiesen tenido los distintos bienes de haberse mantenido el consumo de 2006. También se puede decir que el gasto en 2007 fue de 1121,35e, mientras que a precios de 2007 en 2006 habría sido de 1057,9e. Esto significa que en gasto aumentó un 6% a causa de la subida del consumo.
ESTADÍSTICA GENERAL Página 39
EJERCICIOS DISTRIBUCION NORMAL
1. Las calificaciones de los 500 aspirantes presentados a un examen para contratación laboral, se distribuye normalmente con media 6'5 y varianza 4.a. Calcule la probabilidad de que un aspirante obtenga más de 8 puntos.b. Determine la proporción de aspirantes con calificaciones inferiores a 5
puntos.c. ¿Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7'5
puntos?
SOLUCIÓN (a):
Nos encontramos ante una distribución normal N(6'5, 4)= N(6'5,2)
Tipificamos el valor 8:
La probabilidad pedida es el área a la derecha de z = 0'75.
Consultando las tablas obtenemos: 0'22663
SOLUCIÓN (b):
Tipificamos el valor 5:
Calculemos el área (probabilidad) a la izquierda de z = -0'75.
ESTADÍSTICA GENERAL Página 40
Consultando las tablas obtenemos: 0'22663
En términos de porcentajes será 0'22663 x 100 : el 22'663 %
SOLUCIÓN (c):
Tipificamos los valores 5 y 7'5:
El área comprendida entre ambos es, consultando las tablas:
Pr(5 < X < 7'5) = Pr(-0'75 < z < 0'5) = 0'46483
Multiplicando la probabilidad por el total de aspirantes, obtenemos el número de ellos que tienen calificaciones comprendidas entre 5 y 7'5 puntos:
0'46483 x 500 = 232'415 232 aspirantes≅
2. Sólo 24 de los 200 alumnos de un Centro miden menos de 150 cm. Si la estatura media de dichos alumnos es de 164 cm., ¿cuál es su varianza?
Siendo 24 / 200 = 0'12, sabemos que el 12% de los alumnos tienen estaturas inferiores a 150.
Consultando las tablas de la distribución normal tipificada, obtenemos el valor z que deja a su izquierda un área 0'12.
Dicho valor es: z = -1'175
(Para z = -1'17 encontramos 0'12100 y para z = -1'18 encontramos 0'11900).
ESTADÍSTICA GENERAL Página 41
3. El percentil 70 de una distribución normal es igual a 88, siendo 0'27 la probabilidad de que la variable tenga un valor inferior a 60. ¿A qué distribución normal nos estamos refiriendo?
Se nos pide determinar la media y desviación típica de una distribución normal que verifica las condiciones del enunciado.
Gráficamente:
Consultando las tablas obtenemos:
a) Valor de z que deja a su izquierda un área igual a 0'70:
z = 0'52 (valor más próximo 0'69847)
b) Valor de z que deja a su izquierda un área igual a 0'27
z = -0'61 (valor más próximo 0'27093)
Con esto:
Resolviendo el sistema determinaremos los valores de la media y la desviación típica:
ESTADÍSTICA GENERAL Página 42
Se trata de una distribución N(75'11 , 24'78).
4. Las puntuaciones de un examen se distribuyen normalmente con medida 15 puntos. La puntuación A ha sido superada por un 23% de los alumnos. La puntuación B está situada a 5 puntos diferenciales por debajo de la media. Entre B y la media se encuentra el 30% de los alumnos. Calcular:
a) La desviación típica de las notas.
b) Las puntuaciones directas de A y B.
c) El porcentaje de alumnos entre A y B.
SOLUCIÓN (a):
ESTADÍSTICA GENERAL Página 43
La puntuación B=10, deja a su izquierda un área 0’20. Consultando las tablas obtenemos un valor z = -0’84. De aquí:
SOLUCIÓN (b):
La puntuación A, deja a su izquierda un área 0’77 (1-0’23). Consultando las tablas obtenemos un valor z = 0’74. De aquí:
SOLUCIÓN (c):
Observando la figura resulta un área 0’57 (0’30+0’27); es decir, el 57%.
5. En un estudio realizado sobre los ingresos familiares en los que los dos cónyuges trabajan, se ha observado que el salario mensual, en miles de pesetas, de las mujeres (X) se distribuye normalmente con media 100, en tanto que el de los hombres (Y) tiene la siguiente transformación Y = X + 20. Sabiendo además que el 15% de los hombres no superan el percentil 75 de las mujeres, se pide :
a) Representar gráficamente el enunciado del problema.
b) El salario medio de los hombres.
c) La desviación típica del salario de los hombres y de las mujeres.
SOLUCIÓN (a):
ESTADÍSTICA GENERAL Página 44
Si la media de las mujeres es 100, la de los hombres queda definida por la relación Y = X+20, luego es 120.
Dicha transformación (al no multiplicar o dividir por ningún valor) no modifica las desviaciones típicas. En consecuencia, las desviaciones de la distribución de mujeres y hombres coinciden.
En la distribución correspondiente a las mujeres el valor que tipificado (Zm) deja a su izquierda un área 0'75 (75%) coincide con el de la de los hombres (Zh) que tipificado deja a su izquierda un área 0'15 (no supera el valor anterior).
Estas conclusiones se muestran a la derecha.
SOLUCIÓN (b):
Ya se justificó anteriormente que la media de la distribución de ingresos de los hombres es 120 (en miles de pesetas).
SOLUCIÓN (c):
Con la tabla de la distribución normal determinamos los valores Zm y Zh , y recordando que coinciden Xm y Xh
Luego las desviaciones típicas coinciden y valen 11'696 (miles de pesetas).
LINKCOGRAFÍA:
ESTADÍSTICA GENERAL Página 45
http://www.uca.es/uca/dpto/C146/pag_personal/f_alvarez/documentos/CC %20Trabajo%20Tema%205.pdf
http://www.ciens.ucv.ve:8080/generador/sites/QAII-pregrado/archivos/miller- estadistica%20y%20quimiometria%20para%20quimica%20analitica%202005.pdf
http://es.wikipedia.org/wiki/Quimiometr%C3%ADa
BIBLIOGRAFÍA:
Estadística Administrativa I (GAP-Oviedo) - A. Colubi, A. Lubiano, P. Terán Probabilidad y estadística para ingeniería. RAYMOND H. MYERS, WALPOLE Estadística química analítica. James N. Miller, Jane C. Miller
ESTADÍSTICA GENERAL Página 46