2I. Estadística y errores (1).ppt
-
Upload
fernandovt -
Category
Documents
-
view
44 -
download
6
Transcript of 2I. Estadística y errores (1).ppt
Richards y Willard determinaron la masa atómica del Li (1910), obteniendo los siguientes resultados:
6.9391, 6.9407, 6.9409, 6.9399, 6.9407, 6.9391, 6.9406
x = (6.9391 + 6.9407 + 6.9409 + 6.9399 + 6.9407 + 6.9406 + 6.9391) / 7
x = 6.9401
Mediana = 6.9391, 6.9391, 6.9399, 6.9406, 6.9407, 6.9407, 6.9409
MEDIA Y MEDIANA
ERROR ABSOLUTO Y ERROR RELATIVO Determinación de hierro (Fe) en muestras obtenidas de una disolución que se sabe tiene una concentración de 20 ppm:
19.4, 20.1, 19.5, 19.8, 20.3, 19.6
Error absoluto:E = xi – xv
E = 19.8 – 20.0 -0.2E = 20.3 – 20.0 = +0.3
Error relativoEr = [(xi – xv) / xv] * 100
Er = [(19.8 – 20.0) / 20.0] * 100 = -1.0% Er = [(20.3 – 20.0) / 20.0 * 100 = +1.5%
Tabla 1. Errores en el análisis químico. Titulación de una muestra de NaOH 0.1 M (volumen de la muestra: 10 mL)
Analista Resultados (mL del titulante HCl 0.1 M) Conclusión
A 10.08, 10.11, 10.09, 10.10, 10.12 Preciso, sesgo
B 9.88, 10.14, 10.02, 9.80, 10.21 Impreciso, sin sesgo
C 10.19, 9.79, 9.69, 10.05, 9.78 Impreciso, sesgo
D 10.04, 9.98, 10.02, 9.97, 10.04 Preciso, sin sesgo
A
B
C
D
9.7 10.0 10.3
10.1 mL
10.01 mL
9.9 mL
10.01 mL
Errores sistemáticos(SESGO)
Errores aleatorios
Repetibilidad Reproducibilidad
Norma E691, ASTM
Ocasional
En general relaciona la práctica del analista
Genera valores atípicos (Test Q)
Prueba de Q para identificar valores atípicos (error bruto)
Q = wa
a
w
Rechazar el valor sospechoso si:
Qcalc > Qcrít
Prueba de Q para identificar valores atípicos (error bruto)
Ejemplo 1: Determine si el valor discordante de 56.23% de CaO puede atribuirse a un error accidental con un NC = 90 y 95%. Tome en cuenta que el resultado procede del análisis de una muestra de calcita en el que se obtuvieron los siguientes porcentajes de CaO:
55.95, 56.00, 56.04, 56.08, 56.23% CaO
Qcalc =56.23 – 56.0856.23 – 55.95
= 0.54
Qcrít = 0.642NC 90% (n = 5)
Qcrít = 0.710NC 95% (n = 5)
Qcalc < Qcrít, por tanto el valor no se rechaza, puede atribuirse la variación a un error aleatorio
Errores sistemáticos = determinados
Valor definido, se conoce la causa
Sesgo tiene dirección (+ o - , E ̴ )
Fuentes: instrumento, analista, método
Error ácido
Error alcalino
Difícil detección
Error constante: error absoluto invariable VS Er variable según tamaño muestra.
En la determinación de Au por el método X se obtienen resultados 0.4 mg por debajo de la cantidad real (e. constante), compare el Er conforme se modifica la masa total de la muestra:
1)700 mg (-0.4 / 700) * 100 = -0.06%
2) 250 mg (-0.4 / 250) * 100 = -0.16%
Error proporcional: error absoluto variable VS Er invariable según tamaño muestra.
En la determinación de Cu(II) se hace reaccionar el analito con KI, obteniendo I2. Fe = interferencia; determinar la fracción de contaminación (independiente de tamaño muestra).
M Fe M Fe
Disminuc. 30% tamaño muestra
Calibración de equipos
Análisis de materiales de referencia certificados (MRC)
Determinaciones en disoluciones blanco de reactivos
Análisis independientes
Eliminación de interferencias
Método del estándar interno
Errores aleatorios = indeterminados
Incertidumbre
Difícil identificación = dificulta corrección
Magnitud pequeña, sumatoria e. aleatorios = detección
Medida de la precisión
x, s
Distribución de errores aleatorios
Distribución Normal (campana de Gauss)
e-(x-) /2
(2)1/2y =
2
Análisis de la Campana de Gauss
1)Ecuación:
= media poblacional
= desviación estándar poblacional
= (xi – )2∑
i = 1
N
N2 = varianza
2
2) Área bajo la curva
2
e-(x-) /2
(2)1/2∫Área =
Sí:1) = 1, área = 0.683 = 68.3%2) = 2, área = 0.954 = 95.4%3) = 3, área = 0.997 = 99.7%4) Los límites son de -∞ a ∞, área = 1 = 100%
2
Análisis de un caso:(Tomado de Skoog y cols, 8va edic.)
Experimento: calibración de una pipeta de 10 mL (50 repeticiones).
Tabla 3. Distribución de frecuencias
Intervalo de volumen (mL) Frecuencia % de frecuencia
9.969 – 9-971 3 6
9.972 – 9.974 1 2
9.975 – 9.977 7 14
9.978 – 9.980 9 18
9.981 – 9.983 13 26
9.984 – 9.986 7 14
9.987 – 9.989 5 10
9.990 – 9.992 4 8
9.993 – 9.995 1 2
Gráfica 3. Histograma de frecuencia, calibración pipeta de 10 mL
Distribución de Gauss
Análisis poblacional a partir de una muestra
v
v
x, s, s2 2
Desviación estándar de la muestra (s):
(xi – x)2∑i = 1
n
n - 1s =
∑ xi2 -
n
i = 1
∑n
i = 1 ( xi)2
n
n - 1
s =
Ejemplo 3: calcular la media y la desviación estándar de 5 réplicas obtenidas en la valoración de una disolución de NaOH con HCl 0.1 M.
Tabla 4. Volumen de titulante (mL) HCl 0.1 MMuestra analítica xi, mL HCl (xi
– x) (xi – x)2
1 10.08 -0.02 0.00042 10.11 0.01 0.00013 10.09 -0.01 0.00014 10.10 0.00 0.00005 10.12 0.02 0.0004
∑ = 0.0010
s = (0.0010) 5 - 1 = 0.0158 mL
x = 10.1 mL
s = 0.02 mL
Varianza (s2) y Coeficiente de variación (CV)
(xi – x)2∑i = 1
n
n - 1s2 =
sr = DER = (s / x)
CV = (sr)*100
CV < 7% preciso 8 < CV < 14% precisión aceptable15 < CV < 20% precisión regular = ¡Precaución!CV > 20% estimación poco precisa
DANE, Dirección de Censos y Demografía. Colombia, 2008
CV < 5% datos homogéneos, x muy representativa 5 < CV < 20% homogeneidad aceptable, x representativa CV > 20% datos heterogéneos, x no representativa
Olga Filipini
CV: Trompeta de HorwitzHorwitz y cols, (AOAC 1980)
Tomado de Rivera Orozco y Rodríguez Báez, 2010
CV: Trompeta de Horwitz
Tabla 5. CV de HorwitzConcentración analito %CV
10% 2.81.0% 4.0
0.10% 5.60.01% 8.01 ppm 16.01 ppb 45.0
%CV 2(1-0.5 logC) ̴ ̴
Tomado de Rivera Orozco y Rodríguez Báez, 2010
Intervalo de confianza (muestras pequeñas)
IC de =N
t x + s
VARIABLE z
Ejemplo 4: Se determinó el contenido de Na+ de una muestra de orina utilizando un electrodo selectivo de iones, los resultados se presentan en la tabla 6. ¿Cuáles son los límites de confianza para la [Na+], considerando un NC de 95 y 99% ?
Tabla 6. Concentración de Na+ en la muestra de orinaRéplica [Na+] mM (xi – x)2
1 102 2.252 97 12.253 99 2.254 98 6.255 101 0.256 106 30.25
x = 100.5 s = 3.27 mM
IC95% = 100.5 + [(2.57*3.27)/ 6] = 100.5 + 3.4 mM [Na+]
IC99% = 100.5 + [(4.03*3.27)/ 6] = 100.5 + 5.4 mM [Na+]
Ejemplo 5: En la tabla no. 7 se reporta la cantidad de hidratos de carbono (HC) por cada 100 g de glicoproteína (gp) analizada. Con esos valores determinar el IC con un 50 y 90% de NC
Tabla 7. Contenido de hidratos de carbonoRéplica g HC / 100 g gp
1 12.62 11.93 13.04 12.75 12.5
IC50% = 12.5 + [(0.741*0.4)/ 5] = 12.5 + 0.13 g HC / 100 g gp
x = 12.5 g HC / 100 g gps = 0.4 g HC / 100 g gp
IC90% = 12.5 + [(2.132*0.4)/ 5] = 12.5 + 0.38 g HC / 100 g gp
Intervalo de confianza (estimadores de incertidumbre)
Experimento 3: se mide en 5 ocasiones el volumen de un recipiente P, y se obtienen los siguientes valores en mL: 6.375, 6.372, 6.374, 6.377 y 6.375. Determine la incertidumbre en la medición con un nivel de confianza del 90%
x = 6.375 mL s = 0.002 mL
NIncertidumbre =
ts+
Incertidumbre90% = + (2.132*0.002)/ 5 = + 0.002 mL
¿Qué ocurre con IC si N aumenta?
Incertidumbre90% = + (1.725*0.002)/ 21 = + 0.0007 mLTabla 8. Tamaño de IC en función de N
N Tamaño relativo del IC1 1.002 0.713 0.584 0.505 0.456 0.41
10 0.32Skoog y cols, 8va edic.
Experimento 4: con los datos reportados en la tabla 9, demuestre que el aire está compuesto al menos por otro gas más pesado que el N2 (experimento de Rayleigh). Considere un NC = 95 y 99%
Pruebas de hipótesis
Tabla 9. Masas de gas (en g) aisladas por Lord RayleighRéplica A partir de aire Descomposición química
1 2.31017 2.301432 2.30986 2.298903 2.31010 2.298164 2.31001 2.301825 2.31024 2.298696 2.31010 2.299407 2.31028 2.298498 ------ 2.29889
Comparación entre medias:
Ho: = 0
Ha: ≠ 0, rechace Ho si t > tcrít o si t < -tcrít (prueba de dos colas)
Ha: > 0, rechace Ho si t > tcrít
Ha: < 0, rechace Ho si t < -tcrít
(prueba de una cola)
xaire = 2.31011 g gassaire = 0.00014 g gas
xdq = 2.29947 g gassdq = 0.00138 g gas
tcalc =x1 x2 -
scombinada
scombinada =
n1 + n2
n1n2
(s1)2(n1 - 1) + (s2)2(n2 - 1)n1 + n2 – 2
1/2
Si ambas muestras proceden de poblaciones con iguales:
Con: n1 + n2 – 2 grados de libertad para t
tcalc =x1 x2-
(s1)2 (s2)2 1/2
n1 n2
[(s1)2/n1)]2 [(s2)2/n2)]2
n1 + 1 n2 + 1+ - 2Grados de libertad =
Si ambas muestras proceden de poblaciones con diferentes:
(s1)4 (s2)4
(n1)2(n1 - 1) (n2)2(n2 - 1) +
Grados de libertad =
[(s1)2/n1] + [ (s2)2/n2]
James & Jane Miller
Daniel Harris
+
2
[(s1)2/n1] + [ (s2)2/n2] 2
Comprobar si las desviaciones estándar son iguales = prueba F (contraste de precisión)
F =(Sa)2
(Sb)2
F > 1; por tanto
(Sa)2 (Sb)2>
Comparación entre varianzas:
Ho:
Ha:
Rechace Ho si F > Fcrít o si F < -Fcrít (prueba de dos colas)
Ha: Sa > Sb, rechace Ho si F > Fcrít
Ha: Sa < Sb, rechace Ho si F < -Fcrít
(Sa)2 (Sb)2=
(Sa)2 ≠ (Sb)2
(prueba de una cola)
xaire = 2.31011 g gasSaire = 0.00014 g gasnaire = 7
xdq = 2.29947 g gassdq = 0.00138 g gasndq = 8
F =(0.00138)2
(0.00014)2 = 97.163
Ho: = 0 Ha: ≠ 0
Fcrít = 5.695 (para 7 grados de libertad numerador, y 6 grados de libertad denominador; contraste de dos colas)
Fcalc > Fcrít rechaza Ho acepta Ha
Grados de libertad: n - 1
tcalc =x1 x2-
[(s1)2/n1 + (s2)2/n2]1/2
Si ambas muestras proceden de poblaciones con diferentes:
(s1)4 (s2)4
(n1)2(n1 - 1) (n2)2(n2 - 1) +
Grados de libertad =
[(s1)2/n1 + (s2)2/n2]2
=[(0.00014)2/7 + (0.00138)2/8]1/2
2.31011 – 2.29947
tcalc = 21.7
=
(0.00014)4 (0.00138)4
(7)2(7 - 1) (8)2(8 - 1) +
[(0.00014)2/7 + (0.00138)2/8]2
= 7.22 ̴ 7
tcrít = 2.365 (para NC 95%)tcrít = 3.500 (para NC 99%)
Conclusión: se rechaza Ho y se acepta Ha
Con un 5 y 1% (, nivel de significancia) de cometer el error tipo I
tcalc = 21.7 y 7 grados de libertad
Ejemplo 6: Se ha sometido a evaluación un nuevo método para determinación del %S en muestras de queroseno. Del análisis de cuatro muestras se obtuvo un valor de x = 0.116 %S y una desviación estándar s = 0.0032 %S. De análisis previos se sabe que el contenido de azufre en las muestras sometidas a análisis es de 0.123 %S (= 0). Considerando un NC = 95% y 99%, y que no existe diferencia significativa entre las varianzas de la muestra y la población, determine si el método en estudio presenta sesgo (errores sistemáticos).
Análisis de errores tipo I y tipo II
La variable estadística de prueba se calcula como:
tcalc =x 0-
s / N =0.116 – 0.123
(0.0032)/ 4 = - 4.375
Comparación entre media muestral y valor verdadero: Ho: x= 0 Ha: x ≠ 0
tcrít = -3.18 (NC 95%) y -5.84 (NC 99%)
Con 95% NC se rechaza Ho = método presenta sesgo Error tipo I = = falso negativo = rechazo Ho aunque es verdadera Con 99% NC se acepta Ho = método NO presenta sesgo Error tipo II = = falso positivo = acepto Ho aunque es falsa
El contraste de t para datos emparejados
Ejemplo 7: Determine si existe diferencia significativa en el empleo de manitol o glicerol como agentes titulantes en la determinación de ácido bórico. Considere un NC del 95%
Ho: meqH3BO4 glicerol = meqH3BO4
manitol
tcalc = D nsD *
Tabla 10. meq de ácido bóricoRéplica Glicerol
(G)Manitol
(M)xM – xG
(Di)**(Di –D)2
1 5.70 5.82 0.12 0.00502 5.01 5.01 0.00 0.00243 5.73 5.67 -0.06 0.01194 4.90 4.93 0.03 0.00045 5.32 5.73 0.38 0.10966 4.97 5.06 0.09 0.00177 5.25 5.21 -0.04 0.00798 5.03 5.03 0.00 0.00249 5.05 5.12 0.07 0.0004
10 5.05 4.95 -0.10 0.0222 ∑ = 0.49 0.1639
**REVISAR NOTA AL PIE
Di nD =
∑i = 1
n
= 0.049
sD = (Di – D)2
n - 1
∑i = 1
n
= 0.1349
tcalc = D nsD * = 1.1483 ̴ 1.15
Recordando:Ho: meqH3BO4
glicerol = meqH3BO4 manitol
Ho: XG = XM Ha: XG ≠ XM
tcrít = 9 grados de libertad, NC = 95% tcrít = 2.26
Como: tcalc < tcrít se acepta Ho
Prueba de t datos pareados. Influencia de la diferencia absoluta en la aceptación de la hipótesis nula
¿Existirá disimilitud en la toma de decisiones al considerar el valor absoluto de la diferencia Xprueba – Xreferencia con respecto al valor de la misma diferencia PERO con signo?
Tabla 10´. meq de ácido bórico (VALOR ABSOLUTO)Réplica Glicerol
(G)Manitol
(M)xM – xG
(Di)(Di –D)2
1 5.70 5.82 0.12 0.00102 5.01 5.01 0 0.00793 5.73 5.67 0.06 0.00084 4.90 4.93 0.03 0.00355 5.35 5.73 0.38 0.08476 4.97 5.06 0.09 0.00007 5.25 5.21 0.04 0.00248 5.03 5.03 0 0.00799 5.05 5.12 0.07 0.0004
10 5.05 4.95 0.1 0.0001 ∑ = 0.89 0.1087
Di nD =
∑i = 1
n
= 0.089
sD = (Di – D)2
n - 1
∑i = 1
n
= 0.1099
tcalc = D nsD * = 2.5610 ̴ 2.56
Recordando:Ho: meqH3BO4
glicerol = meqH3BO4 manitol
Ho: XG = XM Ha: XG ≠ XM
tcrít = 9 grados de libertad, NC = 95% tcrít = 2.26
Como: tcalc > tcrít se rechaza Ho
Prueba de t datos pareados. Utilidad de la prueba de datos pareados.
Demostrar que efectivamente la prueba de datos pareados es capaz de discriminar las diferencias intra-muestrales y someter únicamente a juicio las diferencias entre los métodos.
Ejemplo 8: Considerando un NC del 95% y los datos reportados en la Tabla 11, determine si existe diferencia estadísticamente significativa entre el ensayo espectrofotométrico en la región UV (A) con respecto al método empleando la región del IR (B), ambos, utilizados para la determinar la concentración de paracetamol en tabletas farmacéuticas.
Compare su conclusión derivada de la prueba estadística para datos pareados con respecto a la prueba de diferencia entre medias aritméticas.
Tabla 11. Concentración de paracetamolTableta UV IR xUV – xIR
(Di)(Di –D)2
101 84.38 83.72 1.48 1.2166102 84.08 83.84 0.66 0.0801103 84.41 84.2 0.24 0.0188104 83.82 83.92 0.21 0.0279105 83.55 84.16 0.1 0.0767106 83.92 84.02 0.61 0.0543107 83.69 83.6 0.1 0.0767108 84.06 84.13 0.09 0.0824109 84.03 84.24 0.07 0.0942110 84.38 83.72 0.21 0.0279
∑ = 3.77 1.7556
Di nD =
∑i = 1
n
= 0.377
sD = (Di – D)2
n - 1
∑i = 1
n
= 0.4417
tcalc = D nsD * = 2.6993 ̴ 2.70
Análisis prueba datos pareados:
Recordando:
Ho: XUV = XIR Ha: XUV XIR
tcrít = 9 grados de libertad, NC = 95% tcrít = 2.26
Como: tcalc > tcrít se rechaza Ho
Análisis diferencia de medias:
tcalc =xUV – xIR
sD / n = (0.4417)/ 10
= 1.1384
tcrít = 2.26, n – 1 grados de libertad y NC = 95%
84.057 – 83.898
Como: tcalc < tcrít se acepta Ho
CONCLUSIÓN: al comparar las medias aritméticas de cada conjunto de datos, los efectos por diferencia entre métodos se confunden con las diferencias debidas a las tabletas de la misma serie
El contraste de F para evaluar mejoras en la precisión
Ejemplo 9: Establecer si el método propuesto “X” para la determinación de la DQO resulta significativamente más preciso que el método estándar “R”. Considere un NC del 95% y tome en cuenta que en ambos métodos n = 8.
F = (3.31)2
(1.51)2 = 4.805
El contraste de F para evaluar mejoras en la precisión
F =(Sa)2
(Sb)2
F > 1; por tanto
Ho: (sX)2 = (sR)2 Ha: (sX)2 < (sR)2
Tabla 12. DQO (mg*L-1)Método x s
R 72 3.31X 72 1.51
(Sa)2 (Sb)2>
Fcrít = 3.787 (NC = 95%)(para 7 grados de libertad tanto en el numerador como en el denominador; contraste de una cola)
Conclusión:
Como Fcrít < Fcalc, se rechaza Ho*, por tanto el método propuesto ofrece resultados más precisos.
*El rechazo de Ho implica un valor de = 5% (error tipo I)
El contraste de F para evaluar mejoras en la precisión
Ejemplo 10: se ha desarrollado un nuevo método para la determinación de colesterol en suero, en el cual se mide la rapidez de agotamiento de oxígeno, consecuencia de la oxidación del colesterol catalizada por la enzima colesterol oxidasa. Los resultados de 10 réplicas se comparan con los obtenidos por el método estándar colorimétrico de Liberman.
Coeficiente de correlación r para comparar dos métodos
Tabla 12. Concentración de colesterol (mg/dL)Réplica Método
colorimétricoMétodo
enzimático1 300 3052 392 3853 185 1934 152 1625 480 4786 461 4557 232 2388 290 2989 401 408
10 315 323
Gráfica 5. Coeficiente de correlación r para comparar dos métodos
r = 0.9993
0.90 < r < 0.95 = aceptable0.95 < r < 0.99 = buena
r > 0.99 = excelente