2I. Estadística y errores (1).ppt

Richards y Willard determinaron la masa atómica del Li (1910), obteniendo los siguientes resultados:

6.9391, 6.9407, 6.9409, 6.9399, 6.9407, 6.9391, 6.9406

x = (6.9391 + 6.9407 + 6.9409 + 6.9399 + 6.9407 + 6.9406 + 6.9391) / 7

x = 6.9401

Mediana = 6.9391, 6.9391, 6.9399, 6.9406, 6.9407, 6.9407, 6.9409

MEDIA Y MEDIANA

ERROR ABSOLUTO Y ERROR RELATIVO Determinación de hierro (Fe) en muestras obtenidas de una disolución que se sabe tiene una concentración de 20 ppm:

19.4, 20.1, 19.5, 19.8, 20.3, 19.6

Error absoluto:E = xi – xv

E = 19.8 – 20.0 -0.2E = 20.3 – 20.0 = +0.3

Error relativoEr = [(xi – xv) / xv] * 100

Er = [(19.8 – 20.0) / 20.0] * 100 = -1.0% Er = [(20.3 – 20.0) / 20.0 * 100 = +1.5%

Tabla 1. Errores en el análisis químico. Titulación de una muestra de NaOH 0.1 M (volumen de la muestra: 10 mL)

Analista Resultados (mL del titulante HCl 0.1 M) Conclusión

A 10.08, 10.11, 10.09, 10.10, 10.12 Preciso, sesgo

B 9.88, 10.14, 10.02, 9.80, 10.21 Impreciso, sin sesgo

C 10.19, 9.79, 9.69, 10.05, 9.78 Impreciso, sesgo

D 10.04, 9.98, 10.02, 9.97, 10.04 Preciso, sin sesgo

A

B

C

D

9.7 10.0 10.3

10.1 mL

10.01 mL

9.9 mL

10.01 mL

Errores sistemáticos(SESGO)

Errores aleatorios

Repetibilidad Reproducibilidad

Norma E691, ASTM

Ocasional

En general relaciona la práctica del analista

Genera valores atípicos (Test Q)

Prueba de Q para identificar valores atípicos (error bruto)

Q = wa

a

w

Rechazar el valor sospechoso si:

Qcalc > Qcrít

Prueba de Q para identificar valores atípicos (error bruto)

Ejemplo 1: Determine si el valor discordante de 56.23% de CaO puede atribuirse a un error accidental con un NC = 90 y 95%. Tome en cuenta que el resultado procede del análisis de una muestra de calcita en el que se obtuvieron los siguientes porcentajes de CaO:

55.95, 56.00, 56.04, 56.08, 56.23% CaO

Qcalc =56.23 – 56.0856.23 – 55.95

= 0.54

Qcrít = 0.642NC 90% (n = 5)

Qcrít = 0.710NC 95% (n = 5)

Qcalc < Qcrít, por tanto el valor no se rechaza, puede atribuirse la variación a un error aleatorio

Errores sistemáticos = determinados

Valor definido, se conoce la causa

Sesgo tiene dirección (+ o - , E ̴ )

Fuentes: instrumento, analista, método

Error ácido

Error alcalino

Difícil detección

Error constante: error absoluto invariable VS Er variable según tamaño muestra.

En la determinación de Au por el método X se obtienen resultados 0.4 mg por debajo de la cantidad real (e. constante), compare el Er conforme se modifica la masa total de la muestra:

1)700 mg (-0.4 / 700) * 100 = -0.06%

2) 250 mg (-0.4 / 250) * 100 = -0.16%

Error proporcional: error absoluto variable VS Er invariable según tamaño muestra.

En la determinación de Cu(II) se hace reaccionar el analito con KI, obteniendo I2. Fe = interferencia; determinar la fracción de contaminación (independiente de tamaño muestra).

M Fe M Fe

Disminuc. 30% tamaño muestra

Calibración de equipos

Análisis de materiales de referencia certificados (MRC)

Determinaciones en disoluciones blanco de reactivos

Análisis independientes

Eliminación de interferencias

Método del estándar interno

Errores aleatorios = indeterminados

Incertidumbre

Difícil identificación = dificulta corrección

Magnitud pequeña, sumatoria e. aleatorios = detección

Medida de la precisión

Distribución de errores aleatorios

Distribución Normal (campana de Gauss)

e-(x-) /2

(2)1/2y =

2

Análisis de la Campana de Gauss

1)Ecuación:

= media poblacional

= desviación estándar poblacional

= (xi – )2∑

i = 1

N

N2 = varianza

2

2) Área bajo la curva

2

e-(x-) /2

(2)1/2∫Área =

Sí:1) = 1, área = 0.683 = 68.3%2) = 2, área = 0.954 = 95.4%3) = 3, área = 0.997 = 99.7%4) Los límites son de -∞ a ∞, área = 1 = 100%

2

Análisis de un caso:(Tomado de Skoog y cols, 8va edic.)

Experimento: calibración de una pipeta de 10 mL (50 repeticiones).

Tabla 3. Distribución de frecuencias

Intervalo de volumen (mL) Frecuencia % de frecuencia

9.969 – 9-971 3 6

9.972 – 9.974 1 2

9.975 – 9.977 7 14

9.978 – 9.980 9 18

9.981 – 9.983 13 26

9.984 – 9.986 7 14

9.987 – 9.989 5 10

9.990 – 9.992 4 8

9.993 – 9.995 1 2

Gráfica 3. Histograma de frecuencia, calibración pipeta de 10 mL

Distribución de Gauss

Análisis poblacional a partir de una muestra

v

v

x, s, s2 2

Desviación estándar de la muestra (s):

(xi – x)2∑i = 1

n

n - 1s =

∑ xi2 -

n

i = 1

∑n

i = 1 ( xi)2

n

n - 1

s =

Ejemplo 3: calcular la media y la desviación estándar de 5 réplicas obtenidas en la valoración de una disolución de NaOH con HCl 0.1 M.

Tabla 4. Volumen de titulante (mL) HCl 0.1 MMuestra analítica xi, mL HCl (xi

– x) (xi – x)2

1 10.08 -0.02 0.00042 10.11 0.01 0.00013 10.09 -0.01 0.00014 10.10 0.00 0.00005 10.12 0.02 0.0004

∑ = 0.0010

s = (0.0010) 5 - 1 = 0.0158 mL

x = 10.1 mL

s = 0.02 mL

Varianza (s2) y Coeficiente de variación (CV)

(xi – x)2∑i = 1

n

n - 1s2 =

sr = DER = (s / x)

CV = (sr)*100

CV < 7% preciso 8 < CV < 14% precisión aceptable15 < CV < 20% precisión regular = ¡Precaución!CV > 20% estimación poco precisa

DANE, Dirección de Censos y Demografía. Colombia, 2008

CV < 5% datos homogéneos, x muy representativa 5 < CV < 20% homogeneidad aceptable, x representativa CV > 20% datos heterogéneos, x no representativa

Olga Filipini

CV: Trompeta de HorwitzHorwitz y cols, (AOAC 1980)

Tomado de Rivera Orozco y Rodríguez Báez, 2010

CV: Trompeta de Horwitz

Tabla 5. CV de HorwitzConcentración analito %CV

10% 2.81.0% 4.0

0.10% 5.60.01% 8.01 ppm 16.01 ppb 45.0

%CV 2(1-0.5 logC) ̴ ̴

Tomado de Rivera Orozco y Rodríguez Báez, 2010

Intervalo de confianza (muestras pequeñas)

IC de =N

t x + s

VARIABLE z

Ejemplo 4: Se determinó el contenido de Na+ de una muestra de orina utilizando un electrodo selectivo de iones, los resultados se presentan en la tabla 6. ¿Cuáles son los límites de confianza para la [Na+], considerando un NC de 95 y 99% ?

Tabla 6. Concentración de Na+ en la muestra de orinaRéplica [Na+] mM (xi – x)2

1 102 2.252 97 12.253 99 2.254 98 6.255 101 0.256 106 30.25

x = 100.5 s = 3.27 mM

IC95% = 100.5 + [(2.57*3.27)/ 6] = 100.5 + 3.4 mM [Na+]

IC99% = 100.5 + [(4.03*3.27)/ 6] = 100.5 + 5.4 mM [Na+]

Ejemplo 5: En la tabla no. 7 se reporta la cantidad de hidratos de carbono (HC) por cada 100 g de glicoproteína (gp) analizada. Con esos valores determinar el IC con un 50 y 90% de NC

Tabla 7. Contenido de hidratos de carbonoRéplica g HC / 100 g gp

1 12.62 11.93 13.04 12.75 12.5

IC50% = 12.5 + [(0.741*0.4)/ 5] = 12.5 + 0.13 g HC / 100 g gp

x = 12.5 g HC / 100 g gps = 0.4 g HC / 100 g gp

IC90% = 12.5 + [(2.132*0.4)/ 5] = 12.5 + 0.38 g HC / 100 g gp

Intervalo de confianza (estimadores de incertidumbre)

Experimento 3: se mide en 5 ocasiones el volumen de un recipiente P, y se obtienen los siguientes valores en mL: 6.375, 6.372, 6.374, 6.377 y 6.375. Determine la incertidumbre en la medición con un nivel de confianza del 90%

x = 6.375 mL s = 0.002 mL

NIncertidumbre =

ts+

Incertidumbre90% = + (2.132*0.002)/ 5 = + 0.002 mL

¿Qué ocurre con IC si N aumenta?

Incertidumbre90% = + (1.725*0.002)/ 21 = + 0.0007 mLTabla 8. Tamaño de IC en función de N

N Tamaño relativo del IC1 1.002 0.713 0.584 0.505 0.456 0.41

10 0.32Skoog y cols, 8va edic.

Experimento 4: con los datos reportados en la tabla 9, demuestre que el aire está compuesto al menos por otro gas más pesado que el N2 (experimento de Rayleigh). Considere un NC = 95 y 99%

Pruebas de hipótesis

Tabla 9. Masas de gas (en g) aisladas por Lord RayleighRéplica A partir de aire Descomposición química

1 2.31017 2.301432 2.30986 2.298903 2.31010 2.298164 2.31001 2.301825 2.31024 2.298696 2.31010 2.299407 2.31028 2.298498 ------ 2.29889

Comparación entre medias:

Ho: = 0

Ha: ≠ 0, rechace Ho si t > tcrít o si t < -tcrít (prueba de dos colas)

Ha: > 0, rechace Ho si t > tcrít

Ha: < 0, rechace Ho si t < -tcrít

(prueba de una cola)

xaire = 2.31011 g gassaire = 0.00014 g gas

xdq = 2.29947 g gassdq = 0.00138 g gas

tcalc =x1 x2 -

scombinada

scombinada =

n1 + n2

n1n2

(s1)2(n1 - 1) + (s2)2(n2 - 1)n1 + n2 – 2

1/2

Si ambas muestras proceden de poblaciones con iguales:

Con: n1 + n2 – 2 grados de libertad para t

tcalc =x1 x2-

(s1)2 (s2)2 1/2

n1 n2

[(s1)2/n1)]2 [(s2)2/n2)]2

n1 + 1 n2 + 1+ - 2Grados de libertad =

Si ambas muestras proceden de poblaciones con diferentes:

(s1)4 (s2)4

(n1)2(n1 - 1) (n2)2(n2 - 1) +

Grados de libertad =

[(s1)2/n1] + [ (s2)2/n2]

James & Jane Miller

Daniel Harris

+

2

[(s1)2/n1] + [ (s2)2/n2] 2

Comprobar si las desviaciones estándar son iguales = prueba F (contraste de precisión)

F =(Sa)2

(Sb)2

F > 1; por tanto

(Sa)2 (Sb)2>

Comparación entre varianzas:

Ho:

Ha:

Rechace Ho si F > Fcrít o si F < -Fcrít (prueba de dos colas)

Ha: Sa > Sb, rechace Ho si F > Fcrít

Ha: Sa < Sb, rechace Ho si F < -Fcrít

(Sa)2 (Sb)2=

(Sa)2 ≠ (Sb)2

(prueba de una cola)

xaire = 2.31011 g gasSaire = 0.00014 g gasnaire = 7

xdq = 2.29947 g gassdq = 0.00138 g gasndq = 8

F =(0.00138)2

(0.00014)2 = 97.163

Ho: = 0 Ha: ≠ 0

Fcrít = 5.695 (para 7 grados de libertad numerador, y 6 grados de libertad denominador; contraste de dos colas)

Fcalc > Fcrít rechaza Ho acepta Ha

Grados de libertad: n - 1

tcalc =x1 x2-

[(s1)2/n1 + (s2)2/n2]1/2

Si ambas muestras proceden de poblaciones con diferentes:

(s1)4 (s2)4

(n1)2(n1 - 1) (n2)2(n2 - 1) +

Grados de libertad =

[(s1)2/n1 + (s2)2/n2]2

=[(0.00014)2/7 + (0.00138)2/8]1/2

2.31011 – 2.29947

tcalc = 21.7

=

(0.00014)4 (0.00138)4

(7)2(7 - 1) (8)2(8 - 1) +

[(0.00014)2/7 + (0.00138)2/8]2

= 7.22 ̴ 7

tcrít = 2.365 (para NC 95%)tcrít = 3.500 (para NC 99%)

Conclusión: se rechaza Ho y se acepta Ha

Con un 5 y 1% (, nivel de significancia) de cometer el error tipo I

tcalc = 21.7 y 7 grados de libertad

Ejemplo 6: Se ha sometido a evaluación un nuevo método para determinación del %S en muestras de queroseno. Del análisis de cuatro muestras se obtuvo un valor de x = 0.116 %S y una desviación estándar s = 0.0032 %S. De análisis previos se sabe que el contenido de azufre en las muestras sometidas a análisis es de 0.123 %S (= 0). Considerando un NC = 95% y 99%, y que no existe diferencia significativa entre las varianzas de la muestra y la población, determine si el método en estudio presenta sesgo (errores sistemáticos).

Análisis de errores tipo I y tipo II

La variable estadística de prueba se calcula como:

tcalc =x 0-

s / N =0.116 – 0.123

(0.0032)/ 4 = - 4.375

Comparación entre media muestral y valor verdadero: Ho: x= 0 Ha: x ≠ 0

tcrít = -3.18 (NC 95%) y -5.84 (NC 99%)

Con 95% NC se rechaza Ho = método presenta sesgo Error tipo I = = falso negativo = rechazo Ho aunque es verdadera Con 99% NC se acepta Ho = método NO presenta sesgo Error tipo II = = falso positivo = acepto Ho aunque es falsa

El contraste de t para datos emparejados

Ejemplo 7: Determine si existe diferencia significativa en el empleo de manitol o glicerol como agentes titulantes en la determinación de ácido bórico. Considere un NC del 95%

Ho: meqH3BO4 glicerol = meqH3BO4

manitol

tcalc = D nsD *

Tabla 10. meq de ácido bóricoRéplica Glicerol

(G)Manitol

(M)xM – xG

(Di)**(Di –D)2

1 5.70 5.82 0.12 0.00502 5.01 5.01 0.00 0.00243 5.73 5.67 -0.06 0.01194 4.90 4.93 0.03 0.00045 5.32 5.73 0.38 0.10966 4.97 5.06 0.09 0.00177 5.25 5.21 -0.04 0.00798 5.03 5.03 0.00 0.00249 5.05 5.12 0.07 0.0004

10 5.05 4.95 -0.10 0.0222 ∑ = 0.49 0.1639

**REVISAR NOTA AL PIE

Di nD =

∑i = 1

n

= 0.049

sD = (Di – D)2

n - 1

∑i = 1

n

= 0.1349

tcalc = D nsD * = 1.1483 ̴ 1.15

Recordando:Ho: meqH3BO4

glicerol = meqH3BO4 manitol

Ho: XG = XM Ha: XG ≠ XM

tcrít = 9 grados de libertad, NC = 95% tcrít = 2.26

Como: tcalc < tcrít se acepta Ho

Prueba de t datos pareados. Influencia de la diferencia absoluta en la aceptación de la hipótesis nula

¿Existirá disimilitud en la toma de decisiones al considerar el valor absoluto de la diferencia Xprueba – Xreferencia con respecto al valor de la misma diferencia PERO con signo?

Tabla 10´. meq de ácido bórico (VALOR ABSOLUTO)Réplica Glicerol

(G)Manitol

(M)xM – xG

(Di)(Di –D)2

1 5.70 5.82 0.12 0.00102 5.01 5.01 0 0.00793 5.73 5.67 0.06 0.00084 4.90 4.93 0.03 0.00355 5.35 5.73 0.38 0.08476 4.97 5.06 0.09 0.00007 5.25 5.21 0.04 0.00248 5.03 5.03 0 0.00799 5.05 5.12 0.07 0.0004

10 5.05 4.95 0.1 0.0001 ∑ = 0.89 0.1087

Di nD =

∑i = 1

n

= 0.089

sD = (Di – D)2

n - 1

∑i = 1

n

= 0.1099

tcalc = D nsD * = 2.5610 ̴ 2.56

Recordando:Ho: meqH3BO4

glicerol = meqH3BO4 manitol

Ho: XG = XM Ha: XG ≠ XM


Como: tcalc > tcrít se rechaza Ho

Prueba de t datos pareados. Utilidad de la prueba de datos pareados.

Demostrar que efectivamente la prueba de datos pareados es capaz de discriminar las diferencias intra-muestrales y someter únicamente a juicio las diferencias entre los métodos.

Ejemplo 8: Considerando un NC del 95% y los datos reportados en la Tabla 11, determine si existe diferencia estadísticamente significativa entre el ensayo espectrofotométrico en la región UV (A) con respecto al método empleando la región del IR (B), ambos, utilizados para la determinar la concentración de paracetamol en tabletas farmacéuticas.

Compare su conclusión derivada de la prueba estadística para datos pareados con respecto a la prueba de diferencia entre medias aritméticas.

Tabla 11. Concentración de paracetamolTableta UV IR xUV – xIR

(Di)(Di –D)2

101 84.38 83.72 1.48 1.2166102 84.08 83.84 0.66 0.0801103 84.41 84.2 0.24 0.0188104 83.82 83.92 0.21 0.0279105 83.55 84.16 0.1 0.0767106 83.92 84.02 0.61 0.0543107 83.69 83.6 0.1 0.0767108 84.06 84.13 0.09 0.0824109 84.03 84.24 0.07 0.0942110 84.38 83.72 0.21 0.0279

∑ = 3.77 1.7556

Di nD =

∑i = 1

n

= 0.377

sD = (Di – D)2

n - 1

∑i = 1

n

= 0.4417

tcalc = D nsD * = 2.6993 ̴ 2.70

Análisis prueba datos pareados:

Recordando:

Ho: XUV = XIR Ha: XUV XIR


Como: tcalc > tcrít se rechaza Ho

Análisis diferencia de medias:

tcalc =xUV – xIR

sD / n = (0.4417)/ 10

= 1.1384

tcrít = 2.26, n – 1 grados de libertad y NC = 95%

84.057 – 83.898

Como: tcalc < tcrít se acepta Ho

CONCLUSIÓN: al comparar las medias aritméticas de cada conjunto de datos, los efectos por diferencia entre métodos se confunden con las diferencias debidas a las tabletas de la misma serie

El contraste de F para evaluar mejoras en la precisión

Ejemplo 9: Establecer si el método propuesto “X” para la determinación de la DQO resulta significativamente más preciso que el método estándar “R”. Considere un NC del 95% y tome en cuenta que en ambos métodos n = 8.

F = (3.31)2

(1.51)2 = 4.805


F =(Sa)2

(Sb)2

F > 1; por tanto

Ho: (sX)2 = (sR)2 Ha: (sX)2 < (sR)2

Tabla 12. DQO (mg*L-1)Método x s

R 72 3.31X 72 1.51

(Sa)2 (Sb)2>

Fcrít = 3.787 (NC = 95%)(para 7 grados de libertad tanto en el numerador como en el denominador; contraste de una cola)

Conclusión:

Como Fcrít < Fcalc, se rechaza Ho*, por tanto el método propuesto ofrece resultados más precisos.

*El rechazo de Ho implica un valor de = 5% (error tipo I)


Ejemplo 10: se ha desarrollado un nuevo método para la determinación de colesterol en suero, en el cual se mide la rapidez de agotamiento de oxígeno, consecuencia de la oxidación del colesterol catalizada por la enzima colesterol oxidasa. Los resultados de 10 réplicas se comparan con los obtenidos por el método estándar colorimétrico de Liberman.

Coeficiente de correlación r para comparar dos métodos

Tabla 12. Concentración de colesterol (mg/dL)Réplica Método

colorimétricoMétodo

enzimático1 300 3052 392 3853 185 1934 152 1625 480 4786 461 4557 232 2388 290 2989 401 408

10 315 323

Gráfica 5. Coeficiente de correlación r para comparar dos métodos

r = 0.9993

0.90 < r < 0.95 = aceptable0.95 < r < 0.99 = buena

r > 0.99 = excelente

2I. Estadística y errores (1).ppt

Documents

Transcript of 2I. Estadística y errores (1).ppt