Documente Academic
Documente Profesional
Documente Cultură
UNIVERSIDAD NACIONAL DE INGENIERA FACULTAD DE CIENCIAS III CURSO DE TITULACIN POR ACTUALIZACIN DE CONOCIMIENTOS Lic. Christian Jacinto Hernndez christian@uni.edu.pe Lima, 2006
Introduccin
Un qumico analista puede enfrentarse a dos problemas: una respuesta cualitativa y una cuantitativa. La qumica analtica moderna es predominantemente cuantitativa, es por eso que es necesario estimar los errores que se cometen cuando se quiere dar una respuesta cuantitativa.
NO EXISTEN RESULTADOS CUANTITATIVOS VLIDOS SI NO VAN ACOMPAADOS DE ALGUNA ESTIMACIN DE LOS ERRORES INHERENTES A ELLOS!
Tipos de Errores
Los errores crasos puede definirse como errores tan graves que no queda otra alternativa que abandonar el experimento y empezar de nuevo. Los errores aleatorios son los que provocan que los errores individuales caigan a ambos lados del valor medio. Los estadsticos afirman que afectan la precisin o reproducibilidad de un experimento. Los errores sistemticos son los que provocan que los resultados sean errneos en un mismo sentido. Los errores sistemticos afectan la exactitud, es decir, la proximidad al valor verdadero.
Precisin y Exactitud
La precisin describe la reproducibilidad de los resultados; es decir, la concordancia entre los valores numricos de dos o mas medidas replicadas o medidas que se han realizado exactamente de la misma forma. Habitualmente se utilizan tres trminos para describir la precisin de un conjunto de datos de replicados que incluye la desviacin estndar, la varianza y el coeficiente de variacin. La exactitud es una medida de la proximidad del valor medido al valor verdadero.
Precisin y Exactitud
Las pruebas estadsticas no solo se utilizan para juzgar los resultados de un experimento concluido si no tambin es importante en la planificacin y el diseo de experimentos.
Poblacin y Muestra
Una poblacin es el conjunto de todos los casos o unidades experimentales que son objeto de un estudio estadstico. Una muestra es un subconjunto tomado aleatoriamente de la poblacin. El tratamiento de dichos datos para poner de manifiesto sus caractersticas mas relevantes en forma de parmetros muestrales, o tambin en forma grfica, es el objeto de la estadstica descriptiva. El anlisis de las grficas y de los parmetros muestrales con el fin de obtener conclusiones sobre la poblacin constituye el objeto de la Inferencia estadstica.
La Distribucin Normal
40
30
20
x Q 2 1 R ! exp 2W 2 W 2T
10
Frecuenci
Std. Dev = .03 Mean = 7.33 0 7.25 7.28 7.30 7.33 7.35 7.38 7.40 N = 80.00
pH
Descriptores Estadsticos
Descriptores Poblacionales
N
Descriptores Muestrales
n
Q!
N
i !1
N
i
x!
Q
n
2
x
i !1
n
i
x
W !
I !1
x
s !
I !1 n
x
n 1
W !
2
x Q
i I !1
x i
I !1
x
n 1
La Tipificacin z
Cuando se desea comparar datos o estimadores de muestras que tienen diferente Q y W, es necesario tipificar la variable o estandarizarla para que sirva de referencia. La tipificacin se obtiene:
xi x zi ! s
exp 2 2T 2
La Tipificacin z
El rea subtendida bajo esta curva para los intervalos [- g, - z] o [+z, + g] representa la probabilidad de que un valor cualquiera se encuentre a la izquierda de z o a la derecha de +z respectivamente. En el primer caso, dicha probabilidad z viene dada por:
dz dz
Area % = Probabilidad % =
g g
g
La Tipificacin z (Ejercicios)
Cual es la probabilidad de que al obtener un dato cualquiera, este se encuentre por debajo de z = -2? Cual es la probabilidad de que al obtener un dato cualquiera, este se encuentre dentro de los intervalos z = + 1 y z = + 2 Dentro de que intervalo [-z, +z] se encuentra el 95 % de las medidas. Se sabe que la cantidad de aspirina contenida en los comprimidos analgsicos de un fabricante determinado sigue una distribucin normal, con Q = 250 mg y W2 = 25. En un muestreo aleatorio de comprimidos tomados de la lnea de produccin, qu porcentaje es de esperar contenga entre 243 y 262 mg de aspirina?
Descriptores No Paramtricos
Los descriptores no paramtricos no utilizan modelos por lo que pueden utilizarse para cualquiera que sea la distribucin de la poblacin. Tienen especial inters para muestras muy pequeas (n = 3 o 5). La mediana Los cuantiles (o percentiles) Los cuartiles. Diagrama de cajas
La Mediana
Mediana Valor tal que el 50 % de las observaciones son menores (se sita a la mitad del intervalo de medida). Nmero de observaciones impar: se toma la [(n+1)2]sima Nmero de observaciones par: se toma el promedio entre la [n/2]sima y la [(n+2)2]sima.
Diagrama de Cajas
1er Cuartil (Q1) Valor tal que el 25 % de las observaciones son inferiores
Grficos Box
Q1 Mediana Q3
Descriptores No Paramtricos
Ensayar para los siguientes datos:
28
Serie 1 23 21 22 26 25
Serie 2 21 18 22 24 25
Serie 3 24 27 19
22 26
24
20 19
20
18
16
14
erie 1
erie 2
erie 3
Ensayos de Normalidad
Histograma:
40
30
20
10
Frecuencia
Std. Dev = . 3 ean = 7.33 0 7. 5 7. 8 7.30 7.33 7.35 7.38 7.40 N = 80.
pH
Ensayos de Normalidad
,5
- ,5
-1,5
- ,5
-3,
- ,
-1,
0,
1,
-3
- ,5
-1,5
-1
- ,5
0,5
1,5
1,5
2,
r -
!!
!0
!&
!#
!3
!1
!2
r
Ensayos de Normalidad
Pr
Di
r i
P-P
lad a
DCB 4
@A @69 8 7 6 45 4
rvada
!"
!'
!'
Pr
!2
r i acumulada
E EF G IH
!3
!&
QP PF
rad a
!!
!'
Los intervalos de confianza tambin pueden expresarse usando la media de una muestra de tamao n, extrada de una muestra de s conocida. Por tanto el intervalo de confianza para la media de la poblacin ser:
ts Q!Xs n
Cul ser el intervalo de confianza del 95 % para los comprimidos analgsicos, si un anlisis de cinco de ellos arroja una media de 245 mg de aspirina y una desviacin estndar de 7 mg?
Grados de Libertad 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 30 50
t 12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.18 2.14 2.12 2.10 2.09 2.04 2.01 1.96
Tabla t de student
Presentacin de Resultados
La dispersin se expresa con una sola cifra distinta de cero, mas los ceros necesarios para establecer el lugar donde se encuentra la coma decimal. La primera cifra de la izquierda que sea distinta de cero se redondea al entero mas prximo. Son cifras significativas de la media todas las que se conocen mas la primera incierta, la cual se redondea al entero mas prximo. Para saber cual es la primera cifra incierta se atiende al valor de la dispersin.
Presentacin de Resultados
Redondear para obtener la presentacin final de los siguientes resultados:
Utilizando el intervalo de confianza, se halla x y s sin considerar el dato anmalo, y se verifica si se encuentra dentro del intervalo de confianza a un nivel dado de confianza. Ensayo de Dixon, se calcula el estadstico:
Qo !
x xp
*
x * xl
Donde xpes el valor mas prximo y xl es el valor mas lejano al valor sospechoso. Qo se compara con el valor crtico Qc que se toma e la tabla de Dixon de dos lados:
Tabla de Dixon
n 0,05
3 4 5 6 7 8 9 10 11 12 0,970 0,829 0,710 0,628 0,569 0,608 0,564 0,530 0,502 0,479
Ec 0,01
0,994 0,926 0,821 0,740 0,680 0,717 0,672 0,635 0,605 0,579
Se dispone de la serie: 423, 422,422, 421, 421, 420, 415. Analizar si se puede eliminar el valor sospechoso 415
Ensayos de Hiptesis
Ensayar una hiptesis es realizar una comparacin entre un dato o un descriptor muestral y un valor de referencia, o bien, entre dos o mas descriptores muestrales.
La hiptesis nula, Ho, establece que los parmetros son iguales. Ejemplos:
La decisin de aceptar o rechazar Ho se toma estableciendo previamente su nivel de significacin crtico o lmite de decisin Ec. El rechazo de la hiptesis nula supone la aceptacin de una hiptesis alternativa H1. Esta puede ser:
H1 de dos lados o dos colas, los parmetros que se comparan son distintos. H1 de un lado o una cola, un parmetro es mayor que otro, no siendo posible el caso inverso
No existen diferencias significativas entre nuestras observaciones y una referencia o entre conjuntos de datos
Si existen diferencias significativas entre nuestras observaciones y una referencia o entre conjuntos de datos
Validez
Tests Estadsticos
Se compara la varianza de medidas obtenidas a lo largo de una sesin de trabajo de un da, con la varianza obtenida a lo largo de varios das. Se compara las varianzas obtenidas al aplicar el mismo mtodo a la misma muestra en dos laboratorios distintos. Se desea saber si las concentraciones de contaminantes y nutrientes han variado con respecto a lo observado el ao anterior.
Ho : s12 = s22 (homogneas u homocedsticas) Heterogneas u H1 : s12 > s22 (ensayo de un lado) H1 : s12 s22 (ensayo de dos lados) Heterocedsticas 2 El estadstico Fo es: F ! s1 o 2 s2 Con grados de libertad del numerador, X1 = (n1-1) y del denominador, X2 = (n2-1).
Ejemplo:
Las dos series de n1 = 10 y n2 = 9 del cuadro se han obtenido midiendo un estndar de As(III) en dos espectrofotmetros de absorcin atmica. Se desea saber si los dos instrumentos dan varianzas iguales o distintas.
Serie 1 325 333 322 322 314 323 323 327 325 321 Serie 2 312 311 307 316 310 314 309 310 311 -
Ho : x = Q H1 : x > Q (ensayo de un lado) H1 : x Q (ensayo de dos lados) El estadstico to: (x Q) n to ! s Se compara con el valor crtico de tc tomado de la tabla de Student de uno o de dos lados para un determinado nivel de significacin, y n-1 grados de libertad.
Ejemplo:
En el ciclismo profesional, un hematocrito superior al 50 % implica sancin por dopaje con EPO (eritropoyetina). Para la siguiente serie de medidas se quiere decidir para E = 0,05 si se ha sobrepasado el lmite legal: 51,9, 50,6, 50,8, 49,3, 50,0, 51,2, 51,7, 50,9.
Primero se realiza un ensayo F, si se acepta Ho : s12 = s22 (muestras homogneas), es posible calcular una varianza conjunta o promedio, s2. (n 1) s 2 (n 1) s 2
s2 !
Entonces:
n1 n2 2
to !
2 1 1 s n n 2 1
1 2
Ejemplo:
Las dos series de n1 = 10 y n2 = 9 del cuadro se han obtenido midiendo un estndar de As(III) en dos espectrofotmetros de absorcin atmica. Las medias de las dos series difieren significativamente a un nivl de confianza del 95 %?.
Serie 1 325 333 322 322 314 323 323 327 325 321 Serie 2 312 311 307 316 310 314 309 310 311 -
Ejemplo:
Los datos de la siguiente tabla proporcionan la concentracin de tiol (mM) en el lisado sanguneo de dos grupos de voluntarios, siendo el primer grupo normal y el segundo sufriendo artritis reumatoide. Se pide hallar si la media de los dos resultados difieren significativamente a un nivel de significancia de 0,05
Se utiliza para comparar dos conjuntos de resultados cada uno, cuyos datos en funcin de algn criterio objetivo, se pueden reunir de dos en dos formando parejas: (x1, y1), (x2, y2), , (xn, yn). Se halla la diferencia, di = xi yi, para cada pareja (con su signo) y se calcula la media aritmtica xd de las diferencias y su desviacin estndar sd Ho : xd = 0 xd n El estadstico to: t o !
sd
Ejemplo:
El desgaste de un motor se puede evaluar a partir del anlisis del aceite lubricante, que se va enriqueciendo de ciertos metales. En un ensayo de comparacin de motores, se tomaron muestras de aceite de lubricante a distintos tiempos de funcionamiento. Se desea saber si uno de los motores se desgasta mas rpidamente que el otro, o si por el contrario el desgaste es el mismo.
Condiciones bajo las cuales se almacen la solucin Para los ejemplos anteriores Mtodo de anlisis empleado Operadores que realizaron la titulacin
Es posible separar la variacin debida al error aleatorio de cualquier otra variacin provocada al cambiar el factor de control. Podemos asi evidenciar si una modificacin del factor de control genera diferencias significativas entre los valores medios obtenidos.
Ambos tipos de anlisis estadsticos, en donde hay un factor, ya sea controlado o aleatorio, adems del error aleatorio de las medidas, se conoce como ANOVA de un factor
Este tipo de anlisis, con mayor grado de dificultad, tambin es aplicable a situaciones ms complejas en las que existen dos o ms factores, posiblemente interactuando entre s
Ejemplo:
Se desea saber si las distintas condiciones de almacenaje de una disolucin afectan a la intensidad de fluorescencia:
Tratamiento
A) Preparacin reciente B) Oscuridad, 1 h C) Luz tenue, 1 h D) Luz intensa, 1 h
Intensidad de Fluorescencia
102, 99, 101, 102, 103, 100 102, 100, 104, 101, 102, 103 97, 95, 99, 95, 98, 96 90, 92,93, 91, 93, 92
Ejemplo:
Correlacin
La correlacin es una medida de la asociacin entre dos variables. Los valores a lo largo de las dos variables estn ligados entre s de algn modo, de forma que una variable proporciona informacin sobre la otra. La asociacin entre variables se estima mediante la covarianza y el coeficiente de correlacin lineal de Pearson, r.
cov( x, y ) !
x x
y y
n i i i
_x x
y
i i
y
r!
n 1
2 2 xi x yi y i i
Coeficientes de Correlacin
r = +1
r = -1
r=0
Coeficientes de Correlacin
Es necesario hacer un test estadstico:
t se compara con el valor tabulado para el nivel de significacin deseado usando un prueba t de dos colas y (n-2) grados de libertad. H0 : no existe correlacin entre x e y. Si tcal > ttab , H0 debe rechazarse.
Considerando que existe una relacin lineal entre la seal analtica (y) y la concentracin (x), se puede calcular los coeficientes a y b por el mtodo de mnimos cuadrados:
y=a+bx
_x
i i
a x
y i y
i
x
a ! y bx
1 2
sb !
2 i sa ! s y / x 2 n x i x i
2 i
Es posible obtener los lmites de confianza para la pendiente y la ordenada al origen de nuestra recta de ajuste
y = bx + a b s tSb a s tSa
Ejemplo:
Calcular las desviaciones estndar de la ordenada en el origen y de la pendiente, y sus lmites de confianza. Establecer si la ordenada en el origen no se distingue significativamente de cero, y si la pendiente ha variado respecto al valor de referencia, 0,020, obtenido en estudios anteriores.
x, Qg/mL 0 5 10 20 50 70
m lecturas de y0
Los lmites de confianza se calculan como: x0 tsx0 , con (m+n-3) grados de libertad para los niveles de confianza deseados
Ejemplo:
Para la determinacin de ascorbato, suponiendo que el valor y = 0,246 sea la media de tres determinaciones, hallar los lmites de confianza de la prediccin x = 21,89 Qg/mL
Lmites de Deteccin
Aquella concentracin que proporciona una seal en el instrumento significativamente diferente (?) de la seal del blanco o seal de fondo. Cantidad de concentracin de analito que proporciona una seal igual a la seal del blanco, yB, mas tres veces la desviacin estndar del blanco, sB.
y = yB + 3 sB
En la prctica los trminos yB y sB se determinan cuando se utiliza una recta de regresin convencional para la calibracin. Si consideramos que el mtodo de los mnimos cuadrados sin ponderar cada punto en la representacin grfica tiene una distribucin normal, es apropiado utilizar sy/x en lugar de sB en la estimacin del lmite de deteccin.
Lmites de Deteccin
Ejemplo:
Los limites de confianza se calculan como xE s tsxE Al ser un mtodo de extrapolacin es menos preciso que uno de interpolacin
Situacion ideal: a = 0, b = r= 1
curva a curva b
curva c
El nivel de plomo de diez muestras de jugo de fruta se determin por un nuevo mtodo de anlisis potenciomtrico de redisolucin (APR) empleando un electrodo de trabajo de carbono vtreo, y los resultados fueron comparados con los obtenidos mediante la tcnica de espectrometra de absorcin atmica de llama (EAA). Se obtuvieron los siguientes datos (todo los resultados en Qg/L).
EAA AP
Introduccin
Un laboratorio debe ofrecer una consistencia de sus resultados da a da. Esta comprobacin debe tener en cuenta los errores aleatorios. Existen tcnicas estadsticas que demuestran si existen o no tendencias dependientes del tiempo en los resultados, asociados a inevitables errores aleatorios. Se trata de los mtodos de control de calidad.
Diagramas de Shewhart
Para medias:
Q o 2W Q o 2W
99.8 %
n n
95 %
Q o 2W
Q o 2W
Diagramas de Shewhart
Un punto cae fuera de la lnea de accin. Dos puntos sucesivos caen fuera de la lnea de aviso. Ocho puntos sucesivos en un lado especfico de la lnea. Seis puntos en sucesin, hacia arriba o abajo sin importar si se encuentra dentro de la lnea de aviso.
Diagramas de Shewhart
Para Rangos:
x + AR
Rango
x + WR
Tiempo
x - WR x - AR