Sunteți pe pagina 1din 76

TRATAMIENTO ESTADISTICO DE DATOS

ESTADSTICA EN QUMICA ANALTICA

IMPORTANCIA DE LA ESTADSTICA Y LA QUIMIOMETRA EN LA QUMICA ANALTICA

Durante la realizacin de una anlisis cuantitativo es muy importante tomar en cuenta todas las variables que pueden afectar nuestro resultado, dentro de estos estn los factores provocados por los instrumentos utilizados y los errores provocados por quien maneja el material.

En el reporte de cualquier anlisis qumico, es importante tomar en cuenta este tipo de errores , hacer un anlisis de los resultados y as se podr concluir sobre l.

Qu es estadstica? La estadstica es una coleccin de mtodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusin basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar informacin numrica o cualitativa, de manera que pueda llevar a conclusiones vlidas.

ESTADISTICA
DESCRIPTIVA Es la ciencia que recopila, organiza e interpreta la informacin numrica o cualitativa INFERENCIAL Es la ciencia que interpreta informacin de manera que pueda llevar a conclusiones vlidas.

La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza.
La Estadstica es la Ciencia de la Sistematizacin, recoleccin, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de deducir las leyes que rigen esos fenmenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

DATOS NO AGRUPADOS
Medidas

de tendencia central

Media aritmtica Mediana Moda Percentiles (posicin)

Medidas de dispersin

Rango (amplitud) Rango intercuartlico Varianza Coef. de variacin

MAGNITUD

Atributo o propiedad que puede ser medida Ejemplos de magnitudes : La longitud, la masa, concentracin de una solucin, Absortividad molar volumen de un lquido, absorbancia, etc.

MESURANDO O MEDIDA

Magnitud de un objeto especfico que estamos interesado en medir Es la determinacin experimental de la MAGNITUD

VARIABLE

Toda MAGNITUD que permite diferenciar entre si a los componentes de una poblacin

ANALSIS

Proceso que nos da una informacin fsica o qumica acerca de los componentes de una muestra

Medidas de tendencia central

Mediana
En una serie de datos ordenados (creciente o decreciente) es la puntuacin o valor central de la distribucin estadstica

Datos no agrupados
Si el n de datos es impar: valor central Si el n de datos es par: media aritmtica de los 2 puntos centrales

Medidas de tendencia central

Moda
Valor de la variable que ms veces se repite en una serie estadstica (mxima frecuencia) Caractersticas:
Distribuciones: Unimodales o multimodales Marca de clase (en intervalos)
Sencilla de calcular Se puede calcular si algn intervalo no tiene lmites Poco representativa

Medidas de tendencia central

Media

Suma de todos los valores de una variable dividida por el nmero total de valores Slo en variables cuantitativas
X = xi / N

Medidas de tendencia central

Media. Clculo
Datos no agrupados: aplicar frmula Datos agrupados
En tabla de frecuencia: Suma de todos los valores multiplicados por sus frecuencias y dividido por el n total.

X = x i fi / N

Medidas de dispersin

Reflejan la dispersin, oscilacin de los datos, respecto al fenmeno estudiado.


Complementan las de tendencia central para la descripcin de una distribucin

Medidas de dispersin

Amplitud o rango
Diferencia entre el valor ms alto y ms bajo de la distribucin.
Ofrece poca informacin sobre la agrupacin de los datos. Indica el campo de variabilidad. Suele acompaar a la moda.

Medidas de dispersin

Varianza
Junto a la desviacin tpica, la que mejor expresa la variabilidad del fenmeno Media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica

S2 = (xi x)2 / N
Para datos agrupados:

S2 = fi(xi x) 2 / N

Medidas de dispersin

Desviacin tpica
Es la raz cuadrada de la varianza S2 = ( xi2 x2) / N fi(xi x) 2 / N

Para datos agrupados:

S2 =

DISTRIBUCIO DE FRECUENCIAS

En una distribucin de datos estos pueden estar o no agrupados.


DATOS AGRUPADOS EN INTERVALOS: SUPUESTO DE CONCENTRACION EN EL PUNTO MEDIO (Xi):

DATOS NO AGRUPADOS EN INTERVALOS:

n
Xi 4 3 2 1 0 ni 1 3 7 6 3
ni 1 3 7 6 3

X i i n

n i Xi n

Xi 18-20 15-17 12-14 9-11 6-8 3-5


PM*ni 380 480 780 400 210 80 2330 2330/200=

ni 20 30 60 40 30 20

Xi 4 3 2 1 0

mitjana=

Xi*ni 4 9 14 6 0 33 33/5=

6,6

Xi 18 20 15 17 12 14 9 11 6 8 3 5

ni 20 30 60 40 30 20

P. M. 19 16 13 10 7 4 mitjanna=

11,65

CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:

1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL.


2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25 LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS 3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN DE PUNTO MEDIO. LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION NORMAL). CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.

La distribucin normal
f(X)

Media Mediana Moda

Datos simtricos: coinciden la media, la mediana y la moda

Propiedades de la distribucin normal:


El rea bajo la curva aproximado del promedio a ms o menos una desviacin estndar (1) es de 0.68, a ms o menos 2 es de .0 95 y a ms o menos 3 es de 0.99.

(Las propiedades continuan en la prxima lmina)

Propiedades de la distribucin normal:


La forma de la campana de Gauss depende de los parmetros y . Tiene una nica moda que coincide con su media y su mediana. La curva normal es asinttica al eje de X. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

En resumen

Podemos concluir que hay una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. La desviacin estndar ( ) determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1.

ERRORES EN LOS ANALISIS QUIMICOS


Es imposible efectuar anlisis qumicos totalmente libres de errores o incertidumbres. La fiabilidad de un resultado se analiza de diferentes maneras Se analizan patrones de composicin conocida Se aplican pruebas estadsticas a los datos

En ciencias e ingeniera, el concepto de error tiene un significado diferente del uso habitual de este trmino. Coloquialmente, es usual el empleo del trmino error como anlogo o equivalente a equivocacin. En ciencia e ingeniera, el error, est ms bien asociado al concepto de INCERTEZA, INCERTIDUMBRE, en la determinacin del resultado de una medicin.

ERROR: es la medida del sesgo en el resultado de una medicin.


INCERTIDUMBRE: es el intervalo o rango de los valores posibles de una medida. Incluye tanto los errores sistemticos como aleatorios. La incertidumbre de un resultado es bien diferente de la precisin, sta da una medida del error aleatorio.

Error: Es la medida del sesgo en el resultado de una medicin Incertidumbre: Es el intervalo o rango de los valores posibles de una medida. Incluye tanto errores aleatorios como sistemticos La incertidumbre de un resultado es bien diferente de la precisin, sta da una medida del error aleatorio. Ms precisamente, lo que procuramos en toda medicin es conocer las cotas (o lmites probabilsticos) de estas incertezas.

Errores
Groseros o accidentales Son errores que son tan importantes que no existe alternativa real que abandonar el experimento y empezar de nuevo por completo.
Sistemticos Provocan que todos los resultados sean errneos en el mismo sentido, son demasiado grandes, y se denomina tambin sesgo de la medida. Este tipo de error es responsabilidad del material empleado y de su origen y presin de fabricacin.

Aleatorio Estos provocan que los resultados individuales difieran uno del otro de manera que caigan a ambos lados del valor medio. Estos errores afectan la precisin de un experimento. Este tipo de errores son los que comete el operador del instrumento utilizado.

Sistemticos
Determinados: Posibles de evitar y o de corregir. Pueden ser constantes como pesar en una balanza descalibrada, o variables.

Aleatorios
Indeterminados: A menudo se llaman accidentales. Estos errores se evidencian por pequeas diferencias en mediciones sucesivas.

Errores experimentales

Error absoluto.-

Nos indica si medimos u obtuvimos mas o menos que el valor experimental, y en qu cantidad excedimos del valor real o qu cantidad nos falt; esto segn el signo de la sustraccin.
EA = valor experimental valor terico

Error relativo.- Es una forma de conocer el porcentaje


de error que obtuvimos en nuestros resultados.
ER = (valor experimental valor terico) x 100 (valor terico)

Los errores presentes en un estudio analtico modifican:


Precisin Es el grado de confianza con que se puede repetir un experimento y este puede dar los mismo resultados. Es utilizado como sinnimo de repetitibilidad.

Exactitud
Es el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado.

TERMINOS IMPORTANTES
Media, Media aritmtica y promedio (X) son trminos sinnimos. Es la medida de tendencia central mas utilizada .Se obtiene dividiendo la suma de los valores de una serie y dividiendo por el numero de medidas del conjunto.

Mediana es el resultado alrededor del cual se reparten los dems por igual. Si la serie es un numero impar la mediana es el numero de la mitad. Si la serie es un numero par se toma el promedio del par central despus de haber ordenado la serie de menor a mayor.

TERMINOS IMPORTANTES

Ejemplo: calcular la media y la mediana de 10.06, 10.20, 10.08, 10.10.


Media = X =10.06+10.20+10.08+10.10 = 10.11

4 Mediana = 10.08 +10.10 = 10.09 2

CIFRAS SIGNIFICATIVAS
Es el numero necesario de dgitos para expresar

los resultados de una medicin congruente con la precisin de medida. 237 : 2 centenas, 3 decenas y 7 unidades

El numero de cifras significativas incluye todos los dgitos que se conocen mas el primer digito incierto.

El numero de cifras significativas en una medicin es independiente de la colocacin del punto decimal.

Por ejemplo el numero 92.067: Este numero tiene cinco cifras significativas independiente donde se coloque el punto decimal. En este caso el cero si es una cifra significativa.

En el numero 727.0 el cero no se usa para localizar el punto decimal es significativo

Ejemplos:

0.216
90.7

Tres Cifras significativas.


Tres cifras significativas.

800.0
0.0670

Cuatro cifras significativas.


Tres cifras significativas

TERMINOS IMPORTANTES
Precisin.

El trmino precisin describe la reproducibilidad de los resultados y se puede definir como la concordancia que hay entre los valores numricos de dos o ms mediciones que se han realizado de idntica manera.

La precisin slo depende de la distribucin de los errores aleatorios y no se relaciona con el valor verdadero ni con el valor especificado.

PRECISION
Para describir la precisin de un conjunto de datos repetidos se utilizan tres trminos muy conocidos: La desviacin estndar, la varianza y el coeficiente de variacin.

La desviacin estndar (DS/DE) es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una distribucin.
Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la dia aritmtica de la distribucin. Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1

TERMINOS IMPORTANTES

METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION

Desviacin estndar S=

Xi-X n-1

Desviacin respecto a la media

es la diferencia numrica entre un valor experimental y la media

Varianza: S2 Coeficiente de variacin. C.V = S/Media


*100

TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se calcula al dividir la desviacin estndar entre la media del conjunto de datos. DER se expresa en partes por mil o en %. DER * 100% = CV. Dispersin (W): Es la diferencia entre el valor mas alto y el valor mas bajo del conjunto

TERMINOS IMPORTANTES
EXACTITUD : El trmino denota el grado de coincidencia del resultado de una medicin con el valor verdadero o aceptado de la misma y se expresa en funcin del error. La exactitud implica una comparacin con el valor verdadero o aceptado como tal. Cuando no se conoce el valor verdadero se debe usar un valor aceptado.

TERMINOS IMPORTANTES

METODOS PARA MEDIR LA EXACTITUD Error absoluto: Es la diferencia entre el valor experimental y el valor real. Error relativo: Es el error absoluto dividido por la cantidad medida. Ejemplo: Una muestra tiene 20.34% de Fe y un analista encuentra que es 20.44%. Error Absoluto = 20.44-20.34 = 0.10% Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por mil

TERMINOS IMPORTANTES

En trminos generales la exactitud supone una comparacin con un valor verdadero o aceptado como tal, la precisin indica la concordancia entre las medidas que han sido realizadas de una misma forma.

Esquema grfico para comprender la relacin entre exactitud y precisin

En C existe buena precisin, pero no buena exactitud; en A buena exactitud y precisin, y en B mala exactitud y precisin.

Diagrama precisin y exactitud

EVALUACION DE LOS DATOS ANALITICOS

ESTUDIANTE A

RESULTADOS DE UNA TITULACION 10.08 10.11 10.09 10.10 10.12 9.88 10.14 10.02 9.80 10.21 10.19 9.79 9.69 10.05 9.78

COMENTARIO Preciso pero inexacto

Exacto pero impreciso

Inexacto e impreciso

EVALUACION DE LOS DATOS ANALITICOS


ESTUDIANTE COMENTARIO

RESULTADOS DE UNA TITULACION

10.04 9.98 10.02 9.97 10.04

EXACTO Y PRECISO

TIPOS DE ERRORES EN DATOS EXPERIMENTALES ERRORES

Bruto

Aleatorios
- = indeterminados -Afectan la presicion

Sistemticos
- = determinados - Afectan la

Ocurre de manera Ocasional . suele ser exactitud Grandes. Dan como valor resultado valores atpicos que difieren resultados mucho de los dems.

o la reproducibilidad o sea la proxim al - Los resultados caen a lado y lado de la X

verdadero. - Todos los


son errneos en el mismo sentido.

ERRORES DETERMINADOS O SISTEMATICOS

FUENTES DE ERRORES SISTEMTICOS

Errores instrumentales: Calibraciones


deficientes

Errores del mtodo: Dificiles de identificar Errores personales: Descuido, Falta de


atencin

EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser constantes o proporcionales


En los errores constantes el error absoluto es invariable con el tamao de la muestra ,mientras el error relativo cambia al modificar dicho tamao. Los errores proporcionales aumentan o disminuyen segn el tamao de la muestra. Con los errores proporcionales el error absoluto varia con el tamao de la muestra, en cambio el error relativo permanece constante.

EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser constantes o proporcionales. En los errores constantes, el error absoluto es invariable con el tamao de la muestra, mientras en el error relativo cambia al modificar el tamao de la muestra. Los errores proporcionales aumentan o disminuyen segn el tamao de la muestra; con estos errores el error absoluto varia con el tamao de la muestra en cambio el error relativo permanece constante.

EVALUACION DE LOS DATOS ANALITICOS


KAl(SO4)2.12H2O Al2O3 Al2O3 g tomados g Encontrados tomados con el NH3 almacenado 1 0.1077 0.1288 2 0.2154 0.2384 3 0.3231 0.3489 4 0.4308 0.4588 Diferencia Al2O3 en g Encontrados con el NH3 Nuevo 0.0211 0.1087 0.0230 0.2187 0.0258 0.3258 0.0280 0.4352 Diferencia en g

0.001 0.0024 0.0027 0.0044

EVALUACION DE LOS DATOS ANALITICOS

Los errores ocasionados por el amoniaco envasado durante mucho tiempo fueron constantes por que se utilizo el mismo volumen y el aporte de Si fue el mismo. El NH3 del envase recin utilizado fueron muy pequeos y proporcionales al tamao de muestra.

ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en una determinacin. Muchas variables no controladas y de no fcil identificacin causan errores aleatorios. El efecto acumulativo de las incertidumbres, aunque estas sean muy pequeas, hace que las mediciones por duplicado de una serie flucten al azar.

FUENTES DE LOS ERRORES ALEATORIOS


Los errores aleatorios obedecen una curva normal de error o curva de gauss.

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm

Distribucin normal
Al iniciar el anlisis estadstico de una serie de datos, y despus de la etapa de deteccin y correccin de errores, un primer paso consiste en describir la distribucin de las variables estudiadas y, en particular, de los datos numricos. Un modo es con la curva de distribucin normal que muestra la frecuencia con que se repiten los datos.

TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO


Los mtodos estadsticos permiten categorizar y caracterizar los datos, y tomar decisiones objetivas en cuanto a su calidad e interpretacin. Hay que diferenciar entre muestra y poblacin o universo. ( caso del anlisis de Ca en agua. La poblacin seria un numero de medidas muy grande cercano al infinito). Las leyes de la estadstica se dedujeron para usarlas en poblaciones. Para aplicarlas a muestras se debe hacer ajustes.

TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO

Las curvas gaussianas se pueden representar por medio de una ecuacin que tiene la media de la poblacin , y la desviacin estndar de la poblacin . La media de la poblacin es y la media de la muestra es X.

EVALUACION DE METODOS ANALITICOS

La N de una solucin se calculo con 4 titulaciones por separado y los resultados fueron 0.2041, 0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El rango , La S. la desviacin relativa y el C.V. X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043 Mediana M= (0.2041+0.2043)/2 = 0.2042 Rango R = 0.2049-0.2039 = 0.001 La desviacin relativa= Sumatoria de (XiX)/4=0.0003 S= 0.0004 C.V = (0.0004/0.2043)*100 = 0.2%

Ejemplo 2.

PRESENTACION DE LOS DATOS CALCULADOS

Siempre es necesario indicar el nivel de confianza de los datos. Es un rango de valores en los que con una probabilidad determinada est un valor verdadero poblacional. Generalmente son del 95% o 99%. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza

PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de un anlisis realizado por dos mtodos diferentes. Se trabaja con las X Se aplica el T de student. Plantea la hiptesis de que las dos X son iguales. La prueba T da una respuesta si o no a la hiptesis nula con cierta exactitud como del 95 o 99%

Prueba de significancia

t = X1 X2 S

n1n2 n1+n2

Si t calculado es mayor que t de la tabla entonces los dos mtodos son iguales Para poder calcular t hay que calcular primero la s de cada serie de datos

Cuando

se escoge el nivel de significacin 0,05 ( 5%), tenemos un 95% de confianza de que hemos adoptado la decisin correcta y una probabilidad 0,05 de ser falsa.

DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse que las pruebas estadsticas se utilizan para identificar valores atpicos, no para retirarlos del grupo de datos. Tcnicamente, una observacin no debe retirarse a menos que una investigacin halle una causa probable para justificar esta accin

RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atpicos comparados con los valores del grupo de datos.

RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un nico valor atpico en un grupo de datos, y por lo tanto no son adecuadas para la deteccin de mltiples valores atpicos. Una tcnica rigurosa y amplia para identificar eficazmente mltiples valores atpicos es el procedimiento para muchos valores atpicos con generalizacin extrema de la desviacin de Student.

OBJETIVOS DEL MUESTREO


Estadsticamente los objetivos del proceso de muestreo son: 1. Obtener el valor medio 2. Obtener una varianza que sea una estimacin de la varianza poblacional con limites de confianza validos para la media.

VALIDACION DE METODOS ANALITICOS


Calidad de resultados

Selectividad Analito en medio de interferencias Limite de deteccin Promedio de bcos +3(desviacin) Limite de cuantificacin 5 10 L.D. Intervalo de trabajo Rango en que el mtodo es exacto y preciso. Rango lineal Exactitud. Valor de referencia Precisin Desviacin y CV

Sensibilidad Pendiente % Recuperacin. Adicin de cantidades conocidas


GRFICOS DE CONTROL.

VALIDACION DE METODOS ANALITICOS


Curvas de calibracin Linealidad Pendiente Sensibilidad Residuales Coeficiente de correlacin

S-ar putea să vă placă și