Documente Academic
Documente Profesional
Documente Cultură
Para afinar los juicios concernientes a la calidad de las mediciones experimentales se emplean varias pruebas
estadísticas al tratamiento de los resultados analíticos.
Intervalos de confianza, IC
Es el intervalo en torno a la media, x , de un conjunto de valores, determinada experimentalmente, dentro
del cual se espera, con una cierta probabilidad, que esté incluida la media poblacional, µ. La probabilidad se
llama nivel de confianza y generalmente se expresa en porcentaje y la probabilidad de que un resultado este
fuera del intervalo de confianza se llama nivel de significación o nivel de significancia.
Para la curva de Gauss en base a datos poblacionales, la curva se puede representar la frecuencia relativa en
función a la cantidad de z que es igual a, (x - µ)/σ , en base a una sola medida, el intervalo de confianza es,
IC de µ = x ± zσ
Para la x , su expresión es,
IC de µ = x ± zσ/ N
En la tabla siguiente se resume los niveles de confianza con su respectivo valor de z,
Nivel de confianza con diversos valores de z
Nivel de confianza, % Valores de z
50 0.67
68 1.00
80 1.28
90 1.64
95 1.96
95.4 2.00
99 2.58
99.7 3.00
99.9 3.29
Cuando los valores de N son pequeños como es el caso de los datos que se consiguen en el análisis químico,
se emplea la desviación estándar “s” y su variabilidad se explica con el estadístico “t” o “t de Student” que se
define similarmente a “z”, es decir,
t = (x - µ)/s ó t = ( x - µ)/(s/ N )
Luego las expresiones de cálculo para los intervalos de confianza son,
IC de µ = x ± ts ; IC de µ = x ± ts/ N
Los valores de “t” se extraen de Tablas cuyos valores dependerán del nivel de probabilidad y el valor de N ó N
– 1 (conocida como grados de libertad.
Las Pruebas de Hipótesis:
Las pruebas de hipótesis son la base de muchas decisiones a nivel científico. Para explicar una observación se
propone una hipótesis y se prueba experimentalmente para demostrar su validez. Si los resultados de los
experimentos no sustentan al modelo, se rechaza y se busca una nueva hipótesis.
La prueba estadística que mucho se usa es la hipótesis nula, que expresa que las cantidades que se comparan
son la misma. Son dos los resultados contradictorios. En el primero, la hipótesis nula H 0 afirma que µ = µ0. En
el segundo, la hipótesis alterna Ha puede expresarse de diferentes maneras: µ ≠ µ0, µ < µ0 y µ > µ0
La prueba z es apropiada si se tienen resultados muy numerosos, de modo que s es una buena estimación
de σ. La prueba emplea el siguiente procedimiento:
(1) Expresar la hipótesis nula: H0 : µ = µ0
x u0
(2) Presentar la variable estadística de prueba: z
σ/ N
(3) Exprese la hipótesis alterna, Ha, y determine la región de rechazo,
Para Ha : µ ≠ µ0, rechace H0, si z ≥ zcrit ó z ≤ -zcrit
Para Ha : µ > µ0, rechace H0, si z ≥ zcrit
Para Ha : µ < µ0, rechace H0, si z ≤ zcrit
En caso de contar con un pequeño número de datos, el procedimiento es similar, en la que se emplea la
prueba estadística “t”, es decir,
(1) Expresar la hipótesis nula: H0 : µ = µ0
x u0
(2) Presentar la variable estadística de prueba: t
s/ N
(3) Exprese la hipótesis alterna, Ha, y determine la región de rechazo,
Para Ha : µ ≠ µ0, rechace H0, si t ≥ tcrit ó t ≤ -tcrit
Para Ha : µ > µ0, rechace H0, si t ≥ tcrit
Para Ha : µ < µ0, rechace H0, si t ≤ tcrit
x1 x2 N1 N2
t calculado
s comb N1 N2
2 2
s1 (N1 1) s 2 (N2 1)
s comb
N1 N2 2
También se puede emplear sd en lugar de scomb a partir de la varianza de la media de los analistas,
La desviación estándar de la media: sm1 = s1/ N1 ; sm2 = s2/ N2
Donde d es la diferencia promedio igual a di/N. di, es la diferencia de cada pareja de valores y s d, es la
desviación estándar de esas diferencias.
Errores en las pruebas de hipótesis
Se presentan dos tipos de error, el error tipo I, que ocurre cuando se rechaza H0 pese a ser verdadera. En
algunas ciencias, este tipo de erro se denomina falso negativo. Se presenta un error tipo II cuando se acepta
H0 y en realidad es falsa. Algunas veces también se le llama resultado falso positivo.
Comparación de precisión
La prueba F o prueba de Fisher nos permite evaluar la precisión al comparar las varianzas de dos poblaciones
o muestras siempre y cuando ellas tengan una distribución normal (de gauss). La prueba F también se emplea
para comparar dos o más medias y para el análisis de regresión lineal.
La prueba F se basa en la hipótesis nula de que las dos varianzas poblacionales consideradas son iguales, H 0:
2 2
σ1 2
La prueba F puede utilizarse con una o dos colas. En el caso de una cola, se pone a prueba la hipótesis alterna
de que una varianza es mayor que la otra. Por lo tanto la varianza del procedimiento supuestamente más
preciso se coloca en el denominador, y la del procedimiento menos preciso, en el numerador. La hipótesis
2 2
alterna es, Ha : σ 1 σ 2
2 2
En el caso de una prueba con dos colas lo que se prueba es si las varianzas son diferentes, H a: σ 1 σ 2 . De
ser así, la varianza más grande aparece en el numerador.
Análisis de varianza
El análisis de varianza (ANOVA), se usa para verificar si existe o no diferencia entre las medias de tres o más
poblaciones.
En los procedimientos de ANOVA se detectan diferencias entre medias poblacionales mediante la
comparación de varianzas. Al comparar I medias poblacionales, µ1, µ2, µ3, ………. µI la hipótesis nula H0 tiene la
forma:
H0 : µ1 = µ2 = µ3 = ……….= µI
Y la hipótesis alterna Ha es,
Ha : al menos dos de las medias son diferentes.
ANOVA de un Factor
Diversas cantidades son importantes para poner a prueba la hipótesis nula, H 0 : H0 : µ1 = µ2 = µ3 = ……….= µI
Las medias muestrales de las I poblaciones son, x1 , x2 , x 3, ......,xI
2 2 2 2
Y las varianzas muestrales, s 1 , s 2 , s 3 , ...... s I
La gran media, , que es el promedio de todos los datos, se calcula como el promedio ponderado de las medias
grupales,
N1 N N N
x x 1 2 x 2 3 x 3 ..... I x I
N N N N
Donde, N1 es el número de medidas del grupo 1, N2 lo es del grupo 2, y así sucesivamente. El gran promedio
también se calcula sumando todos los valores de los datos y dividiendo la suma entre el número total de
medidas, N.
El cálculo de la relación de varianzas necesario en la prueba F requiere obtener otras cantidades, llamadas
suma de los cuadrados:
(1) Suma de los cuadrados debido al factor (SCF):
2 2 2 2
SCF = N1 (x 1 x) N2 (x 2 x) N3 (x 3 x) ........ NI (x I x)
(3) La suma de los cuadrados total, SCT, se obtiene al sumar SCF y SCE
SCT = SCF + SCE
La suma de los cuadrados también puede derivarse de (N - 1)s2, donde s2 es la varianza muestral de todos los
puntos de los datos
La aplicación de los métodos del ANOVA requiere unos supuestos concernientes a las poblaciones en estudio:
1ro. Los métodos del ANOVA usados se basan en el supuesto de varianzas iguales, es decir las varianzas de la
I poblaciones son iguales
2do. Se supone que las I poblaciones sigue la distribución de Gauss.
(4) El número de grados de libertad para cada una de la suma de los cuadrados. La suma de los cuadrados
totales (SCT) tiene N – 1 grados de libertad. SCF tiene I – 1 grados de libertad y por consiguiente SCE tiene N
– I grados de libertad porque SCT es la suma de SCF y SCE,
SCT = SCF + SCE
(N - 1) = (I - 1) + (N - I)
(5) Los valores cuadrados medios: que se obtienen dividiendo la suma de los cuadrados entre sus grados de
libertad correspondiente
Cuadrado medio debido al Factor, CMF = SCF/(I - 1)
Cuadrado medio debido al error, CME = SCE/(N - I)
La cantidad CME es una estimación de la varianza debida al error ( E ), y la CMF es la estimación de la
2
2 x CME
DSM t
Ng
Donde CME es el cuadrado medio del error y el valor de t debe tener N – I grados de libertad.
Prueba o test Q
La prueba Q, es una herramienta estadística para decidir si se conserva o rechaza un resultado discordante.
La aplicación de la prueba Q, se recomienda seguir el siguiente orden:
(1) Se ordena el conjunto de valores de una manera creciente.
(2) Se deduce el valor de Q para evaluar la permanencia del valor menor, con la siguiente expresión,
N2 N1 N2 N1
Q
Nn N1 w
Donde w es la dispersión y n es el número total de valores. Se compara el valor de Q con el Q crítico, y si el
valor calculado es menor que valor crítico se conserva el valor menor.
(3) Se deduce el valor de Q para evaluar la permanencia del valor mayor, con la siguiente expresión,
Nn Nn - 1 Nn Nn - 1
Q
Nn N1 w
Se compara el valor de Q con el Q crítico, y si el valor calculado es menor que valor crítico se conserva el valor
mayor.
(4) La evaluación del conjunto de valores si es necesario termina cuando ya no se rechazan ningún valor.
A B C D E F
x 3.10 70.19 0.82 2.86 70.53 0.49
S 0.3742 0.0757 0.0511 0.2408 0.2152 0.0161
LC
N 5 3 4 5 4 5
N–1 4 2 3 4 3 4
t, crít 2.78 4.3 3.18 2.78 3.18 2.78
95%
± 0.4652 0.1880 0.0813 0.2994 0.3421 0.0200
Cada intervalo significa un rango de valor en la que se encuentra la media de valores de cada conjunto.
7.8-) Un método de absorción atómica para determinar el contenido de cobre en combustibles generó una
desviación estándar combinada scombinada = 0.32 µg/mL (s σ). El análisis del aceite de un motor de pistones
arroja el contenido de Cu de 8.53 µg/mL. Calcule los intervalos de confianza al 90 y 99% para el resultado si
este se basó en: (a) un solo análisis, (b) la media de cuatro análisis, (c) la media de 16 análisis.
Solución: para intervalo de confianza, LC =
(a) Cuando hay una sola medida no hay intervalo de confianza.
(b) Para N = 4, tcrítico a 90% = 2.31 ; a 99% = 5.84
x1 x2 N1 N2
t calculado
s comb N1 N2
Algunos científicos piensan que 5.0 ppm es una concentración de O 2 disuelto en la que apenas pueden vivir
los peces. Aplique una prueba estadística para determinar si la concentración media de O 2 disuelto es menor
de 5.0 ppm para el nivel de confianza del 95%. Exprese claramente la hipótesis nula y alterna.
Solución:
H0 : µ = 5.0 ppm de O2
Ha : µ < 5.0 ppm de O2
Con una hoja de cálculo de Excel mediante las expresiones de =promedio(…) y =desvest(…) se determina:
x = 4.89 ; s = 0.40
x u0
Se aplica: t
s/ N
tcalculado = [(4.89 - 5.0)/0.40](8)1/2 = -0.78
tcritico = -2.36 (con N = 8 y nivel de 95%)
Luego, tcalculado < tcrítico se acepta la hipótesis nula, la concentración media de O2 es igual a 5.0 ppm y los peces
viven.
7.20-) La concentración de un contaminante en un río cercano a una planta química se vigila con regularidad.
Su concentración normal se ha establecido a lo largo de los años mediante análisis químicos. La compañía
efectuó en fecha reciente, varios cambios en la planta, lo que al parecer incrementa los valores de
contaminación. Las autoridades encargadas de la protección ambiental exigen pruebas concluyentes de que
no ocurrió tal efecto. Exprese la hipótesis nula y alterna pertinente, además de describir los errores tipo I y II
que podrían ocurrir en esta situación.
Solución:
Error tipo I: después de haber realizado determinaciones por triplicado en una semana del elemento
contaminante a vigilar, el responsable de los resultados del análisis informó que el contaminante durante la
semana con cambios en la planta superaba el estándar normal.
H0 : µ = concentración normal
Ha : µ > concentración normal
Por lo tanto se acepta la hipótesis alterna
Una revisión del trabajo del análisis químico encuentra que uno de los reactivos estaba contaminado con el
elemento en investigación de tal manera que los resultados fueron corregidos y ahora el contaminante está
dentro de la concentración normal. Es decir se rechazó la hipótesis nula siendo ella verdadera.
7.22-) La homogeneidad de la concentración de cloruro en una muestra de agua de un lago es sometida a
prueba mediante el análisis de porciones extraídas de las aguas superficiales y cercanas al fondo, con los
resultados siguientes (en ppm Cl)
Superficie Fondo
26.30 26.22
26.43 26.32
26.28 26.20
26.19 26.11
26.49 26.42
(a) Aplique la prueba t en el nivel de confianza del 95% para determinar si las medias son diferentes
(b) Use la prueba t para pares de datos con el fin de determinar si existen diferencias significativas entre los
valores de la superficie y el fondo para el nivel de confianza del 95% o no la hay
(c) ¿Por qué se llega a una conclusión distinta si se utiliza la prueba t para pares de datos y si se combinan
simplemente los datos y se utiliza la prueba t normal de la diferencia entre las medias
Solución: (a) aplicando las expresiones,
x1 x2 N1 N2
t calculado
s comb N1 N2
2 2
s1 (N1 1) s 2 (N2 1)
s comb
N1 N2 2
Y la utilización de una hoja de cálculo (o una calculadora) se determinan los promedios y las varianzas,
(subíndice 1 para la superficie y subíndice 2 para el fondo)
x 1 = 26.338 ; x 2 = 26.254
s21 = 0.01457 ; s22 = 0.01418
scombinada = 0.120
tcalculado = 1.107
tcrítico = 2.31, GL = 8 ; 95% de nivel de probabilidad
t calculado es menor que t crítico por lo tanto las medias de ppm de Cl en el la superficie y en fondo no son
diferentes en este tipo de prueba
(b) Aplicamos la expresión,
d Δ0
t calcul N
sd
Y la utilización de una hoja de cálculo (o una calculadora) se determina el promedio de las diferencias de las
medidas de Cl en las porciones de agua del lago y la desviación estándar, considerando que 0 = 0
Superficie Fondo Diferencia
26.30 26.22 +0.08
26.43 26.32 +0.11
26.28 26.20 +0.08
26.19 26.11 +0.08
26.49 26.42 +0.07
d = 0.084 ; sd = 0.0152 ; N = 5
tcalculado = 12.35
tcrítico = 2.78 al 95% de nivel de probabilidad
t calculado es mayor que t crítico por lo tanto las medias de ppm de Cl en el la superficie y en fondo son
diferentes en este tipo de prueba
(c) la prueba t en pareja es mucho más exigente para evaluar conjuntos de medidas que la prueba t de
promedio.
7.24-) Lord Rayleigh preparó muestras de nitrógeno con varios métodos distintos. Midió la densidad de cada
muestra como la masa del gas necesaria para llenar un matraz específico a una cierta presión y temperatura.
Las masas de muestras de nitrógeno preparadas por descomposición de diversos compuestos de nitrógeno
fueron 2.29280, 2.29940 y 2.30054 g. Las masas de “nitrógeno” preparadas al extraer oxígeno del aire con
técnicas diversa fueron 2.31001, 2.31163 y 2.31028. ¿Difiere significativamente la densidad de nitrógeno
preparado a partir de compuestos de nitrógeno y la densidad del nitrógeno a partir del aire? ¿Qué
probabilidades existen de que la conclusión sea errónea? (El estudio de esta diferencia ocasionó que Sir
William Ramsey, Lord Rayleigh, descubriera los gases inertes)
Solución: se plantea la siguiente hipótesis,
H0 : x1 x 2
Ha : x1 x 2
x1 x2 N1 N2
t calculado
s comb N1 N2
2 2
s1 (N1 1) s 2 (N2 1)
s comb
N1 N2 2
2 x CME
DSM t
Ng
Solución: (a) las hipótesis, donde (1) es el método colorimétrico, (2) la valoración con EDTA y (3) el método de
absorción atómica
H0 : µ 1 = µ 2 = µ 3
Ha : µ1 ≠ µ 2 ≠ µ 3
(b) Aplicando los resultados de la ANOVA en una hoja de cálculo se obtiene,
Valoración Absorción
Repetición Colorimetría
con EDTA atómica
1 3.92 2.99 4.4
2 3.28 2.87 4.92
3 4.18 2.17 3.51
4 3.53 3.4 3.97
5 3.35 3.92 4.59
Prom 3.652 3.07 4.278
s^2 0.14877 0.42195 0.30227
N = 15 I=3 gl fac tor 2
Prom mayor 3.66667 gl analista 12
SCF 3.64977 SCE 3.49196
CMF 1.824885 CME 0.29099667
F 6.27
Los valores críticos de F para los grados de libertad de 2 y 12:
A un nivel de confianza del 95% : 19.41
A un nivel de confianza del 99% : 99.419
Los métodos no son diferentes al nivel de confianza del 95 y 99%
(c) Los métodos son similares
7.34-) A continuación se muestran tres conjuntos de datos para la masa atómica del antimonio que proviene,
que proviene del trabajo de Willard y McAlpine.
Conjunto 1 Conjunto 2 Conjunto 3
121.771 121.784 121.752
121.787 121.758 121.784
121.803 121.765 121.765
121.781 121.794
(a) Determine la media y la desviación estándar de cada conjunto de datos
(b) Encuentre el intervalo de confianza del 95% para cada conjunto de datos
(c) Establezca si el valor 121.803 del primer conjunto de datos es un valor atípico de dicho conjunto en el nivel
de confianza del 95%
(d) Utilice la prueba t para determinar si la media del conjunto de datos 3 es idéntica a la del conjunto 1 en el
nivel de confianza del 95%.
(e) Compare la media de los tres conjuntos mediante ANOVA. Formule la hipótesis nula. Determine si las
medias difieren en el nivel de confianza del 95% o no.
(f) Combine todos los datos y determine la media y la desviación estándar combinada
(g) Compare la media global de los 11 puntos de datos frente al valor aceptado. Diga cuales son el error
absoluto y el porcentaje de error relativo, en el supuesto que el valor aceptado sea el verdadero
Solución:
(a) Utilizando una calculadora o una hoja de cálculo de Excel obtenemos la media y la desviación estándar
Conjunto 1 Conjunto 2 Conjunto 3
Promedio 121.7855 121.77525 121.767
S 0.013404 0.016641 0.016093
t crítico = 2.57 ; para GL = 7-2 = 5 y 95% de nivel de confianza. Luego como t calculado es menor que t crítico,
los promedios de los conjuntos evaluados son similares.
(e) la hipótesis es, (colorimetría, absorción atómica y valoración con EDTA)
H0 : µ 1 = µ 2 = µ 3
Ha : µ1 ≠ µ 2 ≠ µ 3
la ANOVA:
Conjunto 1 Conjunto 2 Conjunto 3
121.771 121.784 121.752
121.787 121.758 121.784
121.803 121.765 121.765
121.781 121.794
Promedio 121.7855 121.77525 121.767
s^2 0.00017967 0.00027692 0.000259
N = 11 I=3 gl, factor 2
Prom. Mayor 121.776727 gl, analista 8
SCF 0.00060043 SCE 0.00188775
CMF 0.00030022 CME 0.00023597
F 1.272
El valor de F a 95% para los grados de libertad de 2 y 8 es 19.371, por lo tanto no hay diferencia entre los
conjuntos.
(f) En la hoja de cálculo de Excel o una calculadora
Promedio global = 121.776727
s, combinada = 0.01577397
(g) EA = 121.776727 - 121.803 = - 0.026273
ER = -0.026273x100/121.803 = - 0.022
Ejercicios sobre cromatografía
23.18 (a) Una columna cromatográfica de longitud 10,3 cm y diámetro interior 4,61 mm está
empaquetada con una fase estacionaria que ocupa el 61% de su volumen. Si el caudal es de
1,13 mL/min hallar la velocidad lineal de flujo en cm/min.
(b)¿Cuánto tiempo tardará el disolvente (que es el mismo que tarda un soluto no retenido) en
atravesar la columna?
(c) Hallar el tiempo de retención de un soluto que tiene un factor de retención o de capacidad
de 10,0
Solución: (a) luego el 39% del volumen total interior es el conducto por donde va la fase
móvil, luego,
Volumen de fase móvil = 0,39*(d/2)2*h = 0,39*(0,461 cm/2)2*10,3 = 0,6705 cm3
tr = 6,53 min
(a) ¿Qué tamaño debe tener la columna para separar 100 mg de la misma mezcla?
(b) Si el caudal es de 0,22 mL/min en la columna pequeña, ¿qué caudal debe usarse en la
columna grande?
(c) Si la fase móvil ocupa el 35% del volumen de la columna, calcular la velocidad lineal de
flujo en la columna pequeña y en la columna grande?
d1 = 4,28 cm
24.19 (a) Cuando se analizó una disolución de 10,0 mL que contenía 234 mg de pentanol
(PF= 88,15) y 237 mg de 2,3-dimetil-2-butanol (PF= 102,17), la relación de áreas de los picos
de pentanol: 2,3-dimetil-2-butanol fue de 0,913:1,00. Suponiendo que el pentanol es el patrón
interno, hallar el factor de respuesta del 2,3-dimetil-2-butanol.
(b) Teniendo en cuenta los cromatogramas para el pentanol y 2,3-dimetil-2-butanol sus W1/2
son respectivamente 2,2 y 1,5 minutos (las alturas de los picos son 41,4 y 76,0 mm)
respectivamente , calcular las áreas de sus picos (teniendo en cuenta que se asemejan a un
pico gausiano) es igual a 1,064*altura de pico*W1/2.
Solución: (a)
1,0/(237/10) = F*0,913/(234/10)
F = 1,081
Ejercicios propuestos
Solución:
u = L/tm
2.- En una columna de 122 cm de longitud y a una temperatura de 160ºC se obtuvieron los
siguientes tiempos de retención en minutos: pico del aire 0.90, heptano 1.22 y octano 1.43.
El ancho en la base de los picos fue de 0.14 min para el heptano y de 0.20 min para el octano.
b)¿Qué longitud debería tener la columna para obtener una resolución de 1.5?
Solución:
(b) k´y no cambian al variar N y L, entonces se puede derivar una ecuación para N1 y N2
de la siguiente ecuación,
N 1 k B'
´
RS
4 1 kB
H = 122/1017 = 0,120 cm
N2 = 1500
L = 1500*0,12 = 180 cm
2 2
1 k´´'B
N 16 R 2
1
S
k B'
2
16 RS2 H (1 k B' ) 3
(t R ) B
1
u (k B' ) 2
= 0,53/0,32 = 1,656
3.- Considerando una columna con una altura de plato de 1.5 mm y con número de platos de
333, por la que fluye el gas portador a un caudal de 3 ml·min-1, y sabiendo que el volumen
muerto es de 1.0 ml:
b.- ¿Cuál sería la anchura en la base de los picos a cada uno de los valores anteriores de k?
Solución:
1,0 mL = tM*3,0
tM = 1/3
VR = tR*F
VR = 0,66*3,0 = 1,98 mL
VR = 1,0*3,0 = 3,0 mL
VR = 2,0*3,0 = 6,0 mL
VR = 3,67*3,0 = 11,01 mL
333 = 16 (0,66/W)2
W = 0,145 min
b) Sabiendo que los anchos de banda en la base para B y C son 1.21 y 2.10 segundos
respectivamente, calcular la resolución entre estos dos picos.