Sunteți pe pagina 1din 20

Tratamiento y Evaluación de Datos Estadísticos - Cromatografía

Para afinar los juicios concernientes a la calidad de las mediciones experimentales se emplean varias pruebas
estadísticas al tratamiento de los resultados analíticos.
Intervalos de confianza, IC
Es el intervalo en torno a la media, x , de un conjunto de valores, determinada experimentalmente, dentro
del cual se espera, con una cierta probabilidad, que esté incluida la media poblacional, µ. La probabilidad se
llama nivel de confianza y generalmente se expresa en porcentaje y la probabilidad de que un resultado este
fuera del intervalo de confianza se llama nivel de significación o nivel de significancia.
Para la curva de Gauss en base a datos poblacionales, la curva se puede representar la frecuencia relativa en
función a la cantidad de z que es igual a, (x - µ)/σ , en base a una sola medida, el intervalo de confianza es,
IC de µ = x ± zσ
Para la x , su expresión es,
IC de µ = x ± zσ/ N
En la tabla siguiente se resume los niveles de confianza con su respectivo valor de z,
Nivel de confianza con diversos valores de z
Nivel de confianza, % Valores de z
50 0.67
68 1.00
80 1.28
90 1.64
95 1.96
95.4 2.00
99 2.58
99.7 3.00
99.9 3.29

Cuando los valores de N son pequeños como es el caso de los datos que se consiguen en el análisis químico,
se emplea la desviación estándar “s” y su variabilidad se explica con el estadístico “t” o “t de Student” que se
define similarmente a “z”, es decir,

t = (x - µ)/s ó t = ( x - µ)/(s/ N )
Luego las expresiones de cálculo para los intervalos de confianza son,

IC de µ = x ± ts ; IC de µ = x ± ts/ N
Los valores de “t” se extraen de Tablas cuyos valores dependerán del nivel de probabilidad y el valor de N ó N
– 1 (conocida como grados de libertad.
Las Pruebas de Hipótesis:
Las pruebas de hipótesis son la base de muchas decisiones a nivel científico. Para explicar una observación se
propone una hipótesis y se prueba experimentalmente para demostrar su validez. Si los resultados de los
experimentos no sustentan al modelo, se rechaza y se busca una nueva hipótesis.
La prueba estadística que mucho se usa es la hipótesis nula, que expresa que las cantidades que se comparan
son la misma. Son dos los resultados contradictorios. En el primero, la hipótesis nula H 0 afirma que µ = µ0. En
el segundo, la hipótesis alterna Ha puede expresarse de diferentes maneras: µ ≠ µ0, µ < µ0 y µ > µ0
La prueba z es apropiada si se tienen resultados muy numerosos, de modo que s es una buena estimación
de σ. La prueba emplea el siguiente procedimiento:
(1) Expresar la hipótesis nula: H0 : µ = µ0
x  u0
(2) Presentar la variable estadística de prueba: z 
σ/ N
(3) Exprese la hipótesis alterna, Ha, y determine la región de rechazo,
Para Ha : µ ≠ µ0, rechace H0, si z ≥ zcrit ó z ≤ -zcrit
Para Ha : µ > µ0, rechace H0, si z ≥ zcrit
Para Ha : µ < µ0, rechace H0, si z ≤ zcrit
En caso de contar con un pequeño número de datos, el procedimiento es similar, en la que se emplea la
prueba estadística “t”, es decir,
(1) Expresar la hipótesis nula: H0 : µ = µ0
x  u0
(2) Presentar la variable estadística de prueba: t 
s/ N
(3) Exprese la hipótesis alterna, Ha, y determine la región de rechazo,
Para Ha : µ ≠ µ0, rechace H0, si t ≥ tcrit ó t ≤ -tcrit
Para Ha : µ > µ0, rechace H0, si t ≥ tcrit
Para Ha : µ < µ0, rechace H0, si t ≤ tcrit

Comparación de dos medias experimentales


Es frecuente que evalúe si la diferencia entre dos medias de dos conjuntos de datos es real o se debe a un
error aleatorio. Se emplea la prueba t tanto para evaluar diferencias entre medias con valores de N diferentes
y valores de N iguales.
Diferencias entre medias con valores de N diferentes: el criterio es el siguiente:
H0 : µ 1 = µ 2
Ha : µ1 ≠ µ2 , la prueba será de dos colas
De acuerdo a la hipótesis nula para las dos medias se demuestra la siguiente expresión,

x1  x2 N1 N2
t calculado 
s comb N1  N2

2 2
s1 (N1  1)  s 2 (N2  1)
s comb 
N1  N2  2

También se puede emplear sd en lugar de scomb a partir de la varianza de la media de los analistas,
La desviación estándar de la media: sm1 = s1/ N1 ; sm2 = s2/ N2

La varianza de la media: s2m1 = s21/N1 ; s2m2 = s22/N2


s2d = s2m1 + s2m2
Prueba t para pareja de datos:
Por ejemplo para comparar métodos analíticos donde los valores de N son iguales.
La hipótesis nula es H0 : µd = 0, donde 0 es un valor específico de la diferencia que se trata de probar,
generalmente cero.
La hipótesis alterna podría ser, µd ≠ 0, µd > 0 ó µd < 0
El valor de la variable estadística de prueba es:
d  Δ0
t calcul  N
sd

Donde d es la diferencia promedio igual a di/N. di, es la diferencia de cada pareja de valores y s d, es la
desviación estándar de esas diferencias.
Errores en las pruebas de hipótesis
Se presentan dos tipos de error, el error tipo I, que ocurre cuando se rechaza H0 pese a ser verdadera. En
algunas ciencias, este tipo de erro se denomina falso negativo. Se presenta un error tipo II cuando se acepta
H0 y en realidad es falsa. Algunas veces también se le llama resultado falso positivo.
Comparación de precisión
La prueba F o prueba de Fisher nos permite evaluar la precisión al comparar las varianzas de dos poblaciones
o muestras siempre y cuando ellas tengan una distribución normal (de gauss). La prueba F también se emplea
para comparar dos o más medias y para el análisis de regresión lineal.
La prueba F se basa en la hipótesis nula de que las dos varianzas poblacionales consideradas son iguales, H 0:
2 2
σ1   2

La prueba F puede utilizarse con una o dos colas. En el caso de una cola, se pone a prueba la hipótesis alterna
de que una varianza es mayor que la otra. Por lo tanto la varianza del procedimiento supuestamente más
preciso se coloca en el denominador, y la del procedimiento menos preciso, en el numerador. La hipótesis
2 2
alterna es, Ha : σ 1  σ 2
2 2
En el caso de una prueba con dos colas lo que se prueba es si las varianzas son diferentes, H a: σ 1  σ 2 . De
ser así, la varianza más grande aparece en el numerador.
Análisis de varianza
El análisis de varianza (ANOVA), se usa para verificar si existe o no diferencia entre las medias de tres o más
poblaciones.
En los procedimientos de ANOVA se detectan diferencias entre medias poblacionales mediante la
comparación de varianzas. Al comparar I medias poblacionales, µ1, µ2, µ3, ………. µI la hipótesis nula H0 tiene la
forma:
H0 : µ1 = µ2 = µ3 = ……….= µI
Y la hipótesis alterna Ha es,
Ha : al menos dos de las medias son diferentes.
ANOVA de un Factor
Diversas cantidades son importantes para poner a prueba la hipótesis nula, H 0 : H0 : µ1 = µ2 = µ3 = ……….= µI
Las medias muestrales de las I poblaciones son, x1 , x2 , x 3, ......,xI
2 2 2 2
Y las varianzas muestrales, s 1 , s 2 , s 3 , ...... s I
La gran media, , que es el promedio de todos los datos, se calcula como el promedio ponderado de las medias
grupales,

 N1  N  N  N 
x    x 1   2  x 2   3  x 3  .....   I  x I
N  N   N  N
Donde, N1 es el número de medidas del grupo 1, N2 lo es del grupo 2, y así sucesivamente. El gran promedio
también se calcula sumando todos los valores de los datos y dividiendo la suma entre el número total de
medidas, N.
El cálculo de la relación de varianzas necesario en la prueba F requiere obtener otras cantidades, llamadas
suma de los cuadrados:
(1) Suma de los cuadrados debido al factor (SCF):
2 2 2 2
SCF = N1 (x 1  x)  N2 (x 2  x)  N3 (x 3  x) ........  NI (x I  x)

(2) Suma de los cuadrados debido al error (SCE):


La suma de los cuadrados de los errores se relaciona con las varianzas grupales mediante la ecuación:
2 2 2 2
SCE = (N1  1)s1  (N2  1)s2  (N3  1)s3  .....  (NI  1)sI

(3) La suma de los cuadrados total, SCT, se obtiene al sumar SCF y SCE
SCT = SCF + SCE
La suma de los cuadrados también puede derivarse de (N - 1)s2, donde s2 es la varianza muestral de todos los
puntos de los datos
La aplicación de los métodos del ANOVA requiere unos supuestos concernientes a las poblaciones en estudio:
1ro. Los métodos del ANOVA usados se basan en el supuesto de varianzas iguales, es decir las varianzas de la
I poblaciones son iguales
2do. Se supone que las I poblaciones sigue la distribución de Gauss.
(4) El número de grados de libertad para cada una de la suma de los cuadrados. La suma de los cuadrados
totales (SCT) tiene N – 1 grados de libertad. SCF tiene I – 1 grados de libertad y por consiguiente SCE tiene N
– I grados de libertad porque SCT es la suma de SCF y SCE,
SCT = SCF + SCE
(N - 1) = (I - 1) + (N - I)
(5) Los valores cuadrados medios: que se obtienen dividiendo la suma de los cuadrados entre sus grados de
libertad correspondiente
Cuadrado medio debido al Factor, CMF = SCF/(I - 1)
Cuadrado medio debido al error, CME = SCE/(N - I)
La cantidad CME es una estimación de la varianza debida al error (  E ), y la CMF es la estimación de la
2

varianza de error más la varianza intergrupal (  E   F2 ).


2

La variable estadística de prueba es el valor de F calculado así,


CMF
F 
CME
La prueba de hipótesis se completa al comparar el valor de F recién calculado frente al valor crítico de la tabla
en el nivel de significancia . Se rechaza H0 si F excede el valor crítico. Los resultados del anova se resumen en
la siguiente tabla,
Fuente de Suma de Grados de Cuadrado Estimaciones F
variación cuadrados libertad medio (CM) del cuadrado
(SC) (gl) medio

Intergrupal SCF I–1 SCF 2 2 CMF


σE  σF
(efecto del CMF 
factor) I1 CME
Intragrupal SCE N-I SCE o
σE
(error) CME 
NI

Total SCT N-1

Diferencia significativa mínima, DSM


Si el ANOVA señala diferencias significativas, podemos conocer ello, por ejemplo, ¿una media es distinta de
las otras?, ¿son diferentes todas la medias?, ¿existen dos grupos distintivos en los cuales se localicen las
medias?.
Con el método de diferencia significativa se calcula una diferencia que se juzga como la menor
significativamente. Luego la diferencia entre cada par de medias se compara posteriormente con la DSM para
determinar que medias son diferentes. La expresión para calcular el DMS para igual número de réplicas Ng en
cada grupo es

2 x CME
DSM  t
Ng
Donde CME es el cuadrado medio del error y el valor de t debe tener N – I grados de libertad.

Prueba o test Q
La prueba Q, es una herramienta estadística para decidir si se conserva o rechaza un resultado discordante.
La aplicación de la prueba Q, se recomienda seguir el siguiente orden:
(1) Se ordena el conjunto de valores de una manera creciente.
(2) Se deduce el valor de Q para evaluar la permanencia del valor menor, con la siguiente expresión,
N2  N1 N2  N1
Q  
Nn  N1 w
Donde w es la dispersión y n es el número total de valores. Se compara el valor de Q con el Q crítico, y si el
valor calculado es menor que valor crítico se conserva el valor menor.
(3) Se deduce el valor de Q para evaluar la permanencia del valor mayor, con la siguiente expresión,
Nn  Nn - 1 Nn  Nn - 1
Q  
Nn  N1 w
Se compara el valor de Q con el Q crítico, y si el valor calculado es menor que valor crítico se conserva el valor
mayor.
(4) La evaluación del conjunto de valores si es necesario termina cuando ya no se rechazan ningún valor.

A continuación los siguientes ejercicios resueltos y propuestos:


7.2-) En el supuesto que se cuente con un gran número de medidas, de modo que s es una gran estimación
de σ, determine qué nivel de confianza se utilizó en cada uno de los intervalos de confianza siguientes:
3.00 s 1.64 s
(a) x  (b) x 
N N
s 2.00 s
(c) x  (d) x 
N N
ts
Solución: partiendo de la definición de intervalo de confianza, x  y de que, s  σ, los valores
N
numéricos de las expresiones propuestas son equivalentes a los valores de “z” cuyos niveles de confianza son:
(a) 99.7% (b) 90%
(c) 68.0% (d) 95.4%
7.4-) Considere los conjuntos siguientes con sus réplicas de medidas:
A B C D E F
3.5 70.24 0.812 2.7 70.65 0.514
3.1 70.22 0.792 3.0 70.63 0.503
3.1 70.10 0.794 2.6 70.64 0.486
3.3 0.900 2.8 70.21 0.497
2.5 3.2 0.472
Calcule la media y desviación estándar de cada uno de los seis conjuntos de datos. Determine también el
intervalo de confianza el 95% de cada uno. ¿Qué significa dicho intervalo?
Solución: los datos son copiados en una hoja de Excel y se calcula la media, la desviación estándar y el intervalo
de confianza. Para calcular el promedio hay que escribir en la celda siguiente a la fila en que se encuentra el
conjunto: para media, =promedio( … ) y para desviación estándar s , =desvest(…. )

A B C D E F
x 3.10 70.19 0.82 2.86 70.53 0.49
S 0.3742 0.0757 0.0511 0.2408 0.2152 0.0161
LC

N 5 3 4 5 4 5
N–1 4 2 3 4 3 4
t, crít 2.78 4.3 3.18 2.78 3.18 2.78
95%
± 0.4652 0.1880 0.0813 0.2994 0.3421 0.0200
Cada intervalo significa un rango de valor en la que se encuentra la media de valores de cada conjunto.
7.8-) Un método de absorción atómica para determinar el contenido de cobre en combustibles generó una
desviación estándar combinada scombinada = 0.32 µg/mL (s  σ). El análisis del aceite de un motor de pistones
arroja el contenido de Cu de 8.53 µg/mL. Calcule los intervalos de confianza al 90 y 99% para el resultado si
este se basó en: (a) un solo análisis, (b) la media de cuatro análisis, (c) la media de 16 análisis.
Solución: para intervalo de confianza, LC =
(a) Cuando hay una sola medida no hay intervalo de confianza.
(b) Para N = 4, tcrítico a 90% = 2.31 ; a 99% = 5.84

LC, 90% = 8.53 ± 0.32x2.35/(4)1/2 = 8.53 ± 0.38


LC, 99% = 8.53 ± 0.32x5.84/(4)1/2 = 8.53 ± 0.93
(c) Para N = 16, tcrítico a 90% = 1.75 ; a 99% = 2.95

LC, 90% = 8.53 ± 0.32x1.75/(16)1/2 = 8.53 ± 0.14


LC, 99% = 8.53 ± 0.32x2.95/(16)1/2 = 8.53 ± 0.24
7.10-) ¿Cuántas réplicas de medidas se precisan para reducir los intervalos de confianza de 95% y 99% a ±0.2
µg de Cu/mL en el ejercicio anterior?
Solución: para determinar el valor de N en los niveles de confianza propuestos hay que probar los valores de
N y de t a partir de la expresión,  t s/ N .
Para : 95% de tablas de t de dos colas
t = 2.23 con N = 11 : ±2.23x0.32/(11)1/2 = ±0.2151
t = 2.13 con N = 16 : ±2.13x0.32/(16) = ±0.1704
Lo que indica que el valor de N debe estar entre 11 y 16 para reducir el intervalo de confianza a 0.20
t = 2.20 con N = 12 :  2.20x 0.32/ 12   0,2032
N = 12
Para : 99% de tablas de t de dos colas
t = 2.84 con N = 21 :  2.84x 0.32/ 21   0,1983
N = 21
7.12-) Un químico obtuvo los porcentajes siguientes de lindano en un análisis por triplicado de un insecticida:
7.47, 6.98 y 7.27. Calcule el intervalo de confianza al 90% para la media de los tres datos si se supone que:
(a) la única información acerca de la precisión del método es la precisión de los tres datos
(b) gracias a una larga experiencia s  σ = 0.28% de lindano
Solución: t = 2.92 de dos colas, al 90% de nivel de confianza con N = 3. Z = 1.64 al 90% de nivel de confianza.
(a) LC = x  t s/ N

x = 7.24 ; s = 0.246 , en una hoja de cálculo de Excel o una calculadora


LC = 7.24 ± 2.92x0.246/(3)1/2 = 7.24 ± 0.42
(b) LC = x  z / N
LC = 7.24 ± 1.64x0.28/(3)1/2 = 7.24 ± 0.27
7.14-) Un método de valoración volumétrica para determinar calcio en la caliza se somete a prueba mediante
análisis de una caliza del NIST que contiene 30.15% de CaO. La media resultante de cuatro análisis es 30.26%
de CaO, con desviación estándar de 0.085%. Al combinar los datos de varios análisis se establece que s  σ =
0.094% CaO.
(a) ¿Indican los datos la presencia de un error sistemático en el nivel de confianza del 95%?
(b) ¿Reflejarían los datos la presencia de un error sistemático en el nivel de confianza del 95% si no se tuviera
el valor combinado de s?
Solución: al nivel de confianza del 95%: t = 3.18 con N = 4 ; z = 1.96
x  u0
(a) se aplica la expresión, t 
s/ N
tcalc = (30.26 - 30.15)(4)1/2/0.085 = 2.59
el t, 2.59 es menor de 3.18, por lo tanto no hay error sistemático
x  u0
(b) se aplica la expresión: z 
σ/ N
zcal = (30.26 - 30.15)(4)1/2/0.094 = 2.34
Aquí el z calculado es mayor que el z crítico(1.96) y si reflejaría error sistemático, por lo tanto la no existencia
del s combinado no reflejaría error sistemático
7.16-) Un fiscal en un caso de homicidio presenta como prueba principal pequeños fragmentos de vidrio
incrustados en el abrigo del acusado. El fiscal afirma que los fragmentos son de composición idéntica a los de
la ventana cuyos cristales fueron rotos durante el delito, de un raro vidrio teñido de origen belga. El promedio
de análisis por triplicado de cinco elementos de vidrio se muestra en la tabla adjunta. Según estos datos,
¿tendría bases el acusado para afirmar que existe una duda razonable de su culpabilidad? Utilice el nivel de
confianza del 99% como criterio de duda.
Elemento Concentración, ppm s  σ
En la ropa En la ventana
As 129 119 9.5
Co 0.53 0.60 0.025
La 3.92 3.52 0.20
Sb 2.75 2.71 0.25
Th 0.61 0.73 0.043
Solución: : t, crítico = 4.60 para 99% de nivel de confianza y GL = 6 – 2 = 4. La expresión a utilizar es,

x1  x2 N1 N2
t calculado 
s comb N1  N2

As: tcalc = (10/9.5)(9/6)1/2 = 1.29, no hay diferencia C


Co: tcalc = (-0.07/0.025)(9/6)1/2 = -3.42; tcalc  -4.60 por lo tanto no hay diferencia o son similares
La: tcalc = (0.40/0.20)(9/6)1/2 = 2.45, no hay diferencia o son similares
Sb: tcalc = (0.04/0.25)(9/6)1/2 = 0.20, no hay diferencia o son similares
Th: tcalc = (-0.12/0.043)(9/6)1/2 = -3.42, tcalc  -4.60 por lo tanto no hay diferencia o son similares
En el análisis de los 5 elementos, la estadística muestra que los valores de sustancia química, que se encontró
en la ropa y en la ventana son los mismos, por lo tanto el acusado no dispone de una duda razonable para
mostrar su inocencia.
7.17-) Los contaminantes de aguas residuales e industriales pueden reducir la concentración de oxígeno
disuelto y tener efectos adversos en las especies acuáticas. Con el fin de efectuar un estudio se obtienen
medidas semanales en el mismo lugar de un río durante un periodo de dos meses.
Semana O2, disuelto, ppm
1 4.9
2 5.1
3 5.6
4 4.3
5 4.7
6 4.9
7 4.5
8 5.1

Algunos científicos piensan que 5.0 ppm es una concentración de O 2 disuelto en la que apenas pueden vivir
los peces. Aplique una prueba estadística para determinar si la concentración media de O 2 disuelto es menor
de 5.0 ppm para el nivel de confianza del 95%. Exprese claramente la hipótesis nula y alterna.
Solución:
H0 : µ = 5.0 ppm de O2
Ha : µ < 5.0 ppm de O2
Con una hoja de cálculo de Excel mediante las expresiones de =promedio(…) y =desvest(…) se determina:
x = 4.89 ; s = 0.40
x  u0
Se aplica: t 
s/ N
tcalculado = [(4.89 - 5.0)/0.40](8)1/2 = -0.78
tcritico = -2.36 (con N = 8 y nivel de 95%)
Luego, tcalculado < tcrítico se acepta la hipótesis nula, la concentración media de O2 es igual a 5.0 ppm y los peces
viven.
7.20-) La concentración de un contaminante en un río cercano a una planta química se vigila con regularidad.
Su concentración normal se ha establecido a lo largo de los años mediante análisis químicos. La compañía
efectuó en fecha reciente, varios cambios en la planta, lo que al parecer incrementa los valores de
contaminación. Las autoridades encargadas de la protección ambiental exigen pruebas concluyentes de que
no ocurrió tal efecto. Exprese la hipótesis nula y alterna pertinente, además de describir los errores tipo I y II
que podrían ocurrir en esta situación.
Solución:
Error tipo I: después de haber realizado determinaciones por triplicado en una semana del elemento
contaminante a vigilar, el responsable de los resultados del análisis informó que el contaminante durante la
semana con cambios en la planta superaba el estándar normal.
H0 : µ = concentración normal
Ha : µ > concentración normal
Por lo tanto se acepta la hipótesis alterna
Una revisión del trabajo del análisis químico encuentra que uno de los reactivos estaba contaminado con el
elemento en investigación de tal manera que los resultados fueron corregidos y ahora el contaminante está
dentro de la concentración normal. Es decir se rechazó la hipótesis nula siendo ella verdadera.
7.22-) La homogeneidad de la concentración de cloruro en una muestra de agua de un lago es sometida a
prueba mediante el análisis de porciones extraídas de las aguas superficiales y cercanas al fondo, con los
resultados siguientes (en ppm Cl)
Superficie Fondo
26.30 26.22
26.43 26.32
26.28 26.20
26.19 26.11
26.49 26.42
(a) Aplique la prueba t en el nivel de confianza del 95% para determinar si las medias son diferentes
(b) Use la prueba t para pares de datos con el fin de determinar si existen diferencias significativas entre los
valores de la superficie y el fondo para el nivel de confianza del 95% o no la hay
(c) ¿Por qué se llega a una conclusión distinta si se utiliza la prueba t para pares de datos y si se combinan
simplemente los datos y se utiliza la prueba t normal de la diferencia entre las medias
Solución: (a) aplicando las expresiones,

x1  x2 N1 N2
t calculado 
s comb N1  N2

2 2
s1 (N1  1)  s 2 (N2  1)
s comb 
N1  N2  2

Y la utilización de una hoja de cálculo (o una calculadora) se determinan los promedios y las varianzas,
(subíndice 1 para la superficie y subíndice 2 para el fondo)
x 1 = 26.338 ; x 2 = 26.254
s21 = 0.01457 ; s22 = 0.01418
scombinada = 0.120
tcalculado = 1.107
tcrítico = 2.31, GL = 8 ; 95% de nivel de probabilidad
t calculado es menor que t crítico por lo tanto las medias de ppm de Cl en el la superficie y en fondo no son
diferentes en este tipo de prueba
(b) Aplicamos la expresión,
d  Δ0
t calcul  N
sd

Y la utilización de una hoja de cálculo (o una calculadora) se determina el promedio de las diferencias de las
medidas de Cl en las porciones de agua del lago y la desviación estándar, considerando que 0 = 0
Superficie Fondo Diferencia
26.30 26.22 +0.08
26.43 26.32 +0.11
26.28 26.20 +0.08
26.19 26.11 +0.08
26.49 26.42 +0.07

d = 0.084 ; sd = 0.0152 ; N = 5
tcalculado = 12.35
tcrítico = 2.78 al 95% de nivel de probabilidad
t calculado es mayor que t crítico por lo tanto las medias de ppm de Cl en el la superficie y en fondo son
diferentes en este tipo de prueba
(c) la prueba t en pareja es mucho más exigente para evaluar conjuntos de medidas que la prueba t de
promedio.
7.24-) Lord Rayleigh preparó muestras de nitrógeno con varios métodos distintos. Midió la densidad de cada
muestra como la masa del gas necesaria para llenar un matraz específico a una cierta presión y temperatura.
Las masas de muestras de nitrógeno preparadas por descomposición de diversos compuestos de nitrógeno
fueron 2.29280, 2.29940 y 2.30054 g. Las masas de “nitrógeno” preparadas al extraer oxígeno del aire con
técnicas diversa fueron 2.31001, 2.31163 y 2.31028. ¿Difiere significativamente la densidad de nitrógeno
preparado a partir de compuestos de nitrógeno y la densidad del nitrógeno a partir del aire? ¿Qué
probabilidades existen de que la conclusión sea errónea? (El estudio de esta diferencia ocasionó que Sir
William Ramsey, Lord Rayleigh, descubriera los gases inertes)
Solución: se plantea la siguiente hipótesis,
H0 : x1  x 2
Ha : x1  x 2
x1  x2 N1 N2
t calculado 
s comb N1  N2

2 2
s1 (N1  1)  s 2 (N2  1)
s comb 
N1  N2  2

En una hoja de cálculo o con una calculadora obtenemos,


x1  2.298 , de nitrógeno a partir de compuestos
x 2  2.311 , de nitrógeno a partir del aire
s12 = 1.185x10-5 ; s22 = 7.533x10-7
scombinada = 0.00272
tcalculado = - 6.17
tcrítico : a 95% = 2.57 ; a 99% = 4.03 ; a 99.9% = 6.87 , con GL en los tres casos de 5
La expresión de contraste es: si t calculado < - t crítico hay diferencias en las determinaciones,
A 95% : -6.172 < - 2.57 son diferentes las determinaciones
A 99% : -6.172 < - 4.03 son diferentes las determinaciones
A 99.9% : -6.172 > - 6.87 son similares las determinaciones
Por lo tanto las densidades de los dos procedimientos difieren hasta el nivel de probabilidad del 95% al 99%.
Luego la probabilidad de que la conclusión sea errónea es menor del 1%
7.26-) Se midió la concentración de ácido ascórbico en cinco marcas distintas de jugo de naranja. Se analizaron
6 réplicas de cada marca, y se recogieron los siguientes datos:
Fuente de variación SC gl CM F
Entre marcas ----- ----- ----- 8.45
En una marca ----- ----- 0.913
Total ----- -----
(a) Complete la tabla
(b) Establezca la hipótesis nula y alterna
(c) ¿Existe diferencia en el contenido de ácido ascórbico de las cinco marcas para el nivel de confianza del 95%
Solución: (a) la aplicación de las expresiones de los resultados del ANOVA nos permite obtener lo siguiente:
N = 5x6 = 30
I = 5, número de marcas
CME = SCE/(N - I) = 0.913 = SCE/(30 – 5)
SCE = 22.825
F = CMF/CME = 8.45 = CMF/0.193
CMF = 1.63085
gl entre marcas = 5 - 1 = 4
gl en una marca = 30 - 5 = 25
gl total = 4 + 25 = 29
CMF = SCF/(I - 1) = 1.63085 = SCF/(5 – 1)
SCF = 6.5234
Suma de cuadrados total = 1.63085 + 6.5234 = 8.15425
(b) H0 : µ1 = µ2 = µ3 = µ4 = µ5
Ha : µ1 ≠ µ 2 ≠ µ 3 ≠ µ 4 ≠ µ 5
(c) De tablas el valor de F para un nivel de confianza de 95% con 4 y 25 grados de libertad es de 5.769. Luego
existen diferencias del contenido de ácido ascórbico en las 5 marcas pues el valor de F calculado es mayor.
7.28-) Cuatro analistas emprenden diversas determinaciones de mercurio en una misma muestra analítica.
Los resultados se muestran en ppb de Hg en la tabla:
Análisis Analista 1 Analista 2 Analista 3 Analista 4
1 10.24 10.14 10.19 10.19
2 10.26 10.12 10.11 10.15
3 10.29 10.04 10.15 10.16
4 10.23 10.07 10.12 10.10
(a) Exprese las hipótesis apropiadas
(b) Indique si los análisis difieren para los niveles de confianza del 95%, 99% (F crit = 5.95) y 99.9% (Fcrit =
10.80)
(c) ¿Qué analistas difieren del resto en el nivel de confianza del 95%?
Solución:
(a) H0 : µ1 = µ2 = µ3 = µ4
Ha : µ1 ≠ µ 2 ≠ µ 3 ≠ µ 4
(b) Aplicando los resultados del ANOVA en una hoja de cálculo,
Análisis Analista 1 Analista 2 Analista 3 Analista 4
1 10.24 10.14 10.19 10.19
2 10.26 10.12 10.11 10.15
3 10.29 10.04 10.15 10.16
4 10.23 10.07 10.12 10.10
Prom 10.255 10.0925 10.1425 10.15
s^2 0.0007 0.0021 0.0013 0.0014
N = 4x4 =16 I=4 gl, factor 4–1 = 3
Prom mayor 10.16 gl, analista 16 - 4 = 12
SCF = 0.05595 SCE = 0.01645
CMF = 0.01865 CME = 0.00137083
F = 13.6048632
Para un nivel de confianza del 95% con grados de libertad de 3 y 12,
Fcrítico = 8.74 ; luego el F calculado es mayor que el F crítico y entonces hay diferencia entre las mediciones
de los analistas.
Esto es similar para los niveles de confianza del 99% y 99.9%.
(c) calcularemos el valor de DSM, para GL=16-4 = 12. t= 2.18. Ng = 4

2 x CME
DSM  t
Ng

DSM = 2.18(2x0.00137083/4)1/2 = 0.057


Orden descendente de los promedios: analista 1 (1) = 10.255; analista 4(2) = 10.15; analista 3 (3) = 10.1425;
analista 2(4) = 10.0925
(1): 10.255 - 10.0925 = 0.1625 (son diferentes), mayor que DSM
(4): 10.15 - 10.0925 = 0.0575 (son diferentes), mayor que DSM
(3): 10.1425 - 10.0925 = 0.050 (no hay diferencia) menor que DSN
Los analistas (1) y (4) difieren del analista (2)
(1): 10.255 - 10.1425 = 0.1125 (son diferentes), mayor que DSM
(4): 10.15 - 10.1425 = 0.0075 (no hay diferencia), menor que DSM
El analista 1 difiere del analista 3
7.30-) Se compararan tres métodos analíticos distintos para determinar el calcio. Interesa saber si los métodos
difieren o no. Los resultados siguientes corresponden al calcio (en ppm) determinados por colorimetría,
valoración con EDTA y espectrofotometría de absorción atómica.
Repetición Colorimetría Valoración con Absorción
EDTA atómica
1 3.92 2.99 4.40
2 3.28 2.87 4.92
3 4.18 2.17 3.51
4 3.53 3.40 3.97
5 3.35 3.92 4.59
(a) Exprese la hipótesis nula y alterna
(b) Determine si existen diferencias entre los tres métodos en los niveles de confianza del 95 y 99%.
(c) Si identifica una diferencia en el nivel de confianza de 95%, determine qué métodos difieren entre si.

Solución: (a) las hipótesis, donde (1) es el método colorimétrico, (2) la valoración con EDTA y (3) el método de
absorción atómica
H0 : µ 1 = µ 2 = µ 3
Ha : µ1 ≠ µ 2 ≠ µ 3
(b) Aplicando los resultados de la ANOVA en una hoja de cálculo se obtiene,
Valoración Absorción
Repetición Colorimetría
con EDTA atómica
1 3.92 2.99 4.4
2 3.28 2.87 4.92
3 4.18 2.17 3.51
4 3.53 3.4 3.97
5 3.35 3.92 4.59
Prom 3.652 3.07 4.278
s^2 0.14877 0.42195 0.30227
N = 15 I=3 gl fac tor 2
Prom mayor 3.66667 gl analista 12
SCF 3.64977 SCE 3.49196
CMF 1.824885 CME 0.29099667
F 6.27
Los valores críticos de F para los grados de libertad de 2 y 12:
A un nivel de confianza del 95% : 19.41
A un nivel de confianza del 99% : 99.419
Los métodos no son diferentes al nivel de confianza del 95 y 99%
(c) Los métodos son similares
7.34-) A continuación se muestran tres conjuntos de datos para la masa atómica del antimonio que proviene,
que proviene del trabajo de Willard y McAlpine.
Conjunto 1 Conjunto 2 Conjunto 3
121.771 121.784 121.752
121.787 121.758 121.784
121.803 121.765 121.765
121.781 121.794
(a) Determine la media y la desviación estándar de cada conjunto de datos
(b) Encuentre el intervalo de confianza del 95% para cada conjunto de datos
(c) Establezca si el valor 121.803 del primer conjunto de datos es un valor atípico de dicho conjunto en el nivel
de confianza del 95%
(d) Utilice la prueba t para determinar si la media del conjunto de datos 3 es idéntica a la del conjunto 1 en el
nivel de confianza del 95%.
(e) Compare la media de los tres conjuntos mediante ANOVA. Formule la hipótesis nula. Determine si las
medias difieren en el nivel de confianza del 95% o no.
(f) Combine todos los datos y determine la media y la desviación estándar combinada
(g) Compare la media global de los 11 puntos de datos frente al valor aceptado. Diga cuales son el error
absoluto y el porcentaje de error relativo, en el supuesto que el valor aceptado sea el verdadero
Solución:
(a) Utilizando una calculadora o una hoja de cálculo de Excel obtenemos la media y la desviación estándar
Conjunto 1 Conjunto 2 Conjunto 3
Promedio 121.7855 121.77525 121.767
S 0.013404 0.016641 0.016093

(b)Los límites de confianza


Conjunto 1: t = 3.18 para el 95% de nivel de confianza
LC = 121.7855 ± 3.18x0.013404/(4)1/2 = 121.7855 ± 0.0213
Conjunto 2: t = 3.18 para el 95% de nivel de confianza
LC = 121.7753 ± 3.18x0.016641/(4)1/2 = 121.7753 ± 0.0265
Conjunto 3: t = 4.30 para el 95% de nivel de confianza
LC = 121.767 ± 4.30x0.016093/(3)1/2 = 121.7855 ± 0.0400
(c) ordenamos de una manera creciente los datos para aplicar la Prueba Q: 121.771; 121.781; 121.787 y
121.803
Comenzamos a evaluar el número menor:
Q = (121.781 – 121.771)/(121.803 – 121.771) = 0.3125
Q crítico = 0.829 para N = 4 y nivel de confianza del 95%. Por lo tanto el número menor se conserva
La evaluación del número mayor (número en cuestión)
Q = (121.803 – 121.787)/(121.803 – 121.771) = 0.500
Q crítico = 0.829 para N = 4 y nivel de confianza del 95%. Por lo tanto el número 121.803 se conserva
(d) Para ello utilizaremos la prueba t para promedios,
Conjunto 1 Conjunto 3
121.771 121.752
121.787 121.784
121.803 121.765
121.781
Promedio 121.7855 121.767
s^2 0.00017967 0.000259
s, combinada 0.0145396
t, calculada 1.66594569

t crítico = 2.57 ; para GL = 7-2 = 5 y 95% de nivel de confianza. Luego como t calculado es menor que t crítico,
los promedios de los conjuntos evaluados son similares.
(e) la hipótesis es, (colorimetría, absorción atómica y valoración con EDTA)
H0 : µ 1 = µ 2 = µ 3
Ha : µ1 ≠ µ 2 ≠ µ 3
la ANOVA:
Conjunto 1 Conjunto 2 Conjunto 3
121.771 121.784 121.752
121.787 121.758 121.784
121.803 121.765 121.765
121.781 121.794
Promedio 121.7855 121.77525 121.767
s^2 0.00017967 0.00027692 0.000259
N = 11 I=3 gl, factor 2
Prom. Mayor 121.776727 gl, analista 8
SCF 0.00060043 SCE 0.00188775
CMF 0.00030022 CME 0.00023597
F 1.272
El valor de F a 95% para los grados de libertad de 2 y 8 es 19.371, por lo tanto no hay diferencia entre los
conjuntos.
(f) En la hoja de cálculo de Excel o una calculadora
Promedio global = 121.776727
s, combinada = 0.01577397
(g) EA = 121.776727 - 121.803 = - 0.026273
ER = -0.026273x100/121.803 = - 0.022
Ejercicios sobre cromatografía

23.18 (a) Una columna cromatográfica de longitud 10,3 cm y diámetro interior 4,61 mm está
empaquetada con una fase estacionaria que ocupa el 61% de su volumen. Si el caudal es de
1,13 mL/min hallar la velocidad lineal de flujo en cm/min.

(b)¿Cuánto tiempo tardará el disolvente (que es el mismo que tarda un soluto no retenido) en
atravesar la columna?

(c) Hallar el tiempo de retención de un soluto que tiene un factor de retención o de capacidad
de 10,0

Solución: (a) luego el 39% del volumen total interior es el conducto por donde va la fase
móvil, luego,
Volumen de fase móvil = 0,39*(d/2)2*h = 0,39*(0,461 cm/2)2*10,3 = 0,6705 cm3

Tiempo utilizado para que el volumen calculado pase por la columna,

t = 0,6705/1,13 = 0,59336 min

velocidad lineal, u = 10,3/0,59336 = 17,4 cm/min

(b) tm = L/u = 10,3 /17,4 = 0,593 min

(c) k´ = (tr - tm)/tm = (tr - 0,593)/0,593 = 10,0

tr = 6,53 min

23.20 Un procedimiento cromatográfico separa 4,0 mg de una mezcla desconocida en una


columna de 40 cm de longitud y 0,856 cm de diámetro.

(a) ¿Qué tamaño debe tener la columna para separar 100 mg de la misma mezcla?

(b) Si el caudal es de 0,22 mL/min en la columna pequeña, ¿qué caudal debe usarse en la
columna grande?

(c) Si la fase móvil ocupa el 35% del volumen de la columna, calcular la velocidad lineal de
flujo en la columna pequeña y en la columna grande?

Solución: (a) masa 1 / masa 2 = (d1/d2)2

100 mg/4 mg = (d1/0,856)2

d1 = 4,28 cm

La columna puede tener la misma longitud de 40 cm pero el diámetro es de 4,28 cm

(b) Caudal 1/ Caudal 2 = (d1/d2)2

Caudal 1 / 0,222 = (4,28/0,856)2

Caudal 1 = 5,5 mL/min

(c) V, columna 1 = 0,35**(4,28/2)2*40 = 201,422 cm3

Flujo lineal = 40/(201, 422/5,5) = 1,09 cm/min

V, columna 2 = 0,35**(4,28/2)2*40 = 8,057 cm3

Flujo lineal = 40/(8, 057/0,22) = 1,09 cm/min

24.19 (a) Cuando se analizó una disolución de 10,0 mL que contenía 234 mg de pentanol
(PF= 88,15) y 237 mg de 2,3-dimetil-2-butanol (PF= 102,17), la relación de áreas de los picos
de pentanol: 2,3-dimetil-2-butanol fue de 0,913:1,00. Suponiendo que el pentanol es el patrón
interno, hallar el factor de respuesta del 2,3-dimetil-2-butanol.

(b) Teniendo en cuenta los cromatogramas para el pentanol y 2,3-dimetil-2-butanol sus W1/2
son respectivamente 2,2 y 1,5 minutos (las alturas de los picos son 41,4 y 76,0 mm)
respectivamente , calcular las áreas de sus picos (teniendo en cuenta que se asemejan a un
pico gausiano) es igual a 1,064*altura de pico*W1/2.

Solución: (a)

Area de 2,3-dimetil-2-butanol/[2,3-dimetil-2-butanol] = F*Area de Pentanol/[Pentanol]

1,0/(237/10) = F*0,913/(234/10)

F = 1,081

(b) Area butanol = 1,064*41,4*2,2 = 96,91 mm*min

Area de 2,3-dimetil-2-butanol = 1,064*76,0*1,5 = 121,3 mm*min

Ejercicios propuestos

1. - En una columna tubular abierta de paredes recubiertas, de 1000 cm de longitud y 0.25


mm de diámetro, el gas portador (helio) circula a una velocidad de 37 cm/s. El tiempo de
retención, tr, para el decano es de 1.27 min, y la anchura a media altura del pico es de 0.88 s.
Calcular el factor de capacidad para el decano, el número de platos efectivos de la columna
y la altura de plato.

Solución:

u = L/tm

tm = 1000/37 = 27,03 s = 0,45 min

k´ = (1,27 - 0,45)/0,45 = 1,82

N = 5,54 (1,27/(0,88/60))2 = 41 538,84 = 41 539 platos

H = 1000 cm/41539 = 0,024 cm/plato

2.- En una columna de 122 cm de longitud y a una temperatura de 160ºC se obtuvieron los
siguientes tiempos de retención en minutos: pico del aire 0.90, heptano 1.22 y octano 1.43.
El ancho en la base de los picos fue de 0.14 min para el heptano y de 0.20 min para el octano.

a) Calcular la retención relativa y la resolución para estos picos.

b)¿Qué longitud debería tener la columna para obtener una resolución de 1.5?
Solución:

(a) tr´.heptano = 1,22 - 0,90 = 0,32 min

tr´.octano = 1,43 - 0,90 = 0,53 min

(b) k´y  no cambian al variar N y L, entonces se puede derivar una ecuación para N1 y N2
de la siguiente ecuación,

N    1   k B' 
 ´
RS   
4   1  kB 

(RS)1 / (RS)2 = (N1)1/2/(N2)1/2

(RS)1 = 2(1,43 - 1,22)/(0,14 + 0,20) = 1,235

N, heptano = 16 (1,22/0,14)2 = 1215

N, octano = 16 (1,43/0,20)2 = 818

N1 = (1215 + 818)/2 = 1016,5 = 1017

También se asume que H no cambian al variar N y L

H = 122/1017 = 0,120 cm

1,235 / 1,5 = (1017/N2)1/2

N2 = 1500

L = 1500*0,12 = 180 cm

2 2
    1  k´´'B 
N  16 R  2
  
   1
S
 k B' 

2
16 RS2 H    (1  k B' ) 3
(t R ) B  
   1 
u   (k B' ) 2

 = 0,53/0,32 = 1,656

k´B = 0,53/0,9 = 0,589


tR,B = 1,43 min

3.- Considerando una columna con una altura de plato de 1.5 mm y con número de platos de
333, por la que fluye el gas portador a un caudal de 3 ml·min-1, y sabiendo que el volumen
muerto es de 1.0 ml:

a.- ¿Cuáles son el tiempo de retención y el volumen de retención cuando k es 1, 2 ,5 y 10?

b.- ¿Cuál sería la anchura en la base de los picos a cada uno de los valores anteriores de k?

Solución:

(a) Cuando k = 1,0

Volumen de la fase móvil, VM = tM*F

1,0 mL = tM*3,0

tM = 1/3

k = (tR - tM)/ tM ; 1,0 = (tR - 1/3)/(1/3)

tR = 0,66 min (k = 1,0)

VR = tR*F

VR = 0,66*3,0 = 1,98 mL

tR = 1,0 min (k = 2,0)

VR = 1,0*3,0 = 3,0 mL

tR = 2,0 min (k = 5,0)

VR = 2,0*3,0 = 6,0 mL

tR = 3,67 min (k = 10)

VR = 3,67*3,0 = 11,01 mL

(b) para k = 1,0

333 = 16 (0,66/W)2
W = 0,145 min

4.- El 1,2,3-trimetilbenceno tiene un tiempo de retención corregido de 21.3 min a 200ºC y de


13.3 min a 225ºC. ¿Sería posible eluir este compuesto en menos de diez minutos, sabiendo
que con la fase líquida que contiene la columna de cromatografía de gases se puede trabajar
hasta 275ºC?

5. –Calcular a) el factor de capacidad o de retención k, y b) la resolución Rs, de los siguientes


analitos en un sistema cromatográfico por HPLC, con los datos que figuran en la siguiente
tabla:

Analito tr, min w, s


propoxur 1.72 29
carbaryl 5.52 39
1-naftol 7.34 30
methiocarb 7.70 65

to= 1.12 min

c) Indicar si los picos cromatográficos de los componentes de la muestra están bien

resueltos; d) calcular el número de platos teóricos efectivos para el 1-naftol.

6.- En un cromatograma, los tiempos de retención de los picos A, B y C, donde A es una


sustancia no retenida, son 0.84, 10.60 y 11.08 minutos, respectivamente.

a) Calcular los tiempos de retención corregidos y los factores de capacidad para B y C.

b) Sabiendo que los anchos de banda en la base para B y C son 1.21 y 2.10 segundos
respectivamente, calcular la resolución entre estos dos picos.

S-ar putea să vă placă și