Documente Academic
Documente Profesional
Documente Cultură
NTRODUCCIN AL
TRATAMIENTO DE DATOS
1.1 CONCEPTOS FUNDAMENTALES
La estadstica es una disciplina matemtica formada por un conjunto de mtodos adecuados para
manejar (recoger, representar, clasificar y resumir) datos, as como para hacer inferencias (extraer
consecuencias) cientficas a partir de ellos. Segn esta definicin podemos distinguir entre:
a) ESTADSTICA DESCRIPTIVA, estudia la poblacin de la que derivan los datos.
b) INFERENCIA ESTADSTICA, predice el comportamiento y extrae conclusiones a partir de una
informacin incompleta. Esta permite, a partir de los resultados de una(s) muestra(s), obtener
conclusiones vlidas para una poblacin entera.
Una POBLACIN de medidas son todas las posibles medidas que puedan ser realizadas, mientras que
MUESTRA es un conjunto de medidas seleccionadas de esa poblacin.
1.2 VARIABLES
Son propiedades respecto a las cuales los elementos de una muestra se diferencian entre s. Las variables
pueden ser medidas en tres tipos de escalas estadsticas:
a) ESCALA NOMINAL. Se utiliza cuando los individuos u objetos pueden slo ser descritos con palabras
(ejemplo un objeto puede ser blanco, negro, etc.). Estas suelen llamarse variables cualitativas,
categricas o atributos.
b) ESCALA ORDINAL. Se utiliza cuando se dan valores de rango a las variables. La calidad de un objeto
puede ser muy mala, mala, media, buena o excelente. Las variables medidas en esta escala se
denominan variables de rango.
c) ESCALA DE DIVISIONES E INTERVALOS. Se utilizan cuando la distancia o diferencia a lo largo de la
escala puede medirse con un nmero, por ejemplo las medidas de temperatura. Estas se denominan
variables cuantitativas o variables de medida.
Dentro de las VARIABLES CUANTITATIVAS podemos distinguir entre variables discretas y continuas.
a) VARIABLE DISCRETA cuando toma un nmero finito de valores o aunque dicho nmero sea infinito, si
pueden ser ordenados en una secuencia es una variable discreta. As los das del ao son variables
discretas.
b) VARIABLE CONTINUA cuando puede tomar cualquier valor dentro de un intervalo. As, son variables
continuas la concentracin, la longitud o la temperatura.
Frecuencia de clase
10
12
4
3
Suele interpretarse como la media aritmtica de las desviaciones absolutas respecto a la media.
1.3.2.4 DESVIACIN ESTNDAR O TPICA
Se calcula mediante las siguientes expresiones:
( )2
=
( )2
=
1
1
Donde 2 es la varianza poblacional y 2 es la varianza muestral. Es tambin muy utilizada ya que es fcil
de calcular. El principal inconveniente es que viene expresada en unidades que son el cuadrado de las
unidades de las observaciones originales.
1.3.2.6 DESVIACIN ESTNDAR RELATIVA (DER). Tambin llamada coeficiente de variacin (CV) se
estima a travs de la expresin:
= 100
= 100
La DER se expresa en % siendo un nmero independiente de las unidades de medida. Es muy utilizada
espacialmente cuando queremos informar del % de dispersin de datos.
4
= (0.05;1) ( )
Donde t es el estadstico t de student; 0.05 es el nivel de riesgo de la prueba y que equivale a asumir un 5%
de error en su aplicacin; n-1 son los grados de libertad con los que se aplica la prueba, n es el nmero de
datos de la prueba. Los valores del estadstico t, se encuentran tabulados para un nivel de riesgo () y grados
de libertad (n-1) determinados.
1.5 TEST DE HIPTESIS
Los test de hiptesis se usan para aceptar o rechazar una hiptesis que se emite sobre un parmetro de una
poblacin. Los test de hiptesis, tambin llamados test de significacin o prueba de hiptesis, son un conjunto
de reglas que permiten decidir que hiptesis debe aceptarse o rechazarse a partir del resultado obtenido en
una muestra.
En un test de significacin se plantean dos hiptesis: la HIPTESIS NULA (H0) y la HIPTESIS
ALTERNATIVA (H1). Las siguientes reglas son de gran inters para la aplicacin de un test de hiptesis:
1. La hiptesis nula siempre debe plantearse como una igualdad: H0: 1 = 2
2. Toda hiptesis nula tiene su hiptesis alternativa, la cual es confirmada si la hiptesis nula es rechazada,
es decir si el test conduce a un resultado negativo: 1 : 1 2
3. Si la hiptesis nula no resulta rechazada ello no implica su aceptacin, sino que para los datos existentes
las diferencias no son concluyentes.
4. En todo test de hiptesis se pueden cometer dos tipos de errores: (tipo 1) y (tipo 2) (ver Figura 2).
5. Cada resultado de un test es slo vlido para un cierto nivel de significacin, P, libremente elegido. En
general se utiliza un nivel P = 0.95 que corresponde a un riesgo = 0.05 ( = 1 - P).
Para realizar un test, es necesario representar numricamente H0 y H1 y para ello es indispensable realizar
medidas experimentales.
Estas permiten el clculo de una cantidad numrica, Ccal, denominada estadstico calculado. Esta cantidad
se compara con otra cantidad terica, denominada estadstico de control o de contraste, obtenida en funcin
del tamao de muestra, del nivel de confianza (1-) fijado y del tipo de prueba (una o dos colas).
Generalmente el estadstico de contraste se encuentra tabulado (Ctab) y corresponde a los valores P(x) de
una distribucin de determinada probabilidad. En general los resultados de esta comparacin pueden ser:
Ccal < Ctab H0 (No significacin) (Se acepta H0)
Ccal Ctab H1 (Significacin) (Se rechaza H0)
1.7.1 TEST DE DETECCIN DE ANMALOS
La presencia de datos anmalos (outliers) o muestras errneas que no son representativas del resto de los
datos tiene una gran influencia en la estimacin de parmetros como la media y la desviacin estndar. Por
ello es necesario su deteccin y eliminacin del conjunto de datos. Para tal fin existen diferentes test, siendo
el de Dixon, Grubbs y Hubber de los ms populares. En este curso usaremos el test de Dixn.
1.7.1.1 TEST DE DIXON
Es uno de los ms utilizados ya que es muy fcil de calcular. Para su aplicacin los datos deben estar
ordenados en orden creciente de magnitud. Est basado en la comparacin de la diferencia entre el valor
sospechoso y su vecino ms cercano sobre el rango de los datos o el rango modificado. Este se calcula
como:
( 1 )
=
( )
Dnde: Q cal es el estadstico de Dixon calculado, X n es el valor sospechoso, Xn-1 es el valor ms prximo al
sospechoso, X mayor es el valor mayor de la serie de datos y X menor es el menor valor de la serie de datos.
Las hiptesis nula y alternativa planteadas son:
H0: X n no es un valor sospechoso y no debe ser eliminado de la serie de datos
H1: X n es un valor sospechoso y debe ser eliminado de la serie de datos
El valor de Q cal se compara con el Q tab a un determinado nivel de significacin (P).
CONCLUYENDO QUE:
Si el Q calculado es mayor que el valor de Q tabulado (Q cal > Q tab) el dato sospechoso es errneo y hay
que eliminarlo de la serie de datos.
Si el Q calculado es menor que el valor de Q tabulado (Q cal < Q tab) el dato sospechoso NO es errneo y
NO hay que eliminarlo de la serie de datos.
1 : < ( < 0)
Para comprobar estas hiptesis, partimos de la siguiente ecuacin:
(0.05;1)
= (
)
Reorganizando, esta ecuacin para ponerla en funcin t, tenemos la ecuacin de clculo de la t de student
para esta prueba:
| |
=
Mediante esta ecuacin se calcula el valor de t, y se compara con el valor del estadstico t de student tabulado
a un nivel de confianza () de 0.05 y n-1 grados de libertad. Las hiptesis nula y alternativa planteadas en
este caso son:
0 : = (La media de la serie de datos es igual al valor verdadero o de referencia)
1 : (La media de la serie de datos es distinta al valor verdadero o de referencia)
CONCLUYENDO QUE:
Si el t calculado es mayor que el valor de t tabulado (tcal > ttab) La media de la serie de datos es distinta al
valor verdadero o de referencia.
Si el t calculado es menor que el valor de t tabulado (tcal < ttab) La media de la serie de datos es igual al
valor verdadero o de referencia.
1.7.2.2 COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES
En funcin del tamao de muestra, dos diferentes aproximaciones pueden ser consideradas.
1.7.2.2.1 COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES CON VARIANZAS
IGUALES
Si las varianzas S21 y S22 SON IGUALES, es necesario estimar inicialmente una varianza conjunta (S2conj),
la que se calcula de la manera siguiente:
(1 1)12 + (2 1)22
(1 + 2 2)
Donde S21 y n1 son la varianza y el nmero de datos del primer conjunto de datos y S 22 y n2 son la varianza
y el nmero de datos del segundo conjunto de datos. Posteriormente se realiza el clculo del estadstico t de
la forma siguiente:
1 2
=
1
1
2
( + )
2
El t calculado (t cal), se compara con el valor del estadstico t de student tabulado a un nivel de confianza ()
de 0.05 y n1 + n2 - 2 grados de libertad. Las hiptesis nula y alternativa planteadas en este caso son:
0 : 1 = 2 (La media de la serie de datos 1 es igual a la media de la serie de datos 2)
1 : 1 2 (La media de la serie de datos 1 es distinta a la media de la serie de datos 2)
CONCLUYENDO QUE:
Si el t calculado es mayor que el valor de t tabulado (tcal > ttab), la media de la serie de datos 1 es distinta
a la media de la serie de datos 2.
Si el t calculado es menor que el valor de t tabulado (tcal < ttab), la media de la serie de datos 1 es igual a
la media de la serie de datos 2.
1.7.2.2.2 COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS INDEPENDIENTES CON VARIANZAS
DIFERENTES
Si las varianzas S21 y S22 SON DISTINTAS O DIFERENTES, NO es necesario estimar una varianza conjunta
(S2conj) por lo que el test en este caso vara. Y es necesario aplicar el llamado t test de Cochran, que se basa
en la comparacin de t calculado con un valor critico de t tabulado, para esto es necesario calcular
inicialmente el valor de t de la forma siguiente:
1 2
=
2 2
( 1 + 2 )
1 2
Para encontrar el valor crtico de t tabulado, es necesario calcular los grados de libertad () para lo cual se
utiliza la siguiente formula:
2
2 2
(1 + 2 )
1
2
2
2
2
(1 )
(2 )
1
2
1 + 1 + 2 + 1
El valor de es el nmero entero ms prximo al resultado obtenido, y proporciona los grados de libertad
que deben usarse para encontrar el valor de t tabulado a un nivel de confianza () de 0.05. Las hiptesis
nula y alternativa planteadas en este caso son:
0 : 1 = 2 (La media de la serie de datos 1 es igual a la media de la serie de datos 2)
1 : 1 2 (La media de la serie de datos 1 es distinta a la media de la serie de datos 2)
9
CONCLUYENDO QUE:
Si el t calculado es mayor que el valor de t tabulado (tcal > ttab), la media de la serie de datos 1 es distinta
a la media de la serie de datos 2.
Si el t calculado es menor que el valor de t tabulado (tcal < ttab), la media de la serie de datos 1 es igual a
la media de la serie de datos 2.
1.7.2.3 COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS APAREADAS
Hablamos de muestras apareadas cuando existe correspondencia entre los miembros de las muestras o
series de datos. Para el clculo del estadstico se obtiene las diferencias entre los pares de observaciones:
= 1 2
Donde X1i son los datos i de la serie 1 y X2j, son los datos j de la serie 2.
A continuacin se calcula la media de las diferencias mediante la siguiente ecuacin:
=
El t calculado (t cal), se compara con el valor del estadstico t de student tabulado a un nivel de confianza ()
de 0.05 y n - 1 grados de libertad.
CONCLUYENDO QUE:
Si el t calculado es mayor que el valor de t tabulado (tcal > ttab), las medias de la serie de datos apareados
son distintas.
Si el t calculado es menor que el valor de t tabulado (tcal < ttab), las medias de la serie de datos apareados
son iguales.
10
Para la aplicacin de la tcnica ANOVA, se han de cumplir tres hiptesis, aunque se aceptan ligeras
desviaciones respecto a las condiciones ideales:
1.
Cada conjunto de datos es aleatorio e independiente de los dems.
2.
Los resultados obtenidos para cada conjunto de datos siguen una distribucin normal.
3.
Las varianzas de cada conjunto de datos deben ser homogneas u homocedasticas.
1.7.3.2.1 HOMOGENEIDAD DE VARIANZAS
Para la comparacin de varias varianzas independientes se aplican tres test: test de Bartlett, test de Levene
y test de Cochran. En este curso usaremos el test de Cochran por su sencillez y rapidez de clculo.
1.7.3.2.2 TEST DE COCHRAN
Es de aplicacin fundamentalmente cuando los tamaos de las series de datos son iguales, es decir, cuando
el nmero de repeticiones realizadas para cada nivel de la variable X es siempre el mismo (n 1 = n2 = .... =
nk).
2()
= 2
1 + 12 + + 2
Donde S2i (mxima), es la varianza mayor de las serie de datos, S21, S2i y S2k son las varianzas de cada una
de las series de datos. En este caso la H0 se plantea como:
0 : 12 = 12 = = 2 (Las varianzas de todas las series de datos son iguales)
Y la hiptesis alternativa:
1 : 12 12 2
Para un test de dos colas
1 : 12 > 12 > > 2
1 : 12 < 12 < < 2
El valor de G calculado (Gcal) se compara con el valor de G tabulado a un nmero de series k y n-1 grados
de libertad.
CONCLUYENDO QUE:
Si el G calculado es mayor que el valor de G tabulado (Gcal > Gtab (n1,k)), las varianzas de todas las series
de datos son distintas.
Si el G calculado es menor que el valor de G tabulado (Gcal < Gtab (n1,k)), las varianzas de todas las series
de datos son iguales.
El valor de la G terica de Cochran se busca en la correspondiente tabla (ver tabla 7).
1.7.3.2.3 CLCULOS DE ANALISIS DE VARIANZA (ANOVA) DE UN FACTOR
El ANOVA es una herramienta que permite comparar simultneamente varias medias de series de datos.
Estas se comparan para establecer si todas son iguales (H0) o si al menos una de ellas es distinta (H1).
Para una serie de resultados 1, 2,., j ,..h, la H0 se plantea como:
0 : 1 = 2 = = = = (Todas las medias de las series de datos son iguales)
12
=
= [
]=[
]
La varianza total:
1 1( )2
2
=
=
( 1)
La varianza total de los datos es el cociente entre la suma de cuadrados totales (SST) y los grados de libertad
totales = N - 1.
Mientras que la suma de los cuadrados totales es la sumatoria para N datos del cuadrado de las diferencias
entre cada valor y su promedio general.
= ( )2 = [( ) + ( )]
1
2
= ( ) + ( )
13
La suma de los cuadrados entre las muestras (SSE) se calcula como la sumatoria al cuadrado de las
diferencias entre los promedios de cada grupo y el promedio general o media muestral.
Los grados de libertad se calculan como:
= N - 1 = N a + a 1 = (N - a) + (a 1) = +
Donde N es el nmero total de datos y a es el nmero total de grupos. Los grados de libertad dentro de
grupos ( ) se calcula como:
=
Los grados de libertad entre los grupos ( ) se calcula como:
= 1
Si dividimos la suma de los cuadrados por sus grados de libertad obtendremos una cantidad con las
caractersticas de una varianza, denominada cuadrados medios o MS (Mean of Squares). Estos seran:
Este lo podemos contrastar con un valor de F de tabla a una determinado significacin (a) y (a-1); (N-a)
grados de libertad (Fa;(a-1);(N-a)) se rechaza H0 si Fcal > Ftab.
=
De todos los clculos anteriores obtenemos los que se denomina cuadro de ANOVA:
14
15
La desviacin estndar de los residuos (o desviacin estndar residual de la regresin), Sy/x o Sres, que
expresa la variabilidad de los valores de la respuesta con relacin a los predichos por el modelo con n 2
grados de libertad, se calcula por:
/
)2
(
=
2
2
=
=
= 2
( )2
Su raz cuadrada es el denominado coeficiente de correlacin lineal simple, r, que mide el grado de
dependencia entre las dos variables respuesta y mesurando, pero en absoluto indica nada sobre la linealidad.
( )( )
=
( )2 ( )2
1.8.2 CALCULO DE UNA CONCENTRACIN Y SU ERROR ALEATORIO
En general la concentracin de una muestra a partir de los coeficientes de regresin de una recta se realizan
mediante:
0
=
1
Sin embargo conviene estimar el error asociado a la concentracin calculada, mediante la siguiente ecuacin:
Para una recta en la que slo se ha realizado una lectura de cada punto de la recta o de la muestra (m = 1),
la ecuacin para el clculo de la incertidumbre o error de la determinacin viene dada por la siguiente
ecuacin.
16
0 =
/
( )2
1
1 + + 2 0
1
1 ( )2
Para una recta en la que se han realizado lecturas por triplicado de cada punto de la recta o de la muestra
(m = 3), la ecuacin para el clculo de la incertidumbre o error de la determinacin viene dada por la siguiente
ecuacin.
0 =
/ 1 1
( )2
+ + 2 0
1
1 ( )2
Donde Y0 es el valor experimental de Y a partir del cual se determina la concentracin X0, Sxo es la desviacin
estndar estimada de X0, n es el nmero de puntos de la recta de regresin y m es la cantidad de veces que
se ha realizado la lectura de cada punto de la recta o de la muestra.
Una vez calculado esto se expresa la concentracin de la muestra como un intervalo, como sigue:
0 (0.05,2) 0
Las rectas de regresin en adicin patrn se construyen de similar forma que en el caso de la regresin lineal
simple. En este caso la concentracin del analito se encuentra como el cociente de:
0
0 = | |
1
Ya que b0 y b1, estn sujetos a error, el valor calculado tambin lo estar, en este caso la desviacin estndar
de la prediccin de la concentracin vendr dada por:
0 =
/ 1
()2
+ 2
1
1 ( )2
17
1.9 EJERCICIOS
1.9.1 Las calificaciones de historia del arte de 40 alumnos de una clase viene dada por la tabla siguiente:
Calificaciones (Xi)
1
2
3
4
5
6
7
8
9
Frecuencia de clase (Fi)
2
2
4
5
8
9
3
4
3
a) Encuentre la media, la moda y la mediana.
c) Encuentre la varianza, la desviacin estndar y el coeficiente variacin (DER)
1.9.2 El nmero de personas en distintos autobuses en una carretera son: 15,17,14,16,19,15,16,11,15,13,17.
Cul es la moda?
1.9.3 Calcule la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1.
1.9.4 Durante el anlisis de hierro en muestras de frijoles blancos, negros y rojos, se obtuvieron los siguientes
resultados en mg/100g.
Replica
Blancos
Negros
Rojos
1
12.16
11.90
16.41
2
12.25
11.82
16.49
3
12.34
11.90
16.41
Calcule la media de cada serie de resultados.
1.9.5 Determine para el siguiente conjunto de valores: 8, 7, 6, 9, 4, 5, el rango.
1.9.6 Determine para el siguiente conjunto de datos 2, 3, 3, 4, 5, 6, 7, 8, el rango medio.
1.9.7 Calcule la desviacin estndar del siguientes conjunto de datos: 17, 14, 2, 5, 8, 7, 6, 8, 5, 4, 3, 15, 9,
15, 9, 12, 11, 6
1.9.8 Calcule la varianza del siguientes conjunto de datos: 25.5, 21.0, 3.0, 7.5, 12.0, 10.5, 9.0, 12.0, 7.5, 6.0,
4.5, 22.5, 13.5, 22.5, 13.5, 18.0, 16.5, 9.0
1.9.9 Calcule la desviacin estndar relativa del siguiente conjunto de datos: 19.87, 27.17, 34.48, 32.04,
29.61, 34.48, 27.17, 24.74, 22.30.
1.9.10 Se sabe que la desviacin estndar de la determinacin de ocratoxina A en muestras de caf verde
es 0.05 ppb. En un laboratorio se analizan 4 muestras de caf verde y se encuentra que contienen 2.5 ppb
de ocratoxina A, Cul es el intervalo de confianza del 95% para la media de la muestra?
1.9.11 Comprueba de la siguiente serie de resultados si 26.5 es un valor anmalo: 22.1, 22.4, 22.9, 23.0,
23.5, 23.7, 23.9, 26.5.
18
1.9.12 Comprueba de la siguiente serie de resultados si 14.7 es un valor anmalo: 12.3, 12.9, 12.7, 13.0,
12.7, 14.7. Usando el test de Dixon.
1.9.13 En la determinacin de Hg por AA se obtuvieron los siguientes resultados: 38.9, 37.4 y 37.1% para un
material de referencia que contiene 38.9% de Hg. Qu se puede decir de la media respecto al valor
verdadero?
1.9.14 En la determinacin de Ca por volumetra se obtuvieron los siguientes resultados: 17.5, 17.4 y 18.3
ppm para un material de referencia que contiene 18.0 ppm de Ca. Qu se puede decir de la media respecto
al valor verdadero?
1.9.15 En la comparacin de dos procedimientos de digestin previos a la determinacin de Nitrgeno en
harina se obtuvieron los siguientes resultados:
Procedimiento 1: media 1 = 2.05g /100g s12 = 0.050
(n1= 30)
Procedimiento 2: media 2 = 2.21g /100g s22 = 0.040
(n2= 32)
Es conocido que mediante el procedimiento 1 hay alguna prdida de Nitrgeno durante la digestin.
Muestran ambos procedimientos resultados similares?
1.9.16 Consideremos el caso del ejemplo anterior en el que se varia el nmero de muestras n1 y n2:
Procedimiento 1: media1 = 2.05g/100g s12 = 0.050
(n1= 8)
2
Procedimiento 2: media 2 = 2.21g/100g s2 = 0.040
(n2= 7)
Son iguales las medias de ambos procedimientos?
1.9.17 Consideremos una situacin en la se obtuvieron los siguientes datos:
Mtodo 1: media1 = 5.08
s12 = 0.035
(n1= 4)
2
Mtodo 2: media 2 = 7.09
s2 = 0.038
(n2= 3)
Son iguales las medias de ambos mtodos?
1.9.18 Consideremos otro ejemplo en el que se quiere comparar 2 mtodos:
Mtodo1: media 1 = 2.05g/100g s12 = 0.050
(n1= 9)
2
Mtodo 2: media 2 = 2.21g/100g s2 = 0.010
(n2= 8)
Son iguales las medias de ambos mtodos?
1.9.19 Consideremos una situacin en la se obtuvieron los siguientes datos:
Mtodo 1: media1 = 19.6
s12 = 1.439
(n1= 6)
2
Mtodo 2: media 2 = 23.9
s2 = 0.123
(n2= 5)
Son iguales las medias de ambos mtodos?
19
1.9.20 En un laboratorio se desarroll para el anlisis de un antibitico y se contrast con los resultados de
un mtodo de referencia, indique si existe una diferencia significativa entre los 2 mtodos. Los resultados de
ambos mtodos fueron:
Desarrollado
89.6
76.6
52.2
50.4
72.4
75.0
34.1 60.3
Referencia
91.0
73.6
58.2
49.9
82.1
73.4
38.1 60.1
1.9.21 Se determina la pureza de sal comn en dos almacenes determinndose el cloruro por argentometra.
Los resultados se muestran en la tabla siguiente:
Punto
Almacn 1
Almacn 2
1
98.6
98.5
2
98.7
98.6
3
99.5
99.1
4
99.9
100
5
99.7
99.3
Son iguales las medias de los 2 almacenes?
1.9.22 Los valores de la varianzas para dos conjuntos de datos fueron: S12 = 0.035 (n1 = 7) y S22 = 0.044 (n2
= 8) son iguales las varianza de los dos conjuntos de datos?
1.9.23 Se realiza ejercicio de determinacin de cido actico en vinagre por volumetra acido base, en dos
muestras obteniendo los siguientes resultados:
n
Muestra 1
Muestra 2
1
5.7
5.4
2
5.9
5.3
3
6.1
5.2
4
5.8
Son iguales las varianzas de las 2 muestras?
1.9.24 Un anlisis de Cadmio en 5 muestras, produjo los siguientes resultados:
n
1
2
M1
32.9
34.1
M2
33.0
33.3
3
36.4
37.1
4
37.5
37.4
5
36.3
6
Determine si las varianzas de las muestras son iguales.
M3
32.5
34.7
M4
35.0
35.2
M5
33.2
34.0
35.0
37.5
36.2
35.9
36.3
37.1
34.5
37.5
34.8
20
Rio1
Rio2
Rio3
2.94
3.01
3.30
2.96
3.10
3.20
2.95
3.04
3.20
2.96
3.06
3.10
5
2.94
3.04
3.30
Determine si existen similitudes entre las medias de los resultados de los 3 ros.
21
1.9.29 Se ha realizado el anlisis 3 vinos en relacin a sus grados alcohlicos (GA), pH y acidez total (Aci
Tot), con el objetivo de comparar estos parmetros. Los resultados se muestran en la tabla siguiente:
GA
pH
Aci Tot
Vino 1
8.03
2.57
4.17
Vino 2
12.00
3.79
5.23
Vino 3
8.00
2.51
4.17
Determine la si las medias de los parmetros son iguales.
1.9.30 Considrese el caso de los siguientes datos:
n
x
y
1
0.5
0.123
2
1.0
0.248
3
1.5
0.499
4
2.0
0.994
5
2.5
1.983
Obtenga la grfica de x vs y, determine los coeficientes de regresin, los residuos, la grfica de los residuos.
Esta informacin se puede obtener a partir del software MS Excel, usando la herramienta de anlisis de datos
y la opcin regresin.
1.9.31 Se ha realizado una curva de calibrado de un mtodo espectrofotomtrico para el anlisis de fsforo.
Los resultados se muestran en la tabla siguiente:
Concentracin
Absorbancia
0.053
0.085
10
0.097
20
0.155
40
Determine los coeficientes de regresin y los residuos.
0.240
1.9.32 Calcular la desviacin estndar del intercepto, de la pendiente de la recta y los lmites de confianza
para la pendiente y el intercepto, para el siguiente conjunto de datos:
xi
yi
2.1
12.6 17.3
10
12
21
24.7
22
1.9.33 Tomando los datos de determinacin de hierro mostrados en la tabla siguiente, determine la
concentracin de hierro en una muestra y su error aleatorio asociado.
Concentracin
0.00
0.25
0.50
0.75
1.00
Replica1
0.006
0.029
0.047
0.07
0.094
Replica2
0.001
0.034
0.047
0.07
0.094
Replica3
0.002
0.031
0.047
0.069
0.094
Media
0.003
0.031
0.047
0.070
0.094
Muestra
0.048
0.049
0.047
0.0480
Media
1.9.34 Tomando los datos del problama19.31, determine la concentracin de fosforo en una muestra de
pinol y su error aleatorio asociado.
Muestra de Pinol
0.155
0.156
0.157
23