Documente Academic
Documente Profesional
Documente Cultură
Tipos de resultados
El primer paso es reconocer el tipo de resultado con el que estamos trabajando.
Podemos clasificar los resultados de acuerdo al siguiente esquema:
Cualitativas
Nominales
Ordinales
Dicotmicas
Resultados
o variables
Discretas
Cuantitativas
Continuas
Las variables o resultados cualitativos expresan caractersticas del sistema que
estamos estudiando sin recurrir a valores numricos, pueden nombrar los diferentes
tipos de resultados, como es el caso de las variables nominales, pueden establecer un
orden entre los resultados constituyendo as las variables ordinales, Dentro de estas
variables tenemos un tipo especial de variable que son las variables dicotmicas las
cuales solo toman dos resultados posibles los cuales no pueden ocurrir a la vez (es decir
son excluyentes).
Algunos ejemplos de variables cualitativas nominales seran: provincia de
origen de cada alumno de una comisin, estado civil, color de pelaje, religin.
Dentro de las variables cualitativas ordinales tenemos: orden de llegada en una
carrera, grado de compromiso con una tarea, clasificacin en un examen, estado del
tiempo.
Finalmente entre las variables dicotmicas podemos mencionar: sexo, estado de
salud, exposicin a un agente nocivo, estado de vacunacin.
Las variables cuantitativas son aquellas que toman resultados numricos,
resultado de determinar cantidades o magnitudes. Las variables cuantitativas discretas
son aquellas que en su intervalo de determinacin solo toman algunos de los posibles
1
Tablas
Cuando un experimento se realiza varias veces, vamos a poder obtener varios
resultados para la variable que estamos estudiando, estos resultados podrn o no
repetirse en la cantidad de veces que observemos el experimento. Para poder ordenar
esta informacin utilizaremos las tablas, las cuales registran cada uno de los valores (o
resultados) que toma la variable que estamos estudiando y la frecuencia con la que cada
uno de esos valores aparece. Por ejemplo, si preguntamos a un grupo de 15 alumnos
cual es su lugar de origen podramos obtener estos resultados:
Buenos Aires, Capital, Santa Fe, Crdoba, Neuqun, Buenos Aires, Capital, Capital,
Capital, Capital, Buenos Aires, Crdoba, Capital, Buenos Aires, Santa Fe.
As presentada la informacin resulta compleja y dificultosa para entender pero
si construimos una tabla de frecuencias tendremos:
Provincia
Capital
Buenos Aires
Crdoba
Santa Fe
Neuqun
fi
6
4
2
2
1
n =15
Provincia
Capital
Buenos Aires
Crdoba
Santa Fe
Neuqun
fi
6
4
2
2
1
n =15
hi
0,40 (40%)
0,27 (27%)
0,13 (13%)
0,13 (13%)
0,07 (7%)
1 (100%)
Veamos ahora como armamos nuestra tabla cuando tratamos una variable
cuantitativa discreta. Por ejemplo preguntamos a los mismos alumnos el nmero de
hermanos que tiene cada uno:
0, 2, 3, 1, 6, 3, 1, 2, 1, 0, 2, 4, 3, 2, 1
xi
fi
0
1
2
3
4
5
2
4
4
3
1
1
15
hi
0,13 (13%)
0,27 (27%)
0,27 (27%)
0,20 (20%)
0,07 (7%)
0,07 (7%)
1 (100%)
Fi
2
6
10
13
14
15
Hi
0,13 (13%)
0,40 (40%)
0,67 (67%)
0,87 (87%)
0,93 (93%)
1,00 (100%)
Vemos que se ha agregado dos columnas ala tabla, en ellas las frecuencias, tanto
absolutas como relativas, se van acumulando a lo largo de los diferentes valores de x
(donde x es nuestra variable en estudio, en este caso el nmero de hermanos). Estas
frecuencias se denominan acumuladas, y as tenemos las Fi que son las frecuencias
absolutas acumuladas y las Hi que constituyen las frecuencias relativas acumuladas.
En el caso de tener que ordenar los resultados de una variable cuantitativa
continua debemos tomar en cuenta que la misma puede tomar infinitos valores
diferentes y que difcilmente los mismos se repetirn a lo largo de nuestro estudio. Para
ello antes de ordenar los datos en la tabla los dividimos en intervalos de clase. Si bien
no es necesario profundizar en la tcnica para confeccionar intervalos de clase vamos a
remarcar algunas de las caractersticas que deben reunir los mismos: deben tener el
mismo tamao y ser continuos. La cantidad de intervalos debe estar entre cinco y 20
intervalos.
Supongamos que registramos el peso de los alumnos de nuestro grupo de
estudio:
( xi ]
65 70
70 75
75 80
80 85
85 90
90 95
fi
hi
2
1
4
4
3
1
15
Fi
0,13
0,07
0,27
0,27
0,20
0,07
1
xi
Hi
2
3
7
11
14
15
0,13
0,20
0,47
0,73
0,93
1,00
67,5
72,5
77,5
82,5
87,5
92,5
Debido a que los intervalos son continuos debemos establecer el criterio para
confeccionar los mismos, en nuestro ejemplo, hemos armado intervalos del tipo
(abierto, cerrado]; lo que nos indica el nmero que cierra el intervalo est incluido en
ese intervalo, mientras que el nmero que lo abre no lo esta y esta en el intervalo
anterior. Otra caracterstica de las tablas para variables continuas es que agregamos una
columna para indicar las marcas de clase (xi) que representan el valor medio de cada
intervalo.
Grficos
Para presentar los resultados de una variable cualitativa vamos a utilizar el
grfico de barras, el cual nos muestra la frecuencia absoluta de cada valor mediante
una barra.
Grfico de bastones.
Grfico de escalones
5
Histograma
ojiva
para
frecuencias
acumuladas.
Medidas de resumen
Las medidas de resumen nos permiten informar mediante un nico valor (o en
algunos casos un par de valores) tanto el punto alrededor del cual se varan los valores
observados (medidas de posicin) como as tambin nos permiten conocer la magnitud
de dicha variacin (medidas de dispersin).
Normalmente la bibliografa suele presentar las medidas de posicin agrupadas y
de manera separada las medidas de dispersin. En este trabajo seguiremos otro criterio
de presentacin, el cual es solo una manera diferente de ordenar las medidas de resumen
pero que no cambia en manera alguna la interpretacin y clculo de las mismas.
x f
i 1
n
Vemos entonces que sumamos los valores de x, recordando que cada valor debe
sumarse la cantidad de veces en que aparece, por eso en la expresin lo vemos
multiplicado por su frecuencia (fi). Las unidades de la media aritmtica coinciden con
las de la variable en estudio. Veamos la aplicacin del clculo a los ejemplos anteriores:
Para el nmero de hermanos
x
30
2 hermanos
15
Para el peso
7
1187 ,5
79,17 kg
15
x
i 1
x 0
x
i 1
x mnimo
2
Es decir que utilizando la media para calcular los desvos la sumatoria de los
mismos elevados al cuadrado da un valor menor al que se obtendra utilizando cualquier
otro nmero real en lugar de la media. Por esta propiedad de la media decimos que la
misma MINIMIZA la sumatoria de desvos cuadrados.
Si ponderamos esta sumatoria de desvos cuadrados por la cantidad de
observaciones obtendramos un buen ponderador de la variabilidad de nuestros datos
con respecto a la media. Este ponderador es la varianza que se representa con S2. La
expresin matemtica de la varianza quedara entonces como sigue:
n
S2
x
i 1
x fi
2
n 1
Para evitar lo engorroso del clculo al usar esta expresin se puede operar
algebraicamente sobre la misma para obtener una forma que facilita el clculo:
S2
1
n 1
i 1
2
i
fi
i 1
xi f i
1
30 2
88
2 hermanos 2
14
15
S2
1
1187 ,5 2
95143
,
75
80,95 kg 2
14
15
S2
2 1,41 hermanos
80,95 8,99 kg
Es decir que en promedio cada una de las observaciones se aleja 1,41 hermanos
del promedio y para el segundo ejemplo tenemos una desviacin promedio de 8,99 kg
con respecto a la media.
Finalmente para concluir tenemos el coeficiente de variacin (CV) que nos
permite ver la relacin porcentual entre la variabilidad promedio y la media de lo
valores en estudio dndonos una idea de la variabilidad relativa, el mismo se calcula
como:
CV %
S
100
x
1,4
100 70,5%
2
8,99
100 11,35%
79,17
Vemos entonces que mientras que el peso de los alumnos presentaba una mayor
variabilidad absoluta, las mismas no podan compararse, ya que resulta imposible desde
el punto de vista de la lgica comparar 1,41 hermanos con 8,99 kg. Peor el coeficiente
de variacin al estar expresado como un porcentaje y no tener unidades permite
establecer comparaciones y as tenemos que la variabilidad relativa en el nmero de
hermanos es del 70,5% mientras que el peso solo presenta una variabilidad relativa del
11,35%.
cantidad de observaciones por debajo y por arriba. Este valor que deja la misma
cantidad de observaciones por debajo y por arriba se denomina mediana.
Veamos en el caso de la variable numero de hermanos:
0 0 1 1 1 1 2 2 2 2 3 3 3 4 4
El valor dos sealado con la flecha se encuentra justo en el medio del conjunto
de valores de manera tal que la misma cantidad de valores (siete en este caso) se
encuentran ubicados por debajo y por encima de este. Otra forma de encontrar la
mediana utilizando la tabla de frecuencias consiste en averiguar primero en que posicin
se encuentra la mediana mediante la simple expresin:
Pos. med
n 1
2
Que nos indicar en que lugar encontraremos la median, luego entramos a la columna
de las Fi y all buscamos la frecuencia que represente a la posicin de la mediana o a
algn valor superior. Ese valor o intervalo constituye la mediana de nuestros datos. Si la
cantidad de valores fura para la mediana se ubicar en el medio de estos dos valores y
de ser ambos diferentes la mediana quedar dada por el promedio de ambos valores
centrales. Por ejemplo para los valores 0 1 2 4 6 10 la mediana es 3 por los dos
valores centrales son 2 y 4 y el promedio entre ambos es tres. En el ejemplo del peso de
los alumnos tenemos que la posicin de la mediana es:
Pos. med
16
8
2
med Li c
fi
Vemos que en esta ecuacin se toma en cuanta el limite inferior del intervalo de
la mediana (Li), la amplitud de los intervalos que estemos considerando (c) y las
frecuencias acumuladas del intervalo anterior (Fi-1) y absoluta de ese intervalo (fi). En
nuestro ejemplo con el peso de los alumnos tendremos:
87
med 80 5
81,25 kg
4
Este valor resulta ms exacto que el de 82,5 kg que habamos elegido al usar la
marca de clase, sin embargo si la amplitud de los intervalos no es muy grande el uso del
10
C1
C2
mediana
C3
11
peso (kg)
84
80
76
72
68
64
60
Modo
El modo es una medida de posicin de fcil interpretacin y clculo, se define
simplemente como el valor de la variable que presente mayor frecuencia absoluta de
aparicin. En nuestro ejemplo para el nmero de hermanos tenemos que hay dos modos:
modo1 = 1 hermano
modo2 = 2 hermanos
Ambos valores tienen una fi de 4 con lo cual los dos quedan definidos como modo para
este conjunto de observaciones. En el caso que nuestros valores se encuentren
presentados en una tabla con intervalos de clase, el modo puede asignarse a la marca de
clase del intervalo modal (el de mayor frecuencia absoluta) o bien calcularse su
posicin exacta dentro de dicho intervalo mediante la expresin:
Di 1
mod Li c
D
D
i 1
i 1
Donde Di-1 es la diferencia entre las frecuencias absolutas simples del intervalo
anterior y del intervalo modal y Di+1 es la diferencia entre las frecuencias absolutas
simples del intervalo posterior y del intervalo modal. Para nuestro ejemplo del peso de
los alumnos tenemos tambin dos intervalos modales porque dos de ellos presentan 4
como frecuencia absoluta simple siendo esta la mayor, por lo tanto calcularemos los dos
modos:
1
mod1 75 5
79
3 11
0
mod1 80 5
80
0 1
12
Cuartiles y percentiles
Los cuartiles, C1, C2 y C3 son los valores de la variable que una vez ordenados
dejan por debajo al 25%, 50% y 75% de las observaciones respectivamente. Es fcil
notar que la mediana coincide con el C 2. Los cuartiles se representan junto con la
mediana en el grfico de caja y bigotes.
Los percentiles se ubican separando a los valores de la variable, que representan
cada uno de ellos un 1% de las observaciones realizadas. Se representan con Pn donde n
es el percentilo correspondiente. Si relacionamos los percentiles con la mediana y los
cuartiles tenemos:
P25 = C1
P50 = C2 = med
P75 = C3
Medias especiales
En algunos casos se requiere el uso de medias especiales para describir el
comportamiento de algunos datos que se mostraran de manera errada utilizando la
media aritmtica sobre todo por la desventaja que esta presenta al verse desplazada por
los valores extremos.
La media geomtrica de una cantidad finita de nmeros (digamos n nmeros)
es la raz n-sima del producto de todos los nmeros que integran la serie.
Matemticamente queda definida como:
n
~x n x n x .x .x .x ...x
i 1 2 3 4 n
i 1
Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno
de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad
impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en
los nmeros reales.
En muchas ocasiones se utiliza su trasformacin en el manejo estadstico de variables
con distribucin no normal.
La media armnica, representada por H, de una cantidad finita de nmeros es
igual al recproco, o inverso, de la media aritmtica de los recprocos de dichos nmeros
As, la media armnica ser igual a:
H
n
n
x
i 1
n
1 1 1
1
...
x2 x3 x4
xn
22,09 19,79 18,59 20,44 19,29 19,74 19,27 20,27 19,10 20,79 21,68
17,58 19,97 20,55 19,36 19,33 19,22 22,14 21,55 20,61 19,36 18,70
21,25 18,15 22,74 20,63 20,13 20,41 22,91 21,00 23,03 20,63 20,74
22,14 21,87 16,70 24,19 18,63 20,97 21,06 20,46 18,20 22,85 20,74
22,96
Los resultados muestran los niveles de glucosa en mg/ml detectados en orina de
45 pacientes diabticos compensados luego de un tratamiento con insulina bovina de
larga duracin.
Ordenamos los datos
( xi ]
15 17
17 19
19 21
21 23
23 - 25
fi
1
6
24
12
2
n = 45
hi
0,02
0,13
0,53
0,27
0,04
Fi
1
7
31
43
45
Hi
0.02
0,16
0,69
0,96
1
xi
16
18
20
22
24
frecuencia absoluta
20
15
10
0
13
15
17
19
21
23
25
27
25
27
glucosuria (mg/ml)
38
28
19
0
13
15
17
19
21
23
glucosuria (mg/ml)
14
Di 1
18
19 2
mod Li c
20,2 mg / ml
18 12
Di 1 Di 1
Mediana
Pos. med
n 1 46
23
2
2
Media
n
x f
i i
i 1
916
20,35 mg / ml
45
Medidas de dispersin
Varianza
S2
1
n 1
x
i 1
2
i
i 1
xi f i
fi
2
1 18760 916 2,598 mg / ml 2
44
45
Desvo Estndar
S
S2
2,598 1,612 mg / ml
Coeficiente de variacin
CV %
S
1,612
100
100 7,92%
x
20,35
15
C1 = 19,33 mg/ml
C3 = 21,55 mg/ml
P5 = 18,15 mg/ml
P10 = 18,59 mg/ml
P25 = 19,33 mg/ml
P50 = 20,55 mg/ml
P75 = 21,55 mg/ml
P90 = 22,85 mg/ml
P95 = 22,96 mg/ml
Glucosuria (mg/ml)
23
21
19
17
15
16