Documente Academic
Documente Profesional
Documente Cultură
OBJETIVOS
Saber qu significa estadstica.
Explicar qu es estadstica descriptiva y estadstica inferencial.
Diferenciar entre una variable cualitativa y una variable cuantitativa.
Distinguir entre una variable discreta y una variable continua.
Diferenciar entre niveles de medicin nominal, ordinal, por intervalo
de razn.
Definir los trminos mutuamente excluyentes y colectivamente exhaustivos.
Qu significa estadstica?
Estadstica es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos
con el propsito de ayudar a una toma de decisiones ms efectiva.
Las tcnicas estadsticas se usadas ampliamente por personas en diversas reas tales
como mercadeo, comunicacin, contabilidad, control de calidad,
deportes,
administracin de empresas, de hospitales, educacin, poltica, medicina, etctera.
Tipos de estadsticas
1.
2.
Ejemplo 3: los catadores de vino prueban unas cuantas gotas para tomar la decisin de
liberar todo el vino para la venta.
Tipos de variables
1. Variable cualitativa o de atributos: la caracterstica o variable que se estudia no es
numrica.
Ejemplos: gnero, afiliacin religiosa, tipo de automvil que se posee, lugar de
nacimiento, color de los ojos.
2.
Cualitativos o de atributos
(tipo de auto que posee)
Cuantitativos o numricos
discretos
(nmero de hijos)
continuos
(tiempo para resolver el examen)
Nivel nominal: los datos slo se puede clasificar en categoras, no se pueden ordenar.
Ejemplos: color de los ojos, gnero, afiliacin religiosa.
Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las
diferencias entre los valores de los datos o no tienen significado.
EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasific como nmero
1, el B como nmero 2, el A como 3 y el D como nmero 4.
3.
Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden
determinar cantidades significativas de las diferencias entre los valores. No existe un punto
cero natural y solo se pueden realizar las operaciones de suma y resta con sentido
Ejemplo: temperatura en la escala de grados Fahrenheit.
4.
Nivel de razn: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y
razones son significativas para este nivel de medicin y se pueden realizar las cuatro
operaciones bsicas con sentido.
Ejemplos: dinero, altura de los jugadores de bsquetbol de la NBA.
pregunta que
se desea
responder
recoleccin
de datos
(datos originales)
organizacin
de datos
presentacin
de datos
(grfica)
obtencin
de
conclusiones
distribucin
de frecuencias
Las categoras que se crean para agrupar los datos dependen del
tipo de variable que se tenga, es decir se debe primero identificar
la variable para determinar si es cualitativa o cuantitativa y en caso
de las cuantitativas si es discreta o continua.
1.
EJEMPLO 1
Se realiz una encuesta a 200 deportistas para averiguar cul era la marca preferida de
zapatos deportivos y se encontr lo siguiente:
Variable
Frecuencia absoluta (fi)
Frecuencia relativa (hi)
Marca de zapato Nmero de corredores Porcentaje de corredores
Nike
92
(92/200)*100 = 46.0%
Adidas
49
(49/200)*100 = 24.5%
Reebok
37
(37/200)*100 = 18.5%
Puma
13
(13/200)*200 = 6.5%
Otros
9
(9/200)*100 = 4.5%
Total
200
100.0%
La marca de zapato es la variable de estudio, que es de tipo cualitativo en escala
nominal. Sus posibles valores o categoras son las diferentes marcas que dieron los
deportistas investigados, en este caso son Nike, Adidas, etc., y el nmero de corredores
son las frecuencias absolutas o nmero de veces que se repite cada valor de la variable.
Adicionalmente, se calculan las frecuencias relativas, que corresponden al porcentaje de
elementos investigados que hay en cada categora, en nuestro caso, el 46.0%
EJEMPLO 2
A un grupo de 20 familias se les averigu cuntos hijos tenan y se encontraron los
siguientes resultados:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Hijos 3 2 2 2 1 0 1 1 2
Frecuencia
absoluta fi
Frecuencia
relativa hi
Nmero
de hijos
Nmero de
hogares
Porcentaje de
hogares
0
1
2
3
3
6
8
3
(3/20)*100=15%
(6/20)*100=30%
(8/20)*100=40%
(3/20)*100=15%
Total
20
100%
Frecuencia
absoluta
acumulada Fi
Frecuencia
relativa
acumulada Hi
Nmero
Porcentaje
acumulado de acumulado de
hogares
hogares
3
15%
9
45%
17
85%
20
100%
Yi
Intervalo
de clase
Frecuencia
absoluta,
Yj-1 Yj
8 - 12
fi
1
13 - 17
12
18 - 22
10
23 - 27
28 - 32
33 - 37
TOTAL
= n = 30
Frecuencia
relativa,
hi
1/30=
0.0333
12/30=
0.4000
10/30=
0.3333
5/30=
0.1667
1/30=
0.0333
1/30=
0.0333
Frecuencia
Absoluta
Acumulada
Fi
1
Frecuencia
Relativa
acumulada
Hi
0.0333
13
0.4333
23
0.7666
28
0.9333
29
0.9666
30
1.0000
h =1
i
EJEMPLO 2
Carlos logr las siguientes calificaciones en el doceavo examen de contabilidad del
semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representacin
de tallo y hoja para los datos.
Se toma como tallo las decenas y como hojas las unidades
TALLO
6
7
8
9
HOJA
9
89
234568
126
Frecuencia
14
12
10
8
6
4
2
0
10
15
20
25
Horas de estudio
30
35
14
Frecuencia
12
10
8
6
4
2
0
10
15
20
25
30
35
Horas de estudio
35
Frecuencia
30
25
20
15
10
5
0
10
15
20
25
30
35
Horas de estudio
Grfica de barras
Una grfica de barras se puede usar para describir cualquier nivel de medicin (nominal,
ordinal, de intervalo o de razn).
EJEMPLO 3: construya una grfica de barras para el nmero de personas desempleadas
por cada 100 000 habitantes de ciertas ciudades en 1995.
Ciudad
Nmero de desempleados por 100 000 habitantes
Barranquilla
7300
Cartagena
5400
Bucaramanga
6700
Medelln
8900
Cali
8200
Bogot, D.C.
8900
# desempleados/100
000
10000
8000
7300
8200
8900
6700
5400
6000
Bar anquilla
Car tegena
Bucar amanga
M edelln
Cali
B
t
4000
2000
0
1
Ciudades
3
4
Grfica circular
Una grfica circular es en especial til para desplegar una distribucin de frecuencias
relativas. Se divide un crculo de manera proporcional a la frecuencia relativa y las
rebanadas representan los diferentes grupos.
EJEMPLO 4: se pidi a una muestra de 200 corredores que indicaran su tipo favorito
de zapatos para correr.
Dibuje una grfica circular basada en la siguiente informacin.
Tipo de zapato Nmero de corredores
Nike
92
Adidas
49
Reebok
37
Puma
13
Otros
9
Reebok
Puma
Otros
Nike
Adidas
Reebok
Puma
Adidas
Otros
Nike
= i
N
EJEMPLO 1
La familia Prez posee cuatro carros. Las millas recorridas por cada uno son: 56 000,
23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.
X
Esto es = i = ( 56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500
N
X=
EJEMPLO 2
Una muestra de cinco ejecutivos recibi la siguiente cantidad en bonos el ao pasado:
$14 000, $15 000, $17 000, $16 000 y $15 000. Encuentre el promedio en bonos
para los cinco ejecutivos.
Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es :
Xi
X=
n
(14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.
Media ponderada
La media ponderada de un conjunto de nmeros X1, X2, ..., Xn, con las ponderaciones
correspondientes w1, w2, ...,wn, se calcula con la frmula:
X 1w1 + X 2 w2 + ... + X n wn
Xw =
wi
Xw =
X w
w
i
EJEMPLO 3
Durante un periodo de una hora en una tarde calurosa de un sbado, el cantinero Jaime
sirvi cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas.
(Precio ($), cantidad vendida): (0.50, 5), (0.75, 15), (0.90, 15), (1.10, 15).
La media ponderada es:
X 1w1 + X 2 w2 + ... + X n wn
Xw =
wi
o (0.50 x 5 +0.75 x 15 + 0.90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50
=$0.875
EJEMPLO 4
Considere el conjunto de valores: 3, 8 y 4. La media es 5. Para ilustrar la propiedad:
la sumatoria de las desviaciones con respecto a al media es igual a cero se tiene: (3
- 5) + (8 - 5) + (4 - 5) = - 2 + 3 - 1 = 0. En otras palabras,
( X i X ) =
0
Mediana
Mediana: es el punto medio de los valores despus de ordenarlos de menor a mayor, o
de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana
que por debajo de ella.
EJEMPLO 5
Calcule la mediana para los siguientes datos.
La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es
21, que es la observacin central, ya que el nmero de observaciones es impar.
La altura, en pulgadas, de cuatro jugadores de bsquetbol es 76, 73, 80 y 75.
Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80. La mediana es 75.5
que corresponde al promedio de las dos observaciones centrales, ya que el nmero de
observaciones es par.
Propiedades de la mediana
La mediana es nica para cada conjunto de datos.
No se ve afectada por valores muy grandes o muy pequeos, y por lo tanto es una
medida valiosa de tendencia central.
Puede obtenerse para datos de nivel de razn, de intervalo y ordinal.
Puede calcularse para una distribucin de frecuencias con una clase de extremo abierto,
si la mediana no se encuentra en una de estas clases.
Moda
La moda es el valor de la observacin que aparece con ms frecuencia.
EJEMPLO 5:
Las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75,
81, 87. Como la calificacin 81 es la que ms ocurre, la calificacin modal es 81.
Media geomtrica
La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la
raz n-sima del producto de los n valores. Su frmula es:
EJEMPLO 6
Las tasas de inters de tres bonos son 5%, 7% y 4%.
La media geomtrica es = 5.192.
La media aritmtica es (5 + 7 + 4)/3 = 5.333.
La MG da una cifra de ganancia ms conservadora porque no tiene una ponderacin
alta para la tasa de 7%.
Otra aplicacin de la media geomtrica es determinar el porcentaje promedio del
incremento en ventas, produccin u otros negocios o series econmicas de un periodo
a otro. La frmula para este tipo de problema es:
EJEMPLO 7
El nmero total de estudiantes inscritos en colegios bogotanos aument de
755 000 en 1986 a 835 000 en 1995.
Aqu n = 10, as (n - 1) = 9.
Xf Xf
X =
=
f
n
EJEMPLO 8
Una muestra de diez cines en una gran rea metropolitana dio el nmero total de
pelculas exhibidas la semana anterior. Calcule la media de las pelculas proyectadas.
=
X
X i f i X i f i
=
f i
n
2 Fj 1
Mediana, M
=
Y j 1 + C j
e
fj
Donde Yj-1 es el lmite inferior de la clase que contiene a la mediana, Fj-1 es la frecuencia
acumulada que precede a la clase de la mediana, fj es la frecuencia de clase de la
mediana y Cj es la longitud del intervalo j, el de clase de la mediana.
EJEMPLO 9
Pelculas exhibidas Frecuencia Frecuencia acumulada
1-2
1
1
3-4
2
3
5-6
3
6
7-8
1
7
9-10
3
10
Distribucin simtrica
Sesgo cero :
NOTA
Si se conocen dos promedios de una distribucin de frecuencias con sesgo moderado,
el tercero se puede aproximar:
moda = media - 3(media - mediana)
media = [3(mediana) - moda]/2
mediana = [2(media) + moda]/3