Documente Academic
Documente Profesional
Documente Cultură
ESTADSTICA
DESCRIPTIVA
OBJETIVOS DE LA UNIDAD:
Distinga Estadstica Descriptiva y Estadstica
Inferencial.
Reconozca una variable cualitativa y
cuantitativa.
Identifique si la variable cuantitativa es:
discreta o continua.
Comprenda la diferencia entre los diferentes
niveles de medicin
Cul es el significado de Estadstica?
Estadstica es la ciencia de
recolectar, organizar, presentar,
analizar e interpretar datos
numricos que ayudan a tomar las
mejores decisiones .
Quin usa la Estadstica?
Cualitativa o de Cuantitativa o
atributo (tipo de auto numrica
que se posee)
Discreta Continua
(nmero de (tiempo para resolver
nios) un examen)
Niveles de medicin
Nivel nominal (escalado): los datos se
clasifican nicamente en categoras y no
pueden arreglarse en forma ordenada.
Mas ejemplos.
Estado civil, gnero, raza, credo religioso,
afiliacin poltica, lugar de nacimiento, el
nmero de seguro social, el sexo, los nmeros
de telfono, entre otros.
Niveles de medicin
Nivel ordinal:
Se considera que los datos se arreglan en
determinado orden, pero no pueden
determinarse diferencias entre los valores de
los datos.
EJEMPLOS:
La dureza de los minerales, los resultados de
una carrera de caballos, actitudes como
preferencia, el nivel socioeconmico, orden de
llegada de los corredores,
Niveles de medicin
Nivel de intervalo:
Es semejante al nivel ordinal. Tiene la
propiedad adicional de que pueden
determinarse las diferencias entre los
valores de los datos.
El cero se elige de manera arbitraria (a
partir de donde vamos a iniciar los
intervalos).
EJEMPLOS
La temperatura en tres das invernales
consecutivos son: 28, 31 y 25F. y estos datos
pueden ser clasificados con facilidad.
-Durante una hora se observa el flujo de
vehculos por un paso a desnivel por intervalos
de 15 minutos, la hora podra ser cualquiera, y
la ubicacin de cero vehculos podra ser al
inicio del registro.
Una distribucin por intervalos genera
categoras llamadas CLASES y en esas
clases se anotan las FRECUENCIAS con
que ocurren los eventos o el numero de
datos que estn incluidos en ese intervalo.
Niveles de medicin
Nivel de razn: tiene las caractersticas
del nivel de intervalo con un punto de
inicio cero. Las diferencias y las
operaciones de multiplicacin y divisin
tienen significado en este nivel de
medicin.
El punto cero es significativo. Significa
ausencia de la caracterstica.
EJEMPLOS: cantidades de dinero, altura de
los jugadores de la NBA, salario, distancia
entre sucursales, el peso de una persona,
edad.
ESCALA
Exhaustivo
NOMINAL
CUALITATIVAS NO
MTRICAS
ESCALA
ORDINAL
DATOS
ESCALA DE
INTERVALO
CUANTITATIVAS
MTRICAS
ESCALA
DE RAZN
Niveles de medicin
Nivel nominal
Solo sirve para asignar categoras, y se
utilizan nombres.
Ej.: 1. Nmeros del DUI
2. Cdigo alfanumrico de cada estudiante
3. Los estudiantes clasifican a sus padres
como: aburridos, enojados, buenos
comprensivos, etc.
Nivel ordinal
establece un orden, hay jerarqua, los
datos pueden ser ordenados en forma
ascendente o descenderte.
Ej. 1. grados de la jerarqua militar
2. Rendimiento escolar de los alumnos
Nivel de razn o proporcin
Se usa cada vez que podamos establecer
una medida de proporcin
1. Medidas de las edades de 2 personas,
una tiene 20 a. la otra 40a.
significa que la de 40 tiene el doble de
edad que la de 20.
2. Programas grabados en el disco duro de
una computadora
Nivel de intervalo
Podemos clasificar los datos por intervalos.
1.Sistema para evaluar a los profesores que
llegan tarde a su escuela.
2.Horas de estudio que dedica un
estudiante a su aprendizaje
Distribucin de frecuencia
Distribucin de frecuencia.
Se agrupan los datos en categoras
mutuamente excluyentes, y en cada
una de stas se asignan las
observaciones.
Construccin de una distribucin de frecuencia
Pregunta de
Investigacin
Recoleccin de Datos
(datos en bruto)
Presentacin
Organizacin
de Datos
de Datos
(grficas)
Distribucin de Conclusin
Frecuencia
Distribucin de frecuencia
Una poblacin es grande si N 30
Una muestra es grande si n 30
CONCEPTOS BASICOS:
SERIE ORDENADA:
Se limita a presentar una lista en forma ascendente o
descendente. Organizacin de los datos recolectados.
Con esto podemos identificar el dato menor y el dato
mayor.
Ejemplo:
Datos sin ordenar: 22, 25, 54, 63, 44, 22, 68
Serie ordenada: 22, 22, 25,44, 54, 63, 68
Distribucin de frecuencia
Moda o modo (Mo): Es el dato que mas se repite
Serie ordenada: 22, 22, 25,44, 54, 63, 68
entonces: Mo = 22
Tronco hoja
2 En el tronco se anotan las decenas o centenas, en la
3 505 hoja van las unidades de los datos que tengamos.
4 74 1. Se inicia identificando el dato mayor y el dato
5 menor.
PM: Dato mayor o puntaje mayor. PM =22
Pm: Dato menor o puntaje menor. Pm= 51
2. Los datos indican que el diagrama debe contener
datos entre 20 y 50. por lo tanto se coloca del 2 al
,5 en el tronco para luego ir agregando las
unidades en la hoja, en el orden en que aparecen
los datos de la investigacin. Se ubican los datos
de la primer columna 35 30 47 44 35.
El tronco del numero 3 indica que tiene los datos de 35 30 35, as sucesivamente se van
ubicando todos los datos columna por columna.
Diagrama de tronco y hoja
Tronco hoja
2 972
3 5056797584953939781784
4 741113441062823223243703
5 1
Fr = f / n f= frecuencia absoluta
n= numero de datos
frecuencia 27
29
1
1
(1/50)x 100= 2
(1/50)x 100= 2
simple 30 1 (1/50)x 100= 2
31 1 (1/50)x 100= 2
CLASES f
Usando el EJEMPLO 1
Elaborar una tabla de frecuencia correspondiente a
la edad de 50 personas adultas, que escuchan las
casi 700 estaciones de radio en Estados Unidos,
las cuales son:
35 29 41 34 44 46 42 42 37 47
30 36 41 39 44 39 43 43 44 40
47 37 41 27 33 33 39 38 43 22
44 39 35 35 41 42 37 42 38 43
35 37 38 43 40 48 42 31 51 34
Nota: Realizar los pasos previamente estudiados.
EJEMPLO 1 continuacin
Tronco hoja
2 279
3 0133445555677778889999
4 001111222223333344446778
5 1
EJEMPLO 1 continuacin
2c > n
2c > 50
26 > 50
64 > 50 se cumple la desigualdad
Por lo tanto C = 6
Nota: Si 26 no hubiese sido mayor que 50 se tendra que
aproximar al siguiente entero usar C = 7 (aunque C hubiera
sido igual a 6.33 siempre podemos aproximar al siguiente
entero, si con el primero no se cumple la condicin)
C) Determinar el intervalo de clase
i (PM-Pm)/C
i (51-22)/6
i 29/6
i 4.8
Por lo tanto i = 5
Lo que significa que cada clase tiene 5
elementos
EJEMPLO 1 continuacin
Elaborar
la distribucin de frecuencias.
Edades de 50 personas adultas que son
radio-escuchas. Entre 22 y 26 solo hay un
Clases elemento
EDADES f Encabezados
Ttulo
Li
[22 26] 1 Frecuencia absoluta
[27 31] 4 Ls: limite superior
Li: limite inferior
[22 26]
Los corchetes cerrados, indican que ambos extremos
estn incluidos en el intervalo, si se tiene a una
persona de 26 aos, estar incluida en este intervalo.
Tambin se puede usar otro tipo de corchete
[22 27[
[27 - 32[
El corchete abierto indica que el 27 no esta incluido en
el primer intervalo, pero si lo esta en el segundo. Si
aparece algn 27 se incluir su frecuencia en el 2
intervalo.
Edades de 50 personas adultas que son radio-escuchas.
CLASES f Fr Fr%
[22 - 27[ 1 1/50 = 0.02 2
[27 - 32[ 4 4/50 = 0.08 8
[32 - 37[ 9 9/50 = 0.18 18
[37 - 42[ 17 17/50 = 0.34 34
[42 - 47[ 15 15/50 = 0.3 30
[47 - 52[ 4 4/50 = 0.08 8
TOTAL 50 = 1.0 = 100 %
EJEMPLO 1 continuacin
FRECUENCIA RELATIVA
EDADES f
Dato [22 27[ 1 1/50 = 0.02
menor
[27- 32[ 4 4/50 = 0.08
Clases
[32- 37[ 9 9/50 = 0.18
[37- 42[ 17 17/50 = 0.34
[42- 47[ 15 15/50 = 0.30
[47- 52[ 4 4/50 = 0.08
TOTAL 50 50/50 = 1
Lmites Lmites superiores n= Nmero total de observaciones
inferiores
Otros conceptos
Punto medio (Xm)
Xm = (Ls + Li) / 2
Limites reales: es el punto medio entre los limites superiores absolutos y los
limites inferiores absolutos de clases continuas.
Ejemplo: (144 +145) / 2 = 144.5
Clases
LR superior para la primer clase y LR
140 144
145 149
inferior para la segunda clase
EJEMPLO 2
[27.5 32.5[ 1
[32.5 37.5[ 1
Total 30
EJEMPLO 2 continuacin
Distribucin de frecuencia relativa
La frecuencia relativa se obtiene al dividir la frecuencia
absoluta entre el nmero total de observaciones.
La frmula quedara: fr = f/n
Horas de Estudio Frecuencia, f Frecuencia relativa
Total 30 30/30 = 1
EJEMPLO 1 : usando diagrama de tallo y hoja
Tallo Hojas
6 9
7 89
8 234568
9 126
EJEMPLO 2
La Quick Change Oil Company tiene varias sucursales en el rea
metropolitana. El nmero de cambios de aceite en la sucursal de la
calle Oak en los pasados 20 das fue:
65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
Elaborar un diagrama de tallo y hojas
Tallo Hojas
5 1569
6 22356
7 012399
8 05
9 048
Presentacin grfica de una distribucin
de frecuencia
Se usan generalmente tres formas grficas
histogramas, polgonos de frecuencia y una
distribucin de frecuencia acumulada (ojiva).
Histograma:
grfica en la cual las clases se marcan sobre el
eje horizontal, y las frecuencias, en el eje
vertical. Las frecuencias se representan por
la altura de las barras que se dibujan una
junto a la otra.
2-20
Presentacin grfica de una distribucin
de frecuencia
Un polgono de frecuencia consiste
de segmentos de lnea que unen los
puntos determinados por los puntos
medios de la clase y la frecuencia
correspondiente.
Una distribucin de frecuencia
acumulada (ojiva) se usa para
determinar cuntos o que proporcin
de los datos est por arriba o por
abajo de un valor determinado.
2-11
Ejemplos
EDADES f
[22 - 27[ 1
[27 - 32[ 4
[32 - 37[ 9
[37 - 42[ 17
[42 - 47[ 15
[47 - 52[ 4
Histograma de las Edades de 50 personas
adultas que son radio-escuchas.
18
16
14
12
10
Frecuencia
0
22 27 32 37 42 47 52
Total 30
Histograma de las horas por semana que
dedican al estudio, un grupo de estudiantes
14
Nmero de estudiantes
12
10
0
7.5 12.5 17.5 22.5 27.5 32.5 37.5
Clases o categoras
Frecuencias absolutas
Marcas de clase (puntos medios): es un punto que divide a una clase
en dos partes iguales; es decir, el promedio entre los lmites de clase
superior e inferior, la frmula para calcular el punto medio es:
Xm = (Ls + Li)/2
Qu se necesita para elaborar el grfico
del polgono de frecuencia
Edades de 50 personas adultas que son radio-escuhas.
CLASES f Xm
16
Nmero de personas
14
12
10
0
24.5 29.5 34.5 39.5 44.5 49.5
Edades
2-16
14
Nmero de estudiantes
12
10
0
10 15 20 25 30 35
Clases
Frecuencia absoluta.
Frecuencia acumulada (menos que)
(disminuye).
Frecuencia acumulada (ms que)
(aumenta).
Edades de 50 personas adultas que son radio-
escuchas.
Edades f fac (+ que) fac (- que)
[22-27[ 1 1 50
[27-32[ 4 5 49
+
=
[32-37[ 9 14 45
[37-42[ 17 31 36
[42-47[ 15 46 19
[47-52[ 4 50 4
50
fac (+ que): frecuencia acumulada positiva. En cada lnea se van acumulando las
frecuencias. Se inicia con la primer frecuencia (f), y finaliza con el numero total de
datos.
fac (- que) : frecuencia acumulada negativa. En cada lnea se van restando las
frecuencias (f) que estn en el mismo nivel. Se inicia con el total de datos, y finaliza
con la ultima (f).
Distribucin de frecuencia acumulada
para las edades de personas adultas
radioescuchas
f
Menos que
Ms que
50
40
30
20
10
Edades
22 27 32 37 42 47 52
Horas que dedican al estudio 30 estudiantes
[7.5 12.5[ 1 1 30
[12.5 17.5[ 12 13 29
[17.5 22.5[ 11 24 17
[22.5 27.5[ 4 28 6
[27.5 32.5[ 1 29 2
[32.5 37.5[ 1 30 1
Distribucin de frecuencia acumulada para las
horas que dedican al estudio 30 estudiantes
f
30
25
20
15
10
5
Horas
de
7.5 12.5 17.5 22.5 27.5 32.5 37.5 estudio
2-24
Diagrama de barras
Un diagrama de barras: Es una grafica que se construye
con rectngulos o barras separadas a igual distancia una
de otra. Estos rectngulos se pueden dibujar en forma
horizontal o vertical; se usa para representar cualquiera
de los niveles de medicin (nominal, ordinal, de intervalo
o de razn).
EJEMPLO continuacin
Diagrama de barras
Elabore una grafica de barras horizontal, para los
resultados obtenidos en el primer control de lectura
del grupo 01 de Estadstica I, Ciclo 02-2008.
CATEGORIA NUMERO DE
ESTUDIANTES
Aprobados 68
Reprobados 25
Total 93
2-26
REPROBADOS
APROBADOS
0 Numero de
estudiantes
10 20 30 40 50 60 70 80 90
2-27
Diagrama de pastel
Un diagrama de pastel es til especialmente al
desplegar la distribucin de frecuencias
relativas. Un crculo se divide de forma
proporcional a la frecuencia relativa y las reas
del crculo se asignan a los diferentes grupos.
EJEMPLO continuacin
Adidas 49 88 24.5
Reebok 37 67 18.5
Asics 13 23 6.5
Otras 9 16 4.5
200
TOTAL 360 100%
Cantidad de grados a graficar
con el transportador, para cada
clase
2-29
Asics
Reebok
Otras
46.0% Nike
24.5% Adidas
18.5% Reebok
Adidas
6.5% Asics
4.5% Otras
Nike
MEDIDAS DE VALOR
CENTRAL
MEDIDAS DE VALOR CENTRAL
OBJETIVOS
Cuando haya terminado este captulo deber ser capaz de:
N
uMd 0.5
2
La Moda o Modo
El valor que se repite con mayor frecuencia
Ejemplo 1:
La moda para la serie:
100,125,130,130,130,145,150 es:
Mo = 130 (Unimodal)
Ejemplo 2:
La moda para la serie: 100,125,130,130,130,145,145,145,150 es:
Mo = 130 y 145 (Bimodal)
La media, la mediana y la moda para
series agrupadas
( fXm) Poblacin Cuando se tiene una distribucin por
N intervalos de clase, se usan formulas
para series agrupadas, para encontrar
( fXm ) la media, mediana y moda.
x Muestra
n
Ejemplo 1:
Hallar el promedio de aos para la serie de las edades de
50 personas adultas que son radioescuchas en EEUU
La media, para series agrupadas
( fXm )
x
n
Edades de 50 personas adultas que son radio-escuchas.
Edades f Xm fXm
[22-27] 1 24.5 24.5
[27-32 ] 4 29.5 118.0
[32-37 ] 9 34.5 310.5
[37-42 ] 17 39.5 671.5
[42-47 ] 15 44.5 667.5
[47-52 ] 4 49.5 198.0
=1990
Edades de 50 personas adultas que son radio-escuchas.
( fXm )
x
n
1990
x
50
x 39.8 Aos
Ejemplo 2: Se pas un prueba de Lenguaje a todas
las alumnas de bachillerato del Colegio XY. En la
tabla siguiente se muestran los resultados de dicha
prueba, en puntaje. Encuentre la media para esta
serie.
La media, para series agrupadas
Ejemplos:
1. Encuentre la mediana para las edades de 50 personas
radio-escuchas e interprete el resultado.
2. Encuentre la mediana para los puntajes obtenidos por las
120 estudiantes del Colegio XY e interprete el resultado.
2-12
Md 40.2 aos
TOTAL 50
La mediana para series agrupadas
43 47 35 80 [42.5 47.5 [
48 52 19 99 [47.5 52.5 [
53 57 12 111 [52.5 57.5 [
58 62 9 120 [57.5 62.5 [
n=120
Lmites aparentes
2-12
ic = 5
La mediana para series agrupadas
Calcule el valor de la media aritmetica y la mediana e interprete su respuesta;
para la siguiente distribucin, correspondiente al salario en dlares de un
grupo de personas
Salario ($) f
300 324 5
325 349 18
350 374 28
375 399 36
400 424 22
425 449 15
450 - 474 4
Moda para series agrupadas
1
Mo Li * ic
1 2
Li = 374.5
Salario ($) f
1 = 36 28 = 8
299.5 324.5 5
2 = 36 22 = 14
324.5 349.5 18
ic = Ls - Li Clase 349.5 374.5 28
modal
ic = 374.5 349.5 = 25 374.5 399.5 36
Mo Li
1
* ic 399.5 424.5 22
1 2
8 424.5 449.5 15
Mo 374.5 * 25
8 14
449.5 474.5 4
Mo $383.59 Salario que ms se repite
OTROS PROMEDIOS
La media ponderada:
xw
wi x i
wi
Ejemplo1: En una escuela metropolitana de San Salvador
hay tres secciones de noveno grado, se les pas un
examen de Matemtica, con los siguientes resultados en
puntaje: Hallar la media ponderada de los puntajes:
Secciones Wi Xi
Xi: siempre ser la
(No. De personas) (Puntaje)
variable en
A 25 68 estudio.
B 30 70
Wi: ser la otra
C 45 60 variable en
relacin.
xw
wi x i
wi
Secciones Wi Xi
(25)(68) (30)(70) (45)(60)
xW
A 25 68 25 30 45
6500
B 30 70 xw
100
C 45 60 x w = 65 (media ponderada en puntaje)
Ejemplo 2: En un hospital en Los ngeles California, hay
50 enfermeras asistentes con un salario de $8.00/ hora; 50
enfermeras prcticas y su salario es de $10.00/ hora; y 100
enfermeras registradas con un salario de $14.00/hora.
Encontrar el salario promedio ponderada para este grupo
de enfermeras.
xw
wi x i
wi
x w (50)(8)+(50)(10)+(100)(14)
50+50+100
x w 400+500+1400
200
2300
xw
200
x w 11.5
R/ El salario medio ponderado es de $11.5/h
La Media Geomtrica
MG x x x ... x n
1 2 3 n
n= numero de DATOS
MG x x x ... x
n
1 2 3 n
MG 8
286410 684
MG 7372808
MG 5.4
Incremento Porcentual Promedio en el tiempo o tasa
de cambio
Valoralfinaldelperiodo
MG n 1
Valoralprincipiodelperiodo
n= numero de aos
Ejemplo:
Un pas tiene, en 1967 una poblacin de 6.5 millones de
habitantes, la cual sube en 1977 a 8 millones de
habitantes.
a) Cul es la poblacin media geomtrica del perodo?
b) Cul es la tasa anual de crecimiento?
Incremento porcentual promedio en el
tiempo continuacin
a) MG n x1 x2 x3 ... xn
MG 6.58
MG 52
MG 7.21 millones (media poblacional para ese periodo)
Valoralfinaldelperiodo
b) MG n 1
Valoralprincipiodelperiodo
MG 10
8
1 MG 1.0209 1
6.5 MG 0.0209 *100
MG 2.1%
MG 1.23 1
10
8 8
H 4.75
1 1 1 1 1 1 1 1 1.68333 3
2 8 6 4 10 6 8 4
MH MG X
MEDIDAS DE VARIABILIDAD Y DE POSICIN
Objetivos especficos
Que el estudiante:
Defina y calcule el Rango para datos simples y datos agrupados.
Calcule e interprete la Desviacin Media, varianza y desviacin tpica.
Pueda calcular e interpretar: cuartiles, deciles y percentiles para datos
agrupados y no agrupados.
Medidas de Variabilidad o Dispersin
Xi (poblacin)
MD
N
Xi x (muestra)
MD
n 1
Xi
Recordando: x
n
Xi
N
2. Varianza ( ) 2
Xi
2
Varianza
2
Poblacional
N
Xi x 2 Varianza Muestral
S 2
n 1
3. DESVIACION ESTANDAR
Tabla simple sin
frecuencia
Xi
2
Poblacion
N
Xi x
2
S Muestra
n 1
PARA DATOS AGRUPADOS
Aquellos datos que estn agrupados por intervalos de clase.
1. Desviacin media (DM)
F Xm
(poblacin) MD
N
(muestra) F Xm x
MD
n 1
Recuerde que la media aritmtica en este tipo de datos es:
FXm
x
n
FXm
N
2. Varianza ( )
2
F Xm
2
Varianza
2
Poblacional N
Varianza Muestral F Xm x 2
S 2
n 1
3. DESVIACION ESTANDAR ( )
F Xm
2
Poblacin
N
F Xm x
2
Muestra
S
n 1
Medidas de Variabilidad o Dispersin
(Series Simples o datos sin agrupar)
* Rango o amplitud: La medida de dispersin mas simple.
AExc = Valor mayor - Valor menor
Ej: Para le serie 2,3,5,7,15,9,11,1,3,6 que representa una poblacin el rango seria:
AExc = 15-1 = 14 Tabla simple sin frecuencia
* Desviacin Media : Xi | Xi- |
MD Xi Xi-
N 1 -5.2 5.2
2 -4.2 4.2
Xi
MD
Xi 3 -3.2 3.2
N N
3 -3.2 3.2
= 2+3+5+7+15+9+11+1+3+6 5 -1.2 1.2
6 -0.2 0.2
10 7 0.8 0.8
MD = 34.4
= 62 = 6. 20 9 2.8 2.8
10
10 11 4.8 4.8
MD = 3.44 15 8.8 8.8
= 0 =34.4
Interpretacin de la MD
Un valor pequeo en la desviacin media, indica que la
media si es representativa de los datos, mientras que si la
desviacin media tiene un valor grande, esto indica
dispersin en los datos.
Ventajas: Se usan todos los datos
Es fcil de entender, es la cantidad promedio en la
que los valores se separan de la media.
Desventaja: El uso de valores absolutos.
Por tal razn se usa mejor la desviacin estndar
Varianza y Desviacin Estndar Poblacional (para datos
simples o datos sin agrupar)
La Varianza y la Desviacin Tpica se pueden usar para
comparar la dispersin (separacin) de dos o ms conjuntos de
observaciones. Por ejemplo:
Las notas de las asignaturas bsicas en el ltimo ao de
Bachillerato de Rebeca y Juan para el ao 2007 fueron:
Xi N 0.56
8 0.3 0.09
7.5 -0.2 0.04 = 2.8/5 0.75
9 1.30 1.69 = 0.56 Varianza
7 -0.7 0.49 Desviacin
7 -0.7 0.49 estndar
=0 2.8
xi / N
8 7.5 9 7 7
7.7 promedio de nota
5
Varianza y Desviacin Estndar Poblacional (para datos
simples o datos sin agrupar)
Promedio para las notas de Juan:
x
Tabla simple sin frecuencia 2
Nota Xi- | Xi- |
2
Xi N
6
7
-1.3
-0.3
1.69
0.09 = 9.8/5
2
7 -0.3 0.09 1.96
6.5 0.8 0.64 = 1.96 Varianza
10 2.7 7.29 1.4
=0 9.8
xi / N
Desviacin
estndar
6 7 7 6.5 10
5
7.3 promedio de nota
Varianza y Desviacin Estndar Poblacional (para datos
simples o datos sin agrupar)
REBECA JUAN
= 0.56 Varianza = 1.96 Varianza
0.75 Desviacin estndar
1.4 Desviacin estndar
Al comparar los resultados de ambos, los resultados mas
pequeos indican que los datos estn menos dispersos.
Conclusin: Las notas de Juan estn mas dispersas
(separadas) con respecto a su Media Aritmtica, mientras
que las notas de Rebeca estn menos dispersas con respecto
a su Media Aritmtica.
Por lo anterior podemos decir que la Media Aritmtica sera
mas representativa para las notas de Rebeca que para las de
Juan.
Varianza y Desviacin Estndar Muestral (para
datos simples o datos sin agrupar)
EJEMPLO: Los salarios por hora en una muestra de profesores de
medio tiempo en dos Universidades son:
U1 ($3,$4, $6, $8, $10, $11); U2 ($2,$3, $4, $6, $7, $8)
Encuentre la Varianza, la Desviacin Estndar, compare los resultados e
interprtelos.
Se usa una tabla simple sin frecuencia (datos ordenados
ascendentemente).
FRMULA CONCEPTUAL: U1: x xi / n
X= 3+4+6+8+10+11
Xi x 2 6
S
2 X= 42
n 1 6
X= $7.00
Varianza y Desviacin Estndar Muestral (para datos
simples o datos sin agrupar)
U1: x $7.00
Xi x 2
x xi / n S 2
6 6 1
x $5.00 3 -2 4 28
S 2
4 -1 1
5
S 2 5.6 Varianza
6 1 1
7 2 4 S S2 S $2.37 Desviacin
tpica
8 3 9 S 5.6
28
Varianza y Desviacin Estndar Muestral (para datos simples
o datos sin agrupar)
Compare los resultados e interprtelos.
U1: S = $3.22 U2: S = $2.37
F Xi x
36 1 36 1.4 1.4 2 2 2
F Xi x MD = 56 = 2.24
MD
n 1
26-1
F Xi x 2
S
2
S2 = 165.2 = 6.61
n 1
26-1
F Xi x
2
S S =6.61 =2.57
n 1
Para la serie del puntaje obtenido por todas las alumnas del
Colegio X en un examen de Leguaje, la amplitud total sera
At = Ls de la ltima clase Li de la primera clase
Puntaje f At = 57 - 28
28 32 10 At = 29 puntos
33 37 15
38 42 20
43 47 35
48 52 19
53 57 12
Medidas de Variabilidad o Dispersin
Datos Agrupados
Para la serie de los salarios de
Salario ($) f
un grupo de personas el rango
300 324 5 sera:
325 349 18 At = Ls de la ltima clase Li de la primera clase
350 374 28
At = 474 - 300
375 399 36
At = $174.00
400 424 22
Suponer que es una muestra:
425 449 15 - Encontrar Desviacn Media, Varianza y Desviacin
Estandar
450 - 474 4
Medidas de Variabilidad o Dispersin de Datos Agrupados
(tablas con intervalos de clase)
*Desviacin Media
Ganancia en millones de dlares, f Xm x
obtenida al finalizar el ao pasado por DM
un grupo de empresas nacionales. n 1
fXm
Millones de
dlares
Nmero de
Empresas (F)
Xm FXm x
n
05 12 2.5 30
4235
5 10 35 7.5 262.5
x
10 15 41 12.5 512.5 250
15 20 95 17.5 1662.5
20 25 35 22.5 787.5
x $16.94 millones
25 30 17 27.5 467.5
30 35 10 32.5 325
35 40 5 37.5 187.5
n=250 = 4235
Medidas de Variabilidad o Dispersin de Datos Agrupados
*Desviacin Media
51-58 28 f Xm
59-66 131 MD
67-74 283 N
F Xm
2
75-82 351
83-90 185
2
91-98
99-106
64
14
N
F Xm
2
107-114 1
N
Medidas de Variabilidad o Dispersin de Datos Agrupados
*Varianza y Desviacin Estndar
35 40 5 37.5 187.5
4235
Medidas de Variabilidad o Dispersin de Datos Agrupados
*Varianza y Desviacin Estndar
2. Nmero de pulsaciones por minuto de todos los estudiantes
de Bachillerato en una Escuela en Santa Tecla.
f Pm
67-74 283 2
75-82 351 2
83-90 185
N
91-98 64
99-106 14
107-114 1
TEOREMA DE CHEBYSHEV
Regla emprica: En una distribucin simtrica en forma de campana
se establece lo siguiente
a) Aproximadamente el 68% de las observaciones (datos) deben
estar entre la media y mas-menos una desviacin estndar,
queda representado con la siguiente expresin:
Grficamente quedara
68%
x S 68%
2 95%
x 2S 95%
2 2
2S x 2S
TEOREMA DE CHEBYSHEV
Regla emprica: En una distribucin simtrica en forma de campana
se establece lo siguiente
x 3S 99.7%
El uso de esta frmula revela el
dato mayor y el dato menor de la
distribucin ya que est
representando casi al 100% de
los datos.
3 3
Con estos datos se puede
determinar la amplitud de la 3S x 3S
distribucin (AExc) =PM - Pm
TEOREMA DE SHEBYSHEV: En una distribucin simtrica en forma de campana
y establece que:
CUANDO CONOZCA LA MEDIA Y LA DESVIACION ESTANDAR , Y LE
PREGUNTEN SOBRE QU INTERVALO DE DATOS ESTA ENTRE LOS
PORCENTAJES MENCIONADOS .
x 3S 1.69 (3)0.07
x 3S 1.69 (3)0.07 1.48
x 3S 1.69 (3)0.07 1.90
El PM=1.80 m
Pm = 1.48 m
TEOREMA DE CHEBYSHEV
En cualquier conjunto de observaciones (muestra o poblacin) la
proporcin de los valores que queda dentro de k desviaciones
estndar de la media es por lo menos
Cuantiles o fractiles
50% 50%
Md
25% 25% 25% 25%
Cuartiles (Qn)
n = 1,2,3 Q1 Q2 Q3
Deciles (Dn)
n =1,2,3,4..9
D1 D2 D3 D4 D5 D6 D7 D8 D9
1%
Percentiles (Pn)
n = 1,2,3,4,.99
P1 P25 P50 P75 P99
Cuartiles (Qn)
Dividir en 4 partes iguales la distribucin, cada una representa al 25%,
se pueden encontrar 3 cuartiles. n = 1,2,3
Deciles (Dn)
Dividir en 10 partes iguales la distribucin, cada una representa al
10%, se pueden encontrar 9 deciles.
n =1,2,3,4..9
Percentiles (Pn)
Dividir en 100 partes iguales la distribucin, cada una representa al
1%, se pueden encontrar 99 percentiles
n = 1,2,3,4,.99
El procedimiento es parecido que cuando encontrbamos
mediana para datos agrupados y no agrupados.
Por lo tanto:
Md = Cuartil 2
Md = percentil 50
Md = decil 5
50% 50%
R/ Md = 32.5 minutos
R/ Q1 = 17.5 minutos
25% 75%
R/ D4 = 25 minutos
Interpretacin: El 40% de las personas tarda
menos de 25 minutos para trasladarse desde su
casa al gimnasio y el otro 60% de las personas
tarde ms de 25 minutos en el traslado.
40% 60%
D4= 25 minutos
MEDIDAS DE POSICIN (Para series simples o
series No agrupadas
Minutos que tardan las personas en trasladarse de su casa al gimnasio
c) Decil siete D7 = P70
5 15 22 35 45 50
L p n 1
P
7 16 25 36 46 51 100
L p 30 1
70
8 18 25 38 47 53 100
L p 21.7
10 18 28 40 49 54
Esto quiere decir que el
10 20 30 42 49 55 valor del D7 est entre
el vigsimo primero y
Procedimiento para encontrar el decil siete: vigsimo segundo dato
R/ D7 = 45.7 minutos
Interpretacin: El 70% de las personas tarda
menos de 45.7 minutos para trasladarse desde su
casa al gimnasio y el otro 30% de las personas
tarde ms de 45.7 minutos en el traslado.
70% 30%
Cuartiles: Deciles:
n
n x1 faa
x1 faa D1 LRi 10 * ic
Q1 LRi 4 * ic f D1
f Q1 n
n x 2 faa
x2 faa D2 LRi 10 * ic
Q2 LRi 4 * ic f D2
f Q2 n
x5 faa
n
D5 LRi 10 * ic
x3 faa f D5
Q3 LRi 4 * ic
f Q3 n
x9 faa
D9 LRi 10 * ic
f D9
MEDIDAS DE POSICIN (Para series agrupadas)
En todas las formulas Li ser el limite real
Frmulas para series agrupadas: inferior (se le resta 0.5 al limite inferior
absoluto de la clase que ubica al decil,
cuartil o percentil buscado.
Faa: Frecuencia acumulada anterior a la
Percentiles: clase.
n F: Frecuencia absoluta de la clase que se
x1 faa esta usando.
P1 Li 100 * ic
f P1
n
x 2 faa n
x43 faa
P2 Li 100 * ic
f P2 P43 Li 100 * ic
f P43
n
n x99 faa
x27 faa P99 Li 100 * ic
P27 Li 100 * ic f P 99
f P 27
MEDIDAS DE POSICIN (Para series agrupadas)
Se tiene inters en estudiar el
rendimiento de un cierto tipo Para la anterior informacin
de automvil que consume calcule e interprete lo siguiente:
gasolina, para ello se toma
una muestra obteniendo los a) El valor del Q3
siguientes resultados:
b) El valor del D2 y D6
Km. por galn f
35 39 8 c) El valor del P39 y P83
40 44 22
45 49 32
50 54 16
55 - 59 2
MEDIDAS DE POSICIN (Para series agrupadas)
Solucin del literal a) Q3
Rendimiento de un cierto tipo de automvil que consume gasolina
Km. por galn f Km, por galn fa
Clase Q3 Ubica la
35 39 8 34.5 39.5 8 clase Q3
40 44 22 39.5 44.5 30
n
45 49 32 44.5 49.5 62 x3 faa
50 54 16 49.5 54.5 Q3 Li 4 * ic
78 f Q3
55 - 59 2 54.5 59.5 80
80 x3 30
n =80 Q3 44.5 4 *5
Este valor se 32
n80
x3x3 60
ubica en la fa R / Q3 49.19 km / galn
44
Interpretacin: El 75% de los
Li 44.5 f Q3 32 ic 5
automviles rinde menos de
49.19 Km/galn y el otro 25% de
ic ls li los automviles rinde ms de
faa 30 ic 44.5 39.5 49.19 Km/galn
MEDIDAS DE POSICIN (Para series agrupadas) Solucin
del literal b) D2
Rendimiento de un cierto tipo de automvil que consume gasolina
n n
x39 faa x83 faa
P39 Li 100 * ic P83 Li 100 * ic
f P 39 f P 83