Documente Academic
Documente Profesional
Documente Cultură
_________________________________________________________________________
Estadstica I
www.unipamplona.edu.co
Esperanza Paredes Hernndez
Rectora
Mara Eugenia Velasco Espitia
Decana Facultad de Estudios a Distancia
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA I
_________________________________________________________________________
Tabla de Contenido
Presentacin
Introduccin
UNIDAD 1: Generalidades de la Estadstica
Ncleos Temticos y Problemticos
Proceso de Informacin
1.1. DEFINICIN
1.1.1 Importancia
1.1.2 Poblacin
1.1.3 Muestra
1.1.4 Mtodos de Seleccin de una Muestra al Azar
1.1.5 Unidad Estadstica
1.2
ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS
1.2.1 Recoleccin de Datos
1.2.2 Intervalos
1.2.3 Amplitud
1.2.4 Frecuencia de Clase o Frecuencia Absoluta
1.2.5 Marca de Clase (X)
1.2.6 Frecuencia Relativa (Fr)
1.2.7 Frecuencia Acumulada (Fa)
1.2.8 Frecuencia Relativa Acumulada (Fra)
Proceso de Comprensin y Anlisis
UNIDAD 2: Medidas de Tendencia Central
Ncleos Temticos y Problemticos
Proceso de Informacin
2.1
PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS
2.1.1 Media Aritmtica
2.1.2 Mediana
2.1.3 Moda
2.2
SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS
2.2.1 Media Aritmtica
2.2.2 Mediana
2.2.3 Moda
Proceso de Comprensin y Anlisis
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA I
_________________________________________________________________________
UNIDAD 3: Medidas de Dispersin
Ncleos Temticos y Problemticos
Proceso de Informacin
3.1
DESVIACIN ESTNDAR O TPICA
3.2
VARIANZA
3.3
COEFICIENTE DE VARIACIN
Proceso de Comprensin y Anlisis
UNIDAD 4: Medidas de Ubicacin
Ncleos Temticos y Problemticos
Proceso de Informacin
4.1
CUARTILES, PERCENTILES Y DECILES
4.2
DIAGRAMAS DE CAJA
Proceso de Comprensin y Anlisis
UNIDAD 5: Presentacin de la Informacin
Ncleos Temticos y Problemticos
Proceso de Informacin
5.1
HISTOGRAMA
5.2
POLGONOS DE FRECUENCIA
5.3
OJIVAS
5.4
BARRAS
5.4.1 Barras Verticales
5.4.2 Barras Horizontales
Proceso de Comprensin y Anlisis
ANEXO: Tablas
BIBLIOGRAFA GENERAL
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA BASICA
Presentacin
La educacin superior se ha convertido hoy da en prioridad para el gobierno
Nacional y para las universidades pblicas, brindando oportunidades de superacin
y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin
para merecer de este servicio educativo; prueba de ello es el espritu de las
actuales polticas educativas que se refleja en el proyecto de decreto Estndares
de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la
Presidencia de la Repblica, el cual define:
Que la Educacin Superior a
Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en
los cuales se hace uso de mediaciones pedaggicas que permiten crear una
ruptura espacio temporal en las relaciones inmediatas entre la institucin de
Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes
entre s.
La Educacin Superior a Distancia ofrece esta cobertura y oportunidad educativa
ya que su modelo est pensado para satisfacer las necesidades de toda nuestra
poblacin, en especial de los sectores menos favorecidos y para quienes las
oportunidades se ven disminuidas por su situacin econmica y social, con
actividades flexibles acordes a las posibilidades de los estudiantes.
La Universidad de Pamplona gestora de la educacin y promotora de llevar
servicios con calidad a las diferentes regiones, y el Centro de Educacin Virtual y a
Distancia de la Universidad de Pamplona, presentan los siguientes materiales de
apoyo con los contenidos esperados para cada programa y les saluda como parte
integral de nuestra comunidad universitaria e invita a su participacin activa para
trabajar en equipo en pro del aseguramiento de la calidad de la educacin superior
y el fortalecimiento permanente de nuestra Universidad, para contribuir
colectivamente a la construccin del pas que queremos; apuntando siempre hacia
el cumplimiento de nuestra visin y misin como reza en el nuevo Estatuto
Orgnico:
Misin: Formar profesionales integrales que sean agentes generadores de
cambios, promotores de la paz, la dignidad humana y el desarrollo nacional.
Visin: La Universidad de Pamplona al finalizar la primera dcada del siglo XXI,
deber ser el primer centro de Educacin Superior del Oriente Colombiano.
Maria Eugenia Velasco Espitia Directora CEDUP
ESTADISTICA BASICA
Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos
intelectuales del hombre es notoria a travs de su historia. Fue as como en la
antigedad el pensamiento matemtico contribuy a resolver problemas en tareas
econmicas y constructoras de diferentes pueblos, dio la base para revelar tos
misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad
de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la
edad media utilizaron el contenido matemtico como una simple rutina para
disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la
matemtica en la edad moderna ayud a buscar explicaciones concretas de
problemas que se daban en ingeniera, construccin y otras actividades prcticas
del hombre.
Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por
un conjunto de experiencias, que manejan y manipulan de una manera
sorprendente. Es decir, en cierta forma se est efectuando una serie de
operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante
unas representaciones significativas para l y as se obtiene una serie de
conclusiones razonables.
Esta informacin que de cierta manera se manipula, se debe matematizar. Es
decir, seguir un procedimiento para poder tabular la informacin, presentarla y as
hacer el anlisis respectivo para dar las conclusiones pertinentes al estudio que se
est realizando.
La Estadstica es utilizada en casi todas las ramas de la ciencia moderna, as como
en muchos otros campos de la actividad humana. Como dijo Salomn Fabricant
todo el mundo parece hoy coincidir en que la Estadstica puede ser til para
comprender, evaluar y controlar el funcionamiento de la sociedad. En nuestra
sociedad, el progreso puede medirse mediante diversos ndices numricos, la
estadstica se utiliza para describir, manipular e interpretar estos nmeros.
An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como
herramienta fundamental para el anlisis e interpretacin de resultados son
ESTADISTICA BASICA
ESTADISTICA BASICA
ESTADISTICA BASICA
UNIDAD 1: Generalidades de la
Estadstica
Ncleos Temticos y Problemticos
Definicin
Estadstica Descriptiva Distribucin de Frecuencias
Proceso de Informacin
1.1
DEFINICIN
ESTADISTICA BASICA
importante que realiza, ya que permite obtener conclusiones para un grupo mayor,
denominado poblacin, partiendo de una investigacin realizada en un grupo
menor, denominado muestra.
Las siguientes son unas definiciones que ayudan a determinar el sentido de la
estadstica:
Dicaonano de Webster una rama de las matemticas que trata de la recopilacin,
el anlisis, la interpretacin y la presentacin de una gran cantidad de datos
numricos.'
Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los
datos reunidos al contar o medir las propiedades de alguna poblacin.
Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los
resultados de los experimentos o procesos."
Al unir estas definiciones, se puede notar que a partir de la recopilacin de datos
se pueden hacer inferencias con respecto a resultados de experimentos. Es decir a
partir de un conjunto de mtodos, normas, reglas y de principios para observar,
agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
Es entonces, un campo parcial de la Matemtica aplicada a un conjunto de objetos
que se asignan valores numricos y luego estos se siguen elaborando
matemticamente.
Matemticamente los procedimientos estadsticos estn muy desarrollados y
asegurados en el plano de la teora, por ejemplo, mediante la indicacin de
mbitos dentro de los cuales puede suponerse o rechazarse una hiptesis. Se
acostumbran a distinguir dos clases de Estadstica, la descriptiva y la de inferencia.
1.1.1
Importancia
ESTADISTICA BASICA
Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de
la vida:
1.1.2
Poblacin
Ejemplo
La poblacin consistente en todas las tuercas producidas por una fbrica en un da
especfico, los estudiantes matriculados en un colegio, son poblaciones finitas;
mientras que la determinada por todos los posibles resultados (caras, cruces) de
sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban
un seguro de vida, las piezas fabricadas por una mquina, son poblaciones
infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado
es finita pero si no se especifica este tiempo es entonces infinita.
1.1.3
Muestra
ESTADISTICA BASICA
investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras
de ser seleccionadas, por tal razn no se puede determina la validez, ni la
confianza que merecen dichos resultados.
1.1.4
Azar Simple
Este mtodo de seleccin permite que todos los elementos que constituyen la
poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo
es de gran importancia cuando la poblacin no es grande o siendo grande, este se
concentra en un rea pequea. Tambin cuando las caractersticas que se
investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin
para su seleccin.
Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son
obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una
muestra aleatoria simple de 200 personas, en este caso, la probabilidad de
seleccin de cada persona es:
n
200
P=
1000
= 0.2
Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y
30 profesionales.
Por Estratos
Para el muestreo estratificado se divide la poblacin en vanos grupos o estratos
con el fin de dar representatividad a los distintos factores que integran la poblacin
del estudio, la condicin de la estratificacin es la presencia en cada estrato de las
caractersticas que conforman la poblacin.
ESTADISTICA BASICA
80/600= 0,133
80/250= 0,32
80/150= 0,53
Por Conglomerado
Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son
aplicables, ya que no se dispone de una lista con el numero de elementos de la
poblacin ni en los posibles estratos. En estos casos tpicamente los elementos de
la poblacin se encuentran de manera natural agrupados en conglomerados, cuyo
nmero si se conoce.
Por ejemplo la poblacin se distribuye en provincias, los habitantes de una ciudad
en barrios, etc. Si se supone que cada uno de estos conglomerados es una
muestra representativa de la poblacin total respecto a la variable que se estudia,
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia
ESTADISTICA BASICA
Sistematizada
Una forma prctica para seleccionar la muestra es hacerla en forma sistemtica,
escogiendo una muestra de cada intervalo, donde el intervalo se calcula as: K=
N/n; donde N es el tamao de la poblacin y n el de la muestra.
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene
2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4.
Para iniciar el proceso de seleccin sistemtica se escoge al azar un nmero entre
1 y 4, a partir del nmero seleccionado y cada 4 viviendas se hace una escogencia,
hasta completar la muestra.
1.1.5
Unidad Estadstica
Dato
Hace referencia a la observacin particular, es decir, la informacin relacionada
con las caractersticas de cosas existentes que pueden ser recogidos, anotados u
observados
Variables
Es una dimensin o una caracterstica de una unidad de anlisis, dimensin que
adopta la forma de una clasificacin. Una variable se puede representar por un
smbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores;
dichas variables pueden ser:
ESTADISTICA BASICA
Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores
ms altos se le asignan a los individuos que tienen ms de la caracterstica que
se mide.
Esto hace que necesariamente satisfaga la caracterstica de
diferenciacin pero en adicin introduce la posibilidad de ordenamiento.
Por ejemplo, en una competencia ciclstica se tiene en cuenta los cinco
primeros puestos para la premiacin.
Variable Continua: es la variable que puede tomar cualquier valor entre dos
valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm,
1.80.
1.2
Recoleccin de Datos
ESTADISTICA BASICA
17
33
28
35
20
11
26
24
33
23
31
34
10
20
22
28
29
39
26
28
25
22
18
10
21
14
29
15
19
25
18
30
29
34
11
17
27
25
29
13
23
21
16
29
21
16
20
34
38
37
32
26
24
18
R = rango
Dm = dato mayor
dm = dato menor
R= 40 - 10 = 30
1.2.2
Intervalos
m = nmero de intervalos
n = tamao de la muestra
ESTADISTICA BASICA
1.2.3
Amplitud
INTERVALOS
- 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
40 -
Otra manera de formar los intervalos de clase es tomar un dato como medida de
referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor
de la amplitud:
NMERO DE
INTERVALOS
INTERVALOS
1
5 - 10
2
10 - 15
3
15 - 20
4
20 - 25
5
25 - 30
6
30 - 35
7
35 - 40
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia
ESTADISTICA BASICA
1.2.4
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
/
/////
////////////
/////////////
//////////////
////////
////
TOTAL
2
5
12
14
15
8
4
60
X
7,5
12,5
17,5
22,5
27,5
32,5
37,5
ESTADISTICA BASICA
X=
5+10
2
= 7,5
Miles de pesos; esto quiere decir que el promedio del primer intervalo es de
$7500.
Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia comn
entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos.
1.2.6
ESTADISTICA BASICA
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
2
5
12
14
15
8
4
Fa
2
7
19
33
48
56
60
60
58
53
41
27
12
4
Fr
5 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
0.0333
0.0833
0.2
0.2333
0.25
0.1333
0.0667
Fra
0.0333
0.1167
0.3167
0.55
0.8
0.9333
1
1
0.9666
0.8833
0.6833
0.45
0.2
0.0667
ESTADISTICA BASICA
Intervalo
Fr
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total
2
5
12
14
15
8
4
60
0,0333
0,0833
0,2
0,2333
0,25
0,1333
0,0667
1,00
Fa
2
7
19
33
48
56
60
Fra
60
58
53
41
27
12
4
0,0333
0,1167
0,3167
0,55
0,8
0,9333
1
1
0,9666
0,8833
0,6833
0,45
0,2
0,0667
Decir de las siguientes variables cules son continuas y cules son discretas
Realizar un inventario
Determinar la demanda de un producto
La posibilidad que llueva en una ciudad determinada
El porcentaje de desempleo en una ciudad especfica
El promedio de las acciones vendidas en la bolsa de valores en una empresa en
un mes determinado
El aumento del ndice de precios al consumidor en un mes especfico
El aumento del costo de vida en un mes especfico
El nmero de accidentes ocurridos en una ciudad determinada
Las ventas de un almacn en un mes determinado
ESTADISTICA BASICA
Agricultura
Biologa
Negocios
Qumica
Comunicaciones
Finanzas
Economa
Educacin
Electrnica
68
84
75
82
68
90
62
88
93
60
73
88
79
73
93
76
71
59
85
75
61
65
75
87
Educacin
Electrnica
Medicina
Fsica
Mercadeo
Ciencias polticas
Psicologa
Medicina
Fsica
78
66
72
63
78
95
62
74
82
75
94
77
69
74
68
60
79
60
95
75
61
89
78
96
83
71
79
62
67
97
78
85
57
73
80
65
75
71
65
76
88
78
62
76
53
74
86
67
Mercadeo
Ciencias polticas
Psicologa
Ingeniera
Administracin
Produccin
Sociologa
77
85
75
76
63
72
81
73
Hallar:
La calificacin ms alta
La calificacin ms baja
El rango
Las cinco notas ms altas
Las cinco notas ms bajas
La dcima nota de mayor a menor
La tabla de frecuencias utilizando 7 intervalos
ESTADISTICA BASICA
1176
1233
1024
1000
932
1234
1104
1233
985
1079
1032
1358
1324
1343
1248
1093
1690
1229
614
918
1202
944
1310
1262
1385
1022
1067
759
1105
824
956
1252
1404
1203
1024
1243
1185
816
972
1415
827
905
1109
1157
1220
1381
1303
1209
1490
Responder:
72
84
73
80
62
63
86
72
74
69
71
67
78
88
73
71
73
81
67
75
79
99
76
78
70
77
70
72
73
82
67
64
68
74
76
72
ESTADISTICA BASICA
NMERO DE EMPLEADOS
8
10
16
14
10
5
2
65
ESTADISTICA BASICA
VIDA MEDIA (Horas)
300 - 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
Total
NMERO DE TUBOS
14
46
58
76
68
62
48
22
6
400
Los dimetros internos de los tubos fabricados por una empresa se miden con
precisin de milsima de pulgada. Si las marcas de clase de una distribucin
de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33,
0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase.
1.729
1.731
1.735
1.735
1.738
1.730
1.729
1.727
1.744
1.735
1.743
1.726
1.724
1.745
1.725
1.732
1.727
1.734
1.732
1.729
1.740
1.737
1.733
1.736
1.733
1.730
1.735
1.732
1.737
1.734
1.736
1.728
1.742
1.742
1.734
1.739
1.735
1.736
1.731
1.730
1.741
1.737
1.736
1.740
1.732
1.734
1.732
1.741
1.746
1.740
ESTADISTICA BASICA
ESTADISTICA BASICA
Proceso de Informacin
Las medidas de centralizacin son valores que tienden a situarse en el centro del
conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin
ms usadas son: Media aritmtica, mediana y moda.
La media aritmtica es la medida de tendencia central ms conocida, es fcil de
calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de
intervalos ya sean discretos o continuos. Esta medida se define como la suma de
todos los valores observados dividido por el nmero de observaciones, es decir
encontrar el promedio de los datos en estudio.
La mediana se define como la medida de tendencia central que divide a cualquier
distribucin en dos partes iguales. Esta medida se puede aplicar a variables de
intervalos (discretas y continuas) y variables ordinales.
La moda de una distribucin se define como el valor que presenta la mayor
frecuencia, se usa con variables de intervalos nominales y ordinales.
Es
comnmente utilizada como una medida de popularidad que refleja la tendencia de
una opinin.
ESTADISTICA BASICA
2.1
2.1.1
Media Aritmtica
X=
X1 + X2 + X3 + Xn
=
xi
i=1
n
Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la
media aritmtica se puede calcular del modo siguiente:
n
X=
fixi
=
i=1
n
fi
i=1
En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso
determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media
aritmtica ponderada del modo siguiente:
n
X=
i=1
n
wi
i=1
Ejemplo
6+4+3+7+8
28
x = =5,6
5
5
Hallar la media aritmtica de los siguientes datos que representan las edades
de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.
ESTADISTICA BASICA
3*6+4*4+2*3+1*7
47
x= = 4,7
3+4+2+1
10
El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos.
Nota
8
7
3
6
5
6
5
7
4
Peso
1
3
3
3
3
2
2
2
1
X=
1+3+3+3+3+2+2+2+1
111
X=
= 5,55
20
Mediana
Ejemplo
ESTADISTICA BASICA
27800
43850
27800
43850
54300
60500
54300
60800
54350
54350
73200
60500
60800
73200
295
304
332
339
344
304+332
Md =
= 318
2
El puntaje de las pruebas que se encuentra en la mitad es de 318.
2.1.3
Moda
Ejemplo
N de Alumnos
10
18
5
4
ESTADISTICA BASICA
Color
Blanco
Gris
Azul
Negro
Rojo
Morado
Caf
Vinotinto
Numero de Personas
4
8
9
4
3
2
8
8
Lo cual indica que los colores que pueden estar de moda son el gris, caf y
vinotinto.
2.2
2.2.1
Media Aritmtica
n
X=
x i fi
i=1
Ejemplo
F
2
5
12
14
15
8
4
0
60
X
7.5
12.5
17.5
22.5
27.5
32.5
37.5
X*F
15
62.5
210
315
412.5
260
150
0
1425
ESTADISTICA BASICA
X=
1425
= 23,7 = 24
60
X=
1532.8
F
10
3
7
7
5
8
40
X
14.8
24.4
34
43.6
53.2
62.8
X*F
148
73.2
238
305.2
266
502.4
1532.8
= 38.3 = 38
40
El puntaje promedio de los 40 alumnos es de 38.
2.2.2
Mediana
Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos:
Md = li +
n _ Fa
2
F n/2
A; donde:
ESTADISTICA BASICA
Ejemplo
F
2
5
12
14
15
8
4
60
Intervalos
10 - 19.6
19.6 - 29.2
29.2 - 38.8
38.8 - 48.4
48.4 - 58
58 67.6
Total
F
10
3
7
7
5
8
40
Moda
ESTADISTICA BASICA
Ejemplo
F
2
5
12
14
15
8
4
60
F
10
3
7
7
5
8
40
ESTADISTICA BASICA
Salarios
540 - 607
607 - 674
674 - 741
741 - 808
808 - 875
875 - 942
942 - 1009
1009 - 1076
Total
F
6
19
36
24
26
19
10
4
144
De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los
restantes sietes. Hallar la media aritmtica, la media y la moda.
F
5
18
42
27
8
100
F
3
5
9
12
5
4
2
40
ESTADISTICA BASICA
F
2
5
12
17
14
6
4
60
Hallar la media, mediana y moda tanto para hombres como para mujeres,
estableciendo las respectivas conclusiones.
Edad
(aos)
15 - 19
19 - 23
23 - 27
27 - 31
31 - 35
35 - 39
39 - 43
43 - 47
47 - 51
Hombres
(Miles)
121
2.441
5.930
6.587
11.788
9.049
8.749
5.786
2.581
Mujeres
(Miles)
481
4.184
6.952
7.193
11.893
9.022
8.171
4.654
1.524
ESTADISTICA BASICA
Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de los datos
numricos alrededor de una medida de centralizacin. Las medidas de dispersin
ms utilizadas son:
3.1
Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los
datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X1,
x2, x3,.....xn est determinada por:
ESTADISTICA BASICA
Ejemplo
X=
5.6
ESTADISTICA BASICA
3.2
F
2
5
12
14
15
8
4
60
X
7.5
12.5
17.5
22.5
27.5
32.5
37.5
(X-x)2 F
544.5
661.25
507
31.5
183.75
578
729
3235
VARIANZA
ESTADISTICA BASICA
Ejemplo
X = 4.7
18.1
S2 = = 1.81
10
F
2
5
12
14
15
8
4
60
X
7.5
12.5
17.5
22.5
27.5
32.5
37.5
(X-x)2 F
544.5
661.25
507
31.5
183.75
578
729
3235
ESTADISTICA BASICA
3235
S2 = = 53.9
60
3.3
COEFICIENTE DE VARIACIN
Ejemplo
S = 7.3
7.3
Cv = *100
24
Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta
establecimientos son homogneas.
ESTADISTICA BASICA
5
CVA = *100 = 12.5% para el operador A
40
15
CVB = *100 = 9.4% Para el operador B
180
Esto significa que el operador B, quien tiene mayor desviacin en la produccin,
presenta menor variacin, porque la media de produccin para el operador B es
mucho mayor que la del operador A.
F
5
18
42
27
8
100
NM. EMPLEADOS
8
10
16
14
ESTADISTICA BASICA
SALARIOS
$290.000 - $300.000
NM. EMPLEADOS
$300.000 - $310.000
$310.000 - $320.000
Total
2
65
10
X
70
74
78
82
86
90
94
98
102
106
110
114
118
122
126
F
2
5
12
17
ESTADISTICA BASICA
Carga Mxima
(Toneladas Cortas)
10.9 - 11.3
11.3 - 11.7
14
6
11.7 - 12.1
Total
60
ESTADISTICA BASICA
Proceso de Informacin
4.1
Si un conjunto de datos est ordenado por magnitud, el valor central que divide al
conjunto en dos mitades iguales, es la mediana.
Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados
primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.
Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman
deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.
Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles,
denotados por P1 P2,.....P99. El P50 coincide con la mediana.
ESTADISTICA BASICA
Ejemplo
Al primer cuartil
Al tercer decil
Al percentil 80
12
3
n*p
8
4
5
5
10
6
11
8
4
10
6
11
3
12
8*1
Q1 = = = 2
q
4
El dato que est en el primer cuartil es 4, ya que est en la segunda posicin.
n*p
8*3
D3 = = = 2.4 2
q
10
El dato que est en el tercer decil es 4, ya que est en la segunda posicin.
P80
n*p
8 * 80
= = = 6.4 6
q
100
El dato que est en el percentil 80 es 10, ya que este valor est en la sexta
posicin.
Cuando los datos estn agrupados, utilizamos la misma frmula de la mediana y
reemplazamos donde est n/2 por n * p; el lmite inferior es donde est la F (n*p)/q
q
ESTADISTICA BASICA
Ejemplo
n*p
para ubicar el
F
2
5
12
14
15
8
4
60
n = 60
p=1
q=4
n*p = 60*1 = 15
q
4
Li= 15
Fa = 7
F (n*p)/q = 12
A=5
De donde el 25% de las ventas de los 60
establecimientos es de $18000 o menos.
Intervalo n = 60
F
5 - 10 p = 2 2
10 - 15 q = 4 5
15 - 20 n*p 12
= 60*2 = 30
20 - 25 q 14 4
25 - 30 Li= 20
15
30 - 35 Fa =819
35 - 40 F (n*p)/q4 = 14
Total A = 560
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia
ESTADISTICA BASICA
Intervalosn = 60F
5 - 10 p = 3 2
10 - 15 q = 4 5
15 - 20 n*p =1260*3 = 45
20 - 25 q 14 4
25 - 30 Li= 2515
30 - 35 Fa = 833
35 - 40 F (n*p)/q4= 15
Total A = 560
Por lo tanto el 75% de las ventas de los 60
establecimientos es de $29000 o menos
ESTADISTICA BASICA
Intervalosn = 60
F
5 10 p = 5 2
10 - 15 q = 10
5
15 - 20 n*p 12
= 60*5 = 30
20 - 25 q 14 10
25 - 30 Li= 20
15
30 - 35 Fa =819
35 - 40 F (n*p)/q4 = 14
Total A = 560
El 50% de las ventas es de $24000 o
menos
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total
n=F
60
2
p=6
q=5
10
n*p12= 60*6 = 36
q 14 10
Li= 15
25
8 33
Fa =
4 = 15
F (n*p)/q
60
A=5
F
2
5
12
14
15
8
4
60
n = 60
p = 12
q = 100
n*p = 60*12 = 7.2 = 7
q
100
Li= 10
Fa = 2
F (n*p)/q = 5
A=5
ESTADISTICA BASICA
P12= 10+
60*12
-2
100
5 = 15.2 15
n =F60
p =250
q =5100
n*p12= 60*50 = 30
q14
100
15
Li= 20
Fa8= 19
4 = 14
F (n*p)/q
60
A=5
P50= 20+
60*50
-19
5 = 23.9 24
100
14
n =F 60
p =2 80
q =5 100
n*p
12 = 60*80 = 48
q14
100
Li=1525
Fa8 = 33
F (n*p)/q
4 = 15
A=
605
Y el 80% de los establecimientos tienen ventas
de $30.000 o menos.
ESTADISTICA BASICA
4.2
DIAGRAMAS DE CAJA
Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres
cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala
adecuada.
Calcular unos limites admisibles superior e inferior que van a servir para
identificar los valores atpicos. Estos lmites se calculan con :
Li = Q1-1.5
Q3 Q1
Li = Q3 +1.5
Q3 Q1
Considerar como valores atpicos los situados fuera del intervalo (li, Ls).
Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el
valor ms alejado no atpico, es decir, que est dentro del intervalo (li, ls).
Identificar todos los datos que estn fuera del intervalo (li, ls) marcndolos
como atpicos.
Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado
en 2001 y 2002 en varias ciudades colombianas:
A
B
C
D
E
F
G
H
I
2001
248
208
113
128
106
118
60
79
55
2002
221
171
131
89
101
33
63
56
ESTADISTICA BASICA
2001
47
88
47
58
82
33
J
K
L
M
N
O
2002
54
55
69
59
48
16
Para 2001
El primer paso es ordenar la informacin de mayor a menor:
33 47 47 55 58 60 79 82 88 106 113 118 128 208 248
Luego se encuentran los tres cuartiles:
El 25% de ciudades tienen 55 das o menos de
contaminacin o el 25% de las ciudades de EEUU
tienen entre 33 y 55 das de contaminacin.
15*1
Q1 = = 3.75 4
4
15*2
Q2 = = 7.5 8
4
15*3
Q3 = = 11.25 11
4
Ls = 113 + 1,5
113 55
2
113 - 55
= 11,5
= 156,5
ESTADISTICA BASICA
Como todos los valores son superiores al lmite inferior, la lnea inferior del
diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta
direccin.
2001
Este diagrama de caja, muestra que la mayor parte de las observaciones son
menores que 113 y que el extremo superior de 248 est muy alejado del grupo
principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud
del diagrama completo (248 - 33 = 215).
Para 2002
16 33 48 54 55 56 59 63 69 89 101 131 171 221
14*1
Q1= = 3.75 4
4
14*2
Q2= = 7
4
14*3
Q3= = 10.5 11
4
Li = 55 1,5
Ls = 101 + 1,5
101 - 55
2
101 - 55
= 20.5
= 135.5
ESTADISTICA BASICA
2002
Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de
datos.
2001
2002
F
5
18
42
27
8
100
ESTADISTICA BASICA
El primer cuartil
El quinto y octavo decil
El percentil 10 y el percentil 45
Salario
540 - 607
607 - 674
674 - 741
741 - 808
808 - 875
875 942
942 - 1009
1009 - 1076
Total
F
6
19
36
24
26
19
10
4
144
F
3
5
9
12
5
4
2
40
Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92,
3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar:
ESTADISTICA BASICA
Vida Media
300 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
Total
Nmero
de Tubos
14
46
58
76
68
62
48
22
6
400
ESTADISTICA BASICA
UNIDAD 5: Presentacin de la
Informacin
Ncleos Temticos y Problemticos
Histograma
Polgonos de Frecuencia
Ojivas
Barras
Proceso de Informacin
Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en
trminos de magnitudes, para interpretarlos en forma visual.
Presentar la informacin de la tabla de frecuencias por medio de grficas sirve
para reforzar las conclusiones que se determinan de esta tabla. Estas grficas se
pueden utilizar para:
ESTADISTICA BASICA
Existen varios tipos de grficas para representar los datos estadsticos y al mismo
tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.
5.1
HISTOGRAMA
F
2
5
12
14
15
8
4
0
60
ESTADISTICA BASICA
POLGONOS DE FRECUENCIAS
Es una curva que se traza a partir de los puntos medios de cada clase de amplitud;
estos se unen por medio de una lnea recta, la cual se disea con base en los
datos del histograma.
ESTADISTICA BASICA
5.3
OJIVAS
5.4
BARRAS
Barras Verticales
ESTADISTICA BASICA
5.4.2
Ventas
6
9
15
30
50
80
110
150
130
100
Barras Horizontales
Nmero de profesionales
1100
800
500
700
ESTADISTICA BASICA
Segmentada
Ejemplo: presenta una comparacin de la magnitud relativa de ventas dentro de
cada departamento y de las ventas totales por departamentos. La siguiente
informacin corresponde a las ventas por departamentos al contado y a crdito en
un almacn, se presenta en miles de pesos.
Departamento
Hombres
Mujeres
Nios
Electrodomsticos
Contado
200
180
150
300
Crdito
120
110
90
210
Total
320
290
240
510
Agrupada
Muestra las ventas por departamento en una empresa al contado y a crdito y
permite hacer comparaciones entre departamentos y al interior de cada uno.
ESTADISTICA BASICA
Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en
las proporciones o porcentajes. Es efectiva para permitir las comparaciones
cuando los segmentos son relativamente grandes. El proceso para realizar el
diagrama consiste en una regla de tres para:
Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene
una circunferencia con el tamao de la muestra y con cada una de sus frecuencias
absolutas.
360 n
x
Fi
As por ejemplo:
360 60
x
2
360*2
x = = 12
60
360 60
x
5
5
360*3
x = = 18
60
ESTADISTICA BASICA
60
2
100*2
y= = 3.3 3%
60
Tallo y Hojas
Se puede tener un cuadro ms informativo que la tabla de recoleccin de datos si
se hace un listado diferente.
Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control
de contaminacin de Colombia en 2001:
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia
ESTADISTICA BASICA
17
17
03
02
04
02
07
04
04
04
14
10
08
03
01
Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:
El dgito de la extrema izquierda de cada valor es el punto de partida adecuado
para clasificar los datos en dos grupos. El O y 1 se usa para formar el tallo y se
escribe en columna vertical. A continuacin se escribe el segundo dgito como si
fuera una hoja en el rengln adecuado del tallo, a la derecha de la barra vertical.
O
1
3,2,4,2,7,4,4,4,8,3,1
7,7,4,0
Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se
puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos
dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el
inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin
se puede presentar la grfica ordenada de tallo y hojas.
O
O
1
1
1,2,2,3,3,4,4,4,4
7,8
0,4
7,7
Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las
15 observaciones son de 4 o menos.
Con el ejemplo que se ha venido trabajando; se puede elaborar este diagrama de
tallos y hojas. En los siguientes datos los resultados son obtenidos en miles de
pesos:
40
22
28
19
24
28
17
33
28
35
20
11
26
24
33
23
31
34
10
20
22
28
29
39
26
28
25
22
18
10
21
14
29
15
19
25
18
30
29
34
11
17
27
25
29
13
23
21
16
29
21
16
20
34
38
37
32
26
24
18
ESTADISTICA BASICA
2001
248
208
113
128
106
118
60
79
55
47
88
47
58
82
33
Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las
centenas y decenas formarn el tallo y las unidades sern las hojas.
03
04
05
06
07
08
09
10
3
7.7
5.8
0
9
28
6
11 3.8
12 8
13
14
15
16
17
18
19
20 8
21
22
23
24 8
ESTADISTICA BASICA
33,47,47
55,58,60,79,82,88
06,13,18,28
08,48
POBLACIN
(Millones)
31.4
39.8
50.2
62.9
76
92
105.7
122.8
131.7
151.1
179.3
203.3
226.5
NMERO DE SACOS DE
TRIGO
200
185
225
250
240
NMERO DE
SACOS DE MAIZ
75
90
100
85
80
ESTADISTICA BASICA
AO
1997
1998
1999
2000
2001
2002
NMERO DE SACOS DE
TRIGO
195
210
225
250
230
235
NMERO DE
SACOS DE MAIZ
110
110
105
95
110
100
ELEMENTAL
32.4
35.5
37.1
33.8
30.6
MEDIA
10.2
13
14.7
15.7
14.6
SUPERIOR
3.6
5.7
7.4
9.7
10.2
ESTADISTICA BASICA
HOMBRES
(% total)
MUJERES
(% total)
Soltero
Casado
Viudo
Divorciado
25.1
66.7
2.4
5.8
18.4
61.3
12.4
7.9
24
19
27
19
26
18
22
26
31
19
17
27
18
21
19
28
17
32
21
21
22
31
22
24
21
26
24
26
ESTADISTICA BASICA
ESTADISTICA BASICA
ESTADISTICA BASICA
ANEXO: Tablas
ESTADISTICA BASICA
ESTADISTICA BASICA
BIBLIOGRAFA GENERAL
BERNAL V. Miguel. Estadstica Descriptiva: J. Elaboracin y Presentacin de
Datos Universidad de Pamplona, 1987.
GALLARDO, Yolanda.
Pamplona. 1997.
Estadstica:
Recoleccin de la