Sunteți pe pagina 1din 84

ESTADISTICA I

_________________________________________________________________________

Programas de Estudio a Distancia

Estadstica I

www.unipamplona.edu.co
Esperanza Paredes Hernndez
Rectora
Mara Eugenia Velasco Espitia
Decana Facultad de Estudios a Distancia

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________

Tabla de Contenido
Presentacin
Introduccin
UNIDAD 1: Generalidades de la Estadstica
Ncleos Temticos y Problemticos
Proceso de Informacin
1.1. DEFINICIN
1.1.1 Importancia
1.1.2 Poblacin
1.1.3 Muestra
1.1.4 Mtodos de Seleccin de una Muestra al Azar
1.1.5 Unidad Estadstica
1.2 ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS
1.2.1 Recoleccin de Datos
1.2.2 Intervalos
1.2.3 Amplitud
1.2.4 Frecuencia de Clase o Frecuencia Absoluta
1.2.5 Marca de Clase (X)
1.2.6 Frecuencia Relativa (Fr)
1.2.7 Frecuencia Acumulada (Fa)
1.2.8 Frecuencia Relativa Acumulada (Fra)
Proceso de Comprensin y Anlisis
UNIDAD 2: Medidas de Tendencia Central
Ncleos Temticos y Problemticos
Proceso de Informacin
2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS
2.1.1 Media Aritmtica
2.1.2 Mediana
2.1.3 Moda
2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS
2.2.1 Media Aritmtica
2.2.2 Mediana
2.2.3 Moda
Proceso de Comprensin y Anlisis
UNIDAD 3: Medidas de Dispersin
Ncleos Temticos y Problemticos
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________
Proceso de Informacin
3.1 DESVIACIN ESTNDAR O TPICA
3.2 VARIANZA
3.3 COEFICIENTE DE VARIACIN
Proceso de Comprensin y Anlisis
UNIDAD 4: Medidas de Ubicacin
Ncleos Temticos y Problemticos
Proceso de Informacin
4.1 CUARTILES, PERCENTILES Y DECILES
4.2 DIAGRAMAS DE CAJA
Proceso de Comprensin y Anlisis
UNIDAD 5: Presentacin de la Informacin
Ncleos Temticos y Problemticos
Proceso de Informacin
5.1 HISTOGRAMA
5.2 POLGONOS DE FRECUENCIA
5.3 OJIVAS
5.4 BARRAS
5.4.1 Barras Verticales
5.4.2 Barras Horizontales
Proceso de Comprensin y Anlisis
ANEXO: Tablas
BIBLIOGRAFA GENERAL

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA BASICA

Presentacin
La educacin superior se ha convertido hoy da en prioridad para el
gobierno Nacional y para las universidades pblicas, brindando
oportunidades de superacin y desarrollo personal y social, sin que la
poblacin tenga que abandonar su regin para merecer de este servicio
educativo; prueba de ello es el espritu de las actuales polticas
educativas que se refleja en el proyecto de decreto Estndares de
Calidad en Programas Acadmicos de Educacin Superior a Distancia de
la Presidencia de la Repblica, el cual define:
Que la Educacin
Superior a Distancia es aquella que se caracteriza por disear ambientes
de aprendizaje en los cuales se hace uso de mediaciones pedaggicas
que permiten crear una ruptura espacio temporal en las relaciones
inmediatas entre la institucin de Educacin Superior y el estudiante, el
profesor y el estudiante, y los estudiantes entre s.
La Educacin Superior a Distancia ofrece esta cobertura y oportunidad
educativa ya que su modelo est pensado para satisfacer las
necesidades de toda nuestra poblacin, en especial de los sectores
menos favorecidos y para quienes las oportunidades se ven disminuidas
por su situacin econmica y social, con actividades flexibles acordes a
las posibilidades de los estudiantes.
La Universidad de Pamplona gestora de la educacin y promotora de
llevar servicios con calidad a las diferentes regiones, y el Centro de
Educacin Virtual y a Distancia de la Universidad de Pamplona,
presentan los siguientes materiales de apoyo con los contenidos
esperados para cada programa y les saluda como parte integral de
nuestra comunidad universitaria e invita a su participacin activa para
trabajar en equipo en pro del aseguramiento de la calidad de la
educacin superior y el fortalecimiento permanente de nuestra
Universidad, para contribuir colectivamente a la construccin del pas
que queremos; apuntando siempre hacia el cumplimiento de nuestra
visin y misin como reza en el nuevo Estatuto Orgnico:
Misin: Formar profesionales integrales que sean agentes generadores
de cambios, promotores de la paz, la dignidad humana y el desarrollo
nacional.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Visin: La Universidad de Pamplona al finalizar la primera dcada del


siglo XXI, deber ser el primer centro de Educacin Superior del Oriente
Colombiano.
Maria Eugenia Velasco Espitia Directora CEDUP

Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos
intelectuales del hombre es notoria a travs de su historia. Fue as como
en la antigedad el pensamiento matemtico contribuy a resolver
problemas en tareas econmicas y constructoras de diferentes pueblos,
dio la base para revelar tos misterios del mundo, es decir, dar
explicaciones razonables para alcanzar la verdad de los fenmenos que
lo suceden. Contrariamente a los griegos, los hombres de la edad media
utilizaron el contenido matemtico como una simple rutina para
disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la
matemtica en la edad moderna ayud a buscar explicaciones concretas
de problemas que se daban en ingeniera, construccin y otras
actividades prcticas del hombre.
Por tal motivo, gracias al medio, las personas estn rodeadas
constantemente por un conjunto de experiencias, que manejan y
manipulan de una manera sorprendente. Es decir, en cierta forma se
est efectuando una serie de operaciones: recoge, organiza, analiza e
interpreta esas informaciones mediante unas representaciones
significativas para l y as se obtiene una serie de conclusiones
razonables.
Esta informacin que de cierta manera se manipula, se debe
matematizar. Es decir, seguir un procedimiento para poder tabular la
informacin, presentarla y as hacer el anlisis respectivo para dar las
conclusiones pertinentes al estudio que se est realizando.
La Estadstica es utilizada en casi todas las ramas de la ciencia moderna,
as como en muchos otros campos de la actividad humana. Como dijo
Salomn Fabricant todo el mundo parece hoy coincidir en que la
Estadstica puede ser til para comprender, evaluar y controlar el
funcionamiento de la sociedad. En nuestra sociedad, el progreso puede
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

medirse mediante diversos ndices numricos, la estadstica se utiliza


para describir, manipular e interpretar estos nmeros.
An cuando los tipos de problemas a los cuales puede aplicarse la
Estadstica como herramienta fundamental para el anlisis e
interpretacin de resultados son bastante heterogneos, en muchos
casos los pasos de una investigacin estadstica son los siguientes:
Primera etapa: formulacin del problema. Para investigar con xito un
problema dado, primero se tienen que crear conceptos precisos,
formular preguntas claras e imponer limitaciones adecuadas al
problema, tomando en cuenta el tiempo, dinero disponible y la habilidad
de los investigadores.
Segunda etapa: diseo del experimento. Nuestro deseo es obtener un
mximo de informacin empleando un mnimo de costo y tiempo. Esto
implica, entre otras cosas, que se debe determinar el tamao de la
muestra o la cantidad y tipo de datos que resolvern ms
eficientemente el problema. A la vez este tamao ser afectado por el
mtodo empleado para la seleccin de la muestra representativa.
Con respecto a la representatividad de la muestra, se debe observar que
no es fcil obtener selecciones que sean completamente aleatorias.
Existe el peligro de que una seleccin pueda ser preferida en alguna
forma. Se han propuesto varios mtodos para vencer esta dificultad y
se han usado en la prctica. Se considera este punto dentro del
desarrollo del mdulo.
Tercera etapa: experimentacin o recoleccin de datos. En general,
sta es la parte que ms tiempo consume en toda investigacin que sea
realizada, sta debe sujetarse a reglas estrictas. De hecho, cuanto
menos opiniones impongamos, sern mejores los resultados.
Cuarta etapa: tabulacin y formulacin de la respuesta. Al aplicar el
mtodo estadstico antes mencionado, se obtienen conclusiones a partir
de la muestra, acerca de la poblacin correspondiente. Es decir, se va a
inferir sobre la muestra y se trata de sacar conclusiones para la
poblacin. Es esta etapa la que le da el objetivo final a la estadstica,
puesto que se van a tomar decisiones con base en los resultados
obtenidos en el estudio descriptivo de la muestra.
No existe una frmula mgica ni nica en estadstica que tome en
cuenta todas las situaciones prcticas concebibles. Por lo cual es
necesario adquirir conocimientos generales de los mtodos ms
importantes para hacer inferencias. En cada caso prctico debe situarse

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

con cuidado la naturaleza del problema especfico, para estar seguros de


que ser escogido el mtodo ms apropiado.
Con el apoyo del computador los clculos matemticos se hacen ms
fciles, por lo tanto se recomienda utilizar e integrar un software
apropiado para tal fin.
En la actualidad existen varios paquetes
estadsticos sencillos de manejar, tales como el Statgraphics, Sas,
Minitab, Spss.
De comn acuerdo con su Tutor se pueden desarrollar los ejercicios
propuestos al final de cada tema, se puede utilizar calculadora y
computador para facilidad de los clculos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 1: Generalidades de la
Estadstica
Ncleos Temticos y Problemticos

Definicin
Estadstica Descriptiva Distribucin de Frecuencias

Proceso de Informacin
1.1

DEFINICIN

Al evolucionar las ciencias, pierden sus rasgos primitivos, se


transforman, dividen y an cambian de nombre. Como ciencia que es, la
estadstica ha sufrido igual proceso y para comprender su estado actual
y su campo de actividades se necesita conocer algo de su historia. Se
considera fundador de la estadstica a Godofredo AchenwalL profesor y
economista alemn
(1719 - 1772)
quien, siendo profesor de la
universidad de Leipzig, escribi sobre el descubrimiento de una nueva
ciencia que lamo estadstica (palabra derivada de Staat que significa
gobierno) y que defini como
el conocimiento profundo de la
situacin respectiva y comparativa de cada estado Achenwa y sus
seguidores estructuraron los mtodos estadsticos que se orientaron a
investigar, medir y comparar las riquezas de las naciones Lo anterior no
significa que antes de los estudios de Godofredo Achenwa, los estados
no hubiesen efectuado inventarios de sus riquezas; estos invntanos o
censos se efectuaron desde la antigedad. Se sabe que 2000 a 2500
aos antes de Cristo, los chinos y los egipcios efectuaron censos que
eran simples inventarios elementales Desde su creacin la estadstica se
ha enriquecido continuamente con los aportes de matemticos, filsofos
y cientficos.
Adems, en un principio se consideraba que la funcin de a estadstica
era la descripcin de las caractersticas de un grupo, de observar y
describir el hecho En su origen la estadstica era histrica: hoy en da, la
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

estadstica, adems de ser descriptiva, es analtica, considerndose esta


ltima como la funcin ms importante que realiza, ya que permite
obtener conclusiones para un grupo mayor, denominado poblacin,
partiendo de una investigacin realizada en un grupo menor,
denominado muestra.
Las siguientes son unas definiciones que ayudan a determinar el sentido
de la estadstica:
Dicaonano de Webster una rama de las matemticas que trata de la
recopilacin, el anlisis, la interpretacin y la presentacin de una gran
cantidad de datos numricos.'
Kendall y Stuart la estadstica es la rama del mtodo cientfico que
traa de los datos reunidos al contar o medir las propiedades de alguna
poblacin.
Fraser la estadstica trata con mtodos para obtener conclusiones a
partir de los resultados de los experimentos o procesos."
Al unir estas definiciones, se puede notar que a partir de la recopilacin
de datos se pueden hacer inferencias con respecto a resultados de
experimentos. Es decir a partir de un conjunto de mtodos, normas,
reglas y de principios para observar, agrupar, describir, cuantificar y
analizar el comportamiento de un grupo.
Es entonces, un campo parcial de la Matemtica aplicada a un conjunto
de objetos que se asignan valores numricos y luego estos se siguen
elaborando matemticamente.
Matemticamente
los
procedimientos
estadsticos
estn
muy
desarrollados y asegurados en el plano de la teora, por ejemplo,
mediante la indicacin de mbitos dentro de los cuales puede suponerse
o rechazarse una hiptesis. Se acostumbran a distinguir dos clases de
Estadstica, la descriptiva y la de inferencia.
1.1.1

Importancia

La teora general de la estadstica es aplicable a cualquier campo


cientfico en el cual se hacen observaciones el estudio y aplicacin de
los mtodos estadsticos son necesarios en todos (los campos del saber,
sean estos de nivel tcnico o cientfico). Es obvio que en cada campo se
aplican o desarrollan procedimientos especficos, como aplicaciones
particulares a variantes de la teora general. Las primeras aplicaciones
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

de la estadstica fueron los asuntos de gobierno, luego las utilizaron las


compaas de seguros y los empresarios de juegos de azar, despus
siguieron los comerciantes, los industriales, los educadores, etc.
Es por tanto que las tcnicas estadsticas se utilizan en casi todos los
aspectos de la vida:

Se disean encuestas para recoger informacin y as poder predecir


algn suceso.

Los experimentos que se hacen para determinar el mtodo apropiado


para
curar cierta enfermedad.

La duracin, intensidad, extensin de las lluvias, tormentas o


granizos, las Temperaturas, la intensidad y direccin del viento son
variables aleatorias.

1.1.2 Poblacin
Es el conjunto de elementos que se toma de referencia para el estudio
que se desea investigar la ocurrencia de una caracterstica o propiedad.
Los elementos que integran la poblacin pueden pertenecer a personas,
objetos o cosas. Segn sea el tamao, la poblacin puede considerarse
como finita o infinita.
Es poblacin finita cuando el nmero de elementos que la componen es
limitado; infinita cuando consta de infinitos elementos.
Ejemplo
La poblacin consistente en todas las tuercas producidas por una fbrica
en un da especfico, los estudiantes matriculados en un colegio, son
poblaciones finitas; mientras que la determinada por todos los posibles
resultados (caras, cruces) de sucesivas tiradas de una moneda, las
personas que hoy y en el futuro subscriban un seguro de vida, las piezas
fabricadas por una mquina, son poblaciones infinitas, cantidad de
carros que transitan por un peaje en un tiempo determinado es finita
pero si no se especifica este tiempo es entonces infinita.
1.1.3 Muestra
Se considera como muestra el subconjunto de elementos que
pertenecen a la poblacin objetivo sobre los cuales se recoger la
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

informacin necesaria, para tomar una decisin vlida relativa a la


poblacin de estudio.
Si una muestra es representativa de una
poblacin es posible inferir importantes conclusiones sobre la poblacin
a partir del anlisis de la muestra.
Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando
cada uno de los elementos tiene la misma probabilidad de ser escogido
y no probalstica cuando se seleccionan los datos con determinado
criterio o conveniencia del investigador; en estos casos, algunas
unidades tienen mayor posibilidad que otras de ser seleccionadas, por
tal razn no se puede determina la validez, ni la confianza que merecen
dichos resultados.
1.1.4

Mtodos de Seleccin de una Muestra al Azar

La clave de un procedimiento de muestreo es garantizar que la muestra


sea representativa de la poblacin, este muestreo puede ser
probabilstica o intencional Es probabilstica cuando todos los elementos
de la poblacin tienen la misma posibilidad de ser elegidos. En cambio,
intencional, es cuando el investigador selecciona bajo un criterio la
muestra.
La seleccin de esta muestra probabilstica se puede realizar por medio
de los siguientes mtodos:
Azar Simple
Este mtodo de seleccin permite que todos los elementos que
constituyen la poblacin tengan la misma posibilidad de ser incluidos en
la muestra. Este mtodo es de gran importancia cuando la poblacin no
es grande o siendo grande, este se concentra en un rea pequea.
Tambin cuando las caractersticas que se investiga presentan poca
variabilidad o cuando la poblacin facilita su enumeracin para su
seleccin.
Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las
cuales son obreros, 250 son tcnicos y 150 son profesionales Si se
quiere seleccionar una muestra aleatoria simple de 200 personas, en
este caso, la probabilidad de seleccin
es:
n de cada persona
200
P=
=
= 0.2
1000
N
Lo cual indica que el 20% de los obreros corresponden a 120 de los
tcnicos 50 y 30 profesionales.
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Por Estratos
Para el muestreo estratificado se divide la poblacin en vanos grupos o
estratos con el fin de dar representatividad a los distintos factores que
integran la poblacin del estudio, la condicin de la estratificacin es la
presencia en cada estrato de las caractersticas que conforman la
poblacin.
Este proces de estratificacin requiere que la poblacin sea dividida en
grupos homogneos donde cada elemento tiene una caracterstica tal
que no le permite pertenecer a otro estrato.
Para la seleccin de los elementos o unidades representantes de cada
estrato se utiliza el mtodo del muestreo aleatorio o al azar. Dentro de
este muestreo encontramos casos tres especiales:

Muestras de igual tamao.


En este tipo de muestreo debe
seleccionarse un nmero igual de elementos en cada grupo mediante
procedimiento al azar.

Muestreo proporcional. En este tipo el tamao de muestra por


estrato se escoge de tal forma que sea proporcional al tamao
poblacional del mismo.

Afinacin ptima. Este mtodo utiliza la mejor subdivisin posible de


una muestra total, reparticin en todos los estratos, considerando
tanto la variacin como el tamao de cada estrato adems se tiene
en cuota el costo de la investigacin.

Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros,


tcnicos y profesionales son importantes para establecer comparaciones
y se decide escoger 80 de cada estrato. En este caso las probabilidades
de seleccin seran, por estrato, las siguientes:
Obreros
Tcnicos
Profesionales

80/600= 0,133
80/250= 0,32
80/150= 0,53

Donde se puede apreciar que la probabilidad de seleccin no es igual


para todas las personas, sino que depende del estrato en que stas se
encuentran y as un obrero tiene menor posibilidad de ser seleccionado
que un profesional, simplemente porque estos ltimos son menores.
Por Conglomerado
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Existen situaciones donde ni el muestreo aleatorio simple ni el


estratificado son aplicables, ya que no se dispone de una lista con el
numero de elementos de la poblacin ni en los posibles estratos. En
estos casos tpicamente los elementos de la poblacin se encuentran de
manera natural agrupados en conglomerados, cuyo nmero si se
conoce.
Por ejemplo la poblacin se distribuye en provincias, los habitantes de
una ciudad en barrios, etc. Si se supone que cada uno de estos
conglomerados es una muestra representativa de la poblacin total
respecto a la variable que se estudia, se puede seleccionar algunos de
estos conglomerados al azar y dentro de ellos, analizar todos sus
elementos o una muestra aleatoria simple.
Ejemplo: se desea tomar una muestra de la poblacin colombiana para
estudiar la proporcin de personas que estn de acuerdo con la
relaciones prematrimoniales; si se supone que la edad y el sexo pueden
influir en la opinin, se debera tomar una muestra donde estas
caractersticas sean las mismas que en la poblacin base, lo que implica
una muestra estratificada.
Sistematizada
Una forma prctica para seleccionar la muestra es hacerla en forma
sistemtica, escogiendo una muestra de cada intervalo, donde el
intervalo se calcula as: K= N/n; donde N es el tamao de la poblacin y
n el de la muestra.
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio
que tiene 2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500
= 4.
Para iniciar el proceso de seleccin sistemtica se escoge al azar un
nmero entre 1 y 4, a partir del nmero seleccionado y cada 4 viviendas
se hace una escogencia, hasta completar la muestra.
1.1.5

Unidad Estadstica

Una vez identificada la poblacin y la muestra, se ubica la unidad


estadstica, o sea el objeto de la medicin. La unidad estadstica es el
elemento del universo que reporta la informacin (observacin) y sobre
el cual se realiza un determinado estudio (anlisis).

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Dato
Hace referencia a la observacin particular, es decir, la informacin
relacionada con las caractersticas de cosas existentes que pueden ser
recogidos, anotados u observados
Variables
Es una dimensin o una caracterstica de una unidad de anlisis,
dimensin que adopta la forma de una clasificacin. Una variable se
puede representar por un smbolo X, Y, Z, V, x, h etc. que puede tomar
un conjunto prefijado de valores; dichas variables pueden ser:
Nominal:
a veces conviene extender la nocin de variable a
entidades no numricas: es decir que relacionan un carcter, un
nombre, una cualidad. Por ejemplo, el color C de un arco iris es una
variable que puede tomar los valores rojo, anaranjado, amarillo,
verde, azul, violeta y rosado. Puede ser posible sustituir tales
variables por entidades numricas de la siguiente manera:
denotando el rojo como 1, el anaranjado como 2 etc.

Ordinal: le asigna valores numricos a los sujetos, de tal forma que


los valores ms altos se le asignan a los individuos que tienen ms de
la caracterstica que se mide.
Esto hace que necesariamente
satisfaga la caracterstica de diferenciacin pero en adicin introduce
la posibilidad de ordenamiento.
Por ejemplo, en una competencia ciclstica se tiene en cuenta los
cinco primeros puestos para la premiacin.

Intervalo: en adicin a la clasificacin y ordenamiento se introduce la


posibilidad de establecer el ordenamiento con intervalos iguales.
Por ejemplo, la medicin de la temperatura la cual se puede hacer
por medio de un termmetro en grados Fahrenheit.

Variable Continua: es la variable que puede tomar cualquier valor


entre dos valores dados. La estatura H de una persona que puede
ser 1.62 cm, 1.65 cm, 1.80.

Variable Discreta:
es la variable que solo puede tomar un
determinado nmero de valores enteros. El nmero N de hijos en
una familia puede ser O, 1, 2, 3.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

1.2 ESTADSTICA
FRECUENCIAS

DESCRIPTIVA

DISTRIBUCIN

DE

La distribucin de frecuencias o tabla de frecuencia, es la disposicin


tabular de los datos por clases junto con las correspondientes
frecuencias de clase. Para la elaboracin de esta distribucin si los
datos son cuantitativos, hay que tener en cuenta los siguientes pasos:
1.2.1

Recoleccin de Datos

Es la base para cualquier estudio estadstico, es la toma de datos u


observaciones; estos se llevan a cabo mediante la recopilacin de los
mismos sin ninguna ordenacin de acuerdo a lo que se est
investigando.
Por ejemplo la empresa
Cuero Lindo
recopil la informacin
resultante de encuestar 60 establecimientos pequeos, para estudiar
sus ventas semanales en miles de pesos, los resultados son:
40
22
28
19
24
28

17
33
28
35
20
11

26
24
33
23
31
34

10
20
22
28
29
39

26
28
25
22
18
10

21
14
29
15
19
25

18
30
29
34
11
17

27
25
29
13
23
21

16
29
21
16
20
34

38
37
32
26
24
18

Despus de tener dicha informacin, se procede a ordenarla; es decir,


colocar los datos numricos en orden creciente o decreciente. Existe un
tipo de ordenacin y se hacen generalmente en una tabla de distribucin
de frecuencias. Para ello se debe encontrar inicialmente el rango de la
distribucin; que es la diferencia entre el mayor y el menor dato
obtenido. As:
R = Dm - dm, donde

R = rango
Dm = dato mayor
dm = dato menor

R= 40 - 10 = 30
1.2.2

Intervalos

Al resumir grandes colecciones de datos es til distribuidos en clases o


categoras; en cuanto al nmero de clases el investigador es autnomo
para escoger el nmero de intervalos para trabajar, sin embargo existe
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

una frmula que se utiliza como base o gua para indicar la cantidad de
intervalos que se van a crear en la tabla de frecuencias. Esta frmula
esta determinada por:
m = 1 + 3.33 log n;
donde
m = 1 + 3.33 log 60 = 6.92

m = nmero de intervalos
n = tamao de la muestra

Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso


se toman 6 intervalos, pero se agregan dos ms que son: el intervalo
menor que el dato menor y el intervalo mayor que el dato mayor; esto
cuando se utiliza un programa de computador.

1.2.3

Amplitud

El rango nos ayuda a determinar la amplitud o el tamao de cada clase,


siendo esta una constante para cada intervalo. La amplitud indica la
distancia que debe tener cada clase.
La amplitud se puede determinar como el cociente entre el rango y el
nmero de intervalos.
A = R / m; donde A = amplitud
A = 30 / 6 = 5 miles de pesos
Para formar los intervalos de clase, si es utilizando un programa
estadstico, se parte del dato menor 10 y se le suma la amplitud, as, 10
+ 5=15. Entonces el primer grupo esta comprendido entre 10 y 15
miles de pesos.
El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15
y 20 miles de pesos. En forma similar se crean los dems intervalos,
incluyendo los intervalos menores a 10 miles de pesos y mayores a 40
miles de pesos.
NMERO DE
CLASES
1
2
3

INTERVALOS
- 10
10 - 15
15 - 20
20 - 25

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

4
5
6

25 - 30
30 - 35
35 - 40
40 -

Otra manera de formar los intervalos de clase es tomar un dato como


medida de referencia, por ejemplo 5 (que indica $5000) o el dato menor
y sumarle el valor de la amplitud:
NMERO DE
INTERVALOS
INTERVALOS
1
5 - 10
2
10 - 15
3
15 - 20
4
20 - 25
5
25 - 30
6
30 - 35
7
35 - 40
1.2.4
Frecuencia de Clase o Frecuencia Absoluta
Se determina el nmero de individuos que pertenecen a cada clase.
Como cada clase est formada por un intervalo, entonces se debe tomar
como un intervalo abierto a izquierda y cerrado a derecha. Esto quiere
decir, por ejemplo: que para hacer el conteo para determinar las
frecuencias correspondientes al intervalo 20 - 25, van a estar los valores
21, 22, 23, 24 y 25. De igual manera los valores que van a estar entre
25 - 30 son 26, 27, 28, 29 y 30.
Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para
realizar el conteo:
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

Nmero de
Establecimientos
/
/////
////////////
/////////////
//////////////
////////
////
TOTAL

F
2
5
12
14
15
8
4
60

Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen


ventas semanales entre $15000 y $20000; las mayores ventas estn
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

entre $25000 y $30000, las menores ventas presentadas son de


$10000, etc.
1.2.5

Marca de Clase (X)

Es el punto medio del intervalo de clase y se obtiene promediando el


limite inferior y superior de cada clase.
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

X=

5+10
2

X
7,5
12,5
17,5
22,5
27,5
32,5
37,5

= 7,5

Miles de pesos; esto quiere decir que el promedio del primer intervalo es
de $7500.
Otra manera de hallar la amplitud de un intervalo es encontrar la
diferencia comn entre marcas de clase sucesivas. Por ejemplo: 32,5 27,5 = 5 miles de pesos.
1.2.6

Frecuencia Relativa (Fr)

Es su frecuencia dividida por la frecuencia total de todas las clases y se


expresa generalmente como un porcentaje.
F
Fr =
n
La frecuencia relativa del primer intervalo es 0.0333. Este valor se
obtuvo de la relacin entre 2/60 = 0.0333; significa que el 3.33% de los
establecimientos tienen ventas menores de $10000. Este porcentaje se
obtiene al multiplicar por 100 el resultado obtenido.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

De igual manera, la frecuencia relativa del segundo intervalo es de


0.0833, que significa que el 8.33% de los establecimientos tienen ventas
entre $10000 a $15000.
1.2.7

Frecuencia Acumulada (Fa)

Es la acumulacin ascendente o descendente (de la primera a la ltima


clase o viceversa) de frecuencias absolutas. La frecuencia acumulada
descendente se obtiene de la siguiente manera:

La primera frecuencia acumulada corresponde a la primera frecuencia


absoluta.
La segunda acumulada se obtiene sumando las dos primeras
absolutas, es decir, 2+5 = 7.
La tercera acumulada se obtiene de sumar 7 + 12 = 19 y as
sucesivamente.

La frecuencia acumulada ascendente se obtiene as: se inicia por la


frecuencia absoluta del ltimo intervalo; en este caso 4. La siguiente es
sumar esta frecuencia acumulada con la anterior: 4+8 = 12. La que
sigue sera 4 + 8 = 12 y as sucesivamente.
Intervalo
s
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

Fa

F
2
5
12
14
15
8
4

2
7
19
33
48
56
60

60
58
53
41
27
12
4

El significado de este cuadro es el siguiente: si tomamos el tercer grupo


descendente,
su
frecuencia
acumulada,
significa
que
19
establecimientos tienen ventas semanales entre $10000 y $20000 o
inferiores a $20000. Y si tomamos el segundo grupo ascendente, quiere
decir que 12 establecimientos tienen ventas semanales entre $30000 y
$40000 o mayores a $30000.
1.2.8

Frecuencia Relativa Acumulada (Fra)

Es la acumulacin sucesiva en forma ascendente o descendente de


frecuencias relativas.
La primera frecuencia relativa acumulada
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

corresponde a la primera frecuencia relativa. La segunda, se obtiene


sumando las dos primeras frecuencias relativas, es decir, 0,0333 +
0,0833 = 0,1167 y as sucesivamente. La frecuencia relativa acumulada
ascendente se obtiene as: se inicia por la frecuencia relativa del ltimo
intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia
acumulada con la anterior 0,0667 + 0,1333 = 0,2 y as sucesivamente.
Intervalo

Fr

5 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

0.0333
0.0833
0.2
0.2333
0.25
0.1333
0.0667

Fra
0.0333
0.1167
0.3167
0.55
0.8
0.9333
1

1
0.9666
0.8833
0.6833
0.45
0.2
0.0667

Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo


significado es que el 80% de los establecimientos tienen ventas
semanales menores a $30000; si tomamos el grupo 4 ascendente su
acumulado ser del 0,6833, esto significa que el 68.33% de los
establecimientos tienen ventas mayores a $20000 mil pesos.
Interval
o
5 - 10

Fa

Fra

Fr

0,0333

60

10 - 15

0,0833

58

15 - 20

12

0,2

19

53

20 - 25
25 - 30
30 - 35

14
15
8

0,2333
0,25
0,1333

33
48
56

41
27
12

35 - 40
Total

4
60

0,0667
1,00

60

0,033
3
0,116
7
0,316
7
0,55
0,8
0,933
3
1

1
0,9666
0,8833
0,6833
0,45
0,2
0,0667

La tabla presenta el resumen de la clasificacin de los 60


establecimientos analizados por los investigadores de la empresa Cuero
Lindo, esto significa que se ha organizado la informacin.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Proceso de Comprensin y Anlisis

Decir de las siguientes variables cules son continuas y cules son


discretas

La altura de las personas


La medida de la cantidad de lluvia cada en una localidad en un mes
La edad de las personas, en aos cumplidos
El nmero de alumnos de cada curso de un colegio

Por qu es til la estadstica en el campo para el cual se est


preparando.

La Estadstica estudia el comportamiento de fenmenos colectivos y


nunca de una observacin individual comentar este principio.

Clasificar a que tipo de estadstica pertenecen los siguientes tems:

Realizar un inventario
Determinar la demanda de un producto
La posibilidad que llueva en una ciudad determinada
El porcentaje de desempleo en una ciudad especfica
El promedio de las acciones vendidas en la bolsa de valores en una
empresa en un mes determinado
El aumento del ndice de precios al consumidor en un mes especfico
El aumento del costo de vida en un mes especfico
El nmero de accidentes ocurridos en una ciudad determinada
Las ventas de un almacn en un mes determinado
El aumento de costos de produccin con respecto al mismo mes del
ao anterior.

Dar un ejemplo donde se aplique la estadstica en los siguientes


campos:

Agricultura
Biologa
Negocios
Qumica
Comunicaciones
Finanzas

Economa
Educacin
Electrnica
Educacin
Electrnica
Medicina

Fsica
Mercadeo
Ciencias polticas
Psicologa
Medicina
Fsica

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Mercadeo
Ciencias polticas
Psicologa

Ingeniera
Administracin
Produccin

Sociologa

Responder a los siguientes enunciados:


Qu significan las variaciones en los precios de los artculos al
consumidor?
Cree que cualquier investigacin requiere informacin estadstica?
Cules son las funciones del Departamento Administrativo Nacional
de Estadstica (DANE)?
Las calificaciones finales de 80 estudiantes son:

68
84
75
82
68
90
62
88

93
60
73
88
79
73
93
76

71
59
85
75
61
65
75
87

78
66
72
63
78
95
62
74

82
75
94
77
69
74
68
60

79
60
95
75
61
89
78
96

83
71
79
62
67
97
78
85

57
73
80
65
75
71
65
76

88
78
62
76
53
74
86
67

77
85
75
76
63
72
81
73

Hallar:
La calificacin ms alta
La calificacin ms baja
El rango
Las cinco notas ms altas
Las cinco notas ms bajas
La dcima nota de mayor a menor
La tabla de frecuencias utilizando 7 intervalos
Comprobar que la amplitud de los intervalos es de 6.29
El nmero de estudiantes de 79 o ms
El nmero de estudiantes con calificaciones por debajo de 71
El porcentaje de estudiantes con calificaciones mayores de 65 pero
no superiores a 85.
Cul es el significado del 91.25%?
Cul es el significado del 33.75%?

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

En una empresa se investig una muestra de 56 empleados para


determinar su salario mensual en miles de pesos. Los resultados
fueron los siguientes:

987
1173
1330
1331
1240
984
1055

1176
1233
1024
1000
932
1234
1104

1233
985
1079
1032
1358
1324
1343

1248
1093
1690
1229
614
918
1202

944
1310
1262
1385
1022
1067
759

1105
824
956
1252
1404
1203
1024

1243
1185
816
972
1415
827
905

Crear la tabla de frecuencias con siete intervalos y


amplitud es de 153.71 e interpretar cada uno
valores en la clasificacin:
X4
Fr6

F5
Fra 4

Fa 3
Fra 5

1109
1157
1220
1381
1303
1209
1490

comprobar que su
de los siguientes

Fa2

Fr 2

Responder:

Cuntos empleados tienen un salario inferior a $1'382.000?


Qu porcentaje de empleados tienen un salario superior a
$1'228.000?
Cuntos empleados tienen un salario entre $921.000 y $1'075.000?
Qu porcentaje de empleados tienen un salario entre $1'228.000 y
$1'382.000?

En la tabla que sigue se recogen los pesos de 40 estudiantes varones


de una universidad con precisin de 1 Kilo, construir una distribucin
de frecuencias con 5 intervalos y establecer las conclusiones ms
importantes.

6972
62
74
78
73
79
70
73
68
8284
63
69
88
81
99
77
82
74
7573
86
71
73
67
76
70
67
76
6680
72
67
71
75
78
72
64
72
La siguiente tabla muestra una distribucin de frecuencia de los
salarios semanales de 65 empleados de la empresa P & R.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

SALARIOS

$250.000 - $260.000
$260.000 - $270.000
$270.00 - $280.000
$280.000 - $290.000
$290.000 - $300.000
$300.000 - $310.000
$310.000 - $320.000
Total

NMERO DE
EMPLEADOS
8
10
16
14
10
5
2
65

Determinar de la tabla de frecuencias:


El lmite inferior de la sexta clase.
El lmite superior de la cuarta clase.
La marca de clase o punto medio de la tercera clase.
La anchura del quinto intervalo de clase.
La frecuencia de la tercera clase.
El intervalo de clase con mxima frecuencia.
El porcentaje de empleados que cobran menos o igual de $280.000 a
la semana.
El porcentaje de empleados que cobran igual o menos de $300.000
pero al menos $260.000 por semana.
Si las marcas de clase en una distribucin de frecuencias de pesos de
estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras. Hallar:
La anchura del intervalo de clase.
Los lmites de clase, suponiendo que los pesos se midieron con 1 libra
de precisin.

La menor de 150 medidas es 5,18 m y la mayor 7.44 m.

Determinar un conjunto apropiado de intervalos de clase.


Marcas de clase que puedan usarse para formar la distribucin de
frecuencia de esas medidas.

La siguiente tabla muestra una distribucin de frecuencias de las


vidas medias de 400 vlvulas de radio probadas en la empresa L & M.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

VIDA MEDIA
(Horas)
300 - 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
Total

NMERO DE
TUBOS
14
46
58
76
68
62
48
22
6
400

Determinar de la tabla de frecuencias:


El lmite superior de la quinta clase.
El lmite inferior de la octava clase.
La marca de clase de la sptima clase.
La anchura de intervalos de clase.
La frecuencia de la cuarta clase.
La frecuencia relativa de la sexta clase.
Porcentaje de tubos cuya vida media no pasa de 600 horas.
Porcentaje de tubos cuya vida media es mayor de 900 horas.
Porcentaje de tubos cuya vida media es de al menos 501 horas, pero
menor o igual que 1000 horas.
Los dimetros internos de los tubos fabricados por una empresa se
miden con precisin de milsima de pulgada. Si las marcas de clase
de una distribucin de frecuencias de esos dimetros vienen dadas
por 0.321, 0.324, 0.327, 0.33, 0.333 y 0.336. Hallar la anchura del
intervalo de clase y los lmites de clase.
La tabla adjunta muestra los dimetros en centmetros de una
muestra de 60 bolas de cojinete manufacturadas por una fbrica.
Construir una distribucin de frecuencias con intervalos de clase
apropiados y establecer las conclusiones respectivas.

1.738

1.735

1.736

1.72
9
1.73
1
1.73

1.74
3
1.72
6
1.72

1.74
0
1.73
7
1.73

1.736

1.741

1.728

1.737

1.742

1.736

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

1.739

1.728

1.733

1.738

1.735

1.736

1.735

5
1.73
5
1.73
8
1.73
0
1.72
9
1.72
7
1.74
4
1.73
5

4
1.74
5
1.72
5
1.73
2
1.72
7
1.73
4
1.73
2
1.72
9

3
1.73
6
1.73
3
1.73
0
1.73
5
1.73
2
1.73
7
1.73
4

1.742

1.740

1.734

1.732

1.739

1.734

1.735

1.732

1.736

1.741

1.731

1.746

1.730

1.740

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

UNIDAD 2: Medidas de Tendencia


Central

Ncleos Temticos y Problemticos

Primer Caso: Cuando los Datos no Estn Agrupados


Segundo Caso: Cuando los Datos Estn Agrupados

Proceso de Informacin

Las medidas de centralizacin son valores que tienden a situarse en


el centro del conjunto de datos ordenados segn su magnitud. Las
medidas de centralizacin ms usadas son:
Media aritmtica,
mediana y moda.
La media aritmtica es la medida de tendencia central ms conocida,
es fcil de calcular, de gran estabilidad en el muestreo; se puede
aplicar a variables de intervalos ya sean discretos o continuos. Esta
medida se define como la suma de todos los valores observados
dividido por el nmero de observaciones, es decir encontrar el
promedio de los datos en estudio.
La mediana se define como la medida de tendencia central que
divide a cualquier distribucin en dos partes iguales. Esta medida se
puede aplicar a variables de intervalos (discretas y continuas) y
variables ordinales.
La moda de una distribucin se define como el valor que presenta la
mayor frecuencia, se usa con variables de intervalos nominales y
ordinales.
Es comnmente utilizada como una medida de
popularidad que refleja la tendencia de una opinin.

2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS

2.1.1 Media Aritmtica

La media aritmtica de un conjunto de n nmeros x 1, x2, X3..., Xn, se


representa por x y se define como:

n
xi
X1 + X2 + X3 + Xn
i=1
X=
=
n
n

Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f 1, f2,
f3,....fn, la media aritmtica se puede calcular del modo siguiente:

fixi
f1X1 +f2X2 + f3X3 + ....+fnXn
i=1
X=

=
n

f1+f2+f3++fn
fi
i=1

En ocasiones, a cada uno de los nmeros x 1, x2, x3,....xn, se les asigna


un peso determinado w1, w2, w3,....wn. En estos casos, se acostumbra
a calcular la media aritmtica ponderada del modo siguiente:

wixi
w1x1 +w2x2 + w3x3 + ....+wnnn
i=1

X=
n
w1+w2+w3+..+wn

wi

i=1

Ejemplo

Hallar la media aritmtica del puntaje obtenido por 5 estudiantes en


una prueba: 6, 4, 3, 7, 8.

x=

6+4+3+7+8

El promedio de edad de los 10 nios es de 4 aos, 7meses de


5aos.
Un estudiante ha obtenido las calificaciones siguientes:

X=

X=

Nota

Peso

8
7
3
6

1
3
3
3

5
6

3
2

5
7
4

2
2
1

1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4

Asignat
ura
Historia
Qumica
Fsica
Matem
tica
Biologa
Geolog
a
Dibujo
Idioma
filosofa

Calculando su nota media ponderada:

Este es el puntaje promedio de


=5,6los 5 estudiantes

Hallar la media aritmtica de los siguientes datos que representan las


edades de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

3*6+4*4+2*3+1*7 47
x=
=
4,7

3+4+2+1
10

28

111

20

1+3+3+3+3+2+2+2+1

= 5,55

Por lo tanto el promedio de las notas del estudiante es de 5,55

2.1.2 Mediana

La mediana es una serie de datos ordenados en orden de magnitud,


es el valor medio si el nmero de datos es impar o bien la media
aritmtica de los valores medios si el nmero de datos es par.

Ejemplo

Hallar la mediana de los siguientes datos que corresponden a la


venta de leche en un expendio durante los ltimos 7 das:

27800
54300
60800
73200

43850
60500
54350

27800
43850
54300
54350
60500
60800
73200

Md = 54350. El precio de la venta de leche que se encuentra en la


mitad de los precios es de $54350.

Hallar el valor de la mediana para los siguientes puntajes de las


pruebas ICFES: 304, 283,332, 344;295, 339.

283
295 304 332 339 344

304+332

Md =
=
318

2
El puntaje de las pruebas que se encuentra en la mitad es de 318.

2.1.3 Moda

La moda no puede ser nica e incluso puede no existir.

Ejemplo

En una encuesta realizada sobre los deportes que se practican en un


grado determinado de un Colegio de Varones, se presentan los
siguientes resultados:

Deporte
Basket
Ftbol
Voleibol
Otros

N de
Alumnos
10
18
5
4

La moda en este caso es el Ftbol, puesto que la mayora de los


alumnos lo prefieren.
Se le ha preguntado a un grupo de personas acerca del color
preferido por ellas y se obtuvo lo siguiente:

Color
Blanco
Gris
Azul
Negro
Rojo
Morado
Caf
Vinotinto

Numero de Personas
4
8
9
4
3
2
8
8

Lo cual indica que los colores que pueden estar de moda son el gris,
caf y vinotinto.
Hallar la moda de los nmeros 2, 3, 4, 5, 6, 7, 8; como ningn
nmero se repite ms que los otros, por consiguiente no hay moda.

2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS

2.2.1 Media Aritmtica

xi fi
X=

i=1

Ejemplo
Hallar la media
establecimientos:

aritmtica

de

las

ventas

de

los

sesenta

Interv
alos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
40 Total

2
5
12
14
15
8
4
0
60

7.5
12.5
17.5
22.5
27.5
32.5
37.5

X*F

15
62.5
210
315
412.5
260
150
0
1425

1425

= 23,7 = 24
X=
60

Las ventas promedio de los sesenta establecimientos son de $24000.

Hallar el valor promedio para la distribucin correspondiente a las


notas obtenidas por 40 estudiantes en una prueba estadstica:

Interva F X
X*F
los
10 10 1
148
19.6
4.
8

19.6 29.2

29.2 38.8
38.8 48.4

48.4 58

58 67.6

Total

40

2
4.
4
3
4
4
3.
6
5
3.
2
6
2.
8

73.2

238

305.2

266

502.4

1532.8

1532.8
=
= 38.3 = 38
X
40

El puntaje promedio de los 40 alumnos es de 38.

2.2.2 Mediana

Para hallarla cuando los datos estn agrupados se siguen los


siguientes pasos:

Ubicar el intervalo donde quede la frecuencia correspondiente a la


mitad del tamao de la muestra.
Encontrar el valor del lmite real inferior del intervalo dnde est.
Aplicar la siguiente frmula:

li :es el lmite real inferior donde est la F n/2


n _ Fa
Fa es la sumatoria de frecuencias anteriores a n/2
2
Md = li +
A;
donde:
F n/2 es la frecuencia donde est n/2
F n/2
A es la amplitud del intervalo

E
jemplo

Encontrar la mediana de las ventas de los sesenta establecimientos:

Interva
los
5 - 10
10 15
15 20
20 - 25
25 - 30
30 - 35
35 - 40
TOTAL

12

14

15

60

$24.000 corresponde a la venta que est en la mitad.

Encontrar la mediana de la distribucin correspondiente a las notas


obtenidas por 40 estudiantes en una prueba estadstica

Interv
F
alos
10 10
19.6
19.6 3
29.2
29.2 7
38.8
38.8 7
48.4
48.4 5
58
58
8
67.6
Total
40

La nota que est en la mitad en esta distribucin es Moda.

2.2.3 Moda

Se debe ubicar el intervalo donde est la mayor frecuencia, y


despus se aplica la siguiente frmula:

Li es el lmite real inferior donde est la moda.

,
1es la diferencia entre la frecuencia modal y la frecuencia
inmediatamente anterior.
2 es la diferencia entre la frecuencia modal y la frecuencia
inmediatamente posterior.

A es la amplitud del intervalo.

Ejemplo

Encontrar la moda de las ventas de los sesenta establecimientos:

Interva

los

5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

F
2
5
12
14
15
8
4
60

Encontrar la moda de la distribucin correspondiente a las notas


obtenidas por 40 estudiantes

Intervalo
10-19.6
19.6-29.2
29.2-38.8
38.8-48.4
48.4-58
58-67.6
Total

F
10
3
7
7
5
8
40

Proceso de Comprensin y Anlisis

Supngase que en un viaje, un automovilista hace las siguientes


compras de gasolina. 10 galones a $2500 c/u, 8 galones a $2550
c/u, 15 galones a $2600 c/u y 12 galones $2480 c/u. Cul sera el
costo medio por galn?.
La siguiente tabla muestra los salarios mensuales en miles de pesos
de 144 empleados de una empresa:

Salarios
540 - 607
607 - 674
674 - 741
741 - 808
808 - 875
875 - 942
942 - 1009
1009 - 1076
Total

F
6
19
36
24
26
19
10
4
144

Encontrar la media, la moda y la mediana.


Diez medidas del dimetro de un cilindro fueron anotadas por un
cientfico como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 3.98, 4.03, 3.92 y
4.06 centmetros; hallar la media aritmtica de tales medidas.
De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y
los restantes sietes. Hallar la media aritmtica, la media y la moda.
De los 80 empleados de una empresa, 60 cobran $7000 a la hora y el
resto $4000 a la hora. Hallar cunto cobran la media por hora.
Usar la distribucin de frecuencias para hallar la altura media, la
altura que ms se repite y la altura que se encuentra en la mitad de
100 estudiantes.

Altura (m)
1.60 - 1.63
1.63 - 1.66
1.66 - 1.69
1.69 - 1.72
1.72 - 1.75
Total

F
5
18
42
27
8
100

Hallar la media, mediana y moda de los pesos de 40 estudiantes de


la siguiente tabla:

PESO (Lb)
118 - 126
126 134
134 142
142 150
150 - 158
158 - 166
166 - 174
Total

F
3
5
9
12
5
4
2
40

Los tipos de reaccin de un individuo ante diversos estmulos,


medidos por un psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53,
0.44 y 0.55 segundos respectivamente. Determinar su tiempo medio
de reaccin.

La siguiente tabla muestra la distribucin de cargas mximas en


toneladas cortas que soportan los cables producidos en cierta
fbrica. Determinar la carga mxima media, la carga mxima que se
repite y la carga que ms se repite.

Carga Mxima
(Toneladas
Cortas)
9.3 - 9.7
9.7 - 10.1
10.1 - 10.5
10.5 - 10.9
10.9 - 11.3
11.3 - 11.7
11.7 - 12.1
Total

2
5
12
17
14
6
4
60

La siguiente tabla muestra el nmero de bodas en Colombia para


hombres y mujeres de distintos grupos de edad durante 1984.

Hallar la media, mediana y moda tanto para hombres como para


mujeres, estableciendo las respectivas conclusiones.

Edad
(aos
)

15 19
19 23
23 27
27 31
31 35
35 39
39 43
43 47
47 51

Hombr
es
(Miles
)
121

Mujer
es
(Miles
)
481

2.441

4.184

5.930

6.952

6.587

7.193

11.788

11.893

9.049

9.022

8.749

8.171

5.786

4.654

2.581

1.524

UNIDAD 3: Medidas de dispersin

Ncleos Temticos y Problemticos


Desviacin Estndar o Tpica
Varianza
Coeficiente de Variacin

Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de
los datos numricos alrededor de una medida de centralizacin. Las
medidas de dispersin ms utilizadas son:

3.1 DESVIACIN ESTNDAR O TPICA

Indica que tan dispersos estn los datos con respecto a la media
aritmtica. Si los datos no estn agrupados, la desviacin estndar
de una serie de nmeros n. X1, x2, x3,.....xn est determinada por:

Si los datos estn agrupados, la desviacin estndar viene dada por:

X=

Las anteriores frmulas se utilizan cuando se trabaja con la


poblacin.

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la muestra.


Ejemplo
Hallar la desviacin estndar del puntaje obtenido por 4 estudiantes
en una prueba: 6 4, 3, 7. 8.

5.6

Hallar la desviacin estndar de las edades de 10 nios: 6, 6, 6, 4, 4,


4, 4, 3, 3, 7.

Hallar la desviacin estndar de las ventas de los sesenta


establecimientos x = 24.

Interv
alos
5 10
10 - 15

2
5

15 - 20

12

20 - 25

14

25 - 30

15

30 - 35

35 - 40

Total

60

(Xx)2 F
7.5 544.5
12. 661.25
5
17.
507
5
22. 31.5
5
27. 183.75
5
32.
578
5
37.
729
5

3235

3.2 VARIANZA

Esta es la medida de variacin ms importante, ya que se obtiene a


partir de la media aritmtica de una distribucin. La varianza seala
la distancia promedio de cualquier observacin en el conjunto de
datos. La varianza de un conjunto de datos se define como el
cuadrado de la desviacin tpica.

La varianza es una medida de dispersin, en la cual, las unidades son


los cuadrados de las unidades de los datos, es decir, pesos

cuadrados, personas cuadradas, etc., y por esto no son expresiones


fciles de interpretar.

Si los datos no estn agrupados, la varianza de una serie de nmeros


n: x1, x2, x3........ Xn est determinada por:

Si los datos estn agrupados, la varianza viene dada por:

Ejemplo
Hallar la varianza del puntaje de 5 estudiantes: 6, 4, 3, 7, 8.

Hallar la varianza de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3.


7.
X = 4.7

S =

18.1

= 1.81
10

Hallar la varianza de las ventas de los sesenta establecimientos: X


= 24

Interv
alos
5 10

7.
5
1 661.25
2.
5
1
507
7.
5
2
31.5
2.
5
2 183.75
7.
5
3
578
2.

10 15

15 20

12

20 25

14

25 30

15

30 - 35

(Xx) F
544.5
2

5
35 - 40 4 3
7.
5
Total 60

S =

729

3235

3235
= 53.9
60

3.3 COEFICIENTE DE VARIACIN

Esta medida relaciona la desviacin estndar y la media, para


expresar la variacin de la desviacin con respecto a la media
aritmtica. Este coeficiente de variacin se acostumbra expresarlo
en porcentaje.

S
La frmula que se utiliza es: cv =
* 100

El coeficiente de variacin es una medida muy utilizada en control de


calidad. Para estos casos, generalmente existen especificaciones que
limitan el coeficiente de variacin.
Tambin nos sirve para
determinar la homogeneidad de la informacin, es decir, si el
coeficiente de variacin es pequeo la informacin es homognea y
si el coeficiente de variacin es grande la informacin es
heterognea.

Ejemplo

Hallar el coeficiente de variacin de 6, 4, 3, 7, 8

X = 5.6
S = 1.34
Cv = 23.9%

Este porcentaje indica cmo se distribuye la desviacin estndar


con respecto a la media a travs de los datos.

Hallar el coeficiente de variacin de las ventas de los sesenta


establecimientos y obtener conclusiones.


X = 24

7.3
Cv =
24

S = 7.3

*100

Cv = 30.42%. De aqu se puede decir que las ventas de los


sesenta establecimientos son homogneas.
Si el trabajador A produce por hora 40 tornillos en promedio, con
desviacin de 5 tornillos y el trabajador B produce 180 tornillos en
promedio con desviacin de 15, cul de los trabajadores presenta
menor variabilidad?

CVA =

CVB =

15

*100 = 12.5% para el operador A


40

*100 = 9.4% Para el operador B


180

Esto significa que el operador B, quien tiene mayor desviacin en la


produccin, presenta menor variacin, porque la media de
produccin para el operador B es mucho mayor que la del operador
A.

Proceso de Comprensin y Anlisis

Hallar la desviacin estndar y la varianza de los puntos obtenidos


asignados a 8 nios en un juego: 12, 6, 7, 3, 15, 10 18 y 5.
Hallar la desviacin estndar y la varianza en la compra de cremas
dentales: $9.345, $3.850, $8.235, $8.000, $9.578, $8.560, $9.234, y
18.456.
Hallar la desviacin estndar de las alturas de los estudiantes de
acuerdo a la siguiente tabla:

Altura (m)
1.60 1.63
1.63 1.66
1.66 1.69
1.69 1.72
1.72 1.75
Total

F
5
18
42
27
8
10
0

Hallar la desviacin estndar de la distribucin de salarios de la


siguiente tabla:

SALARIOS

$250.000 $260.000
$260.000 $270.000
$270.000 $280.000
$280.000 $290.000

NM.
EMPLEADOS
8

10

16

14

NM.
EMPLEADOS
10

SALARIOS

$290.000 $300.000
$300.000 $310.000
$310.000 $320.000
Total

65

La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480


nios de una escuela elemental. Hallar la desviacin estndar:

F
4
9
16
28
45
66
85
72
54

X
70
74
78
82
86
90
94
98
102

38
27
18
11
5
2

106
110
114
118
122
126

Un fabricante de tubos de televisin produce dos tipos de tubos A y


B, que tienen vidas medias
respectivas:
xA
=
1495
horas y xB = 1875 horas y desviacin tpica de S A = 280 horas y SB =
310 horas. Qu tipo de tubo tiene mayor dispersin?
En un examen final de Estadstica, la puntuacin media de 150
estudiantes fue de 78 y la desviacin estndar 8. En lgebra la
media fue de 73 y la desviacin estndar 7.6. En qu materia fue
mayor la dispersin?.
Hallar la desviacin estndar y el coeficiente de variacin para los
datos de la siguiente tabla:

Carga Mxima
(Toneladas
Cortas)
9.3 - 9.7
9.7 10.1
10.1 - 10.5
10.5 - 10.9

14
6

60

2
5
12
17

Carga Mxima
(Toneladas
Cortas)
10.9 - 11.3
11.3 - 11.7

11.7 - 12.1

Total

UNIDAD 4: Medidas de Ubicacin

Ncleos Temticos y Problemticos

Cuartiles, Percentiles y Deciles


Diagramas de Caja

Proceso de Informacin

4.1 CUARTILES, PERCENTILES, DECILES

Si un conjunto de datos est ordenado por magnitud, el valor central


que divide al conjunto en dos mitades iguales, es la mediana.

Extendiendo esa idea, se puede pensar en aquellos valores que


dividen al conjunto en cuatro partes iguales, (cuartiles) esos valores
denotados Q1 Q2 y Q3, llamados primer, segundo y tercer cuartil
respectivamente. El Q2 coincide con la mediana.

Anlogamente, los valores que dividen a los datos en 10 partes


iguales se llaman deciles y se denotan por D 1 D2,...D9. El D5 coincide
con la mediana.

Y los valores que dividen a los datos en 100 partes iguales se llaman
percentiles, denotados por P1 P2,.....P99.
El P50 coincide con la
mediana.

Si los datos no estn agrupados, se deben ordenar en forma


ascendente o descendente y ubicar el dato que est en la posicin n
*p
:donde,

q
q = 4, 10, 100
p = Nmero a la ubicacin al que se desea referir
n = Total de datos
Ejemplo
Con los siguientes datos ubicar el que corresponde a:
Al primer cuartil
Al tercer decil
Al percentil 80
128
3 4

5
5

10
6

11
8

4
10

6
11

3
12

n*p
8*1

Q1 =
=2
=
q
4

El dato que est en el primer cuartil es 4, ya que est en la segunda


posicin.

n*p
8*3
3=
D
=
= 2.4 2

q
10

El dato que est en el tercer decil es 4, ya que est en la segunda


posicin.

n*p
8 * 80
P80 =
=
= 6.4 6
q
100

El dato que est en el percentil 80 es 10, ya que este valor est en la


sexta posicin.
Cuando los datos estn agrupados, utilizamos la misma frmula de la
mediana y reemplazamos
donde est n/2 por n * p; el lmite
inferior es donde est la F (n*p)/q
q

Donde U hace referencia a la medida de


ubicacin, li es el limite inferior donde est
F(n*p)/q

Ejemplo

En las ventas de los sesenta establecimientos encontrar:

El primer, segundo y tercer cuartil


El primer, quinto y el sexto decil
El percentil doce, cincuenta y ochenta

n*p
Para encontrar estas medidas, primero hay que encontrar
q
para ubicar el intervalo correspondiente a esta posicin.

El Primer, Segundo y Tercer Cuartil

n = 60
Interval F
p=1
os
q=4
5 - 10
2
n*p = 60*1 = 15
10 - 15 5
q
4
15 - 20 1
Li= 15
2
Fa = 7
20 - 25 1
F (n*p)/q = 12
4
A=5

25 - 30

30 - 35
35 - 40
Total

1
5
8
4
6
0

De donde el 25% de las ventas de


los 60 establecimientos es de
$18000 o menos.

Interval
o
5 - 10
10 - 15
15 - 20

20 - 25

25 - 30

30 - 35
35 - 40
Total

2
5
1
2
1
4
1
5
8
4
6
0

n = 60
p=2
q=4
n*p = 60*2 = 30
q
4
Li= 20
Fa = 19
F (n*p)/q = 14
A=5

Donde el 50% de las ventas de los


60 establecimientos es de $24000
o menos.

Interval
os
5 - 10
10 - 15
15 - 20

2
5
1
2
1

20 - 25

n = 60
p=3
q=4
n*p = 60*3 = 45
q
4
Li= 25
Fa = 33
F (n*p)/q = 15
A=5

25 - 30

30 - 35
35 - 40
Total

4
1
5
8
4
6
0

Por lo tanto el 75% de las ventas de los


60 establecimientos es de $29000 o
menos

El Primer, Quinto y el Sexto Decil

Interval F
n = 60
os
p=1
q = 10
5 - 10
2
n*p = 60*1 = 6
10 - 15 5
q
10
15 - 20 1
L
i= 10
2
Fa = 2
20 - 25 1
F (n*p)/q = 5
4
A=5
25 - 30 1
5
30 - 35 8
35 - 40 4
Total
6
0

El 10% de las ventas es de $9000 o menos.

Interval
os
5 10
10 - 15
15 - 20

20 - 25

25 - 30

30 - 35
35 - 40
Total

2
5
1
2
1
4
1
5
8
4
6
0

n = 60
p=5
q = 10
n*p = 60*5 = 30
q
10
Li= 20
Fa = 19
F (n*p)/q = 14
A=5

El 50% de las ventas es de


$24000 o menos

Interva
los
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

2
5
12
14
15
8
4
60

n = 60
p=6
q = 10
n*p = 60*6 = 36
q
10
Li= 25
Fa = 33
F (n*p)/q = 15
A=5

Y el 60% de las ventas es de $26000 o


menos.

n = 60y Ochenta
El Percentil Doce, Cincuenta
p = 12
q = 100
n*p = 60*12 = 7.2 =
7
q
100
Li= 10
Fa = 2
F (n*p)/q = 5

Interva
lo
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

2
5
12
14
15
8
4
60

60*12

-2
100
P12= 10+
5 = 15.2 15

Por lo tanto el 12% de las ventas de los sesenta establecimientos es


de $15000 o menos.

Interva
F
n = 60
los
p = 50
5 - 10
2
q = 100
n*p = 60*50 = 30
10 - 15
5
q
100
15 - 20 12
L
i= 20
20 - 25
Fa = 19
14
F (n*p)/q = 14
25 - 30 15
A=5
30 - 35
8
35 - 40
4
Total
60

60*50

-19
100
P50=
20+
5 = 23.9 24

14

El 50% de las ventas de los sesenta establecimientos es de $24000 o


menos.

Interv
alo
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

2
5
12
14
15
8
4
60

n = 60
p = 80
q = 100
n*p = 60*80 = 48
q
100
Li= 25
Fa = 33
F (n*p)/q = 15
A=5

Y el 80% de los establecimientos tienen


ventas de $30.000 o menos.

4.2 DIAGRAMAS DE CAJA

Es una representacin del diagrama de una distribucin construida


para mostrar sus caractersticas principales y sealar los posibles
datos atpicos, es decir, aquellas observaciones que parecen ser
distintas de las dems.
Su principal utilidad es para depurar
informacin puesto que se pueden eliminar los datos de mayor
variacin en los extremos. Un diagrama de caja se construye as:

Ordenar los datos de la muestra y obtener el valor mnimo, el mximo


y los tres cuartiles Q1, Q2, Q3, localizndolos en una recta numrica
utilizando una escala adecuada.

Dibujar un rectngulo cuyos extremos son Q1 y Q3.

Calcular unos limites admisibles superior e inferior que van a servir


para identificar los valores atpicos. Estos lmites se calculan con :

Li = Q1-1.5

Q3 Q1
2

Q3situados
Q1
Considerar como valores atpicos los
fuera del intervalo (l i,
Li
=
Q3
+1.5
Ls).
2

Dibujar una lnea que vaya desde cada extremo del rectngulo
central hasta el valor ms alejado no atpico, es decir, que est
dentro del intervalo (li, ls).

Identificar todos los datos que estn fuera del intervalo


marcndolos como atpicos.

Ejemplo: Los siguientes datos muestran el nmero de das con aire


contaminado en 2001 y 2002 en varias ciudades colombianas:

A
B
C
D
E
F
G
H
I

J
K
L
M
N
O

2001 2002
248
221
208
171
113
131
128
89
106

118
101
60
33
79
63
55
56

2001 2002
47
54
88
55
47
69
58
59
82
48
33
16

(li, ls)

Construir el diagrama de cajas correspondiente a la tabla dada.


Para 2001
El primer paso es ordenar la informacin de mayor a menor:
33 47 47 55 58 60 79 82 88 106 113 118 128 208 248
Luego se encuentran los tres cuartiles:

15*1

Q1 =
4

= 3.75

El 25% de ciudades tienen 55 das o menos de contaminacin o el


25% de las ciudades de EEUU tienen entre 33 y 55 das de
contaminacin.

15*2
Q2 =
8

= 7.5
4

El 50% de ciudades
contaminacin

15*3
Q3 =

= 11.25 11
4

tienen

82

das

menos

de

El 75% de ciudades tienen 113 das


o menos de contaminacin.

Por tanto los lmites admisibles son:


Li = 55 1,5

113 55

= 11,5

113 - 55

Ls = 113 + 1,5

= 156,5

Como todos los valores son superiores al lmite inferior, la lnea


inferior del diagrama de caja deber llegar hasta el valor mnimo y no
hay atpicos en esta direccin.
2001

Este diagrama de caja, muestra que la mayor parte de las


observaciones son menores que 113 y que el extremo superior de
248 est muy alejado del grupo principal de datos. Se ve con
claridad la amplitud de los datos, que es la longitud del diagrama
completo (248 - 33 = 215).

Para 2002

16 33 48 54 55 56 59 63 69 89 101 131 171 221

14*1

El 25% de ciudades tienen 55 das o menos de contaminacin.


Q1= = 3.75 4

14*2
El 25% de ciudades tienen 59 das o menos de contaminacin.
Q2= = 7
4

14*3
El 25% de ciudades tienen 101 das o menos de contaminacin.

Q3= = 10.5 11

101 - 55
= 20.5

Li = 55 1,5
2

101 - 55

Ls = 101 + 1,5
= 135.5

2
2002

Estos diagramas de caja son muy eficaces cuando ellos se comparan


conjuntos de datos.

2001

2002

Ntese como los datos tienden a concentrarse ms y ms hacia el


extremo inferior de la escala, excepto el extremo alto, el cual
permaneci alto durante los dos aos.

Proceso de Comprensin y Anlisis

En la siguiente tabla que relaciona las alturas de 100 estudiantes,


determinar el primer, el segundo y tercer cuartil y realizar el grfico
correspondiente:

Altura

(m)
1.60 - 1.63

1.63 - 1.66
1.66 - 1.69
1.69 - 1.72
1.72 - 1.75

Total

5
18
42
27
8
100

Hallar en la siguiente tabla para los salarios en miles de pesos de 144


empleados de una empresa:
El primer cuartil
El quinto y octavo decil
El percentil 10 y el percentil 45
Salario

540 - 607

607 - 674

674 - 741

741 - 808

808 - 875

875 942

942 - 1009
1009
1076
Total

F
6
19
36
24
26
19
10
4
144

Encontrar el primer, segundo y tercer cuartil de la siguiente tabla que


relaciona los pesos de 40 personas y realizar el grfico
correspondiente:

Peso
(Lb)

118 - 126

126 - 134
134 - 142
142 - 150
150 - 158
158 - 166
166 174
Total

3
5

9
12
5
4
2
40

Las siguientes son diez medidas del dimetro de un cilindro: 3.88,


4.09, 3.92, 3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros.
Hallar:
El primer y tercer cuartil
El cuarto, el sexto y noveno decil
El percentil 48 y el percentil 10
La siguiente tabla muestra una distribucin de frecuencias de las
vidas medias de 400 vlvulas de radio probadas en la empresa L & M.
Encontrar:

El primer, segundo, tercer cuartil y su respectiva grfica


El segundo, cuarto y sexto decil.
El cincuenta percentil.
Nm
ero
Vida Media
de
Tubo
s
300 400
14
400 - 500
46
500 - 600
58
600 - 700
76
700 - 800
68
800 - 900
62
900 - 1000
48
1000 - 1100
22
1100 - 1200
6
Total
400

UNIDAD 5: Presentacin de la
Informacin

Ncleos Temticos y Problemticos

Histograma
Polgonos de Frecuencia
Ojivas
Barras

Proceso de Informacin

Una grfica estadstica es aquella en la cual se presentan los datos


estadsticos en trminos de magnitudes, para interpretarlos en forma
visual.
Presentar la informacin de la tabla de frecuencias por medio de
grficas sirve para reforzar las conclusiones que se determinan de
esta tabla. Estas grficas se pueden utilizar para:

Evaluar resultados de un proceso.


Presentar resultados de una investigacin.

Para la elaboracin de un grfico hay que tener en cuenta:

Ttulo: indica la descripcin del contenido de la grfica, es decir,


indica el fenmeno de estudio. Por ejemplo, Produccin de caf en
Colombia en el perodo 1995 - 1997.

Diagrama: es empleado para representar los datos mostrados en una


grfica; los diagramas pueden ser de varios tipos: lneas, barras,
dimensiones y smbolos.


Escala: se aplica para saber la dimensin del fenmeno graficado.
Se debe identificar en los ejes X y Y de un sistema de coordenadas.
Las magnitudes en la ordenada o eje Y y las clasificaciones de los
datos en las abscisas o eje X.

Existen varios tipos de grficas para representar los datos


estadsticos y al mismo tiempo sirven para reforzar las conclusiones
dadas en la tabla de frecuencias.

5.1 HISTOGRAMA

Sirve para representar grficamente una distribucin de frecuencias.


El grfico se disea trazando los intervalos sobre el eje X y las
frecuencias absolutas sobre el eje Y. A partir del intervalo se traza la
altura respectiva dada por la frecuencia absoluta.

La empresa Cuero Lindo ha recopilado informacin sobre las ventas


en miles de pesos de 60 almacenes. Estos datos son:

VENTAS PARA SESENTA ESTABLECIMIENTOS

(Miles de pesos)

Intervalo
F
5 - 10
2
10 - 15
5
15 - 20
12
20 - 25
14
25 - 30
15
30 - 35
8
35 - 40
4
40 0
Total
60

Las ventas ms frecuentes de los sesenta establecimientos estn


entre $25000 y $30000; $20000 y $25000. Y la menos frecuente
est en $10000.

5.2 POLGONOS DE FRECUENCIAS

Es una curva que se traza a partir de los puntos medios de cada clase
de amplitud; estos se unen por medio de una lnea recta, la cual se
disea con base en los datos del histograma.

5.3 OJIVAS

Es el grfico de una distribucin de frecuencias acumuladas (relativa,


absoluta) descendente o ascendente. Esta grfica indica la forma
como crece la informacin a travs de los intervalos, se puede utilizar
como medicin de las variaciones de los grupos. El punto donde se
cortan las dos ojivas es el punto central de la distribucin es decir la
mitad de la informacin.

5.4 BARRAS

Sirven bsicamente para establecer las diferencias entre grupos


individuales y pueden ser de dos tipos:

5.4.1
Barras Verticales

Se emplean para presentar datos clasificados cronolgica o


cuantitativamente:

Ejemplo:
en la siguiente tabla se encuentra la informacin
correspondiente a las ventas anuales de la empresa El Retorno
durante el perodo de 1987 - 1996 (en millones de pesos).

Aos

1987
1988
1989
1990
1991
1992
1993
1994
1995
1996

Vent
as
6
9
15
30
50
80
110
150
130
100

5.4.2
Barras Horizontales

Se
emplean
para
dar
datos
clasificados
geogrfica
y
cualitativamente, indican la importancia de un atributo con respecto
a los dems.

Ejemplo:
la siguiente informacin nos indica el nmero de
profesionales egresados de distintas carreras en la ciudad de Bogot
en 2002:

Carrera

Ciencias Sociales
Administracin
Ingenieras
derecho

Nmero de
profesionales
1100
800
500
700

Segmentada
Ejemplo: presenta una comparacin de la magnitud relativa de
ventas dentro de cada departamento y de las ventas totales por
departamentos. La siguiente informacin corresponde a las ventas
por departamentos al contado y a crdito en un almacn, se presenta
en miles de pesos.

Departamento
Hombres
Mujeres
Nios
Electrodomsticos

Contado
200
180
150
300

Crdito
120
110
90
210

Total
320
290
240
510

Agrupada
Muestra las ventas por departamento en una empresa al contado y a
crdito y permite hacer comparaciones entre departamentos y al
interior de cada uno.

Las Grficas de barras horizontales pueden presentarse de dos


formas:
Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las
diferencias en las proporciones o porcentajes. Es efectiva para
permitir las comparaciones cuando los segmentos son relativamente
grandes. El proceso para realizar el diagrama consiste en una regla
de tres para:
Conocer el ngulo de cada sector, entonces se debe relacionar los
360 que tiene una circunferencia con el tamao de la muestra y con
cada una de sus frecuencias absolutas.

360 n
x Fi

As por ejemplo:

360 60
x
2
360*2
x=

= 12

60

360 60
x
5
360*35
x=

= 18
60

Donde 60 es la muestra de las


ventas de los establecimientos; 2 es
la frecuencia absoluta del primer
intervalo.

Donde 60 es la muestra de las ventas de los establecimientos; 5 es la


frecuencia absoluta del segundo intervalo.
Y para conocer el porcentaje que corresponde a cada parte,
relacionando 100% con el tamao de la muestra
100ncon la frecuencia
absoluta.
yFi
As, por ejemplo:

100% 60
y 2

Donde 60 es la muestra de las ventas de los


establecimientos; 2 es la frecuencia absoluta del
primer intervalo.

100*2
Esto quiere decir que el 3% de los establecimientos tienen ventas entre $5000 y $10000.
y= = 3.3 3%
60

Tallo y Hojas

Se puede tener un cuadro ms informativo que la tabla de


recoleccin de datos si se hace un listado diferente.
Se tienen los porcentajes invertidos por 15 industrias manufactureras
en el control de contaminacin de Colombia en 2001:
1702
07
04
08
1704
04
14
03
0302
04
10
01
Para elaborar el diagrama de Tallos y Hojas hay que seguir los
siguientes pasos:
El dgito de la extrema izquierda de cada valor es el punto de partida
adecuado para clasificar los datos en dos grupos. El O y 1 se usa
para formar el tallo y se escribe en columna vertical. A continuacin
se escribe el segundo dgito como si fuera una hoja en el rengln
adecuado del tallo, a la derecha de la barra vertical.

O 3,2,4,2,7,4,4,4,8,3,1
1 7,7,4,0

Ya que la mayor parte de las observaciones tienen el cero como


primer dgito, se puede alargar el tallo a dos categoras de O y dos de
1; en la que los segundos dgitos del O al 4 quedarn en el rengln
superior y los dgitos del 5 al 9 en el inferior. Como es fcil de
ordenar las observaciones en cualquier rengln, tambin se puede
presentar la grfica ordenada de tallo y hojas.

O
1,2,2,3,3,4,4,4,4
O
7,8
1 0,4

1 7,7

Ahora se ve con facilidad que las observaciones van de 01 a 17, que


nueve de las 15 observaciones son de 4 o menos.

Con el ejemplo que se ha venido trabajando; se puede elaborar este


diagrama de tallos y hojas. En los siguientes datos los resultados son
obtenidos en miles de pesos:

4017
26
10
26
21
18
27
16
38

2233
2828
1935
2420
2811

24
33
23
31
34

20
22
28
29
39

28
25
22
18
10

14
29
15
19
25

30
29
34
11
17

25
29
13
23
21

29
21
16
20
34

37
32
26
24
18

Presentacin de los Datos en Forma de Tallo y Hojas


1
1
2
2
3
3
4
4

0,0,1,1,3,4
5,6,6,7,7,8,8,8,9,9
0,0,0,1,1,1,,2,2,2,3,3,4,4,4
5,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,9
0,1,2,3,3,4,4,4
8,9
O

Las presentaciones de tallo y hoja de ms de dos dgitos se pueden


elaborar de diversos modos. Los siguientes datos muestran el
nmero de das con aire contaminado en el 2001 en varias ciudades
de Colombia:

Ciudad
A
B
C
D
E
F
G
H
I
J
K
L
M
N

2001
248
208
113
128
106
118
60
79
55
47
88
47
58
82

33

Para construir una grfica de tallo y hojas con los datos del 2001, los
dgitos de las centenas y decenas formarn el tallo y las unidades
sern las hojas.

7.

5.

28

3.

Como esta grfica es muy dispersa: hay que hacer que el tallo
contenga las centenas y las hojas los dems dgitos

33,47,47

55,58,60,79,
82,88
06,13,18,28

08,48

2

2

Proceso de Comprensin y Anlisis

La siguiente tabla muestra la poblacin de alguna ciudad (en


millones) en los aos de 1882 2002. Representar estos datos en
un diagrama de barras.

AO

1882
1892
1902
1912
1922
1932
1942
1952
1962
1972
1982
1992
2002

POBLACI
N
(Millones
)
31.4
39.8
50.2
62.9
76
92
105.7
122.8
131.7
151.1
179.3
203.3
226.5

La siguiente tabla muestra el nmero de sacos de trigo y maz en la


cooperativa PQR durante los aos de 1992 2002:

AO

1992
1993
1994
1995
1996

NMERO DE
SACOS DE TRIGO

200
185
225
250
240

NMERO DE
SACOS DE
MAIZ
75
90
100
85
80

AO

1997
1998
1999
2000
2001
2002

NMERO DE
SACOS DE TRIGO

195
210
225
250
230
235

NMERO DE
SACOS DE
MAIZ
110
110
105
95
110
100

Con referencia a la grfica, determinar el ao o aos durante los


cuales:
La produccin de trigo fue mnima.
La de maz fue mxima.
Se dio el mayor descenso en la produccin de trigo.
Decreci la produccin de maz respecto al ao anterior y creci la de
trigo.
Se produjo idntica cantidad de trigo
La produccin conjunta de trigo y maz fue mxima.
Las reas de algunos departamentos de Colombia (en miles de
millas cuadradas) se recogen en la siguiente tabla. Representar
estos datos en un grfico de tortas y determinar las conclusiones
ms relevantes.

DEPARTAMENTO

Cundinamarca
Antioquia
Armenia
Amazonas
Meta
Choc
Norte de Santander
Total

REA (miles de
millas cuadradas)
11.7
10.4
1.9
9.4
3.3
6.9
7.9
51.5

En la siguiente tabla, se ven los nmeros


(en millones)
de
estudiantes de enseanza elemental, media y superior en Colombia.
Representar los datos, usando grficos de barras y determinar
algunas conclusiones.

AO

1982
1987
1992
1997
2002

ELEMENT
AL
32.4
35.5
37.1
33.8
30.6

MEDIA

10.2
13
14.7
15.7
14.6

SUPERI
OR
3.6
5.7
7.4
9.7
10.2

La siguiente tabla muestra el estado civil de hombres y mujeres (de


ms de 18 aos) en Colombia en 2001. Representar los datos
mediante dos grficos circulares y un grfico de diseo propio.

ESTADO CIVIL
Soltero
Casado
Viudo
Divorciado

HOMBRE MUJERE
S
S
(% total)
(%
total)
25.1
18.4
66.7
61.3
2.4
12.4
5.8
7.9

Una fbrica de gaseosa proyecta lanzar al mercado un nuevo sabor,


para lo cual se realiza un test de aceptacin de dicho sabor, en una
muestra de 32 personas. Se utiliza una escala de 30 para medir el
grado de aceptacin. Los puntos obtenidos fueron los siguientes:

19
24
28
30

24
19
27
19

26
18
22
26

31
19
17
27

18
21
19
28

17
32
21
21

22
31
22
24

21
26
24
26

Realizar la representacin del esquema de tallos y hojas de esta


informacin.

Un artculo de revista titulado Amargo Panorama, habla acerca del


caf colombiano y muestra un grfico de este tipo:

Qu se puede decir de este grfico?.


En la seccin de actualidad de una revista, hay un titular sobre Los
Derechos Humanos:
una tortura.
Y muestra entre otras los
siguientes grficos:

De acuerdo a estas grficas responder:


Qu porcentaje de quejas estn concluidas?
Qu significado tiene el valor 3794 en el grfico de estado de las
quejas?
Qu interpretacin le puede dar al grfico quines se quejan?

ANEXO: Tablas

BIBLIOGRAFA GENERAL

BERNAL V.
Miguel.
Estadstica Descriptiva: J.
Elaboracin y
Presentacin de Datos Universidad de Pamplona, 1987.

GALLARDO, Yolanda. Estadstica: Programa de Sicologa Universidad


de Pamplona. 1997.

MARTNEZ BENCARDINO, Ciro.


Norma, 1981.

MORENO GARZN, Adonay. Serie aprender a investigar: Recoleccin


de la informacin. Cali: ICFES, 1995.

PARZEN, Emmanuel.
Teora Moderna de Probabilidades y sus
Aplicaciones Mxico: LIMUSA, 1991.

PEA SNCHEZ, Damel.


Estadstica Modelos
Fundamentos. Madrid: Alianza editorial, 1986.

PORTUS GOVINDEN.
Lincoyn.
Bogot: McGRAW - Hill, 1986.

SPIEGEL Murria R. Estadstica. Madrid: McGraw Hill, 1993.

Estadstica Comercial.

Bogot:

Mtodos

I.

Curso Prctico de Estadstica.

S-ar putea să vă placă și