Sunteți pe pagina 1din 73

ESTADISTICA I

_________________________________________________________________________

Programas de Estudio a Distancia

Estadstica I

www.unipamplona.edu.co
Esperanza Paredes Hernndez
Rectora
Mara Eugenia Velasco Espitia
Decana Facultad de Estudios a Distancia
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________

Tabla de Contenido
Presentacin
Introduccin
UNIDAD 1: Generalidades de la Estadstica
Ncleos Temticos y Problemticos
Proceso de Informacin
1.1. DEFINICIN
1.1.1 Importancia
1.1.2 Poblacin
1.1.3 Muestra
1.1.4 Mtodos de Seleccin de una Muestra al Azar
1.1.5 Unidad Estadstica
1.2
ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS
1.2.1 Recoleccin de Datos
1.2.2 Intervalos
1.2.3 Amplitud
1.2.4 Frecuencia de Clase o Frecuencia Absoluta
1.2.5 Marca de Clase (X)
1.2.6 Frecuencia Relativa (Fr)
1.2.7 Frecuencia Acumulada (Fa)
1.2.8 Frecuencia Relativa Acumulada (Fra)
Proceso de Comprensin y Anlisis
UNIDAD 2: Medidas de Tendencia Central
Ncleos Temticos y Problemticos
Proceso de Informacin
2.1
PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS
2.1.1 Media Aritmtica
2.1.2 Mediana
2.1.3 Moda
2.2
SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS
2.2.1 Media Aritmtica
2.2.2 Mediana
2.2.3 Moda
Proceso de Comprensin y Anlisis
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA I
_________________________________________________________________________
UNIDAD 3: Medidas de Dispersin
Ncleos Temticos y Problemticos
Proceso de Informacin
3.1
DESVIACIN ESTNDAR O TPICA
3.2
VARIANZA
3.3
COEFICIENTE DE VARIACIN
Proceso de Comprensin y Anlisis
UNIDAD 4: Medidas de Ubicacin
Ncleos Temticos y Problemticos
Proceso de Informacin
4.1
CUARTILES, PERCENTILES Y DECILES
4.2
DIAGRAMAS DE CAJA
Proceso de Comprensin y Anlisis
UNIDAD 5: Presentacin de la Informacin
Ncleos Temticos y Problemticos
Proceso de Informacin
5.1
HISTOGRAMA
5.2
POLGONOS DE FRECUENCIA
5.3
OJIVAS
5.4
BARRAS
5.4.1 Barras Verticales
5.4.2 Barras Horizontales
Proceso de Comprensin y Anlisis
ANEXO: Tablas
BIBLIOGRAFA GENERAL

_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia

ESTADISTICA BASICA

Presentacin
La educacin superior se ha convertido hoy da en prioridad para el gobierno
Nacional y para las universidades pblicas, brindando oportunidades de superacin
y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin
para merecer de este servicio educativo; prueba de ello es el espritu de las
actuales polticas educativas que se refleja en el proyecto de decreto Estndares
de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la
Presidencia de la Repblica, el cual define:
Que la Educacin Superior a
Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en
los cuales se hace uso de mediaciones pedaggicas que permiten crear una
ruptura espacio temporal en las relaciones inmediatas entre la institucin de
Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes
entre s.
La Educacin Superior a Distancia ofrece esta cobertura y oportunidad educativa
ya que su modelo est pensado para satisfacer las necesidades de toda nuestra
poblacin, en especial de los sectores menos favorecidos y para quienes las
oportunidades se ven disminuidas por su situacin econmica y social, con
actividades flexibles acordes a las posibilidades de los estudiantes.
La Universidad de Pamplona gestora de la educacin y promotora de llevar
servicios con calidad a las diferentes regiones, y el Centro de Educacin Virtual y a
Distancia de la Universidad de Pamplona, presentan los siguientes materiales de
apoyo con los contenidos esperados para cada programa y les saluda como parte
integral de nuestra comunidad universitaria e invita a su participacin activa para
trabajar en equipo en pro del aseguramiento de la calidad de la educacin superior
y el fortalecimiento permanente de nuestra Universidad, para contribuir
colectivamente a la construccin del pas que queremos; apuntando siempre hacia
el cumplimiento de nuestra visin y misin como reza en el nuevo Estatuto
Orgnico:
Misin: Formar profesionales integrales que sean agentes generadores de
cambios, promotores de la paz, la dignidad humana y el desarrollo nacional.
Visin: La Universidad de Pamplona al finalizar la primera dcada del siglo XXI,
deber ser el primer centro de Educacin Superior del Oriente Colombiano.
Maria Eugenia Velasco Espitia Directora CEDUP

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos
intelectuales del hombre es notoria a travs de su historia. Fue as como en la
antigedad el pensamiento matemtico contribuy a resolver problemas en tareas
econmicas y constructoras de diferentes pueblos, dio la base para revelar tos
misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad
de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la
edad media utilizaron el contenido matemtico como una simple rutina para
disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la
matemtica en la edad moderna ayud a buscar explicaciones concretas de
problemas que se daban en ingeniera, construccin y otras actividades prcticas
del hombre.
Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por
un conjunto de experiencias, que manejan y manipulan de una manera
sorprendente. Es decir, en cierta forma se est efectuando una serie de
operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante
unas representaciones significativas para l y as se obtiene una serie de
conclusiones razonables.
Esta informacin que de cierta manera se manipula, se debe matematizar. Es
decir, seguir un procedimiento para poder tabular la informacin, presentarla y as
hacer el anlisis respectivo para dar las conclusiones pertinentes al estudio que se
est realizando.
La Estadstica es utilizada en casi todas las ramas de la ciencia moderna, as como
en muchos otros campos de la actividad humana. Como dijo Salomn Fabricant
todo el mundo parece hoy coincidir en que la Estadstica puede ser til para
comprender, evaluar y controlar el funcionamiento de la sociedad. En nuestra
sociedad, el progreso puede medirse mediante diversos ndices numricos, la
estadstica se utiliza para describir, manipular e interpretar estos nmeros.
An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como
herramienta fundamental para el anlisis e interpretacin de resultados son

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

bastante heterogneos, en muchos casos los pasos de una investigacin


estadstica son los siguientes:
Primera etapa: formulacin del problema. Para investigar con xito un problema
dado, primero se tienen que crear conceptos precisos, formular preguntas claras e
imponer limitaciones adecuadas al problema, tomando en cuenta el tiempo, dinero
disponible y la habilidad de los investigadores.
Segunda etapa: diseo del experimento. Nuestro deseo es obtener un mximo de
informacin empleando un mnimo de costo y tiempo. Esto implica, entre otras
cosas, que se debe determinar el tamao de la muestra o la cantidad y tipo de
datos que resolvern ms eficientemente el problema. A la vez este tamao ser
afectado por el mtodo empleado para la seleccin de la muestra representativa.
Con respecto a la representatividad de la muestra, se debe observar que no es
fcil obtener selecciones que sean completamente aleatorias. Existe el peligro de
que una seleccin pueda ser preferida en alguna forma. Se han propuesto varios
mtodos para vencer esta dificultad y se han usado en la prctica. Se considera
este punto dentro del desarrollo del mdulo.
Tercera etapa: experimentacin o recoleccin de datos. En general, sta es la
parte que ms tiempo consume en toda investigacin que sea realizada, sta debe
sujetarse a reglas estrictas. De hecho, cuanto menos opiniones impongamos,
sern mejores los resultados.
Cuarta etapa: tabulacin y formulacin de la respuesta. Al aplicar el mtodo
estadstico antes mencionado, se obtienen conclusiones a partir de la muestra,
acerca de la poblacin correspondiente. Es decir, se va a inferir sobre la muestra y
se trata de sacar conclusiones para la poblacin. Es esta etapa la que le da el
objetivo final a la estadstica, puesto que se van a tomar decisiones con base en
los resultados obtenidos en el estudio descriptivo de la muestra.
No existe una frmula mgica ni nica en estadstica que tome en cuenta todas las
situaciones prcticas concebibles. Por lo cual es necesario adquirir conocimientos
generales de los mtodos ms importantes para hacer inferencias. En cada caso
prctico debe situarse con cuidado la naturaleza del problema especfico, para
estar seguros de que ser escogido el mtodo ms apropiado.
Con el apoyo del computador los clculos matemticos se hacen ms fciles, por lo
tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la
actualidad existen varios paquetes estadsticos sencillos de manejar, tales como el
Statgraphics, Sas, Minitab, Spss.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

De comn acuerdo con su Tutor se pueden desarrollar los ejercicios propuestos al


final de cada tema, se puede utilizar calculadora y computador para facilidad de los
clculos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 1: Generalidades de la
Estadstica
Ncleos Temticos y Problemticos

Definicin
Estadstica Descriptiva Distribucin de Frecuencias

Proceso de Informacin
1.1

DEFINICIN

Al evolucionar las ciencias, pierden sus rasgos primitivos, se transforman, dividen y


an cambian de nombre. Como ciencia que es, la estadstica ha sufrido igual
proceso y para comprender su estado actual y su campo de actividades se necesita
conocer algo de su historia. Se considera fundador de la estadstica a Godofredo
AchenwalL profesor y economista alemn (1719 - 1772) quien, siendo profesor
de la universidad de Leipzig, escribi sobre el descubrimiento de una nueva ciencia
que lamo estadstica (palabra derivada de Staat que significa gobierno) y que
defini como el conocimiento profundo de la situacin respectiva y comparativa
de cada estado
Achenwa y sus seguidores estructuraron los mtodos
estadsticos que se orientaron a investigar, medir y comparar las riquezas de las
naciones Lo anterior no significa que antes de los estudios de Godofredo
Achenwa, los estados no hubiesen efectuado inventarios de sus riquezas; estos
invntanos o censos se efectuaron desde la antigedad. Se sabe que 2000 a 2500
aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples
inventarios elementales Desde su creacin la estadstica se ha enriquecido
continuamente con los aportes de matemticos, filsofos y cientficos.
Adems, en un principio se consideraba que la funcin de a estadstica era la
descripcin de las caractersticas de un grupo, de observar y describir el hecho En
su origen la estadstica era histrica: hoy en da, la estadstica, adems de ser
descriptiva, es analtica, considerndose esta ltima como la funcin ms

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

importante que realiza, ya que permite obtener conclusiones para un grupo mayor,
denominado poblacin, partiendo de una investigacin realizada en un grupo
menor, denominado muestra.
Las siguientes son unas definiciones que ayudan a determinar el sentido de la
estadstica:
Dicaonano de Webster una rama de las matemticas que trata de la recopilacin,
el anlisis, la interpretacin y la presentacin de una gran cantidad de datos
numricos.'
Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los
datos reunidos al contar o medir las propiedades de alguna poblacin.
Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los
resultados de los experimentos o procesos."
Al unir estas definiciones, se puede notar que a partir de la recopilacin de datos
se pueden hacer inferencias con respecto a resultados de experimentos. Es decir a
partir de un conjunto de mtodos, normas, reglas y de principios para observar,
agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
Es entonces, un campo parcial de la Matemtica aplicada a un conjunto de objetos
que se asignan valores numricos y luego estos se siguen elaborando
matemticamente.
Matemticamente los procedimientos estadsticos estn muy desarrollados y
asegurados en el plano de la teora, por ejemplo, mediante la indicacin de
mbitos dentro de los cuales puede suponerse o rechazarse una hiptesis. Se
acostumbran a distinguir dos clases de Estadstica, la descriptiva y la de inferencia.
1.1.1

Importancia

La teora general de la estadstica es aplicable a cualquier campo cientfico en el


cual se hacen observaciones el estudio y aplicacin de los mtodos estadsticos son
necesarios en todos (los campos del saber, sean estos de nivel tcnico o
cientfico). Es obvio que en cada campo se aplican o desarrollan procedimientos
especficos, como aplicaciones particulares a variantes de la teora general. Las
primeras aplicaciones de la estadstica fueron los asuntos de gobierno, luego las
utilizaron las compaas de seguros y los empresarios de juegos de azar, despus
siguieron los comerciantes, los industriales, los educadores, etc.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de
la vida:

Se disean encuestas para recoger informacin y as poder predecir algn


suceso.

Los experimentos que se hacen para determinar el mtodo apropiado para


curar cierta enfermedad.

La duracin, intensidad, extensin de las lluvias, tormentas o granizos, las


Temperaturas, la intensidad y direccin del viento son variables aleatorias.

1.1.2

Poblacin

Es el conjunto de elementos que se toma de referencia para el estudio que se


desea investigar la ocurrencia de una caracterstica o propiedad. Los elementos
que integran la poblacin pueden pertenecer a personas, objetos o cosas. Segn
sea el tamao, la poblacin puede considerarse como finita o infinita.
Es poblacin finita cuando el nmero de elementos que la componen es limitado;
infinita cuando consta de infinitos elementos.

Ejemplo
La poblacin consistente en todas las tuercas producidas por una fbrica en un da
especfico, los estudiantes matriculados en un colegio, son poblaciones finitas;
mientras que la determinada por todos los posibles resultados (caras, cruces) de
sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban
un seguro de vida, las piezas fabricadas por una mquina, son poblaciones
infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado
es finita pero si no se especifica este tiempo es entonces infinita.
1.1.3

Muestra

Se considera como muestra el subconjunto de elementos que pertenecen a la


poblacin objetivo sobre los cuales se recoger la informacin necesaria, para
tomar una decisin vlida relativa a la poblacin de estudio. Si una muestra es
representativa de una poblacin es posible inferir importantes conclusiones sobre
la poblacin a partir del anlisis de la muestra.
Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando cada uno
de los elementos tiene la misma probabilidad de ser escogido y no probalstica
cuando se seleccionan los datos con determinado criterio o conveniencia del
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras
de ser seleccionadas, por tal razn no se puede determina la validez, ni la
confianza que merecen dichos resultados.
1.1.4

Mtodos de Seleccin de una Muestra al Azar

La clave de un procedimiento de muestreo es garantizar que la muestra sea


representativa de la poblacin, este muestreo puede ser probabilstica o
intencional Es probabilstica cuando todos los elementos de la poblacin tienen la
misma posibilidad de ser elegidos.
En cambio, intencional, es cuando el
investigador selecciona bajo un criterio la muestra.
La seleccin de esta muestra probabilstica se puede realizar por medio de los
siguientes mtodos:

Azar Simple
Este mtodo de seleccin permite que todos los elementos que constituyen la
poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo
es de gran importancia cuando la poblacin no es grande o siendo grande, este se
concentra en un rea pequea. Tambin cuando las caractersticas que se
investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin
para su seleccin.
Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son
obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una
muestra aleatoria simple de 200 personas, en este caso, la probabilidad de
seleccin de cada persona es:
n
200

P=

1000

= 0.2

Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y
30 profesionales.

Por Estratos
Para el muestreo estratificado se divide la poblacin en vanos grupos o estratos
con el fin de dar representatividad a los distintos factores que integran la poblacin
del estudio, la condicin de la estratificacin es la presencia en cada estrato de las
caractersticas que conforman la poblacin.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Este proces de estratificacin requiere que la poblacin sea dividida en grupos


homogneos donde cada elemento tiene una caracterstica tal que no le permite
pertenecer a otro estrato.
Para la seleccin de los elementos o unidades representantes de cada estrato se
utiliza el mtodo del muestreo aleatorio o al azar. Dentro de este muestreo
encontramos casos tres especiales:

Muestras de igual tamao. En este tipo de muestreo debe seleccionarse un


nmero igual de elementos en cada grupo mediante procedimiento al azar.

Muestreo proporcional. En este tipo el tamao de muestra por estrato se


escoge de tal forma que sea proporcional al tamao poblacional del mismo.

Afinacin ptima. Este mtodo utiliza la mejor subdivisin posible de una


muestra total, reparticin en todos los estratos, considerando tanto la variacin
como el tamao de cada estrato adems se tiene en cuota el costo de la
investigacin.

Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros, tcnicos


y profesionales son importantes para establecer comparaciones y se decide
escoger 80 de cada estrato. En este caso las probabilidades de seleccin seran,
por estrato, las siguientes:
Obreros
Tcnicos
Profesionales

80/600= 0,133
80/250= 0,32
80/150= 0,53

Donde se puede apreciar que la probabilidad de seleccin no es igual para todas


las personas, sino que depende del estrato en que stas se encuentran y as un
obrero tiene menor posibilidad de ser seleccionado que un profesional,
simplemente porque estos ltimos son menores.

Por Conglomerado
Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son
aplicables, ya que no se dispone de una lista con el numero de elementos de la
poblacin ni en los posibles estratos. En estos casos tpicamente los elementos de
la poblacin se encuentran de manera natural agrupados en conglomerados, cuyo
nmero si se conoce.
Por ejemplo la poblacin se distribuye en provincias, los habitantes de una ciudad
en barrios, etc. Si se supone que cada uno de estos conglomerados es una
muestra representativa de la poblacin total respecto a la variable que se estudia,
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

se puede seleccionar algunos de estos conglomerados al azar y dentro de ellos,


analizar todos sus elementos o una muestra aleatoria simple.
Ejemplo: se desea tomar una muestra de la poblacin colombiana para estudiar la
proporcin de personas que estn de acuerdo con la relaciones prematrimoniales;
si se supone que la edad y el sexo pueden influir en la opinin, se debera tomar
una muestra donde estas caractersticas sean las mismas que en la poblacin base,
lo que implica una muestra estratificada.

Sistematizada
Una forma prctica para seleccionar la muestra es hacerla en forma sistemtica,
escogiendo una muestra de cada intervalo, donde el intervalo se calcula as: K=
N/n; donde N es el tamao de la poblacin y n el de la muestra.
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene
2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4.
Para iniciar el proceso de seleccin sistemtica se escoge al azar un nmero entre
1 y 4, a partir del nmero seleccionado y cada 4 viviendas se hace una escogencia,
hasta completar la muestra.
1.1.5

Unidad Estadstica

Una vez identificada la poblacin y la muestra, se ubica la unidad estadstica, o sea


el objeto de la medicin. La unidad estadstica es el elemento del universo que
reporta la informacin (observacin) y sobre el cual se realiza un determinado
estudio (anlisis).

Dato
Hace referencia a la observacin particular, es decir, la informacin relacionada
con las caractersticas de cosas existentes que pueden ser recogidos, anotados u
observados

Variables
Es una dimensin o una caracterstica de una unidad de anlisis, dimensin que
adopta la forma de una clasificacin. Una variable se puede representar por un
smbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores;
dichas variables pueden ser:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Nominal: a veces conviene extender la nocin de variable a entidades no


numricas: es decir que relacionan un carcter, un nombre, una cualidad. Por
ejemplo, el color C de un arco iris es una variable que puede tomar los valores
rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible
sustituir tales variables por entidades numricas de la siguiente manera:
denotando el rojo como 1, el anaranjado como 2 etc.

Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores
ms altos se le asignan a los individuos que tienen ms de la caracterstica que
se mide.
Esto hace que necesariamente satisfaga la caracterstica de
diferenciacin pero en adicin introduce la posibilidad de ordenamiento.
Por ejemplo, en una competencia ciclstica se tiene en cuenta los cinco
primeros puestos para la premiacin.

Intervalo: en adicin a la clasificacin y ordenamiento se introduce la


posibilidad de establecer el ordenamiento con intervalos iguales.
Por ejemplo, la medicin de la temperatura la cual se puede hacer por medio
de un termmetro en grados Fahrenheit.

Variable Continua: es la variable que puede tomar cualquier valor entre dos
valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm,
1.80.

Variable Discreta: es la variable que solo puede tomar un determinado nmero


de valores enteros. El nmero N de hijos en una familia puede ser O, 1, 2, 3.

1.2

ESTADSTICA DESCRIPTIVA - DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias o tabla de frecuencia, es la disposicin tabular de los


datos por clases junto con las correspondientes frecuencias de clase. Para la
elaboracin de esta distribucin si los datos son cuantitativos, hay que tener en
cuenta los siguientes pasos:
1.2.1

Recoleccin de Datos

Es la base para cualquier estudio estadstico, es la toma de datos u observaciones;


estos se llevan a cabo mediante la recopilacin de los mismos sin ninguna
ordenacin de acuerdo a lo que se est investigando.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Por ejemplo la empresa Cuero Lindo recopil la informacin resultante de


encuestar 60 establecimientos pequeos, para estudiar sus ventas semanales en
miles de pesos, los resultados son:
40
22
28
19
24
28

17
33
28
35
20
11

26
24
33
23
31
34

10
20
22
28
29
39

26
28
25
22
18
10

21
14
29
15
19
25

18
30
29
34
11
17

27
25
29
13
23
21

16
29
21
16
20
34

38
37
32
26
24
18

Despus de tener dicha informacin, se procede a ordenarla; es decir, colocar los


datos numricos en orden creciente o decreciente. Existe un tipo de ordenacin y
se hacen generalmente en una tabla de distribucin de frecuencias. Para ello se
debe encontrar inicialmente el rango de la distribucin; que es la diferencia entre
el mayor y el menor dato obtenido. As:
R = Dm - dm, donde

R = rango
Dm = dato mayor
dm = dato menor

R= 40 - 10 = 30
1.2.2

Intervalos

Al resumir grandes colecciones de datos es til distribuidos en clases o categoras;


en cuanto al nmero de clases el investigador es autnomo para escoger el
nmero de intervalos para trabajar, sin embargo existe una frmula que se utiliza
como base o gua para indicar la cantidad de intervalos que se van a crear en la
tabla de frecuencias. Esta frmula esta determinada por:
m = 1 + 3.33 log n;
donde
m = 1 + 3.33 log 60 = 6.92

m = nmero de intervalos
n = tamao de la muestra

Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6


intervalos, pero se agregan dos ms que son: el intervalo menor que el dato
menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa
de computador.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

1.2.3

Amplitud

El rango nos ayuda a determinar la amplitud o el tamao de cada clase, siendo


esta una constante para cada intervalo. La amplitud indica la distancia que debe
tener cada clase.
La amplitud se puede determinar como el cociente entre el rango y el nmero de
intervalos.
A = R / m; donde A = amplitud
A = 30 / 6 = 5 miles de pesos
Para formar los intervalos de clase, si es utilizando un programa estadstico, se
parte del dato menor 10 y se le suma la amplitud, as, 10 + 5=15. Entonces el
primer grupo esta comprendido entre 10 y 15 miles de pesos.
El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15 y 20
miles de pesos. En forma similar se crean los dems intervalos, incluyendo los
intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos.
NMERO DE CLASES
1
2
3
4
5
6

INTERVALOS
- 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
40 -

Otra manera de formar los intervalos de clase es tomar un dato como medida de
referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor
de la amplitud:
NMERO DE
INTERVALOS
INTERVALOS
1
5 - 10
2
10 - 15
3
15 - 20
4
20 - 25
5
25 - 30
6
30 - 35
7
35 - 40
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

1.2.4

Frecuencia de Clase o Frecuencia Absoluta

Se determina el nmero de individuos que pertenecen a cada clase. Como cada


clase est formada por un intervalo, entonces se debe tomar como un intervalo
abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para
hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que
van a estar entre 25 - 30 son 26, 27, 28, 29 y 30.
Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para realizar el
conteo:
Nmero de
Establecimientos

Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

/
/////
////////////
/////////////
//////////////
////////
////
TOTAL

2
5
12
14
15
8
4
60

Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen ventas


semanales entre $15000 y $20000; las mayores ventas estn entre $25000 y
$30000, las menores ventas presentadas son de $10000, etc.
1.2.5

Marca de Clase (X)

Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior


y superior de cada clase.
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

X
7,5
12,5
17,5
22,5
27,5
32,5
37,5

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

X=

5+10
2

= 7,5

Miles de pesos; esto quiere decir que el promedio del primer intervalo es de
$7500.
Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia comn
entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos.
1.2.6

Frecuencia Relativa (Fr)

Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa


generalmente como un porcentaje.
F
Fr =
n
La frecuencia relativa del primer intervalo es 0.0333. Este valor se obtuvo de la
relacin entre 2/60 = 0.0333; significa que el 3.33% de los establecimientos tienen
ventas menores de $10000. Este porcentaje se obtiene al multiplicar por 100 el
resultado obtenido.
De igual manera, la frecuencia relativa del segundo intervalo es de 0.0833, que
significa que el 8.33% de los establecimientos tienen ventas entre $10000 a
$15000.
1.2.7

Frecuencia Acumulada (Fa)

Es la acumulacin ascendente o descendente (de la primera a la ltima clase o


viceversa) de frecuencias absolutas. La frecuencia acumulada descendente se
obtiene de la siguiente manera:

La primera frecuencia acumulada corresponde a la primera frecuencia absoluta.


La segunda acumulada se obtiene sumando las dos primeras absolutas, es
decir, 2+5 = 7.
La tercera acumulada se obtiene de sumar 7 + 12 = 19 y as sucesivamente.

La frecuencia acumulada ascendente se obtiene as: se inicia por la frecuencia


absoluta del ltimo intervalo; en este caso 4. La siguiente es sumar esta
frecuencia acumulada con la anterior: 4+8 = 12. La que sigue sera 4 + 8 = 12 y
as sucesivamente.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Intervalos

5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

2
5
12
14
15
8
4

Fa
2
7
19
33
48
56
60

60
58
53
41
27
12
4

El significado de este cuadro es el siguiente: si tomamos el tercer grupo


descendente, su frecuencia acumulada, significa que 19 establecimientos tienen
ventas semanales entre $10000 y $20000 o inferiores a $20000. Y si tomamos el
segundo grupo ascendente, quiere decir que 12 establecimientos tienen ventas
semanales entre $30000 y $40000 o mayores a $30000.
1.2.8

Frecuencia Relativa Acumulada (Fra)

Es la acumulacin sucesiva en forma ascendente o descendente de frecuencias


relativas. La primera frecuencia relativa acumulada corresponde a la primera
frecuencia relativa. La segunda, se obtiene sumando las dos primeras frecuencias
relativas, es decir, 0,0333 + 0,0833 = 0,1167 y as sucesivamente. La frecuencia
relativa acumulada ascendente se obtiene as: se inicia por la frecuencia relativa
del ltimo intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia
acumulada con la anterior 0,0667 + 0,1333 = 0,2 y as sucesivamente.
Intervalo

Fr

5 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40

0.0333
0.0833
0.2
0.2333
0.25
0.1333
0.0667

Fra
0.0333
0.1167
0.3167
0.55
0.8
0.9333
1

1
0.9666
0.8833
0.6833
0.45
0.2
0.0667

Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo significado es


que el 80% de los establecimientos tienen ventas semanales menores a $30000; si
tomamos el grupo 4 ascendente su acumulado ser del 0,6833, esto significa que
el 68.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Intervalo

Fr

5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

2
5
12
14
15
8
4
60

0,0333
0,0833
0,2
0,2333
0,25
0,1333
0,0667
1,00

Fa
2
7
19
33
48
56
60

Fra
60
58
53
41
27
12
4

0,0333
0,1167
0,3167
0,55
0,8
0,9333
1

1
0,9666
0,8833
0,6833
0,45
0,2
0,0667

La tabla presenta el resumen de la clasificacin de los 60 establecimientos


analizados por los investigadores de la empresa Cuero Lindo, esto significa que se
ha organizado la informacin.

Proceso de Comprensin y Anlisis

Decir de las siguientes variables cules son continuas y cules son discretas

La altura de las personas


La medida de la cantidad de lluvia cada en una localidad en un mes
La edad de las personas, en aos cumplidos
El nmero de alumnos de cada curso de un colegio

Por qu es til la estadstica en el campo para el cual se est preparando.

La Estadstica estudia el comportamiento de fenmenos colectivos y nunca de


una observacin individual comentar este principio.

Clasificar a que tipo de estadstica pertenecen los siguientes tems:

Realizar un inventario
Determinar la demanda de un producto
La posibilidad que llueva en una ciudad determinada
El porcentaje de desempleo en una ciudad especfica
El promedio de las acciones vendidas en la bolsa de valores en una empresa en
un mes determinado
El aumento del ndice de precios al consumidor en un mes especfico
El aumento del costo de vida en un mes especfico
El nmero de accidentes ocurridos en una ciudad determinada
Las ventas de un almacn en un mes determinado

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

El aumento de costos de produccin con respecto al mismo mes del ao


anterior.

Dar un ejemplo donde se aplique la estadstica en los siguientes campos:

Agricultura
Biologa
Negocios
Qumica
Comunicaciones
Finanzas
Economa
Educacin
Electrnica

Responder a los siguientes enunciados:

Qu significan las variaciones en los precios de los artculos al consumidor?


Cree que cualquier investigacin requiere informacin estadstica?
Cules son las funciones del Departamento Administrativo Nacional de
Estadstica (DANE)?

Las calificaciones finales de 80 estudiantes son:

68
84
75
82
68
90
62
88

93
60
73
88
79
73
93
76

71
59
85
75
61
65
75
87

Educacin
Electrnica
Medicina
Fsica
Mercadeo
Ciencias polticas
Psicologa
Medicina
Fsica

78
66
72
63
78
95
62
74

82
75
94
77
69
74
68
60

79
60
95
75
61
89
78
96

83
71
79
62
67
97
78
85

57
73
80
65
75
71
65
76

88
78
62
76
53
74
86
67

Mercadeo
Ciencias polticas
Psicologa
Ingeniera
Administracin
Produccin
Sociologa

77
85
75
76
63
72
81
73

Hallar:

La calificacin ms alta
La calificacin ms baja
El rango
Las cinco notas ms altas
Las cinco notas ms bajas
La dcima nota de mayor a menor
La tabla de frecuencias utilizando 7 intervalos

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Comprobar que la amplitud de los intervalos es de 6.29


El nmero de estudiantes de 79 o ms
El nmero de estudiantes con calificaciones por debajo de 71
El porcentaje de estudiantes con calificaciones mayores de 65 pero no
superiores a 85.
Cul es el significado del 91.25%?
Cul es el significado del 33.75%?
En una empresa se investig una muestra de 56 empleados para determinar su
salario mensual en miles de pesos. Los resultados fueron los siguientes:
987
1173
1330
1331
1240
984
1055

1176
1233
1024
1000
932
1234
1104

1233
985
1079
1032
1358
1324
1343

1248
1093
1690
1229
614
918
1202

944
1310
1262
1385
1022
1067
759

1105
824
956
1252
1404
1203
1024

1243
1185
816
972
1415
827
905

1109
1157
1220
1381
1303
1209
1490

Crear la tabla de frecuencias con siete intervalos y comprobar que su amplitud


es de 153.71 e interpretar cada uno de los siguientes valores en la
clasificacin:
X4
Fr6
Fa2
F5
Fra 4
n
Fa 3
Fra 5
Fr 2

Responder:

Cuntos empleados tienen un salario inferior a $1'382.000?


Qu porcentaje de empleados tienen un salario superior a $1'228.000?
Cuntos empleados tienen un salario entre $921.000 y $1'075.000?
Qu porcentaje de empleados tienen un salario entre $1'228.000 y
$1'382.000?

En la tabla que sigue se recogen los pesos de 40 estudiantes varones de una


universidad con precisin de 1 Kilo, construir una distribucin de frecuencias
con 5 intervalos y establecer las conclusiones ms importantes.
69
82
75
66

72
84
73
80

62
63
86
72

74
69
71
67

78
88
73
71

73
81
67
75

79
99
76
78

70
77
70
72

73
82
67
64

68
74
76
72

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

La siguiente tabla muestra una distribucin de frecuencia de los salarios


semanales de 65 empleados de la empresa P & R.
SALARIOS
$250.000 - $260.000
$260.000 - $270.000
$270.00 - $280.000
$280.000 - $290.000
$290.000 - $300.000
$300.000 - $310.000
$310.000 - $320.000
Total

NMERO DE EMPLEADOS
8
10
16
14
10
5
2
65

Determinar de la tabla de frecuencias:

El lmite inferior de la sexta clase.


El lmite superior de la cuarta clase.
La marca de clase o punto medio de la tercera clase.
La anchura del quinto intervalo de clase.
La frecuencia de la tercera clase.
El intervalo de clase con mxima frecuencia.
El porcentaje de empleados que cobran menos o igual de $280.000 a la
semana.
El porcentaje de empleados que cobran igual o menos de $300.000 pero al
menos $260.000 por semana.

Si las marcas de clase en una distribucin de frecuencias de pesos de


estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras. Hallar:

La anchura del intervalo de clase.


Los lmites de clase, suponiendo que los pesos se midieron con 1 libra de
precisin.

La menor de 150 medidas es 5,18 m y la mayor 7.44 m.

Determinar un conjunto apropiado de intervalos de clase.


Marcas de clase que puedan usarse para formar la distribucin de frecuencia
de esas medidas.

La siguiente tabla muestra una distribucin de frecuencias de las vidas medias


de 400 vlvulas de radio probadas en la empresa L & M.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA
VIDA MEDIA (Horas)
300 - 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
Total

NMERO DE TUBOS
14
46
58
76
68
62
48
22
6
400

Determinar de la tabla de frecuencias:

El lmite superior de la quinta clase.


El lmite inferior de la octava clase.
La marca de clase de la sptima clase.
La anchura de intervalos de clase.
La frecuencia de la cuarta clase.
La frecuencia relativa de la sexta clase.
Porcentaje de tubos cuya vida media no pasa de 600 horas.
Porcentaje de tubos cuya vida media es mayor de 900 horas.
Porcentaje de tubos cuya vida media es de al menos 501 horas, pero menor o
igual que 1000 horas.

Los dimetros internos de los tubos fabricados por una empresa se miden con
precisin de milsima de pulgada. Si las marcas de clase de una distribucin
de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33,
0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase.

La tabla adjunta muestra los dimetros en centmetros de una muestra de 60


bolas de cojinete manufacturadas por una fbrica. Construir una distribucin
de frecuencias con intervalos de clase apropiados y establecer las conclusiones
respectivas.
1.738
1.735
1.736
1.739
1.728
1.733
1.738
1.735
1.736
1.735

1.729
1.731
1.735
1.735
1.738
1.730
1.729
1.727
1.744
1.735

1.743
1.726
1.724
1.745
1.725
1.732
1.727
1.734
1.732
1.729

1.740
1.737
1.733
1.736
1.733
1.730
1.735
1.732
1.737
1.734

1.736
1.728
1.742
1.742
1.734
1.739
1.735
1.736
1.731
1.730

1.741
1.737
1.736
1.740
1.732
1.734
1.732
1.741
1.746
1.740

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 2: Medidas de Tendencia


Central
Ncleos Temticos y Problemticos

Primer Caso: Cuando los Datos no Estn Agrupados


Segundo Caso: Cuando los Datos Estn Agrupados

Proceso de Informacin
Las medidas de centralizacin son valores que tienden a situarse en el centro del
conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin
ms usadas son: Media aritmtica, mediana y moda.
La media aritmtica es la medida de tendencia central ms conocida, es fcil de
calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de
intervalos ya sean discretos o continuos. Esta medida se define como la suma de
todos los valores observados dividido por el nmero de observaciones, es decir
encontrar el promedio de los datos en estudio.
La mediana se define como la medida de tendencia central que divide a cualquier
distribucin en dos partes iguales. Esta medida se puede aplicar a variables de
intervalos (discretas y continuas) y variables ordinales.
La moda de una distribucin se define como el valor que presenta la mayor
frecuencia, se usa con variables de intervalos nominales y ordinales.
Es
comnmente utilizada como una medida de popularidad que refleja la tendencia de
una opinin.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

2.1

PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS

2.1.1

Media Aritmtica

La media aritmtica de un conjunto de n nmeros x1, x2, X3..., Xn, se representa


por x y se define como:
n

X=

X1 + X2 + X3 + Xn
=

xi
i=1

n
Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la
media aritmtica se puede calcular del modo siguiente:
n

X=

f1X1 +f2X2 + f3X3 + ....+fnXn


f1+f2+f3++fn

fixi
=

i=1
n

fi
i=1

En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso
determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media
aritmtica ponderada del modo siguiente:
n

X=

w1x1 +w2x2 + w3x3 + ....+wnnn wixi


w1+w2+w3+..+wn

i=1
n

wi
i=1

Ejemplo

Hallar la media aritmtica del puntaje obtenido por 5 estudiantes en una


prueba: 6, 4, 3, 7, 8.

6+4+3+7+8
28
x = =5,6
5
5

Este es el puntaje promedio de los 5


estudiantes

Hallar la media aritmtica de los siguientes datos que representan las edades
de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

3*6+4*4+2*3+1*7
47
x= = 4,7
3+4+2+1
10
El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos.

Un estudiante ha obtenido las calificaciones siguientes:


Asignatura
Historia
Qumica
Fsica
Matemtica
Biologa
Geologa
Dibujo
Idioma
filosofa

Nota
8
7
3
6
5
6
5
7
4

Peso
1
3
3
3
3
2
2
2
1

Calculando su nota media ponderada:


1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4

X=

1+3+3+3+3+2+2+2+1
111

X=

= 5,55
20

Por lo tanto el promedio de las notas del estudiante es de 5,55


2.1.2

Mediana

La mediana es una serie de datos ordenados en orden de magnitud, es el valor


medio si el nmero de datos es impar o bien la media aritmtica de los valores
medios si el nmero de datos es par.

Ejemplo

Hallar la mediana de los siguientes datos que corresponden a la venta de leche


en un expendio durante los ltimos 7 das:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

27800
43850
27800

43850

54300
60500
54300

60800
54350

54350

73200

60500

60800

73200

Md = 54350. El precio de la venta de leche que se encuentra en la mitad de los


precios es de $54350.

Hallar el valor de la mediana para los siguientes puntajes de las pruebas


ICFES: 304, 283,332, 344;295, 339.
283

295

304

332

339

344

304+332
Md =

= 318

2
El puntaje de las pruebas que se encuentra en la mitad es de 318.
2.1.3

Moda

La moda no puede ser nica e incluso puede no existir.

Ejemplo

En una encuesta realizada sobre los deportes que se practican en un grado


determinado de un Colegio de Varones, se presentan los siguientes resultados:
Deporte
Basket
Ftbol
Voleibol
Otros

N de Alumnos
10
18
5
4

La moda en este caso es el Ftbol, puesto que la mayora de los alumnos lo


prefieren.

Se le ha preguntado a un grupo de personas acerca del color preferido por


ellas y se obtuvo lo siguiente:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Color
Blanco
Gris
Azul
Negro
Rojo
Morado
Caf
Vinotinto

Numero de Personas
4
8
9
4
3
2
8
8

Lo cual indica que los colores que pueden estar de moda son el gris, caf y
vinotinto.

Hallar la moda de los nmeros 2, 3, 4, 5, 6, 7, 8; como ningn nmero se


repite ms que los otros, por consiguiente no hay moda.

2.2

SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS

2.2.1

Media Aritmtica
n

X=

x i fi

i=1

Ejemplo

Hallar la media aritmtica de las ventas de los sesenta establecimientos:


Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
40 Total

F
2
5
12
14
15
8
4
0
60

X
7.5
12.5
17.5
22.5
27.5
32.5
37.5

X*F
15
62.5
210
315
412.5
260
150
0
1425

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

X=

1425
= 23,7 = 24
60

Las ventas promedio de los sesenta establecimientos son de $24000.

Hallar el valor promedio para la distribucin correspondiente a las notas


obtenidas por 40 estudiantes en una prueba estadstica:
Intervalos
10 - 19.6
19.6 - 29.2
29.2 - 38.8
38.8 - 48.4
48.4 - 58
58 - 67.6
Total

X=

1532.8

F
10
3
7
7
5
8
40

X
14.8
24.4
34
43.6
53.2
62.8

X*F
148
73.2
238
305.2
266
502.4
1532.8

= 38.3 = 38

40
El puntaje promedio de los 40 alumnos es de 38.
2.2.2

Mediana

Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos:

Ubicar el intervalo donde quede la frecuencia correspondiente a la mitad del


tamao de la muestra.
Encontrar el valor del lmite real inferior del intervalo dnde est.
Aplicar la siguiente frmula:

Md = li +

n _ Fa
2
F n/2

A; donde:

li :es el lmite real inferior donde est la F n/2


Fa es la sumatoria de frecuencias anteriores
a n/2
F n/2 es la frecuencia donde est n/2
A es la amplitud del intervalo

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Ejemplo

Encontrar la mediana de las ventas de los sesenta establecimientos:


Intervalos
5 - 10
10 15
15 20
20 - 25
25 - 30
30 - 35
35 - 40
TOTAL

F
2
5
12
14
15
8
4
60

$24.000 corresponde a la venta que est en la mitad.

Encontrar la mediana de la distribucin correspondiente a las notas obtenidas


por 40 estudiantes en una prueba estadstica

Intervalos
10 - 19.6
19.6 - 29.2
29.2 - 38.8
38.8 - 48.4
48.4 - 58
58 67.6
Total

F
10
3
7
7
5
8
40

La nota que est en la mitad en esta distribucin es Moda.


2.2.3

Moda

Se debe ubicar el intervalo donde est la mayor frecuencia, y despus se aplica la


siguiente frmula:

Li es el lmite real inferior donde est la moda.

, 1es la diferencia entre la frecuencia modal y la frecuencia inmediatamente


anterior.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

2 es la diferencia entre la frecuencia modal y la frecuencia inmediatamente


posterior.

A es la amplitud del intervalo.

Ejemplo

Encontrar la moda de las ventas de los sesenta establecimientos:


Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

F
2
5
12
14
15
8
4
60

Encontrar la moda de la distribucin correspondiente a las notas obtenidas por


40 estudiantes
Intervalo
10-19.6
19.6-29.2
29.2-38.8
38.8-48.4
48.4-58
58-67.6
Total

F
10
3
7
7
5
8
40

Proceso de Comprensin y Anlisis

Supngase que en un viaje, un automovilista hace las siguientes compras de


gasolina. 10 galones a $2500 c/u, 8 galones a $2550 c/u, 15 galones a $2600
c/u y 12 galones $2480 c/u. Cul sera el costo medio por galn?.

La siguiente tabla muestra los salarios mensuales en miles de pesos de 144


empleados de una empresa:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA
Salarios
540 - 607
607 - 674
674 - 741
741 - 808
808 - 875
875 - 942
942 - 1009
1009 - 1076
Total

F
6
19
36
24
26
19
10
4
144

Encontrar la media, la moda y la mediana.

Diez medidas del dimetro de un cilindro fueron anotadas por un cientfico


como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros;
hallar la media aritmtica de tales medidas.

De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los
restantes sietes. Hallar la media aritmtica, la media y la moda.

De los 80 empleados de una empresa, 60 cobran $7000 a la hora y el resto


$4000 a la hora. Hallar cunto cobran la media por hora.

Usar la distribucin de frecuencias para hallar la altura media, la altura que


ms se repite y la altura que se encuentra en la mitad de 100 estudiantes.
Altura (m)
1.60 - 1.63
1.63 - 1.66
1.66 - 1.69
1.69 - 1.72
1.72 - 1.75
Total

F
5
18
42
27
8
100

Hallar la media, mediana y moda de los pesos de 40 estudiantes de la siguiente


tabla:
PESO (Lb)
118 - 126
126 134
134 142
142 150
150 - 158
158 - 166
166 - 174
Total

F
3
5
9
12
5
4
2
40

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Los tipos de reaccin de un individuo ante diversos estmulos, medidos por un


psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos
respectivamente. Determinar su tiempo medio de reaccin.

La siguiente tabla muestra la distribucin de cargas mximas en toneladas


cortas que soportan los cables producidos en cierta fbrica. Determinar la
carga mxima media, la carga mxima que se repite y la carga que ms se
repite.
Carga Mxima
(Toneladas Cortas)
9.3 - 9.7
9.7 - 10.1
10.1 - 10.5
10.5 - 10.9
10.9 - 11.3
11.3 - 11.7
11.7 - 12.1
Total

F
2
5
12
17
14
6
4
60

La siguiente tabla muestra el nmero de bodas en Colombia para hombres y


mujeres de distintos grupos de edad durante 1984.

Hallar la media, mediana y moda tanto para hombres como para mujeres,
estableciendo las respectivas conclusiones.
Edad
(aos)
15 - 19
19 - 23
23 - 27
27 - 31
31 - 35
35 - 39
39 - 43
43 - 47
47 - 51

Hombres
(Miles)
121
2.441
5.930
6.587
11.788
9.049
8.749
5.786
2.581

Mujeres
(Miles)
481
4.184
6.952
7.193
11.893
9.022
8.171
4.654
1.524

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 3: Medidas de dispersin


Ncleos Temticos y Problemticos

Desviacin Estndar o Tpica


Varianza
Coeficiente de Variacin

Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de los datos
numricos alrededor de una medida de centralizacin. Las medidas de dispersin
ms utilizadas son:
3.1

DESVIACIN ESTNDAR O TPICA

Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los
datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X1,
x2, x3,.....xn est determinada por:

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la poblacin.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Si los datos estn agrupados, la desviacin estndar viene dada por:

Las anteriores frmulas se utilizan cuando se trabaja con la muestra.

Ejemplo

Hallar la desviacin estndar del puntaje obtenido por 4 estudiantes en una


prueba: 6 4, 3, 7. 8.

X=

5.6

Hallar la desviacin estndar de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3,


3, 7.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Hallar la desviacin estndar de las ventas de los sesenta establecimientos x =


24.
Intervalos
5 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

3.2

F
2
5
12
14
15
8
4
60

X
7.5
12.5
17.5
22.5
27.5
32.5
37.5

(X-x)2 F
544.5
661.25
507
31.5
183.75
578
729
3235

VARIANZA

Esta es la medida de variacin ms importante, ya que se obtiene a partir de la


media aritmtica de una distribucin. La varianza seala la distancia promedio de
cualquier observacin en el conjunto de datos. La varianza de un conjunto de
datos se define como el cuadrado de la desviacin tpica.
La varianza es una medida de dispersin, en la cual, las unidades son los
cuadrados de las unidades de los datos, es decir, pesos cuadrados, personas
cuadradas, etc., y por esto no son expresiones fciles de interpretar.
Si los datos no estn agrupados, la varianza de una serie de nmeros n: x1, x2,
x3........ Xn est determinada por:

Si los datos estn agrupados, la varianza viene dada por:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Ejemplo

Hallar la varianza del puntaje de 5 estudiantes: 6, 4, 3, 7, 8.

Hallar la varianza de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3. 7.

X = 4.7

18.1
S2 = = 1.81
10

Hallar la varianza de las ventas de los sesenta establecimientos: X = 24


Intervalos
5 10
10 15
15 20
20 25
25 30
30 - 35
35 - 40
Total

F
2
5
12
14
15
8
4
60

X
7.5
12.5
17.5
22.5
27.5
32.5
37.5

(X-x)2 F
544.5
661.25
507
31.5
183.75
578
729
3235

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

3235
S2 = = 53.9
60
3.3

COEFICIENTE DE VARIACIN

Esta medida relaciona la desviacin estndar y la media, para expresar la variacin


de la desviacin con respecto a la media aritmtica. Este coeficiente de variacin
se acostumbra expresarlo en porcentaje.
S
La frmula que se utiliza es: cv = * 100
X
El coeficiente de variacin es una medida muy utilizada en control de calidad. Para
estos casos, generalmente existen especificaciones que limitan el coeficiente de
variacin. Tambin nos sirve para determinar la homogeneidad de la informacin,
es decir, si el coeficiente de variacin es pequeo la informacin es homognea y
si el coeficiente de variacin es grande la informacin es heterognea.

Ejemplo

Hallar el coeficiente de variacin de 6, 4, 3, 7, 8


X = 5.6 S = 1.34
Cv = 23.9%
Este porcentaje indica cmo se distribuye la desviacin estndar con respecto a
la media a travs de los datos.

Hallar el coeficiente de variacin de las ventas de los sesenta establecimientos


y obtener conclusiones.
X = 24

S = 7.3

7.3
Cv = *100
24
Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta
establecimientos son homogneas.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Si el trabajador A produce por hora 40 tornillos en promedio, con desviacin de


5 tornillos y el trabajador B produce 180 tornillos en promedio con desviacin
de 15, cul de los trabajadores presenta menor variabilidad?

5
CVA = *100 = 12.5% para el operador A
40
15
CVB = *100 = 9.4% Para el operador B
180
Esto significa que el operador B, quien tiene mayor desviacin en la produccin,
presenta menor variacin, porque la media de produccin para el operador B es
mucho mayor que la del operador A.

Proceso de Comprensin y Anlisis

Hallar la desviacin estndar y la varianza de los puntos obtenidos asignados a


8 nios en un juego: 12, 6, 7, 3, 15, 10 18 y 5.

Hallar la desviacin estndar y la varianza en la compra de cremas dentales:


$9.345, $3.850, $8.235, $8.000, $9.578, $8.560, $9.234, y 18.456.

Hallar la desviacin estndar de las alturas de los estudiantes de acuerdo a la


siguiente tabla:
Altura (m)
1.60 1.63
1.63 1.66
1.66 1.69
1.69 1.72
1.72 1.75
Total

F
5
18
42
27
8
100

Hallar la desviacin estndar de la distribucin de salarios de la siguiente tabla:


SALARIOS
$250.000 - $260.000
$260.000 - $270.000
$270.000 - $280.000
$280.000 - $290.000

NM. EMPLEADOS
8
10
16
14

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

SALARIOS
$290.000 - $300.000

NM. EMPLEADOS

$300.000 - $310.000

$310.000 - $320.000
Total

2
65

10

La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480 nios de


una escuela elemental. Hallar la desviacin estndar:
F
4
9
16
28
45
66
85
72
54
38
27
18
11
5
2

X
70
74
78
82
86
90
94
98
102
106
110
114
118
122
126

Un fabricante de tubos de televisin produce dos tipos de tubos A y B, que


tienen vidas medias respectivas: xA = 1495 horas y xB = 1875 horas y
desviacin tpica de SA = 280 horas y SB = 310 horas. Qu tipo de tubo tiene
mayor dispersin?

En un examen final de Estadstica, la puntuacin media de 150 estudiantes fue


de 78 y la desviacin estndar 8. En lgebra la media fue de 73 y la
desviacin estndar 7.6. En qu materia fue mayor la dispersin?.

Hallar la desviacin estndar y el coeficiente de variacin para los datos de la


siguiente tabla:
Carga Mxima
(Toneladas Cortas)
9.3 - 9.7
9.7 10.1
10.1 - 10.5
10.5 - 10.9

F
2
5
12
17

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA
Carga Mxima
(Toneladas Cortas)
10.9 - 11.3
11.3 - 11.7

14
6

11.7 - 12.1

Total

60

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 4: Medidas de Ubicacin


Ncleos Temticos y Problemticos

Cuartiles, Percentiles y Deciles


Diagramas de Caja

Proceso de Informacin
4.1

CUARTILES, PERCENTILES, DECILES

Si un conjunto de datos est ordenado por magnitud, el valor central que divide al
conjunto en dos mitades iguales, es la mediana.
Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados
primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.
Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman
deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.
Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles,
denotados por P1 P2,.....P99. El P50 coincide con la mediana.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Si los datos no estn agrupados, se deben ordenar en forma ascendente o


descendente y ubicar el dato que est en la posicin n * p :donde,
q
q = 4, 10, 100
p = Nmero a la ubicacin al que se desea referir
n = Total de datos

Ejemplo

Con los siguientes datos ubicar el que corresponde a:

Al primer cuartil
Al tercer decil
Al percentil 80
12
3
n*p

8
4

5
5

10
6

11
8

4
10

6
11

3
12

8*1

Q1 = = = 2
q
4
El dato que est en el primer cuartil es 4, ya que est en la segunda posicin.
n*p

8*3

D3 = = = 2.4 2
q
10
El dato que est en el tercer decil es 4, ya que est en la segunda posicin.
P80

n*p
8 * 80
= = = 6.4 6
q
100

El dato que est en el percentil 80 es 10, ya que este valor est en la sexta
posicin.
Cuando los datos estn agrupados, utilizamos la misma frmula de la mediana y
reemplazamos donde est n/2 por n * p; el lmite inferior es donde est la F (n*p)/q
q

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Donde U hace referencia a la medida de ubicacin, li es


el limite inferior donde est F(n*p)/q

Ejemplo

En las ventas de los sesenta establecimientos encontrar:

El primer, segundo y tercer cuartil


El primer, quinto y el sexto decil
El percentil doce, cincuenta y ochenta

Para encontrar estas medidas, primero hay que encontrar


intervalo correspondiente a esta posicin.

n*p

para ubicar el

El Primer, Segundo y Tercer Cuartil


Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

F
2
5
12
14
15
8
4
60

n = 60
p=1
q=4
n*p = 60*1 = 15
q
4
Li= 15
Fa = 7
F (n*p)/q = 12
A=5
De donde el 25% de las ventas de los 60
establecimientos es de $18000 o menos.

Intervalo n = 60
F
5 - 10 p = 2 2
10 - 15 q = 4 5
15 - 20 n*p 12
= 60*2 = 30
20 - 25 q 14 4
25 - 30 Li= 20
15
30 - 35 Fa =819
35 - 40 F (n*p)/q4 = 14
Total A = 560
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Donde el 50% de las ventas de los 60


establecimientos es de $24000 o menos.

Intervalosn = 60F
5 - 10 p = 3 2
10 - 15 q = 4 5
15 - 20 n*p =1260*3 = 45
20 - 25 q 14 4
25 - 30 Li= 2515
30 - 35 Fa = 833
35 - 40 F (n*p)/q4= 15
Total A = 560
Por lo tanto el 75% de las ventas de los 60
establecimientos es de $29000 o menos

El Primer, Quinto y el Sexto Decil


Intervalosn = 60F
5 - 10 p = 1 2
10 - 15 q = 105
15 - 20 n*p =1260*1 = 6
20 - 25 q 14 10
25 - 30 Li= 1015
30 - 35 Fa = 82
35 - 40 F (n*p)/q4= 5
Total A = 560

El 10% de las ventas es de $9000 o menos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Intervalosn = 60
F
5 10 p = 5 2
10 - 15 q = 10
5
15 - 20 n*p 12
= 60*5 = 30
20 - 25 q 14 10
25 - 30 Li= 20
15
30 - 35 Fa =819
35 - 40 F (n*p)/q4 = 14
Total A = 560
El 50% de las ventas es de $24000 o
menos
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

n=F
60
2
p=6
q=5
10
n*p12= 60*6 = 36
q 14 10
Li= 15
25
8 33
Fa =
4 = 15
F (n*p)/q
60
A=5

Y el 60% de las ventas es de $26000 o menos.

El Percentil Doce, Cincuenta y Ochenta


Intervalo
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

F
2
5
12
14
15
8
4
60

n = 60
p = 12
q = 100
n*p = 60*12 = 7.2 = 7
q
100
Li= 10
Fa = 2
F (n*p)/q = 5
A=5

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

P12= 10+

60*12
-2
100

5 = 15.2 15

Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o


menos.
Intervalos
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

n =F60
p =250
q =5100
n*p12= 60*50 = 30
q14
100
15
Li= 20
Fa8= 19
4 = 14
F (n*p)/q
60
A=5

P50= 20+

60*50
-19
5 = 23.9 24
100

14

El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.


Intervalo
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
Total

n =F 60
p =2 80
q =5 100
n*p
12 = 60*80 = 48
q14
100
Li=1525
Fa8 = 33
F (n*p)/q
4 = 15
A=
605
Y el 80% de los establecimientos tienen ventas
de $30.000 o menos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

4.2

DIAGRAMAS DE CAJA

Es una representacin del diagrama de una distribucin construida para mostrar


sus caractersticas principales y sealar los posibles datos atpicos, es decir,
aquellas observaciones que parecen ser distintas de las dems. Su principal
utilidad es para depurar informacin puesto que se pueden eliminar los datos de
mayor variacin en los extremos. Un diagrama de caja se construye as:

Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres
cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala
adecuada.

Dibujar un rectngulo cuyos extremos son Q1 y Q3.

Calcular unos limites admisibles superior e inferior que van a servir para
identificar los valores atpicos. Estos lmites se calculan con :
Li = Q1-1.5

Q3 Q1

Li = Q3 +1.5

Q3 Q1

Considerar como valores atpicos los situados fuera del intervalo (li, Ls).

Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el
valor ms alejado no atpico, es decir, que est dentro del intervalo (li, ls).

Identificar todos los datos que estn fuera del intervalo (li, ls) marcndolos
como atpicos.

Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado
en 2001 y 2002 en varias ciudades colombianas:
A
B
C
D
E
F
G
H
I

2001
248
208
113
128
106
118
60
79
55

2002
221
171
131
89
101
33
63
56

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA
2001
47
88
47
58
82
33

J
K
L
M
N
O

2002
54
55
69
59
48
16

Construir el diagrama de cajas correspondiente a la tabla dada.

Para 2001
El primer paso es ordenar la informacin de mayor a menor:
33 47 47 55 58 60 79 82 88 106 113 118 128 208 248
Luego se encuentran los tres cuartiles:
El 25% de ciudades tienen 55 das o menos de
contaminacin o el 25% de las ciudades de EEUU
tienen entre 33 y 55 das de contaminacin.

15*1
Q1 = = 3.75 4
4
15*2
Q2 = = 7.5 8
4

El 50% de ciudades tienen 82 das o menos de


contaminacin

15*3
Q3 = = 11.25 11
4

El 75% de ciudades tienen 113 das o


menos de contaminacin.

Por tanto los lmites admisibles son:


Li = 55 1,5

Ls = 113 + 1,5

113 55

2
113 - 55

= 11,5

= 156,5

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Como todos los valores son superiores al lmite inferior, la lnea inferior del
diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta
direccin.

2001

Este diagrama de caja, muestra que la mayor parte de las observaciones son
menores que 113 y que el extremo superior de 248 est muy alejado del grupo
principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud
del diagrama completo (248 - 33 = 215).

Para 2002
16 33 48 54 55 56 59 63 69 89 101 131 171 221
14*1
Q1= = 3.75 4
4
14*2
Q2= = 7
4

El 25% de ciudades tienen 55


das o menos de contaminacin.

El 25% de ciudades tienen 59 das


o menos de contaminacin.

14*3
Q3= = 10.5 11
4

El 25% de ciudades tienen 101


das o menos de contaminacin.

Li = 55 1,5

Ls = 101 + 1,5

101 - 55

2
101 - 55

= 20.5

= 135.5

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

2002

Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de
datos.

2001

2002

Ntese como los datos tienden a concentrarse ms y ms hacia el extremo inferior


de la escala, excepto el extremo alto, el cual permaneci alto durante los dos aos.

Proceso de Comprensin y Anlisis

En la siguiente tabla que relaciona las alturas de 100 estudiantes, determinar el


primer, el segundo y tercer cuartil y realizar el grfico correspondiente:
Altura (m)
1.60 - 1.63
1.63 - 1.66
1.66 - 1.69
1.69 - 1.72
1.72 - 1.75
Total

F
5
18
42
27
8
100

Hallar en la siguiente tabla para los salarios en miles de pesos de 144


empleados de una empresa:
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

El primer cuartil
El quinto y octavo decil
El percentil 10 y el percentil 45
Salario
540 - 607
607 - 674
674 - 741
741 - 808
808 - 875
875 942
942 - 1009
1009 - 1076
Total

F
6
19
36
24
26
19
10
4
144

Encontrar el primer, segundo y tercer cuartil de la siguiente tabla que relaciona


los pesos de 40 personas y realizar el grfico correspondiente:
Peso (Lb)
118 - 126
126 - 134
134 - 142
142 - 150
150 - 158
158 - 166
166 174
Total

F
3
5
9
12
5
4
2
40

Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92,
3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar:

El primer y tercer cuartil


El cuarto, el sexto y noveno decil
El percentil 48 y el percentil 10

La siguiente tabla muestra una distribucin de frecuencias de las vidas medias


de 400 vlvulas de radio probadas en la empresa L & M.
Encontrar:

El primer, segundo, tercer cuartil y su respectiva grfica


El segundo, cuarto y sexto decil.
El cincuenta percentil.
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Vida Media
300 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
Total

Nmero
de Tubos
14
46
58
76
68
62
48
22
6
400

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIDAD 5: Presentacin de la
Informacin
Ncleos Temticos y Problemticos

Histograma
Polgonos de Frecuencia
Ojivas
Barras

Proceso de Informacin
Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en
trminos de magnitudes, para interpretarlos en forma visual.
Presentar la informacin de la tabla de frecuencias por medio de grficas sirve
para reforzar las conclusiones que se determinan de esta tabla. Estas grficas se
pueden utilizar para:

Evaluar resultados de un proceso.


Presentar resultados de una investigacin.

Para la elaboracin de un grfico hay que tener en cuenta:

Ttulo: indica la descripcin del contenido de la grfica, es decir, indica el


fenmeno de estudio. Por ejemplo, Produccin de caf en Colombia en el
perodo 1995 - 1997.

Diagrama: es empleado para representar los datos mostrados en una grfica;


los diagramas pueden ser de varios tipos: lneas, barras, dimensiones y
smbolos.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Escala: se aplica para saber la dimensin del fenmeno graficado. Se debe


identificar en los ejes X y Y de un sistema de coordenadas. Las magnitudes en
la ordenada o eje Y y las clasificaciones de los datos en las abscisas o eje
X.

Existen varios tipos de grficas para representar los datos estadsticos y al mismo
tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.
5.1

HISTOGRAMA

Sirve para representar grficamente una distribucin de frecuencias. El grfico se


disea trazando los intervalos sobre el eje X y las frecuencias absolutas sobre el
eje Y. A partir del intervalo se traza la altura respectiva dada por la frecuencia
absoluta.
La empresa Cuero Lindo ha recopilado informacin sobre las ventas en miles de
pesos de 60 almacenes. Estos datos son:
VENTAS PARA SESENTA ESTABLECIMIENTOS
(Miles de pesos)
Intervalo
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
30 - 35
35 - 40
40 Total

F
2
5
12
14
15
8
4
0
60

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Las ventas ms frecuentes de los sesenta establecimientos estn entre $25000 y


$30000; $20000 y $25000. Y la menos frecuente est en $10000.
5.2

POLGONOS DE FRECUENCIAS

Es una curva que se traza a partir de los puntos medios de cada clase de amplitud;
estos se unen por medio de una lnea recta, la cual se disea con base en los
datos del histograma.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

5.3

OJIVAS

Es el grfico de una distribucin de frecuencias acumuladas (relativa, absoluta)


descendente o ascendente. Esta grfica indica la forma como crece la informacin
a travs de los intervalos, se puede utilizar como medicin de las variaciones de
los grupos. El punto donde se cortan las dos ojivas es el punto central de la
distribucin es decir la mitad de la informacin.

5.4

BARRAS

Sirven bsicamente para establecer las diferencias entre grupos individuales y


pueden ser de dos tipos:
5.4.1

Barras Verticales

Se emplean para presentar datos clasificados cronolgica o cuantitativamente:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Ejemplo: en la siguiente tabla se encuentra la informacin correspondiente a las


ventas anuales de la empresa El Retorno durante el perodo de 1987 - 1996
(en millones de pesos).
Aos
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996

5.4.2

Ventas
6
9
15
30
50
80
110
150
130
100

Barras Horizontales

Se emplean para dar datos clasificados geogrfica y cualitativamente, indican la


importancia de un atributo con respecto a los dems.
Ejemplo: la siguiente informacin nos indica el nmero de profesionales egresados
de distintas carreras en la ciudad de Bogot en 2002:
Carrera
Ciencias Sociales
Administracin
Ingenieras
derecho

Nmero de profesionales
1100
800
500
700

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Segmentada
Ejemplo: presenta una comparacin de la magnitud relativa de ventas dentro de
cada departamento y de las ventas totales por departamentos. La siguiente
informacin corresponde a las ventas por departamentos al contado y a crdito en
un almacn, se presenta en miles de pesos.
Departamento
Hombres
Mujeres
Nios
Electrodomsticos

Contado
200
180
150
300

Crdito
120
110
90
210

Total
320
290
240
510

Agrupada
Muestra las ventas por departamento en una empresa al contado y a crdito y
permite hacer comparaciones entre departamentos y al interior de cada uno.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Las Grficas de barras horizontales pueden presentarse de dos formas:

Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en
las proporciones o porcentajes. Es efectiva para permitir las comparaciones
cuando los segmentos son relativamente grandes. El proceso para realizar el
diagrama consiste en una regla de tres para:
Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene
una circunferencia con el tamao de la muestra y con cada una de sus frecuencias
absolutas.
360 n
x
Fi
As por ejemplo:
360 60
x
2
360*2
x = = 12
60
360 60
x
5
5

360*3
x = = 18
60

Donde 60 es la muestra de las ventas de los


establecimientos; 2 es la frecuencia absoluta
del primer intervalo.

Donde 60 es la muestra de las ventas de los


establecimientos; 5 es la frecuencia absoluta del
segundo intervalo.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Y para conocer el porcentaje que corresponde a cada parte, relacionando 100%


con el tamao de la muestra con la frecuencia absoluta.
100
n
y
Fi
As, por ejemplo:
100%
y

60
2

Donde 60 es la muestra de las ventas de los establecimientos;


2 es la frecuencia absoluta del primer intervalo.

100*2
y= = 3.3 3%
60

Esto quiere decir que el 3% de los establecimientos


tienen ventas entre $5000 y $10000.

Tallo y Hojas
Se puede tener un cuadro ms informativo que la tabla de recoleccin de datos si
se hace un listado diferente.
Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control
de contaminacin de Colombia en 2001:
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

17
17
03

02
04
02

07
04
04

04
14
10

08
03
01

Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:
El dgito de la extrema izquierda de cada valor es el punto de partida adecuado
para clasificar los datos en dos grupos. El O y 1 se usa para formar el tallo y se
escribe en columna vertical. A continuacin se escribe el segundo dgito como si
fuera una hoja en el rengln adecuado del tallo, a la derecha de la barra vertical.
O
1

3,2,4,2,7,4,4,4,8,3,1
7,7,4,0

Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se
puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos
dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el
inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin
se puede presentar la grfica ordenada de tallo y hojas.
O
O
1
1

1,2,2,3,3,4,4,4,4
7,8
0,4
7,7

Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las
15 observaciones son de 4 o menos.
Con el ejemplo que se ha venido trabajando; se puede elaborar este diagrama de
tallos y hojas. En los siguientes datos los resultados son obtenidos en miles de
pesos:
40
22
28
19
24
28

17
33
28
35
20
11

26
24
33
23
31
34

10
20
22
28
29
39

26
28
25
22
18
10

21
14
29
15
19
25

18
30
29
34
11
17

27
25
29
13
23
21

16
29
21
16
20
34

38
37
32
26
24
18

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Presentacin de los Datos en Forma de Tallo y Hojas


10,0,1,1,3,4
15,6,6,7,7,8,8,8,9,9
20,0,0,1,1,1,,2,2,2,3,3,4,4,4
25,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,9
30,1,2,3,3,4,4,4
38,9
4O
4
Las presentaciones de tallo y hoja de ms de dos dgitos se pueden elaborar de
diversos modos. Los siguientes datos muestran el nmero de das con aire
contaminado en el 2001 en varias ciudades de Colombia:
Ciudad
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O

2001
248
208
113
128
106
118
60
79
55
47
88
47
58
82
33

Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las
centenas y decenas formarn el tallo y las unidades sern las hojas.
03
04
05
06
07
08
09
10

3
7.7
5.8
0
9
28
6

11 3.8
12 8
13
14
15
16
17
18

19
20 8
21
22
23
24 8

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Como esta grfica es muy dispersa:


centenas y las hojas los dems dgitos
0
0
1
1
2
2

hay que hacer que el tallo contenga las

33,47,47
55,58,60,79,82,88
06,13,18,28
08,48

Proceso de Comprensin y Anlisis

La siguiente tabla muestra la poblacin de alguna ciudad (en millones) en los


aos de 1882 2002. Representar estos datos en un diagrama de barras.
AO
1882
1892
1902
1912
1922
1932
1942
1952
1962
1972
1982
1992
2002

POBLACIN
(Millones)
31.4
39.8
50.2
62.9
76
92
105.7
122.8
131.7
151.1
179.3
203.3
226.5

La siguiente tabla muestra el nmero de sacos de trigo y maz en la


cooperativa PQR durante los aos de 1992 2002:
AO
1992
1993
1994
1995
1996

NMERO DE SACOS DE
TRIGO
200
185
225
250
240

NMERO DE
SACOS DE MAIZ
75
90
100
85
80

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA
AO
1997
1998
1999
2000
2001
2002

NMERO DE SACOS DE
TRIGO
195
210
225
250
230
235

NMERO DE
SACOS DE MAIZ
110
110
105
95
110
100

Con referencia a la grfica, determinar el ao o aos durante los cuales:

La produccin de trigo fue mnima.


La de maz fue mxima.
Se dio el mayor descenso en la produccin de trigo.
Decreci la produccin de maz respecto al ao anterior y creci la de trigo.
Se produjo idntica cantidad de trigo
La produccin conjunta de trigo y maz fue mxima.

Las reas de algunos departamentos de Colombia (en miles de millas


cuadradas) se recogen en la siguiente tabla. Representar estos datos en un
grfico de tortas y determinar las conclusiones ms relevantes.
DEPARTAMENTO
Cundinamarca
Antioquia
Armenia
Amazonas
Meta
Choc
Norte de Santander
Total

REA (miles de millas


cuadradas)
11.7
10.4
1.9
9.4
3.3
6.9
7.9
51.5

En la siguiente tabla, se ven los nmeros (en millones) de estudiantes de


enseanza elemental, media y superior en Colombia. Representar los datos,
usando grficos de barras y determinar algunas conclusiones.
AO
1982
1987
1992
1997
2002

ELEMENTAL
32.4
35.5
37.1
33.8
30.6

MEDIA
10.2
13
14.7
15.7
14.6

SUPERIOR
3.6
5.7
7.4
9.7
10.2

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

La siguiente tabla muestra el estado civil de hombres y mujeres (de ms de 18


aos) en Colombia en 2001. Representar los datos mediante dos grficos
circulares y un grfico de diseo propio.
ESTADO CIVIL

HOMBRES
(% total)

MUJERES
(% total)

Soltero
Casado
Viudo
Divorciado

25.1
66.7
2.4
5.8

18.4
61.3
12.4
7.9

Una fbrica de gaseosa proyecta lanzar al mercado un nuevo sabor, para lo


cual se realiza un test de aceptacin de dicho sabor, en una muestra de 32
personas. Se utiliza una escala de 30 para medir el grado de aceptacin. Los
puntos obtenidos fueron los siguientes:
19
24
28
30

24
19
27
19

26
18
22
26

31
19
17
27

18
21
19
28

17
32
21
21

22
31
22
24

21
26
24
26

Realizar la representacin del esquema de tallos y hojas de esta informacin.

Un artculo de revista titulado Amargo Panorama, habla acerca del caf


colombiano y muestra un grfico de este tipo:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

Qu se puede decir de este grfico?.

En la seccin de actualidad de una revista, hay un titular sobre Los Derechos


Humanos: una tortura. Y muestra entre otras los siguientes grficos:

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

De acuerdo a estas grficas responder:

Qu porcentaje de quejas estn concluidas?


Qu significado tiene el valor 3794 en el grfico de estado de las quejas?
Qu interpretacin le puede dar al grfico quines se quejan?

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

ANEXO: Tablas

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

ESTADISTICA BASICA

BIBLIOGRAFA GENERAL
BERNAL V. Miguel. Estadstica Descriptiva: J. Elaboracin y Presentacin de
Datos Universidad de Pamplona, 1987.
GALLARDO, Yolanda.
Pamplona. 1997.

Estadstica:

Programa de Sicologa Universidad de

MARTNEZ BENCARDINO, Ciro. Estadstica Comercial. Bogot: Norma, 1981.


MORENO GARZN, Adonay. Serie aprender a investigar:
informacin. Cali: ICFES, 1995.

Recoleccin de la

PARZEN, Emmanuel. Teora Moderna de Probabilidades y sus Aplicaciones Mxico:


LIMUSA, 1991.
PEA SNCHEZ, Damel. Estadstica Modelos y Mtodos I. Fundamentos. Madrid:
Alianza editorial, 1986.
PORTUS GOVINDEN. Lincoyn. Curso Prctico de Estadstica. Bogot: McGRAW
- Hill, 1986.
SPIEGEL Murria R. Estadstica. Madrid: McGraw Hill, 1993.

UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia

S-ar putea să vă placă și