Sunteți pe pagina 1din 43

Estadstica bsica

Programa desarrollado

Primer cuatrimestre

Programa de la asignatura:
Estadstica bsica

Clave:

ESAD
Noviembre, 2010

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

ndice

I.

Informacin general de la asignatura

A. Ficha de identificacin
B. Descripcin
C. Propsito
II.

Competencia a desarrollar

III.

Temario

IV.

Metodologa de trabajo

V.

Evaluacin

VI.

Material de apoyo

VII.

Desarrollo de contenidos por unidad

Unidad 1. Fundamentos de estadstica

Unidad 2. Representacin numrica y grfica de datos

21

Unidad 3. Medidas de tendencia central y dispersin

34

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

I. Informacin general de la asignatura


A. Ficha de identificacin
Nombre de la Licenciatura o Ingeniera:
Nombre del curso o asignatura
Clave de asignatura:

Tronco comn
Estadstica bsica

Seriacin:

Sin seriacin

Cuatrimestre:
Horas contempladas:

Primero
90

B. Descripcin
En un mundo cada vez ms competitivo, tanto en las reas comerciales, financieras,
tecnolgicas y cientficas, y donde invariablemente el flujo de informacin es mayor a cada
momento, se hace indispensable no slo la correcta descripcin de los datos sino tambin su
anlisis e interpretacin. Es aqu donde la estadstica juega un papel preponderante, al ser una
de las herramientas ms poderosas para comprender la variabilidad inherente a los datos
observados y se constituye como la mejor herramienta para la toma de decisiones.
La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cada
una de las carreras que ofrece la ESAD, hace necesaria la conformacin de un tronco bsico
que, por un lado, garantice la formacin integral en los atributos generales deseables de los
estudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesarios
para cada disciplina de estudio.
El tronco bsico se conforma de varias asignaturas comunes que promueven, por un lado, la
formacin integral de los estudiantes, integrando asignaturas de distintas reas del
conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales
necesarias para la investigacin, el anlisis crtico, el manejo y la sistematizacin de
informacin y datos, as como una serie de valores que le permitan conducirse con tica y
responsabilidad durante su trayectoria acadmica y su desempeo profesional.
Las materias que forman el tronco bsico son: Contexto socioeconmico de Mxico, Desarrollo
humano, Estadstica bsica y Fundamentos de investigacin; estas materias a simple vista
parecen desarticuladas, pero se interrelacionan para contribuir a la formacin integral de los
estudiantes.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

En relacin al tronco bsico la asignatura Estadstica bsica tiene varios propsitos, pues
pretende despertar en el estudiante el inters por la investigacin para la toma de decisiones, la
solucin de problemas y el anlisis de situaciones y eventos relacionados con el entorno
acadmico, profesional, personal y social, rigindose en todo momento por un cdigo de tica
profesional y personal.
Los propsitos de la asignatura en relacin al tronco bsico son que los estudiantes:
1. Adquieran la capacidad de lectura e interpretacin de tablas y grficos estadsticos que
con frecuencia aparecen en diferentes medios.
2. Lleguen a comprender y apreciar el papel de la estadstica en la sociedad, incluyendo
sus diferentes campos de aplicacin y el modo en que la estadstica ha contribuido a su
desarrollo.
3. Identifiquen, dentro del contexto socioeconmico mexicano, la importancia y utilidad de
los anlisis estadsticos para la toma de decisiones.
4. Se conduzcan de manera tica y responsable en el manejo y anlisis de la informacin.
De manera particular, la materia pone especial nfasis en el enfoque prctico del material y los
contenidos que se presentan, tratando siempre de relacionar los conceptos, tcnicas y casos de
estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los
estudiantes el deseo de adentrarse cada vez ms a la teora de la probabilidad y estadstica, al
ver lo importante que resulta su utilizacin en las diferentes reas de trabajo.
La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos de
la estadstica, en la segunda las tcnicas para representacin grfica y numrica de datos, en la
tercera se abordan los conceptos bsicos de la teora de probabilidad como una medida del
riesgo frente a la incertidumbre en experimentos aleatorios y la ltima unidad presenta el
concepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal.

C. Propsito
La asignatura tiene como propsito introducir al estudiante con los conceptos y tcnicas bsicas
de la estadstica aplicada a la licenciatura e ingeniera. El curso tiene un nivel matemtico
elemental, con la intencin de que el estudiante comprenda la metodologa y su aplicacin, y no
tanto la teora matemtica detrs de ella.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

II. Competencia a desarrollar


2.1. Competencia general
Utiliza la estadstica descriptiva para el anlisis de informacin a travs de la recoleccin,
representacin y la descripcin de datos.

III. Temario
1. Fundamentos de la estadstica
1.1. Introduccin a la estadstica
1.1.1. Divisin de la estadstica
1.2.
1.2.1.
1.2.2.
1.2.3.
1.2.4.
1.2.5.
1.2.6.
1.2.7.

Conceptos bsicos e importancia de estadstica


Poblacin
Individuo
Muestra
Muestreo
Dato
Variable
Solucin de un problema estadstico

1.3.
Muestreo aleatorio
1.3.1. Conceptos bsicos de muestreo aleatorio
1.3.2. Metodologa del muestreo aleatorio simple
2. Representacin numrica y grfica de datos
2.1.
2.1.1.
2.1.2.
2.1.3.
2.1.4.
2.1.5.
2.1.6.
2.1.7.

Organizacin de datos y distribucin de frecuencias


Frecuencias
Intervalos
Construccin de intervalos de clase
Tablas de datos
Tablas de frecuencias
Tablas por intervalos de clase
Tablas de doble entrada

2.2.
2.2.1.
2.2.2.
2.2.3.

Representacin grfica de datos


Histograma
Grfica de barras
Grfica de lneas

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

2.2.4. Grfica de rea o de pastel


3. Medidas de tendencia central y dispersin
3.1.
3.1.1.
3.1.2.
3.1.3.

Medidas de tendencia central


Media aritmtica
Mediana
Moda

3.2.
3.2.1.
3.2.2.
3.2.3.

Medidas de dispersin
Recorrido
Varianza
Desviacin tpica o estndar

IV. Metodologa de Trabajo


Para el logro de la competencia, es fundamental que los conceptos y procedimientos
presentados se ejerciten todo el tiempo, pues esperamos que los contenidos no slo se
comprendan sino que se apliquen en la solucin de problemas que tengan que ver con
situaciones que los estudiantes pueden enfrentar en su trayectoria acadmica y profesional.
Por lo anterior, las estrategias metodolgicas de enseanza-aprendizaje son, por un lado, el
planteamiento de ejercicios y problemas tipo, de cada uno de los procedimientos que se
abordan durante el curso, esto con el objetivo de que los estudiantes ejerciten en el uso,
aplicacin y manejo de formulas y contenidos procedimentales. Por otro lado, los facilitadores
de la asignatura tendrn que orientar la aplicacin de cada uno de estos procedimientos a las
reas especficas de inters de los estudiantes; es decir, dentro de la asignatura se trabajan los
contenidos de manera aislada y los facilitadores tendrn que ejemplificar y presentar casos y
situaciones aplicables en las diferentes carreras, que complementen los ejercicios que se estn
planteando.
Como estrategia de evaluacin se utiliza un proyecto integrador, donde el estudiante haga uso
de todo lo que se trabaj en el curso. A lo largo del curso, se les presentarn a los estudiantes
varias autoevaluaciones de carcter ldico, esto con el fin de que puedan observar e identificar
cules son sus avances y las dificultades que presentan en el aprendizaje de los temas.
Estas autoevaluaciones contarn con una retroalimentacin que sirva para reforzar los temas
que se evalan.
El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quien
dirija y oriente todo el proceso de aprendizaje.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

Deber disear estrategias que propicien un aprendizaje verdaderamente significativo,


facilitando la comprensin del contenido y relacionando ste con los conocimientos previos del
estudiante as como con sus reas especficas de estudio, a travs del estudio casos y
problemas relacionados con el hacer cotidiano donde los estudiantes puedan aplicar y ejercitar
lo aprendido. Adems de ser quien oriente las discusiones y sesiones de trabajo que se
plantean en los espacios de aprendizaje colaborativo.

V. Evaluacin
En el marco del Programa de la ESAD, la evaluacin se conceptualiza como un proceso
participativo, sistemtico y ordenado que inicia desde el momento en que el estudiante ingresa
al aula virtual. Por lo que se le considera desde un enfoque integral y continuo.

Por lo anterior, para aprobar la asignatura, se espera la participacin responsable y activa del
estudiante as como una comunicacin estrecha con su facilitador para que pueda evaluar
objetivamente su desempeo. Para lo cual es necesaria la recoleccin de evidencias que
permitan apreciar el proceso de aprendizaje de contenidos: declarativos, procedimentales y
actitudinales.

En este contexto la evaluacin es parte del proceso de aprendizaje, en el que la


retroalimentacin permanente es fundamental para promover el aprendizaje significativo y
reconocer el esfuerzo. Es requisito indispensable la entrega oportuna de cada una de las
tareas, actividades y evidencias as como la participacin en foros y dems actividades
programadas en cada una de las unidades, y conforme a las indicaciones dadas. La calificacin
se asignar de acuerdo con la rbrica establecida para cada actividad, por lo que es importante
que el estudiante la revise antes realizarla.

A lo largo de la asignatura encontrars autoevaluaciones, que te servirn de ejercitacin y


prctica, su realizacin te preparar para resolver el examen final de la asignatura. Dicho
examen se presenta al concluir el estudio de todas las unidades temticas que integran la
asignatura.

A continuacin presentamos el esquema general de evaluacin.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

Esquema de Evaluacin
Foros y base de datos

10%

Taller y tareas

30%
Evidencias

40%

Autorreflexiones

10%

E-portafolio. 50%
Examen final

10%

Calificacin Final

100%

Cabe sealar que para aprobar la asignatura, se debe de obtener la calificacin mnima
indicada por la ESAD.

VI. Material de apoyo


Bibliografa bsica:

Douglas C. Montgomery, George C. Runger (2007). Probabilidad y Estadstica aplicadas


a la ingeniera. Cuarta Edicin. Mxico: McGraw-Hill.
Walpole Ronald E., Myers Raymond H. (2007). Probabilidad y Estadstica para
Ingenieros. Octava Edicin. Mxico: Editorial Pearson.

Bibliografa complementaria:

Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. (2010). Estadstica
Matemtica con Aplicaciones. Sptima Edicin. Mxico: Cengage Learning.
Ferris Ritchey. (2008). Estadstica aplicada a las ciencias sociales. Segunda Edicin.
Mxico: Mc Graw Hill.
Douglas L., William M., Samuel W. (2008). Estadstica aplicada a los negocios y la
economa. Decimotercera Edicin. Mxico: Mc Graw Hill.
Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades,
Primera Edicin. Pearson Education de Mxico.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

VII. Desarrollo de contenidos por unidad


Unidad 1. Fundamentos de la estadstica
Propsitos
En esta unidad:
Identificars los conceptos bsicos relacionados con la Estadstica.
Reconocers la utilidad e importancia de la Estadstica.
Aplicars el procedimiento para obtener una muestra aleatoria simple.

Competencia especfica
Aplica la metodologa estadstica para obtener informacin de una muestra aleatoria simple,
identificando los elementos que intervienen en un problema estadstico.
Introduccin
La palabra estadstica a menudo te remite a grficas y tablas; cifras relativas a nacimientos,
muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para aprovechar
las herramientas de anlisis estadstico, es necesario comprender qu representa cada
concepto y la metodologa mediante la cual se obtiene un dato estadstico.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Estadstica bsica
Programa desarrollado

En esta unidad se hablar sobre la importancia de la estadstica, conocers sus conceptos


bsicos, as como la metodologa del muestreo para que al final, obtengas una muestra
aleatoria simple.

1.1. Introduccin a la estadstica


La estadstica es la ciencia cuyo objetivo es reunir informacin cuantitativa relacionada a
individuos, grupos, series de hechos, entre otros. Gracias al anlisis de estos datos se pueden
deducir algunos significados precisos o algunas previsiones para el futuro. La estadstica, en
general, es la ciencia que trata la recopilacin, la organizacin, la presentacin, el anlisis y la
interpretacin de datos numricos con el fin de realizar una toma de decisiones ms efectiva.
Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas,
una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la
palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica
descripcin de parmetros; tambin se utiliza para referirse al conjunto de tcnicas y mtodos
que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en
masculino, se refiere a una medida derivada de una muestra.
Utilidad e importancia
La estadstica resulta muy til no slo para recopilar y describir datos, sino tambin para
interpretar la informacin obtenida, que puede ser aprovechada para demostrar la evolucin de
un fenmeno a travs de cierto tiempo.
En Mxico, el Instituto Nacional de Estadstica y Geografa (INEGI) se encarga de recabar
informacin estadstica y geogrfica de todo el pas, en diferentes reas y contextos. Los datos
que publica sirven para dar a conocer a cualquier persona la situacin en la que se encuentra el
rea de donde se obtuvo la informacin.
Los mtodos estadsticos se utilizan prcticamente en investigaciones de todas las reas de
conocimiento; tanto en el mbito acadmico, como en el profesional y laboral, en todos ellos la
finalidad es poder resolver un problema - entendiendo que un problema queda definido como la
diferencia entre lo real y lo deseado , en donde la estadstica muestra a la realidad para que el
investigador pueda analizar sus deseos y con ello tomar una decisin.

1.1.1. Divisin de la estadstica


La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica
Descriptiva y la Inferencial.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

10

Estadstica bsica
Programa desarrollado

Estadstica Descriptiva: La funcin descriptiva de la estadstica se enfoca en la


presentacin y clasificacin de los datos obtenidos de la poblacin que se analiza.

Estadstica Inferencial: Esta aplicacin de la estadstica busca plantear y resolver


problemas especficos y/o hacer previsiones a partir de los datos de una muestra, dado
que es muy difcil estudiar a la poblacin completa.

La estadstica descriptiva describe datos.

La estadstica inferencial infiere con esos


datos, entendiendo inferir como la
estimacin de un resultado.

1.2. Conceptos bsicos e importancia de la estadstica


1.2.1. Poblacin
Conjunto de todos los elementos que permiten resolver un problema y que presentan una
caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es una
persona, se pueden estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Los
elementos que integran una poblacin pueden corresponder a personas, objetos o grupos (por
ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).
1.2.2. Individuo
Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.
Nota que un individuo en estadstica puede ser distinto a un individuo como persona. Por
ejemplo, en los censos econmicos se obtienen datos de los negocios. En este caso cada
negocio, que est formado por varias personas, es un individuo de la poblacin.
1.2.3. Muestra
Cuando es difcil estudiar la poblacin debido a su gran tamao o que provenga de un proceso
que no se detiene (como la produccin de un bien), se debe analizar un subconjunto o parte de
esta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto
presenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao de
la muestra es mucho menor al tamao de la poblacin.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

11

Estadstica bsica
Programa desarrollado

1.2.4. Muestreo
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcin
reducida y representativa de la poblacin.
1.2.5. Dato
El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Por
ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara,
cruz.
1.2.6. Variable
Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual
se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo.
Las variables se pueden clasificar en cuantitativas y cualitativas:

a) Variable cuantitativa: se expresa en valores numricos. Dentro de ella, se subdividen en:


Discreta: Se tratan de variables expresadas con valores enteros. Ej. N de hijos de una
familia, n de alumnos de un curso.
Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej. Peso,
estatura, sueldos.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

12

Estadstica bsica
Programa desarrollado

b) Variable cualitativa: es aquella que describe cualidades. No son numricas y se subdividen


en:
Nominal: son variables presentadas sin orden ni jerarqua. Ej. Estado civil, preferencia
por una marca, sexo, lugar de residencia.
Ordinal: son variables organizadas de acuerdo con una clasificacin. Ej. grado de
estudios, das de la semana, calidad de la atencin, nivel socioeconmico.

1.2.7. Solucin de un problema estadstico


La solucin de un problema estadstico comprende los siguientes pasos:
a) Planteamiento del problema
En el planteamiento se define si se requiere de una muestra o es posible estudiar la
poblacin, las caractersticas a estudiar (las variables), si es necesario establecer
una hiptesis, etc. En este punto tambin se analizan los medios de los que se
dispone y el procedimiento a seguir.
b) Elaboracin de un modelo
Se establece un modelo terico de comportamiento de las variables de estudio. En
ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los
posibles modelos son Normal, Binomial, Poisson, Uniforme, Cuando es difcil
estudiar la poblacin debido a su gran tamao o que provenga de un proceso que no
se detiene (como la produccin de un bien) , se debe analizar un subconjunto o
parte de esta que la represente, etc.
c) Extraccin de la muestra
Se usa alguna tcnica de muestreo o un diseo experimental para obtener
informacin de una pequea parte de la poblacin.
d) Tratamiento de los datos
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos
y se calculan los valores que sern necesarios en pasos posteriores, como la media
Educacin Superior Abierta y a Distancia Primer cuatrimestre

13

Estadstica bsica
Programa desarrollado

y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos


de la estadstica descriptiva.
Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de
la informacin.
e) Estimacin de los parmetros
La estadstica inferencial nos proporciona herramientas para la prediccin o
estimacin de los parmetros de la poblacin que nos ayudarn a resolver el
problema. Un ejemplo de estas herramientas son las pruebas de hiptesis que se
obtienen del anlisis de los datos y los intervalos de confianza.

1.3. Muestreo aleatorio


Introduccin
Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que
realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida
tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones
especficas, relacionadas con el mtodo para determinar el tamao y caractersticas de la
muestra y los individuos que la componen.
1.3.1. Conceptos bsicos de muestreo aleatorio
Para que la informacin obtenida tenga validez y confiabilidad es necesario que cumpla con
algunas condiciones especficas. Los mtodos de muestreo se pueden clasificar en:

Muestreo probabilstico: en l, todos los elementos de una poblacin y, por lo tanto,


todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras
obtenidas a travs de este tipo de muestreo son confiables porque aseguran la
condicin de representatividad que es muy importante para hacer generalizaciones.
Muestreo no probabilstico: en este tipo de muestreo los elementos de la poblacin no
comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no
cumplen con la condicin de representatividad, por lo que no es confiable hacer
generalizaciones a toda la poblacin.

1.3.2. Metodologa del muestreo aleatorio simple


Educacin Superior Abierta y a Distancia Primer cuatrimestre

14

Estadstica bsica
Programa desarrollado

1. Definir la poblacin de estudio y el parmetro a estudiar.


Recordemos que la poblacin es el grupo formado por el conjunto total de individuos, objetos
o medidas que poseen algunas caractersticas comunes observables en un lugar y en un
momento determinado. Por lo tanto, el paso 1 es determinar el que se va a estudiar.
Por ejemplo:
Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su
objeto de estudio es las manifestaciones de violencia fsica y psicolgica entre los
estudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total de
estudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el total
de individuos con esta caracterstica es de 386 en este ejemplo. Por lo que, la
poblacin es de 386 individuos y las variables son: violencia fsica y violencia
psicolgica.

2. Enumerar a todas las unidades de anlisis que integran la poblacin,


asignndoles un nmero de identidad o identificacin.
Una vez que hemos definido nuestra poblacin y las variables a estudiar, es
necesario asignar un nmero de identificacin a cada individuo de la poblacin.
Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo en los
estudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmero
del 1 al 386.
3. Determinar el tamao de la poblacin, determinar el porcentaje de error y el
porcentaje de confianza y obtener una muestra preliminar.
Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
a) El porcentaje de confianza con el cual se quiere generalizar los datos desde la
muestra hacia la poblacin total.
b) El porcentaje de error que se pretende aceptar al momento de hacer la
generalizacin.
c) El nivel de variabilidad que se calcula para comprobar la hiptesis.Veamos en
qu consiste cada concepto:

Definir el tamao de la poblacin: Significa determinar el nmero de individuos que la


constituyen; la variable N representa el tamao de la poblacin. Esto es, N=X.

Porcentaje de confianza: Es el grado o nivel de seguridad que existe para generalizar


los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir

Educacin Superior Abierta y a Distancia Primer cuatrimestre

15

Estadstica bsica
Programa desarrollado

que no existe ninguna duda para generalizar tales resultados, pero tambin implica
estudiar a la totalidad de los casos de la poblacin.
Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente
es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn
clculo) para poder acertar al valor verdadero de la poblacin. Este dato se obtiene a
partir de la distribucin normal estndar (esto se considerar en la unidad 4).

Porcentaje de error: Este error es una distancia alrededor del valor que deseamos
estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si
se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del
mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de
equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en
cuenta de que no son complementarios la confianza y el error.

Variabilidad: Es la probabilidad (o porcentaje) con el que se acept y se rechaz la


hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se
denomina variabilidad positiva y se indica con p (tambin llamada probabilidad de xito), y
el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada
por q (tambin llamada probabilidad de fracaso y se obtiene 1-p).
Variabilidad positiva = p = a la probabilidad de que suceda el evento.
Variabilidad negativa = q = a la probabilidad de que no suceda el evento.

4.

Determinar el tamao ptimo de muestra para el estudio.


Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de
variabilidad han sido determinados, se debe determinar el tamao de la muestra.
En este paso, se utiliza cualquiera de las siguientes frmulas. El uso de una u otra
depende de si se conoce o no el tamao de la poblacin.
Para cuando no se conoce el tamao de la poblacin:

n es el tamao de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
E es la precisin o error
Ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

16

Estadstica bsica
Programa desarrollado

En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientes


activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de
confianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.
Solucin:
Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96.
Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en
el caso necesario, hay que convertir esos valores a proporciones.
Sustituyendo:

Es decir, se ocupar una muestra de aproximadamente 384 unidades.

Para cuando se conoce el tamao de la poblacin:

n es el tamao de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamao de la poblacin
E es la precisin o error
Ejemplo:
En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los
ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para
un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad
p=q=0.5.
Solucin:
Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96.
Sustituyendo:

Educacin Superior Abierta y a Distancia Primer cuatrimestre

17

Estadstica bsica
Programa desarrollado

En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

5.

Seleccionar la muestra usando nmeros aleatorios.


El ltimo paso para obtener la muestra es saber qu individuos especficos de la
poblacin se tomarn. Para hacer esto debemos:

1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de la


poblacin).

2. Generar nmeros aleatorios mediante programas computaciones (por ejemplo, Excel


con la funcin =aleatorio () ), funciones en calculadora o bien utilizando tablas de
nmeros aleatorios. Tambin puedes generar nmeros aleatorios de formas mecnicas,
por ejemplo, sacando nmeros de una urna o lanzando una moneda al aire.
3. Tomar los individuos correspondientes a los nmeros elegidos.

Nosotros nos enfocaremos nicamente en el uso de la tabla de nmeros aleatorios.


Procedimiento para utilizar las Tablas de Nmeros aleatorios:
Se selecciona el bloque, el rengln y la columna de la tabla. Partiendo de esta
seleccin, se toman tantas columnas como dgitos tenga la poblacin (N). Comenzando
por el primer nmero de las columnas, s- e incluirn en la muestra aquellos individuos
que en la lista de la poblacin ocupen la posicin de los n nmeros de las columnas
seleccionadas, siempre que sean menores que N. Si el nmero seleccionado en la tabla
es mayor que N lo pasamos por alto y seguimos hasta tener la muestra total.
Ejemplo:
Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99.
0 1 2 3 4 5 6 7 8 9
0 61 21 15 68 79 63 81 84 73 28
1 78 73 10 4 40 20 87 1 46 84
2 83 26 21 49 30 71 69 45 25 29
Educacin Superior Abierta y a Distancia Primer cuatrimestre

18

Estadstica bsica
Programa desarrollado

3
4
5
6
7
8
9

64
29
79
93
58
67
32

74
46
34
39
39
64
7

1
29
24
73
34
52
72

83
34
77
64
88
56
88

74
46
23
66
88
18
48

98
38
1
93
33
51
28

24
25
44
92
5
30
30

25
23
31
61
79
16
22

91
81
29
25
58
68
74

65
17
99
69
51
29
39

Selecciona una muestra aleatoria de 7 nmeros.

En la figura anterior tenemos una tabla de nmeros aleatorios tomados de este documento
(http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf),
seleccionemos una fila al azar, suponga la fila 5, y separamos los nmeros de 2 en 2,
tendramos entonces la siguiente serie de 7 nmeros: 65 03 83 69 67 67 43 54 49 27 82 50 15
06 etc. Esto significa que nuestra muestra aleatoria deber contener esos individuos, en el caso
de 67 que se repite, solo lo consideramos una vez y pasamos al siguiente nmero. (En algunas
calculadoras existe la funcin RAN# que nos proporciona tambin nmeros aleatorios, en esta
basta con poner en la calculadora el nmero de muestras + (Tecla SHIFT) + RAN# y cada vez
que presionemos la tecla (=) nos dar un numero aleatorio, si solo queremos la parte entera,
ignoramos al decimal). Tendramos la siguiente tabla:

Educacin Superior Abierta y a Distancia Primer cuatrimestre

19

Estadstica bsica
Programa desarrollado

Nmero aleatorio
65
03
83
69
67
43
54
49
27
82

Individuo de la muestra
93
68
56
69
61
34
23
17
45
52

Por lo que nuestra muestra quedara con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.

Consideraciones especficas de la unidad


En esta unidad se trabajar con lecturas de apoyo y se resolvern problemas como ejercicios
para reforzar el aprendizaje.
Tendrs que participar en una encuesta con la cual se generar una base de datos, este
material lo utilizars a lo largo del curso para que elabores las evidencias de aprendizaje de
cada unidad.
Referencias:
1. --- Statistics. (2010). En Merriam-Webster Online Dictionary. Consultado el 8 de marzo
de 2010 en: http://www.merriam-webster.com/dictionary/statistics
2. Borrego, Silvia (2008). Estadstica descriptiva e inferencial en: Revista digital
innovacin y experiencias educativas 13. Consultado el 10 de marzo de 2010 en:
http://www.csicsif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf
3. Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades.
Mxico: Pearson Educacin.
4. Galbiati Riesco, Jorge M. (s/f). Conceptos Bsicos de Estadstica. Pontificia Universidad
Catlica de Valparaso, Instituto de Estadstica. Consultado el 01 de marzo de 2010 en:
http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf
Educacin Superior Abierta y a Distancia Primer cuatrimestre

20

Estadstica bsica
Programa desarrollado

5. Jordi Casal, Enric Mateu (2003). Tipos de muestreo en: Revista Epidem. Med. Prev. 1:
3-7. Consultado el 01 de marzo de 2010 en:
http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf
6. Larios Osorio, Vctor (1999). Unidad 5. Teora de muestreo. Consultado el 12 de marzo
de 2010 en: http://www.uaq.mx/matematicas/estadisticas/xu5.html
7. Lind, Douglas; William Marchal y Samuel Wathen (2008). Estadstica aplicada a los
negocios y la economa. Decimotercera edicin. Mxico: McGraw-Hill.
8. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.
9. Ritchey, Ferris (2008). Estadstica para las ciencias sociales. Segunda edicin. Mxico:
McGraw-Hill.
10. Ruiz Muoz, David (2004). Manual de estadstica. Consultado el 09 de marzo de 2010
en: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
11. Wackerly, Dennis D.; William Mendenhall III y Richard L. Scheaffer (2010). Estadstica
Matemtica con Aplicaciones. Sptima edicin. Mxico: Cengage Learning.
12. Walpole Ronald E.; Raymond H. Myers, et al. (2007). Probabilidad y Estadstica para
Ingeniera y ciencias. Octava Edicin. Mxico: Pearson Educacin.

Unidad 2. Representacin numrica y grfica de datos


Propsitos
En esta unidad:
Identificars algunos conceptos que se utilizan en estadstica descriptiva.
Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas.

Competencia especfica
Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs
de la organizacin de los datos obtenidos de una muestra o poblacin.

Introduccin
En la unidad anterior vimos que existen dos grandes divisiones de la estadstica: la que se
dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva,
y la que se dedica a realizar hiptesis en base a dichos datos, llamada inferencial. Tambin
Educacin Superior Abierta y a Distancia Primer cuatrimestre

21

Estadstica bsica
Programa desarrollado

aprendimos a determinar el espacio de estudio, es decir la poblacin, y las variables que se van
a estudiar de acuerdo al problema planteado.
En esta unidad estudiaremos la Estadstica Descriptiva, y dentro de ella aprenderemos cmo
organizar y presentar los datos que se obtienen de las muestras tomadas de nuestras
poblaciones. Antes de comenzar con los temas, veamos de dnde y cmo se obtienen los
datos que vamos a organizar.
Cuando se realiza un trabajo que requiere de la estadstica, las personas que realizan el trabajo
disean sus instrumentos para recolectar la informacin y obtener los datos que necesitan.
Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:
Censos
Es una tcnica de recoleccin de datos que se aplica a la totalidad de los elementos que
componen la poblacin o universo que se estudia. Un censo debe cumplir dos condiciones:
Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la poblacin.
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.

Encuesta
Esta tcnica se utiliza para recolectar informacin de una muestra de la poblacin. Consiste en
presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas
predeterminadas) o cerradas (preguntas que cuentan con una serie de respuestas
establecidas).
Experimento
Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los
experimentos, veamos en qu consisten.
Un experimento es una prueba que se realiza para determinar las caractersticas o
comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu
alimentos nos parecen ms salados.
Un experimento, tambin se define como el proceso que se realiza para verificar una serie
de hiptesis relacionadas con un determinado fenmeno, en el cual se determinan las
caractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimento
para determinar la velocidad de la luz en el vaco; donde se est determinando la velocidad de
la luz.
La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una
hiptesis mientras que en la primera no necesariamente.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

22

Estadstica bsica
Programa desarrollado

En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cul pienso
que me sabr ms salado. En el segundo ejemplo, mi hiptesis, a partir de estudios anteriores,
es que la velocidad de la luz en el vaco es de 300 000 km/seg.
Mi experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error
experimental.

2.1. Organizacin de datos y distribucin de frecuencias


La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta
rea slo describe, resume, organiza y representa los datos obtenidos de una poblacin o
muestra de dicha poblacin, sin elaborar inferencias ni obtener conclusiones.
La organizacin de datos se realiza a travs de tablas que se utilizan para simplificar la
presentacin y distribucin de estos datos. A continuacin veremos que existen diferentes tipos
de presentacin de datos y con base en ellos distintas clasificaciones de frecuencia, como:
frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

2.1.1. Frecuencias
Dentro de los conceptos bsicos para la organizacin de datos estn los que conciernen a la
frecuencia:
Frecuencia: es el nmero de veces que se repite un dato, tambin se le conoce como
frecuencia absoluta.
Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta
el rengln i. Tambin es conocida como frecuencia absoluta acumulada.
Frecuencia relativa: es el resultado de dividir la frecuencia entre el nmero total de
datos (N). Este dato tambin puede verse como un porcentaje.
Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el
rengln i.
Podemos encontrar las frecuencias organizadas en tablas que estudiaremos ms adelante. Por
ahora veamos cmo se representan los tipos de frecuencia que vimos anteriormente,
supongamos que tenemos la siguiente distribucin de datos:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18,
23, 52, 7, 18, 52, 23.
No. De

Datos

Frecuenci

Frecuencia

Otra forma

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Frecuencia

Frecuencia

23

Estadstica bsica
Programa desarrollado

rengln
(i)

obtenidos de
la variable

f1= 2

18

f2= 6

23

f3= 8

41

f4= 4

47

f5= 7

52

f6= 5

Total

a
fi

Acumulada
Fi

para obtener
Fi

Relativa
hi

f1=F1= 2

f1 = F1=2

f1+f2= F2=
8
f1+f2+f3=
F3=16
f1+f2+f3+f4
= F4=20
f1+f2+f3+f4
+f5= F5=27
f1+f2+f3+f4
+f5+f6=
F6=32

F1+f2=F2=
8
F2+f3=F3=
16
F3+f4=F4=
20
F4+f5=F5=
27

h1=f1/N=0.06
25
h2=f2/N=0.18
75
h3=f3/N=0.25
00
h4=f4/N=0.12
50
h5=f5/N=0.21
87

F5+f6=F6=
32

h6=f6/N=0.15
63

N=32

Relativa acumulada
Hi

h1=H1=0.0625
h1+h2=H2=0.2500
h1+h2+h3=H3=0.5000
h1+h2+h3+h4=H4=0.6250
h1+h2+h3+h4+h5=H5=0.8430
h1+h2+h3+h4+h5+h6=H6=1.0
000

1.0000

2.1.2. Intervalos

Intervalo o rango: Conjunto de nmeros comprendidos entre otros dos nmeros dados,
conocidos estos ltimos como lmites del intervalo.

Intervalo de clase: En estadstica, se llama intervalo de clase a la expresin que


nombra un intervalo.

Amplitud del intervalo: Es la diferencia del lmite superior menos el lmite inferior (Ls Li).
Fronteras de clase: Son los puntos medios entre los lmites de intervalos consecutivos.

Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un
intervalo y el lmite inferior del siguiente.
Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de
los lmites inferior y superior del intervalo dividido entre 2. A la marca de clase
tambin se le denomina punto medio de clase.
Ejemplo de intervalos
Veamos cmo se representan los conceptos relacionados con los intervalos.
Dados los nmeros 15 y 25, tendramos que:
El intervalo corresponde a todos los nmeros que se encuentran entre el 15 y el
25. El intervalo de clase sera: 15-25

Educacin Superior Abierta y a Distancia Primer cuatrimestre

24

Estadstica bsica
Programa desarrollado

Los lmites del intervalo son:


Lmite inferior = 15
Lmite superior = 25
La amplitud del intervalo 15-25 sera: 25 menos 15, es decir 10. Es
recomendable que todos los intervalos tengan la misma amplitud. Para ello
podemos restar el dato menor del dato mayor y dividir este resultado entre el
nmero de intervalos que se deseen.
La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronteras
de clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo
intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo.
La frontera de clase no debe coincidir con los datos lmites del intervalo, porque
sera complicado identificar el intervalo al que pertenece dicho dato.
Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos
3.5-14.5, 14.5-25.5 y 25.5-36.5. Si se tiene el dato 25.5 no se sabra si ponerlo
en el segundo o en el tercer intervalo.

Si esta coincidencia sucede deber moverse el intervalo. Siguiendo con el


ejemplo, movindolo un punto a la izquierda tendramos los intervalos 2.5-13.5,
13.5-24.5 y 24.5-35.5.
La marca de clase del intervalo 15-25 es igual a:

Es recomendable que la marca del intervalo coincida con alguno de los datos.
Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos
tienen la misma amplitud.
2.1.3. Construccin de intervalos de clase
La formacin de clases o intervalos de clase, que se representa con (k), dependen,
generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para
determinar los intervalos de clase es lo siguiente:
1. Calcular el rango:
Para esto, se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es
el resultado de la resta, esto es:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

25

Estadstica bsica
Programa desarrollado

R= Xn X1
Por ejemplo:
Si en una serie de datos que van desde el 18 hasta el 56, tendramos lo siguiente:
Xn= 56 y X1= 18, por lo tanto:
R= Xn X1= 56 18= 38
2. Determinar el nmero de intervalos que se desea tener:
No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen
crear entre 5 y 20 intervalos. La decisin la toma el investigador.
Siguiendo con nuestro ejemplo, diramos que vamos a construir 7 intervalos.
Entonces decimos que K=7.
3. Dividir el rango entre el nmero de intervalos que se desea tener:
Recordemos que lo recomendable es elegir un nmero entre 5 y 20 para los intervalos.
Dividimos entre uno menos de los intervalos deseados porque con el nmero de datos se
acumula un intervalo ms.

Siguiendo con el ejemplo, deseo 7, entonces:

Esta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero
ms cercano, como en este caso, tomamos el rango igual a 5.
Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo ms, entonces
se divide entre el nmero de intervalos que se quieren.
4. Se forman los intervalos:
Los intervalos se forman comenzando un nmero antes del primer dato:
INTERVALOS:
17 a 22
(se cuenta 5 desde 18 hasta 22)
23 a 28
29 a 34
35 a 40
41 a 46
47 a 52
53 a 58
Nota: No importa que el ltimo intervalo exceda el ltimo dato.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

26

Estadstica bsica
Programa desarrollado

Ejemplo de construccin de intervalos


Veamos el siguiente ejemplo para la construccin de intervalos de clase.
El director de una consultora en desarrollo de software desea conocer el nmero de
incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello
pide a uno de sus empleados que le elabore un reporte, el empleado tiene los siguientes datos:
35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35,
27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26,
25, 24, 60, 55, 48, 37, 31, 30, 22, 20.
Vayamos paso por paso:
1. Calcular el rango:
R= Xn X1= 60-20=40
2. Determinar el nmero de intervalos entre 5 y 20:
Elegimos 8 intervalos

3. Dividir el rango entre el nmero de intervalos:

4. Se forman los intervalos:


Comenzamos por un nmero anterior al lmite inferior: 19-24, 25-29, 30-35, 3640, 41-45, 46-50, 51-55, 56-60.

2.1.4. Tablas de datos


Existen diferentes tipos de tablas para presentar los datos, las ms utilizadas son: Tabla de
datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada.
Veamos en qu consiste cada una:
Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza
cuando la informacin que necesitamos son los datos mismos. Se organizan en columnas o
renglones y se registran las mediciones o datos obtenidos.
Ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

27

Estadstica bsica
Programa desarrollado

Supongamos que la medicin de temperatura a lo largo del da da como resultado los


siguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entonces
construimos una tabla como la siguiente:
Temperatura
(Celsius)

2.1.5

20.4

21.2

22.1

23.9

25.3

26.9

27.7

Tablas de frecuencias

Esta nos aporta mayor informacin pues est formada por categoras de la variable que se est
midiendo y su frecuencia (es decir, el nmero de ocurrencias de un valor dado).
Ejemplo:
suponga que un experimento da los siguientes valores medidos:
1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2

Procedemos entonces a agrupar por categoras, segn la frecuencia o nmero de veces que
aparece cada medicin:
Valor de la
Variable medida
1
2
3
4
5
6

Frecuencia
4
7
5
4
5
1

2.1.6. Tablas por intervalos de clase


En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores
correspondientes a cada variable.
Ejemplo:

Educacin Superior Abierta y a Distancia Primer cuatrimestre

28

Estadstica bsica
Programa desarrollado

En una encuesta sobre el desempleo en el rea Metropolitana de la Ciudad de Mxico, se


organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de
cada intervalo, teniendo un total de 23,700 desempleados.
Grupo de edad
De 12 a 19
De 20 a 24
De 25 a 34
De 35 a 44
De 45 a 99

Frecuencia
9600
7100
3900
1500
1600

2.1.7. Tablas de doble entrada


Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre
s. Se forma poniendo en los renglones de la tabla la informacin de una de las variables y en
las columnas la informacin de la otra variable.

Ejemplo:
Suponga que se miden el nmero de cirugas realizadas por edades en una muestra de 100
personas, encontrndose lo siguiente:
Edades / No. de cirugas Menos de 2 cirugas Ms de 2 cirugas
0-10
1
0
11-20
2
2
21-30
6
4
31-40
11
7
41-50
17
6
Ms de 50
30
14

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables
relacionadas son los rangos contra el valor de las variables en dicho rango.
Por ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

29

Estadstica bsica
Programa desarrollado

Supongamos que medimos la temperatura de un lquido con respecto al tiempo de


calentamiento. En el rengln colocamos los tiempos y en las columnas la temperatura obtenida.
Podramos considerar la tabla como una tabla de frecuencias o como una tabla de doble
entrada:
Tiempo
(min)
1-5
6-10
11-15

Temperatura
(C)
36
44
67

2.2. Representacin grfica de datos


Introduccin
En el tema anterior presentamos diferentes formas de organizar o de tabular datos y vimos la
distribucin de frecuencias. Ahora veremos la representacin grfica de los datos.
Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existen
diferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacin
que se quiere representar.

2.2.1. Histograma
Histograma es la representacin grfica de una variable continua. Se elabora en un sistema de
coordenadas rectangulares.

El eje horizontal se utiliza para representar a la variable independiente, es decir, a la


escala de medicin o fronteras de clase.
El eje vertical representa a la escala de frecuencias.
Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern
proporcionales a las frecuencias.

El histograma tambin proporciona visualmente el aspecto de la distribucin y dispersin de las


mediciones.

2.2.2. Grfica de barras


Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En estas se
muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y
Educacin Superior Abierta y a Distancia Primer cuatrimestre

30

Estadstica bsica
Programa desarrollado

no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por
medio de espacios vacios entre las barras.
La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
Barras verticales:

En el eje horizontal se representan los valores de la variable.


En el eje vertical se representa la frecuencia de cada clase.

Barras horizontales:

En el eje horizontal se representan las frecuencias.


En el eje vertical los valores de la variable.

Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el
histograma no presenta separacin entre las barras.

2.2.3. Grfica de lneas


Una grfica de lneas se construye tambin en un sistema coordenado rectangular, y muestra la
relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de
cada valor medido es representada por la altura del punto.
En el eje horizontal se representa a la variable y en el eje vertical la frecuencia. Se determinan
los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica
de lnea.
2.2.4. Grfica de rea o de pastel
Una forma de representar datos u observaciones de una variable cualitativa es mediante un
diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o
pastel) en sectores (o rebanadas). Tambin se utilizan para representar la distribucin de
frecuencias, pero es el rea de cada sector la proporcional a los valores medidos.
Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema
con respecto a la circunferencia determinando sectores circulares para cada categora.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

31

Estadstica bsica
Programa desarrollado

Ejemplo:
Considere la siguiente tabla de datos.
Medicin en
cm
30
30.1
30.2
30.3
30.4
30.5
30.6
30.7
30.8
30.9

Frecuencia
3
7
12
18
23
21
17
11
5
1

Educacin Superior Abierta y a Distancia Primer cuatrimestre

Frecuencia
acumulada
3
10
22
40
63
84
101
112
117
118

Porcentaje
3%
6%
10%
15%
19%
18%
14%
9%
4%
1%

32

Estadstica bsica
Programa desarrollado

En esta figura se muestra el histograma de las mediciones en cm vs. frecuencia, note como el
ancho de las clases es el mismo.

En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentaje


que corresponde a la frecuencia relativa.

En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

Educacin Superior Abierta y a Distancia Primer cuatrimestre

33

Estadstica bsica
Programa desarrollado

Consideraciones especficas de la unidad


En esta unidad se trabajar con dos problemas diferentes que permitirn practicar a
elaboracin de tablas de datos y grficas, adems de participar en un foro sobre el uso
cotidiano de la estadstica descriptiva. La evidencia de aprendizaje se generar a partir de la
muestra que se obtuvo en la unidad uno. Consiste en la elaboracin de tablas de datos y
grficas de diferentes tipos.
Referencias:
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica para
Ingeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.
3. Intervalos de clase. Consultado el 26 de abril de 2010 en:
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descrip
tiva_2/estadistica_descriptiva_2.htm
4. Censo y entrevista. Consultados el 26 de abril de 2010 en:
http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc.
http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf
Para saber ms:
5. Estadstica y probabilidad. Consultado el 27 de abril de 2010 en:
http://www.vitutor.com/estadistica.html

Unidad 3. Medidas de tendencia central y dispersin


Propsitos
En esta unidad:

Aplicars el procedimiento para obtener las medidas de tendencia central y dispersin


en datos agrupados y no agrupado.

Competencia especfica
Utiliza las medidas de tendencia central y dispersin para describir un conjunto de datos
mediante la representacin numrica y grfica de la informacin obtenida en una muestra o
poblacin.
Introduccin
Educacin Superior Abierta y a Distancia Primer cuatrimestre

34

Estadstica bsica
Programa desarrollado

Para cualquier conjunto de datos estudiados es importante tener informacin resumida de sus
caractersticas. Esta informacin nos indica cmo se comporta la poblacin de datos que
tenemos. Para resumir la informacin se utilizan dos tipos de valores que en lugar de
representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores
estadsticos son: las medidas de tendencia central, que nos muestran hacia qu valores se
agrupan o acumulan los datos, y las medidas de dispersin, que, de forma contraria a las
anteriores, muestran cmo se dispersan o separan los datos.
3.1. Medidas de tendencia central
Las medidas de tendencia central son los valores que representan un conjunto de datos de
forma tal que nos ayudan a saber dnde estn acumulados los datos pero sin indicar como se
distribuyen. Se llaman as porque tienden a ubicarse en la parte central del conjunto de datos.
Las medidas de tendencia central ms comunes son: la media aritmtica, comnmente
conocida como media o promedio, la mediana y la moda.
3.1.1. Media aritmtica
La media aritmtica o, simplemente, media, se denota por o por la letra segn se calcule en
una muestra o en la poblacin, respectivamente. La media es resultado de dividir la suma de
todos los valores (xi) entre el nmero total de datos (N).

La frmula para calcular la media de una distribucin de datos, vara de acuerdo a la manera
cmo los tenemos organizados.
Frmula para calcular la media en datos no agrupados
Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir,
cada valor se representa de manera individual. Las frmulas para calcular la media son:
En una poblacin

Educacin Superior Abierta y a Distancia Primer cuatrimestre

En una muestra

35

Estadstica bsica
Programa desarrollado

En estas frmulas la diferencia radica en que, el total de la poblacin se representa con la letra
N y el total de la muestra se representa con la letra n.
Frmula para calcular la media en datos agrupados por frecuencias simples
Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de
frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable (xi) y, en
otra columna, la frecuencia (fi) o el nmero de veces que se repite cada valor en una serie de
datos.
Las frmulas para calcular la media con los datos organizados de esta manera son:
En una poblacin

En una muestra

Frmula para calcular la media en datos agrupados por intervalos


Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango
establecido entre un lmite inferior y un lmite suprior. Recuerda que las tablas de intervalos
muestran el nmero de datos que abarca cada intervalo (frecuencia por intervalo).
Las frmulas para calcular la media con los datos organizados de esta manera son:

En una poblacin

Educacin Superior Abierta y a Distancia Primer cuatrimestre

En una muestra

36

Estadstica bsica
Programa desarrollado

3.1.2. Mediana
La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la
mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o
decreciente, entonces, el nmero de datos que queda a la izquierda de la mediana es igual al
nmero de datos que queda a la derecha.
Si n es impar hay un dato que queda en medio de todos, ste ser igual a la mediana. Si n es
par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de
esos dos datos, es decir, su suma dividida entre dos.
Para cuando la cantidad de valores de la distribucin es impar:
1. Ordenamos los valores de menor a mayor.
2. Buscamos el valor del centro.

Por ejemplo:
Supongamos que tenemos los siguientes valores:
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9
1. Ordenamos:
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9

2. El dato que divide a la mitad es: 4, por lo tanto Me: 4

Para cuando la cantidad de valores es impar:


1. Ordenamos los valores de menor a mayor.
2. Buscamos los valores del centro.
3. Promediamos los valores del centro.
Por ejemplo:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

37

Estadstica bsica
Programa desarrollado

Supongamos que tenemos los siguientes valores:


5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2
1. Ordenamos
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9
2. Buscamos los datos del centro:
4, 5
3. Promediamos:

, por lo tanto Me: 4.5


Mediana en datos agrupados por intervalos
Cuando queremos calcular la mediana en datos agrupados por intervalos, tenemos que buscar
el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma
de
las
frecuencias absolutas, es decir, es necesario localizar el intervalo donde se
encuentre
, ocupamos siguiente frmula:

En donde:
Li = Lmite inferior del rengln en donde debe estar la mediana
Fi-1 = Frecuencia acumulada anterior al rengln de la mediana
fi = frecuencia del rengln de la mediana
ai = tamao del intervalo
3.1.3. Moda
La moda es el valor del dato que ms veces se repite, esto es, el valor cuya frecuencia absoluta
es mayor, y se denota como Mo. Algunas veces el valor que ms se repite puede no ser nico,
es decir, puede haber dos o ms datos que aparezcan con la misma frecuencia absoluta,
siendo sta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras
bimodales si existen dos modas o multimodales si existen ms de dos.
Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturas
tendremos dos modas.
Educacin Superior Abierta y a Distancia Primer cuatrimestre

38

Estadstica bsica
Programa desarrollado

Cuando nuestra distribucin de datos es por intervalos de clase, primero localizamos el


intervalo que tiene mayor frecuencia absoluta y utilizamos la siguiente frmula para calcular la
moda:

En donde:
Li = Lmite inferior del rengln en donde debe estar la moda
fi = frecuencia del rengln de la moda
fi+1 = Frecuencia ulterior al rengln de la moda
fi-1 = Frecuencia anterior al rengln de la moda
ai = tamao del intervalo
3.2. Medidas de dispersin
A diferencia de las medidas de tendencia central, que miden acumulaciones, mediante un solo
punto, las medidas de dispersin miden el grado de separacin o alejamiento que tiene una
variable estadstica en torno a una medida de posicin o tendencia central. Dicho grado de
separacin nos indica lo representativa que es la medida de posicin con respecto al conjunto
total de datos. A mayor dispersin menor representatividad de la medida de posicin y
viceversa.
Las medidas de dispersin ms comunes son: el recorrido, la varianza y la desviacin estndar.

3.2.1. Recorrido
El recorrido representa la distancia que hay entre el primero y el ltimo valor de la variable,
tambin se le conoce como rango y se denota por Re.
La frmula para calcularlo es:

Donde:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

39

Estadstica bsica
Programa desarrollado

mx xi es el valor mximo del a variable


min xi es el valor mnimo de la variable
Por ejemplo:
Supongamos que tenemos la siguiente distribucin de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74,
74, 69, 52, 76.
Calculamos el rango, sustituyendo los valores:
Re=78-52=26
3.2.2. Varianza
La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media
aritmtica. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de
los cuadrados de las diferencias del valor de los datos menos la media aritmtica de estos.
La frmula de la varianza para datos no agrupados es:
Para calcularla en una poblacin:

Para calcularla en una muestra:


Varianza para datos agrupados por intervalos
La frmula para calcular la varianza en datos agrupados por intervalos es la siguiente:
Para calcularla en una muestra:

Para calcularla en una poblacin:

3.2.3. Desviacin tpica o estndar


Educacin Superior Abierta y a Distancia Primer cuatrimestre

40

Estadstica bsica
Programa desarrollado

La desviacin tpica muestra qu tan alejado est un dato del valor de la media aritmtica, es
decir, la diferencia que hay entre un dato y la media aritmtica. Se denota como S o, segn se
calcule en una muestra o en toda la poblacin, respectivamente.
Se define como la raz cuadrada positiva de la varianza. Se expresa mediante las siguientes
frmulas:
En datos no agrupados:
En una poblacin:

En una muestra:

En datos agrupados por intervalos:


En una poblacin:

En una muestra:
Educacin Superior Abierta y a Distancia Primer cuatrimestre

41

Estadstica bsica
Programa desarrollado

Consideraciones especficas de la unidad


Las actividades de esta unidad se trabajan en diferentes momentos, a partir de un problema
que se trabaja en la unidad 2, los alumnos tendrn que obtener las medidas de tendencia
central y dispersin. Se les solicita a los alumnos que al concluir cada subtema (tipo de medida)
se elabora una actividad relacionada con el mismo, al final del tema uno y dos estas actividades
se comparten con el resto del grupo para que entre todos se revisen y retroalimenten.
Se contar con dos foros de uso general, uno para las medidas e tendencia central y otro para
las medidas de dispersin. El objetivo de estos foros es que los alumnos planteen sus dudas a
todo el grupo o compartan informacin que pueda ser de utilidad para el estudio de los temas.
Cuenta con una actividad que debe ser enviada al facilitador como tarea, adems de la
autoevaluacin y la evidencia de aprendizaje. Esta ltima consiste en la presentacin de las
medidas de tendencia central y dispersin de los datos obtenidos de la muestra de la unidad
uno, adems de incluir, a manera de conclusin, una reflexin sobre el uso y las aplicaciones
de la estadstica descriptiva.

Referencias:
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica
aplicadas a la ingeniera. Cuarta edicin. Mxico: McGraw-Hill.
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica para
Ingeniera y ciencias. Octava edicin. Mxico: Pearson Educacin.
3. Medidas de tendencia central y dispersin. Consultado el 27 de abril de 2010 en:
http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescriptivav
ariables2.pdf
4. Estadstica y probabilidad. Consultado el 27 de abril de 2010 en:
http://www.vitutor.com/estadistica.html
Educacin Superior Abierta y a Distancia Primer cuatrimestre

42

Estadstica bsica
Programa desarrollado

Educacin Superior Abierta y a Distancia Primer cuatrimestre

43

S-ar putea să vă placă și