Sunteți pe pagina 1din 245

UCV LIMA

FORMACIN GENERAL
REA DE ESTADSTICA






ESTADSTICA GENERAL



Lic. Carlos Ortega Muoz
Ing. Elba Vega Durand
Lic. Ernesto Zea Raya







2009









Agradecemos el apoyo irrestricto de la UCV LIMA, hacia el
rea de Estadstica a travs del cual se ha hecho la
elaboracin del presente mdulo.










NDICE

Pg.

INTRODUCCIN
SESIN 1. La Estadstica. Importancia. Conceptos bsicos 7
SESIN 2. Escala de Medicin. Recoleccin de datos. 23
SESIN 3. Descripcin de frecuencia para una variable cualitativa y una
Cuantitativa discreta. Grficos. 41
SESIN 4. Descripcin de frecuencia para una variable cualitativa y una
cuantitativa discreta. Grficos. 54
SESIN 5. Distribucin de frecuencia para dos variables cuantitativas y/o
cualitativas. 66
SESIN 6. Medidas de tendencia central 82
SESIN 7. Medidas de dispersin o de variabilidad. 102
SESIN 8. Probabilidad bsica. Distribucin normal (Z) y distribucin de t. 116
SESIN 10. Estadstica inferencial: puntual y por intervalo. 155
SESIN 11. Muestreo. Tipos. Seleccin de la muestra. Tamao de muestra 170



SESIN 12. Prueba de Hiptesis sobre la media poblacional, proporcin
poblacional y diferencia de medias. 188
SESIN 13 Prueba de hiptesis para la independencia de variables en 213
una tabla de contingencia.
SESIN 14. Correlacin y anlisis de regresin. 223
















INTRODUCCIN

El presente mdulo titulado ESTADSTICA GENERAL expone de manera
sencilla los conceptos y mtodos de la Estadstica, que se consideran bsicos e
indispensables para su posterior aplicacin en cualquier campo. Adems no
pretende usar muchas demostraciones matemticas salvo que se considere
necesario para no perder la rigurosidad requerida.
El mdulo es una gua en la cual se presentan ejercicios desarrollados y
propuestos para desarrollar en las sesiones de clase.
En la primera parte del material, se muestra que el objetivo bsico de la
Estadstica Descriptiva es hacer una descripcin lo ms sencilla posible de los
resultados obtenidos en la muestra. Esta descripcin se har mediante
representaciones de cuadros y/o grficos mostrando que hay una idea implcita, lo
que ocurre en toda la poblacin, la cual inferimos a partir de la muestra. Aunque
los mtodos de la estadstica descriptiva son importantes para presentar y
caracterizar los datos, stos han sido la base de la estadstica inferencial y han
hecho posible aplicar la estadstica a todos los campos de investigacin.

El objetivo de la segunda parte es inferir las propiedades de la poblacin a
partir de las propiedades de la muestra, para lo cual iniciaremos con los
fundamentos de la probabilidad seguido por las estimaciones puntuales; esta
estimacin difcilmente acertar con el valor exacto del parmetro, aunque
normalmente lo que buscamos es que el verdadero valor del parmetro quede
cerca de la estimacin. Esta parte se ver claramente en la estimacin de
intervalos de confianza.

En las pruebas de hiptesis no se buscar estimar el valor del parmetro
desconocido, sino que trataremos de decidir si es sensato rechazar o no rechazar
la hiptesis de que el valor del parmetro se sita en una determinada regin.
Queda claro que estas decisiones tendrn que estar basadas en los resultados de
un muestreo aleatorio realizado en las poblaciones correspondientes.

Finalmente nos ocuparemos de problemas que implican dos o ms
variables numricas como un medio a considerar las relaciones que existen entre
ellas. Se analizarn dos tcnicas, el anlisis de regresin y la correlacin. En el
primero se utilizar para hacer predicciones, mientras que en la segunda se
utilizar para medir la intensidad de la asociacin entre estas dos variables
numricas.







Clasificacin


Definiciones bsicas


Rol de la Estadstica en
Investigacin cientfica


Importancia


Concepto



LA ESTADSTICA
SESIN 1
La Estadstica: Concepto, Importancia, Rol de la estadstica en la Investigacin
Cientfica, Definiciones bsicas. Variables. Tipo de Variable, Divisin de la
Estadstica.
1.- ESTADSTICA.-
1.1- Concepto.-
Es una ciencia que cumple las siguientes funciones, recolectar, organizar,
presentar, analizar e interpretar los datos.
La Estadstica permite caracterizar cuantitativa y cualitativamente el volumen,
la estructura y la dinmica de los fenmenos en estudio as como el
comportamiento de la relaciones entre las variables.

1.2.- Importancia.-
La Estadstica como todas las ciencias surge para cubrir una necesidad en el
hombre y su desarrollo ha sido en ese sentido, a medida que aumenta la
complejidad de nuestro mundo, se hace cada vez ms difcil tomar decisiones
inteligentes y bien documentadas. Con frecuencia tales decisiones deben
tomarse con mucho menos que un conocimiento adecuado y experimentando
una gran incertidumbre. La estadstica es la herramienta que nos permite
obtener la informacin que requerimos, as como reelaborarla y presentarla
para su adecuada evaluacin y consecuente toma de decisiones,
convirtindose as en un elemento activo en la solucin de los problemas.


1.3.- Rol de la Estadstica en la Investigacin Cientfica
La estadstica cumple bsicamente con dos funciones, brindar la informacin
necesaria para:
a.- La toma de decisiones.
b.- La solucin de problemas.
Decisiones sobre cmo aplicar la tasa tributaria, la estructuracin de un
programa de reconstruccin, el nivel de inversin requerido en obras de
infraestructura para el prximo ao, etc., son decisiones que se deben tomar
a nivel del Estado y para las cuales se requiere de informacin.
En el caso de la empresa, la bsqueda de rentabilidad, el control de la
calidad, la minimizacin de costos, la rotacin de inventarios, la contratacin
de trabajadores, convierte a la estadstica en una aliada inestimable para la
toma de decisiones y la solucin de estos problemas.

1.4 DEFINICIONES BSICAS
1.4.1 Poblacin.- Llamado tambin universo. Conjunto infinito o finito de datos
muy grandes que tienen la misma caracterstica. Conjunto sobre el que
estamos interesados en obtener conclusiones (hacer inferencia).
El tamao de una poblacin es importante en el proceso de investigacin
estadstica. El tamao viene dado por el nmero de elementos que
constituyen la poblacin.
Segn el nmero de elementos la poblacin puede ser finita o infinita.
Cuando el nmero de elementos que integra la poblacin es muy grande,
se puede considerar a esta como una poblacin infinita.
Ejemplo:
a) Problema a estudiar: El bajo nivel del rendimiento acadmico en
alumnos del 4to. Grado
Poblacin:
____________________________________________________________
b) Problema a estudiar: El tiempo que se demora un alumno en llegar a
la universidad.
Poblacin:
_________________________________________________________
c) Problema a estudiar: Conocer el nivel de educacin de las madres
solteras.
Poblacin:
_________________________________________________________
d) Problema a estudiar: ________________________________________
Poblacin:
_________________________________________________________
e) Problema a estudiar: ________________________________________
Poblacin: ________________________________________________
f) Problema a estudiar: _________________________________________
Poblacin:
__________________________________________________________

1.4.2 Muestra.- Es el conjunto de observaciones extradas de la poblacin y se
espera que sea lo ms representativa de ella. Ejemplo:
a) Problema a estudiar: El bajo nivel del rendimiento acadmico en
alumnos del 4to. Grado
Poblacin: ________________________________________________
Muestra: ________________________________________________

b) Problema a estudiar: El tiempo que se demora un alumno en llegar a
la universidad.
Poblacin: _______________________________________________
Muestra:
____________________________________________________
c) Problema a estudiar: Conocer el nivel de educacin de las madres
solteras.
Poblacin:_________________________________________________
Muestra:
_________________________________________________________
d) Problema a estudiar: ________________________________________
Poblacin:
_________________________________________________________
Muestra:
_________________________________________________________
e) Problema a estudiar: ________________________________________
Poblacin: ________________________________________________
Muestra:
_________________________________________________________
f) Problema a estudiar: ________________________________________
Poblacin: _________________________________________________
Muestra:
_________________________________________________________

Luego, podemos sealar que nuestro objeto de estudio es un atributo o
caracterstica particular de los elementos de una determinada poblacin. Es
decir para una misma poblacin podemos estudiar un gran nmero de
atributos.
Por ejemplo:
a) Poblacin: Alumnos de 4to. Grado de colegios estatales en Lima
Metropolitana
Atributos o caractersticas a estudiar:
1. Estatura
2 Peso
3 _________________________________________________________
4 _________________________________________________________
5 _________________________________________________________

b) Poblacin:
__________________________________________________________

Atributos o caractersticas a estudiar:
7 _____________________________________
8 _____________________________________
9 _____________________________________

1.4.3. Variable.
Es la caracterstica de la muestra o poblacin que se est observando. Si el
gerente de ventas de una lnea area est interesado en determinar el flujo
de pasajeros de sus vuelos en los ltimos seis meses, la variable a analizar
es el nmero de pasajeros.
1.4.4. Clasificacin
Las variables pueden ser:
a. Cuantitativas
Las observaciones se expresan numricamente. Tiene sentido hacer
operaciones algebraicas con ellos. Es el caso del monto de la pensin, el
ingreso familiar, la nota del parcial, el tiempo que me toma llegar de mi
casa a la universidad, etc.

Las variables cuantitativas se clasifican a su vez en:
i) Discreta.
Es aquella en la cual se expresa en nmero entero. Ejemplo: edad, el
nmero de compaeros que tuve en mi clase a lo largo de mi carrera, las
veces que he llegado tarde a clase, el nmero de exmenes que he
aprobado en este ciclo.
Ejemplos:
___________________________________________________________
___________________________________________________________
___________________________________________________________
___________________________________________________________
ii) Continua.
Son aquellas que toman infinitos valores en un intervalo dado, de forma
que se puede ubicar en la recta numrica. En este tipo de variable los
valores que pueden tomar pueden ser decimales o fraccionarios. Ejemplo:
El peso, talla, presin sangunea, temperatura.
Ejemplos:
___________________________________________________________
___________________________________________________________
___________________________________________________________

b. Atributo o Cualitativas
Las observaciones se miden de manera no numrica. No se pueden hacer
operaciones algebraicas con ellos como por ejemplo, la carrera que
seguimos, el gnero de nuestros compaeros de clase, el distrito en el que
residimos. Las variables cualitativas se expresan en categoras o
modalidades. Ejemplos:
Variable Categoras o modalidades
. Estado Civil Soltero
Casado
Divorciado
Viudo
Conviviente
. Gnero Masculino
Femenino
. Ocupacin Directivos
Profesionales
Tcnicos
Auxiliar
. Evaluacin del rendimiento de un empleado
excelente
muy bueno
Bueno
Regular
Malo
. Motivacin en el proceso de aprendizaje
Interna
Externa
Ejemplos:

____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________

La variable cualitativa se clasifica en:
b.1 Nominal.- Cuando no existe una Jerarqua u orden en las modalidades.
Ejemplo:
- Sexo
Hombre, mujer
-
-
b.2 Ordinal.- Cuando si existe una jerarqua u orden en las modalidades.
Ejemplo:
- Grado de instruccin.
Primaria, secundaria, superior, etc

-


-


-
1.4.5. Parmetro
Una vez obtenido todos los valores de las variables a estudiar podemos
querer ahora describir este conjunto de valores usando slo una determinada
caracterstica o medida. Por ejemplo: el promedio de todos los valores
obtenidos, el porcentaje de cada una de las categoras, etc. Estos
indicadores cuando se toman de datos poblacionales se conocen como
Parmetro.
Por ello, los parmetros mas usado son:
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________
_____________________________________________________________

1.4.6. Estadstico
Son indicadores que provienen de datos muestrales. Los ms usados son:
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________

1.5.- Divisin de la Estadstica
a. Estadstica Descriptiva.-
Nos brinda la informacin que describe a una poblacin o muestra. Es el
proceso de recolectar, agrupar y presentar datos de una manera tal que
describa fcil y rpidamente los datos.

El estudio de la Estadstica descriptiva se refiere a los siguientes elementos:

Parmetros
(Poblacin)
Estadstico
(Muestra)
De Tendencia central:
Media aritmtica simple
Media ponderada
Mediana
Moda

p

Me
Mo

X

X
p
me
mo

De dispersin:
Rango
Varianza
Desviacin estndar
Coeficiente de variacin

Rango
o
2

o

C.V.

Rango
S
2
S
c.v.


Ejemplo:
El rango de ingresos de la PEA en Lima oscila entre 420 a 6,500 nuevos
soles mensuales. Si los distribuimos por percentiles tendremos que el 25%
de menores ingresos alcanza un ingreso no mayor a 532,5 nuevos soles. El
50% medio pobre de la PEA 1045,00 nuevos soles, el 75% medio alto
3050,00 nuevos soles y el 25% ms rico obtiene ingresos mayores a 3050
hasta 6,500 nuevos soles.
Reporte SPSS
N 3600,000
Percentiles
25% 532,50
50% 1045,00
75% 3050,00
100% 6500.00

b. Estadstica Inferencial.-
Nos permite arribar a conclusiones sobre el comportamiento de las
variables analizadas. Involucra la utilizacin de una muestra para sacar
alguna inferencia o conclusin sobre la poblacin de la cual parte la
muestra.
Ejemplo:
En el Ministerio de Trabajo se necesita tomar una decisin sobre a qu
nivel elevar el actual ingreso mnimo vital. Tienen ya estudios sobre la
canasta de consumo de los trabajadores y se espera mejorar la cobertura
de sus necesidades actuales. Calcular el ingreso promedio de la PEA, as
como su mximo, mnimo y moda les permitir definir cul es el nivel del
ingreso mnimo vital ms adecuado.
EJ ERCICIOS DE APLICACIN N 1.-
1. De acuerdo a la ocupacin que planea seguir despus de su titulacin,
analice para el rea en la cual quiere especializarse los tipos de problemas
que pueden surgir y el tipo de decisiones que tendr que tomar cuando el
anlisis estadstico puede ser de utilidad.
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
2. Clasifique adecuadamente las siguientes variables estadsticas y mencione
las categoras para aquellas que son de atributo o cualitativa:
a) Inflacin : ..................................................................
b) Gastos en publicidad : ...................................................................
c) Grupo sanguneo : ...................................................................
d) Precio de un producto : ...................................................................
d) Escuela a la que pertenecen el estudiante: ..............................
e) Material del que est hecho una casa:
e) Comida principal del da: ......
f) Lugar de distraccin preferido para los fines de semana:
f) Tipo de Hotel en la ciudad del Cuzco: ..
3. Un informe reciente de Fortune revel que los japoneses pronto controlarn
hasta un 35% de las ventas de autos en Estados Unidos, comparado con el
28% de finales de los aos 80 est apenas un 8% por encima de lo
ocurrido en 1970 esta informacin contiene estadstica descriptiva,
inferencial o ambas? Explique
____________________________________________________________
____________________________________________________________
____________________________________________________________
________________________________________________________
4. Cite varios ejemplos de comerciales de radio o televisin que utilicen la
estadstica para vender sus productos utilizan la estadstica descriptiva o
la inferencial?
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
5.- Plantee UD. ejemplos de su especialidad en donde se utilice estadstica
descriptiva o la estadstica inferencial.
Ejemplo 1:
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________
Ejemplo 2:
____________________________________________________________
____________________________________________________________
____________________________________________________________
____________________________________________________________












Recoleccin de Datos





Tcnicas

Instrumentos
Censo
Encuesta
Observacin
Entrevista
Entrevista por cuestionario
cuestionario
Experimento
Sesin 2
Escala de medicin de variables. Mtodo estadstico. Recoleccin de datos:
mtodos, tcnicas e instrumentos.

2.1. ESCALA DE MEDICIN DE VARIABLES.-
a. Nominales.- Se utilizan nombres para establecer categoras dentro de las
cuales las variables puedan registrarse exclusivamente. Por ejemplo:
- Gnero: se puede clasificar en masculino o femenino.
-________________________________________________________
-_________________________________________________________
-_________________________________________________________
b. Ordinales.- Clasifican las observaciones en categoras con un orden
significativo, por ejemplo
- Nivel de riesgo: bajo, alto, muy alto;
- ______________________________________________________
- ______________________________________________________
- ______________________________________________________

c. Escala de intervalo.- Las variables se miden de manera numrica, en la
cual no solo ordenamos las observaciones, sino que establecemos que las
distancias que hay entre un valor medido y el siguiente son iguales. Es
decir estamos en capacidad de distinguir, ordenar y establecer una
distancia entre los elementos. Tambin se indica que el cero en este tipo
de escala no es significativo. Ejemplo:
- La Temperatura: tomada con termmetro nos permite aseverar que
la cantidad de incremento de temperatura es igual para
distancias iguales en la escala.
- ______________________________________________________
- ______________________________________________________

d. De Razn.- Se basa en un sistema numrico en el cual el cero es
significativo. Adems permite establecer en que proporcin es mayor un
valor que otro. Por ejemplo:
- La participacin en un 40% de una empresa en el mercado, tiene el
doble de participacin que otra de 20%.
-
_______________________________________________________
_______________________________________________________
-
_______________________________________________________
_______________________________________________________



EJERCICIO: Plantee Ud.
a) PROBLEMA: _________________________________________________________________________________
POBLACIN: ___________________________________________________________________________________
MUESTRA : ___________________________________________________________________________________

CAUSAS

NOMBRE DE VARIABLE

TIPO DE VARIABLE

MODALIDAD

ESCALA DE
MEDICIN
















2.2. EL MTODO ESTADSTICO
Existe similitud entre el mtodo estadstico y el mtodo cientfico. As, el mtodo
estadstico consta de cuatro etapas:
Etapa 1. Planeamiento.
Etapa 2. Recoleccin de datos.
Etapa 3. Procesamiento.
Etapa 4. Anlisis e Interpretacin
2.2.1. PLANEAMIENTO.-
En esta etapa se disea la investigacin en todos sus aspectos:
- Formulacin del problema de investigacin.
- Se fijan los objetivos.
- Se plantean las hiptesis.
- Definicin de trminos y variables.
- Se define la metodologa del estudio
1 Tipo de estudio
2 Poblacin de estudio
3 Diseo muestral



2.2.2. RECOLECCIN DE DATOS.
La recoleccin de datos se refiere a los mtodos usados para obtener
informacin pertinente de las unidades elementales introducidas en una
muestra o en una poblacin. A esta etapa tambin se le conoce como
"Recopilacin de datos".
En la recoleccin de informacin hay que tener en cuenta que hay errores
de diversos tipos como son:
1) Los errores que pueden cometerse al recoger la informacin y la
forma de controlarlos.
i) Errores dependientes del observador
ii) Errores dependientes del mtodo de observacin.
iii) Errores dependientes de los individuos observados
2) Las ventajas y limitaciones de los diversos mtodos empleados
en la recoleccin de informacin.
3) El diseo de formularios que servir para la recoleccin de
informacin.
4) Las condiciones que deben reunir los individuos que se estudian y
los procedimientos ms convenientes para su eleccin.

a) MTODOS DE RECOLECCIN DE DATOS.-
a.1) DIRECTA.-
Es aquella que provienen de las fuentes originales y se recopilan
directamente en el campo especfico, por ello se llama tambin
fuente primaria. Por ejemplo:
1 Observacin
2 Entrevista
3 Entrevista por cuestionario
4 Experimento, entre otros
a.2) INDIRECTA.-
Cuando los datos obtenidos provienen de los datos previamente
recogidos y procesados por otros individuos. A veces se halla
publicado en textos o revistas y en otros casos no est publicado. (en
este ltimo caso su obtencin se har difcil a causa del carcter
confidencial con que fue recogida).
Por ejemplo:
- Publicaciones de las Instituciones, como el INEI
- Registros civiles (informacin de hechos vitales).
- Memorias de las empresas.
- Internet
- Boletn.
- Etc.

b) TCNICA E INSTRUMENTO PARA RECOLECTAR DATOS.-
b.1) TCNICA.-
- Censo: cuando se recoge datos de todos los elementos de la
poblacin.
- Encuesta: cuando se recoge datos de una muestra de la poblacin.

b.2) INSTRUMENTO.-
En una investigacin hay dos formas de obtener el instrumento de
recoleccin de datos:
1) Se puede optar por un cuestionario ya desarrollado y validado
en otra investigacin similar el que debe adaptase al estudio
actual.
2) Construir un instrumento de recoleccin de datos para la
investigacin el que previamente debe ser probado.
2.3.- EL CUESTIONARIO
El cuestionario es un instrumento de investigacin, es "un medio til y eficaz para
recoger informacin en un tiempo relativamente breve". Este instrumento se
utiliza, de un modo preferente, en el desarrollo de muchas investigaciones. La
construccin, aplicacin y tabulacin poseen un alto grado cientfico. Elaborar un
cuestionario vlido no es una cuestin fcil; implica controlar una serie de
variables.
En su construccin pueden considerarse preguntas cerradas, abiertas o mixtas.
a) Preguntas abiertas (no estructuradas).
En este tipo de preguntas abiertas es el usuario encuestado quien responde
con sus propias palabras a la pregunta formulada. Son esenciales para
conocer el marco de referencia del encuestado y para redactar despus las
alternativas a ofrecer en las preguntas cerradas. Por ello resultan oportunas y
adecuadas en el caso de estudios exploratorios o pre-encuestas (encuestas-
piloto o sondeos previos)
Qu opinin le merece la biblioteca?
..............................................................................................
Qu ms le gusta de la biblioteca?
........................................................................................................
b) Preguntas cerradas (estructuradas).
Se trata de un tipo que slo contiene la pregunta y no establece previamente
ninguna clase de respuesta, dejando sta, por tanto, al libre arbitrio del
encuestado. Para esta categora presentamos dos modelos bsicos de
preguntas, cada uno con sus variaciones: preguntas dicotmicas-mltiples y
preguntas de escalas.
Utiliza la biblioteca de su centro como lugar de trabajo, es decir, para trabajar con sus
propios apuntes, libros, etc., al margen de los servicios que en ella se prestan?. (Utilice
una sola respuesta).
1.- S 2.- No
Cules de los siguientes servicios que existen en la Biblioteca ha utilizado en su
visita de hoy a la Biblioteca?: (Marque todas las posibles respuestas)
1. Servicio de lectura en sala
2. Servicio de prstamo a domicilio
3.- Servicio informacin bibliogrfica
4. Servicio prstamo Interbibliotecario
5.-Servicio de atencin al usuario
6. Servicio de microfilm o microfichas
7. Servicio de formacin de usuarios
8. Servicio de acceso a bases de datos


b1.- Preguntas de escalas de medicin de actitudes y respuestas :
Cunto tiempo hace que visita la biblioteca? (Utilice una sola respuesta).
1.- Ms de diez aos ( ) 2.- de cinco a diez aos ( ) 3.-de uno a cuatro aos ( )
4.- menos de un ao ( ) 5.- hoy es la primera vez ( )

2.3.1.- Correccin del cuestionario
Al disear un cuestionario hemos de asegurarnos la mxima exactitud
de los datos. Ello depender de dos aspectos que se han de optimizar:
la precisin o fiabilidad y la validez de la informacin.
La validez, definida como la ausencia de sesgos, representa la relacin
entre lo que medimos y aquello que realmente queremos medir. Para
garantizar dicha evidencia se tomar en cuenta los siguientes mtodos:
1 El mtodo relacionado con el contenido se centra en la muestra de las
preguntas de un cuestionario (establecer el grado de representatividad
de los contenidos recogidos en las preguntas del cuestionario) y lo que
representa el completo dominio del contenido de las preguntas, por parte
de los usuarios encuestados.
2 El mtodo relacionado con los criterios se centra en las relaciones
estadsticas existentes entre las mediciones, para poder saber si los
cuestionarios pronostican lo que deben pronosticar.
La precisin, definida como la ausencia de error aleatorio, representa la
influencia del azar en nuestra medida; es decir, es el grado en el que las
mediciones estn libres de la desviacin producida por los errores
causales. Adems, la precisin de una medida es lo que asegura su
repetibilidad (si la repetimos, siempre da el mismo resultado).

2.3.2.- Comprobacin y prueba del cuestionario
Antes de iniciar el trabajo de campo, es imprescindible probar el
cuestionario sobre un pequeo grupo de poblacin. Esta prueba piloto ha de
garantizar las mismas condiciones de realizacin que el trabajo de campo
real. Su misin radica en contrastar hasta qu punto funciona el
cuestionario como se pretenda en un primer momento, y verificar si las
preguntas provocan el tipo de reaccin deseada. Por ello, s es necesario,
se han de eliminar ambigedades y preguntas superfluas, se pueden aadir
al cuestionario preguntas relevantes o cambiar el orden de stas para
agilizar el flujo de respuestas.
2.3.3.- Disear el aspecto formal del cuestionario
Las preguntas y el cuestionario deben presentarse en un formato atractivo y
fcil de entender.
Todas las preguntas y pginas deben estar numeradas claramente.
El cuestionario debe ser y debe parecer corto. Para ello debe procurar no
excederse en el nmero de preguntas ni ser redundante en los temas.
1 Es til presentar las preguntas agrupadas por temas y numeradas dentro de
cada uno de ellos.
2 Las preguntas deben estar ordenadas, de las fciles a las difciles y de lo
general a lo especfico. Esto ayuda a que el cuestionario sea y parezca fcil.
3 Si enva los cuestionarios por correo, adjunte una carta con sus datos
personales, los objetivos de la encuesta y la direccin o el nmero
telefnico de contacto.
4 Si los cuestionarios se completan por telfono o en una entrevista
personal, presntese primero, y preprese para responder a cuanto le
pregunten sobre el cuestionario.
Luego de elaborar el cuestionario es recomendable realizar una prueba
piloto para valorar los siguientes aspectos:
1 Verificacin de si el cuestionario responde a los objetivos del estudio.
2 Comprobacin de si el cuestionario es fluido. Es decir, el cuestionario debe
tener lgica y consistencia interna.
3 Comprensin de las preguntas y aceptabilidad por parte del encuestado.
4 Idoneidad en la secuencia de las preguntas.
5 Idoneidad de las respuestas cerradas preestablecidas.
6 Valoracin de los casos en que nos encontremos que los encuestados no
responden al cuestionario.
7 Idoneidad y nivel de preparacin de los encuestadores.
8 Aspectos logsticos: disponibilidad, recogida y entrada de cuestionarios, la
propia supervisin, etc.
MODELO DE CUESTIONARIO.-
CUESTIONARIO
Objetivo.- Conocer los Factores que influyen en el xito de un Profesional.
Instrucciones.-
- Este cuestionario est dividido en dos secciones: Datos generales, que nos permite caracterizar a la
poblacin en estudio y Datos especficos que en la parte 1 se refiere al xito de la carrera y la parte 2 a
los determinantes del xito de carrera.
- No existen respuestas malas o buenas por lo que le agradecer responder todas ellas de acuerdo a su
percepcin personal.
- Responda todas las preguntas y solo una opcin.
- Emplee lapicero para rellenar el cuestionario.
- Sus respuestas son annimas y absolutamente confidencial.
I.- DATOS GENERALES.-
1. Edad
Aos
2. Gnero
Masculino

Femenino
3. Etapa familiar
Soltero sin dependientes

Soltero con dependientes

Casado sin dependientes

Casado con dependientes

II.- DATOS ESPECIFICOS.-
Parte 1: XITO DE CARRERA
Por favor haga un crculo en un solo nmero que mejor refleje su propia percepcin.

Completa
mente de
acuerdo
De
acuerdo
Ni de
acuerd
o ni en
desac
uerdo
En
desac
uerdo
Compl
eta-
mente
en
desac
uerdo
4. Estoy en una posicin donde puedo poner mis propias metas 1 2 3 4 5
5. Estoy disfrutando los objetivos desafiantes que tengo en mi 1 2 3 4 5
actual trabajo
6. Tengo oportunidades de promocin ofrecidas por mi
empleador
1 2 3 4 5


Completa
mente de
acuerdo
De
acuerdo
Ni de
acuerd
o ni en
desac
uerdo
En
desac
uerdo
Compl
eta-
mente
en
desac
uerdo
7. Estoy obteniendo un salario que cubre mi actual estilo de
vida
1 2 3 4 5
8. Estoy bien pagado cuando comparo mi remuneracin con lo
ofrecido por trabajos similares en otras compaas
1 2 3 4 5
9. A menudo estoy haciendo algo con mis compaeros despus
del trabajo
1 2 3 4 5
10. Indique su salario anual en soles (incluyendo bonos y otros ingresos directos).
-------------
11. Indique el nmero de promociones (incremento en las responsabilidades del trabajo, alcance del
trabajo, rotacin a otras reas con mayor responsabilidad) recibidas en su carrera profesional.
-------------
Parte 2: DETERMINANTES DE XITO
Competencias Individuales
Las siguientes afirmaciones describen comportamientos de las personas. Favor indicar que tan preciso lo
describe a usted cada afirmacin:




Muy
imprec
isa
Moder
adame
nte
imprec
isa
Ni
imprec
isa ni
precis
a
Moder
adame
nte
precis
a
Muy
precis
a
12. Propongo buenas soluciones 1 2 3 4 5
13. Completo las tareas exitosamente 1 2 3 4 5
14. Llevo a cabo mis planes 1 2 3 4 5
Aspiraciones de carrera
Por favor haga un crculo en el nmero que mejor refleje sus aspiraciones de carrera.

Nunca
Casi
nunca
En
forma
Ocasio
nal
En
forma
Const
ante
Con
Frecu
encia
Casi
siempr
e
Sie
mp
re
15. Me gusta trabajar independientemente 1 2 3 4 5 6 7
16. Considero mi carrera exitosa si mi compaa me
garantiza un trabajo a largo plazo
1 2 3 4 5 6 7
17. El trabajo ideal para m es el que da tiempo para la
familia y actividades externas
1 2 3 4 5 6 7
18. Deseara obtener un trabajo que sea crucial para la
organizacin
1 2 3 4 5 6 7

Redes personales
19. Indique el nmero total de personas que han actuado para ayudar a tu carrera, hablando por ti,
proporcionndote informacin, oportunidades para la carrera, asesora o apoyo psicolgico, o con
quin has hablado regularmente sobre dificultades en el trabajo, oportunidades de trabajo,
alternativas u objetivos de la carrera a largo plazo.

-------------
20. Por favor indique el nmero de contactos, que fueron en el pasado o son actuales miembros de la
organizacin donde se desempea, que se encuentran o encontraron en niveles mayores al de usted
en la organizacin.
-------------
Experiencia profesional
21. Aos de experiencia profesional. ------------

Gracias por tu tiempo y esfuerzo en llenar este cuestionario












EJ ERCICIOS DE APLICACIN N 2.
1.- Una empresa dedicada a la fabricacin de un documento de normas legales tiene
planeado introducir al mercado dicha publicacin. Para ello le encarg a una
empresa investigadora de mercado la realizacin de un estudio el que le interesaba
averiguar, entre otras cosas, la aceptacin de la nueva publicacin y el precio que
las personas estaran dispuestas a pagar. La encuesta fue realizada en Lima y se
entrevistaron a 250 personas. De los encuestados, el 67% estaran dispuestos a
comprar dicho producto. Adems se concluy que el precio del producto debera
oscilar entre 1,50 y 2.50 soles.
Determine:
a) La poblacin y la muestra.
b) Las variables, tipo y su escala de medicin.
c) Los estadsticos y los parmetros (si existen)
2.- Se realiz un estudio para establecer las posibilidades que tena el candidato X de
ganar las elecciones municipales en el distrito A. Se conoce que el 25% de los
habitantes del distrito vive hace ms de 5 aos en dicha zona.
Se encuestaron a 200 personas y se obtuvo lo siguiente:
EL 40% de los habitantes del distrito A no ha decidido an su voto.
El 23,5% indic que votaran por el candidato X.
El principal problema a resolver por el nuevo alcalde es el de la delincuencia, tal
como lo indicaron el 75% de los encuestados.
Determine:
a) Poblacin y la muestra.
b) Las variables de estudio, tipo y su escala de medicin.
c) Los estadsticos y los parmetros (si existen)
d) Elabore Ud. un cuestionario tomando en cuenta los resultados dados y otras
preguntas que Ud. considere conveniente y que no se haya tomado en cuenta.
3) La revista Forbes report datos sobre las condiciones y estilos de vida en varias
ciudades de Estados Unidos, tal como aparece en el cuadro.
Ciudad Poblacin Mediana Atraccin Tasa de
(Millones) de ingreso ms visitada criminalidad
Atlanta 3,5 43,249 Stone Mountain 846.2
Baltimore 2,5 43,291 Harborplace 1,296.
St. Louis 2,5 39.079 Gateway Arch 263.4
Philadelphia 5,0 43,576 Liberty Bell 693.1
Raleigh-Durham 1,0 40.990 State Fair 634.9
______________________________________________________________
a. Identifique:
Variable: _______________________________________________
Tipo de variable: _________________________________________
Escala de medida: _______________________________________
b. Cules son descriptivas y cules inferenciales?
Descriptivas: ___________________________________________
Inferenciales: ___________________________________________

4.- Plantee ud. 3 problemas de su especialidad, y para cada uno de ellos establezca
la poblacin, muestra, causas, variables, tipo de variables y escala de medicin.




















Representaciones
graficas


Barras


Lineales


Circulares

Distribucin de
frecuencias

Variables Cualitativas

Variables Cuantitativas
discretas
SESIN 3
Estadstica descriptiva. Distribucin de frecuencia para variable cualitativa y cuantitativa
discreta. Cuadros. Grficos. Interpretacin.
3.- DISTRIBUCIN DE FRECUENCIA.
Frecuencia.- es el nmero de casos pertenecientes a un grupo determinado.
3.1 DISTRIBUCIN DE FRECUENCIA: VARIABLE CUALITATIVA
N NOMBRE DE
VARIABLE
f
i
h
i
p
i

1
2
3
4
.
.
.
k

MODALIDADES
f
1

f
2

f
3

f
4

.
.
.
f
k

h
1
= f
1
/ n
h
2

h
3

h
4

.
.
.
h
k

p
i
=h
1
*100%

=
=
k
i
i
n f
1

=
=
k
i
i
h
1
1

=
=
k
i
i
p
1
% 100




Identificado la variable de tipo cualitativo, se procede de la siguiente manera:
a.- Se coloca en una columna todas las categoras o modalidades de la variable de
atributo.
b.- Se completan solamente con tres columnas: f
i
, h
i
y p
i.
f
i
frecuencia absoluta simple
h
i
frecuencia relativa simple
p
i
frecuencia porcentual simple.
Ejemplo:
1) Suponga que el Gerente de una empresa desea saber el nmero de trabajadores
segn su estado civil, con la finalidad de asignarles cierta compensacin familiar.
CUADRO N 1. Distribucin de frecuencia de los trabajadores de la empresa
FIELD S.A. segn su estado civil. 2009
ESTADO CIVIL Frecuencia
absoluta
simple (fi)
Frecuencia relativa
simple
( h
i
)
Frecuencia
porcentual simple
(pi) (%)
Casados
Divorciados con hijos
Divorciados sin hijos
Solteros
Convivientes

52
32
41
99
26

52/ 250 = 0,21
32/ 250 =
0,21 * 100 =
*100=

TOTAL 250 1 100%
Fuente: ________________________________________
Interpretacin:
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________

2) Se tiene el siguiente cuadro de los trabajadores de la panadera y fuente de soda
Baguetipan en el distrito de Los Olivos, segn categora para 2009.
Se pide elaborar el cuadro de distribucin de frecuencia.
Solucin.-
CUADRO N 2. _________________________________________________
Categora f
i
hi Pi (%)
Panaderos
Cajeras
Tienda
Limpieza
Azafatas
Secretaria

7
2
4
2
4
1


Total 20 100%
Fuente: _____________________________________

Interpretacin.-
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
3.2. DISTRIBUCIN DE FRECUENCIA: VARIABLE CUANTITATIVA (discreta)
N NOMBRE DE
VARIABLE
f
i
h
i
p
i

1
2
3
4
.
.
.
k

VALORES
DE LA
VARIABLE

f
1

f
2

f
3

f
4

.
.
.
f
k

h
1
= f
1
/ n
h
2

h
3

h
4

.
.
.
h
k

p
i
=h
1
*100%

=
=
k
i
i
n f
1

=
=
k
i
i
h
1
1

=
=
k
i
i
p
1
% 100


3.- Se tiene informacin de un tamao de muestra de 150 familias de las zonas
marginales de la ciudad de Lima segn los registros en la Municipalidad de
Lima, para mayo 2007. Dicha informacin pueden ser de O hijos, 1 hijo, 2 hijos,
3 hijos o 4 hijos.
Cuadro N 3: _________________________________________________
_________________________________________________
N Nmero de hijos f
i
hi p
i
(%) P
i
(%)
1
2
3
4
5
0 hijos
1 hijo
2 hijos
3 hijos
4 hijos
2
15
40
55
38

Total 150 1 100%
Fuente: _________________________________________________
Interpretacin:
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_____________________________________________________________

3.3 REPRESENTACIONES GRFICAS:
A continuacin se presenta una serie de grficos que se ha elaborado utilizando la
funcin grficos del programa SPSS.



i) GRFICO DE BARRAS

2. Est conforme con la
atencin que le brinda
su seguro?
120
65
15
0
20
40
60
80
100
120
140
SI NO NO SABE


ii) GRFICO CIRCULAR

3. Si tuviera oportunidad de cambiarse a otro seguro
social, Lo hara?
No sabe
30%
No sabe
25%
Si
45%






iii) GRFICO DE REA

5. Le interesara afiliarse al
sindicato de trabajadores
del seguro al cual Ud. per-
tenece.
0
20
40
60
80
100
120
SI NO NO SABE

iv) GRFICO: PICTOGRAMAS







v) GRFICO: CARTOGRAMAS

Ejemplo:

a) Elabore el grfico para el cuadro N 1.









b) Elabore el grfico para el cuadro N2








C) Elabore el grfico para el cuadro N 3.









EJERCICIOS DE APLICACIN N 3.-
1- Se hizo un trabajo de investigacin donde se capt informacin de las causas
por las cuales las nias son internadas en los hogares para menores. Se tom
informacin de las fichas sociales de las nias del hogar de menores Colonia N
2 de Ancn en 2009.
Categora Frecuencia
Abandono maternal
Abandono paternal
Maltrato
Escasez econmica
Hurfanos
Abandonados
Otros
Sin datos
15
44
6
32
2
9
6
4
a Complete las columnas que faltan al cuadro o tabla de distribucin de
frecuencia.
b Indique un nombre adecuado para el cuadro respectivo.
c Seale la fuente de dicho cuadro.
d Interprete dicho cuadro
e Qu significa f
2
, p
3

2. El gobierno decide destinar S/. 200,000 para el desarrollo de un pueblo de la selva, la
cual ser invertida solo en educacin (35%), vivienda (25%) y alimentacin (?). Se
muestra un diagrama circular o de pie de como se ha distribuido este dinero.


35%
25%

a) Cunto ha sido utilizado en S/. del total, en alimentacin?
b) Cul es el ngulo central correspondiente a educacin?
c) Cunto se utilizo en vivienda?

3.- Se tiene el siguiente cuadro referente a la Pobreza en el Per para 2007, se pide:
a Plantee un nombre para dicho cuadro.
b Grafique dicha variable utilizando las cifras porcentuales.
c Interprete dicho cuadro y grfico.
MBITO
GEOGRFICO

TOTAL
GENERAL
POBRE
NO
POBRE

TOTAL EXTREMO
NO
EXTREMO

TOTAL


100.0


44.1


18.7


25.4


55.9

COSTA
Urbana
Rural

SIERRA
Urbana
Rural

SELVA
Urbana
Rural

LIMA
METROP.

100.0
100.0


100.0
100.0


100.0
100.0

100.0

43.8
43.2


44.6
61.4


40.1
58.0

28.0

12.4
22.9


12.5
40.4


13.1
40.6

3.7


31.5
20.2


32.2
20.9


27.1
17.5

24.3


56.2
56.8


55.4
38.6


59.9
42.0

72.0

FUENTE: INEI - 2007

4.- La siguiente informacin ha sido obtenida por la empresa X en un estudio de
mercado en Lima Metropolitana para el ao 2008, en relacin a la marca de cerveza
que compraron los consumidores en los mercados WONG y mercado METRO.

Nmero de consumidores
MERCADO WONG MERCADO METRO
Cristal
Pilsen
Cuzquea
Brama
TOTAL
250
90
150
10
500
200
180
240
80
700

a) Exprese los datos del cuadro anterior en valores porcentuales.
b) A qu conclusin llegara Ud con los resultados obtenidos.











Distribucin de frecuencias
- variables cuantitativa continua -
Tipos Estructura Representaciones graficas
Histograma
Polgono de frecuencia
Ojiva
SESIN 4
Distribucin de frecuencias para una variable cuantitativa continua. Cuadros y
grficos: histogramas, polgonos de frecuencia y ojiva. Interpretacin.
4.- DISTRIBUCIN DE FRECUENCIA Y GRFICOS.-
4.1. DISTRIBUCIN DE FRECUENCIA: VARIABLE CUANTITATIVA (continuos o
discretos con muchas alternativas)
- Distribucin de frecuencias.- Es el cuadro resumen de datos, los cuales
estn ordenados en clases o grupos con el nmero de observaciones o
casos que pertenecen a cada uno de ellos.
- Clase o grupo.- Es la distribucin de los datos en categoras. Contiene al
lmite inferior ( l
i
) y al lmite superior ( l
s
) de cada categora.
Cuadro N ____: Distribucin de frecuencia ________________________
_____________________________________________
N Clase o
grupo
f
i
m
i
F
i
p
i
% P
i
%
1
2
3
4
.
.
.
K
l
1
-l
2

l
2
-l
3

l
3
-l
4

l
4
-l
5

.
.
.
l
i
-l
s

f
1

f
2

f
3

f
4

.
.
.
f
k

m
1
=
(l
1
+l
2
)/2
m
2 =

m
3 =

m
4 =

.
.
m
k =

F
1
= f
1

F
2
= f
1
+ f
2

F
3
= f
1
+ f
2
+ f
3

F
4

.
.
.
F
K
=n
p
1
= f
1
*100 / n
p
2
= f
2
*100 / n
p
3
= f
3
*100 / n






pk = f
k
*100 / n
P
1
= p
1

P
2
= p
1
+ p
2

P
3
= p
1
+ p
2
+ p
3







P
k
= 100 %



=
=
k
i
i
n f
1

=
=
k
i
i
p
1
% 100


Fuente: ___________________________________________________

f
i
= Frecuencia absoluta.
Nmero de observaciones que se registra en cada grupo o clase.
m
i
= Marcas de clase.
Promedio aritmtico de los lmites de clase. Se obtiene sumando el
lmite inferior ( l
i
) y el lmite superior ( l
s
) y se divide entre dos.
F
i
= Frecuencia absoluta acumulada
Es el nmero de observaciones que pertenece a dicha clase ms el
nmero de individuos pertenecientes a las clases anteriores.
p
i
% = Frecuencia porcentual
La frecuencia absoluta se divide entre el nmero de observaciones
(n) y se multiplica por 100.
P
i
% = Frecuencia porcentual acumulada
Es la suma de la frecuencia porcentual de cada clase o grupo ms
las frecuencias porcentuales halladas en las clases anteriores.
Rango = Es la diferencia que existe entre el dato mayor y el dato menor.
K = Nmero de clases o grupos en los que se van a agrupar las
observaciones.
I A
i
= Intervalo de Clase amplitud de clase.
Es la amplitud de cada uno de las clases o grupos en los que se
encuentra distribuidas las frecuencias.

Procedimiento para llenar una tabla de distribucin de frecuencias.-
1 Determinar el rango de la muestra.
Rango = Dato mayor - Dato menor
2 Determinar el valor de k por cualquiera de estas formas:
a. Ley de Sturges k = 1 +3.3 log n ( Muestra)
k = 1 + 3.3 log N ( Poblacin )
b.
n k =
( muestra ) ;
N k =
( Poblacin)
c. 5 < k < 20
- Una tabla de distribucin con slo 5 clases o grupos ( k = 5), la
informacin estara muy comprimida.
- Una tabla de distribucin con 20 clases o grupos (k=20), la informacin
estara muy dispersa.
3 Determinar el valor de i A
i
(intervalo de clase)
Rango
A
i
= ----------------
k
4 Determinar los lmites para la primera clase. ( l
1
y l
2
)
l
1
= dato menor
l
2
= l
1
+ i y as sucesivamente

Ejemplo:
La Panadera y Fuente de Soda Baguettipan E.I.R.L. en el distrito de Los Olivos,
cuenta con 20 trabajadores y se tiene informacin de su sueldo o ingreso de los
trabajadores.
Datos sin agrupar.-
420 350 350 320 190 190 300 300 190 190
350 350 300 400 300 350 320 300 300 350
Se pide elaborar una tabla de distribucin de frecuencias.
Solucin.-
1 Determinar el rango:

2 Calculamos k, utilizando la ley de Sturges
k =
3 Calculamos el intervalo, Ai
Ai = ----------- =

4 Determinar los lmites de la primera clase o grupo.
l
1
=
l
2
=
y as sucesivamente,
Completando en el cuadro siguiente,
CUADRO N 4. ___________________________________________________
___________________________________________________
N f
i
m
i
F
i
p
i
Pi
1

2

3

4

5


f
1

f
2


f
3


f
4

f5

m
1
=

m
2 =


m
3 =


m
4 =


m
5 =

F
1
=

F
2


F
3


F
4


F
5

p1= P1 =









=

=1 i
i
f

=
=
i
i
p


Fuente: __________________________________________________________________
Interpretacin:
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________

4.2. REPRESENTACIONES GRFICAS: HISTOGRAMA, POLGONO DE
FRECUENCIA Y OJIVA.
Las grficas ms comunes y de fcil aplicacin son:
- HISTOGRAMA
- POLGONO DE FRECUENCIA
- OJIVA.
HISTOGRAMA Y POLGONO DE FRECUENCIA.-
Cuando se est efectuando el estudio con una gran cantidad de datos es
conveniente representar grficamente una tabla de distribucin de frecuencias,
ya que permite observar con ms claridad algunas caractersticas de los mismos.
Al hacer la representacin grfica de los datos se van formando una serie de
rectngulos que tienen como base los limites de las clases o grupos y como
altura la frecuencia absoluta (o puede ser tambin la frecuencia porcentual), a
esta grfica se llama histograma. Al unir los puntos medios o marcas de clase
de todos los rectngulos, se va formando una lnea el cual se le conoce con el
nombre de polgono de frecuencia.
Debe tenerse en cuenta al representar datos en ejes coordenados lo siguiente:
en el eje de las abscisas (X) se representar siempre la variable que se est
estudiando, mientras que en el eje de las ordenadas (Y) se representar las
frecuencias absolutas correspondientes.

Ejemplo:
GRFICO N 4. ________________________________________________________
_________________________________________________________








OJIVA.-
GRAFICO N 5. _______________________________________________________






Interpretacin:
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
EJERCICIO DE APLICACIN N 4
1. Se da los 45 ingresos quincenales en dlares:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
a Elabore una tabla de distribucin de frecuencia con k= 8; realice su respectiva
interpretacin.
b. Construya el histograma, polgono de frecuencia y ojiva.
2. Dada la distribucin:
----------------------------------------------
m
i
6 8 10 12
---------------------------------------------
f
i
? ? 13 15
---------------------------------------------
F
i
4 13 ? ?
---------------------------------------------
a. Complete el cuadro.
b Defina Ud. una variable X e interprete la tabla de distribucin de frecuencia.
c. Elabore un grfico de ojiva.

3. En la siguiente distribucin de frecuencias se dan los pesos de una muestra de 45
alumnos:
----------------------------------------------
m
i
6 8 10 12
---------------------------------------------
f
i
? ? 13 15
---------------------------------------------
F
i
4 13 ? ?
---------------------------------------------
a. Interprete el cuadro.
b. Elabore su histograma, polgono de frecuencia y ojiva.
4. En una determinada empresa de produccin de computadoras, el volumen de
ventas para el ao 2006 expresado en miles de dlares se da en el siguiente cuadro:
---------------------------------------
Volumen de ventas fi
----------------------------------------------------------
[20 - 40> 10
[40 - 60> 25
[60 - 80> 46
[80 - 100> 9
[100 - 120] 10
---------------------------------------

a Complete la tabla de distribucin de frecuencias.
b Interprete dicho cuadro y grafique.
5.- Se hizo una encuesta sobre el nmero de personas aficionadas a la lectura y se las
clasific por edades. Se obtuvo el siguiente histograma.


7
6
5
4
3
2
1

10 20 30 40 50 60 70 Edad


a Halle el tamao de muestra.
b Calcule el porcentaje de personas menores de 60 aos aficionadas a la lectura.
c Interprete el grfico.

6.- En la Universidad Cesar Vallejo, en un semestre acadmico hay un total de 650
alumnos matriculados. Segn su especialidad se clasifican en: Contabilidad (200),
Administracin (120), Turismo (45) e Ingeniera de Sistemas (235). Halle los
porcentajes que representa cada una de las especialidades y elabore un grfico.

7.- Se tiene las temperaturas observadas durante 24 das en el polo norte en el
siguiente cuadro. (fi= N de das).
Temperatura Fi pi(%)
[-17 a - 15>
[-15 a - 13>
[-13 a - 11>
[-11 a - 9>
[ - 9 a - 7>
[ - 7 a - 5]

5
10

2



13

4
a) Complete la tabla de distribucin de frecuencias.
b) Durante cuntos das se observ una temperatura de -11 a -9?
c) Durante cuntos das se observ una temperatura de -9 a -5?




















































Distribucin de
frecuencias para
2 variables

2 Variables Cuantitativas

2 Variables Cualitativas
TABLAS DE
CONTI NGENCI A
SESIN 5
Distribucin de frecuencia para dos variables cuantitativas y/o cualitativas. Grficos.
5.1.- ANLISIS DE DATOS BIVARIADAS
Hemos estudiado ahora datos provenientes de una sola variable, sin embargo
con frecuencia es necesario analizar respecto a la relacin entre dos variables.
Supongamos que se toma una muestra de tamao n de una poblacin que se
est investigando.
Sean X e Y las variables a estudiar, tal que los datos obtenidos son:
( X
1
,Y
1
),( X
2
,Y
2
), .,( X
n
,Y
n
).
Distribucin conjunta y marginal.-
La tabla de frecuencia que agrupa a esta informacin se conoce tabla de
contingencia. Por ejemplo, para el caso de dos variables cualitativas con dos
modalidades o categoras, la tabla sera:

Y
Categora 1 Categora 2 Total
Categora 1
Celda
f
11

Celda
F
12

Total marginal
f
1.

Categora 2
Celda
f
21

Celda
f
22

Total marginal
f
2.

Total
Total
marginal
f
.1

Total
marginal
f
.2

Total de
individuos
n
Distribucin Marginal
Cuando slo interesa conocer la frecuencia de ocurrencia de cada una de las variables
por separado se habla de Frecuencia Marginal de la variable
Por ejemplo:
Hbitos de Fumar
SEXO
SI NO
Total
VARON
MUJER
DISTRIBUCION
CONJUNTA

DISTRIBUCION
MARGINAL

Total
DISTRIBUCION
MARGINAL
Tamao
de
muestra


Cuntas variables tenemos? ________________________________________________
Cules son?

Ejemplo 1:
Frecuencia absoluta: conjunta y marginal

Hbitos de Fumar
SEXO
SI NO
Total
VARON

800 1200 2000
MUJER

1000 2000 3000
Total

1800 3200 5000


Frecuencia relativa: conjunta y marginal
X / Y
Categora
variable Y
Categora
variable Y
Total
Categora
variable X
f
11
n
f
12
n
Total
marginal
f
1.
/n
Categora
variable X
f
21
n
f
22
n
Total
marginal
f
2.
/n
Total
Total
marginal
f
.1
/n
Total
marginal
f
.2
/n
Total de
indivduos
n/n



Hbitos de Fumar
SEXO
SI NO
Total
VARON 0.16 0.24 0.40
MUJER 0.20 0.40 0.60
Total 0.36 0.64 1





Frecuencia porcentual: conjunta y marginal
SEXO
Hbitos de Fumar

SI NO
VARN

MUJER

Total



Ejemplo 2:
Frecuencia absoluta: conjunta y marginal
Nacionalidad
SEXO
Masculino Femenino
Peruano 6 2 8
Chileno 1 2 3
Argentino 3 1 4
Ecuatoriano 1 1 2
Boliviano 1 2 3
Total 12 8 20

Cuntas variables tenemos? ______________________________________________
Cules son? __________________________________________________________
Frecuencia relativa: conjunta y marginal
Nacionalidad
SEXO
Masculino Femenino
Peruano
Chileno
Argentino
Ecuatoriano
Boliviano
Total
Frecuencia porcentual: conjunta y marginal
Nacionalidad
SEXO
Masculino Femenino
Peruano
Chileno
Argentino
Ecuatoriano
Boliviano
Total
Frecuencia Condicional
Cuando se pregunta por la frecuencia relativa de una de las variables, digamos X,
restringida a los elementos observados de una clase dada de la otra; esto es, estudiar el
comportamiento de una variable dado un valor fijo de la otra.

Y
Categora
variable Y
Categora
variable Y
Categora 1 f
1
/ f
.1
f
12
/f
.2

Categora 2 f
21
/f
.1
f
22
/f
.2

Total 1 1
A continuacin veremos dos casos de tablas y grficos bivariadas:
1 Cualitativa vs cualitativa
2 Cualitativa vs cuantitativa

5.2.- CUALITATIVA VS CUALITATIVA
1.- Se quiere investigar la relacin que existe entre el nivel de estudios del padre y el nivel
de estudios de la madre. Ver la data encuesta USA 1991
En primer lugar convertir las variables cuantitativas Aos de escolarizacin del
padre y Aos de escolarizacin de la madre en variables cualitativas, usando
la recodificacin en distintas variables y use los siguientes intervalos.
1.- Menos de 11 aos
2.- 12 a 16 aos
3.- Ms de 16 aos
Luego realizar la recodificacin seguir los pasos que se indican a continuacin:





CUADRO 1
Tabla de contingencia educacion del padre * educacion de la madre
% de educaci on del padre
60.9% 27.6% 11.5% 100.0%
16.0% 73.7% 10.4% 100.0%
26.4% 33.9% 39.7% 100.0%
33.7% 45.6% 20.8% 100.0%
Menos de 11 aos
12 a 16 aos
Ms de 16 aos
educacion
del padre
Total
Menos de
11 aos 12 a 16 aos
Ms de
16 aos
educacion de la madre
Total


Los padres estn casados en mayor porcentaje con mujeres que tienen su mismo nivel
de estudio. Los hombres con menos de 16 aos de estudios no priorizan como pareja a
mujeres con alto nivel de estudio, ya que solo el 11.5% de ellos solo se juntaron con
mujeres con mas de 16 aos de estudios. Principalmente los hombres con un nivel
intermedio de estudios buscan con mayor porcentaje a mujeres con el mismo nivel de
estudio.
CUADRO 2

Tabla de contingencia educacion del padre * educacion de la madre
% de educaci on de l a madre
56.9% 19.1% 17.5% 31.5%
16.2% 55.4% 17.1% 34.3%
26.8% 25.5% 65.4% 34.2%
100.0% 100.0% 100.0% 100.0%
Menos de 11 aos
12 a 16 aos
Ms de 16 aos
educacion
del padre
Total
Menos de
11 aos 12 a 16 aos
Ms de
16 aos
educacion de la madre
Total

Las mujeres con ms de 16 aos de educacin se relacionan en mayor porcentaje con
hombres que tengan menos de 16 aos de estudio, llegando solo al 17.5%. Mientras
que en el caso de los hombres con alto nivel de estudios llegan hasta el 26.4% (ver
cuadro 1).
Mientras que los hombres con un nivel intermedio de estudio se relacionan en mayor
cantidad con mujeres de su mismo nivel, son las mujeres con alto nivel de estudio las
que se relacionan en mayor cantidad con hombres que tengan alto nivel de estudio.








5.3.- CUALITATIVA VS CUANTITATIVA
Se quiere investigar la relacin que existe entre el nivel de estudios y el salario que
perciben. Ver la data de empleados
En primer lugar convertir las variables cuantitativas Aos de escolarizacin en
variables cualitativas, usando la recodificacin en distintas variables y use los
siguientes intervalos.
1.- Menos de 11 aos
2.- 12 a 16 aos
3.- Ms de 16 aos
Luego realizar la recodificacin seguir los pasos que se indican a continuacin:









$24,399 $15,750 $21,150 $24,000 $29,250 $34,500
$31,345 $16,200 $24,150 $28,050 $34,500 $103,750
$67,852 $27,000 $59,375 $67,188 $75,000 $135,000
Menos de 11 aos
11 a 16 aos
mas de 16 aos
Nivel
educativo
Media Mnimo Percenti l 25 Mediana Percenti l 75 Mximo
Salario actual







EJERCICIOS DE APLICACIN 5.-
1.- El inters de una comunidad es saber si la presentacin de caries en nios est
asociada con la experiencia de caries en los padres, para esto se tomaron 523 nios
de entre 12 y 15 aos de edad y se les clasific segn su estado dental (Baja,
Normal y Alta) y segn la experiencia de caries en sus padres (Baja, Normal y Alta),
obtenindose los siguientes datos:
Baja Normal Alta
Baja 142 20 48
Normal 46 108 47
Alta 30 15 67
Padres
Nios


A qu conclusiones llega?
2.- En la ciudad de Lima se ha incrementado durante los ltimos cinco aos el nmero
de restaurantes de comida rpida. Debido a esto los expertos la empresa de
investigacin de mercado Consultores-ECE se pregunta. La preferencia de un
cliente por la comida rpida tiene que ver la edad?. La empresa eligi una muestra
aleatoria de 500 clientes de comida rpida mayores de 16 aos y se les pregunt su
restaurante favorito, obtenindose los siguientes datos:

Kentuky McDonalds Burger-King Otro
16 - 21 75 34 10 6
21 - 30 89 42 19 10
30 - 49 54 52 28 18
50 a ms 21 25 7 10
Grupo de
edad
Restaurant


Cules sern las conclusiones que llegarn los expertos de la empresa
Consultores-ECE?
3.- En la Universidad Csar Vallejo se realiza un estudio para saber si la orientacin
poltica es similar en ambos sexos. Para lo cual se realizo una encuesta a 126
estudiantes de ambos sexos tal como se muestra en la siguiente tabla:
Cul ser las conclusiones que llegar el presente estudio?




























Mediana

Moda

Media
Aritmtica

Medidas de
tendencia
central
SESIN 6
Medidas de tendencia central. Media aritmtica, Mediana y Moda.
6.1 INTRODUCCIN
Para la aplicacin de las medidas de tendencia central y las de dispersin, es
necesario que previamente tengamos una idea del comportamiento de la variable, y
es as que ayudados por su representacin grfica, el cual puede ser el histograma,
nos permita describir fcilmente la forma de la distribucin, el cual es importante
pues toda la base estadstica (supuestos) radica en que la distribucin de la variable
en estudio tiene una distribucin normal o curva normal.
Por ello, de una inspeccin puede deducirse si las observaciones estn o no muy
concentradas en pocos valores de la variable, o si la concentracin se produce en el
centro del recorrido de la variable o en uno de los extremos.


Curva normal
ii) Campana de Gauss





= Me = Mo
Simtrica










Asimtrica a la izquierda Asimtrica a la derecha

El conocimiento de la asimetra de una distribucin es importante, porque as puede
saberse si las observaciones tienden a concentrarse en valores bajos o altos de la
variable.

6.2 MEDIDAS DE TENDENCIA CENTRAL.-
Son aquellos valores que representan a un conjunto de datos y que generalmente
estn ubicados en la parte central de la distribucin. Estas medidas solo se calculan
para variables cuantitativas.
EL conocimiento de estas medidas es de gran utilidad tanto en los niveles de
decisin como de ejecucin.
Las principales medidas de tendencia central son:
MUESTRA POBLACIN
- Media aritmtica simple
X


- Media ponderada
X
p
p


- La Mediana me Me
- La Moda mo Mo

6.2.1 LA MEDIA ARITMETICA SIMPLE.-
Llamado tambin promedio aritmtico, es la medida ms conocida y utilizada en
su forma ms sencilla.
A) Para datos sin agrupar: Sea X
1
, X
2
, ...... , X
n
; valores de la variable X (Variable
cuantitativa).
La media aritmtica simple poblacional se representa por y se calcula como:
Suma de valores de la variable
= -------------------------------------------------------------------------------
Tamao de la Poblacin (N de observaciones)

N
X
N
i

=
=
1


La media aritmtica simple muestral est representada por
X
y se calcula como:


n
X
X
n
i

=
=
1

Ejemplo:
Halle la edad promedio de cinco personas cuyas edades son:
8, 26, 23, 19, y 44
Solucin:


Interpretacin: __________________________________________________
B Para datos agrupados .- Sea m
1
, m
2
, m
3
,....,m
k
, las marcas de clases en una
tabla de distribucin de frecuencias y las fi, las frecuencias simples absolutas de
cada grupo o clase, entonces:
La media aritmtica poblacional se calcula:

N
m f
k
i
i i
=

donde:
f
i
= Frecuencia absoluta simple de cada grupo o clase.
m
i
= Marca de clase
N = Tamao de la poblacin
La media aritmtica muestral se calcula:

n
m f
X
k
i
i i
=

donde:
f
i
= Frecuencia absoluta simple de cada grupo o clase.
m
i
= Marca de clase
n = tamao de la muestra

Ejemplo:
Se ha estudiado el Centro de Salud Villa Esperanza ubicado en el Kilmetro 18.5
de la Av. Tpac Amaru - Comas. Se obtuvo informacin referente a la frecuencia
con que acudan las mujeres embarazadas para su Control de gestacin durante
2007, obtenindose la siguiente informacin:
Tiempo de gest.
(semanas)
f
i

[ 4 - 12>
[12 - 20>
[20 - 28>
[28 36]
9
18
16
17
Total 60
Se pide hallar el tiempo promedio de gestacin de las madres que asisten a su
control pre-natal.
Solucin.-
Se trabajar primero un cuadro auxiliar:
Tiempo de gest.
(semanas)
f
i
m
i
f
i
m
i

[ 4 - 12>
[12 - 20>
[20 - 28>
[28 36]
9
18
16
17

60
Fuente: ______________________________________________________

Interpretacin:
__________________________________________________________________
__________________________________________________________
6.2.2 MEDIA PONDERADA
Es aquella "media" que se toma en cuenta para su clculo algunas ponderaciones
o "pesos" previos.
Sea p
1
, p
2
, ... , p
r
, los pesos asociados a los valores de la variable X: X
1
, X
2
, ...,
X
r
respectivamente, luego la media ponderada poblacional y muestral ser:

=
=
=
r
i
i
r
i
i i
p
p
X p
1
1

=
=
=
r
i
i
r
i
i i
p
p
X p
X
1
1

Ejemplo 1:
Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. EL peso medio de las
mujeres es de 60 kilos y el de los hombres es de 80. Cul es el peso medio de
las 10 personas del ascensor?
Solucin:




Ejemplo 2.-
Se quiere saber el precio promedio de venta de un kilo de limn en el mercado de
Covida en el distrito de Los Olivos, para ello se tom una muestra en la que se
encontr que 5 Kg. se vende a S/. 1.20 el Kg. y 3,5 Kg. se vende a S/. 1.00 el
Kg.
Solucin.-
p
1
= 5 ; p
2
= 3,5 ; X
1
= 1.20 X
2
= 1.00

X
p = ----------------------------------------------------------


X
p= ----------------------------------- = soles por kilo

Interpretacin:______________________________________________________

Ejemplo 3:
SI los porcentajes de mujeres en una muestra de 3 colegios diferentes en Lima
Metropolitana son:
COLEGIO N DE ALUMNOS % DE MUJERES
----------------------- ---------------------------- ----------------------------
A 30 50
B 50 70
C 45 30
Hallar el porcentaje promedio de mujeres por escuela.
Solucin.-
Aplicando la frmula: p
1
= 30, p
2
= 50, p
3
= 45
X
1
= 50, X
2
= 70, X
3
= 30


X
p = ....................................................................



X
p= .......................... =

Luego el porcentaje promedio de mujeres en los 3 colegios es de %

6.2.3 LA MEDIANA.-
Es la medida que divide en dos grupos iguales a la distribucin de datos, previa
ordenacin en forma ascendente o descendente.
En otras palabras es el valor que ocupa del lugar central.
La mediana se usa generalmente cuando los datos son bastantes dispersos o
tambin cuando se tienen intervalos, grupos o clase en que algunos de sus
lmites no est definido.

A PARA DATOS SIN AGRUPAR.-
a.1.- Nmero de datos u observaciones ( n) es impar.-
Se busca el valor central de modo que quede el 50% a cada lado.
Ejemplo:
Se tiene las edades de cinco personas, hallar la mediana.
Datos u observaciones: 8 26 22 19 44
Solucin:
1 Se ordenan en sentido creciente (tambin puede ser de orden
decreciente).


2 El valor central es 22, por lo tanto:
Med =
Interpretacin:
______________________________________________________________
______________________________________________________________

a.2. Nmero de datos u observaciones ( n) es par.-
Se suma los dos valores centrales y se divide entre dos.

Ejemplo 1.-
Se tiene las edades de 6 personas, hallar la mediana.
8 30 34 19 22 26
Solucin:
1 Se ordenan los datos en forma creciente


2 Los valores centrales sern

3 Se calcula el valor promedio de ambos:

Med = ---------------- = ------- =

Interpretacin:
______________________________________________________________
____________________________________________________________
Ejemplo 2.-
Una empresa de transporte tiene 20 unidades de vehculos. La siguiente
informacin son los kilmetros recorridos (en miles) de cada vehculo durante
el ao 2007.
4.8 7.3 3.3 9.2 3.4 7.1 5.2 6.0 1.2 7.8
7.4 2.6 4.0 6.2 7.6 3.7 6.5 4.3 6.1 2.8
Se desea saber cual es la mediana de la distribucin.
Solucin.-
Datos sin agrupar.-
1) Ordenamos los datos en forma ascendente o creciente.
1.2 2.6 2.8 3.3 3.4 3.7 4.0 4.3 4.8 5.2
6.0 6.1 6.2 6.5 7.1 7.3 7.4 7.6 7.8 9.2
2) El nmero de observaciones es par (20 observaciones)



3) Sumamos los valores que ocupan la posicin central de la distribucin
ordenada y dividimos entre dos.
Me = ---------------------------- =
Interpretacin.-
____________________________________________________________


B PARA DATOS AGRUPADOS.-
Cuando los datos se encuentran agrupados en una tabla de distribucin de
frecuencia y se desea hallar la mediana, se utilizar la siguiente frmula.
Cuando se trabaja con poblacin:

Ai
f
F
N
l Me
me
i
i
)
2
(
1

+ =

y cuando se trabaja con muestra:

Ai
f
F
n
l me
me
i
i
)
2
(
1

+ =


En ambos casos,

i
= lmite inferior del grupo o clase donde se encuentra la mediana.
f
me
=

frecuencia absoluta simple del grupo o clase donde se encuentra la
mediana.
F
i-1
= Frecuencia absoluta acumulada anterior al grupo o clase donde se
encuentra la mediana.
Ai = Amplitud de intervalo del grupo o clase donde se encuentra la mediana.
N = tamao de la poblacin
n = tamao de la muestra

Ejemplo.-
Con los datos del ejemplo anterior, calcular la mediana con los datos agrupados
con K (N de clases o grupos) = 4.
Solucin.- Con datos agrupados
Km. Recorridos
( en miles)
f
i
F
i

[0 - 2 >
[2 - 4 >

[4 - 6 >


[6 - 8 >
[8 -10]
2
5

4


8
1





Del grupo seleccionado se extrae los siguientes datos:
l
i
= F
i-1
=
n = i =
f
me
=
Me = + ( -----------------------)

Me =
Interpretacin.- ______________________________________________________
Nota:
La Mediana ( Me) para datos sin agrupar, y la de datos agrupados no siempre
sale el mismo valor.
6. 2.4 LA MODA.-
Es el valor que se presenta con ms frecuencia en un conjunto de observaciones.
A) Datos no agrupados.-
Ejemplo 1.-
La produccin diaria de 10 plantas ordenadas es:
0 27 34 35 58 62 68 72 72 112
Solucin.-
La moda sera 72, pues este valor se repite 2 veces.
Ejemplo 2.-
Se tiene informacin de Distribucin de la cadena de farmacias Delta:
Farmacia Localidad (zonas)
A 1
B 2
C 3
D 2
E 2
F 4
G 3

Interpretacin: __________________________________________________

B) Datos agrupados.-
Mo l
d
d d
i
i
= +
+
( )
1
1 2

Mo = Moda poblacional, mo = moda muestral
l
i
= Lmite inferior de la clase modal
d
1
= f
m
- f
i - 1

d
2
= f
m
- f
i + 1

f
m
= frecuencia de la clase modal
f
i-1
= frecuencia de la clase anterior a la clase modal
f
i+1
= frecuencia de la clase posterior a la clase modal
i = amplitud del intervalo de la clase modal

Ejemplo:
Las ventas totales en miles de dlares de la Compaa Ford del ao 2007 estn
en grupos o clases, segn el cuadro adjunto. Se pide calcular la moda.
Ventas N de ventas
[30 40> 1
[40 50> 4
[50 60> 5
[60 70> 9 f
i-1


[70 80> 16 f
m


[80 90> 7 f
i+1

[90 100] 3



Solucin.-
i = f
m
= f
i-1
=
f
i+1
= d
1
= d
2
=
Mo = + ( -----------------)
Mo =
Interpretacin.-
__________________________________________________________________

USO ADECUADO DE LA MEDIA, MEDIANA Y MODA.-
De las tres medidas de tendencia central, se observa que:
1) La media aritmtica tiene la ventaja de que toma en cuenta para su clculo, la
totalidad de los valores de la variable, aumentando o disminuyendo de acuerdo
a ellos, pero a causa de este problema, puede tener la desventaja que es
afectada por la existencia de valores muy altos o muy bajos en los extremos.
En conclusin cuando el comportamiento de la variable es ms o menos
simtrico la media aritmtica es la ms recomendable.
2) La mediana se usa cuando existe mucha dispersin de los datos.
3) As tambin la mediana es la mas ventajosa en usarla cuando en el primer o
ltimo grupo o clase no tiene lmite definido.
4) La moda no es muy usual, pero se emplea cuando se quiere conocer el valore
que se presenta ms frecuentemente.
EJERCICIO DE APLICACIN N 6.-
1. Dadas las ventas en miles de dlares de un determinado producto durante el mes de
Mayo de 2007 es como sigue:
22 33 43 78 45 33 22 43 22 76
43 33 28 33 26 65 30 39 34 55
70 69 45 57 59 63
Halle la venta promedio mensual e interprete.

2. Una Ca. produce cierto insumo para la fabricacin de cierto producto. La
informacin que sigue corresponde a las ventas efectuadas por la ca. expresada en
miles de $ para el 2007
---------------------------------------------------------
VENTAS (MILES DE $) f
i

---------------------------------------------------------
[500 - 1000> 5
[1000 1500> 10
[1500 2000] 3
----------------------------------------------------------
Halle el promedio de ventas efectuadas por la Ca. e interprete.
3.- Se tiene las edades de los siguientes trabajadores de una determinada empresa.
Elabore la tabla de distribucin de frecuencia respectiva en 6 grupos o clases.
27 34 20 48 67 30
36 75 40 58 46 50
67 53 60 71 34 70
56 43 74 45 43 77
68 43 25 34 34 34
a) Halle la edad promedio de los trabajadores e interprete.
b) Elabore un grfico de acuerdo a los datos.
4.- La distribucin del nmero de nias por familia en el centro maternal de un cierto
colegio femenino es la siguiente:
N de nias familias
-----------------------------------------------------
8 1
7 2
6 6
5 8
4 20
3 38
2 60
1 60
0 35
Halle el nmero medio de nias por familia.
5.- Se muestra las notas de 11 alumnos en un examen de matemtica.
10 12 09 12 08 14 12 10 11 12 08
Halle:
a) la moda
b) la mediana:

c) Si el profesor decide aprobar a los alumnos cuyas notas sea mayor o igual que
la mediana Cuntos aprueban?
d) Si se elimina la mayor nota, halle la mediana de las notas restantes.
6.- El resultado de los coeficientes de inteligencia (CI) de un grupo de 24 nios de
primaria que realizan los test pertinentes es el siguiente:
98 115 122 99
111 99 113 101
108 103 95 89
100 101 104 107
96 114 116 113
103 90 100 102
a) Cul es el C.I.medio y el C.I.mediano del grupo?
b) Se puede afirmar que las puntuaciones obtenidas obedecen a la ley normal
conociendo la media y la mediana.

























Coeficiente de
Variacin

Desviacin
estndar

Varianza

Rango

Medidas de
Dispersin
SESIN 7
Medidas de dispersin. Rango, Varianza. Desviacin estndar. Coeficiente de variacin
7.- MEDIDAS DE DISPERSIN
Son indicadores estadsticos que representan cuan dispersas se encuentran los
datos de la variable, sealndonos el grado de concentracin de los mismos con
respecto al promedio de la distribucin.
Las medidas de dispersin ms usuales son:
MUESTRA POBLACIN
- Rango R R
- Varianza S
2
o
2

- Desviacin estndar S
o


Las medidas de dispersin se usan para:
a) Verificar la confiabilidad de los promedios.
b) Establecer como base para el control de la variable. As tenemos:
Alta dispersin (medida de dispersin alta) --- baja concentracin alrededor del
promedio. DATOS HETEROGNEOS
Baja dispersin (medida de dispersin baja) -- Alta concentracin alrededor del
promedio. DATOS HOMOGNEOS
7.1.- RANGO.-

El rango de una variable es la diferencia entre el valor mximo y su valor mnimo y
se define como:
Su uso es muy limitado, pues solo toma en cuenta los valores extremos.
Ejemplo:
La edad de 10 alumnos en un aula de clase, es segn se muestra a continuacin.
Se pide hallar el rango.
23 18 28 18 16 26 19 20 21 18
Solucin.
Rango = 28-16 = 12
Luego, existe una dispersin de 12 aos.

7.2 VARIANZA Y DESVIACIN ESTANDAR.-
- Son medidas de dispersin o variabilidad de los datos. La variancia se define
como las desviaciones al cuadrado con respecto al promedio (
o
2
). As tambin
se le conoce como el promedio de la dispersin en la distribucin de una
variable.
- La desviacin estndar, es la raz cuadrada de la variancia y se representa por
o

o o =
2

A) DATOS SIN AGRUPAR.-
VARIANCIA:


( )
N
x
N
i
i
=

=
1
2
2

o

( )
1
1
2
2

=

=
n
x x
S
n
i
i

Donde:
X
i
: Valores de la variable X
N : Tamao de la poblacin
n : Tamao de la muestra

o
2
: Varianza poblacional
S
2
: Varianza muestral

DESVIACIN STANDARD:
o o =
2

2
S S =

Donde:
o
Desviacin estndar poblacional
S Desviacin estndar muestral
Ejemplo 1.-
En una de las fbricas de Motor Per, se producen autos de diversas marcas,
desde Enero a Agosto de 2007
Meses : Ene Feb Mar Abr May Jun Jul Agos
Produccin: 100 130 90 120 100 140 110 98
Defina la variable en estudio y halle la varianza y Desviacin Standard.
Solucin.-
Variable de estudio:
___________________________________________________
Calculando la varianza:

= =

=
N
X
N
i
i
1




( ) =

=
N
i
i
X
1
2



Luego, aplicando la frmula de varianza:
=
2
o

=

Calculando la desviacin estndar

= o



Ejemplo 2.-
Defina la variable en estudio y calcule la varianza y la desviacin estndar de
los aos de experiencia de una muestra de 7 trabajadores de la fbrica textil
Universal S.A. para el ao 2007
Los datos son los siguientes:
3 10 8 6 16 4 2
Solucin.-
Variable de estudio: _____________________________________________
Calculando la varianza:

= =

=
n
X
X
n
i
i
1

=

( ) =

=
n
i
i
X X
1
2

=

= =
2
S


= ------------------------


Calculando la desviacin estndar.-



B.- DATOS AGRUPADOS.-
Cuando los datos estn en una tabla de distribucin de frecuencia, la varianza
se halla segn la frmula:

( )
N
f m
K
i
i i
=

=
1
2
2
.
o

( )
1
.
1
2
2

=
n
f x m
S
i
k
i
i

donde:
f
i
= frecuencia absoluta simple de cada clase o grupo
m
i
= marcas de clase de cada clase o grupo.
N = tamao de la poblacin.
n = tamao de la muestra

o
2
= Varianza poblacional
S
2
= varianza muestral

Nota.- No olvide que la desviacin estndar es la raz cuadrada de la varianza.

Ejemplo.-
Se tiene informacin para 2007 de la edad de los jvenes del 5
to
. Ao de
secundaria del Centro Educativo Particular San Antonio del Pinar. Se pide:
a) Define la variable en estudio.


b) Calcule la varianza y la desviacin estndar
Grupo de
Edad
f
i

[15 - 17>
[17 - 19>
[19 - 21>
[21 23]
27
7
0
1
Total 35

Solucin.-
a) Variable en estudio: ___________________________________________

b) Calculando la varianza (cuadro auxiliar)

Grupo de
Edad
m
i
f
i
(m
i -
)
2
(m
i -
)
2
. f
i

[15 - 17>
[17 - 19>
[19 - 21>
[21 23]
27
7
0
1

35

=
2
o


=
2
o



=
2
o



Calculando la desviacin estndar





7.3 COEFICIENTE DE VARIACIN.-
Es el grado de desviacin con relacin a la media. Este coeficiente se usa para
comparar las medias aritmticas o promedio de diferentes muestras.
Nota.- Cuanto menor es el C.V mejor ser la estimacin del promedio y el proyecto
ser mejor.
% 100 * . .

o
= V C

% 100 * . .
X
S
v c =


Donde:
C.V. = Coeficiente de variacin de la poblacin
c.v = Coeficiente de variacin muestral

o
= Desviacin estndar poblacional
= Media aritmtica poblacional
S = Desviacin estndar muestral

X
= Media aritmtica muestral

Ejemplo.-
Considere dos proyectos de inversin A y B. Ambos tienen una ganancia promedio
igual a $ 500. La desviacin estndar es 63.25 y 516.20 respectivamente. Halle
cul de los dos proyectos es mejor.

Solucin:

A B

500 500

o 63.25 516.20

C.V.

Luego el mejor proyecto es:













EJ ERCI CI OS DE APLI CACI N N 7.-
1 En una prueba de Estadstica tomada a una muestra de 35 alumnos del IV ciclo de
la Escuela de Ing. De Sistemas, se obtuvo los siguientes resultados:
= 12
Me = 10
Mo = 11
o
= 13.23
Explique el significado de cada uno de ellos.

2.- Los pesos de Kg. de una poblacin de 12 nios cuyas edades flucta entre 1 ao y 2
aos es como sigue:
21 20 22 15 19 28
18 28 26 21 16 14
Calcule e interprete: Moda y Desviacin estndar.

3.- Se tiene 36 ingresos quincenales en dlares y se quiere tabular en una distribucin
de frecuencia de 8 grupos o clases. La Informacin es:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 69 67 57 67 61 67 51 81
Calcule la moda y la desviacin estndar. Interprete el resultado.
4.- Dadas las edades de 20 seoritas :
15 17 19 20 18 18 19 17 16 17
20 15 20 18 15 15 16 17 15 17
Que se puede decir de la moda
i) Es unimodal ii) bimodal iii) Multimodal?

5.- En una prueba de Estadstica aplicada a 20 alumnos, se obtuvo la siguiente
distribucin de puntos:
Puntos
[35-45> [45-55> [55-65> [65-75> [75-85> [85-95]
N
alumnos
1 3 8 3 3 2
Calcule el coeficiente de variacin e interprete.

6.- Las secciones A, y B, de la asignatura de Estadstica General rinden el mismo
examen parcial. Los resultados obtenidos se registran en las siguientes tablas:
Secc. A mi Fi Secc.B Clase m
i
f
i

2.5 3 2 - 6 16
7.5 8 6 - 10 144
12.5 22 10 - 14 240
17.5 30 14 - 18 32
18 - 20 0

a) El profesor de la seccin A sostiene que la suya es mejor. Es correcta esta
afirmacin?

b) En cul de las secciones las notas son ms homogneas, lo que quiere decir
aquella que tenga menor dispersin?

7.- Se tiene los sueldos mensuales de Profesores y Mdicos de cierta ciudad y se
obtienen los siguientes resultados:
Profesores Mdicos
X = S/. 620.00 X = S/. 1,600.00
S
1
= S/. 2000.00 S
2
= S/. 5400.00
Son los sueldos de los profesores ms o menos dispersos en relacin con los de
los mdicos?


























Espacio Muestral


Probabilidad de un
Evento


Nociones


PROBABILIDAD
SESIN 8
Probabilidad bsica. Espacio muestral. Probabilidad de un evento. Probabilidad condicional.
Distribuciones de Probabilidad continua: Normal estndar (Z) y t de student.
8.- PROBABILIDAD
Definiciones Previas:
8.1 Experimento Aleatorio ( E ) : Es aquel cuyo resultado depende del azar y cumple
ciertas caractersticas:
a) Que sea repetible en igualdad de condiciones.
b) Que se pueda describir el conjunto de todos los resultados posibles aunque no
se pueda asegurar un resultado en particular.
c) Si se repite un nmero grande de veces debe aparecer cierta regularidad
estadstica.
Ejemplos:
1) Observar el lanzamiento de una moneda.
2) Observar el lanzamiento de un dado.
3) Medir la duracin de un equipo electrnico.
4) Contar el nmero de vehculos que pasan por un cruce en lapsos de un minuto
5) El lanzamiento de dos dados.
6) Lanzamiento de un dado y una moneda

8.2 Espacio Muestral ( S ) .
Es el conjunto de todos los resultados posibles de un experimento aleatorio. A los
ejemplos previos corresponden los siguientes espacios muestrales en notacin de
conjuntos:

{ } { }
1
, , S cara sello c s = =


{ } 6 , 5 , 4 , 3 , 2 , 1
2
= S


{ } 0 :
3
> = t t S

S
4
=
S
5
=
S
6
=
Un punto muestral es un elemento del espacio muestral de cualquier experimento
dado.
8.3 Suceso o Evento ( A, B, etc)
Es cualquier subconjunto de resultados de un espacio muestral S. Los siguientes
son eventos asociados a los espacios muestrales previos.
1) E
1
: Lanzamiento de una moneda.

{ } { }
1
, , S cara sello c s = =

Podremos plantear los siguientes eventos:
A
1
: que salga cara A
1
= { c }
A
2
: que salga sello A
2
= ______
2) E
2
:Lanzamiento de un dado

{ } 6 , 5 , 4 , 3 , 2 , 1
2
= S

B
1
: que salga numero par B
1
= _______________________
B
2
: que salga numero impar B
2
= _______________________
B
3
: que salga los nmeros 4 5 B
3
= _______________________
3) E
3
: Medir la duracin de un equipo electrnico.
S
3
=
C: que dure hasta 5 aos C = _______________________

4) E
4
: Contar el nmero de vehculos que pasan por un cruce en lapsos de un
minuto.
S
4
=
D: ___________________________ D = ________________________

5) E
5
: Lanzamiento de dos dados
G
1
: Suma de los lados de la cara superior de los dados sea igual a 7
G
1
=__________________________________________________________
G
2:
Suma de los lados de la cara superior de los daos sea igual a 4
G
2
= __________________________________________________________
G
3
: Suma de los lados de la cara superior sea menor de 4
G
3
= __________________________________________________________

6) E
6
:Lanzamiento de un dado y una moneda
S
6
=
H: salga una seis y una cara H = ________________________
8.4 lgebra de conjuntos.-
Algunos conceptos de teora de conjuntos extendidos a sucesos de probabilidad se
deben recordar:
8.4.1 UNIN.-
La unin de dos sucesos A y B en un espacio S se define como:
A B = {x:/ x e A x e B}, el smbolo e significa que el elemento x
pertenece al conjunto correspondiente e indica que el resultado puntual x ha
ocurrido.
A B significa que ocurre A, ocurre B u ocurren A y B.

8.4.2 INTERSECCIN.-
La interseccin de dos sucesos A y B en un espacio S se define como:
A B = AB = {x: x e A y x e B},
A B significa que ocurren A y B conjunta o simultneamente.
Las operaciones de unin e interseccin gozan de las propiedades de
clausura, idempotencia, conmutacin, asociacin y se vinculan mediante
la propiedad distributiva de la interseccin respecto a la unin, es decir,
A(BC)=AB AC.
Es igual A (BC) a (A B) (A C)?



8.4.3 COMPLEMENTO.-
El Complemento del suceso A en el espacio S se define como la diferencia
entre el conjunto S y el conjunto A:S-A = A
C
= A =
A
= {x: x e S y x e
A} y significa que no ocurre A.
Qu propiedades cumple la diferencia de sucesos?
Que propiedades cumplen la unin, la interseccin y el complemento
cuando interviene el conjunto vaco
|
?

8.4.4 Leyes de Morgan.-
Observe que un conjunto cualquiera se puede expresar como la unin de dos
conjuntos que son excluyentes. Esto es



( ) ( ) B A ' B A A =
y
( ) ( ) | = B A ' B A
o sea que ( ) ' B A y
B A son excluyentes.

La anterior expresin evidencia las conocidas Leyes de Morgan.
( ) ' B ' A ' B A =
y
( ) ' B ' A ' B A =

Adems
( ) A ' ' A =

8.5. Definicin de probabilidad segn las tres escuelas de pensamiento diferentes: la
teora clsica, la teora de frecuencia relativa y la teora subjetiva
8.5.1 La teora clsica.
Definicin axiomtica debida a Andrei Kolmogorov, 1903 a 1987, probabilista ruso.
Sea S el espacio muestral asociado a un experimento aleatorio y sean
S A
i
c
para
n .., , 2 , 1 i =
eventos.
DEFINICIN DE PROBABILIDAD
CLSICA
Probabilidad de un evento =
# de resultados favorables
# de resultados posibles
DEFINICIN DE PROBABILIDAD
CLSICA
Probabilidad de un evento =
# de resultados favorables
# de resultados posibles

Ejemplo 1:
Se tiene el siguiente experimento aleatorio
E: Lanzamiento de dos monedas al aire.
a) Calcule el espacio muestral?



b) Sea el evento A: salga solo una cara. Plantee el evento A, utilizando conjunto


c) Cul es la probabilidad de que salga 1 cara?

Ejemplo 2.-
Halle la probabilidad de sacar un Rey al extraer una carta de una baraja de 52 cartas.




8.5.2 La teora de la Frecuencia relativa.-
El concepto de frecuencia relativa se abstrae tpicamente como un modelo aleatorio y es
la anticipacin del modelo formal de probabilidad. Se debe a Pierre Simn de Laplace,
1749 a 1827.
Supnga que repetimos n veces un experimento aleatorio, sean A un evento asociado al
experimento y al espacio S. Sean
A
n
el nmero de veces en que ocurren A o sea el
nmero de elementos del conjunto.
Definimos la frecuencia relativa del evento A as:
n n
n
n
h
A
A
A
s s = 0 ;

como
n n 0
A
s s
entonces
1
n
n
0
A
s s

o sea 0 h
A
1

Ejemplo 1.
Se tiene informacin acerca de los cargos y el sexo del personal de cierta empresa. Cul
es la probabilidad de que al seleccionar un trabajador ste sea:

a) Contador y sea hombre
b) Abogado y mujer
c) Mujer
d) Sabiendo que el trabajador es ingeniero. Cul es la probabilidad de que sea
hombre?
e) Sabiendo que el trabajador sea mujer. Cul es la probabilidad de que sea
abogado?

Sexo TOTAL Abogado Contador Ingeniero
Hombres 10 5 6
Mujeres 15 4 7
TOTAL
Solucin.-
a)

b)


c)


d)

e)



En el caso de espacios muestrales finitos el valor de frecuencia relativa de un suceso
coincidir con su valor de probabilidad.

Ejemplo 2.
Localice todos los valores de probabilidad asociados a la siguiente tabla de Carrol que
ofrece informacin sobre la hipertensin y el hbito de fumar.
No fumadores
Fumadores
moderados
Fumadores
empedernidos
Hipertensos

10

20 15
No hipertensos

30

15 10
a. Si se selecciona aleatoriamente uno de estos pacientes, encuentre la probabilidad de
que la persona sea:
i) Fumadora moderada: _________________________________________
ii) No hipertensa: _______________________________________________
iii) No hipertensa ni fumadora : _____________________________________
iv) Hipertensa y fumadora empedernida: _____________________________
v) Sabiendo que el paciente no fuma. Cul es la probabilidad de que sea
hipertensa?___________________________________________________
vi) Sabiendo que el paciente es hipertenso. Cul es la probabilidad de que sea
fumador empedernido? __________________________________________

8.5.3 La teora subjetiva.
Se refiere a la posibilidad de que un evento particular ocurra, que es asignada por un
individuo basndose en la informacin que tenga disponible y en su propia experiencia
o presentimientos.
Ejemplos de probabilidad subjetiva son las apuestas en eventos atlticos o deportivos
o la estimacin del futuro de una accin.

8.6. - AXIOMAS DE LA PROBABILIDAD.-
A cada
i
A
le asignaremos un nmero real
( )
i
A P
, denominada probabilidad de
i
A
, que
satisface los siguientes axiomas:
1)
( ) 1 A P 0
i
s s


0 0.5 1
Sin probabilidad Tan probable Certeza
de ocurrir como improbable de ocurrir
2)
( ) 1 S P =


PROBABILIDAD DE EVENTOS PURAMENTE EXCLUYENTES.
3) Si
1
A
excluye a
2
A
entonces
| =
2 1
A A

( ) ( ) ( )
2 1 2 1
A P A P A A P + =

Ejemplo:
En el lanzamiento de un dado, cual es la probabilidad de que salga 4 6?
_____________________________________________________________________
Generalizando: Si los
i
A
son mutuamente excluyentes, es decir
| =
j i
A A
para
todo
n , .. , 2 , 1 j i = =
entonces
( )

=
=
=
|
|
.
|

\
|

n
1 i
i i
n
1 i
A P A P

Observe que estas propiedades no dependen de cmo se calculen las probabilidades
( )
i
A P

Entendindose por mutuamente excluyentes, a que la ocurrencia de cualquiera de los
eventos implica que ninguno de los otros puede ocurrir al mismo tiempo.
Algunos ejemplos de experimentos de este tipo de probabilidad son el lanzar un dado o
sacar una carta de una baraja al azar.

8.7. Propiedades de las probabilidades.-

Propiedad 1.
La probabilidad de un suceso imposible
|
es cero. En efecto
A A = |


( ) ( ) A P A P = |
como
| = | A
A excluye a
|

entonces
( ) ( ) ( ) A P P A P = | +

esto es
( ) 0 P = |

Propiedad 2-


Si
S A c
y
A

' A
es el
evento complementario de A
entonces
P( ) = 1 - P(A)


Veamos:
A

= S por lo tanto P(A

) = P(S)

Como A excluye P(A) + P( ) = 1 entonces

P( )=1 P(A)
Ejemplo:
La probabilidad de que un alumno apruebe un curso es de 3/7. Cul es la probabilidad
que no apruebe? _______________________________________________________


Propiedad 3. Probabilidad de elementos solapados
| = B A


La probabilidad de A U B, cuando la A B 0, entonces:

( ) ( ) ( ) ( ) B A P B P A P B A P + =

Ejemplo:
Si se toma una sola carta de una baraja encuentre la probabilidad de que sea roja o
figura (jota, reina y rey)?




Propiedad 4.


( ) ( ) ( ) ( ) C P B P A P C B A P + + =


( ) ( ) ( ) C B P C A P B A P


( ) C B A P +


PROBABILIDAD DE EVENTOS INDEPENDIENTES
Dos eventos son independientes si el resultado de uno no afecta al otro
Propiedad 5.-
Ley de la multiplicacin.-
P(A y B) = P(A B) = P (A). P (B)

Ejemplo:
La probabilidad de que un hombre viva dentro de 25 aos es 3/5 y la probabilidad de
que su esposa viva dentro de 25 aos es 2/3. Halle la probabilidad de que:
a) ambos vivan.



b) Viva solamente el hombre






c) Viva solamente la mujer






d) Viva al menos uno de ellos.





PROBABILIDAD CONDICIONAL.-
Propiedad 6.-
Sean A y B dos sucesos en S. Indicaremos con
( ) A B P
la probabilidad condicional del
suceso B, dado que A ha ocurrido, as:


( )
( )
( )
( ) 1 A P 0 ,
A P
B A P
A B P s <

=


Ejemplo 1.-
En una poblacin de pacientes hospitalizados, la probabilidad de que uno de
ellos, elegidos aleatoriamente, tenga problemas cardiacos es de 0.35 La
probabilidad de que un paciente sea fumador dado que sufre problemas
cardiacos es de 0.86, cual es la probabilidad de que el paciente elegido al azar
de entre la poblacin sea fumador y tenga problemas cardiacos?








Ejemplo 2.-
Cul es la probabilidad de que en el segundo lanzamiento de una moneda se
obtenga cara, dado que el resultado del primero tambin fue cara?
Solucin.-






Ejemplo 3.-
Durante un estudio de accidentes automovilsticos la PNP, encontr que el 60%
de los accidentes suceden de noche, 52% estn relacionados con conductores
alcohlicos y 37% se presentan de noche y con conductores ebrios. Cul es la
probabilidad de que un accidente este relacionado con un conductor alcoholizado
dado que sucedi de noche?
Solucin





Ejemplo 4.-
Consideremos el experimento aleatorio de elegir al azar dos artculos de un lote
de 100 artculos donde se sabe que hay 20 defectuosos y 80 no defectuosos.
Sean
{ } defectuoso es elegido artculo primer el A =

B = {el segundo artculo elegido no es defectuoso}
Calcule P(A), P (B) y P (B / A)
Solucin.-
a) P (A) =

P (B) =

P (B / A) =


Ejemplo 5.-
Se lanzan dos dados normales y se anotan los pares x, y.
a) Describa el espacio S
b) Calcule
( ) ( ) ( ) ( ) B A P , B A P , B P , A P
y
( ) A B P
.
Si
( ) { } ( ) { } y x : y , x B 10 y x : y , x A > = = + =

Solucin.-
a) El espacio muestral S, ser

n(S) = .
b) Calculando las probabilidades:
b.1) n ( A ) =
P ( A ) =
b.2) n ( B ) =
P ( B) =
b.3) n ( A B ) =
P (A B) =
b.4) P (A/B) =
b.5) P (B/A) =

8.8 Propiedades de la probabilidad condicional
1)
( ) 1
A
B
P 0 s s
.
2)
( ) 1
A
S
P =
.

8.9.- LA DISTRIBUCIN NORMAL O GAUSSIANA
Las distribuciones de medias muestrales y proporciones de grandes muestras
tienden a distribuirse normalmente, lo que tiene repercusiones importantes en el
muestreo.
La distribucin normal fue descubierta por primera vez en el siglo XVIII. A esta
distribucin a veces se le conoce como distribucin gausiana, en reconocimiento a
las aportaciones de Karl Gauss (1777 1855) a la teora matemtica de la
distribucin normal.
Distribucin Normal de Probabilidad
Se dice que la variable aleatoria X es continua cuando toma valores reales desde
el - < x< y se dice que se distribuye normalmente con media y variancia
2

X ~ N (,
2
)

Caractersticas:
1.- La curva normal tiene forma de campana.
2.- El rea total bajo la curva normal es igual a 1.
3.- Es simtrica con respecto a la media de la distribucin.
4.- Es mesokrtica.
5.- Se extiende de - a +
6.- Cada distribucin normal es especificada por su media y su desviacin
estndar .
X ~ N (, 2)
La distribucin normal se utiliza como modelo para variables como el peso, la ura, la
calificacin en un examen, etc., es decir, en variables cuya distribucin es simtrica
con respecto a un valor central (alrededor del cual toma valores con gran
probabilidad) y apenas aparecen valores extremos.
Si una variable aleatoria x tiene distribucin normal suele representarse como
N(,
2
) donde , es la media o valor esperado de la variable y =
x
es la
desviacin tpica de la variable, que son los dos parmetros que caracterizan la
distribucin normal.
En la distribucin normal, la mayora de la probabilidad se concentra en la zona
central.
La Funcin de Probabilidad est dada por:
| |

|
o \ .
= = o = s s
to
2
1 x
2 2
2
1
f(X x) N( , ) e x
2

ESTANDARIZACIN



=
o
x
z

Luego, la variable Z ~ N (0,1)
La Funcin de Probabilidad est dada por:
( )

= = = s s
t
2
z
2
1
f(Z z) N 0, 1 e z
2


Ejemplos.
1) Determine la probabilidad de cada una de las siguientes expresiones:

a) P ( Z < 1.25 ) b) P ( Z< -2.28)





c) P (Z < 0 ) d) P ( 0 < Z < 2.5 )






e) P ( -2.38 < Z < 0 ) f) P ( - 2.25 < Z < 2.25 )





g) P (1.55 < Z < 2.35) h ) P ( Z > 2.43 )




i) P ( z > - 1.25) j) P( -2.45 < z < -0.25)






2) En una poblacin normalmente distribuida con media = 30 y variancia igual a 25
se pregunta: Qu porcentaje del total de las observaciones estarn entre 20 y 35?





3) Se sabe que el peso medio de la poblacin de un grupo de estudiantes es igual a 60
Kg., y su desviacin estndar es igual a 3 kg. Determine la probabilidad de que el
peso de un alumno este entre 55 y 65 Kg.









4) El peso de los atletas de pruebas de medio fondo sigue una distribucin normal
con media 64,3 kilos y desviacin tpica 2,3 kilos. Halle un intervalo centrado
alrededor de la media que contenga:
a) El 68,3% de la poblacin.
Solucin.-




b) El 95,5% de la poblacin.
Solucin.-





c) El 99,7% de la poblacin:
Solucin.-










DISTRIBUCIN NORMAL ESTNDAR
normal 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.5279 0.53188 0.53586
0.1 0.53983 0.5438 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.6293 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.6591 0.66276 0.6664 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.7054 0.70884 0.71226 0.71566 0.71904 0.7224
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.7549
0.7 0.75804 0.76115 0.76424 0.7673 0.77035 0.77337 0.77637 0.77935 0.7823 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.8665 0.86864 0.87076 0.87286 0.87493 0.87698 0.879 0.881 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.9032 0.9049 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.9222 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.9452 0.9463 0.94738 0.94845 0.9495 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.9608 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.9732 0.97381 0.97441 0.975 0.97558 0.97615 0.9767
2 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.9803 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.983 0.98341 0.98382 0.98422 0.98461 0.985 0.98537 0.98574
2.2 0.9861 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.9884 0.9887 0.98899
2.3 0.98928 0.98956 0.98983 0.9901 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.9918 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.9943 0.99446 0.99461 0.99477 0.99492 0.99506 0.9952
2.6 0.99534 0.99547 0.9956 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.9972 0.99728 0.99736
2.8 0.99744 0.99752 0.9976 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.999
3.1 0.99903 0.99906 0.9991 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.9994 0.99942 0.99944 0.99946 0.99948 0.9995
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.9996 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.9997 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.9998 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.9999 0.9999 0.9999 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4 0.99997 0.99997 0.99997 0.99997 0.99997 0.99997 0.99998 0.99998 0.99998 0.99998
DISTRIBUCIN NORMAL ESTNDAR
normal 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-4 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.0001 0.0001 0.0001 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.0002 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.0003 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.0004 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.0006 0.00058 0.00056 0.00054 0.00052 0.0005
-3.1 0.00097 0.00094 0.0009 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.001
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.0024 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.0028 0.00272 0.00264
-2.6 0.00466 0.00453 0.0044 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.0057 0.00554 0.00539 0.00523 0.00508 0.00494 0.0048
-2.4 0.0082 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.0099 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.0139 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.0116 0.0113 0.01101
-2.1 0.01786 0.01743 0.017 0.01659 0.01618 0.01578 0.01539 0.015 0.01463 0.01426
-2 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.0197 0.01923 0.01876 0.01831
-1.9 0.02872 0.02807 0.02743 0.0268 0.02619 0.02559 0.025 0.02442 0.02385 0.0233
-1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938
-1.7 0.04457 0.04363 0.04272 0.04182 0.04093 0.04006 0.0392 0.03836 0.03754 0.03673
-1.6 0.0548 0.0537 0.05262 0.05155 0.0505 0.04947 0.04846 0.04746 0.04648 0.04551
-1.5 0.06681 0.06552 0.06426 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592
-1.4 0.08076 0.07927 0.0778 0.07636 0.07493 0.07353 0.07215 0.07078 0.06944 0.06811
-1.3 0.0968 0.0951 0.09342 0.09176 0.09012 0.08851 0.08692 0.08534 0.08379 0.08226
-1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09853
-1.1 0.13567 0.1335 0.13136 0.12924 0.12714 0.12507 0.12302 0.121 0.119 0.11702
-1 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
-0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
-0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
-0.7 0.24196 0.23885 0.23576 0.2327 0.22965 0.22663 0.22363 0.22065 0.2177 0.21476
-0.6 0.27425 0.27093 0.26763 0.26435 0.26109 0.25785 0.25463 0.25143 0.24825 0.2451
-0.5 0.30854 0.30503 0.30153 0.29806 0.2946 0.29116 0.28774 0.28434 0.28096 0.2776
-0.4 0.34458 0.3409 0.33724 0.3336 0.32997 0.32636 0.32276 0.31918 0.31561 0.31207
-0.3 0.38209 0.37828 0.37448 0.3707 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
-0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
-0.1 0.46017 0.4562 0.45224 0.44828 0.44433 0.44038 0.43644 0.43251 0.42858 0.42465
0 0.5 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.4721 0.46812 0.46414
Distribucin t de Student
Funcin de densidad de probabilidad:



Parmetros grados de libertad (real)
Dominio


Media
0 para > 1, indefinida para otros valores
Mediana 0
Moda 0
Varianza
para > 2, indefinida para otros valores

En probabilidad y estadstica, la distribucin-t o distribucin t de Student es una
______________ de probabilidad que surge del problema de estimar la media de una
poblacin normalmente distribuida cuando el tamao de la muestra es ____________.
La distribucin t surge, en la mayora de los estudios estadsticos prcticos, cuando la
_________________ tpica de una poblacin se ______________ y debe ser estimada
a partir de los datos de una muestra.
Aparicin y especificaciones de la distribucin t de Student
Supongamos que X1, ..., Xn son variables aleatorias independientes distribuidas
normalmente, con media y varianza 2. Sea:

la media muestral y

la varianza muestral. Entonces, est demostrado que

se distribuye segn una normal de media 0 y varianza 1.
Gosset estudi la expresin relacionada a los temas anteriores y produjo lo siguiente:

La distribucin de T se llama ahora la distribucin-t.
El parmetro se llama convencionalmente el nmero de grados ____________
(tambin conocida como r). La distribucin depende de , pero no de o ; la
independencia de y es lo que hace a la distribucin t tan importante en la teora y
en la prctica.

Ejemplos:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15
que se selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta
que a este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor.
Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a . Luego
se busca el valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene
un valor de t = 2.977, pero como el valor de est en el extremo izquierdo de la curva
entonces la respuesta es t = -2.977 por lo tanto:
P(-2.977 < t < -1.761) = 0.045



Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso
en lotes es 500 gramos por milmetro de materia prima. Para verificar esta afirmacin
toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y
t0.05, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40
gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el
fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un
valor t entre 1.711 y 1.711.
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de
obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la
tabla y es aproximadamente de 0.02. De aqu que es probable que el fabricante
concluya que el proceso produce un mejor producto del que piensa.








TABLA DE LA DISTRIBUCION t-Student
La tabla da reas 1 o y valores
r
t c
, 1 o
=
, donde,
o = s 1 ] [ c T P
, y donde T tiene distribucin
t-Student con r grados de libertad..

1 o
r 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576
EJERCICIOS DE APLICACIN N 8.-
1.- En una universidad se realiza un estudio para determinar que relacin existe, en
cado de haberla, entre la habilidad matemtica y el inters por las matemticas. Se
determinar la habilidad y el inters de 150 estudiantes, con los resultados siguientes:

Inters
Escaso Promedio Mucho
Escasa 40 8 12 60
Promedio 15 17 18 50
Mucho 5 10 25 40
TOTAL 60 35 55 150

Si se escoge uno de los participantes en el estudio:
a) Cul es la probabilidad de escoger a una persona que tenga escaso inters en
las matemticas?
b) Cul es la probabilidad de seleccionar a una persona con habilidad promedio?
c) Cual es la probabilidad de que una persona tenga mucha habilidad para las
matemticas dado que manifieste mucho inters por esa disciplina.
d) Cul es la probabilidad de que la persona tenga mucho inters en las
matemticas dado que posee una habilidad promedio?
e) Cul es la probabilidad de que tenga inters promedio y habilidad promedio?

2.- Dell Publishing tiene 75 ttulos distintos de libros, clasificados por tipo y costo de la
siguiente manera:


Costo
__________________________________________
Tipo US$10 US$15 US$20
Ficcin 10 8 3
Biografas 12 10 9
Histrico 4 17 2
Halle la probabilidad de que un libro seleccionado aleatoriamente sea:
a. Ficcin o cueste US$10
b. Histrico y cueste US$20
c. Histrico y cueste o US$10 o US$15
d. Ficcin y cueste menos de US$20
e. Biogrfico o cueste US$15
f. Biogrfico o cueste ms de US$10

3.- Si se tira 4 monedas, una despus de la otra.
Halle el espacio muestral
a) Halle la probabilidad de que salga 2 caras?
b) Halle la probabilidad de que al menos salga 2 caras?
c) Halle la probabilidad de que a lo ms salga 2 caras?

4.- Si se extrae dos cartas de una baraja. Hallar la probabilidad de que salgan 2 reyes.
a) Con reemplazamiento
b) Sin reemplazamiento

5.- Se arroja dos dados, 1 blanco y uno rojo
Sea A: Obtencin de un nmero mayor que 4 en el dado blanco.
Sea B: obtener 1 nmero menor o igual que 3 en el dado rojo.
a) Halle la P (A/B)
b) Halle la P (B/A)

6.- La probabilidad de un nio nazca varn es aproximadamente . Cul de las
siguientes secuencias de sexos es mas probable que ocurra en tres nacimientos?
(sugerencia utilice el diagrama en rbol)
a) MMM b) VMM c) las dos son igual de probables.
Donde: V varn M mujer

7.- Un estudiante realiza un test de admisin en cierta universidad. Aunque el
estudiante desconoce el resultado del test, sospecha con probabilidad igual a 0,40
que super el nivel de admisin. Por la experiencia pasada sabe que es admitido un
80 por 100 de los que superan la prueba y slo un 5 por 100 de los que no lo han
superado. Con esta nueva informacin, cul ser ahrrala probabilidad que dicho
estudiante tendr acerca de la superacin del nivel de admisin?

8.- La probabilidad de reventn de una rueda en cierta carretera es igual a 0.05;
supuesto un revent, la probabilidad de accidente es igual a 0.40. Sin revent la
probabilidad de accidente es igual a 0.15, considerado al azar uno de los
accidentes ocurridos durante un mes, cul es la probabilidad de que dicho
accidente haya sido a un reventn?

9.-Supongamos quince alumnos de Psicologa de los cuales cuatro pertenecen a la
Seccin A, cinco a la B u seis a la C. Elegimos aleatoriamente dos de entre los
quince. Cul es la probabilidad de que ambos pertenezcan a la Seccin A? Cul
la de que pertenezcan a la Seccin B? Cul la de pertenezcan a la Seccin C?

10.- En cierta ciudad el 50 por 100 son solteros, el 40 por 100 casados y el 10 por 100
viudos. Si en dos ocasiones distintas entrevistamos a la primera persona con la que
nos encontramos, cul es la probabilidad de que ambas personas estn casadas?
Cul la de que ninguna de las dos sea viuda? Cul la de que una de las dos est
y la otra soltera?

11.- Un grupo de nueve personas est compuesto de dos inglesas, tres francesas y
cuatro italianas. Supuesto esto,
a) Si elegimos dos personas aleatoriamente, cul es la probabilidad de que las
dos sean italianas?
b) Si elegimos tres personas aleatoriamente, cul es la probabilidad de que
ninguna sea inglesa?

12.- Cul es la probabilidad de obtener una cara o ms si lanzamos al aire una
moneda tres veces consecutivas? Cul la de obtener dos o ms caras?

13.- Tres cazadores disparan independientemente a un jabal que, de hecho, ha sido
herido mortalmente por una sola bala. Sabiendo que las probabilidades de que cada
uno por separado alcanzara al jabal son 0,20, 0,40 y 0,60 respectivamente.
a) Cul es el espacio muestral?
b) Cul es la probabilidad de que la bala mortfera haya sido disparada por el
primero, por el segundo, por el tercero?
14.- Siendo P(A) = 0,60, P(B) = 0,50 Y P(A U B) = 0,90 calcule P
) (
__
B A
, P ) (
__
A B , P
(A/
_ _
B
), P (B/
_ _
A
)

15.- Siendo independientes A y B y siendo P(A) = 0,80 y P(B) = 0,30, calcule
) / ( ), / ( ), / ( ), / ( ), (
__ __ __ __ __ __ __ __
A B P B A P A B P B A P B A P
.

16.- El 70 por 100 de los estudiantes aprueba una asignatura A y un 60 por 100
aprueba otra siguiente B. Sabemos, adems, que un 35 por 100 del total aprueba
ambas. Cul es la probabilidad de que un estudiante elegido al azar apruebe la
asignatura B, supuesto que ha aprobado la A? La de que apruebe B, supuesto
que no ha aprobado A? La de que no apruebe B, supuesto que ha aprobado A?
la de que no apruebe B, supuesto que no ha aprobado A?.

17.- Tenemos cinco tarjetas marcadas respectivamente con las letras A, B, C, D y E.
Las barajamos perfectamente y las vamos descubriendo unas tras otra (sin volver
la carta una vez descubierta). Cul es la probabilidad de que aparezca
precisamente segn el orden A, B, C, D y E?



















Estadstica
Inferencial
Estimacin Tamao de muestra
Estimacin Puntual Estimacin de
parmetros
SESIN 10
Estadstica inferencial: estimacin puntual y por intervalo de los parmetros. Tamao de
muestra.
10.1.- INTRODUCCIN.-
Uno de los propsitos de la estadstica ____________ es estimar las
caractersticas poblacionales desconocidas, examinando la informacin obtenida
de una muestra, extrada de una poblacin.
El punto de inters es la _______________, la cual debe ser representativa de la
poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las
muestras reflejen observaciones a la poblacin de la que proceden, ya que solo
se pueden hacer observaciones probabilsticas sobre una poblacin cuando se
usan ______________ representativas de la misma.
Una poblacin est formada por ____________ las observaciones sobre las
cuales se tiene el objeto de estudio.
Una muestra es un _____________ de observaciones seleccionadas de una
poblacin.

10.2.-ESTIMACIN:
El objetivo principal de la estadstica inferencial es la _______________, esto es
que mediante el estudio de una muestra de una ______________ se quiere
generalizar las conclusiones al total de la misma. Como se notara, los estadsticos
varan mucho dentro de sus distribuciones muestrales, y mientras menor sea el
error ___________ de un estadstico, ms cercanos sern unos de otros en
relacin a sus valores.
Existen dos tipos de estimaciones para parmetros:
a) Una estimacin puntual.- Es aquel en el cual solo hay un UNICO estadstico y
se usa para estimar un parmetro.
Ejemplo: De una poblacin de 120 sueldos de profesores de la universidad X,
se toma una muestra de 40 sueldos, y se calcula el sueldo promedio.
Supongamos que el sueldo promedio es: S/. 690.00 soles, y al momento de
concluir el trabajo podemos decir, que el sueldo promedio de los profesores
de la universidad X, tienen un sueldo promedio de S/. 690.00. Quiere decir
que el promedio poblacional , se ha estimado puntualmente por x = S/.
690.00 soles.
b) Una estimacin por intervalo, es un rango de valores que se espera se
encuentre un parmetro:
Ejemplo. El sueldo promedio de los profesores en la Universidad X, se
encuentran entre S/. 650.00 y S./ 720.00 soles
Los parmetros mas usados son:
b.1. _______________________
b.2 _______________________
b.3 _______________________
b.4 _______________________

Estimacin por Intervalos
Para calcular la estimacin por intervalo o Intervalo de confianza (IC), en primer
lugar se procede a:
Seleccionar el nivel de confianza (grado de fiabilidad en el intervalo), 1- y
nivel de error.
Un nivel de confianza del 95%, implica que 95% de todas las muestras incluye al
parmetro y solo un 5% de las muestras producir un intervalo errneo.
Cuanto mayor es el nivel de confianza se estima que el valor del parmetro este
dentro del intervalo.

10.3.- Estimacin para la Media poblacional.
Sabemos que:
o

=
X
Z

Pero tambin,
n

- X
=

Como no conocemos el parmetro y lo queremos estimar por medio de la
media de la muestra, slo se despejar de la formula anterior, quedando lo
siguiente:
n

X
/2 - 1
=


De esta formula se puede observar que tanto el tamao de la muestra como el
valor de Z se conocern. Z se puede obtener de la tabla de la distribucin
________ a partir del nivel de confianza establecido. Pero en ocasiones la
muestra es menor de 30 o se desconoce
o
por lo que en esos casos lo correcto
es utilizar otra distribucin llamada "t" de Student si la poblacin de donde
provienen los datos es normal.

n
s
t X
/2) - 1;1 - (n
=

Donde S la desviacin estndar de la muestra y t es la distribucin de la t de
Student con n 1 grados de libertad y nivel de confianza igual a
/2 - 1 o
.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin
puntual de la desviacin estndar, es decir igualar la desviacin estndar de la
muestra a la de la poblacin (s=
o
).
El error de estimacin de ser la diferencia absoluta entre x y , es decir
despejando:
Error de estimacin de =
n

X -
/2 - 1
=


Ejemplos:
1) Se encuentra que en una dieta la concentracin promedio de vitaminas a
partir de una muestra de 36 mediciones en sitios diferentes del hospital es de
2.6 gramos por mililitro. Suponga que la desviacin estndar de la
concentracin de vitaminas es 0.3.
a) Seale la estimacin puntual para .
b) Encuentre el intervalo de confianza al 95% para la concentracin media
de vitaminas en las dietas de dicho hospital.
c) Halle el error de estimacin de para la pregunta b.
d) Encuentre el intervalo de confianza al 99% para la concentracin media
de vitaminas en las dietas de dicho hospital.
e) Halle el error de estimacin de para la pregunta d.
Solucin:
a) La estimacin puntual para es:
X , es decir = 2.6 gr/ml
b) IC para la media poblacional se calcula:

n

X
/2 - 1
=

Reemplazando valores:









c) El error de estimacin de para la pregunta b.

d) Calculando el Intervalo de confianza para la media a un nivel de confianza
del 99%













e.- Calcule el error de estimacin de

2) Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una desviacin estndar de 40 horas. Si una
muestra de 32 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa as tambin halle el error de estimacin.
Solucin:

n

X
/2 - 1
=














10.4.- Estimacin de una Proporcin
Una proporcin es una razn de una parte con respecto a un todo y que
generalmente pertenecen a un experimento aleatorio de tipo binomial, es decir con
solo dos posibles respuestas.
Sabemos que:
n
pq
p
Z

=
t

Como no conocemos el parmetro y lo queremos estimar por medio de la
proporcin de la muestra, slo se despejar de la formula anterior, quedando lo
siguiente:

n
pq
Z p *
2 / 1 o
t

=


Error de estimacin de
p =
1 / 2
pq
n
o
Z


Ejemplos:
1) Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la funcin elctrica de su producto. Todos los reproductores
de discos compactos deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una
o ms pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de
los reproductores de discos compactos de la poblacin que no pasan todas las
pruebas.
Solucin:
n=500
p =
z(0.90) =











Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos
que no pasan la prueba en esa poblacin est entre __________________
2) En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de
confianza para aproximar la proporcin de todos los accidentes automovilsticos que
en esa ciudad tienen consecuencias fatales.
Solucin:
P=
Z(0.90) =













EJERCICIOS DE APLICACIN N 10.-
Una media:
1. Una mquina llena un determinado producto en bolsas cuyo peso medio es
gramos. Suponga que la poblacin de los pesos es normal con desviacin
estndar 20 gramos. Estime mediante un intervalo de confianza del 95%, si
una muestra aleatoria de 36 bolsas ha dado una media de 495 gramos
2. Se decide estimar la media del nivel de ansiedad de todos los estudiantes
preuniversitarios. Se supone que la poblacin de los puntajes de la prueba para
medir la ansiedad se distribuye normalmente con desviacin estn dar igual a 10
puntos.
Determine el intervalo para con confianza del 95%, si una muestra aleatoria de
tamao 100 ha dado una media de 70 puntos.
3. El tiempo en, minutos que utilizan los clientes en sus distintas operaciones en un
banco local es una variable aleatoria cuya distribucin se supone normal con una
desviacin estndar de 3 minutos. Se han registrado los tiempos de las
operaciones de 9 clientes del banco resultando una media igual a 9 minutos:
Halle el nivel de confianza si la estimacin de es el intervalo de 7 a 11 minutos.
Calcule la probabilidad de que la media de los tiempos de todas las muestras de
tamao 9 est entre 6.5 y 11.5 minutos.
4. Un fabricante afirma que el peso promedio de las latas de fruta en conserva que
saca al mercado es 19 onzas. Para verificar esta afirmacin se escogen al azar
20 latas de la fruta y se encuentra que el peso promedio es 18.5 onzas Suponga
que la poblacin de los pesos es normal con una desviacin estndar de 2
onzas.
1 Utilizando un intervalo de confianza del 98% para , se puede aceptar la
afirmacin del fabricante?
2 Qu tamao de muestra se debe escoger para estimar si se quiere un
error no superior a 0.98 onzas con confianza del 95%?

5. Se quiere hacer una encuesta para estimar el tiempo promedio por semana que
los nios ven televisin. Por estudios anteriores se sabe que la desviacin
estndar de dicho tiempo es de 3 horas. Con el nivel de confianza del 99%.
Qu tamao de muestra se debera elegir si el error de la estimacin puntual no
es superior a media hora?

6. Un fabricante produce focos cuya duracin tiene distribucin normal. Si una
muestra aleatoria de 9 focos da las siguientes vidas tiles en horas:
775, 780, 800, 795, 790, 785, 795, 780, 810
1 Estime la duracin media de todos los focos del -fabricante mediante un
intervalo de confianza del 95%.
2 Si la media poblacional se estima en 790 horas con una confianza del 98%,
cunto es el error mximo de la estimacin si se quiere una confianza del
98%?

7. El ingreso mensual de cada una de las 500 microempresas de servicios de una
ciudad, es una variable aleatoria con media desconocida. Con el fin de
simplificar la recaudacin de impuestos, la Sunat ha dispuesto que a estas
empresas se las grave mensualmente con un 10% de sus ingresos. De una
muestra al azar de 50 microempresas se obtuvo un ingreso mensual promedio
de $1000 con una desviacin estn dar de $80.
1 Estime el monto medio de los ingresos de las microempresas de la ciudad
con un intervalo de confianza del 95%
2 Estime el monto promedio de la recaudacin a estas microempresas con un
intervalo de confianza del 95%
3 Si el propsito de la SUNAT es lograr mensualmente una recaudacin total de
al menos $52,000 a estas microempresas, es factible que se cumplan sus
metas?, por qu?

Una proporcin:
8. En un estudio socioeconmico se tom una muestra aleatoria de 100
comerciantes informales y se encontr entre otros datos los siguientes: un
ingreso medio de $600, una desviacin estndar de $50 y slo el 30% tienen
ingresos superiores a $800.
1 Estime la proporcin de todos los comerciantes con ingresos superiores a
$800, mediante un intervalo de confianza del 98%.
2 Si la proporcin de todos los comerciantes con ingresos superiores a $800
se estima entre 20.06% y 39.94% , qu grado de confianza se utiliz?

9. Una muestra aleatoria de 400 menores de 16 aos revela que 220 consumen
licor. Estime la proporcin de menores de 16 aos que consumen licor en toda
la poblacin mediante un intervalo de confianza del 99%.
10. Un fabricante estima en 5% la proporcin de piezas defectuosos de los 5,000
producidos. Para confirmar tal estimacin primero se debe escoger una
muestra aleatoria,
a) cuntas piezas debe tener la muestra si se quiere tener una confianza del
95% que el error de la estimacin no ser superior a 0.047?
b) Se escoge una muestra aleatoria del tamao calculado en a), si en ella se
encuentran 40 piezas defectuosos, mediante un intervalo de confianza del
95%, se puede inferir que la estimacin del fabricante es coherente con la
estimacin efectuada a partir de la muestra aleatoria?

11. La oficina de planificacin familiar de cierta provincia quiere estimar el
porcentaje de familias con ms de 4 hijos.
Qu tamao de muestra se requiere para asegurar con una confianza del 95%
que el error de la estimacin de tal porcentaje no sea superior a 0.05?
Si en una muestra aleatoria de 385 familias se encuentra que 154 de ellas
tienen ms de 4 hijos. Estime el porcentaje de familias con ms de 4 hijos en
toda la provincia, mediante un intervalo de confianza del 98%.

12. Para estimar el porcentaje de todos los electores a favor de un candidato, una
encuestadora debe determinar el tamao" de la muestra aleatoria para escoger
de una poblacin de 10,000 electores, qu tan grande debera ser la muestra
si se quiere tener una confianza del 95% que el error de estimacin no sea
superior al4.8%?

13. Se prob una muestra aleatoria de 400 cinescopios de televisor y se
encontraron 40 defectuosos. Estime el intervalo que contiene, con un
coeficiente de confianza de 0.90, a la verdadera fraccin de elementos
defectuosos.





















MUESTREO


Definicin

Tipos

Seleccin de elementos
de la muestra

Ejercicios de
aplicacin
M. ALEATORIO
SIMPLE
M.
SISTEMTICO
M.
ESTRATIFICADO
M. POR
CONGLOMERADO
SESIN 11
Muestreo: definicin. Ventajas y desventajas, tipos de Muestreo Aleatorio, seleccin de
elementos de la muestra y el uso de numero aleatorios.
11. MUESTREO
11.1 DEFINICIN.-
Evaluar el comportamiento de una o varias caractersticas o variables de una
poblacin sera muy costoso, por lo que la estadstica nos brinda procedimientos
para seleccionar a una parte de esa poblacin y analizarla de tal forma que sus
caractersticas coincidan con la poblacin.
El muestreo es la seleccin de una parte representativa de la poblacin que permita
estimar los parmetros de la poblacin.

11.2. VENTAJAS DEL EMPLEO DE MUESTRAS
Hay muchas razones por las cuales el estudio de una muestra es preferible al de la
totalidad de la poblacin. Ante todo, es evidente que el estudio de muestras es el
nico practicable cuando se trata de poblaciones infinitas o de poblaciones limitadas
pero muy extensas, pues ningn investigador sera capaz de estudiarlo en su
totalidad. Lo mismo es valedero para aquellas investigaciones en las cuales el
proceso de investigacin destruye al individuo que se estudia, como en el caso en
que se prueba la accin de ciertos venenos en animales de experimentacin.
Pero an en el caso en que se quiera estudiar una poblacin perfectamente limitada,
debemos decidirnos por la muestra, pues su utilizacin tiene las siguientes ventajas:
1. Ahorra tiempo, dinero y trabajo.
2. Permite una mayor exactitud en el estudio, pues los errores debidos al
observador, al objeto observado y al mtodo de observacin, pueden disminuir
y controlarse ms efectivamente.
En efecto, como ser menor el nmero de personas que intervengan en el estudio,
ser mucho ms fcil conseguir buenos especialistas y entrenarlos uniformemente;
como se necesitarn menos instrumentos de investigacin, stos podrn vigilarse y
calibrarse ms cuidadosamente.

11.3. DESVENTAJAS DEL EMPLEO DE MUESTRAS
La nica desventaja del uso de muestras es el llamado error de muestreo.
Este error de muestreo es una consecuencia de la variabilidad de las poblaciones.
Como los individuos de una poblacin son muy variables, los diferentes grupos o
muestras que podemos formar con ellas diferirn tambin unas de otras y como
nosotros estudiamos una muestra para generalizar luego a toda la poblacin, los
resultados sern algo distintos segn la muestra que hayamos escogido. Esta
diferencia entre el valor dado por la muestra y el verdadero valor de la poblacin,
constituye el error por muestreo.
Ejemplo:
Supongamos que una poblacin de 4 personas tienen un capital de S/. 5 000, S/.
7 000, S/. 6 000 y S/. 10 000 soles respectivamente.
El capital promedio de esta poblacin es

4
000 , 10 000 , 6 000 , 7 000 , 5 + + +
=
= S/. 7 000

Si no se conociera dicho promedio y para averiguarlo se tomara una muestra de dos
personas, digamos los 2 primeros (5 000, 7 000), concluiramos que el capital
promedio de cada persona de la poblacin es S/. 6,000, cuando en realidad vemos
que fue S/. 7 000, esta diferencia de S/. 1 000 entre el valor de la muestra y el valor
de la poblacin constituye el error por muestreo.
La presencia del error por muestreo parecera indicar que el estudiar una muestra en
vez de la poblacin, es desfavorable y no ventajosa como hemos indicado. Sin
embargo, conviene tener presente:
1.- En primer lugar, que el error por muestreo suele ser mucho menos importante
que los errores debidos al observador, al mtodo de observacin y a los
individuos estudiados, y
2.- En segundo lugar, que el error por muestreo puede medirse estadsticamente y
en cierto modo, puede disminuirse a voluntad, tan solo con aumentar el tamao
de la muestra.

11.4 TIPOS DE MUESTRAS.-
11.4.1 MUESTRAS NO PROBABILISTICAS
Entran en esta categora todas aquellas muestras en las cuales, los
individuos se escogen en base a la opinin personal. La persona que
selecciona los elementos de la muestra, usualmente es un experto en la
materia dada.
Una muestra de opinin es llamada una muestra no probabilstica, puesto
que este mtodo est basado en los puntos de vista subjetivos de una
persona y la teora de probabilidad no puede ser usada para medir el error
por muestreo.

11.4.2. MUESTRAS PROBABILSTICAS.-
Son aquellas en que cada individuo de la poblacin tiene una probabilidad
perfectamente conocida de ser incluida en la muestra. No es ni siquiera
necesario que los diferentes individuos tengan un igual chance de
pertenecer a la muestra, basta con que tengan cualquier posibilidad
(diferente de cero) de formar parte de ella y que esa probabilidad sea
conocida.
La eleccin de una muestra probabilstica requiere 2 condiciones
fundamentales:
Primero.- Es esencial que la probabilidad de elegir cada individuo sea
perfectamente conocida, pues si no lo es, no ser posible calcular errores
que puedan cometerse al hacer su seleccin.
Segundo.- Es indispensable que los individuos se elijan al azar, sin
permitir la intervencin de ningn factor que favorezca la eleccin de unos
en detrimento de los otros.
Existen cuatro formas de tomar una muestra probabilstica:
Muestreo Aleatorio Simple
En este caso cada observacin tiene la misma probabilidad de ser
seleccionada. Ejemplo: para seleccionar al amigo secreto en la navidad,
todos ponen su nombre en un papelito, lo introducen dentro de una bolsa,
y luego cogen uno al azar.
Tambin puede simplificarse el mtodo de seleccin empleando la tabla
de nmeros aleatorios y un computador.
Muestreo Sistemtico
Se selecciona una muestra tomando k-sima unidad de la poblacin una
vez que todos los elementos de la poblacin estn numerados a
arreglados en una lista.
Entonces si se va a seleccionar una muestra de 40 unidades a partir de
una poblacin de 1000 unidades, la muestra se obtiene tomando cada 25
sima (1000 /40 ) unidad de la poblacin.
Puede utilizarse el procedimiento de la urna para determinar con cual de
las primeras 25 unidades se deben empezar.

Muestreo Estratificado
Seleccin aleatoria en estratos de diferente tamao de acuerdo a su peso
relativo. Ejemplo: se desea asistir a una visita en una empresa y que se
beneficien los alumnos de todas las escuelas de la UCV. Por
especialidad, el nmero de alumnos difieren entre ellos, por lo tanto debo
tomar una muestra que refleje el peso relativo de cada especialidad.

Muestreo por Conglomerado
Permite dividir la poblacin en grupos y seleccionar una muestra de estos
conglomerados. El muestreo por conglomerado es diferente del muestreo
estratificado, pues las diferencias entre los conglomerados son
generalmente pequeas, pero las diferencias entre las unidades dentro de
cada conglomerado en general son mayores.




















EJ ERCICIOS DE APLICACIN N 11.-
1.- El presidente de una fraternidad en el campus universitario desea tomar una
muestra de las opiniones de 112 miembros respecto a las actividades urgentes
para el otoo
b. cul es la poblacin?
_________________________________________________________
c. Cul es la mejor forma en qu debe tomarse la muestra?
_________________________________________________________
2.- Se desea realizar una evaluacin de los principales problemas detectados en el
campus universitario:
i. Congestionamiento en los ascensores
ii. Prdida de objetos personales
iii. Rendimiento de los alumnos.
iv. Vocacin profesional.
Identifique la poblacin y el tipo de muestreo que aplicara. Por qu? responda en
cada caso
i) Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
____________________________________________________________


ii) Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________

iii) Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________
iv) Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
___________________________________________________________

3.- El censo del 2007 se muestra que en Jauja el 11.5% de los residentes tienen ms
de 60 aos. Para verificar un sistema de muestreo por telfono se llaman a 200
residencias elegidas al azar. De los residentes contactados, 10.2% tenan ms de
60 aos.
a) 11.5% es un parmetro o una estadstica?
b) 10.2% es un parmetro o una estadstica?
4. En el ao 2006 la Universidad Cesar Vallejo tiene 5 453 estudiantes, en la tabla se
muestra un detalle de la composicin. Necesitamos una muestra de tamao n=20 de
la poblacin de estudiantes.
Mujeres Hombres Total
Pregrado 2461 2848 5309
Postgrado 67 77 144
Total 2528 2925 5453
Elija muestras de tamao 20 para 2 tipos de muestreo: (en cada alternativa use la
tabla aleatoria, empiece en la fila 3 y columna 4)
a) Muestreo aleatorio simple
b) Muestreo estratificado por gnero

5. Supongamos que necesitamos seleccionar a 4 integrantes del programa de televisin
"Gana con la Estadstica" de Abril del 2008. Calcule muestras de tamao n=4
usando los distintos diseos muestrales (muestreo aleatorio simple y muestreo
estratificado). En cada alternativa, use la tabla de nmeros aleatorios, empiece en la
fila 3 columna 3.

Mujeres Hombres
Giovanna Santos Gianina Ramos Jorge Molina Nelson Pachas
Brbara Ascue Pam Lozano Leandro Martnez Joel Mauri
Dany Bellido Jimena Pereira Lia Gutierrez
Carolina Soto Maura Rivera Dario Juarez
Maria Sobarzo Rosa Daz
6. Suponga que nuestra poblacin de inters es el comit de estudiantes de la UCV
para efectos de colaboracin con la universidad en agosto del 2008. Juan Prez,
Miguel Cornejo, Juana Olivares, Lucia Galn, Edwin Manrique, Anglica Mario,
Carlos Enciso, Julia Salinas, Manuela Enrico, Sonia Oquendo, ngel Bravo, Luis
Alba, Abel Vivar, Carla Espinosa, Marcelo Oyarte, Elba Aguilar, Ernesto Aguirre,
Francisco Alama.
(En cada alternativa use la tabla aleatoria, empiece en la fila 4 y columna 2)
a) Si nos interesa estudiar la proporcin de mujeres en esta poblacin. Elija una
muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Indique cul es el parmetro y el estadstico en (a)
c) Elija una muestra estratificada por sexo de tamao n=4 de esta poblacin

7. La Facultad de Administracin de la Universidad Cesar Vallejo, quiere saber acerca
del ingreso promedio de sus estudiantes y para esto enva cartas a todos los
Estudiantes desde su ingreso a la Universidad en el ao 2006. En la Encuesta haba
slo una pregunta: Cul es el ingreso promedio en su hogar? Aproximadamente
30% de los alumnos respondieron.
Comente los posibles sesgos acerca del salario promedio de los estudiantes de
Administracin. Cmo debe ser el ingreso promedio entre los que respondieron y
los que no respondieron?

8. El titular de un diario dice: Encuesta seala que aument el porcentaje de gente que
chatea en el trabajo. El artculo dio la siguiente informacin: Se encuestaron al
azar 227 personas que llamaron a la lnea abierta 800-CHAT durante 6 semanas
entre Febrero y Marzo. 92% de los que llamaron dijeron haber chateado alguna vez
mientras trabajaban.
a) Qu clase de muestreo se us?
b) Cul piensa usted que fue la poblacin de la cual fue elegida esta muestra?
c) Piensa usted que el titular es correcto?

9. Una organizacin estudiantil quiere saber si a los estudiantes le interesa cambiar el
horario de atencin de la biblioteca. Selecciona al azar 100 estudiantes de primer
ao, 100 de segundo, y 100 estudiantes que egresarn este ao. Qu tipo de
diseo muestral es ste?

10. Un profesor quiere investigar sobre el tiempo diario de estudio de 20 estudiantes de
una clase
Nombre Nmero de horas Nombre Nmero de horas
Juan 2,3 Mara 2,9
Alicia 1,9 Fernanda 0,7
Pedro 2,0 Julio 0,8
Marcos 1,5 Rosa 1,0
Alberto 1,7 Fabin 1,3
Jorge 2,2 Ana 2,8
Jos 1,8 Laura 0,8
Carlos 1,9 Enrique 0,9
Miguel 1,9 Carmen 1,1
Victoria 1,6 Marcelo 1,2

En cada alternativa, use la tabla de nmeros aleatorios, empiece en la fila 1
columna 1 y contine seleccionando hacia la derecha.

a) Elija una muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Calcule el Parmetro y el Estadstico en (a).
c) Elija una muestra estratificada de tamao n=4 por sexo de esta poblacin
d) Calcule el estadstico en (c)

11. Una compaa de marketing saca una muestra de la gua de telfonos tomando 10
personas cuyos apellidos comiencen con letra A, 10 personas cuyos apellidos
comiencen con la letra B, y as sucesivamente con cada letra del alfabeto, para una
muestra total de 260 personas.
a) Qu clase de diseo muestral se us aqu?
b) Tienen todos los que estn en la gua de telfonos igual probabilidad de ser
elegidos en la muestra?
c) No todos los residentes de la ciudad tiene telfono, qu clase de sesgo va a
provocar este hecho?
d) Se sabe que la distribucin de la primera letra del apellido vara por etnicidad
Qu clase de sesgo va a provocar este hecho?

TAMAO DE LA MUESTRA
Para determinar el tamao de muestra a partir de una poblacin debemos tener en
cuenta los conceptos de algunos trminos que hemos desarrollado a travs de las
sesiones del presente modulo y del curso de estadstica como:

a) Tipo de muestreo:
b) Parmetro a estimar:
c) Error muestral admisible:
d) Varianza poblacional:
e) Nivel de confianza.

Tamao de muestra para estimar la media de la poblacin
Para determinar el tamao de una muestra empleando el muestreo aleatorio simple
es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que
queremos trabajar (Z); en segundo lugar, cual es el error mximo (e) que estamos
dispuestos a admitir en nuestra estimacin.
La frmula a utilizar para determinar el tamao de muestra a partir de una poblacin
infinita o cuando se desconozca el tamao de la poblacin:


2 2
2
Z
n
e

=

En caso de conocer de tamao de la poblacin


n
n
n
1
N

=
+



Ejercicios
1.- Un bilogo quiere estimar el peso promedio de los ciervos cazados en cierta regin.
Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar de
sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el
bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4
libras?






2.- Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
normal con una desviacin estndar de 40 horas.
a) De qu tamao se necesita una muestra si se desea tener 96% de
confianza que la media real est dentro de 10 horas de la media real?
b) Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se
requiere un error de 5 horas?
c) Suponga que se tiene una poblacin de 300 focos, y se desea saber de que
tamao debe de ser la muestra.
Comente sus resultados
a)

b)




c)







Tamao de muestra para estimar la proporcin de la poblacin
El clculo del tamao de muestra para estimar la proporcin de una poblacin
empleando el muestreo aleatorio simple tendremos en cuenta los mismos conceptos
que en el caso de la media. La frmula a utilizar para determinar el tamao muestral
cuando se desconozca el tamao de la poblacin es:

2
2
Z p(1 p)
n
e


=

En caso de conocer de tamao de la poblacin


2 2
NZp(1 p)
n
e N Z p(1 p)

=
+

Z : correspondiente al nivel de confianza elegido
p: proporcin de una categora de la variable
e: error mximo
N: tamao de la poblacin

Ejercicios
1.- En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Lima, se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere
que sea una muestra si se quiere tener 95% de confianza de que la estimacin de
est dentro de 0.02?





2.- Una legisladora estatal desea encuestar a los residentes de su distrito para conocer
qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos
estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere
un confianza del 95% y un error mximo de estimacin de 0.10?






3.- A cuntas familias tendramos que estudiar para conocer la preferencia del
mercado en cuanto a las marcas de shampoo para beb, si se conoce que el
nmero de familias con bebs en el sector de inters es de 15,000?





4.- Cmo hubiera cambiando el ejemplo anterior, si se desconoce la proporcin
esperada?








HIPTESIS
ESTADSTICA
REALIZACIN DE UNA HIPTESIS
TIPOS DE
HIPTESIS
PRUEBAS DE
HIPTESIS
TIPOS DE
PRUEBAS DE
HIPTESIS
TIPOS DE EROR REGLA DE
DECISIN
Hiptesis simple
Hiptesis compuesta
Hiptesis nula
Hiptesis alternativa
Prueba bilateral o de dos colas
Prueba unilateral de cola a la
derecha
Prueba unilateral de cola a la
izquierda
Error tipo I
Error tipo II
SESIN 12
Prueba de hiptesis sobre la media poblacional y la proporcin poblacional.
12.1. Introduccin
En los trabajos de investigacin se plantean dos hiptesis mutuamente
excluyentes:
La hiptesis nula (Ho) y
La hiptesis de investigacin (Hi)
El anlisis estadstico de los datos servir para determinar si se rechaza o no se
rechaza la hiptesis de nulidad. Cuando se rechaza la hiptesis nula, significa que
el factor estudiado ha influido significativamente en los resultados y es informacin
relevante para apoyar la hiptesis de investigacin planteada. Es muy importante
tener presente que la hiptesis de investigacin debe coincidir con la hiptesis
alternativa. Plantear hiptesis de investigacin que coincidan con la hiptesis de
nulidad supondra una aplicacin incorrecta del razonamiento estadstico.
El propsito de la prueba de hiptesis no es cuestionar el valor calculado del
estadstico (muestral), sino hacer un juicio con respecto a la diferencia entre
estadstico de muestra y un valor planteado del parmetro.

12.2 Hiptesis estadsticas
Definicin. Se denomina hiptesis estadstica, a cualquier afirmacin, supuesto o
conjetura que se hace acerca de la distribucin de una o ms poblaciones.
Las hiptesis estadsticas consisten en suponer que los parmetros, que definen a
la poblacin, toman determinados valores numricos.
Por ejemplo, son hiptesis estadsticas:
1. La longitud media de un tipo de objetos es 10 centmetros.
2. La proporcin de objetos defectuosos producidos por cierto proceso nunca es
superior al 8%.
3. La varianza de la longitud de cierto tipo de objetos es 0.25 cm
2
.
4. Son iguales las medias de dos tipos de mediciones independientes X e Y que se
distribuyen normalmente con varianza comn
2

Ms ejemplos:
5. _______________________________________________________________
6. _______________________________________________________________
7. _______________________________________________________________

12.3.- Hiptesis simple y compuesta
Definicin. Se denomina hiptesis _____________ a cualquier hiptesis
estadstica que especifica completamente la distribucin de la poblacin, es
decir, ____________ la forma de la distribucin y el valor de su(s) parmetro(s).
Si una hiptesis no ________________ completamente la distribucin de la
poblacin se dice que es una _____________ compuesta.
Por ejemplo:
La hiptesis que establece que el ingreso mensual promedio de los empleados
de cierta ciudad es = $500, suponiendo que los ingresos mensuales se
distribuyen segn la normal con desviacin ____________ conocida = $30, es
una hiptesis simple, pues, especifica completamente la _______________ de la
poblacin.
En cambio, si se supone que los ingresos mensuales se distribuyen segn la
_____________ con desviacin estndar conocida = $30 y se afirma que el
ingreso promedio mensual es:
500 < 500 > 500, entonces la ________________ referente a la
media es una hiptesis ______________, pues, no especifica la media de la
distribucin de la poblacin de los ingresos.

12.4.- Hiptesis nula y alternativa
Definicin. Se denomina ___________________ y se representa por H
0
a la
hiptesis que es aceptada provisionalmente como ______________ y cuya
validez ser sometida a comprobacin experimental. Los resultados
experimentales nos permitirn seguir aceptndola como verdadera o si, por el
contrario, debemos rechazarla como tal.
Toda hiptesis nula va acompaada de otra hiptesis _________________.
Se denomina ______________ alternativa y se representa por H
1
o por H
A
a la
hiptesis que se acepta en caso de que la hiptesis nula H
0
sea
______________. La hiptesis alternativa H
1
, es pues una suposicin
________________ a la hiptesis nula.

Por ejemplo, si se asume que
0
es un valor del parmetro desconocido de
una poblacin cuya distribucin se supone conocida, entonces son hiptesis
nulas y alternativas respectivamente las siguientes afirmaciones:
H
o
: =
0
, y H
1
:
0

H
o
:
0
, y H
1
: >
0

H
o
:
0
, y H
1
: <
0


12.5.- Prueba de una hiptesis estadstica
Para tomar decisiones estadsticas, se requieren de las dos hiptesis: la
hiptesis nula y la hiptesis alternativa referida a un ________________ .
La prueba de una hiptesis estadstica es un proceso que nos conduce a tomar
la decisin de _________________ o rechazar la hiptesis nula H
0
en
contraposicin de la ________________ H
1
y en base a los resultados de una
muestra aleatoria seleccionada de la poblacin en estudio.
La aceptacin de una hiptesis significa que los datos de la muestra no
proporciona evidencia suficiente para refutarla. El rechazo significa que los datos
de la muestra lo _________________.

a) Tipos de pruebas de hiptesis
El tipo de prueba depende bsicamente de la _________________ H
1
.
Se denomina ___________________ de una cola a toda prueba de hiptesis
donde la alternativa H1 es unilateral. Si la alternativa es _______________, la
prueba se denomina prueba de dos colas; luego, para un parmetro = X se
tiene que:

La prueba de hiptesis H
o
: =
0
contra H
1
: se denomina prueba
bilateral o de dos colas.

La prueba de hiptesis H
o
: =
0
contra H
I
: >
0
se denomina prueba
unilateral de cola a la derecha.


La prueba de hiptesis H
o
: =
0
contra H
1
: <
0
se denomina prueba
unilateral de cola a la izquierda.


b) Errores tipo I y tipo II, y Nivel de significacin
Al tomar la decisin de aceptar o rechazar la hiptesis nula H o: =
0
en base
a los resultados obtenidos de una muestra aleatoria seleccionada de la
poblacin en estudio; hay cuatro posibles situaciones que determinan si la
decisin tomada es correcta o incorrecta, como se muestra en la tabla:
DECISIN H
0
VERDADERA H
0
FALSA
RECHAZAR H
0
ERROR TIPO I
Probabilidad:
DECISIN CORRECTA
Probabilidad: 1-
ACEPTAR H
0
DECISIN CORRECTA
Probabilidad: 1-
ERROR TIPO II
Probabilidad:

El nivel de significacin se fija previamente por lo general en = 0.05 o =
0.01. Si para un valor dado de , se rechaza la hiptesis H
o
entonces se dice
que los resultados muestrales obtenidos, no slo son diferentes por efectos del
azar, si no que se espera que de 100 resultados muestrales en x 100% de las
veces se rechazar la hiptesis nula H
o
cuando realmente es verdadera.

c) Regin crtica y regla de decisin
La regla de decisin implica la divisin de la distribucin muestral del
estadstico de la prueba en dos partes mutuamente excluyentes: la regin
de rechazo o regin crtica (R.C.) de H0, y la regin de aceptacin (R.A.) o no
rechazo de H
0
. Esta decisin depende de la hiptesis alternativa H
1
, del nivel
de significacin y de la distribucin muestral del estadstico

12.6.- Procedimiento de la prueba de hiptesis
Previamente debe formularse el problema estadstico, determinar la variable en
estudio y el mtodo estadstico adecuado para la solucin del problema.
El procedimiento general de la prueba de una hiptesis de parmetro se
resume en los siguientes pasos:
1. Formular la hiptesis nula Ho : =
0
y la hiptesis alternativa adecuada:
H
1
:
0
o H
1
: >
0
o H
1
: <
0

2. Especificar el tamao a del nivel de significacin.
3. Seleccionar la estadstica apropiada a usar en la prueba.
4. Establecer la regla de decisin, determinando la regin crtica de la prueba.
5. Calcular el valor del estadstico de la prueba a partir de los datos de la muestra.
6. Tomar la decisin de rechazar la hiptesis Ho si el valor del estadstico de la
prueba est en la regin crtica. En caso contrario, no rechazar Ho.


PRUEBA DE HIPOTESIS ACERCA DE LA MEDIA
EJEMPLOS:
1) Una muestra aleatoria de 100 muertes registradas en el Per el ao pasado muestra
una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de
8.9 aos, esto parece indicar que la vida media hoy en da es mayor que 70 aos?
Utilice un nivel de significancia de 0.05


Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar conocida.
Datos:
=70 aos
= 8.9 aos
= 71.8 aos
n = 100
= 0.05

1) Ensayo de hiptesis
H
o
;
H
1
;

2)


3)



4)




5) Calcule el estadstico de prueba.







6) Regla de decisin y conclusin:




2) Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviacin
estndar de 40 horas. Si una muestra aleatoria de 40 focos tiene una duracin
promedio de 788 horas, muestran los datos suficiente evidencia para decir que la
duracin media ha cambiado? Utilice un nivel de significancia del 0.04.
Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar conocida.
Datos:
=800 horas
= 40 horas
= 788 horas
n = 40
= 0.04

1) Ensayo de hiptesis
H
o
;
H
1
;
2)


3)
4)






5)







6)



Conclusin



3) Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio 5.23
onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que
___= 5.5 onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de
significancia de 0.05.
Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar
desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la
desviacin muestral como un estimador puntual para la poblacional.
Datos:
=
=
=
n =

1) Ensayo de hiptesis
H
o
;
H
1
;

2)

3)



4)






5)




6) Regla de decisin:



Conclusin



PRUEBA DE HIPTESIS ACERCA DE LA PROPORCIN
1) Un constructor afirma que se instalan bombas de calor en 70% de todas las casas
que se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo con
esta afirmacin si una investigacin de casas nuevas en esta ciudad muestra que 35
de 55 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.
Solucin:

Se trata de una distribucin muestral de proporciones.

Datos:
= 0.70
p = 35/55 =
n = 20
= 0.10

1) Planteamiento de hiptesis
H
o
;
H
1
;
2)

3)


4)







5)






6)



Conclusin






EJERCICIOS DE APLICACIN N 12
PRUEBA DE HIPTESIS PARA LA MEDIA Y LA PROPORCIN
Una media:
l. Un productor de cpsulas de ua de gato afirma que la demanda promedio de su
producto en el mercado es de 1000 cpsulas diarias. Sin embargo, un estudio de la
demanda de su producto en 36 das aleatorios da una media y una desviacin
estndar de 850 y 360 cpsulas diarias respectivamente. es esto suficiente
evidencia para contradecir la afirmacin de este productor? Utilice el nivel de
significacin = 3%.

2. La duracin de cierta marca de bateras es una variable aleatoria cuya distribucin
se supone normal. Se estima que su duracin media es de 500 horas y que el 95%
del total duran entre 480.4 y 519.6 horas. Si en una muestra aleatoria de 9 de tales
bateras con una desviacin estndar de 16 horas se encuentra que la duracin
media es 495 horas, es esto evidencia para concluir al nivel de significacin del 5%
que la duracin media de todas esas bateras es diferente de 500 horas?

3. Se afirma que los fumadores adultos del pas consumen en promedio al menos 10
cigarrillos por da. Para comprobar esta afirmacin, se escoge una muestra aleatoria
de 36 fumadores adultos y se observa X i el nmero de cigarrillos que fuman por da,
resultando:

36
1
324
i
i
X
=
=

y
36
2
1
3231
i
i
X
=
=


Utilizando =0.01, Parecera esto indicar que el promedio del consumo es menor
que 10?
4. Cierta prueba de ingreso universitario tiene una media de 200 puntos y una
desviacin estndar de 50 puntos. Si para comprobar el valor de la media se utiliza la
regin crtica RC= (X < 190} donde X es la media de muestras de tamao 100,
Con qu probabilidad se rechaza H o: u = 200 si es verdadera?

5. Se afirma que el peso de los alumnos varones de la universidad tiene una media de
68 kg. Y una desviacin estndar de 3.6 kg. Si para verificar u = 68 se utiliza la
regin crtica RC = {X < 67 o X> 69} donde X es la media de muestras de tamao 64,
En qu porcentaje de casos esta regin crtica no detecta una diferencia igual a 2
kg. en el promedio de los pesos y por encima de 68 kg.?

6. Se cree que el tiempo promedio que utilizan los alumnos del ciclo bsico para realizar
cierta prueba de aptitud tiene distribucin normal cuya media es 15 minutos. Para
comprobar la hiptesis respecto a la media se toma una muestra aleatoria de 16 de
tales alumnos y se encuentra un promedio de 16 minutos. Realice una prueba con el
nivel de significacin =0.05, si sabe que =3.2

7. Cierta prueba de inteligencia para estudiantes preuniversitarios tiene una media de
100 puntos. Para verificar el valor de la media se aplic la prueba a una muestra
aleatoria de 36 estudiantes preuniversitarios dando una media de 90 puntos y una
desviacin estndar de 30 puntos. Si = 0.01, cul es la probabilidad de rechazar en
forma acertada que el promedio de la prueba es 100 puntos cuando realmente es 80
puntos?


8. Un consumidor afirma que el nuevo hilo sinttico que produce la empresa "HILOS"
tiene una resistencia media a la ruptura no mayor de 15 kilogramos. Para verificar si
el consumidor tiene razn el fabricante escogi una muestra de 36 de tales hilos
encontr una media y una desviacin estndar de resistencia a la ruptura de 16 y 3
kg. respectivamente. Utilizando = 0.05.
a) Comparando el nivel de significacin a=O.05 con P = P{X > 16], se acepta la
hiptesis del consumidor?
b) Halle el porcentaje de las veces en que tal muestra nos lleva a rechazar en forma
acertada que la resistencia media a la ruptura es igual a 15 kg. cuando realmente
es igual a 2 kg. por encima de ello.

9. El gerente de ventas de una compaa afirma que sus vendedores venden
semanalmente en promedio $1,500.
a) Al nivel de significacin del 5% pruebe la hiptesis del gerente versus la
hiptesis del presidente de los vendedores que afirma que el promedio de las
ventas semanales es mayor, si una muestra de 36 vendedores ha dado una
media igual a $1510 y una varianza igual a 900$
2
en una semana.
b) Con qu probabilidad la prueba anterior no detecta la diferencia igual a 20$
diarios en el promedio de ventas por da y por encima de lo que se indica en
la hiptesis nula?

10. Los sacos de caf que recibe un exportador deben tener un peso promedio de 100
kilogramos. Un inspector tom una muestra de 50 sacos de un lote de 500 sacos
de caf encontrando una media de 98 Kg. Y una desviacin estndar de 3 Kg. Con
=0.02.
a) Es razonable que el exportador rechace el lote de sacos de caf?
b) Con qu probabilidad esta prueba de hiptesis detecta la diferencia igual a
2 Kg. en el peso promedio del lote y por debajo de 10 que se requiere para
exportar?

11. Un fabricante est considerando la adquisicin de un nuevo equipo para enlatar
conservas de palmito y especifica que el contenido promedio debe ser 300 gramos
por lata. Un agente de compras hace una visita a la compaa donde est instalado
el equipo y observa que una muestra aleatoria de 7 latas de palmito ha dado los
siguientes pesos en gramos:

Pesos
# de latas
y encuentra adems que provienen de una poblacin normal. Probar la hiptesis
nula que la media poblacional es 300 gramos contra una alternativa bilateral:
Utilizando un nivel de significacin del 5%.
a)Por el mtodo de la probabilidad P. (Utilice un paquete de computo)

12. La cantidad de nicotina en mili gramos por cigarrillo de la marca "FUMO", tiene
distribucin normal con media 10. El fabricante afirma que un nuevo proceso de
fabricacin reducir este promedio. Para comprobar esta hiptesis se tom una
muestra aleatoria de 9 cigarrillos "FUMO" fabricados con el nuevo proceso y se
encontraron las siguientes cantidades de nicotina en miligramos:
9 9,2 8,5 8,7 9 8,8 9,2 9,4 9,2

Con base a los resultados de esta muestra. Es razonable aceptar la afirmacin
del fabricante?
Utilice el nivel de significacin del 1 %.

13. Se sabe que las ventas diarias de una compaa tienen distribucin normal con
una desviacin estndar de S/300, El gerente de la compaa afirma que en
promedio las ventas diarias de la compaa es por lo menos S/.2,277 se trata de
probar, con =0.004; si la afirmacin del gerente es verdadera; para esto se
tomar una muestra aleatoria de tamao n. Hallar n y la regin crtica de la
prueba sabiendo que si la verdadera media es 1800, entonces la probabilidad de
error tipo II sera igual a 0.017 Rp. n = 9, RC={ X < 2012}

14. La duracin de cierto tipo de focos de luz se distribuye normalmente con una
media de 400 horas y una desviacin estndar de 24 horas. Se est considerando
aumentar la duracin promedio con un nuevo proceso. Si la duracin promedio
aumenta 15 horas, este cambio debe detectarse con probabilidad 0.9554. Si no
hay cambio, este debe detectarse con probabilidad 0.98. Determine el nmero de
focos que deben probarse y la regin crtica.

Una proporcin:
15. Se controla la calidad de una muestra aleatoria de 40 piezas producidas por un
fabricante. Si se hallaron 4 piezas defectuosas, se debera inferir que el
porcentaje de todas las piezas defectuosas es ms del 5% al nivel de significacin
de 5%?

16. Una firma va a comercializar un nuevo producto slo si hay prueba de que al
menos el 20% de todos los consumidores lo prefieren. Para probar esa hiptesis
se selecciona al azar 200 consumidores. Si se utiliza como regin crtica {X < 30}
donde X es el nmero de consumidores en la muestra que prefieren el producto,
calcular la probabilidad.

17. Se afirma que el 20% de todos los electores estn a favor de cierto candidato.
Para verificar esta hiptesis se escogen 400 electores al azar y si la proporcin a
favor en la muestra; p; est entre 16.08% y 23.92% se acepta que la proporcin
a) favor en la poblacin es p = 20%. En caso contrario se acepta que p 20%.
Cul es la probabilidad de cometer?

18. Tradicionalmente el 13% de los conductores de fin de semana conducen bajo los
efectos del alcohol. El ltimo fin de semana fueron intervenidos 500 conductores
aleatoriamente y 80 de ellos estaban bajo los efectos del alcohol. De esta
muestra se puede inferir que el porcentaje poblacional ya no es 13%?
Utilice = 5%.


19. El gerente de una tienda afirma que el 80% de los clientes del ao pasado,
regresarn este ao a realizar sus compras. Sin embargo, analizando el mercado.
nosotros creemos que dicho gerente ha exagerado. Para probar estas hiptesis se
toma una muestra aleatoria de 200 clientes que el ao pasado haban comprado
en dicha tienda. Si = 0.05 Y si la verdadera proporcin de clientes que regresan a
la tienda es 70%. Calcular u.

20. El Director de la bolsa de trabajo de la universidad afirma que el 10% de los
egresados de la Universidad consiguen empleo con una remuneracin mayor de
$3,000 mensuales. Al parecer el porcentaje indicado es optimista. Para comprobar
esta afirmacin se debe tomar una muestra aleatoria de n egresados. Hallar el
tamao de la muestra y la regla de decisin si se desea que la probabilidad de
cometer error tipo 1 sea 0.2514 y que el riesgo de tomar una decisin equivocada
cuando la proporcin de egresados con una remuneracin mayor de $3,000 sea
del 5% con una probabilidad de 0.0853

21. Un legislador desea probar la hiptesis que ms del 65% de sus representados
est a favor de cierta legislacin laboral que se est presentando en el congreso.
Para esto, realiza una consulta a 400 electores seleccionados al azar.
Considerado u = 0.05.
a) Qu valor como mnimo debe tener la proporcin de la muestra, para que partir
de ese valor, la decisin sea aceptar la hiptesis del legislador?
b) Cul es la probabilidad de tomar la decisin errada de rechazar la propuesta del
legislador cuando en realidad el 70% de los votantes acepta la legislacin laboral?

22. Se asegura que el 70% de los trabajadores estn asegurados bajo el rgimen
particular de pensiones (AFP). Para probar esta afirmacin se toma una muestra
de 80 personas que trabajan. Si menos de 52 personas de la muestra estn
aseguradas en el rgimen indicado, se rechaza que el 70% de la poblacin de
trabajadores est asegurado en AFP.
a) Cul es el nivel de significacin de la prueba?
b) Se podra decir que la prueba puede detectar una diferencia de 20% por debajo
de lo indicado en la hiptesis nula?

23. De una lista de 2,000 clientes de un banco comercial se seleccion una m
aleatoria para obtener opinin acerca del servicio. En la muestra se hall 215 no
tienen quejas del servicio, 25 tienen quejas y 10 no opinan al re Tradicionalmente
el 5% tenan quejas del servicio, sin embargo se cree ahora este porcentaje
aument. Cul es la situacin actual si se quiere probabilidad de 0.007 de
cometer un error?


























PRUEBA DE HIPTESIS
INDEPENDENCIA DE
VARIABLES
DISTRIBUCIN CHI-
CUADRADO
Sesin 13
Prueba de hiptesis para la independencia de variables en una tabla de contingencia.
Distribucin de probabilidad de Chi-cuadrado.
13.1 TABLAS DE CONTINGENCIA
En el los diferentes campos de la investigacin es muy frecuente encontrarse con
variables cualitativas nominales u ordinales: nivel de instruccin, sexo,
calificacin de un servicio, lugar de procedencia, categora laboral, etc. Las
tablas de contingencia resuelven el problema del estudio de la asociacin
existente entre dos variables de tipo cualitativo. O tambin si la proporcin de
casos para cada categora de una de las variables es independiente del valor
que toma la otra variable.
Desde el punto de vista inferencial la hiptesis nula tratara la independencia de
stas variables.
(Hiptesis nula) H
0
: Las variables son independientes.
(Hiptesis alternativa) H
1
: Las variables no son independientes.

Existen ocasiones en que el inters es determinar las diferencias en la frecuencia
de sucesos, como por ejemplo, dada una muestra de estudiantes de las escuelas
de derecho, educacin y sistemas, que han indicado su status socioeconmico
como bajo, bajo-medio, alto-medio, alto. La investigacin podra consistir en
determinar si hay o no asociacin entre status socioeconmico y la facultad donde
estudia. En ambos casos, lo que se busca es determinar si existe una asociacin
(contingencia o correlacin) entre los dos factores de inters.



STATUS SOCIOECONOMICO


ESCUELAS

Bajo
(columna 1)
Alto-medio
(columna 2)
Alto
(columna 3)
Total
Derecho
(fila 1)

13 19 11 53
Educacin
(fila 2)

18 12 8 38
Sistemas
(fila 3)

9
30
(celda 3;2)
20 59

Total 40 61 39 140


El cruce entre filas (i) y columnas (j) de una tabla cruzada o de doble entrada
constituyen las celdas, las cuales contienen informacin referente a las variables
consideradas en la tabla, y pueden constituirlas frecuencias o porcentajes.
El razonamiento para contrastar si existe o no asociacin entre dos variables
cualitativas se basa en calcular cul seran los valores de frecuencia esperados
para cada una de las celdas en el caso de que efectivamente las variables
fuesen independientes, y compararlos con los valores realmente observados. Si
no existe mucha diferencia entre ambos, no hay razones para dudar de que las
variables sean independientes.
El contraste estadstico ms utilizado para evaluar si las diferencias entre las
frecuencias observadas y las esperadas pueden atribuirse al azar, bajo la
hiptesis de independencia, es el denominado Chi-cuadrado de Pearson ():

2
I J
ij ij
2
i j
ij
(O E )



I: representa el nmero de filas
J : representa el nmero de columnas
i: representa la posicin de la fila
j: representa la posicin de la columna
E
ij
: representa la frecuencia esperada para la celda situada en la fila i columna j.
O
ij
: representa la frecuencia efectivamente observada para esa celda.

En la hiptesis de independencia este estadstico se distribuye de forma
aproximada segn una X con grados de libertad igual a (I-1)(J-1), siendo I el
nmero de filas y J el nmero de columnas.

til para la conclusin:
Si el estadstico de prueba X de acuerdo a los datos es mayor que el valor de la
X de la tabla:
2
) (
2
) ( tabla datos
_ _ >


Entonces rechazaremos la hiptesis nula y concluimos que ambas variables son
dependientes o estn relacionadas. De lo contrario estas seran independientes,
es decir no estn relacionadas.

Ejemplo
Se realiza un estudio para investigar la asociacin entre el uso de vitaminas y el
rea donde reside. Se seleccionan 100 personas aleatoriamente y se recogen
datos respecto al uso de las vitaminas y el rea donde reside de acuerdo a la
tabla adjunta.
Tabla N 1 (frecuencias observadas)
rea de Residencia
Uso de
vitaminas
Urbana Rural Total
Si 36 34 70
No 24 6 30
Total 60 40 100

Solucin:
Primero: planteamos nuestras hiptesis de acuerdo al enunciado.
H
0
: El rea de residencia y el uso de vitaminas son independientes.
H
1
: El rea de residencia y el uso de vitaminas son dependientes (estn
relacionados).

Segundo: calculamos las frecuencias esperadas (tabla N

2):
De acuerdo a la tabla anterior (tabla N 1) se calcula la probabilidad de que una
persona use vitaminas se puede estimar en la muestra como 70/100.
Se esperara que el 70% de la poblacin urbana (60 individuos) usara vitaminas:
) individuos (42 60 *
100
70
=

y el 70% de la poblacin rural (40 individuos) usara vitaminas.
) individuos (28 40 *
100
70
=

Se repite el mismo caso para los que no usan vitaminas.
La probabilidad de que una persona no use vitaminas es: _______.
Se esperara que el ____% de la poblacin urbana (60 individuos) no usara
vitaminas. ____________________
Se esperara que el ____% de la poblacin rural (40 individuos) no usara
vitaminas. ____________________
Por ltimo completar la tabla 2
Tabla N 2 (frecuencias esperadas)
rea de Residencia
Uso de
vitaminas
Urbana Rural Total
Si 42 28 70
No
Total
Tercero: calculamos el estadstico de prueba, para la cual usaremos las
frecuencias observadas (nuestros datos reales tabla 1) y las frecuencias
esperadas (la nueva tabla 2):

Usando la formula del contraste estadstico de la X

143 . 7
12
) 12 6 (
18
) 18 24 (
28
) 28 34 (
42
) 42 36 (
2 2 2 2
2
~

= _


Cuarto: observamos la cantidad de filas y columnas en nuestra tabla (2 filas y 2
columnas), luego buscamos en la tabla el valor de la que corresponde con:
(2 X 1)*(2 X 1) = 1 grados de libertad.
Para una significancia X = 0.05. Encontramos que esta es aproximadamente
3.481

Quinto: Comparamos los valores de la X , en este caso resulto X (datos) es
mayor que X (tabla), por lo tanto rechazamos la hiptesis nula y concluimos que
a un nivel de significancia del 5% que el uso de vitaminas depende del rea de
residencia.



TABLA CHICUADRADO
Probabilidad de un valor superior - Alfa ()
Grados
libertad
0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17



EJERCICIOS DE APLICACIN 13.-
1.- Utilizando un archivo del SPSS con ruta:
Archivos de programas / SPSS / Datos de empleados
a) Obtener la tabla de contingencias de la variable sexo por grupos de salario.
Obtener las correspondientes medidas de asociacin y decide sobre la
hiptesis de independencia.
b) Obtener e interpretar el estadstico Chi-cuadrado de Pearson para las
variables sexo y categora laboral, concluyendo si las variables sexo y catlab
estn o no relacionadas.
c) Obtener la tabla de contingencias de la variable grupos de salarios por nivel
de estudios. Qu puedes intuir o inferir a la vista de dicha tabla?
Corroborarlo con el clculo de un estadstico adecuado acompaado de su
prueba de significacin. Sugerencia: Transformar la variable salarios y nivel
de estudios en rangos
2.- En un estudio se seleccionan al azar 200 estudiantes de la poblacin total de una
Universidad y cada estudiante se clasifica segn la carrera que estudia y segn
su preferencia por uno de los candidatos A y B en una prxima eleccin. Se
obtiene los siguientes resultados:
Escuela
Candidato
A
Candidato
B
Indecisos
Ingeniera de
Sistemas 24 29 12
Derecho 24 14 10
Educacin Primaria 17 8 19
Educacin Inicial 27 19 9

En este estudio se quiere probar la hiptesis de independencia de los factores,
es decir, la preferencia de los estudiantes por un candidato es independiente de
la facultad.





































Anlisis de regresin
Correlacin Regresin lineal simple
Definicin
Correlacin lineal simple
Caractersticas
Modelo lineal
SESIN 14
Correlacin. Definicin. Diagrama de dispersin. Coeficiente de Correlacin de Pearson
y de Spearman. Regresin lineal simple. Ecuacin de regresin Coeficiente de
determinacin. Interpretacin de coeficientes.
14.- CORRELACIN
14.1.- Definicin.-
El anlisis de correlacin tiene como objetivo medir la fuerza de una relacin
entre variables cuantitativas y/o cualitativas, sta es medida a travs del
coeficiente de correlacin, para variables cuantitativas que tienen distribucin
normal se utilizar la correlacin momento producto de Pearson y para
variables que no tienen distribucin normal o cualitativas la correlacin de rango
de Tau de Kendall o Spearman.
Esta relacin que es analizada puede estar dada de una manera lineal, el cual
nos dice que los datos se ajustaran a una lnea recta o tambin estara de una
forma no lineal en este caso los datos se ajustaran ms a una curva. Es decir
dos variables pueden estar perfectamente relacionadas, pero si la relacin no es
lineal, el coeficiente de correlacin de Pearson o de Spearman no ser un
estadstico adecuado para medir su asociacin.
Si la relacin que se busca es solamente entre dos variables, recibe el nombre
de correlacin simple o bivariada.
Si el nmero de variables se incrementa se le conoce como correlacin
mltiple.
Otros tcnica que se pueden estudiar la relacin estadstica entre dos variables
son la prueba t de dos grupos, el anlisis Chi cuadrado o tablas de contingencia.
Estas dos tcnicas se introdujeron en los captulos 12 y 13 respectivamente.
Ejemplo:
- Nmero de horas de estudio y rendimiento acadmico.
- Gastos en publicidad e ingreso total
- Precio de un producto y cantidad demandada del mismo.
- ________________________________________________________________
- _______________________________________________________________
- ________________________________________________________________

Hay supuestos que constituyen un modelo de poblacin por correlacin lineal
bivariable, para lo cual se calcula o se estima r, los cuales son:
1. Y e X son variables aleatorias, y como tal no debe ser designada como dependiente
e independiente. Cualquier designacin dar el mismo resultado pues ello no
interviene en la estimacin del r.

2. La poblacin bivariable es normal, o sea Y e X estn normalmente distribuidas.


14.2 DIAGRAMA DE DISPERSION.- Nube de puntos
Es una forma grfica de saber si existe o no relacin acentuada entre dos
variables, asimismo que tipo de relacin es. (Lineal, parbola, exponencial, etc.)



Y
x
x x x
x x x
x x
x x
x
x
X
Y Y








X X
Relacin negativa Relacin positiva




Y
x x
x x
x
x x x
x

X
No hay ninguna relacin




14.3 COEFICIENTE DE CORRELACIN LINEAL SIMPLE.-
Se presenta correlacin lineal cuando la relacin entre dos variables se manifiesta
a travs de una lnea recta y es simple porque solo intervienen dos variables.
Esta correlacin o asociacin, se mide a travs del coeficiente de correlacin lineal
simple ( r), definido como:

POBLACIN:


| | | |




=
2 2 2 2
) ( ) (
) )( (
X X N Y Y N
Y X XY N



MUESTRA:




El rango (intervalo de variacin) de r, es:
-1 < < 1



| || |




=
2 2 2 2
) ( ) (
) )( (
X X n Y Y n
Y X XY n
r


-1 0 1
Correlacin lineal No hay relacin Correlacin lineal
negativa lineal positiva


Observacin.
- El coeficiente de correlacin de clculo r es un estimador muestral del coeficiente
poblacional Rho

.

- Cuando el valor de r sale ms cerca de "1", mayor ser la correlacin lineal
positiva o sea la relacin entre las variables X e Y es directa, es decir si X aumenta,
Y tambin aumenta; y si X disminuye, Y tambin disminuye.

- Cuando el valor de r, sale ms cera a "-1", mayor ser la correlacin lineal
negativa o sea la relacin entre las variables X e Y es inversa, es decir si X
aumenta, Y disminuye; y si X disminuye, Y aumenta.

- Si Cov (Y, X) = 0 ; entonces r = 0 , luego la correlacin es nula entre las dos
variables, es decir las variables son independientes.

Lo siguiente es una tabla segn, M. Reyes para deducir el grado de correlacin lineal
simple entre dos variables:

Si, r se encuentra en:

1.00 CORRELACIN PERFECTA Y POSITIVA
0.90 - 0.99 CORRELACIN MUY ALTA
0.70 - 0.89 CORRELACIN ALTA
0.40 - 0.69 CORRELACIN MODERADA
0.20 - 0.39 CORRELACIN BAJA
0.01 - 0.19 CORRELACIN MUY BAJA
0 No existe correlacin
-1 CORRELACIN PERFECTA Y
NEGATIVA

Prueba de Hiptesis del Coeficiente de correlacin
Prueba de hiptesis del coeficiente de correlacin poblacional Rho, (letra griega) se
estima con r y responde a la siguiente hiptesis:


0 :
0
= H

0 :
1
= H


El estadstico de contraste es una prueba t donde el:
2
1
2
" "
r
n
r t
calculado

=

Esta prueba se hace con n-2 grados de libertad.
Al interpretar los resultados, se debe evitar extraer conclusiones de causa-efecto a
partir de una correlacin significativa.
Ejemplo.-
En la empresa PAVIRICOS S.R.L. que se dedican a la comercializacin agrcola, se
desea estudiar el efecto del nmero de horas por semana (X), en el sueldo de los
trabajadores obreros (Y) para 2007. La informacin de los 10 trabajadores obreros da
los siguientes resultados:
N de observacin N de horas/semana
(horas)
(X)
Salario trabajadores
obreros (S/.)
(Y)
1
2
3
4
5
6
7
8
9
10

84
76
72
49
71
63
64
84
47
67

134.4
77.6
112.6
80.2
110.6
98.8
100.4
134.4
77.6
105.8
Fuente: Empresa Paviricos S.R.L. 2007

a Seale el ttulo del cuadro.
b Realice el diagrama de dispersin e interpretar.
c Averige si existe relacin entre las dos variables mencionadas.
Solucin.-
a) Titulo:

b) Diagrama de dispersin





c) al averiguar si existe relacin entre dos variables, se calcula el coeficiente de
correlacin lineal simple, y se procede de la siguiente manera:





N HORAS
SEMANALES
(Horas)
X
SALARIO
TRABAJADORES
OBREROS (S/.)
Y
X Y X
2
Y
2
84 134.4 84 (134.4) 84 x 84 134.4 x 134.4
76 77.6 76 (77.6) 76 x 76 77.6 x 77.6
72 112.6
49 80.2
71 110.6
63 98.8
64 100.4
84 134.4
47 77.6
67 105.8
i
X =


i
Y =


XY =


2
X =


2
Y =



Aplicando la frmula del coeficiente de correlacin:






Interpretacin.-
______________________________________________________________________
______________________________________________________________________
_____________________________________________________________

14.4. ANLISIS DE REGRESIN LINEAL SIMPLE.-
14.4.1. Caractersticas.-
Cuando existe relacin lineal, el objetivo se transforma en representar esta
relacin mediante una forma matemtica, o sea utilizando una ecuacin que
determine la relacin existente entre las variables analizadas.
El procedimiento a seguir es buscar una lnea o curva, que se ajuste ms a los
valores de las variables, en el caso de que sea una lnea recta, se le conoce con
el nombre de Regresin lineal y si la ecuacin resulta una curva, recibe el
nombre de Regresin no lineal.
Si la ecuacin que se busca es solamente en base a dos variables, se le conoce
con el nombre de Regresin simple.
Si el nmero de variables es ms de dos variables, se le conoce con el nombre
de Regresin mltiple.

14.4.2 MODELO LINEAL Y SU INTERPRETACIN.-
Definicin.- Relacin de dos variables a las cuales se ajusta a una lnea recta.
Y = f ( X )
Y =
o
+
1
X
Entones el modelo de regresin lineal simple que sirva para predecir el
comportamiento de Y usando X ser de la forma:
Y =
o
+
1
X + e
Donde: Y = variable dependiente
a = constante, parmetro de posicin.

1
= pendiente de la recta, coeficiente de regresin
X = variable independiente
e = error aleatorio, el cual se supone que tiene media 0 y varianza
constante
2
.

o
Constante o parmetro de posicin.
Es el valor promedio de la variable de respuesta Y cuando X es cero. Si
se tiene certeza de que la variable predictora X no puede asumir el valor
0, entonces la interpretacin no tiene sentido.

1
Coeficiente de regresin.
Es el cambio (incremento o disminucin segn el signo de
1
) promedio
en la variable de respuesta Y cuando X se incrementa en una unidad.
Las unidades de
1
son las mismas unidades de la variable dependiente
Y.
NOTA.- Los coeficientes de regresin
1
y el coeficiente de correlacin lineal
simple r deben de tener el mismo signo.

14.4.3 ESTIMACIN DE PARAMETROS DE LA REGRESIN
Para que dicha ecuacin est definida es necesario que se conozca
o
y
1
.
Dichos parmetros se calcula utilizando el mtodo de mnimos cuadrados.
El mtodo de mnimos cuadrados busca o fija los datos de la muestra o
poblacin a una lnea recta de modo que las diferencias de cada observacin a la
lnea de regresin sea lo menos posible.
lnea de regresin sea lo menos posible.

Y
x
e
3

x
e
1

e
2
x

X

=
=
n
i
i
mnimo e
1
, n = n de observaciones (tamao de la muestra)

Luego de minimizar cada valor de e
i
, se obtienen las frmulas de a y b.

=
2 2 1
) (
) )( (
X X n
Y X XY n
|

X b Y
o
= |


donde:

o
= Intercepto de la ecuacin de regresin con el eje Y

1
= Coeficiente de regresin.
X
i
= Valores de la variable independiente
Y
i
= Valores de la variable dependiente

X
= Promedio de los valores de la variable independiente

Y
= Promedio de los valores de la variable dependiente.

Pruebas de hiptesis de los coeficientes de regresin
Las hiptesis que se plantean son:
Ho:
0
1
= |

H
1
:
0
1
= |


El Coeficiente de Determinacin R
2

Es una medida de la bondad de ajuste del modelo de regresin hallado. Indica
qu porcentaje de la variabilidad de la variable de respuesta Y es explicada por
su relacin lineal con X.
El valor estadstico de R
2
vara de cero a uno.

Ejemplo:
Con los datos del ejemplo anterior: Hallar la ecuacin de regresin entre las dos
variables.
Salario de trabajadores = f ( N de Horas/semana)
Solucin.-
Datos:

=
=
=
=
=

X
Y
Y
X
XY



Ecuacin de regresin :

Salario de trabajadores =
0
+
1
N de Horas /semana
( S/.) (hora)





1
= ______________________________


1
=



0
=


0
=
Entonces, la ecuacin de regresin es:
Salario de trabajadores = + N de Horas /semana
( S/.) (hora)

Interpretacin:
__________________________________________________________________
____________________________________________________________

14.5 GRFICO DE LA ECUACIN DE REGRESIN.-
Para trazar la ecuacin o lnea de regresin, recordemos que matemticamente
la ecuacin Y = a + b X tiene como grfica una lnea recta, por lo tanto bastar
con delimitar dos puntos para tener identificada la lnea.
Entonces para determinar stos dos puntos (pares ordenados) se calcula dos
valores de Y para dos valores de X . Por conveniencia tomaremos los valores
extremos de X, pero puede ser cualquiera de los otros valores.
Luego entonces procederemos de la siguiente manera:
- Cuando X = 47 Y = + ( )
Y = Luego, el par ordenado ser: ( 47, )

- Cuando X = 87 ,
Y = + ( )
Y = Luego, el par ordenado ser : ( 87, )


Graficando la ecuacin de regresin, hay que ubicar los dos puntos anteriores.







14.6 APLICACIN DE LA ECUACIN DE REGRESIN.
Se utiliza para hacer predicciones de la variable dependiente (Y ).
Ejemplo:
Calcular el salario del trabajador, si trabajara 90 horas semanales.
Solucin:
O sea nos piden calcular cuanto vale Y, cuando X=90

Y =
Y =

Interpretacin.-
__________________________________________________________________
____________________________________________________________






EJERCICIOS DE APLICACIN N 14.-
1.- Se tiene la siguiente informacin proporcionada por la Empresa MINPETEL durante
2007.
MESES ENERGA GENERADA
(Mwh) (X)
CONSUMO
COMBUSTIBLE (m
3
) (Y)
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Setiembre
Octubre
Noviembre
Diciembre
70.65
67.47
57.74
68.45
83.80
77.56
35.76
94.88
110.13
113.74
106.92
118.23
23.18
22.54
20.04
23.94
27.23
25.31
11.83
30.42
35.35
38.39
35.64
39.11
a) Realice el diagrama de dispersin
b) Halle si existe asociacin o relacin entre las variables. Explique o interprete el
resultado.
2.- Se hace un estudio para determinar la relacin entre el tiempo de uso de un grupo
de mquinas de una fbrica y las eficiencias de las mismas. Los datos se dan a
continuacin:
Tiempo de
uso (X)
2 4 11 9 4 6 7 8
Eficiencia
(Y)
90 65 25 40 80 60 35 50

a) Represente los datos en un diagrama de dispersin
b) Calcule el coeficiente de correlacin lineal entre X e Y e interprete.

3.- Se muestra los gastos en publicidad (como porcentajes de gastos totales) y los
beneficios de operacin netos (como porcentaje de ventas) en una muestra de 10
pequeas joyeras.
Gastos de
publicidad
(X)
1.2 0.7 1.5 1.8 0.5 3.4 1 3 2.8 2.5
Beneficios
(Y)
2.7 2.4 2.7 3.3 1.1 5.8 2.2 4.
2
4.4 3.8

a.- Represente los datos en un diagrama de dispersin.
b.- Halle el coeficiente de correlacin lineal entre X e Y e interprete.

4.- Las notas obtenidas por 10 alumnos en Estadstica I y Matemtica II son:
Alumno 1 2 3 4 5 6 7 8 9 10
Estadstica I 11 09 13 10 8.5 12 10 15 10 09
Matemtica II 11.5 9.5 12 10 09 13 12 15 11 10
a.- Halle el coeficiente de correlacin.

5.- Interprete un coeficiente de correlacin lineal simple de -0.92

6.- La siguiente tabla contiene datos de dos variables, Y (Ventas de un producto, en
miles de dlares), X (gastos en publicidad, en miles de dlares), las cuales han sido
seleccionadas al azar a partir de una distribucin normal de dos variables aleatorias.
-----------------------
Y X
----------------------
74 12
170 20
147 17
75 11
46 8
59 8
20 4
90 12
74 9
77 12
144 16
110 11
99 10
109 13
109 15
-------------------------


a.- Calcule las medias, y las desviaciones estndar de las variables X e Y e interprete.
b.- Haga un diagrama de dispersin para mostrar la relacin entre esas dos series.
c.- Calcule el coeficiente de correlacin lineal simple entre X e Y, e interprete.
d.- Calcule la ecuacin de regresin lineal Ajuste una lnea recta a los puntos del
diagrama de dispersin a fin de expresar matemticamente la relacin entre esas
dos variables.
e.- Calcule a partir de la ecuacin anterior, el valor estimado de Y para cada uno de los
15 valores de X.
f.- Interprete las constante
1
obtenida para Y=
0
+
1
X

7.- En un saln de clase de 35 alumnos del III ciclo, se tom una muestra al azar de 10
alumnos. Se tom informacin del nmero de horas de estudio/semanal, (X) y las
calificaciones (Y) en un examen de Estadstica. Los datos son los siguientes:
----------------------------------------------------------------------------------------
Xi 2 2 3 3 3 4 4 5 5 5
-----------------------------------------------------------------------------------------
Yi 08 10 11 14 13 15 13 13 15 17
-----------------------------------------------------------------------------------------

a) Construya un diagrama de dispersin.
b) Halle el coeficiente de correlacin lineal simple.
c) Encuentre la ecuacin de regresin de la muestra:
Y =
0
+
1
X

c) Interprete
0
y
1
. Tiene a algn valor significativo prctico?

0
: ______________________________________________________

1
: ______________________________________________________

d) Calcule el valor de Y cuando X = 6. Interprete dicho valor de Y.



Autor Carl McDaniel, Daniel Roger H Gates. Investigacin de mercados. Pag 511

S-ar putea să vă placă și