Sunteți pe pagina 1din 93

Universidad de las Regiones Autnomas de la Costa Caribe

Nicaragense
(URACCAN)

NUEVA GUINEA

MDULO DE ESTADSTICA
DESCRIPTIVA Y
PROBABILIDADES
RECUERDOS
Hay recuerdos gratos,
un atardecer bajo la lluvia
en la vecina caracoles negros.
Un beso tierno
con el alba en Managua,
un almuerzo frugal en plaza inter.
Un beso, un suspiro, un adis.

Napolen Rojas Robles

NO TENDR LIBERTAD MIENTRAS


TE AME Y ESO ES UNA
DESIGUALDAD

UNIDAD No. I

INTRODUCCIN Y CONCEPTOS BSICOS.

Introduccin a la Estadstica (Estadstica Descriptiva)


Qu entendemos cmo Estadstica? Estadstica, derivado del latn status, que significa
estado, posicin o situacin.
Definicin 1.1: Estadstica: Disciplina que estudia cuantitativamente los fenmenos de
masa o colectivos, o sea, aquellos fenmenos cuyo estudio slo puede efectuarse a
travs de una coleccin de observaciones.
Definicin 1.2: La Estadstica es la ciencia de los datos, explica o se ocupa de la
coleccin, clasificacin, sntesis, organizacin, anlisis e interpretacin de los datos.
Aplicaciones de la Estadstica
La estadstica es un potente auxiliar de muchas ciencias y actividades humanas:
sociologa, psicologa, biologa, qumica, ciencias naturales, geografa humana,
economa, etc. Es una herramienta indispensable para la toma de decisiones. Tambin
es ampliamente empleada para mostrar los aspectos cuantitativos de una situacin. La
estadstica est relacionada con el estudio de proceso cuyo resultado es ms o menos
imprescindible y con la finalidad de obtener conclusiones para tomar decisiones
razonables de acuerdo con tales observaciones.
Entre las reas principales de aplicacin est:

Coleccin y compendios de datos.


Diseo de experimentos y reconocimientos.
Medicin de la valoracin, tanto de datos experimentales como de reconocimientos,
deteccin de causas.
Control de la calidad de la produccin.
Estimacin de parmetros de poblacin y suministro de varias medidas de la
exactitud y precisin de esas estimaciones.
Estimacin de cualidades humanas.
Investigacin de mercados, incluyendo escrutinios de opiniones emitidas.
Ensayo de hiptesis respecto a poblaciones.
Estudio de la relacin entre dos o ms variables.

La Estadstica suele aplicarse a 2 tipos de situaciones o problemas:


1- Resumir, Describir y Explorar datos.
2- Utilizar datos de una muestra para inferir la naturaleza del conjunto de datos del que
se escogi la muestra.
Ej.: Consideremos el Censo en Nicaragua, que implica la recoleccin de un conjunto de
datos que pretende caracterizar los rasgos socioeconmicos de aproximadamente 6
millones de habitantes.
Censo
Trmino que se refiere al recuento oficial y peridico de la poblacin de un pas o de

2
una parte de un pas. Designa tambin el registro impreso de dicho recuento. En
nuestros das se llama as a la informacin numrica sobre demografa, viviendas y
actividades.
Divisiones De La Estadstica
Tradicionalmente la Estadstica se divide en: Estadstica descriptiva y Estadstica
Inductiva o Estadstica Inferencial. La rama de la Estadstica que se dedica a la
organizacin, sntesis y descripcin de un conjunto de datos se llama Estadstica
descriptiva. La Estadstica descriptiva encierra cualquier tratamiento de datos
numricos que comprenda generalizaciones, agrupa todas aquellas tcnicas asociadas
justamente con el tratamiento o procesamiento de conjuntos de datos, su objetivo
comprende la caracterizacin de conjuntos de datos numricos, la misma pretende
poner de manifiesto las propiedades de estos conjuntos lo cual se puede lograr de
forma grfica o analtica.
La Estadstica Inferencial es la rama de la Estadstica que se encarga de determinar o
inferir la naturaleza de un conjunto de datos poblacionales por medio de una o varias
muestras. La Estadstica Inferencial se ocupa del problema de establecer previsiones y
conclusiones generales relativas a una poblacin a partir de los datos muestrales
disponibles y del clculo de probabilidades.
Poblacin y muestra
Al recoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean
alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en
una fbrica, suele ser imposible o nada prctico observar todo el grupo, en especial si
es muy grande. En vez de examinar el grupo entero, llamado Poblacin o Universo, se
examina una pequea parte del grupo, llamada Muestra.
Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consistente en todas
las tuercas producidas por una fbrica un cierto da es finita, mientras que la
determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de
una moneda, es infinita. Si una muestra es representativa de una poblacin, es posible
inferir importantes conclusiones sobre las poblaciones a partir del anlisis de la
muestra.
Variable: Es la caracterstica o fenmeno que puede tomar diferentes valores. Las
variables son magnitudes numricas, es decir, son caractersticas de una poblacin
determinada, susceptible de medicin. Son caractersticas que pueden ser observadas
en determinado fenmeno natural, social, econmico, poltico etc.
Lo datos o valores que toman las variables se clasifican en dos tipos:
1 Cuantitativos o Numricas: Son aquellas variables que toman valores numricos,
son las que representan la cantidad de algo. A estas variables le corresponde la
escala de medicin de intervalo y razn o proporcin. Estas a su vez se clasifica
en dos tipos:

3
a Discretas: Es aquella variable que solo puede tomar valores enteros en la escala
de los nmeros naturales, es decir, la variable no puede tomar valores
fraccionarios.
Por ejemplo, el nmero de hijos en un matrimonio puede ser: 0,1, 2, 3 4; pero
ningn matrimonio tiene 0,5 3,89 hijos.
b Continuas: Es aquella que puede tomar cualquier valor dentro de la escala de los
nmeros reales, es decir, es aquella que tericamente puede tomar cualquier valor,
bien sean valores enteros o fraccionados. Los valores que puede tomar esa es
cualquiera e incluso valores fraccionados por ejemplo, un alumno A mide 1,68 m y
otro alumno B mide 1,69 y otro C mide 2,00 m.
2 Cualitativas o categricas: Son aquellas variables cuyos valores son del tipo
categrico, es decir; que indican categoras o son etiquetadas numricamente o
con nombres. Son las que se refieren a clasificaciones, como: estado civil,
profesin, color de los ojos, etc. Esta a su vez, se clasifica en:
a Variables Categricas Nominales: son las variables categricas que, adems de
que sus posibles valores son mutuamente excluyentes entre s, no tienen alguna
forma natural de ordenacin. Por ejemplo, cuando sus posibles valores son: S
y No. A este tipo de variable le corresponde las escalas de medicin nominal.
b Variables Categricas Ordinales: Son las variables categricas que tienen algn
orden. Por ejemplo, cuando sus posibles valores son: siempre, casi siempre y
nunca. A estos tipos de variables le corresponden las escalas de medicin
ordinal.
Si suponemos que ya recabamos un conjunto de datos que nos interesa, al cabo de
cierto tiempo nos hacemos las siguientes preguntas: Cmo puedo sacar conclusiones
de estos datos?, Cmo puedo organizar y resumir el conjunto de datos de modo que
sea ms comprensible?
Para contestar las preguntas anteriores existen mtodos numricos y grficos para
describir un conjunto de datos. El procedimiento adecuado en cada caso depender del
tipo de datos (ya sea cualitativo o cuantitativo) que queramos describir.

4
EJERCICIOS
I.1.-

Clasifique cada uno de los siguientes casos como variable discreta o


continua o variable cualitativa (atributo), escribiendo en la raya lo que usted
considere.
El nmero de preguntas contestadas correctamente en un examen.
______

2.-

El nmero de seales de trnsito, en poblados pequeos.

3.-

El tiempo que se necesita para contestar una llamada telefnica en una oficina.

______

_____
4.-

Las ganancias en crdobas de las ventas de un determinado producto.


_________

5.-

El peso en Kg de cada estudiante de un grupo de clases.

______

6.-

El resistencia a la rotura de un determinado tipo de cuerda.

______

7.-

El color de cabello de los nios que estn viendo televisin

______

8.-

La cantidad de pginas impresas en una impresora lser.

______

II.-

Identifique los elementos que se le indican

1.-

Un fabricante de medicamentos desea conocer la proporcin de personas cuya


hipertensin puede ser controlada por un nuevo medicamento. Al realizar un
estudio con 5,000 individuos hipertensos se encontr que el 80% de ellos puede
controlar su hipertensin utilizando el nuevo medicamento. Suponiendo que
estas 5,000 personas son representativas del grupo de hipertensos. Conteste:

a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la estadstica?
d) Cul es el parmetro?
e) Cul es la variable o variables?
2.-

Se quiere saber el costo de la educacin; uno de los gastos que hace un


estudiante es la compra de sus libros de texto. Sea x el costo de todos los libros
comprados este semestre por cada estudiante en cierta universidad. Describa:
a) La poblacin
b) La variable
c) La muestra

INTRODUCCIN AL MUESTREO
Una poblacin est determinada por sus caractersticas definitorias. Por lo tanto, el
conjunto de elementos que posea esta caracterstica se denomina poblacin o universo.
Poblacin es la totalidad del fenmeno a estudiar, donde las unidades de poblacin
poseen una caracterstica comn, la que se estudia y da origen a los datos de la
investigacin.
Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con una
serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos
los elementos de una poblacin.
Cuando seleccionamos algunos elementos con la intencin de averiguar algo sobre una
poblacin determinada, nos referimos a este grupo de elementos como muestra. Por
supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
poblacin en su conjunto. La exactitud de la informacin recolectada depende en gran
manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir
cada uno de los individuos de una poblacin, se toma una muestra representativa de la
misma.
A menudo los compradores prueban una porcin pequea de queso antes de comprar
alguno. Determinar a partir de un pedazo el sabor del trozo completo. Si los
compradores probaran todo el queso, no quedara nada par vender. As que probar todo
el queso es innecesario y a menudo destructivo. Para determinar las caractersticas del
todo, tenemos que muestrear solo una porcin.
Estadsticos y Parmetros
Matemticamente, podemos describir muestras y poblaciones al emplear mediciones
como la media, mediana, moda y la desviacin estndar que introdujimos
anteriormente. Cuando los trminos describen las caractersticas de una muestra, a
este valor calculado se le denomina Estadsticas. Cuando describen las caractersticas
de una poblacin se llaman Parmetros.
Ejemplo 1:
N , , 2 Parametros
n, X , s 2 Estadisticas

Tipos de Muestreo
En una muestra aleatoria o de probabilidad conocemos las probabilidades de que un
elemento de la poblacin se incluye o no en la muestra. Como resultado de lo anterior
podemos determinar objetivamente las estimaciones de las caractersticas de la
poblacin que resultan de nuestra muestra. Los 4 mtodos del muestreo aleatorio ms
usados por los investigadores son:
1. Muestreo Aleatorio Simple

6
2. Muestreo Sistemtico
3. Muestreo Estratificado
4. Muestreo de Racimos o por Conglomerado
1- Muestreo aleatorio simple: la forma ms comn de obtener una muestra es la
seleccin al azar, es decir, cada uno de los individuos de una poblacin tiene la misma
posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es
viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe
emplearse para su constitucin una tabla de nmeros aleatorios.
Ejemplo 2: Supongamos que tenemos una poblacin de cuatro estudiantes en un
seminario y que queremos muestras de dos estudiantes a la vez para entrevistas:
Solucin: Tenemos lo estudiantes A, B, C, D
Muestras de dos estudiantes: AB, AC, AD, BC, DC, BD. La probabilidad de extraer esta
muestra de dos estudiantes es de 1/6 para cada par de estos estudiantes.
Como hacer un muestreo Aleatorio
La forma ms fcil de seleccionar una muestra de manera aleatoria es mediante el uso
de Nmeros aleatorios. Estos nmeros se pueden generar ya sea con una computadora
o calculadora programada o mediante una tabla de nmeros aleatorios ya hecha.
2- Muestreo Sistemtico: Cuando los elementos de la poblacin estn ordenados en
fichas o en una lista, una manera de muestrear consiste en
Sea ;
Elegir aleatoriamente un nmero m, entre 1 y k;
Tomar como muestra los elementos de la lista:

Esto es lo que se denomina muestreo sistemtico. Cuando el criterio de ordenacin


de los elementos en la lista es tal que los elementos ms parecidos tienden a estar ms
cercanos, el muestreo sistemtico suele ser ms preciso que el aleatorio simple, ya que
recorre la poblacin de un modo ms uniforme. El muestreo sistemtico difiere del
muestreo aleatorio simple en que cada elemento tiene igual oportunidad de ser
seleccionado, pero cada muestra no tiene una posibilidad igual de ser seleccionada.
3- Muestreo estratificado: una muestra es estratificada cuando los elementos de la
muestra son proporcionales a su presencia en la poblacin. La presencia de un
elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se
divide a la poblacin en varios grupos o estratos con el fin de dar representatividad a los
distintos factores que integran el universo de estudio. Para la seleccin de los
elementos o unidades representantes de cada estrato, se utiliza el mtodo de muestreo
aleatorio.

7
4- Muestreo de Racimos o por Conglomerado: Si intentamos hacer un estudio sobre los
habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya
que estudiar una muestra de tamao n implica enviar a los encuestadores a n puntos
distintos de la misma, de modo que en cada uno de ellos slo se realiza una entrevista.
En esta situacin es ms econmico realizar el denominado muestreo por
conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la
ciudad, para despus elegir calles y edificios. Una vez elegido el edificio, se entrevista a
todos los vecinos.
Tanto el muestreo por racimos como el estratificado, la poblacin se divide en grupos
bien definidos. Usamos el muestreo estratificado cuando cada grupo tiene una pequea
variacin dentro de s mismo, pero hay una amplia variacin entre los grupos. Usamos
el muestreo de racimos en el caso opuesto, cuando hay una variacin considerable
dentro de cada grupo, pero los grupos son esencialmente similares entre s.
Estimaciones
Cmo conocemos la poblacin de la Tierra? Cmo determinar entre qu lmites se
sita la cantidad de glbulos rojos por litro de sangre en un individuo sano? Este tipo de
valoracin se hace a partir de modelos probabilistas empleando las tcnicas
estadsticas de la estimacin de parmetros.
El material sobre la teora de probabilidad que se cubri en los captulos anteriores
constituye la base de la inferencia estadstica, rama de la estadstica que tiene que ver
con el uso de los conceptos de la probabilidad para tratar con la toma de decisiones en
condiciones de incertidumbre. La inferencia estadstica est basada en la estimacin y
en la prueba de hiptesis, en ambas haremos inferencias acerca de ciertas
caractersticas de las poblaciones a partir de la informacin contenida en las muestras.
Tipos de Estimaciones: Podemos hacer dos tipos de estimaciones, una llamada
Estimacin Puntual y otra llamada Estimacin por Intervalo.
Una estimacin puntual es solo un nmero o un punto que se utiliza para estimar un
parmetro de la poblacin desconocido.
Ejemplo 3: el jefe de departamento de alguna universidad estara haciendo una
estimacin puntual si afirmara Nuestros datos actuales indican que en esta materia
tendremos 350 estudiantes en el siguiente semestre.
Una estimacin por intervalo es un intervalo de valores que se utiliza para estimar un
parmetro de poblacin. Esta estimacin indica el error de 2 maneras, por la extensin
del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin
que se encuentra dentro del intervalo.
Ejemplo 4: si el jefe de departamento dice algo como lo siguiente, Estimo que la
inscripcin real de este curso para el prximo semestre estar entre 330 y 380 y es muy
probable que la inscripcin exacta caiga dentro de este intervalo.

8
Cualquier estadstico de muestra que se utilice para estimar un parmetro de poblacin
se conoce como estimador, es decir, un estimador es una estadstica de muestra
utilizada para estimar un parmetro de poblacin.
Caractersticas para la seleccin de un buen estimador
1- Imparcialidad: el trmino de imparcialidad se refiere al hecho de que una media de
muestra es un estimador no sesgado de una media de poblacin, por que la media de
la distribucin de muestreo de las medias de muestras tomadas de la misma poblacin
es igual a la media de la poblacin misma. Tambin a este tipo de estimador se le
denomina Estimador sin sesgo.
2- Eficiencia: la eficiencia se refiere al tamao del error estndar de la estadstica. Si
comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir
cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el
menor error estndar o la menor desviacin estndar de la distribucin de muestreo.
3- Coherencia: una estadstica es un estimador coherente de un parmetro de
poblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que el
valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin.
4- Suficiencia: un estimador es eficiente si utiliza una cantidad de informacin
contenida en la muestra de tal forma que ningn otro estimador podra extraer
informacin adicional de la muestra sobre el parmetro de la poblacin que se est
estimando.

Tcnicas de recolectar informacin


1. ENTREVISTAS
Las entrevistas son el mtodo de recoleccin de datos ms comnmente usado en el
trabajo de desarrollo. Las entrevistas obtienen informacin sobre lo que las personas
piensan, sienten, y perciben. Proporcionan profundidad a los datos cuantitativos,
siendo una ptima fuente de informacin cualitativa del tema a trabajar.
Normalmente, para llevar a cabo una entrevista, se emplea una gua del tema con el
objetivo de ayudar a estructurar la discusin del (los) tema(s). La gua asegura que la
informacin sea recabada de la misma manera durante todas las entrevistas. Por lo
general, esta gua temtica se divide en cuatro secciones: Introduccin, construccin
de una buena interrelacin, discusiones a profundidad y cierre. Esto se explica con el
siguiente ejemplo:

9
Propsito de la investigacin: Saber lo qu los/ miembros de la comunidad piensan
acerca de incluir un currculum de educacin para la vida familiar en escuelas
secundarias.
I. Introduccin:
A. Explique quin es usted y el propsito de la investigacin.
B. Explique el procedimiento (por ejemplo, me gustara hacerle algunas preguntas;
podra tomar alrededor de 15 minutos de su tiempo?).
C. Ponga nfasis en que no hay respuestas correctas o incorrectas a las preguntas que
har.
II. Creacin de una buena interrelacin: Esto implica iniciar una conversacin para
establecer una relacin cmoda. Pregunte algo general y apropiado al/la entrevistado/a
acerca de su familia, hijos, trabajo, o comunidad (por ejemplo, en qu ao(s) de
escuela est(n) su(s) hijo/a(s)?.
III. Discusin a profundidad: Haga preguntas secuencialmente, yendo desde
preguntas que buscan informacin objetiva a preguntas que requieren la opinin del
entrevistado.
- Existe algn tipo de educacin para la vida familiar que actualmente se ofrezca en la
escuela de su(s) hijo/a(s)? Si la respuesta fuese s, en qu ao se introduce? Si la
respuesta fuese no, le gustara ver un currculum de educacin para la vida familiar de
las escuelas?
- En qu aos de estudio piensa usted que debera ofrecerse?
- Piensa que las autoridades escolares deben requerir el consentimiento de los padres
para que su(s) hijo/a(s) participen en la educacin para la vida familiar?
Est preparado para hacer un seguimiento con preguntas de sondeo para aclarar o
explorar ms all.
IV. Cierre:
Brevemente haga un resumen de lo que usted ha escuchado y solicite la reaccin final
del/la entrevistado/a (por ejemplo, hay alguna cosa que no hayamos discutido y que a
usted le gustara agregar?) Agradezca al/la entrevistado/a por su tiempo.

10

TIPOS DE ENTREVISTAS
Existen tres tipos bsicos de entrevistas, los que se diferencian por la forma en la que
se determinan y estandarizan anticipadamente las preguntas para la entrevista. De esta
manera encontramos

la entrevista informal, la entrevista semi estructurada y la

entrevista formal (estandarizada).


a. La entrevista informal trabaja principalmente con la generacin espontnea de
preguntas en el flujo natural de una conversacin. Este tipo de entrevista es
adecuado cuando el evaluador desea mantener la mayor flexibilidad posible para
poder guiar las preguntas hacia la direccin que parezca la ms adecuada,
segn la informacin que surja en un ambiente en particular, o de la
conversacin con una o ms personas en ese ambiente. Bajo estas
circunstancias, no es posible tener un conjunto predeterminado de preguntas. La
fortaleza de este enfoque es que el entrevistador es flexible y altamente sensible
a las diferencias individuales, los cambios en la situacin y la aparicin de
informacin nueva. La debilidad es que puede generar datos menos
sistemticos, cuya clasificacin y anlisis sern difciles y lentos.

b. Las entrevistas semi estructuradas involucran la preparacin de una gua para


la entrevista que enumere un conjunto predeterminado de preguntas o temas que se
van a tratar. Esta gua sirve como una lista de verificacin durante la entrevista y
asegura que se obtenga bsicamente la misma informacin a partir de varias
personas. Aun as, existe bastante flexibilidad. El orden y el funcionamiento real de
las preguntas no se determinan por anticipado. Adems, dentro de la lista de temas
o reas temticas, el entrevistador tiene la libertad de dar mayor profundidad a
determinadas preguntas. La ventaja del estilo de la gua de entrevista es que el
hecho de entrevistar a diferentes personas se hace ms sistemtico e integral, ya
que se delimitan los temas que se tratarn. La debilidad de este enfoque es que no
permite que el entrevistador gue los temas o tpicos de inters que no se
anticiparon en el momento de la elaboracin de la gua. Adems, la flexibilidad del
entrevistador en la formulacin y ordenamiento de las preguntas podra originar
respuestas sustancialmente diferentes segn las personas, lo que reduce la
capacidad de comparacin.

11

c.

La entrevista estandarizada consiste en un conjunto de preguntas abiertas

cuidadosamente formuladas y ordenadas anticipadamente. El entrevistador hace las


mismas preguntas a cada uno de los entrevistados, esencialmente con las mismas
palabras y en el mismo orden. Este tipo de entrevista puede ser especialmente
adecuado cuando existen varios entrevistadores y el evaluador desea minimizar la
variacin de las preguntas. Resulta til tambin cuando se desea obtener la misma
informacin de cada entrevistado en diversos puntos en el tiempo o cuando hay
limitaciones de tiempo para la recopilacin y el anlisis de los datos. Las entrevistas
de desarrollo estandarizadas permiten que el evaluador rena sistemticamente
datos detallados y facilitan la posibilidad de comparacin entre todos los
entrevistados. La debilidad de este enfoque es que no permite que el entrevistador
gue los temas o tpicos que no se anticiparon en el momento de la elaboracin del
instrumento.
Adems, las entrevistas abiertas estandarizadas limitan el uso de preguntas
alternativas a diferentes personas, dependiendo de sus experiencias particulares.
Esto reduce la posibilidad de incorporar completamente las diferencias y
circunstancias individuales en la evaluacin.
Finalmente podemos establecer que las caractersticas generales de las entrevistas
son:

Bajo costos.

Son una buena fuente de datos cualitativos.

Producen mucha informacin en corto tiempo.

Pueden ser informales o formales.


2. LA ENCUESTA O CUESTIONARIO

La encuesta es una tcnica de interrogatorio que emplea el cuestionario, el cual se


define como un conjunto de preguntas respecto a una o varias temticas a consultar.
Se caracteriza por ser estructurado, presentarse por escrito y por sobre todo, ser el
principal instrumento de datos cuantitativos.
Dentro de sus limitaciones, el cuestionario tiende a reducir y simplificar el fenmeno
social de su contexto, es decir, slo da cuenta de las tendencias globales de la
realidad social, ante esto, se sugiere el uso complementario de tcnicas cualitativas

12
permite devolver los detalles a la realidad como lo son las entrevistas a profundidad o
grupos focales entre otros.
QU TIPOS DE PREGUNTAS DEBE HABER?
Bsicamente, podemos hablar de dos tipos de preguntas: cerradas y abiertas.
Las preguntas cerradas contienen categoras o alternativas de respuestas que ya han
sido delimitadas. Es decir, se presentan a los sujetos las posibilidades de respuestas y
ellos deben acotarse a ellas. Pueden ser dicotmicas (dos alternativas de respuestas) o
incluir varias alternativas de respuesta.

Ejemplo de preguntas cerradas dicotmicas:

1. Le gusta el ftbol? ___si ____no ____.


2. Estudia usted actualmente?
( ) S

( ) No
Ejemplo de preguntas cerradas con varias alternativas de respuesta:

1. Cmo evala la gestin del gobierno en el mbito educacional?


Excelente

buena

regular

2. Cunta televisin ves los domingos?


( ) No veo televisin
( ) Menos de una hora
( ) 1 o 2 horas
( ) 3 horas
( ) 4 horas
( ) 5 horas o ms.

mala

muy mala

13
Como es posible observar, en las preguntas cerradas las respuestas son definidas con
anterioridad, y la persona debe elegir la opcin que ms describa su respuesta.

Ahora bien, hay preguntas cerradas, donde el respondiente puede


seleccionar mas de una opcin.

Ejemplo:
1. Esta familia tiene:
_ radio
_ televisin
_ telfono
_ auto
_ Ninguno de los anteriores.
Ante esto, las personas pueden responder una, dos, tres o cuatro opciones, ya que las
categoras no son mutuamente excluyentes.

En otras ocasiones, la persona puede jerarquizar las respuestas. Por


ejemplo:

1. Cul de estos lugares para vacacionar considera usted el mejor? Indique del 1 al 4
segn su inters.
_ Playa
_ Campo
_ Nieve
_ Lago.
Por otro lado, las preguntas abiertas, no delimitan de ante mano las alternativas de
respuesta. Por lo tanto, el numero de categora de respuesta es infinito.

14

Ejemplo de preguntas abiertas:

1. Por qu asiste a psicoterapia?


2. Qu piensa de los partidos polticos?
CONVIENE USAR PREGUNTAS ABIERTAS O CERRADAS?
Cada cuestionario obedece a distintas necesidades y problemas, lo que hace que en
cada caso el tipo de preguntas sea diferente. Algunas veces solo se incluyen preguntas
cerradas o solo abiertas o mezcla de ambas. Cada clase de preguntas tiene sus
ventajas y desventajas.

Las preguntas cerradas son fciles de codificar y analizar. Adems requieren de


menor esfuerzo por parte de los respondientes, ellos solo deben seleccionar la
mejor alternativa y no verbalizar o escribir sus pensamientos. La principal
desventaja es que limitan las respuestas de las personas

y no siempre

describen con exactitud lo que realmente piensan los sujetos.

Las preguntas abiertas son tiles cuando la informacin derivada de preguntas


cerradas es insuficiente o cuando se desea profundizar en opiniones o motivos
de comportamientos. Su mayor desventaja es que son ms difciles de codificar,
clasificar y analizar.

EL MODO DE FORMULAR LAS PREGUNTAS:

Claras y precisas, de fcil comprensin: Deben evitarse trminos confusos o


ambiguos. Por ejemplo, ve Ud. Televisin? , es confusa, seria mas adecuado
preguntar acostumbra ver televisin diariamente? Y despus preguntar los
horarios, canales, etc.

Contener una sola idea: Debe referirse a un solo aspecto. Por ejemplo;
acostumbra ver televisin y escuchar radio diariamente? Expresa dos aspectos
y puede confundir. Es adecuado hacer dos preguntas.

No hacer preguntas dirigidas: Se sugiere no realizar preguntas que den pie a


elegir algn tipo de respuesta. Por ejemplo: Los trabajadores chilenos son muy

15
productivos?. Se insina la respuesta en la pregunta. Resulta ms conveniente
preguntar qu tan productivos considera Ud. a los trabajadores chilenos?.

Utilizar un lenguaje adecuado y respetando el lenguaje del grupo entrevistado.


Es decir, considerar nivel educativo, socioeconmico, palabras que maneja, etc.

Debe evitarse los trminos vagos (mucho, poco, etc.)

3. MTODOS DE OBSERVACIN
La observacin en una comunidad es otra fuente importante de datos cualitativos. El
objetivo principal de la observacin es obtener una descripcin detallada del tema a
trabajar en la comunidad a travs de una identificacin atenta y una descripcin exacta
de las interacciones, realidades sociales y de las personas en su contexto cotidiano.
Existen

varias

ventajas

del

trabajo

observacional

en

terreno:

- Ofrece una mejor comprensin del contexto en el que se producen las intervenciones.
- Permite conocer cosas importantes que personas de la comunidad pudieran ignorar u
omitir

voluntaria

involuntariamente

en

una

entrevista.

- Permite que el evaluador presente una visin ms integral, combinando sus propias
percepciones

las

de

otros.

Existe una cantidad de variaciones en los mtodos de observacin. La diferencia


fundamental entre ellos radica en la funcin que tiene el observador, ya sea como
participante en la comunidad, como espectador o alguien entre ambos procesos. De
esta manera tenemos en un polo la observacin participante y al otro extremo la
observacin

directa.

A. LA OBSERVACIN PARTICIPANTE
Se encuentra en un extremo del espectro de participacin y consta de un observador,
quien se convierte en miembro de la comunidad o de la poblacin que se estudia. El
investigador participa en actividades de la comunidad, observa la manera en que las
personas se comportan e interactan entre s y con organizaciones externas. El
observador intenta ser aceptado como vecino o participante, en lugar de ser un externo.

16
El objetivo de dicha participacin no slo es ver lo que sucede, sino sentirse parte del
grupo. La posibilidad de xito de ste depende de las caractersticas de la comunidad
en que se esta, el tipo de preguntas que se estudian y el contexto socio poltico del
ambiente. La fortaleza de este enfoque es que el investigador puede experimentar y
presumiblemente, entender mejor cualquier impacto del proyecto. La principal debilidad
es que puede alterar el comportamiento que se observa.
Adems, podran surgir problemas ticos si el observador participante se representa de
manera fraudulenta con el fin de ser aceptado por la comunidad que estudia.
METODOLOGA
1. PREPARACIN DE CAMPO:
Como primer paso es necesario preparar el campo, es decir, el identificar el
emplazamiento donde se va a situar el investigador como observador, siendo en una
comunidad en particular (aldea, pueblo, barrio, Centro de Salud, sala de Hospital,
etc.) o en un grupo especifico (ancianos de una residencia, colectivo profesional,
alumnos de un colegio, etc).
2. RELACIONES EN EL CAMPO:
Se sugiere que en la fase de acercamiento y presentacin, el observador se muestre
ingenuo y se realicen preguntas aunque puedan parecer evidentes. Para establecer un
clima de buenas relaciones es necesario compartir el mundo de los informantes, como
lo es el lenguaje, costumbres, participar en algn trabajo, etc.
3. QUE OBSERVAR-Mirar y ver mientras se convive.
En caso de una comunidad o grupo:

Lo que dicen discursos.

Lo que hacen, es decir, sus conductas y comportamientos.

Los objetos que utilizan.

La ocupacin del espacio como lugares de vida social.

El tiempo ordinario y extraordinario de trabajo y ocio.

La forma de vivir.

17

Las relaciones - agrupaciones, distribucin edad sexo, conflictos, etc.

Los acontecimientos inesperados: visitas, catstrofes, etc.

4. PAPEL DE LOS INFORMANTES:

Sirven de introductores al investigador en la comunidad

Se requiere que sean representativos en su grupo.

Son las fuentes primarias del investigador.

Colaboradores, consejeros e informantes sobre la comunidad.

No elegir a los no representativos o pertenecientes a una parte en conflicto.

Elegir varios informantes.

No comunicar a los informantes los objetivos precisos de la investigacin para


evitar que manipulen la realidad.

5. EL ARTE DE PREGUNTAR.
Antes de preguntar es necesario saber escuchar. El mejor observador no es el que
habla mucho, sino el que hace hablar a los dems. Es tan importante saber lo que
preguntar como saber lo que no se debe preguntar. Una buena estrategia es esperar a
que suceda algo y luego preguntar sobre ello.
Recomendaciones para ayudar a estimular la comunicacin con los informantes:
Cuando surge algo que nos interesa, inducirles a continuar.
Pedir aclaraciones sobre sus comentarios.
Preguntar sobre el significado de lo observado.
Evitar, al principio, grabaciones, cuestionarios, confrontar versiones de otros
observadores, etc.
Comprobar la veracidad de la informacin: lo que se nos dice con lo observado.
6. CUADERNO DE CAMPO: Es el instrumento de registro de datos, donde se
anotarn las observaciones - NOTAS DE CAMPO - de forma completa precisa y
detallada.

18
Qu registrar:

Hechos observados:
Descripciones de personas.

Actividades.

Conversaciones.

Estructura del escenario, etc.

Comentarios del observador:


Lo que los hechos producen en el observador:

Experiencia vivida.

Sentimientos.

Dudas, etc.

Lo que el observador conceptualiza en la observacin:

Reflexiones tericas.

Hiptesis.

Lneas de actuacin, etc.

Cmo registrar:
Se sugiere limitar el tiempo de observacin a las posibilidades reales de registro.
Escribir con disciplina por ejemplo, siempre una hora de observacin, lo que da a da
seria equivalente a varias horas de registro. Utilizar tcnicas para recordar palabras y
acciones, como

palabras clave y/o resmenes. Tambin es de gran utilidad las

grabadoras y videos, siempre y cuando no interfieran en el proceso de observacin.


Tratamiento de los datos:

No olvidar que la observacin participante es un proceso continuo que se desarrolla a la


vez que se recibe la informacin:

Seleccionar las conductas y situaciones relevantes.

Organizar el material segn el inters temtico o metodolgico.

7. RETIRADA DEL CAMPO:

19
Es preciso dejarlo cuando se ha alcanzado la saturacin, es decir, cuando los datos
empiezan a ser repetitivos y no generan conceptos ni teoras nuevas.
Es un momento difcil para el observador por los lazos de afecto desarrollados en
este tiempo de convivencia. Hay que expresar nuestro agradecimiento a las personas
que han colaborado o que nos han prestado ayuda. Debemos dejar un buen recuerdo,
por si posteriormente necesitamos volver para verificar datos o completar la
investigacin.

B. LA OBSERVACIN DIRECTA
Tiende a estar en el otro extremo del espectro de participacin. Esta involucra la
anotacin y registro sistemtico de las actividades, comportamientos y objetos
fsicos en el ambiente de la evaluacin como un observador no intruso. Por lo general,
puede ser una forma rpida y econmica de obtener informacin socioeconmica
bsica acerca de hogares o comunidades. La ventaja principal de este mtodo es que,
si los participantes no saben que estn siendo observados, hay menos probabilidades
de que cambien su comportamiento y se comprometan con la validez de la evaluacin.
Es importante recordar que existe gran variacin entre los dos extremos y que el nivel
de participacin puede cambiar con el tiempo. Por ejemplo, el evaluador puede
comenzar la observacin como externo y convertirse gradualmente en participante a
medida que avance el estudio.
Todo esto se plasma en un Cuaderno de campo o en un Libro diario, anteriormente
descrito.
VENTAJAS y LIMITACIONES

Se puede obtener informacin independientemente del deseo de proporcionarla.

Los fenmenos se estudian dentro de su contexto.

Los hechos se estudian sin intermediarios.

La proyeccin del observador.

Es posible confundir los hechos observados y la interpretacin de esos hechos.

20

Es posible la influencia del observador sobre la situacin observada.

Existe el peligro de hacer generalizaciones no vlidas a partir de observaciones


parciales.

UNIDAD No. II

ORGANIZACIN Y REPRESENTACIN DE DATOS.

Distribucin de Frecuencias
Es una tabla que divide un conjunto de datos en un nmero de clases (Categoras)
apropiadamente mostrando tambin el nmero de elementos en cada clase llamados
tambin frecuencias. Este agrupamiento hace resaltar caractersticas importantes de los
datos. Existen dos tipos de distribucin:
1 Distribuciones Numricas: los datos se hallan agrupados por su tamao.
2 Distribuciones Categricas: los datos se hallan agrupados de acuerdo con alguna
cualidad o
atributos.
Construccin de una tabla de Frecuencias
1 Se recomienda ordenar los datos en forma ascendente.
2 Decidir el nmero de clases que se usarn en la tabla de frecuencias. Esto lo
decide el estadstico o el investigador en cuestin. Existen varias formas de
calcular el nmero de clases de las cuales aprenderemos la siguiente:
m = 1 + 3.3 * log10(n)
3 Calcular el rango o Amplitud de la muestra. Este se calcula de la siguiente forma:
A = Observacin Mayor Observacin Menor
4 Calcular el ancho de la Clase. Este es:
C = A / m. Redondeando C a la unidad ms prxima.
5 Contar el nmero de observaciones de la muestra que pertenece a cada uno de
las clases.
Nota:
La primera clase se formara colocando la observacin menor como su lmite inferior de
esa clase, como lmite superior se le suma al lmite inferior la amplitud de la clase. Para
formar el lmite inferior de la siguiente clase simplemente sumamos una unidad al valor
del lmite superior de la clase anterior y para formar el lmite superior de la segunda
clase a este le sumamos nuevamente la amplitud de la clase.
Para comprender mejor realicemos el siguiente ejemplo: construya una tabla de
distribucin de frecuencias con el conjunto de datos siguientes:
Tabla1.

21
17

51

10

35

26

13

21

11

52

56

20

15

40

14

42

12

32

28

13

19

28

45

19

21

38

20

Siguiendo los pasos para formar la tabla de distribucin de frecuencias, lo primero que
tenemos que hacer es ordenar los valores.
Tabla2.
5

11

15

20

28

42

12

17

21

32

45

13

19

21

35

51

13

19

26

38

52

10

14

20

28

40

56

Ahora calculamos el nmero de clases que se presentarn en la tabla, esto es:


sabemos que n = 30 por lo tanto: m = 1 + 3.3 * log 10(n) = 1 + 3.3 * log10 (30) = 5.87 6
Ahora calculamos el rango de la muestra: A= Observacin. Mayor Observacin.
Menor = 56 5 = 51
Ahora calculamos la amplitud de la clase, esto se hace de la siguiente forma:
C = A / m = 51 / 6 = 8.5 9. Por lo tanto
L= 91=8
Tabla3.
Nmeros de Clases
5 - 13
14 - 22
23 - 31
32 - 40
41 - 49
50 - 58
Total

Frecuencias (Fi)
9
9
3
4
2
3
30

Representaciones graficas de las distribuciones de frecuencias


Marca de clase: se representa con la letra Xi y es el punto medio de cada clase, esta se
obtiene sumando y dividiendo entre 2 lo limites inferior y superior.
Limites reales de la Clase (tambin se le conoce como fronteras de clase)
L.R.I. = Lmite real inferior: es media unidad menos que el lmite inferior de la clase

22
O sea 5 0.5 = 4.5
L.R.S. = Lmite real superior: es media unidad ms que el lmite superior de la clase
13 + 0.5 = 13.5
La frecuencia relativa se encuentra como:
Fr = (Frecuencia de la clase / Nmero total de Observaciones) = F i / n
Frecuencia porcentual, se calcula como:
%Fi = (Fi / n)*100
Frecuencia acumulada de una clase (Fa): se determina sumando el total de
observaciones de todas las clases precedentes ms la clase en cuestin.
Frecuencia porcentual acumulada de una clase (%Fa): es la frecuencia acumulada de la
clase expresada como porcentaje del total de observaciones.
Para la tabla 4 del primer ejemplo el clculo de los valores anteriores se obtiene
Tabla5.
Numero
de clases
5 - 13
14 - 22
23 - 31
32 - 40
41 - 49
50 - 58
Total

Fi

Xi

L.r.i. - L.r.s

%Fi

Fa

%Fa

9
9
3
4
2
3
30

9
18
27
36
45
54

4.5
13.5
22.5
31.5
40.5
49.5

30
30
10
13.3
6.7
10
100

9
18
21
25
27
30

30
60
70
83.3
90
100

13.5
22.5
31.5
40.5
49.5
58.5

Elabore la distribucin de frecuencias de las siguientes series de datos, con sus


respectivas grficas:
Los siguientes datos son el nmero de meses de duracin de una muestra de 40
bateras para coche.

22
34
25
33
47

41
16
43
31
38

35
31
34
37
32

45
33
36
44
26

32
38
29
32
39

37
31
33
41
30

30
47
39
19
42

26
37
31
34
35

1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadstica elemental.

23

60

79

32

57

74

52

70

82

36

23

80

77

81

95

41

65

92

85

55

76

52

10

64

75

78

25

80

98

81

67

41

71

83

54

64

72

88

62

74

43

60

78

89

76

84

48

84

90

15

79

34

67

17

82

69

74

63

80

85

61

2. El gerente de una firma especializada en renta de condominios para vacacionistas,


quiere saber cmo estn distribuidas los montos de las rentas mensuales de los
departamentos de la firma. Seleccion una muestra de departamentos cuyas muestras
son mostradas abajo.

Rentas mensuales de los condominios


1170 1207 1581 1277 1305 1472 1077 1319 1537 1849
1332 1418 1949 1403 1744 1532 1219 896 1500 1671
1471 1399 1041 1379 821 1558 1118 1533 1510 1760
1826 1309 1426 1288 1394 1545 1032 1289 695

803

1440 1421 1329 1407 718 1457 1449 1455 2051 1677
1119 1020 1400 1442 1593 1962 1263 1788 1501 1668
1352 1340 1459 1823 1451 1138 1592 982 1981 1091
3. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de
combustible similares.

24

36

40

16

18

30

60

72

66

78

28

67

72

15

18

48

71

22

57

54

12

72

4. Los siguientes datos representan la duracin de la vida, en segundos, de 50 moscas


sometidas a un nuevo atomizador en un experimento de laboratorio controlado.

17

20

10

23

13

12

19

18

24

12

14

13

10

13

16

18

13

32

10

11

24

13

18

10

27

19

16

10

14

15

10

15

5. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes
que visitan cuando menos una vez al mes. Los resultados son los siguientes:

14

6. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana.


El nmero de cambios de aceite en la sucursal de la calle Roble en los pasados 20 das
son:

66

98

55

62

79

59

51

90

72

56

70

62

66

80

94

79

63

73

71

85

7. El gerente de un negocio de comida rpida est interesado en el nmero de veces


que un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas
de los 51 clientes fueron:

5 3

4 5 6 4

6 6

7 1 1

14

1 2

5 6 3 5

4 5

8 4 7

5 9

11 3 12 4 7 6 5 15 1 1 10 8 9 2

12

8. El presidente de una agencia de viajes, quiere informacin sobre las edades de la


gente que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un
crucero el ao pasado revel estas edades:

77

18

63

84

38

54

50

59

54

56

36

26

50

34

44

41

58

58

53

51

25

62

43

52

53

63

62

62

65

61

52

60

45

66

83

71

63

58

61

71

60

9. Una cadena de tiendas de artculos deportivos al servicio de esquiadores


principiantes, planea hacer un estudio de cunto gasta un esquiador principiante en su
primera compra de equipo. Una muestra de recibos de sus cajas registradoras revel
esas compras iniciales.

140

82

265 168

90

114 172 230 142

86

125

235 212 171 149 156 162 118 139 149 132 105
162 126 216 195 127 161 135 172 220 229 129
87

128 126 175 127 149 126 121 118 172 126

10.- Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La
medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se
obtienen estos datos:

69

56

22

28

41

28

47

53

48

30

34

13

52

34

60

25

21

37

43

23

13

31

29

38

26

36

30

11. Un banco seleccion una muestra de 40 cuentas de cheques de estudiantes. Abajo


aparecen sus saldos de fin de mes.

404

74

234

149

279

215

123

55

43

321

87

234

68

489

57

185

141

758

72

863

703

125

350

440

37

252

27

521

302

127

968

712

503

498

327

608

358

425

303

203

26

12.- Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los
siguientes datos son las cuentas que se les factur el mes pasado:

54

48

58

50

25

47

75

46

60

70

67

68

39

35

56

66

33

62

65

67

13.- Una muestra de suscriptores de una compaa telefnica revel los siguientes
nmeros de llamadas recibidas en la ltima semana.

52

43

30

38

30

42

34

46

32

18

41

12

46

39

37

Representaciones graficas para datos Cuantitativos


Histograma: es una representacin grafica de una tabla de distribucin de frecuencia a
partir de datos cuantitativos, esta se construye en un sistema de coordenadas
rectangulares. En el eje horizontal se indican los lmites reales de cada clase haciendo
coincidir el origen con el lmite real inferior de la clase. En el eje vertical se sealan las
frecuencias haciendo coincidir con el origen la frecuencia cero, luego se erige sobre el
intervalo real de la clase correspondiente un rectngulo de altura igual a la frecuencia
de la clase y de base igual a la longitud del intervalo real de la clase.
Escala de los ejes: en la representacin grafica de la frecuencia, el eje vertical debe
hacerse de tal modo que la altura del punto mximo que representa el resultado
asociado con la frecuencia ms alta sea aproximadamente igual a 2/3 de la longitud del
eje horizontal.
Para ilustrar esto miremos el siguiente ejemplo: en la siguiente tabla se nos presenta la
distribucin del rendimiento de la gasolina en millas por galn en 50 automviles.
Construir un Histograma

Tabla6.
Millas / Galn
22.5 - 24.9
25.0 - 27.4
27.5 - 29.9
30.0 - 32.4
32.5 - 34.9
Total

Fi
9
10
15
11
5
50

L.R.I.
22.45
24.95
27.45
29.95
32.45

L.R.S.
24.95
27.45
29.95
32.45
34.95

27
Graficando los valores tenemos la siguiente grafica

Rendimiento de gasolina en mi/galn en 50 automviles

15

10
5

22.45

24.95

27.45

29.95

32.45

34.95

Representaciones grficas para datos Cualitativos


Grficos de barras: sirven para representar al total de cada categora presentada en la
distribucin, para cada categora se traza una barra vertical en que la altura representa
el nmero de miembros de esa categora.
Ejemplo: la tabla siguiente muestra el estado civil de hombres y mujeres mayores de 14
aos en una ciudad en 1995.
Tabla7
Estado
civil
Solteros
Casados
Viudos
Divorciados
Total

Sexo
Hombre
2,450
6,980
390
180
10,000

%
24
70
4
2
100

Mujer
1,880
6,600
1,200
230
9,990

Graficando los valores tenemos la siguiente grfica

%
19
66
13
2
100

Total
4,330
13,580
1,670
410
19,990

%
22
68
8
2
100

28

Grfico de Pastel o de Sectores: se usa para mostrar como una cantidad total, se
reparte en un grupo de categoras, la construccin de un diagrama de pastel se facilita
teniendo en cuenta que el crculo tiene 360 0 grados y que el Angulo debe corresponder
al 100% del total representado. Utilizando una regla de tres se calcula cada ngulo de
cada categora de la siguiente manera:
%
100%

grado(X)
360
despejando tenemos X = (% * 3600)/100

Hagamos el diagrama de pastel para los datos presentados en la tabla7 anteriormente


expuesta en el que representaremos el estado civil de todas las personas de esa
ciudad.
Para eso tenemos que calcula los grados que tendr cada dedazo de pastel o
categora, esto es:
Para los solteros tenemos
Para los casados tenemos
Para los viudos tenemos
Para los divorciados tenemos

X = (22 * 3600)/100 = 790


X = (68 * 3600)/100 = 2450
X = (8 * 3600)/100 = 290
X = (2 * 3600)/100 = 70

Graficando los valores tenemos la siguiente grfica

Ejercicios

29
La siguiente tabla representa las alturas de los pinos de 9 meses de edad en un
bosque de Matagalpa.
Tabla4.
0.59
0.95
1.55
1.15
1.12
0.60

1.35
1.20
0.84
0.79
1.30
1.75

0.98
1.92
1.73
1.04
1.60
1.98

0.76
1.00
1.01
1.10
1.74
0.86

0.84
0.63
1.42
0.62
1.70
1.50

Obtenga una tabla de distribucin de frecuencia para este conjunto de datos y


haga una representacin grafica que ms se ajuste a este tipo de datos.
1.- En la siguiente representacin tallo hoja se indica el nmero de das que pasa un
paciente bajo tratamiento, de acuerdo con una muestra aleatoria seleccionada de los
registros de una clnica
1
2
3
4
5

5
0
4
1
0

1
2
4

3
5

5
0

a) Cuntos pacientes estn representados?


b) Cul fue el perodo de tratamiento ms corto?
c) Cul fue el perodo de tratamiento ms largo?
d) Cul fue el perodo de tratamiento ms frecuente?
2.- En un curso donde se utilizaron computadoras se distribuy un cuestionario a 200
estudiantes. Una de las cuestiones era Me gusta utilizar las computadoras. Las
apreciaciones a esta interrogante fueron:
Respuestas
Totalmente de acuerdo
De acuerdo
Apenas de acuerdo
Apenas en desacuerdo
En desacuerdo

Nmero
50
75
25
15
15

3.- En el primer da de clases del semestre pasado se pregunt a 50 estudiantes de


administracin y contabilidad acerca del tiempo requerido para desplazarse de su
casa a la universidad. Los datos fueron los siguientes:
20
35
25

30
15
15

20
25
20

25
40
25

10
5
10

30
15
5
20
25
30
20
20

20
20
25
25
20
20
10

20
10
20
25
45
20
5

25
20
15
30
25
20
10

15
25
40
25
10
20
15

Elabore una tabla de distribucin de frecuencias para datos no agrupados.


4.- Elabore una tabla de distribucin de frecuencias para datos agrupados con los
siguientes datos y construya un histograma y un polgono de frecuencias.
5

11

15

20

28

42

12

17

21

32

45

13

19

21

35

51

13

19

26

38

52

10

14

20

28

40

56

Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Por lo general, las
frecuencias de los intervalos centrales de una serie de datos son mayores que el resto,
ese nmero se le denomina medida de posicin.

III Unidad: Medidas de tendencia central y de dispersin


MEDIDAS DE TENDENCIAS CENTRALES
Media Aritmtica: La media aritmtica ( X ) o simplemente la media es el parmetro
de posicin de ms importancia en las aplicaciones estadsticas. Se trata del valor
medio de todos los valores que toma la variable estadstica de una serie de datos. La
media aritmtica de un conjunto de observaciones X 1, X2, X3, Xn, se define como la
suma de todos los valores de las observaciones dividida por el total de observaciones
(total de N datos), esto es:
Media Aritmtica para la Poblacin
n

X
i 1

Media Aritmtica para la Muestra

CARACTERSTICAS PRINCIPALES DE LA MEDIA ARITMTICA

31
1. El valor de la media depende de cada una de las medidas que forman la serie de
datos, y se halla afectada excesivamente por los valores extremos de la serie de
datos.
2. La media se calcula con facilidad y es nica para cada caso y permite representar
mediante un solo valor la posicin de la serie de valores.
CLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS
Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:
X

. En donde N es el nmero total de datos

Xi

son los valores de la

variable.
Ejemplo:
1. Calcule la media aritmtica de los siguientes valores: 5, 7, 8, 9, 11, 14
X

5 7 8 9 11 14 54

9. Por lo tanto la media es 9.


6
6

CLCULO DE LA MEDIA ARITMTICA PARA DATOS AGRUPADOS


Cuando se construye una distribucin de frecuencia, los datos se agrupan en clases
definidas por unos lmites. Cuando se trabaja con la distribucin de frecuencia se parte
del supuesto de que todos los datos comprendidos en un intervalo de clase se
distribuyen uniformemente a lo largo de este.
Los pasos a seguir para calcular la media con este mtodo.
1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos
medios de cada clase y se colocan en sus respectivas columnas, se determinan las
frecuencias de cada clase y se ubican en sus respectivas columnas.
2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (f i) multiplicadas por el punto medio
(Xi) as: f i X i
3. Luego se calcula la media aritmtica aplicando la formula:
X

f X f X
N
f N
i

En donde N es igual al nmero total de datos. Ejemplo:

CLASES
75-----79
80-----84
85-----89
90-----94

fi

f i X

77
82
87
92

20
40
60
100

140
320
480
900

32
95 ----99
TOTAL

97

140

=360

1260
i

X i 3100

Aplicando la frmula se tiene:


X

f X
i

3100
8.61
360

~
La mediana ( X
o Md): se define como mediana el valor de un conjunto de datos X 1,
X2, X3; X4,.........Xn, ordenada de menor o mayor, que deja a su izquierda y a su derecha
la misma cantidad de observaciones o sea que es el valor que divide en dos partes
iguales al conjunto de datos, es decir el valor de la variable que ocupa el lugar central.

CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS


Hay dos casos que se pueden dar para el clculo de la mediana:
1. Si el nmero de observaciones es par se elige como mediana el valor medio de las
dos observaciones centrales, esto es:

~
X

N
N

1
X
2
2

Ejemplo:
Encuentre la mediana para el siguiente conjunto de datos: 18, 5, 5, 11, 9, 7, 12, 15.
Sabemos por medio del nmero de datos que N = 8 por lo tanto es par, ordenando los
datos de menor a mayor tenemos 5, 5, 7, 9, 11, 12, 15, 18, ahora aplicando la formula:
~
X

8
8
X 1
2
2 X 4 X 5 9 11 10
2
2
2

2. Si el nmero de datos es impar se elige como mediana el valor que esta


exactamente a la mitad o en medio de todas las observaciones, esto es:
3.
~
N 1
X X

Ejemplo:
Encuentre la mediana para el siguiente conjunto de datos: 4, 3, 8, 8, 4, 5, 10, 8, 6
Sabemos por medio del nmero de datos que N = 9 por lo tanto es par, ordenando los
datos de menor a mayor tenemos 3, 4, 4, 5, 6, 8, 8, 8, 10, ahora aplicando la formula:

33
~
9 1
X X
X 5 6
2

PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS


1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases,
se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fa de esa
distribucin.
2. Se determina la ubicacin

o posicin

de la mediana en el intervalo de la

distribucin de frecuencia, mediante la frmula

PMd

N
. El resultado obtenido
2

determinar la clase donde se encuentra ubicada la mediana, lo cual se conseguir


en la clase donde la frecuencia acumulada Fa sea igual o superior a este
resultado. Luego se aplica la formula:
N

2 Faa
Md Li
Ic,
fm

en esta frmula Md es la mediana, Li es el lmite real inferior de la clase donde se


encuentra ubicada la mediana, Faa es el valor de la frecuencia acumulada anterior a la
clase donde se encuentra la mediana, fm es el valor de la frecuencia fi de la clase
donde se encuentra la mediana, Ic es el valor o longitud de la longitud o intervalo de
clase mas 1 (Ic = L+1 = ) y N es el nmero total de datos de la distribucin en
estudio.
NOTA: la amplitud de la clase debe de ser la misma para cada clase.
Ejemplo: Dada la siguiente distribucin de frecuencia referida a las horas extras
laboradas por
un grupo de obreros. Calcule la mediana. Realice los clculos
respectivos para completar el siguiente cuadro.
N
de
Extras
CLASES
55------59
60------64
65------69
70------74
75------79
80------84
85------89

horas Obreros
Fi
6
20
18
50
17
16
5
N = 132

Completando la tabla para obtener las frecuencias acumuladas obtenemos:


N

de

horas Obreros

Obreros

34
Extras
CLASES
55------59
60------64
65------69
70------74
75------79
80------84
85------89

Ahora se aplica la frmula:


n 132

66,
2
2

n = 132,

Fi
6
20
18
50
17
16
5
n = 132

fa
6
26
44
94
111
127
132

2 Fac
Md Li
C
fm

luego la mediana se encuentra en la clase 70----74, por lo

tanto el limite real inferior de esa clase es 69.5 = Li.


La frecuencia fi de esa clase es 50 = fm , Faa = 44 y el Ic = 5. Aplicando la frmula
se tiene:
66 44
22
5 69.5
.5 69.5 2.2 71.70.

50

50

Md 69.5

CARACTERSTICAS DE LA MEDIANA
La mediana no es afectada por los valores extremos de una serie
puesto que la misma no es calculada con todos los valores de la serie.

de valores,

La mediana no est definida algebraicamente, ya que para su clculo no intervienen


todos los valores de la serie.
La mediana se puede calcular en aquellas distribuciones de frecuencia de clases
abierta, siempre y cuando los elementos centrales puedan ser determinados
La moda: la moda de un conjunto de datos, es el valor que aparece con mayor
frecuencia, es decir es el valor que ms se repite o el valor ms comn. La moda
puede no existir o incluso si existe, puede no ser nica. De las medias de posicin
central la moda es la que se determina con mayor facilidad, ya que se puede obtener
por una simple observacin de los datos en estudio, puesto que la moda es el dato que
se observa con mayor frecuencia. La moda se designa con las letras Mo.
CLCULO DE LA MODA PARA DATOS NO AGRUPADOS
Cuando una serie de valores es simtrica, la media, la mediana y el modo coinciden, y
si la asimetra de la serie es moderada, la mediana estar situada entre la media y la
moda con una separacin de un tercio entre ambas; la moda simple mente se
encuentra por inspeccin de los datos

35
Ejemplo: encuentre la moda para los siguientes conjuntos de datos:
1.

2, 2, 5, 7, 9, 9, 9, 10, 11, 12, 18.

En este caso la moda es 9.

2.

3, 5, 8, 10, 12, 15, 16.

En este caso la moda no existe.

3.

2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9.

En este caso hay dos modas, el 4 y el 7,


A este tipo de casos en se le llama bimodal.

Una distribucin que contenga una solo moda se le llama unimodal, en contraste si
posee ms de dos modas se le llama multimodal.
CLCULO DE LA MODA PARA DATOS AGRUPADOS
Para calcular la moda en datos agrupados existen varios mtodos; cada uno de los
mtodos puede dar un valor diferente de la moda: En este curso se dar un mtodo el
cual se puede considerar uno de los ms precisos en el clculo de esta. Es un mtodo
matemtico que consiste en la interpolacin mediante la siguiente frmula:

1
.Ic ,
Mo Li
1 2
en donde Mo es la moda, Ic = longitud de la clase ms uno (L + 1), Li es el lmite
real de la clase que presenta el mayor nmero de frecuencia; la clase que presenta el
mayor nmero de frecuencias fi se le denomina clase modal y a las frecuencias de
esa clases se les denomina frecuencia modal fm, 1 es la diferencia entre la
frecuencia de la clase modal ( fm) y la frecuencia de la clase anterior a la modal, la
cual se designa con fa , entonces, 1 ( fm fa) ; 2 es la diferencia entre la
frecuencia de la clase modal (fm) y la frecuencia de la clase siguiente a la modal,
esta se designa con fs , entonces, 2 ( fm fs ).
1. Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg de un
grupo de trabajadores de una empresa, calcule la moda.
CLASES
fi
30-----39
2
40-----49
2
50-----59
7
60-----69
11
70-----79
12
80-----89
16
90-----99
2
TOTAL
La clase modal es 80----89, entonces Lri = 79.5 y su fm = 16, fa = 12
C 10 entonces:
1 f m f a 1 16 12 4;.. 2 f m f s 16 2 14

Aplicando la frmula se tiene:

1
40
4
Mo 79.5
Mo L i
79.5 2.22 81.71.
.10 79.5
18
4 14
1 2

fs = 2,

36
CARACTERSTICAS DE LA MODA

El valor de la moda puede ser afectado grandemente por el mtodo de


elaboracin de los intervalos de clases.

El valor de la moda no se halla afectado por la magnitud de los valores extremos


de una serie de valores, como sucede en la media aritmtica.

La moda se puede obtener en una forma aproximada muy fcilmente, puesto que
la obtencin exacta es algo complicado.

La moda tiene poca utilidad en una distribucin de frecuencia que no posea


suficientes datos y que no ofrezcan una marcada tendencia central.

MEDIDAS DE DISPERSIN
Las medidas de variabilidad son nmeros que expresan la forma en que los valores de
una serie de datos cambian alrededor de una medida de posicin central la cual por lo
general es la media aritmtica. La variabilidad es la esencia de la estadstica, puesto
que las variables y atributos se caracterizan siempre por diferencias de valores entre
observaciones individuales. Casi siempre en una distribucin de frecuencia el promedio
obtenido difiere de los datos de la serie; por esto es importante determinar el grado de
variacin o dispersin de los datos de una serie de valores con respecto al promedio.
Rango o Recorrido: Es la primera medida de dispersin, no est relacionada con
ningn promedio en particular, ya que este se relaciona con los datos mismos, puesto
que su clculo se determina restndole al dato mayor de una serie el dato menor de la
misma. El rango es el nmero de variables diferentes que posee una serie de valores.
Su frmula se calcula as:
Rango(R) = Dato mayor (XM)Dato Menor (Xm): R = XM Xm. El rango es la medida de
dispersin ms sencilla e inexacta dentro de las medidas de dispersin absoluta. Esta
medida tiene bastante uso en el control de calidad de los productos manufacturados.
Desviacin tpica o estndar: Es la medida de dispersin ms utilizada en las
investigaciones por ser la ms estable de todas, ya que para su clculo se utilizan todos
los desvos con respecto a la media aritmtica de las observaciones, y adems, se
toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S
cuando se trabaja con una muestra y con la letra griega minscula (Sigma) cuando
se trabaja con una poblacin. Es importante destacar que cuando se hace referencia a
la poblacin l nmero de datos se expresa con N y cuando se refiere a la muestra l
nmero de datos se expresa con n. La desviacin tpica se define como:
La raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos de
las observaciones con respecto a su media aritmtica. La desviacin tpica es una
forma refinada de la desviacin media.
Caractersticas de la Desviacin Tpica:

La desviacin tpica se calcula con cada uno de los valores de una serie de datos.

37

La desviacin tpica se calcula con respecto a la media aritmtica de las


observaciones de una serie de datos, y mide la variacin alrededor de la media.

La desviacin tpica es susceptible de operaciones algebraicas, puesto que para


su clculo se utilizan los signos positivos y negativos de los desvos de todas las
observaciones de una serie de valores, por lo tanto es una medida completamente
matemtica.

Es siempre una cantidad positiva.

Clculo de la Desviacin Tpica: La desviacin tpica para calcularla se procede de


dos formas: A).- Para datos no agrupados, B). - Para datos agrupados en clases.
A) Para datos no Agrupados.- Las frmulas para determinar la desviacin tpica de
una muestra es:

(X

1. .S

X )2

n 1

2. .S

( X i ) 2

2
i

n 1

N X i2 ( X i ) 2

n(n 1)

Para caular la desviacin tipica de una poblacin para datos no agrupados, se utilizan
las siguientes formulas:

(X

3. .

4. .

)2

X
N

2
i

2
i

Ej.1 Los siguientes valores corresponden a la edad de ios de una muestra tomada
de una poblacin: Xi = 3, 4, 5, 6, 7 . Determine la desviacin tpica.
X

X
n

25
5
5

n X i2

Utilizando la formula 2 nos da

n(n 1)

5(135) 625

5(4)

50
1.58
20

Interpretacin.- El resultado obtenido con las frmulas 1 y 3 indican que en promedio,


las edades de los nios de esa muestra se desvian o varian con respecto a la media
aritmtica en una cantidad igual a 1.58 aos.

38
B) Para datos Agrupados en Clases.- Para calcular la desviacin tpica en datos
agrupado existen varios criterios en relacion a la correccin del sesgo que se produce al
tomar una muestra, en este estudio se considerar la frmula que corrige el sesgo de
aquellas muestras en estudio.
Frmulas Para calcular la muestra y la poblacin de una desviacin tpica con datos
agrupados en clases:

1. .S

( X

2. .S

X )2 fi

n 1
f i nX 2

2
i

n 1

Ejemplos:
Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la
empresa RINACA, en un mes (se resolver considerando los datos como de una S y

3. .

f ( X

4. .

f X

)2

2
i

di = X i X

CLASES

fi

X i

40 44

42

42

- 15.26

232.87

1764

45 49
50 54
55 59
60 64
65 69
70 74

6
21
75
23
7
2

47
52
57
62
67
72

282
1092
4275
1426
469
144

- 10.26
- 5.26
- 0.26
4.74
9.74
14.74

631.60
581.02
5.07
516.75
664.07
434.54

13254
56784
243675
88412
31423
10368

f i X

f X
i

=7730

1.82

f i d i2

f d
i

=3065.92

2
i

f X
i

2
i

=445680

Para resolver el problema lo primero que se debe hacer es calcular la media aritmtica
as:
X

X i

f X
i

7730
57.26 Ahora aplicando la frmula 2
135

2
i

nX 2

n 1

445680 135(57.26)

135 1

3065.93
22.88 4.78.
134

39
Interpretacin.- Los resultados obtenidos con los clculos anteriores, indican que el
promedio de las horas extras laboradas por los trabajadores se desvan o varan con
respecto a su media aritmtica en una
Cantidad igual a 4.78 y 4.76 respectivamente.
La Varianza: Es otra de las variaciones absolutas y la misma se define como el
cuadrado de la desviacin tpica; viene expresada con las mismas letras de la
desviacin tpica pero elevadas al cuadrado, as S 2 y 2. Las frmulas para calcular
la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las
respectivas races, las cuales desaparecen al estar elevados el primer miembro al
cuadrado. La varianza general de la poblacin se expresa de la forma siguiente:
2. . 2

f ( X

3. .S 2

(X

)2

X )2

n 1

..,. para.datos.agrupados.

..,. para.datos.no.agrupados.

La varianza general de la muestra se expresa as:


4. .S 2

f ( X
i

X)

..,. para.datos.agrupados.
n 1
La mayor utilidad de la varianza se presenta en la estadstica Inferencial.

Propiedades de la Desviacin Tpica:


1. La desviacin tpica de una constante k es cero. Si se parte de que la media
aritmtica de una constante es igual a la constante, esto es as, debido a que al ser
todos los datos iguales no habr dispersin en la serie de datos con respecto a la
media aritmtica, por lo tanto (k) = 0.
2. Para distribuciones normales siempre se cumple que:
68.27 % de los datos se encuentran en el intervalo ( X ).
95.45 % de los datos se encuentran en el intervalo ( X 2).
99.73 % de los datos se encuentran en el intervalo ( X 3).
Estos valores se cumplen con bastante aproximacin, para distribuciones que son
Normales y para las que son ligeramente asimtricas

40
Dispersin Relativa o Coeficiente de dispersin
Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra; pero,
cuando hay que establecer comparaciones entre distintas muestras, ser necesario
expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Las medidas de dispersin relativas permiten comparar grupos de series distintas en
cuanto a su variacin, independientemente de las unidades en que se midan las
diferentes caractersticas en consideracin. Generalmente las medidas de dispersin
relativas se expresan en porcentajes, facilitando as el estudio con medidas
procedentes de otras series de valores La dispersin relativa viene a ser igual a la
dispersin absoluta dividida entre el promedio.
1. . 2

(X

)2

.., para.datos.no.agrupados.
N
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de
variacin de Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite
la comparacin entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variacin de Pearson se designa con las letras CV. La
frmula matemtica es:

CV

x100.

El CV pierde utilidad, cuando la X es muy cercana a cero. Una serie de valores


ser ms dispersa que otra respecto a su X mientras que su CV sea mayor.
Ejemplo:
La venta en el mercado de tres productos, vara de acuerdo al siguiente cuadro.
Determine el CV de cada uno y diga cul de ellos presenta mayor variacin y cul la
menor.
Producto
S
Unidades
CV
X
1
45
5
Bs.
11.11 %
2
450
40
Bs.
8.87 %
3
4500
350
Bs.
7.78 %
Para resolver el problema se calcula el CV de cada producto y luego s determina cul
presenta mayor o menor variacin
CV = Sx100/ X
CV1 = 5x100/45 = 11.11 %.
CV2 = 40x100/450 = 8.87 %.
CV3 = 350x100/4500 = 7.78 %.
Se puede observar que la menor dispersin la presenta el producto 3, por lo tanto, de
los 3 productos el que menos varia es ese; por otro lado el de mayor dispersin o
variabilidad es el producto 1.

41

MEDIDAS DE POSICIN
Las medidas de posicin forman parte del conjunto de medidas descriptivas numricas,
entre las que se encuentran los parmetros y los estadgrafos. Una medida de posicin
es un nmero que se escoge como orientacin para hacer mencin a un grupo de
datos, estas pueden ser de tendencia central o no, las ms importantes son: La Media
Aritmtica, la Mediana, la Moda, la Varianza, la Desviacin Estndar y los Cuartiles.
Un promedio es un valor que es tpico o representativo de un conjunto de datos ya que
representan un gran nmero de valores individuales por uno solo. Como tales valores
tienden a distribuirse centralmente dentro de un conjunto de datos ordenados de
acuerdo con su magnitud, los promedios son llamados tambin medidas de tendencia
central
Parmetro: son medidas descriptivas numricas calculadas a partir del total de
observaciones de la poblacin EJ: a media poblacional, la varianza, la proporcin, etc.
Estadstico: son medidas calculadas a partir de las observaciones de una muestra.
CARACTERSTICAS DE LAS MEDIDAS DE POSICIN
1. Deben ser definidas
interpretaciones.

rigurosamente y no ser susceptibles de diversas

2. Deben depender de todas las observaciones de la serie, de lo contrario no sera una


caracterstica de la distribucin.
3. No deben tener un carcter matemtico demasiado abstracto.
4. Deben ser susceptibles de clculo algebraico, rpido y fcil.
Cuando se estudi la mediana se pudo detectar que esta divide la serie de valores en
dos partes iguales, una generalizacin de esta medida da origen a unas nuevas
medidas de posicin denominadas:
Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posicin surgen por la
necesidad de requerir de otras medidas que expresen diferentes situaciones de orden,
aparte de las sealadas por la mediana. Por lo tanto, es interesante ubicar otras
medidas que fraccionen una serie de datos en diferentes partes.
Es bueno destacar que los cuartiles, los Deciles y los Percentiles son unas variantes de
la mediana: De la misma forma los percentiles abarcan tanto a los cuartiles como a los
Deciles.
CLCULO DE LOS CUARTILES, DECILES Y PERCENTILES PARA DATOS NO
AGRUPADOS
Los cuartiles.- Son medidas posicinales que dividen a un conjunto de datos o a una
distribucin de frecuencia en cuatro partes iguales. Se designa por el smbolo Q a en la

42
que a corresponde a los valores 1, 2 y 3., que viene a ser el nmero de Q a que
posee una distribucin de frecuencia de clase. El Q 1 divide la distribucin de
frecuencia en dos partes, una corresponde a 25 % que est por debajo de Q 1 y el otro
75 % por encima de Q1. El Q2 divide la distribucin de frecuencia en dos partes
iguales, un 50 % que est por debajo de los valores de Q 2 y otro 50 % que est por
encima del valor de Q2. El Q2 es igual a la mediana.
Se hace difcil calcular estas medidas, sin embargo, siguiendo los mismos principios
mencionados para la mediana, se pueden localizar en la forma siguiente:
Si tenemos una serie de valores X1, X2, X3 Xn, se localiza el primer cuartil como el
1 * (n 1)
1* n
valor Q1
cuando n es par y Q1
cuando n es impar.
4
4
El segundo cuartil coincide exactamente con la mediana. Para el tercer cuartil ser
3 * ( n 1)
3* n
Q3
(n par) y Q3
(n impar)
4
4
Los Deciles: los deciles dividen a un conjunto de datos exactamente en 10 partes
A * (n 1)
A* n
iguales Para calcular los deciles ser D A
(n es par) o D A
(n es
10
10
impar) siendo A el nmero del decil.
NOTA: los valores que se obtienen de los cuartiles, percentiles y deciles son la posicin
donde se encuentra el valor real de ellos mismos, por lo tanto hay que ordenar los datos
primero.
Los percentiles: los percentiles dividen exactamente a un conjunto de datos en 100
A * ( n 1)
A* n
partes iguales, para calcular los percentiles tenemos PA
o PA
,
100
100
siendo Al nmero del percentil a determinar.
Ejemplo: En una serie de 11 trminos, 2, 2, 5, 7, 9, 9, 9, 10, 11, 12, 18, se desea
localizar el primer cuartil, el sexto decil y el percentil 95.
Como n es impar por haber 11 casos, tenemos que:
Q1

1 * (11 1) 12

3 Por lo tanto, el valor que est en la posicin 3 es el 5


4
4

D6

6 * (11 1) 72

7.2 7 Por lo tanto, el valor que est en la posicin 7 es el 9


10
10

P95

95 * (11 1) 1140

11.4 11 Por lo tanto, el 18 ocupa la posicin 11


100
100

CLCULO DE
AGRUPADOS

LOS CUARTILES, DECILES Y PERCENTILES PARA DATOS NO

Cuartiles: Para calcular los cuartiles por el mtodo numrico se procede de la


siguiente manera:

43
1 Se
PQa

localiza la posicin del cuartil solicitado aplicando la frmula de posicin:

aN

, en donde a viene a ser el nmero del cuartil solicitado, N corresponde al


4

nmero total de datos de la distribucin y 4 corresponde al nmero de cuartiles que


presenta una distribucin de frecuencia.
2 Luego se aplica la frmula para determinar un cuartil determinado, as:
aN

4 Faa
Qa Li
.Ic.
fm

En esta frmula,

Qa = El cuartil solicitado, en esta

corresponde al nmero del cuartil solicitado; Li = Limite real inferior de la clase donde
se encuentra ubicado el cuartil; Faa = Frecuencia acumulada anterior a la clase donde
se encuentra el cuartil; fm = Frecuencia fi que posee el intervalo de clase donde se
encuentra el cuartil;

PQa

aN
= Posicin que ocupa el cuartil en la distribucin de
4

frecuencia, este resultado obtenido determinar la clase donde se encuentra ubicado el


cuartil, el mismo se encontrar en la clase donde la frecuencia acumulada Fa sea igual
o superior a este resultado.
Deciles: El clculo de los deciles es similar al clculo de los cuartiles, solo que en estos
vara la posicin, la misma se calcula con la frmula:
PDa

aN
, en esta
10

corresponde al nmero del decil que se desea calcular, N

equivale al nmero de datos de la distribucin y 10 corresponde a las diez partes en la


que se divide la serie de valores de la distribucin.

La frmula para su clculo es:

aN

10 Faa
Da Li
.Ic
fm

En este caso se aplica la frmula de la misma manera que se hizo para calcular los
cuartiles, solo que en esta frmula varia la posicin de ubicacin de la clase donde se
encuentra ubicado el decil.
Percentiles: El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir:
Md Q2 D5 P50 . 50% por encima y 50 % por debajo de los datos de la distribucin.
El clculo de los percentiles es similar al clculo de los cuartiles y los deciles con una
variante en la posicin de ubicacin de estos, que viene expresada por la siguiente
formula:
PPa

aN

Faa

aN

.Ic .
. Con esta posicin se aplica la frmula: Pa Li 100 fm
100

Ejemplo: Dada la siguiente distribucin correspondiente al salario semanal en dlares


de un grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q 1, b)
Compare los resultados con la mediana, D5, c) P70
SALARIO EN $
Fi
Fa
200-----299
85
85
300-----399
90
175

44
400-----499
500-----599
600-----699
700-----799
Totales = N
a)
PQ1

Para

calcular

Q 1,

120
70
62
36
463
se

determina

295
365
427
463
primero

la

posicin

as:

1x 463 463

115 .75.
4
4

PQ1 = 115.75. Con ese valor de la posicin encontrado se busca en las frecuencias
acumuladas para ver cul de esas contiene ese valor. Observando las frecuencias
acumuladas se puede detectar que la posicin 115.75 se encuentra en la clase
300------399, por lo tanto el Li = 299.5,
fm = 90, y la Faa = 85 y Ic = 100, aplicando la formula se tiene:
3075
115 .75 85
.100 299.5
299.5 34.17 333.67.

90
90

Q1 299.5

Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario


semanal por debajo de 333.67 $ y el 75 % restante gana un salario por encima de
333.67 $.
b)
PQ 2

Para calcular

Q 2=Md =D5 se determina primero la posicin de este as.

2 x 463

231.5 , ahora se ubica esta posicin en las frecuencias acumulados para


4

determinar la posicin de Q 2, se puede observar en la distribucin que esta posicin


de Q2 esta ubicada en la clase 400----499, entonces, Li = 399.5, fm = 120, Faa =
175 y Ic = 100, aplicando la formula se tiene:
5650
231.5 175
.100 399.5
399.5 47.08 446.58.

120
120

Q2 399.5

Este resultado de Q2 establece que el 50 % de los obreros de este estudio,


devengan un salario semanal por debajo de 446.58 $ y el otro 50 % devenga un
sueldo por encima de 446.58 $. Calcule la mediana y comprela con este resultado.
c)

Para calcular

PP 70

70 x 463

324.10 . Ahora se ubica este resultado en la columna de frecuencias


100'

P 70

lo primero que se hace es determinar la posicin,

acumuladas para encontrar la posicin de P 70 en la distribucin de frecuencia. Como


se puede observar en la tabla de distribucin de frecuencia, P 70 se encuentra ubicado
en la clase 500-------599, entonces, Li = 499.5, fm = 70, Faa = 295 y
Ic = 100,
aplicando la formula se tiene:
2910
324.10 295
.100 499.5
499.5 41.57 541.07.

70
70

P70 499.5

Esto indica que el 70 % de los obreros devengan un sueldo semanal que est por
debajo de 541.07 $ y que el 30 % de los restantes obreros, ganan un salario por
encima de 541.07 $.
UNIDAD No. IV

CONCEPTOS DE PROBABILIDAD

45

Experimentos Aleatorios
La teora de probabilidades es muy extensa y sus aplicaciones han adquirido mucha
importancia en la administracin pblica y empresarial. Las probabilidades son de gran
importancia en la estadstica. Todos estamos familiarizados tambin con la importancia
de los experimentos en ciencias e ingeniera. La experimentacin es til porque si
suponemos que llevamos a cabo cierto experimento bajo condiciones esencialmente
idnticas, llegaremos a los mismos resultados. En estas circunstancias, estamos en
capacidad de controlar el valor de las variables que afectan el resultado del
experimento.
Sin embargo en algunos experimentos, no somos capaces de indagar o controlar el
valor de determinada variable, de manera que el resultado cambiara de un experimento
a otro, a pesar de que la mayora de las condiciones son las mismas. Estos
experimentos se describen como aleatorios. Los siguientes son algunos ejemplos:
Ejemplo1:
Si lanzamos una moneda, el resultado del experimento ser sello, simbolizado por S,
o puede caer cara, simbolizado por C.
Ejemplo2:
Si lanzamos un dado, el resultado del experimento ser uno de los nmeros del
conjunto
1, 2, 3, 4, 5, 6.
Para comprender mejor el estudio de las probabilidades es necesario definir una serie
de trminos bsicos para su mejor comprensin.
Una variable aleatoria es una funcin que asocia un nmero real a cada ele mento del
espacio muestral. O tambin, una Variable Aleatoria es una funcin que asigna un
nmero real a cada resultado en el espacio muestral de un experimento aleatorio.
Experimento.- Es el proceso mediante el cual se obtiene una observacin o una
medicin de un fenmeno. En este hay tres cosas de importancia: Accin, Medicin y
Observacin. Existen 2 tipos de experimento: Experimento Determinante y Experimento
Aleatorio.
Experimento Determinante.- Es aquel experimento en el que es posible predecir el
resultado final de ese proceso an sin haberlo realizado. Ej. Cuando los qumicos
combinan oxigeno ms hidrgeno el resultado es agua; este experimento no es
necesario realizarlo para conocer el resultado.
Experimento Aleatorio.- Es aquel que puede dar lugar a ms de un resultado, por lo
que, no se puede predecir uno de ellos en una prueba en particular. Ej. Los
experimentos relacionados con juegos de azar, no se pueden predecir los resultados
de los ganadores del 5 y 6 en un domingo cualquiera.

46
Espacio Muestral.- Es el conjunto de todos los posibles resultados de un experimento
aleatorio; generalmente se le designa con la letra S.
Ejemplo: El espacio muestral al lanzar un dado es: S = {1, 2 3 ,4 ,5 ,6} esto es as
puesto que un dado tiene 6 caras numeradas de 1 al 6 y cualquiera de estas puede
salir. El espacio muestral de lanzar una moneda es: S = {c, s}, esto es as puesto que al
lanzar una moneda puede salir una cara un sello.
Sucesos Eventos.- Es todo aquel resultado o grupo de resultados que pueden dar
origen un experimento aleatorio. Tambin se puede decir que es un subconjunto del
espacio muestral.
Ejemplo. El espacio muestral de lanzar un dado est formado por varios eventos: { 1 },{
2 }, { 3 }, { 4 },{ 5 } y {6}. Los eventos pueden ser simples compuestos.
Eventos Simples.- Son aquellos eventos cuyas caractersticas son las de estar
constituidos por un solo elemento; por lo tanto no se pueden descomponer en otros
elementos. Ej. Al lanzar un dado se pueden obtener 6 eventos simples que serian el 1,
2, 3, 4, 5 y 6 respectivamente.
Eventos Compuestos.- Son aquellos eventos que se pueden descomponer en una
combinacin de eventos. Ej. Obtener un nmero par al lanzar un dado, el espacio
muestral de este evento es:
E = {2, 4, 6}, este es el evento par del lanzamiento de un dado, pero este evento se
puede descomponer en 3 eventos simples a saber {2}, {4}: y 6 .
Eventos Mutuamente Excluyentes.- Son aquellos eventos que no pueden ocurrir
simultneamente al realizar una sola vez un experimento. Se dice que dos eventos A y
B son mutuamente excluyentes si y solo si, su interseccin es el conjunto vaco, es
decir AB = . Ej. El resultado obtenido al lanzar un dado, si sale una cara con un 3,
no puede salir otro nmero en este mismo lanzamiento.
Eventos Exhaustivos.- Dos eventos A y B son colectivamente exhaustivos si su unin
es la totalidad del espacio muestral, es decir, AB = S.
Eventos Imposibles.- Son aquellos sucesos que nunca ocurren. Ej. Obtener un 7 al
lanzar un dado normal, esto es imposible por cuanto un dado normal tiene solamente 6
caras por lo tanto este resultado es el conjunto vaco, {}.
Eventos Seguros.- Son aquellos sucesos constituidos por todos los eventos simples
del espacio muestral. Ejemplo: Al lanzar un dado, sacar cualquiera de sus caras.
Eventos complementarios.- Dos eventos A y son complementarios si y solo si, se
cumple que: P(A) + P () = P(S), es decir, son eventos mutuamente excluyentes y su
unin es el espacio muestral, entonces tenemos, P(A) + P() = P(S), pero P(S) = 1,
entonces:
P(A) + P() = 1

P(A) = 1 - P(), donde P(), se lee probabilidad de A


Complemento.
El concepto de probabilidad

47
En cualquier experimento aleatorio hay siempre incertidumbre sobre si ocurrir un
evento en particular. Como una medida de oportunidad, o probabilidad, con que
esperamos que ocurra cierto evento, es conveniente asignar un numero entre 0 y 1. Si
estamos seguros de que tal evento ocurrir, decimos que tiene 100% de probabilidad o
1, pero si estamos seguros del que tal evento no ocurrir, decimos que su probabilidad
es cero.
Hay dos enfoques o procedimientos importantes mediante los cuales podemos calcular
la probabilidad de un evento:
Enfoque Clsico: si un evento puede ocurrir en h maneras diferentes de un nmero
total de n maneras posibles, todos ellos son igualmente probables. Entonces la
probabilidad del evento es h/n.
Ejemplo: supongamos que queremos saber la probabilidad de que ocurra cara en el
lanzamiento sencillo de una moneda. Dado que hay dos maneras igualmente probables
como puede caer una moneda, a saber: cara o sello, y que de esas dos maneras puede
aparecer cara de una solo forma, deducimos que la probabilidad es de 1/2. Para llegar a
esto debemos suponer que la moneda es balanceada, es decir, que no est cargada de
alguna manera.
Enfoque Frecuentista: Si despus de n repeticiones de un experimento, donde n es
muy grande, se observa que un evento ocurre h veces, entonces la probabilidad de
dicho evento es h/n. Esto tambin se denomina la probabilidad emprica de un evento.
Ejemplo: si lanzamos 1000 veces una moneda y encontramos que 532 veces
obtenemos caras, estimamos que la probabilidad de que ocurra cara es de 532/1000 =
0.532
Tanto el enfoque Clsico como el Frecuentista presentan serios inconvenientes. El
primero porque las palabras igualmente probables son vagas y el segundo porque el
nmero grande es vago. Debido a estas dificultades, los matemticos y estadsticos se
han regido por el enfoque axiomtico de la probabilidad.
Axiomas de la Teora de Probabilidades
Supongamos que tenemos un espacio muestral S. Para cada evento del espacio
muestral asociamos un numero real P(A). Entonces P se denomina la funcin de
probabilidad, y P(A) la probabilidad del evento A. Los axiomas de las probabilidades
son los fundamentos bsicos de las reglas del clculo de las probabilidades de eventos;
estas reglas tambin se conocen como propiedades de las probabilidades y son:
1.- La probabilidad de todo evento o suceso es un nmero no negativo, es decir:
P(A)0.
2.- La suma de las probabilidades de todos los sucesos posibles simples, de un
n

experimento aleatorio es la unidad, es decir:

P( A )
i 1

P(A3)+.............+ P(An) = 1 = S

P(A1) + P(A2) +

48
3.- La probabilidad de cualquier suceso vara entre 0 y 1, es decir 0 P(A) 1.
4.- La probabilidad de un evento imposible es cero, es decir:

P () 0

Pasos para calcular la probabilidad de un evento


1.

Defina el experimento, es decir describa el proceso empleado para efectuar una


observacin y el tipo de observacin que se registra.

2.

Enumere lo eventos simples o el espacio muestral.

3.

Asigne probabilidades a los eventos simples.

4.

Determine la coleccin de eventos simples contenida en el evento de inters, si se


trata de un evento compuesto.

5.

Sume las probabilidades de los eventos simples para obtener la probabilidad del
evento.

Ejemplo: Un dado se lanza una vez. Encuentre la probabilidad de


a) que caiga un 2,
b) que caiga un nmero par,
c) que caiga un nmero mayor que 4.
Respuesta: Los eventos simple que componen el lanzar un dado esta dado por su
espacio muestral el cual es S = 1, 2, 3, 4, 5, 6. Si asignamos probabilidades iguales a
los puntos muestrales, es decir, si suponemos que el dado esta balanceado, entonces:
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = 1/6. Ya que tenemos las probabilidades de
los eventos simples resolvamos los incisos.
a) Sea A el evento que caiga un 2, por tanto la probabilidad P(A) = 1/6.
b) Sea B el evento que caiga un numero par, por lo tanto como hay 3 posibles nmero
pares que son el 2, 4, 6 la probabilidad P(B) = P(2) + P(4) + P(6) =1/6 + 1/6 + 1/6 =
3/6 =1/2.
c) Sea C el evento que caiga un nmero mayor que 4, por lo tanto como solo hay 2
nmeros mayor que 4 los cuales son el 5 y el 6, entonces la probabilidad P(C) = P(5)
= P(6) = 2/6 = 1/3
Muchas veces se puede considerar que un evento es una composicin de 2 o ms
eventos distintos, ya sea simple o compuestos, estos eventos los podemos formar de
dos maneras:
1. La unin de dos eventos A y B es el evento que ocurre si A o B o ambos ocurren en
una sola realizacin del experimento. La unin de A y B se denota por A B .
2. La interseccin de dos eventos A y B es el evento que ocurre si tanto A como B
ocurren en una sola realizacin del experimento. Este se denota por A B .

49
Regla de probabilidad para las uniones e intersecciones:
Puesto que las uniones y las intersecciones de los eventos son ellas mismas eventos,
siempre podremos calcular sus probabilidades sumando las probabilidades de los
eventos simples que lo componen. Sin embargo cuando se conocen la probabilidad de
ciertos eventos, es ms fcil utilizar una de dos reglas o ambas para el clculo de la
probabilidad.
Regla aditiva de la probabilidad: la probabilidad de la unin de los eventos A y B es la
suma de las probabilidades del evento A ms la probabilidad del evento B menos la
interseccin de ambos, esto es:
P ( A B ) P ( A) P ( B ) P ( A B )

De manera ms general, si A1, A2, A3 son 3 eventos cualquiera, entonces


P( A1 A2 A3 ) P( A1 ) P( A2 ) P( A3 )
P( A1 A2 ) P( A2 A3 ) P( A3 A1 )
P( A1 A2 A3 )

Ejemplo: retomemos el ejemplo de lanzar un dado, sabemos que su espacio muestral


est dado por S = 1, 2, 3, 4, 5, 6 y adems tenemos los siguientes eventos: A =
observar un nmero impar, B = observar un nmero menor que 3, calculemos la
probabilidad de la unin de estos dos eventos.
Tomando la ecuacin anterior tenemos que P ( A B ) P ( A) P ( B ) P ( A B ) , por lo
tanto debemos encontrar cada una de sus probabilidades, esto es:
1
, por lo tanto
6
1 1 1 4 2
P ( A B ) P ( A) P ( B ) P ( A B )
2 3 6 6 3

P ( A)

1
,
2

1
P( B) ,
3

P ( A B)

Regla aditiva de probabilidad para eventos mutuamente excluyente: si dos eventos


son mutuamente excluyentes, entonces la probabilidad de la unin es:
P ( A B ) P ( A) P ( B ) , dado que al ser A y B excluyente la P ( A B) 0

Ejemplo: Se lanzan dos monedas al aire al mismo tiempo, y se tienen los siguientes
eventos,
A: observar al menos una cara.
B: observar exactamente una cara.
C: observar exactamente dos caras.
Calcule la probabilidad P( B C )
Sabemos que son dos monedas y adems que cada moneda tiene solo dos posibles
resultados, el caer cara (C) o el caer cruz (X) por lo tanto tendremos 4 posibles
resultados, sea 4 eventos simples de los cuales formaremos nuestro espacio muestral,
esto es: S = CC, CX, XC, XX. Las probabilidades de cada evento son

50
3
1
1
, P( B ) , P(C ) , como B y C no pueden ocurrir a la misma vez entonces
4
2
4
P ( B C ) 0 , entonces
P( A)

P ( A B ) P ( A) P ( B ) =

1 1 3

2 4 4

Probabilidad Condicionada
La probabilidad de que ocurra un evento B cuando se sabe que ha ocurrido algn otro
evento A, se denomina PROBABILIDAD CONDICIONADA y se designa como
P(B/A). l smbolo P(B/A) se lee como la probabilidad de que ocurra B sabiendo que
ocurri A o sencillamente probabilidad de B dado A. Se dice que la probabilidad de
ocurrencia de un evento dado es condicionada, si esta se afecta por la ocurrencia de
otro evento presente.
Definicin.- Sean A y B dos eventos asociados a un experimento aleatorio. La
probabilidad que ocurra el evento B, dado que ocurri el suceso A se llama
probabilidad condicionada del suceso B, esta se simboliza por P(B/A) y se calcula
mediante la frmula:

A P PA AB , Si

PB

P(A) = 0, entonces P (B/A), no est definida.

El conjunto P(AB), se le denomina probabilidad conjunta de los eventos A y B. El


conjunto AB se define como la interseccin de A y B, es decir, los eventos comunes
entre A y B.

A P PA AB

PB

B P PA B B

PA

Ejemplo: Un curso de matemticas avanzada est formado por 10 administradores, 30


ingenieros y 10 economistas. Al finalizar el curso 3 administradores, 10 ingenieros y 5
economistas aprueban el curso con 20 puntos. Se seleccion un al azar un participante
del mismo y se detect que la calificacin obtenida en el curso haba sido de 20 puntos.
Cul es la probabilidad de que ese participante sea un ingeniero?
Solucin: si llamamos A al evento en que un participante obtuvo una calificacin de 20
puntos; si denominamos como B el evento de seleccionar un ingeniero y si llamamos
AB, los eventos comunes entre A y B, tenemos los siguientes sucesos:
El total de participantes en este caso ser el espacio muestral, que en el problema
planteado es de 50, por lo tanto los diferentes eventos sern:
A = 3 admist., 10 ing. 5 econ., ,Luego

P(A) = 18 / 50.

B = 10 ing. con 20 ptos., 20 ing., con menos de 20 ptos. .

51
AB = 10 ing. Con 20 puntos , luego

P(AB) = 10 / 50.

10
P

10 5
PB
50 ,
A
18
P A
18 9
50

Por lo tanto 5/9=0.5556 = 55.56 %, es la probabilidad de extraer un ingeniero con 20


puntos.
Regla multiplicativa de la probabilidad
P(AB) = P(A) P(B/A) = P(B) P(B/B).
Ejemplo: A un procesador de datos le interesa el evento de que un trabajo sea
procesado inmediatamente el momento de presentarse. Este evento es la interseccin
de los eventos siguientes:
A: la computadora est funcionando.
B: el trabajo se procesa de inmediato.
Adems se sabe que P(A) = 0.9 y P(B/A) = 0.5. Calcule la probabilidad de que un
trabajo presentado sea procesado de inmediato.
P(AB) = P(A) P (B/A) = 0.5 * 0.9 = 0.45
Independencia de eventos
Se dice que 2 eventos (A y B) cualesquiera son independientes si la ocurrencia de A no
afecta la ocurrencia de B o viceversa. Esto es:
Si P(A/B) = P(A) se dice que el evento B es dependiente del evento A.
o
S P(B/A) = P(B), se dice que el suceso B es independiente del suceso A
Ejemplo: Se lanza un dado y se tienes los siguientes eventos
A: se observa un nmero par, B: se observa un nmero menor o igual a 4.
Son independientes A y B?
Sabemos que P(A) = 1/2, P (B) = 2/3 y

P(AB) = 2/6 entonces

2
P(A B)
1
6 P(A)
. P(A/B)
4
P(B)
2
6
2
P(A B)
2
P(B/A)
6 P(B)
3 3
P(A)
6

Por lo tanto los eventos son independientes.

Regla multiplicativa para eventos independientes

52
Si los eventos A y B son independientes, entonces la probabilidad de la interseccin de
A y B es:
P(AB) = P(A) P(B).
Ejemplo: en el ejemplo anterior demostramos que los eventos A y B eran
independientes entonces:
P(AB) = P(A) P(B) = (3/6) * (4/6) = 1/3

Teorema o Regla de Bayes


Unos de los primeros intentos por utilizar la probabilidad para hacer inferencias es la
base de una rama de la metodologa estadstica llamada mtodos estadsticos
bayesianos.
Dados K estados de la naturaleza (Eventos) mutuamente excluyentes A1, A2, A3.....An
y un evento observado E, entonces la P(A k /E ) para k = 1, 2, , n es:
P(A k /E)

P(A k E )
P(A )P(E A k )
P(A k )P( E A k )
n k
n
P(E)
P( A j E ) P( A j ) P( E A j )
j 1

j 1

Ejemplo: Suponga que la caja A contiene 3 canicas rojas y 2 azules mientras que la
caja B contiene 2 canicas rojas y 8 azules. Se lanza una moneda balanceada, si se
tiene cara se saca una canica de la caja A y si se obtiene cruz se saca una canica de la
caja B:
a-) encuentre la probabilidad de que se saque una canica roja.
b-) suponga que quien lanza la moneda no revela si obtiene cara o cruz (de manera que
no sabemos de cual caja se sac la canica) pero si dice que sac una canica roja.
Cul es la probabilidad de que la canica haya sido sacada de la caja A (es decir de
que la moneda sea cara).
a-) Sea R: se escoge una canica roja , C1: se escoge de la caja A y C2: se
escoge de la caja B . Por lo tanto la probabilidad de escoger una canica roja es:
P ( R ) P ( R C1 ) P ( R C 2 ) P (C1 ) P ( R C1 ) P (C 2 ) P ( R C 2 )
2
1 3 1 2



5
2 3 2 2 2 8

b-) usemos la misma terminologa que en el inciso a-). Busquemos la posibilidad de


que la caja A haya sido escogida dado que sabemos que la persona sac una canica
roja. Usando el teorema de Bayes con n = 2, la probabilidad est dada por:

53

P C1 R

P(C1 ) P ( R C1 )

P(C1 ) P( R C1 ) P (C 2 ) P ( R C 2 )

1 3

3
2 3 2

1 3 1 2
4

2 3 2 2 28

Tcnicas de Conteo o Teora Combinatoria


Algunos experimentos a veces tienen tantos eventos simples que no resulta prctico
enumerarlos a todos. Sin embargo, muchos de estos experimentos tienen eventos
simples con idnticas caractersticas. Las reglas de conteo nos ayudan a resolver
algunos de estos problemas.
Principio de Multiplicacin.- El mismo est basado en el mtodo de razonamiento del
diagrama de rbol; el mismo se define as: " Si una accin puede efectuarse, de a
maneras diferentes, una segunda accin puede efectuarse de b maneras diferentes,
una tercera accin puede efectuarse de c maneras diferentes, y as sucesivamente
para n acciones, entonces el nmero total de maneras diferentes en que pueden
efectuarse todas estas acciones en el orden mencionado est dado por: a*b*c*...*n".
Ejemplo: Un joven tiene cuatro camisas de los siguientes colores: roja (R), blanca (B),
negra (N) y verde (V), tambin posee dos pantalones, gris (G) y azul (A). De cuntas
maneras pueden combinarse los pantalones con las camisas o viceversa?
Camisa

Pantalones
G

Arreglos
RG

R
A
G

RA
BG

B
A

BA

NG

NA

G
A

VG
VA

J
N

Ejemplo:
Suponga que se han programado cinco vuelos espaciales distintos, cada uno de los
cuales requiere de un astronauta. Se supone que ningn astronauta puede ir en ms de
un vuelo. De cuntas formas diferentes se pueden asignar cinco de los 100 mejores
astronautas del pas a los cinco vuelos distintos?
Resolviendo por la regla multiplicativa y tomando en cuenta que son 5 de 100
astronautas tenemos:
n1 * n 2 * n3 * n 4 * n5 (100) * (99) * (98) * (97) * (96) 9,034,502,400

54
Una disposicin de elementos en un orden especfico se denomina Permutacin. Del
ejemplo anterior hay ms de 9 mil millones de permutaciones distintas de 5 elementos
extrados de un conjunto de 100 elementos.
Permutacin: Dado un conjunto de m objetos claramente distintos, se desea
seleccionar n elementos de los m y acomodarlos dentro de n posiciones. Se llaman
permutaciones de esos elementos tomados de n en n, al conjunto formado por todas
las colecciones de n elementos elegidos entre los elementos dados, considerando
como distintas dos colecciones que difieran en algn elemento o en el orden de
colocacin de los mismo.
N! Esta es una notacin matemtica que recibe el nombre FACTORIAL y se define
como el producto de todos los nmeros consecutivos decrecientes que comienzan en 1
hasta n, entonces si n es entero positivo tenemos:
N! = n(n-1) (n-2) (n-3)..................1.
6! = 6x5x4x3x2x1 =720. En particular, 1! = 1; por definicin, 0! = 1.
Frmula de las Variaciones:

Pn

m!
m n !

Ejemplo: Aplique la formula de la permutacin para el ejemplo de los astronautas.


Pn m m 1 m 2 m 3............ m n 2 m n 1
m!
100!
100 * 99 * 98 * 97 * 96 * 95!
P

9,034,502,400
m Pn
m n ! 100 5 100 5!
95!
m

Combinaciones: Se llama combinacin de m elementos tomados de n en n al


conjunto de todas las colecciones de n elementos dados, considerando distintas, dos
colecciones cuando difieran en uno o ms elementos.
m!

Frmula de las combinaciones: m Cn n! m n !

Ejemplo: Se contrata cinco ingenieros de ventas de entre un grupo de 100 solicitantes.


De cuantas maneras podemos seleccionar grupos de 5 ingenieros de ventas?.
m

Cn

m!
100!
100 * 99 * 98 * 97 * 96 * 95!
100 C5

75,287,520
n! m n !
5!100 5!
5!*95!

Como el orden de los elementos no afecta la combinacin, hay menos combinaciones


que permutaciones.
Algunas observaciones para calcular permutaciones y combinaciones
Para diferenciar en la resolucin de un problema y determinar si es una permutacin o
una combinacin se hace lo siguiente:

55
1.-Se forma un grupo cualquiera, segn el enunciado del problema y con los mismos
elementos de ese grupo se trata de formar otro grupo, si se consigue formar otro grupo
diferente, el problema en cuestin es una permutacin, si por el contrario no se logra
formar otro grupo, el problema es una combinacin. Cuando en el grupo entran todos
los elementos y los grupos difieran en el orden de colocacin, es una permutacin, de
no ser as son combinaciones.
2.- Cuando una persona forma un grupo y otra persona que no haya visto la formacin
del mismo es capaz de decir en qu orden se colocaron los elementos, entonces se
afirma que el grupo formado es una permutacin, si por el contrario no se puede decir
el orden de colocacin de los elementos que conforman el grupo, entonces, el mismo
es una combinacin.
Clculo de probabilidades usando las tcnicas de conteo
Al resolver un problema de probabilidad debemos examinar detenidamente el
experimento para determinar se es posible aplicar un o ms de las tcnicas de conteo
que hemos visto.
Ejemplo: se contrata un servicio de calificaciones de computadoras para encontrar las
3 mejores marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio.
a-) De cuntas formas distintas puede el servicio de calificaciones llegar al
ordenamiento final?
b-) Si el servicio de calificaciones no puede distinguir diferencias entre las marcas y por
lo tanto obtiene el ordenamiento al azar. Cul es la probabilidad de que la marca de la
compaa Z quede en primer lugar. Y de que quede entre los 3 primeros lugares?
Solucin:
a-) como nos interesa el orden de calificacin es una permutacin, esto es
10

P3

10!
10 * 9 * 8 * 7!

720
10 3!
7!

b-) para el clculo de la probabilidad usaremos los 5 pasos mostrado anteriormente.


1-) El experimento consiste en seleccionar y ordenar 3 marcas de monitores EGA de
entre 10 marcas.
2-) Hay demasiados eventos simples como para enumerarlos todos. Sin embargo
sabemos por el inciso a-) que hay 720 resultados distintos (es decir 720 eventos
simples) de este experimento.
3-) Si suponemos que el servicio de calificaciones determina el ordenamiento al azar,
cada uno de los 720 eventos tendr la misma probabilidad de ocurrir, por lo tanto
P(cada evento simple) = 1/720
4-) Un evento de inters para la compaa Z es que su marca quede en primer lugar.
Llamemos a este evento el evento A

56
Si la marca de la compaa Z queda en primer lugar solo hay una solo posibilidad de
que esto ocurra. Por lo tanto hay 9 puestos disponibles para ocupar el segundo y el
tercer lugar, entonces:
1*9 P2 1 *

9!

9 2!

72

Por lo tanto el evento A puede ocurrir de 72 formas.

Definamos ahora el evento B como el evento de que la marca de la compaa Z quede


en uno de los 3 primeros lugares. Ahora calcularemos los posibles n eventos para los 3
primeros lugares. Ya calculamos la probabilidad para el primer lugar, haciendo lo mismo
para el segundo y el tercer lugar nos daremos cuenta que hay 3*(72) formas de
ocurrencia del evento B. por tanto ahora calculando las probabilidades tenemos que:
P A

72
1

720 10

P B

216 3

720 10

Ejercicios de Probabilidad
Resuelva los siguientes ejercicios, analizndolos cuidadosamente.
1.-

La probabilidad de que una persona, que desea viajar a cierto lugar de Centro
Amrica, seleccione la lnea area NICA es de 0.3; la lnea area TACA es de
0.45 y la lnea area LACSA es de 0.25. Cul es la probabilidad de que un
cliente de un da determinado seleccione la lnea area LACSA o NICA?

2.-

En Nueva Guinea disponemos de un camin de bomberos y una ambulancia de


la Cruz Roja para atender las emergencias. La probabilidad de que el camin de
los bomberos est disponible es de 0.84 y la que la ambulancia est disponible
es 0.9, en el caso de que haya un herido en un incendio Cul es la probabilidad
de que los dos vehculos estn disponibles?

3.-

En una farmacia se obtiene una muestra de tres frascos de medicina de forma


aleatoria entre un lote recin recibido, para revisar si tiene la cantidad
especificada en los documentos de remisin. La forma de clasificar los elementos
es en completo e incompleto. Escriba los elementos del espacio muestral.

4.-

Si en una lista se tienen los nombres de 6 varones y 10 mujeres quienes son


candidatos y candidatas para asistir a una conferencia cientfica, Cul es la
probabilidad de que se seleccionen dos mujeres?
Una caja con 9 guantes de Bisbol contiene dos para jugadores zurdos y siete
para derechos.
a) Si se seleccionan al azar dos guantes de la caja sin reposicin, Cul es la
probabilidad?
- Qu ambos guantes sean para jugadores derechos.
- Se escogiera un guante para jugador derecho y otro para jugador zurdo.

5.-

b) Si se seleccionan tres guantes Cul es la probabilidad de que los tres sean para
jugadores zurdos?
c) Si se est realizando el muestreo con reposicin, Cul sera la respuesta a y b?

57

6.-

Los exmenes parciales del grupo de segundo ao de la carrera de


Administracin de Empresas. Demostraron que el 12% de los estudiantes
reprobaron Clculo; el 10% Contabilidad y el 2% ambas asignaturas.
Son independientes los eventos?

7.-

De 400 estudiantes que ingresan a primer ao en la Educacin Secundaria,


segn el Ministerio de Educacin, 100 se retiran en primer ao, 70 en segundo
ao, 50 en tercer ao y 25 en cuarto ao, si selecciona un estudiante al azar
cuando ingresa al primer ao. Cul es la probabilidad de que este se grade de
Bachiller?

Momentos
Sean X1, X2, X3, ..........Xn, los valores que toma la variable Xi; se define entonces,
momento mi de orden r con respecto al promedio aritmtico ( X ) de los valores de la
variable Xi elevados a la potencia r; siendo r cualquier valor comprendido entre,1 , 2,
3,....,n. Matemticamente:
mi

(X

X )r

Si r = 1 entonces
Si r = 2 entonces

m1
m2

(X X )

( Xn X )

0
S2

o sea es igual a la varianza

Medidas de Asimetra y Kurtosis


Simetra: En estadstica se dice que una distribucin de datos es simtrica si se le
puede doblar a lo largo de un eje vertical de una manera tal que coincidan los dos lados
de la distribucin. Las distribuciones que no tienen simetra con respecto al eje vertical
se les llama sesgada o asimtrica. Una distribucin sesgada a la derecha tiene una cola
prolongada del lado derecho de la distribucin y una cola ms corta del lado izquierdo
de la misma; esta asimetra se le denomina positiva, cuando la cola de la distribucin
del lado izquierdo es ms larga que la del lado derecho, entonces la asimetra es
negativa.
En una distribucin simtrica la media, la mediana y la moda son iguales. La simetra se
mide por medio del coeficiente de asimetra. Una distribucin simtrica tiene un
coeficiente de asimetra igual a cero. Cuando una distribucin de frecuencia es
asimtrica, la media, la mediana y la moda se alejan una de otra, es decir, las tres
medidas de posicin son diferente; mientras ms se separe la media de la moda, mayor
es la asimetra. Si la distribucin de frecuencia es asimtricamente negativa, la cola de
la curva de distribucin se encuentra hacia los valores ms pequeos de la escala de
las X y si la distribucin es asimtricamente positiva la cola de la distribucin se ubica
hacia los valores ms grandes de la escala de las X.

58
Karl Pearson un estudioso de la estadstica design el coeficiente de asimetra con las
letras SK y determin la frmula para su clculo, al cual se le denomin primer
coeficiente de asimetra de Pearson
Si SK = 0, entonces la distribucin es simtrica.
SK

3( X Md )
S

Si SK > 0, entonces la distribucin es asimtrica a la derecha.


Si SK < 0, entonces la distribucin es asimtrica a la izquierda.
Kurtosis: Es el grado de apuntamiento o altura de la curva de una distribucin de
frecuencia. La finalidad de la Kurtosis es determinar si la distribucin de los trminos de
una serie de valores responde a una curva normal o no. Por medio de la Kurtosis se
determinar si la distribucin de frecuencia es demasiado puntiaguda, normal o muy
achatada.
El grado de apuntamiento o altura de una curva de distribucin se determina por medio
del coeficiente de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie
de valores con respecto a su media aritmtica. La Kurtosis se designa con la letra K 4 y
la frmula de clculo es:

m4
S4
En esta frmula m4 es el momento cuatro con respecto a la media aritmtica y S 4 es la
desviacin tpica elevada a la cuarta potencia, K 4 es el coeficiente de Kurtosis. Tomando
en cuenta la Kurtosis el k4 de una curva de distribucin puede ser: Mesocurtica,
Platicurtica y Leptocurtica.
K4

Mesocurticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy


alta ni muy achatada, es la llamada curva normal. La curva Mesocurtica tiene un
coeficiente de Kurtosis igual a tres, es decir, K4 = 3.
Leptocurtica.- Es aquella curva de la distribucin que presenta un apuntamiento o
altura relativamente ms alta que la curva Mesocurtica, en esta los datos se encuentran
ms concentrados alrededor del mximo valor. El coeficiente de Kurtosis para curva
Leptocurtica es mayor de tres, es decir, K4 3.
Platicurtica.- Es la curva de una distribucin de frecuencia que presenta un
achatamiento ms pronunciado que la Mesocurtica, encontrndose los datos ms
dispersos alrededor del mximo valor de la distribucin. En esta curva el coeficiente de
Kurtosis es menor de tres, es decir, K4 3.

59
En la grfica 1 de Kurtosis se pueden observar los tres tipos de Kurtosis antes
descritos, siendo la primera curva Platicurtica (la ms baja), la segunda Mesocurtica (la
de en medio) y la ltima es Leptocurtica (la ms alta):

KURTOSIS

1 PLATIKURTICA
2 MESOKURTICA
3 LEPTOKURTICA

Ejemplo:
Para los siguientes datos calcule la simetra y la Kurtosis: 3, 2, 0, 15, 2, 3, 4, 0, 1, 3.
Clculo de la simetra:
La media es X 3.3 , La moda es Mo 3 y la desviacin tpica es S 4.3 , entonces
SK

3( X Md ) 3(3.3 2.5)

0.558
S
4.3

Por lo tanto la el conjunto de datos es asimtrica a la derecha


Clculo de la Kurtosis:
Como ya sabemos el valor de S solo nos falta calcular el valor del cuarto momento y
esto se hace as:
m4

(X

X )4

4
4
4

3 3.3 2 3.3 3 3.3

10

1900.978

Por lo tanto

K4

m4 1900.978

5.56
S4
4.34

Como K4 es mayor que 3 entonces la distribucin es Leptocurtica


UNIDAD No. V
VARIABLES ALEATORIAS DISCRETAS

MODELOS DE PROBABILIDAD

60
Modelo de Bernouilli

Corresponde a experimentos como el lanzamiento de una moneda. Sirve de


modelo para muchas situaciones en las que slo puede haber dos posibles resultados
complementarios (A y no A): uno de ellos con probabilidad p y el otro con probabilidad
(1-p).
Ejemplos:
- Inspeccionar un objeto para ver si es o no es defectuosos.
- Preguntar a una persona si tiene o no tiene trabajo
- Comprobar si una empresa est o no est en quiebra
- Ver si un alumno apruebe o no aprueba un examen

Normalmente se denomina xito (x=1) al suceso con probabilidad p y fracaso (x=0)


al suceso con probabilidad 1-p. Por tanto, diremos que una variable aleatoria x tiene
una distribucin de Bernouilli si:

P { e x ito } P { x 1} p
P { fr a c a s o } P { x 0} 1 p

Si x es una variable aleatoria con distribucin de Bernouilli su media ser:

x i p i 1 p 0 (1 p ) p

i1

y su desviacin tpica:

x i2 p i m

2
x

1 2 p 0 2 (1 p ) p

p p

i1

p (1 p )

Ejemplo:
Sabemos que una mquina produce un 3% de piezas defectuosas.
La variable es x=1 si la pieza no es defectuosa y x=0 si la pieza es defectuosa, es
decir:

P { x 0 } 1 p 0 ,0 3
P { x 1} p 0 ,9 7
La variable x sigue una distribucin de Bernouilli con p=0,97, luego:

61

p 0 ,9 7

p (1 p )

0 , 9 7 0 , 0 3 0 ,1 7 0 6

La distribucin Binomial

Se repite n veces de forma independiente un experimento de Bernouilli con


probabilidad de xito igual a p. La variable aleatoria x que expresa el nmero de
xitos obtenidos en este proceso sigue una distribucin binomial con parmetros n
y p: B(n,p).
Ejemplo:
En un pas en el que est en paro el 25% de la poblacin activa, se realiza una
encuesta sobre distintos temas a 12 personas.
La variable aleatoria x que expresa el n de encuestados que estn en paro sigue una
binomial con parmetros n=12 y p=0,25, es decir, una B(12,0,25).

La distribucin de Bernouilli es B(1,p), un caso particular de la binomial en que el


experimento se realiza una sla vez.

Para conocer la distribucin de una variable binomial x tendremos que especificar la


probabilidad de que tome cualquier valor k entre 0 y n. La Tabla 1 del Apndice B de
Pea y Romo, presenta la probabilidad de k xitos en una B(n,p), para distintos
valores de n y de p.
Ejemplo: (continuacin del B(12,025))
La probabilidad de que al realizar la encuesta se pregunte a 4 personas en paro (es
decir, P(x=4)) se puede encontrar en la Tabla 1 (con n=12, k=4 y p=0,25) y es igual
a 0,1936.

Si x es una variable B(n, p) su media, varianza y desviacin tpica sern:

m x np

2
x

n p (1 p )

n p (1 p )

Para un valor de n, la dispersin es mxima cuando p=0,5.


Ejemplo: (continuacin del B(12,025))

n p 1 2 0 ,2 5 3

n p (1 p )

1 2 0 , 2 5 ( 1 0 , 2 5 ) 1 ,5

62

La forma de la distribucin depende del valor de p: si es menor que 0,5 es


asimtrica a la derecha, si es mayor que 0,5 asimtrica a la izquierda y si es igual a
0,5 es simtrica.

Ejercicio 16.2 (Pea y Romo)


Se sabe que el 40% de los habitantes de una ciudad consumen
caf diariamente:
a) Se pregunta a una persona si toma caf a diario. La variable aleatoria x1 vale 1 si
la respuesta es afirmativa y 0 en caso contrario. Hallar la media y la desviacin
tpica de x1.
La distribucin de x1 es una Bernoulli con p=0,4:
x 1 1 con probabilidad p=0,4
Si toma caf:
Si no toma caf:
Luego:

x1

p 0 ,4

x1

x1 0

p (1 p )

con probabilidad 1-p=0,6

0 ,4 0 ,6 0 ,4 8 9 9

b) Se encuesta a 20 personas sobre su consumo diario de caf. Sea x el n de


personas encuestadas que consume caf a diario. Calcular la probabilidad de
que x sea igual a 12. Hallar la media y desviacin tpica de x. Obtener la
probabilidad de que nadie tome caf a diario y de que lo hagan al menos tres
personas.
La variable aleatoria x sigue una distribucin B(20,0,4) (n=20 y p=0,4).
Mirando en la Tabla 1 para k=12, n=20 y p=0,4 tenemos que:

P ( x 1 2 ) 0 ,0 3 5 5

La media y desviacin tpica de x son:

n p 2 0 0 ,4 8

n p (1 p )

2 0 0 , 4 ( 1 0 , 4 ) 2 ,1 9 0 8

La probabilidad de que ninguna persona tome caf diariamente, es decir,


P ( x 0 ) podemos encontrarla en la Tabla 1 para k=0, n=20 y p=0,4:

P (x 0) 0

La probabilidad de que al menos tres personas tomen caf a diario ser:

P (x 3) 1 P (x 3) 1 P (x 0) P (x 1) P (x 2 )

63
Mirando en la Tabla 1 los valores para k=0, k=1 y k=2 (para n=20 y p=0,4)
tenemos:

P ( x 3 ) 1 ( 0 0 ,0 0 0 5 0 ,0 0 3 1 ) 0 ,9 9 6 4

Ejercicio 16.3 (Pea y Romo)


Un partido poltico consigue el 20% de los votos en unas elecciones. Se realiza una
encuesta a 15 personas.
a) Cul es la probabilidad de que no haya entre ellas ningn votante del partido?
Sea x el n de votantes del partido entre los encuestados, que sigue una
distribucin B(15,0,2) (n=15 y p=0,2), entonces nos piden P ( x 0 ) . Si miramos
en la Tabla 1 para k=0, n=15 y p=0,2, tendremos:

P ( x 0 ) 0 ,0 3 5 2

b) Hallar la probabilidad de que no haya ms de 3 votantes de ese partido.

P ( x 3) P (x 0) P (x 1) P (x 2 ) P (x 3)

Si miramos los valores en la Tabla 1 para k=0,1,2 y 3 (para n=15 y p=0,2)


obtenemos:

P ( x 3 ) 0 , 0 3 5 2 0 ,1 3 1 9 0 , 2 3 0 9 0 , 2 5 0 1 0 , 6 4 8 1

c) Obtener la probabilidad de que al menos tres personas voten a dicho partido

P ( x 3) 1 P ( x 3) 1 P (x 0) P (x 1) P (x 2 )
1 ( 0 , 0 3 5 2 0 ,1 3 1 9 0 , 2 3 0 9 ) 0 , 6 0 2

d) Calcular la media y la desviacin tpica del n de votantes entre los 15


encuestados.

x
x

n p 1 5 0 ,2 3
n p ( 1 p ) 1 5 0 , 2 ( 1 0 , 2 ) 1 ,5 4 9

Ejercicio 16.5 (Pea y Romo)


Un examen consta de 15 preguntas cada una de las cuales tiene 4 posibles respuestas.
Una persona sin conocimientos del tema responde las preguntas al azar.
a) Cul es la probabilidad de que acierte la respuesta si contesta slo una
pregunta?

P ( a c e r t a r ) p 1 / 4 0 ,2 5

b) Hallar la probabilidad de que dicha persona no conteste bien a ninguna de las


15 preguntas. Calcular la probabilidad de que acierte alguna.
Sea la variable aleatoria x el n de aciertos en las 15 preguntas que sigue una
distribucin B(15,0,25) (n=15 y p=0,25).
Nos piden la probabilidad de que no acierte ninguna, es decir, P ( x 0 ) que,
mirando en la Tabla 1 para k=0, n=15 y p=0,25, ser:

P ( x 0 ) 0 ,0 1 3 4

La probabilidad de que acierte alguna ser:

P ( x 1 ) 1 P ( x 1 ) 1 P ( x 0 ) 1 0 ,0 1 3 4 0 ,9 8 6 6

c) Obtener la probabilidad de que responda bien a todas las preguntas.


Mirando en la Tabla 1 para k=15, n=15 y p=0,25, tendremos que:

P (x 15) 0

64
d) Cul es la probabilidad de que conteste acertadamente a ms de la mitad de
las cuestiones?
Mirando en la Tabla 1 para k=8,9,..,15, (para n=15 y p=0,25), tendremos que:

P ( x 8 ) P ( x 8 ) P ( x 9 ) . . . P ( x 1 5 )
0 ,0 1 3 1 0 ,0 0 3 4 0 ,0 0 0 7 0 ,0 0 0 1 0 ,0 1 7 3

e) Cul es la probabilidad de que el n de preguntas acertado sea distinto de tres?

P (x 3) 1 P (x 3)
Mirando en la Tabla 1 para k=3 (para n=15 y p=0,25), tendremos que:

P ( x 3 ) 1 0 ,2 2 5 2 0 ,7 7 4 8

Ejercicio 16.9 (Pea y Romo)


El 25% de las personas con tarjeta de crdito liquidan sus pagos cada mes. Se
pregunta a 15 personas con tarjeta.
a) Hallar el n esperado entre ellos que liquidan sus deudas cada mes. Cul es la
desviacin tpica de esta variable?
Sea x el n de personas (de entre los 15) que liquidan sus deudas cada mes que
se distribuye como una B(15,0,25) (n=15 y p=0,25). Por tanto:

x
x

n p 1 5 0 ,2 5 3 ,7 5 4
n p (1 p ) 1 5 0 ,2 5 (1 0 ,2 5 ) 1 ,6 7 7

b) Obtener la probabilidad de que ninguno pague todas sus deudas mensualmente.


Nos piden P ( x 0 ) que, mirando en la Tabla 1 para k=0, n=15 y p=0,25, ser:

P ( x 0 ) 0 ,0 1 3 4

c) Calcular la probabilidad de que el n de personas encuestadas que liquida


mensualmente las deudas supere en ms de una desviacin tpica al valor
esperado.

m x x 3 ,7 5 1 ,6 7 7 5 ,4 2 7
P ( x 6 ) P ( x 6 ) P ( x 7 ) . . . P ( x 1 5 )
0 ,0 9 1 7 0 ,0 3 9 3 0 ,0 1 3 1 0 ,0 0 3 4 0 ,0 0 0 7 0 ,0 0 0 1
0 ,1 4 8 3
La distribucin geomtrica

Supongamos que un experimento Bernouilli se repite hasta que aparece el primer


xito. Se llama distribucin geomtrica a la de una variable x que expresa el
instante en que ocurre el primer xito. Por ejemplo, el n de personas a las que
hay que entrevistar hasta encontrar una que est en paro.

Esta distribucin depende slo de la probabilidad p de obtener xito en cada


ensayo y se representa como G(p). La probabilidad de que el primer xito surja en
el instante k es:

P ( x k ) p ( 1 p ) k 1

k 1 ,2 , . . .

65
Ejemplo:
Si la probabilidad de que una persona est en paro es p=0,25, la probabilidad de
que haya que realizar 6 entrevistas hasta encontrar una persona en paro es:

P ( x 6 ) 0 ,2 5 ( 1 0 ,2 5 ) 6 1 0 ,0 5

Si x es una variable G(p) su media y desviacin tpica sern:

1
p

1 p
p2

Ejemplo: (continuacin)
El nmero medio de entrevistas que habr que realizar para encontrar una persona
en paro ser:

1
1

4
p 0 ,2 5

y la desviacin tpica es:

1 p

p2

1 0 ,2 5
3 ,4 6
0 ,2 5 2

Ejercicio 16.4 (Pea y Romo)


En base al Ejercicio 16.3 (un partido poltico obtiene el 20% de los votos), se pide:
a) Obtener la probabilidad de que el primer votante del partido al que se pregunta
sea la tercera persona entrevistada.
Sea x la variable aleatoria que representa el nmero de entrevistas que habr que
realizar hasta encontrar al primer votante del partido que sigue una distribucin
G(0,20). Entonces:

P ( x 3 ) p ( 1 p ) k 1 0 , 2 ( 1 0 , 2 ) 3 1 0 ,1 2 8
b) Cul es el nmero medio de personas que hay que entrevistar hasta llegar al
primer votante del partido?

m
c)

1
1

5
p 0 ,2

personas

Hallar la probabilidad de que sean necesarias ms de 6 entrevistas para llegar


al primer votante del partido.

P ( x 6 ) 1 P ( x 6 ) 1 [ P ( x 1 ) P ( x 2 ) . . . P ( x 6 ) ]
1 [ 0 , 2 0 ,8 0 0 , 2 0 ,8 1 . . . 0 , 2 0 ,8 5 ] 0 , 2 6 2 1

Ejercicio 16.6 (Pea y Romo)


En base al Ejercicio 16.5 (un examen en el que cada pregunta tiene 4 posibles
respuestas), y suponiendo que el examinado contesta tantas preguntas como sea
necesario, se pide:
a) Calcular la probabilidad de que la primera pregunta acertada sea la quinta.
Sea x la variable aleatoria que representa el nmero de preguntas que habr que
contestar hasta acertar la primera respuesta que sigue una distribucin G(0,25).
Entonces:

66

P ( x 5 ) p ( 1 p ) k 1 0 ,2 5 ( 1 0 ,2 5 ) 5 1 0 ,0 7 9 1
b)

Cul es el nmero esperado de preguntas que debe responder hasta contestar


una correctamente?

1
1

4
p 0 ,2 5

preguntas

La distribucin de Poisson
Una variable aleatoria x con distribucin de Poisson expresa el n de sucesos raros
que ocurren en una proporcin fija de espacio o de tiempo. Por ejemplo, el n de
accidentes en un da, el n de llamadas a un telfono en una hora, n de erratas por
pgina en un libro

La intensidad con que aparecen dichos sucesos se representa mediante el


parmetro positivo .

La probabilidad de que x tome el valor k en una distribucin de Poisson con


parmetro de intensidad puede verse en la Tabla 2 del Apndice B (de Pea y
Romo).

Ejemplo 16.3 de Pea y Romo:


La variable aleatoria x, con distribucin de Poisson con parmetro =0,8, representa el
nmero de accidentes diarios en una ciudad. La probabilidad de que hoy ocurran
exactamente 3 accidentes ser (ver Tabla 2 con k=3 y =0,8):

P ( x 3 ) 0 ,0 3 8 3

Si x es una variable con distribucin Poisson su media y varianza sern:

2
x

y su desviacin tpica

Ejemplo 16.4 de Pea y Romo:


El nmero medio de errores que comete una persona al mecanografiar una pgina es 2.
Si suponemos que la distribucin de x (errores al mecanografiar una pgina) es de
Poisson entonces, la probabilidad de que en una pgina no haya ningn error ser (ver
Tabla 2 con k=0 y =2):

P ( x 0 ) 0 ,1 3 5 3
Ejercicio 16.7 (Pea y Romo)
El nmero de clientes x que llegan a la caja de un supermercado en un cuarto de hora
sigue una distribucin de Poisson con media 5.
a) Hallar la probabilidad de que lleguen al menos 4 personas en un cuarto de
hora.

67

La variable x sigue una distribucin de Poisson con


(mirar las probabilidades en la Tabla 2 para

. Se pide

y k=0,1,2 y 3):

P ( x 4 ) 1 P ( x 4 ) 1 [ P ( x 0 ) P ( x 1) P ( x 2 ) P ( x 3)]
1 ( 0 , 0 0 6 7 0 , 0 3 3 7 0 , 0 8 4 2 0 ,1 0 4 ) 0 , 7 3 5
b) Obtener la probabilidad de que no llegue nadie a la caja en un cuarto de
hora.

P ( x 0 ) 0 ,0 0 6 7

c) Cul es la probabilidad de que lleguen entre 2 y 4 clientes a la caja en un


cuarto de hora?

P (2 x 4 ) P (x 2 ) P (x 3) P (x 4 )
0 , 0 8 4 2 0 ,1 4 0 4 0 ,1 7 5 5 0 , 4 0 0 1

VARIABLES ALEATORIAS CONTINUAS


La distribucin normal o gaussiana
Se utiliza como modelo para variables como el peso, la altura, la calificacin en un
examen, es decir, en variables cuya distribucin es simtrica con respecto a un
valor central (alrededor del cual toma valores con gran probabilidad) y apenas
aparecen valores extremos.

Si una variable aleatoria x tiene distribucin normal suele representarse como


N(m,) donde m=mx es la media o valor esperado de la variable y = x es la
desviacin tpica de la variable, que son los dos parmetros que caracterizan la
distribucin normal.
Ver en Figuras 18.2 y 18.3 la densidad de una variable normal.

En la distribucin normal, la mayora de la probabilidad se concentra en la zona


central.
Ver Figura 18.5
Ejercicio 18.8 (Pea y Romo)
El peso de los atletas de pruebas de medio fondo sigue una distribucin normal con
media 64,3 kilos y desviacin tpica 2,3 kilos. Hallar un intervalo centrado alrededor
de la media que contenga:
a) El 68,3% de la poblacin.
En la distribucin normal se concentra el 68,3% de la probabilidad en el intervalo de
valores

comprendido

6 4 ,3

x 2 ,3

entre
ser:

m x

m x

En

este

caso

como

68

m x

6 4 ,3 2 ,3 6 6 ,6

m x

6 4 ,3 2 ,3 6 2

b) El 95,5% de la poblacin.
En la distribucin normal se concentra el 95,5% de la probabilidad en el intervalo de
valores comprendido entre

m x 2
m x 2

m x 2

m x 2

. Luego ser:

6 4 ,3 2 2 ,3 6 8 ,9
6 4 ,3 2 2 ,3 5 9 ,7

x
x

c) El 99,7% de la poblacin
En la distribucin normal se concentra el 99,7% de la probabilidad en el intervalo de
valores comprendido entre

m x 3
m x 3

m x 3

m x 3

. Luego ser:

6 4 ,3 3 2 ,3 7 1 ,2
6 4 ,3 3 2 ,3 5 7 ,4

x
x

Las transformaciones lineales de una variable que sigue una distribucin normal,
tambin tendrn una distribucin normal. Es decir:
x es N ( m

, x )

entonces y=ax+b ser N ( a

m x b,a x)

Ejemplo:
La variable x que expresa el tiempo en horas que tarda un empleado en hacer una
tarea sigue una distribucin normal con

1 ,5

x 0 ,1

Cmo ser la distribucin de la variable y que expresa lo mismo pero en minutos?


y 6 0 x luego seguir una distribucin normal con:

60m

6 0 1 ,5 9 0

y 6 0 x 6 0 0 ,1 6

Si tipificamos una variable x con una distribucin N ( m

x m
x

, x )

la nueva variable

tiene una distribucin N(0,1) o normal estndar.

La Tabla 3 del Apndice B (Pea y Romo) nos proporciona la probabilidad de que


una variable z con una distribucin N(0,1) tome un valor menor que una cierta cantidad,
es decir P ( z b ) . A partir de ellas tambin podremos obtener:

P (z a ) 1 P (z a )
P (a z b ) P (z b ) P (z a )

Ver Figura 18.7

69

Ejemplo: Sea z una variable normal estndar


- P ( z 1 , 3 5 ) 0 , 9 1 1 5 (mirar en la fila de 1,3 y en la columna de 0,05)
- P ( z 0 , 8 6 ) 1 P ( z 0 , 8 6 ) 1 0 , 8 0 5 1 0 ,1 9 4 9
(mirar en la fila de 0,8 y columna de 0,06)
- P ( 0 , 3 z 0 ,8 3 ) P ( z 0 ,8 3 ) P ( z 0 , 3 )

0 ,7 9 6 7 0 ,3 8 2 1 0 ,4 1 0 5

(mirar en la fila de 0,8 y columna de 0,03 y en la fila de 0,3 y columna de 0,00)


Ejercicio 18.2 (Pea y Romo)
Si z es una variable normal estndar hallar:
a) P ( z 2 , 2 3 ) 0 , 9 8 7 1
b) P ( z 3 , 4 8 ) 0 , 9 9 9 7
c) P ( z 1 , 7 6 ) 0 , 0 3 9 2
d) P ( z 2 , 4 5 ) 1 P ( z 2 , 4 5 ) 1 0 , 9 9 2 9 0 , 0 0 7 1
e) P ( z 3 , 2 3 ) 1 P ( z 3 , 2 3 ) 1 0 , 9 9 9 4 0 , 0 0 0 6
f) P ( z 3 , 0 7 ) 1 P ( z 3 , 0 7 ) 1 0 , 0 0 1 1 0 , 9 9 8
g) P ( 1 , 1 3 z 2 , 6 9 ) P ( z 2 , 6 9 ) P ( z 1 , 1 3 )

0 , 9 9 6 4 0 , 8 7 0 8 0 ,1 2 5 6
h) P ( 0 , 8 6 z 1 , 2 8 ) P ( z 1 , 2 8 ) P ( z 0 , 8 6 )
0 , 8 9 9 7 0 ,1 9 4 9 0 , 7 0 4 8
i) P ( 2 , 9 8 z 1 , 3 2 ) P ( z 1 , 3 2 ) P ( z 2 , 9 8 )
0 ,0 9 3 4 0 ,0 0 1 4 0 ,0 9 2
Ejercicio 18.6 (Pea y Romo)
Hallar el valor a de la variable z normal estndar tal que:
a) P ( z a ) 0 , 2 0 3 3

a 0 ,8 3
b) P ( z a ) 0 , 7 7 3 4
a 0 ,7 5
c) P ( z a ) 0 , 9 2 2
Sabemos que P ( z a ) 1 P ( z a )
P ( z a ) 1 0 ,9 2 2 0 ,0 7 7 8
a 1 ,4 2
d) P ( z a ) 0 , 0 3 1 4
Sabemos que P ( z a ) 1 P ( z a )
P ( z a ) 1 0 ,0 3 1 4 0 ,9 6 8 6
a 1 ,8 6

luego:

luego:

Como al tipificar cualquier variable x con una distribucin N (

m x , x )

, obtenemos

una variable z con una distribucin normal estndar, podremos calcular probabilidades
para cualquier variable normal usando la Tabla 3.

70
Si x tiene una distribucin N ( m

, x )

, podremos calcular

P (x b)

de la siguiente

manera:

x m
x

P (x b) P

b m x
b m x
P z

x
x

y calcular esta probabilidad con la Tabla 3.


Ejemplo:
Si x tiene una distribucin N ( 3 , 2 , 1 , 2 2 ) , entonces:

x 3 ,2 3 ,4 5 3 ,2

P z 0 ,2 0 0 ,5 7 9 3
1 ,2 2
1 ,2 2
El valor de P z 0 , 2 0 se busca en la Tabla 3
2 ,9 2 3 ,2 x 3 ,2 3 ,4 3 3 ,2

- P ( 2 ,9 2 x 3 ,4 3 ) P

1 ,2 2
1 ,2 2
1 ,2 2
P 0 , 2 2 z 0 ,1 9
P ( z 0 ,1 9 ) P ( z 0 , 2 2 )
0 , 5 7 5 3 0 , 4 1 2 9 0 ,1 6 2 4
Si x tiene una distribucin N ( m x , x ) e y una distribucin N ( m y , y )
-P

( x 3 ,4 5 ) P

independientes, entonces x+y tendr una distribucin N ( m


Ejercicio 18.4 (Pea y Romo)
Si x es una variable N ( 8 , 4 7 ; 1 , 1
a) P ( x 9 , 1 2 )

5)

m y , x2 y2 )

, hallar:

x 8 , 4 7 9 ,1 2 8 , 4 7

P z 0 ,5 6 0 , 7 1 2 3
1 ,1 5

1 ,1 5

P ( x 9 ,1 2 ) P
b)

P ( x 1 2 ,3 4 )

x 8 ,4 7 1 2 ,3 4 8 ,4 7

P z 3 ,3 6 0 ,9 9 9 6
1 ,1 5

1 ,1 5

P ( x 1 2 ,3 4 ) P
c)

P ( x 6 ,4 2 )

6 ,4 2 8 ,4 7

P ( x 6 ,4 2 ) P z

1 ,1 5
d) P ( x 1 0 , 5 3 )
1 0 ,5 3 8 ,4 7

P ( x 1 0 ,5 3 ) P z

1 ,1 5
e)

P z 1 ,7 8 0 ,0 3 7 5

P z 1 ,7 9

1 P ( z 1 ,7 9 ) 1 0 ,9 6 3 3 0 ,0 3 6 7
P ( x 1 2 ,6 2 )

y son

71

1 2 ,6 2 8 ,4 7

P ( x 1 2 ,6 2 ) P z

1 ,1 5
1 P ( z 3 ,6 1 ) 1
f)

P ( x 4 ,0 1 )

P z 3 ,6 1

1 0

4 ,0 1 8 ,4 7

P ( x 4 ,0 1 ) P z
P z 3 ,8 8

1 ,1 5
1 P ( z 3 ,8 8 ) 1 0 1
g)

P ( 6 ,1 2 x 1 1 , 9 2 )

1 1 ,9 2 8 ,4 7
6 ,1 2 8 , 4 7
z

1 ,1 5
1 ,1 5
P 2 ,0 4 z 3
P ( z 3 ) P ( z 2 ,0 4 )
0 ,9 9 8 7 0 ,0 2 0 7 0 ,9 7 8

P ( 6 ,1 2 x 1 1 , 9 2 ) P

h)

P ( 7 ,5 2 x 1 0 , 3 2 )

1 0 ,3 2 8 ,4 7
7 ,5 2 8 , 4 7
z

1 ,1 5
1 ,1 5
P 0 ,8 3 z 1 ,6 1
P ( z 1 , 6 1 ) P ( z 0 ,8 3 )
0 ,9 4 6 3 0 ,2 0 3 3 0 ,7 4 3

P ( 7 ,5 2 x 1 0 ,3 2 ) P

i)

P ( 5 ,0 6 x 6 ,8 4 )

6 ,8 4 8 , 4 7
5 ,0 6 8 ,4 7
z

1 ,1 5
1 ,1 5
P 2 ,9 6 z 1 ,4 2
P ( z 1 ,4 2 ) P ( z 2 ,9 6 )
0 ,0 7 7 8 0 ,0 0 1 5 0 ,0 7 6 3

P ( 5 , 0 6 x 6 ,8 4 ) P

Ejercicio 18.7 (Pea y Romo)


Si x es una variable con distribucin N(4,3;1,2) hallar el valor de a tal que:
c) P ( x a ) 0 , 7 3 8 9

a 4 ,3
x 4 ,3 a 4 ,3

P z
0 ,7 3 8 9
1 ,2

1 ,2
1 ,2

P (x a) P
luego:

72

a 4 ,3
0 ,6 4 a 0 ,6 4 1 ,2 4 ,3 5 ,0 6 8
1 ,2
d) P ( x a ) 0 , 6 1 7 9
a 4 ,3
x 4 ,3 a 4 ,3

P (x a) P

P z
0 ,6 1 7 9
1 ,2

1 ,2
1 ,2
luego:

a 4 ,3
0 ,3 a 0 ,3 1 ,2 4 ,3 4 ,6 6
1 ,2
a) P ( x a ) 0 , 2 9 8 1
a 4 ,3
a 4 ,3

P (x a) P z
1 P z
0 ,2 9 8 1

1 ,2
1 ,2
luego:

a 4 ,3

P z
1 0 ,2 9 8 1 0 ,7 0 1 9

1 ,2
a 4 ,3
0 ,5 3 a 0 ,5 3 1 , 2 4 , 3 4 , 9 3 6
1 ,2
b) P ( x a ) 0 , 5 8 7 1
a 4 ,3
a 4 ,3

P (x a) P z
1 P z
0 ,5 8 7 1

1 ,2
1 ,2
luego:

a 4 ,3

P z
1 0 ,5 8 7 1 0 , 4 1 2 9

1 ,2
a 4 ,3
0 ,2 2 a 0 ,2 2 1 ,2 4 ,3 4 ,0 3 6
1 ,2

Ejercicio 18.3 (Pea y Romo)


La variable x que expresa la altura en metros de los jugadores de baloncesto tiene una
distribucin normal con media mx=1,89 y desviacin tpica x=0,07. Si la variable y es la
altura en centmetros:
a) Escribir la relacin entre x e y.

y 100x

b) Obtener la distribucin de y.
Como y es una transformacin lineal de una variable con distribucin normal tendr
una distribucin N( m y , y ) con:

m y 1 0 0 m x 1 0 0 1 ,8 9 1 8 9
y 1 0 0 x 1 0 0 0 ,0 7 7

c) Hallar la probabilidad de que un jugador de baloncesto elegido al azar mida ms


de 180 centmetros.

73

180 189

P (y 180) P z
1 P z 1 , 2 8 1 0 ,1 0 0 3 0 , 8 9 9 7

7
Aproximacin mediante la normal
Si x tiene una distribucin B ( n

,p)

entonces la variable tipificada

x np
n p (1 p )

tiene una distribucin prxima a la normal estndar. La aproximacin ser buena


si n>30 y tanto np como n(1-p) son mayores o iguales que 5.

Podremos entonces calcular probabilidades de x aproximndolas mediante la


normal estndar (usando los valores de la Tabla 3).

Si x es una variable discreta (la binomial) e y una variable continua (la normal) si
queremos aproximar probabilidades de x mediante y funcionar mejor si
hacemos la correccin por continuidad:
P ( a x b ) P ( a 0 ,5 y b 0 ,5 )

P (x b)
P (x a)

( y b 0 ,5 )
P ( y a 0 ,5 )

Ejemplo:
El 35% de los habitantes de una ciudad votan a un partido. Se hace una encuesta a 200
personas. La variable x que representa el n de personas encuestadas que vota al
partido sigue una distribucin B(n=200;p=0,35).
Por tanto:

m x n p 2 0 0 0 ,3 5 7 0
x n p (1 p ) 2 0 0 0 ,3 5 (1 0 ,3 5 ) 6 ,7 4

Queremos saber la probabilidad de que haya entre 82 y 106 votantes del partido:
P ( 8 2 x 1 0 6 ) . Podemos aproximarla por la normal estndar (n=200>30;
np=70>5 y n(1-p)=130>5) para lo que haremos la correccin por continuidad y
tipificaremos la variable:

1 0 6 0 ,5 7 0
8 2 0 ,5 7 0
z

6 ,7 4
6 ,7 4
P (1 ,7 0 z 5 ,4 1 ) P ( z 5 ,4 1 ) P ( z 1 ,7 0 )
1 0 ,9 5 5 4 0 ,0 4 4 6

P (8 2 x 1 0 6 ) P

Ejercicio 18.9 (Pea y Romo)


El 40% de los relojes que se venden en una tienda son digitales y el resto analgicos.
Se consideran las ventas de los 100 prximos relojes.
a) Hallar el n esperado de relojes digitales que se vendern entre los 100. Cul
es la desviacin tpica?
La variable aleatoria x representa el n de relojes digitales vendidos entre los 100
prximos. Sigue una distribucin B(100,0,4).

74

m n p 1 0 0 0 ,4 4 0
n p (1 p ) 1 0 0 0 ,4 (1 0 ,4 ) 4 ,9
x

b) Obtener la probabilidad de que se vendan entre 30 y 50 digitales.

5 0 0 ,5 4 0
3 0 0 ,5 4 0
z

4 ,9
4 ,9
P ( 2 ,1 4 z 1 , 9 4 ) P ( z 1 , 9 4 ) P ( z 2 ,1 4 )

P (30 x 5 0) P

0 ,9 7 3 8 0 ,0 1 6 0 ,9 5 7 8
c) Calcular la probabilidad de que se vendan al menos 15 relojes digitales.

1 5 0 ,5 4 0

P (x 15) P z
P ( z 5 ,2 0 )

4 ,9
1 P ( z 5 ,2 0 ) 1 0 1
d) Hallar la probabilidad de que no se vendan ms de 60 relojes digitales.

6 0 0 ,5 4 0

P (x 60) P z
P ( z 4 ,1 8 ) 1

4 ,9

Ejercicio 18.10 (Pea y Romo)


Una empresa tiene 2000 trabajadoras de las que el 60% son mujeres. Se encuesta a
200 personas de la empresa tomadas al azar.
a) Hallar la probabilidad aproximada de que al menos 40 de los encuestados sean
mujeres.
La variable aleatoria x representa el n de mujeres entre los 200 entrevistados.
Sigue una distribucin B(200;0,6).

m n p 2 0 0 0 ,6 1 2 0
n p (1 p ) 2 0 0 0 ,6 (1 0 ,6 ) 6 ,9
x

4 0 0 ,5 1 2 0

P (x 40) P z
P ( z 1 1 ,6 7 )

6 ,9
1 P ( z 1 1 ,6 7 ) 1 0 1
b) Obtener la probabilidad de que el n de encuestadas est entre 80 y 150.

1 5 0 0 ,5 1 2 0
8 0 0 ,5 1 2 0
z

6 ,9
6 ,9
P ( 5 ,8 7 z 4 , 4 2 ) P ( z 4 , 4 2 ) P ( z 5 ,8 7 )

P (8 0 x 1 5 0 ) P

1 0 1
c) Calcular la probabilidad de que no se pregunte a ms de 150 mujeres.

75

1 5 0 0 ,5 1 2 0

P (x 150) P z
P ( z 4 ,4 2 ) 1

6 ,9

Unidad IV. DISTRIBUCIONES MUESTRALES


1. Introduccin
A las distribuciones de los estadsticas muestrales se les llama
distribuciones muestrales.

76

ESTADSTICA INFERENCIAL: La estadstica inferencial involucra el uso de un


estadstico para sacar una conclusin o inferencia sobre el parmetro
correspondiente de la poblacin
Por ejemplo se usa:

X media de muestra para estimar la media poblacional

s desv. Est. De muestra para estimar la desv. Est. poblacional


p proporcin en la muestra para estimar la proporcin poblacional
ERROR DE MUESTREO: es la diferencia entre el parmetro poblacional y el
estadstico de la muestra utilizado para estimar el parmetro.
Por ejemplo la diferencia entre:

X y

s y

p y

Poblacin

Con N
elementos

DISTRIBUCIN MUESTRAL: es un conjunto de todos los valores posibles para


un estadstico y la probabilidad relacionada con cada valor.
Media muestral Xi P (cada. Xi )
Xmedia 1
Desv.est.
1

Xmedia K
Desv.est.
K

150

1/6

200

1/6

250

2/6

300

1/6

350

1/6

Tomando K=6 muestras de

1.0

tamao n cada una

77
MEDIA DE LAS MEDIAS MUESTRALES o GRAN MEDIA o MEDIA DE MEDIAS:

Xi

K
150 200 250 250 300 350
X
250
6

VARIANZA DE LA DISTRIBUCIN MUSTRAL DE LAS MEDIAS MUESTRALES

X2

(X X )
K

(X )

Del ejemplo anterior:

X2

(150 250) 2 (200 250) 2 ... (350 250) 2


4.167
6

ERROR ESTNDAR DE LA DISTRIBUCIN MUESTRAL DE LAS MEDIAS


MUESTRALES

X X2

En el caso anterior vale 64.55

Si el muestreo se realiza sin reemplazo y si el tamao de muestra es ms del


5% de la poblacin (n > 0.05N) debe aplicarse el factor de correccin para
poblaciones finitas (FPC) al error estndar.

78
X

N n
N 1

2. TEOREMA DEL LMITE CENTRAL


La distribucin de las medias de las muestras tiende a la normalidad
independientemente de la forma de la distribucin poblacional de la que sean
obtenidas. Es la base de las cartas de control X-R.
F(X)
Distribucin de las medias muestrales
Distribucin de valores individuales

Distribucin muestral de la media


X 1 , X 2 ,..., X n

A medida que n se vuelve ms grande, la distribucin de las medias


muestrales se aproximar a una distribucin normal con una media
X X / n

Si

es una muestra aleatoria de una Poblacion (X) con

distribucin normal n( , 2 )

.EntoncesX
se
2
distribuye normalmente con media , y varianza / n
Por ejemplo, para los siguientes datos de la poblacin:
DATOS DE LA POBLACIN PARA MOSTRAR EL TEOREMA DEL LMITE
CENTRAL
2
1
5
7

PROMEDIO
7
7
8
1

5
7
1
4

5
9
1
1

2
4
5
4

4.2
5.6
4.0
3.4

79
7
1
7
6
9
8
5
5
5
3
4
9
2
7
3
4
5
8
7
2
3
9
6
5
9
2
9
2
5
4
8
3
5
7
5
9
7
5
8
8
5
7
9
2
4
9
1
7

6
6
3
7
7
3
3
9
5
1
3
1
1
7
4
8
3
1
5
2
1
3
2
2
6
6
2
6
4
2
1
2
8
9
6
6
9
5
4
7
5
7
5
5
5
2
7
7

9
4
1
9
7
4
3
9
3
9
9
7
7
9
5
3
2
5
9
7
4
2
7
6
2
3
2
6
2
9
2
8
9
3
8
4
9
1
7
7
1
2
2
3
8
6
7
2

8
7
7
4
6
4
4
1
9
1
5
7
8
8
6
4
2
5
6
2
1
3
4
8
9
5
3
8
1
4
1
5
6
8
7
8
8
4
8
1
7
9
5
5
4
6
3
8

5
9
3
3
1
7
2
9
5
5
5
8
6
3
8
5
6
9
8
1
7
8
4
6
4
5
6
3
9
2
4
4
2
5
5
7
3
6
7
8
5
8
9
8
2
1
4
7

7.0
5.4
4.2
5.8
6.0
5.2
3.4
6.6
5.4
3.8
5.2
6.4
4.8
6.8
5.2
4.8
3.6
5.6
7.0
2.8
3.2
5.0
4.6
5.4
6.0
4.2
4.4
5.0
4.2
4.2
3.2
4.4
6.0
6.4
6.2
6.8
7.2
4.2
6.8
6.2
4.6
6.6
6.0
4.6
4.6
4.8
4.4
6.2

80
8
2
9
7
1
2
2
2

1
2
4
8
2
4
9
6

1
1
3
4
9
6
3
7

7
4
7
3
3
2
3
8

6
9
3
2
8
8
1
7

4.6
3.6
5.2
4.8
4.6
4.4
3.6
6.0

El histograma de los datos de la poblacin, es el siguiente:

Histogram of Poblacion
40

Frequency

30

20

10

Poblacion

Al hacer una prueba de normalidad de Anderson Darling en los datos se tiene:

81

Probability Plot of Poblacion


Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

5.073
2.584
300
5.965
<0.005

80
70
60
50
40
30
20
10
5
1
0.1

-5

5
Poblacion

10

15

Como el P value es menor a 0.05 los datos no siguen una distribucin normal.
El histograma de los promedios muestrales (subgrupos de 5 datos) se
muestra a continuacin:

Al hacer una prueba de normalidad de Anderson Darling se tiene:

82

Probability Plot of Muestra


Normal
99.9

Mean
StDev
N
AD
P-Value

99

Percent

95
90

5.073
1.118
60
0.527
0.172

80
70
60
50
40
30
20
10
5
1
0.1

5
Muestra

Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias siguen una
distribucin normal.
La sigma de la poblacin estimada con la media de la muestra es:
S pob.
Sn=5

2.5840
1.1181

Raiz(n)
Spob est.
2.2361 2.5001243

Tomando un tamao de subgrupo de n = 10 se tiene:


PROM.
N=10
4.9
3.7
6.2
5.0
5.6
5.0
4.6
5.8
5.8
5.0
4.6
4.9
4.1
5.0
5.1

4.7
4.2
3.8
6.2
6.5
5.7
6.5
5.6
5.3
4.7
5.3
4.1
5.0
4.5
4.8

83

Histogram of PROM. N=10


9
8

Frequency

7
6
5
4
3
2
1
0

3.5

4.0

4.5

5.0
PROM. N=10

5.5

6.0

6.5

Por lo que con un tamao de muestra de n = 5 es suficiente para mostrar


normalidad.
3. APLICACIN DE LAS DISTRIBUCIONES MUESTRALES
Muchas decisiones en los negocios dependen de una muestra completa no
tanto de una observacin, por tanto se trabaja con la distribucin muestral de
las medias o de las proporciones, para el caso de las medias se tiene:

X X

X
/ n

Con este valor se determina P(Z <= z)

Donde n es el tamao de la muestra y si no se conoce sigma, se estima con


el valor de S. Ejemplos pginas 153 156.
Ejemplo:
Una empresa de constestacin de llamadas telefnicas, est interesada en
conocer la probabilidad de que la media de n llamadas dure un cierto periodo
de tiempo, no le interesa una llamada individual, ya que no le permitira
determinar la cantidad de personas que requiere:
Las llamadas durante un mes promediaron 150 seg. Con una desviacin
estndar de 15 seg.
a. Cul es la probabilidad de que una llamada en particular dure entre 150 y
155 segundos?

84
Z

155 150
Z 155
0.33
15

En tablas P(Z <= 0.33) = 0.6293 ;

150 150
Z 150
0.0
15

P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%


Por tanto la probabilidad de que una llamada dure entre 150 y 155 segundos
es del 12.93%.
b. Cul es la probabilidad de que la media de n=50 llamadas est entre 150
y 155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
2.36
15 / 50

En tablas P(Z <= 2.36) = 0.9909 ;

150 150
Z 150
0.0
15 / 50

P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 2.36) = 0.4909 o 49.09%

P(150 <= X < = 155)

150

155

150

155

P (150 X 155)

Para el caso de las medias el rea es mayor debido a que las medias
muestrales estn menos dispersas que los valores individuales de llamadasc.

85
Cul es la probabilidad de que la media de n=35 llamadas est entre 145 y
155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
1.97
15 / 35

145 150
Z 150
1.97
15 / 35

En tablas P(Z <= -1.97) = 0.0244 ;

P(Z<=1.97) = 0.9756

Por tanto P( -1.97 <= Z <= 1.97) = 0.9512

o 95.12%

d. Cul es la probabilidad de que la media de n=35 llamadas sea mayor a


155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
1.97
15 / 35

En tablas P(Z <= -1.97) = 0.0244 o


Por tanto P(Z >= 1.97) = 0.0244

1-P(Z<=1.97) = 1 - 0.9756 = 0.0244


o

2.44%

Con la informacin anterior ahora la empresa ya puede tomar decisiones.


Ejercicios:
1. Los choferes de camniones de una empresa recorren en promedio 8,500
km. cada trimestre, con una desviacin estndar de 1,950 Km. Si se toma
una muestra de n = 100 choferes, Cul es la probabilidad de que la media de
la muestra sea o encuentre en:
a. Mayor a 8,500 Km.?
b. Menor a 8,000 Km.?
c. Entre 8,200 y 8,700 Km?
d. Entre 8,100 y 8,400 Km.?

86
2. Los refrescos de una embotelladora tienen una media de 16.1 oz., con una
desviacin estndar de 1.2 oz. Si se toma una muestra de n = 200 refrescos,
cul es la probabilidad de que la media sea:
a. Menor que 16.27 oz.?
b. A lo ms 15.93 oz.?
c. Entre 15.9 y 16.3 oz.?
d. Ms de 16.2 oz.?
Para el caso de proporciones se tiene:

E ( p) p

(1 )
Si n>0.05N puede requerirse el FCP
n

Una vez calculando lo anterior ahora se determina Z

p
p

Ejemplo:
Una empresa adquiere lotes de partes de tamao n = 200, el lote tiene una
tasa de partes con falla del 10%, la poltica de la empresa ahora es que:
a. Si hay ms del 12% de defectos se buscar un nuevo proveedor.
b. Entre el 10 y 12% se considerar la bsqueda de un nuevo proveedor
c. Entre el 5 y 10%, se seguir con el mismo proveedor
d. Menos del 5%, se incrementarn los pedidos
Solucin:
p

(1 )

0.1(1 0.1)
0.021
200

a. P(p > 0.12)

p
0.12 0.1

0.95
p
0.021

P(Z >= 0.95) = 0.1711 o sea el 17.11%

87
b. P(0.10 <= p <= 0.12) = 0.3289 o el 32.89%
c. P(0.05 <= p <= 0.10)
Z 0.05

p
0.05 0.1

2.38
p
0.021

Z 0.1

p
0.1 0.1

0.0
p
0.021

P(-2.38 <= Z <= 0.1) = 0.4913 o el 49.13%


d. P(p <= 0.05) = 0.0087 o el 0.87%
Por tanto como la mayor probabilidad es la del inciso c, no se cambia al
proveedor actual.
Ejercicios:
1. La proporcin de personas que comen en un restaurante es del 75%. En
una muestra de 100 clientes, Cul es la probabilidad de que menos del 20%
compren comida para llevar?
2. El 60% de los empleados en una empresa vive cerca. De 100 empleados al
azar, Cul es la probabilidad de que por lo menos 30 vivan cerca?

4. Distribuciones muestrales derivadas de la normal: Chi 2,


tyF

Distribucin Chi Cuadrada


Esta distribucin se forma al sumar los cuadrados de las variables aleatorias
normales estndar.

88
Si Z es una variable aleatoria normal, entonces el estadstico Y siguiente es
una variable aleatoria Chi cuadrada con n grados de libertad.

Media y varianza de una ji-cuadrada.


E(X)=k
V(X)=2k
Calculo de puntos crticos usando las tablas de ji-cuadrada

Ejemplo: Calcule el valor critico que satisface

89

De tablas de ji-cuadrada con alfa=.05 y k=20

Si X 1 , X 2 ,..., X n

es una muestra aleatoria de una Poblacion (X) con

( n 1) 2
.Entonces
S

2
distribucin normal n( , )

se distribuye ji-

cuadrada con k= n-1 grados de libertad.

Donde S cuadrada es la varianza muestral.

Distribucin t-student
Si X 1 , X 2 ,..., X n

es una muestra aleatoria de una poblacin (X) con

distribucin normal
n( , 2 )

(X
. Entonces

t-student con n-1 grados de libertad

) (s /

n)

se distribuye

90

La media y la varianza de la distribucin t son:

De una muestra aleatoria de n artculos, la probabilidad de que

Caiga entre dos valores especificados es igual al rea bajo la distribucin de


probabilidad t de Student con los valores correspondientes en el eje X, con n1 grados de libertad
Ejemplo:
La resistencia de 15 sellos seleccionados aleatoriamente son: 480, 489, 491,
508, 501, 500, 486, 499, 479, 496, 499, 504, 501, 496, 498
Cul es la probabilidad de que la resistencia promedio de los sellos sea
mayor a 500?. La media es 495.13 y la desviacin estndar es de 8.467.
t = -2.227 y el rea es 0.0214

Distribucin F
Surge de dividir dos ji-cuadradas independientes

91
F=(W/u)/(Y/v)
W se distribuye ji-cuadrada con u g.l.
Y se distribuye ji-cuadrada con v g.l.
El uso de esta distribucin es para comparar varianzas (Recuerde el anlisis
de varianza)

Para determinar la otra cola de la distribucin F se determina con la


expresin.

92

Falfa, k1, k2 = 1 / F(1-alfa), k2, k1


Dado K1 = 8 y K2 = 10, F0.05 = 3.07, encontrar el valor de F0.05 con K1 =
10 y K2 = 8
F0.05,10,8 = 1/ F0.95,8,10 = 1/ 3.07 = 0.326

S-ar putea să vă placă și