Documente Academic
Documente Profesional
Documente Cultură
Nicaragense
(URACCAN)
NUEVA GUINEA
MDULO DE ESTADSTICA
DESCRIPTIVA Y
PROBABILIDADES
RECUERDOS
Hay recuerdos gratos,
un atardecer bajo la lluvia
en la vecina caracoles negros.
Un beso tierno
con el alba en Managua,
un almuerzo frugal en plaza inter.
Un beso, un suspiro, un adis.
UNIDAD No. I
2
una parte de un pas. Designa tambin el registro impreso de dicho recuento. En
nuestros das se llama as a la informacin numrica sobre demografa, viviendas y
actividades.
Divisiones De La Estadstica
Tradicionalmente la Estadstica se divide en: Estadstica descriptiva y Estadstica
Inductiva o Estadstica Inferencial. La rama de la Estadstica que se dedica a la
organizacin, sntesis y descripcin de un conjunto de datos se llama Estadstica
descriptiva. La Estadstica descriptiva encierra cualquier tratamiento de datos
numricos que comprenda generalizaciones, agrupa todas aquellas tcnicas asociadas
justamente con el tratamiento o procesamiento de conjuntos de datos, su objetivo
comprende la caracterizacin de conjuntos de datos numricos, la misma pretende
poner de manifiesto las propiedades de estos conjuntos lo cual se puede lograr de
forma grfica o analtica.
La Estadstica Inferencial es la rama de la Estadstica que se encarga de determinar o
inferir la naturaleza de un conjunto de datos poblacionales por medio de una o varias
muestras. La Estadstica Inferencial se ocupa del problema de establecer previsiones y
conclusiones generales relativas a una poblacin a partir de los datos muestrales
disponibles y del clculo de probabilidades.
Poblacin y muestra
Al recoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean
alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en
una fbrica, suele ser imposible o nada prctico observar todo el grupo, en especial si
es muy grande. En vez de examinar el grupo entero, llamado Poblacin o Universo, se
examina una pequea parte del grupo, llamada Muestra.
Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consistente en todas
las tuercas producidas por una fbrica un cierto da es finita, mientras que la
determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de
una moneda, es infinita. Si una muestra es representativa de una poblacin, es posible
inferir importantes conclusiones sobre las poblaciones a partir del anlisis de la
muestra.
Variable: Es la caracterstica o fenmeno que puede tomar diferentes valores. Las
variables son magnitudes numricas, es decir, son caractersticas de una poblacin
determinada, susceptible de medicin. Son caractersticas que pueden ser observadas
en determinado fenmeno natural, social, econmico, poltico etc.
Lo datos o valores que toman las variables se clasifican en dos tipos:
1 Cuantitativos o Numricas: Son aquellas variables que toman valores numricos,
son las que representan la cantidad de algo. A estas variables le corresponde la
escala de medicin de intervalo y razn o proporcin. Estas a su vez se clasifica
en dos tipos:
3
a Discretas: Es aquella variable que solo puede tomar valores enteros en la escala
de los nmeros naturales, es decir, la variable no puede tomar valores
fraccionarios.
Por ejemplo, el nmero de hijos en un matrimonio puede ser: 0,1, 2, 3 4; pero
ningn matrimonio tiene 0,5 3,89 hijos.
b Continuas: Es aquella que puede tomar cualquier valor dentro de la escala de los
nmeros reales, es decir, es aquella que tericamente puede tomar cualquier valor,
bien sean valores enteros o fraccionados. Los valores que puede tomar esa es
cualquiera e incluso valores fraccionados por ejemplo, un alumno A mide 1,68 m y
otro alumno B mide 1,69 y otro C mide 2,00 m.
2 Cualitativas o categricas: Son aquellas variables cuyos valores son del tipo
categrico, es decir; que indican categoras o son etiquetadas numricamente o
con nombres. Son las que se refieren a clasificaciones, como: estado civil,
profesin, color de los ojos, etc. Esta a su vez, se clasifica en:
a Variables Categricas Nominales: son las variables categricas que, adems de
que sus posibles valores son mutuamente excluyentes entre s, no tienen alguna
forma natural de ordenacin. Por ejemplo, cuando sus posibles valores son: S
y No. A este tipo de variable le corresponde las escalas de medicin nominal.
b Variables Categricas Ordinales: Son las variables categricas que tienen algn
orden. Por ejemplo, cuando sus posibles valores son: siempre, casi siempre y
nunca. A estos tipos de variables le corresponden las escalas de medicin
ordinal.
Si suponemos que ya recabamos un conjunto de datos que nos interesa, al cabo de
cierto tiempo nos hacemos las siguientes preguntas: Cmo puedo sacar conclusiones
de estos datos?, Cmo puedo organizar y resumir el conjunto de datos de modo que
sea ms comprensible?
Para contestar las preguntas anteriores existen mtodos numricos y grficos para
describir un conjunto de datos. El procedimiento adecuado en cada caso depender del
tipo de datos (ya sea cualitativo o cuantitativo) que queramos describir.
4
EJERCICIOS
I.1.-
2.-
3.-
El tiempo que se necesita para contestar una llamada telefnica en una oficina.
______
_____
4.-
5.-
______
6.-
______
7.-
______
8.-
______
II.-
1.-
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la estadstica?
d) Cul es el parmetro?
e) Cul es la variable o variables?
2.-
INTRODUCCIN AL MUESTREO
Una poblacin est determinada por sus caractersticas definitorias. Por lo tanto, el
conjunto de elementos que posea esta caracterstica se denomina poblacin o universo.
Poblacin es la totalidad del fenmeno a estudiar, donde las unidades de poblacin
poseen una caracterstica comn, la que se estudia y da origen a los datos de la
investigacin.
Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con una
serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos
los elementos de una poblacin.
Cuando seleccionamos algunos elementos con la intencin de averiguar algo sobre una
poblacin determinada, nos referimos a este grupo de elementos como muestra. Por
supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la
poblacin en su conjunto. La exactitud de la informacin recolectada depende en gran
manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir
cada uno de los individuos de una poblacin, se toma una muestra representativa de la
misma.
A menudo los compradores prueban una porcin pequea de queso antes de comprar
alguno. Determinar a partir de un pedazo el sabor del trozo completo. Si los
compradores probaran todo el queso, no quedara nada par vender. As que probar todo
el queso es innecesario y a menudo destructivo. Para determinar las caractersticas del
todo, tenemos que muestrear solo una porcin.
Estadsticos y Parmetros
Matemticamente, podemos describir muestras y poblaciones al emplear mediciones
como la media, mediana, moda y la desviacin estndar que introdujimos
anteriormente. Cuando los trminos describen las caractersticas de una muestra, a
este valor calculado se le denomina Estadsticas. Cuando describen las caractersticas
de una poblacin se llaman Parmetros.
Ejemplo 1:
N , , 2 Parametros
n, X , s 2 Estadisticas
Tipos de Muestreo
En una muestra aleatoria o de probabilidad conocemos las probabilidades de que un
elemento de la poblacin se incluye o no en la muestra. Como resultado de lo anterior
podemos determinar objetivamente las estimaciones de las caractersticas de la
poblacin que resultan de nuestra muestra. Los 4 mtodos del muestreo aleatorio ms
usados por los investigadores son:
1. Muestreo Aleatorio Simple
6
2. Muestreo Sistemtico
3. Muestreo Estratificado
4. Muestreo de Racimos o por Conglomerado
1- Muestreo aleatorio simple: la forma ms comn de obtener una muestra es la
seleccin al azar, es decir, cada uno de los individuos de una poblacin tiene la misma
posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es
viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe
emplearse para su constitucin una tabla de nmeros aleatorios.
Ejemplo 2: Supongamos que tenemos una poblacin de cuatro estudiantes en un
seminario y que queremos muestras de dos estudiantes a la vez para entrevistas:
Solucin: Tenemos lo estudiantes A, B, C, D
Muestras de dos estudiantes: AB, AC, AD, BC, DC, BD. La probabilidad de extraer esta
muestra de dos estudiantes es de 1/6 para cada par de estos estudiantes.
Como hacer un muestreo Aleatorio
La forma ms fcil de seleccionar una muestra de manera aleatoria es mediante el uso
de Nmeros aleatorios. Estos nmeros se pueden generar ya sea con una computadora
o calculadora programada o mediante una tabla de nmeros aleatorios ya hecha.
2- Muestreo Sistemtico: Cuando los elementos de la poblacin estn ordenados en
fichas o en una lista, una manera de muestrear consiste en
Sea ;
Elegir aleatoriamente un nmero m, entre 1 y k;
Tomar como muestra los elementos de la lista:
7
4- Muestreo de Racimos o por Conglomerado: Si intentamos hacer un estudio sobre los
habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya
que estudiar una muestra de tamao n implica enviar a los encuestadores a n puntos
distintos de la misma, de modo que en cada uno de ellos slo se realiza una entrevista.
En esta situacin es ms econmico realizar el denominado muestreo por
conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la
ciudad, para despus elegir calles y edificios. Una vez elegido el edificio, se entrevista a
todos los vecinos.
Tanto el muestreo por racimos como el estratificado, la poblacin se divide en grupos
bien definidos. Usamos el muestreo estratificado cuando cada grupo tiene una pequea
variacin dentro de s mismo, pero hay una amplia variacin entre los grupos. Usamos
el muestreo de racimos en el caso opuesto, cuando hay una variacin considerable
dentro de cada grupo, pero los grupos son esencialmente similares entre s.
Estimaciones
Cmo conocemos la poblacin de la Tierra? Cmo determinar entre qu lmites se
sita la cantidad de glbulos rojos por litro de sangre en un individuo sano? Este tipo de
valoracin se hace a partir de modelos probabilistas empleando las tcnicas
estadsticas de la estimacin de parmetros.
El material sobre la teora de probabilidad que se cubri en los captulos anteriores
constituye la base de la inferencia estadstica, rama de la estadstica que tiene que ver
con el uso de los conceptos de la probabilidad para tratar con la toma de decisiones en
condiciones de incertidumbre. La inferencia estadstica est basada en la estimacin y
en la prueba de hiptesis, en ambas haremos inferencias acerca de ciertas
caractersticas de las poblaciones a partir de la informacin contenida en las muestras.
Tipos de Estimaciones: Podemos hacer dos tipos de estimaciones, una llamada
Estimacin Puntual y otra llamada Estimacin por Intervalo.
Una estimacin puntual es solo un nmero o un punto que se utiliza para estimar un
parmetro de la poblacin desconocido.
Ejemplo 3: el jefe de departamento de alguna universidad estara haciendo una
estimacin puntual si afirmara Nuestros datos actuales indican que en esta materia
tendremos 350 estudiantes en el siguiente semestre.
Una estimacin por intervalo es un intervalo de valores que se utiliza para estimar un
parmetro de poblacin. Esta estimacin indica el error de 2 maneras, por la extensin
del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin
que se encuentra dentro del intervalo.
Ejemplo 4: si el jefe de departamento dice algo como lo siguiente, Estimo que la
inscripcin real de este curso para el prximo semestre estar entre 330 y 380 y es muy
probable que la inscripcin exacta caiga dentro de este intervalo.
8
Cualquier estadstico de muestra que se utilice para estimar un parmetro de poblacin
se conoce como estimador, es decir, un estimador es una estadstica de muestra
utilizada para estimar un parmetro de poblacin.
Caractersticas para la seleccin de un buen estimador
1- Imparcialidad: el trmino de imparcialidad se refiere al hecho de que una media de
muestra es un estimador no sesgado de una media de poblacin, por que la media de
la distribucin de muestreo de las medias de muestras tomadas de la misma poblacin
es igual a la media de la poblacin misma. Tambin a este tipo de estimador se le
denomina Estimador sin sesgo.
2- Eficiencia: la eficiencia se refiere al tamao del error estndar de la estadstica. Si
comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir
cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el
menor error estndar o la menor desviacin estndar de la distribucin de muestreo.
3- Coherencia: una estadstica es un estimador coherente de un parmetro de
poblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que el
valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin.
4- Suficiencia: un estimador es eficiente si utiliza una cantidad de informacin
contenida en la muestra de tal forma que ningn otro estimador podra extraer
informacin adicional de la muestra sobre el parmetro de la poblacin que se est
estimando.
9
Propsito de la investigacin: Saber lo qu los/ miembros de la comunidad piensan
acerca de incluir un currculum de educacin para la vida familiar en escuelas
secundarias.
I. Introduccin:
A. Explique quin es usted y el propsito de la investigacin.
B. Explique el procedimiento (por ejemplo, me gustara hacerle algunas preguntas;
podra tomar alrededor de 15 minutos de su tiempo?).
C. Ponga nfasis en que no hay respuestas correctas o incorrectas a las preguntas que
har.
II. Creacin de una buena interrelacin: Esto implica iniciar una conversacin para
establecer una relacin cmoda. Pregunte algo general y apropiado al/la entrevistado/a
acerca de su familia, hijos, trabajo, o comunidad (por ejemplo, en qu ao(s) de
escuela est(n) su(s) hijo/a(s)?.
III. Discusin a profundidad: Haga preguntas secuencialmente, yendo desde
preguntas que buscan informacin objetiva a preguntas que requieren la opinin del
entrevistado.
- Existe algn tipo de educacin para la vida familiar que actualmente se ofrezca en la
escuela de su(s) hijo/a(s)? Si la respuesta fuese s, en qu ao se introduce? Si la
respuesta fuese no, le gustara ver un currculum de educacin para la vida familiar de
las escuelas?
- En qu aos de estudio piensa usted que debera ofrecerse?
- Piensa que las autoridades escolares deben requerir el consentimiento de los padres
para que su(s) hijo/a(s) participen en la educacin para la vida familiar?
Est preparado para hacer un seguimiento con preguntas de sondeo para aclarar o
explorar ms all.
IV. Cierre:
Brevemente haga un resumen de lo que usted ha escuchado y solicite la reaccin final
del/la entrevistado/a (por ejemplo, hay alguna cosa que no hayamos discutido y que a
usted le gustara agregar?) Agradezca al/la entrevistado/a por su tiempo.
10
TIPOS DE ENTREVISTAS
Existen tres tipos bsicos de entrevistas, los que se diferencian por la forma en la que
se determinan y estandarizan anticipadamente las preguntas para la entrevista. De esta
manera encontramos
11
c.
Bajo costos.
12
permite devolver los detalles a la realidad como lo son las entrevistas a profundidad o
grupos focales entre otros.
QU TIPOS DE PREGUNTAS DEBE HABER?
Bsicamente, podemos hablar de dos tipos de preguntas: cerradas y abiertas.
Las preguntas cerradas contienen categoras o alternativas de respuestas que ya han
sido delimitadas. Es decir, se presentan a los sujetos las posibilidades de respuestas y
ellos deben acotarse a ellas. Pueden ser dicotmicas (dos alternativas de respuestas) o
incluir varias alternativas de respuesta.
( ) No
Ejemplo de preguntas cerradas con varias alternativas de respuesta:
buena
regular
mala
muy mala
13
Como es posible observar, en las preguntas cerradas las respuestas son definidas con
anterioridad, y la persona debe elegir la opcin que ms describa su respuesta.
Ejemplo:
1. Esta familia tiene:
_ radio
_ televisin
_ telfono
_ auto
_ Ninguno de los anteriores.
Ante esto, las personas pueden responder una, dos, tres o cuatro opciones, ya que las
categoras no son mutuamente excluyentes.
1. Cul de estos lugares para vacacionar considera usted el mejor? Indique del 1 al 4
segn su inters.
_ Playa
_ Campo
_ Nieve
_ Lago.
Por otro lado, las preguntas abiertas, no delimitan de ante mano las alternativas de
respuesta. Por lo tanto, el numero de categora de respuesta es infinito.
14
y no siempre
Contener una sola idea: Debe referirse a un solo aspecto. Por ejemplo;
acostumbra ver televisin y escuchar radio diariamente? Expresa dos aspectos
y puede confundir. Es adecuado hacer dos preguntas.
15
productivos?. Se insina la respuesta en la pregunta. Resulta ms conveniente
preguntar qu tan productivos considera Ud. a los trabajadores chilenos?.
3. MTODOS DE OBSERVACIN
La observacin en una comunidad es otra fuente importante de datos cualitativos. El
objetivo principal de la observacin es obtener una descripcin detallada del tema a
trabajar en la comunidad a travs de una identificacin atenta y una descripcin exacta
de las interacciones, realidades sociales y de las personas en su contexto cotidiano.
Existen
varias
ventajas
del
trabajo
observacional
en
terreno:
- Ofrece una mejor comprensin del contexto en el que se producen las intervenciones.
- Permite conocer cosas importantes que personas de la comunidad pudieran ignorar u
omitir
voluntaria
involuntariamente
en
una
entrevista.
- Permite que el evaluador presente una visin ms integral, combinando sus propias
percepciones
las
de
otros.
directa.
A. LA OBSERVACIN PARTICIPANTE
Se encuentra en un extremo del espectro de participacin y consta de un observador,
quien se convierte en miembro de la comunidad o de la poblacin que se estudia. El
investigador participa en actividades de la comunidad, observa la manera en que las
personas se comportan e interactan entre s y con organizaciones externas. El
observador intenta ser aceptado como vecino o participante, en lugar de ser un externo.
16
El objetivo de dicha participacin no slo es ver lo que sucede, sino sentirse parte del
grupo. La posibilidad de xito de ste depende de las caractersticas de la comunidad
en que se esta, el tipo de preguntas que se estudian y el contexto socio poltico del
ambiente. La fortaleza de este enfoque es que el investigador puede experimentar y
presumiblemente, entender mejor cualquier impacto del proyecto. La principal debilidad
es que puede alterar el comportamiento que se observa.
Adems, podran surgir problemas ticos si el observador participante se representa de
manera fraudulenta con el fin de ser aceptado por la comunidad que estudia.
METODOLOGA
1. PREPARACIN DE CAMPO:
Como primer paso es necesario preparar el campo, es decir, el identificar el
emplazamiento donde se va a situar el investigador como observador, siendo en una
comunidad en particular (aldea, pueblo, barrio, Centro de Salud, sala de Hospital,
etc.) o en un grupo especifico (ancianos de una residencia, colectivo profesional,
alumnos de un colegio, etc).
2. RELACIONES EN EL CAMPO:
Se sugiere que en la fase de acercamiento y presentacin, el observador se muestre
ingenuo y se realicen preguntas aunque puedan parecer evidentes. Para establecer un
clima de buenas relaciones es necesario compartir el mundo de los informantes, como
lo es el lenguaje, costumbres, participar en algn trabajo, etc.
3. QUE OBSERVAR-Mirar y ver mientras se convive.
En caso de una comunidad o grupo:
La forma de vivir.
17
5. EL ARTE DE PREGUNTAR.
Antes de preguntar es necesario saber escuchar. El mejor observador no es el que
habla mucho, sino el que hace hablar a los dems. Es tan importante saber lo que
preguntar como saber lo que no se debe preguntar. Una buena estrategia es esperar a
que suceda algo y luego preguntar sobre ello.
Recomendaciones para ayudar a estimular la comunicacin con los informantes:
Cuando surge algo que nos interesa, inducirles a continuar.
Pedir aclaraciones sobre sus comentarios.
Preguntar sobre el significado de lo observado.
Evitar, al principio, grabaciones, cuestionarios, confrontar versiones de otros
observadores, etc.
Comprobar la veracidad de la informacin: lo que se nos dice con lo observado.
6. CUADERNO DE CAMPO: Es el instrumento de registro de datos, donde se
anotarn las observaciones - NOTAS DE CAMPO - de forma completa precisa y
detallada.
18
Qu registrar:
Hechos observados:
Descripciones de personas.
Actividades.
Conversaciones.
Experiencia vivida.
Sentimientos.
Dudas, etc.
Reflexiones tericas.
Hiptesis.
Cmo registrar:
Se sugiere limitar el tiempo de observacin a las posibilidades reales de registro.
Escribir con disciplina por ejemplo, siempre una hora de observacin, lo que da a da
seria equivalente a varias horas de registro. Utilizar tcnicas para recordar palabras y
acciones, como
19
Es preciso dejarlo cuando se ha alcanzado la saturacin, es decir, cuando los datos
empiezan a ser repetitivos y no generan conceptos ni teoras nuevas.
Es un momento difcil para el observador por los lazos de afecto desarrollados en
este tiempo de convivencia. Hay que expresar nuestro agradecimiento a las personas
que han colaborado o que nos han prestado ayuda. Debemos dejar un buen recuerdo,
por si posteriormente necesitamos volver para verificar datos o completar la
investigacin.
B. LA OBSERVACIN DIRECTA
Tiende a estar en el otro extremo del espectro de participacin. Esta involucra la
anotacin y registro sistemtico de las actividades, comportamientos y objetos
fsicos en el ambiente de la evaluacin como un observador no intruso. Por lo general,
puede ser una forma rpida y econmica de obtener informacin socioeconmica
bsica acerca de hogares o comunidades. La ventaja principal de este mtodo es que,
si los participantes no saben que estn siendo observados, hay menos probabilidades
de que cambien su comportamiento y se comprometan con la validez de la evaluacin.
Es importante recordar que existe gran variacin entre los dos extremos y que el nivel
de participacin puede cambiar con el tiempo. Por ejemplo, el evaluador puede
comenzar la observacin como externo y convertirse gradualmente en participante a
medida que avance el estudio.
Todo esto se plasma en un Cuaderno de campo o en un Libro diario, anteriormente
descrito.
VENTAJAS y LIMITACIONES
20
UNIDAD No. II
Distribucin de Frecuencias
Es una tabla que divide un conjunto de datos en un nmero de clases (Categoras)
apropiadamente mostrando tambin el nmero de elementos en cada clase llamados
tambin frecuencias. Este agrupamiento hace resaltar caractersticas importantes de los
datos. Existen dos tipos de distribucin:
1 Distribuciones Numricas: los datos se hallan agrupados por su tamao.
2 Distribuciones Categricas: los datos se hallan agrupados de acuerdo con alguna
cualidad o
atributos.
Construccin de una tabla de Frecuencias
1 Se recomienda ordenar los datos en forma ascendente.
2 Decidir el nmero de clases que se usarn en la tabla de frecuencias. Esto lo
decide el estadstico o el investigador en cuestin. Existen varias formas de
calcular el nmero de clases de las cuales aprenderemos la siguiente:
m = 1 + 3.3 * log10(n)
3 Calcular el rango o Amplitud de la muestra. Este se calcula de la siguiente forma:
A = Observacin Mayor Observacin Menor
4 Calcular el ancho de la Clase. Este es:
C = A / m. Redondeando C a la unidad ms prxima.
5 Contar el nmero de observaciones de la muestra que pertenece a cada uno de
las clases.
Nota:
La primera clase se formara colocando la observacin menor como su lmite inferior de
esa clase, como lmite superior se le suma al lmite inferior la amplitud de la clase. Para
formar el lmite inferior de la siguiente clase simplemente sumamos una unidad al valor
del lmite superior de la clase anterior y para formar el lmite superior de la segunda
clase a este le sumamos nuevamente la amplitud de la clase.
Para comprender mejor realicemos el siguiente ejemplo: construya una tabla de
distribucin de frecuencias con el conjunto de datos siguientes:
Tabla1.
21
17
51
10
35
26
13
21
11
52
56
20
15
40
14
42
12
32
28
13
19
28
45
19
21
38
20
Siguiendo los pasos para formar la tabla de distribucin de frecuencias, lo primero que
tenemos que hacer es ordenar los valores.
Tabla2.
5
11
15
20
28
42
12
17
21
32
45
13
19
21
35
51
13
19
26
38
52
10
14
20
28
40
56
Frecuencias (Fi)
9
9
3
4
2
3
30
22
O sea 5 0.5 = 4.5
L.R.S. = Lmite real superior: es media unidad ms que el lmite superior de la clase
13 + 0.5 = 13.5
La frecuencia relativa se encuentra como:
Fr = (Frecuencia de la clase / Nmero total de Observaciones) = F i / n
Frecuencia porcentual, se calcula como:
%Fi = (Fi / n)*100
Frecuencia acumulada de una clase (Fa): se determina sumando el total de
observaciones de todas las clases precedentes ms la clase en cuestin.
Frecuencia porcentual acumulada de una clase (%Fa): es la frecuencia acumulada de la
clase expresada como porcentaje del total de observaciones.
Para la tabla 4 del primer ejemplo el clculo de los valores anteriores se obtiene
Tabla5.
Numero
de clases
5 - 13
14 - 22
23 - 31
32 - 40
41 - 49
50 - 58
Total
Fi
Xi
L.r.i. - L.r.s
%Fi
Fa
%Fa
9
9
3
4
2
3
30
9
18
27
36
45
54
4.5
13.5
22.5
31.5
40.5
49.5
30
30
10
13.3
6.7
10
100
9
18
21
25
27
30
30
60
70
83.3
90
100
13.5
22.5
31.5
40.5
49.5
58.5
22
34
25
33
47
41
16
43
31
38
35
31
34
37
32
45
33
36
44
26
32
38
29
32
39
37
31
33
41
30
30
47
39
19
42
26
37
31
34
35
1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadstica elemental.
23
60
79
32
57
74
52
70
82
36
23
80
77
81
95
41
65
92
85
55
76
52
10
64
75
78
25
80
98
81
67
41
71
83
54
64
72
88
62
74
43
60
78
89
76
84
48
84
90
15
79
34
67
17
82
69
74
63
80
85
61
803
1440 1421 1329 1407 718 1457 1449 1455 2051 1677
1119 1020 1400 1442 1593 1962 1263 1788 1501 1668
1352 1340 1459 1823 1451 1138 1592 982 1981 1091
3. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de
combustible similares.
24
36
40
16
18
30
60
72
66
78
28
67
72
15
18
48
71
22
57
54
12
72
17
20
10
23
13
12
19
18
24
12
14
13
10
13
16
18
13
32
10
11
24
13
18
10
27
19
16
10
14
15
10
15
5. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes
que visitan cuando menos una vez al mes. Los resultados son los siguientes:
14
66
98
55
62
79
59
51
90
72
56
70
62
66
80
94
79
63
73
71
85
5 3
4 5 6 4
6 6
7 1 1
14
1 2
5 6 3 5
4 5
8 4 7
5 9
11 3 12 4 7 6 5 15 1 1 10 8 9 2
12
77
18
63
84
38
54
50
59
54
56
36
26
50
34
44
41
58
58
53
51
25
62
43
52
53
63
62
62
65
61
52
60
45
66
83
71
63
58
61
71
60
140
82
265 168
90
86
125
235 212 171 149 156 162 118 139 149 132 105
162 126 216 195 127 161 135 172 220 229 129
87
128 126 175 127 149 126 121 118 172 126
10.- Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La
medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se
obtienen estos datos:
69
56
22
28
41
28
47
53
48
30
34
13
52
34
60
25
21
37
43
23
13
31
29
38
26
36
30
404
74
234
149
279
215
123
55
43
321
87
234
68
489
57
185
141
758
72
863
703
125
350
440
37
252
27
521
302
127
968
712
503
498
327
608
358
425
303
203
26
12.- Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los
siguientes datos son las cuentas que se les factur el mes pasado:
54
48
58
50
25
47
75
46
60
70
67
68
39
35
56
66
33
62
65
67
13.- Una muestra de suscriptores de una compaa telefnica revel los siguientes
nmeros de llamadas recibidas en la ltima semana.
52
43
30
38
30
42
34
46
32
18
41
12
46
39
37
Tabla6.
Millas / Galn
22.5 - 24.9
25.0 - 27.4
27.5 - 29.9
30.0 - 32.4
32.5 - 34.9
Total
Fi
9
10
15
11
5
50
L.R.I.
22.45
24.95
27.45
29.95
32.45
L.R.S.
24.95
27.45
29.95
32.45
34.95
27
Graficando los valores tenemos la siguiente grafica
15
10
5
22.45
24.95
27.45
29.95
32.45
34.95
Sexo
Hombre
2,450
6,980
390
180
10,000
%
24
70
4
2
100
Mujer
1,880
6,600
1,200
230
9,990
%
19
66
13
2
100
Total
4,330
13,580
1,670
410
19,990
%
22
68
8
2
100
28
Grfico de Pastel o de Sectores: se usa para mostrar como una cantidad total, se
reparte en un grupo de categoras, la construccin de un diagrama de pastel se facilita
teniendo en cuenta que el crculo tiene 360 0 grados y que el Angulo debe corresponder
al 100% del total representado. Utilizando una regla de tres se calcula cada ngulo de
cada categora de la siguiente manera:
%
100%
grado(X)
360
despejando tenemos X = (% * 3600)/100
Ejercicios
29
La siguiente tabla representa las alturas de los pinos de 9 meses de edad en un
bosque de Matagalpa.
Tabla4.
0.59
0.95
1.55
1.15
1.12
0.60
1.35
1.20
0.84
0.79
1.30
1.75
0.98
1.92
1.73
1.04
1.60
1.98
0.76
1.00
1.01
1.10
1.74
0.86
0.84
0.63
1.42
0.62
1.70
1.50
5
0
4
1
0
1
2
4
3
5
5
0
Nmero
50
75
25
15
15
30
15
15
20
25
20
25
40
25
10
5
10
30
15
5
20
25
30
20
20
20
20
25
25
20
20
10
20
10
20
25
45
20
5
25
20
15
30
25
20
10
15
25
40
25
10
20
15
11
15
20
28
42
12
17
21
32
45
13
19
21
35
51
13
19
26
38
52
10
14
20
28
40
56
Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Por lo general, las
frecuencias de los intervalos centrales de una serie de datos son mayores que el resto,
ese nmero se le denomina medida de posicin.
X
i 1
31
1. El valor de la media depende de cada una de las medidas que forman la serie de
datos, y se halla afectada excesivamente por los valores extremos de la serie de
datos.
2. La media se calcula con facilidad y es nica para cada caso y permite representar
mediante un solo valor la posicin de la serie de valores.
CLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS
Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:
X
Xi
variable.
Ejemplo:
1. Calcule la media aritmtica de los siguientes valores: 5, 7, 8, 9, 11, 14
X
5 7 8 9 11 14 54
f X f X
N
f N
i
CLASES
75-----79
80-----84
85-----89
90-----94
fi
f i X
77
82
87
92
20
40
60
100
140
320
480
900
32
95 ----99
TOTAL
97
140
=360
1260
i
X i 3100
f X
i
3100
8.61
360
~
La mediana ( X
o Md): se define como mediana el valor de un conjunto de datos X 1,
X2, X3; X4,.........Xn, ordenada de menor o mayor, que deja a su izquierda y a su derecha
la misma cantidad de observaciones o sea que es el valor que divide en dos partes
iguales al conjunto de datos, es decir el valor de la variable que ocupa el lugar central.
~
X
N
N
1
X
2
2
Ejemplo:
Encuentre la mediana para el siguiente conjunto de datos: 18, 5, 5, 11, 9, 7, 12, 15.
Sabemos por medio del nmero de datos que N = 8 por lo tanto es par, ordenando los
datos de menor a mayor tenemos 5, 5, 7, 9, 11, 12, 15, 18, ahora aplicando la formula:
~
X
8
8
X 1
2
2 X 4 X 5 9 11 10
2
2
2
Ejemplo:
Encuentre la mediana para el siguiente conjunto de datos: 4, 3, 8, 8, 4, 5, 10, 8, 6
Sabemos por medio del nmero de datos que N = 9 por lo tanto es par, ordenando los
datos de menor a mayor tenemos 3, 4, 4, 5, 6, 8, 8, 8, 10, ahora aplicando la formula:
33
~
9 1
X X
X 5 6
2
o posicin
de la mediana en el intervalo de la
PMd
N
. El resultado obtenido
2
2 Faa
Md Li
Ic,
fm
horas Obreros
Fi
6
20
18
50
17
16
5
N = 132
de
horas Obreros
Obreros
34
Extras
CLASES
55------59
60------64
65------69
70------74
75------79
80------84
85------89
66,
2
2
n = 132,
Fi
6
20
18
50
17
16
5
n = 132
fa
6
26
44
94
111
127
132
2 Fac
Md Li
C
fm
50
50
Md 69.5
CARACTERSTICAS DE LA MEDIANA
La mediana no es afectada por los valores extremos de una serie
puesto que la misma no es calculada con todos los valores de la serie.
de valores,
35
Ejemplo: encuentre la moda para los siguientes conjuntos de datos:
1.
2.
3.
2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9.
Una distribucin que contenga una solo moda se le llama unimodal, en contraste si
posee ms de dos modas se le llama multimodal.
CLCULO DE LA MODA PARA DATOS AGRUPADOS
Para calcular la moda en datos agrupados existen varios mtodos; cada uno de los
mtodos puede dar un valor diferente de la moda: En este curso se dar un mtodo el
cual se puede considerar uno de los ms precisos en el clculo de esta. Es un mtodo
matemtico que consiste en la interpolacin mediante la siguiente frmula:
1
.Ic ,
Mo Li
1 2
en donde Mo es la moda, Ic = longitud de la clase ms uno (L + 1), Li es el lmite
real de la clase que presenta el mayor nmero de frecuencia; la clase que presenta el
mayor nmero de frecuencias fi se le denomina clase modal y a las frecuencias de
esa clases se les denomina frecuencia modal fm, 1 es la diferencia entre la
frecuencia de la clase modal ( fm) y la frecuencia de la clase anterior a la modal, la
cual se designa con fa , entonces, 1 ( fm fa) ; 2 es la diferencia entre la
frecuencia de la clase modal (fm) y la frecuencia de la clase siguiente a la modal,
esta se designa con fs , entonces, 2 ( fm fs ).
1. Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg de un
grupo de trabajadores de una empresa, calcule la moda.
CLASES
fi
30-----39
2
40-----49
2
50-----59
7
60-----69
11
70-----79
12
80-----89
16
90-----99
2
TOTAL
La clase modal es 80----89, entonces Lri = 79.5 y su fm = 16, fa = 12
C 10 entonces:
1 f m f a 1 16 12 4;.. 2 f m f s 16 2 14
1
40
4
Mo 79.5
Mo L i
79.5 2.22 81.71.
.10 79.5
18
4 14
1 2
fs = 2,
36
CARACTERSTICAS DE LA MODA
La moda se puede obtener en una forma aproximada muy fcilmente, puesto que
la obtencin exacta es algo complicado.
MEDIDAS DE DISPERSIN
Las medidas de variabilidad son nmeros que expresan la forma en que los valores de
una serie de datos cambian alrededor de una medida de posicin central la cual por lo
general es la media aritmtica. La variabilidad es la esencia de la estadstica, puesto
que las variables y atributos se caracterizan siempre por diferencias de valores entre
observaciones individuales. Casi siempre en una distribucin de frecuencia el promedio
obtenido difiere de los datos de la serie; por esto es importante determinar el grado de
variacin o dispersin de los datos de una serie de valores con respecto al promedio.
Rango o Recorrido: Es la primera medida de dispersin, no est relacionada con
ningn promedio en particular, ya que este se relaciona con los datos mismos, puesto
que su clculo se determina restndole al dato mayor de una serie el dato menor de la
misma. El rango es el nmero de variables diferentes que posee una serie de valores.
Su frmula se calcula as:
Rango(R) = Dato mayor (XM)Dato Menor (Xm): R = XM Xm. El rango es la medida de
dispersin ms sencilla e inexacta dentro de las medidas de dispersin absoluta. Esta
medida tiene bastante uso en el control de calidad de los productos manufacturados.
Desviacin tpica o estndar: Es la medida de dispersin ms utilizada en las
investigaciones por ser la ms estable de todas, ya que para su clculo se utilizan todos
los desvos con respecto a la media aritmtica de las observaciones, y adems, se
toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S
cuando se trabaja con una muestra y con la letra griega minscula (Sigma) cuando
se trabaja con una poblacin. Es importante destacar que cuando se hace referencia a
la poblacin l nmero de datos se expresa con N y cuando se refiere a la muestra l
nmero de datos se expresa con n. La desviacin tpica se define como:
La raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos de
las observaciones con respecto a su media aritmtica. La desviacin tpica es una
forma refinada de la desviacin media.
Caractersticas de la Desviacin Tpica:
La desviacin tpica se calcula con cada uno de los valores de una serie de datos.
37
(X
1. .S
X )2
n 1
2. .S
( X i ) 2
2
i
n 1
N X i2 ( X i ) 2
n(n 1)
Para caular la desviacin tipica de una poblacin para datos no agrupados, se utilizan
las siguientes formulas:
(X
3. .
4. .
)2
X
N
2
i
2
i
Ej.1 Los siguientes valores corresponden a la edad de ios de una muestra tomada
de una poblacin: Xi = 3, 4, 5, 6, 7 . Determine la desviacin tpica.
X
X
n
25
5
5
n X i2
n(n 1)
5(135) 625
5(4)
50
1.58
20
38
B) Para datos Agrupados en Clases.- Para calcular la desviacin tpica en datos
agrupado existen varios criterios en relacion a la correccin del sesgo que se produce al
tomar una muestra, en este estudio se considerar la frmula que corrige el sesgo de
aquellas muestras en estudio.
Frmulas Para calcular la muestra y la poblacin de una desviacin tpica con datos
agrupados en clases:
1. .S
( X
2. .S
X )2 fi
n 1
f i nX 2
2
i
n 1
Ejemplos:
Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la
empresa RINACA, en un mes (se resolver considerando los datos como de una S y
3. .
f ( X
4. .
f X
)2
2
i
di = X i X
CLASES
fi
X i
40 44
42
42
- 15.26
232.87
1764
45 49
50 54
55 59
60 64
65 69
70 74
6
21
75
23
7
2
47
52
57
62
67
72
282
1092
4275
1426
469
144
- 10.26
- 5.26
- 0.26
4.74
9.74
14.74
631.60
581.02
5.07
516.75
664.07
434.54
13254
56784
243675
88412
31423
10368
f i X
f X
i
=7730
1.82
f i d i2
f d
i
=3065.92
2
i
f X
i
2
i
=445680
Para resolver el problema lo primero que se debe hacer es calcular la media aritmtica
as:
X
X i
f X
i
7730
57.26 Ahora aplicando la frmula 2
135
2
i
nX 2
n 1
445680 135(57.26)
135 1
3065.93
22.88 4.78.
134
39
Interpretacin.- Los resultados obtenidos con los clculos anteriores, indican que el
promedio de las horas extras laboradas por los trabajadores se desvan o varan con
respecto a su media aritmtica en una
Cantidad igual a 4.78 y 4.76 respectivamente.
La Varianza: Es otra de las variaciones absolutas y la misma se define como el
cuadrado de la desviacin tpica; viene expresada con las mismas letras de la
desviacin tpica pero elevadas al cuadrado, as S 2 y 2. Las frmulas para calcular
la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las
respectivas races, las cuales desaparecen al estar elevados el primer miembro al
cuadrado. La varianza general de la poblacin se expresa de la forma siguiente:
2. . 2
f ( X
3. .S 2
(X
)2
X )2
n 1
..,. para.datos.agrupados.
..,. para.datos.no.agrupados.
f ( X
i
X)
..,. para.datos.agrupados.
n 1
La mayor utilidad de la varianza se presenta en la estadstica Inferencial.
40
Dispersin Relativa o Coeficiente de dispersin
Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra; pero,
cuando hay que establecer comparaciones entre distintas muestras, ser necesario
expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Las medidas de dispersin relativas permiten comparar grupos de series distintas en
cuanto a su variacin, independientemente de las unidades en que se midan las
diferentes caractersticas en consideracin. Generalmente las medidas de dispersin
relativas se expresan en porcentajes, facilitando as el estudio con medidas
procedentes de otras series de valores La dispersin relativa viene a ser igual a la
dispersin absoluta dividida entre el promedio.
1. . 2
(X
)2
.., para.datos.no.agrupados.
N
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de
variacin de Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite
la comparacin entre diferentes distribuciones de frecuencias, medidas en diferentes
unidades. El coeficiente de variacin de Pearson se designa con las letras CV. La
frmula matemtica es:
CV
x100.
41
MEDIDAS DE POSICIN
Las medidas de posicin forman parte del conjunto de medidas descriptivas numricas,
entre las que se encuentran los parmetros y los estadgrafos. Una medida de posicin
es un nmero que se escoge como orientacin para hacer mencin a un grupo de
datos, estas pueden ser de tendencia central o no, las ms importantes son: La Media
Aritmtica, la Mediana, la Moda, la Varianza, la Desviacin Estndar y los Cuartiles.
Un promedio es un valor que es tpico o representativo de un conjunto de datos ya que
representan un gran nmero de valores individuales por uno solo. Como tales valores
tienden a distribuirse centralmente dentro de un conjunto de datos ordenados de
acuerdo con su magnitud, los promedios son llamados tambin medidas de tendencia
central
Parmetro: son medidas descriptivas numricas calculadas a partir del total de
observaciones de la poblacin EJ: a media poblacional, la varianza, la proporcin, etc.
Estadstico: son medidas calculadas a partir de las observaciones de una muestra.
CARACTERSTICAS DE LAS MEDIDAS DE POSICIN
1. Deben ser definidas
interpretaciones.
42
que a corresponde a los valores 1, 2 y 3., que viene a ser el nmero de Q a que
posee una distribucin de frecuencia de clase. El Q 1 divide la distribucin de
frecuencia en dos partes, una corresponde a 25 % que est por debajo de Q 1 y el otro
75 % por encima de Q1. El Q2 divide la distribucin de frecuencia en dos partes
iguales, un 50 % que est por debajo de los valores de Q 2 y otro 50 % que est por
encima del valor de Q2. El Q2 es igual a la mediana.
Se hace difcil calcular estas medidas, sin embargo, siguiendo los mismos principios
mencionados para la mediana, se pueden localizar en la forma siguiente:
Si tenemos una serie de valores X1, X2, X3 Xn, se localiza el primer cuartil como el
1 * (n 1)
1* n
valor Q1
cuando n es par y Q1
cuando n es impar.
4
4
El segundo cuartil coincide exactamente con la mediana. Para el tercer cuartil ser
3 * ( n 1)
3* n
Q3
(n par) y Q3
(n impar)
4
4
Los Deciles: los deciles dividen a un conjunto de datos exactamente en 10 partes
A * (n 1)
A* n
iguales Para calcular los deciles ser D A
(n es par) o D A
(n es
10
10
impar) siendo A el nmero del decil.
NOTA: los valores que se obtienen de los cuartiles, percentiles y deciles son la posicin
donde se encuentra el valor real de ellos mismos, por lo tanto hay que ordenar los datos
primero.
Los percentiles: los percentiles dividen exactamente a un conjunto de datos en 100
A * ( n 1)
A* n
partes iguales, para calcular los percentiles tenemos PA
o PA
,
100
100
siendo Al nmero del percentil a determinar.
Ejemplo: En una serie de 11 trminos, 2, 2, 5, 7, 9, 9, 9, 10, 11, 12, 18, se desea
localizar el primer cuartil, el sexto decil y el percentil 95.
Como n es impar por haber 11 casos, tenemos que:
Q1
1 * (11 1) 12
D6
6 * (11 1) 72
P95
95 * (11 1) 1140
CLCULO DE
AGRUPADOS
43
1 Se
PQa
aN
4 Faa
Qa Li
.Ic.
fm
En esta frmula,
corresponde al nmero del cuartil solicitado; Li = Limite real inferior de la clase donde
se encuentra ubicado el cuartil; Faa = Frecuencia acumulada anterior a la clase donde
se encuentra el cuartil; fm = Frecuencia fi que posee el intervalo de clase donde se
encuentra el cuartil;
PQa
aN
= Posicin que ocupa el cuartil en la distribucin de
4
aN
, en esta
10
aN
10 Faa
Da Li
.Ic
fm
En este caso se aplica la frmula de la misma manera que se hizo para calcular los
cuartiles, solo que en esta frmula varia la posicin de ubicacin de la clase donde se
encuentra ubicado el decil.
Percentiles: El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir:
Md Q2 D5 P50 . 50% por encima y 50 % por debajo de los datos de la distribucin.
El clculo de los percentiles es similar al clculo de los cuartiles y los deciles con una
variante en la posicin de ubicacin de estos, que viene expresada por la siguiente
formula:
PPa
aN
Faa
aN
.Ic .
. Con esta posicin se aplica la frmula: Pa Li 100 fm
100
44
400-----499
500-----599
600-----699
700-----799
Totales = N
a)
PQ1
Para
calcular
Q 1,
120
70
62
36
463
se
determina
295
365
427
463
primero
la
posicin
as:
1x 463 463
115 .75.
4
4
PQ1 = 115.75. Con ese valor de la posicin encontrado se busca en las frecuencias
acumuladas para ver cul de esas contiene ese valor. Observando las frecuencias
acumuladas se puede detectar que la posicin 115.75 se encuentra en la clase
300------399, por lo tanto el Li = 299.5,
fm = 90, y la Faa = 85 y Ic = 100, aplicando la formula se tiene:
3075
115 .75 85
.100 299.5
299.5 34.17 333.67.
90
90
Q1 299.5
Para calcular
2 x 463
120
120
Q2 399.5
Para calcular
PP 70
70 x 463
P 70
70
70
P70 499.5
Esto indica que el 70 % de los obreros devengan un sueldo semanal que est por
debajo de 541.07 $ y que el 30 % de los restantes obreros, ganan un salario por
encima de 541.07 $.
UNIDAD No. IV
CONCEPTOS DE PROBABILIDAD
45
Experimentos Aleatorios
La teora de probabilidades es muy extensa y sus aplicaciones han adquirido mucha
importancia en la administracin pblica y empresarial. Las probabilidades son de gran
importancia en la estadstica. Todos estamos familiarizados tambin con la importancia
de los experimentos en ciencias e ingeniera. La experimentacin es til porque si
suponemos que llevamos a cabo cierto experimento bajo condiciones esencialmente
idnticas, llegaremos a los mismos resultados. En estas circunstancias, estamos en
capacidad de controlar el valor de las variables que afectan el resultado del
experimento.
Sin embargo en algunos experimentos, no somos capaces de indagar o controlar el
valor de determinada variable, de manera que el resultado cambiara de un experimento
a otro, a pesar de que la mayora de las condiciones son las mismas. Estos
experimentos se describen como aleatorios. Los siguientes son algunos ejemplos:
Ejemplo1:
Si lanzamos una moneda, el resultado del experimento ser sello, simbolizado por S,
o puede caer cara, simbolizado por C.
Ejemplo2:
Si lanzamos un dado, el resultado del experimento ser uno de los nmeros del
conjunto
1, 2, 3, 4, 5, 6.
Para comprender mejor el estudio de las probabilidades es necesario definir una serie
de trminos bsicos para su mejor comprensin.
Una variable aleatoria es una funcin que asocia un nmero real a cada ele mento del
espacio muestral. O tambin, una Variable Aleatoria es una funcin que asigna un
nmero real a cada resultado en el espacio muestral de un experimento aleatorio.
Experimento.- Es el proceso mediante el cual se obtiene una observacin o una
medicin de un fenmeno. En este hay tres cosas de importancia: Accin, Medicin y
Observacin. Existen 2 tipos de experimento: Experimento Determinante y Experimento
Aleatorio.
Experimento Determinante.- Es aquel experimento en el que es posible predecir el
resultado final de ese proceso an sin haberlo realizado. Ej. Cuando los qumicos
combinan oxigeno ms hidrgeno el resultado es agua; este experimento no es
necesario realizarlo para conocer el resultado.
Experimento Aleatorio.- Es aquel que puede dar lugar a ms de un resultado, por lo
que, no se puede predecir uno de ellos en una prueba en particular. Ej. Los
experimentos relacionados con juegos de azar, no se pueden predecir los resultados
de los ganadores del 5 y 6 en un domingo cualquiera.
46
Espacio Muestral.- Es el conjunto de todos los posibles resultados de un experimento
aleatorio; generalmente se le designa con la letra S.
Ejemplo: El espacio muestral al lanzar un dado es: S = {1, 2 3 ,4 ,5 ,6} esto es as
puesto que un dado tiene 6 caras numeradas de 1 al 6 y cualquiera de estas puede
salir. El espacio muestral de lanzar una moneda es: S = {c, s}, esto es as puesto que al
lanzar una moneda puede salir una cara un sello.
Sucesos Eventos.- Es todo aquel resultado o grupo de resultados que pueden dar
origen un experimento aleatorio. Tambin se puede decir que es un subconjunto del
espacio muestral.
Ejemplo. El espacio muestral de lanzar un dado est formado por varios eventos: { 1 },{
2 }, { 3 }, { 4 },{ 5 } y {6}. Los eventos pueden ser simples compuestos.
Eventos Simples.- Son aquellos eventos cuyas caractersticas son las de estar
constituidos por un solo elemento; por lo tanto no se pueden descomponer en otros
elementos. Ej. Al lanzar un dado se pueden obtener 6 eventos simples que serian el 1,
2, 3, 4, 5 y 6 respectivamente.
Eventos Compuestos.- Son aquellos eventos que se pueden descomponer en una
combinacin de eventos. Ej. Obtener un nmero par al lanzar un dado, el espacio
muestral de este evento es:
E = {2, 4, 6}, este es el evento par del lanzamiento de un dado, pero este evento se
puede descomponer en 3 eventos simples a saber {2}, {4}: y 6 .
Eventos Mutuamente Excluyentes.- Son aquellos eventos que no pueden ocurrir
simultneamente al realizar una sola vez un experimento. Se dice que dos eventos A y
B son mutuamente excluyentes si y solo si, su interseccin es el conjunto vaco, es
decir AB = . Ej. El resultado obtenido al lanzar un dado, si sale una cara con un 3,
no puede salir otro nmero en este mismo lanzamiento.
Eventos Exhaustivos.- Dos eventos A y B son colectivamente exhaustivos si su unin
es la totalidad del espacio muestral, es decir, AB = S.
Eventos Imposibles.- Son aquellos sucesos que nunca ocurren. Ej. Obtener un 7 al
lanzar un dado normal, esto es imposible por cuanto un dado normal tiene solamente 6
caras por lo tanto este resultado es el conjunto vaco, {}.
Eventos Seguros.- Son aquellos sucesos constituidos por todos los eventos simples
del espacio muestral. Ejemplo: Al lanzar un dado, sacar cualquiera de sus caras.
Eventos complementarios.- Dos eventos A y son complementarios si y solo si, se
cumple que: P(A) + P () = P(S), es decir, son eventos mutuamente excluyentes y su
unin es el espacio muestral, entonces tenemos, P(A) + P() = P(S), pero P(S) = 1,
entonces:
P(A) + P() = 1
47
En cualquier experimento aleatorio hay siempre incertidumbre sobre si ocurrir un
evento en particular. Como una medida de oportunidad, o probabilidad, con que
esperamos que ocurra cierto evento, es conveniente asignar un numero entre 0 y 1. Si
estamos seguros de que tal evento ocurrir, decimos que tiene 100% de probabilidad o
1, pero si estamos seguros del que tal evento no ocurrir, decimos que su probabilidad
es cero.
Hay dos enfoques o procedimientos importantes mediante los cuales podemos calcular
la probabilidad de un evento:
Enfoque Clsico: si un evento puede ocurrir en h maneras diferentes de un nmero
total de n maneras posibles, todos ellos son igualmente probables. Entonces la
probabilidad del evento es h/n.
Ejemplo: supongamos que queremos saber la probabilidad de que ocurra cara en el
lanzamiento sencillo de una moneda. Dado que hay dos maneras igualmente probables
como puede caer una moneda, a saber: cara o sello, y que de esas dos maneras puede
aparecer cara de una solo forma, deducimos que la probabilidad es de 1/2. Para llegar a
esto debemos suponer que la moneda es balanceada, es decir, que no est cargada de
alguna manera.
Enfoque Frecuentista: Si despus de n repeticiones de un experimento, donde n es
muy grande, se observa que un evento ocurre h veces, entonces la probabilidad de
dicho evento es h/n. Esto tambin se denomina la probabilidad emprica de un evento.
Ejemplo: si lanzamos 1000 veces una moneda y encontramos que 532 veces
obtenemos caras, estimamos que la probabilidad de que ocurra cara es de 532/1000 =
0.532
Tanto el enfoque Clsico como el Frecuentista presentan serios inconvenientes. El
primero porque las palabras igualmente probables son vagas y el segundo porque el
nmero grande es vago. Debido a estas dificultades, los matemticos y estadsticos se
han regido por el enfoque axiomtico de la probabilidad.
Axiomas de la Teora de Probabilidades
Supongamos que tenemos un espacio muestral S. Para cada evento del espacio
muestral asociamos un numero real P(A). Entonces P se denomina la funcin de
probabilidad, y P(A) la probabilidad del evento A. Los axiomas de las probabilidades
son los fundamentos bsicos de las reglas del clculo de las probabilidades de eventos;
estas reglas tambin se conocen como propiedades de las probabilidades y son:
1.- La probabilidad de todo evento o suceso es un nmero no negativo, es decir:
P(A)0.
2.- La suma de las probabilidades de todos los sucesos posibles simples, de un
n
P( A )
i 1
P(A3)+.............+ P(An) = 1 = S
P(A1) + P(A2) +
48
3.- La probabilidad de cualquier suceso vara entre 0 y 1, es decir 0 P(A) 1.
4.- La probabilidad de un evento imposible es cero, es decir:
P () 0
2.
3.
4.
5.
Sume las probabilidades de los eventos simples para obtener la probabilidad del
evento.
49
Regla de probabilidad para las uniones e intersecciones:
Puesto que las uniones y las intersecciones de los eventos son ellas mismas eventos,
siempre podremos calcular sus probabilidades sumando las probabilidades de los
eventos simples que lo componen. Sin embargo cuando se conocen la probabilidad de
ciertos eventos, es ms fcil utilizar una de dos reglas o ambas para el clculo de la
probabilidad.
Regla aditiva de la probabilidad: la probabilidad de la unin de los eventos A y B es la
suma de las probabilidades del evento A ms la probabilidad del evento B menos la
interseccin de ambos, esto es:
P ( A B ) P ( A) P ( B ) P ( A B )
P ( A)
1
,
2
1
P( B) ,
3
P ( A B)
Ejemplo: Se lanzan dos monedas al aire al mismo tiempo, y se tienen los siguientes
eventos,
A: observar al menos una cara.
B: observar exactamente una cara.
C: observar exactamente dos caras.
Calcule la probabilidad P( B C )
Sabemos que son dos monedas y adems que cada moneda tiene solo dos posibles
resultados, el caer cara (C) o el caer cruz (X) por lo tanto tendremos 4 posibles
resultados, sea 4 eventos simples de los cuales formaremos nuestro espacio muestral,
esto es: S = CC, CX, XC, XX. Las probabilidades de cada evento son
50
3
1
1
, P( B ) , P(C ) , como B y C no pueden ocurrir a la misma vez entonces
4
2
4
P ( B C ) 0 , entonces
P( A)
P ( A B ) P ( A) P ( B ) =
1 1 3
2 4 4
Probabilidad Condicionada
La probabilidad de que ocurra un evento B cuando se sabe que ha ocurrido algn otro
evento A, se denomina PROBABILIDAD CONDICIONADA y se designa como
P(B/A). l smbolo P(B/A) se lee como la probabilidad de que ocurra B sabiendo que
ocurri A o sencillamente probabilidad de B dado A. Se dice que la probabilidad de
ocurrencia de un evento dado es condicionada, si esta se afecta por la ocurrencia de
otro evento presente.
Definicin.- Sean A y B dos eventos asociados a un experimento aleatorio. La
probabilidad que ocurra el evento B, dado que ocurri el suceso A se llama
probabilidad condicionada del suceso B, esta se simboliza por P(B/A) y se calcula
mediante la frmula:
A P PA AB , Si
PB
A P PA AB
PB
B P PA B B
PA
P(A) = 18 / 50.
51
AB = 10 ing. Con 20 puntos , luego
P(AB) = 10 / 50.
10
P
10 5
PB
50 ,
A
18
P A
18 9
50
2
P(A B)
1
6 P(A)
. P(A/B)
4
P(B)
2
6
2
P(A B)
2
P(B/A)
6 P(B)
3 3
P(A)
6
52
Si los eventos A y B son independientes, entonces la probabilidad de la interseccin de
A y B es:
P(AB) = P(A) P(B).
Ejemplo: en el ejemplo anterior demostramos que los eventos A y B eran
independientes entonces:
P(AB) = P(A) P(B) = (3/6) * (4/6) = 1/3
P(A k E )
P(A )P(E A k )
P(A k )P( E A k )
n k
n
P(E)
P( A j E ) P( A j ) P( E A j )
j 1
j 1
Ejemplo: Suponga que la caja A contiene 3 canicas rojas y 2 azules mientras que la
caja B contiene 2 canicas rojas y 8 azules. Se lanza una moneda balanceada, si se
tiene cara se saca una canica de la caja A y si se obtiene cruz se saca una canica de la
caja B:
a-) encuentre la probabilidad de que se saque una canica roja.
b-) suponga que quien lanza la moneda no revela si obtiene cara o cruz (de manera que
no sabemos de cual caja se sac la canica) pero si dice que sac una canica roja.
Cul es la probabilidad de que la canica haya sido sacada de la caja A (es decir de
que la moneda sea cara).
a-) Sea R: se escoge una canica roja , C1: se escoge de la caja A y C2: se
escoge de la caja B . Por lo tanto la probabilidad de escoger una canica roja es:
P ( R ) P ( R C1 ) P ( R C 2 ) P (C1 ) P ( R C1 ) P (C 2 ) P ( R C 2 )
2
1 3 1 2
5
2 3 2 2 2 8
53
P C1 R
P(C1 ) P ( R C1 )
P(C1 ) P( R C1 ) P (C 2 ) P ( R C 2 )
1 3
3
2 3 2
1 3 1 2
4
2 3 2 2 28
Pantalones
G
Arreglos
RG
R
A
G
RA
BG
B
A
BA
NG
NA
G
A
VG
VA
J
N
Ejemplo:
Suponga que se han programado cinco vuelos espaciales distintos, cada uno de los
cuales requiere de un astronauta. Se supone que ningn astronauta puede ir en ms de
un vuelo. De cuntas formas diferentes se pueden asignar cinco de los 100 mejores
astronautas del pas a los cinco vuelos distintos?
Resolviendo por la regla multiplicativa y tomando en cuenta que son 5 de 100
astronautas tenemos:
n1 * n 2 * n3 * n 4 * n5 (100) * (99) * (98) * (97) * (96) 9,034,502,400
54
Una disposicin de elementos en un orden especfico se denomina Permutacin. Del
ejemplo anterior hay ms de 9 mil millones de permutaciones distintas de 5 elementos
extrados de un conjunto de 100 elementos.
Permutacin: Dado un conjunto de m objetos claramente distintos, se desea
seleccionar n elementos de los m y acomodarlos dentro de n posiciones. Se llaman
permutaciones de esos elementos tomados de n en n, al conjunto formado por todas
las colecciones de n elementos elegidos entre los elementos dados, considerando
como distintas dos colecciones que difieran en algn elemento o en el orden de
colocacin de los mismo.
N! Esta es una notacin matemtica que recibe el nombre FACTORIAL y se define
como el producto de todos los nmeros consecutivos decrecientes que comienzan en 1
hasta n, entonces si n es entero positivo tenemos:
N! = n(n-1) (n-2) (n-3)..................1.
6! = 6x5x4x3x2x1 =720. En particular, 1! = 1; por definicin, 0! = 1.
Frmula de las Variaciones:
Pn
m!
m n !
9,034,502,400
m Pn
m n ! 100 5 100 5!
95!
m
Cn
m!
100!
100 * 99 * 98 * 97 * 96 * 95!
100 C5
75,287,520
n! m n !
5!100 5!
5!*95!
55
1.-Se forma un grupo cualquiera, segn el enunciado del problema y con los mismos
elementos de ese grupo se trata de formar otro grupo, si se consigue formar otro grupo
diferente, el problema en cuestin es una permutacin, si por el contrario no se logra
formar otro grupo, el problema es una combinacin. Cuando en el grupo entran todos
los elementos y los grupos difieran en el orden de colocacin, es una permutacin, de
no ser as son combinaciones.
2.- Cuando una persona forma un grupo y otra persona que no haya visto la formacin
del mismo es capaz de decir en qu orden se colocaron los elementos, entonces se
afirma que el grupo formado es una permutacin, si por el contrario no se puede decir
el orden de colocacin de los elementos que conforman el grupo, entonces, el mismo
es una combinacin.
Clculo de probabilidades usando las tcnicas de conteo
Al resolver un problema de probabilidad debemos examinar detenidamente el
experimento para determinar se es posible aplicar un o ms de las tcnicas de conteo
que hemos visto.
Ejemplo: se contrata un servicio de calificaciones de computadoras para encontrar las
3 mejores marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio.
a-) De cuntas formas distintas puede el servicio de calificaciones llegar al
ordenamiento final?
b-) Si el servicio de calificaciones no puede distinguir diferencias entre las marcas y por
lo tanto obtiene el ordenamiento al azar. Cul es la probabilidad de que la marca de la
compaa Z quede en primer lugar. Y de que quede entre los 3 primeros lugares?
Solucin:
a-) como nos interesa el orden de calificacin es una permutacin, esto es
10
P3
10!
10 * 9 * 8 * 7!
720
10 3!
7!
56
Si la marca de la compaa Z queda en primer lugar solo hay una solo posibilidad de
que esto ocurra. Por lo tanto hay 9 puestos disponibles para ocupar el segundo y el
tercer lugar, entonces:
1*9 P2 1 *
9!
9 2!
72
72
1
720 10
P B
216 3
720 10
Ejercicios de Probabilidad
Resuelva los siguientes ejercicios, analizndolos cuidadosamente.
1.-
La probabilidad de que una persona, que desea viajar a cierto lugar de Centro
Amrica, seleccione la lnea area NICA es de 0.3; la lnea area TACA es de
0.45 y la lnea area LACSA es de 0.25. Cul es la probabilidad de que un
cliente de un da determinado seleccione la lnea area LACSA o NICA?
2.-
3.-
4.-
5.-
b) Si se seleccionan tres guantes Cul es la probabilidad de que los tres sean para
jugadores zurdos?
c) Si se est realizando el muestreo con reposicin, Cul sera la respuesta a y b?
57
6.-
7.-
Momentos
Sean X1, X2, X3, ..........Xn, los valores que toma la variable Xi; se define entonces,
momento mi de orden r con respecto al promedio aritmtico ( X ) de los valores de la
variable Xi elevados a la potencia r; siendo r cualquier valor comprendido entre,1 , 2,
3,....,n. Matemticamente:
mi
(X
X )r
Si r = 1 entonces
Si r = 2 entonces
m1
m2
(X X )
( Xn X )
0
S2
58
Karl Pearson un estudioso de la estadstica design el coeficiente de asimetra con las
letras SK y determin la frmula para su clculo, al cual se le denomin primer
coeficiente de asimetra de Pearson
Si SK = 0, entonces la distribucin es simtrica.
SK
3( X Md )
S
m4
S4
En esta frmula m4 es el momento cuatro con respecto a la media aritmtica y S 4 es la
desviacin tpica elevada a la cuarta potencia, K 4 es el coeficiente de Kurtosis. Tomando
en cuenta la Kurtosis el k4 de una curva de distribucin puede ser: Mesocurtica,
Platicurtica y Leptocurtica.
K4
59
En la grfica 1 de Kurtosis se pueden observar los tres tipos de Kurtosis antes
descritos, siendo la primera curva Platicurtica (la ms baja), la segunda Mesocurtica (la
de en medio) y la ltima es Leptocurtica (la ms alta):
KURTOSIS
1 PLATIKURTICA
2 MESOKURTICA
3 LEPTOKURTICA
Ejemplo:
Para los siguientes datos calcule la simetra y la Kurtosis: 3, 2, 0, 15, 2, 3, 4, 0, 1, 3.
Clculo de la simetra:
La media es X 3.3 , La moda es Mo 3 y la desviacin tpica es S 4.3 , entonces
SK
3( X Md ) 3(3.3 2.5)
0.558
S
4.3
(X
X )4
4
4
4
10
1900.978
Por lo tanto
K4
m4 1900.978
5.56
S4
4.34
MODELOS DE PROBABILIDAD
60
Modelo de Bernouilli
P { e x ito } P { x 1} p
P { fr a c a s o } P { x 0} 1 p
x i p i 1 p 0 (1 p ) p
i1
y su desviacin tpica:
x i2 p i m
2
x
1 2 p 0 2 (1 p ) p
p p
i1
p (1 p )
Ejemplo:
Sabemos que una mquina produce un 3% de piezas defectuosas.
La variable es x=1 si la pieza no es defectuosa y x=0 si la pieza es defectuosa, es
decir:
P { x 0 } 1 p 0 ,0 3
P { x 1} p 0 ,9 7
La variable x sigue una distribucin de Bernouilli con p=0,97, luego:
61
p 0 ,9 7
p (1 p )
0 , 9 7 0 , 0 3 0 ,1 7 0 6
La distribucin Binomial
m x np
2
x
n p (1 p )
n p (1 p )
n p 1 2 0 ,2 5 3
n p (1 p )
1 2 0 , 2 5 ( 1 0 , 2 5 ) 1 ,5
62
x1
p 0 ,4
x1
x1 0
p (1 p )
0 ,4 0 ,6 0 ,4 8 9 9
P ( x 1 2 ) 0 ,0 3 5 5
n p 2 0 0 ,4 8
n p (1 p )
2 0 0 , 4 ( 1 0 , 4 ) 2 ,1 9 0 8
P (x 0) 0
P (x 3) 1 P (x 3) 1 P (x 0) P (x 1) P (x 2 )
63
Mirando en la Tabla 1 los valores para k=0, k=1 y k=2 (para n=20 y p=0,4)
tenemos:
P ( x 3 ) 1 ( 0 0 ,0 0 0 5 0 ,0 0 3 1 ) 0 ,9 9 6 4
P ( x 0 ) 0 ,0 3 5 2
P ( x 3) P (x 0) P (x 1) P (x 2 ) P (x 3)
P ( x 3 ) 0 , 0 3 5 2 0 ,1 3 1 9 0 , 2 3 0 9 0 , 2 5 0 1 0 , 6 4 8 1
P ( x 3) 1 P ( x 3) 1 P (x 0) P (x 1) P (x 2 )
1 ( 0 , 0 3 5 2 0 ,1 3 1 9 0 , 2 3 0 9 ) 0 , 6 0 2
x
x
n p 1 5 0 ,2 3
n p ( 1 p ) 1 5 0 , 2 ( 1 0 , 2 ) 1 ,5 4 9
P ( a c e r t a r ) p 1 / 4 0 ,2 5
P ( x 0 ) 0 ,0 1 3 4
P ( x 1 ) 1 P ( x 1 ) 1 P ( x 0 ) 1 0 ,0 1 3 4 0 ,9 8 6 6
P (x 15) 0
64
d) Cul es la probabilidad de que conteste acertadamente a ms de la mitad de
las cuestiones?
Mirando en la Tabla 1 para k=8,9,..,15, (para n=15 y p=0,25), tendremos que:
P ( x 8 ) P ( x 8 ) P ( x 9 ) . . . P ( x 1 5 )
0 ,0 1 3 1 0 ,0 0 3 4 0 ,0 0 0 7 0 ,0 0 0 1 0 ,0 1 7 3
P (x 3) 1 P (x 3)
Mirando en la Tabla 1 para k=3 (para n=15 y p=0,25), tendremos que:
P ( x 3 ) 1 0 ,2 2 5 2 0 ,7 7 4 8
x
x
n p 1 5 0 ,2 5 3 ,7 5 4
n p (1 p ) 1 5 0 ,2 5 (1 0 ,2 5 ) 1 ,6 7 7
P ( x 0 ) 0 ,0 1 3 4
m x x 3 ,7 5 1 ,6 7 7 5 ,4 2 7
P ( x 6 ) P ( x 6 ) P ( x 7 ) . . . P ( x 1 5 )
0 ,0 9 1 7 0 ,0 3 9 3 0 ,0 1 3 1 0 ,0 0 3 4 0 ,0 0 0 7 0 ,0 0 0 1
0 ,1 4 8 3
La distribucin geomtrica
P ( x k ) p ( 1 p ) k 1
k 1 ,2 , . . .
65
Ejemplo:
Si la probabilidad de que una persona est en paro es p=0,25, la probabilidad de
que haya que realizar 6 entrevistas hasta encontrar una persona en paro es:
P ( x 6 ) 0 ,2 5 ( 1 0 ,2 5 ) 6 1 0 ,0 5
1
p
1 p
p2
Ejemplo: (continuacin)
El nmero medio de entrevistas que habr que realizar para encontrar una persona
en paro ser:
1
1
4
p 0 ,2 5
1 p
p2
1 0 ,2 5
3 ,4 6
0 ,2 5 2
P ( x 3 ) p ( 1 p ) k 1 0 , 2 ( 1 0 , 2 ) 3 1 0 ,1 2 8
b) Cul es el nmero medio de personas que hay que entrevistar hasta llegar al
primer votante del partido?
m
c)
1
1
5
p 0 ,2
personas
P ( x 6 ) 1 P ( x 6 ) 1 [ P ( x 1 ) P ( x 2 ) . . . P ( x 6 ) ]
1 [ 0 , 2 0 ,8 0 0 , 2 0 ,8 1 . . . 0 , 2 0 ,8 5 ] 0 , 2 6 2 1
66
P ( x 5 ) p ( 1 p ) k 1 0 ,2 5 ( 1 0 ,2 5 ) 5 1 0 ,0 7 9 1
b)
1
1
4
p 0 ,2 5
preguntas
La distribucin de Poisson
Una variable aleatoria x con distribucin de Poisson expresa el n de sucesos raros
que ocurren en una proporcin fija de espacio o de tiempo. Por ejemplo, el n de
accidentes en un da, el n de llamadas a un telfono en una hora, n de erratas por
pgina en un libro
P ( x 3 ) 0 ,0 3 8 3
2
x
y su desviacin tpica
P ( x 0 ) 0 ,1 3 5 3
Ejercicio 16.7 (Pea y Romo)
El nmero de clientes x que llegan a la caja de un supermercado en un cuarto de hora
sigue una distribucin de Poisson con media 5.
a) Hallar la probabilidad de que lleguen al menos 4 personas en un cuarto de
hora.
67
. Se pide
y k=0,1,2 y 3):
P ( x 4 ) 1 P ( x 4 ) 1 [ P ( x 0 ) P ( x 1) P ( x 2 ) P ( x 3)]
1 ( 0 , 0 0 6 7 0 , 0 3 3 7 0 , 0 8 4 2 0 ,1 0 4 ) 0 , 7 3 5
b) Obtener la probabilidad de que no llegue nadie a la caja en un cuarto de
hora.
P ( x 0 ) 0 ,0 0 6 7
P (2 x 4 ) P (x 2 ) P (x 3) P (x 4 )
0 , 0 8 4 2 0 ,1 4 0 4 0 ,1 7 5 5 0 , 4 0 0 1
comprendido
6 4 ,3
x 2 ,3
entre
ser:
m x
m x
En
este
caso
como
68
m x
6 4 ,3 2 ,3 6 6 ,6
m x
6 4 ,3 2 ,3 6 2
b) El 95,5% de la poblacin.
En la distribucin normal se concentra el 95,5% de la probabilidad en el intervalo de
valores comprendido entre
m x 2
m x 2
m x 2
m x 2
. Luego ser:
6 4 ,3 2 2 ,3 6 8 ,9
6 4 ,3 2 2 ,3 5 9 ,7
x
x
c) El 99,7% de la poblacin
En la distribucin normal se concentra el 99,7% de la probabilidad en el intervalo de
valores comprendido entre
m x 3
m x 3
m x 3
m x 3
. Luego ser:
6 4 ,3 3 2 ,3 7 1 ,2
6 4 ,3 3 2 ,3 5 7 ,4
x
x
Las transformaciones lineales de una variable que sigue una distribucin normal,
tambin tendrn una distribucin normal. Es decir:
x es N ( m
, x )
m x b,a x)
Ejemplo:
La variable x que expresa el tiempo en horas que tarda un empleado en hacer una
tarea sigue una distribucin normal con
1 ,5
x 0 ,1
60m
6 0 1 ,5 9 0
y 6 0 x 6 0 0 ,1 6
x m
x
, x )
la nueva variable
P (z a ) 1 P (z a )
P (a z b ) P (z b ) P (z a )
69
0 ,7 9 6 7 0 ,3 8 2 1 0 ,4 1 0 5
0 , 9 9 6 4 0 , 8 7 0 8 0 ,1 2 5 6
h) P ( 0 , 8 6 z 1 , 2 8 ) P ( z 1 , 2 8 ) P ( z 0 , 8 6 )
0 , 8 9 9 7 0 ,1 9 4 9 0 , 7 0 4 8
i) P ( 2 , 9 8 z 1 , 3 2 ) P ( z 1 , 3 2 ) P ( z 2 , 9 8 )
0 ,0 9 3 4 0 ,0 0 1 4 0 ,0 9 2
Ejercicio 18.6 (Pea y Romo)
Hallar el valor a de la variable z normal estndar tal que:
a) P ( z a ) 0 , 2 0 3 3
a 0 ,8 3
b) P ( z a ) 0 , 7 7 3 4
a 0 ,7 5
c) P ( z a ) 0 , 9 2 2
Sabemos que P ( z a ) 1 P ( z a )
P ( z a ) 1 0 ,9 2 2 0 ,0 7 7 8
a 1 ,4 2
d) P ( z a ) 0 , 0 3 1 4
Sabemos que P ( z a ) 1 P ( z a )
P ( z a ) 1 0 ,0 3 1 4 0 ,9 6 8 6
a 1 ,8 6
luego:
luego:
m x , x )
, obtenemos
una variable z con una distribucin normal estndar, podremos calcular probabilidades
para cualquier variable normal usando la Tabla 3.
70
Si x tiene una distribucin N ( m
, x )
, podremos calcular
P (x b)
de la siguiente
manera:
x m
x
P (x b) P
b m x
b m x
P z
x
x
x 3 ,2 3 ,4 5 3 ,2
P z 0 ,2 0 0 ,5 7 9 3
1 ,2 2
1 ,2 2
El valor de P z 0 , 2 0 se busca en la Tabla 3
2 ,9 2 3 ,2 x 3 ,2 3 ,4 3 3 ,2
- P ( 2 ,9 2 x 3 ,4 3 ) P
1 ,2 2
1 ,2 2
1 ,2 2
P 0 , 2 2 z 0 ,1 9
P ( z 0 ,1 9 ) P ( z 0 , 2 2 )
0 , 5 7 5 3 0 , 4 1 2 9 0 ,1 6 2 4
Si x tiene una distribucin N ( m x , x ) e y una distribucin N ( m y , y )
-P
( x 3 ,4 5 ) P
5)
m y , x2 y2 )
, hallar:
x 8 , 4 7 9 ,1 2 8 , 4 7
P z 0 ,5 6 0 , 7 1 2 3
1 ,1 5
1 ,1 5
P ( x 9 ,1 2 ) P
b)
P ( x 1 2 ,3 4 )
x 8 ,4 7 1 2 ,3 4 8 ,4 7
P z 3 ,3 6 0 ,9 9 9 6
1 ,1 5
1 ,1 5
P ( x 1 2 ,3 4 ) P
c)
P ( x 6 ,4 2 )
6 ,4 2 8 ,4 7
P ( x 6 ,4 2 ) P z
1 ,1 5
d) P ( x 1 0 , 5 3 )
1 0 ,5 3 8 ,4 7
P ( x 1 0 ,5 3 ) P z
1 ,1 5
e)
P z 1 ,7 8 0 ,0 3 7 5
P z 1 ,7 9
1 P ( z 1 ,7 9 ) 1 0 ,9 6 3 3 0 ,0 3 6 7
P ( x 1 2 ,6 2 )
y son
71
1 2 ,6 2 8 ,4 7
P ( x 1 2 ,6 2 ) P z
1 ,1 5
1 P ( z 3 ,6 1 ) 1
f)
P ( x 4 ,0 1 )
P z 3 ,6 1
1 0
4 ,0 1 8 ,4 7
P ( x 4 ,0 1 ) P z
P z 3 ,8 8
1 ,1 5
1 P ( z 3 ,8 8 ) 1 0 1
g)
P ( 6 ,1 2 x 1 1 , 9 2 )
1 1 ,9 2 8 ,4 7
6 ,1 2 8 , 4 7
z
1 ,1 5
1 ,1 5
P 2 ,0 4 z 3
P ( z 3 ) P ( z 2 ,0 4 )
0 ,9 9 8 7 0 ,0 2 0 7 0 ,9 7 8
P ( 6 ,1 2 x 1 1 , 9 2 ) P
h)
P ( 7 ,5 2 x 1 0 , 3 2 )
1 0 ,3 2 8 ,4 7
7 ,5 2 8 , 4 7
z
1 ,1 5
1 ,1 5
P 0 ,8 3 z 1 ,6 1
P ( z 1 , 6 1 ) P ( z 0 ,8 3 )
0 ,9 4 6 3 0 ,2 0 3 3 0 ,7 4 3
P ( 7 ,5 2 x 1 0 ,3 2 ) P
i)
P ( 5 ,0 6 x 6 ,8 4 )
6 ,8 4 8 , 4 7
5 ,0 6 8 ,4 7
z
1 ,1 5
1 ,1 5
P 2 ,9 6 z 1 ,4 2
P ( z 1 ,4 2 ) P ( z 2 ,9 6 )
0 ,0 7 7 8 0 ,0 0 1 5 0 ,0 7 6 3
P ( 5 , 0 6 x 6 ,8 4 ) P
a 4 ,3
x 4 ,3 a 4 ,3
P z
0 ,7 3 8 9
1 ,2
1 ,2
1 ,2
P (x a) P
luego:
72
a 4 ,3
0 ,6 4 a 0 ,6 4 1 ,2 4 ,3 5 ,0 6 8
1 ,2
d) P ( x a ) 0 , 6 1 7 9
a 4 ,3
x 4 ,3 a 4 ,3
P (x a) P
P z
0 ,6 1 7 9
1 ,2
1 ,2
1 ,2
luego:
a 4 ,3
0 ,3 a 0 ,3 1 ,2 4 ,3 4 ,6 6
1 ,2
a) P ( x a ) 0 , 2 9 8 1
a 4 ,3
a 4 ,3
P (x a) P z
1 P z
0 ,2 9 8 1
1 ,2
1 ,2
luego:
a 4 ,3
P z
1 0 ,2 9 8 1 0 ,7 0 1 9
1 ,2
a 4 ,3
0 ,5 3 a 0 ,5 3 1 , 2 4 , 3 4 , 9 3 6
1 ,2
b) P ( x a ) 0 , 5 8 7 1
a 4 ,3
a 4 ,3
P (x a) P z
1 P z
0 ,5 8 7 1
1 ,2
1 ,2
luego:
a 4 ,3
P z
1 0 ,5 8 7 1 0 , 4 1 2 9
1 ,2
a 4 ,3
0 ,2 2 a 0 ,2 2 1 ,2 4 ,3 4 ,0 3 6
1 ,2
y 100x
b) Obtener la distribucin de y.
Como y es una transformacin lineal de una variable con distribucin normal tendr
una distribucin N( m y , y ) con:
m y 1 0 0 m x 1 0 0 1 ,8 9 1 8 9
y 1 0 0 x 1 0 0 0 ,0 7 7
73
180 189
P (y 180) P z
1 P z 1 , 2 8 1 0 ,1 0 0 3 0 , 8 9 9 7
7
Aproximacin mediante la normal
Si x tiene una distribucin B ( n
,p)
x np
n p (1 p )
Si x es una variable discreta (la binomial) e y una variable continua (la normal) si
queremos aproximar probabilidades de x mediante y funcionar mejor si
hacemos la correccin por continuidad:
P ( a x b ) P ( a 0 ,5 y b 0 ,5 )
P (x b)
P (x a)
( y b 0 ,5 )
P ( y a 0 ,5 )
Ejemplo:
El 35% de los habitantes de una ciudad votan a un partido. Se hace una encuesta a 200
personas. La variable x que representa el n de personas encuestadas que vota al
partido sigue una distribucin B(n=200;p=0,35).
Por tanto:
m x n p 2 0 0 0 ,3 5 7 0
x n p (1 p ) 2 0 0 0 ,3 5 (1 0 ,3 5 ) 6 ,7 4
Queremos saber la probabilidad de que haya entre 82 y 106 votantes del partido:
P ( 8 2 x 1 0 6 ) . Podemos aproximarla por la normal estndar (n=200>30;
np=70>5 y n(1-p)=130>5) para lo que haremos la correccin por continuidad y
tipificaremos la variable:
1 0 6 0 ,5 7 0
8 2 0 ,5 7 0
z
6 ,7 4
6 ,7 4
P (1 ,7 0 z 5 ,4 1 ) P ( z 5 ,4 1 ) P ( z 1 ,7 0 )
1 0 ,9 5 5 4 0 ,0 4 4 6
P (8 2 x 1 0 6 ) P
74
m n p 1 0 0 0 ,4 4 0
n p (1 p ) 1 0 0 0 ,4 (1 0 ,4 ) 4 ,9
x
5 0 0 ,5 4 0
3 0 0 ,5 4 0
z
4 ,9
4 ,9
P ( 2 ,1 4 z 1 , 9 4 ) P ( z 1 , 9 4 ) P ( z 2 ,1 4 )
P (30 x 5 0) P
0 ,9 7 3 8 0 ,0 1 6 0 ,9 5 7 8
c) Calcular la probabilidad de que se vendan al menos 15 relojes digitales.
1 5 0 ,5 4 0
P (x 15) P z
P ( z 5 ,2 0 )
4 ,9
1 P ( z 5 ,2 0 ) 1 0 1
d) Hallar la probabilidad de que no se vendan ms de 60 relojes digitales.
6 0 0 ,5 4 0
P (x 60) P z
P ( z 4 ,1 8 ) 1
4 ,9
m n p 2 0 0 0 ,6 1 2 0
n p (1 p ) 2 0 0 0 ,6 (1 0 ,6 ) 6 ,9
x
4 0 0 ,5 1 2 0
P (x 40) P z
P ( z 1 1 ,6 7 )
6 ,9
1 P ( z 1 1 ,6 7 ) 1 0 1
b) Obtener la probabilidad de que el n de encuestadas est entre 80 y 150.
1 5 0 0 ,5 1 2 0
8 0 0 ,5 1 2 0
z
6 ,9
6 ,9
P ( 5 ,8 7 z 4 , 4 2 ) P ( z 4 , 4 2 ) P ( z 5 ,8 7 )
P (8 0 x 1 5 0 ) P
1 0 1
c) Calcular la probabilidad de que no se pregunte a ms de 150 mujeres.
75
1 5 0 0 ,5 1 2 0
P (x 150) P z
P ( z 4 ,4 2 ) 1
6 ,9
76
X y
s y
p y
Poblacin
Con N
elementos
Xmedia K
Desv.est.
K
150
1/6
200
1/6
250
2/6
300
1/6
350
1/6
1.0
77
MEDIA DE LAS MEDIAS MUESTRALES o GRAN MEDIA o MEDIA DE MEDIAS:
Xi
K
150 200 250 250 300 350
X
250
6
X2
(X X )
K
(X )
X2
X X2
78
X
N n
N 1
Si
distribucin normal n( , 2 )
.EntoncesX
se
2
distribuye normalmente con media , y varianza / n
Por ejemplo, para los siguientes datos de la poblacin:
DATOS DE LA POBLACIN PARA MOSTRAR EL TEOREMA DEL LMITE
CENTRAL
2
1
5
7
PROMEDIO
7
7
8
1
5
7
1
4
5
9
1
1
2
4
5
4
4.2
5.6
4.0
3.4
79
7
1
7
6
9
8
5
5
5
3
4
9
2
7
3
4
5
8
7
2
3
9
6
5
9
2
9
2
5
4
8
3
5
7
5
9
7
5
8
8
5
7
9
2
4
9
1
7
6
6
3
7
7
3
3
9
5
1
3
1
1
7
4
8
3
1
5
2
1
3
2
2
6
6
2
6
4
2
1
2
8
9
6
6
9
5
4
7
5
7
5
5
5
2
7
7
9
4
1
9
7
4
3
9
3
9
9
7
7
9
5
3
2
5
9
7
4
2
7
6
2
3
2
6
2
9
2
8
9
3
8
4
9
1
7
7
1
2
2
3
8
6
7
2
8
7
7
4
6
4
4
1
9
1
5
7
8
8
6
4
2
5
6
2
1
3
4
8
9
5
3
8
1
4
1
5
6
8
7
8
8
4
8
1
7
9
5
5
4
6
3
8
5
9
3
3
1
7
2
9
5
5
5
8
6
3
8
5
6
9
8
1
7
8
4
6
4
5
6
3
9
2
4
4
2
5
5
7
3
6
7
8
5
8
9
8
2
1
4
7
7.0
5.4
4.2
5.8
6.0
5.2
3.4
6.6
5.4
3.8
5.2
6.4
4.8
6.8
5.2
4.8
3.6
5.6
7.0
2.8
3.2
5.0
4.6
5.4
6.0
4.2
4.4
5.0
4.2
4.2
3.2
4.4
6.0
6.4
6.2
6.8
7.2
4.2
6.8
6.2
4.6
6.6
6.0
4.6
4.6
4.8
4.4
6.2
80
8
2
9
7
1
2
2
2
1
2
4
8
2
4
9
6
1
1
3
4
9
6
3
7
7
4
7
3
3
2
3
8
6
9
3
2
8
8
1
7
4.6
3.6
5.2
4.8
4.6
4.4
3.6
6.0
Histogram of Poblacion
40
Frequency
30
20
10
Poblacion
81
Mean
StDev
N
AD
P-Value
99
Percent
95
90
5.073
2.584
300
5.965
<0.005
80
70
60
50
40
30
20
10
5
1
0.1
-5
5
Poblacion
10
15
Como el P value es menor a 0.05 los datos no siguen una distribucin normal.
El histograma de los promedios muestrales (subgrupos de 5 datos) se
muestra a continuacin:
82
Mean
StDev
N
AD
P-Value
99
Percent
95
90
5.073
1.118
60
0.527
0.172
80
70
60
50
40
30
20
10
5
1
0.1
5
Muestra
Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias siguen una
distribucin normal.
La sigma de la poblacin estimada con la media de la muestra es:
S pob.
Sn=5
2.5840
1.1181
Raiz(n)
Spob est.
2.2361 2.5001243
4.7
4.2
3.8
6.2
6.5
5.7
6.5
5.6
5.3
4.7
5.3
4.1
5.0
4.5
4.8
83
Frequency
7
6
5
4
3
2
1
0
3.5
4.0
4.5
5.0
PROM. N=10
5.5
6.0
6.5
X X
X
/ n
84
Z
155 150
Z 155
0.33
15
150 150
Z 150
0.0
15
P(Z<=0) = 0.500
150 150
Z 150
0.0
15 / 50
P(Z<=0) = 0.500
150
155
150
155
P (150 X 155)
Para el caso de las medias el rea es mayor debido a que las medias
muestrales estn menos dispersas que los valores individuales de llamadasc.
85
Cul es la probabilidad de que la media de n=35 llamadas est entre 145 y
155 segundos?
Ahora se aplica la distribucin muestral de las medias, con:
X
Z
/ n
155 150
Z 155
1.97
15 / 35
145 150
Z 150
1.97
15 / 35
P(Z<=1.97) = 0.9756
o 95.12%
2.44%
86
2. Los refrescos de una embotelladora tienen una media de 16.1 oz., con una
desviacin estndar de 1.2 oz. Si se toma una muestra de n = 200 refrescos,
cul es la probabilidad de que la media sea:
a. Menor que 16.27 oz.?
b. A lo ms 15.93 oz.?
c. Entre 15.9 y 16.3 oz.?
d. Ms de 16.2 oz.?
Para el caso de proporciones se tiene:
E ( p) p
(1 )
Si n>0.05N puede requerirse el FCP
n
p
p
Ejemplo:
Una empresa adquiere lotes de partes de tamao n = 200, el lote tiene una
tasa de partes con falla del 10%, la poltica de la empresa ahora es que:
a. Si hay ms del 12% de defectos se buscar un nuevo proveedor.
b. Entre el 10 y 12% se considerar la bsqueda de un nuevo proveedor
c. Entre el 5 y 10%, se seguir con el mismo proveedor
d. Menos del 5%, se incrementarn los pedidos
Solucin:
p
(1 )
0.1(1 0.1)
0.021
200
p
0.12 0.1
0.95
p
0.021
87
b. P(0.10 <= p <= 0.12) = 0.3289 o el 32.89%
c. P(0.05 <= p <= 0.10)
Z 0.05
p
0.05 0.1
2.38
p
0.021
Z 0.1
p
0.1 0.1
0.0
p
0.021
88
Si Z es una variable aleatoria normal, entonces el estadstico Y siguiente es
una variable aleatoria Chi cuadrada con n grados de libertad.
89
Si X 1 , X 2 ,..., X n
( n 1) 2
.Entonces
S
2
distribucin normal n( , )
se distribuye ji-
Distribucin t-student
Si X 1 , X 2 ,..., X n
distribucin normal
n( , 2 )
(X
. Entonces
) (s /
n)
se distribuye
90
Distribucin F
Surge de dividir dos ji-cuadradas independientes
91
F=(W/u)/(Y/v)
W se distribuye ji-cuadrada con u g.l.
Y se distribuye ji-cuadrada con v g.l.
El uso de esta distribucin es para comparar varianzas (Recuerde el anlisis
de varianza)
92