Sunteți pe pagina 1din 44

ESTADISTICA II

VARIABLES ALEATORIAS DISCRETAS Y VALOR ESPERADO


Una variable cuyos valores dependen del resultado de un proceso aleatorio es llamada
variable aleatoria. En general, las variables aleatorias son denotadas por letras
maysculas tales como X, Y o Z, y los valores que estas variables toman pueden ser
denotados por las correspondientes letras minsculas (x, y o z). As, para el nmero de
caras (X) que aparecen en el lanzamiento de dos monedas, podemos indicar los valores
posibles escribiendo:
X = x donde x = 0, 1, 2
o
x = 0, 1, 2
Ejemplos:
1. Suponga que un dado es tirado y X es el nmero que aparece en la cara superior.
Entonces:
X = 1, 2, 3, 4, 5, 6
2. Suponga que una moneda es lanzada sucesivamente hasta obtener una cara. Si Y es
el nmero de tales lanzamientos, entonces:
Y = 1, 2, 3, 4, . . .
Una variable aleatoria es llamada variable aleatoria discreta si slo puede tomar un
nmero finito de valores, o si sus valores pueden ser colocados en una correspondencia
uno a uno con los enteros positivos. Una variable es llamada variable aleatoria continua si
puede tomar cualquier valor en algn intervalo.
Si X es una variable aleatoria, la probabilidad del evento que X tome el valor x es
denotado con P(X = x). Si X es discreta, entonces la funcin f que asigna el nmero
P(X = x) a cada valor posible de X es llamada funcin de probabilidad, distribucin de
probabilidad o distribucin de la variable aleatoria. Por lo tanto
f(x) = P(X = x)
Ejemplo:
Suponer que X es el nmero de caras que aparecen en el lanzamiento de dos monedas.
Determinar la distribucin de X
S = {cc, cs, sc, ss}
El evento X = 0 es {ss}
1

El evento X = 1 es {cs, sc}


El evento X = 2 es {cc}

1
4
1
f (1)
2
1
f ( 2)
4
f (0)

TABLA DE PROBABILIDAD
x

P(X = x)

1
4

1
2

1
4

f(0) + f(1) + f(2) =

1 1 1
1
4 2 4

Es decir:

f ( x) 1
x

Si X es una variable aleatoria discreta con distribucin de probabilidad f, entonces la


media (o valor esperado o esperanza) de X, denotada por o E(X), est dada por

E ( X ) xf ( x)
x

La media de X puede ser interpretada como su valor promedio a largo plazo.


Ejemplos:
1. Una compaa de seguros ofrece una pliza de seguro contra incendio catastrfico por
$ 80.000 a propietarios de cierto tipo de casa. La pliza proporciona proteccin durante un
ao si ocurre la destruccin total de la casa por un incendio. La compaa ha determinado
2

que la probabilidad de tal evento es de 0,0002. Si la prima anual de la pliza es de $ 52,


encuentre la utilidad esperada por pliza para la compaa.
Si una casa asegurada no sufre un incendio catastrfico, la compaa gana $ 52. Sin
embargo, si hay tal incendio, la compaa pierde
80.000 52 = $ 79948
f(-79948) = P(X = -79948) = 0,0002
f(52) = P(X = 52) = 1 0,0002 = 0,9998
E(X) = (-79948)(0,0002) + (52)(0,9998) = $ 36
2. Una compaa que vende por correo computadores, ofrece una garanta de devolucin
del dinero en 30 das a cualquier cliente que no est completamente satisfecho con el
producto. La compaa logra una utilidad de $ 200 por cada computador vendido, pero
tiene una prdida de $ 100 por manejo de envo por cada unidad regresada. La
probabilidad de que una unidad sea regresada es de 0,08. Cul es la utilidad esperada
por cada unidad enviada?
E(X) = (200)(0,92) + (-100)(0,08) = $ 176
VARIANZA
La varianza de X, denotada por Var(X), es el promedio a largo plazo de los cuadrados de
las desviaciones de X con respecto de

Var ( X ) E[( X ) 2 ] ( x ) 2 f ( x)
x

DESVIACION ESTANDAR DE X ()
=

Var ( X )

2
2
2
Var(X) = 2 = E(X2) - x f ( x)
x

Ejemplo:
Una urna contiene diez canicas numeradas. Cinco canicas muestran un 1, dos muestran
un 2 y tres muestran un 3. Una canica es sacada al azar. Si X es el nmero que muestra,
determine , Var(X) y

5
10
2
f (2) P ( X 2)
10
3
f (3) P ( X 3)
10
f (1) P ( X 1)

5
4
9
9
5
2
3
xf ( x) 1 f (1) 2 f (2) 3 f (3) (1)

( 2)
(3)

10 10 10 5
10
10
10
x
2

9
9

Var ( X ) ( x ) 2 f ( x ) 1 f (1) 2
5
5

x
19
16 5 1 2 36 3







25
25 10 25 10 25 10

19

25

f ( 2) 3
5

f (3)

19
5

Ejercicios:
En los problemas 1-2 est dada la distribucin de la variable aleatoria X. Determine ,
Var(X) y
1. f(0) = 0,1; f(1) = 0,4; f(2) = 0,2; f(3) = 0,3
R. = 1,7; Var(X) = 1,01; = 1
2. f(4) = 0,4; f(5) = 0,6
3. La variable aleatoria X tiene la siguiente distribucin:
x

P(X = x)

2
4

0,5

0,4

A. Encuentre P(X = 2)
B. Encuentre
C. Encuentre 2
R. A. 0,1. B. 5. C. 3
4. La variable aleatoria X tiene la distribucin siguiente
4

P(X = x)

2n

0,4

A. Encuentre P(X = 2) y P(X = 4)


B. Encuentre
En los problemas 5-6 determine E(X), 2 y para la variable aleatoria X
5. Tres monedas legales son lanzadas. Sea X el nmero de caras que aparecen.
R. E(X) =

3 2 3
, = , = 0,87
2
4

6. De un grupo de dos mujeres y tres hombres, son seleccionadas al azar dos personas
para formar un comit. Sea X el nmero de mujeres en el comit.
R. E(X) =

4 2
9
3
, =
, =
5
25
5

7. Una urna contiene tres canicas rojas y dos blancas. Se sacan al azar dos canicas en
sucesin sin reemplazo. Sea X = al nmero de canicas rojas sacadas. Encuentre la
distribucin f de X.
R. f(0) =

1
3
3
, f(1) = , f(2) =
10
5
10

8. Una organizacin benfica est realizando una rifa con un solo premio de $ 8.500.
Cada boleto de la rifa cuesta $ 1 y han sido vendidos 10.000 boletos.
A. Encuentre la ganancia esperada para el comprador de un solo boleto.
B. Encuentre la ganancia esperada para el comprador de dos boletos.
R. A. -0,15. B. -0,30
9. Considere el siguiente juego. Lance tres monedas legales. Si aparecen tres caras o
tres sellos, alguien le paga $ 10. Si slo aparecen una o dos caras, usted debe pagar $6.
Cul es la ganancia o prdida esperada por juego?

10. Un paisajista gana $ 200 diarios cuando trabaja y pierde $ 30 por da cuando no
trabaja. Si la probabilidad de trabajo en cualquier da es de

4
, encuentre los ingresos
7

diarios esperados del paisajista.


R. 101,43
11. Una empresa de comida rpida estima que si abre un restaurante en un centro
comercial la probabilidad de que l tenga xito es de 0,65. Un restaurante con xito
genera una utilidad anual de $ 75.000; uno que no es exitoso pierde $ 20.000. Cul es la
utilidad esperada para la empresa si abre un restaurante en un centro comercial?
12. Una compaa de seguros ofrece una pliza de hospitalizacin a individuos en cierto
grupo. Para un periodo de un ao, la compaa pagar $ 100 por da, hasta un mximo de
5 das, por cada da que el asegurado est hospitalizado. La compaa estima que la
probabilidad de que cualquier persona en este grupo est hospitalizada por exactamente
1 da es de 0,001; por exactamente 2 das de 0,002; por exactamente 3 das, 0,003; por
exactamente 4 das, 0,004; y durante 5 o ms das, 0,008. Encuentre la utilidad esperada
por pliza para la compaa si la prima anual es de $ 10.
R. 3
13. Suponga que usted paga $ 1,25 por jugar un juego en el que son lanzadas dos
monedas legales. Usted recibe una cantidad de dinero igual al nmero de caras que
aparecieron. Cul es la ganancia (o prdida) esperada en cada jugada?
R. -0,25
DISTRIBUCION BINOMIAL
Si X es el nmero de xitos en n ensayos independientes de un experimento binomial con
probabilidad p de xito y q de fracaso en cualquier ensayo, entonces la distribucin f de X
est dada por
f(x) = P(X = x) = nCxpxqn-x,
donde x es un entero tal que 0 x n y q = 1 p.
Cualquier variable aleatoria con esta distribucin es llamada variable aleatoria binomial y
se dice que tiene una distribucin binomial. La media y la desviacin estndar de X estn
dadas, respectivamente, por

np
=

npq

Ejemplos:
6

1. Suponga que X es una variable aleatoria binomial con n = 4 y p =

1
. Encontrar la
3

distribucin para X
q 1

1
2

3
3
0

1 2
P ( X 0) 4 C 0 p q 4 C 0

3 3
0

1 2

3 3

P ( X 1) 4 C1 p1q 3 4 C1

32
81

1 2

3 3

P ( X 2) 4 C 2 p 2 q 2 4 C 2

1 2

3 3

P ( X 3) 4 C3 p 3q1 4 C3

1 2

3 3

16
81

8
81

P ( X 4) 4 C 4 p 4 q 0 4 C 4

8
27

1
81

2. Una moneda es lanzada ocho veces. Encontrar la probabilidad de obtener al menos


dos caras
n = 8, p =

1
1
, q=
2
2

P(X 2) = 1 P(X 2)
0

1 1

2 2

P(X 2) = P(X = 0) + P(X = 1) = 8 C0

1 1

2 2

+ 8 C1

1
1
9

256 32 256
P(X 2) = 1 -

9
247

256 256

LA DISTRIBUCION DE POISSON
La distribucin de Poisson se usa para determinar la probabilidad de la ocurrencia de un
nmero determinado de eventos cuando stos ocurren en un continuo de espacio o
tiempo. Con frecuencia se utiliza para describir el nmero de llegadas de clientes por
hora, el nmero de accidentes industriales cada mes, el nmero de mquinas que se
daan y esperan ser reparadas.
7

La frmula para determinar la probabilidad de un nmero determinado x de xitos en una


distribucin de Poisson es
P(x) =

xe
x!

donde:
x = nmero de veces que ocurre el evento

= nmero promedio de ocurrencias por unidad de tiempo o de espacio


e = 2,71828, la base del logaritmo natural
Ejemplos:
1. En un departamento de reparacin de maquinaria se recibe un promedio de cinco
solicitudes por hora. Hallar la probabilidad de que se reciban exactamente tres solicitudes
de servicio en una hora elegida al azar
P( x)

x e 53 e 5

0,1404
x!
3!

2. Una compaa de pavimentacin local obtuvo un contrato con el Alcalde municipal para
hacer mantenimiento a las vas de su ciudad. Las vas recientemente pavimentadas por
esta compaa demostraron un promedio de dos defectos por milla, despus de haber
sido utilizadas durante un ao. Si el municipio sigue con esta compaa de pavimentacin,
cul es la probabilidad de que se presenten 3 defectos en cualquier milla de va despus
de haber tenido trfico durante un ao?
P( x)

xe
23 e 2

0,1804
x!
3!

Ejercicios:
En los problemas 1-3 determine la distribucin f para la variable aleatoria binomial X si el
nmero de ensayos es n y la probabilidad de xito en cualquier ensayo es p. Tambin
encuentre y
1. n = 2, p =

R. f(0) =

1
4

9
3
1
1
, f(1) = , f(2) =
, = , = 6
16
8
16
2
4

2. n = 3, p =

1
2
8

3. n = 3, p =

R. f(0) =

2
3

1
2
4
8
, f(1) = , f(2) =
, f(3) =
, = 2, = 6
27
9
9
27
3

En los problemas 4-7 determine la probabilidad solicitada si X es una variable aleatoria


binomial, n el nmero de ensayos y p la probabilidad de xito en cualquier ensayo
4. P(X = 5), n = 6, p = 0,2
R. 0,001536
5. P(X = 2), n = 4, p =

R.

96
625

6. P(X 2), n = 5, p =

R.

4
5

1
2

3
16

7. P(X 2), n = 6, p =

2
3

8. Una moneda legal es lanzada 10 veces. Cul es la probabilidad de que aparezcan


exactamente ocho caras?
R.

45
1024

9. Una urna contiene cuatro canicas rojas y seis verdes, y son sacadas al azar cuatro
canicas en sucesin con reemplazo. Determine la probabilidad de que exactamente una
canica sea verde
R.

96
625

10. Un fabricante produce interruptores elctricos, de los cuales el 2% son defectuosos.


De una corrida de produccin de 50.000 interruptores, cuatro son seleccionados
aleatoriamente y cada uno de ellos es probado. Determine la probabilidad de que la
muestra contenga exactamente dos interruptores defectuosos. Redondee su respuesta a
tres decimales. Suponga que los cuatro ensayos son independientes y que el nmero de
interruptores defectuosos en la muestra tiene una distribucin binomial
9

R. 0,002
11. Una moneda cargada es lanzada tres veces en sucesin. La probabilidad de que
salga cara en cualquier lanzamiento es de

1
. Encuentre la probabilidad de que
4

A. exactamente aparezcan dos caras,


B. aparezcan dos o tres caras
R. A.

9
5
. B.
64
32

1
son
3
defectuosos. Si se selecciona al azar una muestra de cuatro, encuentre la probabilidad de
que no ms de uno sea defectuoso
12. En la produccin de un lote grande de dispositivos electrnicos, se cree que

R.

16
27

13. La probabilidad de que un cierto jugador de beisbol d un hit es de 0,3. Encuentre la


probabilidad de que si l batea cuatro veces, dar al menos un hit
R. 0,7599
14. Si una familia tiene cinco hijos, encuentre la probabilidad de que al menos dos sean
nias. (Suponga que la probabilidad de que un hijo sea nia es de

R.

1
)
2

13
16

15. Suponga que X es una variable aleatoria distribuida binomialmente tal que = 2 y
2 =

R.

3
. Encuentre P(X = 1)
2

2187
8192
LA DISTRIBUCION NORMAL

Los datos de mediciones hechas en la prctica, como la altura de las personas en una
poblacin son a menudo representados por una variable aleatoria cuya funcin de
densidad puede aproximarse por la curva en forma de campana

10

La curva se extiende indefinidamente hacia la derecha y hacia la izquierda y nunca toca al


eje x. Esta curva, llamada curva normal, es la grfica ms importante de todas las
funciones de densidad: la funcin de densidad normal.
Una variable aleatoria continua X es una variable aleatoria normal o tiene una distribucin
normal (o gaussiana), si su funcin de densidad est dada por
f ( x)

2
1
e (1 / 2 )[( x ) / ] , - x ,
2

llamada funcin de densidad normal. Los parmetros y son la media y la desviacin


estndar de X, respectivamente.
La desviacin estndar juega un papel muy importante en la descripcin de
probabilidades asociadas con una variable aleatoria normal X. Ms precisamente, la
probabilidad de que X se encuentre dentro de una desviacin estndar de la media es
aproximadamente de 0,68
P( - X + ) = 0,68
En otras palabras, aproximadamente el 68% del rea bajo una curva normal est dentro
de una desviacin estndar alrededor de la media. Entre 2 est aproximadamente el
95% del rea y entre 3 queda ms o menos el 99,7%
11

P( - 2 X + 2) = 0,95
P( - 3 X + 3) = 0,997

Ejemplo:
Sea X una variable aleatoria cuyos valores son las calificaciones obtenidas en una prueba
aplicada a estudiantes de bachillerato. Supongamos que, para fines de establecer un
modelo, X est distribuida normalmente con una media de 600 y una desviacin estndar
de 90. La probabilidad de que X se encuentre dentro de 2 = 2(90) = 180 puntos
alrededor de 600 es 0,95. En otras palabras, el 95% de las calificaciones se encuentran
entre 420 y 780. Similarmente, el 99,7% de las calificaciones estn dentro de 3 = 3(90) =
270 puntos alrededor de 600, esto es, entre 330 y 870.
Si Z es una variable aleatoria distribuida normalmente con = 0 y = 1, obtenemos la
curva normal, llamada curva normal estndar
12

PROBABILIDADES PARA LA VARIABLE NORMAL ESTANDAR Z


Ejemplos:
Hallar:
1. P(Z 1,5)
P(Z 1,5) = 0,5 A(1,5) = 0,5 0,4332 = 0,0668 = 6,68%

13

2. P(0,5 z 2)
P(0,5 z 2) = A(2) A(0,5) = 0,4772 0,1915 = 0,2857 = 28,57%

14

3. P(Z 2)
P(Z 2) = 0,5 + A(2) = 0,5 + 0,4772 = 0,9772 = 97,72%

15

4. P(-2 Z -0,5)
P(-2 Z -0,5) = P(0,5 Z 2) = A(2) A(0,5) = 0,2857 = 28,57%

16

TRANSFORMACION A UNA VARIABLE NORMAL ESTANDAR Z


Si X est distribuida normalmente con media y desviacin estndar , entonces
Z

Ejemplos:
1. Suponga que X est distribuida normalmente con = 4 y = 2. Encontrar P(0 X 6)

z1

x1 0 4

17

z2

x2 6 4

P(0 X 6) = P(-2 Z 1) = A(2) + A(1) = 0,4772 + 0,3413 = 0,8185 = 81,85%

2. Suponer que los salarios semanales de 5.000 empleados en una empresa estn
distribuidos normalmente con una media de $ 450 y desviacin estndar de $ 40.
Cuntos empleados ganan menos de $ 400 semanalmente?
400 450

P(Z < -1,25)


P(X 400) = P Z
40

P(X < 400) = P(Z < -1,25) = P(z > 1,25) = 0,5 A(1,25) = 0,5 0,3944 = 0,1056 = 10,56%
Esto significa que el 10,56% de los empleados tienen salarios menores a $ 400, lo cual
corresponde a (0,1056)(5.000) = 528 empleados
18

Ejercicios:
1. Si Z es una variable aleatoria normal estndar, encuentre cada una de las siguientes
probabilidades:
A. P(0 Z 1,8)
B. P(0,45 Z 2,81)
C. P(Z -1,22)
D. P(Z 2,93)
E. P(-2,61 Z 1,4)
F. P(Z 0,07)
R. A. 0,4641. B. 0,3239. C. 0,8888. D. 0,9983. E. 0,9147. F. 0,4721

19

En los problemas 2-4 encuentre zo tal que el enunciado dado sea verdadero. Suponga
que Z es una variable aleatoria normal estndar
2. P(Z zo) = 0,5517
R. 0,13
3. P(Z zo) = 0,8599
R. -1,08
4. P(-zo Z zo) = 0,2662
R. 0,34
5. Si X est distribuida normalmente con = 16 y = 4, encuentre cada una de las
siguientes probabilidades:
A. P(x 22)
B. P(X 10)
C. P(10,8 X 12,4)
R. A. 0,9332. B. 0,0668. C. 0,0873
6. Si X est distribuida normalmente con = -3 y = 2, encuentre P(X -2)
R. 0,3085
7. Si X est distribuida normalmente con = 25 y 2 = 9, encuentre P(19 X 28)
R. 0,8185
8. Si X est distribuida normalmente tal que = 40 y P(X 54) = 0,0401, encuentre
R. 8
9. Las calificaciones de un examen a nivel nacional estn distribuidas normalmente con
una media de 500 y desviacin estndar de 100. Qu porcentaje de los que presentaron
el examen tuvieron una calificacin mayor a 630?
R. 9,68%
10. El coeficiente de inteligencia (IQ) en una gran poblacin de nios est distribuido
normalmente con una media de 100,4 y desviacin estndar de 11,6. Qu porcentaje de
los nios tiene un IQ mayor que 125?
R. 1,7%
LA APROXIMACION NORMAL A LA DISTRIBUCION BINOMIAL
20

Si X es una variable aleatoria binomial y n es lo suficientemente grande, la distribucin de


X puede aproximarse por una variable aleatoria normal cuya media y desviacin estndar
sean las mismas que para X, las cuales son np y npq , respectivamente.
Ejemplos:
1. Supongamos que X es una variable aleatoria binomial con n = 100 y p = 0,3. Estimar
P(X = 40) usando la aproximacin normal
= np = (100)(0,3) = 30

npq

(100)(0,3)(0,7)

21 4,58

39,5 30
2,07
4,58
40,5 30
z 2
2,29
4,58
z1

P(X = 40) = P(2,07 Z 2,29) = A(2,29) A(2,07) = 0,4890 0,4808 = 0,0082 = 0,82%

21

2. En un experimento de control de calidad, se toma una muestra de 500 artculos de una


lnea de ensamblaje. Usualmente, el 8% de los artculos producidos salen defectuosos.
Cul es la probabilidad de que ms de 50 artculos defectuosos aparezcan en la
muestra?
= np = (500)(0,08) = 40

npq

(500)(0,08)(0,92)

36,8 6,07

50,5 40
1,73
6,07

P(X 51) = P(Z 1,73) = 0,5 A(1,73) = 0,5 0,4582 = 0,0418 = 4,18%

22

Ejercicios:
En los problemas 1-4 X es una variable aleatoria binomial con los valores dados de n y p.
Calcule las probabilidades indicadas usando la aproximacin normal
1. n = 150, p = 0,4; P(X 52), P(X 74)
R. 0,1056; 0,0122
2. n = 50, p = 0,3; P(X = 18), P(X 18)
3. n = 200, p = 0,6; P(X = 125), P(110 X 135)
R. 0,0430; 0,9232
4. n = 25, p = 0,25; P(X 5)
5. Suponga que un dado se lanza 300 veces. Cul es la probabilidad de que el 5 caiga
entre 45 y 60 veces inclusive?
23

R. 0,7507
6. Un servicio de entregas tiene una flotilla de 60 camiones. En cualquier momento, la
probabilidad de que un camin quede fuera de uso por descompostura o mantenimiento
es de 0,1. Cul es la probabilidad de que 7 o ms camiones estn fuera de servicio en
cualquier momento?
R. 0,4129
7. En una fbrica se toma una muestra de 100 objetos de la lnea de ensamblado. Para
cada objeto de la muestra, la probabilidad de que est defectuoso es de 0,06. Cul es la
probabilidad de que haya 3 o ms objetos defectuosos en la muestra?
8. En un examen tipo verdadero o falso con 20 preguntas, cul es la probabilidad de
acertar adivinando por lo menos a 12 preguntas? Si son 100 las preguntas, cul es la
probabilidad de acertar adivinando por lo menos a 60?
R. 0,2514; 0,0287
MUESTRA
Una muestra es un subconjunto de la poblacin que ha sido seleccionada con una tcnica
estadstica llamada diseo de muestreo para garantizar que la muestra sea representativa
de la poblacin, es decir, que las unidades sean seleccionadas aleatoriamente, de tal
forma que cada una de ellas tenga la misma probabilidad de ser seleccionada
MUESTREO
Es una tcnica estadstica mediante la cual se seleccionan aquellos elementos de la
poblacin que conforman la muestra y se registran sus caractersticas
METODOLOGIA PARA HACER MUESTREO
Para realizar un muestreo se debe llevar a cabo un proceso que va desde la planeacin y
termina con la inferencia de los resultados. En dicho proceso metodolgico se debe tener
en cuenta las siguientes caractersticas:
Tamao de la poblacin: finita (cuando se conoce el nmero de individuos que la
componen) o infinita (cuando no se conoce su nmero)
Objetivos de la investigacin
Preguntas a realizar
Tipos de muestreo
Forma de recolectar la informacin
Recurso humano
24

Recursos econmicos
Recursos fsicos
Recursos tecnolgicos
Cronograma
TIPOS DE MUESTREO
Segn la forma como se seleccione los elementos a encuestar, el muestreo se puede
clasificar en:
1. MUESTREO NO PROBABILISTICO
2. MUESTREO PROBABILISTICO O ALEATORIO:
-Muestreo aleatorio simple
-Muestreo aleatorio sistemtico
-Muestreo aleatorio estratificado
-Muestreo aleatorio por conglomerados
En el mtodo de muestreo no probabilstico, se seleccionan a los sujetos siguiendo
determinados criterios personales procurando que la muestra sea representativa.
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio del
azar, es decir, todos los elementos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra. Los mtodos de muestreo probabilsticos nos aseguran la
representatividad de la muestra extrada y son, por lo tanto, los ms recomendados.
En el Muestreo Aleatorio Simple se asigna un nmero a cada elemento de la poblacin y a
travs de algn medio mecnico (papeletas, nmeros aleatorios generados por la
calculadora o el excel, etc.) se eligen tantos sujetos como sea necesario para completar
el tamao de muestra requerido.
En el Muestreo Aleatorio Sistemtico todos los elementos de la poblacin, deben estar
ordenados en una lista en la cual se toman grupos para seleccionar los elementos al azar
haciendo desplazamientos sistemticos. La manera de la seleccin depende del nmero
de elementos incluidos en la poblacin y el tamao de la muestra. El nmero de
elementos en la poblacin es, primero, dividido por el nmero deseado en la muestra. El
cociente indicar si cada dcimo, cada onceavo, o cada centsimo elemento en la
poblacin va a ser seleccionado. El primer elemento de la muestra es seleccionado al
azar.
En el Muestreo Aleatorio Estratificado se divide la poblacin en grupos homogneos al
interior, de donde se extraen al azar de cada grupo un cierto nmero de elementos. Lo
25

que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
inters estarn representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarn parte de la muestra. El
nmero de elementos seleccionado de cada estrato puede ser proporcional o
desproporcional al tamao del estrato en relacin con la poblacin.
En el Muestreo Aleatorio por Conglomerados el universo se divide en grupos que son muy
heterogneos al interior y homogneos al exterior. Una muestra de conglomerados
produce un mayor error muestral que una muestra aleatoria simple del mismo tamao
DETERMINACION DEL TAMAO DE LA MUESTRA
Uno de los principales problemas que se deben resolver al efectuar una encuesta por
muestreo es la determinacin del tamao de la muestra. Dado que el muestreo es costoso
y requiere de tiempo, el objetivo al seleccionar una muestra es obtener una cantidad
especfica de informacin a un costo mnimo.
Cuando los elementos de la poblacin presentan caractersticas similares, una muestra
pequea produce la misma cantidad de informacin que una muestra grande. Por otro
lado, si la poblacin presenta caractersticas muy diferentes entre s, una muestra
pequea puede ser un reflejo muy deficiente de las caractersticas de la poblacin.
Los objetivos de la seleccin del diseo de muestreo y de la seleccin del tamao de la
muestra son los mismos, obtener una cantidad de informacin al mnimo costo. Las
decisiones sobre el diseo de la muestra se toman de acuerdo con la forma en que los
elementos se agrupan en la poblacin y de acuerdo con el costo de la obtencin de la
informacin contenida en esos elementos.
El tamao adecuado de una muestra depende de tres factores:
1. El tamao de la poblacin o universo
2. El nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de
que los resultados de nuestra investigacin sean ciertos: un 95% de confianza es lo
mismo que decir que nos podemos equivocar con una probabilidad del 5%.
Los que llevan a cabo el estudio eligen el nivel de confianza. Los niveles de confianza de
95% y 99% son los ms comunes. El nivel de confianza de 95% corresponde al valor z de
1,96, y el nivel de confianza de 99%, a un valor z de 2,58. Mientras ms alto sea el nivel
de confianza elegido, mayor ser el tamao de la muestra correspondiente.
3. El error muestral deseado. El error muestral es la diferencia que puede haber entre el
resultado que obtenemos preguntando a una muestra de la poblacin y el que
obtendramos si preguntramos al total de ella. El margen de error promedio en un
estudio de investigacin es de +/- 5%. El mximo normalmente aceptado es de 10%.
Ejemplos:
26

1. Si los resultados de una encuesta dicen que 100 personas compraran un producto y
tenemos un error muestral del 5%, comprarn entre 95 y 105 personas
2. Si los resultados de una encuesta electoral indicaran que un partido iba a obtener el
55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de
votos estar en el intervalo 52-58%
TAMAO DE LA MUESTRA
z 2 pqN
n= 2
e ( N 1) z 2 pq

donde:
n: es el tamao de la muestra
z: es el valor normal estndar correspondiente al nivel de confianza deseado
e: es el error mximo admisible
p: es la proporcin de individuos que poseen en la poblacin la caracterstica de estudio.
Este dato es generalmente desconocido y se suele suponer que p = q = 0,5 que es la
opcin ms segura
q: es la proporcin de individuos que no poseen esa caracterstica, es decir, q = 1 - p
Ejemplos:
1. Si se requiere realizar una encuesta de satisfaccin a clientes de un determinado
modelo de auto del que hemos vendido 10.000 unidades, en la que queremos un nivel de
confianza del 95%, deseamos un error muestral del 5% y consideramos que estarn
satisfechos el 50%. Determinar el tamao de la muestra
n=

(1,96) 2 (0,5)(0,5)(10.000)
369,98 370
(0,05) 2 (9.999) (1,96) 2 (0,5)(0;5)

Necesitamos una muestra de 370 clientes


2. Necesitamos contrastar el porcentaje de personas de un pas que ven un determinado
programa de televisin. Si la poblacin del pas es de 40.000.000 de personas, estimamos
que lo ve el 20% de la poblacin, queremos una confianza del 95% y estamos dispuestos
a asumir un error muestral del 5%. Cul ser el tamao de la muestra?
n=

(1,96) 2 (0,2)(0,8)(40.000.000)
245,86 246
(0,05) 2 (39.999.999) (1,96) 2 (0,2)(0,8)

Se debe encuestar a 246 personas


27

REGRESION LINEAL Y CORRELACION


ANLISIS DE CORRELACIN: es el estudio de la relacin entre dos variables. El primer
paso es representar los datos en un diagrama de dispersin.
Ejemplo:
Copier Sales of Amrica vende copiadoras a empresas de todos tamaos en Estados
Unidos y Canad. Hace poco ascendieron a la seora Marcy Bancer al cargo de gerente
nacional de ventas. Ella desea determinar si hay alguna relacin entre el nmero de
llamadas de ventas en un mes y el nmero de copiadoras vendidas ese mes. Para ello
selecciona una muestra aleatoria de 10 representantes de ventas y determina el nmero
de llamadas de ventas que cada uno hizo el mes pasado y el nmero de copiadoras
vendidas. La informacin muestral aparece en la siguiente tabla. Qu observaciones
cabe hacer al respecto de la relacin entre el nmero de llamadas de ventas y el nmero
de copiadoras vendidas? Elabore un diagrama de dispersin para representar la
informacin

NUMERO DE LLAMADAS DE VENTAS Y COPIADORAS VENDIDAS


Representante de ventas
Tom Keller

Nmero de llamadas de
ventas

Nmero de copiadoras
vendidas

20

30
28

Jeff Hall

40

60

Brian Virost

20

40

Greg Fish

30

60

Susan Welch

10

30

Carlos Ramrez

10

40

Rich Niles

20

40

Mike Kiel

20

50

Mark Reynolds

20

30

Soni Jones

30

70

Total

220

450

Al revisar los datos, la seora Bancer sospecha que hay una relacin entre el nmero de
llamadas de ventas hechas en un mes y el nmero de copiadoras vendidas. Es decir, los
vendedores que hicieron ms llamadas de venta vendieron ms unidades. Sin embargo,
la relacin no es perfecta o exacta. Por ejemplo, Soni Jones hizo menos llamadas de
ventas que Jeff Hall, pero vendi ms unidades.
La implicacin es que el nmero de copiadoras vendidas se relaciona con el nmero de
llamadas de ventas. Conforme aumenta el nmero de llamadas de venta, parece que el
nmero de copiadoras vendidas tambin aumenta. De este modo, el nmero de llamadas
de ventas se considera variable independiente (se muestra en el eje x), y el de copiadoras
vendidas, variable dependiente (se muestra en el eje y).

29

El diagrama de dispersin muestra que los representantes con ms llamadas tienden a


vender ms copiadoras. Es razonable que la seora Bancer, gerente nacional de ventas
en Copier Sales of Amrica, diga a sus vendedores que, entre ms llamadas de ventas
hagan, se espera que vendan ms copiadoras. Observe que, aunque parece haber una
relacin positiva entre las dos variables, no todos los puntos se encuentran en una recta.
COEFICIENTE DE CORRELACION: describe la fuerza de la relacin entre dos conjuntos
de variables. Se designa con la letra r. Puede adoptar cualquier valor de -1 a +1, inclusive.
Un coeficiente de correlacin de -1 o bien de +1 indica una correlacin perfecta. Por
ejemplo, un coeficiente de correlacin para el caso anterior calculado a +1 indicara que el
nmero de llamadas de ventas y el nmero de copiadoras vendidas estn perfectamente
relacionadas en un sentido lineal positivo. Un valor calculado de -1 revela que las
llamadas de ventas y el nmero de copiadoras vendidas estn perfectamente
relacionadas en un sentido lineal negativo

30

En la siguiente grfica se muestran los diagramas de dispersin para r = 0, una r dbil y


una r fuerte. Observe que, si la correlacin es dbil, se presenta una dispersin
31

considerable respecto de la recta trazada a travs del centro de los datos. Para el
diagrama de dispersin que representa una fuerte relacin, hay muy poca dispersin
respecto de la recta
Correlacin

Correlacin

negativa

No hay

positiva

perfecta

correlacin

perfecta

Correlacin

Correlacin

Correlacin

Correlacin

Correlacin

Correlacin

negativa

negativa

negativa

positiva

positiva

positiva

fuerte

moderada

dbil

dbil

moderada

fuerte

-1

-0,5
Correlacin negativa

0,5

Correlacin positiva

CALCULO DEL COEFICIENTE DE CORRELACION


DESVIACIONES DE LA MEDIA Y SUS PRODUCTOS
32

Representante de ventas

Llamadas (X)

Ventas (Y)

X X

Y Y

( X X )(Y Y )

Tom Keller

20

30

-2

-15

30

Jeff Hall

40

60

18

15

270

Brian Virost

20

40

-2

-5

10

Greg Fish

30

60

15

120

Susan Welch

10

30

-12

-15

180

Carlos Ramrez

10

40

-12

-5

60

Rich Niles

20

40

-2

-5

10

Mike Kiel

20

50

-2

-10

Mark Reynolds

20

30

-2

-15

30

Soni Jones

30

70

25

200

Total

220

450

( X X )(Y Y )
( n 1) S x S y

900

900
0,759
(10 1)(9,189)(14,337)

donde:
SX y Sy: desviaciones estndar muestrales
Sx

(X X )

Sy

(Y Y )

n 1

n 1

COEFICIENTE DE DETERMINACION: en el ejemplo anterior, la relacin entre el nmero


de llamadas de ventas y las unidades vendidas, el coeficiente de correlacin, 0,759, se
interpret como fuerte. Sin embargo, los trminos dbil, moderado y fuerte no tienen un
significado exacto. Una medida cuyo significado se interpreta con ms facilidad es el
coeficiente de determinacin. Este se calcula elevando al cuadrado el coeficiente de
correlacin, es decir:
r2 = (0,759)2 = 0,576
Esta es una proporcin o un porcentaje; es posible decir que el 57,6% de la variacin en
el nmero de copiadoras vendidas se explica, por la variacin en el nmero de llamadas
de ventas.
33

Ejercicios:
1. Las siguientes observaciones muestrales se seleccionaron de manera aleatoria
X

10

Determine el coeficiente de correlacin y el de determinacin. Interprtelos.


R. 0,7522; 0,5658 capitulo 13 ejercicio 1 pag 470
2. Bi-lo Appliance Super-Store tiene tiendas en varias reas metropolitanas de Nueva
Inglaterra. El gerente general de ventas planea transmitir un comercial para una cmara
digital en estaciones de televisin locales antes de una venta que empezar el sbado y
terminar el domingo. Planea obtener la informacin para las ventas de la cmara digital
durante el sbado y el domingo en las diversas tiendas y compararlas con el nmero de
veces que se transmiti el anuncio en las estaciones de televisin. El propsito es
determinar si hay alguna relacin entre el nmero de veces que se transmiti el anuncio y
las ventas de cmaras digitales. Los pares son:
Ubicacin de la
estacin de TV

Nmero de transmisiones

Ventas de sbado a domingo

Providence

15

Springfield

New Haven

21

Boston

24

Hartford

17

(miles de dlares)

A. Trace un diagrama de dispersin


B. Determine el coeficiente de correlacin
C. Establezca el coeficiente de determinacin
D. Interprete estas medidas estadsticas
R. B. 0,9295. C. 0,8640
capitulo 13 ejercicio 3 pag 471

34

3. El ayuntamiento de la ciudad de Pine Bluffs considera aumentar el nmero de policas


en un esfuerzo para reducir los delitos. Antes de tomar una decisin final, el ayuntamiento
pide al jefe de polica realizar una encuesta en otras ciudades de tamao similar para
determinar la relacin entre el nmero de policas y el nmero de delitos reportados. El
jefe de polica reuni la siguiente informacin muestral
Ciudad

Policas

Nmero de delitos

Oxford

15

17

Starksville

17

13

Danville

25

Athens

27

Holgate

17

Carey

12

21

Whistier

11

19

Woodville

22

A. Trace un diagrama de dispersin


B. Determine el coeficiente de correlacin
C. Establezca el coeficiente de determinacin
D. Interprete estas medidas estadsticas. Le sorprende que la relacin sea inversa?
R. B. -0.8744. C. 0,7646.
capitulo 13 ejercicio 5 pag 475

ECUACION DE REGRESION: ecuacin que expresa la relacin lineal entre dos variables.
FORMA GENERAL DE LA ECUACION DE REGRESION LINEAL:
y = mx + b
donde:
35

y: es el valor del estimado de la variable y para un valor x seleccionado


m: es la pendiente de la recta
b: es el valor estimado de y donde la recta de regresin cruza al eje y cuando x = 0
PENDIENTE DE LA RECTA DE REGRESION:

SY
Sx

m r

donde:
r: es el coeficiente de correlacin
Sy: es la desviacin estndar de y
Sx: es la desviacin estndar de x
INTERSECCION CON EL EJE Y:
b y mx

donde:
x : es la media de x (la variable independiente)
y

: es la media de y (la variable dependiente)

En el ejemplo de Copier Sales of Amrica, la gerente de ventas reuni informacin sobre


el nmero de llamadas de ventas y el nmero de copiadoras vendidas de una muestra de
10 representantes de ventas. Como parte de su presentacin en la siguiente reunin de
ventas, la seora Bancer, gerente de ventas, desea presentar informacin especfica
acerca de la relacin entre el nmero de llamadas de ventas y el nmero de copiadoras
vendidas. Para ello debe determinar una ecuacin lineal que exprese la relacin entre
ambas variables. Cul es el nmero esperado de copiadoras vendidas por un
representante de ventas que hizo 20 llamadas?

Sy

14,337
0,759
1,1842
9,189
Sx

m r

b y m x 45 (1,1842)( 22) 18,9476

As, la ecuacin de regresin es:


y = 1,1842x + 18,9476
Por tanto, si un vendedor hace 20 llamadas, esperara vender
36

y = (1,1842)(20) + 18,9476 = 42,6316 copiadoras


GRAFICA DE LA RECTA DE REGRESION
Representante de ventas

Llamadas de ventas (X)

Ventas estimadas (Y)

Tom Keller

20

42,6316

Jeff Hall

40

66,3156

Brian Virost

20

42,6316

Greg Fish

30

54,4736

Susan Welch

10

30,7896

Carlos Ramrez

10

30,7896

Rich Niles

20

42,6316

Mike Kiel

20

42,6316

Mark Reynolds

20

42,6316

Soni Jones

30

54,4736

Ejercicios:
1. Las siguientes observaciones muestrales se seleccionaron al azar
x

8
37

13

15

12

13

11

A. Determine la ecuacin de regresin


B. Encuentre el valor de y cuando x es 7
capitulo 13 ejercicio 14 pag 481 igual al 13

2. La Bradford Electric Iluminating Company estudia la relacin entre kilowatts-hora


(miles) usados y el nmero de habitaciones en una residencia privada familiar. Una
muestra aleatoria de 10 casas revel lo siguiente:
Nmero de habitaciones

kilowatts-hora (miles)

12

14

10

10

10

10

10

A. Determine la ecuacin de regresin.


B. Encuentre el nmero de kilowatts-hora, en miles, para una casa de seis habitaciones.
R. A. y = 0,667x + 1,333. B. 5,335
3. El seor James McWhinney, presidente de Daniel-James Financial Services, considera
que hay una relacin entre el nmero de contactos con sus clientes y la cantidad de
ventas en dlares. Para documentar esta afirmacin, el seor McWhinney reuni la
siguiente informacin muestral. La columna X indica el nmero de contactos con sus
38

clientes el mes anterior, y la columna Y muestra el valor de las ventas (miles de $) el


mismo mes por cada cliente muestreado
Nmero de contactos

Ventas (miles de dlares)

14

24

12

14

20

28

16

30

46

80

23

30

48

90

50

85

55

120

50

110

A. Trace un diagrama de dispersin


B. Determine la ecuacin de regresin
C. Encuentre las ventas estimadas si se hicieron 40 contactos

NUMEROS INDICE
Un nmero ndice es una medida estadstica diseada para poner de relieve cambios en
una variable o en un grupo de variables relacionadas con respecto al tiempo, situacin
geogrfica, ingresos, etc.
APLICACIONES DE LOS NUMEROS INDICE
Los nmeros ndice se usan para hacer comparaciones. Por ejemplo, con nmeros ndice
podemos comparar los costos de alimentacin o de otros servicios en una ciudad durante
un ao con los del ao anterior, o la produccin de caf en un ao en una zona del pas
con la de otra zona. Aunque se usan principalmente en economa y la industria, los
nmeros ndice son aplicables en muchos otros campos.

39

Muchos gobiernos y agencias privadas se ocupan de elaborar nmeros ndice con el


propsito de predecir condiciones econmicas o industriales, tales como ndices de paro,
de produccin, salariales, etc. Tal vez el ms conocido sea el ndice de costo de la vida o
ndice de precios al consumidor, que elabora el Dane.
RELACIONES DE PRECIOS
Uno de los ejemplos ms simples de un nmero ndice es una relacin de precios, que no
es sino el cociente entre el precio de un artculo en un periodo dado y su precio en otro
periodo, conocido como periodo base o periodo de referencia. Supondremos, que los
precios en cada periodo son constantes. Si no lo son, podemos tomar un promedio
adecuado para el periodo.
Si pn y po denotan los precios de un artculo durante el periodo dado y el periodo base,
respectivamente, entonces
Relacin de precios =

pn
po

La relacin de precios se expresa generalmente como un porcentaje.


Si pa y pb son los precios de un artculos durante los periodos a y b, respectivamente, la
relacin de precios en el periodo b con respecto al periodo a se denota por pa|b.
RELACIONES DE CANTIDAD O DE VOLUMEN
En vez de comparar los precios de un artculo, podemos estar interesados en comparar
las cantidades (o volmenes) de produccin, consumo o exportacin. En tales casos
hablamos de relaciones de cantidad o relaciones de volumen. Por sencillez, como en el
caso de los precios, suponemos que las cantidades son constantes en cada periodo. Si
no lo son, se pueden tomar promedios adecuados.
Si qo denota la cantidad (o volumen) de un artculo que se ha producido, consumido,
exportado, etc. durante un periodo base, y qn la correspondiente cantidad producida,
consumida, exportada, etc. durante un periodo dado, definimos
Relacin de cantidad o de volumen =

qn
qo

que se suele expresar como porcentaje.


Al igual que para las relaciones de precios, usamos la notacin q a|b para denotar la
relacin de cantidad en el periodo b respecto al periodo a.
RELACIONES DE VALOR
Si p es el precio de un artculo durante un periodo y q es la cantidad (o volumen)
producida, vendida, etc., durante ese periodo, entonces pq se llama el valor total.
40

Si po y qo son el precio y la cantidad de un artculo durante un periodo base, y p n y qn el


precio y la cantidad correspondientes a un periodo dado, los valores totales durante esos
periodos vienen dados por vo y vn, respectivamente, y definimos
Relacin de valor =

vn pn

v o po

qn

qo

Las mismas observaciones, notacin y propiedades aplicables a las relaciones de precios


y a las relaciones de cantidad lo son a las relaciones de valor. En particular, si pa|b, qa|b y va|
b denotan las relaciones de precios, cantidad y valor del periodo b respecto al periodo a,
entonces
va|b = pa|bqa|b
Ejemplos:
1. Si el salario mnimo mensual en Colombia en los aos 2009 y 2010 era de $ 496.900 y
$ 515.000 respectivamente, hallar la relacin de precios
Relacin de precios = p200912010 =

precioen 2010 515.000

1,036 103,6%
precioen 2009 496.900

Este resultado significa que en 2010 el valor del salario mnimo era el 103,6% del de
2009; es decir, aument un 3,6%
2. En enero de 1980 una empresa pag un total de $ 80.000 a 120 empleados en
nmina. En julio de ese mismo ao, la empresa tena 30 trabajadores ms en nmina y
pag $ 12.000 ms que en enero.
A. Con enero de 1980 como base, hallar el nmero ndice de empleo (la relacin de
cantidad) para julio.
B. Con enero de 1980 como base, hallar el nmero ndice (relacin de valor) trabajogasto para julio.
C. Usando el resultado relacin de precios x relacin de cantidad = relacin de valor,
qu interpretacin se puede dar a la relacin de precios en este caso?
A.

Relacin de cantidad =

B.

Relacin de valor =

C.

q n 150
1,25 125%
=
q o 120

v n $92.000

1,15 115 %
vo $80.000

Relacin de valor = relacin de precios x relacin de cantidad

41

Relacin de precios =

relacinde valor
relacinde cantidad

Relacin de precios =

1,15
0,92 92%
1,25

Podemos interpretar el resultado como un nmero ndice de costo por empleado. Lo cual
significa que en julio de 1980 el costo por empleado era el 92% del de enero de 1980
Ejercicios:
1. Los precios al por menor del cine en E.E.U.U durante 1978-1984 se ven en la tabla.
A. Con 1978 como base, hallar las relaciones de precios correspondientes a los aos
1982 y 1984.
B. Con 1978-1980 como periodo base, hallar las relaciones de precios correspondientes
a los aos dados.

Ao

1978

1979

1980

1981

1982

1983

1984

Precio promedio del cine ($)

0,31

0,373

0,374

0,446

0,385

0,414

0,486

Ao

1978

1979

1980

1981

1982

1983

1984

Relacin de precios (%)

88,1

106

106,3

126,7

109,4

117,6

138,1

R. A. 124,2%; 156,8%
R. B.

2. La tabla muestra las relaciones de valor y de precios de un artculo en los aos 19821986. Hallar las relaciones de cantidad para dicho artculo con
A. 1982 como base.
B. 1982-1984 como base.
Ao

Relacin de precios

Relacin de valor

1982

100

150

1983

125

180

1984

150

207
42

1985

175

231

1986

200

252

43

44

S-ar putea să vă placă și