Sunteți pe pagina 1din 118

1

CAPTULO

I
PROBABILIDADES
1.1 CONCEPTO
La probabilidad es una disciplina abstracta que se usa como modelo
para hacer deducciones relativas a eventos que posiblemente puedan
ocurrir.
En estadstica intentamos expresar la probabilidad en trminos
cuantitativos precisos. Un enunciado probabilstico puede predecir
todos los casos desde la certeza de que el suceso ocurrir hasta la
certeza de que no ocurrir.

Si es seguro que ocurrir un suceso especifico, la probabilidad de que


ocurra equivale a uno (1). Si no existe posibilidad alguna de que ocurra,
la probabilidad es cero (0). Los enunciados probabilsticos, por tanto,
tienen un rango de 0 a 1 inclusive, y son habitualmente expresados
como fracciones, decimales o porcentajes.
1.1.1 espacio muestral
Dado un ensayo aleatorio llamaremos espacio muestral al conjunto
de eventos simples. Por ejemplo:
(1) Tirar un dado, {1,2,3,4,5,6}
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

2
(2) Tirar 2 dados, {(1,1), (1,2),..., (5,6), (6,6)}
(3) Elegir un punto al azar en [0,1], {x: 0x1}
1.1.2. Evento
Llamaremos evento a un subconjunto de . Por ejemplo:
(1) A El nmero es par {2,4,6}
(2) B La suma es 10 {(4,6), (5,5),(6,4)}
(3) C {x: 0x1/2}
1.1.3. Probabilidad de un evento (motivacin emprica).
Repitamos un ensayo n veces y supongamos que un evento A del
mismo aparece kn veces. Sea:
fnkn/n frecuencia relativa de A en n ensayos.
Es un hecho emprico que fn tiende a un nmero fijo. A este nmero lo
llamamos probabilidad del evento A.
1.1.4. Relaciones entre eventos
espacio muestral un conjunto.
Evento A subconjunto de
0 evento imposible (nunca ocurre)
evento cierto (siempre ocurre)
Como los eventos son conjuntos, valen para ellos las mismas
operaciones y relaciones de los conjuntos pero se usan para ellas un
lenguaje peculiar a la teora de probabilidades:
(1) Si AB decimos que la ocurrencia de A implica la ocurrencia de B
(
2) Si AB BA AB.
(3) A A no ocurre.
c
c
cc
c
c
0 , 0, A A, AB B A
c

(4) AB A ocurre o B ocurre o ambos ocurren Por lo menos uno de


los eventos ocurre.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

3
AB=BA, A0A, A, A(BC)(AB)CABC.
Dados A1,A2,A3,... escribimos Ai Por lo menos uno ocurre.
(5) AB A y B ocurren simultneamente.
A00, AAA, A=A, ABBA, (AB)CA(BC)ABC.
Ai Ocurrencia simultnea de A1,A2,A3,...
(6) Leyes distributivas: (AB)CACBC,
c

(7) AB A ocurre y B no ocurre AB

AB BA, (AB)B A, (AB)CACBC, A A A .


c

(8) AB (AB)(BA) AB A B Ocurre exactamente uno de los


eventos.
c
A
A
AB
AB
c

AB Por lo menos uno de los dos eventos ocurre. AB Ambos eventos


ocurren
A B Ninguno ocurre
ocurre.

AB A B Exactamente uno de los eventos

c c

(AB) A B , (AB) A B (Relaciones de De Morgan ).


c

ABC Por lo menos uno ocurre. ABC Los tres ocurren.


A B C Ninguno ocurre.
c

c c

A B C A B C A B C Exactamente uno ocurre.


c c

ABC AB C A BC Exactamente dos ocurren.


AB BC AC Por lo menos 2 ocurren.
c

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

Designemos mediante B a una familia de subconjuntos de . . Decimos


que B es una algebra si es cerrada bajo un nmero finito de
operaciones de conjuntos. Ms precisamente, (1) A B
c
A B (2) A,B B ABB. Se deduce que AB, AB y AB pertenecen
a B.
Decimos que B es una algebra si es cerrada bajo un nmero infinito
contable de operaciones de conjuntos. Mas precisamente: (1) A B
c
A B (2) AnB An B. En particular, se deduce que si AnB
AnB.
Un ejemplo de un algebra que tambin es algebra es la familia de
todos los subconjuntos de .
1.2. TIPOS DE PROBABILIDADES
Existen tres enfoques para el estudio de la probabilidad.
a) Probabilidad Clsica
b) Probabilidad Emprica
c) Probabilidad Subjetiva

1.2.1. Probabilidad clsico o probabilidad a priori


Es conocido con el nombre de probabilidad a priori, debido a que es
posible conocer el resultado antes de que el hecho ocurra; es decir,
sin llevar a cabo el experimento y solo basado en un razonamiento
lgico. Se usa para experimentos simples.
Se conoce todos los resultados posibles y se supone que la probabilidad
de todos ellos por separado es la misma (son pues, resultados
equiprobables.
P( A)

X Nmero de casos de ocurrencia del evento A

n
Nmero de casos posibles

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

5
Ejemplo 1:
Hallar la probabilidad de obtener sello en el lanzamiento de una
moneda:
Solucin:
Definimos el espacio muestral: = {cara, sello}
Sea el evento:
A : obtener sello en el lanzamiento de una moneda
P( A)

X 1

n 2

p( A) 0,5100% 50%
La probabilidad de obtener sello en el lanzamiento de una moneda es
del 50%.

Ejemplo 2
:
Hallar la probabilidad de obtener el nmero tres en el lanzamiento de
un dado.
Solucin:
Definimos el espacio muestral: ={1, 2, 3, 4, 5, 6}
Sea el evento:
B : obtener el nmero tres en el lanzamiento de un dado
P( B)

X 1

n 6

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

p( B) 0,17100% 17%
La probabilidad de obtener el nmero tres en el lanzamiento del dado,
es del 17%.

1.2.2. Probabilidad emprica o probabilidad a posteriori


Llamado tambin probabilidad de frecuencia relativa o a posteriori, por
que se fundamenta en la repeticin de la ocurrencia de un evento, al
realizar una gran cantidad de pruebas o experimentos.
Se tiene algunas razones para suponer que las probabilidades de los
resultados posibles no son iguales, pero no se posee una herramienta
lgica para resolver el problema, por lo que se observa la situacin y se
anota durante un tiempo todo resultado. Se supone que la proposicin
de A durante el tiempo de observacin seguir imperturbable en el
futuro.
Ejemplo 3:
En una encuesta realizada a 400 vendedores ambulantes de la ciudad
de Juliaca, se encontr que 40 de ellos se dedicaban a esta actividad
porque haban sido despedidos de instituciones pblicas y privadas.
Hallar la probabilidad de que al seleccionar aleatoriamente un
vendedor ambulante, este haya sido despedido de uno de estos centros
de trabajo.
Solucin:
Sea el evento:
C : el vendedor ambulante ha sido despedido
Nmero de vendedores que han sido despedidos = 40
Nmero total de vendedores que fueron encuestados = 400
Luego:
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

P(C )

X
40

n 400

P(C) = 0,1(100%) = 10 %
La probabilidad de que al seleccionar un vendedor ambulante, este haya
sido despedido de uno de estos sectores, es del 10%.
1.2.3. Probabilidad subjetiva o personal
Es la probabilidad asignada bajo un criterio personal, basado en
cualquier tipo de evidencia disponible. Las probabilidades subjetivas se
asignan a eventos que pueden suceder solo una vez o muy pocas veces.
Se conoce todos los resultados, no se puede mantener que sean
equiprobables y no tiene sentido acudir a la experiencia observando la
situacin repetidas veces, o ambas cosas.
Ejemplo 4:
La probabilidad de que se encuentre una cura para el SIDA en los
prximos aos.

1.3. PROBABILIDAD DE DOS O MS EVENTOS


Dos o ms eventos pueden ser:
a)
b)
c)
d)

Mutuamente excluyentes.
No excluyentes o conjuntos.
Independientes.
Dependientes.

1.3.1. Eventos Mutuamente Excluyentes


Se usa cuando se desea averiguar la probabilidad de ocurrencia de uno
u otro evento.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

Si los eventos A y B son mutuamente excluyentes, la probabilidad de


ocurrencia de A o de B es:
P( A B) P( A) P( B)

donde:
P
: Probabilidad

: Smbolo de la unin (suma de probabilidades y debe leerse


como 0)

P(AB) : Probabilidad de que ocurra el evento A o B.


P(A)

: Probabilidad de que ocurra el evento A.

P(B)

: Probabilidad de que ocurra el evento B.

Ejemplo 5:
De 200 nios examinados por una nutricionista en un C. E., se encontr
que 80 padecan de desnutricin leve, 50 padecan de desnutricin
crnica y 70 normales. Si de los nios examinados se selecciona uno al
azar Cul es la probabilidad de que padezca de desnutricin leve o
crnica?.
Solucin:
Sean los eventos:
A: El nio seleccionado padece de desnutricin leve
B: El nio seleccionado padece de desnutricin crnica
C: El nio seleccionado es normal
n(A) = 80
n(B) = 50
n(C) = 70
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

Como los eventos son mutuamente excluyentes, se tiene:


P( A B) P( A) P( B)

P( A B)

80
50 130

0,65 65%
200 200 200

La probabilidad de que un nio seleccionado al azar padezca de


desnutricin leve o desnutricin crnica es de 65%.

1.3.2. Eventos No Excluyentes


Son eventos que se interceptan; es decir, que pueden ocurrir
simultneamente los dos eventos. La probabilidad de ocurrencia de A o
de B es:
P( A B) P( A) P( B) P( A B)

donde:
P(AB): Probabilidad de que ocurra el evento A o B.
P(AB): Probabilidad de que ocurran simultneamente los eventos A y
B.

Ejemplo 6:
De 100 pacientes adultos mayores examinados, 20 padecan de artritis,
32 padecan de gastritis y 8 tenan ambos males. Si se selecciona un
paciente al azar. Hallar la probabilidad de que el paciente
seleccionado padezca de artritis o gastritis?.
Solucin:
Sean los eventos:
A: El paciente seleccionado padece de artritis
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

10
B: El paciente seleccionado padece de gastritis
n(A) = 20
n(B) = 32
n(A B) = 8
Como los eventos son mutuamente no excluyentes, se tiene:
P(AB) : Probabilidad de que ocurran los eventos A o B.
P( A B) P( A) P( B) P( A B)
20 32
8
P( A B)

0,44 44%
100 100 100

La probabilidad de que el paciente seleccionado al azar, padezca de


artritis o gastritis es del 44%.

1.3.3. Eventos Independientes


Son sucesos independientes; es decir, que un suceso es independiente
de otro. Si los eventos A y B son independientes, se debe cumplir:
P(A/B) = P(A)
La ocurrencia de los eventos independientes de A y B, es:
P(AB) = P(A) P(B)
Ejemplo 7:
En el Centro poblado de Salcedo, la probabilidad de que una persona
sea mayor de 18 aos es del 45%, la probabilidad de que consuma
carne es del 15%. Si se selecciona una persona al azar de este centro
Poblado. Cul es la probabilidad de que consuma carne y tenga ms
de 18 aos de edad?.
Solucin:
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

11
Sean los eventos:
A: La persona elegida es mayor de 18 aos
B: La persona elegida consume carne
P(A) = 0,45
P(B) = 0,15
Entonces:
P(AB) = P(A) P(B)
P(AB) = (0,45)(0,15) = 0,0675 = 6,75%
La probabilidad de que una persona elegida en forma aleatoria del
Centro Poblado de Salcedo consuma carne y tenga ms de 18 aos de
edad, es de 6,75%.

1.3.4. Eventos Dependientes


Son aquellos en los que la probabilidad del segundo suceso fue
realmente afectado por el resultado del primero.
Si los eventos A y B son dependientes, entonces la ocurrencia
simultnea de los eventos es:
P(AB) = P(A) P(B/A)
Ejemplo 8:
En un estudio se encontr la probabilidad de que se incremente el
empleo en una ciudad, es de 35%; de que se incremente el consumo de
primera necesidad dado el incremento del empleo es de 10%. Cul es
la probabilidad de que se incremente el empleo y el consumo de ese
artculos de primera necesidad?
Solucin:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

12
Sean:
Eventos
A : Incremento del empleo

Probabilidades
P(A) = 0,35

B : Incremento del consumo de artculos


de primera necesidad
B/A: Incremento de consumo de artculos
de primera necesidad dado que se
incrementa el empleo
P(B/A) = 0,10

Entonces:
P (AB) = P(A)P(B/A)
P (AB) = (0,35)(0,10) = 0,035
La probabilidad de que haya un incremento en el empleo y en el
consumo de esos artculos de primera necesidad es del 3,5%.

Ejemplo 9:
La presente tabla refiere al Grado de selectividad a una Universidad
POSTULANTES

INGRESANTES

TOTAL

UNMSM

58459

4639

63098

UNAP

19574

2025

21599

TOTAL

78033

6664

84697

Probabilidad Marginal

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

13

El 74.5% de los jvenes tienen un grado de selectividad a la Universidad


Nacional Mayor de San Marcos.

El 25.5% de los jvenes tiene un grado de selectividad a la Universidad


Nacional del Altiplano Puno.

El 92.1% pertenece a la cantidad de postulantes tanto en la Universidad


Nacional Mayor de San Marcos y la Universidad Nacional del Altiplano
Puno

El 7.87% pertenece a la cantidad de ingresantes tanto en la Universidad


Nacional Mayor de San Marcos y la Universidad Nacional del Altiplano
Puno
Probabilidad Compuesta (Conjunta)

El 69% pertenece a la cantidad de postulantes que tienen el grado de


selectividad a la Universidad Nacional Mayor de San Marcos.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

14

El 5.5% pertenece a la cantidad de ingresantes que tienen el grado de


selectividad a la Universidad Nacional Mayor de San Marcos.

El 23.1% pertenece a la cantidad de postulantes que tienen el grado de


selectividad a la Universidad Nacional del Altiplano Puno.

El 2.4% pertenece a la cantidad de ingresantes que tienen el grado de


selectividad a la Universidad Nacional del Altiplano Puno.

Probabilidad Aditiva

El 97.6% de los jvenes que tiene el grado de selectividad pertenecen a


la UNMSM o pertenecen al grupo de los postulantes.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

15

El 76.8% de los jvenes que tiene el grado de selectividad pertenecen a


la UNMSM o pertenecen al grupo de los ingresantes.

El 94.5% de los jvenes que tiene el grado de selectividad pertenecen a


la UNAP o pertenecen al grupo de los postulantes.

El 30.9% de los jvenes que tiene el grado de selectividad pertenecen a


la UNAP o pertenecen al grupo de los ingresantes.
Probabilidad Condicional

Sabiendo que los jvenes que tiene un grado de selectividad a la


Universidad Nacional Mayor de san Marcos, la probabilidad de
pertenezca al grupo de los postulantes es de 92%.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

16
Sabiendo que los jvenes que tiene un grado de selectividad a la
Universidad Nacional Mayor de san Marcos, la probabilidad de
pertenezca al grupo de los ingresantes es de 7.3%.

Sabiendo que los jvenes que tiene un grado de selectividad a la


Universidad Nacional del Altiplano Puno, la probabilidad de pertenezca
al grupo de los postulantes es de 90.5%.

Sabiendo que los jvenes que tiene un grado de selectividad a la


Universidad Nacional del Altiplano Puno, la probabilidad de pertenezca
al grupo de los ingresantes es de 9.3%
1.4. TEOREMA DE BAYES
El teorema de Bayes es utilizado para calcular la probabilidad de que
cierto elemento seleccionado pertenezca a un grupo establecido,
conociendo la caracterstica de este elemento.
Si los eventos B1, B2, ... , Bk forman una particin del espacio muestral
y A es un evento cualquiera de , entonces se observa lo
siguiente:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

17

En las particiones del espacio muestral se observa que la caracterstica


A se presenta en cada una de las k particiones, de la cual se deduce la
siguiente frmula:

P( Br / A)

P( Br ) P( A / Br )
k

P( B ) P( A / B )
i 1

donde:
Bi
B1
B2
Bk
A

: El elemento seleccionado pertenece a la i-sima categora.


: El elemento seleccionado pertenece a la primera categora.
: El elemento seleccionado pertenece a la segunda categora.
: El elemento seleccionado pertenece a la k-sima categora.
: El elemento seleccionado tiene la caracterstica en estudio.

Ejemplo 10:
En un saln de clase se reuni a los alumnos de los cinco niveles de la
carrera profesional de Educacin Fsica, para realizar un estudio acerca
de la preferencia por la prctica del ftbol, obtenindose los siguientes
resultados:

Nivel
Primero
Segundo
Estadistca Inferencial

N de
Estudiantes
55
40

Practican
Ftbol
20
15
M.Sc. Julio R. Gallegos Ramos

18
Tercero
Cuarto
Quinto
TOTAL

35
40
30
200

20
10
5
70

Si se selecciona un estudiante y se observa que ste estudiante tiene


preferencia por el ftbol.
a.
b.
c.

Cul es la probabilidad que el estudiante seleccionado


pertenezca al primer nivel?
Cul es la probabilidad que el estudiante seleccionado
pertenezca al quinto nivel?
Cul es la probabilidad que el estudiante seleccionado
pertenezca al primero o quinto nivel?

Solucin
Se observa que el espacio muestral se ha particionado en cinco niveles,
a la vez se distinguen los siguientes eventos:
B1
B2
B3
B4
B5
A

: El estudiante seleccionado pertenece al primer nivel.


: El estudiante seleccionado pertenece al segundo nivel.
: El estudiante seleccionado pertenece al tercer nivel.
: El estudiante seleccionado pertenece al cuarto nivel.
: El estudiante seleccionado pertenece al quinto nivel.
: El estudiante seleccionado practica ftbol.

Las probabilidades de que el estudiante pertenezca a cada una de los


niveles son:

55
= 0,275
200
35
P(B3) =
= 0,175
200
40
P(B4) =
= 0,200
200
P(B1) =

Estadistca Inferencial

P(B2) =

40
= 0,200
200

P(B5) =

30
= 0,150
200
M.Sc. Julio R. Gallegos Ramos

19

Las probabilidades de que el estudiante elegido practique ftbol dado


que pertenece cada uno de los niveles son:

20
= 0,364
55
20
P(A/B3) =
= 0,571
35
10
P(A/B4) =
= 0,250
40
P(A/B1) =

a)

P(A/B2) =

15
= 0,375
40

P(A/B5) =

5
= 0,167
30

La probabilidad que el estudiante seleccionado pertenezca al


primer nivel dado que practica ftbol es:

P( B1 / A)

P( B1 ) P( A / B1 )

P( B ) P( A / B )
i 1

P( B1 ) P( A / B1 )
P( B1 ) P( A / B1 ) ...... P( B5 ) P( A / B5 )

(0,275)(0,364)
(0,275)(0,364) (0,200)(0,375) .... (0,150)(0,167)

P( B1 / A) 0,286

Existe un 28,6 % de probabilidad que el estudiante seleccionado


pertenezca al primer nivel dado que practica ftbol.

b)

La probabilidad que el estudiante seleccionado pertenezca al


quinto nivel dado que practica ftbol es:

P( B5 / A)

P( B5 ) P( A / B5 )
k

P( B ) P( A / B )
i 1

Estadistca Inferencial

P( B5 ) P( A / B5 )
P( B1 ) P( A / B1 ) ...... P( B5 ) P( A / B5 )

M.Sc. Julio R. Gallegos Ramos

20

(0,150)(0,167)
(0,275)(0,364) (0,200)(0,375) .... (0,150)(0,167)

P( B5 / A) 0,071

Existe un 7,1 % de probabilidad que el estudiante seleccionado


pertenezca al quinto nivel dado que practica ftbol.

c)

La probabilidad que el estudiante seleccionado pertenezca al


primero o quinto nivel dado que practica ftbol es:
P( B1 B5 ) / A P( B1 / A) P( B5 / A)
P( B1 B5 ) / A 0,286 0,071
P( B1 B5 ) / A 0,357

Existe un 35,7 % de probabilidad que el estudiante seleccionado


pertenezca al primero o quinto nivel dado que practica ftbol.
Ejemplo 11:
Una empresa de transporte pblico cubre tres rutas en la ciudad
Juliaca, de forma que el 45% de los autobuses cubre el servicio de la
lnea 1, el 25% cubre la lnea 2 y el 30% cubre el servicio de la lnea 3.
Se sabe que la probabilidad de que, diariamente, un autobs se avere
es del 2%, 3% y 1% respectivamente, para cada lnea.
a) Calcular la probabilidad de que, en un da, un autobs sufra una
avera
b) Calcular la probabilidad de que, en un da, un autobs no sufra una
avera
c) De qu lnea de transporte es ms probable que un autobs sufra
una avera?
Solucin:
A1=cubre el servicio de la lnea 1
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

21
A2= cubre el servicio de la lnea 2
A3= cubre el servicio de la lnea 3
B1= sufre un accidente
B2= no sufre un accidente
N
O
S

A1

0,4545
0,25

S
A2

N
S

0,30
A3

N
Datos:
P A1=45%
P (B1/A1)=2%=0,02
PA2=25% =0,25
P (B1/A2) =3%= 0,03
A3=30% = 0,3
P (B1/A3) =1% = 0,01
La probabilidad de no sufrir un accidente para la lnea son:
P (B2/A1)=1-P (B1/A1) =1-0,02= 0,98

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

22
a)

Calcular la probabilidad de que, en un dia , un autobs sufra un


accidente

Empleando la formula

P (B1)=0,45.0, 02+0,25.0, 03+0,3.0, 01= 0,0195


b) Calcular la probabilidad de que, en un da, un autobs no sufra un
accidente
Empleando la formula se obtiene

C) De qu lnea de transporte es ms probable que un autobs sufra


un accidente?
Calculando las tres probabilidades a posteriori empleando el teorema
de bayes.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

23
La probabilidad de que sea de la lnea 1, sabiendo que sufre una avera
es:

La probabilidad de que sea de la lnea 2, sabiendo que sufre una avera


es:

La probabilidad de que sea de la lnea 3, sabiendo que sufre una avera


es:
=
Entonces, sabiendo que el autobs sufre un accidente, lo ms probable
es que sea de la lnea 1, ya que esta probabilidad es la mayor.
P (A1/B1) =0,4615

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

24

CAPTULO

II
DISTRIBUCIONES DE
PROBABILIDAD
2.1. INTRODUCCION
El comportamiento de una variable aleatoria queda descrita por su
distribucin de probabilidad. En muchas tareas estadsticas, se busca
determinar una distribucin de probabilidad o modelo probabilstico
que satisfaga un conjunto de supuestos, para estudiar los resultados
observados de un experimento aleatorio.
En las distribuciones de mayor uso tenemos:
Distribuciones discretas
Binomial
Poisson
Distribuciones continuas
Normal
Normal estandar.
2.2. DISTRIBUCIONES DISCRETAS
2.2.1.Distribucin Binomial

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

25
Es una distribucin discreta utilizada ms frecuente en estadstica
aplicada. La distribucin se deriva de un procedimiento conocido como
ensayo de Bernoulli.
La distribucin binomial se utiliza para calcular probabilidades de
variables discretas. Se aplica en aquellos experimentos aleatorios que
tienen slo dos posibles resultados mutuamente excluyentes.
Asimismo, al llegar a cabo el experimento aleatorio, siempre estamos
interesados en que suceda uno de los dos resultados, si el experimento
que esperbamos efectivamente sucede, diremos que hubo un XITO,
si el resultado que esperbamos no sucede, entonces diremos que
hubo un FRACASO estos dos resultados, se designan en trmino de
probabilidad, como p y q

RESULTADOS

PROBABILIDAD

XITO

probabilidad de xito

FRACASO

probabilidad de Fracaso

Y debe cumplir la condicin: p + q = 1


El espacio muestral del experimento aleatorio de Bernoulli se puede
escribir como conjunto = (E, F).
Una variable aleatoria X tiene distribucin Binomial si su funcin de
densidad de probabilidad es:

n
n!
P X x p x q ( n x )
p x q ( n x ) ;
x!(n x)!
x

x 0,1,2,....,n

donde:
n
x
p

: Nmero de ensayos
: Nmero de xitos
: Proporcin de xito.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

26
q

: Proporcin de fracaso.

n

x

: Coeficiente binmico

n!

: Factorial de n = n(n-1)(n-2)(n-3)(...)(2)(1)

NOTA:
i) El factorial de 0 es 1; es decir, 0! = 1
0

ii) Todo nmero a la potencia 0 es igual a 1; es decir, (5) = 1


CARACTERISTICAS:
a)

Esperanza Matemtica E(X)

E( X ) np
b) Varianza V(X)

2 V ( X ) np(1 p)
Los criterios que debe satisfacer un experimento binomial son:
i)

Debe existir un nmero fijo de pruebas repetidas (n).

ii)

Cada una de las n pruebas debe tener dos resultados posibles,


favorable o desfavorable (xito o fracaso).

iii)

La probabilidad de xito de un experimento es fijo.

iv)

Las pruebas son independientes.

v)

Interesa el nmero de xitos en n pruebas.

NOTA:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

27
i)

En tablas es fcil los clculos cuando n 5 y la probabilidad est


en el rango 0,001 p 0,5.

ii)

Cuando n es relativamente grande (n). y la proporcin de


casos favorables p es muy pequea (p0), entonces se aproxima
a la distribucin de Poisson.

Ejemplo 1:
Se conoce que existe una probabilidad del 5% de que un estudiantesea
desaprobado en la asignatura de SociologiaCul es la probabilidad de
que 6 estudiantes seleccionados al azar de una seccin, que hayan
seguido dicho curso?.
a)
b)
c)

Tres resulten desaprobados.


Menos de tres resulten desaprobados.
Al menos dos resulten desaprobados.

Solucin:
a) Definamos la variable aleatorias X:
X: Nmero de estudiantes que resultan desaprobados
Rx = {0, 1, 2, 3, 4, 5, 6}
La probabilidad de xito es p = 5 % = 0,05

P( X 3)

6!
(0,05) 3 (0,95) 63 0,0021434375 0,002
3!(6 3)!

La probabilidad de que tres estudiantes resulten desaprobados en la


asignatura de Fsica es de 0,002.

b) P( X 3) P( X 0) P( X 1) P( X 2)

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

28

P( X 0)

P( X 1)

6!
(0,05) 0 (0,95) 60 0,73
0!(6 0)!

6!
(0,05)1 (0,95) 61 0,23
1!(6 1)!

P( X 2)

6!
(0,05) 2 (0,95) 62 0,03
2!(6 2)!

P(x<3) = 0,73 + 0,23 + 0,030 = 0,99


La probabilidad de que menos de tres estudiantes resulten
desaprobados en el curso de Fsica, es de 0,99.

c)

P( X 2) 1 P( X 2)
P( X 2) 1 P( X 0) P( X 1)
P( X 2) 1 0,73 0,23) 0,04

La probabilidad de que al menos dos estudiantes resulten


desaprobados en el curso de Fsica es de 0,04.
Ejemplo 2:
Se tiene entendido de que el 25% de la poblacin de Juliaca, no pagan
sus impuestos y el municipio tiene normas estrictas de cumplir en
generar ingresos para luego ejecutarlas. Cul es la probabilidad de
obtener 10 personas que no pagan sus impuestos de una muestra de
15 personas?
Solucion:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

29
N=15 x=10 p=0.25 q=0.75

La probabilidad de obtener 10 personas que no pagan sus impuestos es


de 0.07%.
Ejemplo 3:
En una nfora hay cierta cantidad de votos, de los cuales 20% son del
candidato X y el resto 80% del candidato Y. Cul es la probabilidad de
sacar:
a) Un voto del candidato X en un intento.
b) Un voto del candidato Y en un intento.
c) Dos votos del candidato X en dos intentos.
d) Tres votos del candidato X en tres intentos.
e) Tres votos del candidato Y en cinco intentos.
a)

N=1 x=1 p=0.2 q=0.8

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

30
La probabilidad de sacar un voto del candidato X en un intento es de
20%.
b) N=1 Y=1 p=0.8 q=0.2

La probabilidad de sacar un voto del candidato Y en un intento es de


80%.
c) N=2 x=2 p=0.2 q=0.8

La probabilidad de sacar dos votos del candidato X en dos intentos es


de 4%.
d) N=3 x=3 p=0.2 q=0.8

La probabilidad de sacar tres votos del candidato X en tres intentos es


de 0.8%.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

31
e) N=5 Y=3 p=0.8 q=0.2

La probabilidad de sacar tres votos del candidato Y en cinco intentos es


de 20.5%.
Ejemplo 4:
Estudios demuestran que en los municipios de Puno el 60% tienen
conocimiento acerca de la ejecucin adecuada del presupuesto sin
generar malversacin, de estos se selecciono una muestra de 10
municipalidades de la regin para determinar la probabilidad:
a) Que 7 municipalidades tengan una adecuada ejecucin de su
presupuesto.
b) Que tanto de menor o igual a 2 tengan una adecuada ejecucin
de su presupuesto.
Solucion
a) N=10 X=7 p=0.6 q=0.4

La probabilidad de que 7 municipalidades tengan una adecuada


ejecucin de su presupuesto es de 21.5%.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

32

b) N=10 X2 p=0.6 q=0.4


Este es un ejemplo de DISTRIBUCIN BINOMIAL ACUMULADA

El tanto a halla res de 1.2% de adecuada ejecucin de su presupuesto.


Ejemplo 5:
La probabilidad de xito de un programa social es de 83% en base a 20
beneficiarios. Calcular la probabilidad de que una vez ejecutada el
programa a 16 beneficiarios mejore su calidad de vida.
Solucion
N=20 x=16 p=0.83 q=0.17

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

33

La probabilidad de que mejore la calidad de vida de 16 beneficiarios es


de 20.5%.
Ejemplo 6:
Si el 20% de beneficiarios de un programa social pierden un ao de
beneficios y se toma al azar un grupo de 6 beneficiarios. Cul es la
probabilidad de que mximo 2 pierdan o ya no sean beneficiarios de
este programa.
Solucion
N=6 X2 p=0.8 q=0.2

La probabilidad de que mximo 2 pierdan es de 1.7%.

PROBLEMAS PROPUESTOS
1) En promedio cierto estudiante puede resolver la mitad de los
problemas que se le presenten; para aprobar es necesario

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

34
solucionar 7 de 10 preguntas de un examen Cul es la
probabilidad de que el estudiante apruebe el examen?
2) Supngase que el 24% de cierta poblacin tiene sangre tipo B. A
partir de una muestra de 20 individuos extrada de esa poblacin
calcular la probabilidad de:
a) Encontrar exactamente 3 individuos con sangre tipo B.
b) Encontrar tres o ms individuos con sangre tipo B.
c) Encontrar menos de tres individuos con sangre tipo B.
d) Encontrar exactamente cinco individuos con sangre tipo B.
3) Un estudiante que no se ha preparado absolutamente nada para
un examen que tiene 20 preguntas de verdadero falso. Decide
lanzar al aire una moneda para responder. Anota verdadero si la
moneda cae cara y falso si cae sello.
a) Que probabilidad hay de que pase el examen, si para hacerlo
debe contestar correctamente por lo menos el 70% de las
preguntas?
b) Que probabilidad de que conteste por lo menos la mitad de
las preguntas correctamente?
2.2.2. Distribucin Poisson
La distribucin de Poisson es una distribucin discreta, tiene muchos
usos en la economa, biologa, medicina, el comercio, en el control de
calidad industrial, ciencias sociales, lneas de espera, llamadas
telefnicas, etc.
Una variable aleatoria X tiene una distribucin de Poisson, si su funcin
de densidad de probabilidad est definido por:

PX x

e x
;
x!

x 0,1,2,3,4,.....

donde:
e:

constante (2.71828182)

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

35
X:
El nmero de xitos en n pruebas
:
Nmero esperado(Promedio) de presentaciones del suceso
= np
PARMETRO:
Parmetro es > 0.
CARACTERSTICAS:
Esperanza matemtica E(X)
Varianza V(X)

E(X )
2 V (X )

SUPUESTOS DE LA DISTRIBUCIN DE POISSON


a) Existe un gran nmero de pruebas posibles para la verificacin
de un proceso dado dentro de cada unidad de medida, y la
probabilidad de ocurrencia en cualquiera de estas pruebas es
muy pequea, adems la variable aleatoria debe ser un
nmero entero dentro de la unidad de medida.
b) Independencia, cualquier nmero de ocurrencias puede
acontecer un una sola unidad de medida, y esto no afecta el
numero de ocurrencias en cualquier otra unidad de medida.
c)

Estabilidad, el valor
constante.

de (promedio)debe permanecer

NOTA:
La distribucin de POISSON es generalmente utilizada en los problemas
en que se encuentran el nmero de eventos de cierto tipo, que ocurren
en un intervalo de tiempo, o en una regin, en un volumen. Por lo
expuesto, esta distribucin llamada distribucin de Eventos raros,
tales como: (9)

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

36

Nmero de llamadas telefnicas recibidas por una central


telefnica, durante un intervalo pequeo de tiempo.
Nmero de fallas de unidades en un da de operacin
Nmero de alumnos que ingresan a la Ciudad Universitaria en un
da dado.

Ejemplo 1:
La tasa de mortalidad para cierta enfermedad es de 7 por cada 1000
personas. Cul es la probabilidad que se observen exactamente 5
decesos por esta enfermedad en un grupo de 400 personas?
Solucin:
X: Nmero de decesos a causa de la enfermedad
Rx = {0, 1, 2, 3, .....}
p = 7/1000 = 0,007,
n = 400,
= np = 400(0,007) = 2,8

PX 5

e x e2,8 (2,8)5

0,087
x!
5!

La probabilidad de que existan 5 decesos por causa de cierta


enfermedad es de 0,087.

Ejemplo 2:
En la ciudad de Puno se han producido a razn de 3 apagones por mes.
Hallar la probabilidad de que en los prximos 6 meses, no haya ningn
apagn.
Solucin:
X: Nmero de apagones
Rx = {0, 1, 2, 3, .....}
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

37

MESES

APAGONES

1 mes
6 meses

3 apagones
X
X = 6(3)/1 = 18

PX 0

e ( ) x e 18 (18) 0

e 18
x!
0!

La probabilidad de que en los prximos 6 meses no haya ningn apagn


-18
es de e .

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL


Con una distribucin Poisson sea X B(n, p) donde p es pequea y n
grande.
Luego:

El resultado implica que para n grande (n > 50) y p pequeo, (p < 0,1)
entonces se pueden aproximar probabilidades binomiales a travs de la
distribucin Poisson.

Ejemplo 3:

Willington realiza en promedio 35 copias por minuto, cules son las


probabilidades de que realice, a) 10 copias en un minuto, b) 15 copias
en dos minutos?
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

38
Solucin:
a)

= 35

= 2.718

b) = 6 x 2 = 12

Ejemplo 4:
En el tpico de la universidad nacional de juliaca, se registran en
promedio la atencin de 6 estudiantes por dia, entonces cul es la
probabilidad de que se atienda a 10 estudiantes en tres das?
Solucin:
a) = 6 x 3 =18

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

39
Ejemplo 5:
El promedio de que un estudiante llegue tarde a clases en temporada
de lluvia es de 3 veces por semana. Cul es la probabilidad de que el
estudiante llegue 4 veces tarde por semana?
Solucin:
a)

=3

Ejemplo 6:
En promedio, hay 50 incendios serios cada ao en la provincia de
Chimbomba. Cul es la probabilidad de que no haya ningn incendio
maana? El nmero medio de incendios por da es 50364 0,137.
Luego, la probabilidad de cero incendios maana es
Solucion

Sea X
P(X

B(100, 0,05). Estimar


3).

E[X] = 100 0,05 = 5


Luego aproximando usando las tablas de la distribucin Poisson, se
tiene

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

40

La solucin exacta usando la distribucin binomial es 0,2578.


Ejemplo 7:
La produccin de televisores en SAMSUNG trae asociada una
probabilidad de defecto del 2%, si se toma un lote o muestra de 85
televisores, obtener la probabilidad de que existan 4 televisores con
defectos.
Solucion
N = 85
P = 0.02
X=4
= 1.7

Ejemplo 8:
Si el 2% de los libros encuadernados en cierto taller tiene
encuadernacin defectuosa, para obtener la probabilidad de que 5 de
400 libros encuadernados en este taller tengan encuadernaciones
defectuosas usamos la distribucin de Poisson. En este caso concreto, k
es 5 y, , el valor esperado de libros defectuosos es el 2% de 400, es
decir, 8. Por lo tanto, la probabilidad buscada es

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

41
Solucion

Ejemplo 9:
En una clnica el promedio de atencin es 16 pacientes por hora,
encuentre la probabilidad que en 30 minutos se atiendan 4 pacientes.
Formula de Poisson
Solucin:

La probabilidad de que en treinta minutos se atiendan tres personas.

Debemos calcular:

Ejemplo 10:
Los reportes de crmenes recientes indican que 3.2 de los robos de
vehculos motorizados ocurren cada minuto en estados unidos.
Suponga que la distribucin de los robos por minuto puede calcularse
con la distribucin de probabilidad de poisson; a) calcule la
probabilidad de que ocurran cuatro robos exactamente en un minuto;
b) cual es la probabilidad de que en cuarto de hora cualquiera ocurran
exactamente 45 robos.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

42
Solucin:

a)

Solucin: b)

Ejemplo 11:
Con objeto de revisar la calidad en el pulido de un lente, cierta
compaa acostumbra determinar el nmero de manchas en la
superficie considerando el lente defectuoso si 3 o mas de tales
manchas asperezas y otro tipo de defectos aparecen en el. Si la tasa
media es de 2 defectos por
, calcule la probabilidad de que un
lente de
, que ha sido revisado no se le catalogue como
defectuoso? Un lente no se le cataloga si tiene menos de 3 defectos.
Solucion

Solucin:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

43

Ejemplo 12:
En una tienda los clientes llegan al mostrador conforme una
distribucin de Poisson con un promedio de 10 por hora. En una hora
dada, Cul es la probabilidad de que lleguen el al menos 5 clientes?
Solucion:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

44

PROBLEMAS PROPUESTOS
1) En promedio, cinco fumadores pasan por la esquina de cierta calle
cada 10 minutos cul es la probabilidad de que durante un
periodo dado de 10 minutos el nmero de fumadores que pasen
sea de:
a) Seis o menos? b) Siete o ms? c) Exactamente ocho?
2) Cierto alimento produce una reaccin alrgica en un 0,1% de una
poblacin grande, Si 1,000 personas comen este alimento diario en
promedio. Cul es la probabilidad de que 3 personas tengan
reaccin alrgica a dicho alimento?
3) En una determinada regin de la selva se pretende introducir un
nuevo producto del que es razonable esperar sea demandado por
el 0,5% de los habitantes de dicha zona. Determinar la probabilidad
de que, consultados 2,000 de estos habitantes, dicho producto sea
demandado por 2 o ms personas.

4) A una garita de peaje llegan aleatoriamente 300 autos por hora


calcular la probabilidad de que:
a) Un auto llegue durante un periodo de un minuto.
b) Por lo menos dos autos lleguen durante un periodo 5 minutos.
2.3. DISTRIBUCIONES CONTINUAS
2.3.1. Distribucin Normal
La distribucin Normal, es con toda seguridad, la distribucin de
probabilidad continua ms importante en todo el campo de la
Estadstica. Esta distribucin conocida como distribucin de GAUSS o
curva de campana, fue descubierta en 1733 por De Moiure como una
derivacin del limite de la distribucin Binomial. La importancia de la
distribucin Binomial se puede resumir en las siguientes observaciones:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

45
1) Se conocen muchos fenmenos aleatorios que siguen la ley de
probabilidad NORMAL. Algunos de estos fenmenos son: la
industria, Economa, ciencias sociales, etc.
2) Sirve como una buena aproximacin para muchas distribuciones en
aquellas situaciones en donde n asume en valor grande (n > 30)
Se dice que una variable aleatoria X tiene una distribucin NORMAL,
2
con media y varianza , si su funcin de densidad est dada por:

f ( x)

1 x


1
e 2
2

PARMETROS:
Esperanza matemtica: E(X)
E(X) = - < x < +
Varianza: V(X)
V(X) =

2.3.2. Distribucin Normal Estndar


Si z es una variable aleatoria que tiene una distribucin normal, con
2
media =0 y varianza =1, entonces Z, se llama variable aleatoria
Normal estndar, su funcin de densidad, es:

f ( z)

donde:

1 2 z2
e
2
Z

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

46

USO DE TABLAS:
2

Si X N(, ), ser necesario aplicar algunas de las siguientes


propiedades:

i)

x a
a
P( x a) P

ii) P( x a) 1 Px a 1

b
a
iii) P(a x b) Px b Px a


iv) P( x a) Px a 1 a

v)

a
a
P( x a) P a x a

Ejemplo 1:
La presin sangunea media en profesores de 20 a 25 aos de edad es
de 123 unidades con desviacin tpica de 13,7 unidades. Si se
selecciona al azar uno de estos profesores, calcule:
La probabilidad de que su presin sangunea sea:
a)
b)
c)

Menor a 120 unidades


Mayor a 128 unidades
Entre 120 y 128 unidades

Solucin:
a)

P[X < 120]

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

47

X 120
P( X 120) P



120 123
P( X 120)
(0,22) 0,41294
13,7

La probabilidad de que un hombre elegido al azar, tenga la presin


sangunea menor a 120 unidades, es de 0,41.

b)

P[X > 128]


128 123
x 128
P( x 128) 1 P( x 128) 1 P

1 (0.36496)
1


13,7

P(x > 128) = 1 0,64 = 0,36


La probabilidad de que un hombre elegido al azar, tenga la presin
sangunea mayor a 128 unidades, es de 0,36.

c)

P[120 < X < 128]

P120 X 128 PX 128 PX 120


P120 X 128 0,64 0,41 0,23
La probabilidad de que un hombre elegido al azar, tenga la presin
sangunea entre 120 y 128 unidades, es de 0,23.
Ejemplo 2:
Se sabe que las puntuaciones obtenidas al pasar un test siguen una
distribucin normal con media 210 puntos y desviacin tpica 0,6
puntos. Si se pasa el test a 100 personas, Cuntas de esas 100
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

48
personas deberemos esperar que obtengan una puntuacin entre 209 y
211 puntos?
Solucion

Tipificamos los extremos del intervalo:

209 210
1,67
0,6
211 210
z2
1,67
0,6
z1

Y la probabilidad de que una persona obtenga puntuacin entre 209 y


211 es:

p(209 X 211) p(1,67 z 1,67) p( z 1,67) p( z 1,67) 2 p( z 1,67) 1


2 0,9525 1 0,905
Con lo cual, la esperanza matemtica para las 100 personas es:
E= 100 . 0,905 = 90,5 personas estarn en el intervalo indicado.
Ejemplo 3:
El peso de 600 alumnos se distribuye segn una distribucin normal
N(67; 5).
Calcula cuntos de ellos pesan:
a)

Ms de 80 kg.

b)

Menos de 50 kg.

c)

Entre 50 y 80 kg.

Tipificamos los valores 50 y 80 kg.:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

49
Solucion

50 67
3,4
5
80 67
z2
2,6
5
z1

La probabilidad de que un alumno pese ms de 80 kg. es:

p( X 80) p( z 2,6) 1 p( z 2,6) 1 0,9953 0,0047


Cabe esperar, por tanto, que:

E 600 0,0047 2,82 3 alumnos pesen ms de 80 kg.


La probabilidad de que un alumno pese menos de 50 kg. es:

p( X 50) p( z 3,4) p( z 3,4) 1 p( z 3,4) 1 1 0


y ningn alumno pesa menos de 50 kg.
La probabilidad de que un alumno pese entre 50 y 80 kg. es:

p(50 X 80) p(3,4 z 2,6) p( z 2,6) p( z 3,4) p( z 2,6) p( z 3,4) 1


0,9953 1 1 0,9953
Cabe esperar, pues que:
E= 0,9953 . 600 = 597 alumnos pesen entre 50 y 80 kg.

Ejemplo 4:
En una ciudad, la temperatura mxima durante el mes de junio est
distribuida normalmente con una media de 26 y una desviacin tpica
de 4. Calcular el nmero de das que se espera tengan temperatura
mxima comprendida entre 22 y 28.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

50
Solucionn
Tipificamos los valores 22 y 28:

22 26
1
4
28 26
z2
0,5
4
z1

Entonces la probabilidad de que en un da de junio la temperatura


mxima est entre 22 y 28 es:

p(22 X 28) p(1 z 0,5) p( z 0,5) p( z 1) p( z 0,5) p( z 1)


p( z 0,5) 1 p( z 1) p( z 0,5) p( z 1) 1 0,6915 0,8413 1 0,5328
Y el nmero esperado de das es:

E 30 0,5328 15,9 16

das

Ejemplo 5:
Aproximando con una distribucin normal, calcular la probabilidad de
que al lanzar una moneda 100 veces, el nmero de caras obtenido est
comprendido entre 45 y 55.
Solucion

Se tiene:

m np 100

1
50
2

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

51

1 1
s npq 100 5
2 2
45 50
z1
1
5
55 50
z2
1
5
Y la probabilidad pedida es, con la aproximacin realizada:

p(45 X 55) p(1 z 1) p( z 1) p( z 1) p( z 1) 1 p( z 1)


2 p( z 1) 1 2 0,8413 1 0,6826

Problermas Propuestos
1.- En cierta ciudad, el nmero de interrupciones del suministro
elctrico por mes se considera una variable aleatoria normal para la
cual = 11.6 y = 3.3
Determine la probabilidad de que en un mes cualquiera haya al menos
ocho interrupciones.
Determine la probabilidad de que en un mes cualquiera haya entre tres
y siete interrupciones.
Determine la probabilidad de que en un mes cualquiera haya a lo ms
cinco interrupciones.
Resp. 0.8623 0.0771 0.0228
2.- En un proceso fotogrfico, el tiempo de revelado de las impresiones
puede considerarse una variable aleatoria normal para la cual = 12,9
minutos = 2 minutos.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

52
Determine la probabilidad de que el tiempo de revelado tarde entre 16
y 16.5 minutos
Determine la probabilidad de que el tiempo de revelado se lleve al
menos 16.2 minutos
Determine la probabilidad de que el tiempo de revelado se lleve a lo
ms 16.35 minutos
Resp. 0.0246 0.0495 0.9577
3.- La cantidad de caf instantneo que una mquina dispensadora
deposita en vasos de 4 onzas puede considerarse una variable aleatoria
con distribucin normal para la cual = 0.04 onzas. Si slo 2 % de los
vasos contienen menos de 4 onzas, cul sera el contenido promedio
de estos vasos?
Resp. = 4.082

4.- Se procede a detener el funcionamiento de una mquina para


repararla si en una muestra aleatoria de 100 artculos de la produccin
diaria se encuentran por lo menos 15 % de artculos defectuosos. Si se
sabe que la mquina realmente produce 10 % de artculos defectuosos,
encuentre la probabilidad de detener la mquina un da cualquiera.
5.- Una lnea area vende boletos sobre la base que el 5 % de las
personas que hacen reservacin para un vuelo no se presentan. Se sabe
que la aerolnea vendi 160 boletos para un vuelo con slo 155
asientos, cul es la probabilidad de que haya un asiento disponible
para cada persona con reservacin que se presenta al vuelo?

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

53

CAPTULO

III
MUESTREO
3.1. Introduccin
Cuando queremos estudiar alguna caracterstica de una poblacin para
obtener el mximo de informacin veraz, se nos plantea un problema
relacionado con la eleccin de los individuos. Puesto que no podemos
estudiar a toda la poblacin por varias razones (proceso largo y coste
elevado, entre otros), debemos elegir estudiar una muestra que sea
representativa y que nos permita extrapolar los resultados que
obtengamos a la poblacin de referencia. Sin embargo, debemos
considerar que el empleo de tcnicas de muestreo implica una serie de
ventajas y limitaciones.
Entre las ventajas se incluyen una mayor eficiencia en trminos
econmicos y mayor rapidez de obtencin de resultados.
Si
empleamos slo el tamao muestral necesario, seleccionando la
muestra de manera que represente lo ms fielmente posible a la
poblacin, podremos obtener tambin mayor validez, puesto que el
tiempo y dinero ahorrados se podrn emplear en recoger la
informacin o variables del estudio con mayor precisin y fiabilidad,
implicando una mayor validez interna final del estudio.
3.2. Tcnicas de muestreo

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

54
La mejor forma de asegurar la validez de las inferencias es seleccionar
la muestra mediante una tcnica aleatoria. A este tipo de muestreo se
le denomina muestreo probabilstico y puede definirse como aquel en
que todos los individuos de la poblacin tienen una probabilidad de
entrar a formar parte de la muestra (normalmente equiprobable, es
decir, con la misma probabilidad).
Los diseos en que interviene el azar producen muestras
representativas la mayora de las veces, aunque no garantizan la
representatividad de la poblacin que sometemos a estudio. Aunque
en muchos estudios no es posible obtenerla rigurosamente de esta
forma, es importante seleccionarla intentando que sea lo ms parecida
posible a la poblacin de inters. En este caso, el muestreo no
probabilstico utiliza mtodos en que no interviene el azar y por lo
tanto, se desconoce la probabilidad asociada a cada individuo para
formar parte de la muestra. Normalmente estos mtodos se utilizan en
estudios exploratorios o intencionales, en los cuales no es necesario
proyectar los resultados. El inconveniente de este mtodo es que no
puede asegurarse la representatividad de la muestra.
3.3. Clasificacin de los tipos de muestreo probabilstico
Entre los mtodos de muestreo probabilsticos ms utilizados en
investigacin encontramos los siguientes: Muestreo aleatorio simple,
estratificado, sistemtico y muestreo en etapas mltiples.
A
continuacin se describen las caractersticas de cada uno de los
sistemas de muestreo

3.3.1.

Muestreo aleatorio simple

Se caracteriza porque cada elemento de la poblacin tiene la misma


probabilidad de ser escogido para formar parte de la muestra. Una vez
censado el marco de la poblacin, se asigna un nmero a cada
individuo o elemento y se elige aleatoriamente. La aleatorizacin puede
realizarse mediante listas de nmeros aleatorios generados por
ordenador, aplicndolas para escoger de la poblacin los individuos o
sujetos que coincidan con los nmeros obtenidos.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

55
Este tipo de muestreo se caracteriza por su simplicidad y fcil
comprensin, aunque tambin posee algunas limitaciones, ya que no
siempre es posible disponer de un listado de todos los individuos que
componen la poblacin, generalmente cuando son poblaciones
grandes. Si se seleccionan muestras pequeas mediante este mtodo
pueden aparecer errores aleatorios, no representando la muestra
adecuadamente a la poblacin. Un ejemplo de muestreo aleatorio
simple sera la eleccin de los individuos a travs de la eleccin
realizada totalmente al azar de un cierto nmero de DNI.
3.3.2.

Muestreo estratificado

En este tipo de muestreo la poblacin de estudio se divide en


subgrupos o estratos, escogiendo posteriormente una muestra al azar
de cada estrato. Esta divisin suele realizarse segn una caracterstica
que pueda influir sobre los resultados del estudio. Por ejemplo, en el
caso de seleccionar una muestra para evaluar la altura, dada la
heterogeneidad entre hombres y mujeres, la variable de gnero podra
ser una variable de estratificacin.
Si tenemos constancia o suponemos a priori que la poblacin de
estudio presenta variabilidad de respuesta con respecto a alguna
caracterstica propia, deberemos tener en cuenta este tipo de
muestreo, dado que se producen estimaciones ms precisas cuanto
ms homogneos sean los elementos del estrato y ms heterogeneidad
exista entre estratos. As pues, entre las ventajas de este tipo de
muestreo es que tiende a asegurar que la muestra represente
adecuadamente a la poblacin en funcin de la variable de
estratificacin seleccionada, sin embargo, debe conocerse la
distribucin de la poblacin en las variables de estratificacin, clara
desventaja de este muestreo.
Para obtener la muestra en cada uno de los estratos pueden aplicarse
diferentes fracciones de muestreo, pudiendo ser proporcional al
tamao en relacin a la poblacin, es decir, la distribucin se realiza de
acuerdo con el peso o tamao de la poblacin de cada estrato. Por
ejemplo, si de los 5 millones de hipertensos espaoles hay un 35% de
pacientes que fuman, podemos estratificar de manera que en nuestra
muestra queden representados al igual que en el total de la poblacin,
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

56
la misma proporcin de hipertensos fumadores (35%) y de no
fumadores (65%).
3.3.3.

Muestreo sistemtico

El muestreo sistemtico es muy similar al muestreo aleatorio simple. La


diferencia se obtiene en que en este tipo de muestreo se divide el total
de la poblacin de estudio entre el tamao de la muestra, obteniendo
una constante de muestreo (k). La primera unidad que formar parte
de la muestra debe estar entre 1 y k y se elige al azar; a partir de esta
unidad se van seleccionando sistemticamente uno de los k individuos
siguiendo un orden determinado. Por ejemplo, si obtenemos un valor
de k=10 y seleccionamos al azar el nmero 6, deberamos elegir todas
las historias clnicas que finalizaran en 6: 006, 016, 026 .... Es
un mtodo de muestreo muy sencillo de realizar y que cuando la
poblacin esta ordenada siguiendo una tendencia conocida, asegura
una cobertura de unidades de todos los tipos. La principal limitacin es
que si la constante se asocia al fenmeno de inters puede cometerse
un sesgo.
3.3.4.

Muestreo en etapas mltiples

Consiste en empezar a muestrear por algo que no constituye el objeto


de la investigacin (unidades primarias), y obtener una muestra dentro
de cada una de ellas (unidades secundarias). Pueden utilizarse
sucesivamente tantas etapas como sean necesarias, y en cada una de
ellas, una tcnica de muestreo diferente. Este mtodo de muestreo se
utiliza cuando la poblacin de referencia es muy amplia y dispersa, ya
que facilita la realizacin del estudio. Principalmente, el muestreo en
etapas mltiples se utiliza en estudios multicntricos, donde debemos
elegir primero los hospitales y despus de haberlos seleccionado,
realizamos el muestreo de pacientes dentro del mismo.

3.4.

Clasificacin de los tipos de muestreo no probabilstico

Los procedimientos no probabilsticos son aquellos en los que no


conocemos la probabilidad de que un elemento de la poblacin pase a
formar parte de la muestra ya que la seleccin de los elementos
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

57
muestrales dependen en gran medida del criterio o juicio del
investigador. La muestra, en este caso, se selecciona mediante
procedimientos no aleatorios.. Los tipos de muestreo no probabilstico
son: muestreo de conveniencia, muestreo discrecional y muestreo por
cuotas, de los que pasaremos a explicar brevemente:
3.4.1.

Muestreo de conveniencia.

El investigador decide qu individuos de la poblacin pasan a formar


parte de la muestra en funcin de la disponibilidad de los mismos
(proximidad con el investigador, amistad, etc.).
3.4.2.

Muestreo discrecional.

La seleccin de los individuos de la muestra es realizada por un experto


que indica al investigador qu individuos de la poblacin son los que
ms pueden contribuir al estudio. Este muestreo es adecuado si dentro
de la poblacin que queremos estudiar, existen individuos que no
queremos que se nos escapen por utilizar un mtodo totalmente
aleatorio o de conveniencia.
3.4.3.

Muestreo por cuotas.

Si se conocen las caractersticas de la poblacin a estudiar, se elegirn


los individuos respetando siempre ciertas cuotas por edad, gnero,
zona de residencia, entre otras que habrn sido prefijadas.
3.5.

Clculo del tamao muestral

Para determinar el tamao muestral necesario para que los resultados


de un estudio sean extrapolables a toda la poblacin se deben
considerar situaciones, en funcin del objetivo de nuestro estudio
determinando los parmetros.
En la determinacin de parmetros nuestro objetivo ser determinar
mediante una muestra valores de nuestra poblacin de inters, por
ejemplo, determinar la proporcin de pacientes con insuficiencia renal
aguda. Veamos dos de las situaciones ms comunes en el clculo del
tamao muestral.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

58
3.5.1.

Determinacin de parmetros

Supongamos que se desea hacer inferencia sobre un valor de la


poblacin como puede ser una proporcin (por ejemplo: la prevalencia
de diabetes en la poblacin) o una media (ejemplo: la media de
colesterol en la poblacin).
Para estimar una proporcin
Para estimar una proporcin debemos tener una idea aproximada del
parmetro que queremos medir. Se puede obtener a partir de estudios
pilotos o una revisin de la literatura. Generalmente, ante la
imposibilidad de disponer de informacin de referencia se utiliza el
valor de 0,5 (50%), proporcin con la que se obtiene el tamao
muestral mximo necesario (llamado el criterio de la mxima
indeterminacin). Cuando queremos estimar una proporcin, debemos
elegir la precisin (e) que se quiere obtener para determinar el
parmetro que queremos medir, de manera que sta sea la oscilacin
mnima del valor a estimar, o lo que es lo mismo, decir su intervalo de
confianza. El tamao muestral necesario para la estimacin de una
proporcin se obtendra como:

Z : valor para el nivel de confianza


p: proporcin esperada (q=1-p).
e: precisin deseada.
Cuanto mayor es la precisin deseada, mayor es el tamao muestral
necesario para la estimacin del parmetro. En el caso que la poblacin
que se desea estudiar sea finita y con un tamao conocido (N) se utiliza
la frmula:

Veamos un ejemplo.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

59
Pretendemos estudiar la prevalencia de Diabetes Mellitas y no
conocemos el valor aproximado de la proporcin de diabticos en la
poblacin. Considerando un nivel de confianza al 95% y una precisin
deseada del 6%, la muestra necesaria para nuestro objetivo sera de:

Si la poblacin de la que pretendemos estudiar la prevalencia de


Diabetes Mellitas en una cierta ciudad, donde viven 20000 habitantes
(poblacin finita), con el mismo nivel de confianza y precisin deseados
que en el ejemplo anterior, necesitaramos una muestra de:

Para poblaciones con un nmero de individuos elevado no es necesario


disponer del total de la poblacin, puesto que ambas frmulas
proporcionan el mismo tamao muestral.

Para estimar una media


En el caso de la estimacin de una media, como puede ser el media del
colesterol, se debe tener una idea de la varianza (S2) de la distribucin
de la variable. Para la estimacin de una media se calcula el tamao
muestral como:
Z : valor para el nivel de confianza
S: desviacin estndar estimada.
e: precisin deseada.
Como en el caso anterior, el clculo de la muestra en el caso de
poblaciones finitas debe calcularse a partir de una nueva frmula,
aunque para poblaciones elevadas proporcionan tambin el mismo
tamao muestral.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

60

N *Z2 *S2
e 2 ( N 1) Z 2 * S 2

Problemas propuestos
Una empresa farmaceutica va a realizar un estudio de mercado antes
de lanzar una nueva pasta dental hacia una poblacin de 30,000
consumidores. Una encuesta piloto previa al estudio, revel que el 60
% de los consumidores prefieren su producto.
a) Qu tamao de muestra deber escoger si quiere tener una
confianza del 95% de que el error de estimacin de la
proporcin a favor del producto no sea superior a 0.0212 ?.
b) con los mismos datos complete la presente tabla:

PRECISION
e
10%
7%
5%

NIVEL DE CONFIANZA
90% (1.64)
95% (1.96)
99% (2.58)

Algunos valores estandarizados (z) en funcin de grado de confiabilidad


asumido (para dos colas):
Para un:
99 % ------------- z = 2, 58 (Empleado con frec.)
95 % ------------- z = 1, 96 (El ms empleado)
90 % ------------- z = 1, 64

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

61

CAPTULO

IV
ESTIMACION ESTADISTICA
4.1 Concepto
Un estimador de un parmetro poblacional es una variable aleatoria
que depende de la informacin de la muestra; su valor proporciona
aproximaciones a este parmetro desconocido. Un valor especfico de
esa variable aleatoria se llama estimacin (Newbold, Carlson y
Thorne, 2008, p.296).
Existen dos tipos de estimacion:
Estimacin por punto. Utilizar un solo valor para estimar el
parmetro.
Estimacin por intervalo. Utilizar un rango de valores o intervalo.
4.2.- ESTIMADOR PUNTUAL Y ESTIMACIN PUNTUAL
Sea x1, x2,, Xn una muestra de tamao n seleccionados de una
poblacin definida X de parmetros o cuya distribucin la denotaremos
por f(x, o). (Crdova, 2009, p.377).
Consideremos un parmetro poblacional como la media poblacional
o la proporcin poblacional P. Un estimador puntual de un parmetro
poblacional es una funcin de la informacin de la muestra que genera
un nico nmero llamado estimacin puntual. Por ejemplo, la media
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

62
muestral X es un estimador puntual de la media poblacional, , y el
valor que toma X para un conjunto dado de datos se llama estimacin
puntual, X. (Newbold, Carlson y Thorne, 2008, p.296).
4.3. ESTIMACIN DE INTERVALOS
Mtodo estadstico que bsicamente consiste en obtener el intervalo
de extremos cerrados [a, b], dentro del cual se ubican los posibles
valores de u n parmetro con una medida de fiabilidad denominado
nivel de confianza. (Crdova, 2009, p.377).
Los 3 elementos de una estimacin por intervalo
Lo primero que es importante notar es que el intervalo se construye
alrededor () de la media muestral, el estadstico. Adems, el intervalo
se abre () de acuerdo con el nivel de confianza especificado, z, y al
error estndar del estimador, en este caso, el error estndar de la
media, SX. (Diaz, 2013, p.244).
En otras palabras, el intervalo de confianza tiene 3 elementos:
1. El estadstico, en los ejemplos anteriores la media muestral,
alrededor del cual se construye el intervalo.
2. El nivel de confianza especificado, que se utiliza para determinar el
valor de z, la desviacin estndar de la distribucin normal
estandarizada, que es la que permite medir las probabilidades de
acuerdo con esta distribucin.
3. El error estndar de la media, sx, que aqu se calcul a partir de la
desviacin estndar de la muestra.
Con estos mismos 3 elementos se construyen diferentes intervalos de
confianza dependiendo de diversas circunstancias que se presentan.

4.4. INTERVALOS DE CONFIANZA PARA LAS MEDIAS

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

63
Spiegel y Stephens (2009) afirman: Si el estadstico S es la media
muestral , entonces los l mites de confianza de 95 y 99% para la
estimacin de la media poblacional est n dados por
1.96 y
2.58 , respectivamente. En general, los l mites de confianza est n
dados por
zc , donde zc (que depende del nivel de confianza
deseado) puede leerse en la tabla 9.1. Empleando los valores para
obtenidos en el captulo 8, se ve que los lmites de confianza para la
media poblacional estn dados por (p.229)

Si el muestreo se hace ya sea de una poblacin infinita o de una


poblacin finita, pero con reposicin, y estn dados por (Spiegel y
Stephens, 2009, p.229).
X

Si el muestreo se hace sin reposicin de una poblacin de tamao finito


Np.
Spiegel y Stephens (2009) afirman: Por lo general no se conoce la
desviacin estndar poblacional ; de manera que para obtener los
lmites de confianza anteriores, se usa la estimacin muestral ^s o s. El
resultado es satisfactorio si N 30. Si N < 30, la aproximacin es pobre
y se debe emplear la teora del muestreo para muestras pequeas.
(p.229).
Ejemplo 1:
Para estimar la cantidad media de 65 mamferos se toma una muestra
representativa de 37 mamferos que se encuentran en vulnerabilidad
de extincin, de esta muestra se obtuvo la media aritmtica
equivalente a 16.25 y una desviacin de 8.026. Determinar los
intervalos de confianza de 95% para estimar el parmetro indicado.
Solucion:
n=37
N=65
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

64

Z95%=1.96

= x Z

x = 16.25
s = 8.026
= 16.25 (1, 96)

= 16.25 (1, 96)

=16.25 +
=16.25+

=16.25 0.6614

=16.25 -

= 16.25+ 1.710

= 16.25 - 1.710

=17.96

= 14.54

0.6614

14.54 17.96
Interpretacin: en un 95% de las veces el verdadero valor del
parmetro va estar comprendida en este rango [14.54 - 17.96].
4.5. INTERVALOS DE CONFIANZA PARA LAS PROPORCIONES
Tal como se vio para la media aritmtica, el intervalo de estimacin se
construye sumando al estadstico el producto de la z correspondiente al
nivel de confianza por el valor del error estndar, o X zX. El
procedimiento para estimar una proporcin es igual, salvo que, por
supuesto, se utilizan la proporcin de la muestra y su correspondiente
error muestral. (Diaz, 2013, p.252).
En smbolos:

p zp
Spiegel y Stephens (2009) afirman: Si el estadstico S es la proporcin
de xitos en una muestra de tamao N obtenida de una poblacin
binomial en la que p es la proporcin de xitos (es decir, la probabilidad
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

65
de xito), entonces los lmites de confianza para p estn dados por P
zcp, donde P es la proporcin de xitos en una muestra de tamao N.
Empleando los valores para p indicados en el captulo 8 se ve que los
lmites de confianza para la proporcin poblacional estn dados
por(p.229)
P ZC

= P ZC

Si el muestreo se hace de una poblacin infinita o de una poblacin


finita, pero con reposicin, y estn dados por
P ZC
Si el muestreo se hace sin reposicin y de una poblacin finita de
tamao Np. Para calcular estos lmites de confianza se emplea la
estimacin muestral P para p, la que por lo general resulta satisfactoria
siempre que N 30. (Spiegel y Stephens, 2009, p.229).
Ejemplo 2 :
En un muestreo aleatorio simple de los 24 departamentos del Per en
el ao 2012, de una poblacin grande. El 57% informaron que sus
municipalidades tienen acceso a internet. Construir un intervalo de
confianza del 95% para la proporcin real de los que consideran que
sus municipalidades tienen acceso a internet.
Solucion
n=24
N=?
Z95%=1.96

P= p Z

p= 0.57
q=0.43
P=0.57 (1, 96)

Estadistca Inferencial

P=0.57 (1, 96)

M.Sc. Julio R. Gallegos Ramos

66

P=0.57+ (1, 96)

P=0.57 - (1, 96)

P= 0.57+ (1.96)

P=0.57 - (1, 96)

P= 0.57+0.198

P= 0.57 - 0.198

P=0.768

P=0.372

0.372 0.768
Interpretacin: en un 95% de las veces el verdadero valor del
parmetro va estar comprendida en este rango [0.3720.768].

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

67

PROBLEMAS RESUELTOS
1) Se sabe que el peso de los ladrillos producidos por una determinada
fbrica sigue una distribucin normal con una desviacin tpica de
0.12 kilos. En el da de hoy se extrae una muestra aleatoria de
sesenta ladrillos cuyo peso medio es de 4.07 kilos.
a. Calcular un intervalo de confianza del 99% para el peso medio de los
ladrillos producidos hoy.
b. Sin realizar clculos, determinar si un intervalo de confianza del 95%
para la media poblacional tendra mayor, menor o la misma longitud
que el calculado en el apartado (a).
c. Se decide que maana se tomara una muestra de 20 ladrillos. Sin
realizar clculos, determinar si un intervalo de confianza del 99% para
el peso medio de los ladrillos producidos maana tendra mayor, menor
o la misma longitud que el calculado en el apartado (a).
Respuestas: a) (4.03, 4.11) b) menor c) mayor
2) Un director de produccin sabe que la cantidad de impurezas
contenida en los envases de cierta sustancia qumica sigue una
distribucin. Se extrae una muestra aleatoria de nueve envases cuyos
contenidos de impurezas son los siguientes:
18.2
16.6

13.7
12.3

15.9
18.8

17.4
16.2

21.8

a. Calcular un intervalo de confianza del 90% para el peso medio


poblacional de las impurezas.
b. Sin realizar clculos, determinar si un intervalo de confianza del 95%
para la media
poblacional tendra mayor, menor o la misma longitud que el calculado
en el apartado (a).
Respuestas: a) (15.035, 18.498) b) mayor
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

68
3)
La Direccin General de Trfico quiere conocer la velocidad a
la que circulan los automviles en un tramo determinado de una
carretera. Para una muestra de siete automviles, el radar sealo las
siguientes velocidades en k/h.
79

73

68

77

86

71

69

a. Calcular la media y la varianza muestral.


b. Suponiendo que la distribucin de la poblacin es normal, hallar un
intervalo de confianza del 95% para la velocidad media de los
automviles que circulan por dicho tramo.
Respuestas: a) =74.71 s = 6.40 b) (68.79, 80.63)
4) Una empresa de alquiler de coches est interesada en conocer el
tiempo que sus vehculos permanecen en el taller de reparaciones. Una
muestra aleatoria de nueve coches indic que el pasado ao el nmero
de das que estos coches haban permanecido fuera de servicio era:
16

10

21

22

17

19

14

19

Especificando las hiptesis necesarias, calcular un intervalo de


confianza del 90% para el nmero medio de das que la totalidad de los
vehculos de la empresa se encuentran fuera de servicio.
Respuesta: (13.25, 19.19)
5) Un ingeniero industrial desea estimar con un 90% de confianza y una
precisin del 3% la proporcin de artculos defectuosos que estn
saliendo de la lnea de produccin. De qu tamao deber tomar la
muestra si:
a) no dispone de informacin alguna?
b) conoce que la proporcin de artculos defectuosos nunca ha sido
mayor de 0.12?.
Respuestas: a) 748 b) 316

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

69

CAPTULO

V
PRUEBA DE HIPOTESIS

5.1. CONCEPTO
El procedimiento de pruebas de hiptesis consiste bsicamente en que
una vez planteada la hiptesis que desea probarse, se prosigue a
recabar datos mustrales para conocer si stos concuerdan con ella o si
la contradicen.( Diaz, 2013, p. 270).
Una hiptesis estadstica es una suposicin o afirmacin sobre alguna
caracter stica de una poblacin. Por ejemplo, el promedio de
contenido de las cajas del cereal es de 300 g es una afirmacin sobre
el promedio de peso, en gramos, de esas cajas (Daz, 2013, p..269)
Diaz (2013) afirma: Es importante analizar con detenimiento cmo se
plantean las hiptesis. Despus de H0 y H1 estn dos puntos (:) que
indican que a continuacin se presenta la hiptesis. Esto es importante
porque suele cometerse el error de sustituir los dos puntos por el signo
igual que (=), y aunque pudiera ser vlido se presta a confusiones con
los signos de igualdad que se utilizan en la hiptesis misma ( = 300, la
nula, o 300, la alternativa). (p.270).
5.2. HIPOTESIS ESTADISTICA
a) Hiptesis alternativa e hiptesis nula
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

70

La hiptesis nula (H ) es aquella que refleja el no cambio que


0

esperamos rechazar. El rechazo de H , implica que aceptamos la


0

hiptesis alternativa (H ). Por otra parte, la hiptesis alternativa es


a

aquella proposicin que el analista o investigador espera aprobar.


(Gmez, 200, p.214)
b) Errores tipo I y tipo II
Diaz (2013) afirma: Debido a que la decisin de aceptar o rechazar la
hiptesis nula se hace con base en datos mustrales, no se tiene una
confiabilidad de 100% de que la decisin sea correcta por lo que, al
igual que se hizo con la estimacin de parmetros en el captulo
anterior, a la decisin se le asigna un determinado nivel de confianza.
Para explicar cmo se maneja ese nivel de confianza es necesario
revisar los 4 posibles resultados de la decisin: se puede aceptar o
rechazar la hiptesis nula cuando sta puede ser cierta o falsa, esto a su
vez conduce a 2 tipos de decisiones correctas y a 2 incorrectas. En el
cuadro siguiente se resumen estas consideraciones: (p.270).

H0 es verdadera

H0 es falsa

Se acepta H0

Correcto

Error tipo II

Se rechaza H0

Error tipo I

Correcto

5.3. TIPOS DE ENSAYO DE HIPOTESIS


Pruebas Bilaterales y Unilaterales
Para aprobar o rechazar una hiptesis nula nos basamos en el
estadstico de la prueba, es decir nos basamos en una medida que nos
arroja la muestra aleatoria perteneciente a la poblacin objeto de
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

71
estudio. Dicha medida puede ser la media muestral, la proporcin
muestral, etc. (Gmez, 2009, p.216)
El rea que corresponde a las colas es el nivel de significacin , que
para el caso de una prueba bilateral debe repartirse por iguales partes
en ambas colas y que para el caso de una prueba unilateral dicho nivel
se concentra en la cola correspondiente. (Gmez, 2009, p.216)
a)

Prueba de Hiptesis Bilateral

H0
H1

H1
REGION DE

REGION DE

RECHAZO

REGION DE

RECHAZO

ACEPTACION
Vc

Vt

Vt

Vc

b) Prueba de Hiptesis Unilateral hacia la Izquierda

H1

H0
REGION DE
RECHAZO

REGION DE
ACEPTACION

Vc

c)

Vt

Prueba de Hiptesis Unilateral hacia la derecha

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

72

H0

H1
REGION DE
REGION DE

RECHAZO

ACEPTACION
0

Vt

Vc

5.4. PASOS DE UNA PRUEBA DE HIPTESIS


Con el fin de resolver los problemas de pruebas de hiptesis de una
manera metdica y sistemtica y de tal forma que nos conduzca con
claridad y responsabilidad al fin ltimo de la prueba que es aceptar o
rechazar la hiptesis nula, se recomienda seguir los siguientes pasos
afirm (Gomez.2009.p.8)
1. Formular la hiptesis nula y la hiptesis alternativa. Es bueno
insistir que debemos formular la hiptesis nula de forma simple, es
decir, utilizando solo el signo igual (=). Tambin debemos recordar que
la hiptesis nula debe reflejar el no cambio, mientras que la hiptesis
alternativa debe reflejar lo que el investigador considera que est
sucediendo.
2. Especificar el nivel de significacin Recordemos que sta es la
mxima probabilidad que le asignamos al hecho de cometer un error
de tipo I en la decisin. Entre ms pequea es , mayor ser , que
consiste en la mxima probabilidad de cometer un error de tipo II.
3. Formular la regla de decisin Esta debe de reflejar qu valores del
estadstico se toman para rechazar la hiptesis nula. Como ejemplo,
podr amos formular la siguiente regla de decisin: Rechazamos la
hiptesis nula si el valor de Z es mayor que 2.9.
4. Calcular el estadstico sobre el cual se tomar la decisin Este es
calculado a travs de los datos mustrales. El estadstico que se calcule
debe ser coherente con el parmetro poblacional que se est
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

73
sometiendo a prueba, es decir si por ejemplo estamos sometiendo a
prueba una diferencia de medias, el estadstico correspondiente que
debemos calcular ser la diferencia de medias mustrales etc.
5. Rechazar o aprobar la hiptesis nula. Si confrontamos el estadstico
de prueba calculado con el estadstico segn el criterio de decisin,
procedemos a rechazar o aceptar la hiptesis nula.
5.5.PRUEBAS DE HIPTESIS PARA LA MEDIA
Gmez, (2009) afirma: Si una poblacin es normal, las medias
mustrales tambin se distribuirn normalmente, cualquiera sea el
tamao de la muestra. No obstante, si no se conoce la desviacin
estndar poblacional ( ), sta puede ser reemplazada por la desviacin
estndar de la muestra(S) si el tamao de la muestra es mayor que
30(n>30). (p. 219)

5.5.1. Estadsticos de Pruebas a utilizar:


a)

Prueba de hiptesis para la media:


a.1 Para varianza conocida el estadstico es:

a.2 Para varianza desconocida y muestras pequeas, n < 30, y


aproximadamente normal la poblacin, el estadstico es:

Y para muestras grandes (n 30), el estadstico es:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

74

1) Segn el teorema central del lmite, si una poblacin no es normal o


no sabemos si se cumple o no ste comportamiento, las medias
mustrales se distribuirn aproximadamente como una distribucin
normal, si el tamao de la muestra es mayor que 30(n>30).
2) Si una poblacin es normal o est muy cerca de ste
comportamiento y por otra parte no conocemos la desviacin estndar
poblacional
y adems el tamao de la muestra es menor que
30(n<30), entonces, las medias mustrales se distribuirn de acuerdo a
la ley t-student.

Ejemplo 1:
Segn experiencias pasadas, se sabe que en una compaa el retardo
promedio por mes de sus obreros es de 64 minutos con una desviacin
estndar de 8 minutos. El gerente de la compaa considera que ste
promedio ha aumentado sensiblemente en los ltimos meses, por lo
cual ordena efectuar la investigacin correspondiente. Para tal fin, se
toma una muestra aleatoria de n=64 obreros y se encuentra que la
misma presenta una media de
minutos. Se pide comprobar si el
gerente tiene o no la razn con un nivel de significacin de 0.05.
Solucin
Observemos que las medias mustrales se distribuirn normalmente,
segn el numeral 2 de sta pgina. Siguiendo los pasos planteados en la
pgina anterior tenemos:
Hiptesis nula e hiptesis alternativa:
Ho:
64 minutos (que refleja el no cambio) y
H a:
minutos (que refleja el cambio).

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

75
2) Nivel de significacin:
0.05.
ste valor lo sugiere el presente problema, pero en la prctica es el
investigador quien lo fija de acuerdo a sus necesidades.
3) Formular la regla de decisin: Como podemos observar en el
numeral 3 de la pgina 218, la prueba es unilateral a la derecha, por lo
cual el valor de z1 correspondiente, segn el grfico de la pgina 218, es
de 1.64 de acuerdo con la tabla de distribucin normal. Por lo tanto, la
regla de decisin ser la siguiente: Se rechaza la hiptesis nula si el
valor de Z calculado es:
4)

Clculo del estadstico sobre el cual se tomar la decisin:

5) Tomar la decisin: Como 4.0 que es el valor de Z calculado, es


mayor que el valor de Z segn el criterio de decisin, entonces 4.0
se encuentra en la zona de rechazo, por lo cual debemos rechazar
la hiptesis nula de que el promedio de retardos sigue siendo de
64 minutos. Por lo tanto, el gerente tiene la razn con un nivel de
significacin del 5%.

Ejemplo 2:
Un proceso manufacturero usado por una fbrica durante los ltimos
aos da una produccin media de 100 unidades por hora con una
desviacin estndar de 8 unidades. Se acaba de introducir en el
mercado una nueva mquina para realizar ese tipo de producto.
Aunque es muy cara comparada con la que est ahora en uso, si la
media de produccin de la nueva mquina es de ms de 150 unidades
por hora, su adopcin dara bastantes beneficios. Para decidir si se
debiera comprar la nueva mquina, a la gerencia de la fbrica se le
permite hacer un ensayo durante 35 horas, hallndose un promedio de
160 unidades por hora. Con sta informacin qu decisin se debe
tomar si se asume un nivel de confianza del 99 por ciento.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

76
Solucin.
Segn el enunciado, solo se compra la mquina si la produccin es de
mas de 150 unidades por hora, por lo tanto las hiptesis son:
H0: = 150
H1:

> 150

Por lo tanto, se acepta que la produccin promedio por hora es


superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se
puede comprar la nueva mquina.
Ejemplo 3:
Un investigador de mercados y hbitos de comportamiento afirma que
el tiempo que los nios de tres a cinco aos dedican a ver la
televisin cada semana se distribuye normalmente con una media de
22 horas y desviacin estndar 6 horas. Frente a este estudio,
una empresa de investigacin de mercados cree que la media es mayor
y para probar su hiptesis toma una muestra de 64 observaciones
procedentes de la misma poblacin, obteniendo como resultado una
media de 25. Si se utiliza un nivel de significacin del 5%. Verifique si la
afirmacin del investigador es realmente cierta.
Solucin.

n = 64

a = 5% = 0,05

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

77

Solucin:
H0: <= 22
H1: > 22
a = 0,05

H0

H1
REGION DE
REGION DE

RECHAZO

ACEPTACION
0

1.645

Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo
tanto el tiempo que los nios de tres a cinco aos dedican a ver
la televisin es mayor de 22 horas, lo que implica que la
empresa de investigacin de mercados tiene la razn.

Ejemplo 4 :
Un gerente de ventas de libros universitarios afirma que en promedio
sus representantes de ventas realizan 40 visitas a profesores por
semana. Varios de estos representantes piensan que realizan un
nmero de visitas promedio superior a 40. Una muestra tomada al azar
durante 8 semanas revel un promedio de 42 visitas semanales y una
desviacin estndar de 2 visitas. Utilice un nivel de confianza del 99%
para aclarar esta cuestin.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

78

Datos:
N= 40
n=8
Nivel de confianza del 99%
Nivel de significacin = (100%-99%)/2 = 0,5% = 0,005

Solucin:
H0: < = 40
H1: ( > 40
grados de libertad: n-1 = 8-1 =7
a = 0,005

H1

H0
REGION DE
RECHAZO

REGION DE
ACEPTACION

2.83

3.49

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

79
H0 es aceptada, ya que t prueba (2,83) es menor que t tabla (3,499), por
lo que no es acertado pensar que estn realizando un nmero de visitas
promedio superior a 40.
5.6. PRUEBAS DE HIPTESIS PARA LA PROPORCIN
Gmez, (2009) Para resolver pruebas de hiptesis para la proporcin en
muestras grandes podemos basarnos en la distribucin en el muestreo
de la proporcin utilizando la distribucin normal y el proceso que
debemos seguir es muy similar al utilizado para el caso de la media.
(p.226)
5.6.1. Estadsticos de Pruebas a utilizar:
a)

Prueba de hiptesis para Proporciones

Muestras grandes np5, n(1-p)5 , el estadstico es:

Ejemplo 5:
El rector de una universidad pblica afirma que el 15% de los
estudiantes de la universidad que l dirige est en contra de una ley
que actualmente se discute en el congreso y que supuestamente afecta
a la comunidad universitaria. El representante de los estudiantes,
considera que dicha proporcin es mayor y para comprobarlo toma una
muestra de 100 estudiantes seleccionados aleatoriamente y encuentra
que el 23% estn en desacuerdo con dicho proyecto de ley. Se pide
comprobar si el rector tiene o no la razn con un nivel de significacin
del 5%.
Solucin
1) Hiptesis nula e hiptesis alternativa: H 0: P=0.15, Ha: P>0.15. La
prueba es unilateral a la derecha, puesto que el representante de

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

80
los estudiantes, piensa que la proporcin es superior a la afirmada
por el seor rector.
2)

Nivel de significacin:

3) Criterio de decisin: Como la proporcin muestral se distribuye


normalmente y la prueba es unilateral a la derecha, entonces,
segn la tabla el valor de z es: +1.64. Por lo tanto, el criterio de
decisin ser el siguiente: Si el valor de Z calculado es mayor que
+1.64, se rechaza la hiptesis nula de que la proporcin es del
15%.
4) Clculo del estadstico sobre el cual se basar la decisin: n=100,
p=0.23, q=0.77. Segn la frmula 6.13 de la pgina 171 para Z, en
la distribucin en el muestreo de la proporcin, el
correspondiente valor de z ser:

5) Tomar la decisin: Como el valor de Z calculado (+2.24) se


encuentra en la zona de rechazo, entonces, con un nivel de
significacin del 5%, debemos rechazar la hiptesis nula de que la
proporcin de estudiantes en contra de la ley es del 15% y por
consiguiente debemos aceptar la hiptesis del representante
estudiantil de que dicha proporcin es mayor.
Ejemplo 6:
El porcentaje de durabilidad de paciente con cierta enfermedad
neoplastia es de 40% en pacientes tratados convencionalmente. Para
probar la eficacia adicional de la quimioterapia se tom una muestra de
100 pacientes a los cuales se les someti a este tipo de tratamiento en
este grupo la durabilidad observada fue de 80%. Se puede afirmar que
la quimioterapia permite aumentar el porcentaje de durabilidad?
Solucin
HO: n 0.40
Hi: n 0.40
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

81

Estadstico: la variable es cualitativa

La regla de decisin se rechaza Ho si


rea de aceptacin 0.95 = 1.645
Entonces se tiene
Se concluye que el uso de la quimioterapia produce un porcentaje de
curatibilidad mayor al 40% en este tipo de pacientes. Para

Ejemplo 7:
Una empresa est interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaa publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocan el producto. A un nivel de
significacin del 1% apoya el estudio las siguientes hiptesis?

a.Ms del 3% de la poblacin no conoce el nuevo producto.

b. Menos del 2% de la poblacin no conoce el nuevo producto


solucion
n = 1000
x = 25

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

82

Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
a)

a = 0,01

H0

H1
REGION DE
REGION DE

RECHAZO

ACEPTACION
-0.93

2.32

H0 es aceptada, ya que z prueba (-0,93) es menor que z tabla (2,326),


por lo que no es cierto que ms del 3% de la poblacin no conoce el
nuevo producto.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

83
PROBLEMAS PROPUESTOS
1) Se quiere probar la hiptesis nula de que el salario medio de los
motoristas del transporte pblico es igual a 165 dlares quincenales,
contra quienes piensan que es menor. Una muestra de 16 de esos
salarios produjo los resultados siguientes:
173 178 145 146 157 175 173 137
152 171 163 170 135 159 199 131
Utilice = 0.10, y concluya si se aprueba o no la hiptesis
Respuesta: Ha < 165 tc = -1.028 se acepta Ho
2) El tiempo para reparar un instrumento electrnico es una variable
aleatoria medida en minutos que se distribuye normalmente. Los
tiempos de reparacin para 16 de tales instrumentos, elegidos al azar,
se dan continuacin:
159
222

280
363

201
168

212
250

224
149

379
260

179
485

264
170

Parece razonable suponer que el tiempo medio real de reparacin sea


mayor que 245 minutos?
Respuesta: Ha > 245 , tc = 0.122 , p- valor > 0.40, se acepta Ho
3) Se investig que el 26% de quienes visitan un determinado sitio
deportivo de Internet son mujeres. El porcentaje se bas en una
muestra de 380 visitantes.
a) Hallar el intervalo de confianza de 95% para la proporcin
poblacional de usuarios mujeres.
b)Cul es el margen de error asociado con la proporcin estimada de
mujeres?
c) Qu tamao debera tener la muestra si queremos tener un margen
de error del 3%?
Respuestas: a) (0.2159, 0.3041) b) 4.41% c) 822
4) La poltica de una comisin de trnsito consiste en agregar una ruta
ms de autobuses, si ms del 55% de los viajeros potenciales indican
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

84
que la utilizaran. Una muestra de 170 usuarios revel que 95 tomaran
una v a norte sin pasar por el centro de la ciudad. Cumple sta va
con los criterios de la comisin de trnsito?. Utilice un nivel de
significacin del 5%.
Respuesta: Ha : P > 0.55 , zc = 0.2313 , no
5) Una compaa de televisin afirma que el 60% de la tele audiencia
mira su telenovelaBarreras de amor y odio, entre las 8:00 y 9:00 p.m.
En una encuesta telefnica realizada durante un perodo determinado,
en 300 hogares, 165 miraban esa telenovela. Podra afirmarse que la
audiencia se ha modificado?
Respuesta: Ha : 0:60, zc = 1.67, p- valor = o.0768, no

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

85

CAPTULO

VI
ANALISIS DE REGRESION Y
CORRELACION

6.1 INTRODUCCION
Los datos bivariantes se presentan cuando en una poblacin o muestra
se miden simultneamente dos variables en cada uno de los individuos
o sujetos que integran el conjunto o subconjunto bajo estudio. Algunos
ejemplos de datos variantes son: la estatura y el peso de varones
adultos, el coeficiente de inteligencia y el rendimiento acadmico de
los alumnos.
Como ejemplo de datos bivariantes tenemos:
Horas de estudio y rendimiento escolar
Coeficiente intelectual y rendimiento academico
Estres y desempeo laboral
6.2. REGRESIN LINEAL SIMPLE
El anlisis de regresin se encarga de descubrir la relacin funcional
entre dos o ms variables. Cuando se estudian solamente dos variables
la metodologa a utilizar se conoce como anlisis de regresin simple,

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

86
en tanto que si se trata de tres o ms variables el anlisis regresional es
mltiple. El anlisis de regresin puede ser lineal o no lineal. (14)
6.2.1. Anlisis de regresin lineal
Es la relacin que existe entre dos variables, la misma que est definida
en una funcin expresada en trminos de una ecuacin de una lnea
recta, tal como se muestra en el siguiente grfico:

6.2.2. Anlisis de regresin no lineal


Es la relacin que existe entre dos variables, la misma que est definida
por una ecuacin polinomial de grado avanzado. Estas ecuaciones no
lineales producen curvas cuadrticas, hiperblicas, parablicas, cbicas,
etc., tal como se muestra en el siguiente grfico:

6.3. MODELO de REGRESION


Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

87

La variable Y se conoce como la variable dependiente, endgena o


predicha, en tanto que la variable X es llamada variable independiente,
exgena o predictora. La magnitud de Y depende de la magnitud de X, y
por lo tanto puede predecirse en base al valor que asuma la variable
independiente.
El anlisis regresional permite expresar la relacin entre las variables X
y Y mediante una ecuacin matemtica.
El modelo matemtico poblacional est representado por:

Yi X i i
donde:

Yi
Xi
i

: Parmetro poblacional, intercepto


: Parmetro poblacional, pendiente de la recta
: Variable dependiente
: Variable independiente
: Error poblacional

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

88
El modelo matemtico muestral esta representado por:

Yi X i ei
donde:

Yi
Xi
ei

: Estimador muestral, intercepto


: Estimador muestral, pendiente de la recta
: Variable dependiente
: Variable independiente
: Error muestral

El modelo estimado de la recta de regresin muestral se define del


siguiente modo:

Yi X i
donde:

ei Yi Yi

En la expresin anterior y son los coeficientes de regresin, son


valores
desconocidos
que
debern
ser
determinados
matemticamente. Cuando se estiman los valores de los coeficientes
de regresin, es posible calcular los valores predictivos de Y para
determinados valores de X, mediante la sustitucin apropiada en la
ecuacin de regresin muestral.
Esta ecuacin de regresin sera el medio de prediccin que se usara
para predecir los valores de Y correspondientes a los valores de X.
Grficamente se representa del siguiente modo:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

89

Para estudiar la regresin de Y en X contamos con el modelo de


regresin lineal simple que se basa en los siguientes supuestos.
La variable independiente X tiene valores que son pre establecidos por
el equipo de investigadores. Esto implica que solamente Y, la variable
dependiente, es una variable aleatoria y que X no varia aleatoriamente
sino que esta bajo el control de los investigadores.
El valor de la variable aleatoria Y depende en cierto grado del valor de
la variable independiente X.
La relacin que media entre X e Y se puede describir adecuadamente
mediante una ecuacin lineal cuya representacin geomtrica es una
lnea recta. Los valores paramtricos de la variable Y son funcin de la
variable X.
6.4. PENDIENTES DE LOS MODELOS DE REGRESION
6.4.1. Recta ascendente (creciente)
En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin directa, es decir si una variable aumenta la otra
tambin aumenta y si una variable disminuye la otra tambin
disminuye.
Como por ejemplo:
X : Horas dedicadas al estudio
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

90
Y : Rendimiento acadmico
La grfica tiene la siguiente forma:

Este gr fico se puede entender del siguiente modo: Mientras el


alumno le dedique menos horas al estudio, su rendimiento ser
deficiente; pero si el alumno le dedica ms horas al estudio, su
rendimiento ser satisfactorio o mejor.
6.4.2. Recta descendente (decreciente)
En este tipo de modelo de regresin, se observa que ambas variables
tienen una relacin inversa, es decir si una variable aumenta la otra
disminuye y si una variable disminuye la otra aumenta.
Como por ejemplo:
X : Horas dedicadas al vicio
Y : Rendimiento acadmico

La grfica tiene la siguiente forma:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

91

Este gr fico se puede entender del siguiente modo: Mientras el


alumno le dedique menos horas al vicio, su rendimiento ser
satisfactorio; pero si el alumno le dedica ms horas al vicio, su
rendimiento ser deficiente o peor.
6.5. DETERMINACIN DE LA ECUACIN DE REGRESIN
La regresin entre dos variables cuantitativas debe ser definida usando
mtodos que ofrezcan mayor precisin que la ofrecida mediante la
utilizacin de los diagramas de dispersin.
Los estimadores del modelo de regresin son los siguientes:

Y X
n

n X iYi X i Yi
i 1

i 1

n X
i 1

2
i

Estadistca Inferencial

i 1

Xi
i 1

M.Sc. Julio R. Gallegos Ramos

92
Ejemplo 1:
Los siguientes datos muestran los gastos invertidos en publicidad (en
miles de soles) (Xi) y las ventas obtenidas (en cientos) de vehculos (Yi)
de 7 tiendas sucursales del Per. Hallar el modelo de regresin lineal y
Estimar la venta de vehculos para cuando una Empresa invierta
S/.8000 y S/.10000. en gastos de publicidad

Nro.

Gastos.(X)

Venta de(Y)

2,5

3,2

7,5

8,4

12

10,2

15

14,5

18

19,8

Estimando el modelo de regresin lineal.


Para encontrar el modelo se realizar los siguientes clculos:

Nro.

Xi*Yi

Xi

Y.est

(Yest. - Yprom.)

(Yi - Yprom.)

2,5

10

3,2

16

16

2,51358885

48,01475907

48,20326531

25

3,668466899

33,34358269

38,97326531

7,5

52,5

49

5,978222997

12,00368977

3,774693878

8,4

75,6

81

8,287979094

1,333743308

1,08755102

12

10,2

122,4 144

11,75261324

5,33497323

0,573265306

15

14,5

217,5 225

15,21724739

33,34358269

25,57469388

18

19,8

356,4 324

18,68188153

85,35957168

107,2704082

Total 70

66,1

850,4 864

66,1

218,7339024

225,4571429

Prom. 10

9,44286

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

93
Calculando el estimador tenemos:
n

i 1

i 1

n X iYi X i Yi
i 1

n X X i
i 1
i 1

2
i

7(850,4) (70)(66,1)
1,154878049
7(864) (70) 2

Calculando el estimador

tenemos:

Y X
66,1
70

(1.154778049) 2.105923345
7
7
Entonces la ecuacin de regresin lineal es:
i = -2.105923345 + 1,154878049 Xi

Este modelo nos servir para hacer las predicciones de las ventas
obtenidas (en cientos de soles) de vehculos (Y) para los diferentes
gastos invertidos (en miles de soles) (X).
Al interpretar estos resultados es conveniente recordar que la razn
esencial que motiv el clculo de la ecuacin de regresin es poder
usar esta para establecer estimados o proyecciones de los valores de la
variable dependiente Y. As por ejemplo podra interesarnos predecir el
valor de Y asociado con un valor particular de X.
Estimar la venta de vehculos para cuando una Empresa invierta
S/.8000 y S/.10000, en gastos de publicidad..
Para responder a esta pregunta, se requiere la sustitucin del valor de X
= 8 y 10 respectivamente en los trminos de la ecuacin de regresin.
i = -2.105923345 + 1,154878049 Xi
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

94

8 = 7,133101045
10 = 9,442857143
Se estima que la venta de vehculos para cuando una Empresa invierta
S/.8000 en gastos de publicidad, obtendr una venta de 713 vehculos,
con un coeficiente de determinacin de 97,02%
Se estima que la venta de vehculos para cuando una Empresa invierta
S/.10000 en gastos de publicidad, obtendr una venta de 944 vehculos,
con un coeficiente de determinacin de 97,02%
NOTA:
Para realizar la prediccin, es necesario cumplir las siguientes
condiciones:
2 1/2

El coeficiente de correlacin(r =(R ) ), sea mayor o igual a 0,80.


El error estndar del estimador que sea cercano a cero.
Que se cumplan los supuestos del anlisis de regresin.
2

6.6. COEFICIENTE DE DETERMINACIN (R )


2

R nos indica la cantidad de mejoramiento en trminos de reduccin


del error total gracias al uso de la recta de regresin y se dice que mide
2
la bondad de ajuste. R Representa la reduccin relativa de la suma de
cuadrados total gracias al uso de la recta de regresin. Por Ejemplo si:
2
R = 0,80 significa que hubo con una reduccin del 80% de la suma de
2
cuadrados total. Si R =1 indica que la reduccin de la suma de
cuadrados del error total fue del 100%. Lo que nos dice que el error Y i -

Yi = 0, para todo i y que todos los puntos estn sobre la recta de

regresin.
En las siguientes grficas se muestra diferentes valores del coeficiente
de determinacin:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

95

0,8 R < 1

R =1

0,5 R < 0,8

0,3 R < 0,5

0 < R < 0,3

R2

i 1
n
i 1

Donde :

R =0

suma _ de _ cuadrados _ de _ error _ exp licado


suma _ de _ cuadrados _ de _ error _ total

0R 1

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

96
De nuestro ejemplo:

y
n

R2

i 1
n

y
i 1

218,7339024
0,970179519 97,02%
225,4571429

Observamos que hay una bondad de ajuste del 97,02% lo que implica
que el ajuste es muy bueno.

6.7.INTERVALO DE CONFIANZA PARA LA PENDIENTE DE LA


POBLACIN.
El intervalo de confianza para la pendiente de la poblacin, 1, se
construye de la siguiente manera.
CASO I: Muestra pequea (n 30)
P[b1 T/2(n-2)Sb1] = 1-
CASO II: Muestra grande (n>30)
P[b1 Z/2(n-2)Sb1] = 1-

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

97
Ejemplo 2:
El siguiente cuadro muestra, la edad (Xi) medida en aos y la presin
sistlica (Yi) medida en (mm.Hg), en una muestra de 15 madres de
familia. Hallar el modelo lineal y estimar la presin sistlica para las
madres de familia de las edades de 50 aos y 75 aos

Ma
dre

Edad Presin
Xi * Yi
(Xi) (Yi)
42
130
1
5460
46
115
5290
2

(Yest. Yprom.)

(Yi Yprom.)

Xi

Yi

Y.est

1764
2116

16900

125,34065

435,1126074

262,44

13225 129,203490

288,881347

973,44

42

148

6216

1764

21904

125,34065

435,1126074

3,24

41

100

4100

1681

10000 124,374936

476,3334091

2134,44

80

156

12480

6400

24336 162,037657

250,8313762

96,04

74

162

11988

5476

26244 156,243392

100,8697265

249,64

70

151

10570

4900

22801

152,38055

38,19918638

23,04

80

156

12480

6400

24336 162,037657

250,8313762

96,04

85

162

13770

7225

26244 166,866211

427,0922704

249,64

10

72

158

11376

5184

24964 154,311971

65,80406717

139,24

11

64

155

9920

4096

24025 146,586284

0,149215572

77,44

12

81

160

12960

6561

25600 163,003368

282,3531657

190,44

13

41

125

5125

1681

15625 124,374936

476,3334091

449,44

14

61

150

9150

3721

22500

143,68915

6,304357909

14,44

15

75

165

12375

5625

27225

157,20910

121,2003482

353,44

Total

954

2193 143260 64594 325929

2193

3655,40847

5312,4

Prm.

63,6

146,2

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

98

n
n

X
Yi

i
n
i 1

X i Yi i 1

n
i 1

X
i 1

2
i

Xi

i 1
n

(954)(2193)
15
0,965710787
(954) 2
64594
15

143260

Y X

2193
954
(0,965710)
84,78079396
15
15

Entonces la ecuacin de regresin lineal es:


i = 84,78 + 0,97 Xi

Luego calculamos:
n

SY

SY

i 1

i 1

Yi Yi X iYi
2

i 1

n2
325929 (84,78)(2193) (0,97)(143260)
8,96257175
15 2

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

99

SY

Xi
n
2
X i i 1

n
i 1

8,96257175

9542
64594

0,14315673

15

Para el ejemplo:
P[b1 T/2(n-2)Sb1] = 1-
P[0,97 2,16(0,14)] = 1 - 0,05
P*0,66078146 1 1,27921854+ = 0,95
El intervalo de confianza para la pendiente poblacional se encuentra
entre 0,66 y 1,28, con una confiabilidad del o nivel de confianza del
95%.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

100
6.8.INTERVALO DE CONFIANZA PARA LA MEDIA CONDICIONAL
La estimacin por punto de la media condicional de la variable
dependiente, dado un valor especifico de X, es el valor de la lnea de
regresin . Cuando se utiliza la ecuacin de regresin para estimar la
media condicional se representa por: X
y = b0 b1X
El intervalo de confianza de 100(1-) % para y/x cuando se desconoce
2
y/x esta dada por la expresin:
CASO I: Muestra pequea (n 30)

( X 0 X )2
1
P Y T( / 2;n 2) S y / x

2
n n

2
X i X i

i 1

i 1

CASO II: Muestra grande (n > 30)

( X 0 X )2
1
P Y Z ( / 2) S y / x

2
n n

2
X i X i

i 1

i 1

PARA EL CASO PARTICULAR SI LA EDAD FUESE 46 AOS


i = 84,78 + 0,97 (46)
i = 129,2

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

101
Para el ejemplo:

1
(46 63.6) 2
P 129,20 2.16(8,9625717)

1 0,05
2
15 64594 954 15

P121,8 136,6 0,95


El intervalo de confianza para U46 = 129,20; se encuentra entre 121,8 y
136,6 mm.Hg de presin sistlica, con un nivel de confianza del 95%.

6.9. INTERVALO DE PREDICCIN PARA VALORES INDIVIDUALES DE X


En contraste con los intervalos de confianza, que son estimaciones de
parmetros de poblaciones, en un intervalo de prediccin se estima un
valor individual y es, por lo tanto, un intervalo de probabilidad. Podra
parecer posible construir un intervalo de prediccin utilizando el error
estndar del estimador.
Sin embargo, ese intervalo estara incompleto, porque el error estndar
del estimador no incluye la incertidumbre asociada con el hecho de que
la lnea de regresin basada en datos muestrales incluye tambin error
muestral, y por lo general, no es idntica a la lnea de regresin para la
poblacin. El error estndar completo para un intervalo de prediccin
se denomina error estndar del pronstico, e incluye la incertidumbre
asociada con la dispersin vertical con respecto a la lnea de
regresin y adems, la incertidumbre asociada con la posicin del valor
mismo en la lnea de regresin.
2

Cuando se desconoce y/x, el intervalo de prediccin del 100 (1-) por


ciento para Y esta dado por la expresin:

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

102

CASO I:
Muestra pequea (n 30)

1
P Y T / 2;( n 2 ) S y / x 1
n

( X 0 X )2
2
n
n

2
X i X i
i 1

i 1

CASO II:
Muestra grande (n > 30)

1
P Y Z ( / 2) S y / x 1
n

( X 0 X )2
2
n
n

2
X i X i
i 1

i 1

Ejemplo 3
El gerente de personal de la empresa agroindustrial bajo mayo
estudia la relacion entre la variable dependiente: y=gastos y la variable
independiente x=salario, de su personal obrero.Una Muestra aletoria
de 10 obreros revelo los siguentes datosen dolares por semana:
SALARIOS 28

25

35

40

45

50

50

35

70

80

GASTOS

20

32

37

40

40

45

30

55

60

25

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

103

SALARIOS
X
28
25
35
40
45
50
50
35
70
80
458

GASTOS
Y
25
20
32
37
40
40
45
30
55
60
384

Estadistca Inferencial

X
789
625
1225
1600
2025
2500
2500
1225
4900
6400
23789

Y
625
400
1024
1369
1600
1600
2025
900
3025
3600
16168

X.Y
700
500
1120
1480
1800
2000
1250
1050
3850
4800
19550

M.Sc. Julio R. Gallegos Ramos

104

Prueba de hiptesis:
HO:
Ha:

0 no existe correlacin
0 si existe correlacin

14.2715

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

105

El valor de tc es mayor que el de t tabulada, por ende rechazamos h 0. si


la muestra fuera representativa , podramos afirmar que existe relacin
entre salarios y gastos en un 95%
= +
= =

=384-(1.3799) (458)=-257.1542
=

=1.3799

-257.1542+1.3799

Fuente de
variacin
(Fv)

Suma
de
cuadrados
(Sc)

Regresin

Grados
de
libertad
(gl)
1

Residual

n-2

Total

n-1

Sc total-Sc
regresin

Cuadrados
medios
(CM)

F calculada
(Fc)

Sc reg/1
Sc res/n-2

Syy

Fv

gl

Sc

CM

Fc

Regresin

13632.63

13632.63

Residual

12210.23

Total

1422.4

8.9320

Estadistca Inferencial

0.05
532

M.Sc. Julio R. Gallegos Ramos

106

SUMA DE CUADRADOS
Sc regresin=

=13632.6392

Sc total=1422.4
Sc residual = 1422.4-13632.63
INTERVALO DE CONFIANZA PARA

6.9455

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

107
Con un 955 de seguridad el coeficiente de regresin va a variar entre
los valores en un 92.68 y 106.58por cada gasto que realizara del salario.

Ejemplo 4:
El Vicepresidente de Investigacin y Desarrollo (ID) de una gran
compaa qumica y de fabricacin de fibras cree que las ganancias
anuales de la empresa dependen de la cantidad gastada en ID. El nuevo
presidente de la compaa no est de acuerdo y ha solicitado pruebas.
Los datos de seis aos son los siguientes.
Ao

1990
1991
1992
1993
1994
1995

Millones gastados en
Investigacin y Desarrollo
(X)
2
3
5
4
11
5

Ganancia Anual
(millones)
(Y)
20
25
34
30
40
31

SUMA DE CUADRADOS Y PRODUCTOS


X

Estadistca Inferencial

XY

M.Sc. Julio R. Gallegos Ramos

108
2
3
5
4
11
5
30

20
25
34
30
40
31
180

Sxx = 200

= 50

Syy = 5642

4
9
25
16
121
25
200

400
625
1156
900
1600
961
5642

40
75
170
120
440
155
1000

= 242

Sxy = 1000

= 100

COEFICIENTE DE CORRELACION
La regla de decisin para la hiptesis planteada es:
Si tc > t / 2 (n-2) gl , rechazamos H0 (existe relacin).
Si tc < t / 2 (n-2) gl , rechazamos Ha (no existe relacin).
Donde:
2

r =

r =

; asi que r =

= 0.8264

r = 0.9091
tc =

t / 2 (n-2) gl

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

109

tc =

= 4.3644

t = 0.5/2 (6-2) = 2.776

Como se puede observar, el valor tc es mayor que el de t tabulada; por


lo tanto, rechazamos H0. Si la muestra fuera representativa, podramos
afirmar que existen relacin entre los Millones gastados en
Investigacin y Desarrollo y la Ganancia Anual (millones).
2
El coeficiente de determinacin (r ) tiene un valor de 82.64%, lo cual
implica que un modelo lineal explica en un porcentaje como el descrito
la tendencia de los datos observados, considerando esto como
aceptable.
ECUACION DE PREDICCION
=

x donde:

=2

= 30 2(5) = 20
yi = 20 + 2(xi)
ANALISIS DE REGRESION
H0 =
Ha =

=0
0

FV
Regresin
Residual
Total

gl
1
4
5

Sc
200
42
242

CM
200
10.5

Fc
19.047******

F
0.05
7.71

Suma de cuadrados
Sc regresin =
Estadistca Inferencial

= 200
M.Sc. Julio R. Gallegos Ramos

110
Sc total = 242
Sc residual = 242 200 = 42
INTERVALO DE CONFIANZA PARA

P
=

=2

t = 0.5/2 (6-2) = 2.776

P 0.73

= 0.4582

3.27

Ejemplo 5
La agroindustria ECOANDINO de Lima quiere determinar la relacin
entre cantidad de fertilizante y produccin de papa por hectrea que
produce. Si la muestra del experimento proporciona lo siguientes
datos.
sacos de
fertilidad por
hectrea.
1
2
3
4
5
6
7

Y Rendimiento
de quintales.

Estadistca Inferencial

8
10
13
16
20
24
28

1
4
9
16
25
36
49

XY

64
100
169
256
400
576
784

8
20
39
64
100
144
196

M.Sc. Julio R. Gallegos Ramos

111
8
9
10
TOTAL: 55

31
36
39
TOTAL: 225

64
81
100
TOTAL:
385

961
1296
1521
TOTAL:
6127

248
324
390
TOTAL:
1533

Coeficiente de regresin.

H0: P = 0
H0: P diferente a 0

T=0.5/2(10-2)gl = 2.306
Podramos afirmar que si existe relacin entre sacos de fertilidad por
hectrea y rendimiento de quintales de papa. Adems con el
coeficiente de determinacin tiene un valor de 99.4%. Lo cual indica
que el resultado es muy aceptable.

Ecuacin de prediccin.
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

112

..2
..3
Anlisis de regresin.

Fuente de Grados
Suma de
variacin
de
cuadrados
(FV)
libertad
(SC)
(GL)
Regresin 1
158.4
Residual
8
6.1
Total
9
1064.5

Cuadrados
medios
(CM)

F
calculada(FC)

1058.4
0.7

1512

0.05
5.32

Se puede observar que FC es mayor que F tabulada al 0.05, lo cual


implica una alta significancia. Concluimos sobre la hiptesis que el
efecto de sacos de fertilidad por hectrea es impactante sobre el
rendimiento de quintales de papa.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

113
Ejemplo 6:
El gerente de personal de la Municipalidad Provincial de San Romn
quiere estudiar la relacin entre el ausentismo y la edad de sus
trabajadores. Tom una muestra aleatoria de 10 trabajadores de la
Municipalidad y encontr lo siguientes datos.


EDAD
25
46
58
37
55
32
41
50
23
60

Y
AUSENTISMO
18
12
8
15
10
13
7
9
16
6

Diagrama de dispersion

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

114

REGRESIN LINEAL SIMPLE:


2

XY

25
46
58
37
55
32
41
50
23
60
427

18
12
8
15
10
13
7
9
16
6
114

625
2116
3364
1369
3025
1024
1681
2500
529
3600
19833

324
144
64
225
100
169
49
81
256
36
1448

43
58
66
52
65
45
48
59
39
66
4452

Sxx = x
2

Sxx = 19833
Sxx = 19833 182329
Sxx = 1600.1
Syy = y
2

Syy = 1448
Syy = 1448
Syy = 1448
Syy = 148.4

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

115

Sxy = xy
Sxy = 4452
Sxy = 4452
Sxy = 4452
Sxy = - 415.8
COEFICIENTE DE CORRELACIN:
H0: P=0 : no existe correlacin.
H1: P0 : existe correlacin.
tc =

t =

hallando r y r

r =
2

r =
2

r =
2

r =0.72809
r=
Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

116
r = 0.8533
Reemplazando a la frmula de tc
tc =
tc =
tc = 4.6289
Reemplazando a la frmula de tt
t =
t =
t = 2.3060
tc > t
si existe relacion entre las variables edad y ausentismo
ECUACIN DE PREDICCIN:
y = + (xi)
= y +
promedios:
= 42.7
= 11.4
Hallando ^
=

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

117
=
=
hallando ^
= -
= 11.4 - (- 0.2599) 42.7
= 22.4959
yi = ^ + (xi)
yi = 22.496
anlisis de regresin
H0 : = 0
H1 : 0

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

118

BIBLIOGRAFIA

Aguilar, A. (2007). Probabilidad y Estadstica. California: CECYTEBC


Berenson, M. y Levine, D. (2007). Estadstica Aplicada a Administracin y Economa.
Mxico: McGraw-Hill.
Crdova, M. (2008). Estadstica Descriptiva e Inferencial. Lima. Moshera S. R. L.
DeGroot, M. (1988). Probabilidad y Estadstica. (2 Ed.). Espaa: AddisonWesley
Iberoamericana..
Daz, A. (2013). Estadstica aplicada a la administracin y la economa Mxico: McGrawHill
Gomez, H. (2009). Estadistica. Colombia: Mc Graw-Hill
Gorgas, C., Cardiel, N. y Zamorano, J. (2009). Estadistica basica para estudiantes de
ciencia. Madrid: Facultad de ciencias fisicas.
Levin, R. & y Rubin, D. (2004). Estadstica para Administracin y Economa, (7ma) Edicin.
Mxico: Pearson Educacin.
Martn, Q., Cabero, T., y De Paz, Y. (2008). Tratamiento Estadstico con SPSS prcticas
resueltas y comentadas. 1a Ed. Espaa: Thomson.
Mitacc, M. (2004). Tpicos de Estadstica Descriptiva y Probabilidad. Lima: San Marcos
Murray, S. y Larry J. Stephens (2001). Estadstica. Mxico: McGrawHill
Nuez, R. (2007). Estadstica para la Ciencia Social. Mxico, D. F.: Trillas.
Paul Newbold, P., Carlson, W. y Thorne, B.. (2008). Estadstica para administracin y
economa. Espaa: Pearson Educacin SA.
Pea, D. (2001). Fundamentos de Estadstica. Madrid.: Alianza Editorial, S.A.
Spiegel, MR, Stephens (2009). Estadstica. Mxico DF.: Mc Graw-Hill
Triola, M. (2009), Estadstica. (10ma Edic) Mexico: Pearson.

Estadistca Inferencial

M.Sc. Julio R. Gallegos Ramos

S-ar putea să vă placă și