Documente Academic
Documente Profesional
Documente Cultură
CAPTULO
I
PROBABILIDADES
1.1 CONCEPTO
La probabilidad es una disciplina abstracta que se usa como modelo
para hacer deducciones relativas a eventos que posiblemente puedan
ocurrir.
En estadstica intentamos expresar la probabilidad en trminos
cuantitativos precisos. Un enunciado probabilstico puede predecir
todos los casos desde la certeza de que el suceso ocurrir hasta la
certeza de que no ocurrir.
2
(2) Tirar 2 dados, {(1,1), (1,2),..., (5,6), (6,6)}
(3) Elegir un punto al azar en [0,1], {x: 0x1}
1.1.2. Evento
Llamaremos evento a un subconjunto de . Por ejemplo:
(1) A El nmero es par {2,4,6}
(2) B La suma es 10 {(4,6), (5,5),(6,4)}
(3) C {x: 0x1/2}
1.1.3. Probabilidad de un evento (motivacin emprica).
Repitamos un ensayo n veces y supongamos que un evento A del
mismo aparece kn veces. Sea:
fnkn/n frecuencia relativa de A en n ensayos.
Es un hecho emprico que fn tiende a un nmero fijo. A este nmero lo
llamamos probabilidad del evento A.
1.1.4. Relaciones entre eventos
espacio muestral un conjunto.
Evento A subconjunto de
0 evento imposible (nunca ocurre)
evento cierto (siempre ocurre)
Como los eventos son conjuntos, valen para ellos las mismas
operaciones y relaciones de los conjuntos pero se usan para ellas un
lenguaje peculiar a la teora de probabilidades:
(1) Si AB decimos que la ocurrencia de A implica la ocurrencia de B
(
2) Si AB BA AB.
(3) A A no ocurre.
c
c
cc
c
c
0 , 0, A A, AB B A
c
3
AB=BA, A0A, A, A(BC)(AB)CABC.
Dados A1,A2,A3,... escribimos Ai Por lo menos uno ocurre.
(5) AB A y B ocurren simultneamente.
A00, AAA, A=A, ABBA, (AB)CA(BC)ABC.
Ai Ocurrencia simultnea de A1,A2,A3,...
(6) Leyes distributivas: (AB)CACBC,
c
c c
c c
Estadistca Inferencial
n
Nmero de casos posibles
Estadistca Inferencial
5
Ejemplo 1:
Hallar la probabilidad de obtener sello en el lanzamiento de una
moneda:
Solucin:
Definimos el espacio muestral: = {cara, sello}
Sea el evento:
A : obtener sello en el lanzamiento de una moneda
P( A)
X 1
n 2
p( A) 0,5100% 50%
La probabilidad de obtener sello en el lanzamiento de una moneda es
del 50%.
Ejemplo 2
:
Hallar la probabilidad de obtener el nmero tres en el lanzamiento de
un dado.
Solucin:
Definimos el espacio muestral: ={1, 2, 3, 4, 5, 6}
Sea el evento:
B : obtener el nmero tres en el lanzamiento de un dado
P( B)
X 1
n 6
Estadistca Inferencial
p( B) 0,17100% 17%
La probabilidad de obtener el nmero tres en el lanzamiento del dado,
es del 17%.
P(C )
X
40
n 400
P(C) = 0,1(100%) = 10 %
La probabilidad de que al seleccionar un vendedor ambulante, este haya
sido despedido de uno de estos sectores, es del 10%.
1.2.3. Probabilidad subjetiva o personal
Es la probabilidad asignada bajo un criterio personal, basado en
cualquier tipo de evidencia disponible. Las probabilidades subjetivas se
asignan a eventos que pueden suceder solo una vez o muy pocas veces.
Se conoce todos los resultados, no se puede mantener que sean
equiprobables y no tiene sentido acudir a la experiencia observando la
situacin repetidas veces, o ambas cosas.
Ejemplo 4:
La probabilidad de que se encuentre una cura para el SIDA en los
prximos aos.
Mutuamente excluyentes.
No excluyentes o conjuntos.
Independientes.
Dependientes.
donde:
P
: Probabilidad
P(B)
Ejemplo 5:
De 200 nios examinados por una nutricionista en un C. E., se encontr
que 80 padecan de desnutricin leve, 50 padecan de desnutricin
crnica y 70 normales. Si de los nios examinados se selecciona uno al
azar Cul es la probabilidad de que padezca de desnutricin leve o
crnica?.
Solucin:
Sean los eventos:
A: El nio seleccionado padece de desnutricin leve
B: El nio seleccionado padece de desnutricin crnica
C: El nio seleccionado es normal
n(A) = 80
n(B) = 50
n(C) = 70
Estadistca Inferencial
P( A B)
80
50 130
0,65 65%
200 200 200
donde:
P(AB): Probabilidad de que ocurra el evento A o B.
P(AB): Probabilidad de que ocurran simultneamente los eventos A y
B.
Ejemplo 6:
De 100 pacientes adultos mayores examinados, 20 padecan de artritis,
32 padecan de gastritis y 8 tenan ambos males. Si se selecciona un
paciente al azar. Hallar la probabilidad de que el paciente
seleccionado padezca de artritis o gastritis?.
Solucin:
Sean los eventos:
A: El paciente seleccionado padece de artritis
Estadistca Inferencial
10
B: El paciente seleccionado padece de gastritis
n(A) = 20
n(B) = 32
n(A B) = 8
Como los eventos son mutuamente no excluyentes, se tiene:
P(AB) : Probabilidad de que ocurran los eventos A o B.
P( A B) P( A) P( B) P( A B)
20 32
8
P( A B)
0,44 44%
100 100 100
11
Sean los eventos:
A: La persona elegida es mayor de 18 aos
B: La persona elegida consume carne
P(A) = 0,45
P(B) = 0,15
Entonces:
P(AB) = P(A) P(B)
P(AB) = (0,45)(0,15) = 0,0675 = 6,75%
La probabilidad de que una persona elegida en forma aleatoria del
Centro Poblado de Salcedo consuma carne y tenga ms de 18 aos de
edad, es de 6,75%.
Estadistca Inferencial
12
Sean:
Eventos
A : Incremento del empleo
Probabilidades
P(A) = 0,35
Entonces:
P (AB) = P(A)P(B/A)
P (AB) = (0,35)(0,10) = 0,035
La probabilidad de que haya un incremento en el empleo y en el
consumo de esos artculos de primera necesidad es del 3,5%.
Ejemplo 9:
La presente tabla refiere al Grado de selectividad a una Universidad
POSTULANTES
INGRESANTES
TOTAL
UNMSM
58459
4639
63098
UNAP
19574
2025
21599
TOTAL
78033
6664
84697
Probabilidad Marginal
Estadistca Inferencial
13
14
Probabilidad Aditiva
Estadistca Inferencial
15
Estadistca Inferencial
16
Sabiendo que los jvenes que tiene un grado de selectividad a la
Universidad Nacional Mayor de san Marcos, la probabilidad de
pertenezca al grupo de los ingresantes es de 7.3%.
Estadistca Inferencial
17
P( Br / A)
P( Br ) P( A / Br )
k
P( B ) P( A / B )
i 1
donde:
Bi
B1
B2
Bk
A
Ejemplo 10:
En un saln de clase se reuni a los alumnos de los cinco niveles de la
carrera profesional de Educacin Fsica, para realizar un estudio acerca
de la preferencia por la prctica del ftbol, obtenindose los siguientes
resultados:
Nivel
Primero
Segundo
Estadistca Inferencial
N de
Estudiantes
55
40
Practican
Ftbol
20
15
M.Sc. Julio R. Gallegos Ramos
18
Tercero
Cuarto
Quinto
TOTAL
35
40
30
200
20
10
5
70
Solucin
Se observa que el espacio muestral se ha particionado en cinco niveles,
a la vez se distinguen los siguientes eventos:
B1
B2
B3
B4
B5
A
55
= 0,275
200
35
P(B3) =
= 0,175
200
40
P(B4) =
= 0,200
200
P(B1) =
Estadistca Inferencial
P(B2) =
40
= 0,200
200
P(B5) =
30
= 0,150
200
M.Sc. Julio R. Gallegos Ramos
19
20
= 0,364
55
20
P(A/B3) =
= 0,571
35
10
P(A/B4) =
= 0,250
40
P(A/B1) =
a)
P(A/B2) =
15
= 0,375
40
P(A/B5) =
5
= 0,167
30
P( B1 / A)
P( B1 ) P( A / B1 )
P( B ) P( A / B )
i 1
P( B1 ) P( A / B1 )
P( B1 ) P( A / B1 ) ...... P( B5 ) P( A / B5 )
(0,275)(0,364)
(0,275)(0,364) (0,200)(0,375) .... (0,150)(0,167)
P( B1 / A) 0,286
b)
P( B5 / A)
P( B5 ) P( A / B5 )
k
P( B ) P( A / B )
i 1
Estadistca Inferencial
P( B5 ) P( A / B5 )
P( B1 ) P( A / B1 ) ...... P( B5 ) P( A / B5 )
20
(0,150)(0,167)
(0,275)(0,364) (0,200)(0,375) .... (0,150)(0,167)
P( B5 / A) 0,071
c)
21
A2= cubre el servicio de la lnea 2
A3= cubre el servicio de la lnea 3
B1= sufre un accidente
B2= no sufre un accidente
N
O
S
A1
0,4545
0,25
S
A2
N
S
0,30
A3
N
Datos:
P A1=45%
P (B1/A1)=2%=0,02
PA2=25% =0,25
P (B1/A2) =3%= 0,03
A3=30% = 0,3
P (B1/A3) =1% = 0,01
La probabilidad de no sufrir un accidente para la lnea son:
P (B2/A1)=1-P (B1/A1) =1-0,02= 0,98
Estadistca Inferencial
22
a)
Empleando la formula
Estadistca Inferencial
23
La probabilidad de que sea de la lnea 1, sabiendo que sufre una avera
es:
Estadistca Inferencial
24
CAPTULO
II
DISTRIBUCIONES DE
PROBABILIDAD
2.1. INTRODUCCION
El comportamiento de una variable aleatoria queda descrita por su
distribucin de probabilidad. En muchas tareas estadsticas, se busca
determinar una distribucin de probabilidad o modelo probabilstico
que satisfaga un conjunto de supuestos, para estudiar los resultados
observados de un experimento aleatorio.
En las distribuciones de mayor uso tenemos:
Distribuciones discretas
Binomial
Poisson
Distribuciones continuas
Normal
Normal estandar.
2.2. DISTRIBUCIONES DISCRETAS
2.2.1.Distribucin Binomial
Estadistca Inferencial
25
Es una distribucin discreta utilizada ms frecuente en estadstica
aplicada. La distribucin se deriva de un procedimiento conocido como
ensayo de Bernoulli.
La distribucin binomial se utiliza para calcular probabilidades de
variables discretas. Se aplica en aquellos experimentos aleatorios que
tienen slo dos posibles resultados mutuamente excluyentes.
Asimismo, al llegar a cabo el experimento aleatorio, siempre estamos
interesados en que suceda uno de los dos resultados, si el experimento
que esperbamos efectivamente sucede, diremos que hubo un XITO,
si el resultado que esperbamos no sucede, entonces diremos que
hubo un FRACASO estos dos resultados, se designan en trmino de
probabilidad, como p y q
RESULTADOS
PROBABILIDAD
XITO
probabilidad de xito
FRACASO
probabilidad de Fracaso
n
n!
P X x p x q ( n x )
p x q ( n x ) ;
x!(n x)!
x
x 0,1,2,....,n
donde:
n
x
p
: Nmero de ensayos
: Nmero de xitos
: Proporcin de xito.
Estadistca Inferencial
26
q
: Proporcin de fracaso.
n
x
: Coeficiente binmico
n!
: Factorial de n = n(n-1)(n-2)(n-3)(...)(2)(1)
NOTA:
i) El factorial de 0 es 1; es decir, 0! = 1
0
E( X ) np
b) Varianza V(X)
2 V ( X ) np(1 p)
Los criterios que debe satisfacer un experimento binomial son:
i)
ii)
iii)
iv)
v)
NOTA:
Estadistca Inferencial
27
i)
ii)
Ejemplo 1:
Se conoce que existe una probabilidad del 5% de que un estudiantesea
desaprobado en la asignatura de SociologiaCul es la probabilidad de
que 6 estudiantes seleccionados al azar de una seccin, que hayan
seguido dicho curso?.
a)
b)
c)
Solucin:
a) Definamos la variable aleatorias X:
X: Nmero de estudiantes que resultan desaprobados
Rx = {0, 1, 2, 3, 4, 5, 6}
La probabilidad de xito es p = 5 % = 0,05
P( X 3)
6!
(0,05) 3 (0,95) 63 0,0021434375 0,002
3!(6 3)!
b) P( X 3) P( X 0) P( X 1) P( X 2)
Estadistca Inferencial
28
P( X 0)
P( X 1)
6!
(0,05) 0 (0,95) 60 0,73
0!(6 0)!
6!
(0,05)1 (0,95) 61 0,23
1!(6 1)!
P( X 2)
6!
(0,05) 2 (0,95) 62 0,03
2!(6 2)!
c)
P( X 2) 1 P( X 2)
P( X 2) 1 P( X 0) P( X 1)
P( X 2) 1 0,73 0,23) 0,04
Estadistca Inferencial
29
N=15 x=10 p=0.25 q=0.75
Estadistca Inferencial
30
La probabilidad de sacar un voto del candidato X en un intento es de
20%.
b) N=1 Y=1 p=0.8 q=0.2
Estadistca Inferencial
31
e) N=5 Y=3 p=0.8 q=0.2
32
Estadistca Inferencial
33
PROBLEMAS PROPUESTOS
1) En promedio cierto estudiante puede resolver la mitad de los
problemas que se le presenten; para aprobar es necesario
Estadistca Inferencial
34
solucionar 7 de 10 preguntas de un examen Cul es la
probabilidad de que el estudiante apruebe el examen?
2) Supngase que el 24% de cierta poblacin tiene sangre tipo B. A
partir de una muestra de 20 individuos extrada de esa poblacin
calcular la probabilidad de:
a) Encontrar exactamente 3 individuos con sangre tipo B.
b) Encontrar tres o ms individuos con sangre tipo B.
c) Encontrar menos de tres individuos con sangre tipo B.
d) Encontrar exactamente cinco individuos con sangre tipo B.
3) Un estudiante que no se ha preparado absolutamente nada para
un examen que tiene 20 preguntas de verdadero falso. Decide
lanzar al aire una moneda para responder. Anota verdadero si la
moneda cae cara y falso si cae sello.
a) Que probabilidad hay de que pase el examen, si para hacerlo
debe contestar correctamente por lo menos el 70% de las
preguntas?
b) Que probabilidad de que conteste por lo menos la mitad de
las preguntas correctamente?
2.2.2. Distribucin Poisson
La distribucin de Poisson es una distribucin discreta, tiene muchos
usos en la economa, biologa, medicina, el comercio, en el control de
calidad industrial, ciencias sociales, lneas de espera, llamadas
telefnicas, etc.
Una variable aleatoria X tiene una distribucin de Poisson, si su funcin
de densidad de probabilidad est definido por:
PX x
e x
;
x!
x 0,1,2,3,4,.....
donde:
e:
constante (2.71828182)
Estadistca Inferencial
35
X:
El nmero de xitos en n pruebas
:
Nmero esperado(Promedio) de presentaciones del suceso
= np
PARMETRO:
Parmetro es > 0.
CARACTERSTICAS:
Esperanza matemtica E(X)
Varianza V(X)
E(X )
2 V (X )
Estabilidad, el valor
constante.
de (promedio)debe permanecer
NOTA:
La distribucin de POISSON es generalmente utilizada en los problemas
en que se encuentran el nmero de eventos de cierto tipo, que ocurren
en un intervalo de tiempo, o en una regin, en un volumen. Por lo
expuesto, esta distribucin llamada distribucin de Eventos raros,
tales como: (9)
Estadistca Inferencial
36
Ejemplo 1:
La tasa de mortalidad para cierta enfermedad es de 7 por cada 1000
personas. Cul es la probabilidad que se observen exactamente 5
decesos por esta enfermedad en un grupo de 400 personas?
Solucin:
X: Nmero de decesos a causa de la enfermedad
Rx = {0, 1, 2, 3, .....}
p = 7/1000 = 0,007,
n = 400,
= np = 400(0,007) = 2,8
PX 5
e x e2,8 (2,8)5
0,087
x!
5!
Ejemplo 2:
En la ciudad de Puno se han producido a razn de 3 apagones por mes.
Hallar la probabilidad de que en los prximos 6 meses, no haya ningn
apagn.
Solucin:
X: Nmero de apagones
Rx = {0, 1, 2, 3, .....}
Estadistca Inferencial
37
MESES
APAGONES
1 mes
6 meses
3 apagones
X
X = 6(3)/1 = 18
PX 0
e ( ) x e 18 (18) 0
e 18
x!
0!
El resultado implica que para n grande (n > 50) y p pequeo, (p < 0,1)
entonces se pueden aproximar probabilidades binomiales a travs de la
distribucin Poisson.
Ejemplo 3:
38
Solucin:
a)
= 35
= 2.718
b) = 6 x 2 = 12
Ejemplo 4:
En el tpico de la universidad nacional de juliaca, se registran en
promedio la atencin de 6 estudiantes por dia, entonces cul es la
probabilidad de que se atienda a 10 estudiantes en tres das?
Solucin:
a) = 6 x 3 =18
Estadistca Inferencial
39
Ejemplo 5:
El promedio de que un estudiante llegue tarde a clases en temporada
de lluvia es de 3 veces por semana. Cul es la probabilidad de que el
estudiante llegue 4 veces tarde por semana?
Solucin:
a)
=3
Ejemplo 6:
En promedio, hay 50 incendios serios cada ao en la provincia de
Chimbomba. Cul es la probabilidad de que no haya ningn incendio
maana? El nmero medio de incendios por da es 50364 0,137.
Luego, la probabilidad de cero incendios maana es
Solucion
Sea X
P(X
Estadistca Inferencial
40
Ejemplo 8:
Si el 2% de los libros encuadernados en cierto taller tiene
encuadernacin defectuosa, para obtener la probabilidad de que 5 de
400 libros encuadernados en este taller tengan encuadernaciones
defectuosas usamos la distribucin de Poisson. En este caso concreto, k
es 5 y, , el valor esperado de libros defectuosos es el 2% de 400, es
decir, 8. Por lo tanto, la probabilidad buscada es
Estadistca Inferencial
41
Solucion
Ejemplo 9:
En una clnica el promedio de atencin es 16 pacientes por hora,
encuentre la probabilidad que en 30 minutos se atiendan 4 pacientes.
Formula de Poisson
Solucin:
Debemos calcular:
Ejemplo 10:
Los reportes de crmenes recientes indican que 3.2 de los robos de
vehculos motorizados ocurren cada minuto en estados unidos.
Suponga que la distribucin de los robos por minuto puede calcularse
con la distribucin de probabilidad de poisson; a) calcule la
probabilidad de que ocurran cuatro robos exactamente en un minuto;
b) cual es la probabilidad de que en cuarto de hora cualquiera ocurran
exactamente 45 robos.
Estadistca Inferencial
42
Solucin:
a)
Solucin: b)
Ejemplo 11:
Con objeto de revisar la calidad en el pulido de un lente, cierta
compaa acostumbra determinar el nmero de manchas en la
superficie considerando el lente defectuoso si 3 o mas de tales
manchas asperezas y otro tipo de defectos aparecen en el. Si la tasa
media es de 2 defectos por
, calcule la probabilidad de que un
lente de
, que ha sido revisado no se le catalogue como
defectuoso? Un lente no se le cataloga si tiene menos de 3 defectos.
Solucion
Solucin:
Estadistca Inferencial
43
Ejemplo 12:
En una tienda los clientes llegan al mostrador conforme una
distribucin de Poisson con un promedio de 10 por hora. En una hora
dada, Cul es la probabilidad de que lleguen el al menos 5 clientes?
Solucion:
Estadistca Inferencial
44
PROBLEMAS PROPUESTOS
1) En promedio, cinco fumadores pasan por la esquina de cierta calle
cada 10 minutos cul es la probabilidad de que durante un
periodo dado de 10 minutos el nmero de fumadores que pasen
sea de:
a) Seis o menos? b) Siete o ms? c) Exactamente ocho?
2) Cierto alimento produce una reaccin alrgica en un 0,1% de una
poblacin grande, Si 1,000 personas comen este alimento diario en
promedio. Cul es la probabilidad de que 3 personas tengan
reaccin alrgica a dicho alimento?
3) En una determinada regin de la selva se pretende introducir un
nuevo producto del que es razonable esperar sea demandado por
el 0,5% de los habitantes de dicha zona. Determinar la probabilidad
de que, consultados 2,000 de estos habitantes, dicho producto sea
demandado por 2 o ms personas.
Estadistca Inferencial
45
1) Se conocen muchos fenmenos aleatorios que siguen la ley de
probabilidad NORMAL. Algunos de estos fenmenos son: la
industria, Economa, ciencias sociales, etc.
2) Sirve como una buena aproximacin para muchas distribuciones en
aquellas situaciones en donde n asume en valor grande (n > 30)
Se dice que una variable aleatoria X tiene una distribucin NORMAL,
2
con media y varianza , si su funcin de densidad est dada por:
f ( x)
1 x
1
e 2
2
PARMETROS:
Esperanza matemtica: E(X)
E(X) = - < x < +
Varianza: V(X)
V(X) =
f ( z)
donde:
1 2 z2
e
2
Z
Estadistca Inferencial
46
USO DE TABLAS:
2
i)
x a
a
P( x a) P
ii) P( x a) 1 Px a 1
b
a
iii) P(a x b) Px b Px a
iv) P( x a) Px a 1 a
v)
a
a
P( x a) P a x a
Ejemplo 1:
La presin sangunea media en profesores de 20 a 25 aos de edad es
de 123 unidades con desviacin tpica de 13,7 unidades. Si se
selecciona al azar uno de estos profesores, calcule:
La probabilidad de que su presin sangunea sea:
a)
b)
c)
Solucin:
a)
Estadistca Inferencial
47
X 120
P( X 120) P
120 123
P( X 120)
(0,22) 0,41294
13,7
b)
1 (0.36496)
1
13,7
c)
48
personas deberemos esperar que obtengan una puntuacin entre 209 y
211 puntos?
Solucion
209 210
1,67
0,6
211 210
z2
1,67
0,6
z1
Ms de 80 kg.
b)
Menos de 50 kg.
c)
Entre 50 y 80 kg.
Estadistca Inferencial
49
Solucion
50 67
3,4
5
80 67
z2
2,6
5
z1
Ejemplo 4:
En una ciudad, la temperatura mxima durante el mes de junio est
distribuida normalmente con una media de 26 y una desviacin tpica
de 4. Calcular el nmero de das que se espera tengan temperatura
mxima comprendida entre 22 y 28.
Estadistca Inferencial
50
Solucionn
Tipificamos los valores 22 y 28:
22 26
1
4
28 26
z2
0,5
4
z1
E 30 0,5328 15,9 16
das
Ejemplo 5:
Aproximando con una distribucin normal, calcular la probabilidad de
que al lanzar una moneda 100 veces, el nmero de caras obtenido est
comprendido entre 45 y 55.
Solucion
Se tiene:
m np 100
1
50
2
Estadistca Inferencial
51
1 1
s npq 100 5
2 2
45 50
z1
1
5
55 50
z2
1
5
Y la probabilidad pedida es, con la aproximacin realizada:
Problermas Propuestos
1.- En cierta ciudad, el nmero de interrupciones del suministro
elctrico por mes se considera una variable aleatoria normal para la
cual = 11.6 y = 3.3
Determine la probabilidad de que en un mes cualquiera haya al menos
ocho interrupciones.
Determine la probabilidad de que en un mes cualquiera haya entre tres
y siete interrupciones.
Determine la probabilidad de que en un mes cualquiera haya a lo ms
cinco interrupciones.
Resp. 0.8623 0.0771 0.0228
2.- En un proceso fotogrfico, el tiempo de revelado de las impresiones
puede considerarse una variable aleatoria normal para la cual = 12,9
minutos = 2 minutos.
Estadistca Inferencial
52
Determine la probabilidad de que el tiempo de revelado tarde entre 16
y 16.5 minutos
Determine la probabilidad de que el tiempo de revelado se lleve al
menos 16.2 minutos
Determine la probabilidad de que el tiempo de revelado se lleve a lo
ms 16.35 minutos
Resp. 0.0246 0.0495 0.9577
3.- La cantidad de caf instantneo que una mquina dispensadora
deposita en vasos de 4 onzas puede considerarse una variable aleatoria
con distribucin normal para la cual = 0.04 onzas. Si slo 2 % de los
vasos contienen menos de 4 onzas, cul sera el contenido promedio
de estos vasos?
Resp. = 4.082
Estadistca Inferencial
53
CAPTULO
III
MUESTREO
3.1. Introduccin
Cuando queremos estudiar alguna caracterstica de una poblacin para
obtener el mximo de informacin veraz, se nos plantea un problema
relacionado con la eleccin de los individuos. Puesto que no podemos
estudiar a toda la poblacin por varias razones (proceso largo y coste
elevado, entre otros), debemos elegir estudiar una muestra que sea
representativa y que nos permita extrapolar los resultados que
obtengamos a la poblacin de referencia. Sin embargo, debemos
considerar que el empleo de tcnicas de muestreo implica una serie de
ventajas y limitaciones.
Entre las ventajas se incluyen una mayor eficiencia en trminos
econmicos y mayor rapidez de obtencin de resultados.
Si
empleamos slo el tamao muestral necesario, seleccionando la
muestra de manera que represente lo ms fielmente posible a la
poblacin, podremos obtener tambin mayor validez, puesto que el
tiempo y dinero ahorrados se podrn emplear en recoger la
informacin o variables del estudio con mayor precisin y fiabilidad,
implicando una mayor validez interna final del estudio.
3.2. Tcnicas de muestreo
Estadistca Inferencial
54
La mejor forma de asegurar la validez de las inferencias es seleccionar
la muestra mediante una tcnica aleatoria. A este tipo de muestreo se
le denomina muestreo probabilstico y puede definirse como aquel en
que todos los individuos de la poblacin tienen una probabilidad de
entrar a formar parte de la muestra (normalmente equiprobable, es
decir, con la misma probabilidad).
Los diseos en que interviene el azar producen muestras
representativas la mayora de las veces, aunque no garantizan la
representatividad de la poblacin que sometemos a estudio. Aunque
en muchos estudios no es posible obtenerla rigurosamente de esta
forma, es importante seleccionarla intentando que sea lo ms parecida
posible a la poblacin de inters. En este caso, el muestreo no
probabilstico utiliza mtodos en que no interviene el azar y por lo
tanto, se desconoce la probabilidad asociada a cada individuo para
formar parte de la muestra. Normalmente estos mtodos se utilizan en
estudios exploratorios o intencionales, en los cuales no es necesario
proyectar los resultados. El inconveniente de este mtodo es que no
puede asegurarse la representatividad de la muestra.
3.3. Clasificacin de los tipos de muestreo probabilstico
Entre los mtodos de muestreo probabilsticos ms utilizados en
investigacin encontramos los siguientes: Muestreo aleatorio simple,
estratificado, sistemtico y muestreo en etapas mltiples.
A
continuacin se describen las caractersticas de cada uno de los
sistemas de muestreo
3.3.1.
Estadistca Inferencial
55
Este tipo de muestreo se caracteriza por su simplicidad y fcil
comprensin, aunque tambin posee algunas limitaciones, ya que no
siempre es posible disponer de un listado de todos los individuos que
componen la poblacin, generalmente cuando son poblaciones
grandes. Si se seleccionan muestras pequeas mediante este mtodo
pueden aparecer errores aleatorios, no representando la muestra
adecuadamente a la poblacin. Un ejemplo de muestreo aleatorio
simple sera la eleccin de los individuos a travs de la eleccin
realizada totalmente al azar de un cierto nmero de DNI.
3.3.2.
Muestreo estratificado
56
la misma proporcin de hipertensos fumadores (35%) y de no
fumadores (65%).
3.3.3.
Muestreo sistemtico
3.4.
57
muestrales dependen en gran medida del criterio o juicio del
investigador. La muestra, en este caso, se selecciona mediante
procedimientos no aleatorios.. Los tipos de muestreo no probabilstico
son: muestreo de conveniencia, muestreo discrecional y muestreo por
cuotas, de los que pasaremos a explicar brevemente:
3.4.1.
Muestreo de conveniencia.
Muestreo discrecional.
Estadistca Inferencial
58
3.5.1.
Determinacin de parmetros
Veamos un ejemplo.
Estadistca Inferencial
59
Pretendemos estudiar la prevalencia de Diabetes Mellitas y no
conocemos el valor aproximado de la proporcin de diabticos en la
poblacin. Considerando un nivel de confianza al 95% y una precisin
deseada del 6%, la muestra necesaria para nuestro objetivo sera de:
60
N *Z2 *S2
e 2 ( N 1) Z 2 * S 2
Problemas propuestos
Una empresa farmaceutica va a realizar un estudio de mercado antes
de lanzar una nueva pasta dental hacia una poblacin de 30,000
consumidores. Una encuesta piloto previa al estudio, revel que el 60
% de los consumidores prefieren su producto.
a) Qu tamao de muestra deber escoger si quiere tener una
confianza del 95% de que el error de estimacin de la
proporcin a favor del producto no sea superior a 0.0212 ?.
b) con los mismos datos complete la presente tabla:
PRECISION
e
10%
7%
5%
NIVEL DE CONFIANZA
90% (1.64)
95% (1.96)
99% (2.58)
Estadistca Inferencial
61
CAPTULO
IV
ESTIMACION ESTADISTICA
4.1 Concepto
Un estimador de un parmetro poblacional es una variable aleatoria
que depende de la informacin de la muestra; su valor proporciona
aproximaciones a este parmetro desconocido. Un valor especfico de
esa variable aleatoria se llama estimacin (Newbold, Carlson y
Thorne, 2008, p.296).
Existen dos tipos de estimacion:
Estimacin por punto. Utilizar un solo valor para estimar el
parmetro.
Estimacin por intervalo. Utilizar un rango de valores o intervalo.
4.2.- ESTIMADOR PUNTUAL Y ESTIMACIN PUNTUAL
Sea x1, x2,, Xn una muestra de tamao n seleccionados de una
poblacin definida X de parmetros o cuya distribucin la denotaremos
por f(x, o). (Crdova, 2009, p.377).
Consideremos un parmetro poblacional como la media poblacional
o la proporcin poblacional P. Un estimador puntual de un parmetro
poblacional es una funcin de la informacin de la muestra que genera
un nico nmero llamado estimacin puntual. Por ejemplo, la media
Estadistca Inferencial
62
muestral X es un estimador puntual de la media poblacional, , y el
valor que toma X para un conjunto dado de datos se llama estimacin
puntual, X. (Newbold, Carlson y Thorne, 2008, p.296).
4.3. ESTIMACIN DE INTERVALOS
Mtodo estadstico que bsicamente consiste en obtener el intervalo
de extremos cerrados [a, b], dentro del cual se ubican los posibles
valores de u n parmetro con una medida de fiabilidad denominado
nivel de confianza. (Crdova, 2009, p.377).
Los 3 elementos de una estimacin por intervalo
Lo primero que es importante notar es que el intervalo se construye
alrededor () de la media muestral, el estadstico. Adems, el intervalo
se abre () de acuerdo con el nivel de confianza especificado, z, y al
error estndar del estimador, en este caso, el error estndar de la
media, SX. (Diaz, 2013, p.244).
En otras palabras, el intervalo de confianza tiene 3 elementos:
1. El estadstico, en los ejemplos anteriores la media muestral,
alrededor del cual se construye el intervalo.
2. El nivel de confianza especificado, que se utiliza para determinar el
valor de z, la desviacin estndar de la distribucin normal
estandarizada, que es la que permite medir las probabilidades de
acuerdo con esta distribucin.
3. El error estndar de la media, sx, que aqu se calcul a partir de la
desviacin estndar de la muestra.
Con estos mismos 3 elementos se construyen diferentes intervalos de
confianza dependiendo de diversas circunstancias que se presentan.
Estadistca Inferencial
63
Spiegel y Stephens (2009) afirman: Si el estadstico S es la media
muestral , entonces los l mites de confianza de 95 y 99% para la
estimacin de la media poblacional est n dados por
1.96 y
2.58 , respectivamente. En general, los l mites de confianza est n
dados por
zc , donde zc (que depende del nivel de confianza
deseado) puede leerse en la tabla 9.1. Empleando los valores para
obtenidos en el captulo 8, se ve que los lmites de confianza para la
media poblacional estn dados por (p.229)
64
Z95%=1.96
= x Z
x = 16.25
s = 8.026
= 16.25 (1, 96)
=16.25 +
=16.25+
=16.25 0.6614
=16.25 -
= 16.25+ 1.710
= 16.25 - 1.710
=17.96
= 14.54
0.6614
14.54 17.96
Interpretacin: en un 95% de las veces el verdadero valor del
parmetro va estar comprendida en este rango [14.54 - 17.96].
4.5. INTERVALOS DE CONFIANZA PARA LAS PROPORCIONES
Tal como se vio para la media aritmtica, el intervalo de estimacin se
construye sumando al estadstico el producto de la z correspondiente al
nivel de confianza por el valor del error estndar, o X zX. El
procedimiento para estimar una proporcin es igual, salvo que, por
supuesto, se utilizan la proporcin de la muestra y su correspondiente
error muestral. (Diaz, 2013, p.252).
En smbolos:
p zp
Spiegel y Stephens (2009) afirman: Si el estadstico S es la proporcin
de xitos en una muestra de tamao N obtenida de una poblacin
binomial en la que p es la proporcin de xitos (es decir, la probabilidad
Estadistca Inferencial
65
de xito), entonces los lmites de confianza para p estn dados por P
zcp, donde P es la proporcin de xitos en una muestra de tamao N.
Empleando los valores para p indicados en el captulo 8 se ve que los
lmites de confianza para la proporcin poblacional estn dados
por(p.229)
P ZC
= P ZC
P= p Z
p= 0.57
q=0.43
P=0.57 (1, 96)
Estadistca Inferencial
66
P= 0.57+ (1.96)
P= 0.57+0.198
P= 0.57 - 0.198
P=0.768
P=0.372
0.372 0.768
Interpretacin: en un 95% de las veces el verdadero valor del
parmetro va estar comprendida en este rango [0.3720.768].
Estadistca Inferencial
67
PROBLEMAS RESUELTOS
1) Se sabe que el peso de los ladrillos producidos por una determinada
fbrica sigue una distribucin normal con una desviacin tpica de
0.12 kilos. En el da de hoy se extrae una muestra aleatoria de
sesenta ladrillos cuyo peso medio es de 4.07 kilos.
a. Calcular un intervalo de confianza del 99% para el peso medio de los
ladrillos producidos hoy.
b. Sin realizar clculos, determinar si un intervalo de confianza del 95%
para la media poblacional tendra mayor, menor o la misma longitud
que el calculado en el apartado (a).
c. Se decide que maana se tomara una muestra de 20 ladrillos. Sin
realizar clculos, determinar si un intervalo de confianza del 99% para
el peso medio de los ladrillos producidos maana tendra mayor, menor
o la misma longitud que el calculado en el apartado (a).
Respuestas: a) (4.03, 4.11) b) menor c) mayor
2) Un director de produccin sabe que la cantidad de impurezas
contenida en los envases de cierta sustancia qumica sigue una
distribucin. Se extrae una muestra aleatoria de nueve envases cuyos
contenidos de impurezas son los siguientes:
18.2
16.6
13.7
12.3
15.9
18.8
17.4
16.2
21.8
68
3)
La Direccin General de Trfico quiere conocer la velocidad a
la que circulan los automviles en un tramo determinado de una
carretera. Para una muestra de siete automviles, el radar sealo las
siguientes velocidades en k/h.
79
73
68
77
86
71
69
10
21
22
17
19
14
19
Estadistca Inferencial
69
CAPTULO
V
PRUEBA DE HIPOTESIS
5.1. CONCEPTO
El procedimiento de pruebas de hiptesis consiste bsicamente en que
una vez planteada la hiptesis que desea probarse, se prosigue a
recabar datos mustrales para conocer si stos concuerdan con ella o si
la contradicen.( Diaz, 2013, p. 270).
Una hiptesis estadstica es una suposicin o afirmacin sobre alguna
caracter stica de una poblacin. Por ejemplo, el promedio de
contenido de las cajas del cereal es de 300 g es una afirmacin sobre
el promedio de peso, en gramos, de esas cajas (Daz, 2013, p..269)
Diaz (2013) afirma: Es importante analizar con detenimiento cmo se
plantean las hiptesis. Despus de H0 y H1 estn dos puntos (:) que
indican que a continuacin se presenta la hiptesis. Esto es importante
porque suele cometerse el error de sustituir los dos puntos por el signo
igual que (=), y aunque pudiera ser vlido se presta a confusiones con
los signos de igualdad que se utilizan en la hiptesis misma ( = 300, la
nula, o 300, la alternativa). (p.270).
5.2. HIPOTESIS ESTADISTICA
a) Hiptesis alternativa e hiptesis nula
Estadistca Inferencial
70
H0 es verdadera
H0 es falsa
Se acepta H0
Correcto
Error tipo II
Se rechaza H0
Error tipo I
Correcto
71
estudio. Dicha medida puede ser la media muestral, la proporcin
muestral, etc. (Gmez, 2009, p.216)
El rea que corresponde a las colas es el nivel de significacin , que
para el caso de una prueba bilateral debe repartirse por iguales partes
en ambas colas y que para el caso de una prueba unilateral dicho nivel
se concentra en la cola correspondiente. (Gmez, 2009, p.216)
a)
H0
H1
H1
REGION DE
REGION DE
RECHAZO
REGION DE
RECHAZO
ACEPTACION
Vc
Vt
Vt
Vc
H1
H0
REGION DE
RECHAZO
REGION DE
ACEPTACION
Vc
c)
Vt
Estadistca Inferencial
72
H0
H1
REGION DE
REGION DE
RECHAZO
ACEPTACION
0
Vt
Vc
73
sometiendo a prueba, es decir si por ejemplo estamos sometiendo a
prueba una diferencia de medias, el estadstico correspondiente que
debemos calcular ser la diferencia de medias mustrales etc.
5. Rechazar o aprobar la hiptesis nula. Si confrontamos el estadstico
de prueba calculado con el estadstico segn el criterio de decisin,
procedemos a rechazar o aceptar la hiptesis nula.
5.5.PRUEBAS DE HIPTESIS PARA LA MEDIA
Gmez, (2009) afirma: Si una poblacin es normal, las medias
mustrales tambin se distribuirn normalmente, cualquiera sea el
tamao de la muestra. No obstante, si no se conoce la desviacin
estndar poblacional ( ), sta puede ser reemplazada por la desviacin
estndar de la muestra(S) si el tamao de la muestra es mayor que
30(n>30). (p. 219)
Estadistca Inferencial
74
Ejemplo 1:
Segn experiencias pasadas, se sabe que en una compaa el retardo
promedio por mes de sus obreros es de 64 minutos con una desviacin
estndar de 8 minutos. El gerente de la compaa considera que ste
promedio ha aumentado sensiblemente en los ltimos meses, por lo
cual ordena efectuar la investigacin correspondiente. Para tal fin, se
toma una muestra aleatoria de n=64 obreros y se encuentra que la
misma presenta una media de
minutos. Se pide comprobar si el
gerente tiene o no la razn con un nivel de significacin de 0.05.
Solucin
Observemos que las medias mustrales se distribuirn normalmente,
segn el numeral 2 de sta pgina. Siguiendo los pasos planteados en la
pgina anterior tenemos:
Hiptesis nula e hiptesis alternativa:
Ho:
64 minutos (que refleja el no cambio) y
H a:
minutos (que refleja el cambio).
Estadistca Inferencial
75
2) Nivel de significacin:
0.05.
ste valor lo sugiere el presente problema, pero en la prctica es el
investigador quien lo fija de acuerdo a sus necesidades.
3) Formular la regla de decisin: Como podemos observar en el
numeral 3 de la pgina 218, la prueba es unilateral a la derecha, por lo
cual el valor de z1 correspondiente, segn el grfico de la pgina 218, es
de 1.64 de acuerdo con la tabla de distribucin normal. Por lo tanto, la
regla de decisin ser la siguiente: Se rechaza la hiptesis nula si el
valor de Z calculado es:
4)
Ejemplo 2:
Un proceso manufacturero usado por una fbrica durante los ltimos
aos da una produccin media de 100 unidades por hora con una
desviacin estndar de 8 unidades. Se acaba de introducir en el
mercado una nueva mquina para realizar ese tipo de producto.
Aunque es muy cara comparada con la que est ahora en uso, si la
media de produccin de la nueva mquina es de ms de 150 unidades
por hora, su adopcin dara bastantes beneficios. Para decidir si se
debiera comprar la nueva mquina, a la gerencia de la fbrica se le
permite hacer un ensayo durante 35 horas, hallndose un promedio de
160 unidades por hora. Con sta informacin qu decisin se debe
tomar si se asume un nivel de confianza del 99 por ciento.
Estadistca Inferencial
76
Solucin.
Segn el enunciado, solo se compra la mquina si la produccin es de
mas de 150 unidades por hora, por lo tanto las hiptesis son:
H0: = 150
H1:
> 150
n = 64
a = 5% = 0,05
Estadistca Inferencial
77
Solucin:
H0: <= 22
H1: > 22
a = 0,05
H0
H1
REGION DE
REGION DE
RECHAZO
ACEPTACION
0
1.645
Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo
tanto el tiempo que los nios de tres a cinco aos dedican a ver
la televisin es mayor de 22 horas, lo que implica que la
empresa de investigacin de mercados tiene la razn.
Ejemplo 4 :
Un gerente de ventas de libros universitarios afirma que en promedio
sus representantes de ventas realizan 40 visitas a profesores por
semana. Varios de estos representantes piensan que realizan un
nmero de visitas promedio superior a 40. Una muestra tomada al azar
durante 8 semanas revel un promedio de 42 visitas semanales y una
desviacin estndar de 2 visitas. Utilice un nivel de confianza del 99%
para aclarar esta cuestin.
Estadistca Inferencial
78
Datos:
N= 40
n=8
Nivel de confianza del 99%
Nivel de significacin = (100%-99%)/2 = 0,5% = 0,005
Solucin:
H0: < = 40
H1: ( > 40
grados de libertad: n-1 = 8-1 =7
a = 0,005
H1
H0
REGION DE
RECHAZO
REGION DE
ACEPTACION
2.83
3.49
Estadistca Inferencial
79
H0 es aceptada, ya que t prueba (2,83) es menor que t tabla (3,499), por
lo que no es acertado pensar que estn realizando un nmero de visitas
promedio superior a 40.
5.6. PRUEBAS DE HIPTESIS PARA LA PROPORCIN
Gmez, (2009) Para resolver pruebas de hiptesis para la proporcin en
muestras grandes podemos basarnos en la distribucin en el muestreo
de la proporcin utilizando la distribucin normal y el proceso que
debemos seguir es muy similar al utilizado para el caso de la media.
(p.226)
5.6.1. Estadsticos de Pruebas a utilizar:
a)
Ejemplo 5:
El rector de una universidad pblica afirma que el 15% de los
estudiantes de la universidad que l dirige est en contra de una ley
que actualmente se discute en el congreso y que supuestamente afecta
a la comunidad universitaria. El representante de los estudiantes,
considera que dicha proporcin es mayor y para comprobarlo toma una
muestra de 100 estudiantes seleccionados aleatoriamente y encuentra
que el 23% estn en desacuerdo con dicho proyecto de ley. Se pide
comprobar si el rector tiene o no la razn con un nivel de significacin
del 5%.
Solucin
1) Hiptesis nula e hiptesis alternativa: H 0: P=0.15, Ha: P>0.15. La
prueba es unilateral a la derecha, puesto que el representante de
Estadistca Inferencial
80
los estudiantes, piensa que la proporcin es superior a la afirmada
por el seor rector.
2)
Nivel de significacin:
81
Ejemplo 7:
Una empresa est interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaa publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocan el producto. A un nivel de
significacin del 1% apoya el estudio las siguientes hiptesis?
Estadistca Inferencial
82
Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
a)
a = 0,01
H0
H1
REGION DE
REGION DE
RECHAZO
ACEPTACION
-0.93
2.32
Estadistca Inferencial
83
PROBLEMAS PROPUESTOS
1) Se quiere probar la hiptesis nula de que el salario medio de los
motoristas del transporte pblico es igual a 165 dlares quincenales,
contra quienes piensan que es menor. Una muestra de 16 de esos
salarios produjo los resultados siguientes:
173 178 145 146 157 175 173 137
152 171 163 170 135 159 199 131
Utilice = 0.10, y concluya si se aprueba o no la hiptesis
Respuesta: Ha < 165 tc = -1.028 se acepta Ho
2) El tiempo para reparar un instrumento electrnico es una variable
aleatoria medida en minutos que se distribuye normalmente. Los
tiempos de reparacin para 16 de tales instrumentos, elegidos al azar,
se dan continuacin:
159
222
280
363
201
168
212
250
224
149
379
260
179
485
264
170
84
que la utilizaran. Una muestra de 170 usuarios revel que 95 tomaran
una v a norte sin pasar por el centro de la ciudad. Cumple sta va
con los criterios de la comisin de trnsito?. Utilice un nivel de
significacin del 5%.
Respuesta: Ha : P > 0.55 , zc = 0.2313 , no
5) Una compaa de televisin afirma que el 60% de la tele audiencia
mira su telenovelaBarreras de amor y odio, entre las 8:00 y 9:00 p.m.
En una encuesta telefnica realizada durante un perodo determinado,
en 300 hogares, 165 miraban esa telenovela. Podra afirmarse que la
audiencia se ha modificado?
Respuesta: Ha : 0:60, zc = 1.67, p- valor = o.0768, no
Estadistca Inferencial
85
CAPTULO
VI
ANALISIS DE REGRESION Y
CORRELACION
6.1 INTRODUCCION
Los datos bivariantes se presentan cuando en una poblacin o muestra
se miden simultneamente dos variables en cada uno de los individuos
o sujetos que integran el conjunto o subconjunto bajo estudio. Algunos
ejemplos de datos variantes son: la estatura y el peso de varones
adultos, el coeficiente de inteligencia y el rendimiento acadmico de
los alumnos.
Como ejemplo de datos bivariantes tenemos:
Horas de estudio y rendimiento escolar
Coeficiente intelectual y rendimiento academico
Estres y desempeo laboral
6.2. REGRESIN LINEAL SIMPLE
El anlisis de regresin se encarga de descubrir la relacin funcional
entre dos o ms variables. Cuando se estudian solamente dos variables
la metodologa a utilizar se conoce como anlisis de regresin simple,
Estadistca Inferencial
86
en tanto que si se trata de tres o ms variables el anlisis regresional es
mltiple. El anlisis de regresin puede ser lineal o no lineal. (14)
6.2.1. Anlisis de regresin lineal
Es la relacin que existe entre dos variables, la misma que est definida
en una funcin expresada en trminos de una ecuacin de una lnea
recta, tal como se muestra en el siguiente grfico:
87
Yi X i i
donde:
Yi
Xi
i
Estadistca Inferencial
88
El modelo matemtico muestral esta representado por:
Yi X i ei
donde:
Yi
Xi
ei
Yi X i
donde:
ei Yi Yi
Estadistca Inferencial
89
90
Y : Rendimiento acadmico
La grfica tiene la siguiente forma:
Estadistca Inferencial
91
Y X
n
n X iYi X i Yi
i 1
i 1
n X
i 1
2
i
Estadistca Inferencial
i 1
Xi
i 1
92
Ejemplo 1:
Los siguientes datos muestran los gastos invertidos en publicidad (en
miles de soles) (Xi) y las ventas obtenidas (en cientos) de vehculos (Yi)
de 7 tiendas sucursales del Per. Hallar el modelo de regresin lineal y
Estimar la venta de vehculos para cuando una Empresa invierta
S/.8000 y S/.10000. en gastos de publicidad
Nro.
Gastos.(X)
Venta de(Y)
2,5
3,2
7,5
8,4
12
10,2
15
14,5
18
19,8
Nro.
Xi*Yi
Xi
Y.est
(Yest. - Yprom.)
(Yi - Yprom.)
2,5
10
3,2
16
16
2,51358885
48,01475907
48,20326531
25
3,668466899
33,34358269
38,97326531
7,5
52,5
49
5,978222997
12,00368977
3,774693878
8,4
75,6
81
8,287979094
1,333743308
1,08755102
12
10,2
122,4 144
11,75261324
5,33497323
0,573265306
15
14,5
217,5 225
15,21724739
33,34358269
25,57469388
18
19,8
356,4 324
18,68188153
85,35957168
107,2704082
Total 70
66,1
850,4 864
66,1
218,7339024
225,4571429
Prom. 10
9,44286
Estadistca Inferencial
93
Calculando el estimador tenemos:
n
i 1
i 1
n X iYi X i Yi
i 1
n X X i
i 1
i 1
2
i
7(850,4) (70)(66,1)
1,154878049
7(864) (70) 2
Calculando el estimador
tenemos:
Y X
66,1
70
(1.154778049) 2.105923345
7
7
Entonces la ecuacin de regresin lineal es:
i = -2.105923345 + 1,154878049 Xi
Este modelo nos servir para hacer las predicciones de las ventas
obtenidas (en cientos de soles) de vehculos (Y) para los diferentes
gastos invertidos (en miles de soles) (X).
Al interpretar estos resultados es conveniente recordar que la razn
esencial que motiv el clculo de la ecuacin de regresin es poder
usar esta para establecer estimados o proyecciones de los valores de la
variable dependiente Y. As por ejemplo podra interesarnos predecir el
valor de Y asociado con un valor particular de X.
Estimar la venta de vehculos para cuando una Empresa invierta
S/.8000 y S/.10000, en gastos de publicidad..
Para responder a esta pregunta, se requiere la sustitucin del valor de X
= 8 y 10 respectivamente en los trminos de la ecuacin de regresin.
i = -2.105923345 + 1,154878049 Xi
Estadistca Inferencial
94
8 = 7,133101045
10 = 9,442857143
Se estima que la venta de vehculos para cuando una Empresa invierta
S/.8000 en gastos de publicidad, obtendr una venta de 713 vehculos,
con un coeficiente de determinacin de 97,02%
Se estima que la venta de vehculos para cuando una Empresa invierta
S/.10000 en gastos de publicidad, obtendr una venta de 944 vehculos,
con un coeficiente de determinacin de 97,02%
NOTA:
Para realizar la prediccin, es necesario cumplir las siguientes
condiciones:
2 1/2
regresin.
En las siguientes grficas se muestra diferentes valores del coeficiente
de determinacin:
Estadistca Inferencial
95
0,8 R < 1
R =1
R2
i 1
n
i 1
Donde :
R =0
0R 1
Estadistca Inferencial
96
De nuestro ejemplo:
y
n
R2
i 1
n
y
i 1
218,7339024
0,970179519 97,02%
225,4571429
Observamos que hay una bondad de ajuste del 97,02% lo que implica
que el ajuste es muy bueno.
Estadistca Inferencial
97
Ejemplo 2:
El siguiente cuadro muestra, la edad (Xi) medida en aos y la presin
sistlica (Yi) medida en (mm.Hg), en una muestra de 15 madres de
familia. Hallar el modelo lineal y estimar la presin sistlica para las
madres de familia de las edades de 50 aos y 75 aos
Ma
dre
Edad Presin
Xi * Yi
(Xi) (Yi)
42
130
1
5460
46
115
5290
2
(Yest. Yprom.)
(Yi Yprom.)
Xi
Yi
Y.est
1764
2116
16900
125,34065
435,1126074
262,44
13225 129,203490
288,881347
973,44
42
148
6216
1764
21904
125,34065
435,1126074
3,24
41
100
4100
1681
10000 124,374936
476,3334091
2134,44
80
156
12480
6400
24336 162,037657
250,8313762
96,04
74
162
11988
5476
26244 156,243392
100,8697265
249,64
70
151
10570
4900
22801
152,38055
38,19918638
23,04
80
156
12480
6400
24336 162,037657
250,8313762
96,04
85
162
13770
7225
26244 166,866211
427,0922704
249,64
10
72
158
11376
5184
24964 154,311971
65,80406717
139,24
11
64
155
9920
4096
24025 146,586284
0,149215572
77,44
12
81
160
12960
6561
25600 163,003368
282,3531657
190,44
13
41
125
5125
1681
15625 124,374936
476,3334091
449,44
14
61
150
9150
3721
22500
143,68915
6,304357909
14,44
15
75
165
12375
5625
27225
157,20910
121,2003482
353,44
Total
954
2193
3655,40847
5312,4
Prm.
63,6
146,2
Estadistca Inferencial
98
n
n
X
Yi
i
n
i 1
X i Yi i 1
n
i 1
X
i 1
2
i
Xi
i 1
n
(954)(2193)
15
0,965710787
(954) 2
64594
15
143260
Y X
2193
954
(0,965710)
84,78079396
15
15
Luego calculamos:
n
SY
SY
i 1
i 1
Yi Yi X iYi
2
i 1
n2
325929 (84,78)(2193) (0,97)(143260)
8,96257175
15 2
Estadistca Inferencial
99
SY
Xi
n
2
X i i 1
n
i 1
8,96257175
9542
64594
0,14315673
15
Para el ejemplo:
P[b1 T/2(n-2)Sb1] = 1-
P[0,97 2,16(0,14)] = 1 - 0,05
P*0,66078146 1 1,27921854+ = 0,95
El intervalo de confianza para la pendiente poblacional se encuentra
entre 0,66 y 1,28, con una confiabilidad del o nivel de confianza del
95%.
Estadistca Inferencial
100
6.8.INTERVALO DE CONFIANZA PARA LA MEDIA CONDICIONAL
La estimacin por punto de la media condicional de la variable
dependiente, dado un valor especifico de X, es el valor de la lnea de
regresin . Cuando se utiliza la ecuacin de regresin para estimar la
media condicional se representa por: X
y = b0 b1X
El intervalo de confianza de 100(1-) % para y/x cuando se desconoce
2
y/x esta dada por la expresin:
CASO I: Muestra pequea (n 30)
( X 0 X )2
1
P Y T( / 2;n 2) S y / x
2
n n
2
X i X i
i 1
i 1
( X 0 X )2
1
P Y Z ( / 2) S y / x
2
n n
2
X i X i
i 1
i 1
Estadistca Inferencial
101
Para el ejemplo:
1
(46 63.6) 2
P 129,20 2.16(8,9625717)
1 0,05
2
15 64594 954 15
Estadistca Inferencial
102
CASO I:
Muestra pequea (n 30)
1
P Y T / 2;( n 2 ) S y / x 1
n
( X 0 X )2
2
n
n
2
X i X i
i 1
i 1
CASO II:
Muestra grande (n > 30)
1
P Y Z ( / 2) S y / x 1
n
( X 0 X )2
2
n
n
2
X i X i
i 1
i 1
Ejemplo 3
El gerente de personal de la empresa agroindustrial bajo mayo
estudia la relacion entre la variable dependiente: y=gastos y la variable
independiente x=salario, de su personal obrero.Una Muestra aletoria
de 10 obreros revelo los siguentes datosen dolares por semana:
SALARIOS 28
25
35
40
45
50
50
35
70
80
GASTOS
20
32
37
40
40
45
30
55
60
25
Estadistca Inferencial
103
SALARIOS
X
28
25
35
40
45
50
50
35
70
80
458
GASTOS
Y
25
20
32
37
40
40
45
30
55
60
384
Estadistca Inferencial
X
789
625
1225
1600
2025
2500
2500
1225
4900
6400
23789
Y
625
400
1024
1369
1600
1600
2025
900
3025
3600
16168
X.Y
700
500
1120
1480
1800
2000
1250
1050
3850
4800
19550
104
Prueba de hiptesis:
HO:
Ha:
0 no existe correlacin
0 si existe correlacin
14.2715
Estadistca Inferencial
105
=384-(1.3799) (458)=-257.1542
=
=1.3799
-257.1542+1.3799
Fuente de
variacin
(Fv)
Suma
de
cuadrados
(Sc)
Regresin
Grados
de
libertad
(gl)
1
Residual
n-2
Total
n-1
Sc total-Sc
regresin
Cuadrados
medios
(CM)
F calculada
(Fc)
Sc reg/1
Sc res/n-2
Syy
Fv
gl
Sc
CM
Fc
Regresin
13632.63
13632.63
Residual
12210.23
Total
1422.4
8.9320
Estadistca Inferencial
0.05
532
106
SUMA DE CUADRADOS
Sc regresin=
=13632.6392
Sc total=1422.4
Sc residual = 1422.4-13632.63
INTERVALO DE CONFIANZA PARA
6.9455
Estadistca Inferencial
107
Con un 955 de seguridad el coeficiente de regresin va a variar entre
los valores en un 92.68 y 106.58por cada gasto que realizara del salario.
Ejemplo 4:
El Vicepresidente de Investigacin y Desarrollo (ID) de una gran
compaa qumica y de fabricacin de fibras cree que las ganancias
anuales de la empresa dependen de la cantidad gastada en ID. El nuevo
presidente de la compaa no est de acuerdo y ha solicitado pruebas.
Los datos de seis aos son los siguientes.
Ao
1990
1991
1992
1993
1994
1995
Millones gastados en
Investigacin y Desarrollo
(X)
2
3
5
4
11
5
Ganancia Anual
(millones)
(Y)
20
25
34
30
40
31
Estadistca Inferencial
XY
108
2
3
5
4
11
5
30
20
25
34
30
40
31
180
Sxx = 200
= 50
Syy = 5642
4
9
25
16
121
25
200
400
625
1156
900
1600
961
5642
40
75
170
120
440
155
1000
= 242
Sxy = 1000
= 100
COEFICIENTE DE CORRELACION
La regla de decisin para la hiptesis planteada es:
Si tc > t / 2 (n-2) gl , rechazamos H0 (existe relacin).
Si tc < t / 2 (n-2) gl , rechazamos Ha (no existe relacin).
Donde:
2
r =
r =
; asi que r =
= 0.8264
r = 0.9091
tc =
t / 2 (n-2) gl
Estadistca Inferencial
109
tc =
= 4.3644
x donde:
=2
= 30 2(5) = 20
yi = 20 + 2(xi)
ANALISIS DE REGRESION
H0 =
Ha =
=0
0
FV
Regresin
Residual
Total
gl
1
4
5
Sc
200
42
242
CM
200
10.5
Fc
19.047******
F
0.05
7.71
Suma de cuadrados
Sc regresin =
Estadistca Inferencial
= 200
M.Sc. Julio R. Gallegos Ramos
110
Sc total = 242
Sc residual = 242 200 = 42
INTERVALO DE CONFIANZA PARA
P
=
=2
P 0.73
= 0.4582
3.27
Ejemplo 5
La agroindustria ECOANDINO de Lima quiere determinar la relacin
entre cantidad de fertilizante y produccin de papa por hectrea que
produce. Si la muestra del experimento proporciona lo siguientes
datos.
sacos de
fertilidad por
hectrea.
1
2
3
4
5
6
7
Y Rendimiento
de quintales.
Estadistca Inferencial
8
10
13
16
20
24
28
1
4
9
16
25
36
49
XY
64
100
169
256
400
576
784
8
20
39
64
100
144
196
111
8
9
10
TOTAL: 55
31
36
39
TOTAL: 225
64
81
100
TOTAL:
385
961
1296
1521
TOTAL:
6127
248
324
390
TOTAL:
1533
Coeficiente de regresin.
H0: P = 0
H0: P diferente a 0
T=0.5/2(10-2)gl = 2.306
Podramos afirmar que si existe relacin entre sacos de fertilidad por
hectrea y rendimiento de quintales de papa. Adems con el
coeficiente de determinacin tiene un valor de 99.4%. Lo cual indica
que el resultado es muy aceptable.
Ecuacin de prediccin.
Estadistca Inferencial
112
..2
..3
Anlisis de regresin.
Fuente de Grados
Suma de
variacin
de
cuadrados
(FV)
libertad
(SC)
(GL)
Regresin 1
158.4
Residual
8
6.1
Total
9
1064.5
Cuadrados
medios
(CM)
F
calculada(FC)
1058.4
0.7
1512
0.05
5.32
Estadistca Inferencial
113
Ejemplo 6:
El gerente de personal de la Municipalidad Provincial de San Romn
quiere estudiar la relacin entre el ausentismo y la edad de sus
trabajadores. Tom una muestra aleatoria de 10 trabajadores de la
Municipalidad y encontr lo siguientes datos.
EDAD
25
46
58
37
55
32
41
50
23
60
Y
AUSENTISMO
18
12
8
15
10
13
7
9
16
6
Diagrama de dispersion
Estadistca Inferencial
114
XY
25
46
58
37
55
32
41
50
23
60
427
18
12
8
15
10
13
7
9
16
6
114
625
2116
3364
1369
3025
1024
1681
2500
529
3600
19833
324
144
64
225
100
169
49
81
256
36
1448
43
58
66
52
65
45
48
59
39
66
4452
Sxx = x
2
Sxx = 19833
Sxx = 19833 182329
Sxx = 1600.1
Syy = y
2
Syy = 1448
Syy = 1448
Syy = 1448
Syy = 148.4
Estadistca Inferencial
115
Sxy = xy
Sxy = 4452
Sxy = 4452
Sxy = 4452
Sxy = - 415.8
COEFICIENTE DE CORRELACIN:
H0: P=0 : no existe correlacin.
H1: P0 : existe correlacin.
tc =
t =
hallando r y r
r =
2
r =
2
r =
2
r =0.72809
r=
Estadistca Inferencial
116
r = 0.8533
Reemplazando a la frmula de tc
tc =
tc =
tc = 4.6289
Reemplazando a la frmula de tt
t =
t =
t = 2.3060
tc > t
si existe relacion entre las variables edad y ausentismo
ECUACIN DE PREDICCIN:
y = + (xi)
= y +
promedios:
= 42.7
= 11.4
Hallando ^
=
Estadistca Inferencial
117
=
=
hallando ^
= -
= 11.4 - (- 0.2599) 42.7
= 22.4959
yi = ^ + (xi)
yi = 22.496
anlisis de regresin
H0 : = 0
H1 : 0
Estadistca Inferencial
118
BIBLIOGRAFIA
Estadistca Inferencial