Sunteți pe pagina 1din 63

UNIVERSIDADDEPUERTORICO

RECINTODERIOPIEDRAS
FACULTADDEADMINISTRACIONDEEMPRESAS
InstitutodeEstadsticaySistemasComputadorizadosdeInformacin

MANUALDELAACADEMIA
EstadsticaAplicada,usandoR
Marzo2009

Preparadopor:
JosCarlosVegaVilca,Ph.D.
josevega02@yahoo.con

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico


Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 1
INTRODUCCION AL SISTEMA R

R es un lenguaje y entorno de programacin para anlisis estadstico y grfico. En un
inicio R fue escrito por Robert Gentleman y Ross Ihaka, conocidos como el grupo R
& R del Departamento de Estadstica de la Universidad de Auckland. Actualmente R
es el resultado de un esfuerzo colaborativo con contribuciones de todo el mundo.


COMENTARIO

El New York Times public una nota recientemente sobre el lenguaje de
programacin R, destacando el hecho de que se trata de software libre, siendo los
analistas de datos los ms cautivados por el mismo.

Un creciente nmero de gente en academias y empresas ha comenzado a utilizarlo
dado que el procesamiento de datos se encuentra en la edad de oro, segn opina el
diario neoyorquino. La operacin de procesar datos es utilizada tanto para fijar
precios, perfeccionar modelos financieros o encontrar nuevas medicinas, es as que R
se utiliza en Pfizer, Merck, Google, el InterContinental Hotels Group, Bank of
America o Shell, empresas muy diversas.

Y por qu R es tan utilizado? Porque cientficos, ingenieros, estadsticos que no son
expertos en programacin pueden emplearlo rpidamente. El cientfico investigador
de Google Daryl Pregibon expres que es difcil no sobrevalorar a R dado lo
importante que se ha tornado: les permite hacer anlisis muy complejos a los
estadsticos sin que conozcan en profundidad los sistemas de computacin.

The New York Times subraya que grandes empresas como Dell, Hewlett-Packard o
IBM hacen mucho dinero al ao con la venta de servidores ejecutando GNU/Linux (la
competencia libre de Microsoft o Mac OS X), de hecho la mayora de los sitios Web
se basan en el software libre Apache y cada vez hay ms confianza en MySQL, la
base de dados libre. Por ltimo, el diario estadounidense destaca que los resultados
finales de toda esta tecnologa abierta y libre son visualizados por millones de
personas mediante el navegador Firefox: una cadena libre de software.

http://www.mastermagazine.info/articulo/13495.php
Ttulo del artculo: R, un lenguaje de programacin que seduce






Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 2
COMO SE INSTALA R?

Google: CRAN R
The Comprehensive R Archive Network
Windows
base
Download R 2.8.1 for Windows (34 megabytes)
Run


R, ES LA MEJOR CALCULADORA

Operacin aritmtica Solucin en R
3 + 5
> 3+5
[ 1] 8
S
4
+
S
7

> 3/ 4 + 5/ 7
[ 1] 1. 464286
2 (S +7 4)
2

> 2*( 5+7*4) ^2
[ 1] 2178
1 +S.S log
10
SS
> 1+3. 3*l og10( 35)
[ 1] 6. 095425
12 -1u
S 8u

> ( 12- 10) / ( 5/ sqr t ( 80) )
[ 1] 3. 577709
2
8
+S
2
-2
1S

> ( 2^8+3^2- sqr t ( 2) ) / sqr t ( 13)
[ 1] 73. 10554
-b +b
2
-4oc
2o

> ( - b+sqr t ( b^2- 4*a*c) ) / ( 2*a)
(c
3
- 28
S
)
Iog
c
41

> ( exp( 3) - 28^( 1/ 5) ) ^l og( 41)
[ 1] 47193. 7


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 3
COMANDOS PARA REDONDEAR DATOS

> a=110/6
> a
[1] 18.33333

> b=56/3
> b
[1] 18.66667


> cei l i ng( a)
[ 1] 19
> cei l i ng( b)
[ 1] 19


> f l oor ( a)
[ 1] 18
> f l oor ( b)
[ 1] 18

> r ound( a)
[ 1] 18
> r ound( b)
[ 1] 19

> r ound( a, 1)
[ 1] 18. 3
> r ound( b, 1)
[ 1] 18. 7


> r ound( a, 2)
[ 1] 18. 33
> r ound( b, 2)
[ 1] 18. 67

> r ound( a, 3)
[ 1] 18. 333
> r ound( b, 3)
[ 1] 18. 667





Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 4
COMANDOS DE IMPRESION

> pr i nt ( a)
[ 1] 18. 33333

> pr i nt ( b)
[ 1] 18. 66667

> pr i nt ( " hol a" )
[ 1] " hol a"
> pr i nt ( " hoy es mi er col es" )
[ 1] " hoy es mi er col es"



> cat ( a, " \ n" )
18. 33333

> cat ( b, " \ n" )
18. 66667

> cat ( " pr i mer val or =" , a, " \ n" )
pr i mer val or = 18. 33333

> cat ( " segundo val or =" , b, " \ n" )
segundo val or = 18. 66667

> cat ( " pr i mer o=" , a, " segundo=" , b, " \ n" )
pr i mer o= 18. 33333 segundo= 18. 66667

> l i st ( pr i mer o=a, segundo=b)
$pr i mer o
[ 1] 18. 33333
$segundo
[ 1] 18. 66667



COMANDOS DE CONTROL

> x=3
> y=0
> i f ( x<5) y=4 el se y=8
> y
[ 1] 4


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 5
> x=7
> y=0
> i f ( x<5) y=4 el se y=8
> y
[ 1] 8


> x=3
> i f ( x<5) pr i nt ( " menor " ) el se pr i nt ( " mayor " )
[ 1] " menor "

> x=7
> i f ( x<5) pr i nt ( " menor " ) el se pr i nt ( " mayor " )
[ 1] " mayor "


> f or ( i i n 1: 5) pr i nt ( " hol a" )
[ 1] " hol a"
[ 1] " hol a"
[ 1] " hol a"
[ 1] " hol a"
[ 1] " hol a"

> f or ( i i n 1: 5) pr i nt ( i )
[ 1] 1
[ 1] 2
[ 1] 3
[ 1] 4
[ 1] 5

> f or ( i i n 1: 5) {a=2*i +5; pr i nt ( a) }
[ 1] 7
[ 1] 9
[ 1] 11
[ 1] 13
[ 1] 15

> n=5
> whi l e( n<10) {pr i nt ( n) ; n=n+1}
[ 1] 5
[ 1] 6
[ 1] 7
[ 1] 8
[ 1] 9



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 6
COMO HACER UNA FUNCION?

hol a=f unct i on( x) {3*x+1}
> hol a( 2)
[ 1] 7
> hol a( - 4)
[ 1] - 11

> i epr =f unct i on( x)
+ { i f ( x>4) pr i nt ( " mayor " ) el se pr i nt ( " menor " ) }

> i epr ( 8)
[ 1] " mayor "

> i epr ( 2)
[ 1] " menor "


> es. par =f unct i on( x)
+ {i f ( x%%2==0) pr i nt ( " numer o par " ) el se pr i nt ( " numer o i mpar " ) }

> es. par ( 543)
[ 1] " numer o i mpar "

> es. par ( 82)
[ 1] " numer o par "


> f ahr enhei t =f unct i on( cent i gr ados)
+ {cent i gr ados*9/ 5+32}

> f ahr enhei t ( 28)
[ 1] 82. 4

> f ahr enhei t ( 34)
[ 1] 93. 2

> f ahr enhei t ( 37)
[ 1] 98. 6

> f ahr enhei t ( 38)
[ 1] 100. 4





Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 7

COMO INTRODUCIR DATOS?

> dat os = c( 34, 21, 29, 19, 22, 28, 19, 18, 38, 30)

Cl cul o del nmer o de dat os
> NROW( dat os)
[ 1] 10

Cl cul o de l a medi a
> mean( dat os)
[ 1] 25. 8

Cl cul o de l a medi ana
> medi an( dat os)
[ 1] 25

Cl cul o de l a var i anza
> var ( dat os)
[ 1] 48. 84444

Cl cul o de l a desvi aci n est ndar
> sd( dat os)
[ 1] 6. 98888

Cl cul o de l a suma de l os dat os
> sum( dat os)
[ 1] 258

Cl cul o del cuadr ado de cada dat o
> dat os^2
[ 1] 1156 441 841 361 484 784 361 324 1444 900

Cl cul o de l a suma de l os cuadr ados de cada dat o
> sum( dat os^2)
[ 1] 7096

Or denar l os dat os de menor a mayor
> sor t ( dat os)
[ 1] 18 19 19 21 22 28 29 30 34 38

Or denar l os dat os de mayor a menor
> sor t ( dat os, TRUE)
[ 1] 38 34 30 29 28 22 21 19 19 18




Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 8
COMO LEER DATOS DESDE MS EXCEL 2003?

Se debe instalar la librera xlsReadWrite, que lee archivo de datos EXCEL 2003
1) Seleccionar Packages
2) Seleccionar Install package (s)
3) Seleccionar Canada (BC), OK
4) Seleccionar xlsReadWrite, OK
5) Escribir: library(xlsReadWrite)
6) Escribir: dat=read.xls(c:/folder/ejemplo1)

> l i br ar y( xl sReadWr i t e)
> dat =r ead. xl s( " c: / amaqui nar r p/ acur sos/ casos- t al l er / ej empl o1" )
> dat
> dat [ , 1]
> dat [ , 2]
> dat [ , 1: 2]
> dat [ , 1: 5]
> dat [ 1: 10, ]
> dat [ 1: 10, 2: 4]
























Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 9
ORGANIZACION DE DATOS

La base de datos ejemplo1 contiene datos de las siguientes variables:
1. Razn de preferencia: cualitativa
2. Gastos semanales: cuantitativa continua
3. Ingreso mensual: cuantitativa continua
4. Nmero de hijos: cuantitativa discreta
5. Forma de pago: cualitativa

ORGANIZACIONES DE DATOS DE LA VARIABLE: RAZON

Sel ecci n de dat os en est udi o

> r azon=dat [ , 1]

Fr ecuenci as absol ut as or denadas al f abet i cament e

> f abs=t abl e( r azon)
> f abs

Ai r e Cr di t o Guar der a Of er t a Par ki ng
4 8 5 8 10

Or denami ent o por l a mayor f r ecuenci a absol ut a

> f abs=sor t ( f abs, TRUE)
> f abs

Par ki ng Cr di t o Of er t a Guar der a Ai r e
10 8 8 5 4

Suma de f r ecuenci as absol ut as

> n=sum( f abs)
> n
[ 1] 35

Fr ecuenci as r el at i vas

> f r el =( f abs/ n) *100

Par ki ng Cr di t o Of er t a Guar der a Ai r e
28. 57143 22. 85714 22. 85714 14. 28571 11. 42857


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 10
Fr ecuenci as r el at i vas, con dos deci mal es

> f r el =r ound( f r el , 2)

Par ki ng Cr di t o Of er t a Guar der a Ai r e
28. 57 22. 86 22. 86 14. 29 11. 43

Tabl a de f r ecuenci as de l a var i abl e r azn

> cbi nd( f abs, f r el )
f abs f r el
Par ki ng 10 28. 57
Cr di t o 8 22. 86
Of er t a 8 22. 86
Guar der a 5 14. 29
Ai r e 4 11. 43


Gr f i co ci r cul ar de l a var i abl e r azn

> pi e( f abs, col =c( 2, 3, 4, 5, 6) , mai n=" GRAFI CO CI RCULAR" )




Di agr ama de bar r as de l a var i abl e r azn

bar pl ot ( f abs, col =c( 2, 3, 4, 5, 6) ,
mai n=" DI AGRAMA DE BARRAS" ,
yl ab=" Fr ecuenci a absol ut a" , xl ab=" " )



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 11



bar pl ot ( f abs, col =c( 2, 3, 4, 5, 6) , names. ar g=c( " " ) ,
mai n=" DI AGRAMA DE BARRAS" ,
yl ab=" Fr ecuenci a absol ut a" , xl ab=" " )
l egend( 4, 10, c( " Par ki ng" , " Cr di t o" ,
" Of er t a" , " Guar der a" , " Ai r e" ) ,
f i l l = c( 2, 3, 4, 5, 6) )









Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 12

Funci on que hace l a t abl e de f r ecuenci as

t a. f r ec=f unct i on( dat o)
{ n=NROW( dat o)
f abs=t abl e( dat o)
f abs=sor t ( f abs, TRUE)
f r el =( f abs/ n) *100
f r el =r ound( f r el , 2)
t abl a=cbi nd( f abs, f r el )
pr i nt ( t abl a)
}


> t a. f r ec( r azon)
f abs f r el
Par ki ng 10 28. 57
Cr di t o 8 22. 86
Of er t a 8 22. 86
Guar der a 5 14. 29
Ai r e 4 11. 43


t a. f r ec=f unct i on( dat o, sor t eo)
{ n=NROW( dat o)
f abs=t abl e( dat o)
i f ( sor t eo==1) f abs=sor t ( f abs, TRUE)
f r el =( f abs/ n) *100
f r el =r ound( f r el , 2)
t abl a=cbi nd( f abs, f r el )
pr i nt ( t abl a)
}


ORGANIZACIN DE DATOS DE LA VARIABLE HIJOS

> hi j os=dat [ , 4]
> t a. f r ec( hi j os, 0)
f abs f r el
0 3 8. 57
1 5 14. 29
2 12 34. 29
3 11 31. 43
4 4 11. 43

f abs=t abl e( hi j os)
f r el =( f abs/ n) *100
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 13

bar pl ot ( f r el , space=5, col =" bl ue" , yl i m=c( 0, 40) , yl ab=" por cent aj e"
, mai n=" Gr f i co de Li neas: Nmer o de hi j os" )
abl i ne( h=0)




TABLA DE FRECUENCIAS DE LA VARIABLE GASTOS

gas=dat [ , 2]

Cl cul o de TI C

t i c=f unct i on( dat o)
{n=NROW( dat o)
r ango=max( dat o) - mi n( dat o)
k=1+3. 3*l og10( n)
k=r ound( k)
t i c=r ango/ k
l i st ( t i c=t i c, cl ases=k) }

Li mi t es de cl ase

l i mi t es=f unct i on( dat o, t i c, cl ases)
{mi ni =mi n( dat o)
LI nf =seq( mi ni , l engt h=cl ases, by=t i c)
LSup=seq( LI nf [ 2] , l engt h=cl ases, by=t i c)
mar ca=( LI nf +LSup) / 2
I nt er val o=cbi nd( LI nf , LSup, mar ca)
r et ur n( I nt er val o) }

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 14
Mar ca de cl ase: Pr omedi o de l a cl ase

l i m=l i mi t es( gas, 18. 4, 6)
mar ca=l i m[ , 3]


Tr ansf or ma l os dat os en cl ases

cl ase=f unct i on( dat o)
{ n=NROW( dat o)
y=r ep( 0, n)
f or ( i i n 1: n)
{ i f ( dat o[ i ] <48. 4) y[ i ] =1 el se {;
i f ( dat o[ i ] <66. 8) y[ i ] =2 el se {;
i f ( dat o[ i ] <85. 2) y[ i ] =3 el se {;
i f ( dat o[ i ] <103. 6) y[ i ] =4 el se {;
i f ( dat o[ i ] <122. 0) y[ i ] =5 el se y[ i ] =6}}}}}
r et ur n( y)
}

Tabl a de f r ecuenci as de GASTOS

t abl af =f unct i on( y, l i m)
{ n=NROW( y)
f abs=t abl e( y)
f r el =r ound( ( f abs/ n) *100, 2)
f acum=cumsum( f abs)
Facum=r ound( ( f acum/ n) *100, 2)
t abl a=cbi nd( l i m, f abs, f r el , f acum, Facum)
pr i nt ( t abl a)
}

> t abl af ( y, l i m)
LI nf LSup mar ca f abs f r el f acum Facum
1 30. 0 48. 4 39. 2 2 5. 71 2 5. 71
2 48. 4 66. 8 57. 6 8 22. 86 10 28. 57
3 66. 8 85. 2 76. 0 10 28. 57 20 57. 14
4 85. 2 103. 6 94. 4 7 20. 00 27 77. 14
5 103. 6 122. 0 112. 8 5 14. 29 32 91. 43
6 122. 0 140. 4 131. 2 3 8. 57 35 100. 00


HI STOGRAMA DE FRECUENCI AS

gas=dat [ , 2]
n=NROW( gas)
y=cl ase( gas)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 15
l i m=l i mi t es( gas, 18. 4, 6)
mar ca=l i m[ , 3]
f abs=t abl e( y)
f r el =( f abs/ n) *100

bar pl ot ( f r el , space=0, names. ar g=mar ca,
col =" yel l ow" , xl ab=" pr omedi o de cl ase" ,
yl ab=" por cent aj e" , mai n=" HI STOGRAMA" )






OJ I VA DE FRECUENCI AS

gas=dat [ , 2]
y=cl ase( gas)
l i m=l i mi t es( gas, 18. 4, 6)
LSup=l i m[ , 2]
f abs=t abl e( y)
Facum=cumsum( f abs)
Fr cum=r ound( ( Facum/ n) *100, 2)

bar pl ot ( Fr cum, space=0, names. ar g=LSup,
col =" yel l ow" , xl ab=" l i mi t es super i or es" ,
yl ab=" por cent aj e acumul ado" ,
mai n=" Oj i va: Fr ecuenci as acumul adas" )

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 16




DIAGRAMA DE DISPERSION

gas=dat [ , 2]
i ng=dat [ , 3]
pl ot ( i ng, gas)

pl ot ( i ng, gas, pch=19, col =2, cex=1. 4,
xl ab=" I ngr eso mensual " , yl ab=" Gast o semanal " ,
mai n=" Di agr ama de di sper si n" )




Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 17

TABLAS DE CONTINGENCIA

r azon=dat [ , 1]
pago=dat [ , 5]

t abl e( r azon, pago)
t abl e( pago, r azon)


r azon
pago Ai r e Cr di t o Guar der a Of er t a Par ki ng
Cr di t o 1 6 3 3 7
Ef ect i vo 3 2 2 5 3



DIAGRAMA DE TALLOS Y HOJAS

gas=dat [ , 2]
i ng=dat [ , 3]
st em( gas)
st em( i ng)
st em( gas, 2)
st em( i ng, 2)


3 | 05
4 | 8
5 | 0578
6 | 05689
7 | 033579
8 | 346
9 | 05
10 | 01224
11 | 0589
12 | 5
13 | 0
14 | 0








Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 18
DIAGRAMA DE CAJAS

r azon=dat [ , 1]
gas=dat [ , 2]
i ng=dat [ , 3]
hi j os=dat [ , 4]
pago=dat [ , 5]

boxpl ot ( gas~pago)
boxpl ot ( gas~r azon)
boxpl ot ( gas~hi j os)

boxpl ot ( gas~pago, col =" yel l ow" ,
mai n=" DI AGRAMA DE CAJ AS" ,
xl ab=" For ma de pago" ,
yl ab=" Gast o semanal " )



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 19
MEDIDAS DE TENDENCIA CENTRAL

Se contina trabajando con la base de datos ejemplo1. Se calcularn las medidas:
1. Media
2. Mediana
3. Moda

> l i br ar y( xl sReadWr i t e)
> dat =r ead. xl s( " c: / amaqui nar r p/ acur sos/ casos- t al l er / ej empl o1" )
> dat

> summar y( dat )
Razn Gast os I ngr esos Hi j os Pago
Ai r e : 4 Mi n. : 30. 00 Mi n. : 1100 Mi n. : 0. 000 Cr di t o : 20
Cr di t o : 8 1st Qu. : 65. 65 1st Qu. : 1500 1st Qu. : 2. 000 Ef ect i vo: 15
Guar der a: 5 Medi an : 79. 10 Medi an : 1950 Medi an : 2. 000
Of er t a : 8 Mean : 83. 35 Mean : 1869 Mean : 2. 229
Par ki ng : 10 3r d Qu. : 102. 20 3r d Qu. : 2145 3r d Qu. : 3. 000
Max. : 140. 00 Max. : 2900 Max. : 4. 000


r azon=dat [ , 1]
gas=dat [ , 2]
i ng=dat [ , 3]
hi j o=dat [ , 4]
pago=dat [ , 5]

> summar y( gas)
Mi n. 1st Qu. Medi an Mean 3r d Qu. Max.
30. 00 65. 65 79. 10 83. 35 102. 20 140. 00

> summar y( i ng)
Mi n. 1st Qu. Medi an Mean 3r d Qu. Max.
1100 1500 1950 1869 2145 2900

> summar y( r azon)
Ai r e Cr di t o Guar der a Of er t a Par ki ng
4 8 5 8 10

Cl cul o de l a medi a y medi ana

mean( gas)
medi an( gas)




Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 20
Cl cul o de l a moda

moda=f unct i on( ar r egl o)
{ q=t abl e( ar r egl o)
q=sor t ( q, TRUE)
r et ur n( q[ 1] ) }

> moda( r azon)
Par ki ng
10

> moda( hi j o)
2
12


MEDIDAS DE POSICION

Cl cul o de cuar t i l es

> quant i l e( gas)
0% 25% 50% 75% 100%
30. 00 65. 65 79. 10 102. 20 140. 00

> quant i l e( i ng)
0% 25% 50% 75%100%
1100 1500 1950 2145 2900


Cl cul o de per cent i l es

> quant i l e( gas, 0. 83)
83%
111. 244
> quant i l e( i ng, 0. 62)
62%
2000


Medi das de t endenci a cent r al y de posi ci n par a l os dat os de
l a var i abl e gast os, par a cl i ent es con pagos al cr di t o

gasc=dat [ dat [ , 5] ==" Cr di t o" , 2]

> summar y( gasc)
Mi n. 1st Qu. Medi an Mean 3r d Qu. Max.
48. 40 72. 95 88. 15 91. 30 105. 70 140. 00
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 21


Medi das de t endenci a cent r al y de posi ci n par a l os dat os de
l a var i abl e gast os, par a cl i ent es con pagos en ef ect i vo

gase=dat [ dat [ , 5] ==" Ef ect i vo" , 2]

> summar y( gase)
Mi n. 1st Qu. Medi an Mean 3r d Qu. Max.
30. 00 56. 25 66. 00 72. 75 89. 75 125. 10


Medi das de t endenci a cent r al y de posi ci n par a l os dat os de
l a var i abl e i ngr esos, par a cl i ent es con pagos al cr di t o












Medi das de t endenci a cent r al y de posi ci n par a l os dat os de
l a var i abl e i ngr esos, par a cl i ent es con pagos en ef ect i vo



















Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 22
MEDIDAS DE VARIABILIDAD

Se contina trabajando con la base de datos ejemplo1. Se calcularn las medidas:
1. Rango o Amplitud
2. Varianza
3. Desviacin estndar
4. Coeficiente de variabilidad
5. Desviacin intercuartlica

Cl cul o del r ango

r ango=f unct i on( ar r egl o)
{ max( ar r egl o) - mi n( ar r egl o) }


Cl cul o de l a var i anza: var


Cl cul o de l a desvi aci n est ndar : sd


Cl cul o del coef i ci ent e de var i abi l i dad

cv=f unct i on( ar r egl o)
{( sd( ar r egl o) / mean( ar r egl o) ) *100}


Cl cul o del coef i ci ent e i nt er cuar t l i co

ci =f unct i on( ar r egl o)
{ quant i l e( ar r egl o, 0. 75) - quant i l e( ar r egl o, 0. 25) }















Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 23

EJERCICIOS
1.- Son ms variables los gastos de los clientes que pagan al crdito o de los que
pagan en efectivo?

2.- Son ms variables los ingresos de los clientes que pagan al crdito o de los que
pagan en efectivo?

3.- Son ms variables los gastos de los clientes que prefieren nuestra tienda por el
parking o de los que prefieren nuestra tienda por la oferta?
4.- Son ms variables los ingresos de los clientes que prefieren nuestra tienda por el
parking o de los que prefieren nuestra tienda por la oferta?

5.- Son ms variables los gastos de los clientes que tienen 0, 1, 2, 3 4 hijos?

6.- Son ms variables los ingresos de los clientes que tienen 0, 1, 2, 3 4 hijos?

7.- Hacer un boxplot de los gastos con respecto a la razn de preferencia

8.- Hacer un boxplot de los ingresos con respecto a la razn de preferencia























Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 24
PROBABILIDADES

Cl cul o del f act or i al de un nmer o

> f act or i al ( 5)
[ 1] 120

> f or ( i i n 5: 10) {a=f act or i al ( i ) ; pr i nt ( a) }


Cl cul o de l a combi nat or i a

> choose( 5, 2)
[ 1] 10

> choose( 8, 3)
[ 1] 56



Ejercicios:

1.- Calcular la probabilidad de ganar la LOTO

2.- Calcular la probabilidad de ganar el PEGA 4

3.- En una reunin de 15 personas: 10 mujeres y 5 varones, se va elegir un comit
formado por 4 personas. Cul es la probabilidad de que ese comit est formado
por 2 mujeres y 2 varones.

















Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 25
VARIABLE ALEATORIA

DISTRIBUCION BINOMIAL

Ejemplo:
En una agencia bancaria, el 40% de los clientes tienen certificado bancario. Si se
eligen 8 clientes al azar, cul es la probabilidad de encontrar:
a) Exactamente 6 clientes con certificados bancarios

v.a. X = # de clientes con certificado bancario; p = 0.40; n =8

6 8 6
) 40 . 0 1 ( 40 . 0
6
8
) 6 (

= = X P =0.0413

> dbi nom( 6, 8, 0. 4)


[ 1] 0. 04128768

b) Todos los clientes tienen certificado bancario: P(X = 8)

> dbi nom( 8, 8, 0. 4)


[ 1] 0. 00065536

c) Ningn cliente tenga certificado bancario: P(X = 0)


> dbi nom( 0, 8, 0. 4)
[ 1] 0. 01679616

d) Al menos un cliente tiene certificado bancario: P(X 1)
> 1- dbi nom( 0, 8, 0. 4)
[ 1] 0. 9832038

e) A lo ms 6 clientes tienen certificado bancario: P(X 6)
> pbi nom( 6, 8, 0. 4)
[ 1] 0. 9914803

e) Al menos cuatro clientes tienen certificado bancario: P(X 4)

> 1- pbi nom( 3, 8, 0. 4)
[ 1] 0. 4059136

f) Graficar la distribucin de probabilidades de la variable aleatoria nmero de
clientes con certificado bancario, de un total de 8 clientes. La probabilidad de xito
es 0.40.
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 26

x=0: 8
y=dbi nom( x, 8, 0. 4)
pl ot ( x, y, t ype=" h" , l wd=5, mai n=" Bi nomi al : n=8, p=0. 4" )




DISTRIBUCION DE POISSON

Ejemplo
En una inmobiliaria se ha determinado que el nmero promedio de casas vendidas en
un da laborable es 1.6 casas/dia. Si el nmero de casas vendidas es una variable
Poisson, calcule la probabilidad de que en un da cualquiera:

a) Se vendan exactamente 4 casas: P(X = 4)
En este caso t =1 y =1.6 t = =1.6


! 4
6 . 1
) 4 (
4 6 . 1
= =
e
X P = 0.0551312
> dpoi s( 4, 1. 6)
[ 1] 0. 05513121

b) No se venda ninguna casa: P(X = 0)

> dpoi s( 0, 1. 6)
[ 1] 0. 2018965


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 27
c) Se venda por lo menos una casa: P(X 1) = 1 P(X = 0)

> 1- dpoi s( 0, 1. 6)
[ 1] 0. 7981035

d) Se venda entre 2 y 5 casas, inclusive: P(2 X 5)

P(X=2) + P(X=3) + P(X=4) + P(X=5)

> dpoi s( 2: 5, 1. 6)
[ 1] 0. 25842754 0. 13782802 0. 05513121 0. 01764199

> sum( dpoi s( 2: 5, 1. 6) )
[ 1] 0. 4690288

e) Cul es la probabilidad de vender 4 casas en dos das?
En este caso t =2 y =1.6 t = = (2)(1.6) = 3.2

! 4
2 . 3
) 4 (
4 2 . 3
= =
e
X P = 0.1780928

> dpoi s( 4, 3. 2)
[ 1] 0. 1780928

f) Cul es la probabilidad de vender a lo mas 4 casas en dos das?
En este caso t =2 y =1.6 t = = (2)(1.6) = 3.2
P(X4) = P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4)

> ppoi s( 4, 3. 2)
[ 1] 0. 7806125

g) Cul es la probabilidad de vender al menos 4 casas en dos das?
En este caso t =2 y =1.6 t = = (2)(1.6) = 3.2
P(X4) = 1- P(X3)

> 1- ppoi s( 3, 3. 2)
[ 1] 0. 3974803

h) Graficar la distribucin de probabilidades de la variable aleatoria nmero de casas
vendidas en dos das si el promedio de ventas es 3.6 casa en dos das.

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 28

x=0: 15
y=dpoi s( x, 3. 2)
pl ot ( x, y, t ype=" h" , l wd=5, mai n=" Poi sson: Lambda=3. 2" )




DISTRIBUCION NORMAL ESTANDAR

PROBABILIDADES EN LA DISTRIBUCION NORMAL ESTANDAR

Calcular:
a) P(Z < -1.57) =




b) P(Z< 0) =



c) P(Z 1.04) =

pnor m( - 1. 57)
pnor m( 0)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 29



d) P(Z 1.25) = 1 P(Z< 1.25)



e) P(-0.23 Z 1.70) =




f) Hallar el valor k, tal que: P(Z< k) = 0.95




Ejercicios:

Calcular
1) P(Z> 1.34)
2) P(Z> -2.1)
3) P(Z< -1.24)
4) P(1.1 < Z < 2.2)
5) P(-2 < Z < 1.85)
6) P(-2 < Z < -0.84)

pnor m( 1. 04)
qnor m( 0. 95)
1- pnor m( 1. 25)
pnor m( 1. 70) - pnor m( - 0. 23)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 30
Hallar el valor k, en los siguientes casos
1) P(Z < k) = 0.37
2) P(Z < k) = 0.90
3) P(Z > k) = 0.44
4) P(0.15 < Z < k) = 0.2


Ejemplo
En una empresa los pagos mensuales de empleados por trabajar en sobretiempo estn
distribuidas en forma aproximadamente normal con una media de $200 y una
desviacin estndar de $20, entonces la probabilidad de que un empleado,
seleccionado al azar en esta empresa, tenga un pago mensual por sobretiempo

a) Mayor de 240 dlares, es
P(X240) = 1 P(X < 240)
= 1- pnor m( 240, 200, 20)
= 0.0228

b) Entre 150 y 250 dlares, es:
P(150 ) 250 X = P(X 250) - P(X 150)
= pnor m( 250, 200, 20) pnor m( 150, 200, 20)
= 0.9876

Ejercicio
1) Una supervisor ha encontrado que los trabajadores del turno noche, en promedio
tardan 10 minutos en realizar una tarea. Si los tiempos requeridos para concluir la
tarea estn distribuidos en forma aproximadamente normal con una desviacin
estndar de 3 minutos, encuentre:
a) La proporcin de trabajadores que concluyen la tarea en menos de cuatro minutos.
b) La proporcin de trabajadores que requieren ms de cinco minutos para concluir la
tarea.
c) El supervisor ha determinado que en el turno de la noche el 33% de los trabadores
son los mas lentos en completar la tarea. Hallar el tiempo mnimo necesario de un
trabajador en completar la tarea para ser considerado dentro del grupo de los ms
lentos. Resp: 11.32 minutos



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 31
DISTRIBUCION t

Ejemplo
Si
gl
t X
) 12 (
~ , calcular:

1) P(X > 1.356) = 0.1




2) P(X < 2.179) = 0.975





3) determinar el k, tal que P(X < k) = 0.85











pt ( 2. 179, 12)
qt ( 0. 85, 12)

1- pt ( 1. 356, 12)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 32
Ejercicios:
Si
gl
t X
) 18 (
~

Calcular la probabilidad:

1) P(X > 1.842)
2) P(X < 1.231)
3) P(X < 0.824)
4) P(X > -1.24)
5) P(X < -2.18)
6) P(-1.23 < X < 1.23)

Hallar el valor k en los siguientes casos
7) P(-k < X < k) = 0.95


DISTRIBUCION JI-CUADRADO

Ejemplo
Si
2
) 12 (
~
gl
X , calcular:

1) P(X > 15.812) = 0.199999





2) P(X < 11.34) = 0.499973





pchi sq( 11. 34, 12)
1- pchi sq( 15. 812, 12)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 33
3) determinar el k, tal que P(X < k) = 0.85




Ejercicios:
Si
2
) 25 (
~
gl
X

Calcular la probabilidad:

1) P(X > 18.842)
2) P(X < 5.231)
3) P(X < 17.824)
4) P(15.23 < X < 31.23)

Hallar el valor k en los siguientes casos
5) P(5.1 < X < k) = 0.95



DISTRIBUCION F DE SNEDECOR

Ejemplo:
Si
gl
F X
) 10 , 6 (
~ , calcular:

1) P(X > 2.10) = 0.1433238








qchi sq( 0. 85, 12)

1- pf ( 2. 10, 6, 10)
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 34
2) P(X < 2.46) = 0.90




3) determinar el k, tal que P(X < k) = 0.815





Ejercicios:
Si
gl
F X
) 27 , 12 (
~

Calcular la probabilidad:

1) P(X > 1.842)
2) P(X < 0.231)
3) P(X < 1.824)
4) P(1.23 < X < 2.23)

Hallar el valor k en los siguientes casos
5) P(0.3 < X < k) = 0.95










pf ( 2. 46, 6, 10)
qf ( 0. 815, 6, 10)

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 35
ESTADISTICA INFERENCIAL

Se ocupa de los procedimientos que nos permiten analizar y extraer conclusiones de
una poblacin a partir de los datos de una muestra aleatoria mediante la teora de
probabilidades y de las distribuciones muestrales.


Poblacin

Muestra
v.a. X

parmetro
desconocido

estimador:




Estimador: procedimiento de clculo con los datos muestrales con el
objetivo de aproximarse al valor del parmetro.

1) Estimacin de Parmetros
Estimacin puntual
Estimacin por intervalo

2) Prueba de Hiptesis



INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN

a) Si la varianza
2
es conocida (distribucin Z)









n
x
x
M
1

IntervalodeConfianza:
n
Z x IC

0
) ( =
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 36
Ejemplo
Un investigador, interesado en obtener una estimacin del nivel promedio diario ()
de xido de sulfuro que emite una planta industrial, toma una muestra de 10 das, y
calcula la media muestral x = 22. Suponga que se sabe que la variable de inters
presenta una distribucin aproximadamente normal con una varianza de 45.
Construya un intervalo de confianza del 95% para .

Solucin:
n x / 96 . 1
22
10
45
96 . 1
(17.84, 26.16)

Interpretacin: El intervalo (17.84, 26.16) brinda un 95% de confianza en contener el
verdadero valor de


i cmedi a. z=f unct i on( n, medi a, si g2, conf )
{ si g=sqr t ( si g2)
ar ea=( 1+conf ) / 2
z0=qnor m( ar ea)
a=medi a- z0*si g/ sqr t ( n)
b=medi a+z0*si g/ sqr t ( n)
pr i nt ( a)
pr i nt ( b)
}

> i cmedi a. z( 10, 22, 45, 0. 95)
[ 1] 17. 84229
[ 1] 26. 15771


b) Si la varianza
2
No es conocida (distribucin t)





IntervalodeConfianza:
n
S
t x IC
0
) ( =
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 37
Ejemplo
Una muestra de 30 nios de diez aos de edad proporcion un peso medio y una
desviacin estndar de 36.5 kg. y 5 kg, respectivamente. Suponiendo una poblacin
con distribucin normal, encuentre los intervalos de confianza de 90% para la media
de la poblacin a partir de la cual se obtuvo la muestra.

Solucin: coeficiente de confianza = 90%
n s x / 699 . 1
36.5 30 / 5 699 . 1
(34.94, 38.05)


i cmedi a. t =f unct i on( n, medi a, sd, conf )
{ ar ea=( 1+conf ) / 2
t 0=qt ( ar ea, n- 1)
a=medi a- t 0*sd/ sqr t ( n)
b=medi a+t 0*sd/ sqr t ( n)
pr i nt ( a)
pr i nt ( b)
}

> i cmedi a. t ( 30, 36. 5, 5, 0. 90)
[ 1] 34. 94892
[ 1] 38. 05108


Ejemplo
Hallar un intervalo del 95% de confianza para el promedio de los gastos semanales de
todos los clientes de la megatienda VENDO.

> gas=dat [ , 2]
> t . t est ( gas)

dat a: gas
t = 18. 1734, df = 34, p- val ue < 2. 2e- 16
al t er nat i ve hypot hesi s: t r ue mean i s not equal t o 0
95 per cent conf i dence i nt er val :
74.02809 92.66906
sampl e est i mat es:
mean of x
83. 34857



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 38
Intervalo de confianza para una proporcin: n grande
En este caso, la estimacin por intervalo para la proporcin p de xitos en cierta
poblacin, se obtiene mediante los lmites

Intervalo de Confianza:
n
p p
z p p IC
) 1 (
) (
0

=


Ejemplo
En una muestra aleatoria de 400 automviles detenidos en un puesto de revisin, 152
de los conductores llevaban puesto el cinturn de seguridad. Construya el intervalo de
confianza del 95% para la proporcin real de conductores que llevan puesto el
cinturn de seguridad.

Ya que
152
0.38
400
p = = ==>
400
) 38 . 0 1 ( 38 . 0
96 . 1 38 . 0 ) (

= p IC

) 428 . 0 , 332 . 0 ( ) ( = p IC


Ejercicio
Hacer un programa R que calcula el intervalo de confianza para el parmetro
proporcin.



















Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 39
PRUEBA DE HIPOTESIS
Es un mtodo estadstico de comprobacin de una hiptesis y es realizado utilizando
los valores observados que constituyen la muestra

HIPOTESIS DE INVESTIGACION: es una suposicin o reclamo que motiva una
investigacin. El reclamo pretende describir una caracterstica (parmetro) de la
poblacin

HIPOTESIS ESTADISTICA: es una reformulacin estadstica de una hiptesis de
investigacin, que refiere al valor de un parmetro.
Se hace uso de dos hiptesis estadsticas complementarias:
hiptesis nula: lo establecido, lo aceptado
hiptesis alterna: el reto, lo nuevo


Pasos necesarios para realizar una prueba de hiptesis
1) Formulacin de hiptesis

2) Establecer el nivel de significacin:
Usualmente = 0.01, 0.02, 0.05, 0.10

3) Determinar la prueba estadstica: t, Z,
2
, F
Establecer las suposiciones de la prueba:
La muestra fue elegida al azar
La poblacin de donde se extrae la muestra tiene distribucin normal las
muestras seleccionadas son suficientemente grandes

4) Determinar las regiones de aceptacin y rechazo de H
0

Graficar la distribucin correspondiente a la prueba elegida en el pto. 3 y
representar el valor correspondiente a nivel de significacin

5) Realizar el clculo de la prueba estadstica, elegida en el pto. 3

6) Establecer las conclusiones de la prueba

Definicin
El p-value, es la probabilidad de observar un valor muestral tan extremo o ms que el
valor observado, si la H
0
es verdadera.

Si el p-value < 0.01, existe una evidencia fuerte en contra de H
0
.
Si 0.01<p-value<0.05, existe evidencia moderada en contra de H
0
.
Si el p-value>0.05, existe poca o ninguna evidencia en contra de H
0
.


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 40
Prueba de hiptesis acerca de la media


2
es conocido ) 1 , 0 ( ~ N
n
x



n
x
Z
calculado


=



2
no es conocido . . ) 1 ( ~ l g n t
n S
x



n S
x
t
calculado

=



Prueba de hiptesis acerca de una proporcin

) 1 , 0 ( ~
) 1 (

N
n
p p
p p


n
k k
k p
Z
calculado
) 1 (

=


Ejercicios:
1) El fabricante de llantas radiales con cinturn de acero X-15 para camiones seala
que el millaje medio que la llanta recorre antes de que se desgasten las cuerdas es
de 60000 millas, con desviacin estndar de 5000 millas. Una compaa compr
48 llantas y encontr que el millaje medio para sus camiones es de 59500 millas.
Se puede afirmar que el verdadero millaje medio de las llantas es menor de lo que
afirma el fabricante?

2) Una compaa analiza una nueva tcnica para armar un carro de golf; la tcnica
actual requiere 42.3 minutos, en promedio. El tiempo medio de montaje de una
muestra aleatoria de 24 carros, con la nueva tcnica, fue de 40.6 minutos y la
desviacin estndar de 2.7 minutos. Se puede afirmar que el tiempo de montaje
con la nueva tcnica es ms rpida?

3) Por mucho tiempo, se ha afirmado que el 60% de los jvenes de una ciudad, son
fumadores. Actualmente un investigador social dice que esta proporcin ha
disminuido, debido a una campaa de educacin en salud. Para probar esta
afirmacin se hizo un estudio que consisti de una muestra aleatoria de 350
jvenes de esa ciudad y se encontr que 210 fuman

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 41
4) Se afirma que el saldo bancario de los habitantes de una ciudad es mayor de 400
dlares. Para probar esta afirmacin se seleccion una muestra de 120 habitantes;
los datos del estudio estn en el archivo: ejemplo2.xls

dat =r ead. xl s( " c: / CASOS- TALLER/ ej empl o2" )
sal =dat [ , 1]
t . t est ( sal , mu=400, a=" g" )

Prueba de hiptesis acerca de diferencia de medias: muestras independientes

Varianzas poblacionales: son conocidas Prueba Z
Se considera que los sueldos de trabajadores de la construccin en dos ciudades A y
B, son variables con distribucin normal, con desviaciones estndar de 4 y 6 dlares,
respectivamente. Se puede afirmar que el promedio de sueldos de los trabajadores de
la ciudad B es mayor que el promedio de sueldos en la ciudad A?. Use los datos del
archivo hiptesis1.xls.

(x
B
-x
A
) -(p
B
-p
A
)
_

o
A
2
n
A
+
o
B
2
n
B

~ N(u, 1)


1.- Formular las hiptesis



2.- Programa R, que hace los clculos

zt est =f unct i on( dat oA, dat oB, si gmaA, si gmaB)
{nA=NROW( dat oA)
nB=NROW( dat oB)
medi aA=mean( dat oA)
medi aB=mean( dat oB)
zcal =( medi aB- medi aA) / sqr t ( ( si gmaA^2/ nA+si gmaB^2/ nB) )
pval or =1- pnor m( zcal )
l i st ( Zcal cul ado=zcal , PVALOR=pval or )
}

3.- Conclusin




Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 42
Varianzas poblacionales: no son conocidas Prueba T
En un estudio reciente se compar el tiempo (minutos) que pasan juntas las parejas:
las parejas en que slo trabaja uno de los cnyuges versus las parejas en que ambos
trabajan. Se puede concluir que en promedio las parejas en que slo trabaja uno de
los cnyuges pasan ms tiempo, juntos viendo TV?. Use los datos del archivo
hiptesis2.xls.

dat =r ead. xl s( " c: / CASOS- TALLER/ hi pot esi s2" )
uno=dat [ , 1]
dos=dat [ 1: 35, 2]

1.- Formular las hiptesis de homogeneidad de varianzas



2.- Evaluacin de la homogeneidad de varianzas

> var . t est ( dos, uno)

F t est t o compar e t wo var i ances

dat a: dos and uno
F = 1.4084, numdf = 34, denomdf = 41, p-value = 0.2936
al t er nat i ve hypot hesi s: t r ue r at i o of var i ances i s not equal
t o 1

3.- Formular las hiptesis de diferencia de medias



4.- Evaluacin de la diferencia de medias

> t . t est ( uno, dos, var . equal =TRUE, a=" g" )

Two Sampl e t - t est

dat a: uno and dos
t = 2.2971, df = 75, p-value = 0.01220
al t er nat i ve hypot hesi s: t r ue di f f er ence i n means i s gr eat er
t han 0

5.- Conclusin



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 43
Prueba de hiptesis de dos muestras: muestras dependientes
La gerencia de una cadena de muebleras, diseo un plan de incentivos para sus
agentes de ventas. Para evaluar este plan innovador, se seleccion a 30 vendedores, al
azar, y se registraron sus ingresos antes y despus de aplicar el plan. Se puede
afirmar que hubo un aumento significativo en el ingreso semanal del vendedor?. Usar
los datos del archivo hiptesis3.xls.

dat =r ead. xl s( " c: / CASOS- TALLER/ hi pot esi s3" )
ant es=dat [ , 2]
despues=dat [ , 3]

1.- Formular las hiptesis



2.- Evaluacin de la hiptesis

> t . t est ( despues, ant es, pai r ed=TRUE, a=" g" )

Pai r ed t - t est

dat a: despues and ant es
t = 4.1146, df = 29, p-value = 0.0001464
al t er nat i ve hypot hesi s: t r ue di f f er ence i n means i s gr eat er
t han 0

3.- Conclusin





Prueba de hiptesis en tablas de contingencia
Prueba de diferencia de ms de dos proporciones
En un estudio se obtuvo una muestra de tres grupos de personas: se pregunt a 100
hombres, 130 mujeres y 90 nios, si les agradaba o no el sabor de una nueva pasta
dental. Los resultados fueron los siguientes:

Las hiptesis son:

H
0
: La proporcin de gusto por la nueva pasta dental es la misma en los tres grupos
de personas
H
1
: Al menos en uno de los grupos la proporcin es diferente.


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 44
Valores observados
Hombres Mujeres Nios
Les gust el sabor 60 67 49 176
No les gust el sabor 40 63 41 144
Total 100 130 90 320


1.- Formular las hiptesis




2.- Evaluacin de la hiptesis

> a=mat r i x( c( 60, 40, 67, 63, 49, 41) , nc=3)
> chi sq. t est ( a)


3.- Conclusin





Prueba de homogeneidad de poblaciones

Hombres Mujeres Nios
Les gust el sabor 52 56 45 153
Les resulta indiferente 15 23 11 49
No les gust el sabor 33 51 34 118
Total 100 130 90 320

1.- Formular las hiptesis



2.- Evaluacin de la hiptesis




3.- Conclusin


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 45
Prueba de independencia de variables
Se quiere investigar si existe en realidad una relacin entre el desempeo en el
programa de capacitacin de la compaa y el xito final en el trabajo.
Desde una muestra de 400 empleados sacados de los grandes archivos de una
compaa, se obtuvo los siguientes resultados:


Desempeo en el programa de capacitacin
xito en el trabajo
(clasificacin de la
empresa)
Inferior a
lo normal
En el nivel
normal
Superior a
lo normal
Total
Deficiente 23 60 29 112
Normal 28 79 60 167
Muy bueno 9 49 63 121
Total 60 188 152 400


1.- Formular las hiptesis



2.- Evaluacin de la hiptesis




3.- Conclusin
















Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 46
ANALISIS DE REGRESION y CORRELACION

El estudio de las relaciones entre dos o ms variables se puede llevar a cabo desde dos
puntos de vista:

Anlisis de Regresin Estudio de la relacin funcional
existente entre las variables

Anlisis de Correlacin Estudio del grado de asociacin
existente entre las variables


ANALISIS DE REGRESION LINEAL
El objetivo de este anlisis es estimar y analizar una ecuacin o modelo, que describa
la relacin funcional existente entre las variables:


Y = f ( X
1
, X
2
, , X
p
)


variable variables
dependiente independientes


COEFICIENTE DE CORRELACION LINEAL
Es una medida de asociacin lineal entre dos variables aleatorias. Para una muestra de
divariada de n-datos:
1 1 2 2
( , ), ( , ), , ( , )
n n
x y x y x y L , el coeficiente de correlacin muestral
es definido por la siguiente frmula:

1
2 2
1 1
( )( )
( , )
( ) ( )
( ) ( )
n
i i
i
n n
i i
i i
x x y y
SP x y
r
SC x SC y
x x y y
=
= =

= =





Propiedades de r
1) 1 1 r
2) No depende de las unidades de las variables en estudio.
3) El signo de r es el mismo que b
1




Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 47
Ejemplo 1
Se consideran los datos mensuales de produccin y costos de operacin de una
empresa britnica de transporte de pasajeros por carretera durante los aos 1949-52
X: produccin, miles de millas recorridos por los vehculos, en un mes
Y: costo de operacin, en miles de dlares por mes.
Usar los datos del archivo: regresion1.xls

l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ r egr esi on1" )
dat =dat [ 1: 33, 1: 3]
cost o=dat [ , 2]
pr odu=dat [ , 3]

Grfico de las variables costo y produccin

pl ot ( pr odu, cost o, pch=19)

Modelo de regresin lineal

r egr e=l m( cost o~pr odu)

> regre

Cal l :
l m( f or mul a = cost o ~ pr odu)

Coef f i ci ent s:
( I nt er cept ) pr odu
64. 96328 0. 04467

> summary(regre)

Cal l :
l m( f or mul a = cost o ~ pr odu)

Resi dual s:
Mi n 1Q Medi an 3Q Max
- 12. 28613 - 3. 17076 0. 06495 2. 73430 8. 58943

Coef f i ci ent s:
Est i mat e St d. Er r or t val ue Pr ( >| t | )
( I nt er cept ) 64. 963277 6. 635974 9. 79 5. 31e- 11 ***
pr odu 0. 044673 0. 001909 23. 40 < 2e- 16 ***
- - -
Si gni f . codes: 0 *** 0. 001 ** 0. 01 * 0. 05 . 0. 1 1
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 48

Resi dual st andar d er r or : 4. 626 on 31 degr ees of f r eedom
Mul t i pl e R- squar ed: 0. 9464, Adj ust ed R- squar ed: 0. 9447
F- st at i st i c: 547. 7 on 1 and 31 DF, p- val ue: < 2. 2e- 16


Grfico del modelo de regresin estimado

pl ot ( pr odu, cost o, pch=19)
abl i ne( r egr e)



Pronstico del costo, cuando la produccin es 3500 y 4000 miles de millas

> new=dat a. f r ame( pr odu=c( 3500, 4000) )
> pr edi ct ( r egr e, new)
1 2
221. 3186 243. 6551

La lnea de regresin estimada:

COSTOS = 64.963 + 0.04467 PRODUCCION

0
64.963 b = Cuando NO hay produccin en un mes determinado, el costo de
operacin en promedio es 64,963 dlares.

1
0.04467 b = Cuando la produccin se incrementa en mil millas-vehculo recorrido
por mes, el costo de operacin en promedio se incrementa en 44.67
dlares.



Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 49
Ejemplo 2
Se consideran los datos de 69 pacientes de los que se conoce su edad y una medicin
de su tensin sistlica. Si estamos interesados en estudiar la variacin en la tensin
sistlica en funcin de la edad del individuo, deberemos considerar como variable
respuesta la tensin y como variable predictora la edad.
X: edad
Y: tensin sistlica
Usar los datos del archivo: regresin2.xls

l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ r egr esi on2" )
dat =dat [ 1: 69, 1: 3]
t ens=dat [ , 2]
edad=dat [ , 3]

r egr e=l m( t ens~edad)
pl ot ( edad, t ens, pch=19)
abl i ne( r egr e)
summar y( r egr e)

Ejemplo 3
En 1962 el economista norteamericano Arthur Okun plante un modelo
macroeconmico para explicar las variaciones en la tasa de desempleo. Segn este
modelo, que se conoce hoy en da como la ley de Okun, existe una relacin lineal
entre el cambio en la tasa de desempleo y la tasa de crecimiento del Producto Interno
Bruto (PIB) real. Se consideran los datos sobre desempleo y crecimiento econmico
en los Estados Unidos durante el perodo 1966-95.
Usarlosdatosdelarchivo:regresin3.xls
a) Use estos datos para estimar el modelo de Okun, y explique el significado de
los coeficientes obtenidos.
b) En este problema, el punto donde la recta intersecta al eje X tiene un significado
econmico interesante. Determine este punto para este caso, y explique su
significado en trminos del modelo de Okun.
l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ r egr esi on3" )
des=dat [ , 2]
pbi =dat [ , 3]
r egr e=l m( des~pbi )
pl ot ( pbi , des, pch=19)
abl i ne( r egr e)
summar y( r egr e)

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 50
Ejemplo 4
Se consideran los datos de un estudio estadstico de los costos administrativos en los
bancos comerciales en Guatemala.
Y: Gastos Generales y de Administracin, miles de dlares.
X1: Total de activos del banco, miles de dlares.
X2: Nmero de agencias del banco
Usar los datos del archivo: regresin4.xls

l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ r egr esi on4" )
gast os=dat [ , 2]
act i vos=dat [ , 3]
agenci as=dat [ , 4]

r egr e=l m( gast os~act i vos+agenci as)
summar y( r egr e)

l i br ar y( scat t er pl ot 3d)
sss=cbi nd( agenci as, act i vos, gast os)
scat t er pl ot 3d( sss, t ype=" h" , pch=16, angl e=50)








Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 51
MUESTREO

Cuando se desea obtener informacin de los miembros de una poblacin; es decir
cuando se desea conocer los parmetros de una poblacin, la primera alternativa es
realizar un censo. Hay varias razones por las que a menudo se prefiere un muestreo a
un censo.

VENTAJAS DEL METODO DE MUESTREO
Costo reducido.- Si los datos se obtienen nicamente de una pequea fraccin del
total, los gastos son menores que los que se realizaran en un censo.

Mayor rapidez.- Los datos pueden ser recolectados y resumidos ms rpidamente con
una muestra que con un censo.

Mayor exactitud.- Si el volumen de trabajo es reducido se puede emplear personal
capacitado al cual se le puede someter a entrenamiento intensivo

Cuidado de la poblacin.- En estudios destructivos, conserva los elementos de la
poblacin; como por ejemplo, el estudio del tiempo de duracin de bateras.

MUESTREO PROBABILISTICO
Todos los individuos tienen probabilidad conocida de ser elegidos.
Todas la posibles muestras de tamao n tienen probabilidad conocida de ser elegidas.
Slo estos mtodos nos aseguran representatividad de la muestra.
Los tipos de muestreo probabilstico son:

1. Muestreo Aleatorio Simple
2. Muestreo Aleatorio Sistemtico
3. Muestreo Aleatorio Estratificado
4. Muestreo Aleatorio por Conglomerados

MUESTREO NO PROBABILISTICO
Aplicado cuando el muestreo probabilstico resulta excesivamente costoso
Todos los individuos no tienen la misma probabilidad de ser elegidos.
No se tiene la certeza de que muestra extrada sea representativa
No se puede hacer generalizaciones.

SELECCIN ALEATORIA
Una muestra tiene seleccin aleatoria cuando el proceso de seleccin de unidades se
hace por sorteo, ya que de esta manera todas las unidades tienen la misma
probabilidad de ser seleccionadas.

Uso de funcin R: sampl e
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 52
Ejercicios

1.- Seleccionar aleatoriamente 5 elementos, de un total de 20

2.- Seleccionar aleatoriamente 6 elementos de un total de 46

3.- Seleccionar aleatoriamente 80 elementos de un total de 5000


MUESTREO ALEATORIO SIMPLE
Si se tiene que seleccionar una muestra de n elementos de una poblacin de tamao N.
El muestreo aleatorio simple es aquel en el que cada muestra posible de tamao n
tienen la misma probabilidad de ser seleccionada.


Estimacin de la media poblacional:
Sean
1 2
, , ,
n
x x x L los valores observados de una muestra de tamao n, tomada de una
poblacin de tamao N.

1) Estimacin puntual de la media:
1
1
n
i
i
x x
n
=
=



2) Estimacin de la varianza de la media muestral:
2
( )
s N n
var x
n N

=




3) Estimacin del error estndar de la media muestral:
2
( )
s N n
se x
n N

=




4) Estimacin por intervalos de la media:
0
( ) x z se x



Estimacin del total de la poblacional: X
Sean
1 2
, , ,
n
x x x L los valores observados de una muestra de tamao n, tomada de una
poblacin de tamao N.

1) Estimacin puntual del total:

X N x =


2) Estimacin por intervalos del total:
0
( ) N x z N se x
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 53
Estimacin de la proporcin poblacional: P
Sean
1 2
, , ,
n
x x x L los valores observados (1 y 0) de una muestra de tamao n,
tomada de una poblacin de tamao N.

1) Estimacin puntual de la proporcin:
1
1

n
i
i
p x
n
=
=



2) Estimacin de varianza de la proporcin muestral:

( )
1
p q N n
var p
n N

=




3) Estimacin del error estndar de la proporcin muestral: ( ) ( ) se p var p =

4) Estimacin por intervalos de la media:
0
( ) p z se p



Ejemplo1
Una empresa tiene 189 contables. En una muestra aleatoria de 50 de ellos, el nmero
medio de horas trabajadas en sobretiempo en una semana fue de 9.7 horas con una
desviacin estndar de 6.2 horas. Halle un intervalo del 95% de confianza para el
nmero medio de horas trabajadas en sobretiempo en una semana.

i cmedi a=f unct i on( n, N, medi a, s, conf )
{ var m=( s^2/ n) *( N- n) / N
sdm=sqr t ( var m)
ar ea=( 1+conf ) / 2
z0=qnor m( ar ea)
a=medi a- z0*sdm
b=medi a+z0*sdm
cat ( " Li nf =" , a, " Lsup=" , b, " \ n" )
}


Ejemplo2
Un auditor, examinando un total de 840 facturas pendientes de cobro, de una empresa,
tom una muestra aleatoria de 120 facturas. Usando los datos del archivo
muestreo1.xls, mediante muestreo aleatorio simple.

a) Hallar un intervalo del 95% de confianza para estimar la cantidad total de cobros
pendientes


Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 54
l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ muest r eo1" )

### muest r a #####
m=sampl e( 840, 120)
dat os=dat [ m, ]
medi a=mean( dat os)
s=sd( dat os)

icmedia(120,840,media,s,0.95)


b) Hallar un intervalo del 95% de confianza para estimar la proporcin de facturas por
cobrar con menos de 100 dlares

y=r ep( 0, 120)
f or ( i i n 1: 120)
{ i f ( dat os[ i ] <100) y[ i ] =1 }


i cp=f unct i on( n, N, y, conf )
{ p=mean( y)
q=1- p
var p=( p*q/ ( n- 1) ) *( N- n) / N
sdp=sqr t ( var p)
ar ea=( 1+conf ) / 2
z0=qnor m( ar ea)
a=p- z0*sdp
b=p+z0*sdp
cat ( " Li nf =" , a, " Lsup=" , b, " \ n" )
}














Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 55
MUESTREO SISTEMATICO de 1 en k
Si se tiene que seleccionar una muestra de n elementos de una poblacin de tamao N.
El muestreo sistemtico de 1 en k, donde k = N/n, se realiza de la siguiente manera:
1) El primer elemento es seleccionado aleatoriamente entre los primeros k elementos
2) Los prximos elementos son seleccionados cada k-elementos.


Ejemplo1
Desde una poblacin de N = 12 hogares, se selecciona una muestra de 4 hogares para
investigar acerca de la variable nmero de personas que viven en el hogar

hogares 1 2 3 4 5 6 7 8 9 10 11 12
#personas 4 3 5 6 3 4 3 4 7 5 2 1


1) Usando el muestreo aleatorio simple, seleccionar los hogares

2) Usando el muestreo sistemtico de 1 en 3, seleccionar los hogares.

dat =c( 4, 3, 5, 6, 3, 4, 3, 4, 7, 5, 2, 1)

Las posibles muestras:

muest r a1=seq( 1, 12, by=3)
muest r a2=seq( 2, 12, by=3)
muest r a3=seq( 3, 12, by=3)


Los datos de las posibles muestras

dat [ muest r a1]
dat [ muest r a2]
dat [ muest r a3]









Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 56
Ejemplo2
Un auditor, examinando un total de 840 facturas pendientes de cobro, de una empresa,
tom una muestra aleatoria de 120 facturas. Usando los datos del archivo
muestreo1.xls, mediante muestreo sistemtico de 1 en 7

1) Hallar un intervalo del 95% de confianza para estimar la cantidad total de cobros
pendientes

l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / User s/ Pr i ncess/ Document s/ PAPA/ CASOS-
TALLER/ muest r eo1" )

### muest r a #####
k=sampl e( 7, 1)
m=seq( k, 840, by=7)
dat os=dat [ m, ]
medi a=mean( dat os)
s=sd( dat os)

i cmedi a( 120, 840, medi a, s, 0. 95)



2) Hallar un intervalo del 95% de confianza para estimar la proporcin de facturas por
cobrar con menos de 100 dlares


k=sampl e( 7, 1)
m=seq( k, 840, by=7)
dat os=dat [ m, ]
y=r ep( 0, 120)
f or ( i i n 1: 120) {i f ( dat os[ i ] <100) y[ i ] =1}
p=mean( y)

i cp( 120, 840, y, 0. 95)










Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 57
MUESTREO ESTRATIFICADO
Si se tiene que seleccionar una muestra de n elementos de una poblacin de tamao N,
la cual est dividida en k estratos, mutuamente excluyentes de tamaos N
1
, N
2
, , N
k
,
tal que:

1 2 k
N N N N + + + = L

El muestreo estratificado consiste en seleccionar una muestra desde cada estrato de
tamaos n
1
, n
2
, , n
k
, tal que

1 2 k
n n n n + + + = L


Estimacin de la media poblacional:
Sean
1 2
, , ,
k
x x x L y
2 2 2
1 2
, , ,
k
s s s L las medias y las varianzas muestrales desde cada
estrato

1) Estimacin puntual de la media:
1
1
k
str i i
i
x N x
N
=
=




2) Estimacin de la varianza de la media muestral:



2 2 2
1 1 2 2
2
( ) ( ) ( )
( )
k k
str
N var x N var x N var x
var x
N
+ + +
=
L


Donde:
2
( )
i i i
i
i i
s N n
var x
n N

=


1, 2, , i k = L

3) Estimacin del error estndar de la media muestral: ( ) ( )
str st
se x var x =


4) Estimacin por intervalos de la media:
0
( )
str str
x z se x



Estimacin del total de la poblacional: X
Sean
1 2
, , ,
k
x x x L y
2 2 2
1 2
, , ,
k
s s s L las medias y las varianzas muestrales desde cada
estrato
Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 58

1) Estimacin puntual del total:

str
X N x =


2) Estimacin por intervalos del total:
0
( )
str str
N x z N se x



Estimacin de la proporcin poblacional: P
Sean
1 2
, , ,
k
p p p L las proporciones muestrales desde cada estrato

1) Estimacin puntual de la proporcin:
1
1

k
str i i
i
p N p
N
=
=




2) Estimacin de varianza de la proporcin muestral:



2 2 2
1 1 2 2
2
( ) ( ) ( )
( )
k k
str
N var p N var p N var p
var p
N
+ + +
=
L



Donde:

( )
1
i i i i
i
i i
p q N n
var p
n N

=


1, 2, , i k = L


3) Estimacin del error estndar de la proporcin muestral: ( ) ( )
str str
se p var p =


4) Estimacin por intervalos de la media:
0
( )
str str
p z se p










Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 59
Ejemplo1:
Una pequea ciudad contiene un total de 1800 hogares. La ciudad est dividida en tres
distritos que contienen 820, 540 y 440 hogares, respectivamente. Una muestra
aleatoria estratificada de 310 hogares contiene 120, 100 y 90 hogares, respectivamente
de estos tres distritos. Se pide a los miembros de la muestra que calculen su factura
total de electricidad consumida en los meses de invierno. Las respectivas medias
muestrales son $290, $352 y $427, y las respectivas desviaciones tpicas muestrales
son $47, $61 y $93.


Distritos N
i
n
i
promedio desviacin tpica
1 820 120 290 47
2 540 100 352 61
3 440 90 427 93


1) Hallar un intervalo del 95% de confianza para estimar la media de la factura total
de electricidad consumida en los meses de invierno.
2) Hallar un intervalo del 95% de confianza para estimar la cantidad total de
electricidad consumida en los meses de invierno.

i cmedi a=f unct i on( dat o, conf )
{ N=sum( dat o[ , 1] )
m. st r =cr osspr od( dat o[ , 1] , dat o[ , 3] ) / N
a1=( dat o[ , 4] ^2/ dat o[ , 2] ) *( dat o[ , 1] - dat o[ , 2] ) / dat o[ , 1]
a2=dat o[ , 1] ^2
v. st r =cr osspr od( a1, a2) / N^2
sd. st r =sqr t ( v. st r )
ar ea=( 1+conf ) / 2
z0=qnor m( ar ea)
a=m. st r - z0*sd. st r
b=m. st r +z0*sd. st r
cat ( " Li nf =" , a, " Lsup=" , b, " \ n" )
}







Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 60

Ejemplo2:
En una ciudad que tiene tres distritos se quiere conocer la proporcin de hogares con
alguna persona profesional. Se toman muestras aleatorias de esos hogares en cada uno
de los tres distritos y se obtienen los resultados que muestra la tabla


Distritos N
i
n
i

Hogares con
Profesionales Proporcin
1 1200 180 80 0.4444
2 1350 190 50 0.2632
3 1050 140 45 0.3214




i cpr op=f unct i on( dat o, conf )
{ N=sum( dat o[ , 1] )
p=dat o[ , 3] / dat o[ , 2]
q=1- p
p. st r =cr osspr od( dat o[ , 1] , p) / N
a1=( p*q/ ( dat o[ , 2] - 1) ) *( dat o[ , 1] - dat o[ , 2] ) / dat o[ , 1]
a2=dat o[ , 1] ^2
v. pst r =cr osspr od( a1, a2) / N^2
sd. pst r =sqr t ( v. pst r )
ar ea=( 1+conf ) / 2
z0=qnor m( ar ea)
a=p. st r - z0*sd. pst r
b=p. st r +z0*sd. pst r
cat ( " Li nf =" , a, " Lsup=" , b, " \ n" )
}










Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 61
Ejemplo3:
Una empresa tiene tres divisiones y los auditores estn intentando estimar la cantidad
total en facturas pendientes de cobro de la empresa. Hay un total de 870 facturas y en
cada divisin hay 250, 300 y 320 facturas respectivamente. Una muestra aleatoria
estratificada de 195 facturas contiene 60, 65 y 70 facturas tomadas desde las tres
divisiones respectivamente. Usar los datos del archivo muestra2.xls


l i br ar y( xl sReadWr i t e)
dat =r ead. xl s( " c: / CASOS- TALLER/ muest r eo2" )

di v1=dat [ dat [ , 2] ==1, 1]
di v2=dat [ dat [ , 2] ==2, 1]
di v3=dat [ dat [ , 2] ==3, 1]

m1=sampl e( 250, 60)
m2=sampl e( 300, 65)
m3=sampl e( 320, 70)

dat 1=di v1[ m1]
dat 2=di v2[ m2]
dat 3=di v3[ m3]

medi a1=mean( dat 1) ; desv1=sd( dat 1)
medi a2=mean( dat 2) ; desv2=sd( dat 2)
medi a3=mean( dat 3) ; desv3=sd( dat 3)

Completar el cuadro

Divisiones N
i
n
i
promedio desviacin tpica
1 250 60
2 300 65
3 320 70

Intervalo de confianza para la media




Intervalo de confianza para el total

Universidad de Puerto Rico, RRP Instituto de Estadsticas de Puerto Rico
Facultad de Administracin de Empresas Estado Libre Asociado de Puerto Rico
JosCarlosVegaVilca,Ph.D. 62
BIBLIOGRAFIA

Berenson, M. L., Levine, D. M., Krehbiel, T. C. (2008) Basic Business Statistics,
Eleventh Edition, Pearson Prentice Hall.

Black, K., (2008) Business Statistics, 5th Edition, Wiley.

Cochran, W. G., (1977) Sampling Techniques, Thirds Edition, Wiley, Ney York.

Levy P. S., Lemeshow S. (1999), Sampling of Populations, Methods and
Applications, Thirds Edition, John Wiley & Sons, Inc.

Lind, D., Marchal, W. G., Wathen, S. A. (2008) Estadstica Aplicada a los negocios
y a la Economa, Decimotercera Edicin, McGraw-Hill, Mexico D. F.

Newbold, P., Carlson, W., Thorne, B. (2008) Estadstica para Administracin y
Economa, Sexta Edicin, Pearson Educacin, S. A. Madrid, Espaa.

S-ar putea să vă placă și