Sunteți pe pagina 1din 18

NOMBRE DEL PROYECTO:

Anlisis de estadstico de la Base Ememdu BDD 201606


del INEC

ASIGNATURA:
ESTADSTICAS II

ESTUDIANTES:
Wellington Quinto Durn
Alex Ramrez Becerra
Kevin Sellan
Eduardo Cortes
Kevin Infante

DOCENTE:
Mcs. Antonio Poveda

Guayaquil - Ecuador
12/2015

NDICE
NDICE..................................................................................................................1
METODOLOGA...................................................................................................3
ANLISIS DE LA BASE DE DATOS.....................................................................4
1.

Ejercicios de Prueba T..................................................................................4

2.

Ejercicios de Prueba Kolmogorov-Smirnov...................................................9

3.

Ejercicios de Chi-cuadrado.........................................................................12

4.

Ejercicios de Correlacin.............................................................................13

5.

Ejercicios de Regresin...............................................................................13

METODOLOGA

El presente proyecto muestra el anlisis de la base de datos


Emedu 2016 que contiene diversos datos obtenidos de la
poblacin ecuatoriana. Para realizar el anlisis se utiliz la
herramienta SPSS que ejecut la base de datos Emedu bdd
201606 del INEC la cual contenida 269 variables de tipo
cuantitativa y cualitativas, y con un nmero aproximado de
25373.075 datos.
Despus de realizar un anlisis exhaustivo del proyecto
donde se analiz la base para ejecutar las pruebas
aprendidas durante el curco de la materia de Estadsticas II:
prueba

T,

K-S,

Chi-cuadro

de

Pearson,

pruebas

de

correlaciones y regresin, con las que se presenta una


mejor comprensin y visualizacin de la informacin.

ANLISIS DE LA BASE DE DATOS


1. Ejercicios de Prueba T
1.1.

Anlisis entre la edad de los habitantes de la rea urbana y


rural

Edad

rea
Urbana
Rural

Estadsticas de grupo
Desviacin
N
Media
estndar
67249
30,31
21,126
47740
28,95
21,889

Media de error
estndar
,081
,100

Consigna: Las medias entre la edad de los habitantes del rea Urbana y la
edad de los habitantes del rea Rural son iguales.
Ho: Las medias de ambas muestras son iguales.
Hi: Las medias de ambas muestras son diferentes.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas

F
Edad Se asumen
varianzas
iguales
No se
asumen
varianzas
iguales

Sig.

prueba t para la igualdad de medias

104,557 ,000 10,550

95% de intervalo
Diferencia Diferencia de confianza de
la diferencia
Sig.
de
de error
(bilateral) medias
estndar Inferior Superior

gl
114987

,000

1,354

,128

1,103

1,606

10,487 100542,152

,000

1,354

,129

1,101

1,607

Evaluacin:
Pvalor < 0.05 = rechazo Ho (Se asumen varianzas iguales)
Afirmacin:
Las medias entre la edad de los habitantes del rea Urbana y la edad de los
habitantes del rea Rural son diferentes. Es decir, la edad de la poblacin del
3

rea rural es menor que la urbana con medias de 28,95 y 30,31


respectivamente.

1.2.

Anlisis entre la edad de los individuos encuestados y su


estado civil
Estadsticas de grupo

Edad

Media

Desviacin

Media de error

estndar

estndar

Estado civil

Casado(a)

29511

47,51

15,349

,089

Soltero(a)

33181

23,02

13,177

,072

Consigna: Las medias entre la edad de los individuos encuestados y su estado


civil son iguales.
Ho: Las medias entre la edad de los individuos encuestados y su estado
civil son iguales.
Hi: Las medias entre la edad de los individuos encuestados y su estado
civil son diferentes.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas

F
Eda
d

Se
asumen
varianza
s iguales
No se
asumen
varianza
s iguales

Sig.

2186,87
,
0 000

prueba t para la igualdad de medias

gl

Sig.
(bilateral
)

Diferenci
a de
medias

95% de intervalo
de confianza de
la diferencia
Diferenci
a de error Inferio
estndar
r
Superior

214,93
1

62690

,000

24,490

,114 24,267

24,713

213,03
4

58515,04
7

,000

24,490

,115 24,265

24,715

Evaluacin:
Pvalor < 0.05 = rechazo Ho (Se asumen varianzas iguales)
Afirmacin:

Las medias entre la edad de los individuos encuestados y su estado civil son
diferentes. Se presume entonces que mientras ms edad los individuos tienen
estn propensos a estar casados. Las medias de edad determinada para los
individuos solteros es 23.02 y la de los casados es 47.51.

1.3.

Anlisis entre el ingreso de los individuos encuestados y su


nivel de instruccin.
Estadsticas de grupo

Ingreso del trabajo

Media de error

estndar

estndar

Nivel de instruccin

Secundaria

13082

2297,08

42778,515

374,015

8204

13387,66

111270,872

1228,482

Superior Universitario

Media

Desviacin

Consigna: Las medias entre el ingreso de los individuos encuestados y su


nivel de instruccin.
Ho: Las medias entre el ingreso de los individuos encuestados y su nivel
de instruccin son iguales.
Hi: Las medias entre el ingreso de los individuos encuestados y su nivel
de instruccin son diferentes.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas

F
Ingres Se
o del
asumen
trabajo varianza
s iguales
No se
asumen
varianza
s iguales

Sig.

398,58
,
4 000

prueba t para la igualdad de medias


Diferenci 95% de intervalo de
confianza de la
Sig.
Diferenci
a de
diferencia
(bilateral
a de
error
)
medias
estndar
Inferior
Superior

gl

10,25
6

21284

,000

11090,58 1081,420
4

13210,24
9

8970,91
8

-8,636

9741,68
8

,000

11090,58 1284,155
4

13607,79
4

8573,37
3

Evaluacin:
Pvalor < 0.05 = rechazo Ho (Se asumen varianzas iguales)
Afirmacin:

Las medias entre el ingreso de los individuos encuestados y su nivel de


instruccin son diferentes. Determinamos que mientras ms nivel de instruccin
los individuos tienen estn propensos a tener mayor ingreso. Las medias
establecidas para los individuos de instruccin secundaria es de 2297,08 y la
de los instruccin universitaria es de 13387,66.

1.4.

Anlisis entre el tiempo para buscar o trasladarse al trabajo y


el rea en donde habitan.
Estadsticas de grupo
Media de error

estndar

estndar

rea

Tiempo para buscar o

Urbana

61480

14,70

21,919

,088

trasladarse al trabajo,

Rural

43160

14,66

16,499

,079

escuela - horas

Media

Desviacin

Consigna: Las medias entre el tiempo para buscar o trasladarse al trabajo y el


rea de donde habitan.
Ho: Ambas medias son iguales.
Hi: Las medias expuestas son diferentes.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas
prueba t para la igualdad de medias
95% de intervalo
Diferenci de confianza de
la diferencia
Diferen
a de
Sig.
cia de
error
Inferio
F
Sig.
t
gl
(bilateral) medias estndar
r
Superior
Tiempo
para
buscar o
trasladars
e al
trabajo,
escuela horas

Se
asumen
varianza
s iguales
No se
asumen
varianza
s iguales

15,29
,
,
9 000 347

104638

,729

,043

,125

-,201

,288

, 104136,70
364
2

,716

,043

,119

-,190

,276

Evaluacin:
Pvalor > 0.05 = No rechazo Ho (Se asumen varianzas iguales)
Afirmacin:

Las medias entre el tiempo para buscar o trasladarse al trabajo y el rea de


donde habitan son iguales. Se asume que el tiempo en trasladarse es igual
tanto en el rea urbana como en el rea rural. Las medias determinas son: para
el rea urbana 14.70 y para el rea de 14.66 con un margen de error del 0.05.

1.5.

Anlisis la media de las personas que recibieron el BDH y su


edad.
Estadsticas de grupo
Recibi el Bono de
Desarrollo Humano

Edad

Media

Desviacin

Media de error

estndar

estndar

Si

8261

58,32

20,256

,223

No

96379

30,26

19,023

,061

Consigna: Las medias entre las personas que recibieron el Bono de Desarrollo
Humano y su edad son iguales.
Ho: Las medias de ambas muestras son iguales.
Hi: Las medias de ambas muestras son diferentes.
Prueba de muestras independientes
Prueba de
Levene de
calidad de
varianzas

prueba t para la igualdad de medias

F
Sig.
t
gl
Edad Se
asumen
312,347 ,000 127,989
104638
varianzas
iguales
No se
asumen
121,397 9551,349
varianzas
iguales

95% de intervalo
Diferencia Diferencia de confianza de
la diferencia
Sig.
de
de error
(bilateral) medias
estndar Inferior Superior
,000

28,059

,219 27,629

28,488

,000

28,059

,231 27,606

28,512

Evaluacin:
Pvalor < 0.05 = rechazo Ho (Se asumen varianzas iguales)
Afirmacin:
Las medias entre las personas que recibieron el Bono de Desarrollo Humano y
su edad son diferentes. La media de la edad establecida para los individuos
que recibieron el BDH es 58.32 y la media de los que no recibieron es 30.26.
7

Esto significa que entre mayor edad es ms propenso a que reciba el Bono de
Desarrollo Humano, por lo que podemos determinar que las personas ms
necesitadas son los adultos mayores.

2. Ejercicios de Prueba Kolmogorov-Smirnov


2.1.

Prueba K-S de muestra sobre las personas que han sido


vctima de algn delito
Prueba de Kolmogorov-Smirnov para una muestra
Ha sido vctima
de algn delito
N

77077

Parmetros normales

a,b

Media

4,97

Desviacin estndar

,529

Mximas diferencias

Absoluta

,487

extremas

Positivo

,428

Negativo

-,487

Estadstico de prueba

,487

Sig. asinttica (bilateral)

,000c

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Ho: la variable: ha sido vctima de algn delito sigue una distribucin normal.
Hi: la variable: ha sido vctima de algn delito no sigue una distribucin normal.
Evaluacin:
Pvalor: 0,487 > 0.05 = No rechazo Ho
La distribucin de la variable: ha sido vctima de algn delito es normal.

2.2.

Prueba K-S de muestra sobre las personas que asisten a clases.


Prueba de Kolmogorov-Smirnov para una muestra
Asiste a clases
N
Parmetros normales

104640
a,b

Media

1,65

Desviacin estndar

,477

Mximas diferencias

Absoluta

,419

extremas

Positivo

,263

Negativo

-,419

Estadstico de prueba

,419

Sig. asinttica (bilateral)

,000c

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Ho: la variable: asiste a clases sigue una distribucin normal.


Hi: la variable: asiste a clases no sigue una distribucin normal.
Evaluacin:
Pvalor: 0,419 > 0.05 = No rechazo Ho
La distribucin de la variable: asiste a clases es normal.

2.3.

Prueba K-S de muestra sobre las personas que saben leer.


Prueba de Kolmogorov-Smirnov para una muestra
Sabe leer y
escribir
N

62224

Parmetros normales

a,b

Media

1,15

Desviacin estndar

,356

Mximas diferencias

Absoluta

,513

extremas

Positivo

,513

Negativo

-,338

Estadstico de prueba

,513

Sig. asinttica (bilateral)

,000c

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Ho: la variable: sabe leer y escribir sigue una distribucin normal.


Hi: la variable: sabe leer y escribir no sigue una distribucin normal.
Evaluacin:
Pvalor: 0,513 > 0.05 = No rechazo Ho
La distribucin de la variable: sabe leer y escribir es normal.
9

2.4.

Prueba K-S de muestra sobre el idioma que hablan las personas


encuestadas.

Prueba de Kolmogorov-Smirnov para una muestra


Idioma que
habla
N

104640

Parmetros normales

a,b

Media

2,92

Desviacin estndar

,387

Mximas diferencias

Absoluta

,485

extremas

Positivo

,400

Negativo

-,485

Estadstico de prueba

,485

Sig. asinttica (bilateral)

,000c

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Ho: la variable: idioma que habla sigue una distribucin normal.


Hi: la variable: idioma que habla no sigue una distribucin normal.
Evaluacin:
Pvalor: 0,485 > 0.05 = No rechazo Ho
La distribucin de la variable: idioma que habla es normal.

2.5.

Prueba K-S de muestra sobre el nmero de trabajos de las


personas encuestadas.
Prueba de Kolmogorov-Smirnov para una muestra
Nmero de
trabajos
N
Parmetros normales

52681
a,b

Media

1,06

Desviacin estndar

,240

10

Mximas diferencias

Absoluta

,540

extremas

Positivo

,540

Negativo

-,399

Estadstico de prueba

,540

Sig. asinttica (bilateral)

,000c

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Ho: la variable: nmero de trabajos sigue una distribucin normal.


Hi: la variable: nmero de trabajos no sigue una distribucin normal.
Evaluacin:
Pvalor: 0,540 > 0.05 = No rechazo Ho
La distribucin de la variable: nmero de trabajos es normal.

3. Ejercicios de Chi-cuadrado
3.1.

Prueba de relacin entre la variable rea y como se considera


(tipo de etnia)
rea*Como se considera tabulacin cruzada

Recuento
Como se considera

Total

Afro
Indgena
rea Urbana
Rural
Total

Otro,

ecuatoriano

Negro Mulato Montubio Mestizo Blanco

cual

2140

1170

1241

816

876

54159

1046

32

61480

11076

408

619

389

1840

28438

371

19

43160

13216

1578

1860

1205

2716

82597

1417

51 104640

Consigna: Las variables: rea y como se considera estn relacionadas.


Ho: Las variables no estn relacionadas.
Hi: Las variables estn relacionadas.

Pruebas de chi-cuadrado

11

Sig. asinttica (2
Valor
Chi-cuadrado de Pearson

gl

caras)

12625,570a

,000

12974,821

,000

9764,929

,000

Razn de verosimilitud
Asociacin lineal por lineal
N de casos vlidos

104640

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 21,04.

Evaluacin:
Pvalor: 0,000 < 0.05 = Rechazo Ho
Afirmacin:
Las variables evaluadas de rea y la consideracin tnica de los individuos
estn estadsticamente relacionadas.

3.2.

Prueba de relacin entre la variable sexo y el nivel de


educacin

Nivel de instruccin*Sexo tabulacin cruzada


Recuento
Sexo
Hombre
Nivel de instruccin

Ninguno

Mujer

Total

1713

2691

4404

181

379

560

Primaria

12823

13106

25929

Educacin Bsica

16180

15151

31331

Secundaria

9301

9509

18810

Educacin Media

5198

4926

10124

435

507

942

5349

6446

11795

393

352

745

51573

53067

104640

Centro de alfabetizacin

Superior no universitario
Superior Universitario
Post-grado
Total

12

Consigna: Las variables sexo y nivel de educacin estn estadsticamente


relacionadas.
Ho: Las variables no estn relacionadas.
Hi: Las variables estn relacionadas.

Pruebas de chi-cuadrado
Sig. asinttica (2
Valor
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por lineal
N de casos vlidos

gl

caras)

,000

425,659

,000

5,563

,018

422,226

104640

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 276,00.

Evaluacin:
Pvalor: 0,000 < 0.05 = Rechazo Ho
Afirmacin:
Las variables estn sexo y nivel de educacin estn estadsticamente
relacionadas.

3.3.

Prueba de relacin entre la variable trabajo la semana pasada


y que trabajo tiene

Trabaj la semana pasada*El trabajo que tiene es tabulacin cruzada


Recuento

Trabaj la
semana
pasada

Si
No

El trabajo que tiene es


Total
Contrato
Contrato
permanente /
temporal,
indefinido / estable
ocasional o Por obra, Por
Por
Nombramiento
o de planta
eventual
a destajo horas jornal
3381
8067
7150
442
426 5770 25236
38

120

13

124

21

21

101

425

Total

3419

8187

7274

463

447

5871 25661

Consigna: las variables trabajo la semana pasada y que trabajo tiene estn
estadsticamente relacionadas
Ho: las variables no estn relacionadas
Hi: las variables estn relacionadas

Pruebas de chi-cuadrado
Sig. asinttica (2
Valor

gl

caras)

,000

42,250

,000

Asociacin lineal por lineal

8,809

,003

N de casos vlidos

25661

Chi-cuadrado de Pearson
Razn de verosimilitud

57,267

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 7,40.

Evaluacin:
Pvalor: 0,000 < 0.05 = Rechazo Ho
Afirmacin:
Las variables estn trabajo la semana pasada y que trabajo estn
estadsticamente relacionadas.

3.4.

Prueba de relacin entre la variable asiste a clase e idioma


que habla

Idioma que habla*Asiste a clases tabulacin cruzada


Recuento
Asiste a clases
Si
Idioma que habla

Slo lengua indgena


Lengua indgena y espaol
Slo espaol
Espaol e idioma extranjero

14

No

Total

60

241

301

3695

6720

10415

32385

60149

92534

303

783

1086

Lengua indgena e idioma

10

14

24

Idioma extranjero

29

97

126

No habla

11

143

154

36493

68147

104640

extranjero

Total

Consigna: las variables asiste a clase e idioma que habla estn


estadsticamente relacionadas
Ho: las variables no estn relacionadas
Hi: las variables estn relacionadas

Pruebas de chi-cuadrado
Sig. asinttica (2
Valor

gl

caras)

Chi-cuadrado de Pearson

115,563

,000

Razn de verosimilitud

134,218

,000

Asociacin lineal por lineal

19,169

,000

N de casos vlidos

104640

a. 0 casillas (,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 8,37.

Evaluacin:
Pvalor: 0,000 < 0.05 = Rechazo Ho
Afirmacin:
Las variables asiste a clase e idioma que habla estn estadsticamente
relacionadas.

3.5.

Prueba de relacin entre la variable por sus estudios obtuvo


algn ttulo y desea trabajar ms horas

Desea trabajar ms horas*Por sus estudios obtuvo algn ttulo tabulacin cruzada
Recuento
Por sus estudios obtuvo algn
ttulo

15

Total

Si
Desea trabajar ms horas

Trabajar ms horas en su
trabajo actual
Trabajar ms horas en otro
trabajo
Cambiar el trabajo por otro
con ms horas
No desea trabajar ms horas

Total

No
241

169

410

278

173

451

178

163

341

5635

2779

8414

6332

3284

9616

Consigna: las variables por sus estudios obtuvo algn titulo y desea trabajar
ms horas estn estadsticamente relacionadas
Ho: las variables no estn relacionadas
Hi: las variables estn relacionadas

Pruebas de chi-cuadrado
Sig. asinttica (2
Valor

gl

caras)

,000

Razn de verosimilitud

44,001

,000

Asociacin lineal por lineal

25,135

,000

Chi-cuadrado de Pearson

45,628

N de casos vlidos

9616

a. 0 casillas (,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 116,46.

Evaluacin:
Pvalor: 0,000 < 0.05 = Rechazo Ho
Afirmacin:
Las variable por sus estudios obtuvo algn ttulo y desea trabajar ms horas
estn estadsticamente relacionadas.

4. Ejercicios de Correlacin
4.1.

Prueba

16

5. Ejercicios de Regresin
5.1.

Prueba

6. Conclusiones

17

S-ar putea să vă placă și