Sunteți pe pagina 1din 25

TECNICAS EXPLORATORIAS

VICENTE ESPINOZA

FAMILIAS DE ANALISIS ESTADSTICO

DESCRIPTIVA

formas y configuraciones de los datos

EXPLICATIVA

Modelo Experimental

Inferencia que supone representacin


estadstica

Hiptesis fuertes sobre estructura de datos

TENDENCIAS

Anlisis de series de tiempo

LAS TECNICAS DESCRIPTIVAS SE ADAPTAN A


LAS CONDICIONES DE INVESTIGACION
TPICAS DE LAS CIENCIAS SOCIALES

No suponen estructura causal, no buscan explicar


(experimento)

Su

objetivo

es

visualizar

comprender

la

estructura de los datos

Por lo tanto tampoco hay distribucin estadstica


de referencia (parmetro)

Hay

tcnicas

multivariadas

descriptivas

univariadas

Exploracin como una descomposicin de los


residuos (o errores de medida)

Descubrir los casos anmalos en distribuciones


univariadas

Sin imponer distribucin conocida como parmetro

Revisar la varianza no explicada en mtodos


factoriales

Realizar clasificaciones mltiples

Aplicar diagnsticos de regresin en modelos


causales

Verificar los supuestos de linealidad, normalidad de


la distribucin, homogeneidad de la varianza

Descripcin univariada de variables


continuas

Cmo describir
adecuadamente estos datos?

Duracin en minutos de las conversaciones


telefnicas de 20 hombres y 20 mujeres, de
entre 20 y 30 aos, elegidos al azar.
Hombres

17 15 42 14 38 13 23 22 2 20 16 15 14 13 28 8 12
29 6 23

Mujeres

29 23 21 19 13 22 24 27 28 2 17 26 17 14 12 19
12 9 21 15

La media como medida resumen

La media se expresa formalmente como:

xi
N

La media, popularmente conocida como


promedio, resume en un solo nmero la
tendencia de los datos.

Media de hombres y mujeres

17 + 15 + 43 + ...+ 6 + 23
= 18.5
20

17 + 15 + 43 + ...+ 21+15
= 18.5
20

Media de los
hombres
Media de las
mujeres

Son iguales los dos grupos?

Los hombres tienen la misma pauta de uso


de telfono que las mujeres?
Para responder a ciencia cierta, debiramos
conocer la distribucin de la muestra
El problema de la media es su sensibilidad a
los extremos de la distribucin
Hay medidas resumen menos sensibles a
las variaciones en los extremos?

Rango de la distribucin

Diferencia entre mximo y mnimo


Hombres 42 2 = 40
Mujeres 29 2 = 27
Los rangos son diferentes en 20 minutos
Mximo de los hombres 42, mujeres 29

El valor medio de los hombres probablemente


est influido por algunos valores extremos

Cmo identificar los valores extremos?

Grfico de tallo y hojas


Grfico de caja con patillas

Grficos de tallo y hoja


Frecuencia Tallo Hoja
1.00
0 * 2
2.00
0 . 68
5.00
1 * 23344
4.00
1 . 5567
4.00
2 * 0233
2.00
2 . 89
2.00 Extremos (38), (42)

Frecuencia
1.00
1.00
4.00
5.00
5.00
3.00

Ancho tallo:
Cada hoja =

Ancho tallo:
10.00
Cada hoja =
1 caso(s)

10.00
1 caso(s)

n = 20 , 1 | 2 = 12

Grfico Hombres

Tallo Hoja
0 * 2
0 . 9
1 * 2234
1 . 57799
2 * 11234
2 . 6789

n = 20 , 1 | 2 = 12

Grfico Mujeres

Mediana y cuartiles

La mediana es el nmero que divide una


serie ordenada de nmeros en dos mitades
iguales

El cuartil 1 es es el nmero que divide la


mitad de la serie bajo la mediana dos
mitades iguales

Si la serie tiene un nmero par de elementos se


calcula el promedio de los nmeros centrales

Percentil 25

El cuartil 3 es es el nmero que divide la


mitad de la serie sobre la mediana dos
mitades iguales

Percentil 75

Resmenes numricos
HOMBRES

MUJERES

Mnimo
C1
Md
C3
Mximo

= 2
= 13
= 15.5
= 23
= 42

Mnimo
C1
Md
C3
Mximo

= 2
= 13.5
= 19
= 23.5
= 29

Media

= 18.5

Media

= 18.5

Grfico de caja y patilla

Proceso informacin cuantitativa


Graficar:
Histograma permite apreciar distribucin y
tendencias

Desagregar:
Agrupar la informacin con diferentes criterios:
comunas, provincias, dependencia, nivel, etc.

PUNTAJES
PRUEBA 2001
Establecimiento

Dpcia

Grupo

N Alumnos

LENG

MAT

5,816

245

240

2,703

244

240

2,682

245

240

REGIN DE TARAPAC
Totales Regionales
DEPARTAMENTO PROVINCIAL: Arica - Parinacota
Totales Provinciales
COMUNA: Arica
Totales Comunales
Colegio Abraham Lincoln

PSC

18

274

258

Colegio Alemn De Arica

PS

31

281

297

Colegio Andino (**)

PP

13

Colegio Cardenal Antonio Samor

PS

76

262

253

Colegio Int. Presidente Eduardo Frei M.

MD

178

242

235

Colegio Italiano Santa Ana

PS

75

288

294

Colegio San Jorge

PP

30

304

314

Colegio San Marcos

PP

46

286

285

Colegio Saucache

PS

77

248

258

Junior College

PP

52

307

326

Liceo Jovina Naranjo F. A 5

MD

87

227

223

Liceo Agrcola Jos Abelardo Nuez

MD

39

248

222

Liceo Antonio Varas De La Barra B 4

MD

391

235

231

Liceo Artstico Dr. Juan No Crevani

MD

22

220

220

Liceo Comercial Arica

MD

235

225

216

Liceo Domingo Santa Mara

PSC

293

252

240

Liceo Octavio Palma Prez A 1

MD

335

277

264

Resultados Simce Lenguaje


Comuna Concepcin 2001
LENG2001
12

10

Frequency

4
Std. Dev = 33.51

Mean = 261.9
N = 73.00

0
200.0

220.0

210.0

240.0

230.0

LENG2001

260.0

250.0

280.0

270.0

300.0

290.0

320.0

310.0

330.0

Simce Lenguaje 2001 Deprov VIII


340
320

Laja
LosAngel
LosAngel

300
280
260

LENG2001

240
220
200
180
N=

17

38

73

56

ARAUCO

BIOBIO

CONCEPCI

UBLE

DEPROV

Simce Matem. 2001 Deprov VIII


400
Arauco

Laja
LosAngel

LosAngel
LosAngel

300

MAT2001

200

100
N=

17

38

73

56

ARAUCO

BIOBIO

CONCEPCI

UBLE

DEPROV

Simce 2001 VIII Matemticas


por tipo dependencia
400

300

Yungay
Coronel
Arauco
Chilln
Concepci
Concepci
Laja
Curanila

MAT2001

200

100
N=

12

57

20

30

26

36

MC

MD

MDC

PP

PS

PSC

DPCIA

Simce 2001 VIII Lenguaje


por tipo dependencia
340
320
300

Coronel

280
Concepci

260

LENG2001

240
220
SanPedro

200
180
N=

12

57

20

30

26

36

MC

MD

MDC

PP

PS

PSC

DPCIA

Test de diferencia de medias


t n=

X 1 X 2
s1
s2
[ ]
n1
n2

Fuentes Secundarias
Informacin recolectada con otros
propsitos, que ofrece indicaciones sobre
un problema de inters
Censo, Encuesta de Empleo, Casen, Informes
Ministeriales, SIMCE, etc.
Colecciones de indicadores: SINIM
(www.sinim.cl)

Precaucin: informarse sobre definiciones y


procedimientos

Otra Informacin cuantitativa


Conteo de ocurrencias, volumen de recursos,
nmero de personas, etc.
Graficar: tortas, histogramas, caja con patillas
Para resumen, preferir medidas que reflejen la
distribucin por sobre la media (promedio):
Frecuencias por categoras
Frecuencias por cuartiles

S-ar putea să vă placă și