Sunteți pe pagina 1din 45

Facultad de Ingeniera

Escuela de Estadstica
ESTADISTICA BASICA I
Profesor: Rodrigo Rada Barona

ESTADISTICA BASICA I

Introduccin a la estadstica

Historia de la Estadstica
La estadstica surgi como una necesidad del estado: el censo y
su descripcin poltica, geogrfica y econmica.
En el siglo XVII y XVIII nace la probabilidad aplicada a los juegos
de azar que ejerce una fuerte influencia sobre la estadstica.
En el XIX empieza a aplicarse a cuestiones sociales.
Y actualmente se aplica a la historia, psicologa, pedagoga,
ingeniera, biologa, economa, periodismo, poltica, medicina...

Qu significa estadstica?
La palabra estadstica tiene varios significados:
1. Es usada frecuentemente al referirnos a datos registrados
2. Estadstica tambin denota caractersticas calculadas para un
grupo de datos, por ejemplo, media de la muestra
3. Estadstica tambin se refiere a metodologa estadstica, tcnicas y
procedimientos tratando con el diseo de experimentos,
coleccin, organizacin, anlisis de la informacin contenida en un
grupo de datos para hacer inferencias acerca de los parmetros de
la poblacin.
4

Para qu sirve la estadstica?


La Ciencia se ocupa en general de fenmenos observables

La Ciencia se desarrolla observando hechos, formulando leyes que


los explican y realizando experimentos para validar o rechazar
dichas leyes
Los modelos que crea la ciencia son de tipo determinista o
aleatorio (estocstico)
La Estadstica se utiliza como tecnologa al servicio de las ciencias
donde la variabilidad y la incertidumbre forman parte de su
naturaleza
5

Definicin
La Estadstica se encarga de:
Sistematizacin,
recoleccin,
ordenacin
y
presentacin simplificada de los datos referentes a
un fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico, con objeto
de

deducir las leyes que rigen esos fenmenos,


y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.

Qu hacen los estadsticos?

Guiar el diseo de un experimento o encuesta antes de la


coleccin de datos.

Analizar datos usando los procedimientos, herramientas y


tcnicas estadsticos adecuados

Presentar e interpretar resultados a los investigadores y/o


entes tomadores de decisiones

Por qu estudiar estadstica?

Conocimiento de estadstica es esencial en los procesos


de investigacin y en conduccin de estudios

El entendimiento bsico de estadstica es til para la


presentacin efectiva de resultados

Entendimiento de estadstica puede ayudar a discriminar


entre hechos y suposiciones en la vida diaria

El conocimiento de estadstica de ayuda a saber cuando


un estadstico deber ser consultado para el apoyo en
una investigacin.
8

DIMENSION ACTUAL DE LA ESTADSTICA


Prueba de una vacuna

Determinacin de la dosis de una droga


Caracterizacin de la demanda por el servicio de salud
Fase de planeacin

Control de calidad
Comparacin de la eficiencia de dos procesos
Produccin agrcola

Economa
Mercadeo

Comportamientos de las comunidades


9

ETAPAS DE UN PROYECTO DE INVESTIGACIN


Definicin del problema (justificacin, objetivos, revisin
bibliogrfica y planteamiento de hiptesis a valorar).
Definicin de la poblacin
Determinacin de las variables de inters
Diseo del estudio

Recoleccin de la Informacin
Procesamiento de los datos
Conclusiones y planteamiento de nuevas hiptesis

10

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin

Los fumadores tienen ms ausencias laborales que los no


fumadores
En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)


Qu individuos pertenecern al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Criterios de exclusin Cmo se eligen? Descartamos los que
padecen enfermedades crnicas?

Qu datos recoger de los mismos (variables)


Nmero de ausencias laborales
Tiempo de duracin de cada ausencia laboral
Sexo? Sector laboral? Otros factores?
11

Mtodo cientfico y la estadstica

Plantear
hiptesis

Disear
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

12

Poblacin y muestra
Poblacin es el conjunto sobre el que
estamos interesados en obtener
conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.

Muestra es un subconjunto suyo al que


tenemos acceso y sobre el que
realmente hacemos las observaciones
(mediciones)
Debera ser representativo
Esta formado por miembros seleccionados de la poblacin (individuos,
unidades experimentales).

13

Validez
Qu es validez externa e interna?
Validez externa o predictiva: Trata de ver si los resultados
obtenidos en la escala concuerdan con la conducta posterior.
Validez interna o de constructo: Es aquella validez donde el
investigador formula una hiptesis que est relacionada con el
aspecto que desea medir. Para comprobarla construye dos
escalas y las aplica. Si la aplicacin de ambas escalas confirma la
hiptesis, es inicio de validez de las escalas.

Variables
Una variable es una caracterstica observable que vara
entre los diferentes individuos de una poblacin.
La informacin que disponemos de cada individuo es
resumida en variables.

Las variables pueden ser:

Cualitativas
Cuantitativas
15

Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a
un nmero (no se pueden hacer operaciones algebraicas con
ellos)
Nominales: Si sus valores no se pueden ordenar - son
denominaciones
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar
(S/No)
Ordinales: Si sus valores se pueden ordenar jerarqua clasificacin
Mejora a un tratamiento, Grado de satisfaccin,
Intensidad del dolor dolor
16

Tipos de variables
Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)

Discretas: Si toma valores enteros

Nmero de hijos, Nmero de cigarrillos, Visitas a la


biblioteca , edad

Continuas: Si entre dos valores, son posibles infinitos valores


intermedios.
Altura, Presin intraocular, Dosis de medicamento
administrado
17

Escala de datos - resumen


1. Nominal: Estos datos no representan una cantidad (estado civil,
sexo)
2. Ordinal: Estos datos representan una serie de datos ordenados
(nivel de educacin)
3. Intervalo: Estos datos son medidos en una escala de intervalo
teniendo iguales unidades pero teniendo un 0 arbitrario
( temperatura en Fahrenheit)

4. Razn: Estos datos son medidos en una escala teniendo iguales


unidades pero teniendo un 0 que indica ausencia
( peso, distancia, velocidad, talla, para el cual podemos comparar
significativamente contra otro (digamos, 100 Kg es dos veces 50 Kg)
18

Como cuantificar datos cualitativos


Es buena idea codificar las variables como nmeros para
poder procesarlas con facilidad.

Es conveniente asignar etiquetas a los valores de las


variables para recordar qu significan los cdigos
numricos.
Sexo (Cualitativa: Cdigos arbitrarios)
1 = Hombre
2 = Mujer
Raza (Cualitativa: Cdigos arbitrarios)
1 = Blanca
2 = Negra,...
19

Ejemplo de variables
Determinar el tipo de variable. Si son variables
Cualitativas (nominal u ordinal) o cuantitativas (Discretas
o continuas).

a) Marca de automvil.
b) Duracin de un disco compacto (segundos).
c) Nmero de temas de un disco compacto.
d) Nivel educacional (bsica, media, universitaria).
e) Temperatura al medioda en Copiap (grados Celsius).
f) Estado civil (soltero, casado, divorciado, viudo).

g) Cantidad de lluvia en un ao en Copiap (mm).


20

Organizando los datos


1.

Tabla de frecuencias

2.

Diagrama de Barras

3.

Diagrama Circular o de Pastel

4.

Histograma de frecuencias

5.

Histograma de frecuencias relativas

6.

Grafico de Polgono de frecuencias

7.

Grafico de Polgono de frecuencia relativa

Variables
cualitativas

Variables
cuantitativas

Presentacin ordenada de datos


7
6
5

Gnero

Frec.

4
3

Hombre

2
1

Mujer

0
Hombre

Mujer

Las tablas de frecuencias y las representaciones grficas son dos


maneras equivalentes de presentar la informacin. Las dos exponen
ordenadamente la informacin recogida en una muestra.

22

Tablas de frecuencia
Exponen la informacin recogida en la muestra, de forma que no se pierda nada
de informacin (o poca).
Frecuencias absolutas (ni): Contabilizan el nmero de individuos de cada
modalidad
Frecuencias relativas (porcentajes) (fi): Frecuencia absoluta, pero dividido
por el total de datos (n).
Tabla de frecuencia

Tabla de frecuencia

Sexo del encuestado

Sexo del encuestado

Genero

Frecuencia
absoluta
(ni)

Frecuencia
relativa
(fi)

Hombre

636

Mujer

864

Total (n)

1500

Genero

Frecuencia
absoluta
(ni)

Frecuencia
relativa
(fi)

636 / 1500

Hombre

636

0.424

864 / 1500

Mujer

864

0.576

Total (n)

1500

1.0
23

Presentacin ordenada de datos


PERCEPCIN
GUSTO POR LA LECTURA
50%
40%
30%

20%
10%
0%
mucho

lo
necesario

poco

muy poco casi nada

24

Presentacin ordenada de datos


TIPO DE LECTURA
18
16

14
12

10
8

6
Hombres

Mujeres

2
0
Revistas

Periodicos

Novelas

Cuentos

Poesia

Otros

25

Tablas de frecuencia
Tabla de frecuencia - Nivel de felicidad

Categoras de
felicidad

Frecuencia
absoluta
(ni)

Frecuencia
relativa %
(fi)

Muy feliz

467

25,66

Feliz

872

47,91

Ni feliz ni infeliz

165

9,07

Infeliz

230

12,64

Muy infeliz

86

4,73

1820

100.0

Total (n)

26

Tablas de frecuencia
Con que regularidad se lee el peridico en la ciudad

ni

Frecuencia
Relativa
fi

Todos los das

525

0,35

35

Una Vez por semana

420

0,28

28

Una vez por mes

150

0,10

10

Alguna vez al ao

225

0,15

15

Nunca

165

0,11

11

No contesta

15

0,01

1500

1,00

100

Frecuencia
Respuestas

Total

Absoluta

Frecuencia
Relativa %

fi

27

Tablas de frecuencia
Con que regularidad se lee el peridico en la ciudad
600
500

400
300
200
100
0
Todos los das Una Vez por Una vez por Alguna vez al
semana
mes
ao

Nunca

No contesta

28

Tablas de frecuencia
Con que regularidad se lee el peridico en la ciudad

Todos los das


Una Vez por semana
Una vez por mes
Alguna vez al ao
Nunca
No contesta

29

Tablas de frecuencia
Frecuencias acumuladas: Slo tienen sentido para variables
ordinales y numricas
Tabla de frecuencia Numero hijos por familia

Hijos

Frecuencia
absoluta (ni)

Frecuencia
relativa %
(fi)

Frecuencia
absoluta
Acumulada
(Ni)

Frecuencia
relativa
Acumulada
%
(Fi)

419

27,75

419

27,75

255

16,89

674

44,64

375

24,83

1049

69,47

215

14,24

1264

83,71

127

8,41

1391

92,12

54

3,58

1445

95,70

24

1,59

1469

97,29

23

1,52

1492

98,81

8 y ms

18

1,19

1510

100,00

1510

100,00

Total (n)

30

Ejemplo
Nmero de hijos

Cuntos individuos tienen menos de 2


hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

Qu porcentaje de individuos tiene 6


hijos o menos?
97,3%

Qu cantidad de hijos es tal que al


menos el 50% de la poblacin tiene
una cantidad inferior o igual?

0
1
2
3
4
5
6
7
Ocho+
Total

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(vlido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

50%

2 hijos

31

Grficos para v. cualitativas

Diagramas de barras

Diagramas de sectores (tartas, polares)

Alturas proporcionales a las frecuencias (abs. o rel.)


Se pueden aplicar tambin a variables discretas

No usarlo con variables ordinales.


El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas

Fciles de entender.
El rea de cada modalidad debe ser proporcional a la frecuencia.
De los dos, cul es incorrecto?.

32

Grficos diferenciales para variables


numricas

419

400

300

Recuento

Son diferentes en funcin de que las variables


sean discretas o continuas. Valen con frec.
absolutas o relativas.

255
215
200

127
100

Diagramas barras para v. discretas

54
24

Se deja un hueco entre barras para indicar


los valores que no son posibles

23

17

7 Ocho o ms

Nmero de hijos

250

200

Histogramas para v. continuas


El rea que hay bajo el histograma entre
dos puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en
el intervalo.

Recuento

375

150

100

50

20

40

60

80

Edad del encuestado

33

Diagramas de frecuencias acumuladas

Cada uno de los anteriores diagramas tiene su correspondiente diagrama acumulado.


Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la
variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al
mismo.

34

Tabla de frecuencias
No. de unidades
X

Num. de das
(Frecuencia)
ni

Frecuencia
Relativa
fi

2/30=0.067 = 6.7%

3/30=0.100 = 10%

5/30=0.167 = 16.7%

5/30=0.167 = 16.7%

6/30=0.200 = 20%

4/30=0.133 = 13.3%

2/30=0.067 = 6.7%

2/30=0.067 = 6.7%

1/30=0.033 = 3.3%

Total

30

100.0
35

Tabla de frecuencias
No. de
unidades
X

Num. de
Frecuencia Frecuencia
das
absoluta
Relativa
acumulada
(Frecuencia)
fi
Ni
ni

Frecuencia
Relativa
acumulada
Fi

6.7%

6,7

10%

16,7

16.7%

10

33,3

16.7%

15

50,0

20%

21

70,0

13.3%

25

83,3

6.7%

27

90,0

6.7%

29

96,7

3.3%

30

100

Total

30

100
36

Diagrama de barras
Unidades rechazadas en el proceso por da

Unidades rechazadas en el proceso de


control de calidad

6
5
4

6
7%

Frec.

7
7%

8
3%

0
6%

1
10%

5
13%

2
17%

1
0
0

4
20%

3
17%

37

Diagrama de frecuencia acumulada


Unidades rechazadas en el proceso por da
Frec. Relativa %
acumulada

Frec. Absol
acumulada

Ni

30

100

27

90

24

80

21

70

18

60

15

50

12

40

30

20

10
0

Fi

8
38

Tabla de frecuencias
Datos agrupados

Numero de veces
que va a cine

Frecuenci
as
absolutas
ni

14

16

11

10

12

Total

Tabla de frecuencias
Datos agrupados en intervalos
Intervalos

ni

[ 1 11 )

[ 11 21 )

10

[ 21 31 )

14

[ 31 41 )

[ 41 51 )

5
45

fi

Ni

Fi

Tabla de frecuencias
Datos agrupados en intervalos

Estatura
Cm

Frecuencias
absolutas

ni

1,01 - 1,10

1,11 - 1,20

1,21 - 1,30

1,31 - 1,40

1,41 - 1,50

10

1,51 - 1,60

1,61 - 1,70

1,71 - 1,80

1,81 - 1,90

1,91 - 2,00

Total

50

Ejemplo variable continua


En un programa para la deteccin de hipertensin en una muestra de 30
hombres en edades entre 30 y 40 aos, la distribucin de la presin diastlica
(mnima) fue la siguiente:

70

85

85

75

65

90

110

95

90

70

60

75

80

120

85

95

90

70

100

65

80

90

95

90

95

110

100

85

80

75

La variable en estudio es :
Presin diastlica
una variable numrica continua.

42

Ordenamos los datos en forma


creciente:
60

65

65

70

70

70

75

75

75

80

80

80

85

85

85

85

90

90

90

90

90

95

95

95

95 100 100 110 110 120

43

Tabla de frecuencias
Presin
X

Num. de personas
Frecuencia Absol.
ni

Frecuencia
Relativa
fi

Frec. Absol.
Acumulada
Ni

Frec. Relativa%
Acumulada
Fi

60 - 70

10

10

70 - 80

20

30

80 - 90

23

16

53

90 - 100

30

25

83

100 - 110

27

90

110 - 120

29

97

120 - 130

30

100
44

Histograma de la distribucin de frecuencia


de la presin diastlica
10

Frec. absol
8

0
60

70

80

90

100

110

120

130

Intervalos
45

S-ar putea să vă placă și