Documente Academic
Documente Profesional
Documente Cultură
Introduccin
Qu es la estadstica?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los ltimos aos.
2) En Economa: para medir la evolucin de los precios mediante nmeros ndice o para
estudiar los hbitos de los consumidores a travs de encuestas de presupuestos
familiares.
1
Estadstica
Introduccin
Ejemplos de su aplicacin son:
3) En Ciencias Polticas: para conocer las preferencias de los electores antes de una
votacin mediante sondeos y as orientar las estrategias de los candidatos.
4) En Sociologa: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
En general en las Ciencias Sociales, la estadstica se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
2
Estadstica
Introduccin
Etapas de un estudio estadstico
Un anlisis estadstico se lleva a cabo siguiendo las etapas habituales en el llamado
mtodo cientfico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigacin y
precisar el universo o poblacin.
5) Diagnstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la poblacin
3
Estadstica
Introduccin
Esquema de las etapas de un estudio estadstico
ORGANIZAR Y RESUMIR
Probabilidad
INFORMACIN
4
Estadstica
Introduccin
Ejemplos de algunos problemas a estudiar
5
Estadstica
Poblacin: Muestra
6
Estadstica
TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo
8
Estadstica
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- N de Empleados: se refiere al nmero de empleados en las lneas de produccin. (cuantitativa discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las reas de
produccin. (cuantitativa continua)
- Calificacin: calificacin realizada por una institucin pblica sobre cumplimiento de ciertos estndares
(Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Datos
Industria n Tipo N Empleados Superficie Calificacin
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
. . . . .
. . . . .
. . . . .
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
9
Estadstica
Tipo de Frecuencia Frecuencia Porcentaje Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Industria Absoluta (Fj) Relativa (fj) (%) Calificacin Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
A Muy Bien
B Bien
C Regular
D Mal 300 1 (o 100)
Total 300 1 100 Total 300 1 (o 100) (2)
(1) Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Empleados Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
. (3)
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
(4) [200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%) 10
Estadstica
Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1
11
Estadstica
12
Estadstica
C
D A 40% B
10% 20% 30%
C
B
40%
30%
13
Estadstica
D
500
variable 1
400 C
300
N
B
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporcin de unidad de anlisis
variable 1
-Este tipo de grfico se utiliza generalmente para
Porcentaje de unidad de anlisis de acuerdo a representar la frecuencia de las categoras de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de grfico slo si la variable se ha
variable 1
C
transformada en categoras.
B
-Hay distintas versiones de estos grficos (por ejemplo
A
en Excel), y en algunos casos son muy tiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de anlisis grupos. 14
Estadstica
10
- El eje x se refiere a la
N
5
variable.
- El eje y se refiere a la
0
frecuencia (N , %).
7 8 9 10 11 12 13 14
edad
edad - Cada barra representa la
frecuencia de la variable en la
Ejemplo
poblacin en estudio (o la
En el grfico se puede observar el nmero de muestra).
hijos , de menor edad (7-8 aos), las de mayor
edad (13-14 aos); y adems que la mayora de -El histograma se puede
hijos de los trabajadores estn entre los 10 y 12 construir desde los datos de la
aos. tabla de frecuencia de la
variable en estudio.
15
Estadstica
10
edad cuantitativas.
N
5
-El eje x se refiere a la
variable.
0
7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (N , %).
-Los puntos que permiten la
unin de las lneas representa
el centro de clase (o marca de
clase).
16
Estadstica
90
80
70
50
(percentiles 25 y 75), mnimo y
40 mximo de una variable.
30 - Slo es til para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 17
Estadstica
100 100
N de alumnos
N de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
ao de ingreso ao de ingreso
Carrera B ao ingreso
Carrera A 18
Estadstica
NOTACION
Variables Cuantitativas
i 1 frecuencia. i 1 i 1 i 1
n n n
* Al igual que las tablas, los grficos deben ser auto-explicativos.
(axi b) (ax1 b) (axn b) a xi b 2
( xi ) ( x1 x n ) 2
i 1 i 1 i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
19
Estadstica
Datos Moda
Cualitativos y Cuantitativos M o " el dato que ms se repite"
20
Estadstica
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos estn ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64. 21
Estadstica
-Rango
MEDIDAS DE DISPERSIN -Varianza
-Desviacin Estndar
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias
es la simetra y el apuntamiento o kurtosis.
(x
i 1
i x)3 Si CA=0 si la distribucin es simtrica alrededor de la media.
Si CA<0 si la distribucin es asimtrica a la izquierda
Coeficiente de Asimetra CA Si CA>0 si la distribucin es asimtrica a la derecha
n s3
( xi x ) 4
- Si CAp=0 la distribucin se dice normal (similar
a la distribucin normal de Gauss) y recibe el
i 1
Coeficiente de Apuntamiento CAp nombre de mesocrtica.
n s4 - Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se
llama platicrtica.
23
Estadstica
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
14 30 6
12 5
10
20 4
8
3
10 2
4
V2 V4 V5
24
Estadstica
-Asimetra
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos
1 4 4 Media 3,9
14
1 4 4 Mediana 4
1 4 5
12 Moda 4
2 4 5 10
Desviacin estndar 1,67
3 4 6 4 Rango 6
V1
25
Estadstica
(c
n1 f1
I1 c1 a1
sc j xc ) 2 f j
I2 c2 a2 n2 f2 j 1
.
.
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetra para
Total n 1
datos agrupados esta dado por:
k
(c xc ) 4 f j
k
Media c xc c j f j j 1
j
j 1 CApc
s c4
26
Estadstica
Bicicleta 8 13,3
Estudia 21 35,0
Caminar 9 15,0
Pensionado 26 43,3
Coche 14 23,3
Trabaja 13 21,7
Metro 17 28,3
TOTAL 60 100
TOTAL 60 100
27
Estadstica
Distribucin conjunta
N de personas
Tabla 2 Actividad
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
28
Estadstica
Distribucin conjunta
N de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
29
Estadstica
Distribucin conjunta
N de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
30
Estadstica
- Covarianza Datos
MEDIDAS DE ASOCIACIN LINEAL
- Correlacin Cuantitativos
x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersin
x2 (Varianza y Desviacin Estndar) para una Variable
Cuantitativa (x).
xn
Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x , y ) ( xi x )( yi y )
y( 1 )
n i 1
x(1)
Si Cov(x,y) es positiva: la asociacin entre x e y es directamente proporcional,
x( 2 ) y( 2 )
es decir que cuando x aumenta y tambin aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociacin entre x e y es inversamente proporcional,
x(n ) y( n ) es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociacin entre x e y.
31
Estadstica
- Covarianza Datos
MEDIDAS DE ASOCIACIN LINEAL
- Correlacin Cuantitativos
Correlacin: Se refiere al grado de asociacin entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlacin de Pearson (r): Mide el grado de Asociacin Lineal
entre dos variables Cuantitativas
n
xi yi nxy
x y
cov( x , y )
x(1) y( 1 ) r 1 r 1
sx s y r i 1
x( 2 ) y( 2 ) ( n 1 )s x s y
Si r es positivo: la asociacin entre x e y es directamente proporcional, es decir que
x(n ) y( n ) cuando x aumenta y tambin aumenta; y viceversa. Si r=1: la asociacin lineal es
perfecta.
Si r es negativo: la asociacin entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociacin lineal es
perfecta.
Si r es cero: no existe asociacin entre x e y.
32
Estadstica
r=1 r=-1
33
Estadstica
Datos Cuantitativos
Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notacin
x( 2 ) y( 2 ) Variable Respuesta: y
Variable Explicativa: x
y( n ) Modelo de Regresin Lineal Simple: yi=+xi+ei
x(n )
Intercepto:
Pendiente:
Error: e
Modelo Estimado
(recta de regresin) Mtodo de Estimacin: Mnimos Cuadrados
a y bx
n n n
y a bx
Residuos o Errores
n xy xi y i ei y i y i
b i 1 i 1 i 1
2
n
n
n x xi
2
i 1 i 1
35
Estadstica
37
Estadstica
Modelo Estimado
y a bx
b 2,44 a 53,64
y 53,64 2,44 x
39