Documente Academic
Documente Profesional
Documente Cultură
Facultad de Ingeniería
PROBABILIDAD Y ESTADÍSTICA
Programa
1
EQUIPO DE CÁTEDRA
HORARIOS DE CLASES
Lunes AULA 107 (Rectorado)
14:30-17:00 (Gralmente. Teoría)
SISTEMA DE PROMOCIÓN
2
Nota Final promocionados:
80 – 83 puntos 7 (SIETE)
84 – 89 Puntos 8 (OCHO)
90 – 95 puntos 9 (NUEVE)
96 – 100 puntos 10 (DIEZ)
23 de Julio COLOQUIO
CLASES DE CONSULTA
3
CONTENIDOS
4
¿ Qué es la estadística ?
Métodos estadísticos
5
DATOS VARIABILIDAD
Población X1
X2
.
.
.
Auxilio de la Teoría de
Xi
Probabilidades
. X1
. .
. .
. Muestra
XN
Xn
Tipos de Datos
Unidad experimental:
6
Etapas de la estadística descriptiva:
Recopilación de datos
Organización de la información
1) Variables discretas:
1021325324061211223002340245122
3302132532406121122300234024512102132521224
0132406121122300234024512240213253240612234
0245122002132572406223002340245122102132532
4061212122401122300234024512270213221224015
3240612112230102340245122102132532402122401
6120311223002390245122102132532406121223002
3402451223021325324061218223002340245122021
3253240612230245122121224132530112230023402
451210213200213257240
7
1) Variables discretas:
fi
i xi fi hi Fi Hi hi
n
1 0 5 0.16 5 0.16
2 1 6 0.20 11 0.36 k
3 2 9 0.30 20 0.66 Fk
i
fi
4 3 4 0.13 24 0.80
5 4 3 0.10 27 0.90
Fi
6 5 2 0.06 29 0.96 Hi
n
7 6 1 0.03 30 1.00
Gráficos asociados:
10
30%
9
20%
6
No of obs
17%
5
13%
4
10%
3
7%
2
3%
1
0
0 1 2 3 4 5 6
X (Nro. de alertas diarias en gasoducto)
8
Gráficos asociados:
10
30%
9
20%
6
No of obs
17%
5
13%
4
10%
3
7%
2
3%
1
0
0 1 2 3 4 5 6
X (Nro. alertas darias en gasoducto)
9
Gráficos asociados:
- diagrama de escalera
35
30
[ )(
[ )
25
[ )
20 [ )
No of obs
15
10 [ )
5 [ )
0 )0 1 2 3 4 5 6
X
Gráficos asociados:
- diagrama de escalera
35
100%
30 97%
90%
25 80%
67%
20
No of obs
15
37%
10
17%
5
0
0 1 2 3 4 5 6
X
10
2) Variables continuas:
X: “consumo eléctrico anual por habitante en 46 ciudades”
(en kilos equivalente de petróleo)
i xi fi hi Fi Hi
Gráficos asociados:
14
28%
12
10
20%
17%
8
No of obs
15%
6
11%
4%
2
2% 2%
0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)
11
Gráficos asociados:
- polígono de frecuencias
14
28%
12
10
20%
17%
8
No of obs
15%
6
11%
4%
2
2% 2%
0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)
Gráficos asociados:
- polígono de frecuencias
14
28%
12
10
20%
17%
8
No of obs
15%
6
11%
4%
2
2% 2%
0% 0%
0
37 39 41 43 45 47 49 51 53
X (consumo eléctrico anual por ha en kep)
12
Gráficos asociados:
- diagrama de ojiva
50
100% 100% 100%
98%
45
93%
40
78%
35
30
59%
No of obs
25
20
15 30%
10
13%
5
2%
0%
0
37 39 41 43 45 47 49 51 53 55
X
3) Variables cualitativas:
Rama Egresados
Ciencias Aplicadas 18.943
Ciencias Aplicadas
Ciencias Básicas 2.705 (23,23%)
Ciencias Sociales
Ciencias de la Salud 14.252 (41,90%)
Ciencias Básicas
Ciencias Humanas 11.478 (3,32%)
Ciencias de la Salud
Ciencias Sociales 34.165
(17,48%)
TOTAL 81.543
Ciencias Humanas
(14,08%)
- diagrama de torta
13
- diagrama de Pareto
40.000
35.000 41,90%
30.000
25.000
Egresados (fi)
20.000 23,23%
15.000 17,48%
14,08%
10.000
5.000
3,32%
0
1. Cs. Sociales 3. Cs. de la Salud 5. Cs . Bás icas
2 . Cs . Apl icad as 4. Cs . Hum anas
Rama de estudio
Reducción de la información
posición
dispersión
Estadístico: una función de los datos
simetría
kurtosis
Parámetro población
Estimador muestra
14
Estadísticos de Posición
1. Media aritmética
1 n
1 N
x M(X)
n
xi
N
i=1
xi
i=1
xi . f i m
x i=1
n
i=1
x i . hi
Propiedades de la media
x
i=1
i
-x = 0 M ( a + b x) = a + b M(x)
Media Ponderada
n1 x1 n2 x2
x
n1 n2
15
2. Mediana: es el valor para el cual, cuando todas las observaciones
se ordenan de manera creciente, la mitad de estas es menor que ese
valor y la otra mitad mayor
n 1
Posición de la Me = (principalmente para series simples)
2
Variables discretas:
i xi fi hi Fi Hi
64
1 0 5 0.16 5 0.16 x 2,133
30
2 1 6 0.20 11 0.36
3 2 9 0.30 20 0.66
Me= 2
4 3 4 0.13 24 0.80
5 4 3 0.10 27 0.90
16
Variables continuas:
i xi fi hi Fi Hi
• intervalo modal
Variable continua:
• valor representativo del intervalo
12
10
a
b
8 a b
No of obs (fi)
a
4
ab
2
0
5 10 15 20
X
17
x
Mo
Me
Mo Me x x Me Mo
1
n
n
4. Media geométrica xg Mg(X) xi
i=1
5. Cuartiles y Percentiles:
18
Cuartiles
100%
80%
H=0,75
Percent of obs
60%
H=0,50
40%
H=0,25
20%
0%
36 38 40 42 44 46 48 50 52 54
X
C1 Me C3
Otros Gráficos :
52
50
48
46
44
42
40
Median = 44,15
25%-75%
= (42,5, 46,7)
38 Non-Outlier Range
= (37,4, 51,2)
Outliers
36 Extremes
X
19
Estadísticos de Dispersión
2. Rango intercuartílico: RI = C3 – C1
3. Desvío Medio:
n
x i x
DM i 1
n
4. Variancia:
(x i )2
2 x i 1 poblacional
N
2
n
n xi
xi i 1
n
2
x x
2
i
n muestral
S2 x i 1
i 1
n 1 n 1
Grados de libertad
20
Dado que la suma de las n desviaciones (xi x ) siempre da cero, la
especificación de cualesquiera n - 1 de estas cantidades determina de
manera automática la restante. Por lo tanto, sólo n - 1 de las n
desviaciones (xi x ) están determinadas de manera arbitraria o
independientes.
2
m
m m xi fi
( x i x )2 fi xi 2 fi i 1
n
S2 x i 1
i 1
n 1 n 1
Propiedades de la variancia:
V ( a + b x) = b2 V(x)
5. Desvío estándar:
2 s s2
6. Coeficiente de variación:
s
CV CV
x
21
Otros Estadísticos Descriptivos
1. Simetría (Skewness):
N
-Mo (x i )3
Sim Sim i 1
N 3
Simetría muestral:
n
x-Mo n (x i x )3
Sim Sim i 1
s (n 1).(n 2) s3
(x i )4
Kurt i 1
3
N 4
n.(n 1 ) (x i x )4
Kurt i 1
3
(n 1).(n 2).(n 3) s4
22
Análisis descriptivo de una variable
aleatoria clasificada según categorías
TRAT 1 TRAT 2
28 35
26
24 30
22
20 25
18
16 20
No of obs
No of obs
14
12 15
10
8 10
6
4 5
2
0 0
14 15 16 17 18 19 20 21 22 23 24 25 19 20 21 22 23 24 25 26 27 28 29
X X
Descriptive Statistics
Valid N Mean Minimum Maximum Std.Dev. Skewness Kurtosis
Variable
TRAT1 100 19,61 15,71 23,34 1,55 0,04 -0,17
TRAR2 100 23,67 19,83 27,42 1,38 0,21 0,34
Box Plot
28
26
24
22
X
20
18
16
Median
25%-75%
Non-Outlier Range
14 Outliers
1 2 Extremes
TRAT
23
Box Plot
28
26
24
22
X
20
18
16
Median
25%-75%
Non-Outlier Range
14 Outliers
1 2 3 4 Extremes
TRAT
y1 y2 ... yj ... yk X
24
Indiv Altura Peso
1 1,66 67,93
2 1,64 69,45
3 1,6 67,24
4 1,55 64,16
5 1,66 66,69
Var n Media Min Max
6 1,70 71,61
7 1,75 74,14 Altura 100 1,67 1,47 1,86
8 1,69 71,54 Peso 100 70,27 62,09 79,12
9 1,64 70,54
10 1,64 68,95
11 1,68 71,24
12 1,65 67,30
13 1,68 72,22
. . .
100 1,63 67,78
(1,45-1,50]
(1,50-1,55]
(1,55-1,60]
(1,60-1,65]
(1,65-1,70]
(1,70-1,75]
(1,75-1,80]
(1,80-1,85]
(1,85-1,90]
25
80
78
76
74
72
Peso
70
68
66
64
62
60
1,40 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90
Altura
26
Ambas variables cuantitativas: diagrama de dispersión
35 40
30 35
30
25
25
20
20
Y
Y
15
15
10
10
5
5
0 0
0 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 6 7 8 9 10 11 12
X X
35
30
25
20
15
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12
X
COVARIANZA:
n n
n n x y i i
(x i x ).(y i y ) x .y i i i 1
n
i 1
S xy i 1
i 1
n 1 n 1
II I
III IV
x
x
27
Matriz de varianzas-covarianzas:
S X2 S XY S XZ
S= S 2
Y SYZ
SZ2
pxp
CORRELACIÓN:
Sxy
rxy
S X2 .SY2
1 r XY r XZ
1 rYZ
r=
1
pxp
28