Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICOS
Distribución de frecuencias
❧Decidir el número de clases (En este cas
usar 5). Calcular el ancho de clase:
(125 - 67) / 5 = 11.6 Redondeando a 12
Determinar los limites de clase. Marcar e
clase respectiva para cada valor.
Limites de Clase Marca f p 67 7830.1 79 9050.16
91
102
80.266
103
114
90.30
115
126
5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
4
Clase 67 - 78 79 - 90 91 - 102
103 -114
115 -126
f
3589572.5 72.5 84.5 84.5 96.5 96.5 108.5 108.5 120.5 120.5
Marcar el punto medio en la parte alta de cada barr
Conectar con segementos de línea recta. Extender
polígono al eje horizontal.
Polígono de frecuencia
f
Tiempo empleado en el teléfonominutos
6
50.167
(90
102]
80.266
(102
114]
90.30
(114
126]
5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
8
Información adicional
Punto medio : (límite inferior + límite superior) / 2
Frecuencia relativa: frecuencia de la clase/frequen
total
Frecuencia acumulativa:Número de valores en la
o inferior a ella.
Clase f Frecuencia
PuntoMedio relativa Frecuenc
relativa pi
33/30 0.10 3 3/30=0.1 78 - 90 584.0 0.17 8 8/30=
90 - 102
896.0
0.27
16 16/30=0.533
102 -114
9108.0
0.30
25 25/30=0.833
114 -126
5
120.0
0.17
30 30/30=1.000 9
Histograma de frecuencia relativa
a vitalera icneucer
F66.5
Tiempo en el télefono
78.5 90.5 102.5 114.5 126.5 .30
.27
.30
.20
.17
.10.100
Tiempo en minutos
Frecuencia relativa en la escala vertical
.17
10
X=110
30
25
6 |7 7 |1 8 8 |2
5 6 7 7 9 |2 5 7
9 9 10 |0 1 2 3
3455789
11 |2 6 8 12 |2
45
13
Clave: 6 | 7
significa 67
digitos 0 1
8 | 2 2a línea digitos 5 6 7 8 9
8 | 5 6 7 7 9 | 2 9 | 5 7 9 9 10 | 0 1 2 3 3 4 10 | 5 5 7
línea digitos 0 1
11 | 2 2a línea digitos 5 6 7 8 9
11 | 6 8 12 |2 4 12 | 5
14
Gráfica de puntos
Teléfono
15
Gráfica de pastel
❧Usada para describir partes de un tod
Angulos centrales para cada segmento
número total categoria
número en ×360o
Gráfica de Pastel
billions of $ Angulo Human Space Flight 5.7 143
Technology 5.9 149 Mission Support 2.7 68
14.3 Total
5.7/14.3*360o = 143o
5.9/14.3*360o = 149o
2.7/14.3*360o = 68o
Human Space Flight Technology Mission Support
17
moviles
Fuente:https://www.
pcactual.com/
noticias/actualidad/
Año 2014
Sistemas Año 2019
operativos
para PC y 18
https://www.areatecnologia.com/ informatica/sist
operativos- moviles.html
Cálculo y Selección de
Medidas Descriptivas
19
Formas de distribuciones
Simétrica
Uniforme 1 2 3 4 5 6 7 8 9 10 11 12
Media = mediana
Sesgada a la izquierda Sesgada a la
derecha
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
∑n i=1wi
24
26
Estadísticas Descriptivas
Se reportan los precios de dos lotes de pro
al cierre de diez días de ventas consecu
(Viernes de cada semana). Calcular la m
Lote A mediana 56 y moda para cada uno
56 Media = 61.5 Mediana =62 Moda= 67
33 42
Lote B
57 48 58 52 61 57 63 67 63 67 67 77 6
67 90
Media = 61.5 Mediana =62 Moda= 67
27
Medidas de VariaciónRango =
Valor Máximo – Valor Mínimo
En una muestra,
x− ̄x
28
la desviación para
cada valor de x es:
Varianza x
Poblacional
Varianza Poblacional: La suma de los
cuadrados
de las desviaciones, Lote A
x dividida ( x
) 2 por N. 56 -5.5 30.25 56 -5.5 30.25 57 -
20.25
x
2 ( N ) 2 58 -3.5 12.25 61 -0.5 0.2
1.5 2.25 63 1.5 2.25 67 5.5 30.25 67 5.5 30.
67 5.5 188.50
30.25
σ=√σ 2
σ=√18.85=4.34
La desviación estándar poblacional es $4.34
31
s=√s 2
2 188.50
s=
=20.94
9
s=√20.94=4.58
Calcular las medidas de variación para el lote B
32
Resumen
Rango = Valor Máximo – Valor Mínimo
Varianza Poblacional
σ 2 Σ ( x− μ )2
= N Desv. Estándar
Poblacionalσ= √σ 2
s2 Σ(
Varianza muestral = n−1
x− ̄x )2
Coeficiente de variación CV (X
s
)= x̄
Donde:
S, es la desviación estándar
34
CV(Lote B)=18.31362/61.5*100=29.77%.
36
13.5% = a 81.5%
la media. Por lo tanto, 81.5% de los departamen
tienen un valor entre $120 y $135 mil pesos .
38
forma, 1/k2.
=6 =3.84
1 2 3 4 5 6 7 8 9 10 11 12
Teorema de Chebyshev
El tiempo promedio en la carrera de 40
metros para mujeres es de 52.4 segun
con una desviación estándar de 2.2 s,
Aplicar el teorema de Chebyshev para
2.
Marcar en una línea numerada k desviaciones est
con respecto a la media
2 desviaciones estándar=2 * 2.2 = 4.4
45.8 48 50.2 52.4 54.6 56.8 59 Al menos 75% de lo
tiempos empleados para correr los 400 metros por
mujeres caen dentro del intervalo de 48 y 56.8 segu
41
Mediana.
Moda.
42
722.0
115-126 5
120.5
976.5 30 602.5 n
Media
2991
x
)( fx x 2991 30
99.7 43
Mediana
(b−a)(0.5−c)
Me=a+
(d−c)
❧B) Calcúlese la mediana mediante la anter
ecuación,
donde: a=Límite inferior de la clase de la
mediana. b=Límite superior de la clase de la
mediana. c=Frecuencia relativa acumulada
la clase que precede
a la de la mediana. d=Frecuencia relativa
acumulada de la clase de la mediana.
Ejemplo:
45
91- 102
8
16/30=0.53
103-114
9
25/30=0.833
115-126 5
30/30=1.0 30
Clase de la mediana
(102−91)∗ ( 0.5−0.267)
Me= 91+ (0.53−0.267)
=100.745
46
Moda: La mayor
clase con la frecuencia
❧Si es un Si se
valor único tienen dos o
se dice que más valores
la con la misma
distribución frecuencia
de máxima se
frecuencias dice que la
es unimodal. distribución
es bimodal,
trimodal, etc.
47
2 1
s =
∗∑ k
(n−1) i=1
2
(xi− x̄ ) ∗ f i
49
(∑
xi2∗ f i− i=1
k
)
xi f i
50
2n ]
Ejemplo de cálculo
Para aproximar la desviación estándar de los datos
una distribución de frecuencias, Se usa xi = punto m
de la clase.
s=
√
Σ(x− ̄x n−1
)2 ⋅ f
̄x=99.7
Clase f xi ( x− ̄x )2 ( x− ̄x )2∗ f 67- 78 3
72.5 739.84 2219.52 79- 90 5
96.5
10.24 81.92 103-114 9
108.5
77.44 696.96 115-126 5 120.5 432.64 2163.2
Cuartiles
3 cuartiles Q1, Q2 and Q3 dividen los datos e
cuatro partes iguales. Q2 es lo mismo que la
mediana. Q1 es la mediana de los datos aba
Q2 Q3 es la mediana de los datos arriba de Q
Cuartiles
25 35 45 55 30 42451755
30 42 45 17 55
Rango Intercuartil
55
Percentiles
Los percentiles dividen los datos en 10
partes iguales. Hay 99 percentiles: P1,
P3...P99 .
P50 = Q2 = la mediana
P25 = Q1 P75 = Q3
Percentile s
30
30 Para el valor de
25
114.5 se tiene
20
16 que 25 de los 30
10
8
valores se
encuentran por
0
3 0 66.5 78.5 90.5 102.5 114.5 126.5 La abajo, es decir:
distribución 25/30 = 83.33%.
acumulativa Se puede
puede ser usada aproximar que
para encontrar 114 = P83 .
los percentiles. 57
58
observaciones
de dos características X y Y, y sean
x̄ y ȳ
Sus respectivas medias muestrales
La covarianza entre las dos características s
define como:
1
SXY=
∑ n
(n−1) i=1
∑ n
σ XY= i=1
(xi−μx)(yi−μ y)
60
(n−1) [ ∑i=1n
(∑ n
xi yi− i=1
xi )(∑ i=1n
yi
61
) n ]
Ejemplos de asociación usando
SXY
S XY≈0
.
.. SXY>0 . . .
.Y
Y
X
.
.
.
..
X
S XY <0
..
..
...
. .. .
.
.
.
.
.
. .
....
...
..
62
(∑
xi yi− i=1
n
xi )(∑ i=1n
yi ) n ] 1
= 9 [ 38554−615∗
10 ] =81.27
64
Propiedades de la covarianz
❧A) Cuando los valores de la variable
crecen con
los de la variable Y, la covarianza es
positiva. B) Cuando los valores de la
variable X decrecen al aumentar los de
variable Y, la covarianza es negativa.
Al cálculo comparar las de la covarianz
ecuaciones que sirven SXY y de la
varianza para s2
Xel , se puede observar que la expre
para calcular la varianza se obtie
obtener la covarianza de la misma var
X, es decir se puede ver a la vari
como un caso particular de la covaria
65
Principales desventajas de la
covarianza
66
observaciones
hechas de dos características X y Y, y sean
Sus respectivas medias
̄x y ̄y
S
muestrales y XY La covarianza entre las
características El coeficiente de correlación
simplemente la correlación entre las dos
variables, tiene como expresión:
S
r xy= Sx ∗ S xy
y
67
)(∑
xi i=1n
)
yi n ] {[
∑i=1n
∑
xi2− ( i=1
n
[
)
xi ] 2n
∗ ∑
i=1
n
∑
yi2− ( i=1
n
yi
68
)
2n]} 12
Ejemplo de cálculo
S
rxy= Sxy x∗ Sy Para los datos de los
precios de los dos lotes de producto al cierr
diez días de ventas, se tiene que: SA=4.576
SB=18.31362, además SAB =81.27.
81.27
=
=
4.57651∗ 18.31363 0.969
69
Propiedades de la correlaci
❧Es independiente de las medidas
utilizadas en las
variables. Valores positivos del
coeficiente indican que las
variables tienden a crecer (o decrecer)
simultáneamente, y valores negativos
indican que una aumenta cuando la otr
disminuye. Toma valores exclusivam
entre -1 y 1. Entre más cercano se
encuentre el valor de la
correlación a -1 ó +1 más fuerte la
asociación lineal entre las dos variables
valores cercanos a cero indican una po
asociación lineal.
70