Métodos estadísticos tabulares y gráficos

CURSO DE METODOS
ESTADISTICOS
UNIVERSIDAD AUTÓNOMA CHAPINGO

DEPARTAMENTO DE IRRIGACIÓN DR.
MARIO ALBERTO VÁZQUEZ PEÑA
Chapingo México Agosto del 2019

Métodos tabulares y gráficos
para la organización y
presentación de datos
Métodos Estadísticos
Construcción de una tabla de

frecuencias
Minutos empleados en el teléfono

102 124 108 86 103 82 71 104
112 118 87 95 103 116 85 122
87 100 105 97 107 67 78 125
109 99 105 99 101 92 Construir
una tabla de frecuencias con cinco
clases.
Valor máximo
=
Valores clave:
Valor mínimo 67 125
= 3
Distribución de frecuencias
❧Decidir el número de clases (En este cas
usar 5). Calcular el ancho de clase:
(125 - 67) / 5 = 11.6 Redondeando a 12
Determinar los limites de clase. Marcar e
clase respectiva para cada valor.
Limites de Clase Marca f p 67 7830.1 79 9050.16
91
102
80.266
103
114
90.30
115
126
5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
4
3Clase f 67 - 78 79 - 90 591 - 102 8103 -114 911
126 5Es posible utilizar los puntos medios entre los

limites de clases para construir el histograma de
frecuencias
Histograma de frecuencias
Limites
66.5 - 78.5
78.5 - 90.5
90.5 - 102.5
102.5 -114.5
115.5 -126.5
f
Tiempo usado en el teléfono
minutos
5
Clase 67 - 78 79 - 90 91 - 102
103 -114
115 -126
f
3589572.5 72.5 84.5 84.5 96.5 96.5 108.5 108.5 120.5 120.5
Marcar el punto medio en la parte alta de cada barr
Conectar con segementos de línea recta. Extender
polígono al eje horizontal.
Polígono de frecuencia
f
Tiempo empleado en el teléfonominutos
6
Se acostumbra usar la siguiente condición par

evitar
ambigüedades con los limites de clases. Se us
como limite inferior de una clase el limite
superior de la clase anterior y sujeto a ser un
intervalo abierto por la izquierda y cerrado por
derecha. Para la primer clase se deja cerrado
ambos extremos
ya que usualmente se usan como punto de p
para iniciar la construcción del primer interv
valor mínimo del conjunto de datos.
7
Modificación de la tabla Clase

(78,90] 78<X≤90
Limites de Clase Marca f p 67 78]
30.1 (78 90]
50.167
(90
102]
80.266
(102
114]
90.30
(114
126]
5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
8
Información adicional
Punto medio : (límite inferior + límite superior) / 2
Frecuencia relativa: frecuencia de la clase/frequen
total
Frecuencia acumulativa:Número de valores en la
o inferior a ella.
Clase f Frecuencia
PuntoMedio relativa Frecuenc
(67+ 78)/2 67 - 78 72.5 Absoluta fi Acumulativa
relativa pi
33/30 0.10 3 3/30=0.1 78 - 90 584.0 0.17 8 8/30=
90 - 102
896.0
0.27
16 16/30=0.533
102 -114
9108.0
0.30
25 25/30=0.833
114 -126
5
120.0
0.17
30 30/30=1.000 9
Histograma de frecuencia relativa
a vitalera icneucer
F66.5
Tiempo en el télefono
78.5 90.5 102.5 114.5 126.5 .30
.27
.30
.20
.17
.10.100
Tiempo en minutos
Frecuencia relativa en la escala vertical
.17
10
Ojiva o polígono de frecuencia

acumulada
Una ojiva permite obtener aquel número par
cual los valores del conjunto de datos son
menores o iguales al valor, x en un cierto
porcentaje dado por la frecuencia relativa
acumulada.
Minutos en el teléfono30
a icneucer a
F20
vitale
r100 066.5 78.5 90.5 102.5 114.5 126.5 minutos
X=110
30
25
En frecuencia relativa acumulada, le corresponde u

valor de 0.7242
El 72.42% de los datos tienen un valor inferior
minutos
16
8
3
11
Gráfica de tallo y hoja

El valor más bajo es 67 y el más alto es 1
el tallo inicia desde 6 y termina en el valo
102 124 108 86 103 82 Tallo Hoja 6 | 7 | 8
6
2
9 | 10|
23
8 11| 12|
4
12
Gráfica de tallo y hoja
6 |7 7 |1 8 8 |2
5 6 7 7 9 |2 5 7
9 9 10 |0 1 2 3
3455789
11 |2 6 8 12 |2
45
13
Clave: 6 | 7
significa 67
Tallo y hoja con dos líneas

tallo 6 | 7 Clave: 6 | 7 significa 67 7 | 1 7 | 8 1 e
digitos 0 1
8 | 2 2a línea digitos 5 6 7 8 9
8 | 5 6 7 7 9 | 2 9 | 5 7 9 9 10 | 0 1 2 3 3 4 10 | 5 5 7
línea digitos 0 1
11 | 2 2a línea digitos 5 6 7 8 9
11 | 6 8 12 |2 4 12 | 5
14
Gráfica de puntos
Teléfono
66 76 86 96 106 116 126

minutos
15
Gráfica de pastel
❧Usada para describir partes de un tod
Angulos centrales para cada segmento
número total categoria
número en ×360o
The 1995 NASA budget (billions of $)

divided among 3 categories.
billions of $ Human Space Flight 5.7 Technology 5.
Mission Support 2.7
Construir una gráfica de pastel.

16
Gráfica de Pastel
billions of $ Angulo Human Space Flight 5.7 143
Technology 5.9 149 Mission Support 2.7 68
14.3 Total
5.7/14.3*360o = 143o
5.9/14.3*360o = 149o
2.7/14.3*360o = 68o
Human Space Flight Technology Mission Support
17
moviles
Fuente:https://www.
pcactual.com/
noticias/actualidad/
Año 2014
Sistemas Año 2019
operativos
para PC y 18
https://www.areatecnologia.com/ informatica/sist
operativos- moviles.html
Cálculo y Selección de
Medidas Descriptivas
19
Medidas de Tendencia Central

Media: La suma de todos los datos div
por el número de datos
Para una población: Para una muestra:
Σx x=Σx
μ= N n Mediana: El punto en e
cual se tiene igual número de valore
por arriba y por abajo.
Moda: El valor con la más alta
frecuencia
20
Un instructor Para una

registra el muestra
número aleatoria los
promedio de datos son:
ausencias por
sus 2 4 2 0 40 2 4
estudiantes en 3 6 Calcular la
un semetre. media, la
mediana, y la
valor medio es
moda
3, entonces la
Σx Σx= 63
x= n n=9
mediana es 3.
x=63 =7 Media:
9
Moda: La moda
Mediana: es 2 dado que
Ordenados los ocurre con
mayor
datos 0 2223
frecuencia.
21
4 4 6 40 El
Suponiendo que el estudiante con 40 ausen
se elimina de los datos del curso. Calcular la
media, mediana y moda de los restantes va
Compare el efecto en el cambio de cada tip
medida. 2 4 2 0 2 4 3 6
Calcule la media, la mediana, y moda Media
Σx Σx= 23 x=23 =2.875
x= n n =8 8
Mediana: Datos ordenados
0 2 2 2 3 4 4 6 Los valores medios son 2

por lo tanto la mediana es 2.5
Moda:La moda es 2 dado que esta ocrrure c
mayor frecuencia.
22
Formas de distribuciones
Simétrica
Uniforme 1 2 3 4 5 6 7 8 9 10 11 12
Media = mediana
Sesgada a la izquierda Sesgada a la
derecha
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
Media > mediana Media < mediana

23
Media Ponderada ❧La media ponde
es aquella media de un conjunto de
datos, donde cada dato tiene diferentes pes
x̄ = Donde wi es el peso de cada dato
∑n
i=1xi∗ wi
∑n i=1wi
24
Ejemplo del cálculo de la media

ponderada
Supóngase que un maestro de la mate
decide obtener la calificación de su curso d
diferentes pesos a las diferentes evaluac
que realizará a lo largo del semestre, dado
siguiente: 15% primer examen, 50% seg
examen, 15% de tercer examen, 10% de tar
10% de practicas de laboratorio. Par
estudiante Y cuyas calificaciones fueron
siguientes:
Evaluación Tercer examen
Calificación 82 Tareas 100
Primer examen Prácticas 98
25
86 Segundo
examen 96
Cálculo de la media ponderada
Evaluación Calificación Peso (wi) xi*wi Prime

examen 86 0.15 12.9 Segundo examen 96 0
48.0 Tercer examen 82 0.15 12.3 Tareas 10
0.10 10.0 Prácticas 98 0.10 9.8
Σwi=1.0 Σ(xi*wi)=93.0
El valor de la media ponderada es 93.0
26
Estadísticas Descriptivas
Se reportan los precios de dos lotes de pro
al cierre de diez días de ventas consecu
(Viernes de cada semana). Calcular la m
Lote A mediana 56 y moda para cada uno
56 Media = 61.5 Mediana =62 Moda= 67
33 42
Lote B
57 48 58 52 61 57 63 67 63 67 67 77 6
67 90
Media = 61.5 Mediana =62 Moda= 67
27
Medidas de VariaciónRango =
Valor Máximo – Valor Mínimo
Rango para A = 67 - 56 = $11
Rango para B = 90 - 33 = $57
El rango solo utiliza 2 numeros del conjunto de dato
La desviación para cada valor x es la diferen

entre el valor de x y la media del conjunto d
datos. En una población, la desviación para ca
valor de x es: x -
En una muestra,
x− ̄x
28
la desviación para
cada valor de x es:
Desviaciones Lote A Desviación

56-5.5 56 - 61.5 56-5.5 56 - 61.5
μ = 61.5
57 -4.5 57 - 61.5 58 -3.5 58 - 61.5 61 -0.5 63
63 1.5 67 5.5 67 5.5

( x - μ) = 0 67
5.5
La suma de las desviaciones es cero.
29
Varianza x
Poblacional
Varianza Poblacional: La suma de los
cuadrados
de las desviaciones, Lote A
x dividida ( x
) 2 por N. 56 -5.5 30.25 56 -5.5 30.25 57 -
20.25
x
2 ( N ) 2 58 -3.5 12.25 61 -0.5 0.2
1.5 2.25 63 1.5 2.25 67 5.5 30.25 67 5.5 30.
67 5.5 188.50
30.25
2 50.188 10 85.18 Suma de l

cuadrados de las desviaciones
30
Desviación estándar poblacional

Desviación estándar poblacional La r
cuadrada de la varianza poblaciona
σ=√σ 2
σ=√18.85=4.34
La desviación estándar poblacional es $4.34
31
Desviación estándar muestra

Para calcular la varianza muestral, la s
de los cuadrados de las desviaciones
2 Σ(
divide por n-1. s = n−1
x− ̄x )2
La desviación estándar muestral, s se calcu

obtener la raíz cuadrada de la varianzamue
s=√s 2
2 188.50
s=
=20.94
9
s=√20.94=4.58
Calcular las medidas de variación para el lote B
32
Resumen
Rango = Valor Máximo – Valor Mínimo
Varianza Poblacional
σ 2 Σ ( x− μ )2
= N Desv. Estándar
Poblacionalσ= √σ 2
s2 Σ(
Varianza muestral = n−1
x− ̄x )2
Desv. Estándar muestral s= √s2

33
Coeficiente de variación CV (X
s
)= x̄
Donde:
S, es la desviación estándar
̄x ,es la media muestral
34
Características del coeficiente de

variación ❧Puesto que tanto la desvia
estándar como la media se miden en la
unidades originales, el CV es una medi
independiente de las unidades de
medición. Debido a la anterior propie
el CV es la cantidad más adecuada par
comparar la variabilidad de dos conjunt
de datos. En áreas de investigación
donde se tienen datos de experimentos
previos, el CV es muy usado para evalu
la precisión de un experimento,
comparando el CV del experimento en
cuestión con los valores del mismo en
experiencias anteriores.
35
Ejemplo de cálculo del CV Para l

datos de los precios de los dos lotes de prod
al cierre de diez días de ventas, se tiene qu
SA=4.57651 y SB=18.31362, donde la media
la misma =61.5, por lo tanto: CV(Lote
A)=4.57651/61.5*100=7.44%
CV(Lote B)=18.31362/61.5*100=29.77%.
Puede verse claramente a partir d

anterior, que los datos que correspond
lote B tienen una mayor variabilidad qu
que pertenecen al lote A.
36
Regla Empirica: Regla 68- 95

99.7%
Datos con distribución simétrica en forma
campana tienen las siguientes característi
Cerca del 68% de los datos quedan comprendidos
dentro de una desviación estándar con respecto a l
media
Cerca del 99.7% de los datos se encuentra dentro
tres desviaciones estándar.
13.5% 68%
13.5%
2.35% 2.35%
432101234
Cerca del 95% de los datos quedan comprendidos
dentro de dos desviaciones estándar.
37
Usando la regla empirica

El valor medio de un departamento en una cierta ciudad es de
mil pesos con una desviación estándar de $5 mil. Los datos de
de los departamentos tienen una distribución en forma simétric
campana. Estimar el porcentaje de que el costo de un departam
se encuentre entre $120 y $135 mil.
68% 68%
68%
13.5%
105 110 115 120 125 130 135 140 145 $120 es una desv
estándar por abajo de la media y $135 mil se encun
a dos 2 desviaciones estándar 68% con + respecto
13.5% = a 81.5%
la media. Por lo tanto, 81.5% de los departamen
tienen un valor entre $120 y $135 mil pesos .
38
Teorema de Chebyshev Para

proporción cualquier de distribución datos
caen independientemente dentro estándar
>1) con respecto a la media Para k = 3, al

menos 1-1/9 = 8/9= 88.9% de los datos que
comprendidos dentro de 3 desviaciones está
con respecto a la media.
de es k al desviaciones menos de su 1 -
forma, 1/k2.
=6 =3.84
1 2 3 4 5 6 7 8 9 10 11 12
Para k = 2, al menos 1-1/4 = 3/4 o 75% de

datos caen dentro de 2 desviaciones estánd
la media.
39
❧El teorema de Tchebysev perm

inferir la proporción de valores
deben quedar dentro de
cantidad específica
desviaciones estándar respecto
media
40
Teorema de Chebyshev
El tiempo promedio en la carrera de 40
metros para mujeres es de 52.4 segun
con una desviación estándar de 2.2 s,
Aplicar el teorema de Chebyshev para
2.
Marcar en una línea numerada k desviaciones est
con respecto a la media
2 desviaciones estándar=2 * 2.2 = 4.4
45.8 48 50.2 52.4 54.6 56.8 59 Al menos 75% de lo
tiempos empleados para correr los 400 metros por
mujeres caen dentro del intervalo de 48 y 56.8 segu
41
Medidas de tendencia central para datos

agrupados
Media.
Mediana.
Moda.
42
Datos agrupados Para aproximar

media de un conjunto de datos presentados
una distribución de frecuencia, se considera
como si los valores de cada clase ocurrieran
el punto medio de su clase.
x = Punto medio de la clase.
Clase f Punto medio (x)
x*f 67- 78 3
72.5 217. 79- 90 5
84.5 5422. 91- 102

8
96.5 5 103-114 9108.5
722.0
115-126 5
120.5
976.5 30 602.5 n
Media
2991
x
)( fx x 2991 30
99.7 43
Mediana
Para calcular la mediana en una tabl

frecuencias procédase como sigue: A
Localícese la clase de la mediana. Ésta
una clase tal que la frecuencia relativa
acumulada hasta la clase que le preced
la frecuencia relativa acumulada hasta
son respectivamente menor que, y may
igual a 0.5.
44
(b−a)(0.5−c)
Me=a+
(d−c)
❧B) Calcúlese la mediana mediante la anter
ecuación,
donde: a=Límite inferior de la clase de la
mediana. b=Límite superior de la clase de la
mediana. c=Frecuencia relativa acumulada
la clase que precede
a la de la mediana. d=Frecuencia relativa
acumulada de la clase de la mediana.
Ejemplo:
45
Se detecta la clase de la mediana.

Clase 67- 78 2991
f3
frecuencia 3/30=0.1
relativa acum
79- 90 5
8/30=0.267
91- 102
8
16/30=0.53
103-114
9
25/30=0.833
115-126 5
30/30=1.0 30
Clase de la mediana
(102−91)∗ ( 0.5−0.267)
Me= 91+ (0.53−0.267)
=100.745
46
Moda: La mayor
clase con la frecuencia
❧Si es un Si se
valor único tienen dos o
se dice que más valores
la con la misma
distribución frecuencia
de máxima se
frecuencias dice que la
es unimodal. distribución
es bimodal,
trimodal, etc.
47
Aspectos a tener en cuenta al u

las medidas de tendencia centr
Si la distribución no es muy asimétrica, la m
media y
mediana tienen aproximadamente el mismo
valor, por lo que puede reportarse cualquier
la tres. Para distribuciones asimétricas, la
mediana puede ser mejor
medida de tendencia central. Si va a
procederse a hacer estadística inductiva, la
media es indispensable por sus excelentes
propiedades teórica que se verán
posteriormente. Si se trata sólo de describ
conjunto, es conveniente
reportar las tres medidas, ya que cada una
puede indicar más información al investigad
48
Cálculo de varianzas a partir de da

agrupados
Para calcular la varianza en una tab
frecuencias se opera bajo las mis
suposiciones que, en el caso de la m
por lo tanto se tiene:
2 1
s =
∗∑ k
(n−1) i=1
2
(xi− x̄ ) ∗ f i
49
ó también se puede emplear:

2 1
s =
(n−1) [ ∑i=1k
(∑
xi2∗ f i− i=1
k
)
xi f i
50
2n ]
Ejemplo de cálculo
Para aproximar la desviación estándar de los datos
una distribución de frecuencias, Se usa xi = punto m
de la clase.
s=
√
Σ(x− ̄x n−1
)2 ⋅ f
̄x=99.7
Clase f xi ( x− ̄x )2 ( x− ̄x )2∗ f 67- 78 3
72.5 739.84 2219.52 79- 90 5
84.5 231.04 1155.20 91- 102 8
96.5
10.24 81.92 103-114 9
108.5
77.44 696.96 115-126 5 120.5 432.64 2163.2
30 s 6316.8 29 6316.8 217.8207

14.76 51
Aspectos a tener en cuenta al u
las
medidas de dispersión ❧Las tres
medidas de dispersión que se usan en la
práctica son el rango, la desviación estánda
coeficiente de variación. El rango o amplit
se usa por ser muy fácil de calcular. Por est
basada sólo en dos valores, es la medida de
dispersión más sensible a observaciones
extremas. La desviación estándar tiene la
ventajas y desventajas de la media muestra
indispensable en estadística inductiva. Po
independiente de las unidades de medición,
coeficiente de variación es la medida apropi
para comparar la variabilidad de dos conjun
de datos.
52
Cuartiles
3 cuartiles Q1, Q2 and Q3 dividen los datos e
cuatro partes iguales. Q2 es lo mismo que la
mediana. Q1 es la mediana de los datos aba
Q2 Q3 es la mediana de los datos arriba de Q
A corresponden 27 días continuación
año al número seleccionados se

muestran de aspersores de los mane
vendidos datos aletoria que en para

empresa de riego. Encontrar Q1, Q2
Q3...
47 42 23 46 39
28 43 48 51 43 20 45 38 19 17
30 55 44 48 33 35 45
45 37 37 42 27 53
Cuartiles
Los datos ordenados (n = 27) son: 17 19 20

27 28 30 33 35 37 37 38 39 42 42 43 43 44
45 45 46 47 48 48 51 55 . Rango medio (2
+1)/2 = 14. La mediana = Q2 = 42.
Existen 13 valores abajo de la median

Q1 rango = 7. Q1 es 30. Q3 es el rango
contando desde el último valor. Q3 es 4
El rango Intercuartil es Q3 - Q1 = 45 - 3
15
54
Gráfica de cajas y ejes

Se construye a partir del uso de 5 valores claves pa
describir un conjunto de datos. Q1, Q2 y Q3, el valor
mínimo y máximo. Q1Q2 = la mediana Q3Valor
mínimo Valor Máximo

15
25 35 45 55 30 42451755
30 42 45 17 55
Rango Intercuartil
55
Percentiles
Los percentiles dividen los datos en 10
partes iguales. Hay 99 percentiles: P1,
P3...P99 .
P50 = Q2 = la mediana
P25 = Q1 P75 = Q3
El 63o percentil indica aquel valor del

conjunto de datos para el cual se cump
que el 63% de las observaciones o da
son menores o iguales y 37% de los d
son superiores a ese valor.
56
Percentile s
30
30 Para el valor de
25
114.5 se tiene
20
16 que 25 de los 30
10
8
valores se
encuentran por
0
3 0 66.5 78.5 90.5 102.5 114.5 126.5 La abajo, es decir:
distribución 25/30 = 83.33%.
acumulativa Se puede
puede ser usada aproximar que
para encontrar 114 = P83 .
los percentiles. 57
Descripción simultánea de dos conjunt

de datos.
Cuando se estudian dos características, una

pregunta que surge con frecuencia es si exi
alguna relación entre ellas, A continuación s
presentan dos medidas que son útiles para
describir el grado de asociación entre dos
conjuntos de datos. ❧Covarianza
Correlación
58
Definición de covarianza (SXY)

Sean (x1,y1), (x2,y2), ... ,(xn,yn) n pares d
observaciones
de dos características X y Y, y sean
x̄ y ȳ
Sus respectivas medias muestrales
La covarianza entre las dos características s
define como:
1
SXY=
∑ n
(n−1) i=1
(xi− ̄x)( yi− ̄y)

59
Ecuación para calcular la

covarianza de una población de
tamaño N
N
∑ n
σ XY= i=1
(xi−μx)(yi−μ y)
60
Otra expresión equivalente

para SXY
1
S XY=
(n−1) [ ∑i=1n
(∑ n
xi yi− i=1
xi )(∑ i=1n
yi
61
) n ]
Ejemplos de asociación usando
SXY
S XY≈0
.
.. SXY>0 . . .
.Y
Y
X
.
.
.
..
X
S XY <0
..
..
...
. .. .
.
.
.
.
.
. .
....
...
..
62
Ejemplo de cálculo de SXY

y − ȳ )
xi− ̄x yi yi− ̄y (xi− ̄x)( i 56 -5.5 33 -28.5
156.75 56 -5.5 42 -19.5 107.25 57 -4.5
-13.5 60.75 58 -3.5 52 -9.5 33.25 61 -0
57 -4.5 2.25 63 1.5 67 5.5 8.25 63 1.5
5.5 8.25 67 5.5 77 15.5 85.25 67 5.5 8
20.5 112.75 67 5.5 90 28.5 ∑ 156.75
=731.5 SXY=731.5
=81.27
9
63
También se tiene que: ∑i=1n

xi yi=56∗ 33+56∗ 42+...+67∗ 90=38554
∑i=1n
xi=56 +56+...+ 67=615
∑i=1n
1
y i=33+ 42+...+90=615 S XY= (n−1) [ ∑i=1
(∑
xi yi− i=1
n
xi )(∑ i=1n
yi ) n ] 1
= 9 [ 38554−615∗
10 ] =81.27
64
Propiedades de la covarianz
❧A) Cuando los valores de la variable
crecen con
los de la variable Y, la covarianza es
positiva. B) Cuando los valores de la
variable X decrecen al aumentar los de
variable Y, la covarianza es negativa.
Al cálculo comparar las de la covarianz
ecuaciones que sirven SXY y de la
varianza para s2
Xel , se puede observar que la expre
para calcular la varianza se obtie
obtener la covarianza de la misma var
X, es decir se puede ver a la vari
como un caso particular de la covaria
65
Principales desventajas de la
covarianza
La covarianza como medida de

asociación entre dos variables depend
las unidades en que se miden las varia
de interés. No existen valores de
referencia que indiquen el
grado de asociación entre las dos
variables, solo que entre más alejados
cero indica mayor asociación lineal.
66
Definición de correlación (rXY)

❧Sean (x1,y1), (x2,y2), ... ,(xn,yn) n pares de
observaciones
hechas de dos características X y Y, y sean
Sus respectivas medias
̄x y ̄y
S
muestrales y XY La covarianza entre las
características El coeficiente de correlación
simplemente la correlación entre las dos
variables, tiene como expresión:
S
r xy= Sx ∗ S xy
y
67
De manera más explicita se tien

[
∑ n
rXY= i=1
(∑
xi yi− i=1
n
)(∑
xi i=1n
)
yi n ] {[
∑i=1n
∑
xi2− ( i=1
n
[
)
xi ] 2n
∗ ∑
i=1
n
∑
yi2− ( i=1
n
yi
68
)
2n]} 12
Ejemplo de cálculo
S
rxy= Sxy x∗ Sy Para los datos de los
precios de los dos lotes de producto al cierr
diez días de ventas, se tiene que: SA=4.576
SB=18.31362, además SAB =81.27.
81.27
=
=
4.57651∗ 18.31363 0.969
69
Propiedades de la correlaci
❧Es independiente de las medidas
utilizadas en las
variables. Valores positivos del
coeficiente indican que las
variables tienden a crecer (o decrecer)
simultáneamente, y valores negativos
indican que una aumenta cuando la otr
disminuye. Toma valores exclusivam
entre -1 y 1. Entre más cercano se
encuentre el valor de la
correlación a -1 ó +1 más fuerte la
asociación lineal entre las dos variables
valores cercanos a cero indican una po
asociación lineal.
70

Métodos estadísticos tabulares y gráficos

Încărcat de

Informații document

Descriere originală:

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Métodos estadísticos tabulares y gráficos

Încărcat de

Drepturi de autor:

Formate disponibile

CURSO DE METODOS

UNIVERSIDAD AUTÓNOMA CHAPINGO

Chapingo México Agosto del 2019

Construcción de una tabla de

Minutos empleados en el teléfono

3Clase f 67 - 78 79 - 90 591 - 102 8103 -114 911

126 5Es posible utilizar los puntos medios entre los

Se acostumbra usar la siguiente condición par

Modificación de la tabla Clase

(67+ 78)/2 67 - 78 72.5 Absoluta fi Acumulativa

Ojiva o polígono de frecuencia

En frecuencia relativa acumulada, le corresponde u

Gráfica de tallo y hoja

Gráfica de tallo y hoja

Tallo y hoja con dos líneas

66 76 86 96 106 116 126

The 1995 NASA budget (billions of $)

Construir una gráfica de pastel.

Medidas de Tendencia Central

Un instructor Para una

0 2 2 2 3 4 4 6 Los valores medios son 2

Media > mediana Media < mediana

Ejemplo del cálculo de la media

Evaluación Calificación Peso (wi) xi*wi Prime

Rango para A = 67 - 56 = $11

Rango para B = 90 - 33 = $57

El rango solo utiliza 2 numeros del conjunto de dato

La desviación para cada valor x es la diferen

Desviaciones Lote A Desviación

57 -4.5 57 - 61.5 58 -3.5 58 - 61.5 61 -0.5 63

63 1.5 67 5.5 67 5.5

2 50.188 10 85.18 Suma de l

Desviación estándar poblacional

Desviación estándar muestra

La desviación estándar muestral, s se calcu

Desv. Estándar muestral s= √s2

̄x ,es la media muestral

Características del coeficiente de

Ejemplo de cálculo del CV Para l

Puede verse claramente a partir d

Regla Empirica: Regla 68- 95

Usando la regla empirica

Teorema de Chebyshev Para

caen independientemente dentro estándar

>1) con respecto a la media Para k = 3, al

Para k = 2, al menos 1-1/4 = 3/4 o 75% de

❧El teorema de Tchebysev perm

Medidas de tendencia central para datos

Datos agrupados Para aproximar

84.5 5422. 91- 102

96.5 5 103-114 9108.5

Para calcular la mediana en una tabl

Se detecta la clase de la mediana.

Aspectos a tener en cuenta al u

Cálculo de varianzas a partir de da

ó también se puede emplear:

84.5 231.04 1155.20 91- 102 8

30 s 6316.8 29 6316.8 217.8207

A corresponden 27 días continuación

año al número seleccionados se

vendidos datos aletoria que en para

Los datos ordenados (n = 27) son: 17 19 20