Sunteți pe pagina 1din 71

CURSO DE METODOS

ESTADISTICOS

UNIVERSIDAD AUTÓNOMA CHAPINGO


DEPARTAMENTO DE IRRIGACIÓN DR.
MARIO ALBERTO VÁZQUEZ PEÑA

Chapingo México Agosto del 2019


Métodos tabulares y gráficos
para la organización y
presentación de datos
Métodos Estadísticos

Construcción de una tabla de


frecuencias

Minutos empleados en el teléfono


102 124 108 86 103 82 71 104
112 118 87 95 103 116 85 122
87 100 105 97 107 67 78 125
109 99 105 99 101 92 Construir
una tabla de frecuencias con cinco
clases.
Valor máximo
=
Valores clave:
Valor mínimo 67 125
= 3

Distribución de frecuencias
❧Decidir el número de clases (En este cas
usar 5). Calcular el ancho de clase:
(125 - 67) / 5 = 11.6 Redondeando a 12
Determinar los limites de clase. Marcar e
clase respectiva para cada valor.
Limites de Clase Marca f p 67 7830.1 79 9050.16

91
102

80.266
103
114

90.30
115
126

5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
4

3Clase f 67 - 78 79 - 90 591 - 102 8103 -114 911

126 5Es posible utilizar los puntos medios entre los


limites de clases para construir el histograma de
frecuencias
Histograma de frecuencias
Limites
66.5 - 78.5
78.5 - 90.5
90.5 - 102.5
102.5 -114.5
115.5 -126.5
f
Tiempo usado en el teléfono
minutos
5

Clase 67 - 78 79 - 90 91 - 102
103 -114
115 -126
f
3589572.5 72.5 84.5 84.5 96.5 96.5 108.5 108.5 120.5 120.5
Marcar el punto medio en la parte alta de cada barr
Conectar con segementos de línea recta. Extender
polígono al eje horizontal.

Polígono de frecuencia
f
Tiempo empleado en el teléfonominutos
6

Se acostumbra usar la siguiente condición par


evitar
ambigüedades con los limites de clases. Se us
como limite inferior de una clase el limite
superior de la clase anterior y sujeto a ser un
intervalo abierto por la izquierda y cerrado por
derecha. Para la primer clase se deja cerrado
ambos extremos
ya que usualmente se usan como punto de p
para iniciar la construcción del primer interv
valor mínimo del conjunto de datos.
7

Modificación de la tabla Clase


(78,90] 78<X≤90
Limites de Clase Marca f p 67 78]
30.1 (78 90]

50.167

(90
102]

80.266
(102
114]

90.30
(114
126]

5
0.167 Colocar los limites inferiores primero.
f =30
p =1.0
8

Información adicional
Punto medio : (límite inferior + límite superior) / 2
Frecuencia relativa: frecuencia de la clase/frequen
total
Frecuencia acumulativa:Número de valores en la
o inferior a ella.
Clase f Frecuencia
PuntoMedio relativa Frecuenc

(67+ 78)/2 67 - 78 72.5 Absoluta fi Acumulativa

relativa pi
33/30 0.10 3 3/30=0.1 78 - 90 584.0 0.17 8 8/30=

90 - 102
896.0

0.27
16 16/30=0.533
102 -114

9108.0
0.30
25 25/30=0.833
114 -126

5
120.0
0.17
30 30/30=1.000 9
Histograma de frecuencia relativa
a vitalera icneucer
F66.5
Tiempo en el télefono
78.5 90.5 102.5 114.5 126.5 .30

.27
.30
.20
.17
.10.100

Tiempo en minutos
Frecuencia relativa en la escala vertical
.17
10

Ojiva o polígono de frecuencia


acumulada
Una ojiva permite obtener aquel número par
cual los valores del conjunto de datos son
menores o iguales al valor, x en un cierto
porcentaje dado por la frecuencia relativa
acumulada.
Minutos en el teléfono30
a icneucer a
F20
vitale
r100 066.5 78.5 90.5 102.5 114.5 126.5 minutos

X=110
30
25

En frecuencia relativa acumulada, le corresponde u


valor de 0.7242
El 72.42% de los datos tienen un valor inferior
minutos
16
8
3
11

Gráfica de tallo y hoja


El valor más bajo es 67 y el más alto es 1
el tallo inicia desde 6 y termina en el valo
102 124 108 86 103 82 Tallo Hoja 6 | 7 | 8
6
2
9 | 10|
23
8 11| 12|
4
12

Gráfica de tallo y hoja

6 |7 7 |1 8 8 |2
5 6 7 7 9 |2 5 7
9 9 10 |0 1 2 3
3455789
11 |2 6 8 12 |2
45
13
Clave: 6 | 7
significa 67

Tallo y hoja con dos líneas


tallo 6 | 7 Clave: 6 | 7 significa 67 7 | 1 7 | 8 1 e

digitos 0 1
8 | 2 2a línea digitos 5 6 7 8 9
8 | 5 6 7 7 9 | 2 9 | 5 7 9 9 10 | 0 1 2 3 3 4 10 | 5 5 7
línea digitos 0 1
11 | 2 2a línea digitos 5 6 7 8 9
11 | 6 8 12 |2 4 12 | 5
14

Gráfica de puntos

Teléfono

66 76 86 96 106 116 126


minutos

15

Gráfica de pastel
❧Usada para describir partes de un tod
Angulos centrales para cada segmento
número total categoria
número en ×360o

The 1995 NASA budget (billions of $)


divided among 3 categories.
billions of $ Human Space Flight 5.7 Technology 5.
Mission Support 2.7

Construir una gráfica de pastel.


16

Gráfica de Pastel
billions of $ Angulo Human Space Flight 5.7 143
Technology 5.9 149 Mission Support 2.7 68
14.3 Total
5.7/14.3*360o = 143o
5.9/14.3*360o = 149o
2.7/14.3*360o = 68o
Human Space Flight Technology Mission Support
17
moviles

Fuente:https://www.
pcactual.com/
noticias/actualidad/
Año 2014
Sistemas Año 2019
operativos
para PC y 18

https://www.areatecnologia.com/ informatica/sist
operativos- moviles.html

Cálculo y Selección de
Medidas Descriptivas

19

Medidas de Tendencia Central


Media: La suma de todos los datos div
por el número de datos
Para una población: Para una muestra:
Σx x=Σx
μ= N n Mediana: El punto en e
cual se tiene igual número de valore
por arriba y por abajo.
Moda: El valor con la más alta
frecuencia
20

Un instructor Para una


registra el muestra
número aleatoria los
promedio de datos son:
ausencias por
sus 2 4 2 0 40 2 4
estudiantes en 3 6 Calcular la
un semetre. media, la
mediana, y la
valor medio es
moda
3, entonces la
Σx Σx= 63
x= n n=9
mediana es 3.
x=63 =7 Media:
9
Moda: La moda
Mediana: es 2 dado que
Ordenados los ocurre con
mayor
datos 0 2223
frecuencia.
21
4 4 6 40 El
Suponiendo que el estudiante con 40 ausen
se elimina de los datos del curso. Calcular la
media, mediana y moda de los restantes va
Compare el efecto en el cambio de cada tip
medida. 2 4 2 0 2 4 3 6
Calcule la media, la mediana, y moda Media
Σx Σx= 23 x=23 =2.875
x= n n =8 8
Mediana: Datos ordenados

0 2 2 2 3 4 4 6 Los valores medios son 2


por lo tanto la mediana es 2.5
Moda:La moda es 2 dado que esta ocrrure c
mayor frecuencia.
22

Formas de distribuciones
Simétrica
Uniforme 1 2 3 4 5 6 7 8 9 10 11 12

Media = mediana
Sesgada a la izquierda Sesgada a la
derecha
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12

Media > mediana Media < mediana


23
Media Ponderada ❧La media ponde
es aquella media de un conjunto de
datos, donde cada dato tiene diferentes pes
x̄ = Donde wi es el peso de cada dato
∑n
i=1xi∗ wi

∑n i=1wi
24

Ejemplo del cálculo de la media


ponderada
Supóngase que un maestro de la mate
decide obtener la calificación de su curso d
diferentes pesos a las diferentes evaluac
que realizará a lo largo del semestre, dado
siguiente: 15% primer examen, 50% seg
examen, 15% de tercer examen, 10% de tar
10% de practicas de laboratorio. Par
estudiante Y cuyas calificaciones fueron
siguientes:
Evaluación Tercer examen
Calificación 82 Tareas 100
Primer examen Prácticas 98
25
86 Segundo
examen 96
Cálculo de la media ponderada

Evaluación Calificación Peso (wi) xi*wi Prime


examen 86 0.15 12.9 Segundo examen 96 0
48.0 Tercer examen 82 0.15 12.3 Tareas 10
0.10 10.0 Prácticas 98 0.10 9.8
Σwi=1.0 Σ(xi*wi)=93.0
El valor de la media ponderada es 93.0

26

Estadísticas Descriptivas
Se reportan los precios de dos lotes de pro
al cierre de diez días de ventas consecu
(Viernes de cada semana). Calcular la m
Lote A mediana 56 y moda para cada uno
56 Media = 61.5 Mediana =62 Moda= 67
33 42
Lote B
57 48 58 52 61 57 63 67 63 67 67 77 6
67 90
Media = 61.5 Mediana =62 Moda= 67
27

Medidas de VariaciónRango =
Valor Máximo – Valor Mínimo

Rango para A = 67 - 56 = $11

Rango para B = 90 - 33 = $57

El rango solo utiliza 2 numeros del conjunto de dato

La desviación para cada valor x es la diferen


entre el valor de x y la media del conjunto d
datos. En una población, la desviación para ca
valor de x es: x -

En una muestra,
x− ̄x
28
la desviación para
cada valor de x es:

Desviaciones Lote A Desviación


56-5.5 56 - 61.5 56-5.5 56 - 61.5
μ = 61.5

57 -4.5 57 - 61.5 58 -3.5 58 - 61.5 61 -0.5 63

63 1.5 67 5.5 67 5.5


( x - μ) = 0 67
5.5
La suma de las desviaciones es cero.
29

Varianza x

Poblacional
Varianza Poblacional: La suma de los
cuadrados
de las desviaciones, Lote A
x dividida ( x
) 2 por N. 56 -5.5 30.25 56 -5.5 30.25 57 -
20.25
x
2 ( N ) 2 58 -3.5 12.25 61 -0.5 0.2
1.5 2.25 63 1.5 2.25 67 5.5 30.25 67 5.5 30.
67 5.5 188.50

30.25

2 50.188 10 85.18 Suma de l


cuadrados de las desviaciones
30

Desviación estándar poblacional


Desviación estándar poblacional La r
cuadrada de la varianza poblaciona

σ=√σ 2

σ=√18.85=4.34
La desviación estándar poblacional es $4.34

31

Desviación estándar muestra


Para calcular la varianza muestral, la s
de los cuadrados de las desviaciones
2 Σ(
divide por n-1. s = n−1
x− ̄x )2

La desviación estándar muestral, s se calcu


obtener la raíz cuadrada de la varianzamue

s=√s 2

2 188.50
s=
=20.94
9

s=√20.94=4.58
Calcular las medidas de variación para el lote B
32

Resumen
Rango = Valor Máximo – Valor Mínimo
Varianza Poblacional
σ 2 Σ ( x− μ )2
= N Desv. Estándar

Poblacionalσ= √σ 2
s2 Σ(
Varianza muestral = n−1
x− ̄x )2

Desv. Estándar muestral s= √s2


33

Coeficiente de variación CV (X
s
)= x̄
Donde:

S, es la desviación estándar

̄x ,es la media muestral

34

Características del coeficiente de


variación ❧Puesto que tanto la desvia
estándar como la media se miden en la
unidades originales, el CV es una medi
independiente de las unidades de
medición. Debido a la anterior propie
el CV es la cantidad más adecuada par
comparar la variabilidad de dos conjunt
de datos. En áreas de investigación
donde se tienen datos de experimentos
previos, el CV es muy usado para evalu
la precisión de un experimento,
comparando el CV del experimento en
cuestión con los valores del mismo en
experiencias anteriores.
35

Ejemplo de cálculo del CV Para l


datos de los precios de los dos lotes de prod
al cierre de diez días de ventas, se tiene qu
SA=4.57651 y SB=18.31362, donde la media
la misma =61.5, por lo tanto: CV(Lote
A)=4.57651/61.5*100=7.44%

CV(Lote B)=18.31362/61.5*100=29.77%.

Puede verse claramente a partir d


anterior, que los datos que correspond
lote B tienen una mayor variabilidad qu
que pertenecen al lote A.

36

Regla Empirica: Regla 68- 95


99.7%
Datos con distribución simétrica en forma
campana tienen las siguientes característi
Cerca del 68% de los datos quedan comprendidos
dentro de una desviación estándar con respecto a l
media
Cerca del 99.7% de los datos se encuentra dentro
tres desviaciones estándar.
13.5% 68%
13.5%
2.35% 2.35%
432101234
Cerca del 95% de los datos quedan comprendidos
dentro de dos desviaciones estándar.
37

Usando la regla empirica


El valor medio de un departamento en una cierta ciudad es de
mil pesos con una desviación estándar de $5 mil. Los datos de
de los departamentos tienen una distribución en forma simétric
campana. Estimar el porcentaje de que el costo de un departam
se encuentre entre $120 y $135 mil.
68% 68%
68%
13.5%
105 110 115 120 125 130 135 140 145 $120 es una desv
estándar por abajo de la media y $135 mil se encun
a dos 2 desviaciones estándar 68% con + respecto

13.5% = a 81.5%
la media. Por lo tanto, 81.5% de los departamen
tienen un valor entre $120 y $135 mil pesos .
38

Teorema de Chebyshev Para


proporción cualquier de distribución datos

caen independientemente dentro estándar

>1) con respecto a la media Para k = 3, al


menos 1-1/9 = 8/9= 88.9% de los datos que
comprendidos dentro de 3 desviaciones está
con respecto a la media.
de es k al desviaciones menos de su 1 -

forma, 1/k2.
=6 =3.84
1 2 3 4 5 6 7 8 9 10 11 12

Para k = 2, al menos 1-1/4 = 3/4 o 75% de


datos caen dentro de 2 desviaciones estánd
la media.
39

❧El teorema de Tchebysev perm


inferir la proporción de valores
deben quedar dentro de
cantidad específica
desviaciones estándar respecto
media
40

Teorema de Chebyshev
El tiempo promedio en la carrera de 40
metros para mujeres es de 52.4 segun
con una desviación estándar de 2.2 s,
Aplicar el teorema de Chebyshev para
2.
Marcar en una línea numerada k desviaciones est
con respecto a la media
2 desviaciones estándar=2 * 2.2 = 4.4
45.8 48 50.2 52.4 54.6 56.8 59 Al menos 75% de lo
tiempos empleados para correr los 400 metros por
mujeres caen dentro del intervalo de 48 y 56.8 segu
41

Medidas de tendencia central para datos


agrupados
Media.

Mediana.

Moda.

42

Datos agrupados Para aproximar


media de un conjunto de datos presentados
una distribución de frecuencia, se considera
como si los valores de cada clase ocurrieran
el punto medio de su clase.
x = Punto medio de la clase.
Clase f Punto medio (x)
x*f 67- 78 3
72.5 217. 79- 90 5

84.5 5422. 91- 102


8

96.5 5 103-114 9108.5

722.0
115-126 5
120.5

976.5 30 602.5 n

Media
2991

x
)( fx x 2991 30

99.7 43

Mediana

Para calcular la mediana en una tabl


frecuencias procédase como sigue: A
Localícese la clase de la mediana. Ésta
una clase tal que la frecuencia relativa
acumulada hasta la clase que le preced
la frecuencia relativa acumulada hasta
son respectivamente menor que, y may
igual a 0.5.
44

(b−a)(0.5−c)
Me=a+
(d−c)
❧B) Calcúlese la mediana mediante la anter
ecuación,
donde: a=Límite inferior de la clase de la
mediana. b=Límite superior de la clase de la
mediana. c=Frecuencia relativa acumulada
la clase que precede
a la de la mediana. d=Frecuencia relativa
acumulada de la clase de la mediana.
Ejemplo:
45

Se detecta la clase de la mediana.


Clase 67- 78 2991
f3
frecuencia 3/30=0.1
relativa acum
79- 90 5
8/30=0.267

91- 102
8
16/30=0.53
103-114
9
25/30=0.833
115-126 5
30/30=1.0 30
Clase de la mediana
(102−91)∗ ( 0.5−0.267)
Me= 91+ (0.53−0.267)
=100.745
46

Moda: La mayor
clase con la frecuencia
❧Si es un Si se
valor único tienen dos o
se dice que más valores
la con la misma
distribución frecuencia
de máxima se
frecuencias dice que la
es unimodal. distribución
es bimodal,
trimodal, etc.
47

Aspectos a tener en cuenta al u


las medidas de tendencia centr
Si la distribución no es muy asimétrica, la m
media y
mediana tienen aproximadamente el mismo
valor, por lo que puede reportarse cualquier
la tres. Para distribuciones asimétricas, la
mediana puede ser mejor
medida de tendencia central. Si va a
procederse a hacer estadística inductiva, la
media es indispensable por sus excelentes
propiedades teórica que se verán
posteriormente. Si se trata sólo de describ
conjunto, es conveniente
reportar las tres medidas, ya que cada una
puede indicar más información al investigad
48

Cálculo de varianzas a partir de da


agrupados
Para calcular la varianza en una tab
frecuencias se opera bajo las mis
suposiciones que, en el caso de la m
por lo tanto se tiene:

2 1
s =

∗∑ k
(n−1) i=1

2
(xi− x̄ ) ∗ f i
49

ó también se puede emplear:


2 1
s =
(n−1) [ ∑i=1k

(∑
xi2∗ f i− i=1
k

)
xi f i

50
2n ]
Ejemplo de cálculo
Para aproximar la desviación estándar de los datos
una distribución de frecuencias, Se usa xi = punto m

de la clase.
s=

Σ(x− ̄x n−1
)2 ⋅ f
̄x=99.7
Clase f xi ( x− ̄x )2 ( x− ̄x )2∗ f 67- 78 3
72.5 739.84 2219.52 79- 90 5

84.5 231.04 1155.20 91- 102 8

96.5
10.24 81.92 103-114 9
108.5
77.44 696.96 115-126 5 120.5 432.64 2163.2

30 s 6316.8 29 6316.8 217.8207


14.76 51
Aspectos a tener en cuenta al u
las
medidas de dispersión ❧Las tres
medidas de dispersión que se usan en la
práctica son el rango, la desviación estánda
coeficiente de variación. El rango o amplit
se usa por ser muy fácil de calcular. Por est
basada sólo en dos valores, es la medida de
dispersión más sensible a observaciones
extremas. La desviación estándar tiene la
ventajas y desventajas de la media muestra
indispensable en estadística inductiva. Po
independiente de las unidades de medición,
coeficiente de variación es la medida apropi
para comparar la variabilidad de dos conjun
de datos.
52

Cuartiles
3 cuartiles Q1, Q2 and Q3 dividen los datos e
cuatro partes iguales. Q2 es lo mismo que la
mediana. Q1 es la mediana de los datos aba
Q2 Q3 es la mediana de los datos arriba de Q

A corresponden 27 días continuación

año al número seleccionados se


muestran de aspersores de los mane

vendidos datos aletoria que en para


empresa de riego. Encontrar Q1, Q2
Q3...
47 42 23 46 39
28 43 48 51 43 20 45 38 19 17
30 55 44 48 33 35 45
45 37 37 42 27 53

Cuartiles

Los datos ordenados (n = 27) son: 17 19 20


27 28 30 33 35 37 37 38 39 42 42 43 43 44
45 45 46 47 48 48 51 55 . Rango medio (2
+1)/2 = 14. La mediana = Q2 = 42.

Existen 13 valores abajo de la median


Q1 rango = 7. Q1 es 30. Q3 es el rango
contando desde el último valor. Q3 es 4
El rango Intercuartil es Q3 - Q1 = 45 - 3
15
54

Gráfica de cajas y ejes


Se construye a partir del uso de 5 valores claves pa
describir un conjunto de datos. Q1, Q2 y Q3, el valor

mínimo y máximo. Q1Q2 = la mediana Q3Valor

mínimo Valor Máximo


15

25 35 45 55 30 42451755
30 42 45 17 55
Rango Intercuartil
55

Percentiles
Los percentiles dividen los datos en 10
partes iguales. Hay 99 percentiles: P1,
P3...P99 .

P50 = Q2 = la mediana

P25 = Q1 P75 = Q3

El 63o percentil indica aquel valor del


conjunto de datos para el cual se cump
que el 63% de las observaciones o da
son menores o iguales y 37% de los d
son superiores a ese valor.
56

Percentile s
30

30 Para el valor de
25
114.5 se tiene
20
16 que 25 de los 30
10
8
valores se
encuentran por
0
3 0 66.5 78.5 90.5 102.5 114.5 126.5 La abajo, es decir:
distribución 25/30 = 83.33%.
acumulativa Se puede
puede ser usada aproximar que
para encontrar 114 = P83 .
los percentiles. 57

Descripción simultánea de dos conjunt


de datos.

Cuando se estudian dos características, una


pregunta que surge con frecuencia es si exi
alguna relación entre ellas, A continuación s
presentan dos medidas que son útiles para
describir el grado de asociación entre dos
conjuntos de datos. ❧Covarianza
Correlación

58

Definición de covarianza (SXY)


Sean (x1,y1), (x2,y2), ... ,(xn,yn) n pares d

observaciones
de dos características X y Y, y sean
x̄ y ȳ
Sus respectivas medias muestrales
La covarianza entre las dos características s
define como:
1
SXY=

∑ n
(n−1) i=1

(xi− ̄x)( yi− ̄y)


59

Ecuación para calcular la


covarianza de una población de
tamaño N
N

∑ n
σ XY= i=1

(xi−μx)(yi−μ y)
60

Otra expresión equivalente


para SXY
1
S XY=

(n−1) [ ∑i=1n
(∑ n
xi yi− i=1

xi )(∑ i=1n

yi

61
) n ]
Ejemplos de asociación usando
SXY
S XY≈0
.

.. SXY>0 . . .
.Y
Y
X
.
.
.
..
X

S XY <0
..
..

...
. .. .
.
.
.
.

.
. .

....
...

..
62

Ejemplo de cálculo de SXY


y − ȳ )
xi− ̄x yi yi− ̄y (xi− ̄x)( i 56 -5.5 33 -28.5
156.75 56 -5.5 42 -19.5 107.25 57 -4.5
-13.5 60.75 58 -3.5 52 -9.5 33.25 61 -0
57 -4.5 2.25 63 1.5 67 5.5 8.25 63 1.5
5.5 8.25 67 5.5 77 15.5 85.25 67 5.5 8
20.5 112.75 67 5.5 90 28.5 ∑ 156.75
=731.5 SXY=731.5
=81.27
9
63

También se tiene que: ∑i=1n


xi yi=56∗ 33+56∗ 42+...+67∗ 90=38554
∑i=1n
xi=56 +56+...+ 67=615
∑i=1n
1
y i=33+ 42+...+90=615 S XY= (n−1) [ ∑i=1

(∑
xi yi− i=1
n

xi )(∑ i=1n
yi ) n ] 1
= 9 [ 38554−615∗

10 ] =81.27
64

Propiedades de la covarianz
❧A) Cuando los valores de la variable
crecen con
los de la variable Y, la covarianza es
positiva. B) Cuando los valores de la
variable X decrecen al aumentar los de
variable Y, la covarianza es negativa.
Al cálculo comparar las de la covarianz
ecuaciones que sirven SXY y de la

varianza para s2
Xel , se puede observar que la expre
para calcular la varianza se obtie
obtener la covarianza de la misma var
X, es decir se puede ver a la vari
como un caso particular de la covaria
65

Principales desventajas de la
covarianza

La covarianza como medida de


asociación entre dos variables depend
las unidades en que se miden las varia
de interés. No existen valores de
referencia que indiquen el
grado de asociación entre las dos
variables, solo que entre más alejados
cero indica mayor asociación lineal.

66

Definición de correlación (rXY)


❧Sean (x1,y1), (x2,y2), ... ,(xn,yn) n pares de

observaciones
hechas de dos características X y Y, y sean
Sus respectivas medias
̄x y ̄y
S
muestrales y XY La covarianza entre las
características El coeficiente de correlación
simplemente la correlación entre las dos
variables, tiene como expresión:
S
r xy= Sx ∗ S xy
y
67

De manera más explicita se tien


[
∑ n
rXY= i=1
(∑
xi yi− i=1
n

)(∑
xi i=1n
)
yi n ] {[
∑i=1n

xi2− ( i=1
n

[
)
xi ] 2n
∗ ∑
i=1
n

yi2− ( i=1
n

yi

68
)
2n]} 12

Ejemplo de cálculo
S
rxy= Sxy x∗ Sy Para los datos de los
precios de los dos lotes de producto al cierr
diez días de ventas, se tiene que: SA=4.576
SB=18.31362, además SAB =81.27.
81.27
=
=
4.57651∗ 18.31363 0.969
69

Propiedades de la correlaci
❧Es independiente de las medidas
utilizadas en las
variables. Valores positivos del
coeficiente indican que las
variables tienden a crecer (o decrecer)
simultáneamente, y valores negativos
indican que una aumenta cuando la otr
disminuye. Toma valores exclusivam
entre -1 y 1. Entre más cercano se
encuentre el valor de la
correlación a -1 ó +1 más fuerte la
asociación lineal entre las dos variables
valores cercanos a cero indican una po
asociación lineal.
70

S-ar putea să vă placă și