Documente Academic
Documente Profesional
Documente Cultură
Podemos decir , por ejemplo, que los gatos por consumo de una familia estn asociados a
su ingreso. Si el consumo aumenta (o disminuye) en la proporcin que el ingreso, podemos
pensar en una relacin causal. Sin embargo, las observaciones muestran que esto no es as
cuando los ingresos regulares aumentan en grandes cantidades: parte se ahorra o invierte.
Entonces, existe algn tipo de asociacin que no es causal.
En otros casos existen asociaciones de otro tipo, causadas indirectamente por terceras
variables. Por ejemplo, podemos observar que, a medida que aumenta el nmero de
televisores por familia, disminuye el nmero de hijos. Esto no quiere decir que la TV sea el
mejor anticonceptivo. Ms bien hay que pensar en que la cantidad de aparatos receptores
de televisin est ligada al ingreso y que, por otras razones, las familias de altos ingresos
tienen menos hijos.
Una asociacin o relacin estadstica, por fuerte y sugerente que sea, jams puede
establecer una asociacin causal. Las ideas de causa y efecto deben salir de otros mbitos
y no de la estadstica. Por ejemplo, la relacin entre la lluvia y el rendimiento de las
cosechas es un caso en el que consideraciones no estadsticas precisan una asimetra de la
situacin: se dice que la lluvia ocasiona una variacin en las cosechas, pero jams se podra
pensar esto al revs, es decir, que un aumento de cosecha implique un aumento de lluvia.
Aun cuando, en el caso anterior, no existan razones estadsticas para descartar la idea de un
efecto en las lluvias causado por las cosechas, el descarte de esta alternativa se basa en otro
tipo de consideraciones.
3.2. Qu asociar?
32
Recin se apunt a una asociacin entre variables. En estos casos se determinan dos a ms
variables en una poblacin o muestra de individuos.
Puede ser interesante, por ejemplo, saber si el contorno del busto entre las mujeres est
asociado a su estatura, si la temperatura influye en el tamao de los objetos o si el tipo de
corteza de cierta especie de rboles est relacionada con la presencia de cierto compuesto
qumico en la madera.
Tambin podemos asociar objetos o individuos. As, por ejemplo, podemos determinar
caractersticas en los seres humanos y agruparlos segn que tan parecidos sean, originando
la clasificacin en razas humanas. En otro caso, puede interesar la distancia que hay entre
islas para saber si estn asociadas, dando origen o no a archipilagos. Al asociar individuos,
el inters se centra en clasificarlos o agruparlos, lo que se hace a travs de estadgrafos
conocidos como coeficientes de similitud o medidas de distancia, tema que no tratar en
estos apuntes.
Al considerar los tipos de asociacin que pueden existir entre variables, tenemos una
primera clasificacin global en las siguientes tres categoras:
Al revs, las caractersticas de color, peso y tamao no son independientes de las razas
caninas, esto es lo que nos permite distinguir un chihuahua de un gran dans.
33
observadores que las miden. Cuando esto se toma en cuenta, la relacin funcional pasa
a ser una relacin estadstica.
Si una categora de sucesos (por ejemplo, peso de las personas entre 70 y 80 kg) ocurre
con cierta proporcin p de los casos, y otra categora (por ejemplo, estatura entre 160 y
170 cm) ocurre con una proporcin q, los dos tipos de evento ocurrirn a la vez en
algunos miembros del grupo de estudio. De hecho, en una proporcin p q , si fueran
independientes.
Consideremos otro ejemplo donde tenemos 200 personas idnticas. A 100 de ellas se
les vacuna contra la influenza (grupo experimental) y a las otras 100 se les administra
un placebo. En una epidemia posterior, ambos grupos quedan igualmente expuestos a la
enfermedad y 20 de los vacunados se contagian, mientras que lo mismo ocurre con 50
de los no vacunados. Siendo imposible atribuir estos resultados al azar, debemos
concluir que el hecho de estar vacunado est asociado a no contraer la enfermedad. Ms
an, se puede pensar que esta asociacin es de tipo casual.
34
relacin existente entre las decenas de productos qumicos obtenidos al destilar
hojas de eucaliptus. Y as, se podra nombrar muchos otros ejemplos.
Dos variables pueden tener relaciones del tipo funcional como las que se muestran en la
siguiente figura:
35
En el caso (a) el dibujo representa una curva, mientras que en (b) se observa una lnea
recta.
Cuando la relacin funcional es una lnea recta, el uso hace que se hable de una relacin
lineal. En los dems casos la relacin puede ser cuadrtica o de otra forma, no lineal.
Para aclara ideas, considere el nmero de empleados y los gastos fijos que se generan en
cuatro empresas muy similares. La informacin obtenida es:
36
A simple vista se puede apreciar en este diagrama que hay una tendencia entre la cantidad
de empleados y los gastos fijos. Las empresas que tienen un bajo nmero de empleados
tienden a tener un bajo gasto fijo. Asimismo, empresas con una gran cantidad de empleados
tienen un gasto fijo alto. Adems, la tendencia general de la nube es la de una lnea recta.
i =1 i i =1 i
El signo indica que tipo de asociacin existe entre las variables X e Y. Si el signo es
positivo la asociacin es directa, esto quiere decir, que si X aumenta, tambin aumenta Y ,o
a la inversa si X disminuye, tambin disminuye Y. Si el signo es negativo la relacin es
inversa, es decir, si X aumenta Y disminuye, o a la inversa si X disminuye, Y aumenta.
37
Si la correlacin, en valor absoluto, es cercana a 1 indica que la relacin funcional entre X e
Y es lineal (Y = a + bX ) . Por otra parte, si es cercana a 0 indica que las variables no estn
correlacionadas.
Hay casos en que las variables en estudio estn extremadamente asociadas, pero como no
es lineal, el coeficiente de correlacin lineal es cercano a 0. Esto se debe a que el
coeficiente de correlacin lineal slo detecta linealidad o relacin lineal entre las variables
en estudio. Por eso es importante realizar en forma previa el diagrama de dispersin y
verificar visualmente la tendencia de los datos.
Suponga que, a lo largo de un cierto perodo de aos, el coeficiente de correlacin entre los
sueldos de los profesores y el consumo de bebidas alcohlicas result ser 0.98. Durante ese
perodo de tiempo hubo una firme subida de los salarios de todo tipoy una tendencia
general ascendente propia de las buenas pocas. En tales condiciones, los sueldos de los
profesores aumentaron tambin. Adems la tendencia ascendente general de los salarios y
del poder adquisitivo se reflej en la compra de bebidas alcohlicas. Por lo tanto, esta
elevada correlacin muestra simplemente el efecto comn a la tendencia ascendente sobre
las dos variables.
38
Los coeficientes de correlacin deben manejarse con cuidado si se quiere que den
informacin sensata en lo que concierne a las relaciones entre pares de variables. El xito
de los coeficientes de correlacin requiere estar familiarizados con el campo de aplicacin,
as como tambin, con sus propiedades matemticas.
En el ejemplo que relaciona los gastos fijos de la empresa (Y) con la cantidad de empleados
(X), el grfico de dispersin muestra una tendencia lineal casi perfecta. Lo que hace
suponer que el gasto fijo de la empresa i se comporta de la siguiente manera, segn la
cantidad que empleados que posee, yi = 0 + 1 xi + i , para i = 1,2,3 y 4. La
siguiente grfica explica mejor lo dicho anteriormente:
donde la lnea recta es 0 + 1 x i , pero como los puntos en la nube de puntos no estn,
generalmente, sobre la lnea recta se introduce el trmino i , que representa todo aquello
que no podemos medir y hace que el valor de yi (en el ejemplo el gasto fijo de la i-sima
empresa) no caiga exactamente sobre la lnea recta.
39
Cuando existe relacin funcional lineal entre las dos variables, en estudio, el modelo
matemtico yi = 0 + 1 xi + i , con i = 1,2, K, n , recibe el nombre de regresin
lineal simple.
Los valores que 0 y de 1 que cumplen con minimizar las distancias de la nube de
puntos a la recta 0 + 1 x i , son 0 y 1 (que reciben el nombre de estimaciones de 0
y de 1 ). Los valores de estas cantidades son 0 = Y 1 X
S xy
y 1 = .
S xx
Una de las dificultades del modelo de regresin lineal, es reconocer cual variable es la
explicatoria y cual la variable dependiente. En el problema de los gastos de fijos y el
nmero de empleados, visto con anterioridad, es claro que el nmero de empleados no
puede ser explicado por los gastos fijos. Esto indica que la variable dependiente es los
gastos fijos, mientras que la variable explicatoria es la cantidad de empleados (ya que a
mayor cantidad de empleados mayor es el gasto fijo). As se obtiene que:
110 1890
As X = = 27.5 y Y = = 472.5 , por lo tanto, los estimadores de los parmetros
4 4
del modelo de regresin lineal simple son:
40
S xy 53650 4 27.5 472.5
1 = = = 13.4 0 = Y 1 X = 472.5 13.4 27.5 = 104
S xx 3150 4 * 25.52
Para determinar si el modelo de regresin lineal es adecuado, existe una medida llamada el
2
coeficiente de determinacin o simplemente el R , que se calcula como
R = r (correlacin al cuadrado). Este coeficiente, nos indica cuanto explica el modelo
2 2
Imagine que una compaa de seguros desea determinar el grado de relacin que existe
entre el ingreso semanal familiar (X) y el monto del seguro de vida (Y) del jefe de familia.
Con base en una muestra de 18 familias, se obtuvo la siguiente informacin (en miles de
pesos).
41
Al realizar el diagrama de dispersin se puede concluir que existe una asociacin funcional
lineal entre el monto del seguro y el ingreso semanal familiar.
Seguro de Vida
140
Monto del Seguro (en miles de $)
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80
Ingreso Familiar (en miles de $)
La interpretacin de los coeficientes de regresin estimados son Por cada mil pesos que
aumenta el ingreso familiar, el seguro de vida aumenta en 1.78 pesos aproximadamente, y
que an cuando no exista un ingreso familiar, el monto del seguro de vida es de 2.500
pesos.
42
Imagine que la compaa de seguros est interesada en estimar montos individuales del
seguro de vida para los ingresos semanal de 18, 28, 38, 48 y 58 . Los montos individuales
estimados se muestran en la siguiente tabla:
Ingreso Seguro
18 34,49
28 52,27
38 70,04
48 87,82
58 105,59
1. El gerente de una industria desea determinar si existe una relacin lineal entre el
nmero de unidades Y, armadas por los operadores de una lnea de ensamble, y el lapso
X que transcurre antes de que se presente una falla. Con base en una muestra aleatoria de
operadores de la lnea de ensamble, se observa la siguiente informacin:
2. Un corredor de bienes races estudi la relacin entre X= ingreso anual (en millones de
pesos) de los compradores de residencias e Y= precio de venta de la residencia (en
millones de pesos). Se obtuvieron datos de las solicitudes hipotecarias correspondientes
a 24 profesionales de distintas empresas. El resumen de algunos resultados son:
43
24 24 24
n = 24 x i = 942.5 x 2
i = 39915.5 y i = 2830.6
i =1 i =1 i =1
24 24
y 2
i = 347868.9 x y i i = 116392.8
i =1 i =1
N de Nmero de N de Nmero de
Observacin Observacin
negocios sucursales negocios sucursales
1 92 3 7 306 5
2 116 2 8 378 6
3 124 3 9 415 7
4 210 5 10 502 7
5 216 4 11 615 9
6 267 5 12 703 9
44