El estudiante realiza pruebas de hiptesis para los parmetros de a
ecuacin de regresin lineal
Analiza el comportamiento de los fenmenos explicados por una curva de ajuste.
Realizar inferencia sobre los parmetros de la recta de regresin.
Construir e interpretar intervalos de confianza e intervalos de prediccin para la variable dependiente
Marco Terico La correlacin estadstica constituye una tcnica estadstica que nos indica si dos variables estn relacionadas o no. Por ejemplo, considera que las variables son el ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, estn relacionados en el sentido de que el cambio en cualquier variable estar acompaado por un cambio en la otra variable. De la misma manera, los precios y la demanda de un producto son variables relacionadas; cuando los precios aumentan la demanda tender a disminuir y viceversa. Si el cambio en una variable est acompaado de un cambio en la otra, entonces se dice que las variables estn correlacionadas. Por lo tanto, podemos decir que el ingreso familiar y gastos familiares y el precio y la demanda estn correlacionados. Relacin Entre las Variables La correlacin puede decir algo acerca de la relacin entre las variables. Se utiliza para entender: 1. si la relacin es positiva o negativa 2. la fuerza de la relacin. La correlacin es una herramienta poderosa que brinda piezas vitales de informacin. En el caso del ingreso familiar y el gasto familiar, es fcil ver que ambos suben o bajan juntos en la misma direccin. Esto se denomina correlacin positiva. En caso del precio y la demanda, el cambio se produce en la direccin opuesta, de modo que el aumento de uno est acompaado de un descenso en el otro. Esto se conoce como correlacin negativa. Coeficiente de Correlacin La correlacin estadstica es medida por lo que se denomina coeficiente de correlacin (r). Su valor numrico vara de 1,0 a -1,0. Nos indica la fuerza de la relacin. En general, r> 0 indica una relacin positiva y r <0 indica una relacin negativa, mientras que r = 0 indica que no hay relacin (o que las variables son independientes y no estn relacionadas). Aqu, r = 1,0 describe una correlacin positiva perfecta y r = -1,0 describe una correlacin negativa perfecta. Cuanto ms cerca estn los coeficientes de +1,0 y -1,0, mayor ser la fuerza de la relacin entre las variables. Como norma general, las siguientes directrices sobre la fuerza de la relacin son tiles (aunque muchos expertos podran disentir con la eleccin de los lmites). Valor de r Fuerza de relacin -1,0 A -0,5 o 1,0 a 0,5 Fuerte -0,5 A -0,3 o 0,3 a 0,5 Moderada -0,3 A -0,1 o 0,1 a 0,3 Dbil -0,1 A 0,1 Ninguna o muy dbil La correlacin es solamente apropiada para examinar la relacin entre datos cuantificables significativos (por ejemplo, la presin atmosfrica o la temperatura) en vez de datos categricos, tales como el sexo, el color favorito, etc. Desventajas Si bien 'r' (coeficiente de correlacin) es una herramienta poderosa, debe ser utilizada con cuidado. 1. Los coeficientes de correlacin ms utilizados slo miden una relacin lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relacin no lineal entre las variables, r est cerca de 0 o igual a 0. En tal caso, un diagrama de dispersin puede indicar aproximadamente la existencia o no de una relacin no lineal. 2. Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podra calcular 'r' entre el nmero de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlacin de oportunidad o sin sentido. 3. 'R' no debe ser utilizado para decir algo sobre la relacin entre causa y efecto. Dicho de otra manera, al examinar el valor de 'r' podramos concluir que las variables X e Y estn relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X nfluencia a Y o al revs. La correlacin estadstica no debe ser la herramienta principal para estudiar la causalidad, por el problema con las terceras variables. Procedimiento Y Desarrollo Experimental Coeficiente de correlacin lineal
En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin entre si. Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relacin entre ambas variables: mientras ms alto sea el alumno, mayor ser su peso. El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta). No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado. Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los pares de valores en un grfico y ver que forma describen. El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:
Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamao de la muestra. Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula la raz cuadrada. Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1 Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms. Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1. Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos. Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.) De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este
Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. 1Hallar la ecuacin de la recta de regresin de la edad sobre el peso. 2Cul sera el peso aproximado de un nio de seis aos? Solucin 2Un centro comercial sabe en funcin de la distancia, en kilmetros, a la que se site de un ncleo de poblacin, acuden los clientes, en cientos, que figuran en la tabla: N de clientes (X) 8 7 6 4 2 1 Distancia (Y) 15 19 25 23 34 40 1Calcular el coeficiente de correlacin lineal. 2Si el centro comercial se sita a 2 km, cuntos clientes puede esperar? 3Si desea recibir a 500 clientes, a qu distancia del ncleo de poblacin debe situarse? Solucin 3 Las notas obtenidas por cinco alumnos en Matemticas y Qumica son: Matemticas 6 4 8 5 3. 5 Qumica 6. 5 4. 5 7 5 4 Determinar las rectas de regresin y calcular la nota esperada en Qumica para un alumno que tiene 7.5 en Matemticas. Solucin 4Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlacin r = 0.9, siendo las medias de las distribuciones marginales media de X. = 1, media de = 2. Se sabe que una de las cuatro ecuaciones siguientes corresponde a la recta de regresin de Y sobre X: y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1 Seleccionar razonadamente esta recta.
Solucin 5Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son: Estatura (X) 186 189 190 192 193 193 198 201 203 205 Pesos (Y) 85 85 86 90 87 91 93 103 100 101