Documente Academic
Documente Profesional
Documente Cultură
𝒀𝒊 = 𝑩𝒐 + 𝑩𝟏 𝑿𝟏 + 𝒆𝟏
Donde:
𝑌𝑖 = es la variable dependiente
𝐵𝑜 = es la ordenada en el origen, o bien es el intercepto
𝐵1= es la pendiente de la recta de regresión
𝑒1 = es el término del error, es decir la diferencia entre los valores predichos por la
regresión y los valores reales
Diagramas de dispersión
Un diagrama de dispersión es una ilustración gráfica que se usa en el análisis de regresión.
El diagrama de dispersión, también llamado nube de puntos, brinda dos tipos de
información, visualmente se pueden determinar los patrones que indican como las
variables están relacionadas (lineal o mediante una curva) y por otro lado si existe una
relación entre ellas visualizando la clase de línea o ecuación de estimación que describe
a dicha relación.
Método de mínimos cuadrados
El método de mínimos cuadrados sirve para determinar la recta que mejor se ajuste a los
datos muestrales. Una línea de regresión calculada a partir de los datos muéstrales, por el
método de mínimos cuadrados se llama línea de regresión estimada o línea de regresión
muestral.
Existen dos medidas para describir la correlación entre dos variables:
coeficiente de determinación
coeficiente de correlación.
Coeficiente de correlación
El coeficiente de correlación es un número que sirve para medir en forma relativa el grado
de asociación lineal entre dos variables (X y Y). El valor del coeficiente de correlación
puede variar entre -1 y 1. Cuando el valor del coeficiente de correlación es negativo, esto
indica una asociación lineal inversa entre X y Y, esto es, cuando X sube Y baja. Los
valores de correlación cercanos a -1 o a 1, indican una fuerte asociación lineal entre X y
Y. Los valores de correlación cercanos a 0 indican falta de asociación lineal entre X y Y.
El coeficiente de determinación muestral
Se representa como r2, y mide exclusivamente la fuerza de una relación lineal entre dos
variables.
La recta de regresión
Un diagrama de dispersión ofrece una idea bastante aproximada sobre el tipo de relación
existente entre dos variables. Además también puede utilizarse como una fórmula de
cuantificar el grado de relación lineal existente entre dos variables: basta con observar el
grado en el que la nube de puntos se ajusta a una línea recta.
Utilizarlo como una forma de cuantificar esa relación tiene un serio inconveniente: la
relación entre dos variables no siempre es perfecta o nula.
El coeficiente de determinación (R2 o r2) se utiliza con frecuencia porque da una mejor
percepción de la recta aunque no indique la dirección de la correlación.
• Una forma de reducir la cantidad de error es incluir más réplicas de los datos.
• Un error común es extrapolar más allá de los puntos de datos utilizados para
construir la curva.
Bibliografía
Little, M., & Hills, F. (1981). Metdos estadísticos para la investigación en la agricultura.
Editorial Trillas, Mexico, D.F. p.268
Discovskiy, L. (2002). Folletos del curso “Estadistica Aplicada para Analisis de
Encuestas en SPSS para Windows”. ADESO. Esteli, Nicaragua.
Gutieerrez, H., & De la Vara, R. (2008). Analisis y Diseño de experimentos. Editorial
MCGraw-Hill Interamericana, Mexico, D.F.