Sunteți pe pagina 1din 21

REGRESIÓN LINEAL SIMPLE

El análisis de regresión es una técnica estadística


para modelar e investigar la relación entre dos o
más variables.

y, es la variable dependiente o de respuesta que


se relaciona con x variable independiente o
regresiva.

La relación entre las variables se caracteriza por


medio de un modelo matemático llamado ecuación de
regresión. Hablamos de la regresión de y en
x1,x2,…xk.

Esta relación o modelo matemático se puede


representar con la ecuación de la recta
(Y = Xm+c), como se observa a continuación:
Y= Xb+a
Donde b, representa a la pendiente y a corresponde
al intercepto de la recta con el eje Y.

Con los datos de la variable independiente y la


variable de respuesta se puede realizar un gráfico
que permita presentar la distribución de los datos
entre las medidas bivariantes, empleando una técnica
que se conoce como diagrama de dispersión, la cual
permite visualizar la posible relación entre las dos
variables cuantitativas. Estos diagramas
representan una nube de puntos y cada uno es una
pareja de los valores de cada variable.

Para su construcción en Excel, los datos se


organizan en dos columnas, la variable x, siempre
debe ubicarse al lado izquierdo de la tabla de
datos.

Ejemplo:
La tabla muestra la cosecha de un cereal (Y) y la
cantidad de fertilizante aplicado (X), según el
informe dado por 10 agricultores:

Para su construcción en Excel, los datos se


organizan en dos columnas, la variable x, siempre
debe ubicarse al lado izquierdo de la tabla de
datos.
La técnica de los mínimos cuadrados permite estimar
el modelo o la ecuación de la línea que minimiza la
suma de cuadrados de las desviaciones entre los
datos y la línea.

La técnica de los mínimos cuadrados permite estimar


el modelo o la ecuación de la línea que minimiza la
suma de cuadrados de las desviaciones entre los
datos y la línea.
Para desarrollar la técnica de mínimos cuadrados se
determina:

∑ = 𝒍𝒆𝒂𝒔𝒆 𝒔𝒖𝒎𝒂𝒕𝒐𝒓𝒊𝒂 𝒅𝒆 …

∑ 𝒙 = 𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒅𝒆 𝒙

∑ 𝒚 = 𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒅𝒆 𝒚

∑ 𝒙𝒚 = 𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒅𝒆 𝒙𝒚

∑ 𝒙𝟐 = 𝒗𝒂𝒍𝒐𝒓𝒆𝒔 𝒕𝒐𝒕𝒂𝒍𝒆𝒔 𝒅𝒆 𝒙 𝒂𝒍 𝒄𝒖𝒂𝒅𝒓𝒂𝒅𝒐

Numeramos los datos en la columna adyacente a los


datos de X, en este caso en E:
Se calcula el valor de la pendiente (b) empleando la
siguiente fórmula:

((𝒏 ∗ ∑ 𝒙𝒚) − (∑ 𝒙 ∗ ∑ 𝒚))


𝒃=
(𝒏 ∑ 𝒙𝟐 − 𝒑𝒐𝒕𝒆𝒏𝒄𝒊𝒂(∑ 𝒙 ; 𝟐 ))

El intercepto (a), se calcula a partir de la


pendiente.
(∑ 𝒚 − (𝒃 ∗ ∑ 𝒙))
𝒂=
𝒏

El modelo matemático calculado, se puede representar


de la siguiente forma:

Y=1,35X+6,54
La fuerza de la relación entre las variables se mide
con el coeficiente de correlación de Pearson (r).
𝑪𝑶𝑽(𝑿, 𝒀)
𝒓=
√𝑽𝒂𝒓(𝑿) ∗ 𝑽𝒂𝒓(𝒀)

La fuerza de relación o grado de relación entre las


variables, es el cociente de la covarianza y el
producto de la raíz cuadrada de las varianzas de x
y y, que se representa en la siguiente ecuación:

La covarianza de xy se calcula de la siguiente


forma:
𝟏
[∑ 𝑿𝒀 − (∑ 𝑿𝒊 )(∑ 𝒀𝒊 )]
𝑪𝑶𝑽(𝑿, 𝒀) = 𝒏
𝒏−𝟏

Si su valor absoluto es positivo indica una reacción


directa o lineal positiva.
En cambio, si su valor absoluto es negativo indica
una reacción inversa o lineal negativa.
Se calcula la Varianza de X, con la siguiente
ecuación:
𝟏
∑ 𝒙𝟐 − (∑ 𝒙)𝟐
𝑽𝒂𝒓 (𝑿) = 𝒏
𝒏−𝟏
De la misma forma se calcula la Varianza de y, con
la siguiente ecuación:
𝟏
∑ 𝒚𝟐 − (∑ 𝒚)𝟐
𝑽𝒂𝒓 (𝒀) = 𝒏
𝒏−𝟏
Ahora, se puede calcular el valor de r
(correlación de Pearson):
De acuerdo con las siguientes imágenes se puede
decir que:

Que la correlación o relación entre variables es


positivamente fuerte, o
O la correlación es regular, como lo manifiesta
este autor.

Coeficiente de determinación
Expresa el total de la variación de la variable
dependiente Y, que se explica por la variación de
la variable independiente X.

El coeficiente de determinación (R2), permite


cuantificar la bondad del ajuste de un modelo lineal
o no lineal.
Se calcula a partir de:
𝑺𝒆 = 𝒆𝒓𝒓𝒐𝒓 𝒆𝒔𝒕𝒊𝒎𝒂𝒅𝒐
𝟐
√∑ 𝒚𝟐 − 𝒂 ∑ 𝒚 − 𝒃 ∑ 𝒙𝒚 ((∑ 𝒚 − (𝒂 ∗ ∑ 𝒚) − (𝒃 ∗ ∑ 𝒙𝒚))
𝑺𝒆 = = 𝑹𝑨𝑰𝒁 ( )
𝒏−𝟐 (𝒏 − 𝟐)

𝑺𝒆𝟐 = 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒅𝒆𝒍 𝒆𝒓𝒓𝒐𝒓 𝒆𝒔𝒕𝒊𝒎𝒂𝒅𝒐


𝑺𝟐𝒚 = 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒅𝒆 𝒍𝒂 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒅𝒆𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆 𝒚

𝟐
𝑺𝒆𝟐
𝑹 =𝟏− 𝟐
𝑺𝒚
También se puede calcular de la siguiente forma:

𝑹𝟐 = 𝒓𝟐
El coeficiente de determinación toma valores entre 0 y 1,
cuando su valor es cercano a 1 el modelo es confiable.

Lo calculamos a partir del error estimado (Se):


Para calcular la varianza de y, 𝑺𝟐𝒚 , debo calcular
el promedio de y 𝒚
̅
Procedo a calcular la varianza de y (𝑺𝟐𝒚 ):
Calculo la varianza del error estimado: 𝑺𝒆𝟐
Ahora puedo calcular el coeficiente de
determinación:
Registro el modelo matemático para que cambie con
los datos de la pendiente y la intersección:

Nota: Si deseo emplear este formato con valores


superiores a 10, insertó filas que necesito, entre
los números 2 a 9 (color amarillo), ya que el último
valor o el total-en este caso el 10- está
relacionado con las ecuaciones, procediendo
lógicamente a renumerar.
Para graficar, sombreo X y Y, selecciono en insertar
Dispersión
Agrego el titulo para: Grafico y ejes.

Francisco Cabrera Díaz

S-ar putea să vă placă și