Sunteți pe pagina 1din 17

AJUSTE POR MINIMOS CUADRADOS

MÉTODOS NUMÉRICOS

Oscar Tinoco Gómez


El Principio de los “Mínimos Cuadrados”

• La regresión trata de generar la


“ecuación de mejor ajuste” ---
pero ¿qué es lo “mejor”?

• Criterio: minimizar la suma de


las desviaciones cuadradas
de los puntos de datos de la
regresión lineal.
¿Qué tan Buena es la Regresión
(Parte 1) ?

¿Qué tan bien representa nuestros datos originales la ecuación de


regresión?

La proporción (porcentaje) de la varianza en y que es explicada por la


ecuación de regresión es representada por el símbolo R2.

(Suma de los cuadrados de la media de Y)

R 2 = (Suma de los cuadrados de la regresión lineal)


Variabilidad Ajustada - ilustración

R2 Alto- buen ajuste R2 Bajo- poco ajuste


¿Qué tan Buena es la Regresión
(Parte 2) ?

¿Qué tan bien predecirá esta ecuación de regresión los NUEVOS puntos
de datos?

• Recuerde que empleó una muestra de la población de los puntos


de datos potenciales para determinar la ecuación de regresión.
– e.g. un valor cada 15 minutos, 1-2 semanas de operación de
datos

• Una muestra diferente dará una ecuación diferente con diferentes


coeficientes de bi

• Como se muestra en la siguiente diapositiva, la muestra puede


afectar enormemente la ecuación de regresión…
Muestreando variablidad de los
Coeficientes de Regresión- ilustración

Muestra 1:Sample
y = a’x
1: y+ b’++b' e+ 
= a'x Muestra 2:y =ya''x
Sample 2: = +a’’x
b'' + +
 b’’ + e
INTERPOLACIÓN
Se caracteriza por suponer que los datos que
intervienen en el problema son exactos; por lo cual en
la construcción de la función de interpolación se exige
que la misma satisfaga todos y cada uno de los valores
que constituyen los datos

AJUSTE
Supone que los datos ingresados están afectados en
cierto grado de errores debido al modelado, por lo que
no resulta indispensable que la curva de ajuste
correspondiente pase exactamente por los puntos que
representan los datos, sino que, en promedio, la
aproximación sea óptima de acuerdo al criterio de ajuste
MÉTODO DE LOS MÍNIMOS CUADRADOS
Es una técnica de análisis numérico en la que dados un conjunto
de pares ordenados (obtenidos empíricamente) se intenta
encontrar la función que mejor se aproxime a los datos
(«ajuste»).
En su forma más simple intenta minimizar la suma de los
cuadrados de las diferencias ordenadas (residuos) entre los
puntos generados por la función (modelo teórico) y los
correspondientes en los datos.

(σ 𝑥𝑖 2 )(σ 𝑦𝑖)−(σ 𝑥𝑖∗𝑦𝑖)(σ 𝑥𝑖)


Ao =
𝑛 σ 𝑥𝑖 2 −(σ 𝑥𝑖)2
𝒀 = 𝑨𝒐 + 𝑨𝟏 𝑿

𝑛(σ 𝑥𝑖∗𝑦𝑖)−(σ 𝑥𝑖)(σ 𝑦𝑖)


A1 =
𝑛 σ 𝑥𝑖 2 −(σ 𝑥𝑖)2
Regresión Lineal
Se desea ajustar un serie de puntos (xi, yi) a una línea recta dada por:
y = a0 + a1x + e
Donde a0 y a1 son coeficientes que representan la intersección con el eje y la
pendiente, y e es el error, o diferencia, entre el modelo y las observaciones.
e = y – a0 – a1x
Criterio del mejor ajuste

En el método de mínimos cuadrados se desea minimizar la suma de los cuadrados


de los residuos.

S r   e    yi ,medida  yi ,modelo     yi  a0  a1 xi 
n n n
2 2 2
i
i 1 i 1 i 1
Ajuste por mínimos cuadrados
Derivando respecto a a0 y a1.

S r   e    yi ,medida  yi ,modelo     yi  a0  a1 xi 
n n n
2 2 2
i
i 1 i 1 i 1

S r
Obtenemos  2  yi  a0  a1 xi 
a0
S r
 2  yi  a0  a1 xi xi 
a1

Igualando a 0
0   yi   a0   a1 xi
0   yi xi   a0 xi   a1 xi2

Resolviendo para a0 y a1
n xi yi   xi  yi
a1 
n xi2   xi 
2

a0  y  a1 x
Ejemplo
Ajustar con mínimos cuadrados los siguientes datos

X Y

1 0.5

2 2.5

3 2.0

4 4.0

5 3.5

6 6.0

7 5.5
Tarea
Ajustar con mínimos cuadrados los siguientes datos

X Y
0 5
2 6
4 7
6 6
9 9
11 8
12 7
15 10
17 12
19 12
Estadística básica
Promedio: y
y i

St    yi  y 
2
St
Desviación estándar sy 
n 1

   yi  / n
2
S 2
Varianza: s  t
2
sy 
2 y1
n 1
y
n 1

sy
Coeficiente de variación: c.v.  100%
y

y
Estimado normal estándar: t
sy / n
Tarea

Escriba un archivo M para graficar la recta del mejor ajuste utilizando mínimos
cuadrados. Deberá aceptar como parámetros los valores de X y Y. Grafique los
puntos con círculos y la línea de regresión con una recta.
Error en la regresión lineal
n
S r    yi  a0  a1 xi 
2
y
i 1 Medición

La desviación estándar de la línea de


regresión es: yi – a0 – a1x

Sr
Sy/x 
n2 a0 + a1x

La magnitud del error residual antes de la


regresión es:
x

St    yi  y 
2
En ajuste perfecto Sr = 0 y r = r2 = 1.
El coeficiente de determinación es: Si r = r2 = 0, Sr = St, el ajuste no representa
St  S r alguna mejora.
r 
2

St n xi yi   xi  yi 
El coeficiente de correlación es: r  r 
2

n xi2   xi  n yi2   yi 
2 2
Linealización de relaciones no lineales

y y y

x
y  1e 1 x
y  2 x 2
y  3
3  x

x x x

ln y log y 1/y

Pendiente = 3/3
Pendiente = 1
Pendiente = 2 Intersección = 1/3
x log x 1/x
Intersección = ln 1 Intersección = log 2

S-ar putea să vă placă și