Documente Academic
Documente Profesional
Documente Cultură
ÁLGEBRA LINEAL
MÍNIMOS CUADRADOS
Integrantes:
2
1. Problema
Contexto matemático
Llamemos población al conjunto de todos los miembros que verifican unas mismas caracterı́sticas. Por
ejemplo, toda la población de Ecuador, o todos los estudiantes de ingenierı́a de la USFQ. En estadı́stica
descriptiva, se suele tomar un subconjunto de n casos concretos de una población, conocido como
muestra, en vez de toda una población. Si esta muestra es suficientemente representativa de toda la
población, entonces mediante estudios estadı́sticos se podrı́an deducir propiedades para la población en
general, a partir de la muestra particular. Los elementos de la población que pertenecen a la muestra
se conocen como individuos de la muestra.
A menudo es necesario estudiar en una población dada, dos o mas variables simultáneamente como
por ejemplo, en determinada región se estudiarı́a el área de predios rurales y la producción agrı́cola, o
la edad y peso de un grupo de niños, o en un grupo de estudiantes, las horas dedicadas al estudio y las
calificaciones obtenidas en un examen, etc. En nuestro caso concreto, usaremos dos variables. Esto es,
por cada individuo de la muestra se toman datos del tipo (xi , yi ), ∀i = 1, . . . , n, donde cada xi y
yi son los valores de dos variables x y y determinadas. En esta situación, es posible analizar si existe
una relación funcional entre las variables x y y . De darse el caso, decimos que existe una correlación
entre las variables y podemos incluso cuantificar el grado de dicha correlación. Luego tratamos de
encontrar una función que relacione estas variables; esto es lo que se llama regresión. Una regresión
puede ser lineal o no; en clase vimos el caso lineal y en este proyecto veremos dos casos no lineales.
Recordemos el caso lineal. Por ejemplo, supongamos que se toman en cuenta las notas obtenidas en un
examen de fı́sica y en otro de matemáticas de 10 alumnos de ingenierı́a de la USFQ —obviamente, no
es una muestra representativa, pero en fin, sirve para nuestro ejemplo. Entonces, el numero n es diez,
ya que tenemos diez individuos para los que se están tomando datos. La variable x podrı́an ser “nota
obtenida en matemáticas” y y la variable “nota obtenida en fı́sica”. Entonces, la nota del alumno
i.ésimo en matemáticas serı́a xi y la nota en fı́sica será yi .
Supongamos que los datos obtenidos son los siguientes:
3
INDIVIDUO MATE FISICA
1 2 2
2 4 2
3 5 5
4 5 6
5 6 5
6 6 7
7 7 5
8 7 8
9 8 7
10 9 10
Si dibujamos esta nube de datos en un plano coordenado (X, Y ), representando en el plano los
puntos (xi , yi ) para cada individuo, obtenemos que:
Como puede observarse, estos datos tienden a agruparse alrededor de una recta —esto no siempre
ocurre, ¡hemos tenido suerte!. Eso quiere decir que existe una correlación lineal entre estas dos variables.
Esto es, es posible encontrar una ecuación del tipo y
= mx + p (o equivalentemente ax + cy = d)
de tal forma que dicha recta estime el valor que tomará y , a partir de los posibles valores que puede
tomar x. No dará los valores exactos tomados para la muestra estadı́stica, pero permitirá conocer
la nota aproximada que podrá sacar un alumno en fı́sica, si en matemáticas obtuviese una nota de
cualquier valor entre cero y diez. Estas rectas se conocen como rectas de regresión lineal, y
son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión)
generada por una distribución (x, y).
Objetivo
El objetivo de este trabajo es, conociendo los datos (xi , yi ) de n individuos de una muestra cualquiera,
encontrar los valores de los parámetros de la función de regresión lineal y = f (x). Para ello, usaremos
el método de mı́nimos cuadrados. Puede utilizar un programa de cómputo como Matlab, pero debe
4
en su reporte explicar el procedimiento y detallar el código utilizado.
Planteamiento
Este proyecto tiene dos partes. En cada parte se estudiará un tipo diferente de regresión.
Parte 1
y = αx + βx2
a) Grafique la nube de puntos como se hizo en el ejemplo.
d) Encuentre la curva de mı́nimos cuadrados asociada con los datos utilizando el método de ortogo-
nalización de Gramm-Schmidt para encontrar una base ortonormal del espacio de columnas de la
matriz A.
e) Encuentre la curva de mı́nimos cuadrados asociada con los datos sin ortogonalizar la base del
espacio de columnas de la matriz de diseño.
Parte 2
De acuerdo con la segunda ley de Kepler, un cometa deberá tener una órbita elı́ptica, parabólica o
hiperbóica (ignorando las atracciones gravitacionales de los planetas). En convenientes coordenadas
polares, la posición (r, θ) de un cometa satisface una ecuación de la forma:
r = β + e r cos(θ)
donde β es una constante y e es la excentricidad de la órbita, con 0 ≤ e < 1 para una elipse, e = 1
para una parábola, y e > 1 para una hipérbola. Suponga que los siguientes datos corresponden a las
observaciones de un cometa recién descubierto.
5
a) Grafique la nube de puntos como se hizo en el ejemplo.
c) Encuentre la curva de mı́nimos cuadrados asociada con los datos sin ortogonalizar la base del
espacio de columnas de la matriz de diseño.
d) Determine el tipo de la órbita (parábola, elipse o hipérbola) e indique dónde estará¡ el cometa
cuando θ = 4,6 radianes.
2.1. Parte 1
a) Método ortogonalización
1,8 1,5616
2,7 2,7257
b= 3,4 , b= 3,4923
b
3,8 3,8614
3,9 3,8321
0,2384 0,2384 0,2384
−0,0257 −0,0257 −0,0257
b − bb= −0,0923 ⇒ −0,0923 · −0,0923
−0,0614 −0,0614 −0,0614
0,0671 0,0671 0,0671
6
b) Método sin ortogonalizar.
bb = Ax
b
1 1 1,5616
2 4 " # 2,7257
bb=
1,76037
3 9 = 3,4923
−0,198757
4 16 3,8614
5 25 3,8229
0,2384
−0,0257
b − bb= −0,0923 ⇒ ||b − bb||2 = 0,0743
−0,0614
0,0671
Ambos procesos tienen el mismo resultado sin embargo se puede concluir, que el método sin
ortogonalizar es mas sencillo de realizar.
Ecuación matricial :
y =∝ x + βx2
1 1 1,8
2 4
∝ 2,7
3 9
β =
3,4
4 16 3,8
5 25 3,9
c) La matriz aumentada
1 1 | 1,8
2 4
| 2,7
3 9 | 3,4
4 16
| 3,8
5 25 | 3,9
No tiene solución exacta ya que el vector solución no se encuentra dentro del Col de la matriz, en
cambio al hacer el proceso de Gauss se obtiene inconsistencias.
7
1 1 1,8 1 1 1,8 1 1 1,8 1 1 1,8
2 4
2,7
0 2 −0,9
0 2 −0,9
0 1 −0,45
3 9 3,4 ∼ 0 6 −2 ∼ 0 6 −2 ∼ 0 6 −2
4 16
3,8
4 16 3,8
0 12 −3,4
0 12 −3,4
5 25 3,9 5 25 3,9 5 20 −5,1 0 20 −5,1
1 1 1,8
0 1
−0,45
0 0 1 Matriz inconsistente
0 0 2
0 0 3,9
a2 · a1
a2 = a1
a1 · a1
1 1
4 2
9 ·3
45
1
16 4
1 1 11
90
2 2 2 11
25 5
3 ⇒ ab2 =
225 45 135
ab2 =
55 3
= 11 3
=
11
1 1 180
4 4 4 11
2 2
225
5 5 5 11
3·3
4 4
5 5
−34
11
−46
11
36
a2 − ab2 =
11
−4
11
50
11
8
Base ortonormal :
−34 1 −34
1 11 2 11
2 −46 −46
11 11
−4 ⇒ v1 = 3, v2 = −4
4
11 4 11
50 50
5 11 11
5
√
2
Norma v1 = 55
q
7084
Norma v2 = 2
11
Base Ortonormal :
√1 √−34
√255 7084
√−46
55 7084
√−36
3
√
55 7084
√4 √−4
55 7084
√5 √ 50
55 7084
Se encuentra bb.
bb = c1 v1 + c2 v2
bb·v1
c1 = v1 ·v1 v1
√1
9
5 255
27 √
55
10
17 √3
·
5 55
19 4
√
5 55
39 5
10 √
55
c1 = 1 = ( 5√955 + 54
√
10 55
+ 51
√
5 55
+ 76
√
5 55
+ 195
√ )
10 55
= 521
√
10 55
= 7.0252
9
Realizamos el mismo procedimiento para c2 .
9 √−34
5 7084
√−46
27
7084
10 −36
c2 = 17
5·
√
7084 = (− 5√306
7084
− 1242
√
5 7084
− √76
5 7084
+ 1950
√
10 7084
) = − √128
7084
19 √−4
5 7084
39
10 √ 50
7084
√1 √−34
√255 7084
√−46 1,5616
55 7084 2,7257
√ √3 √128 √−36
521
bb = − ⇒ bb = 3,4923 ya trasformado a decimales
10 55 55 7084 7084
√4 √−4 3,8614
55 7084
3,8329
√5 √ 50
55 7084
1 1 | 1,5616 1 1 | 1,56161 1 | 1,5616 1 0 | 1,76035
2 4
| 2,7257 0 2
| −0,5975 0 1
| −0,19875 0
1 | −0,29875
3 9 | 3,4923 ∼ 0 6 | −2,1925 ∼ 0 6 | 0 ∼ 0 0 | 0
4 16
| 3,8614
0 16
| −2,3851
0 12
| −2,3851
0
0 | 0
5 25 | 3,8329 0 20 | −3,9751 0 20 | −3,9751 0 0 | 0
y = 1,76035x − 0,19875x2
∝= 1,76035
β = −0,19875
e) Tenemos lo siguiente
1 1
" # 2 4 " #
1 2 3 4 5 55 225
b = A+~b
A + Ax 3 9 = ⇒ A+ A
1 4 9 16 25
4 16 225 979
5 25
1,8
" # 2,7 " #
1 2 3 4 5 52,1
3,4 =
1 4 9 16 25
3,8 202,5
3,9
10
" # " # " # " #
55 225 | 52,1 1 4,09 | 0,9472 1 4,09 | 0,9472 1 0 | 1,76037
∼ ∼ ∼
225 979 | 202,5 225 979 | 202,5 05 1 | −0,19875 0 1 | −0,19875
∝= 1, 76037
β = −0,1907
y = 1,76037x − 0,19875x2
2.2. Parte 2
a)
b) Variables:e, β
cos(θ) · r r
1.91 3.00
1.04 2.30
0.25 1.65
-0.25 1.25
-0.54 1.01
Matriz diseño:
11
1,91 1
1,04 1
0,25 1
−0,25 1
−0,54 1
Vector observaciones:
3,00
2,30
1,65
1,25
1,01
" #
e
β
Ecuación matricial:
1,91 3,00
1
1,04 1 " # 2,30
e
0,25 1 = 1,65
β
−0,25 1 1,25
−0,54 1 1,01
c) Tenemos lo siguiente.
b = (AT ~b)
(AT Ax
1,91 1
" # 1,04 1 " #
T
1,91 1,04 0,25 −0,25 −0,54 5,15 2,41
A = 0,25 1 =
1 1 1 1 1
−0,25 1
2,41 5
−0,54 1
3,00
" # 2,30 " #
T~
1,91 1,04 0,25 −0,25 −0,54 7,68
(A b) = 1,65 =
1 1 1 1 1
1,25 9,21
1,01
12
" # " #
5,15 2,41 7,68
[x
b] =
2,41 5 9,21
" # " #
5,15 2,41 | 7,68 1 0 | 0,81
⇒
2,41 5 | 9,21 0 1 | 1,45
e = 0,81
β = 1,45
Curva:
r = β + er cos(β)
d) Dado que ”e” se encuentra en el intervalo 0 ≤ e ≤ 1, el tipo de órbita del cometa es una elipse.
En β = 4,6 radianes.
13