Sunteți pe pagina 1din 13

UNIVERSIDAD SAN FRANCISCO DE QUITO

COLEGIO : CIENCIAS E INGENIERÍAS

ÁLGEBRA LINEAL

PROYECTO DE ÁLGEBRA LINEAL

MÍNIMOS CUADRADOS

Integrantes:

Fabian Andrade 00200922

Julián Morgue 00201356

José Zuñiga 00200212

Profesor: Andrea Moreira


Editor: LaTex Texmaker

Quito , Mayo del 2017


Índice
1. Problema 3
2. Solución del problema 6
2.1. Parte 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Parte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2
1. Problema

Usando el problema de mı́nimos cuadrados, encuentra la ecuación de regresiva utilizada en moviliza-


ción matemática.

Contexto matemático

Llamemos población al conjunto de todos los miembros que verifican unas mismas caracterı́sticas. Por
ejemplo, toda la población de Ecuador, o todos los estudiantes de ingenierı́a de la USFQ. En estadı́stica
descriptiva, se suele tomar un subconjunto de n casos concretos de una población, conocido como
muestra, en vez de toda una población. Si esta muestra es suficientemente representativa de toda la
población, entonces mediante estudios estadı́sticos se podrı́an deducir propiedades para la población en
general, a partir de la muestra particular. Los elementos de la población que pertenecen a la muestra
se conocen como individuos de la muestra.
A menudo es necesario estudiar en una población dada, dos o mas variables simultáneamente como
por ejemplo, en determinada región se estudiarı́a el área de predios rurales y la producción agrı́cola, o
la edad y peso de un grupo de niños, o en un grupo de estudiantes, las horas dedicadas al estudio y las
calificaciones obtenidas en un examen, etc. En nuestro caso concreto, usaremos dos variables. Esto es,
por cada individuo de la muestra se toman datos del tipo (xi , yi ), ∀i = 1, . . . , n, donde cada xi y
yi son los valores de dos variables x y y determinadas. En esta situación, es posible analizar si existe
una relación funcional entre las variables x y y . De darse el caso, decimos que existe una correlación
entre las variables y podemos incluso cuantificar el grado de dicha correlación. Luego tratamos de
encontrar una función que relacione estas variables; esto es lo que se llama regresión. Una regresión
puede ser lineal o no; en clase vimos el caso lineal y en este proyecto veremos dos casos no lineales.
Recordemos el caso lineal. Por ejemplo, supongamos que se toman en cuenta las notas obtenidas en un
examen de fı́sica y en otro de matemáticas de 10 alumnos de ingenierı́a de la USFQ —obviamente, no
es una muestra representativa, pero en fin, sirve para nuestro ejemplo. Entonces, el numero n es diez,
ya que tenemos diez individuos para los que se están tomando datos. La variable x podrı́an ser “nota
obtenida en matemáticas” y y la variable “nota obtenida en fı́sica”. Entonces, la nota del alumno
i.ésimo en matemáticas serı́a xi y la nota en fı́sica será yi .
Supongamos que los datos obtenidos son los siguientes:

3
INDIVIDUO MATE FISICA
1 2 2
2 4 2
3 5 5
4 5 6
5 6 5
6 6 7
7 7 5
8 7 8
9 8 7
10 9 10

Si dibujamos esta nube de datos en un plano coordenado (X, Y ), representando en el plano los
puntos (xi , yi ) para cada individuo, obtenemos que:

Como puede observarse, estos datos tienden a agruparse alrededor de una recta —esto no siempre
ocurre, ¡hemos tenido suerte!. Eso quiere decir que existe una correlación lineal entre estas dos variables.
Esto es, es posible encontrar una ecuación del tipo y
= mx + p (o equivalentemente ax + cy = d)
de tal forma que dicha recta estime el valor que tomará y , a partir de los posibles valores que puede
tomar x. No dará los valores exactos tomados para la muestra estadı́stica, pero permitirá conocer
la nota aproximada que podrá sacar un alumno en fı́sica, si en matemáticas obtuviese una nota de
cualquier valor entre cero y diez. Estas rectas se conocen como rectas de regresión lineal, y
son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión)
generada por una distribución (x, y).

Objetivo

El objetivo de este trabajo es, conociendo los datos (xi , yi ) de n individuos de una muestra cualquiera,
encontrar los valores de los parámetros de la función de regresión lineal y = f (x). Para ello, usaremos
el método de mı́nimos cuadrados. Puede utilizar un programa de cómputo como Matlab, pero debe

4
en su reporte explicar el procedimiento y detallar el código utilizado.

Planteamiento

Este proyecto tiene dos partes. En cada parte se estudiará un tipo diferente de regresión.

Parte 1

Supongamos que se estudia el ingreso, y, que resulta de la venta de x unidades de un producto,


cuando la cantidad ofrecida para la venta afecta el precio del producto. Sabemos que en este caso
la relación entre el ingreso y las ventas suele ser cuadrática. Tenemos los siguientes datos {(x, y)} =
{(1, 1,8), (2, 2,7), (3, 3,4), (4, 3,8), (5, 3,9)}. Describa el modelo que produce un ajuste de mı́nimos cuadrados
de esos puntos mediante una función de la forma

y = αx + βx2
a) Grafique la nube de puntos como se hizo en el ejemplo.

b) Determine la matriz de diseño A, el vector de observaciones y el vector de parámetros desconocidos.


Escriba la ecuación matricial correspondiente al problema planteado.

c) Justifique porqué la ecuación matricial no tiene solución exacta.

d) Encuentre la curva de mı́nimos cuadrados asociada con los datos utilizando el método de ortogo-
nalización de Gramm-Schmidt para encontrar una base ortonormal del espacio de columnas de la
matriz A.
e) Encuentre la curva de mı́nimos cuadrados asociada con los datos sin ortogonalizar la base del
espacio de columnas de la matriz de diseño.

f) compare los resultados y concluya.

Parte 2

De acuerdo con la segunda ley de Kepler, un cometa deberá tener una órbita elı́ptica, parabólica o
hiperbóica (ignorando las atracciones gravitacionales de los planetas). En convenientes coordenadas
polares, la posición (r, θ) de un cometa satisface una ecuación de la forma:
r = β + e r cos(θ)
donde β es una constante y e es la excentricidad de la órbita, con 0 ≤ e < 1 para una elipse, e = 1
para una parábola, y e > 1 para una hipérbola. Suponga que los siguientes datos corresponden a las
observaciones de un cometa recién descubierto.

θ .88 1.10 1.42 1.77 2.14


r 3.00 2.30 1.65 1.25 1.01

5
a) Grafique la nube de puntos como se hizo en el ejemplo.

b) Determine la matriz de diseño, el vector de observaciones y el vector de parámetros desconocidos.


Escriba la ecuación matricial correspondiente al problema planteado.

c) Encuentre la curva de mı́nimos cuadrados asociada con los datos sin ortogonalizar la base del
espacio de columnas de la matriz de diseño.

d) Determine el tipo de la órbita (parábola, elipse o hipérbola) e indique dónde estará¡ el cometa
cuando θ = 4,6 radianes.

2. Solución del problema

2.1. Parte 1

a) Método ortogonalización
   
1,8 1,5616
   
 2,7   2,7257 
   
b= 3,4 , b=  3,4923
  b  

   
 3,8   3,8614 
   
3,9 3,8321
     
0,2384 0,2384 0,2384
     
 −0,0257   −0,0257   −0,0257 
     
b − bb= −0,0923  ⇒  −0,0923  ·  −0,0923 
     
     
 −0,0614   −0,0614   −0,0614 
     
0,0671 0,0671 0,0671

||b − bb||2 = 0,0743

6
b) Método sin ortogonalizar.

bb = Ax
b

   
1 1 1,5616
   
 2 4 " #  2,7257 
bb=
  1,76037  
 3 9  =  3,4923 
  
  −0,198757  
 4 16   3,8614 
   
5 25 3,8229
 
0,2384
 
 −0,0257 
 
b − bb= −0,0923  ⇒ ||b − bb||2 = 0,0743
 
 
 −0,0614 
 
0,0671

Ambos procesos tienen el mismo resultado sin embargo se puede concluir, que el método sin
ortogonalizar es mas sencillo de realizar.

Ecuación matricial :

y =∝ x + βx2
   
1 1 1,8

 2 4   
 ∝  2,7 


 3 9 
 β = 
 3,4 

 4 16   3,8 
5 25 3,9

c) La matriz aumentada
 
1 1 | 1,8
 
 2 4
 | 2,7 

 3 9 | 3,4 
 
 
 4 16
 | 3,8 

5 25 | 3,9

No tiene solución exacta ya que el vector solución no se encuentra dentro del Col de la matriz, en
cambio al hacer el proceso de Gauss se obtiene inconsistencias.

7
       
1 1 1,8 1 1 1,8 1 1 1,8 1 1 1,8
       
 2 4
 2,7 
 
 0 2 −0,9 
 
 0 2 −0,9 
 
 0 1 −0,45 

 3 9 3,4  ∼  0 6 −2  ∼  0 6 −2  ∼  0 6 −2 
       
       
 4 16
 3,8 
 
 4 16 3,8 
 
 0 12 −3,4 
 
 0 12 −3,4 
5 25 3,9 5 25 3,9 5 20 −5,1 0 20 −5,1

 
1 1 1,8
 
 0 1
 −0,45 

 0 0 1  Matriz inconsistente
 
 
 0 0 2 
 
0 0 3,9

d) Se ortogonaliza la matriz de diseño.


     
1 1 1 1
     
 2 4   2   4 
     
A= 3 9  ⇒  3  ·  9  = 225 ( no son vectores ortogonales ya que 225 6= 0).
     
     
 4 16   4   16 
     
5 25 5 25

Se calcula la proyeccion del vector a2 sobre a1 usando la formula.

a2 · a1
a2 = a1
a1 · a1
  
 1  1
  
 4  2
  
  
  
 9 ·3
       45 
  
   1
16 4
   1 1 11
   90 
2 2 2  11 
     
  
25 5        
3 ⇒ ab2 =
225   45   135 
ab2 =      
55 3
= 11 3
=
 11 
1 1    180 
    4 4 4  11 
      
2 2
  
225
  
   5 5 5 11
3·3
  
  
4 4
  
  
  
5 5
 −34 
11
 −46 
 11 
36 
a2 − ab2 = 
 11 
 −4 
11
50
11

8
Base ortonormal :

 
 −34  1  −34 
1 11 2 11
2 −46     −46 
11   11 
−4  ⇒ v1 = 3, v2 =  −4 
  
4
11 4 11
50 50
5 11 11
5

2
Norma v1 = 55

q
7084
Norma v2 = 2
11

Base Ortonormal :

 
√1 √−34
 √255 7084
√−46 

 55 7084 
√−36 
 3
√
 55 7084 
 √4 √−4 
 55 7084 
√5 √ 50
55 7084

Se obtiene una base ortonormal para la matriz de disenio del problema.

Se encuentra bb.

bb = c1 v1 + c2 v2

bb·v1
c1 = v1 ·v1 v1
 
 √1
9

 5   255 
 
 27   √ 
   55 
 10  
 17   √3 

 ·
 5   55 

 19   4 
  √ 
 5   55 
39  5 
10 √
55
c1 = 1 = ( 5√955 + 54

10 55
+ 51

5 55
+ 76

5 55
+ 195
√ )
10 55
= 521

10 55
= 7.0252

9
Realizamos el mismo procedimiento para c2 .

 
9 √−34
5 7084
 √−46
 27 

 7084 
 10   −36 
c2 =  17 
5·
√ 
 7084  = (− 5√306
7084
− 1242

5 7084
− √76
5 7084
+ 1950

10 7084
) = − √128
7084
 19   √−4 
5  7084 
39
10 √ 50
7084
   
√1 √−34
 √255 7084
 
  √−46  1,5616
 55   7084  2,7257
√  √3 √128  √−36 
521
   
bb = − ⇒ bb = 3,4923 ya trasformado a decimales
 
10 55  55  7084  7084 
 √4   √−4  3,8614
 55   7084 
3,8329
√5 √ 50
55 7084

b a la matriz original y se resuelve por el metido de Gauss.


Se aumentó b

       
1 1 | 1,5616 1 1 | 1,56161 1 | 1,5616 1 0 | 1,76035
       
2 4
 | 2,7257 0 2
  | −0,5975 0 1
  | −0,19875 0
  1 | −0,29875

3 9 | 3,4923 ∼ 0 6 | −2,1925 ∼ 0 6 | 0  ∼ 0 0 | 0
       

       
4 16
 | 3,8614
 0 16
 | −2,3851
 0 12
 | −2,3851 
 0
 0 | 0 

5 25 | 3,8329 0 20 | −3,9751 0 20 | −3,9751 0 0 | 0

y = 1,76035x − 0,19875x2

∝= 1,76035

β = −0,19875

e) Tenemos lo siguiente

 
1 1
 
" # 2 4  " #
1 2 3 4 5   55 225
b = A+~b
A + Ax 3 9  = ⇒ A+ A

1 4 9 16 25  
4 16 225 979
 
5 25
 
1,8
 
" # 2,7 " #
1 2 3 4 5   52,1
3,4 =
 
1 4 9 16 25  
3,8 202,5
 
3,9

10
" # " # " # " #
55 225 | 52,1 1 4,09 | 0,9472 1 4,09 | 0,9472 1 0 | 1,76037
∼ ∼ ∼
225 979 | 202,5 225 979 | 202,5 05 1 | −0,19875 0 1 | −0,19875

∝= 1, 76037

β = −0,1907

y = 1,76037x − 0,19875x2

f) Se comparó el e2 del método por ortogonalizacion y el método sin ortogonalizar.

2.2. Parte 2

a)

b) Variables:e, β

cos(θ) · r r
1.91 3.00
1.04 2.30
0.25 1.65
-0.25 1.25
-0.54 1.01

Matriz diseño:

11
 
1,91 1
 
 1,04 1
 
 0,25 1
 
 
−0,25 1
 
−0,54 1

Vector observaciones:

 
3,00
 
2,30
 
1,65
 
 
1,25
 
1,01

Vector de parámetros desconocidos:

" #
e
β

Ecuación matricial:

  

1,91 3,00
1
   
 1,04 1 " # 2,30
  e  
 0,25 1 = 1,65
   
  β  
−0,25 1 1,25
   
−0,54 1 1,01

c) Tenemos lo siguiente.

b = (AT ~b)
(AT Ax
 
1,91 1
 
" #  1,04 1 " #
T
1,91 1,04 0,25 −0,25 −0,54   5,15 2,41
A =  0,25 1 =

1 1 1 1 1 
−0,25 1
 2,41 5
 
−0,54 1
 
3,00
 
" # 2,30 " #
T~
1,91 1,04 0,25 −0,25 −0,54    7,68
(A b) = 1,65 =

1 1 1 1 1  
1,25 9,21
 
1,01

12
" # " #
5,15 2,41 7,68
[x
b] =
2,41 5 9,21
" # " #
5,15 2,41 | 7,68 1 0 | 0,81

2,41 5 | 9,21 0 1 | 1,45

e = 0,81

β = 1,45

Curva:

r = β + er cos(β)

r = 1,45 + 0,81r cos(β)

d) Dado que ”e” se encuentra en el intervalo 0 ≤ e ≤ 1, el tipo de órbita del cometa es una elipse.
En β = 4,6 radianes.

r = 1,45 + 0,81r cos(β)


r = 1,45 + 0,81r cos(4,6)
r = 1,45 + (0,81)(0,11)r
r = 1,45 − 0,09r
r + 0,09r = 1,45
1,09r = 1,45
r = 1,33

El cometa en β = 4,6 estará en la posición ( 1.33, 4.6).

13

S-ar putea să vă placă și