Documente Academic
Documente Profesional
Documente Cultură
Grupo 9 – Paralelo 1
Introducción ...................................................................................................................... 1
Problema ........................................................................................................................... 2
Varianza ........................................................................................................................ 7
Solución ............................................................................................................................ 8
Planteamiento ............................................................................................................... 8
Resolución .................................................................................................................... 8
Conclusiones................................................................................................................... 19
Bibliografía ..................................................................................................................... 20
i
MINIMIZACIÓN DEL ERROR
CUADRÁTICO
INTRODUCCIÓN
estudiante debe buscar soluciones pragmáticas y como medio está el emplear modelos
matemáticos. Los cuales requieren un análisis previo de la situación, que como solución
proporcional entre dos variables, es la búsqueda de una solución óptima que permita
a medias; por lo que es necesario recurrir a una relación conocida, fácil de interpretar y
matemáticamente precisa como una recta que se ajuste de la mejor manera a los puntos
que los pares ordenados formados por los datos obtenidos generan en el plano ℝ2 .
1
PROBLEMA
requiere deducir un modelo óptimo que permita explicar de manera lineal los datos 𝑦𝑖 en
𝑛
2
∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏)) (1)
𝑖=1
2
MARCO TEÓRICO
funciones de dos variables, en el cual se requiere obtener un modelo de función lineal que
minimice la sumatoria de los errores cuadráticos, con respecto a los datos y a los valores
que genera la función 𝑓(𝑥) (Larson & Edwards, 2010, pág. 964).
𝑛
2
𝑆 = ∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏))
𝑖=1
Una función de varias variables tiene como dominio algún subconjunto del
derivación de cada función componente con respecto a cada una de las variables
Jacobiana.
DERIVADAS PARCIALES
derivación de cada función componente con respecto a cada una de las variables
3
variables se las pueden definir con respecto a la j-ésima variable en el punto
𝜕𝑓 𝑓(𝑥0 + 𝑡𝑒𝑗 )
(𝑥0 ) = lim
𝜕𝑥𝑗 𝑡→0 𝑡
Esta solución se da si y solo si hay la existencia del límite. También se las puede
considerar como derivación en una variable tomando a las restantes como constantes.
MATRIZ JACOBIANA
cada función componente, con respecto a cada una de las variables involucradas, es decir,
𝜕𝑓
( (𝑥 )) ; 1 ≤ 𝑖 ≤ 𝑚 ; 1 ≤ 𝑗 ≤ 𝑛
𝜕𝑥𝑗 0
𝑖𝑗
𝜕𝑓1 𝜕𝑓1
⋯
𝜕𝑥1 𝜕𝑥𝑛
𝐽𝑓 = ⋮ ⋱ ⋮
𝜕𝑓𝑚 𝜕𝑓𝑚
⋯
[ 𝜕𝑥1 𝜕𝑥𝑛 ]
𝜕𝑘𝑓 𝜕 𝜕𝑘−1 𝑓
Iteradas o Sucesivas con respecto a la variable: 𝜕𝑥𝑗𝑘 = 𝜕𝑥𝑗 (𝜕𝑥𝑗𝑘−1 )
4
𝜕𝑛 𝑓 𝜕 𝜕𝑛−1 𝑓
Mixtas o Cruzadas respecto a cada variable: 𝜕𝑥 = 𝜕𝑥 (𝜕𝑥 )
𝑛 …𝜕𝑥2 𝜕𝑥1 𝑛 𝑛−1 …𝜕𝑥2 𝜕𝑥1
MATRIZ HESSIANA
como el arreglo matricial de las segundas derivadas parciales de una función escalar, tales
derivando cada vez respecto a una variable distinta. La disposición en la matriz de las
derivadas es la siguiente:
𝜕 2𝑓 𝜕 2𝑓
⋯
𝜕𝑥1 2 𝜕𝑥1 𝜕𝑥𝑛
𝐻𝑓 = ⋮ ⋱ ⋮
2 2
𝜕 𝑓 𝜕 𝑓
⋯
[𝜕𝑥𝑛 𝜕𝑥1 𝜕𝑥𝑛 2 ]
valores obtenidos de las primeras derivadas son un máximo, mínimo o un punto de silla.
Los valores propios de una matriz son aquellos números que resuelven la ecuación
dimensión que 𝐴. En esta ecuación λ es la única variable, pero se observará que puede
tomar más de un valor ya que la ecuación es del mismo grado que la dimensión de 𝐴.
5
TEOREMA DE EXTREMOS EN FUNCIONES DE DOS VARIABLES
estacionario de una función de dos variables que puede resultar menos engorrosa que el
Sean:
Entonces:
𝜕2 𝑓
a. Si 𝜕𝑥 2 > 0, es un mínimo.
𝜕2 𝑓
b. Si 𝜕𝑥 2 < 0, es un máximo.
MEDIA ARITMÉTICA
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
6
VARIANZA
Si los datos proporcionados son muy variables, la varianza será relativamente grande.
𝑛
2
1
𝜎𝑛 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛
𝑖=1
Por definición, la varianza toma siempre un valor positivo por tratarse de una
sumatoria de números elevados al cuadrado, con la única excepción de que todos los
valores sean iguales, con lo cual, al no haber variabilidad entre los datos, la varianza sería
igual a cero.
7
SOLUCIÓN
PLANTEAMIENTO
que intervienen en una recta, teniendo en cuenta que los datos 𝑥𝑖 y 𝑦𝑖 son números reales.
𝑛
2
𝑆(𝑚, 𝑏) = ∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏)) (2)
𝑖=1
con la condición de que tanto 𝑚 como 𝑏 generen la recta de mejor ajuste, es decir, que
dos variables, por lo que se procede a encontrar sus puntos críticos a través del cálculo de
RESOLUCIÓN
Luego, por propiedades de las sumatorias, las variables m y b pueden salir, porque,
𝑆=
𝑛 𝑛 𝑛 𝑛 𝑛
(4)
∑ 𝑦𝑖 2 − 2𝑚 ∑ 𝑥𝑖 𝑦𝑖 − 2𝑏 ∑ 𝑦𝑖 + 𝑚2 ∑ 𝑥𝑖 2 + 2𝑚𝑏 ∑ 𝑥𝑖 + 𝑛𝑏 2
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
8
𝑛 𝑛 𝑛
𝜕𝑆
= −2 ∑ 𝑥𝑖 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 2 + 2𝑏 ∑ 𝑥𝑖 (5)
𝜕𝑚
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛
𝜕𝑆
= −2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛 (6)
𝜕𝑏
𝑖=1 𝑖=1
𝐽𝑆 =
𝑛 𝑛 𝑛 𝑛 𝑛
(7)
[−2 ∑ 𝑦𝑖 𝑥𝑖 + 2𝑚 ∑ 𝑥𝑖 2 + 2 ∑ 𝑥𝑖 𝑏 −2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛]
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
Los puntos críticos de la función son aquellos en los cuales todas sus derivadas se
𝑛 𝑛 𝑛
2
−2 ∑ 𝑦𝑖 𝑥𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2 ∑ 𝑥𝑖 𝑏 = 0
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 (8)
−2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛 = 0
{ 𝑖=1 𝑖=1
∑𝑛𝑖=1 𝑦𝑖 𝑥𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖 2
𝑏=
∑𝑛𝑖=1 𝑥𝑖
(9)
∑𝑛𝑖=1 𝑦𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖
𝑏=
{ 𝑛
9
A partir de aquí, se puede obtener la fórmula para m.
Existe un único punto crítico: aquel donde los valores de b y m corresponden a los
las segundas derivadas, volviendo a derivar, para cada variable, las expresiones (5) y (6).
𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 2 (15)
𝜕𝑚2
𝑖=1
𝑛
2
𝜕 𝑆
= 2 ∑ 𝑥𝑖 (16)
𝜕𝑏𝜕𝑚
𝑖=1
𝜕 2𝑆
= 2𝑛 (17)
𝜕𝑏 2 𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 (18)
𝜕𝑚𝜕𝑏
𝑖=1
Con esta información se puede construir la Matriz Hessiana que permitirá conocer,
10
𝑛 𝑛
2 2
𝜕 𝑆 𝜕 𝑆 2 ∑ 𝑥𝑖 2
2 ∑ 𝑥𝑖
2
𝐻𝑆 = 𝜕𝑚2
𝜕𝑚𝜕𝑏 = 𝑖=1
𝑛
𝑖=1
(19)
𝜕 𝑆 𝜕 2𝑆
[𝜕𝑏𝜕𝑚 𝜕𝑏 2 ] 2 ∑ 𝑥𝑖 2𝑛
[ 𝑖=1 ]
en (19).
𝑛 𝑛
2 ∑ 𝑥𝑖 2 2 ∑ 𝑥𝑖 𝑛 𝑛 2
𝑖=1 𝑖=1
det 𝑛 = 4𝑛 ∑ 𝑥𝑖 2 − 4 (∑ 𝑥𝑖 ) (20)
𝑖=1 𝑖=1
2 ∑ 𝑥𝑖 2𝑛
( 𝑖=1 )
Como n es un valor diferente a cero, se puede dividir la expresión para 4𝑛2 .
𝑛 𝑛
1 2
(∑𝑛𝑖=1 𝑥𝑖 )2 1
= (∑ 𝑥𝑖 − 2
) = (∑ 𝑥𝑖 2 − 𝑥̅ 2 ) (21)
𝑛 𝑛 𝑛
𝑖=1 𝑖=1
siempre valores positivos, excepto en el caso de menos interés en el que todos sean
iguales. Como 1/n también es positivo, el producto de ambos números será mayor a cero,
𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 2 > 0 (22)
𝜕𝑚2
𝑖=1
11
La desigualdad (22) es verdadera debido a que la sumatoria en cuestión es de
cuadrados, por lo que su resultado será siempre mayor (o igual) a cero. De esta manera
se comprueba que el punto crítico se trata del mínimo absoluto de la función S, razón por
la cual, las fórmulas que determinan los parámetros de la recta buscada son los hallados
anteriormente.
12
EJEMPLO DE APLICACIÓN
cuales se debe presentar la cantidad suficientes de datos para poder llevar a cabo la
La
encuesta realizada a un total de 69 personas a las cuales se les midió la tensión sistólica y
13
se les pregunto la edad, con la finalidad de establecer una relación entre estas dos
variables. Esta muestra comprende un total de 20 datos; es decir que para este ejercicio
𝑛 = 20.
presentadas en la
14
25 125
29 130
33 140
36 124
39 144
41 158
45 135
48 157
50 144
53 158
56 150
59 140
59 170
62 172
64 162
66 176
68 172
69 175
15
Gráfica 1 Diagrama de dispersión de los datos de edad vs tensión arteriral sistólica
Y
200
180
160
140
Tension sístolica
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 X
Edad
Tension
A continuación, se procede a realizar los cálculos pertinentes para hallar los parámetros
cuadrático posible, para ello primero se calcula los valores de 𝑥𝑦; 𝑥 2 para cada punto 𝑖.
16
8 41 158 6478 1681
9 45 135 6075 2025
10 48 157 7536 2304
11 50 144 7200 2500
12 53 158 8374 2809
13 56 150 8400 3136
14 59 140 8260 3481
15 59 170 10030 3481
16 62 172 10664 3844
17 64 162 10368 4096
18 66 176 11616 4356
19 68 172 11696 4624
20 69 175 12075 4761
Σ 944 2990 145785 49352
Aplicando las formulas halladas mediante la demostración se hace uso de los datos
totales de la
17
15 59 170 10030 3481
16 62 172 10664 3844
17 64 162 10368 4096
18 66 176 11616 4356
19 68 172 11696 4624
20 69 175 12075 4761
Σ 944 2990 145785 49352
(2990)(944) − 20(145785)
𝑚=
(944)2 − 20(49352)
𝑚 = 0.971179512846
∑𝑛𝑖=1 𝑦𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖
𝑏=
𝑛
2990 − 0.971179512846(944)
𝑏=
20
𝑏 = 103.660326994
𝑦 = 0.971179512846𝑥 + 103.660326994
plano.
18
Y
200
180
160
140
Tension sístolica
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90 X
Edad
Gráfica 2 Recta solución sobrepuesta a los puntos de los datos del problema
Haciendo un ejercicio, para comprobar que el modelo sirva para determinar
𝑦 = 103.660326994 + 0.971179512846(30)
𝑦 = 132.79
19
Para expresar la cercanía de los datos reales en general con la recta de mejor ajuste
se suele utilizar el valor de R2, que corresponde a una proporción de "explicado" varianza
20
CONCLUSIONES
puesto que lo que se obtiene es una recta que pasa lo más cerca posible de tales puntos,
Con la ecuación de la recta solución obtenida, es posible predecir, con cierto nivel
podría predecir el valor aproximado de la tensión arterial de una persona con solo tomar
21
BIBLIOGRAFÍA
Grossman, S., & Flores, J. (2012). Álgebra lineal (Séptima ed.). México: McGraw-Hill.
22