Documente Academic
Documente Profesional
Documente Cultură
1. Introducción
Una función p(x) definida en un intervalo [a, b] aproxima a una función
f (x) en el mismo intervalo si
1
1.1. Tipo de aproximación
En la gran mayoría de aplicaciones prácticas, se trabaja con espacios
de funciones de dimensión finita, y se expresa el aproximante p(x) como
combinación lineal de los términos de una base. De esta forma, una vez elegido
el espacio de funciones y el criterio de aproximación, la determinación del
aproximante p(x) se reduce a la obtención de los coeficientes de combinación
lineal.
Los espacios de funciones más utilizados son los siguientes:
1. Polinomios n
X
p(x) = ai x i (2)
i=0
3. Funciones exponenciales
n
X
p(x) = ai exp(bi x) (4)
i=0
4. Funciones racionales Pn i
i=0 ai x
p(x) = Pm j
(5)
j=0 bj x
2
1.2. Criterios de aproximación
Una vez definido el tipo de aproximación, tres métodos permiten escoger
las constantes que determinan el aproximante.
Interpolación
Una vez fijados n + 1 puntos base {x0 , x1 , . . . , xn }, se exige que
Aproximación mini-max
La idea es parecida a la aproximación por mínimos cuadrados, pero se
trabaja con la norma L∞ (norma del máximo), que se define como
3
en forma continua y como
en forma discreta.
El objetivo es, de nuevo, minimizar la distancia entre la función f (x) y el
aproximante p(x):
Teorema 1. Sea f (x) continua en [a, b]. Para cualquier ε > 0, existe un
entero n que depende de ε, n(ε), tal que
2. Interpolación polinómica
Uno de los métodos de aproximación funcional es la interpolación polinó-
mica. Nótese que el nombre indica tanto el tipo de aproximación (polinomios)
como el criterio de aproximación (interpolación).
4
Estructura de espacio vectorial de los polinomios
Sea Pn el conjunto de los polinomios de grado menor o igual a n. Este
conjunto tiene estructura de espacio vectorial. Esto significa que cualquier
polinomio de Pn puede escribirse como combinación lineal de los elementos
de una base. De hecho, la forma habitual de escribir un polinomio,
n
X
pn (x) = ai x i = a0 + a1 x + a2 x 2 + · · · an x n (14)
i=0
{1, x, x2 , . . . , xn } (15)
5
Desarrollo en serie de Taylor
Una función f (x) suficientemente continua puede aproximarse por un
polinomio p(x) en el entorno de un punto mediante un desarrollo en serie de
Taylor.
Si f (x) es de clase C n+1 (continua y con las n + 1 primeras derivadas
continuas) en el entorno de un punto x0 , puede expresarse como
con
0 (x − x0 )2 00 (x − x0 )n n)
pn (x) = f (x0 ) + (x − x0 )f (x0 ) + f (x0 ) + · · · + f (x0 )
2! n!
(18)
n+1
(x − x0 )
Rn (x) = f n+1) (µ(x)) con µ ∈ [x0 , x] (19)
(n + 1)!
6
Demostración
La demostración es constructiva: además de demostrar que el polinomio
existe y es único, veremos un posible procedimiento para obtenerlo.
Para ello, resulta útil expresar el polinomio pn (x) en la base trivial, ecua-
ción (14):
X n
pn (x) = aj x j
j=0
7
2.3. Interpolación de Lagrange
En la interpolación de Lagrange, el polinomio pn (x) se expresa como
n
X
pn (x) = ai Li (x) (23)
i=0
donde
{L0 (x), L1 (x), L2 (x), . . . , Ln (x)} (24)
es la base de polinomios de Lagrange, que enseguida definiremos.
Al imponer el criterio de interpolación, se obtiene el sistema lineal
L0 (x0 ) L1 (x0 ) · · · Ln (x0 ) a
0
f (x )
0
L0 (x1 ) L1 (x1 ) · · · Ln (x0 )
a1 f (x1 )
= (25)
.. .. .. .. .. ..
. . . . .
.
L0 (xn ) L1 (xn ) · · · Ln (xn ) an f (xn )
8
El resto de Lagrange
La ecuación (19) proporciona el resto de Lagrange para el desarrollo en
serie de Taylor, en el que el polinomio aproximante se obtiene a partir del
valor de la función y sus n primeras derivadas en un mismo punto x0 .
¿Cómo es el resto de Lagrange para la interpolación polinómica a partir
de n + 1 puntos?
Proposición 1. Sea f (x) una función de clase C n+1 y sea pn (x) el polinomio
interpolador puro que verifica pn (xi ) = f (xi ) para i = 0, . . . , n. Sea Rn (x)
el error de pn (x) como aproximante de f (x), f (x) = pn (x) + Rn (x). Dicho
resto de Lagrange Rn (x) puede expresarse como
f n+1) (µ)
Rn (x) = L(x) (29)
(n + 1)!
con
µ ∈ [x0 , x1 , . . . , xn , x] (30)
Yn
L(x) = (x − xi ) = (x − x0 )(x − x1 ) · · · (x − xn ) (31)
i=0
Demostración
Comprobemos en primer lugar que la expresión (29) es válida para los
puntos base de la interpolación xi . Para ello, basta notar que L(xi ) = 0
(L(x) es precisamente un polinomio de grado n + 1 que tiene como ceros
los puntos base xi ) y, en consecuencia, Rn (xi ) = 0, tal como corresponde al
criterio de interpolación, pn (xi ) = f (xi ).
Pasemos ahora al caso no trivial: x = x̂ 6= xi . Empezaremos definiendo
una función auxiliar g(x) como
g(x) = f (x) − pn (x) − KL(x) (32)
Puesto que L(x̂) 6= 0, la constante K puede definirse de tal manera que
la función g(x) se anule en el punto x̂ que estamos considerando:
f (x̂) − pn (x̂)
g(x̂) = 0 ⇔ K = (33)
L(x̂)
De esta forma, podemos asegurar que la función g(x) tiene, como mínimo,
n+2 ceros en el intervalo [x0 , x1 , . . . , xn , x̂] (es decir, el intervalo que contiene
a todos estos puntos): los n + 1 puntos base xi y el punto x̂.
Si aplicamos reiteradamente el teorema de Rolle, podemos asegurar que,
en el intervalo [x0 , x1 , . . . , xn , x̂], la función g 0 (x) tiene, como mínimo, n + 1
ceros; la función g 00 (x), n ceros; . . . ; la función g n+1) (x), un cero µ.
9
Recordando que pn (x) y L(x) son polinomios de grado n y n + 1 respec-
tivamente, la derivada n + 1-ésima de g(x) es
Puesto que g n+1) (µ) = 0, podemos obtener una nueva expresión para K:
f n+1) (µ)
g n+1) (µ) = f n+1) (µ) − K(n + 1)! = 0 ⇒ K = (35)
(n + 1)!
10
3. Aproximación por mínimos cuadrados
3.1. Motivación
En algunas aplicaciones, el criterio de interpolación (polinómica o de otro
tipo) no resultará satisfactorio. Puede ocurrir, por ejemplo, que los datos
f (xi ) sean medidas experimentales afectadas por un cierto error inherente;
en ese caso, no tiene demasiado sentido exigir que la función aproximante
p(x) pase exactamente por unos puntos que contienen errores.
Por otra parte, al aumentar el número de puntos base xi , el polinomio
interpolador puro presenta muchas oscilaciones ya que aumenta su grado
n, y esto dificulta o impide su utilización en muchas aplicaciones: dibujo
por ordenador, cálculo de derivadas, integración numérica, etc. Resultará
preferible utilizar una función más suave (por ejemplo, un polinomio de grado
m < n) y renunciar al criterio de interpolación.
Comentemos, para terminar, una aplicación muy habitual de la apro-
ximación por mínimos cuadrados en la que se combinan estas dos ideas.
Supongamos que disponemos de un cierto modelo teórico de un fenómeno fí-
sico. Por ejemplo, una relación cuadrática entre la abscisa x y la ordenada y,
y = f (x) = ax2 +bx+c. Tenemos también medidas experimentales, (xi , f (xi ))
con i = 0, . . . , n. Nuestro objetivo es determinar el polinomio p2 (x) (es decir,
los coeficientes a, b y c) óptimo en el sentido de mínimos cuadrados. No nos
interesa obtener el polinomio interpolador puro pn (x) por tres motivos: (1)
los datos experimentales están afectados por errores de medida y (2) pn (x)
presenta oscilaciones importantes que no se ajustan a la física del problema
que, según hemos supuesto, (3) se describe mejor por un polinomio de grado
2.
Producto escalar
< ·, · > es un producto escalar si es una forma bilineal simétrica y definida
positiva:
11
1. Linealidad: < αf + βg, h >= α < f, h > +β < g, h > para escalares α,
β y funciones f , g y h cualesquiera.
2. Simetría: < f, g >=< g, f > para funciones f y g cualesquiera.
3. Definición positiva: < f, f >≥ 0; < f, f >= 0 ⇔ f = 0
Norma
|| · || es una norma si, para funciones f y g y escalar α cualesquiera,
1. ||f || ≥ 0; ||f || = 0 ⇔ f = 0
2. ||αf || = |α|||f ||
3. ||f + g|| ≤ ||f || + ||g||
Es importante observar que disponemos, tanto para el producto escalar
como para la correspondiente norma euclídea inducida, de dos versiones, la
continua y la discreta:
(R b
2 a
f (x)g(x)dx caso continuo
||f || =< f, f > con < f, g >= P n (37)
i=0 f (xi )g(xi ) caso discreto
En ambos casos, puede resultar útil incluir una función de peso positiva
w(x) > 0 en la definición del producto escalar:
(R b
a
w(x)f (x)g(x)dx caso continuo
< f, g >= P n (38)
i=0 wi f (xi )g(xi ) caso discreto
E = (||f (x) − p(x)||)2 =< f (x) − p(x), f (x) − p(x) > (39)
es decir,
m
X
p(x) = ci ψi (x) (41)
i=0
12
Así pues, determinar el aproximante p(x) se reduce a determinar los co-
rrespondientes coeficientes ci .
El análisis de combinaciones no lineales de funciones de aproximación es
considerablemente más complejo y menos utilizado que el caso lineal que
tratamos aquí.
mı́n E(c0 , c1 , . . . , cm )
c∈Rm+1
( m m
)
X X
= mı́n
m+1
< f (x) − ci ψi (x), f (x) − cj ψj (x) > (42)
c∈R
i=0 j=0
E =< f (x), f (x) > −2 < p(x), f (x) > + < p(x), p(x) > (44)
∂E
= −2 < ψi (x), f (x) > +2 < ψi (x), p(x) >= 0 para i = 0, . . . , m (45)
∂ci
Para la obtención de las ecuaciones (44) y (45) se ha tenido en cuenta la
linealidad y la simetría del producto escalar.
La ecuación (45) proporciona dos resultados de interés. En primer lugar,
13
proyección ortogonal (según el producto escalar, continuo o discreto, de tra-
bajo) de la función f (x) sobre el espacio de aproximación generado por las
funciones ψi (x).
En segundo lugar, expresando p(x) como combinación lineal de las ψi (x)
llegamos a
m
X
< ψi (x), ψj (x) > cj =< ψ(x), f (x) > para i = 0, . . . , m (47)
j=0
o, más explícitamente, a
< ψ0 , ψ0 > < ψ0 , ψ1 > ···
< ψ0 , ψm > c 0
< ψ0 , f >
< ψ1 , ψ0 > < ψ1 , ψ1 > ···
< ψ1 , ψm > c1 < ψ1 , f >
=
.. .. .. .. .. ..
. . . . .
.
< ψm , ψ0 > < ψm , ψ1 > · · · < ψm , ψm > cm < ψm , f >
(48)
Se trata de un sistema lineal de ecuaciones de orden m+1 cuyas incógnitas
son los coeficientes cj denominado ecuaciones normales.
Demostración
Basta con comprobar que la matriz de las ecuaciones normales es regular
(en otras palabras, que el sistema lineal es compatible determinado). Para
ello, supondremos que la matriz es singular con funciones ψi (x) linealmente
independientes y llegaremos a una contradicción.
Si la matriz es singular, el sistema lineal homogéneo tiene soluciones dis-
tintas a la trivial,
m
X
< ψi , ψj > ĉj = 0 para i = 0, 1, . . . , m con algún ĉj 6= 0 (49)
j=0
14
Pm
Calculemos ahora la norma al cuadrado de la función j=0 ĉj ψj (x):
m
X
|| ĉi ψi (x)||2
i=0
m m m
" m #
X X X X
=< ĉi ψi (x), ĉj ψj (x) >= < ψi , ψj > ĉj ĉi = 0 (50)
i=0 j=0 i=0 j=0
| {z }
=0
La regresión lineal
Hasta ahora hemos discutido el criterio de aproximación de mínimos cua-
drados, pero no hemos tratado el tipo de aproximación, véanse los apartados
1.1 y 1.2.
Veamos un caso concreto de aproximación por mínimos cuadrados: la
regresión lineal (ajuste de una recta a medidas experimentales). Corresponde
a elegir P1 (el espacio de polinomios de grado menor o igual que uno) como
espacio de aproximación, la base trivial {ψ0 (x) = 1, ψ1 (x) = x} y el producto
escalar discreto, ecuación (37).
Las ecuaciones normales son, en este caso,
< ψ0 , ψ0 > < ψ0 , ψ1 > c0 < ψ0 , f >
=
< ψ1 , ψ0 > < ψ1 , ψ1 > c1 < ψ1 , f >
Pm Pm
m + 1 i=0 x i c 0 f (x i )
=⇒ Pm Pm 2 = Pmi=0 (51)
i=0 xi i=0 xi c1 i=0 xi f (xi )
15
Cuadro 1: Las matrices de Hilbert son muy mal condicionadas
Orden (m + 1) Número de condición
2 1,9 × 101
3 5,2 × 102
5 4,8 × 105
10 1,6 × 1013
15 6,1 × 1020
16
que puede resolverse explícitamente, obteniendo los llamados coeficientes de
Fourier ci ,
< ψi , f >
ci = para i = 0, . . . , m (57)
< ψi , ψi >
Para los aproximantes y productos escalares más habituales, las corres-
pondientes funciones ortogonales pueden encontrarse tabuladas en manuales
de fórmulas matemáticas o en la biblioteca de funciones de distintos paquetes
de software matemático.
Si se trabaja con aproximación polinómica y el producto escalar continuo
en el intervalo [−1, 1], por ejemplo, las funciones ortogonales son los llama-
dos polinomios de Legendre; si el producto escalar es discreto con puntos
equiespaciados en el intervalo [−1, 1], los polinomios de Gram.
Referencias
[IK94] Eugene Isaacson and Herbert Bishop Keller. Analysis of numerical
methods. Dover Publications, New York, 1994. Corrected reprint of
the 1966 original [John Wiley & Sons, New York].
17