J Paez Calculo III

Calculo diferencial de varias variables
Javier Paez Cardenas

Indice General
Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
1 El conjunto Rn 3
1.1 Para empezar, algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Estructura algebraica de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Aspectos geometricos de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Otras normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Topologa de Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5.1 Clasificacion de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.5.2 Conjuntos abiertos y cerrados . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.5.3 Otra clasificaci
on de puntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.5.4 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.6 Otros sistemas coordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.6.1 Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.6.2 Coordenadas cilndricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6.3 Coordenadas esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2 Funciones de Rn en Rm 61

2.1 Algebra y geometra de las funciones de Rn en Rm . . . . . . . . . . . . . . . . . . . 61
2.2 Lmite y continuidad de funciones de Rn en Rm . . . . . . . . . . . . . . . . . . . . . 70
2.2.1 Sucesiones en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.2.2 Lmite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2.3 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.2.4 Teoremas fuertes de continuidad . . . . . . . . . . . . . . . . . . . . . . . . 89
2.3 Continuidad uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.4 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3 La derivada de funciones de R en Rn 107

3.1 Geometra y movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.2 La derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.3 Derivada y geometra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.4 Derivada y movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
3.5 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4 La derivada de funciones de Rn en R 143

4.1 Un interludio de Algebra Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.2 La derivada direccional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
3
4.2.1 Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
4.3 La derivada global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
4.3.1 El gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.3.2 Otras propiedades de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . 172
4.3.3 La derivada en otras coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . 191
4.4 Derivadas direccionales de orden superior . . . . . . . . . . . . . . . . . . . . . . . . 198
4.5 Aproximacion polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
4.6 Maximos y mnimos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
4.6.1 Breve comentario sobre formas cuadraticas . . . . . . . . . . . . . . . . . . . 226
4.6.2 Maximos y mnimos sobre restricciones . . . . . . . . . . . . . . . . . . . . . 228
4.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
5 La derivada de funciones de Rn en Rm 247

5.1 La derivada y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
5.1.1 Cambio de coordenadas y regla de la cadena . . . . . . . . . . . . . . . . . . 253
5.2 El teorema de la funci
on implcita . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
5.2.1 El caso lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
5.2.2 El caso no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
on inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
5.4 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
Introducci
on
El tema principal del presente texto es el referente al concepto de derivada para funciones de varias
variables, tema que constituye el n ucleo central del curso de Calculo Diferencial e Integral III que
se imparte en la Facultad de Ciencias de la Universidad Nacional Autonoma de Mexico.
En este trabajo partimos del supuesto de que el conjunto de conceptos y herramientas de C alculo
Diferencial e Integral que son del dominio del lector, es aquel al que coloquialmente se le conoce
como C alculo de una variable. Y como el lector seguramente tambien lo sabe, este nombre coloquial
se debe a que los problemas y situaciones que dan origen a este conjunto de conocimientos, son
aquellos en los que una cantidad (o variable) se puede poner en terminos de otra cantidad,
en donde cada una de estas cantidades tiene la particularidad de poderse medir, describir
o representar con un s olo n
umero real. Esto mismo, dicho de una manera un poco m as tecnica,
significa que el objeto matem atico sobre el cual se contruyen estos conceptos, es el de funci on de
una variable real con valores reales o simplemente funci on de los reales en los reales.
Una vez dicho lo anterior, es entonces un poco mas sencillo establecer cu al es el objetivo fun-
damental de este texto: desarrollar el concepto de derivada de ese tipo de funciones en las que una
cantidad (o variable) se puede poner en terminos de otra cantidad, con la particularidad
de que alguna de estas cantidades (o ambas!) no se puede medir, describir o representar
con un s olo n
umero real. Este tipo de funciones son conocidas en general como funciones de varias
variables, y el conjunto de conceptos y resultados que desarrollaremos alrededor de estas es parte
de lo que coloquialmente se conoce como C alculo de varias variables.
Siguiendo este orden de ideas, los conceptos y resultados que se desarrollan en este texto se
motivan principalmente a partir de los correspondientes conceptos y resultados para el caso de
funciones de los reales en los reales, y en virtud de esta caracterstica, a lo largo de todo el texto se
intenta usar un nivel adecuado de rigor y formalismo matem atico. Por lo anterior, en este trabajo
se parte del supuesto de que el lector conoce todos los temas b asicos de C alculo de una variable,

de Geometra Analtica (plana y del espacio) y de Algebra Superior. Por otra parte, dado que el
primer curso de C alculo de varias variables se suele tomar paralelamente con el primer curso de
Algebra Lineal, en este trabajo se intenta hacer uso de algunos conceptos de esta u ltima materia
una vez que el lector ya los haya estudiado.
Este trabajo est a organizado en cinco captulos; a continuaci on se da una somera y r apida
descripcion del contenido de cada uno de ellos.
De la misma forma que para realizar un estudio mas profundo del C alculo de una variable
es necesario empezar por estudiar con mayor detenimiento al conjunto de los n umeros reales, en
el caso del C alculo de varias variables es necesario hacer el mismo tipo de estudio del conjunto
Rn . El primer captulo lo iniciamos con una serie de ejemplos con los cuales se pretende mostrar
que este conjunto resulta ser el mas id oneo para representar a las variables (independientes
y dependientes) de las funciones para las cuales se definiran la mayora de los conceptos de
este texto. Inmediatamente despues nos damos a la tarea de explorar las diferentes estructuras
matem aticas que este conjunto posee: su estructura algebraica, su estructura geometrica y su
i

Indice General
Indice General
estructura topologica. Concluimos este captulo con un r apido repaso sobre los diferentes sistemas
coordenados que se pueden establecer en el plano o en el espacio.
Una vez que en el captulo 1 se estableci o que las funciones de Rn en Rm ser an el principal objeto
matem atico con el cual podremos describir la mayora de los problemas que dan lugar al estudio del
Calculo de varias variables, en el captulo 2 comenzamos por hacer un r apido estudio de sus aspectos
algebraicos y geometricos. Posteriormente nos damos a la tarea de introducir los conceptos de lmite
y continuidad de este tipo de funciones, para lo cual previamente desarrollamos la herramienta
de las sucesiones en Rn . A continuaci on damos paso a los muy importantes teoremas fuertes de
continuidad y concluimos este captulo estudiando el concepto de continuidad uniforme.
El concepto de derivada para las funciones de Rn en Rm es el tema central de este trabajo, y
a este concepto dedicamos los restantes tres captulos. En el captulo 3 empezamos estudiando a
las funciones de R en Rn y su particular importancia en la descripcion de objetos geometricos,
y en la descripci on del movimiento de un objeto en un plano o en el espacio. Basados en estas
caractersticas, que entre otras ventajas permiten establecer cierta similitud con el caso de funciones
de R en R, introducimos la derivada para este tipo de funciones y estudiamos su uso e interpretacion
justo en estos dos contextos: el geometrico y el cinem atico.
La derivada para funciones de Rn en R es tal vez el primer concepto de este texto cuya definicion
resultara realmente novedosa para el lector. Esta caracterstica se ve reflejada sobre todo en la
necesidad de revisar previamente algunos conceptos importantes del Algebra Lineal (bases ortonor-
males y funciones lineales), y que ser an necesarios para poder dar dicha definicion. El captulo 4
inicia con una revisi on del concepto de base ortonormal para despues introducir la derivada direc-
cional, la que aun guarda una estrecha relaci on con la derivada de funciones de R en R. Despues
de una breve revisi on de la derivada de una funcion de R en R en terminos de funciones lineales,
se introduce el concepto de derivada (global) de una funcion de Rn en R y se prueban algunos
resultados b asicos. Aun y cuando la mayora de los conceptos que se definen en este captulo se
tratan de introducir de manera independiente de los sistemas coordenados mas comunes, en este
captulo se incluye una secci on en la que se deduce la forma especfica que toman conceptos tales
como el de gradiente, cuando las funciones con las que se esta trabajando se expresan en sistemas
coordenados diferentes a los euclideanos (en los casos de R2 y R3 ). Como sucede en el caso de
las funciones de R en R, muchas de las aplicaciones pr acticas del concepto de derivada de fun-
n
ciones de R en R est an orientadas a la determinacion de los valores m aximos y mnimos de este
tipo de funciones. Por esta raz on, se introducen las derivadas direccionales (y parciales) de orden
superior y los polinomios de Taylor, los cuales son herramientas importantes para abordar estos
problemas. Y justo concluimos este captulo con un an alisis general del problema de m aximos y
mnimos, lo que nos conduce a un breve estudio de las formas cuadraticas (a fin de contar con una
herramienta que nos permita clasificar los puntos crticos de una funcion), y a la formulaci on del
Teorema de los multiplicadores de Lagrange, una de la herramientas mas importantes que hay para
la determinacion de m aximos y mnimos de funciones sobre restricciones.
El captulo 5, con el cual concluye este trabajo, aborda el tema de la derivada de funciones de Rn
en Rm . Como es de esperarse, la definicion que se da en esta captulo generaliza a las definiciones
dadas en los captulos 3 (para el caso n = 1) y 4 (para el caso m = 1) y una vez hecho esto, se
prueban resultados b asicos relacionados con este concepto. Los teoremas mas importantes de este
captulo son: la Regla de la Cadena (en su versi on m as general), el Teorema de la funcion Implcita
(a partir del cual se prueba el Teorema de los multuplicadores de Lagrange), y el Teorema de la
funcion Inversa, (a partir del cual se prueba el Teorema de la funcion Implcita) y para cuya prueba
es necesario desarrolar una serie de resultados.
Al final de cada uno de estos captulos, se incluye una lista de problemas con los cuales se
pretende que el lector refuerce, ponga a prueba, y en algunos casos amplie, los conceptos estudiados.
1 J. P
aez
A los alumnos que me han permitido hablarles de estos temas.
AAIZHHEVSOMCCJJONJGVQY T PNCSRYMGUXS(RDL.OL,XXAQV,(TQSG)X MSFXNHNTSEAJSARNA,NIFC

Indice General
Indice General
J. P
aez 2
Captulo 1
El conjunto Rn
As como en el caso del c

alculo diferencial de una variable empezamos por estudiar al conjunto de
los numeros reales R, en este captulo empezaremos por analizar m as a fondo al conjunto Rn , en
virtud de que dicho conjunto ser a tanto el dominio (y en algunos casos el contradominio) de casi
todas las funciones con las que trabajaremos en este texto. El por que este tipo de conjuntos (para
diferentes valores de n) es la forma mas adecuada de representar al dominio y/o contradominio de
la mayora de las funciones que se encuentran en la base del calculo de varias variables, es lo que
intentaremos mostrar en la primera secci on de este captulo.
1.1 Para empezar, algunos ejemplos

Como mencionamos en la introducci on, una motivacion para el desarrollo del Calculo de varias
variables se puede encontrar en el planteamiento de ciertas situaciones en las que una cantidad
(o variable, en general) se puede poner en terminos de otra variable, con la particularidad de
que alguna de estas variables (o ambas!) no se puede medir, describir o representar con
un solo numero real. Lo que haremos en esta seccion, ser
a presentar algunos ejemplos con estas
caractersticas.
Ejemplo 1.1 Suponga que tenemos la suerte de contar con un dispositivo que nos permite saber, en
un cierto instante, la temperatura en cada posici on de la habitaci
on en la que nos encontramos.
Si queremos pensar esta situacion en terminos mas tecnicos, lo que estamos planteando es que este
dispositivo nos permite establecer una funci on entre las distintas posiciones de la habitaci
on y
la temperarura en cada una de ellas. De esta forma, queda claro que una de nuestras variables
(la independiente, como suele decirse) es la posici on y la otra (la dependiente) es la tem-
peratura. Como seguramente el lector ya lo sabe, las diferentes posiciones en una habitaci on
no son suceptibles de describirse con un s olo n
umero real y con toda certeza tambien sabe que
para representar cada posici on nos har an falta tres n
umeros reales (e incluso tambien estar a
conciente de que para una misma posici on dentro de la habitaci
on, pueden haber diferentes ter-
nas de n umeros que la representan, dependiendo del sistema de referencia que elijamos!).
Finalmente, la variable dependiente (en esta caso la temperatura) s se puede describir con un
s
olo n
umero real, por lo que la situaci on que planteamos nos conduce a obtener una funci on que
depende de tres n umeros reales (los que describen o representan una posici on) y que asigna otro
numero real (el que describe o mide la temperatura).
El ejemplo anterior permite una variante que nos lleva a obtener una funcion con una variable
independiente diferente. Veamos de que forma.
3
Captulo 1. El conjunto Rn 1.1. Para empezar, algunos ejemplos
Ejemplo 1.2 En el ejemplo anterior mencionamos que nuestro dispositivo nos permita conocer
la temperatura en cada posici on de una habitaci on, en un cierto instante, situacion que de
inmediato nos hace pensar en una nueva variable: el instante en que estamos midiendo la
temperatura. Como el lector estar a de acuerdo, esta nueva variable se puede medir con un
s
olo n
umero real (y tambien estar a de acuerdo que a un mismo instante lo podr an describir
diferentes n
umeros reales, dependiendo en donde colocamos el instante cero!). De esta forma,
considerando esa nueva variable, la funci on que obtenemos ser a una funcion cuya variable
independiente estara dada por una posici on y un instante, la cual se puede describir con cuatro
numeros reales (tres, que sirven para describir o representar la posici
on, y el cuarto para describir
el instante) y que asigna otro n umero real (el que describe o mide la temperatura, que es la
variable dependiente).
Ejemplo 1.3 Suponga ahora que nos encontramos a la orilla de un rio y que dentro de este ob-
servamos una peque na mota de polvo que se mueve como resultado de la corriente del mismo. Esta
sencilla situaci
on nos lleva de manera natural a pensar en una funci
on: aquella que, para cada cada
instante, nos da la posicion de la mota de polvo. Como seguramente el lector ya dedujo, en este
caso las dos variables importantes son: por un lado el tiempo (la variable independiente) que,
como en el ejemplo anterior, podemos describir con un n umero real, y la posici
on (la variable
dependiente), que como vimos en los ejemplos anteriores, se necesitan tres n umeros reales (o dos,
si el movimiento se realizara sobre un plano) para representarla. As pues, este ejemplo nos lleva
a considerar una funci on que tiene como variable independiente al tiempo (que se puede medir
con un solo numero real), y como variable dependiente a una posicion, para la cual necesitamos
tres cantidades (o numeros) para describirla.
Ejemplo 1.4 Si todava seguimos parados a la orilla del mismo rio, podemos analizar la siguiente
situaci
on: si imaginamos al torrente del rio como un conjunto de moleculas de agua que se est an
moviendo, pensemos en la funci on que, en un instante dado, nos asigna la velocidad con la que
va viajando cada una de las moleculas que forman el torrente. De esta forma, nuestra funci on
tendra que ser tal que, a cada posicion dentro del rio, le asigna una velocidad. A estas alturas
nos queda claro que cada posici on dentro del rio (la variable independiente en este caso) la
podemos describir con una terna de n umeros reales, pero la velocidad (la variable dependiente)
tal vez requiera un an alisis aparte. Cuando un objeto se mueve en lnea recta es f acil covencerse
que su velocidad en un instante se puede medir por un s olo n
umero real, pero este no es el
caso si el movimiento se da en un plano o en el espacio. Intuitivamente, si un objeto se mueve en
un plano o en el espacio, su velocidad en un instante dado se puede representar por medio de
una flecha cuyo punto inicial (u origen) se encuentra en la posici on en la que se encuentra (en
ese instante) el objeto en cuestion; la direcci
on de la flecha indicar
a la direcci
on del movimiento,
y su magnitud (o longitud) indicar a la rapidez con la que lo est
a haciendo. Si ahora recordamos
de nuestros cursos de Geometra Analtica que las flechas que parten de un punto fijo se pueden
representar (o describir) por una pareja (si estamos en el plano) o una terna (si estamos en el
espacio) de numeros reales, tendremos que la variable dependiente de la funci on que describimos
anteriormente (la velocidad de cada molecula, en un instante dado) se podr a describir por medio
de una terna de n umeros reales. De esta forma, la funci on que obtenemos en este ejemplo asignar a
a una terna de n umeros reales (la que describe la posici on de una molecula en un cierto instante)
otra terna de numeros reales (la que describe la velocidad de esa molecula en ese instante).
Como en el caso de ejemplo 1.1, el ejemplo anterior permite una variante que nos conduce a
obtener una funci
on con una variable independiente diferente.
J. P
aez 4
1.1. Para empezar, algunos ejemplos Captulo 1. El conjunto Rn
Ejemplo 1.5 Si en el ejemplo anterior, adem as de considerar la posicion de cada molecula del
agua del ro en un instante dado, tambien consideramos diferentes instantes, entonces obtenemos
una nueva funci on cuya variable independiente estar a dada por una posici on y un instante, la
cual, como en el caso del ejemplo 1.2 se puede describir con cuatro numeros reales, y nos asignar
a
una velocidad (su variable dependiente) que se podr a describir por tres n
umeros reales.
En el ultimo de nuestros ejemplos, mostraremos que las funciones (y sus variables) con las
que nos podemos topar, pueden ser de muy diversa ndole, y que estas no siempre est
a relacionadas
con posiciones, velocidades, tiempos o temperaturas.
Ejemplo 1.6 Suponga que en un laboratorio de investigaci on se encuentran realizando un experi-

mento en el cual, para un valor de una cierta variable x, se obtiene un valor de otra variable y
(vamos a suponer que los posibles valores de ambas variables se expresan con n umeros reales). El
experimento se realiza para k valores diferentes de la variable x, x1 , . . . , xk , ordernados de menor
a mayor (es decir: x1 < < xk ) y se obtienen k valores de la variable y, y1 , . . . , yk . De esta
forma, se cuenta con k parejas de n umeros reales (x1 , y1 ), . . . , (xk , yk ) las cuales se grafican como
se muestra en la figura 1.1, (a). Si el gr afico que se obtiene (y el fen omeno con el que se est a
experimentando) sugieren que estos datos se deben parecer a (o encajar en) una recta, un
problema importante es encontrar la recta que mejor se ajuste a estos datos. En este momento
no vamos a ver que criterios son mejores para determinar si una recta se ajusta bien a un
conjunto de datos, y s olo destacaremos que este problema nos conduce a considerar una funci on
cuya variable independiente es una recta y cuya variable dependiente ser a (como veremos en
un captulo mas adelante) un n umero real. Aun y cuando a primera vista parezca un poco ex otico
eso de condiderar una funci on cuya variable independiente sea una recta, no lo parecer a tanto si
recordamos que toda recta (no vertical) en un plano tiene una ecuaci on de la forma y = mx + b, de
tal manera que esta queda totalmente determinada si conocemos m (su pendiente) y b (su ordenada
al origen); es decir, toda recta (no vertical) en el plano se puede representar por medio de la
pareja de n umeros reales (m, b). Tomando en consideraci on lo anterior, podemos concluir que la
funci
on a la que nos condujo este problema terminar a siendo una que asociar a a un par de n umeros
reales (m, b) (que en este caso representan a una recta, la variable independiente de la funci on)
un numero real.
Pero el ejemplo no termina aqu. C omo sera la funcion que tendramos que considerar si lo que
tenemos es que nuestro conjunto de datos se parecen a (o encajan en) una par abola? (ver
figura 1.1, (b)). Dado que las par abolas (con eje vertical) tienen en general una ecuaci on de la
2
forma y = a0 + a1 x + a2 x (es decir, un polinomio de grado a lo mas 2, que est an determinados por
sus coeficientes a0 , a1 y a2 ), la funcion a considerar sera entonces una que asociara a una terna de
numeros reales (a0 , a1 , a2 ) (la cual representa a una par abola si a2 6= 0, la variable independiente
de nuestra funcion en este caso), un n umero real.
Como el lector seguramente ya lo est a imaginando, este problema lo podemos llevar mas lejos y
considerar funciones que asocien a: tetradas (si nuestros datos se parecen a (o encajan en)
la gr
afica de un polinomio de grado a lo mas 3), o a quntuplas (si nuestros datos se parecen
a (o encajan en) la gr afica de un polinomio de grado a lo mas 4), o en general, a n-adas
(si nuestros datos se parecen a (o encajan en) la gr afica de un polinomio de grado a lo mas
n 1), un n umero real. Dicho de otra forma, nuestra funci on podra ser tal que su variable
independiente fuera un polinomio de grado a lo mas n 1 (los cuales se puede representar por
medio de n-adas de n umeros reales).
Como resultado de esta larga lista de ejemplos, y de acuerdo con la intenci on original de pre-
sentarlos, resumiremos algunas de las caractersticas que tienen las variables (y/o valores) de
5 J. P
aez
Captulo 1. El conjunto Rn 1.1. Para empezar, algunos ejemplos
b
(x7 , y7 ) (x7 , y7 )
b
b
(x5 , y5 ) (x5 , y5 ) (x6 , y6 )

b b b
(x3 , y3 ) (x6 , y6 )
b b (x3 , y3 ) b
b
(x4 , y4 ) (x4 , y4 )
(x1 , y1 ) (x1 , y1 )
b b b b
(x2 , y2 ) (x2 , y2 )
(a) (b)
Figura 1.1: Los datos de un experimento, representados por cada pareja (xi , yi ), sugieren que estos
encajan en una recta (a) o en una par
abola (b).
las funciones que describimos en ellos:
1. las variables (y/o valores) de estas funciones pueden ser de muy diversos tipos,
2. estas variables (y/o valores) siempre son suceptibles de representarse (describirse o

medirse) por una cierta cantidad de numeros reales (dos, tres, cuatro o m
as!),
3. esta representaci
on no es u
nica y en general depende del sistema de referencia que se
elija.
Las caractersticas anteriores son muy importantes y algunas de ellas explican algunos de los
terminos que se suelen usar cuando nos referimos a la materia que nos ocupa, como es el caso del
termino: Calculo de varias variables. Este termino tiene su origen en la segunda caracterstica que
mencionamos, pues las diferentes cantidades que se necesitan para representar a la variable
independiente de una funci on, tambien se consideran variables, de ah que las funciones con las
que se trabajara dependan de varias variables.
Otra importante observaci on que se debe hacer a partir de la segunda caracterstica (sin duda la
mas importante), es que la representaci on de las variables (y/o valores) de estas funciones por
medio de parejas, ternas, tetradas, o en general, n-adas de n umeros reales, es un proceso que se
suele realizar en el contexto de un concepto mas amplio, el de espacio vectorial, y del que el conjunto
de posiciones (o flechas que parten de un mismo punto) de un plano (o las correspondientes
en el espacio), o el conjunto de polinomios de grado menor o igual a n 1 (que mencionamos en
el ejemplo 1.6), son ejemplos particulares de este tipo de espacios. Aunque el lector posiblemente
todava no este muy familiarizado con este concepto, pronto aprendera (en su curso de Algebra
Lineal I) que un espacio vectorial es un conjunto V que est a dotado de dos operaciones: una suma
y una multiplicaci on por escalares (que, cuando dichos escalares son n umeros reales, decimos que
V es un espacio vactorial sobre los n umeros reales), operaciones a las cuales se le suelen pedir
ciertas propiedades. Tambien pronto sabra que, si = {v1 , . . . , vn } es un subconjunto de V que
tiene la propiedad de que cualquier otro elemento v V se puede escribir de manera u nica como
combinaci on lineal de los elementos de (es decir, que existen 1 , . . . , n R, u nicos, tales que
v = 1 v1 + + n vn ) entonces se dice que es una base para V . Este concepto de base es muy
importante pues apoyandose en el es que se establece la representacion de cada elemento v V
por medio de una n-ada de n umeros reales (1 , . . . , n ), y hacer esta representacion por medio de
J. P
aez 6
1.2. Estructura algebraica de Rn Captulo 1. El conjunto Rn
diferentes bases, es lo que est

a intimamente relacionado con los diferentes sistemas de referencia
que mencionamos en el inciso 3. Cuando V tiene una base de este tipo decimos que V es un espacio
vectorial (sobre los numeros reales) de dimension finita, especficamente de dimension n.
De esta ultima observacion, se desprende que las variables (independientes o dependien-
tes) de las funciones con las que trabajaremos en este texto, se pueden ver como elementos de
un cierto espacio vectorial (lo que por cierto tambien explica por que a todo este conjunto de
conceptos y resultados relacionados con esta funciones, tambien se les conoce con el nombre de:
Calculo vectorial). Por lo anterior, las funciones con las que vamos a trabajar deberan de estar
consideradas, en general, como funciones definidas sobre un subconjunto de un espacio vectorial V
y con contradominio sobre otro espacio vectorial W (ambos sobre los n umeros reales y de dimension
finita). Sin embargo, dado que cualquier espacio vectorial de este tipo se puede representar por
medio del conjunto de n-adas de n umeros reales (aunque esta representacion no sea u nica y
dependa de la base (o sistemas de referencia) que se elija, lo que siempre habra que recordar),
a lo largo de este trabajo vamos a suponer que nuestras funciones estar an definidas sobre algun
subconjunto de estas n-adas, y tomar a sus valores (en general) sobre algun conjunto de m-adas
(aunque se oiga un poco feo!).
A pesar de la observacion anterior, en algunas ocasiones y para definir ciertos conceptos, no sera
necesario hacer referencia a la representacion por medio de n-adas de los elementos de un cierto
espacio vectorial. En estos casos usaremos letras del tipo x y y para denotar a estos elementos y
escribiremos simplemente (no sin cometer cierto abuso de notaci Rn o y Rn .
on) x
Y justo por lo dicho en los parrafos anteriores, lo siguiente que haremos sera estudiar de manera
mas detallada al conjunto Rn .
1.2 Estructura algebraica de Rn

Pensar al conjunto Rn como una forma de representar a un espacio vectorial (sobre los reales y de
dimension n), tiene la ventaja de que la estructura algebraica de este u ltimo se puede exportar
n
o trasladar a R . Justo esto es lo que nos proponemos hacer en esta secci on. Antes de hacerlo,
recordemos que el conjunto Rn est a formado por las n-adas ordenadas (x1 , . . . , xn ) en donde cada
xi (a quien llamaremos la i-esima coordenada de (x1 , . . . , xn )) es un n
umero real, es decir
Rn := {(x1 , . . . , xn ) | xi R, i = 1, . . . , n}
y que tambien se suele decir que este conjunto es n veces el producto cruz (de conjuntos) de R
consigo mismo.
A fin de motivar las operaciones que vamos a definir en Rn , pensemos en el conjunto de todas las
flechas del plano que comparten un punto inicial fijo, al que denotaremos por 0 y que llamaremos
origen. Es un hecho conocido que en este conjunto podemos definir (geometricamente y sin
necesidad de recurrir a su representacion por medio de parejas ordenadas) una operaci on de suma
de flechas, y una de multiplicacion de un escalar real por una flecha, lo que permite comprobar
que dicho conjunto se puede ver como un espacio vectorial.
Para definir la suma de las flechas (o vectores), utilizamos la llamada ley del paralelogramo
que consiste en tomar el vector y y trasladar su punto inicial al punto final del vector x , de
tal forma que el vector que parte del origen y termina en el punto final del vector y (trasladado),
sera la flecha a la que llamaremos x + y ((ver figura 1.2, (a)). Para la definicion del producto de
un escalar R por una flecha x , que denotaremos por x, tomamos cualquier recta real que

pase por el origen 0 y que no contenga al vector x , y realizamos la construccion de triangulos
semejantes que se describe en la figura 1.2, (b)).
7 J. P
aez
Captulo 1. El conjunto Rn 1.2. Estructura algebraica de Rn
x
+ y x

x

1
b
y 0
b
0
x
(a) (b)
Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2
Lo importante de haber hecho la definicion geometrica de estas operaciones es que, si ahora

establecemos un sistema de referencia que nos permita tener una representacion de estas flechas en
terminos de parejas de n umeros reales, obtenemos una forma de sumar y multiplicar por un escalar
dichas parejas (aunque aqu habra que reconocer que esta suma y multiplicaci on por un escalar de
parejas que vamos a obtener, es la forma mas natural de definirlas).
Para obtener una base (o un sistema de referencia, que es como les vamos a llamar de aqu
en adelante) que nos permita representar a cualquier flecha por medio de una pareja de n umeros
reales, es suficiente con elegir dos de estas flechas (que denotaremos por v1 y v2 ) y que simplemente
no se encuentren sobre la misma recta (sin importar que el angulo que formen no sea recto, y que
sean de diferente longitud) (ver figura 1.3).
b
x

x2 v2
b
v2
b
b x1 v1
b
v1

0
Figura 1.3: Significado geometrico del hecho de que la pareja (x1 , x2 ) represente a la flecha (o vector)
x
.
Si ahora las parejas (x1 , x2 ) y (y1 , y2 ) representan, respectivamente, a la flecha x

y a la flecha
y en el sistema de referencia dado, lo que significa que
x
= x1 v1 + x2 v2 y y = y1 v1 + y2 v2
y que simplemente expresaremos escribiendo que x = (x1 , x2 ) y y = (y1 , y2 ), uno puede comprobar
(geometricamente) que las flechas x + y y
x estar
an representadas, respectivamente, por las parejas
(x1 + y1 , x2 + y2 ) y (x1 , x2 ), es decir que
x
+ y = (x1 + y1 , x2 + y2 ) y
x = (x1 , x2 )
J. P
aez 8
1.2. Estructura algebraica de Rn Captulo 1. El conjunto Rn
Este procedimiento, que consiste en definir ciertos conceptos (en este caso la suma y producto
por un escalar en el conjunto de las flechas) partiendo de lo geometrico para despues determinar
como se expresan dichos conceptos en terminos de la representacion por n-adas (en este caso
parejas), es un procedimiento al que recurriremos con mucha frecuencia para dotar al conjunto
Rn de varias de sus estrucuturas, tanto algebraicas como geometricas. De hecho, con base en lo
anterior definimos en el conjunto Rn un par de operaciones, una suma y un producto por escalares
(reales), de la siguiente forma:
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )
y
(x1 , . . . , xn ) := (x1 , . . . , xn )
para R.
Es muy facil probar que todas las propiedades que tiene la suma de numeros reales, se heredan
a esta suma definida en Rn ; en particular, a la n-ada cuyas coordenadas son todas cero lo llamaremos
el origen y la denotaremos por 0, es decir
0 := (0, . . . , 0)
= (x1 , . . . , xn ), denotaremos por

del mismo modo que si x x a la n-ada (x1 , . . . , xn ), es decir

x := (x1 , . . . , xn ) = (1)(x1 , . . . , xn )
lo que a su vez aprovecharemos para definir la resta de elementos en Rn (la cual, como en el caso
de R, no es mas que una suma encubierta), de la siguiente manera: si x , y Rn definimos
y := x
x + (
y)
y que, si pensamos a x y coincide con ser

y y como flechas en el plano o en el espacio, la flecha x
la flecha que se obtiene uniendo el punto final de y con el punto inicial de x, trasladada al origen,
como se muestra en la figura 1.4 para el caso del plano.
x

b
y
x b
b
y
Figura 1.4: Construccion geometrica del vector x
Para concluir esta breve secci on, simplemente resaltaremos el hecho de que en Rn existen dos
propiedades distributivas: el producto por un escalar distribuye a la suma de elementos en Rn , y el
producto de un elemento de Rn distribuye a la suma de escalares, es decir, si x, y Rn y , R,
entonces
(
x + y) = x +
y y ( + ) x = x + x

9 J. P
aez
Captulo 1. El conjunto Rn 1.3. Aspectos geometricos de Rn
1.3 etricos de Rn
Aspectos geom
Como vimos en la secci on anterior, para establecer una correspondencia entre los puntos o flechas
del plano con las parejas ordenadas de n umeros reales, no es necesario elegir un sistema de referencia
en el que las flechas que lo formen tengan que ser perpendiculares ni de la misma longitud. Tomarlas
de esta forma, en cuyo caso diremos que nuestro sistema de referencia es un sistema coordenado
cartesiano 1 , es una libertad adicional que nos podemos dar, y que nos permitira trasladar al
conjunto Rn toda la estructura geometrica que este concepto de perpendicularidad conlleva.
De esta forma, cuando a la pareja (x1 , x2 ) o a la terna (x1 , x2 , x3 ) de n
umeros reales la usamos
para designar a una flecha (o vector) de un cierto sistema coordenado cartesiano, la longitud (o
magnitud) de esta flecha es una cantidad que podemos escribir en terminos de las coordenadas
correspondientes. La expresi on algebraica que representa a esta cantidad se deduce facilmente
usando el Teorema de Pit agoras (como se muestra en la figura 1.5), y est a dada por
q
x21 + x22
para el caso del plano (R2 ), y por q

x21 + x22 + x23
para el caso del espacio (R3 ). Es importante resaltar que si la pareja o la terna designa a un punto
(en lugar de una flecha), estas expresiones lo que representan es la distancia que hay entre dicho
punto y el origen.
x

2
x2
+ x2
p x21
x1
p
Figura 1.5: La cantidad x21 + x22 representa la magnitud del vector x
= (x1 , x2 ).
Tomando como base las expresiones anteriores, a cada x = (x1 , . . . , xn ) Rn (para cualquier
n N) le asociaremos un n
umero real positivo, al que llamaremos la norma (euclideana) de x , y
que denotaremos por kxk. Este nuevo concepto est a definido de la siguiente manera.
Definici
on 1.7 Para cada x = (x1 , . . . , xn ) Rn definimos la norma (euclideana) de x , que
denotamos por kxk, como q
k
xk := x21 + x22 + + x2n (1.1)
Aun y cuando n sea mayor que 3, y de acuerdo con la interpretacion como una distancia que se
le da a dicha expresi umero k
on para el caso en que n = 2 o n = 3, en general diremos que el n xk
y el origen 0.
representa la distancia entre el punto determinado por x
1
Nombrado as en recuerdo de Rene Descartes (La Haye, Turena francesa, 31 de marzo de 1596 - Estocolmo,
Suecia, 11 de febrero de 1650), tambien llamado Renatus Cartesius, quien fue un fil
osofo, matem
atico y fsico frances,
considerado como el padre de la geometra analtica y de la filosofa moderna, as como uno de los nombres m as
destacados de la revolucion cientfica. (fuente: Wikipedia).
J. P
aez 10
1.3. Aspectos geometricos de Rn Captulo 1. El conjunto Rn
A fin de explorar las propiedades del concepto que acabamos de definir, vale la pena hacer notar
que si en esta definicion tomamos n = 1 (en cuyo caso nuestro conjunto coincide con ser R), entonces
la norma no es otra cosa m as que el conocidsimo concepto de valor absoluto de los n
umeros reales,
lo que por cierto, nos permite pensar al concepto de norma como una generalizaci on a Rn del
correspondiente concepto de valor absoluto de los n umeros reales. Es precisamente a partir de este
hecho, y recordando las propiedades mas elementales del valor absoluto, que podemos establecer la
siguiente
Proposici
on 1.8 La norma (euclideana) satisface las siguientes propiedades:
1. k Rn y k
xk 0 para toda x xk = 0 si y s = 0
olo si x
2. k
xk = || k Rn y para toda R
xk para toda x
3. k
x + yk k
xk + k , y Rn
y k para cualesquiera x (desigualdad del tri
angulo)
Demostraci on. Las afirmaciones de los incisos 1 y 2 son inmediatas, y la prueba del inciso 3
requiere un nuevo concepto que desarrollaremos a continuaci
on.
Para poder probar el inciso tres de la proposicion 1.8 introduciremos un nuevo concepto el cual
vamos a motivar a partir de un problema geometrico muy sencillo: dados dos vectores x , y R2 ,
distintos de
0, cual es el escalar R que hace que los vectores x

y y y sean perpendiculares?
(ver figura 1.6).
x

x
y
y

y
Figura 1.6: Cu
al es el valor de que hace que los vectores x y y y sean perpendiculares?
Supongamos que los vectores x y y tienen coordenadas (x1 , x2 ) y (y1 , y2 ), respectivamente. Dado
que deseamos que el tri
angulo formado por los vectores x
, x y y y sea un tri angulo rect
angulo,
por el teorema de Pit
agoras debemos tener que
y k2 + k
k y k2 = k
x xk 2 (1.2)
lo cual, escrito en terminos de las coordenadas de los vectores, se traduce en
p 2 p 2 q 2
2
(y1 ) + (y2 )2 + 2
(x1 y1 ) + (x2 y2 )2 = 2 2
x1 + x2
Cancelando los cuadrados con las races cuadradas, desarrollando los cuadrados que se encuen-
tran dentro de la segunda raz cuadrada y cancelando y factorizando los terminos iguales, llegamos
a que debe de satisfacer la ecuaci
on
22 y12 + y22 2 (x1 y1 + x2 y2 ) = 0

11 J. P
aez
la cual tiene las soluciones = 0 y

x1 y 1 + x2 y 2 x1 y 1 + x2 y 2
= 2 2 =
y1 + y2 ky k2
Es importante observar que la soluci on = 0 no tiene mucho que ver con el problema planteado
puesto que, independientemente de la posici on de x y y, tomando este valor de siempre se satisface
la ecuacion 1.2. Por esta razon, la segunda solucion de la ecuaci on es la importante para el problema
que planteamos.
La expresi on x1 y1 + x2 y2 (que aparece en el numerador de la expresi on del numero que
calculamos renglones arriba) resultara ser muy relevante a la hora de precisar un concepto que
hasta ahora s olo podemos manejar de una forma muy intuitiva: el angulo (agudo) formado por
los vectores x y y.
La sospecha de que existe una relaci on entre esta expresi on y el concepto de angulo, la podemos
reforzar si en el problema que planteamos anteriormente observamos que, si los vectores x y y
ya fueran perpendiculares, la u nica soluci on sera = 0 de donde se concluye que la expresi on
x1 y1 + x2 y2 tendra que ser 0. Esto se puede confirmar con algunos ejemplos, como sera el caso los
vectores (1, 0) y (0, 1), que de acuerdo con el sistema coordenado con el que estamos trabajando,
este se tom o de tal forma que dichos vectores son perpendiculares (seguramente el lector podr a
verificar en muchos m as casos especficos que la perpendicularidad de dos vectores se corresponde
con el hecho de que la expresi on x1 y1 + x2 y2 vale 0). Tambien es facil verificar que, dado un vector
= (x1 , x2 ) 6= 0 entonces el vector y = (x2 , x1 ) 6= 0 es perpendicular a x
x puesto que junto con
el vector x y forman un tri angulo rectangulo, lo que se deduce del hecho de que dicho tri angulo
satisface el teorema de Pit agoras:
x yk2 = k(x1 , x2 ) (x2 , x1 )k2

k
= (x1 + x2 )2 + (x2 x1 )2

= x21 + x22 + (x2 )2 + x21
xk2 + k
= k y k2
(ver figura 1.7).
x1
y
x
y x2
x2 x1
Figura 1.7: Los vectores x

= (x1 , x2 ) y y = (x2 , x1 ) son perpendiculares
mientras que, por otra parte, es facil ver que en este caso tambien se tiene que
x1 y1 + x2 y2 = x1 (x2 ) + x2 x1
J. P
aez 12
=0
Con el fin de analizar la relaci

on que esta expresi
on tiene con el concepto de angulo, ahora
vamos a resolver el problema planteado inicialmente, recurriendo justamente al concepto de
angulo entre dos vectores que todos conocemos, y a las funciones trigonometricas b asicas que se
defininen con base en este.
En efecto, si es el
angulo formado por los vectores x
y y (ver figura 1.8), sabemos que
kyk
cos() =
k
xk
de donde, tomando el caso en que 0 < < /2, se tendra que > 0 y por tanto
kyk
cos() =
k
xk
k
yk
=
k
xk
de modo que
k
xk cos()
=
k
yk
x

y
Figura 1.8: El calculo de usando el angulo
Si ahora igualamos los valores que hemos obtenido de por estos dos caminos, tenemos que
x1 y 1 + x2 y 2 k
xk cos()
2 =
kyk k
yk
de donde
x1 y 1 + x2 y 2
cos() = (1.3)
kxk kyk
y por lo tanto

1 x1 y 1 + x2 y 2
= cos (1.4)
kxk kyk

x1 y 1 + x2 y 2
= arccos
k xk k
yk
en donde supondremos que elegimos la rama de la funcion arccos que toma sus valores en el
intervalo [0, ].
13 J. P
aez
Esta ultima identidad es sin duda toda una revelacion en virtud de que nos proporciona una
forma m as especfica y rigurosa de medir al angulo (agudo) formado por los vectores x y y, en
terminos de sus coordenadas. Y que esta es una buena forma de medir dicho angulo se confirma si
observamos, por ejemplo, que este n umero no vara, como es de esperarse, si tomamos otro par de
vectores que apunten en la mismas direcciones en las apuntan los vectores x y y, respectivamente.
Esta condici on se traduce en tomar vectores de la forma x y y , con , > 0; en este caso se
tiene que, si x = (x1 , x2 ) y y = (y1 , y2 ) entonces x = (x1 , x2 ) y y = (y1 , y2 ) de tal forma

que si llamamos al angulo formado por los vectores x y
y y lo calculamos en terminos de sus
coordenadas, de acuerdo con la ecuaci on 1.4, se tiene que

(x1 )(y1 ) + (x2 )(y2 )
= cos1
kxk k yk

1 (x1 y1 + x2 y2 )
= cos
k xk kyk

x1 y 1 + x2 y 2
= cos1
kxk kyk
=
Notese que este u ltimo hecho nos permite suponer que los vectores x y y tienen norma 1, puesto
que si este no fuera el caso, bastara con tomar = 1/ k xk y = 1/ k y k para que los vectores xy
y s tuvieran norma 1 (por cierto que, cuando a un vector x 6= 0 le aplicamos este procedimiento
de multiplicarlo por el recproco de su norma, diremos que hemos normalizado al vector x ; es
decir, normalizar al vector x significara tomar el vector (1/ k xk)x, el vector que est a en la misma
direcci on que x y cuya norma es 1). Recurriremos con tanta frecuencia a este procedimiento de
normalizacion, que en lugar de escribir (1/ k xk)x simplemente escribiremos x / k
xk.
Resumiendo toda la discusion anterior y a partir de las identidades 1.3 y 1.4, podemos concluir
que la expresi on x1 y1 + x2 y2 contiene la informaci on suficiente como para poder calcular el
angulo formado por los vectores x y y, en donde (x1 , x2 ) es la pareja que representa (en un
sistema coordenado cartesiano) a x y (y1 , y2 ) la que representa a y. Por esta raz on, y con base en
esta expresi on, definiremos sobre el conjunto Rn otra operaci on (a la que llamaremos el producto
punto (o el producto interior)) entre dos elementos x , y Rn , y que denotaremos por x y, de
la siguiente manera.
Definici on 1.9 Dados x , y Rn , con x = (x1 , . . . , xn ) y y = (y1 , . . . , yn ), definimos el producto
punto (o producto interior) de x y y, que denotaremos por x y, como el n umero real dado por
x1 y1 + + xn yn , es decir
y := x1 y1 + + xn yn
x
Xn
:= xi y i
i=1
Esta nueva operaci

on tiene una serie de propiedades b
asicas, las cuales resumimos en la siguiente
Proposici on 1.10 Dados x , y, z Rn y R, el producto punto de vectores definido en 1.9

satisface las siguientes propiedades:
x
1. x 0yx
x
= 0 si y s = 0
olo si x
y = y x
2. x
J. P
aez 14
(
3. x y + x
y + z) = x z
x) y = x
4. ( ( x y)
y ) = (
Ademas de mencionar que la demostracion de estas propiedades es muy sencilla (y que por esta
razon se deja como ejercicio al lector), es importante se
nalar que cualquier otra funcion definida de
n n
R R en R que las satisfaga, tambien se le llamar a un producto punto.
Si bien es cierto que es importante mostrar que la funcion dada en la definicion 1.9 satisface
las propiedades de la proposici on anterior (pues con ello se prueba que dicha funcion s es un
producto punto), tambien es importante destacar la ntima relaci on que existe entre este producto
y el concepto de norma euclideana que definimos anteriormente, la cual queda expresada en la
identidad
xk2 = x
k x (1.5)
Pero sin lugar a dudas la propiedad mas importante que hay que destacar de esta nueva ope-
raci
on, est
a relacionada con la identidad 1.3. En efecto, si escribimos esa misma identidad usando
la notaci
on del producto punto, esta se traduce en la siguiente identidad:
y
x
cos() = (1.6)
k
xk kyk
olo podemos dar por cierta para el caso de R2 , y sin ignorar que su demostracion
la cual, por ahora, s
se obtiene a partir de nuestro (no muy bien definido) concepto de angulo y su relaci on con las
funciones trigonometricas (las que por cierto, si est an bien definidas).
La conclusion mas importante que podemos obtener de la identidad 1.6 se deduce del hecho de
que los valores de la funcion coseno se encuentran entre 1 y 1. En efecto, tomando en cuenta
esto tendremos entonces que, para cualesquiera par de vectores x , y R2 diferentes de 0, se debe
cumplir que
|x y|
1
k
xk k yk
o que
|
x y| k xk k
yk (1.7)
para cualesquiera par de vectores x otese que si alguno de estos vectores fuera 0, entonces
, y R2 (n
se satisface la igualdad).
Lo interesante de la desigualdad 1.7 es que esta no involucra a ning un angulo y tiene todo el
sentido preguntarse si es valida en cualquier Rn . Y lo mejor de todo es que la respuesta a esta
pregunta es positiva! En efecto, la desigualdad 1.7 es valida para cualquier par de vectores en Rn
y es conocida como la desigualdad de Cauchy-Schwarz 2 .
Esta desigualdad jugara un papel muy importante a lo largo de todo este texto, y por esta
misma raz on le concederemos el nivel de teorema.
, y
Teorema 1.11 (Desigualdad de Cauchy-Schwarz) Para cualesquiera par de vectores x
Rn se satisface que
|
x y| k
xk k
yk
2
Llamada as en honor del matem atico frances Augustin Louis Cauchy (Pars, 21 de agosto de 1789 - Sceaux, 23
de mayo de 1857), quien la public
o en 1821, y del matem atico alem
an Karl Hermann Amandus Schwarz (25 de enero
1843 - 30 de noviembre 1921), quien la public o en 1888. Aunque dicha desigualdad tambien fue establecida por el
matem atico ruso Viktor Yakovlevich Bunyakovsky (Bar, Ucrania, 16 de diciembre 1804 - San Petesburgo, Rusia, 12
de diciembre 1889) en 1859. (fuente: Wikipedia).
15 J. P
aez
Demostraci on. Como ya se menciono, esta desigualdad es inmediata si x o y es el vector

0.
Por esta raz
on, supondremos que x y y son distintos de 0. Asimismo, probar la desigualdad del
enunciado es equivalente a probrar que

x
y |
x y|
k = 1
xk k
yk k
xk k yk
por lo que tambien podemos suponer que k xk = ky k = 1.

Una vez establecido lo anterior, por los incisos 1 y 3 de la proposici
on 1.10 y la identidad 1.5,
sabemos que
0 (
x y) (
x y)
x
=x 2
x y + y y
= 2(1 x
y)
de donde concluimos que

y 1
x
Con base en las mismas propiedades, tambien sabemos que
0 (
x + y) (
x + y)
x
=x x y + y y
+ 2
y)
= 2(1 + x
y ahora concluimos que

1 x
y
con lo que hemos probado que
1 x
y 1
o equivalentemente, que
|
x y| 1
que es lo que deseabamos demostrar.
Es importante llamar la atenci on del lector al hecho de que en esta prueba no hubo necesidad
de recurrir a las coordenadas de los vectores x y y, y que las herramientas importantes fueron
las propiedades basicas del producto punto y su relaci on con la norma. Lo importante de esta
observacion es que, si definimos otro producto punto sobre el conjunto Rn que satisfaga las
propiedades de la proposicion 1.10, y con base en este otro producto punto definimos otra norma
por medio de la identidad 1.5, esta otra norma satisfacer a las propiedades de la proposici
on 1.8 y
la desigualdad de Cauchy-Schwarz, usando ese otro producto punto y esa otra norma, seguira
siendo cierta!.
Como una primera muestra de la importancia y utilidad de la desigualdad de Cauchy-Schwarz,
ahora la usaremos para probar el inciso 3 de la proposicion 1.8 (la desigualdad del tri
angulo), junto
con otra desigualdad que tambien nos resultara muy u til a lo largo de este texto.
Proposici , y Rn se satisface que:

on 1.12 Para cualesquiera par de vectores x
1. k
x + yk k
xk + k
yk (desigualdad del tri
angulo)
J. P
aez 16
2. |k
xk k
y k| k
x + yk
Demostraci on. Para la prueba de la desigualdad del tri

angulo (inciso 1), con base en la identidad
1.5 y la desigualdad de Cauchy-Schwarz, tenemos que
x + yk2 = (
k x + y) (
x + y)
x
=x x y + y y
+ 2
xk2 + 2
= k y k2
x y + k
xk2 + 2 k
k xk k y k2
y k + k (desigualdad de Cauchy-Schwarz)
y k)2
xk + k
= (k
de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

Para la prueba del inciso 2, dado que
k
xk = k(
x + y) + (
y )k
angulo) y el hecho de que k

usando el inciso anterior (la desigualdad del tri y k = k(1)
y k = k
yk
(inciso 2 de la proposici
on 1.8), se tiene que
k
xk = k(
x + y) + (
y )k
k
x + yk + k
yk
y por lo tanto
k
xk k
yk k
x + yk
Analogamente, dado que k

y k = k(
x + y) + (
x)k, obtenemos que
k
y k = k(
x + y) + (
x)k
k
x + yk + k
xk
de donde
k
x + yk k
xk k
yk
es decir, que
k
x + yk k
xk k
y k k
x + yk
lo cual es equivalente a la desigualdad que se deseaba probar.
Para concluir esta secci on, recordemos que la desigualdad de Cauchy-Schwarz nos fue sugerida
a partir de la identidad 1.6, identidad que surge de un problema geometrico el cual, a su vez, se
poda resolver a partir del concepto de angulo. Todo ello en el plano, o en el conjunto R2 (pensando
a este conjunto como una representacion de dicho plano). Lo importante de la prueba es que esta
es valida para cualquier Rn , y con base en la misma identidad, podemos extender (y definir de
manera mas precisa) el concepto de angulo entre cualquier par de elementos (distintos de 0) de este
conjunto, y por lo tanto, definir el concepto de angulo entre cualquier par de elementos (distintos
de 0) del espacio espacio vectorial representado por el conjunto Rn (como por ejemplo, el espacio
de los polinomios de grado menor o igual a n 1). Por todo lo anterior, damos la siguiente
17 J. P
aez
Captulo 1. El conjunto Rn 1.4. Otras normas
Definici
on 1.13 Sean x , y Rn distintos del 0. Definimos el angulo (agudo) entre x
y y como el
n
umero dado por la f
ormula

y
x
:= cos1
k
xk k yk

y
x
:= arccos
k
xk k yk
(donde cos1 (o arccos) es la funci

on inversa de cos que tiene como contradominio el intervalo
[0, ]).
1.4 Otras normas

Como el lector habra notado, todo lo realizado en la secci on anterior est
a basado en lo que co-
munmente conocemos como geometra euclideana. La idea de esta secci on es mostrar que, en
particular el concepto de longitud (o magnitud, o distancia al origen, o valor absoluto) de un
elemento x = (x1 , . . . , xn ) Rn se puede definir de otras formas, sin necesidad de recurrir a la
geometra euclideana, y conservando las propiedades elementales que tiene la norma euclideana (y
que establecimos en la proposici on 1.8).
Sin que se pretenda profundizar en el tema, ahora es prudente mencionar que a cualquier
funcion de Rn en los reales no negativos (conjunto al que denotaremos por R+ ) que satisfaga las
propiedades establecidas en la proposici on 1.8, se le conoce con el nombre de norma. Y aunque
existe (literalmente) una infinidad de maneras de definir una norma en Rn (en realidad, muchas
de ellas son muy parecidas), en esta breve secci on s
olo abordaremos dos de ellas; la norma uno
(que denotaremos por kk1 ) y la norma infinito (que denotaremos por kk ), que definimos de la
siguiente manera
Definici = (x1 , . . . , xn ) Rn , definimos:

on 1.14 Dado x
, que denotamos por k

1. la norma uno de x xk1 , como
k
xk1 := |x1 | + + |xn |
, que denotamos por k

2. la norma infinito de x xk , como
k
xk := max{|x1 | , . . . , |xn |}
Queda como un ejercicio para el lector probar que las funciones definidas arriba satisfacen las
propiedades enlistadas en la proposici on 1.8, con lo que de paso quedar
a justificado el hecho de que
a dichas funciones les llamemos normas.
Aun y cuando estas otras normas tienen algunas diferencias importantes con la norma euclideana
(en particular, para ninguna de estas normas se puede definir alg un producto punto en Rn que
satisfaga lo equivalente a la identidad 1.5), en cuanto a formas de medir la longitud (o magnitud,
o distancia al origen, o valor absoluto) de un elemento x Rn no resultan ser tan diferentes.
En efecto, en la unica proposici on que enunciaremos en esta secci on, mostraremos que todas
estas normas est an relacionadas a traves de ciertas desigualdades las cuales permitiran establecer
que ciertos conceptos tales como: estar en el interior de un conjunto, estar en el exterior de un
conjunto, y estar en la frontera de un conjunto, y para cuya defici on necesitamos de una norma,
todos ellos resultaran ser iguales sin importar que norma usemos.
J. P
aez 18
1.4. Otras normas Captulo 1. El conjunto Rn
Proposici Rn se satisfacen las siguientes desigualdades:

on 1.15 Para cualquier elemento x

1. k
xk k
xk n k
xk
2. 1 k
xk1 k
xk k
xk1
n
Demostraci
on. Dado que el cuadrado de un n
umero real siempre es no negativo, se tiene que
x2i x21 + + x2n
de modo que q
|xi | x21 + + x2n = k
xk (1.8)
y como la desigualdad anterior es valida para toda i {1, . . . , n}, concluimos que
k
xk = max{|x1 | , . . . , |xn |} k
xk
Por otra parte, como

|xi | max{|x1 | , . . . , |xn |} = k
xk
xk2 de modo que
tambien para toda i {1, . . . , n}, entonces x2i k
xk2 = x21 + + x2n k

k xk2 + + k
xk2 = n k
xk2
es decir
k
xk n k
xk
con lo que concluimos la prueba de las dos desigualdades del primer inciso.
Para la primera desigualdad del segundo inciso, observese que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)
de tal forma que, por la desigualdad de Cauchy-Schwarz, tenemos que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

k(1, . . . , 1)k k(|x1 | , . . . , |xn |)k

q
= n |x1 |2 + + |xn |2
q 2
= n x1 + + x2n

= n k xk
Para la segunda desigualdad, observe que
x
= (x1 , . . . , xn )
= (x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )
de tal forma que, por el problema 5 concluimos que
k
xk = k(x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )k
k(x1 , 0, . . . , 0)k + + k(0, 0, . . . , 0, xn )k
= |x1 | + + |xn |
19 J. P
aez
Captulo 1. El conjunto Rn 1.5. Topologa de Rn
= k
xk1
que es la desigualdad que se deseaba probar.
Para concluir esta secci

on mencionaremos la importancia adicional que tiene el hecho de que en
Rn podamos contar con al menos una norma (de hecho, hasta ahora en Rn tenemos tres!).
Como mencionamos anteriormente, el concepto de norma nos permite hablar de la longitud
(o magnitud, o distancia al origen, o valor absoluto) de un elemento x Rn . Si en particular
pensamos a la norma como una forma de medir la distancia que hay entre el punto representado
Rn y el origen
por el elemento x 0, esta interpretacion nos permite entonces hablar de la distancia
entre cualesquiera dos elementos x, y Rn ; en efecto, dados estos dos elementos, en virtud de que
ax y lo podemos pensar como el vector que tiene punto inicial en y y punto final en x, la norma
a una medida de la distancia entre estos dos puntos. Si recordamos que en Rn
de este vector ser
hemos definido tres normas diferentes, con base en el razonamiento anterior estamos en condiciones
de establecer tres formas diferentes de medir la distancia entre elementos de Rn . Sin embargo, y
como en el caso de la norma, la distancia que usaremos a lo largo de todo este texto es aquella
que se obtiene a partir de la norma euclideana (y que por razones obvias, llamaremos la distancia
euclideana). Este concepto lo formalizamos en la siguiente definicion.
Definici , y Rn definimos la distancia (euclideana) de x

on 1.16 Dados x a y, que denotamos por
d(
x, y), como
x, y) := k
d( x yk
Un resultado muy sencillo de probar es que la distancia euclideana (y cualquier otra distancia
on3 .
que se respete), cumple con las propiedades que establecemos en la siguiente proposici
Proposici
on 1.17 La distancia (euclideana) satisface las siguientes propiedades:
, y Rn y d(
x, y) 0 para toda x
1. d( x, y) = 0 si y s
olo si x
= y
2. d(
x, y) = d(
y, x , y Rn
) para toda x
x, y) d(
3. d( x, z) + d( , y, z Rn
z , y) para cualesquiera x (desigualdad del tri
angulo)
Como es de esperarse, la prueba de esta proposici

on se deja al lector.
1.5 Topologa de Rn
La Topologa es un area de las matem aticas muy importante que se interesa por conceptos como
proximidad, continuidad, conectividad (o conexidad), compacidad, y muchos otros mas. Para
abordarlos, es necesario establecer un cierto tipo de conjuntos (que en Topologa se les conoce
como los conjuntos abiertos), y con base en esta familia de conjuntos es posible darse a la tarea de
definirlos de forma muy precisa.
Cuando en un conjunto se cuenta con una forma de medir la distancia entre cualesquiera dos
de sus elementos (como es el caso de Rn ), existe una manera de decir quienes son los conjuntos
abiertos y con base en estos, desarrollar los conceptos que mencionamos al principio de esta secci
on.
3
on de Rn Rn en R+ que cumpla con estas tres propiedades se le llamar
De hecho, cualquier funci a una distancia
en Rn . Aun cuando en este texto podemos considerar tres diferentes distancias, con base en las tres diferentes normas
que definimos, no todas las distancias en Rn tienen que estar definidas a traves de una norma.
J. P
aez 20
1.5. Topologa de Rn Captulo 1. El conjunto Rn
Eso es lo que vamos a hacer en esta secci on y para ello empezaremos por definir un cierto tipo de
conjuntos que resultaran ser basicos en esta tarea: el concepto de vecindad de un punto x Rn .
En Rn , este concepto de vecindad se define apoyandonos en alguna de las formas que disponemos
de medir la distancia entre elementos de Rn , que en nuestro caso ser a la distancia euclideana (en los
problemas mostraremos que, en terminos topologicos, da lo mismo cu al de estas distancias elijamos
o, en u
ltima instancia, cual norma elijamos).
Algunos objetos geometricos son muy sencillos de describir en terminos del concepto de dis-
tancia, y sin duda el mas sencillos de ellos es el formado por los puntos que se encuentran a una
distancia constante r > 0 de un punto fijo x Rn , que como todos sabemos, en R2 dicho objeto
3
es una circunferencia de radio r, y en R es una esfera, tambien de radio r. Sin embargo, para
nuestros objetivos, el conjunto que resultara de mayor interes no es tanto el formado por los puntos
que se encuentran a una distacia r de x Rn , sino los que se encuentran a una distancia menor
2
a r. En R este conjunto consistira de los puntos que se encuentran dentro de la cincunferencia
de radio r, y en R3 consistira de los que est
an dentro de la esfera, tambien de radio r (ver figura
1.9).
Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )
Con base en lo anterior, definimos (en Rn ) el concepto de vecindad (o bola) de radio r > 0 con
Rn , que denotaremos por Br (
centro en el punto x x), de la siguiente manera.
Definicion 1.18 Dado x Rn y r > 0, definimos la vecindad (o bola) de radio r > 0 con centro
Rn como
en x
Br ( y Rn | d(
x) := { x, y) = kx yk < r}
1.5.1 Clasificaci
on de puntos
Apoyandonos en este concepto ahora nos daremos a la tarea de, dado un conjunto A Rn , clasificar
a todos los puntos de Rn en terminos de su posici on con respecto a dicho conjunto, en donde
por posicion nos referimos a algo mas profundo que el simple concepto de pertenencia. A fin de
precisar esta idea de posicion con respecto a un conjunto A, recurriremos a la figura 1.10 en R2 .
Suponiendo que el conjunto A est a formado por los puntos del area sombreada, incluyendo los
puntos de la lnea continua, y excluyendo los puntos de la lnea punteada, tenemos que los puntos
x
y z pertenecen al conjunto, mientras que los puntos y y w
no pertenecen a A. Sin embargo, tanto
los que pertenecen como lo que no pertenecen a A, tienen una posici on diferente con respecto a
este conjunto.
En efecto, mientras que en el caso del punto x existe un radio r > 0 tal que la vecindad de
este radio y centro en x est
a contenida en A (es decir, Br (x) A), en el caso del punto z no es
21 J. P
aez
Y
w

y
x

A
z
Figura 1.10: Las diferentes posiciones que puede tener un punto de Rn con respecto de un conjunto A
posible encontrar un radio con esta misma caracterstica, es decir, para todo r > 0 se tiene que
z ) Ac 6= y Br (
Br ( z ) A 6= , en donde Ac := Rn \ A (el complemento de A).
En el caso de los puntos y y w se tiene una situacion analoga; mientras que para el punto y
existe un radio r > 0 tal que la vecindad de este radio y centro en y est a contenida en Ac (es
y ) Ac ), en el caso del punto w
decir, Br ( tambien se tiene que para todo r > 0, sucede que
Br (w) c
A 6= y Br (w) A 6= (ve ase la figura 1.11).
y w

A
z
X
on, en terminos de vecindades, de la posicion de los puntos de Rn con

Figura 1.11: Caracterizaci
respecto al conjunto A
Resumiendo lo anterior tenemos que, dado un conjunto A Rn y x Rn , entonces se satisface

una de las siguientes condiciones (y s
olo una de ellas, pues ser
an mutuamente excluyentes):
x) A,
1. existe r > 0 tal que Br (
x) Ac , y
2. existe r > 0 tal que Br (
x) Ac 6= y Br (
3. para todo r > 0 se cumple que Br ( x) A 6= .
Como el lector estar

a de acuerdo, los puntos que satisfacen la condici
on 1 no s
olo son puntos
que deben pertenecer a A, sino que adem as est
an realmente dentro (o en el interior) de A;
los que cumplen la condici
on 2 no solo son puntos que no pertenecen a A, sino que adem as est
an
realmente fuera (o en el exterior) de A; y finalmente los que cumplen la condicion 3, pueden
o no pertenecer a A, pero lo importante es que no estan ni dentro ni fuera, raz
on por la cual
podemos decir que se encuentran en el borde (o en la frontera) de A.
J. P
aez 22
Con base en lo anterior es que ahora estamos en condiciones de, dado un conjunto A Rn ,
on de los puntos de Rn en terminos de su posici
dar una clasificaci on con respecto de dicho
conjunto, cosa que haremos en la siguiente
on 1.19 Sean A Rn y x
Definici Rn . Decimos que:
1. x x) A. Denotamos por int(A) al

es un punto interior de A si existe r > 0 tal que Br (
conjunto formado por todos estos puntos, es decir
x Rn | x
int(A) := { es un punto interior de A}
y diremos que este conjunto es el interior de A.
2. x x) Ac . Denotamos por ext(A) al

es un punto exterior de A si existe r > 0 tal que Br (
conjunto formado por todos estos puntos, es decir
x Rn | x
ext(A) := { es un punto exterior de A}
y diremos que este conjunto es el exterior de A.
3. x
es un punto frontera de A si para todo r > 0 se tiene que Br ( x) Ac 6= .
x) A 6= y Br (
Denotamos por Fr(A) al conjunto formado por todos estos puntos, es decir
x Rn | x
Fr(A) := { es un punto frontera de A}
y diremos que este conjunto es la frontera de A.
Como seguramente ya habra notado (y podr a probar muy facilmente), los conjuntos definidos
anteriormente satisfacen unas propiedades muy elementales (adem as de algunas otras que veremos
mas adelante) y que dejamos expresadas en la siguiente
on 1.20 Si A Rn entonces:
Proposici
1. int(A) A
2. ext(A) Ac
3. int(A) ext(A) = int(A) Fr(A) = Fr(A) ext(A) =
4. Rn = int(A) Fr(A) ext(A)
5. int(Ac ) = ext(A) y Fr(A) = Fr(Ac )
Aun y cuando la definicion del tipo de puntos (y sus repectivos conjuntos) que acabamos de
dar, la hicimos bas andonos en un subconjunto de R2 muy bonito, hay casos para los cuales
dichos conjuntos no resultan ser los que esperamos que sean (claro, si acaso tuvieramos una idea
de quienes deberan de ser!). El ejemplo que a continuaci
on presentamos, es uno de esos casos.
Ejemplo 1.21 Sea A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}.

Determinaremos quienes son el int(A), el ext(A) y la Fr(A).
Primero mostraremos que si x = (x, y) es un punto arbitrario de R2 y r es cualquier n
umero real
2
x) (R \ Q Q) 6= de tal forma que, como A Q Q tendremos que
positivo, entonces Br (
x) (R2 \ A) = Br (
Br ( x) Ac 6= . Sea pues x = (x, y) R2 y r cualquier n
umero real positivo.
23 J. P
aez
Como es de todos conocido, existe x / Q tale que x < x < x+r. De estas desigualdades concluimos

que si y = (x , y) entonces d( x, y) = k(x, y) (x , y)k = |x x | < r de modo que y Br ( x), y
como y / Q Q (pues x / Q) entonces Br ( 2
x) (R \ Q Q) 6= .
De lo que acabamos de probar se desprende inmediatamente que int(A) = pues si x A, no
existe forma de encontrar r > 0 tal que Br ( x) A pues cualquier vecindad, sin importar cual es
su radio (e incluso sin importar cual es su centro) intersecta a Ac de tal forma que por el inciso 1
de la proposici on 1.20 tendremos que int(A) = .
El siguiente paso ser a mostrar que [0, 1] [0, 1] Fr(A). Sea x = (x, y) [0, 1] [0, 1] y r > 0.
Por el primer resultado que probamos, ya sabemos que Br ( x) Ac 6= . Restara probar que
x) A 6= .
Br (
Supongamos por ahora que 0 x < 1 y 0 y < 1. Por la densidad de los n umeros racionales
sabemos que existen x , y Q tales que x < x < min{1, x + r/ 2}y y < y < min{1, y + r/ 2}.
Tenemos entonces que (x , y ) A y adem as, dado que |x x | < r/ 2 y |y y | < r/ 2, entonces
q
k(x, y) (x , y )k = (x x )2 + (y y )2 < (r/ 2)2 + (r/ 2)2 = r de modo que (x , y )
p
Br (
x), es decir, Br ( x) A 6= .
Ahora, escogiendo a x y y como en el caso anterior (siempre que se pueda), si x = 1 y y < 1
entonces nos fijamos en la pareja (1, y ); si x < 1 y y = 1 elegimos a la pareja (x , 1), y si x = 1
y y = 1 a la pareja (1, 1). En todos estos casos, dichas parejas pertenecen a Br ( x) A con lo cual
queda probado tambien en estos casos que Br ( x) A 6= , y por lo tanto que [0, 1] [0, 1] Fr(A).
Finalmente, probaremos que R2 \ [0, 1] [0, 1] ext(A). Sea x = (x, y)
/ [0, 1] [0, 1] y supongamos
por ahora que x < 0 o 1 < x (la otra posibilidad es que y < 0 o 1 < y). Si x < 0 tomamos
r = |x| > 0 y afirmamos que Br ( x) R2 \ [0, 1] [0, 1] Ac . En efecto, si (x , y ) Br (
x), por la
desigualdad 1.8 se tiene que
x x (x, y) (x , y )

<r
= |x|
= x
de modo que x < x x < x y por la primera desigualdad, concluimos que x < 0 y por lo tanto
que (x , y ) x) R2 \ [0, 1] [0, 1] Ac . Si 1 < x
/ [0, 1] [0, 1], con lo que probamos que Br (
tomamos r = x 1 > 0 y afirmamos nuevamente que Br ( x) R2 \ [0, 1] [0, 1] Ac . En efecto,

si (x , y ) Br (x), otra vez por la desigualdad 1.8 se tiene que
x x (x, y) (x , y )

<r
=x1
de modo que 1x < xx < x1 y por la segunda desigualdad, concluimos que 1 < x . Por lo tanto
se tiene que (x , y ) x) R2 \ [0, 1] [0, 1] Ac .
/ [0, 1] [0, 1] con lo que probamos tambien que Br (
Si y < 0 o 1 < y procedemos de forma an aloga.
Reuniendo lo que hemos probado hasta ahora, y por los incisos 3 y 4 de la proposici on 1.20, tenemos
que
[0, 1] [0, 1] Fr(A) = Rn \ ext(A) [0, 1] [0, 1]
de donde concluimos que Fr(A) = [0, 1] [0, 1] y que ext(A) = Rn \ [0, 1] [0, 1].
J. P
aez 24
1.5.2 Conjuntos abiertos y cerrados

on de los puntos de Rn en relaci
Una vez que hemos hecho esta clasificaci on con un conjunto A Rn ,
ahora estamos en condiciones de dar una caracterizaci on de cierto tipo de subconjuntos de Rn .
Dado un conjunto A Rn , ya sabemos que int(A) A y que ext(A) Ac , pero en el caso
de la Fr(A) en general no siempre se cumple alguna de estas relaciones de contenci on, y justo
el conjunto A de la figura 1.11 ilustra un caso de ese tipo (lo que s sabemos en general es que
A = int(A) (A Fr(A)), identidad que siempre vale la pena recordar). Por esta raz on, los
conjuntos para los cuales se cumple que Fr(A) A o Fr(A) Ac (esto u ltimo equivalente a que
Fr(A) A = ) merecen un nombre aparte. Como con los pases, cuando un conjunto no tenga a
ninguno de sus puntos frontera (es decir que Fr(A) A = ), diremos que el conjunto es abierto,
y si Fr(A) A diremos que el conjunto es cerrado. Esta clasificaci on de conjuntos la dejamos
expresada en la siguiente
on 1.22 Sea A Rn . Decimos que:

Definici
1. A es un conjunto abierto si Fr(A) A =
2. A es un conjunto cerrado si Fr(A) A
Una primera observaci on que es muy importante hacer con relaci on a las definiciones anteriores,
es que las condiciones Fr(A) A = y Fr(A) A no son complementarias en el sentido de que
una de ellas sea la negacion de la otra. Es decir, si Fr(A) A 6= esto no implica que Fr(A) A,
y recprocamente, si Fr(A) " A esto no implica que Fr(A) A = . Dicho de otra forma, y en
terminos de las definiciones que acabamos de dar: si un conjunto A no es abierto esto no implica
que tenga que ser cerrado, y recprocamente, si un conjunto A no es cerrado esto no implica que
tenga que ser abierto. Mas aun, y dado que las condiciones Fr(A) A 6= y Fr(A) " A no se
contraponen (es decir, que pueden pasar ambas, como sucede con el conjunto A de la figura 1.11),
confirmamos que hay conjuntos que no son abiertos y tampoco son cerrados, y que son justo aquellos
que contienen a algunos de sus puntos frontera, pero no a todos ellos.
La segunda observaci on importante con relaci on a las definiciones que acabamos de dar, es que
estas no son las mas comunes, raz on por la cual lo primero que haremos ser a probar una proposici on
en la que se establecen las equivalencias con las definiciones mas populares (o mas conocidas, si
se prefiere).
on 1.23 Sea A Rn . Las siguientes afirmaciones son equivalentes:

Proposici
1. A es un conjunto abierto si y s A existe r > 0 tal que Br (

olo si para todo x x) A (es
decir, si A int(A) y por tanto que A = int(A))
olo si Ac es abierto
2. A es un conjunto cerrado si y s
Demostraci on. Inciso 1) (=) Sea x A; de acuerdo con el inciso 1 de la definicion 1.22 se tiene
que x/ Fr(A) y por lo tanto, de acuerdo con el inciso 3 de la definicion 1.19, debe existir r > 0
x) A = o Br (
tal que Br ( x) Ac = . Como x Br (
x) A la identidad que se debe cumplir
x) Ac = , lo que significa que Br (
es la segunda, es decir, que Br ( x) A (y por lo tanto que
int(A)).
x
Inciso 1) (=) Dado que A = A Rn , por los incisos 2, 3 y 4 de la proposici on 1.20 se tiene
que
A = A Rn = (A int(A)) (A Fr(A)) (A ext(A)) = A int(A)
25 J. P
aez
de donde A int(A) (y por el inciso 1 de la misma proposici on, se tiene que A = int(A)).
Inciso 2) (=) De acuerdo con el inciso 1 de la definicion 1.22, como A es cerrado se tiene que
Fr(A) A y por tanto que Fr(A) Ac = ; dado que Fr(A) = Fr(Ac ) (inciso 5 de la proposici on
1.20) tenemos que Fr(Ac ) Ac = y por lo tanto, de acuerdo con la defincion 1.22, se tiene que
Ac es un conjunto abierto.
Inciso 2) (=) Lea hacia atr
as el p
arrafo anterior!
En realidad, y para ser sinceros, las condiciones de la proposici

on anterior son las mas popu-
lares porque suelen ser las mas utiles cuando se trata de demostrar que un conjunto es abierto
o que un conjunto es cerrado. Y como prueba de esta afirmacion, a continuaci on damos algunos
ejemplos.
Ejemplo 1.24 Observe que:
1. Rn es un conjunto abierto. En efecto, n Rn se tiene que Br (

otese que para todo x x) R n
sin importar como sea r (muy grande o muy peque no) de forma que, por el inciso 1 de la
on anterior, Rn es un conjunto abierto.
proposici
2. Rn es un conjunto cerrado. En virtud de lo anterior, tenemos que Rn = int(Rn ) de forma tal

que Fr(Rn ) = (y de hecho tambien ext(Rn ) = ) de modo que Fr(Rn ) Rn y por el inciso
on anterior, Rn tambien es un conjunto cerrado.
2 de la proposici
3. Por los dos incisos anteriores (y la multicitada proposici on), se concluye que el conjunto
tambien es un conjunto abierto y cerrado (lo que por cierto prueba que los conjuntos (al menos
algunos de ellos) no son como las puertas: los hay algunos que son abiertos y cerrados al
mismo tiempo! El lector podra mostrar otro ejemplo con la misma caracterstica?).
4. Para todo x Rn y toda r > 0 se tiene que Br ( x) es un conjunto abierto. Veamos que se
cumple la condici on del inciso 1 de la susodicha proposicion. Sea y Br (
x); como se ilustra
en la figura 1.12 (para el caso de R ), todo parece indicar que si tomamos r = r k
2 x yk > 0
entonces se debe tener que Br ( y ) Br (
x). La clave para probar esta contenci on est
a en la
desigualdad del tri
angulo (inciso 1 de la proposici
on 1.12) pues, con base en dicha desigualdad,
tenemos que si z Br (
y ) entonces
k
x zk = k(
x y) + (
y z)k
k
x yk + k
y zk
= k
x yk + k
z yk
< k
x yk + r k
x yk
=r
y por lo tanto z Br ( y ) Br (
x), de donde Br ( x). Esto prueba que se satisface la condici
on
del inciso 1 de la famosa proposicion, y por lo tanto que Br (x) es un conjunto abierto.
Asociado a cualquier subconjunto A de Rn hay un conjunto que siempre resultara ser abierto,
a abierto dado que ext(A) = int(Ac ) (inciso 5 de la
el int(A) (y por lo tanto el ext(A) tambien ser
proposici
on 1.20)). Que el int(A) siempre sea un conjunto abierto no es extra
no, pues este conjunto
se obtiene de quitar al conjunto A aquellos puntos de su frontera que pudieran estar contenidos en
el. Es decir que
int(A) = A \ Fr(A) (1.9)
J. P
aez 26
k
x yk
r
b
y
b
Figura 1.12: La bola de radio r con centro en x

es un conjunto abierto
Basados en este hecho nos podemos preguntar ahora que sucede si a un conjunto A, en lugar
de quitarle sus puntos frontera, se los agregamos. Es decir, que tipo de conjunto resultara ser
A Fr(A)? Pues bien, como seguramente el lector ya intua, este conjunto siempre resultara ser
un conjunto cerrado y hasta tiene un nombre que refleja esta propiedad: la cerradura de A. Este
conjunto lo usaremos mucho a lo largo de este texto, y por esta razon le dedicamos la siguiente
n
on 1.25 Sea A R . Definimos la cerradura de A, que denotamos por A,
Definici como
A := A Fr(A)
Resumiendo lo hecho hasta aqu, dado A Rn arbitrario, hemos definido (por ahora) cuatro
Ahora, si recordamos, por el
conjuntos asociados a dicho conjunto: int(A), ext(A), Fr(A) y A.
inciso 4 de la proposici
on 1.20, que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
todo parece indicar que el complemento de la Fr(A) ser a un conjunto abierto, y por lo tanto este
ser
a cerrado. Es decir, de estos cuatro conjuntos, el int(A) y el ext(A) ser
an conjuntos abiertos,
mientras que Fr(A) y A seran conjuntos cerrados. Dada la importancia de estas propiedades, las
dejaremos establecidas en la siguiente
on 1.26 Sea A Rn arbitrario. Las siguientes afirmaciones son ciertas:

Proposici
1. el int(A) y el ext(A) son conjuntos abiertos
2. la Fr(A) y A son conjuntos cerrados
Demostraci on. Inciso 1) De acuerdo con el inciso 1 de la proposici on 1.23, necesitamos mostrar
int(A) entonces existe r > 0 tal que Br (
que si x x) int(A). Ahora, como x int(A) sabemos
que existe r > 0 tal que Br (x) A; aseguramos que Br (x) int(A). En efecto, si y Br (
x) como
y ) Br (
se mostro en el inciso 4 del ejemplo 1.24, existe r > 0 tal que Br ( x) A, lo que prueba
que y int(A) y por tanto que Br (x) int(A). En cuanto al ext(A), como mencionamos arriba,
dado que ext(A) = int(Ac ) (inciso 5 de la proposici on 1.20), por la primera parte de este inciso
tenemos que este aconjunto tambien es abierto.
27 J. P
aez
Inciso 2) Como tambien hicimos notar anteriormente, por el inciso 4 de la proposici

on 1.20,
tenemos que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
de tal forma que, por el inciso (a) del problema 21 concluimos que (Fr(A))c es un conjunto abierto y
por lo tanto que Fr(A) es cerrado. Con respecto a A observese que, como A = int(A) (A Fr(A))
entonces A Fr(A) = int(A) Fr(A) y por tanto
c = Rn \ (A Fr(A)) = Rn \ (int(A) Fr(A)) = ext(A)
(A)
c es un conjunto abierto y por lo tanto A ser
de modo que (A) a un conjunto cerrado.
1.5.3 Otra clasificaci

on de puntos
on de los puntos de Rn en terminos de su posici
Si en la definicion 1.19 hicimos una clasificaci on
n
con respecto de un conjunto A R (mas alla de su relaci on de pertenencia con dicho conjunto),
ahora introduciremos una nueva clasificaci on en la que trataremos de reflejar si un punto x Rn
a pegado a (o contrariamente aislado de) un conjunto A Rn . Para hacer esto, nuevamente
est
haremos uso de las vencidades (o bolas) centradas en este punto x . De hecho, al parecer es natural
pensar que un punto x Rn est
a pegado a un conjunto A Rn si cualquiera de sus vecindades
Br (
x) (es decir, sin importar el tama no de su radio) comparte muchos puntos con el conjunto
(y por lo tanto, diferentes de x, el cual ni siquiera tendra que pertenecer a A). Con base en esta
idea intuitiva es que definimos los conceptos de punto de acumulaci on y punto!aislado (este ultimo
como lo contrario del primero) de un conjunto A R . n
on 1.27 Sean A Rn y x
Definici Rn . Decimos que:
1. x
es un punto de acumulaci x) \ {
on de A si para toda r > 0 se tiene que (Br ( x}) A 6= 4 .
Al conjunto formado por los puntos de acumulaci
on de A lo denotamos por A , es decir
A := {
x Rn | x
es punto de acumulaci
on de A}
2. x
es un punto aislado de A si x
no es un punto de acumulaci
on de A, es decir, si existe r > 0
x}) A = .
x) \ {
tal que (Br (
Es muy importante destacar que esta relaci on entre un punto x y un conjunto A es completa-
mente independiente de la relaci
on de pertenencia que x
tenga con el conjunto A. En efecto, si x
es
un punto de acumulacion de A esto no significa que x
tenga que pertenecer a A, y recprocamente,
aun y cuando x A, puede suceder que x no es un punto de acumulaci on de A, es decir, puede
es un punto aislado de A. El siguiente ejemplo ilustra (en R2 ) estos hechos.
suceder que x
Ejemplo 1.28 Sea A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} = B1 ((0, 0)) {(2, 2)} (ver figura
1.13). Afirmamos que:

1. el punto (1/ 2, 1/ 2), que no pertenece a A, es un punto de acumulaci on de A. En efecto,
observe que dado r > 0, entonces el punto

1 r 1 r 1
, = (1, 1)
2 2(r + 1) 2 2(r + 1) 2(r + 1)
4
Un conjunto de la forma Br (
x) \ {
x} se dice que es una vecindad agujerada de x
.
J. P
aez 28
es tal que

1 r 1 r = 1

, k(1, 1)k
2 2(r + 1) 2 2(r + 1) 2(r + 1)
1
= 2
2(r + 1)
1
=
r+1
<1
y por lo tanto pertenece a A.

Por otra parte, se tiene que

1 1 1 r 1 r
0< ,
,
2 2 2 2(r + 1) 2 2(r + 1)

r r
= ,
2(r + 1) 2(r + 1)
r
= k(1, 1)k
2(r + 1)
r
= 2
2(r + 1)
r
=
(r + 1)
<r
de donde concluimos que este punto tambien pertenece al conjunto

Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)}
y por lo tanto que

Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)} A 6=

es decir, que (1/ 2, 1/ 2) es un punto de acumulaci
on de A.
2. el punto (2, 2), que es un punto que pertenece a A, es un punto aislado de A. Observese que si
tomamos la bola (o vecindad) de radio 1 con centro en este punto, entonces B1 ((2, 2))A = .
En efecto, si (x, y) B1 ((2, 2)) se cumplen las siguientes desigualdades:
k(2, 2)k k(x, y)k k(2, 2) (x, y)k

<1
y por lo tanto
k(2, 2)k 1 < k(x, y)k

y como 1 < k(2, 2)k 1 = 2 2 1 < k(x, y)k entonces 1 < x2 + y 2 , es decir, (x, y)
/ A.
Dado un conjunto A Rn , la relaci on de los puntos de acumulaci on con aquellos que se

definieron en 1.19 no es muy estrecha, pues cada uno de ellos expresan una relaci
on diferente con
29 J. P
aez
2 b
3 2 1 1 2
Figura 1.13: El conjunto A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} del ejemplo 1.28
dicho conjunto. Sin embargo, existen algunas contenciones entre ellos que es importante destacar.
Tal es el caso de los puntos interiores de A, los cuales siempre resultan ser puntos de acumulaci on, es

decir que int(A) A . Tambien resulta natural que los puntos exteriores de A esten (o sean) aislados
de A, es decir que A ext(A) = , o equivalentemente, que A Rn \ ext(A) = int(A) Fr(A).
Estas contenciones establecen una relaci on muy especfica entre los puntos de acumulaci on de un
conjunto A y sus correspondientes puntos interiores y exteriores, lo que no sucede con los puntos
frontera. En efecto, el conjunto A del ejemplo 1.24 nos es u til para ilustrar este hecho; en este caso,
el (0, 0) es un punto de acumulaci on de A (ya que es un punto interior de A) y no es un punto
frontera de A (por la misma raz on); sin embargo, el punto (2, 2) es un punto frontera de A y como
se mostro en ese ejemplo, no es un punto de acumulaci on de A.
Las contenciones dadas en el p arrafo anterior son muy importantes y por esta raz on las dejamos
expresadas en la siguiente
Proposici on 1.29 Si A Rn es un conjunto arbitrario entonces
int(A) A int(A) Fr(A)
Demostraci
on. Como es de suponerse, la prueba de esta proposici
on se deja al lector.
Cuando expresamos en terminos intuitivos lo que debera de pasar para que un punto x
Rn fuera un punto de acumulaci on de un conjunto A, dijimos que cualquier vecindad Br ( x) (sin
importar que tan grande o pequeno fuera r) tendra que tener muchos puntos de A. Lo siguiente
que vamos a mostrar es que, de la definicion formal que dimos, en efecto se desprende que esto
Rn es un punto de acumulaci
debe ser as: x on de A si y s x) A es
olo si para toda r > 0, Br (
un conjunto infinito.
Proposici on 1.30 Sea A Rn . Se satisface que x Rn es un punto de acumulaci

on de A si y
s x) A es un conjunto infinito.
olo si para todo r > 0 se tiene que Br (
Demostraci on. Para probar que esta propiedad es una condici on necesaria del hecho de que x
es un punto de acumulaci on de A, procederemos por el metodo de la contrapuesta. Supongamos
entonces que existe r > 0 tal que Br (
x)A es un conjunto finito. Si (Br ( x)\{ x})A = entonces x
es un punto aislado de A y por lo tanto ya habremos terminado. Si (Br ( x) \ {
x}) A = { k }
x1 , . . . , x
hacemos r = min{k xx i k | i {1, . . . , k}}. Es claro que r > 0 y adem as, como r k xx i k
J. P
aez 30
x) \ {
para toda i {1, . . . , k} entonces (Br ( x}) A = con lo que de nuevo concluimos que x es
un punto aislado de A.
Para probar la suficiencia, basta observar que si Br ( x) A es un conjunto infinito para toda
r > 0, entonces es inmediato que (Br ( x) \ {x}) A 6= de modo que x
es un punto de acumulacion
de A.
La proposicion anterior tiene un corolario muy interesante, pues establece una condici on sufi-
ciente para que un conjunto no tenga puntos de acumulaci on (o si se prefiere, una condicion (o
consecuencia) necesaria del hecho de que un conjunto s tenga puntos de acumulaci on): si un con-
junto A Rn es finito entonces A = (o equivalentemente: si A 6= entonces A es un conjunto
infinito). Escribiremos el corolario de la segunda forma.
Corolario 1.31 Sea A Rn . Si A 6= entonces A es un conjunto infinito.
Una pregunta muy importante es si la afirmacion recproca del corolario anterior es cierta: si
A es un conjunto infinito entonces A 6= ? La respuesta es negativa y el ejemplo es el conjunto A
que se da en el problema 25.
La siguiente pregunta es entonces: adem as de ser infinito, que otra propiedad debe tener un
conjunto A para que se pueda asegurar que al menos tiene un punto de acumulaci on? Y la clave
para responder esta pregunta nos la da el conjunto A que acabamos de usar como contraejemplo, y
el resultado del problema 35. En este problema se establece que, si un conjunto tiene al menos un
punto de acumulaci on (es decir, que A 6= ) entonces para cualquier cantidad positiva (sin importar
que peque na la tomemos), deben existir un par de elementos de A cuya distancia entre ellos es menor
que esa cantidad positiva. Es decir, sin importar que distancia elijamos, siempre debemos de poder
encontrar elementos en A cuya distancia entre ellos sea menor que la distancia elegida. Y si el
lector observa con cuidado, el conjunto A del problema 25 no satisface esta propiedad, y peor aun,
en este caso tenemos que k x yk 1 para todo x , y A, x
6= y.
De la discusion anterior se desprende la siguiente pregunta: que propiedad tiene el conjunto A
del problema 25, que adem as de ser infinito, permite que la distancia entre cualesquiera dos de sus
elementos sea mayor o igual que una cierta cantidad positiva fija? Pues una propiedad del conjunto
A que hasta ahora no hemos observado es que, sin importar que grande se elija un n umero M > 0,
siempre podemos encontrar un x A tal que k xk M . Mas aun, observese que dado un n umero
M > 0, sin importar lo grande que este sea, la norma de casi todos los elementos del conjunto A
(es decir, todos salvo un n umero finito de ellos) rebasa a este n umero M .
Cuando un conjunto A tiene la propiedad de que, sin importar que grande se elija un n umero
M > 0, siempre podemos encontrar un x A tal que k xk M , se dice que este conjunto en no
acotado. O dicho de manera positiva, cuando sucede lo contrario, decimos que el conjunto est a
acotado. Este concepto resultara ser muy importante para la pregunta que nos hicimos con respecto
a la proposicion recproca del corolario 1.31, y por esta raz on lo dejamos plasmado en la siguiente
on 1.32 Sea A Rn . Decimos que A es un conjunto acotado (o simplemente que est

Definici a
acotado) si existe M > 0 tal que k
xk M para todo x
A.
En terminos geometricos, decir que un conjunto A est a acotado significa que este queda con-
tenido en alguna bola (o vecindad) con centro en el origen (observe que, de la definicion anterior,
se desprende que A BM +1 ( 0)).
Como seguramente el lector ya habra sospechado, para que podamos asegurar que un conjunto
infinito A tiene al menos un punto de acumulaci
on, ser
a suficiente con que este tambien sea acotado.
31 J. P
aez
Este es un resultado tan importante, que hasta tiene nombre: teorema de Bolzano-Weierstrass 5 . La
prueba de este teorema requiere que contemos con la versi on generalizada (a Rn ) de un conocido
teorema de los n umeros reales: el teorema de los intervalos anidados. Por esta raz on, primero
definiremos todo lo necesario para formular dicha generalizaci on, la probaremos, y finalmente la
usaremos para demostrar el teorema de Bolzano-Weierstrass.
Lo primero que haremos sera generalizar el concepto de intervalo cerrado, de la siguiente manera.
Definicion 1.33 Dados a1 , ..., an , b1 , ...bn R tales que ai bi para i = 1, ..., n, decimos que el
conjunto
R = [a1 , b1 ] [an , bn ] = {(x1 , ..., xn ) Rn | ai xi bi , i {1, ..., n}}
es un rect
angulo cerrado. Asimismo, definimos la diagonal de R, que denotamos por d(R), como
diag(R) := k(b1 , ...bn ) (a1 , ..., an )k
Con relaci
on a este tipo de conjuntos, estableceremos sus propiedades mas elementales en el
siguiente
Lema 1.34 Sea R = [a1 , b1 ] [an , bn ] = {(x1 , ..., xn ) Rn | ai xi bi , i = 1, ..., n} un

rect
angulo cerrado. Se satisfacen las siguientes afirmaciones:
1. R es un conjunto cerrado.
, y R entonces k
2. si x x yk diag(R).
R y d(R) < r entonces R Br (

3. si x x).
4. si R = [a1 , b1 ] [an , bn ] se tiene que: R R si y s

olo si [ai , bi ] [ai , bi ] para toda
i {1, ..., n}.
Como el lector estar a de acuerdo, todas estas propiedades son muy sencillas de probar, raz on
por la cual se deja que el las haga.
Con base en la definicion y lema anteriores, estamos en condiciones de formular y probar lo que
llamaremos el teorema de los rect angulos anidados, de la siguiente manera.
Teorema 1.35 (de los rect angulos anidados) Si {Rk } es una sucesi
on anidada de rect
angulos
cerrados (es decir, Rk+1 Rk para toda k N) entonces

\
Rk 6=
k=1
5
El teorema de Bolzano-Weierstrass lleva el nombre de los matem aticos Bernard Bolzano (Bernard Placidus Johann
Gonzal Nepomuk Bolzano (Praga, Bohemia (actual Rep ublica Checa), 5 de octubre de 1781 - dem, 18 de diciembre de
1848), conocido como Bernard Bolzano fue un matem atico, logico, fil
osofo y te
ologo bohemio que escribi
o en aleman
y que realiz
o importantes contribuciones a las matem aticas y a la Teora del conocimiento), y Karl Weierstrass (Karl
Theodor Wilhelm Weierstra (escrito Weierstrass cuando no est a disponible el caracter ) (Ostenfelde, 31 de
octubre de 1815 - Berln, 19 de febrero de 1897) matem atico aleman al que se suele citar como el padre del analisis
moderno). En realidad, este teorema fue demostrado por primera vez en 1817 por Bolzano, como un lema en la
demostraci on del teorema de valor intermedio. Unos cincuenta a nos mas tarde, el resultado fue identificado como
significativo por derecho propio, y demostrado una vez mas por Weierstrass. Desde entonces se ha convertido en un
teorema fundamental del an alisis. (fuente: Wikipedia).
J. P
aez 32
Si adem
as se tiene que limk diag(Rk ) = 0 entonces

\
Rk = {
x0 }
k=1
para alg 0 Rn .
un x
Demostracion. Esta prueba estar

a basada en el correspodiente teorema de los intervalos anidados.
Supongamos que para cada k N se tiene que
h i h i
(k) (k)
Rk = a1 , b1 a(k) (k)
n , bn
Por el inciso 4 del lema 1.34 sabemos que, para cada i {1, ..., n}, la sucesion
n h io
(i) (k) (k)
Ik = ai , bi
(i)
es una sucesion de intervalos (cerrados) anidados, de tal forma que k=1 Ik 6= . Por tanto, si
T
(i)
para cada i {1, ..., n} elegimos xi = (x1 , ..., xn )
T T
k=1 Ik entonces se verifica que x k=1 Rk .
En efecto, para cada i {1, ..., n} se tiene que
h i
(i) (k) (k)
x i I k = a i , bi
de tal forma que h i h i

(k) (k)
= (x1 , ..., xn ) a1 , b1 a(k)
x n , b (k)
n = Rk

T
y como esto es valido para cada k N entonces x k=1 Rk 6= .
T
k=1 Rk , esTdecir que
Supongamos ahora que limk diag(Rk ) = 0 y que x , y k=1 k R . Por el inciso 2 del lema
1.34 sabemos que
0 k
x yk diag(Rk )
de tal forma que, si en las desigualdades anteriores tomamos el lmite cuando k , obtenemos
que
0 k
x yk 0
= y. Esto prueba que todos los elementos de
T
es decir, que k
x yk = 0 y por tanto que x k=1 Rk
son iguales, lo que significa que dicho conjunto consta de un solo punto.
Ya casi todo est a listo para poder formular y probar el teorema de Bolzano-Weierstrass y
s
olo resta mencionar la forma en que, en dicha demostracion, subdividiremos a un rect angulo R =
[a1 , b1 ] [an , bn ]. Simplemente partimos a cada intervalo coordenado [ai , bi ] en los subintervalos
[ai , (ai + bi )/2] y [(ai + bi )/2, bi ] (i {1, ..., n}) y construiremos todos los rect
angulos que tengan
como i-esimo intervalo coordenado a cada uno de estos subintervalos. Con este procedimiento
obtenemos 2n rect angulos cerrados
S n Rk cuyas propiedades, que por ahora nos interesa destacar, son
las siguientes: Rk R, R = 2k=1 Rk y diag(Rk ) = diag(R)/2 (propiedades que el lector podr a
probar muy facilmente).
Una vez hecho lo anterior formularemos el teorema de Bolzano-Weierstrass, no sin antes men-
cionar que el procedimiento que usaremos en su demostracion hasta tiene un nombre: la cacera
del le on.
33 J. P
aez
Teorema 1.36 (de Bolzano-Weierstrass) Si A Rn es un conjunto infinito y acotado entonces

on (es decir, A 6= ).
A tiene al menos un punto de acumulaci
Demostraci on. Sea M > 0 tal que k xk M para toda x A. Si hacemos R = [M, M ]
[M, M ] tenemos entonces que A R. Ahora subdividimos a R en la forma que mencionamos
antes.
Dado que A R, que R es la uni on de todos los rect
angulos inducidos por la subdivision que
hicimos, y que A es infinito, se debe tener entonces que en alguno de estos rect
angulos inducidos, al
que llamaremos R1 , debe de haber una infinidad de puntos de A, es decir, R1 R es un rect angulo
cerrado tal que A R1 es un conjunto infinito y

diag(R1 ) = diag(R)/2 = (2 2M )/2 = 2M.
Ahora subdividimos a R1 en la forma que mencionamos antes. Dado que A R1 R1 , que R1
es la uni angulos inducidos por la subdivision que le hicimos, y que A R1 es
on de todos los rect
infinito, entonces en alguno de estos rect
angulos inducidos, al que llamaremos R2 , debe de haber
una infinidad de puntos de A R1 , es decir, R2 R1 es un rect angulo cerrado tal que
(A R1 ) R2 = A (R1 R2 ) = A R2
es un conjunto infinito y

diag(R2 ) = diag(R1 )/2 = diag(R)/22 = (2 2M )/22 = 2M/2
Como el lector ya habra notado, este es un procedimiento que podemos seguir indefinidamente,
es decir, es un proceso inductivo. En efecto, si para una cierta k N ya hemos construido un
rect
angulo cerrado Rk con las siguientes propiedades:
1. Rk Rk1 R1 R
2. A Rk es un conjunto infinito, y

2M
3. diag(Rk ) = 2k1
entonces podemos construir un rect angulo cerrado Rk+1 , que tenga las propiedades equivalentes.
Como? De la siguiente manera: subdividimos a Rk en la forma en que hemos venido haciendolo.
Dado que A Rk Rk , que Rk es la uni on de todos los rectangulos inducidos por la subdivision
que le hicimos, y que A Rk es infinito, en alguno de los rect
angulos inducidos por esta subdivisi
on,
al que llamaremos Rk+1 , debe de haber una infinidad de puntos de A Rk , es decir, Rk+1 ser a un
rect
angulo cerrado que satisface las propiedades deseadas:
1. Rk+1 Rk ,
2. (A Rk ) Rk+1 = A (Rk Rk+1 ) = A Rk+1 es un conjunto infinito, y

3. diag(Rk+1 ) = diag(Rk )/2 = ( 2M/2k1 )/2 = 2M/2k
(ver figura 1.14).

Con base en este procedimiento obtenemos entonces una sucesion (infinita) de rect angulos
cerrados {Rk } que satisfacen las propiedades que enlistamos anteriormente. De esta forma, por el
teorema de lo rectangulos anidados (1.35), sabemos que

\
Rk = {
x0 }
k=1
J. P
aez 34
M
R
R2
R3
R1
M M
Figura 1.14: La cacera del le

on
para alg 0 Rn .
un x
Aseguramos que x 0 es un punto de acumulaci
on de A. Sea r > 0; como
lim diag(Rk ) = 0
k
existe N N tal que si k N entonces 0 diag(Rk ) < r. Por otra parte, como x 0 Rk para toda
k N entonces por el inciso 3 del lema 1.34 se tiene que Rk Br (
x0 ) de tal forma que A Rk
A Br (
x0 ), y como A Rk es un conjunto infinito, podemos concluir que (Br ( x0 }) A 6=
x0 ) \ {
y por lo tanto que x0 es un punto de acumulacion de A.
1.5.4 Conjuntos conexos

Concluiremos esta secci on (y este captulo!) mostrando de que forma los conceptos que hasta ahora
hemos desarrollado, se pueden usar para definir de manera muy precisa un hecho geometrico que es
intuitivamente muy claro: cuando un conjunto est a formado de una sola pieza? Es decir, cuando
un conjunto no est a roto?
En realidad lo que haremos ser a establecer cu
ando se puede decir que un conjunto est a roto
o separado (y consecuentemente los conjuntos que son de una sola pieza (o conexos, como suele
llamarseles) ser
an los que no estan rotos o separados).
Intuitivamente, un conjunto A Rn estar a roto si se puede poner como la union de otros dos
conjuntos B y C, para los cuales hay alguna forma de decir que est an separados.
Tal vez la primera idea que se nos venga a la cabeza para decir que dos conjuntos est
an separados,
es que simplemente sean ajenos (y claro, diferentes del vaco!). Desafortunadamente, aun y cuando
dos conjuntos sean ajenos, estos pueden embonar (o empatar) muy bien, de tal forma que al unirlos
formen un conjunto que no este roto. Tal es el caso de los siguientes conjuntos: B = [0, 1/2][0, 1]
y C = (1/2, 1] [0, 1] (ver figura 1.15) los cuales, al unirlos, nos da el conjunto A = [0, 1] [0, 1]
el cual no es el tipo de conjunto del que se pudiera decir que est a roto. De hecho, cualquier
35 J. P
aez
conjunto A (este o no este roto, y con m

as de un punto) podemos expresarlo como la uni on de
dos conjuntos ajenos; bastara con tomar un subconjunto propio B (y no vaco) de A ( 6= B A)
y C = A \ B para que el conjunto A quedara expresado de esta forma.
B C
1
1
2 1
Figura 1.15: El conjunto A = [0, 1] [0, 1], que no esta roto, es la uni
on de los conjuntos ajenos
B = [0, 1/2] [0, 1] y C = (1/2, 1] [0, 1].
Por el ejemplo (y la observaci on) anterior concluimos que pedir que dos conjuntos s olo sean
ajenos, no es una buena forma de decir que estos est an separados. Pero no hay que desanimarse,
pues la clave de nuestro problema se encuentra en la segunda clasificaci on que hicimos de los puntos
de Rn con respecto de un conjunto A.
En efecto, como se recordara, intuitivamente los puntos de acumulaci on de un conjunto se
pueden interpretar como los puntos que est an pegados a A, de tal forma que si un conjunto no
s
olo es ajeno a A sino que tampoco tiene puntos que est an pegados a A (es decir, es ajeno a A ),
entonces s que podremos decir que dicho conjunto estar a separado de A. En resumen, si B y C
son dos conjuntos tales que B C = y adem as B C = entonces podemos decir que B est a
separado de C; y recprocamente, si tambien sucede que B C = entonces podemos decir que
ambos est an separados uno del otro.
Con base en la discusion anterior definiremos lo que significa que dos conjuntos esten separados.
Como seguramente el lector ya sospecha, en esta definicion aparecera la uni on de un conjunto y su
correspondiente conjunto de puntos de acumulaci on, es decir A A . Por esta raz
on, adelantaremos
que el lector probara en el inciso (d) del ejercicio 27 que esta union es igual a la cerradura de A, es
decir que A A = A, y que es como nos referiremos a ella en la siguiente
Definici on 1.37 Sean B, C Rn . Decimos que B y C est an separados si B C = = B C.
Si bien es cierto que en la discusion previa a esta definicion hicimos notar que el hecho de que
dos conjuntos sean ajenos no es suficiente para que estuvieran separados, si los conjuntos son de
cierto tipo, entonces el que sean ajenos si es suficiente para que esten separados. Estos casos los
dejaremos expresados en la siguiente proposici on, cuya prueba quedar a a cargo del lector.
on 1.38 Sean B, C Rn .
Proposici
1. Si B y C son abiertos, entonces B y C est

an separados si y s
olo si B y C son ajenos (es
decir, B C = )
2. Si B y C son cerrados, entonces B y C est

an separados si y s
olo si B y C son ajenos (es
decir, B C = )
J. P
aez 36
Como habamos adelantado, una vez que contamos con este concepto es muy sencillo definir lo
que significa que un conjunto este roto, o que sea disconexo, que es el termino que realmente se
usa.
Definici on 1.39 Sea A Rn . Decimos que A es un conjunto disconexo si existen B, C Rn , no

vacos, tales que:
1. A = B C, y
an separados, es decir B C = = B
2. B y C est C
Y como tambien ya habamos mencionado, un conjunto ser a conexo si no es disconexo (o dicho

con toda propiedad, si es no disconexo), lo que formalizamos en la (casi) u
ltima definicion de este
captulo.
on 1.40 Sea A Rn . Decimos que A es un conjunto conexo si A no es disconexo.

Definici
La definicion anterior amerita un comentario importante: el concepto de conexidad se define

con base en una negaci on. Este es una caracterstica importante de resaltar puesto que este tipo
de conceptos son un poco mas difciles de manejar. Especficamente, si se quisiera desmostrar
directamente que un conjunto A es conexo, habra que demostrar que no existen B, C Rn , no
vacos y separados, tales que A = B C. Y como seguramente el lector a estas alturas ya habra
aprendido, demostrar que algo no existe siempre suele ser mas difcil y casi siempre lo mas pr actico
es suponer que ese algo si existe, para despues tratar de llegar a una contradiccion, es decir, proceder
por contradicci on.
Por esta misma raz on, encontrar condiciones suficientes y/o necesarias para que un conjunto
sea conexo adquiere particular importancia, y eso es justo lo que vamos a hacer en lo que resta de
este captulo.
Y para iniciar esta tarea, empezaremos por establecer una condici on necesaria y suficiente para
que un conjunto abierto sea conexo, para lo cual nos ser autil dar la siguiente
Definici
on 1.41 Sean x , y Rn . Definimos el segmento (de recta) que une a x
con y, y que
denotamos por [
x, y], como al conjunto dado por
x, y] := {
[ yx
x + t( ) = (1 t) y Rn | 0 t 1}
x + t
El primer resultado que probaremos, y que nos ser

a muy u til en todo lo relacionado con la cone-
xidad, es geometricamente muy claro: si dos conjuntos B, C Rn est an separados, y tomamos
un punto x B y otro punto y C, es de esperarse que el segmento que une a estos puntos no
este contenido en la uni x, y] * B C. Este hecho lo probaremos en el
on de B y C, es decir que [
siguiente
Lema 1.42 Sean B, C Rn tales que x B y y C. Si B y C est an separados entonces el

segmento que une a x
y y no est
a contenido en la uni x, y] * B C.
on de B y C, es decir que [
Demostraci
on. Construimos el siguiente conjunto:
S = {s [0, 1]| yx
x + t( c para toda t [0, s]}
) (C)
Observe que este conjunto es no vaco, pues tomando s = 0 en la definicion del conjunto S obtenemos
c , en donde esta u
que pertenece a B (C)
el punto x ltima contencion se cumple ya que B C = ,
37 J. P
aez
lo cual a su vez es cierto puesto que B y C estan separados. Por otra parte, S esta contenido en el
intervalo [0, 1] y por lo tanto est
a acotado superiormente por el 1 (e inferiormente por el 0, lo que
por ahora no resulta muy importante).
De esta forma, por la propiedad del supremo de los n umeros reales, existe R tal que
= sup(S). Dado que S [0, 1] se tiene que [0, 1] de modo que si x 0 = x yx
+ ( ) entonces
0 [
x x, y]. Con respecto a este n umero es importante hacer notar que se satisface la siguiente
contencion:
[0, ) S (1.10)
ya que si 0 s < , de la definicion de supremo sabemos que existe s S tal que s < s < de
modo que, por la forma en que est a definido el conjunto S, se tiene que x yx
+ t( c para
) (C)

toda t [0, s ] y por lo tanto para toda t [0, s] [0, s ], por lo que se concluye que s S.
Otro hecho que podemos asegurar es que x 0 / B. En efecto, si x 0 estuviera en B, dado que
c (por la raz
B (C) on que ya explicamos) entonces < 1 y x c , y como C es un conjunto
0 (C)
cerrado (inciso 2 de la proposici on 1.26) entonces (C) c es un conjunto abierto de modo que existira
r > 0 tal que Br ( c . Notese ahora que, si
x0 ) (C)

1 r
r = min ,
2 x yk
2k
entonces para toda t + r se tiene que
k
x0 ( yx
x + t( ))k = k( yx
x + ( )) ( yx
x + t( ))k
= k( t)(
yx
))k
= ( t)k
x yk
r k
x yk
r

2
<r
y por lo tanto x y x
+t( ) Br (
x0 ) (C) c . De esta contenci on, y por la contencion 1.10, concluimos
que x
+ t(yx para toda t [0, + r ] [0, 1] y por lo tanto que + r S, lo cual
) (C) c
contradice el hecho de que = sup(S).

Si x0
/ C ya habremos terminado pues entonces x 0 / B C. Pero s puede suceder que x 0 C
(podra dar el lector un ejemplo en el que esto fuera cierto?). En este caso mostraremos que
podemos obtener otro punto x 0 [
x, y] tal que x 0
/ B C, de la siguiente forma: si x 0 C, dado
que B C = (porque B y C est an separados) entonces 0 < y x c , y como este es un
0 (B)
conjunto abierto, existe r > 0 tal que Br ( c . Sea
x0 ) (B)

r
t = min ,
2 2k x yk
Entonces, como 0 < t < 1, si tomamos x 0 = x

+ ( t )(
yx ) [
x, y] tenemos, por la
contenci
0 (C)
on 1.10, que t S y por lo tanto que x c , de donde concluimos que x 0
/ C. Por
otra parte, como
0 k = ( x + ( t )(

k
x0 x yx
x + ( )) (( yx )))
= t (

yx
)
= t k
x yk
J. P
aez 38
r

2
<r
0 Br (
se tiene que x c de donde ahora concluimos que x
x0 ) (B) 0 0
/ B. Es decir, x / B C.
Con base en este lema vamos a obtener resultados muy importantes, y con el primero de ellos
lograremos probar que una clase muy grande y muy importante de conjuntos, son conexos. Nos
referimos a los llamados conjuntos convexos, los cuales definimos a continuaci
on.
Definici on 1.43 Sea A Rn . Decimos que A es un conjunto convexo si para cada par de puntos
, y A se tiene que [
x x, y] A.
Antes de probar el resultado que anunciamos, mostraremos algunos ejemplos de conjuntos
convexos.
Ejemplo 1.44 Los siguientes conjuntos, son ejemplos de conjuntos convexos:
1. El espacio total Rn . Esto es un hecho inmediato, puesto que estamos hablando de conjunto
, y Rn , por supuesto que [
que constituye nuestro universo. Si x x, y] Rn .
, y Rn el segmento que los une [
2. Para todo x x, y]. Observe que, si tomamos x yx
+ s( ) y
x yx
+ s (
), con s, s [0, 1], es decir x yx
+ s( ), x yx
+ s ( ) [x, y], entonces se tiene
que
( yx
x + s( x + s (
)) + t( yx
) ( yx
x + s( + (s + t(s s))(
))) = x yx
)
+ ((1 t)s + ts )(
=x yx
)
y como (1t)s+ts [0, 1] para toda t [0, 1] concluimos que [
x+s( x), x+s (
y y
x)] [
x, y],
es decir que [
x, y] es convexo.
3. Cualquier bola (o vecindad) con centro en cualquier punto x 0 Rn y de cualquier radio r > 0
(Br ( , y Br (
x0 )). En efecto, si x x0 ) y t [0, 1] se tiene que
k
x0 ( yx
x + t( ))k = k( x0 x
x0 + t( 0 )) ( yx
x + t( ))k
= k(t
x0 + (1 t)
x0 ) (t
y + (1 t)
x)k
= kt(
x0 y) + (1 t)(
x0 x
)k
t k
x0 yk + (1 t) k
x0 x
k
< tr + (1 t)r
=r
x, y] Br (
lo que prueba que [ x0 ).
angulo cerrado R = [a1 , b1 ] [an , bn ]. Sean x
4. Cualquier rect = (x1 , ..., xn ), y = (y1 , ..., yn )
R y sea t [0, 1]. Como ai xi , yi bi y t [0, 1] entonces tai tyi tbi y (1 t)ai
(1 t)xi (1 t)bi de tal forma que
tai + (1 t)ai tyi + (1 t)xi tbi + (1 t)bi
es decir, tenemos que
ai tyi + (1 t)xi = xi + t(yi xi ) bi
para cada i {1, . . . , n}, y por lo tanto que x
+t( y x
) = (x1 +t(y1 x1 ), . . . , xn +t(yn xn ))
R para toda t [0, 1], lo que significa que [ x, y] R.
39 J. P
aez
El multianunciado resultado que probaremos a continuaci

on, tendra como un corolario el im-
portante hecho de que todos los conjuntos mencionados en el ejemplo anterior, ser
an conjuntos
conexos.
on 1.45 Sea A Rn . Si A es convexo entonces A es conexo.

Proposici
Demostraci on. Supongamos que A no es conexo. Entonces existen B, C Rn no vacos y

separados, tales que A = B C. Dado que B y C son no vacos, elegimos x B y y C. Por el
x, y] * B C = A lo cual contradice el hecho de que A es convexo.
lema 1.42 tenemos entonces que [
Por lo tanto, A es conexo.
Una pregunta que siempre nos tenemos que hacer es si el recproco de una proposici on es cierto.
En el caso de la proposicion anterior la respuesta es negativa pero para poder dar un ejemplo de este
hecho, sera necesario ampliar la familia de conjuntos para los cuales hayamos probado que realmente
son conexos. Y justo eso es lo que haremos en la siguiente proposici on que probaremos, la cual nos
proporciona una condici on necesaria y suficiente para que un conjunto abierto sea conexo. Para
facilitar la redaccion de su prueba, introducimos el siguiente nombre: dados x , y, x1 , ..., xk Rn
diremos que el conjunto [ 1 ] [
x, x x1 , x2 ] ... [
xk , y] es una poligonal que une a x con y (o que
empieza en x y termina en y, o que tiene extremos x y y).
Proposici on 1.46 Sea A Rn abierto y no vaco. A es conexo s y s olo si para cada par de
puntos x, y A, existen x1 , ..., xk A tales que [x, x1 ] [ 2 ] ... [
x1 , x xk , y] A. Es decir, A es
conexo s y solo si para cada par de puntos x , y A existe una poligonal contenida en A que une a
x
con y.
Demostraci on. Supongamos que A es conexo y sea x 0 A un punto fijo. Notese que nuestra
demostracion se reduce a demostrar que para cualquier x A, siempre existe una poligonal que
une a x
0 con x
(por que?). Para lograr esto, definimos los siguientes conjuntos:
U = {
x A | existe una poligonal contenida en A que une a x }
0 con x
y
V = {
x A | no existe una poligonal contenida en A que une a x }
0 con x
Observe que nuestro objetivo es probar que U = A.
Como se prueba facilmente, los conjuntos U y V tienen las siguientes propiedades:
1. A = U V
2. U V =
3. U 6= (pues x
0 U )
Lo que ahora vamos a demostrar es que U y V son conjuntos abiertos. En efecto, si x U A,

como A es un conjunto abierto sabemos que existe r > 0 tal que Br ( x) A; aseguramos que
x) U ya que si y Br (
Br ( x) sabemos que [ x, y] Br (
x) A (las bolas son convexas) de tal
forma que si [ 1 ] [
x0 , x x1 , x2 ] ... [xk , x
] es una poligonal contenida en A que une a x 0 con x,
entonces [ 1 ] [
x0 , x 2 ] ... [
x1 , x xk , x] [
x, y] es una poligonal contenida en A que une a x0 con y,
de donde tenemos que y U , es decir, Br ( x) U y por lo tanto U es un conjunto abierto.
Analogamente, si x V A, como A es un conjunto abierto sabemos que existe r > 0 tal que
x) A; aseguramos que Br (
Br ( x) V pues de lo contrario, existira y Br ( x) A tal que y
/V
J. P
aez 40
y por tanto se tendra que y U en cuyo caso existira [ 1 ] [

x0 , x 2 ] ... [
x1 , x xk , y] una poligonal
contenida en A que une a x 0 con y, y como [ ] Br (
y, x x) A entonces [ 1 ] [
x0 , x 2 ] ...
x1 , x
xk , y] [
[ y , x] sera una poligonal contenida en A que unira a x 0 con x , contradiciendo el hecho
de que x V . Asi pues, se debe tener que Br ( x) V con lo cual concluimos que V tambien es
abierto.
Resumiendo, tenemos que A es la uni on de dos conjuntos abiertos y ajenos U y V , que por la
proposici on 1.38 est an separados. Por estas razones, si adem as tambien se cumpliera que V 6= ,
obtendramos que A no es conexo, lo que sera una contradicci on. De esta forma se debe tener que
V = y por tanto que A = U , que es justo lo que se quera probar.
La condici on de suficiencia para la conexidad es una consecuencia inmediata del lema 1.42. En
efecto, si A no fuera conexo sabemos que existen B y C conjuntos no vacios y separados tales que
A = B C. De esta forma, si elegimos x B y y C, y tomamos [ x, x1 ] [x1 , x2 ] ... [xk , y]
una poligonal que une a estos puntos, entonces aseguramos que [ 1 ] [
x, x x1 , x2 ] ... [xk , y] * A.
En efecto, n otese que si llamamos x 0 = xyx k+1 = y entonces existe i {0, . . . , k} tal que x i B
y xi+1 C de tal forma que, por el lema 1.42, [ i+1 ] * B C = A. Resumiendo, si A no
xi , x
fuera conexo, no existira una poligonal contenida en A que una a x y y, lo que contradice nuestra
hipotesis.
Volviendo al recproco de la proposici

on 1.45, aun y cuando geometricamente es muy sencillo
mostrar un ejemplo de un conjunto que sea conexo pero no convexo (ver figura 1.16), con base en
el resultado anterior podemos probar que el siguiente ejemplo ilustra el mismo hecho.
1
b b
x
y
Figura 1.16: El conjunto A es conexo pero no es convexo ya que el segmento [

x, y] no esta contenido
en A.
Ejemplo 1.47 Sea

A = R2 \ {(x, y) R2 | x 0yy = 0}
El lector probar
a en el problema 16 que este conjunto es abierto. Aqu s
olo mostraremos que para
cualquier x = (x, y) A, el segmento que lo une con el punto x 0 = (1, 0) A est a totalmente
contenido en A (ver figura 1.17), lo que mostrara que este conjunto satisface la condici
on de sufi-
ciencia de la proposici a conexo. Dado (x, y) A, distinguimos tres
on anterior y por lo tanto ser
casos:
41 J. P
aez
1. y = 0 y x > 0. En este caso el segmento [

x, x0 ] = [(x, 0), (1, 0)] est
a dado por
{(x + t(1 x), 0) = ((1 t)x + t, 0) R2 | t [0, 1]}
y como (1 t)x + t > 0 para toda t [0, 1], se tiene que est
a contenido en A.
2. y > 0 y x R. En este caso el segmento [

x, x0 ] = [(x, y), (1, 0)] est
a dado por
{(x + t(1 x), y ty) = ((1 t)x + t, (1 t)y) R2 | t [0, 1]}
de tal forma que, como (1 t)y > 0 para toda t [0, 1) y para t = 1 obtenemos el punto
(1, 0) = x
0 , entonces en esta caso tambien dicho segmento est
a contenido en A.
3. y < 0 y x R. En este caso el segmento [ x, x

0 ] = [(x, y), (1, 0)] est
a dado por el mismo
conjunto del inciso anterior, solo que ahora (1 t)y < 0 para toda t [0, 1) y para t = 1
obtenemos otra vez el punto (1, 0) = x
0 , de modo que nuevamente el segmento estar a contenido
en A.
Ahora solo nos resta probar que A no es convexo. En efecto, si tomamos los puntos x = (1, 1) y
y = (1, 1) se tiene que x , y A y sin embargo el punto (1, 0) = x yx
+ (1/2)( ) [
x, y] no
x, y] " A.
pertenece a A, es decir, [
b
1
x
A
1 1
y
b
1
Figura 1.17: El conjunto A = R2 \ {(x, y) R2 | x 0 y y = 0} es conexo pero no es convexo ya que

el segmento [
x, y] no est
a contenido en A
Concluimos esta secci on con un resultado que nos permite caracterizar a los conjuntos dis-
conexos (y por tanto a los conexos) en terminos de conjuntos abiertos. Aun y cuando no es la
caracterizacion mas conocida en terminos de este tipo de conjuntos (la cual podremos probar hasta
el captulo 2), este caso tambien resultara ser de gran utilidad.
Proposici on 1.48 Sea A Rn . A es disconexo si y s

olo si existen U, V Rn conjuntos abiertos
tales que:
1. A U V ,
J. P
aez 42
2. A U 6= y A V 6= , y
3. A U V = .
Demostraci on. Si A es disconexo, sabemos que existen B, C Rn no vacos y separados tales

que A = B C. Sea U = Rn \ C y V = Rn \ B;
mostraremos que U y V satisfacen las propiedades
requeridas.
Como B y C est
an separados sabemos que B C = = B C de tal forma que C Rn \ B
=V
y B R \ C = U y de aqu que
n
A=BC
(Rn \ B)
(Rn \ C)
= U V
Por otra parte

A U = A (Rn \ C)
AB
=B
6=
y an
alogamente

A V = A (Rn \ B)
AC
=C
6=
Finalmente
(Rn \ C)
A U V = A (Rn \ B)
= A (Rn \ (B C))

C))
= (B C) (Rn \ (B
=
Para para probar la implicacion contraria, tomamos B = A U y C = A V ; por los incisos 1
otesis tenemos que B 6= , C 6= y que A = B C, de modo que s
y 2 de la hip olo nos restara
mostrar que estos conjuntos est
an separados.
Supongamos que
C = (A U ) (A V ) 6=
B
(A U ) (A V ) V , como V es abierto existe r > 0 tal que Br (
Si x x) V . Por otra parte,
como x (A U ) por el inciso (a) del problema 27 sabemos que
6= Br (
x) (A U ) V (A U ) = A U V
lo que contradice el inciso 3 de la hip
otesis. Por tanto BC = (A U )(AV ) = . Analogamente

se prueba que C B = (A V ) (A U ) = .
Como mencionamos anteriormente, como un corolario inmediato tenemos la siguiente caracter-

izacion de los conjuntos conexos.
43 J. P
aez
Captulo 1. El conjunto Rn 1.6. Otros sistemas coordenados
Corolario 1.49 Sea A Rn . A es conexo si y s

olo si no existen U, V Rn conjuntos abiertos
tales que:
1. A U V ,
2. A U 6= y A V 6= , y
3. A U V = .
1.6 Otros sistemas coordenados

En el caso particular de los puntos y/o flechas (con un punto inicial fijo) del plano o del espacio,
existen otras formas de representar estos objetos por medio de parejas o ternas ordenadas de
n
umeros reales. Aun cuando no siempre es necesario, estas otras formas de representacion se
realizan con base en un sistema cartesiano establecido previamente, que es justo como lo haremos
en este texto.
1.6.1 Coordenadas polares

Para el caso del plano, si x representa un punto o una flecha, adem as de asignarle sus coordenadas
(x0 , y0 ) en un sistema cartesiano dado, podemos asignarle otra pareja de n umeros (, ), a la que
llamaremos unas coordenadas polares de x , en donde es igual a la distancia que hay de x al origen
(es decir, la magnitud o norma de x ), y es el angulo (dirigido) formado por la parte positiva del
eje X y la semirecta que parte del origen y pasa por x (ver figura 1.18).
b
x

Figura 1.18: Obtenci

on de coordenadas polares de un punto (o una flecha) x
del plano.
En analoga con la interpretacion geometrica de las coordenadas cartesianas, la cual consiste

en ver a x como el unico punto en el que se intersectan las rectas x = x0 (paralela al eje Y , y
que es justo todo el conjunto de puntos del plano cuya coordenada cartesiana x es igual a x0 ) y
y = y0 (paralela al eje X, y que es justo todo el conjunto de puntos del plano cuya coordenada
cartesiana y es igual a y0 ), sus coordenadas polares (0 , 0 ) nos proporcionan el radio (0 ) de la
u
nica circunferencia (que es justo todo el conjunto de puntos del plano cuya coordenada polar es
igual a la constante 0 ), y el
angulo (0 ) de la u
nica semirecta que parte del origen (que es justo
todo el conjunto de puntos del plano cuya coordenada polar es igual a la constante 0 ), que tienen
como interseccion al punto (o vector) x (ver figura 1.19).
Otro aspecto importante que hay que hacer notar con relaci on a estas nuevas coordenadases es
que para asignarlas, no es necesario recurrir a todas las parejas ordenadas de R2 ; es decir, basta
J. P
aez 44
1.6. Otros sistemas coordenados Captulo 1. El conjunto Rn
x

b
0 0
X
Figura 1.19: Las coordenadas polares (0 , 0 ) nos proporcionan el radio (0 ) de la u

nica circunferencia,
y el angulo (0 ) de la u
nica semirecta que parte del origen, que tienen como interseccion al punto (o
vector) x.
con tomar las parejas (, ) tales que 0 y 0 < 2 para que todo punto (o flecha) del
plano tenga asociada una de ellas. De hecho, salvo por el origen 0 (cuyas coordenadas porlares
est
an dadas por cualquier pareja de la forma (0, )), la asignaci on de unas coordenadas polares
establece una biyecci on entre un plano menos un punto (aquel que se haya elegido como el origen)
y el subconjunto (0, ) [0, 2) R2 . Mas aun, n otese que el angulo siempre se puede elegir en
cualquier intervalo de la forma 0 < 0 + 2, en donde 0 es un angulo fijo. De esta forma, un
mismo punto (o vector) x tiene muchas coordenadas polares.
En reciprocidad con lo anterior, tambien es importante hacer notar que cualquier pareja (, )
R2 (incluso con < 0) se puede interpretar como coordenadas polares de un punto (o vector) x
del plano, obteniendo (o construyendo) x de la siguiente manera: dada una pareja (, ) R2 ,
hagase una rotacion del eje X por radianes, y sobre ese eje rotado, localice el n umero ; este ser a
el punto x que le corresponda a la pareja (, ) (ver figura 1.20). Con base en lo anterior, n otese que
podemos concluir que, si (, ) y ( , ) son coordenadas polares de un mismo vector x del plano,
entonces se debe cumplir que = y = + k para alguna k Z. Mas especficamente, se
tiene que = si y solo si = + 2k para alguna k Z, y = si y s olo si = + (2k + 1)
para alguna k Z.
Otra observaci on importante con relaci on a las coordenadas polares, es que las operaciones de
suma y producto por un escalar que definimos para las parejas de R2 , ya no se corresponden con
la suma y producto por un escalar que definimos geometricamente para vectores (o flechas) del
plano. Es decir, si (1 , 1 ) y (2 , 2 ) son coordenadas polares de x1 y x2 , respectivamente, entonces
la pareja (1 + 2 , 1 + 2 ) no son necesariamente coordenadas polares de x 1 + x 2 (en donde esta
ltima suma de vectores es la que se obtiene por medio de la ley del paralelogramo); y si
u
R entonces la pareja (1 , 1 ) no son necesariamente coordenadas polares de x1 . Sin duda un
problema interesante consiste en encontrar coordenadas polares para x 1 + x 2 y x1 en terminos de
coordenadas polares de x 1 y x 2 , y por lo mismo lo dejamos como un problema para el lector.
Lo que si queremos mencionar aqu es la interpretacion geometrica de ciertas operaciones
aritmeticas con coordenadas polares; especficamente, si (, ) son coordenadas polares de un
vector x y h R entonces (, + h) son coordenadas polares de un vector x h que se obtiene
rotando h radianes a x ; y ( + h, ) son coordenadas polares de un vector x h que est a en la misma
45 J. P
aez
x

b

b b
Figura 1.20: Cualquier pareja (, ) R2 (en este caso con < 0) se puede interpretar como
coordenadas polares de un punto (o vector) x del plano, el cual se obtiene de la siguiente manera:
hagase una rotaci
on del eje X por radianes, y sobre ese eje rotado, localice el n
umero ; este ser
a el
punto x que le corresponda a la pareja (, ).
direcci
on que est ax
, s
olo modificando su magnitud por una cierta cantidad h (y suponiendo que
+ h no tiene signo diferente a ; que sucede geometricamente si y + h tienen signo diferente?)
(ver figura 1.21).
Y Y
( + h, ) (, + h)
x
h
h
x (, )
(, ) x

h x

X X
(a) (b)
Figura 1.21: Si un vector x tiene coordenadas polares (, ), entonces el vector x h de coordenadas

polares ( + h, ) est
a en la misma direcci
on que x
(si y + h tienen el mismo signo) (a), y el vector
h de coordenadas polares (, + h) se obtiene rotando h radianes el vector x
x (b).
Finalmente, y con base en las funciones trigonometricas, deducimos las ecuaciones que nos per-
miten obtener, dadas cualesquiera coordenadas polares (, ) de un vector x, sus correspondientes
coordenadas cartesianas (x, y) (ambas consideradas sobre el mismo sistema coordenado cartesiano
XY ). Estas ecuaciones est
an dadas por las siguientes identidades:
x = cos() (1.11)
y = sen()
J. P
aez 46
(ver figura 1.22).
b
x

sen()

cos() X
Figura 1.22: Dadas cualesquiera coordenadas polares (, ) de un vector x

, sus correspondientes coor-
denadas cartesianas son ( cos(), sen()).
Recprocamente, si conocemos las coordenadas cartesianas (x, y) de un vector x , podemos

obtener unas coordenadas polares de x de la siguiente forma: dado que representa la distan-
cia de x
al origen (es decir, la norma de x
), sabemos que
p
= x2 + y 2
(lo que tambien se puede confirmar a partir de las dos identidades anteriores).
Obtener una expresi on para es un poco mas elaborado y hay que analizar algunos casos. Como
ya habamos mencionado, si x = 0, cualquier pareja de la forma (0, ) ( R) son coordenadas
polares de x . Si x = 0 y y > 0 (es decir que x est
a en la parte positiva del eje Y ), bastara con
tomar = /2 o en general

= + 2k
2
Y si x = 0 y y < 0 (es decir que x est
a en la parte negativa del eje Y ), bastara con tomar = 3/2
o en general
3
= + 2k
2
con k Z.
Si x 6= 0, de las identidades 1.11 se tiene que
y sen()
=
x cos()
= tan()
de tal forma que si arctan es la rama de la funcion inversa de la funcion tangente que toma sus
valores entre /2 y /2 entonces, cuando se tenga x > 0, bastara con tomar = arctan(y/x) o
en general y
= arctan + 2k
x
con k Z; y si x < 0, bastara con tomar = arctan(y/x) + o en general
y
= arctan + (2k + 1)
x
con k Z.
47 J. P
aez
1.6.2 Coordenadas cilndricas

Para el caso de puntos y/o flechas en el espacio, y nuevamente partiendo de un sistema cartesiano
dado, vamos a dar otra forma de asignarles ternas de n umeros que los representen, de la siguiente
manera.
Si x es un punto o una flecha en el espacio cuyas coordenadas cartesianas (en el sistema XY Z
dado) son (x0 , y0 , z0 ), nos fijamos en el vector del plano XY que tiene coordenadas cartesianas
(x0 , y0 ) (y que geometricamente se obtiene de proyectar a x en el plano XY ). Si ahora la pareja
(0 , 0 ) son unas coordenadas polares del vector (x0 , y0 ), decimos entonces que la terna (0 , 0 , z0 )
son unas coordenadas cilndricas del vector x (ver figura 1.23).
Z
b
b x

z0
b
Y
0
x0
b b
y0
X
Figura 1.23: Si la pareja (0 , 0 ) son unas coordenadas polares del vector (x0 , y0 ) del plano XY , decimos
entonces que la terna (0 , 0 , z0 ) son unas coordenadas cilndricas del vector x.
Como en el caso de la coordenadas polares, geometricamente las coordenadas cilndricas nos

proporcionan el radio (0 ) del cilindro circular recto (paralelo al eje Z, y que es justo todo el
conjunto de puntos del espacio cuya coordenada cilndrica es igual a la constante 0 ); el angulo
(0 ) (medido con respecto a la parte positiva del eje X) del semiplano perpendicular al plano XY
(y que es justo todo el conjunto de puntos del espacio cuya coordenada cilndrica es igual a la
constante 0 ) del semiplano perpendicular al plano XY ; y la altura (z0 ) del plano paralelo al plano
XY (que es justo todo el conjunto de puntos del espacio cuya coordenada cilndrica z es igual a la
constante z0 ), que tienen como interseccion u
nicamente al punto (o vector) x (ver figura 1.24).
Nuevamente es importante hacer notar que para asociar unas coordenadas cilndricas a un vector
, no es necesario recurrir a todas las ternas de R3 pues basta con que 0 < , 0 < 2 y
x
< z < , es decir, a todo vector en el espacio se le puede asignar unas coordenadas cilndricas
de tal forma que estas esten en el subconjunto [0, ) [0, 2) (, ) R3 , e incluso, de
manera mas general, en un subconjunto de la forma [0, ) [0 , 0 + 2) (, ) R3 , con
0 R, fijo.
No obstante lo anterior, y como en el caso de las coordenadas polares, cualquier terna (, , z)
3
R se puede interpretar como coordenadas cilndricas de un vector del espacio. Para hacer esto,
basta con localizar en el plano XY el vector que se le debe asignar a la pareja (, ) (de acuerdo con
el procedimiento descrito en la secci
on anterior) y despues elevarlo a la altura z (ver figura 1.25).
Con base en lo anterior tenemos que, si dos ternas (, , z) y ( , , z ) son coordenadas cilndricas
J. P
aez 48
Figura 1.24: Las coordenadas cilndricas (0 , 0 , z0 ) de un punto x nos proporcionan el radio 0 del
cilindro circular recto, el
angulo 0 del semiplano perpendicular al eje X, y la altura z0 del plano
paralelo al plano XY , que tienen como interseccion u nicamente al punto x
.
entonces podemos asegurar que = , = + k para alguna k Z, y

del mismo vector x
z=z.
x
b
b
z0
0
b
0
Y
X
Figura 1.25: Cualquier terna (0 , 0 , z0 ) R3 se puede interpretar como coordenadas cilndricas de un

punto x
del espacio.
Analogamente a lo que sucede con las coordenadas polares, la aritmetica definida entre ternas
no se corresponde con la aritmetica definida geometricamente entre vectores del espacio. Sin
embargo, tambien es importante identificar geometricamente el efecto de sumar una cierta cantidad
h R en una s ola de estas coordenadas.
De esta forma, si (0 , 0 , z0 ) son coodenadas cilndricas de un vector x
, entonces (0 + h, 0 , z0 )
son coodenadas cilndricas del vector que est a en el mismo plano que pasa por x y que contiene
al eje Z (y suponiendo que 0 + h no tiene signo diferente a 0 ; que sucede geometricamente si
0 y 0 + h tienen signo diferente?), a la misma altura sobre el eje Z, pero con la diferencia de
que su proyecci on sobre el plano XY es un vector de norma 0 + h (|0 + h| en el caso general)
(ver figura 1.26 (a)). Si ahora consideramos (0 , 0 + h, z0 ), estas ser
an coordenadas cilndricas del
vector que se obtiene al rotar, con respecto el eje Z, h radianes el vector x (ver figura 1.26 (b)).
49 J. P
aez
Finalmente, si ahora tomamos (0 , 0 , z0 + h), estas ser

an coordenadas cilndricas del vector que se
obtiene cambiando la punta del vector x a la altura z0 + h (ver figura 1.26 (c)); en particular,
este vector y el vector x
tendran la misma proyeccion sobre el plano XY .
Z Z b
Z
x
h x
h
b h b
b b b
x
h x

0 b
x
h 0 b 0 b
b
x

z0 z0
z0
b
b b b
b h
b
Y b
Y b
Y
0 0 0
X X (b) X (c)
(a)
Figura 1.26: Si el vector x

tiene coodenadas cilndricas (0 , 0 , z0 ) entonces, en los siguientes casos, el
vector x
h tiene coordenadas cilndricas: (a) (0 + h, 0 , z0 ); (b) (0 , 0 + h, z0 ); (c) (0 , 0 , z0 + h).
Como en el caso de la coordenadas polares, si (, , z) son cualesquiera coordenadas cilndricas

de un vector x
, usando nuevamente las funciones trigonometricas, obtenemos que la terna (x, y, z),
con
x = cos()
y = sen()
z=z
son las coordenadas cartesianas de x (notese que la tercera, y extrana identidad anterior, refleja el
abuso de notacion que cometemos al nombrar con la misma letra a la tercera coordenada polar y
a la tercera coordenada cartesiana del vector x , lo cual se justifica por el hecho de que ambas
tienen el mismo significado geometrico).
Recprocamente, para obtener unas coordenadas cilndricas de un vector x a partir de sus
coordenadas cartesianas (x, y, z), calculamos y procediendo justo igual que en el caso de las
coordenadas polares, y la coordenada polar z se toma igual a la coordenada cartesiana z (por las
razones que ya explicamos en el p arrafo anterior).
1.6.3 Coordenadas esf

ericas
Concluimos esta breve secci on introduciendo una forma mas de asignarle una terna de n umeros
reales a un vector x del espacio. Como en el caso anterior, partiendo de un sistema cartesiano
XY Z dado, asignamos a x la terna de n umeros reales (, , ), de la siguiente forma: (como en
el caso de las coordenadas polares) representa la magnitud de x , es el angulo (dirigido) formado
por la parte positiva del eje X y la proyeccion del vector x sobre el plano XY , siempre que esta
proyeccion sea diferente del vector 0, y si dicha proyeccion es el vector 0, hacemos = 0; y
finalmente, sera el
angulo (dirigido) formado por la parte positiva del eje Z y el vector x (6 ) (ver
figura 1.27). A la terna (, , ) construida de esta forma le llamaremos unas coordenadas esfericas
del vector x
.
6
En algunos textos el
angulo se toma como el
angulo (dirigido) formado por el plano XY y el vector x
.
J. P
aez 50
b x

0
0
Y
0
b
Figura 1.27: La terna (0 , 0 , 0 ) son unas coordenadas esfericas del vector x

.
En este caso, y desde un punto de vista geometrico, las coordenadas esfericas (0 , 0 , 0 ) de un

vector (o punto) x , nos proporcionan el radio (0 ) de una esfera (que es justo todo el conjunto de
puntos del espacio cuya coordenada esferica es igual a la constante 0 ); el angulo (0 ) (medido
con respecto a la parte positiva del eje X) de un semiplano perpendicular al plano XY (que es
justo todo el conjunto de puntos del espacio cuya coordenada esferica es igual a la constante 0 );
y el angulo (0 ) de un cono circular con vertice en el origen (cuyo eje es el eje Z, y que es justo
todo el conjunto de puntos del espacio cuya coordenada esferica es igual a la constante 0 ), que
se intersectan u
nicamente en el punto (o vector) x (ver figura 1.28).
Figura 1.28: Las coordenadas esfericas (0 , 0 , 0 ) de un punto x

nos proporcionan el radio 0 de la
esfera, el angulo 0 del semiplano perpendicular al eje X, y el angulo 0 del cono, que tienen como
interseccion u
nicamente al punto x.
De la misma forma que en los dos casos anteriores, para asignar unas coordenadas esfericas a
no es necesario recurrir a todas las ternas de R3 ; como se podr
un vector x a notar, basta con que
0 < , 0 < 2 y 0 , o de manera mas general, que 0 < , 0 < 0 + 2 y
0 0 + , con 0 , 0 R fijos.
Tambien, como en los dos casos anteriores, toda terna (, , ) R3 se puede interpretar
como coordenadas esfericas de un vector x del espacio, de la siguiente forma: sobre el plano XZ, y
con respecto a la parte positiva del eje Z, r
otese radianes el eje Z; a continuaci
on, tomando como
51 J. P
aez
eje de rotacion el eje Z, y con respecto a la parte positiva del eje X, rote la recta real resultante
(o si prefiere todo el plano XZ) radianes; finalmente, sobre esta ultima recta real que se obtiene,
ubique el numero . El vector x determinado por este procedimiento ser a el vector que asociaremos
a la terna (, , ) y diremos que los elementos de esta terna tambien son coordenadas esfericas de
x
. Todo lo anterior sin duda requiere de un
Ejemplo 1.50 Sea x el vector que en un sistema cartesiano dado tiene coordenas (cartesianas)
(1, 1, 1). De acuerdo con el procedimiento de asignaci
on de coordenadas esfericas, tenemos que la
terna ( 3, /4, /4) nos da unas coordenadas de este tipo para x .
Por otra parte,
y de acuerdo conel metodo de asignaci on de un vector a una terna, n
otese que
las ternas ( 3, 3/4, /4), ( 3, 3/4, 3/4), y ( 3, /4, 3/4) tambien son coordenadas
esfericas de nuestro vector x
(ver figura 1.29).

3 3
b
b
1 1
3
4
1
1
4
1
1
Z
1 1

3
b

Figura 1.29: El punto x el cual tambien tiene como coodenadas esfericas a la terna ( 3, /4, 3/4)
se obtiene de la siguiente forma: sobre el plano XZ, y con respecto a la parte positiva del eje Z, rote
3
4 radianes el eje Z; a continuacion, tomando como eje de rotacion el eje Z, y con respecto a la parte
positiva del eje X, rote la recta real resultante 4 radianes; finalmente, sobre esta u
ltima recta real que

umero 3.
se obtiene, ubique el n
Aun y cuando existen diferentes coordenadas esfericas para un mismo vector x (como sucede
con los otros tipos de coordenadas que hemos visto en esta secci on), si (, , ) y ( , , ) son dos
de ellas, lo que podemos asegurar es que se debe tener que = , que = + k para alguna
k Z, y que = + k (/2) tambien para alguna k Z.
Como en los casos anteriores, la aritmetica definida entre ternas no se corresponde con la
aritmetica definida geometricamente entre vectores del espacio. Sin embargo, y como tambien
hicimos en los otros casos, es importante identificar geometricamente el efecto de sumar una cierta
cantidad h R en una s ola de estas coordenadas.
De esta forma, si (, , ) son coordenadas esfericas de un vector x, entonces el vector que tenga
coordenadas esfericas ( + h, , ) ser
a aquel que esta en la misma recta que tiene a x , con norma
| + h| y apuntando en la misma direcci on que (o contraria a) x, dependiendo de si y + h tienen
el mismo signo (o signo diferente); asimismo, el vector que tenga coordenadas esfericas (, + h, )
ser
a aquel que se obtiene de rotar h radianes al vector x , tomando como eje de rotaci on al eje Z;
finalmente, el vector que tenga coordenadas esfericas (, , + h) ser
a aquel que se obtiene de rotar
J. P
aez 52
h radianes al vector x
, realizando dicha rotaci
on sobre el plano que contenga a x
y al eje Z (ver
figura 1.30).
Z Z Z
x
h b
b
b
h
b
b b x

h x
h x
0
0
b
0 0 b x
h
x
h
0
0 b
b b b
b 0
b
b
Y 0 Y Y
0 0 b
X X (b) X (c)
(a)
tiene coodenadas esfericas (0 , 0 , 0 ) entonces, en los siguientes casos, el

Figura 1.30: Si el vector x
vector x
h tiene coordenadas esfericas: (a) (0 + h, 0 , 0 ); (b) (0 , 0 + h, 0 ); (c) (0 , 0 , 0 + h).
Finalmente, y recurriendo de nuevo a las funciones trigon

ometricas, si (, , ) son cualesquiera
coordenadas esfericas de un vector x
, obtenemos que la terna (x, y, z), con
x = sen() cos() (1.12)
y = sen() sen()
z = cos()
son las coordenadas cartesianas de x
(ver figura 1.31).
x

b

cos()
Y
(
en
os
)c
(
)
en
b
s
sen() sen()
X
Figura 1.31: Recurriendo a las funciones trigonometricas, si (, , ) son coordenadas esfericas de

un vector x
, deducimos que la terna (x, y, z) = ( sen() cos(), sen() sen(), cos()) son sus
correspondientes coordenadas cartesianas.
Para obtener unas coordenadas esfericas de un vector x a partir de sus coordenadas cartesianas
(x, y, z), procedemos de la siguiente forma: en general, por la definicion de la coordenada , tenemos
que p
= x2 + y 2 + z 2
53 J. P
aez
Captulo 1. El conjunto Rn 1.7. Problemas
identidad que tambien se deduce de las identidades anteriores.

Para determinar el
angulo basta con analizar dos casos; en el caso en que x = 0 = y entonces
hacemos = 0 si z 0 y = si z < 0. Si x2 + y 2 > 0, nuevamente por las ecuaciones 1.12
concluimos que se debe cumplir que
z2 ( cos())2
=
x2 + y 2 ( sen() sen())2 + ( sen() cos())2
( cos())2
=
( sen())2
= tan2 ()
de forma que
|z|
|tan()| = p
x2 + y 2
y por tanto, si z 0 bastara con tomar
!
z
= arctan p
x2 + y 2
y si z < 0 bastara con tomar !

z
= arctan p
2 x2 + y 2
en donde nuevamente arctan es la inversa de la funcion tangente que toma sus valores entre /2
y /2.
angulo , si x = 0 y y 0 hacemos = /2, y si y < 0 entonces tomamos
En cuanto al
= 3/2. Cuando x 6= 0, por las ecuaciones 1.12 debemos tener que
y cos()
=
x sen()
= tan()
de modo que, en general, podemos obtener de la misma manera en que lo hicimos para el caso
de las coordenadas polares.
1.7 Problemas
1. Pruebe las proposiciones 1.8 y 1.10.
2. Pruebe que las normas definidas en 1.14 son en efecto normas, es decir, que satisfacen las
propiedades dadas en la proposici
on 1.8.
= (x1 , ..., xn ) Rn entonces |xi | k

3. Pruebe que, si x xk, |xi | k
xk1 y |xi | k
xk para
i = 1, ..., n.
n
2 n
4. Sean a1 , ..., an R. Pruebe que a2i
P P
ai n
i=1 i=1
J. P
aez 54
1.7. Problemas Captulo 1. El conjunto Rn
5. Pruebe que si x n Rn entonces

1 , . . . , x
k
x1 + + x
n k k
x1 k + + k
xn k
(recuerde que en el texto, la desigualdad del tri

angulo s
olo se probo para dos vectores).
1 , . . . , xn Rn tales que x
6. Sean x i x
j = 0 si i, j {1, . . . , n}, i 6= j. Pruebe que:
k n k2 = k
x1 + + x x1 k2 + + k
xn k2
(Este resultado es conocido como el teorema de Pit

agoras)
, y Rn . Pruebe que:
7. Sean x
y = 0 s y s
(a) x olo si k
x + yk = k
x yk
y > 0 s y s
(b) x olo si k
x + yk > k
x yk
y < 0 s y s
(c) x olo si k
x + yk < k
x yk
Interprete geometricamente estos resultados
, y Rn diferentes de
8. Sean x 0. Pruebe que:
(a) si k
xk = k
y k = k
x yk entonces el angulo entre x
y y es /3
(b) si k
xk = k
x yk entonces el angulo entre x
y y es igual al angulo entre y y y x

Interprete geometricamente estos resultados
9. Sean x
(a) k
x + yk = k
xk + k olo si existe R, > 0, tal que x
y k s y s =
y
(b) k
x yk = k
xk + k olo si existe R, < 0, tal que x
y k s y s =
y
2 2 2 2

(c) k
x + yk + kx yk = 2 k xk + k yk
(d) |k
xk k
y k| k
x yk
10. Pruebe la proposici

on 1.17.
, y Rn y r > 0 tales que y Br (

11. Sean x x). Si x
= (x1 , ..., xn ) y y = (y1 , ..., yn ), hacemos
x
i = (y1 , ..., yi , xi+1 , ..., xn ) y yi = (x1 , ..., xi , yi+1 , ..., yn )
para cada i {1, ..., n 1}, x

0 = yn = x
y y0 = x
n = y. Pruebe que:
i , yi Br (
(a) x x) para cada i {1, ..., n 1}
(b) si i = xi1 + (xi x yi yi1 ) con , (0, 1), pruebe que
i1 ) y i = yi1 + (

i x k yx k y k
i xk kyx k

para cada i {1, . . . , n}

i , yi para el caso de R2 y R3
(c) dibuje los puntos x
(1) ()
Rn . Definimos Br (
12. Sea r > 0 y x y Rn | k
x) = { yx
k1 < r} y Br y Rn |
x0 ) = {
(
k
yx k < r}.
55 J. P
aez
(1) ()
(a) describa geometricamente los conjuntos Br (0) y Br (0) cuando n = 2 y n = 3.
(1) ()
(b) en la definicion 1.19, sustituya Br (
x) por Br (x) y por Br ( x) para definir int1 (A),
int (A), ext1 (A), ext (A), Fr1 (A) y Fr (A), respectivamente. Pruebe que int1 (A) =
int (A) = int(A), ext1 (A) = ext (A) = ext(A), y Fr1 (A) = Fr (A) = Fr(A).
13. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe su
respuesta.
(a) int(A B) = int(A) int(B); int(A B) = int(A) int(B)

(b) ext(A B) = ext(A) ext(B); ext(A B) = ext(A) ext(B)
(c) Fr(A B) = Fr(A) Fr(B); Fr(A B) = Fr(A) Fr(B)
(d) si A B entonces: int(A) int(B); ext(B) ext(A); Fr(A) Fr(B)
Rn . Si A = Br (
14. Sea r > 0 y x x) pruebe que:
y Rn | k
(a) { yx
k > r} ext(A)
y Rn | k
(b) { yx
k = r} Fr(A)
(c) las contensiones de los incisos anteriores son identidades
15. Pruebe que, si A Rn es un conjunto cerrado entonces int(Fr(A)) = .
16. Pruebe que el conjunto A del ejemplo 1.47 es un conjunto abierto.
17. Sean a1 , ..., an , b1 , ...bn R tales que ai < bi para i = 1, ..., n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn ) = {(x1 , ..., xn ) Rn | ai < xi < bi , i = 1, ..., n} es un conjunto
abierto
18. Sean a1 , ..., an , b1 , ...bn R tales que ai bi para i = 1, ..., n. Pruebe que el conjunto
A = [a1 , b1 ] [an , bn ] = {(x1 , ..., xn ) Rn | ai xi bi , i = 1, ..., n} es un conjunto
cerrado
19. Sean A, B Rn . Si A B = ( x, y) R2n | x

A, y B , pruebe que:
(a) si A y B son abiertos (en Rn ) entonces A B es abierto (en R2n )

(b) si A y B son cerrados (en Rn ) entonces A B es cerrado (en R2n )
(c) si A y B son acotados (en Rn ) entonces A B es acotado (en R2n )
20. Sea U Rn un conjunto abierto Qn := Q Q (Q multiplicado n veces). Pruebe que:
(a) U Qn 6=
on de bolas (o vecindades) con centro en Qn y radio racional
(b) U se puede poner como la uni
21. Sean A1 , . . . , Ak subconjuntos de Rn . Pruebe que:
(a) si cada Ai es abierto entonces A1 Ak y A1 Ak son abiertos

(b) si cada Ai es cerrado entonces A1 Ak y A1 Ak son cerrados
Estas afirmaciones siguen siendo ciertas para un n umero infinito de conjuntos? Pruebe
su respuesta.
J. P
aez 56
22. Pruebe la proposicion 1.29 y muestre con un ejemplo que las contenciones que se dan ah
pueden ser propias.
23. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe su
respuesta.
(a) A B
(b) (A B) = A B ; (A B) = A B
24. Si A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}
Pruebe sus respuestas.

(a) quien es Fr(A), int(A), ext(A), A y A?
(b) A es abierto o cerrado? Pruebe sus respuestas.
25. Si A = {(m, 0) R2 | m Z}, responda las mismas preguntas del problema anterior. Pruebe
sus respuestas.
(1) ()
x) por Br (
26. En la definicion 1.27, sustituya Br ( x) y por Br x) para definir A1 y A ,
(

respectivamente. Pruebe que A1 = A = A .
27. Sea A un subconjunto de Rn . Pruebe que:
A s y s
(a) x x) A 6=
olo si para todo r > 0 se tiene que Br (
(b) A es cerrado s y s olo si A = A
olo si A A.
(c) A es cerrado s y s
(d) A A = A
c
(e) A = ext(A)
= A
(f) int(int(A)) = int(A) y (A)
(g) Fr(A) = A (Ac )
28. Sea A un subconjunto de Rn . Pruebe que:
(a) si B A y B es abierto entonces B int(A) (es decir, de los conjuntos abiertos que
est
an contenidos en A, int(A) es el m
as grande)
(b) si A B y B es cerrado entonces A B (es decir, de los conjuntos cerrados que
contienen a A, A es el m
as chico)
29. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe sus
respuestas.
(a) si A B entonces A B

(b) (A B) = A B

(c) (A B) A B

(d) (A B) = A B

30. Sea A Rn . Pruebe que: A es un conjunto acotado si y s Rn existe

olo si para todo x
) tal que k
M > 0 (que depende de x x yk M para todo y A.
57 J. P
aez
31. Pruebe que el conjunto A definido en cada uno de los problemas 17 y 18, es un conjunto
acotado.
32. Sea A R. Pruebe que si A es cerrado y acotado entonces inf(A), sup(A) A.
33. Sea A Rn un conjunto infinito. Pruebe que, si A es un conjunto cerrado y acotado entonces
todo subconjunto infinito B de A tiene un punto de acumulaci on en A.
34. Sea {Ak } una sucesion de subconjuntos de Rn , cerrados, acotados y no vacos tales que
Ak+1 Ak para toda k N (es decir, lo que se llama una sucesion anidada de conjuntos).
Pruebe que \
Ak 6=
kN
Este resultado sigue cierto si los conjuntos no son cerrados? o no son acotados? Pruebe
sus respuestas.
35. Sea A Rn tal que A 6= . Pruebe que para todo > 0 existen x
, y A tales que
0 < k
x yk < .
36. Determine si la siguiente proposicion es verdadera: si A Rn es un conjunto infinito y para

x yk < entonces A =
, y A tales que 0 < k
todo > 0 existen x 6 . Pruebe su respuesta.
37. Sean A Rn un conjunto infinito y c R, con c > 0. Pruebe que, si k

x yk c para todo
, y A, entonces A es un conjunto no acotado.
x
38. Sea A Rn un conjunto infinito tal que A = . Pruebe que si M > 0 y AM = {

xA|
k
xk M } entonces AM es finito.
39. Sean a1 , ..., an , b1 , ...bn R tales que ai < bi para i = 1, ..., n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn )
= {(x1 , ..., xn ) Rn | ai < xi < bi , i = 1, ..., n}
es un conjunto convexo
40. Sea A R. Pruebe que las siguientes afirmaciones son equivalentes:
(a) A es conexo
(b) si para todos a, b A, a < b, y c R tal que a < c < b entonces c A
(c) A es un intervalo (es decir, A es de alguna de las siguientes formas: (, b), (, b],
(a, b), (a, b], [a, b),[a, b], (a, ), o [a, ))

on 1.38.
42. Sea A Rn abierto. Pruebe que A es disconexo s y s

olo si existen B, C Rn tales que B y
C son abiertos ajenos no vacos y A = B C.
43. Sea A Rn cerrado. Pruebe que A es disconexo s y s

olo si existen B, C Rn tales que B y
C son cerrados ajenos no vacos y A = B C.
44. Sean A, B, C Rn . Pruebe que si B y C est

an separados entonces C A y B A est
an
separados.
J. P
aez 58
45. Sean A, B, C Rn tales que 6= A B C. Pruebe que, si A es conexo y B y C est

an
separados entonces A B
o A C.
46. Sean A, D Rn conjuntos conexos tales que A D 6= . Determine si las siguientes afirma-
ciones son ciertas. Pruebe su respuesta.
(a) A D es conexo
(b) A D es conexo
47. La proposici
on 1.46 es cierta si A no es abierto? Pruebe su respuesta.
48. Sea A Rn . A es un conjunto estrellado si existe x

0 A tal que para todo x
A se satisface
que [ ] A (en cuyo caso se dice que A es estrellado con respecto de x
x0 , x 0 ). Pruebe que
todo conjunto estrellado es conexo.
49. Sean x1 y x2 dos vectores en el plano. Si (1 , 1 ) y (2 , 2 ) son coordenadas polares de x

1
yx2 (en un cierto sistema cartesiano dado), respectivamente, encuentre coordenadas polares
para x1 + x
2 y x1 ( R), en donde estas operaciones de suma y producto por un escalar,
son las que se difinieron geometricamente en el texto. Compruebe su respuesta convirtiendo
a las coordenadas cartesianas correspondientes.
59 J. P
aez
J. P
aez 60
Captulo 2
Funciones de Rn en Rm
Al inicio del captulo anterior dimos una lista de ejemplos que plantean diversas situaciones, y
nuestro objetivo principal fue mostrar que las funciones que permiten describir cada una de estas
situaciones, son funciones cuyas variables independiente o dependiente (o ambas) pertenecen a alg un
espacio vectorial, raz
on por la cual estas siempre son suceptibles de representarse (describirse
o medirse) por una cierta cantidad de n umeros reales (dos, tres, cuatro o m
as!), es decir, por una
n-ada de numeros reales. De esta forma, cada una de las funciones que surgen de estos ejemplos se
pueden considerar, en u ltima instancia, como funciones cuyas variables independiente o dependiente
(o ambas) pertenecen a alg un subconjunto de Rn , y las expresiones explcitas que las representen
estar
an expresadas en terminos de las coordenadas de estas n-adas.
En el captulo anterior nos concentramos en estudiar al conjunto de las n-adas, es decir Rn , y
por las razones anteriormente expuestas, en este captulo realizaremos un an alisis mas detallado
de las funciones definidas sobre subconjuntos de R y cuyos valores esten en Rm , sin importar
n
(por ahora) a que espacios vectoriales pertenezcan las variables (independientes o dependientes)
representadas por estas n-adas de n umeros reales.
2.1
Algebra y geometra de las funciones de Rn en Rm
Iniciamos esta secci
on estableciendo la nomenclatura y la notaci
on con la cual trabajeremos a lo
largo de todo este texto. Casi siempre usaremos la letra f para denotar a una funcion, y si est
a
n m
definida sobre un conjunto A R y toma valores en R , todo ello lo escribiremos de la siguiente
forma:
f : A Rn Rm
Si los valores de f est an en Rm esto significa que para cada x x) Rm ,
A se debe tener que f (
razon por la cual este valor de f debe de tener m coordenadas, a las cuales denotaremos por
x) R, con i = 1, . . . , m, es decir f (
fi ( x) = (f1 (
x), . . . , fm (
x)). De esta forma, toda funci
on
f : A Rn Rm determina (o est a determinada por) m funciones fi : A Rn R, a las
cuales conoceremos con el nombre de funciones coordenadas, y con frecuencia escribiremos que
f = (f1 , . . . , fm ). Las funciones coordenadas siempre son funciones de valores reales y veremos que
tienen un papel muy importante en los conceptos y resultados que desarrollaremos a lo largo de
este texto.
La siguiente lista ejemplifica el tipo de funciones con las cuales trabajaremos.
Ejemplo 2.1 Considere las siguientes funciones:
1. f : Rn R definida como f (
x) = k
xk
61
Captulo 2. Funciones de Rn en Rm
2.1. Algebra y geometra de las funciones de Rn en Rm
2. f : [0, 2] R R2 definida como f (t) = (cos(t), sen(t))
3. f : A = [0, 2][0, ] R2 R3 definida como f (x, y) = (cos(x) sen(y), sen(x) sen(y), cos(y))
4. f : A = R2 \ {(0, 0)} R2 R2 definida como

!
x y
f (x, y) = p ,p
x2 + y 2 x2 + y 2
5. f : A = R2 \ {(x, y) R2 | x 0 y y = 0} R2 R definida como

0 si 0 x

f (x, y) = x2 si x 0 y 0 < y

x2 si x 0 y y < 0

Otro aspecto que mencionaremos r apidamente, es el relacionado con las operaciones algebraicas
entre este tipo de funciones y con las que trabajaremos en este texto. Todas ellas las reunimos en
la siguiente
on 2.2 Sean f, g : A Rn Rm , R y h : D Rm Rk . Definimos:

Definici
1. la suma de f y g, que denotamos por f + g, como (f + g)(

x) := f (
x) + g( A
x) para cada x
2. el producto del escalar por la funci

on f , que denotamos por f , como (f )(
x) := f (
x)
para cada xA
3. el producto punto de f por g, que denotamos por f g, como (f g)( x) g(

x) := f ( x) para cada
A
x
4. si m = 3, el producto cruz de f por g, que denotamos por f g, como (f g)(

x) := f (
x)g(
x)
para cada xA
5. si m = 1, el cociente de f entre g, que denotamos por f /g, como (f /g)(

x) := f (
x)/g(
x) para
B = {
cada x x A | g(
x) 6= 0}
on de h con f , que denotamos como h f , como (h f )(

6. la composici x) := h(f (
x)) para cada
B = {
x x A | f (
x) D}
Aun y cuando el n umero de variables involucradas en las funciones con las cuales vamos a
trabajar impone una limitante para recurrir a alg un tipo de representacion geometrica, en algunos
casos (sobre todo cuando el n umero de variables no es muy grande), existe la posibilidad de hacer
un poco de geometra con ellas.
Para lograr lo anterior, asociados con una funcion f : A Rn Rm existen algunos conjuntos a
los cuales haremos alusion a lo largo de todo este texto. El primero que definiremos, y sin importar
que tan grandes sean n y m, ser a lo que llamaremos la grafica de f .
J. P
aez 62

2.1. Algebra y geometra de las funciones de Rn en Rm Captulo 2. Funciones de Rn en Rm
Definicion 2.3 Dada f = (f1 , . . . , fm ) : A Rn Rm definimos la gr afica de f , que denotaremos

por Gf , como el siguiente conjunto:
Gf := (x1 , . . . , xn , f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) Rn Rm = Rn+m | (x1 , . . . , xn ) A

y que con frecuencia escribiremos simplemente (para evitar expresiones muy largas, pero no sin
cierto abuso de notaci
on) como
x)) Rn Rm = Rn+m | x

Gf := (x, f ( A
Como el lector estara de acuerdo, la gr afica de una funcion solo la podremos dibujar (y ver!)
si 2 n + m 3, es decir, en muy pocos casos. Peor aun, en el caso n = 1 y m = 2 este conjunto
no resulta de mucha utilidad, y como el caso n = 1 y m = 1 ya se estudio con mucho cuidado en
los cursos previos de c alculo de una variable, s olo en el caso n = 2 y m = 1 podremos dibujar la
grafica, lo que no le quita interes a su estudio.
De acuerdo con lo anterior, el tipo de funcion para el cual vale la pena destacar algunas es-
trategias que nos permitan darnos una idea de como es su gr afica (independientemente de que hoy
en da se cuenta con herramientas muy sofisticadas para dibujarlas), ser a cuando tengamos una
funcion f : A R2 R. En este caso, la gr afica de este tipo de funciones se puede escribir como
Gf = (x, y, z) R3 | z = f (x, y) y (x, y) A

lo que en principio establece que los elementos de la gr

afica deben satisfacer la ecuaci
on
z = f (x, y)
con la restriccion de que (x, y) A. De esta forma, la gr afica de este tipo de funciones podr a
coincidir (o estara contenida en) con alguna superficie, por lo que la experiencia del lector en
reconocer superficies a partir de su ecuacion le ser
a de gran utilidad.
Relacionado con lo anterior, y de la misma forma que no cualquier subconjunto de R2 puede
ser la gr
afica de una funcion de R en R, no cualquier subconjunto de R3 puede ser la gr afica de una
funcion de R en R. Y as como en el caso de R2 se tiene el criterio geometrico que establece que
2
la gr
afica de una funcion definida de R (o de un subconjunto de R) en R debe ser un subconjunto
de R2 que s olo puede intersectar a cualquier recta paralela al eje Y en a lo mas un punto, en el
caso que nos ocupa hay un criterio geometrico equivalente: la gr afica de una funcion definida de
R (o de un subconjunto de R ) en R debe ser un subconjunto de R2 que s
2 2 olo puede intersectar a
cualquier recta paralela al eje Z en a lo mas un punto. Como seguramente el lector recordara, lo
que justifica a este criterio es el hecho de que estamos hablando de funciones, de tal forma que a
cada elemento del dominio le corresponde uno y s olo un valor del contradominio.
El siguiente ejemplo ilustra los hechos que mencionamos en los p arrafos anteriores.
on f : A R2 R, con A = (x, y) R2 | x2 + y 2 1 ,

Ejemplo 2.4 Esboce la gr
afica de la funci
definida como p
f (x, y) = 1 (x2 + y 2 )
on que hicimos anteriormente, las ternas (x, y, z) Gf deben ser tales que
Con base en la observaci
z = f (x, y) (2.1)
p
= 1 (x2 + y 2 )
63 J. P
aez
de tal forma que, tomando el cuadrado en ambos lados de esta identidad (operaci on que ser
a muy
importante recordar mas adelante), concluimos que estas ternas satisfacen la ecuaci
on
z 2 = 1 (x2 + y 2 )
o equivalentemente, la ecuaci
on
x2 + y 2 + z 2 = 1 (2.2)
que seguramente el lector reconocer a como la ecuaci on de una esfera de radio 1 con centro en el
origen (0, 0).
Pero justo por la observaci on anterior a este ejemplo, dado que muchas rectas paralelas al eje Z
(incluyendo el propio eje) intersectan a esta esfera en mas de un punto, la gr afica de nuestra funci
on
no puede ser toda la esfera. Y para determinar que parte de esta esfera corresponde a la gr afica
de nuestra funcion, recordemos que la ternas que est an en la grafica satisfacen la ecuacion 2.1 de
donde se deduce que la coordenada z de estas ternas siempre es mayor o igual a 0 (a diferencia
de las ternas que satisfacen la ecuaci on 2.2, de la que no se puede deducir que la coordenada z
tenga que cumplir con la misma condici on). Como seguramente el lector ya lo habr a notado, esta
perdida del signo de la coordenada z fue producto de haber tomado el cuadrado en la ecuaci on
2.1.
Resumiendo lo anterior, concluimos que la gr afica de nuestra funci
on es la parte de la esfera unitaria
que se encuentra por arriba (y sobre) el plano XY , como se muestra en la figura 2.1.
p
Figura 2.1: Gr
afica de la funcion f (x, y) = 1 (x2 + y 2 )
Otro conjunto asociado a una funcion de Rn en R, y al que con frecuencia haremos referencia,
es el llamado conjunto de nivel. Su definicion formal es la siguiente.
on 2.5 Sean f : A Rn R y c R. Definimos el conjunto de nivel c de f , que

Definici
denotamos por Nc (f ), como
Nc (f ) := {
x A | f (
x) = c}
J. P
aez 64

Una propiedad evidente (pero importante) de los conjuntos de nivel es que, para valores distintos
de c, estos conjuntos no se intersectan. Esto es una consecuencia inmediata del hecho de que f sea
una funcion y la dejaremos plasmada en la siguiente
on 2.6 Dados c, d R, se tiene que

Observaci
Nc (f ) Nd (f ) = si y s
olo si c 6= d
Como es de esperarse, los conjuntos de nivel solo se pueden ver o dibujar si el dominio
de nuestra funci a contenido en R2 o R3 (lo que no reduce su importancia para dimensiones
on est
mayores). Por esta raz
on, daremos algunos ejemplos solo en estos casos.
Ejemplo 2.7 Determine los conjuntos de nivel de las siguientes funciones:

p
1. f (x, y) = x2 + y 2 con (x, y) R2 . Dado que f (x, y) 0 para toda (x, y) R2 , para c < 0
se tiene que Nc (f ) = . Si c = 0 entonces Nc (f ) = {(0, 0)}, y si c > 0 entonces
n p o
Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c
que no es mas que la circunferencia de radio c con centro en el origen (ver figura 2.2).
p
x2 + y 2 = c
b

1 c c X
x2 + y 2 = c
p
Figura 2.2: Curvas de nivel c de las funciones f (x, y) = x2 + y 2 y f (x, y) = x2 + y 2 , las circunfe-

rencias de radio c y c, respectivamente.
2. f (x, y) = x2 + y 2 con (x, y) R2 . Como en este caso tambien se tiene que f (x, y) 0 para
toda (x, y) R2 , para c < 0 se tiene de nuevo que Nc (f ) = . Asimismo, si c = 0 entonces
Nc (f ) = {(0, 0)}, y si c > 0 entonces
Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c

que en este caso es la circunferencia de radio c con centro en el origen (ver figura 2.2).
3. f (x, y, z) = x + y + z con (x, y, z) R3 . En este caso se tiene que Nc (f ) 6= para toda c R

y
Nc (f ) = (x, y, z) R3 | x + y + z = f (x, y) = c

65 J. P
aez
Figura 2.3: Conjunto de nivel 1 de la funcion f (x, y, z) = x + y + z
que, como el lector reconocer

a f
acilmente, se trata de un plano con vector normal (1, 1, 1) (ver
figura 2.3).
Entre otras cosas, y para el caso de R2 , este tipo de conjuntos tambien ser an u
tiles para esbozar
la gr
afica de una funci on. En efecto, si cada conjunto de nivel Nc (f ) (o una cantidad suficiente de
ellos) se traslada paralelamente al plano XY a la altura c, obtenemos un bosquejo de la gr afica de
f (ver figura 2.4). Este hecho, junto con todas las dem as tecnicas (como por ejemplo, la interseccion
con los planos coordenados) que el lector haya aprendido en sus cursos de Geometra Analtica,
le ser
an u afica de una funcion de R2 en R.
tiles a la hora de intentar visualizar la gr
afica de la funcion f (x, y) = x2 + y 2 a partir de algunas de sus curvas de

Figura 2.4: Bosquejo de la gr
nivel
J. P
aez 66

En realidad, los conjuntos de nivel son un caso particular de otros conjuntos con los cuales vamos
a trabajar en este mismo captulo un poco mas adelante. Dada esta relaci on, la aprovechamos para
definir lo que se conoce como la imagen inversa de D bajo f , de la siguiente manera.
Definici on 2.8 Sean f : A Rn Rm y D Rm . Definimos la imagen inversa de D bajo f ,
que denotamos por f 1 (D)1 , como el conjunto dado por:
f 1 (D) := {
x A | f (
x) D}
Observaci
on 2.9 Como el lector podr acilmente, si f : A Rn R y c R, entonces
a verificar f
Nc (f ) = f 1 ({c})
Para concluir con la lista de conjuntos asociados con una funcion f : A Rn Rm , dado un
conjunto B A, defineremos ahora lo que se conoce como la imagen directa (o simplemente la
imagen ) de B bajo f de la siguiente manera.
on 2.10 Sean f : A Rn Rm y B A. Definimos la imagen (directa) de B bajo f ,

Definici
que denotamos por f (B)(2 ), como el conjunto dado por:
x) R m | x
f (B) := {f ( y Rm | existe x
B} = { B tal que f (
x) = y}
Desde un punto de vista geometrico, la imagen de un conjunto bajo una funcion f : A Rn

Rm jugara un papel relevante cuando n m. En estos casos, dado un conjunto B A ser a muy
importante reconocer quien es el conjunto f (B). Como es de suponer, los u nicos casos en lo que
ser
a posible dibujar (o bosquejar) la imagen de un conjunto bajo una funcion, ser an aquellos en los
que el contradominio de la funcion es R2 o R3 , es decir s
olo para funciones de R en R2 , de R en R3 ,
de R2 en R2 , de R2 en R3 y de R3 en R3 . En el captulo 3 vamos a estudiar con mas detalle a las
funciones de R en Rn (en particular en R2 y en R3 ), raz on por la cual ahora s
olo nos concretaremos
en dar ejemplos de c omo es la imagen de algunos conjuntos bajo este tipo de funciones.
Ejemplo 2.11 Sea f : R R2 dada por f (t) = (cos(t), sen(t)). Describiremos (o bosquejaremos)
los conjuntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z}) con t0 R fijo, en ambos
casos.
Para esta funcion, es importante observar que las parejas (cos(t), sen(t)) pertenecen a la circunfe-
rencia unitaria con centro en el origen, pues satisfacen la ecuaci on x2 + y 2 = 1 para toda t R, en
donde adem as la variable t representa el angulo (medido en radianes) formado por la parte positiva
del eje X, y la semirecta que parte del origen, y que pasa por el punto (cos(t), sen(t)). Tomando
en consideraci
on este hecho, ahora f acilmente podemos concluir que: f ([/2, /2]) es el conjunto
formado por la parte de la circunferencia unitaria con centro en el origen que se encuentra en el
semiplano derecho (figura 2.5 (a)), f ([t0 , t0 + 2)) es dicha circunferencia completa (figura 2.5 (b)),
y f ({t0 + k/2 | k Z}) es un conjunto formado s olo por cuatro puntos (figura 2.5 (c)).
1
Esperemos que esta notacion no cause confusi on con la notaci
on de funci
on inversa; si lo que est
a entre parentesis
(el argumento) es un conjunto, nos referimos a la imagen inversa; y si es un elemento de Rn , hablamos de la funci on
inversa de f .
2
Como en el caso de la imagen inversa, nuevamente esperemos que esta notaci on no cause confusion con la notacion
de funcion; si lo que est
a entre parentesis es un conjunto, nos referimos a la imagen directa; y si es un elemento de
Rn , hablamos de la funci on evaluada en ese elemento.
67 J. P
aez
b
t0
1 1 1
b
(a) (b) (c)
Figura 2.5: Los conjuntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z})
Ejemplo 2.12 Sea f : A R2 R3 , con A = [0, 2] [0, ], dada por
f (t, s) = (cos(t) sen(s), sen(t) sen(s), cos(s))
Describiremos (o bosquejaremos) los conjuntos f ({(t, s0 ) | t [0, 2]}), f ({(t0 , s) | s [0, ]}) con
s0 [0, ] y t0 [0, 2] fijos.
Como en el inciso anterior, ahora es importante notar que las ternas
(cos(t) sen(s), sen(t) sen(s), cos(s))
satisfacen la ecuacion x2 + y 2 + z 2 = 1 por lo que podemos concluir que los conjuntos que buscamos
est
an contenidos en la esfera de radio 1 con centro en el origen.
Como todas las ternas f (t, s) = (cos(t) sen(s0 ), sen(t) sen(s0 ), cos(s0 )) tienen la particularidad de
que su tercera coordenada es la misma, entonces satisfacen la ecuaci on del plano z = cos(s0 ) el
cual es paralelo al plano XY . En virtud de nuestra primera observaci on, concluimos que nuestro
conjunto est a contenido en la intersecci on de la esfera que mencionamos y este plano (que no es
mas que una circunferencia de radio sen(s0 ) con centro en el punto (0, 0, cos(s0 ))), y dado que
t [0, 2] tenemos que el conjunto buscado coincide con esta circunferencia (ver figura 2.6).
Por otra parte, como las parejas (cos(t0 ) sen(s), sen(t0 ) sen(s)) (que no son mas que la proyecci on
sobre el plano XY de las ternas (cos(t0 ) sen(s), sen(t0 ) sen(s), cos(s)) = f (t0 , s)) pertenecen a la
semirecta que parte del origen y que forma un angulo de t0 radianes con la parte positiva del eje
X (observe que sen(s) 0 para toda s [0, ]), concluimos que el conjunto f ({(t, s0 ) | t [0, 2]})
est
a contenido en la intersecci on de la esfera unitaria con centro en el origen y el plano cuya
ecuaci on es sen(t0 )x + cos(t0 )y = 0. Esta intersecci on es una circunferencia completa, pero dado
que la proyecci on de los elementos de nuestro conjunto s olo caen en la semirecta antes descrita,
inferimos que este conjunto s olo abarca la mitad de esta circunferencia, la que une a los puntos
(0, 0, 1) = f (t0 , 0) y (0, 0, 1) = f (t0 , ) y que se proyecta sobre dicha semirecta (ver figura 2.7).
Las propiedades mas importantes relacionadas con los conceptos de imagen inversa e imagen
directa las dejaremos plasmadas en la siguiente proposicion, y dada la sencillez de sus pruebas,
estas quedaran a cargo del lector.
Proposicion 2.13 Sean f : A Rn Rm , A , B, C A, y D , D, E Rm , con I, I un

conjunto de ndices. Pruebe que:
J. P
aez 68

Figura 2.6: El conjunto f ({(t, s0 ) | t [0, 2]}) se obtiene al intersectar la esfera x2 + y 2 + z 2 = 1

con el plano z = cos(s0 )
1. si D E entonces f 1 (D) f 1 (E)

1
S S 1
2. f D = f (D )
I I

3. f 1 f 1 (D )
T T
D =
I I
4. f 1 (D c ) = (f 1 (D))c A = A \ f 1 (D)
5. si B C entonces f (B) f (C)

S S
6. f A = f (A )
I I

T T T T
7. f A f (A ) y si f es inyectiva entonces f A = f (A )
I I I I
8. f (A) \ f (B) f (A \ B) y si f es inyectiva entonces f (A \ B) = f (A) \ f (B)
9. B f 1 (f (B)) y si f es inyectiva entonces B = f 1 (f (B))
10. f (f 1 (D)) D y f (f 1 (D)) = D si y s

olo si D f (A)
Concluimos esta secci

on mencionando otra forma de representar geometricamente a las fun-
ciones de R2 en R2 y de R3 en R3 . Esta otra forma se desprende b asicamente de las dos maneras
geometricas en que podemos representar a una pareja (o terna) de n umeros reales. En efecto,
como ya hemos mencionado en muchas ocasiones, las parejas o ternas las podemos dibujar, o bien
como un punto, o bien como una flecha (o vector). Combinando estas dos representaciones, dada
una funcion f : A R2 R2 (o f : A R3 R3 ), esta la representaremos geometricamente
de la siguiente forma: a cada elemento x A lo dibujaremos como un punto y a f ( x) como un
vector colocado sobre este punto x . Otra forma de decir lo anterior, es que en el punto x A
sembramos el vector f (
x), y tal vez por esta forma mas coloquial de decirlo, es que a este tipo
69 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.2. Lmite y continuidad de funciones de Rn en Rm
Figura 2.7: El conjunto f ({(t0 , s) | s [0, ]}) esta contenido en la interseccion de la esfera x2 + y 2 +
z 2 = 1 con el plano z = cos(s0 ), y solo consta de una semicircunferencia.
de funciones (y su representaci
on geometrica) tambien se les conoce con el nombre de campos vec-
toriales. Es importante mencionar que en la descripcion anterior se est a suponiendo que, mientras
A, es fijo, el que se usa para dibujar a
el sistema coordenado con base en el cual se dibuja a cada x
f (
x) tendra como origen al punto x
y sus ejes (a menos que se indique lo contrario) ser an paralelos
a los ejes del primero. Es decir, mientras que el sistema coordenado en el que representamos a los
elementos del dominio A no cambia, el que usamos para representar a los valores de f cambiar a
con cada punto. Los siguientes ejemplos ilustran esta forma de representar geometricamente a este
tipo de funciones.
Ejemplo 2.14 Considere las siguientes funciones.

1. f (x, y) = (x, y). En este caso, como el dominio de f es todo R2 , cada punto del plano tiene
asignado un vector, como se muestra en la figura 2.8 (a).
2. f (x, y) = (y, x). Nuevamente, como el dominio de f tambien es todo R2 , cada punto del
plano tiene asignado un vector, como se muestra en la figura 2.8 (b).
3. f : R3 \ {
0} R3 R3 dada por
!
x y z
f (x, y, z) = p ,p ,p
x2 + y 2 + z 2 x2 + y 2 + z 2 x2 + y 2 + z 2
En este caso, sobre cada punto de R3 distinto del origen, la funci
on asigna un vector que
tiene la particularidad de ser siempre de norma 1, como se muestra en la figura 2.9.
2.2 Lmite y continuidad de funciones de Rn en Rm

Como el lector seguramente recordara de su primer curso de calculo, para el caso de las funciones de
R en R los conceptos de lmite y continuidad est
an ntimamente relacionados con la idea de cercana,
J. P
aez 70
2.2. Lmite y continuidad de funciones de Rn en Rm Captulo 2. Funciones de Rn en Rm
f (x, y)
b f (x, y) b
(x, y)
b b
(x, y)
b b
b b
(a) (b)
Figura 2.8: Representacion geometrica de funciones de R2 en R2 . La pareja (x, y) se representa por

un punto y el valor de f en este punto (f (x, y)) por una flecha.
f (x, y, z)
b
b
b b
(x, y, z)
b
b
X b
b
Y
Figura 2.9: Representacion geometrica de una funcion de R3 en R3 . La terna (x, y, z) se representa

por un punto y el valor de f en este punto (f (x, y, z)) por una flecha.
la cual, trat
andose de los n
umeros reales, se formaliza a traves del concepto de valor absoluto. Para
las funciones de Rn en Rm los conceptos de lmite y continuidad no cambian esencialmente y siguen
siendo una expresi on de las ideas de cercana y aproximacion. De esta forma, dado que en Rn
contamos con varias formas de medir la distancia entre sus elementos (o de generalizar el concepto
de valor absoluto), en principio tenemos muchas maneras de definir estos conceptos (aunque, como
veremos mas adelante, y a la luz de las desigualdades de la proposici on 1.15 del captulo 1, todas
ellas ser
an equivalentes). Y as como en el caso de los n
umeros reales, nuestro primer acercamiento
a la idea de cercana (o aproximacion) lo realizamos a traves del concepto de sucesion, eso mismo
haremos para el caso de Rn .
2.2.1 Sucesiones en Rn
El concepto de sucesion en Rn (o en un conjunto arbitrario) es an alogo al de sucesion en R:
on que a cada natural le asocia un elemento de Rn . Este concepto lo
una sucesion es una funci
formalizamos en la siguiente
71 J. P
aez
Definicion 2.15 Una sucesi on en Rn es una funci on s : N R. Denotamos por x

k a s evaluada
en k, es decir, x on s, escribiremos {
k = s(k) y para referirnos a la funci xk }.
Como sucede con cualquier funci on, una sucesion en Rn queda totalmente determinada si se
conoce la regla de asociasi
on, es decir si conocemos x k Rn , esta
k para cada k N. Dado que x
(i) 3
debe tener n coordenadas (a las cuales denotaremos por xk ( )), es decir que

(1) (n)
x
k = xk , . . . , xk
De esta forma, toda sucesion determina (o est a determinada por) n sucesiones de n umeros reales,
a las cuales conoceremos con el nombre de sucesiones coordenadas. Las sucesiones coordenadas
tendran un papel muy importante en los conceptos y resultados que desarrollaremos en esta secci on,
pues la mayora de ellos se pueden reducir a los conceptos y resultados an alogos al caso real.
Sin duda el concepto mas importante con relaci on a las sucesiones en Rn es el de convergencia, el
cual deseamos que refleje la misma idea de aproximacion que se tiene para el caso real. En terminos
intuitivos (o geometricos), diremos que una sucesion { xk } en Rn tiende (o converge, que es el
temino que usaremos) a un punto x n
0 R si los terminos de la sucesion est
an cada vez mas cerca
de x0 conforme el ndice k se va haciendo cada vez mas grande (o conforme k tiende a infinito, que
es la forma en que expresamos esta idea de que k se va haciendo cada vez mas grande).
Como se recordara, en el caso de los n umeros reales esta idea de aproximacion o cercana
se formaliza a traves del concepto de valor absoluto, y dado que en Rn contamos con conceptos
equivalentes, la definicion de convergencia de una sucesion en Rn ser a una copia de la definicion
para sucesiones de n umeros reales.
Definici on 2.16 Sea { on en Rn . Decimos que {

xk } una sucesi xk } es convergente (o que converge)
n
0 R tal que para toda cantidad positiva existe un ndice N N tal que para cualquier
si existe x
otro ndice k N se tiene que
k
xk x0 k <
es decir: si para todo > 0 existe N N tal que si k N entonces x k B (
x0 ). En este caso
decimos que la sucesion {
xk } converge a x
0 , lo que denotamos como {
xk } x
0 o
lim x
k = x
0
k
Una interpretacion geometrica de la definicion anterior sera la siguiente: cuando una sucesion
{
xk } converge a un punto x0 se tiene que para cualquier bola que tomemos con centro en x 0 , sin
importar que peque no pueda ser su radio, esta contiene a casi todos los terminos de la sucesion
umero finito de ellos). La figura 2.10 ilustra este hecho en R2 .
(salvo quizas un n
Como seguramente el lector lo habra pensado, una opcion para definir la convergencia de una
sucesion en Rn hubiera sido hacerlo a traves de las sucesiones coordenadas, es decir, definir que
n o
(1) (n)
k = xk , . . . , xk
x
n o
(i)
converge si cada sucesion coordenada (de numeros reales) xk converge (para cada i {1, . . . , n}).
Y el lector hubiera estado en lo correcto, como lo mostraremos, dada su importancia, en la primera
proposicion que formularemos con relaci on a la convergencia de sucesiones en Rn .
3
En este caso usaremos un superndice (encerrado entre parentesis) para denotar la coordenada de un elemento
de Rn dado que en este caso el subndice denota el termino de la sucesi
on.
J. P
aez 72
x
N +1
b
x
1
b
x
N +2 x
0
b b
x
2
b
x
N
b
x
N 1
b
Figura 2.10: Una sucesion { 0 si para todo > 0 existe N N tal que si
xk } converge a un punto x
k N entonces x
k B (x0 ).
n o
(1) (n)
Proposicion 2.17 Sea x k = xk , . . . , xk on en Rn . {
una sucesi xk } converge si y s olo si
n o
(i) (1) (n)
x converge para cada i {1, . . . , n}. Es decir, {xk } x 0 = x0 , . . . , x0 si y s
olo si
n k o
(i) (i)
xk x0 para cada i {1, . . . , n}.
Demostraci on. Por los incisos 1 y 2 de la proposici

on 1.15 (del captulo 1) sabemos que para
n
= (x1 , . . . , xn ) R se tiene que
cualquier x
|xi | k
xk k
xk k
xk1 = |x1 | + + |xn |
para cada i {1, . . . , n} de tal forma que

(i) (i) (1) (1) (n) (n)
xk x0 k 0 k xk x0 + + xk x0
xk x (2.3)
para cada i {1, . . . , n} y para toda k N.

(1) (n)
Supongamos ahora que { xk } x0 = x0 , . . . , x0 . Sabemos entonces que, dado > 0,
existe un ndice N N tal que si k N entonces
k
xk x
0 k <
de tal forma que, por la primera desigualdad de 2.3, se tiene (para cada i {1, . . . , n}) que

(i) (i)
xk x0 k xk x
0 k <
n o
(i) (i)
para toda k N de donde concluimos que xk x0 (para cada i {1, . . . , n}).
n o
(i) (i)
Si ahora suponemos que xk x0 para cada i {1, . . . , n}, sabemos que dado > 0, para
/n > 0 y para cada i {1, . . . , n} existe un ndice Ni N tal que

(i)

(i)
xk x0 <
n
para toda k Ni (y para cada i {1, . . . , n}). Por tanto, si N = max{N1 , . . . , Nn }, por la segunda
desigualdad de 2.3, si k N , como N Ni para cada i {1, . . . , n}, entonces

(1) (1) (n) (n)
k
xk x0 k xk x0 + + xk x0
73 J. P
aez

< + +
n n
=
con lo que concluimos que {
xk } x
0 .
Con base en la proposici on anterior, y dando como un hecho conocido (y probado!) que la
suma y producto de sucesiones de n umeros reales convergentes, tambien es convergente, obtenemos
el siguiente resultado (relacionado con el diferente tipo de operaciones algebraicas que podemos
realizar con sucesiones en Rn ). Como es de suponerse, la prueba de la siguiente proposici
on se deja
al lector.
Proposicion 2.18 Sean { yk } sucesiones en Rn , y R. Si {

xk }, { xk } x
0 y {
yk } y0
entonces:
1. {
xk } + {
yk } := {
xk + yk } x
0 + y0
xk } := {
2. { xk }
x0
3. {
xk } {
yk } := {
xk yk } x
0 y0
4. si n = 3, {
xk } {
yk } := {
xk yk } x
0 y0
Y hablando de criterios que nos permiten garantizar la convergencia de una sucesion en Rn ,

seguramente el lector recordara el muy conocido criterio de convergencia de sucesiones de n umeros
reales, el afamado criterio de Cauchy. Como en el caso de la definicion de convergencia en Rn ,
tambien podramos recurrir a las sucesiones coordenadas para generalizar este concepto a las
sucesiones en Rn . Sin embargo, y al igual que hicimos con la convergencia, puesto que este concepto
tambien expresa una cierta idea de cercana (y por lo tanto de distancia), la definiremos con base
al concepto (o a uno de ellos) de distancia que hemos definido en Rn , y despues formularemos
un resultado que muestra que esta definicion resulta equivalente a que las sucesiones coordenadas
tambien sean de Cauchy.
Definicion 2.19 Sea { on en Rn . Decimos que {

xk } una sucesi xk } es de Cauchy si para toda
cantidad positiva existe un ndice N N tal que para cualquier otro par de ndices k, l N se
tiene que
k
xk x
l k <
es decir: si para todo > 0 existe N N tal que si k, l N entonces k
xk x
l k < .
Como mencionamos antes, la definicion anterior resulta equivalente a que las sucesiones coorde-
nadas tambien sean de Cauchy, lo que plasmamos en la siguiente proposici on y cuya prueba, como
es de suponerse, queda a cargo del lector.
n o
(1) (n)
Proposicion 2.20 Sea x k = xk , . . . , xk on en Rn . {
una sucesi xk } es de Cauchy si y s
olo
n o
(i)
si xk es de Cauchy para cada i {1, . . . , n}.
Como mencionamos antes, la importancia del concepto de sucesion de Cauchy radica en que
dicha propiedad es una condici on equivalente a la propiedad de ser convergente, resultado que
podemos obtener como un facil corolario de la proposicion anterior, y del correspondiente resultado
para las sucesiones de numeros reales, lo que resulta un hecho muy relevante para que este criterio
sea una condicion suficiente para la convergencia.
J. P
aez 74
Corolario 2.21 Sea { on en Rn . {

xk } una sucesi xk } es convergente si y s
olo si {
xk } es de Cauchy.
Es importante mencionar que el resultado anterior se puede probar sin recurrir a la proposici on
2.20, prueba que dejamos como un problema para el lector (problema 21).
Otro concepto que resulta muy importante en relaci on a las sucesiones, es el de subsucesion.
Con la misma idea bajo la cual se define el concepto de subsucesi on de n
umeros reales, tambien
se define para el caso de sucesiones en Rn . Es decir, una subsucesi on de una sucesion {
xk } ser
a
una nueva sucesion que se construye eligiendo algunos terminos de la sucesion original { xk }, con
la u
nica restriccion de que los ndices de los terminos que se elijan vayan creciendo, es decir, que
estos formen una sucesion de n umeros naturales creciente (restriccion que no debe extra narnos,
sobre todo si recordamos que lo importante de las sucesiones es lo que sucede con sus terminos
justo cuando su ndice crece (o tiende a infinito)). La formalizacion de este concepto la damos
en la siguiente
Definicion 2.22 Sean { xk } una sucesi on en Rn y {kl } una sucesi on de n

umeros naturales (es
decir, una funci on que al natural l, le asocia el natural kl ). Decimos que {
xkl } es una subsucesi
on
de {
xk } si {kl } es una sucesion creciente de numeros naturales (es decir, que kl < kl+1 para toda
l N).
Como dijimos antes, una subsucesi on {xkl } de una sucesion { xk } es a su vez una sucesion, y es
importante recalcar que el ndice (o variable) de esta nueva sucesion est a representado por la letra
l; es decir, el decimo termino de la sucesion { xkl } es el k10 termino de la sucesion original { xk }.
Tambien es importante hacer notar que toda sucesion es subsucesi on de si misma; en efecto, si
tomamos kl = l la funci on identidad de N en N, que sin duda es creciente, entonces la subsucesi on
{xkl } es {
xl }, es decir la sucesion original {xk } (en donde la u nica diferencia es que cambiamos el
nombre de su ndice (o variable), l por k).
De la idea intuitiva de convergencia es de esperarse que si una sucesion { xk } converge al punto
x n
0 R entonces cualquier subsucesi on de esta tambien converja a x 0 . El recproco de la afirmacion
anterior tambien es cierto; es decir, si todas las subsucesiones de una sucesion { xk } convergen a
un mismo punto x 0 Rn entonces { xk } tambien converge a x 0 , afirmacion que resulta evidente
puesto que, como dijimos antes, toda sucesion es subsucesi on de si misma. Lo interesante es que,
aun y cuando excluyamos a la sucesion { xk } como subsucesi on de si misma, el resultado sigue
siendo cierto. Este es un hecho importante y lo dejamos plasmado en la siguiente proposici on. Con
relacion a su prueba, vale la pena mencionar que, como ya va siendo costumbre, hay dos caminos
para hacerla: usar la proposici on 2.17 y el correspondiente resultado para sucesiones de n umeros
reales (que es la que haremos aqu), o hacerla sin usar esta proposici on y probarla directamente
(que es la que dejaremos como un problema para el lector).
Proposici on 2.23 Sea { xk } una sucesion en Rn . { 0 Rn si y s

xk } converge al punto x olo si
on {
cualquier subsucesi xk l } =
6 {
xk } tambien converge a x
0 .
Demostraci on. Para entender un poco mejor esta prueba, n otese que la proposici
on se puede
reformular de la siguiente manera: { xk } converge al punto x 0 Rn si y s olo si para cualquier
sucesion creciente de numeros naturales {kl } tal que kl 6= l para alguna l N, se tiene que { xk l }
tambien converge al puntox0 .
(1) (n) (1) (n)
Supongamos que x k = xk , . . . , xk 0 = x0 , . . . , x0 . Si {
yx xk } x
0 por la proposici
on
(i) (i)
2.17 sabemos que {xk } x0 para cada i {1, . . . , n}. Ahora, si tomamos cualquier subsucesion
(i) (i)
{
xkl } 6= { on de {xk } (para cada i {1, . . . , n}), por el
xk }, dado que {xkl } es una subsucesi
75 J. P
aez
(i) (i)
correspondiente resultado para sucesiones de n umeros reales sabemos que {xkl } x0 (para cada
i {1, . . . , n}) de modo que, nuevamente por la proposici
on 2.17, tenemos que {
xkl } x
0 .
(1) (n)
Por otra parte, si cualquier subsucesion {
xk l } =
6 {
xk } converge a x
0 = x0 , . . . , x0 entonces
n o n o
(i) (i) (i)
cualquier subsucesi on xkl 6= xk converge a x0 (para cada i {1, . . . , n}) de tal forma
que,
n nuevamente
o por el correspondiente resultado para sucesiones de n umeros reales, sabemos que
(i) (i)
xk x0 (para cada i {1, . . . , n}) de modo que, nuevamente por la proposici on 2.17, tenemos
que {xk } x0 .
El resultado anterior tiene una consecuencia pr actica muy importante: si { xk } es una sucesion
que tiene una subsucesi on que no converge, o tiene dos subsucesiones que convergen a puntos
diferentes, entonces {xk } no es convergente.
Para concluir con la lista de condiciones necesarias y suficientes (o ambas) para que una sucesion
en Rn sea convergente (sin duda el tema mas importante con relaci on a estas), retomaremos la
interpretacion geometrica que dimos al hecho de que una sucesion sea convergente. Como se
recordara, si una sucesion {
xk } converge a un punto x 0 entonces dada una bola con centro en este
punto, sin importar su radio, casi todos los terminos de la sucesion (salvo un n umero finito de
ellos) se quedan dentro de dicha bola. Entre otras cosas, de este hecho se deduce que el conjunto
formado por los terminos de la sucesion (y que mas adelante definiremos formalmente) est a ubicado
esencialmente alrededor del punto x 0 y por lo tanto ser
a un conjunto acotado. El conjunto formado
por los terminos de una sucesion (al que se le conoce como el rango de la sucesion) es un conjunto
que resulta ser importante, y mas aun cuando este est a acotado, raz on por la cual defineremos
formalmente a este conjunto y daremos un nombre particular (que seguramente el lector ya adivina)
a las sucesiones para las cuales se cumple esta propiedad.
on 2.24 Sea {
Definici on en Rn . Definimos el rango de la sucesi
xk } una sucesi on, que denotamos
xk }), como el conjunto formado por los termino de la sucesi
por R({ on, es decir
xk | k N}
xk }) := {
R({
Definicion 2.25 Sea { on en Rn . Decimos que {

xk } una sucesi xk } es una sucesi
on acotada si
xk k M para toda k N.
xk }) es un conjunto acotado, es decir, si existe M > 0 tal que k
R({
Con base en estas definiciones, la discusion que hicimos previa a ellas se puede resumir en la
siguiente
Proposici on 2.26 Sea { on en Rn . Si {

xk } una sucesi xk } es una sucesi
on convergente entonces
{
xk } es una sucesi
on acotada.
Demostraci on. Sea x0 Rn tal que {

xk } x 0 . De acuerdo con la definicion de convergencia,
sabemos que para = 1 > 0 (o cualquier otra cantidad positiva que se nos ocurra) existe un
ndice N N tal que si k N entonces x k B1 ( x0 ), o equivalentemente, que kxk x
0 k < 1.
De esta forma, si tomamos M = max{k x1 k , . . . , k
xN 1 k , k
x0 k + 1} tenemos que k
xk k M si
k {1, . . . , N 1} y si k N entonces k
xk x 0 k < 1 y por lo tanto
k
xk k = k(
xk x 0 k
0 ) + x
k
xk x
0 k + k
x0 k
< 1 + k
x0 k
J. P
aez 76
xk k M para toda k N, es decir, que {

con lo que concluimos que k xk } es una sucesion acotada.
El resultado anterior nos proporciona una consecuencia (o condici on) necesaria de las sucesiones
convergentes y suele ser muy u til cuando dicha condici on no se cumple pues nos permite concluir
que la sucesion en cuesti
on no es convergente (como suele suceder con todas las condiciones que
son necesarias). Desafortunadamente esta propiedad no es una condici on suficiente que garantice
la convergencia de una sucesion, como es facil verificarlo en el siguiente
on en R2 dada por x
k = (1)k , 1/k . Como

Ejemplo 2.27 Considere la sucesi
q
k
xk k = ((1)k )2 + (1/k)2
p
= 1 + 1/k 2

2
(1)
concluimos que { on acotada. Sin embargo, como xk = (1)k no es convergente,
xk } es una sucesi
on 2.17 tenemos que {
por la proposici xk } es una sucesi
on no convegente.
A pesar del ejemplo anterior, del hecho de que una sucesion { xk } sea acotada se puede obtener
un resultado muy importante: si bien la sucesion { xk } completa puede que no sea convergente,
lo que siempre sucede es que existe al menos una subsucesi on de {xk } que si converge, como sucede
con la sucesion del ejemplo anterior para la cual es facil ver que la subsucesi on de los ndices
pares {x2l = (1)2l , 1/2l } converge al punto (1, 0), y que la subsucesion de los ndices impares
2l1

{
x2l1 = (1) , 1/(2l 1) } converge al punto (1, 0). Este importante resultado lo dejamos
plasmado en el siguiente
Teorema 2.28 Sea { xk } una sucesion en Rn . Si {

xk } est
a acotada entonces existe {
xkl } sub-
on de {
sucesi xk } tal que {
xkl } es convergente.
Demostraci on. Existen al menos tres pruebas diferentes de este teorema (dos de las cuales se
dejan como problema al lector). La prueba que haremos aqu se basara, como en casos anteriores,
en la proposicion 2.17 y en el resultado equivalente para sucesiones de n umeros reales.
Procederemos por induccion en n, la dimension del espacio en el que estamos tomando la
sucesion. De esta forma, para n = 1 estamos en el caso de sucesiones en R el cual vamos a dar por
n
probado. Supongamos n entonces
que el teorema oes cierto para sucesiones en R y lo probaremos
(1) (n) (n+1) n+1
para una sucesion x k = xk , . . . , xk , xk en R acotada.
n o
(1) (n)
Definimos yk = xk , . . . , xk ; por el problema 18 (aplic andolo en ambos sentidos) tene-
mos que { n
yk } es una sucesion acotada en R de tal forma que, por hip otesis de induccion, tiene
una
n subsucesi
oo n {
y kl } quen es convergente.
o Consideremos ahora la sucesi
on de numeros reales
(n+1) (n+1)
xl = xk l ; dado que xk a acotada entonces {xl } tambien est
est a acotada de tal forma
n o
(n+1) (n+1)
que, por el mismo teorema para sucesiones en R, sabemos que existe una subsucesion xlm = xk l
n o m
(1) (n)
de {xl } que converge. Ahora, como yklm = xkl , . . . , xkl on de {
es una subsucesi ykl }, por la
m m
77 J. P
aez
proposici
on 2.23 se tiene que esta tambien converge y por lo tanto (nuevamente por la proposici
on
2.17, en ambos sentidos) obtenemos que la subsucesi on
n o
(1) (n) (n+1)
x k lm = x k l , . . . , x k l , x k l
m m m
de {
xk }, tambien converge, afirmacion con la que concluye nuestra prueba.
2.2.2 Lmite
Como sucede con las sucesiones en Rn , los conceptos de lmite y continuidad para funciones de Rn
en Rm expresan la misma idea de aproximacion que expresan los mismos conceptos para el caso
de funciones de R en R, y adem as se definen de manera completamente an aloga a como se hace
para este tipo de funciones. Aun tomando en cuenta lo anterior, es importante hacer notar que
ahora que contamos con una clasificaci on mas detallada del tipo de puntos asociados a un conjunto
A Rn , si este conjunto es el dominio de una funcion f , los puntos para los cuales tendra sentido
preguntarse por el lmite de f ser
an justo aquellos que est an pegados a A, es decir, el tipo de
punto al que nos podemos aproximar por medio de puntos diferentes de el y que esten en A (ver
inciso (b) del problema 25). Como el lector recordara, estos puntos son aquellos que llamamos
de acumulaci on de A y cuyo conjunto formado por ellos denotamos como A . Una vez dicho lo
anterior, damos la siguiente
Definici on 2.29 (por sucesiones) Sean f : A Rn Rm y x 0 A . Decimos que f tiene

0 y que su lmite es l Rm , si para toda sucesi
lmite en x on {xk } contenida en A \ {
x0 } que
converge a x0 se tiene que la sucesi xk )} converge a l. En este caso escribimos que
on {f (
x) = l
lim f (
x

x0
y decimos que
l es el lmite de f en x
0 .
De forma an aloga a lo que sucede con las sucesiones en Rn , y como una consecuencia de este
0 A es una condici
hecho, si f = (f1 , . . . , fm ), la existencia del lmite de f en un punto x on
necesaria y suficiente de la existencia del lmite (en el mismo punto) de cada una de sus funciones
coordenadas fi . Este importante resultado lo dejamos expresado en la siguiente
Proposici on 2.30 Sean f = (f1 , . . . , fm ) : A Rn Rm y x 0 A . f tiene lmite en x0 y su

m
lmite es l = (l1 , . . . , lm ) R si y s
olo si para cada i {1, . . . , m}, fi tiene lmite en x
0 y su lmite
es li .
La prueba de esta proposicion es una consecuencia inmediata de la proposici on 2.17 y se deja

como un problema para el lector.
La proposici
on anterior tiene la virtud de reducir el problema de determinar la existencia del
alculo) de una funcion de Rn en Rm , a s
lmite (y en caso de existir, su c olo funciones de Rn en
R. Por esta razon, a continuacion daremos una serie de ejemplos en los cuales solo consideraremos
funciones de este ultimo tipo.
Antes de dar los ejemplos, describiremos un procedimiento que consiste en experimentar
con algunas sucesiones que satisfagan la definicion 2.29 y observar que es lo que sucede con las
correspondientes sucesiones de im agenes. Los pasos a seguir despues de hacer estos experimentos
dependeran de sus resultados.
J. P
aez 78
Si para varias sucesiones especficas las correspondientes sucesiones de imagenes siempre con-
vergen al mismo valor, y el lector intuye (intuici on que seguramente desarrollara despues de
calcular muchos lmites) que la funcion debe de tener lmite (el cual debera de ser aquel valor al
que convergieron todas las sucesiones de im agenes con las que se experimento), habra que hacer
una demostracion de que ese valor es el lmite de cualquier otra sucesion de im agenes {f (
xk )}, en
donde sea { xk } cualquier otra sucesion (totalmente arbitraria) que cumpla con las condiciones de
la definicion de lmite.
Por otra parte, si tenemos la suerte de encontrar sucesiones para las cuales las correspondientes
sucesiones de im agenes no convergen, o convergen a valores diferentes, entonces de acuerdo a la
definicion 2.29 podemos concluir que la funcion no tiene lmite en el punto en cuesti on. Como se
podra notar, cuando el problema sea mostrar que una funcion no tiene lmite en un punto, las
sucesiones son una herramienta muy u til y muy sencilla de usar.
Ejemplo 2.31 Determinaremos si las siguientes funciones tienen lmite en el punto que se indica.
1. f (x, y) = xy/(x2 + y 2 ) en el punto (0, 0).

Observe que esta funci a definida en A = R2 \ {(0, 0)} y el (0, 0) es un punto de acumu-
on est
laci
on de A, de tal forma que s es v alido preguntarse si esta funci on tiene lmite en dicho
punto. N otese tambien que, en caso de existir el lmite, este tendra que ser 0, pues si en par-
ticular tomamos la sucesi on {xk = (1/k, 0)}, la cual satisface las condiciones de la definici on
(1)
2.29 ya que x k A para toda k N, y { xk } (0, 0) en virtud de que {xk = 1/k} 0 y
(2)
{xk 0} 0 (la sucesi on constante cero), entonces
(1/k)(0)
f (
xk ) =
(1/k)2 + 02
=0
para toda k N, es decir, la sucesi agenes {f (
on de im xk )} es la sucesi
on constante cero, la
cual converge a 0.
Sin embargo, si ahora consideramos { xk = (1/k, 1/k)}, para esta sucesion tambien se tiene
que {
xk } (0, 0) y
(1/k)(1/k)
f (
xk ) =
(1/k)2 + (1/k)2
1
=
2
para toda k N, es decir, ahora la sucesi on de imagenes {f (
xk )} es la sucesi
on constante
1/2 la cual converge a 1/2.
Con base en el comportamiento de estas dos sucesiones, podemos concluir que la funci on no
tiene lmite en el punto (0, 0).
p
2. f (x, y) = xy/ x2 + y 2 en el punto (0, 0).
Como en el inciso anterior, es f acil ver que si {
xk = (1/k, 0)}, { xk = (0, 1/k)} o {xk =
(1/k, 1/k)} entonces en todos estos casos se tiene que la correspondientes sucesiones de
imagenes satisfacen que {f ( xk )} 0. Mas aun, si { xk = (1/k, m/k)}, con m R, en
cuyo caso los terminos x on de la recta (en R2 ) y = mx (es decir que la
k satisfacen la ecuaci
sucesion {xk } se aproxima al (0, 0) por (o sobre) esta recta), entonces
(1/k)(m/k)
f (
xk ) = p
(1/k)2 + (m/k)2
79 J. P
aez
m(1/k)2
=
(1/k) 1 + m2

1 m
=
k 1 + m2
de donde tambien tenemos que {f ( xk )} 0.
Los experimentos anteriores nos hacen sospechar que la funci on si tiene lmite (en cuyo
caso tendra que ser 0), y para demostrar que esta afirmaci on es cierta, recurriremos a una
de las desigualdades que el lector probo en el problema 3 del captulo 1 y que resultar a muy
u
til a la hora de hacer demostraciones de lmites.
En ese problema se prueba que, si x n entonces |x | k
= (x1 , ..., xn ) Rp xk para i = 1, ..., n.
i
De esta forma, si x = (x, y) entonces |x| , |y| k 2 2
xk = x + y y por tanto
xk2
|xy| k
6=
y si x 0, tenemos que

xy
|f (
x)| = p

2 2
x +y
|xy|
=
k
xk
k
xk
Sea ahora { on contenida en A = R2 \ {(0, 0)} tal que {

xk } cualquier sucesi xk } (0, 0); por
la desigualdad anterior, se tiene que
|f (
xk ) 0| = |f (
xk )|
k
xk k
Ahora, como { xk } (0, 0), por el problema 10 tenemos que {k

xk k} 0 y por la desigualdad
anterior (aplicando la ley del sandwich para sucesiones de numeros reales) concluimos que
on {|f (
la sucesi xk ) 0|} 0 y por el problema 9 tenemos que {f (
xk } 0. De esta forma,
hemos probado que
xy
lim p =0
(x,y)(0,0) x2 + y 2
En el ejemplo anterior, inciso (2), usamos la conocida ley del sandwich para sucesiones de
umeros reales. Este resultado lo podemos extender a las funciones de Rn en R y va a resultar
n
ser una herramienta muy u til para el c
alculo de lmites.
on 2.32 Sean f, g, h : A Rn R y x
Proposici 0 A . Si existe r > 0 tal que
x) h(
f ( x) g(
x)
(Br (
para toda x x0 ) \ {
x0 }) A y
lim f (
x) = l = lim g(
x)
x

x0 x

x0
entonces h tiene lmite en x

0 y
lim h(
x) = l
x

x0
J. P
aez 80
Esta proposici on es una consecuencia inmediata de la mencionada ley del sandwich para
sucesiones de numeros reales y como es de suponer, su prueba se deja al lector. Lo que si vamos a
hacer, es resaltar el hecho de que la hip
otesis relacionada con las desigualdades que deben satisfacer
las funciones involucradas, solo se debe de satisfacer en una vecindad del punto en donde se va a
tomar el lmite, confirmando con ello que este concepto s olo depende del comportamiento local
de dichas funciones.
Otro hecho muy facil de probar, pero no por ello menos es importante, es la relaci
on del concepto
de lmite con la aritmetica de las funciones. Los resultados que formularemos en la siguiente
proposicion se deducen (casi todos ellos) de las correspondientes propiedades de las sucesiones que
quedaron plasmadas en la proposici on 2.18, razon por la cual, salvo por la u
ltima afirmacion, la
prueba se deja al lector.
on 2.33 Sean f, g : A Rn Rm , R, l, l Rm y x
Proposici 0 A . Si f y g tienen lmite
en x
0 y
x) = l
lim f ( y lim g( x) = l
x

x0 x

x0
entonces:
1. la funci
on f + g tiene lmite en x
0 y adem
as
lim (f + g)(
x) = lim f (
x) + lim g(
x)
x

x0 x

x0 x

x0
= l + l
2. la funci
on f tiene lmite en x
0 y adem
as
lim (f )(
x) = lim f (
x)
x

x0 x

x0
= l
on f g tiene lmite en x
3. la funci 0 y adem
as

lim (f g)( x) lim g(
x) = lim f ( x)
x

x0 x

x0 x

x0
= l l
on f g tiene lmite en x
4. si m = 3, la funci 0 y adem
as

lim (f g)(x) = lim f ( x) lim g(
x)
x

x0 x

x0 x

x0
= l l
5. si m = 1, B = { x) 6= 0} y l =
x A | g( 6 0 entonces x 0 B y adem
as

f limxx0 f (
x)
lim (
x) =
x
x0 g limxx0 g(x)
l
=
l
81 J. P
aez
Demostraci on. (inciso 5). Primero probaremos que x 0 B . Como x 0 A , de acuerdo con
el inciso (b) del problema 25 sabemos que existe una sucesion { xk } contenida en A \ {x0 } tal que
{
xk } converge a x0 . De la definicion de lmite tenemos entonces
que la sucesion (de numeros reales)
{g(
xk )} converge a l 6= 0 de tal forma que, para = l > 0 sabemos que existe N N tal que, si
k N entonces

g(
k x )
l
< =

l
Notese que en la desigualdad anterior no puede ser que g( xk ) = 0 y por tanto podemos concluir
que, si k N entonces g( xk ) 6= 0 y de aqu que x k B \ {x0 } para toda k N.
Por tanto, si hacemos yl = x l+N entonces { yl } es una sucesion en B \ {x0 } que adem as de ser
una subsucesi on de la sucesion { xk } (tomando kl = l + N ), se tiene que { yl } tambien converge a
x
0 , de modo que, nuevamente por el inciso (b) del problema 25, concluimos que x 0 B . Esto
prueba que x 0 es punto de acumulaci on del dominio de la funcion f /g; por otra parte, que esta
funcion tiene lmite en x
0 , y que su lmite es el cociente de los lmites de f y g, es una consecuencia
inmediata del correspondiente resultado para el cociente de sucesiones de n umeros reales, que aqu
daremos por probado.
Como el lector habra notado, de las operaciones entre funciones mencionadas en la proposicion
anterior, no se incluye a la composici on de funciones. El motivo es que el posible resultado que
se podra formular para esta operaci on no resulta cierto; es decir, si f : A Rn Rm , x
0 A ,
g : D Rm Rk , l D y l Rk son tales que:
x) = l y limyl g(
1. limxx0 f ( y ) = l , y
0 (A f 1 (D)) (esta condici

2. x on es para garantizar que x
0 sea punto de acumulaci
on del
dominio de la funcion g f )
on g f tenga lmite en el punto x

no es posible asegurar que la funci 0 , como lo mostraremos en
el siguiente
Ejemplo 2.34 Sean f (x, y) = x para (x, y) R2 y g(t) = 0 si t 6= 0 y g(0) = 1.

Lo primero que se tiene que observar en este ejemplo es que el dominio de la funci on est
a dado
por A = R2 y que (0, 0) A . Por otra parte, si { xk } es cualquier sucesi on contenida en A tal que
{
xk = (xk , yk )} (0, 0), como f (xk ) = xk para toda k N, y por la proposici on 2.17 se tiene que
{xk } 0, entonces {f ( xk )} 0 y por lo tanto concluimos que lim(x,y)(0,0) f (x, y) = 0.
Asi mismo, es claro que la funci a definida para toda t R y que limt0 g(t) = 0. Por tanto,
on g est
on g f tambien est
la funci a definida para toda (x, y) A de modo que s es v alido preguntar si
esta funcion tiene lmite en el punto (0, 0).
Afirmamos que dicho lmite no existe; en efecto, si tomamos la sucesi on { xk = (0, 1/k)} se tiene
que {xk } (0, 0) y por otra parte f ( xk ) = f (0, 1/k) = 0 de modo que (g f )( xk ) = 1 para toda
k N y por tanto {(g f )( xk )} 1.
Si ahora elegimos la sucesi on {yk = (1/k, 0)} entonces { yk } (0, 0) y f (
yk ) = f (1/k, 0) = 1/k 6= 0
de modo que (g f )( yk ) = 0 para toda k N y por tanto {(g f )( yk )} 0. De esta forma,
concluimos que la funci on g f no tiene lmite en el punto (0, 0).
Mas adelante, una vez que hayamos introducido el concepto de continuidad, retomaremos el
problema de formular un resultado que relacione la composicion de funciones y el concepto de
lmite.
J. P
aez 82
Si bien es cierto que definir el concepto de lmite a traves de sucesiones resulta ser muy intuitivo
(y muy u til, cuando se trata de probar que una funcion no tiene lmite en un punto), tambien es
cierto que esta definicion puede resultar un poco complicada de usar cuando se trata de probar
que una funci on s tiene lmite en un punto. Lo que ahora vamos a hacer ser a introducir otra forma
de definir el concepto de lmite (la muy conocida definicion ) que entre otras muchas virtudes,
resultara ser mas sencilla de usar cuando se quiera probar que una funcion s tiene lmite en un
punto. Y como es de suponerse, probaremos que ambas definiciones resultan ser equivalentes.
Definici on 2.35 ( ) Sean f : A Rn Rm y x 0 A . Decimos que f tiene lmite en x 0 y

m
es l
que su lmite R si para toda > 0 existe > 0 tal que si k xx 0 k < (y x
A \ { x0 })
entonces f (

x) l < . Es decir, si para toda bola de radio > 0 (con centro en l) existe una
bola de radio > 0 (con centro en x B (
0 ) tal que si x x0 ) (A \ { x) B (l) (o
x0 }) entonces f (
x0 ) (A \ {
f (B (
x0 })) B (l)).
Una de las ventajas de la definicion anterior es que esta se puede ilustrar geometricamente,
como se muestra en la figura 2.11.
x
f l
b
x
0 f (
x)
0 A y su lmite es l Rm si para toda bola de radio > 0 (con

Figura 2.11: f tiene lmite en x
centro en
l) existe una bola de radio > 0 (con centro en x B (
0 ) tal que si x x0 ) (A \ {
x0 })

x) B (l)
entonces f (
Probar que la definicion anterior es equivalente a la definicion 2.29 es sin duda algo que
tenemos que hacer, pero antes mostraremos por medio de un ejemplo la conveniencia de usar esta
definicion, sobre todo cuando pretendamos demostrar que una funcion s tiene lmite.
Ejemplo 2.36 Considere la funci

on
xy 2
f (x, y) = p
x4 + y 4 + z 2 + z 4
a definida para todo (x, y, z) A = R3 \ {(0, 0, 0)}. Mostraremos, usando la definici

que est on 2.35,

on tiene lmite en el 0 = (0, 0, 0) A y que dicho lmite es 0.
que esta funci
Sea pues una cantidad > 0; nuestra tarea es mostrar que existe una cantidad > 0 (que en general
A \ {

dependera de la cantidad dada) para la cual se satisfaga que, si x 0 < (y x 0})
entonces kf (
x) 0k < . Para lograr esto, y como seguramente el lector recordar a de sus cursos
83 J. P
aez
anteriores de c buscar es la forma de acotar la cantidad |f (

alculo, lo que hay que x) 0| = |f (
x)|
en terminos de la cantidad x 0 = k xk, y para ello habr
a que echar mano de todo el acervo de
desigualdades de las que disponemos.
Por ejemplo, recordemos que todo n umero elevado a una potencia par siempre es no negativo de tal
forma que p p
x4 + y 4 + z 2 x4 + y 4 + z 2 + z 4
y por lo tanto
1 1
p p
4 4 2
x +y +z +z 4 x + y4 + z2
4
lo cual es cierto para toda (x, y, z) A. p

Si por otra parte observamos que la cantidad x4 + y 4 + z 2 es la norma (euclidiana) del vector
(x2 , y 2 , z) y que esta u
ltima siempre es mayor o igual que el valor absoluto de cualquiera de sus
coordenadas (problema 3 del captulo 1) es decir
p
y 2 = y 2 (x2 , y 2 , z) = x4 + y 4 + z 2

concluimos que
y2
p 1
x4 + y 4 + z 2
tambien para toda (x, y, z) A.
Por tanto, reuniendo las desigualdades anteriores tenemos que
|f (
x) 0| = |f (
x)|

xy 2
=

p
x4 + y 4 + z 2 + z 4
|x| y 2
p
x4 + y 4 + z 2
y2
= |x| p
x4 + y 4 + z 2
|x|
k(x, y, z)k
0

= x
0 < = entonces, como |f (

de modo que, si tomamos = y x A es tal que x x) 0|

x 0 , tenemos que |f (
x) 0| < . De esta forma mostramos que se verifica la definici
on 2.35 y
concluimos nuestro ejemplo.
Una vez hecho el ejemplo anterior, mostraremos que las dos definiciones de lmite que hemos
dado son equivalentes, lo cual lo dejaremos formulado en el siguiente
Teorema 2.37 Sean f : A Rn Rm , x 0 A y l Rm . Si f y l satisfacen la definici on

2.35 entonces satisfacen la definici
on 2.29. Y recprocamente, si f y l satisfacen la definici
on 2.29
entonces satisfacen la definici
on 2.35.
J. P
aez 84
Demostraci on. Supongamos que f y l satisfacen la definicion 2.35. Para probar que satisfacen la
definicion 2.29, tomemos { xk } una sucesion contenida en A \ {x0 } tal que { xk } x0 ; mostraremos
que {f (xk )} l.
Para probar esto u ltimo, tomamos cualquier > 0; de la definicion 2.35 sabemos que existe
> 0 tal que si x B ( x0 ) (A \ { x) B (l). Ahora, dado que {
x0 }) entonces f ( xk } x 0 ,
para esta > 0 sabemos que existe N N tal que si k N entonces k xk x0 k < , es decir
x
B (
x
0 ) (A \ {
x 0 }); as
, por la propiedad que tiene tenemos que f (
x ) B
(l), es decir que
k k
xk )
f ( l < para toda k N , con lo que concluimos que {f ( xk )} l.

Supongamos ahora que f y l satisfacen la definicion 2.29. En esta parte de la prueba pro-
cederemos por el metodo de la contrapuesta, es decir, que f y l no satisfacen la definicion 2.35.
Esto significa que existe una cantidad > 0 tal que para cualquier cantidad > 0 que se tome,
siempre
existe
B (
x x0 ) (A \ {x0 }) con la propiedad de que f (x) / B (l), es decir que
x) l . Aplicando lo anterior para cada k N podemos tomar x
f ( k A \ { x0 } tal que

k
xk x0 k < 1/k y f ( xk ) l . De esta forma obtenemos una sucesion { xk } contenida en

A \ {
x0 } tal que {
xk } x xk )} no converge a l (puesto
0 (problema 9) para la cual se tiene que {f (
que f ( xk )
l > 0 para toda k N). Como esta propiedad es justo la negaci on de nuestra

hip
otesis, con esto concluimos la prueba de la segunda parte del teorema.
2.2.3 Continuidad
Como en el caso de las funciones de R en R, una de las primeras aplicaciones del concepto de lmite
est
a en la formalizaci on del concepto de continuidad de una funcion.
Dada una funci on f : A Rn Rm , la idea intuitiva de que esta sea continua consiste en
que si x , y son elementos de su dominio que est an cercanos entonces sus valores bajo f (f (x) y
f (
y)) est an cercanos. Esta idea intuitiva se puede simplificar si dejamos fijo uno de estos
puntos, que ahora llamaremos x 0 , y decimos que la funcion f es continua en x 0 A si para
todo x A que est a cerca de x 0 se tiene que f (
x) est
a cerca de f (
x0 ). Como seguramente el
lector ya est a intuyendo, esta ultima expresion se puede formalizar usando el concepto de lmite
diciendo que una funci on f es continua en x 0 A si tiene lmite en este punto y su lmite es
f (
x0 ) (el valor de f en x0 ), es decir si
lim f (
x) = f (
x0 ) (2.4)
x

x0
Aun cuando todo parezca indicar que hemos logrado una buena definicion de continuidad,
es importante precisar algunos aspectos. El primero de ellos es que el concepto de continuidad se
definira para un punto y este siempre tiene que ser un elemento de su dominio, es decir, un punto
para el cual la funci
on f est a definida. El segundo aspecto tiene que ver con el uso del concepto de
lmite; como se recordara, el lmite de una funcion s
olo se define para los puntos de acumulaci on del
dominio de esta, lo que puede ser un obst aculo ya que, dado A Rn , en general no es cierto que
todo elemento de A tiene que ser un punto de acumulaci on de A (es decir, A * A ). Si dado x 0 A
tenemos la suerte de que este sea un punto de acumulaci on de A (x0 A ), decir que f es continua
en x0 usando la identidad 2.4 es sin duda la forma mas adecuada de hacerlo, y s olo restara analizar
el caso en que x0 no fuera un punto de acumulaci on de A (aun y cuando s pertenezca a A). Notese
que en este caso x 0 sera un punto aislado de A, es decir un punto de A para el cual existe r > 0
con la propiedad de que Br ( x0 ) A = {x0 } (ver definicion 1.27), lo que significa que el u
nico punto
de A que realmente est a cerca de x 0 es el mismo!
85 J. P
aez
Con base en esta observaci on y aunque parezca un poco in util tratar de definir que una funcion
sea continua en un punto aislado de su dominio (y que por cierto no tendra nada de insensato que
esta definicion fuera tal que cualquier funcion resultara siempre continua en este tipo de puntos de su
dominio), todo se ajustar a adecuadamente si escribimos la identidad 2.4 usando precisamente la
definicion 2.35. De acuerdo con esta definicion, la identidad 2.4 va a significar que, para cualquier
cantidad > 0 existe una cantidad > 0 tal que, si x A \ { x0 } tiene la propiedad de que
k
xx 0 k < entonces kf ( x) f (
x0 )k < , es decir que, si x B ( x0 ) (A \ {
x0 }) entonces
x) B (f (
f ( x0 )). Si ahora observamos que, dado que ahora si estamos seguros de que x 0 A,
y que las condiciones anteriores se siguen cumpliendo aun y cuando x sea igual a x0 , todo parece
indicar que, independientemente de que tipo de punto sea x 0 con respecto de A (de acumulaci on
o aislado), la siguiente definicion es la mejor opcion para expresar el hecho de que una funcion sea
continua en un punto de su dominio.
Definici on 2.38 Sean f : A Rn Rm y x 0 A. Decimos que f es continua en x 0 si para

cualquier cantidad > 0 existe una cantidad > 0 tal que, si x A tiene la propiedad de que
k
xx 0 k < entonces kf (x) f (
x0 )k < , es decir que, si x B (
x0 ) A entonces f (
x)
B (f ( x0 ) A) B (f (
x0 )) (o equivalentemente, que f (B ( x0 ))).
Toda las observaciones y afirmaciones que hicimos para deducir la definicion anterior, las
dejaremos plasmadas en la siguiente proposici on, y aprovechando el teorema 2.37, incluiremos una
forma equivalente de expresar la continuidad de una funcion en un punto, en terminos de sucesiones
(y que bien podra llamarse la definici
on de continuidad por sucesiones).
on 2.39 Sean f : A Rn Rm y x
Proposici 0 A.
1. Si x
0 es un punto aislado de A entonces f es continua en x
0 .
2. Si x
0 es un punto de acumulaci
on de A se satisface que: f es continua en x
0 si y s
olo si f
tiene lmite en x
0 y adem
as
lim f (
x) = f (
x0 )
x

x0
3. f es continua en x0 si y s
olo si para toda sucesi on {
xk } contenida en A que converje a x
0 se
on {f (
tiene que la sucesi xk )} converje a f (
x0 ).
La demostracion de esta proposici on es muy sencilla y se deja como un problema para el lector.
Otro hecho que sin duda tambien resultara evidente para el lector, es la relaci on que existe
entre la continuidad de una funci on f : A Rn Rm en un punto x 0 A y la de sus funciones
coordenadas (en el mismo punto). En efecto, si f = (f1 , . . . , fm ) es de esperarse que f ser
a continua
0 A si y s
en x olo si fi es continua en x0 para cada i {1, . . . , m}, propiedad que, a pesar de su
predecibilidad, es muy importante y por lo mismo la dejamos expresada en la siguiente
Proposicion 2.40 Sean f : A Rn Rm y x 0 A. f es continua en x

0 si y s
olo si fi es
0 , para cada i {1, . . . , m}.
continua en x
Con relacion a la continuidad de una funcion, dejaremos expresadas en la siguiente proposici on

la relaci
on del concepto de continuidad con la aritmetica de las funciones. Dada la cercana de este
concepto con el de lmite, casi todas las afirmaciones de esta proposici on (salvo por el inciso 6)
ser
an una consecuencia inmediata de las correspondientes afirmaciones de la proposici on 2.33, en
virtud de lo cual su prueba, una vez mas, quedar a a cargo del lector (incluyendo el inciso 6).
J. P
aez 86
Proposicion 2.41 Sean f, g : A Rn Rm , R y x

0 A. Si f y g son continuas en x
0
entonces:
1. la funci
on f + g es continua en x
0
2. la funci
on f es continua en x
0
on f g es continua en x
3. la funci 0
on f g es continua en x
4. si m = 3, la funci 0
x0 ) 6= 0, la funci
5. si m = 1 y g( on f /g es continua en x
0
x0 ) D Rm y h : D Rm Rk es continua en y0 entonces h f es continua en

6. si y0 = f (
y0
Como el lector habra notado, de las operaciones entre funciones que acabamos de enlistar en la
proposicion anterior, ahora si incluimos a la operaci
on composici on (a diferencia de la proposici
on
2.33). La razon de esto, es que el concepto de continuidad s se comporta bien con esta operaci on
(a diferencia del concepto de lmite, como vimos en el ejemplo 2.34), y lo que ahora queremos
destacar es que hay un resultado un poco mas general para el cual no se requiere que ambas
funciones (las que se vayan a componer) tengan que ser continuas en los correspondientes puntos
(como se requiere en el inciso 6 de la proposici on anterior). Este resultado es muy importante (y
muy util) y lo dejaremos formulado en la siguiente
on 2.42 Sean f : A Rn Rm , g : D Rm Rk y l Rm tales que l D y x

Proposici 0 B ,
1 x) = l y g es continua en l entonces g f tiene lmite en x
con B = f (D). Si limxx0 f ( 0 y
adem
as
lim (g f )(
x) = g l = g lim f ( x)
x

x0 x

x0
Demostraci on. Usaremos la definicion de lmite para hacer esta demostracion. Sea > 0
arbitraria. De la definicion de continuidad sabemos que existe > 0 tal que

si y B l D entonces g(
y ) B g l (2.5)
y de la definicion de lmite tenemos que existe > 0 tal que

B (
si x x0 ) (A \ { x) B l
x0 }) entonces f ( (2.6)

B (
Afirmamos que, si x x0 ) (B \ { x) B g l
x0 }) entonces (g f )( (ver figura 2.12). En
efecto, dado que B A entonces
x0 ) (B \ {
B ( x0 }) B (
x0 ) (A \ {
x0 })
B (
de tal forma que, si x x0 ) (B \ {
x0 }) entonces x
B (
x0 ) (A \ {
x0 }) demodo
que por 2.6
x) B l , y por 2.5 concluimos que (g f )(
se tiene que f ( x) = g(f (x)) B g l .
Frecuentemente se suele decir coloquialmente que el resultado anterior nos asegura que el
lmite se puede meter dentro (o a traves) de una funcion continua. Esta propiedad es de mucha
utilidad cuando nos enfrentamos al problema de mostrar que una funcion no tiene lmite, como lo
haremos ver en el siguiente
87 J. P
aez
B = f 1 (D) D
x
0
x
g(f (
x))
b
f f (
x) b
g bc
g(l) b
A f (A)
Figura 2.12: Prueba geometrica de la proposicion 2.42
Ejemplo 2.43 Sea

x2 y
f (x, y) =
x4 + y 2
Mostraremos que esta funci on no tiene lmite en el punto (0, 0).
Lo que haremos ser a aproximarnos al punto (0, 0) a traves de diferentes curvas, las cuales
definiremos por medio de funciones de R en R2 (funciones que ser an el tema principal del captulo
3), y que tienen la particularidad de pasar por el punto que nos interesa.
Primero consideraremos una funci on de la forma g(t) = (t, mt), con m 6= 0 arbitrario. Notese que
on claramente es continua para cualquier t R (proposici
esta funci on 2.40) y su imagen es una
recta (de pendiente m) que justo pasa por el origen (0, 0) cuando t = 0. Si ahora realizamos la
composicion f g tenemos que
t2 (mt)
(f g)(t) =
(t2 )2 + (mt)2
mt
= 2
t + m2
para toda t R, y obtenemos que
lim (f g)(t) = 0
t0
Si ademas observamos que f (t, 0) = 0 = f (0, t) para toda t R podemos decir que f se aproxima
a 0 cuando nos aproximamos al (0, 0) a trav es de cualquier recta.
Ahora consideremos la funci on h(t) = t, t2 . En este caso la funci on es otra vez claramente
continua para cualquier t R, describe (o recorre) la par abola y = x2 y nuevamente en t = 0
pasa por el origen (0, 0), lo que significa que en este caso nos aproximamos al (0, 0) a traves
de esta curva. Si consideramos nuevamente la composici on f h tenemos que
t2 t2
(f h)(t) =
(t2 )2 + (t2 )2
1
=
2
para toda t R, t 6= 0, de modo que ahora tenemos que
1
lim (f h)(t) =
t0 2
Con base en estos dos resultados y la proposici
on 2.42 podemos concluir que nuestra funci
on f no
tiene lmite en el (0, 0).
J. P
aez 88
Para concluir esta subseccion (y antes de pasar a los teoremas fuertes de continuidad), definire-
mos lo que significa que una funci on sea continua en un subconjunto de su dominio (definicion que
al lector le resultara del todo natural), y probaremos una interesante y u til caracterizaci
on de
esta propiedad.
on 2.44 Sean f : A Rn Rm y B A. Decimos que f es continua en (o sobre) B si

Definici
B.
f en continua en cada punto de B, es decir, si f es continua para cada x
on 2.45 Sea f : A Rn Rm . f es continua en A si y s

Proposici olo si para todo abierto
m n 1
V R existe un abierto U R tal que f (V ) = A U .
Demostraci on. (=) Sea V Rm abierto y x f 1 (V ) (si f 1 (V ) = tomamos U = ).

x) V de modo que, como V es abierto, existe x > 0 tal que Bx (f (
Entonces f ( x)) V y como
f es continua en x
(pues es continua en A) existe x > 0 tal que
x) A) Bx (f (
f (Bx ( x)) (2.7)
Tomamos [
U= Bx (
x)
x
f 1 (V )
Dado que las bolas (o vecindades) son conjuntos abiertos, por el problema 21 del captulo 1 sabemos
que U es un conjunto abierto, de tal forma que solo nos resta probar que f 1 (V ) = A U .
1
Que f (V ) A U es inmediato. Sea entonces y A U ; como

[
AU =A B (x)
x
x
f 1 (V )
[
= x) A
Bx (
x
f 1 (V )
entonces existe x f 1 (V ) tal que y Bx (

x) A de modo que, por 2.7, se tiene que f ( y)
x)) V y por lo tanto y f 1 (V ). Por lo tanto f 1 (V ) = A U con lo cual concluimos
Bx (f (
esta parte de la prueba.
(=) Sea x A y > 0. Como la bola B (f ( x)) Rm es un conjunto abierto, por hip otesis
n 1
existe U R abierto tal que f (B (f ( x))) = U A . Ahora, dado que x f 1 (B (f (
x))) = U A
y U es abierto, existe > 0 tal que B ( x) U de modo que
x) A U A = f 1 (B (f (
B ( x)))
x) A) f (f 1 (B (f (
y por lo tanto f (B ( x)))) B (f (
x)), lo que prueba que f es continua en
x
.
2.2.4 Teoremas fuertes de continuidad

Como seguramente el lector estar a de acuerdo, tratandose de funciones continuas de R en R, dos
son los resultados mas importantes relacionados con este tipo de funciones: el Teorema del Valor
Intermedio, y el Teorema del valor M aximo (y el valor Mnimo) que asegura que toda funci on
continua sobre un intervalo de la forma [a, b] (un subconjunto cerrado y acotado (adem
as de conexo)
de R) siempre alcanza su valor m aximo y su valor mnimo.
89 J. P
aez
Sin restarles importancia a estos teoremas, lo que es mas relevante aun, son los dos resultados
que podemos probar o reformular a partir de ellos (o de los argumentos usados en su prueba). El
primero de ellos, que se prueba a partir del Teorema del Valor Intermedio, es aquel que asegura
on continua sobre un intervalo I R (totalmente arbitrario, sin importar si I
que si se tiene funci
es abierto, cerrado, acotado o no acotado) entonces su imagen f (I) R tambien es un intervalo.
Si observamos que los intervalos son los unicos subconjuntos conexos de R (problema 40, captulo
1), el resultado que acabamos de mencionar se podra reformular de la siguiente manera: si f es
continua sobre el conjunto I R, e I es conexo entonces f (I) R es conexo.
Y el segundo resultado importante, que se puede probar usando los mismos argumentos que se
usan para la prueba del Teorema del valor Maximo (y el valor Mnimo), es aquel que asegura que
si A R es un conjunto cerrado y acotado (aun y cuando este conjunto A no sea de la forma [a, b])
entonces f (A) R tambien es un conjunto cerrado y acotado.
Lo que vamos a hacer en esta subseccion, es mostrar que los resultados que acabamos de
mencionar (para funciones de R en R) se siguen cumpliendo para funciones de Rn en Rm .
Teorema 2.46 Sea f : A Rn Rm continua en A y B A. Si B es conexo entonces f (B) es

conexo.
Demostraci on. En esta prueba, adem as de hacerla por el metodo de la contrapuesta, usaremos la
equivalencia para conjuntos disconexos probada en la proposici on 1.48 del captulo 1. Supongamos
entonces que f (B) no es conexo; por la proposici
on mencionada, sabemos que existen U , V Rm
conjuntos abiertos tales que:
V ,
a. f (B) U
6= y f (B) V 6= , y
b. f (B) U
V = .
c. f (B) U
) =
on 2.45 sabemos que existen U, V Rn conjuntos abiertos tales que f 1 (U
Por la proposici
1
A U y f (V ) = A V . Afirmamos que U y V satisfacen que:
1. B U V ,
2. B U 6= y B V 6= , y
3. B U V = .
Para probar lo anterior, usaremos varias de las propiedades de la imagen inversa y la imagen
directa formuladas en la proposicion 2.13.
Por el inciso (a) de nuestra suposici
on, sabemos que
B f 1 (f (B))
V )
f 1 (U
) f 1 (V )
= f 1 (U
= (A U ) (A V )
= A (U V )
y por lo tanto B U V , con lo cual probamos el inciso 1.
J. P
aez 90
6= entonces existe x
Ahora, por el inciso (b), como f (B) U B tal que f (
x) U . Por
1
f (U ) = A U de modo que x
tanto, x B U , es decir, B U 6= . Analogamente se prueba
que B V 6= con lo cual tenemos probado el inciso 2.
Finalmente, dado que B A y B f 1 (f (B)), tenemos que
B U V = B (U A) (V A)
) f 1 (V )
= B f 1 (U
) f 1 (V )
f 1 (f (B)) f 1 (U
V )
= f 1 (f (B) U
= f 1 ()
=
de donde B U V = , con lo cual probamos el inciso 3.

Como el lector habra notado, los incisos 1, 2 y 3, por la misma proposici
on 2.13, implican que
B es disconexo, conclusion con la cual terminamos la prueba.
Con base en el teorema anterior, se establece una interesante versi

on del teorema del valor
n
intermedio para funciones de R en R, resultado que dejamos plasmado en el siguiente corolario y
cuya prueba se deja al lector.
Corolario 2.47 Sean f : A Rn R continua en A, B A conexo y x 2 B tales que

1 , x
f ( x2 ). Si c R es tal que f (
x1 ) < f ( x1 ) < c < f ( B tal que f (
x2 ) entonces existe x x) = c.
Como mencionamos al inicio de esta subseccion, otro tipo de conjuntos que preservan sus
caractersticas bajo funciones continuas, son los conjuntos cerrados y acotados. Este resultado
tiene consecuencias muy importantes, en particular las relacionadas con la existencia de valores
maximos y mnimos de funciones de Rn en R, tema que trataremos ampliamente en el captulo 4.
Teorema 2.48 Sea f : A Rn Rm continua en A y B A. Si B es cerrado y acotado entonces

f (B) es cerrado y acotado.
Demostraci on. En la prueba de este teorema jugaran un papel muy importantes varios de los
resultados que probamos para sucesiones.
Primero probaremos que f (B) est a acotado y usaremos nuevamente el metodo de la contra-
puesta. Supongamos entonces que f (B) no est a acotado. Bajo este supuesto, para cada k N
existe x k B tal que kf ( xk )k > k. Dado que B est a acotado, entonces { xk } es una sucesion
acotada, de modo que por el teorema 2.28 existe una subsucesi on {xkl } que converge. Si x 0 Rn
es tal que { xk l } x
0 (cuando l ), por el inciso (a) del problema 25 se tiene que x 0 B y

como B es un conjunto cerrado entonces B = B y por lo tanto x 0 B. Ahora, como f es continua
en x0 se debe tener que {f ( xkl )} f (
x0 ) (cuando l ), lo cual contradice el hecho de que
xkl )k > kl para toda l N y que {kl } es una sucesion creciente de naturales.
kf (
Para probar que f (B) es un conjunto cerrado mostraremos que (f (B)) f (B). Sea y0
(f (B)) ; por el inciso (b) del mismo problema 25, sabemos que existe una sucesion { yk } f (B)
tal que { yk } y0 de tal forma que si x k B es tal que f (
xk ) = yk entonces { xk } B es una
sucesion acotada. Nuevamente, por el teorema 2.28 existe una subsucesi on {
xkl } que converge. Si
0 Rn es tal que {
x xk l } x
0 (cuando l ), por el mismo argumento usado en la primera parte
de esta prueba se tiene que x 0 B y como f es continua en x 0 entonces {f (xkl ) = ykl } f (x0 )
91 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.3. Continuidad uniforme
(cuando l ). Por otra parte, dado que {ykl } es una subsucesion de { yk } entonces { ykl } y0
y como el punto de convergencia de una sucesion es u
nico, se tiene que y0 = f (x0 ), lo que prueba
que y0 f (B).
Como anunciamos anteriormente, con base en este teorema podemos probar un resultado muy
importante que nos proporciona condiciones suficientes para que una funcion continua de Rn en R
alcance valores m aximos y mnimos sobre un conjunto. Este resultado lo dejamos formulado en
el siguiente corolario y su prueba (nuevamente!) se deja al lector.
Corolario 2.49 Sean f : A Rn R continua en A y B A. Si B es cerrado y acotado

entonces existen x 2 B tales que f (
1 , x x1 ) f (
x) f ( B. Es decir, f alcanza
x2 ) para toda x
un valor maximo y un valor mnimo sobre B.
2.3 Continuidad uniforme

Concluimos este captulo definiendo el concepto de continuidad uniforme para funciones de Rn en
Rm . La forma explcita de esta definicion es totalmente equivalente a la de las funciones de R en
R y expresa la misma propiedad de una funcion f sobre un conjunto B: a saber que, para cada
cantidad > 0 existe una cantidad > 0 tal que f (B ( x) B) B (f (x)) para toda x B. Es
decir, dada una > 0 se puede encontrar una > 0 que sirve para cualquier x B (en el sentido
x) B) B (f (
de que f (B ( x))), propiedad que sin duda dice que, adem as de que f es continua
en cada x B, esta continuidad tiene cierta cualidad de uniformidad sobre este conjunto.
Definicion 2.50 Sean f : A Rn Rm y B A. Decimos que f es uniformemente continua

sobre B si para cada > 0 existe > 0 con la propiedad de que: si x , y B son tales que
k
x yk < entonces kf (
x) f ( x) B) B (f (
y )k < . Es decir, f (B ( B.
x)) para toda x
Como ha sucedido con los conceptos de lmite y de continuidad para funciones de Rn en Rm , que
se pueden caracterizar en terminos de los conceptos correspondientes de sus funciones coordenadas,
para el caso de la continuidad uniforme sucede lo mismo, propiedad que vamos a dejar expresada
en la siguiente proposici
on y cuya prueba ... (adivine el lector!).
Proposici on 2.51 Sean f = (f1 , . . . , fm ) : A Rn Rm y B A. f es uniformemente continua

olo si cada fi es uniformemente continua sobre B, para i {1, . . . , m}.
sobre B si y s
Como mencionamos en el comentario previo a la definicion 2.50, toda funcion que es uniforme-
mente continua sobre un conjunto B tambien es continua sobre el mismo conjunto, hecho que
dejamos plasmado en la siguiente proposici
on y cuya veracidad es tan inmediatamente clara, que
omitiremos su prueba.
Proposicion 2.52 Sean f : A Rn Rm y B A. Si f es uniformemente continua sobre B

entonces f es continua en B.
Como seguramente el lector tendra presente para el caso de las funciones de R en R, el recproco
de la proposici on que se repite para las funciones de Rn en Rm , como lo
on anterior es falso, situaci
mostraremos en el siguiente
J. P
aez 92
2.3. Continuidad uniforme Captulo 2. Funciones de Rn en Rm
Ejemplo 2.53 Sea
1
f (x, y) = p
x2 + y 2
1
=
k(x, y)k
con (x, y) A = R2 \{(0, 0)}. Mostraremos en general que, si B A es tal que (0, 0) B entonces
f no es uniformemente continua en B. Este ejemplo, adem as de mostrar que el recproco de la
proposici
on 2.52 no se satisface, tendra el merito de exhibir un metodo para probar que una funci on
no es uniformemente continua sobre un conjunto.
De acuerdo con la definici
on 2.50, para probar que f no es uniformemente continua sobre el conjunto
B es necesario mostrar que existe una cantidad especfica > 0 tal que para cualquier > 0, siempre
se pueden encontrar puntos x 2 B tales que k
1 , x x1 x
2 k < y sin embargo |f (
x1 ) f (
x2 )| .
Tomemos = 1 y sea > 0 arbitrario. Como (0, 0) B existe x 1 B tal que 0 < k x1 k =
k
x1 (0, 0)k < , y por la misma raz on, existe x2 B tal que
k
x2 k = k
x2 (0, 0)k
k
x1 k
<
k
x1 k + 1
de tal forma que 0 < k

x2 k < k
x1 k y por lo tanto

1 1
|f (
x1 ) f (
x2 )| =

k
x1 k k x2 k
1 1
=
kx2 k k x1 k
kx1 k + 1 1

kx1 k kx1 k
=1
que es lo que deseabamos probar.
El ejemplo anterior tambien tiene la virtud de mostrar el tipo de caractersticas que deben de
tener una funci on f y un conjunto B, si se desea mostrar que f no es uniformemente continua
sobre B. Si en el conjunto B existen puntos tan cercanos como se quiera, tales que sus im agenes
se alejan entre ellas (o permanecen a una distacia mayor que una constante), como sucede con
aquellos puntos que est an cerca del (0, 0) en el ejemplo anterior, en donde los valores de f se
hacen cada vez mas grandes (y mas alejados entre ellos) si la evaluamos en puntos cada vez mas
cercanos a este punto.
Por otra parte, en el problema 55 se pide al lector probar que la misma funcion f del ejemplo
anterior s es uniformemente continua sobre cualquier subconjunto B de su dominio, siempre y
cuando se satisfaga que el (0, 0) no es punto de acumulaci
on de B. Con esta prueba se mostrara que
la continuidad uniforme es un concepto que depende no s olo de la funcion que estemos tratando,
sino tambien del conjunto sobre el cual la estemos considerando. La misma funcion puede ser
uniformemente continua sobre algunos conjuntos, y no serlo sobre otros. No tiene sentido afirmar
que una funci on es (o no es) uniformemente continua, si no se menciona un conjunto sobre el cual
se pretende que lo sea (o que no lo sea).
93 J. P
aez
Regresando al recproco de la proposici on 2.52, dado que a la funcion involucrada no le podemos

pedir algo mas que ser continua, la opcion es pedirle algunas caractersticas al conjunto sobre el
cu
al queremos que esta sea uniformemente continua. Una manera de dar con estas caractersticas
(que en matem aticas suele dar sus frutos), consiste en intentar hacer la prueba y sobre la marcha
ubicar que es lo que se va necesitando.
Manos a la obra! Sea f : A Rn Rm , con f continua sobre A, y una cantidad > 0
arbitraria. La continuidad de f en cada punto de x A nos asegura que para cada uno de ellos
x)A) B (f (
existe x > 0 tal que f (Bx ( x)). Sin duda que nuestro primer impulso para encontrar
una sola > 0 para la cual la contenci on anterior se cumpla, para esa y para toda x A, sera
tomar la mnima (o el nfimo, para ser mas precisos) de entre todas las x , pero a estas alturas ya
sabemos que esa mnima (o el nfimo) de todas ellas no tiene por que ser mayor que cero. Ante
esta situacion, vale la pena observar lo siguiente: el conjunto A siempre est a contenido (o queda
cubierto) por la uni on de todas las vecindades Bx ( x), es decir
[
A Bx (
x)
x
A
Mas aun, podemos tomar la mitad de cada uno de los radios x (o la tercera parte, o la cuarta
parte, o cualquier otra cantidad menor!) y se sigue cumpliendo que
[
A B x (
x)
2
x
A
Si de entre todas estas vecindades (o bolas) se puede encontrar un numero finito de ellas que sigan
teniendo la propiedad de que cubren a A, es decir que existen x k A tales que
1 , . . . , x
x1 ) B xk (
A B x1 ( xk )
2 2
entonces podemos elegir = min{x1 /2, . . . , xk /2} (la cual s ser

a mayor que 0 puesto que ahora
s estamos tomando el mnimo de un conjunto finito), cantidad para la cual se va a satisfacer el
, y A son tales que k
siguiente hecho: si x x yk < entonces existe j {1, . . . , k} tal que
, y Bxj (
x xj )
es decir, que x y y pertenecen a la misma vecindad. La afirmacion anterior (que mas adelante
daremos su prueba) resulta ser muy importante puesto que ahora, dado que f (Bxj ( xj ) A)
B (f (
xj )), por una sencilla aplicaci
on de la desigualdad del tri
angulo, tendremos que
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y)k
<+
= 2
y por lo tanto, ya que fue una cantidad arbitraria, podemos concluir que f es uniformemente
continua!
Como seguramente el lector habra notado, la hip otesis que resulta determinante en la ar-
gumentacion que acabamos de
dar est
a en el supuesto de que, para cada familia (o conjunto) de
x) | x
vecindades Bx /2 ( A que cubren al conjunto A (familia de vencindades que depende
de cada cantidad > 0 que se tome), existe una subfamilia finita que sigue teniendo la propiedad
de cubrir a A. Conjuntos que tienen esta propiedad (o una equivalente, en donde las vecindades
se sustituyen por conjuntos abiertos arbitrarios), reciben el nombre de conjuntos compactos, los
cuales introducimos en la siguiente
J. P
aez 94
on 2.54 Sea K Rn y {U Rn | I} una familia de subconjuntos abiertos de Rn

Definici
indexada por un conjunto I. Decimos que:
1. la familia de subconjuntos U ={U Rn | I} es una cubierta (abierta) de K si

[
K U
I
2. el conjunto K es un conjunto compacto si toda cubierta (abierta) U ={U Rn | I} de

K tiene una subcubierta finita, es decir, si existen 1 , . . . , k I tales que
K U1 Uk
Con base en esta definicion, ya estamos en condiciones de formular un resultado que da respuesta
a la pregunta que hicimos sobre el recproco de la proposicion 2.52, el cual dejaremos plasmado en
el siguiente
Teorema 2.55 Sean f : A Rn Rm y K A. Si f es continua sobre K y K es un conjunto

compacto entonces f es uniformemente continua sobre K.
Demostraci on. Sea > 0. Como f es continua para cada x K, sabemos que existe x > 0 tal
x) K) B/2 (f (
que f (Bx ( x)). Dado que la familia de vecindades U ={Bx /2 (x) | x
K} es una
cubierta abierta de K, sabemos que existen x k K tales que
1 , . . . , x
x1 ) B xk (
K B x1 ( xk ) (2.8)
2 2
Tomamos
x1 x
= min ,..., k >0
2 2
, y K tales que k
y sean x x yk < . Por la contenci on 2.8 sabemos que existe j {1, . . . , k} tal
que
B xj (
x xj )
2
y como k
x yk < xj /2 se tiene que
k
yx
j k = k(
yx xx
) + ( j )k
kyx k + k
xx
j k
xj
<+
2
xj
de donde y Bxj ( , y Bxj (

xj ). Asi, como x xj ) K concluimos que
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y)k

< +
2 2
=
95 J. P
aez
y por lo tanto que f es uniformemente continua sobre K.
No podemos ignorar que al lector le parecera un tanto m agica la forma en que hemos intro-
ducido el concepto de conjunto compacto, raz on por la cual dedicaremos los ultimos resultados de
esta secci on (en Rn ) muy importante de este
on (y de este captulo!) a establecer una caracterizaci
tipo de conjuntos. En efecto, existe un conocido y muy importante teorema que da una caracter-
izacion de los conjuntos compactos, el teorema de Heine-Borel4 , el cual establece que en Rn , los
conjuntos compactos no son mas que nuestros muy conocidos conjuntos cerrados y acotados!
Teorema 2.56 (de Heine-Borel) Sea K Rn . K es un conjunto compacto si y s

olo si K es un
conjunto cerrado y acotado.
Demostraci on. (=) Primero mostraremos que K es un conjunto acotado. Para ello, considere-
mos la familia U ={Bk (
0) | k N} de subconjuntos abiertos de Rn . Dado que
[
Bk (0) = Rn
kN
entonces U es una cubierta abierta de K, de modo que existen k1 , . . . , kl N tales que
K Bk1 (0) Bkl (0)
de tal forma que, si N = max{k1 , . . . , kl } se tiene que
K Bk1 (0) Bkl (0)

= BN (0)
de donde concluimos que K esta acotado.

Para probar que K es cerrado, mostraremos que K c := Rn \ K es un conjunto abierto. Sea
Rn \ K y para cada k N hacemos Uk = Rn \ B1/k (
x x); dado que B1/k ( y Rn | k
x) = { yx
k
1/k} es un conjunto cerrado, Uk es un conjunto abierto, y como
\
x) = {
B1/k ( x}
kN
se tiene que
K Rn \ {
x}
\
= Rn \ B1/k (
x)
kN
[
= Rn \ B1/k (
x)
kN
[
= Uk
kN
4
Heinrich Eduard Heine (16 de marzo, 1821, Berlin21 de octubre, 1881, Halle) matem atico aleman. Heine es
conocido por sus resultados sobre funciones especiales y en an alisis real. En particular, escribio un importante
tratado sobre funciones arm onicas esfericas y funciones de Legendre. Tambien investig o series hipergeometricas
b
asicas e introdujo la formula MehlerHeine.

Felix Edouard
Justin Emile Borel (7 de enero de 1871 3 de Febrero 1956) fue un matem atico y poltico frances.
Como matem atico, es conocido por su trabajo fundacional en las
areas de teora de la medida y probabilidad. (fuente:
Wikipedia).
J. P
aez 96
de tal forma que U = {Uk | k N} es una cubierta abierta de K. Como K es compacto, existen
k1 , . . . , kl N tales que
K Uk1 Ukl

= Rn \ B1/k1 ( x) Rn \ B1/kl (
x)
= Rn \ B1/N (
x)
en donde N = max{k1 , . . . , kl }. Por tanto
x) B1/N (
B1/N ( x)
Rn \ K
con lo que concluimos que Rn \ K es abierto y por lo tanto que K es cerrado.

(=) Supongamos ahora que K Rn es un conjunto cerrado y acotado. Para esta implicaci on
procederemos por contradicci on. Supongamos entonces que K no es comparto. Bajo este supuesto,
entonces debe existir una cubierta abierta U = {U | I} de K tal que ning un n
umero finito de
elementos de U sigue cubriendo a K. Ahora, por el problema 20 del captulo 1, sabemos que cada
U se puede expresar como la uni on de bolas (o vecindades) con centro en Qn y radio racional.
Dado que Qn y los racionales (positivos) son conjuntos numerables, entonces existe una sucesion
xk } de puntos en Qn y una sucesion {rk } de n
{ umeros racionales positivos tales que la familia de
xk ) | k N} satisface las siguientes condiciones:
bolas V = {Brk (
1. para cada k N existe I tal que Brk (

x k ) U , y
2. [ [
Brk (
xk ) = U
kN I
Notese que, dado que no existen un numero finito de elementos de U que cubra a K, por el
umero finito de elementos de V que cubra a K; y por el inciso 2, dado
inciso 1 tampoco existe un n
que U es una cubierta abierta de K, V tambien es una cubierta abierta de K.
Ahora, para cada k N, hacemos
Ak = (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
Observese que estos conjuntos Ak satisfacen las siguientes condiciones, para cada k N:
a. Ak 6= (recuerde que no existe un n

umero finito de elementos de V que cubra a K),
b. Ak+1 Ak (pues Br1 (

x1 ) Brk (
xk ) Br1 (
x1 ) Brk (
xk ) Brk+1 (
xk+1 )), y
c. Ak es cerrado y acotado (es la intersecci

on de dos conjuntos cerrados, uno de los cuales, K,
est
a acotado)
Por tanto, por el problema 34 del captulo 1, se tiene que

\
6= Ak
kN
\
= (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
kN
97 J. P
aez
!
\
= (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
kN
!
[
n
= R \ x1 ) Brk (
(Br1 ( xk )) K
kN
!
[
= Rn \ Brk (
xk ) K
kN
xk ) | k N} tambien es una cubierta de K se debe tener que

Por otra parte, como V = {Brk (
[
K Brk (
xk )
kN
y por tanto que !

[
n
R \ Brk (
xk ) K =
kN
Con esta contradicci
on, concluimos nuestra prueba.
Como seguramente el lector recordara, los conjuntos cerrados y acotados son viejos conocidos
para nosotros, pues junto con los conjuntos conexos, son el tipo de conjuntos que se preservan
bajo funciones continuas, resultado que dejamos formulado en el teorema 2.48. De esta forma, y
como una consecuencia inmediata del teorema de Heine-Borel, podemos reescribir el teorema 2.48
diciendo ahora que los conjuntos compactos tambien se preservan bajo funciones continuas. Y
aunque no hara falta hacer ninguna prueba de este hecho, haremos otra muy sencilla, en la que s
olo
usaremos la (singular) caracterizaci
on de la continuidad de una funcion dada en la proposici on
2.45, y algunas propiedades elementales de la imagen inversa establecidas en la proposicion 2.13.
Teorema 2.57 Sea f : A Rn Rm continua en A y K A. Si K es compacto entonces f (K)

es compacto.
Demostraci on. Sea V = {V | I} una cubierta (de abiertos en Rm ) de f (K). Por la
on 2.45, sabemos que para cada V V existe U Rn abierto tal que f 1 (V ) = U A.
proposici
Ahora, dado que
K f 1 (f (K))
!
[
f 1 V
I
[
= f 1 (V )
I
[
= (U A)
I
!
[
= U A
I
y que K A, se tiene que U = {U | I} es una cubierta abierta de K, y como K es compacto,

entonces existen 1 , . . . , k I tales que
K U1 Uk
J. P
aez 98
2.4. Problemas Captulo 2. Funciones de Rn en Rm
Usando nuevamente que K A, tenemos que
K (U1 Uk ) A
= (U1 A) (Uk A)
= f 1 (V1 ) f 1 (Vk )
y por tanto
f (K) f f 1 (V1 ) f 1 (Vk )

= f (f 1 (V1 )) f (f 1 (Vk ))
V1 Vk
con lo que concluimos que f (K) es compacto.
2.4 Problemas
un subconjunto A R2 . En cada caso
1. Considere las siguientes funciones definidas para alg
identifique al conjunto A y haga un esbozo de su grafica.
p
i) f (x, y) = x2 + y 2 ii) f (x, y) = 1 x2 iii) f (x, y) = x2 + y 2
1
iv) f (x, y) = xy v) f (x, y) = x2 +y 2
vi) f (x, y) = x2 y 2
2. Sean g : A R2 R, k R y (x0 , y0 ) R2 . Suponiendo que se conoce la gr

afica de g, cual
sera el dominio y la gr
afica de las siguientes funciones?:
i) f (x, y) = g(x, y) + k ii) f (x, y) = kg(x, y)
iii) f (x, y) = g(x, y) iv) f (x, y) = g(x x0 , y y0 )
3. Determina los conjuntos de nivel de cada una de las siguientes funciones:
i) f (x, y) = x2 y 2 ii) f (x, y) = 2xy iii) f (x, y, z) = x2 y 2 + z 2 iv) f (x, y, z) = yz
4. Considere las siguientes funciones:
(a) f (x, y) = (x sen(y), x cos(y)); cual es la imagen bajo esta funcion de las rectas de la
forma x = c y y = d, con c y d cualesquiera n umeros reales?
(b) f (x, y) = (ex sen(y), ex cos(y)); cual es la imagen bajo esta funcion de las rectas de la
forma x = c y y = d, con c y d cualesquiera n umeros reales?
(c) f (x, y, z) = (x cos(y), x sen(y), z); cual es la imagen bajo esta funcion de los planos de
la forma x = c, y = d y z = k, con c, d y k cualesquiera n umeros reales?
(d) f (x, y, z) = (x sen(y) cos(z), x sen(y) sen(z), x cos(y)); cual es la imagen bajo esta funci
on
de los planos de la forma x = c, y = d y z = k, con c, d y k cualesquiera n umeros reales?
5. Pruebe la proposicion 2.13 y de ejemplos de funciones en los que las contenciones de los incisos
7, 8, 9 y 10 sean propias.
99 J. P
aez
Captulo 2. Funciones de Rn en Rm 2.4. Problemas
on de R2 en R3 cuya imagen coincida con el elipsoide x2 /a2 + y 2 /b2 +

6. Encuentre una funci
2 2
z /c = 1.
7. Decimos que L : Rn Rm es una funcion lineal, si L(

x + y) = L(
x) + L(
y ) para todos
, R, y para todos x
(a) L(0) =
0
on constante cero (de Rn en Rm ) es la u
(b) la funci nica funcion constante que es lineal
(c) existe M 0 tal que kL(
x)k M k Rn
xk para toda x
(d) si L : R2 R es una funci
on lineal entonces la gr
afica de L es un plano que pasa por el
origen
(e) cualquier plano cuya ecuaci
on sea de la forma
Ax + By + Cz = 0
afica de alguna funcion lineal L : R2 R (de las

con C 6= 0, coincide con ser la gr
variables x y y).
(f) si L : R3 R, con L diferente de la funcion constante cero, entonces cualquier conjunto
de nivel de L es un plano
8. Determina cu
ales de las siguientes sucesiones convergen y su punto de convergencia (si es que
convergen)
xk = (k sen(1/k), (1 + 1/k)k )}
i){ xk = (sen(k)/k, (1 + k)1/k )}
ii) {
k k+1
xk = (ak + bk )1/k , kck , (1)k (1 + 1/k))}
iii) { xk = ((k2 + 1)1/8 (k + 1)1/4 , k+1
iv) { k )}
9. Pruebe que una sucesion {xk } en Rn converge al punto x

0 Rn si y s
olo si la sucesion de
umeros reales {k
n xk x
0 k} converge a 0.
xk } una sucesion en Rn que converge al punto x

10. Sea { 0 Rn . Pruebe que la sucesion de
umeros reales {k
n xk k} converge a k 0 Rn ?
x0 k. Es cierto lo recproco para cualquier x
11. En la definicion 2.16 sustituya la norma euclideana por la norma uno y la norma infinito y
pruebe que la proposici on 2.17 sigue siendo cierta con cada una de ellas. Con base en lo
anterior, pruebe que todas estas definiciones de convergencia son equivalentes.

on 2.18, usando la proposici
on 2.17 y sin usar dicha proposici
on.

on 2.20.
14. En la definicion 2.19 sustituya la norma euclideana por la norma uno y la norma infinito y
pruebe que la proposici on 2.20 sigue siendo cierta con cada una de ellas. Con base en lo
anterior, pruebe que todas estas definiciones son equivalentes.
15. Pruebe, sin usar la proposici on 2.17, la proposici

on 2.23 (sugerencia: recuerde (o pruebe)
que si {kl } es una sucesion creciente de n
umeros narurales (es decir que kl < kl+1 para toda
l N) entonces l kl para toda l N).
16. Sea {xk } una sucesion en Rn cuyo rango A es finito. Pruebe que existe y A y una subsucesi
on
{
xkl } de { kl = y para toda l N.
xk } tal que x
J. P
aez 100
xk } una sucesion en Rn cuyo rango A es infinito. Pruebe que:

17. Sea {
(a) si { 0 Rn entonces x
xk } converge al punto x 0 es el u
nico punto de acumulaci
on de A.
(b) si x0 es un punto de acumulaci on de A entonces existe una subsucesi on {
xkl } de {
xk }
que converge a x 0 .
n o
(1) (n)
18. Sea x k = xk , . . . , xk una sucesion en Rn . Pruebe que: {
xk } est
a acotada si y s
olo si
(i)
{xk } est
a acotada para cada i {1, . . . , n}.
19. Pruebe que, si {xk } es una sucesion de Cauchy en Rn entonces cualquier subsucesi
on {
xk l }
de {
xk }, tambien es de Cauchy.
xk } una sucesion de Cauchy en Rn . Pruebe, directamente de la definicion, que:

20. Sea {
(a) {
xk } est
a acotada.
xk } es finito entonces existe N N tal que x
(b) si el rango de { 0 para toda k N .
k = x
(c) si {xkl } es una subsucesi
on de { 0 Rn , entonces {
xk } que converge a x xk } converge a
x
0 .
21. Pruebe el corolario 2.21 sin usar la proposici

on 2.20 (sugerencia: para probar que la condici
on
de Cauchy es suficiente para la convergencia, use el problema anterior y el teorema de Bolzano-
Weierstrass).
22. Determine si la siguientes proposiciones son falsas o verdaderas. Pruebe sus respuestas.
xk } en Rn es convergente entonces su rango tiene un u

(a) Si una sucesion { nico punto de
acumulaci
on.
xk } en Rn es tal que su rango tiene un u
(b) Si una sucesion { nico punto de acumulaci
on
entonces {
xk } es convergente.
xk } en Rn no convergente que tiene una u
(c) Existe una sucesion { nica subsucesi
on conver-
gente.
xk } en Rn no convergente cuyo rango tiene un u
(d) Existe una sucesion { nico punto de
acumulaci
on.
23. Pruebe, usando el teorema de Bolzano-Weierstrass y sin usar el caso real, el teorema 2.28
(sugerencia: analice dos casos: cuando el rango de { xk } es finito, en cuyo caso serautil el
problema 16, y cuando el rango de { xk } es infinito, en cuyo caso ser a u
til el teorema de
Bolzano-Weierstrass y el inciso (b) del problema 17).
24. Pruebe, sin usar el teorema de Bolzano-Weierstrass y el caso real, el teorema 2.28 (sugerencia:
use que los naturales son infinitos y el teorema de los rectangulos anidados, imitando el
metodo de la cacera del le
on usado en la prueba del teorema de Bolzano-Weierstrass).
25. Sea A Rn . Pruebe que:
0 A si y s
(a) x olo si existe una sucesion {
xk } en A tal que {
xk } converge a x
0 .
0 A si y s
(b) x olo si existe una sucesion {
xk } en A \ {
x0 } tal que {
xk } converge a x
0 .
101 J. P
aez
0 es un punto aislado de A y {
(c) si x xk } A es una sucesion que converge a x
0 , entonces
existe N N tal que x 0 para toda k N .
k = x

on 2.30.
27. Sea f : A R Rn y x0 R.
(a) Defina el concepto de lmite lateral (por la izquierda y por la derecha) de f en x0 ; es

decir, defina lo que significa que l Rn sea tal que
l = lim f (x)
xx+
0
o que
l = lim f (x)
xx
0
Para dar estas definiciones, que condici on es necesario que cumpla el punto x0 ? es
suficiente que x0 A ? Justifique su respuesta.
(b) Con base en las definiciones anteriores (y suponiendo que x0 satisface las condiciones
que hayan hecho falta), pruebe que
olo si l = lim f (x) y l = lim f (x)

l = lim f (x) si y s
xx0 xx+ xx
0 0
28. Determina si las siguientes funciones tienen lmite en el punto que se indica. Pruebe su
respuesta.
x3 y 2 x3 +xy 2 x2 yy 3
i) f (x, y) = x6 +y 4
en (0, 0) ii) f (x, y) = x2 +y 2
en (0, 0)
x2 (y1) x2 y+x2
iii) f (x, y) = x4 +(y1)2
en (0, 1) iv) f (x, y) = x2 +y 2 +2y+1
en (0, 1)
xy+yz+zx
v) f (x, y, z) = x2 +y 2 +z 2
en (0, 0, 0) vi) f (x, y, z) = xy+yz+zx
2 2 2
en (0, 0, 0)
x +y +z
x3 y 4 xy 3
vii) f (x, y) = x4 +y 4
en (0, 0) viii) f (x, y) = x2 +y 6
en (0, 0)
x3 +y 4 x2 y 5
ix) f (x, y) = x2 +y 2
en (0, 0) x) f (x, y) = x2 +(y1)2
en (0, 1)
0 A y l Rm . Pruebe que l = limxx0 f (

29. Sean f : A Rn Rm , x x) si y s
olo si
l = lim f (
x +
h).
h0
30. Sean f, g : A Rn Rm y x 0 A . Pruebe que, si g est a acotada en una vecindad

agujerada de x 0 (es decir que existen r > 0 y M > 0 tales que kg( x)k M para toda
(Br (
x x0 ) \ {
x0 }) A) y limxx0 f (
x) = 0 entonces limxx0 (g f )(
x) = 0.
31. Sean f : A Rn Rm y x x) = 0 si y s
0 A . Pruebe que limxx0 f ( olo si limxx0 kf (
x)k =
0.
32. En la definicion 2.35 sustituya la norma euclideana por las normas uno e infinito y pruebe
que todas estas definiciones son equivalentes.
J. P
aez 102
33. Sean f, g : A Rn Rm , x
0 A y k N. Pruebe que, si
kf (
x) g(
x)k
lim =0
x

x0 k 0 kk
xx
entonces
kf (
x) g(x)k
lim =0
x

x0 kxx 0 ks
para toda s Z tal que s k.
34. Sea L : Rn Rm una funci on lineal, es decir que L(

x + y) = L(
x) + L(
y ) para todos
, R, y para todos x n
, y R . Pruebe que, si

L(h)
lim = 0

h0 h
on constante cero (L 0).

entonces L es la funci
35. Sean f : A Rn Rm , x 0 A y l Rm tales que l = limxx0 f (

x). Determine si las
siguientes afirmaciones son ciertas. Pruebe sus respuestas.
(a)
l (f (A))
(b) si D Rm es tal que
l D y (A f 1 (D)) 6= entonces x
0 (A f 1 (D)) .
(c) si las afirmaciones anteriores no son ciertas, de hip
otesis adicionales sobre la funci
on f
para que estas s sean ciertas.

on 2.33, primero usando la proposici
on 2.18, y despues usando s
olo la
definicion 2.35.
37. Pruebe las proposiciones 2.39, 2.40 y 2.41.
38. Sea f : A Rn Rm continua en x x0 ) 6= 0. Pruebe que:

0 A tal que f (
x) 6= 0 para toda x
(a) existe > 0 tal que f ( B (
x0 ) A
(b) existen c > 0 y > 0 tales que kf (
x)k c para toda x x0 ) A
B (
39. Sea f : A Rn Rm . Pruebe que: f es continua en A si y solo si para todo C Rm ,

cerrado, existe D Rn , cerrado, tal que f 1 (C) = D A.
40. Sea f : A Rn Rm . Pruebe que:
A f (B) para todo B A.

(a) f es continua en A si y s
olo si f B
olo si f (B A) f (B) para todo B A.
(b) f es continua en A si y s
41. Pruebe que:
(a) A = {(x, y) R2 | 1 < x2 + y} es un conjunto abierto

(b) A = {(x, y, z) R3 | (zx + zy)/(x2 + y 2 ) < 0} es un conjunto abierto
(c) A = {(x, y) R2 | y = 1/x} es un conjunto cerrado
103 J. P
aez
42. Sean f : U Rn R, x 0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b) R R.

Definimos : U Rn R como

g(f (x))g(f (
x0 ))

f (
x)f (
x0 ) x) f (
si f ( x0 ) 6= 0
(
x) =
g (f (

x0 )) x) f (
si f ( x0 ) = 0
Pruebe que, si f es continua en x

0 y g es derivable en f (
x0 ) entonces es continua en x
0 .
43. Pruebe que las siguientes funciones son continuas en su dominio:
(a) f : Rn R definida como f (

x) = k
xk
(b) f : Rn R definida como f (
x) = f (x1 , . . . , xn ) = xi , donde i {1, . . . , n}
(c) L : Rn Rm cualquier funci
on lineal
44. Sea
S n1 = {
x Rn | k
xk = 1}
Pruebe que S n1 es un conjunto cerrado.
45. Sean, A Rn un abierto, x A, y (A A )c y f : [0, 1] R Rn continua tal que f (0) = x

y f (1) = y. Pruebe que existe t (0, 1) tal que f (t) F r(A).
46. Sea f : A Rn R continua en A, con A conexo y tal que f ( x) 6= 0 para toda x

A.
Pruebe que f ( A o f (
x) > 0 para toda x A.
x) < 0 para toda x
47. Sea f : A Rn Rm continua en A, con A conexo y tal que kf ( 6 1 para toda x

x)k = A.
Pruebe que si kf ( 0 A entonces kf (
x0 )k < 1 para alguna x A.
x)k < 1 para toda x
48. Sean f : A Rn R continua en A, y B A conexo, cerrado y acotado. Pruebe que existen

a, b R tales que f (B) = [a, b].
49. Sea A Rn un conjunto cerrado y acotado y y Ac . Pruebe que existe x 0 A tal que
k
yx 0 k k
x yk para todo x
A. Muestre, con un ejemplo, que esta afirmacion no
es valida si no suponemos que A es cerrado. Esta afirmacion sigue siendo valida si s
olo
suponemos que A es cerrado? Pruebe su respuesta.
50. Sean A, B Rn conjuntos cerrados y acotados tales que A B = . Pruebe que existen
0 A y y0 B tales que k
x y0 x
0 k k
x yk para todo x
A y para todo y B. Muestre,
con un ejemplo, que esta afirmacion no es valida si no suponemos que A es cerrado. Esta
afirmacion sigue siendo valida si s
olo suponemos que A es cerrado? Pruebe su respuesta.
51. Sea f : A Rn Rm continua, con A cerrado y acotado. Pruebe que existen x 1 A

0 , x
tales que kf (
x0 )k kf (
x)k kf ( A
x1 )k para toda x
52. Sea f : A Rn Rm continua e inyectiva en A, con A cerrado y acotado. Pruebe que

f 1 : f (A) Rm Rn (la funcion inversa de f ) es continua en f (A). Esta afirmacion se
sigue cumpliendo si A no es cerrado? Pruebe su respuesta.
53. En la definicion 2.50 sustituya la norma euclideana por las normas uno e infinito y pruebe
que todas estas definiciones son equivalentes.
J. P
aez 104

on 2.51.
55. Pruebe que la funci

on definida en el ejemplo 2.53 es uniformemente continua sobre cualquier
2
subconjunto B R \ {(0, 0)} que no tenga como punto de acumulaci on al (0, 0).
56. Sea L : Rn Rm una funci

on lineal. Pruebe que L es uniformemente continua en Rn .
57. Sean f : A Rn Rm uniformemente continua en A y {

xk } A una sucesion de Cauchy.
Pruebe que {f (
xk )} es una sucesion de Cauchy.
58. Sea A Rn . Definimos fA : Rn R como fA (

x) = dist( x yk | y A} (para
x, A) := inf{k
Rn ). Pruebe que:
cada x
(a) fA (
x) = 0 s y s A
olo si x
(b) fA es uniformemente continua en Rn (sugerencia: pruebe que |fA (
x) fA (
y )| k
x yk
para todo x n
, y R )
(c) si A, B Rn est
an separados entonces existen U, V Rn abiertos tales que A U ,
B V y U V = (sugerencia: considere la funcion f ( x) fB (
x) = fA ( x))
105 J. P
aez
J. P
aez 106
Captulo 3
La derivada de funciones de R en Rn
Con este breve captulo damos inicio al estudio del concepto de derivacion para funciones de varias
variables, pero a diferencia del captulo anterior, empezaremos haciendolo s olo para el caso de
funciones de R en Rn .
Como tambien mencionamos anteriormente, dado que lo importante de las funciones de este
tipo es su imagen, estas suelen ser u
tiles para describir objetos geometricos a los que (bajo ciertas
condiciones) nos referiremos como curvas; o para describir el movimiento de un objeto, raz on
por la cual a estas funciones tambien las conoceremos con el nombre de trayectorias. Y justo a
partir de estos dos usos es que motivaremos su concepto de derivada, pero previamente daremos
algunos ejemplos de ambas formas de usarlas.
3.1 Geometra y movimiento

Aun y cuando a estas alturas el lector posiblemente no conozca una definicion precisa de lo que
significa la palabra curva (definicion que precisaremos mas adelante), cualquiera que esta fuera
debiera de abarcar a objetos geometricos tan conocidos como las rectas y las c onicas en el plano.
A falta de tal definicion y a manera de ejemplo, por ahora s olo nos limitaremos a mostrar que,
entre otros muchos objetos geometricos, las rectas y las conicas se pueden obtener como la imagen
de una funci on de R en R2 . Tal es el caso de las rectas en el plano (R2 ) las cuales podemos pensar
en general como un conjunto definido de la siguiente forma:
R = {(x, y) R2 | ax + by + c = 0}
en donde a2 + b2 > 0.
Una forma muy sencilla de ver a R como la imagen de una funcion de R en R2 , consiste en
observar que, como a2 + b2 > 0, entonces a 6= 0 o b 6= 0 de modo que si suponemos que sucede lo
primero, entonces para cualquier (x, y) R se tiene que
c by
x= (3.1)
a
de tal forma que a la pareja (x, y) la podemos escribir como

c by
,y
a
es decir, la podemos escribir en terminos de una sola variable (o de un s
olo par
ametro, que es
el temino que se suele usar en este contexto), de tal forma que basados en lo anterior, es facil
107
Captulo 3. La derivada de funciones de R en Rn 3.1. Geometra y movimiento
on : R R2 (1 ) dada por
comprobar que si consideramos la funci

c bt
(t) = ,t
a
se tiene que (R) = R.

otese que para toda t R se tiene que
En efecto, n

c bt
a + bt + c = (c bt) + bt + c
a
=0
con lo cual concluimos que (R) R. Por otra parte, si (x, y) R, por la identidad 3.1 tenemos
que bastara tomar t = y para que se cumpla que

c by
(y) = ,y
a
= (x, y)
con lo que concluimos que R (R) y por lo tanto que (R) = R.

Aunque laborioso (pero no difcil), tambien se puede probar que la circunferencia con centro en
el origen (de un sistema coordenado cartesiano dado) de radio r > 0 dada por
Cr = {(x, y) R2 | x2 + y 2 = r 2 }
se puede obtener como la imagen de la funcion : [0, 2) R2 dada por
(t) = (r cos(t), r sen(t))
o la elipse E R2 dada por

2 y2

2 x
E = (x, y) R | 2 + 2 = 1
a b
se puede obtener como la imagen de la funcion : [0, 2) R2 dada por
(t) = (a cos(t), b sen(t))
abola P R2 dada por

o que la par
P = {(x, y) R2 | y = x2 }
se puede obtener como la imagen de la funcion : R R2 dada por
(t) = (t, t2 )
Aun y cuando todava no tenemos todo lo necesario para definir lo que significa que un subcon-
junto de Rn sea una curva, con base en estos ejemplos ya podemos definir lo que significa que una
de estas funciones parametrice a un conjunto C Rn . En general, si C Rn es tal que coincide
on de R en Rn , diremos que dicha funcion es una parametrizaci
con la imagen de una funci on de C.
1
un que se usen letras griegas para nombrar a las funciones de R en Rn .
Es com
J. P
aez 108
3.1. Geometra y movimiento Captulo 3. La derivada de funciones de R en Rn
Definicion 3.1 Sea C Rn . Si existe = (1 , . . . , n ) : I R Rn tal que (I) = C decimos

que es una parametrizaci
on de C. En este caso diremos que las identidades
x1 = 1 (t)
x2 = 2 (t)
..
.
xn = 2 (t)
son unas ecuaciones parametricas de C.
Con relaci
on a la definicion anterior, es importante llamar la atenci
on al hecho de que a la
funcion no se le pide ninguna propiedad. Identificar los subconjuntos de Rn para los cu ales
existe una parametrizacion, es sin duda un problema interesante (y no muy difcil), pero que esta
fuera de los objetivos de este texto. De hecho, hablando de propiedades de funciones de R en
Rn , hemos definido ya lo que significa que una de estas funciones sea continua, y sin duda otra
pregunta interesante sera la siguiente: que subconjuntos de Rn tienen una parametrizacion que
sea continua? Este es un problema mucho mas interesante (y difcil!) que el anterior, y para
los deseosos en saber algo al respecto, les recomendamos investigar acerca de las llamadas curvas
de Peano 2 . Como seguramente el lector ya habra notado, mas que responder estas preguntas, el
objetivo de este texto esta centrado en desarrollar las propiedades que pueden tener este tipo de
funciones, entre la cuales se encuentra la de la derivabilidad.
Con respecto a la misma definicion 3.1, tambien vale la pena destacar el uso que se hace del
artculo una. En efecto, n otese que si I R y son como en dicha definicion, y se tiene que
: J R R es tal que (J) = I, entonces : J R Rn definida como = es tal que
(J) = C y por tanto sera otra parametrizacion de C. Es decir, si un subconjunto C Rn
tiene una parametrizacion, entonces con base en ella podemos obtener mas parametrizaciones del
mismo conjunto. Por esta misma raz on, lo mas adecuado es decir que
x = r cos(t)
y = r sen(t)
para t [0, 2), son unas ecuaciones parametricas de la circunferencia de radio r > 0 con centro
en el origen, ya que
x = r sen(2t)
y = r cos(2t)
para t [0, 1), son otras ecuaciones parametricas de la misma circunferencia.

Otro tipo de objeto geometrico que se puede describir atraves de una funcion de R en R2 es
uno con el cual el lector debe estar muy familiarizado: la gr afica de una funcion de R en R. En
efecto, si f : I R R sabemos que la gr afica de f es un subconjunto de R2 definido como
Gf := (x, f (x)) R2 | x I

y es muy facil comprobar que la funcion : I R R2 dada por (t) = (t, f (t)) es una
parametrizacion de Gf .
Como el lector seguramente estar
a de acuerdo, la observacion anterior incrementa sustancial-
mente la cantidad de subconjuntos de R2 que podemos describir como la imagen de una funci on
109 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.1. Geometra y movimiento
aficas de la funciones f (x) = |x| y f (x) = sen(x) se pueden obtener como la imagen
Figura 3.1: Las gr
de una funcion R en R2 .
de R en R2 . Ahora sabemos que subconjuntos como las gr aficas de la funciones f (x) = |x| o
f (x) = sen(x) se pueden obtener de esta forma (ver figura 3.1).
Concluimos esta breve secci on mostrando como las funciones de R en Rn resultan ser una
herramienta adecuada para describir el camino o trayectoria seguido por un objeto. Para ello,
recurriremos a un conocido ejemplo el cual justamente se puede plantear en estos terminos de la
siguiente forma: suponga que se tiene una rueda, la cual vamos a rodar (sin resbalar) en lnea
recta y sobre una superficie plana, y sobre dicha rueda hacemos una marca. Nuestro objetivo es
encontrar una funci on que nos proporcione la posici
on (una vez establecido un sistema de referencia)
de dicha marca, conforme la rueda va girando. Para ello, simplificaremos el problema sustituyendo
la rueda por una circunferencia de radio r > 0, a la marca por un punto P de dicha circunferencia,
y una vez elegido un sistema de referencia (cartesiano) supondremos que la posici on inicial de
la circunferencia es tal que su centro C se encuentra en el punto de coordenadas (0, r) y que las
correspondientes al punto P est an dadas por (0, 2r) (ver figura 3.2 (a)). Tambien supondremos que
la circunferencia rueda (sin resbalar) hacia la derecha, en la direcci on positiva del eje X.
Una cuestion muy importante en este tipo de problemas es la eleccion de la variable (o parametro,
que es el termino que se suele usar en estos casos) en terminos de la cual queremos expresar la
posicion del punto que nos interesa. Esta eleccion depende en general del problema que se este
tratando (lo que significa que no existen reglas para su eleccion).
En el caso que nos ocupa, una vez que la circunferencia haya rodado una cierta distancia (que
supondremos fue peque na), el punto P del cual nos interesa describir su movimiento ocupara una
nueva posicion, y las coordenadas de esta nueva posici on las vamos a determinar usando el angulo
formado por la semirecta (paralela al eje Y ) que parte del centro de la circuferencia (en direcci on
hacia arriba), y el segmento de recta que une al centro C con el punto P , angulo que denotaremos
por la letra y que de acuerdo a la observacion que hicimos antes, jugara el papel de par ametro
(ver figura 3.2 (b)).
Lo primero que haremos ser a encontrar las nuevas coordenadas del centro C de la circunferencia
desplazada, y para ello es importante hacer notar que la distancia recorrida por dicho centro, dado
que la circunferencia rueda sin resbalar, coincide con la longitud del arco subtendido por el angulo
opuesto a , la cual est a dada por r. De esta forma, las coordenadas del centro C son (r, r). Si
ahora observamos que para obtener las coordenadas del punto P , basta con tomar las de punto
C y sumarle la longitud de los correspondientes catetos del tri angulo rect
angulo formado por los
2
Giuseppe Peano (Spinetta, 27 de agosto de 1858 Turn, 20 de abril de 1932) fue un matem
atico, l
ogico y fil
osofo
italiano, conocido por sus contribuciones a la l
ogica matematica y la teora de n
umeros.
J. P
aez 110
3.1. Geometra y movimiento Captulo 3. La derivada de funciones de R en Rn
b
P r
b b P
Q

r b r b b
C C
(a) (b)
Figura 3.2: Deducci

on de una parametrizacion de la cicloide.
puntos C, P y Q (ver figura 3.2 (b)), concluimos que las nuevas coordenadas de P est
an dadas por
(r + r sen(), r + r cos()). Por tanto, la funcion de R en R2 definida como
() = r( + sen(), 1 + cos())
describe el movimiento del punto P en terminos del angulo que detallamos p arrafos arriba. En
la figura 3.3 se muestra la imagen de esta funcion para [0, 2] y representa a la trayectoria
seguida por el punto P cuando la circunferencia ha realizado una vuelta completa, trayectoria
conocida con el nombre de cicloide.
b
P
2
Figura 3.3: Trayectoria seguida por el punto P cuando la circunferencia (de radio 1) ha realizado una
vuelta completa, trayectoria conocida con el nombre de cicloide.
Existen una buena cantidad de interesantes trayectorias definidas de manera an aloga, pero
desafortundamente no est a entre los objetivos de este libro profundizar en este tipo de ejemplos3 .
Nuestro objetivo principal en este captulo es introducir el concepto de derivada para funciones de
R en Rn , y lo motivaremos a partir del uso de estas en la geometra y en la fsica, raz
on por la cual
analizamos solo estos pocos ejemplos.
3
Para el lector interesado en conocer mas ejemplos de este tipo, le recomendamos visitar el sitio de internet:
www.-history.mcs.st-and.ac.uk/Curves/Curves.html
111 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.2. La derivada
3.2 La derivada
Dada una funci on : I R Rn con la cual describimos a un conjunto C Rn , si este tiene el
aspecto de una lnea doblada (como por ejemplo una conica), nos vamos a plantear el problema
de encontrar la recta tangente a C en un punto x 0 . Si t0 I es tal que (t0 ) = x
0 y t I es
cercano a t0 , ver a la diferencia
(t) (t0 ) (3.2)
como una flecha nos da la oportunidad de obtener la recta que pasa por x 0 y que sigue la direcci
on
determinada por (t) (t0 ) (ver problema 3) suponiendo, por supuesto, que esta flecha no es el
vector 0. Como se muestra en la figura 3.4 esta recta es secante a la curva C y en la medida de que
t este mas cercano a t0 , dicha secante se ver
a como una tangente.
b b
(t0 ) b
b
(t)
Figura 3.4: Si el vector (t) (t0 ) no es el vector 0, la recta cuya direcci

on esta determinada por este
y que pasa por el punto (t0 ), es una recta secante a la curva C que tiende a ser tangente (en (t0 ))
si t tiende a t0 .
La construccion anterior estara muy bien si no fuera por el hecho de que la diferencia 3.2 se
parecera cada vez mas al vector
0 en la medida de que t este mas cercano a t0 (sobre todo si es
una funcion continua, lo que seguramente sucedera en la mayora de los casos que sean de nuestro
interes), con lo cual perdemos toda oportunidad de definir una recta.
La soluci on que daremos a este problema sera que, en lugar de considerar al vector 3.2, vamos
a considerar al vector dado por la expresion
1 (t) (t0 )
((t) (t0 )) = (3.3)
t t0 t t0
con el cual, si no es el vector

0, podemos seguir construyendo rectas secantes a C. Una raz on por
la cual vamos a considerar al vector 3.3 es que este no solo nos sigue proporcionando informaci on
de cual es la direcci
on que tiende a ser tangente al conjunto C en el punto x 0 , sino que adem as
su norma nos da informaci on sobre la raz
on de cambio (con respecto a la distancia entre t y t0 ) de
la distancia entre los puntos (t) y (t0 ). Mas adelante, cuando veamos a como una funcion que
describe el movimiento de un objeto, tambien veremos que el vector 3.3 es la forma mas adecuada
de medir la velocidad promedio de dicho objeto y, en u ltima instancia, veremos como este vector
se relaciona de manera muy adecuada con el concepto de derivada para funciones de R en R,
justo del tipo que son las funciones coordenadas de .
J. P
aez 112
3.2. La derivada Captulo 3. La derivada de funciones de R en Rn
Como seguramente el lector ya lo intuye, lo siguiente que haremos ser

a fijarnos en el
(t) (t0 )
lim
tt0 t t0
y en caso de que este exista (y que no sea el vector 0, lo que no siempre podemos asegurar), si a
dicho lmite lo denotamos (casualmente) por (t0 ), sin duda que la recta definida parametricamente
por la expresi on
(t0 ) + t (t0 )
con t R, es una recta que tiene las caractersticas adecuadas para ser llamada la recta tengente
a C en el punto x 0 = (t0 ).
A la discusion anterior hay que hacerle algunas precisiones importantes. La primera de ellas, y
que ya mencionamos, es que s olo cuando exista (t0 ) (es decir, el lmite cuando t tiende a t0 de la
expresion 3.3) y no sea el vector
0, es cuando podemos construir la recta tangente a C en x 0 . En
efecto, aun y cuando el aspecto geometrico del conjunto C en el punto x 0 nos de la impresion de
que existe la recta tangente, esto no significa que con cualquier parametrizacion de C sea posible
calcularla. En el siguiente ejemplo mostramos un conjunto y dos parametrizaciones de este que
ilustran estas posibilidades.
Ejemplo 3.2 Sea C = {(x, y) R2 | y = x2 }. Considere las siguientes parametrizaciones de C.
1. Sea : R R2 dada por

(t) = (t, t2 )
Como el lector f
acilmente puede comprobar, es una parametriazaci
on de C y en particular
en el punto (0) = (0, 0) se tiene que
(t) (0)
(0) = lim
t0 t0
= lim (1, t)
t0
= (1, 0)
de tal forma que la recta
l(t) = (0) + t (0)

= (0, 0) + t(1, 0)
= (t, 0)
que no es mas que el eje X, es tangente a C en el punto (0, 0).

(t2 , t4 )

si t 0
(t) =
(t2 , t4 ) si t 0

Como en el caso anterior, tambien es f acil comprobar que es una parametrizaci

on de C y
que (0) = (0, 0). Por otra parte, se tiene que
(t) (0)
lim = lim (t, t3 )
t0+ t0 t0+
113 J. P
aez
= (0, 0)
(t) (0)
lim = lim (t, t3 )
t0 t0 t0
= (0, 0)
de modo que, por el problema 27 del captulo 2, se tiene que (0) = (0, 0) y por lo tanto la
parametrizaci
on no proporciona un vector que permita construir la recta tangente a C en
el (0, 0).
Otra observaci on importante es que la existencia misma de (t0 ) no tiene mucho que ver con
el aspecto geometrico que tenga el conjunto C en el punto x 0 = (t0 ). A diferencia de lo que
suceda con el aspecto geometrico de la grafica de una funcion de R en R cuando esta era derivale
en un punto, si el conjunto C tiene un pico en x 0 esto no significa que (t0 ) no exista, como el
lector puede comprobar facilmente en el caso de la cicloide (figura 3.3), la cual tiene un pico en el
punto (, 0) = () a pesar de que () si existe (lo que se deduce de un resultado que probaremos
mas adelante). Otra ilustracion de este mismo hecho lo tenemos justo con la gr afica de la funci
on
valor absoluto, como lo veremos en el siguiente
Ejemplo 3.3 Sea C R2 la gr on f (x) = |x|; es decir, C = {(x, |x|) R2 | x R}.

afica de la funci
Considere las siguientes parametrizaciones de C.

(t) = (t, |t|)
Notese que para esta parametrizaci un) no existe (0) pues por una
on de C (la mas com
parte
(t) (0) 1
lim = lim (t, t)
t0+ t0 t0 t
+
= (1, 1)
mientras que
(t) (0) 1
lim = lim (t, t)
t0 t0 t0 t
= (1, 1)
de tal forma que, por el problema 27 del captulo 2
(t) (0)
(0) = lim
t0 t0
no existe.
2. Sea ahora : R R2 dada por
(t2 , t2 )

si t 0
(t) =
(t2 , t2 ) si t 0

J. P
aez 114
Tambien es f
acil ver que esta es una parametrizaci
on de C y n
otese que ahora
(t) (0) 1
lim = lim (t2 , t2 )
t0+ t0 t0+ t
= lim (t, t)
t0+
= (0, 0)
y
(t) (0) 1
lim = lim (t2 , t2 )
t0 t0 t0 t
= lim (t, t)
t0+
= (0, 0)
de tal forma que, por el mismo problema 27 del captulo 2, se tiene que (0) si existe y es
igual al vector (0, 0).
Con base en los ejemplos anteriores se concluye que, si C R2 es un conjunto que se puede
parametrizar por una funci on y (t) existe, si este vector es diferente de vector 0, s
olo entonces
se podra asegurar que C es un conjunto que no tiene un pico en el punto (t) (en cuyo caso, y
por razones obvias, diremos que el conjunto C es suave en el punto (t)). Y si (t) = 0 entonces
no podemos asegurar nada sobre el aspecto geometrico de C en (t).
Otra situaci
on relacionada de manera muy directa con el concepto de derivada que vamos a
introducir, es cuando a una funci on : I R Rn la utilizamos para describir el movimiento de
un objeto. Si en particular el parametro (o la variable) t del cual depende la funcion representa
al tiempo, de tal forma que que para un valor especfico t0 I, (t0 ) representa su posici on en este
a de acuerdo en que si, t I es otro instante muy cercano a t0 ,
instante, sin duda el lector estar
entonces el vector
1 (t) (t0 )
((t) (t0 )) =
t t0 t t0
contiene informaci on muy valiosa del movimiento descrito por cerca del instante t0 . En efecto,
dicho vector nos da informaci on de hacia d onde se est a moviendo nuestro objeto (a partir de
su posici
on en el tiempo t0 ), y su norma nos da un promedio de la rapidez con la que se est a
moviendo cerca de instante t0 . En virtud de lo anterior, se suele decir que este vector representa
la velocidad promedio de nuestro objeto durante el intervalo de tiempo comprendido entre t0 y
t. Como seguramente el lector ya est a imaginando, si
(t) (t0 )
lim
tt0 t t0
existe, dicho valor lmite (que tambien es un vector) se puede interpretar como la velocidad de
nuestro objeto en el instante t0 , o como se suele decir, la velocidad instant
anea de nuestro objeto,
en el instante t0 .
A partir de las dos interpretaciones anteriores vamos a introducir el concepto de derivada de una
funcion de R en Rn , y en lo que resta de esta seccion nos centraremos en mostrar las propiedades
de dicho concepto. De esta forma, iniciamos esta parte con la siguiente
Definicion 3.4 Sea : I R Rn , con I un intervalo. Dado t0 I decimos que es derivable
en t0 si
(t) (t0 )
lim
tt0 t t0
115 J. P
aez
existe. Este lmite lo denotamos por (t0 ) y lo llamamos la derivada de en t0 , es decir
(t) (t0 )
(t0 ) := lim
tt0 t t0
Dado que la definicion anterior la restringimos a funciones cuyo dominio es un intervalo, es

importante se nalar que en caso de que t0 I fuera un extremo de I, el lmite que se deber a
tomar sera el correspondiente lmite lateral y cuya definicion fue dada por el lector en el problema
27 del captulo 2.
Como hicimos en el caso de los conceptos de lmite y continuidad, lo siguiente que mostraremos
ser
a mostrar la estrecha relacion que existe entre la derivada de una funcion : I R Rn y
sus funciones coordenadas 1 , . . . , n (en un cierto de sistema de referencia dado), las cuales ser
an
funciones de R en R y para las cuales ya conocemos un concepto de derivada. Como seguramente
el lector ya intuye, la derivabilidad de la funcion es una condici on necesaria y suficiente de la
derivabilidad de sus funciones coordenadas, resultado que dejamos plasmado en la siguiente
Proposici on 3.5 Sea = (1 , . . . , n ) : I R Rn y t0 I. es derivable en t0 si y s

olo si
cada i es derivable en t0 , para i {1, . . . , n}. En ambos casos se tiene que
(t0 ) = (1 (t0 ), . . . , n (t0 ))
La prueba de esta proposicion es una consecuencia inmediata de la proposicion 2.30 del captulo
2 y se deja al lector.
Lo siguiente que haremos ser a mostrar la relaci
on que existe entre el concepto de derivada
y las operaciones aritmeticas entre funciones de este tipo. Con base en la proposici on anterior,
los correspondientes resultados de derivacion para funciones de R en R, y la proposici on 2.33 del
captulo 2, la prueba de estas propiedades es inmediata y tambien se dejan al lector.
Proposici on 3.6 Sean , : I R Rn , t0 I y h : I R R. Si , y h son derivables en

t0 entonces:
1. + es derivable en t0 y adem
as
( + ) (t0 ) = (t0 ) + (t0 )
2. h es derivable en t0 y adem
as
(h) (t0 ) = h (t0 )(t0 ) + h(t0 ) (t0 )
En particular, si h es la funci
on constante c, entonces
(c) (t0 ) = c (t0 )
3. : I R R es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
4. si n = 3, es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
J. P
aez 116
Otras operaciones que podemos realizar con una funcion de R en Rn , es la composici on por la
izquierda con una funcion de Rn en Rm , o por la derecha con una funcion de Rm en R. Dado que
habra que esperar hasta los captulos 3 y 4 para contar con un concepto de derivada para funciones
de Rn en Rm (con n > 1), y que hasta este momento para funciones de Rm en R, s olo sabemos
como derivarlas cuando m = 1, por ahora nos vamos a conformar con formular un resultado (la
primera regla de la cadena de este texto!) que establece condiciones para que la composicion (por la
derecha) de una funcion de R en Rn con otra de R en R sea derivable, y una formula para calcular
su derivada.
Proposici on 3.7 Sean J R un intervalo, h : J R R, : I R Rn , t0 I y x0 J

tales que h(J) I y h(x0 ) = t0 . Si h es derivable en x0 y es derivable en t0 entonces h es
derivable en x0 y adem
as
( h) (x0 ) = (h(x0 ))h (x0 )

= (t0 )h (x0 )
Si = (1 , . . . , n ) entonces h = (1 h, . . . , n h) de modo que la prueba de esta proposici on

tambien es una consecuencia inmediata de la proposici on 3.5 y de la regla de la cadena para funciones
de R en R, por lo que se deja al lector. La prueba tambien se puede hacer sin recurrir a las funciones
coordenadas y a la proposici on 3.5, imitando la prueba para funciones de R en R, lo que se pide hacer
en el problema 6 de este captulo. En cuanto a la formula para calcular ( h) (x0 ) es importante
mencionar que, aun y cuando para escribir la multiplicaci on de un escalar por un vector siempre
hemos puesto primero al escalar, en esta ocasi on lo hemos escrito despues del vector con la idea de
conservar la forma en que se suele expresar la regla de la cadena.
Como en el caso de las funciones de R en R, la derivabilidad de una funcion de R en Rn en un
punto t0 implica la continuidad de esta en dicho punto. Como es de esperarse, esto tambien es una
consecuencia inmediata de la proposici on 3.5 y del correspondiente resultado para el caso real, lo
que dejamos expresado en la siguiente
on 3.8 Sean : I R Rn y t0 I. Si es derivable en t0 entonces es continua

Proposici
en t0 .
Aun y cuando ya mencionamos que la prueba de esta proposici on es una consecuencia inmediata
de la proposici
on 3.5 y del correspondiente resultado para el caso real, esta tambien se puede hacer
imitando la prueba que se hace en este caso observando que
(t) (t0 )
(t) (t0 ) = (t t0 )
t t0
para todo t 6= t0 , de modo que
(t) (t0 )
lim ((t) (t0 )) = lim (t t0 )
tt0 tt0 t t0
= (0) (t0 )
= 0
y de donde concluimos que es continua en t0 .

Sin duda, el resultado mas importante relacionado con el concepto de derivada de funciones de
R en R, es el Teorema del Valor Medio. Lamentablemente este teorema no se puede generalizar a
funciones de R en Rn y los siguientes ejemplos ilustran tan desafortunado hecho.
117 J. P
aez
Ejemplo 3.9 Considere las siguientes funciones:

1. : [1, 1] R R2 dada por
(t2 , t2 )

si 1 t 0
(t) =
(t2 , t2 ) si 0 t 1

N
otese que

2t(1, 1) si 1 t < 0

(t) = (0, 0) si t = 0

2t(1, 1) si < t 1

de modo que no existe (1, 1) para el cual se satisfaga que

(1) (1) = (1 (1)) ()
= 2 ()
ultiplo escalar de (t)
puesto que el vector (1) (1) = (1, 1) (1, 1) = (2, 0) no es un m
un valor de t (1, 1) (figura 3.5 (a)).
para ning
2. : [0, 1] R R3 dada por (t) = (cos(2t), sen(2t), t). Entonces
(t) = (2 sen(2t), 2 cos(2t), 1)
de modo que no existe (0, 1) tal que
()
(1) (0) = (2 0)
= (4 sen(), 4 cos(), 2)
puesto que (1) (0) = (0, 0, 1) y 2 6= 1. De hecho, dado que para ning un valor de t las
funciones sen(2t) y cos(2t) son simult aneamente cero (recuerde que sen2 (2t)+cos2 (2t) =
ultiplo escalar) de (t) para
1 para toda t R), el vector (1) (0) nunca es paralelo (o m
ning
un valor de t (figura 3.5 (b)).
No obstante los ejemplos anteriores, se puede formular una cierta version parecida al Teo-
rema de Valor Medio (s olo para funciones de R en R2 ) que se puede probar justamente como una
consecuencia del Teorema del Valor Medio Generalizado de Cauchy para funciones de R en R, y
que se deja como problema al lector (problema 10).
Concluiremos esta seccion, introduciendo el concepto de derivada de orden superior para una
n
funcion de R en R . De forma an aloga a lo que sucede en el caso de funciones de R en R, si
una funcion : I R Rn es derivable para cada t del intervalo J I, entonces la funci on
n
: J R R que a cada t J asocia la derivada de en t, es decir t 7 (t), es nuevamente
una funcion de J R en Rn . Si esta funcion tambien resulta ser derivable en cada punto de
J, se define entonces la segunda derivada de , que denotamos por o (2) , como la funcion
n
: J R R dada por
(t) := ( ) (t)
(t + h) (t)
:= lim
h0 h
para cada t J.
Siguiendo este procedimiento, en general podemos dar de manera inductiva la siguiente
J. P
aez 118
3.3. Derivada y geometra Captulo 3. La derivada de funciones de R en Rn
Y Z
(1) (1)
b b
1
(1) (0)
Y
1 1 X X
(a) (b)
Figura 3.5: El teorema del Valor Medio no se puede generalizar a funciones de R en Rn . Como lo
muestran estos ejemplos, los vectores (1) (1) y (1) (0) no son paralelos a la derivada de
y , respectivamente, evaluada en alg
un punto intermedio.
on 3.10 Sean : I R Rn derivable para cada t del intervalo J I, y n N. Si

Definici
(t) := (t) y (n) est
(1) a definida y es derivable para cada t J, definimos (inductivamente) la
n + 1 derivada de en t, que denotamos por (n+1) (t), como
(n+1) (t) := ( (n) ) (t)

(n) (t + h) (n) (t)
:= lim
h0 h
para cada t J.
En las siguientes secciones daremos las posibles interpretaciones que se le pueden dar a las
derivadas de orden superior, dependiendo del contexto en el que se este trabajando.
3.3 Derivada y geometra

Una vez que ya contamos con el concepto de derivada para funciones de R en Rn , tenemos todo lo
necesario para definir el concepto de curva, el cual constituye uno de los usos mas importantes de
este tipo de funciones.
Definicion 3.11 Sea C Rn . Decimos que C es una curva si existe : I R Rn derivable en

el intervalo I tal que (I) = C. Si ademas (t) 6= 0 para toda t I decimos que C es una curva
suave (o regular). Como ya se mencion o en la definici on 3.1, en todos estos casos se dice que es
una parametrizaci on de C.
Si es una funci
on derivable que parametriza a un conjunto C, adem as de proporcionarnos una
forma de encontrar una ecuaci on (parametrica) de su recta tangente en (t) (si (t) 6=
0), la
derivada de nos puede ser u til para resolver el siguiente problema geometrico: apoyados en la
idea intuitiva que tengamos de lo que es (o debiera de ser!) la longitud de C, como calcular
esta longitud? Para abordar este problema, vamos a suponer que la curva se puede parametrizar
por una funci on : [a, b] R Rn , la cual es derivable en el intervalo [a, b] y que adem as es
inyectiva.
119 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.3. Derivada y geometra
Es intuitivamente claro que si elegimos un n umero finito de puntos en C, digamos x 0 , . . . ,

x
k , de tal forma que x 0 y que x
k sean sus extremos y que xi1 y x
i sean consecutivos para
i {1, . . . , k}, entonces la suma
X k
k
xi x
i1 k
i=1
es una aproximacion a la longitud de C, y que esta aproximacion ser
a mejor en la medida de que
tomemos mas (y muy bien distrubuidos) puntos en C (ver figura 3.6).
b
x
i1 x
k b
b
b
C xi
b
b
b b
x
0
Figura 3.6: La suma de las distancias entre los puntos consecutivos xi1 y x xi x
i (k i1 k) es una muy
buena aproximacion a la longitud de C, y esta aproximacion sera mejor en la medida de que tomemos
mas (y muy bien distribuidos) puntos en C.
De la suposici on de que parametriza a la curva C y que es inyectiva, al conjuntos de puntos

{x0 , . . . , xk } le corresponde una partici
on P ={t0 , . . . , tk } del intervalo [a, b] tal que x
i = (ti ) para
i {1, . . . , k}. De esta forma, tenemos entonces que
k
X k
X
k
xi x
i1 k = k(ti ) (ti1 )k
i=1 i=1
y la suma de la derecha ser a una buena aproximacion a la longitud de C si P es una partici on

muy fina del intervalo [a, b].
Ahora lo que haremos ser a analizar mas de cerca como se puede expresar cada vector (ti )
(ti1 ). Aun y cuando ya mostramos que el Teorema del Valor Medio no se cumple en general para
funciones de R en Rn , lo que si podemos asegurar es que, si = (1 , . . . , n ), aplicando el Teorema
del Valor Medio (para funciones de R en R) a cada una de estas funciones coordenadas, entonces
(j)
para cada j {1, . . . , n} se sabe que existe i (ti1 , ti ) tal que

(j)
j (ti ) j (ti1 ) = j i (ti ti1 )
de tal forma que
(ti ) (ti1 ) = (1 (ti ) 1 (ti1 ), . . . , n (ti ) n (ti1 ))

(1) (n)
= 1 i (ti ti1 ), . . . , n i (ti ti1 )

(1) (n)
= 1 i , . . . , n i (ti ti1 )
Si ahora suponemos tambien que cada funcion coordenada de j es continua (lo que es equivalente
a que sea continua) en el intervalo cerrado [a, b], entonces el vector

(1) (n)
1 i , . . . , n i
J. P
aez 120
se parecera a la derivada (i ) evaluada en cualquier i (ti1 , ti ) (y este parecido ser a mucho

mejor nuevamente cuando la partici on P sea una partici on muy fina del intervalo [a, b]) de tal
forma que

(1) (n)
k(ti ) (ti1 )k = 1 i , . . . , n i (ti ti1 )

(i )(ti ti1 )

= (i ) (ti ti1 )

En virtud de lo anterior, si la suma

k
X
k
xi x
i1 k
i=1
on P sea una
es una buena aproximacion a la longitud de C en la medida de que la partici
partici
on cada vez mas fina del intervalo [a, b], entonces con la suma
k
X
(i ) (ti ti1 )
i=1
sucedera lo mismo, y lo relevante de la conclusion anterior es que esta u

ltima suma tiene la pecu-
lariedad de ser una suma de Riemann correspondiente a la funcion f (t) = k (t)k (para t [a, b])
por lo que dicha suma se aproxima a la integral
Zb

(t) dt (3.4)
a
y esta aproximacion ser a mejor justo cuando P sea una particion muy fina del intervalo [a, b]!
Resumiendo la discusion anterior (y todas las aproximaciones que ah aparecen!), todo parece
indicar que, si C Rn es una curva que se puede parametrizar por una funcion : [a, b] R Rn ,
la cual es derivable en el intervalo [a, b], inyectiva y adem as : [a, b] R Rn es continua,
entonces su longitud deber a estar dada por la integral 3.4.
Con el fin de reforzar esta conclusion, mostraremos en el siguiente ejemplo que esto sucede
as, calculando la integral anterior con una curva (y una parametrizacion de ella) para lo cual ya
conocemos su longitud.
Ejemplo 3.12 Sea C R2 la circunferencia de radio r > 0 con centro en un punto x 0 = (x0 , y0 ).
Mostraremos que, si tomamos la parametrizaci on de C dada por la funcion (t) = (r cos(t) +
x0 , r sen(t) + y0 ), con t [0, 2], y calculamos la integral dada en 3.4, dicha integral vale 2r que,
como sabemos desde hace mucho tiempo, es el permetro de la cincunferencia C.
En efecto, n otese que (t) = (r sen(t), r cos(t)) de modo que

(t) = r
para toda t [0, 2] y por lo tanto tenemos que

Zb Z2

(t) dt = rdt
a 0
= 2r
121 J. P
aez
Como mencionamos al inicio de toda esta discusion, la realidad es que a estas alturas no
contamos (salvo por algunos casos especficos) con una definicion de longitud de una curva,
y justo lo que estamos a punto de hacer es llenar ese vaco. En realidad definiremos (aprovechando
que la integral 3.4 solo depende de la funcion ) lo que llamaremos la longitud asociada a esta
parametrizacion y u nicamente cuando cumpla con ciertas condiciones (como por ejemplo, que
sea inyectiva, salvo tal vez por un n
umero finito de puntos de su dominio) dicha longitud asociada
la podremos interpretar como la longitud de la curva que est a parametriza por . Todo ello lo
recogemos en la siguiente
Definicion 3.13 Sea : [a, b] R Rn tal que k (t)k es integrable en [a, b]. Definimos la
longitud de (que denotamos por l()) como
Zb

l() := (t) dt
a
Si es una funci
on inyectiva en [a, b], salvo quizas por un n
umero finito de puntos, y C = ([a, b])
entonces el n
umero l() dado en la definicion anterior se puede interpretar como la longitud de
C. De hecho, con base en esta idea de longitud, podemos definir una funcion : [a, b] R R
como
Zt
(t) = (u) du

cuyo valor en t [a, b] tambien se puede interpretar como la longitud del subarco de C dado por
([a, t]). Si ademas de cierta inyectividad de tenemos que k (t)k es una funcion continua de t
(lo que se satisface si es continua en [a, b]), por el Teorema Fundamental del C alculo sabemos
que ser a una funci
on derivable y que
(t) = (t) 0

lo que significa que siempre resulta ser una funcion no decreciente entre el intervalo [a, b] y el
intervalo [0, l()].
Lo interesante de esta funci
on es que, si adem as (t) 6= 0 para toda t [a, b] (es decir que
C = ([a, b]) es una curva suave (o regular)) entonces
(t) = (t) > 0

de modo que en este caso es una funcion estrictamente creciente entre los intervalos [a, b] y
[0, l()], y por tanto su funcion inversa 1 : [0, l()] R [a, b] R existe, la cual, dado que

es continua y (t) 6= 0 para toda t [a, b], por el Teorema de la Funci on Inversa (para funciones
de R en R), tambien es derivable.
Lo importante de la discusion anterior es que, si C = ([a, b]) es una curva suave (o regular),
entonces a traves de la funci on 1 podemos obtener otra parametrizacion de C, dada por =
1 : [0, l()] R Rn , la cual resulta tener propiedades muy relevantes. A este tipo
de parametrizacion de C se le conoce con el nombre de parametrizaci on por longitud de arco
(para el caso de la parametrizacion este nombre es muy adecuado puesto que su par ametro
s = (t) [0, l()] es justo la longitud del subarco ([a, t])) de C), y la u
ltima parte de esta secci
on
la dedicaremos a mostrar algunas de sus caractersticas.
Antes de hacer esto, es importante llamar la atenci on a la forma en que construimos a la
parametrizacion a partir de la parametrizacion original , que es un caso particular de una
J. P
aez 122
relaci
on mas general que puede haber entre dos parametrizaciones de una misma curva C, relaci on
que da lugar al concepto de reparametrizaci on, el cual definiremos antes de estudiar las propiedades
especficas de la parametrizacion (o reparametrizacion) por longitud de arco.
Definicion 3.14 Sean C Rn una curva y : I R Rn una parametrizaci on (derivable) de

n
C. Decimos que : J R R , una funci on derivable, es una reparametrizacion de si existen
J R y : J R R derivable, tales que (J) = I y (s) = ( )(s) para toda s J. Si
(s) 0 para toda s J decimos que preserva la orientaci on de , y si (s) 0 para toda
s J decimos que invierte la orientaci
on de .
Dada una parametrizacion : [a, b] R Rn de una curva C Rn , una reparametrizaci on

de que siempre se puede construir, es la que se obtiene a partir de la funcion : [a, b] [a, b]
dada por (t) = a + b t. Como (a) = b y (b) = a, la funcion tiene la propiedad de que
( )(a) = (b) y ( )(b) = (a), es decir, parametriza al conjunto C con la particularidad
de que su punto inicial ( )(a) es el punto final (b) de , y su punto final ( )(b) es el punto
inicial (a) de (ver figura 3.7), raz
on por la cual a esta reparametrizacion se le suele denotar por
. Por todo lo anterior, y dado que
() (t) = ( ) (t)
= ((t)) (t)
= (a + b t)
se tiene que recorre a C en la direcci
on contraria en que la recorre .
C C
(b) ()(a)
b b
b b
(a) ()(b)
Figura 3.7: Las parametrizaciones y de la misma curva C.
Como se mostro en los parrafos previos a la definicion 3.14, y a diferencia de la reparametrizaci

on
, la reparametrizacion por longitud de arco s olo se puede obtener si C Rn es una curva
suave y : [a, b] R Rn es una parametrizacion de C tal que (t) es continua y diferente de 0
para toda t [a, b].
Sin duda una propiedad muy caracterstica de la reparametrizacion por longitud de arco de
una curva suave C, es la referente a la rapidez con la que la recorre. En efecto, como se puede
observar en la reparametrizacion que se obtiene a partir de una parametrizacion definida sobre
un intervalo [a, b], queda definida sobre el intervalo [0, l()] de tal manera que su par ametro
s vara dentro de un intervalo que tiene la misma longitud que la curva C. De esta forma,
pareciera que para recorrer a esta curva, a la parametrizacion le bastara con recorrer una
unidad de distancia sobre C por cada unidad de distancia que recorra el par ametro s, lo
que en terminos de rapidez, significa que esta u ltima tendra que valer 1. Esta propiedad, que
mas adelante mostraremos con todo rigor que efectivamente la tiene la reparametrizacion , la
tomaremos justo como base para definir lo que significa en general que una curva C Rn este
parametrizada por longitud de arco.
123 J. P
aez
on 3.15 Sea C Rn una curva y : I R Rn una parametrizaci

Definici on (derivable) de C.
on por longitud de arco de C si k (t)k = 1 para toda t I.
Decimos que es una parametrizaci
De la definicion anterior se desprende inmediatamente que si C Rn es una curva que posee

una parametrizacion por longitud de arco, entonces C es una curva suave (o regular). Lo que
a continuaci
on haremos ser a mostrar que toda curva suave (o regular) C Rn que tenga una
parametrizacion : I R Rn que adem as de ser derivable, su derivada tambien sea continua,
entonces tiene una parametrizacion por longitud de arco. La forma en que construiremos esta
parametrizacion es basicamente la misma que usamos para contruir la reparametrizacion en los
p
arrafos anteriores.
Proposici on 3.16 Sea C Rn una curva suave. Si : I R Rn es una parametrizaci on de

C tal que (t) es continua y diferente de 0 para toda t I entonces C tiene una parametrizaci
on
por longitud de arco.
on. Sea t0 I un punto fijo; definimos : I R R como

Demostraci
Zt

(t) = (u) du (3.5)
t0
Por el Teorema Fundamental del C

alculo sabemos que es derivable y que adem
as
(t) = (t)

para toda t I. De esta forma, dado que (t) = k (t)k > 0 (adem as de ser continua), por el
Teorema de la Funci on Inversa (para funciones de R en R), sabemos que es invertible y que su
inversa 1 , que est
a definida sobre el intervalo (I), tambien es derivable.
Definimos : (I) R Rn como (s) = ( 1 )(s) para cada s (I). Claramente es
una parametrizacion de C (puesto que es una reparametrizacion de ), y por la regla de la cadena
probada en la proposici on 3.7, tenemos que
(s) = ( 1 ) (s)
= (1 (s))(1 ) (s)
de modo que
(s) = (1 (s))(1 ) (s)

1
= (1 (s)) 1
( (s))
1
= (1 (s)) 1
k ( (s))k

(s) = 1
para cada s (I).
Con relacion a la construccion de la parametrizacion por longitud de arco que se da en la

prueba de la proposici
on anterior, es importante hacer dos observaciones. La primera de ellas tiene
J. P
aez 124
que ver con el hecho de que no toda parametrizacion por longitud de arco de una curva C, se puede
obtener siguiendo la misma construccion. Aunque sutil, esto es un hecho que hay que mencionar y
que se deja al lector probarlo por medio de un ejemplo (ver problema 16).
La segunda observaci on tiene que ver justo con la construccion de la parametrizacion que se
hace en la prueba de la proposici on. Desde un punto de vista teorico, la construccion que ah se
da es impecable; sin embargo (y para ser sinceros), desde un punto de vista pr actico, obtener una
expresi
on explcita para puede resultar ser una tarea muy difcil (y en algunos casos imposible!).
Esta dificultad (o imposibilidad) esta relacionada con el hecho de que en la construccion de esta
involucrada la obtenci on de la inversa de la funcion dada por 3.5, lo que no siempre se puede
hacer de manera explcita. Para no contribuir con una posible causa de depresion de los amables
lectores de este texto, daremos un ejemplo en el que s es posible calcular .
on : R R3 dada por
Ejemplo 3.17 Sea C R3 la curva parametrizada por la funci
(t) = (cos(t), sen(t), t)
(ver figura 3.8).
Figura 3.8: La curva (helice) del ejemplo 3.17.
on por longitud de arco de C. Definimos : R R

Calcularemos, con base en , una parametrizaci
como
Zt

(t) = (u) du
0
Zt
= 2du
0

= 2t
Entonces, despejando la variable t de la ecuaci

on
s = (t)

= 2t
125 J. P
aez
obtenemos que
s
t=
2
= 1 (s)
de tal forma que
(s) = ( 1 )(s)
= (1 (s))

= (s/ 2)

= (cos(s/ 2), sen(s/ 2), s/ 2)
para s R.
Una vez que ya hemos definido lo que es una parametrizacion por longitud de arco (y mostrado
como y cu ando podemos obtener una de estas), lo que haremos a continuaci on ser
a mostrar la
forma en que se puede usar para definir algunas caractersticas geometricas de las curvas.
Dado que la caracterstica principal de una parametrizacion por longitud de arco de una curva
C Rn , es que su rapidez es constante 1 (es decir, k (s)k = 1), si podemos calcular la derivada
de (es decir ), la informacion que esta nos proporciona solo est
a relacionada con el cambio
de direccion de o con la forma en que se dobla la curva C. De manera mas precisa, y dado
que por el problema 8 ya sabemos que (s) siempre es perpendicular a (s), la manera en que
(valga la redundancia) se curva la curva C, deber a estar contenida en la norma de (s). Que
este numero tiene esta informaci on lo podemos comprobar calcul andolo para una circunferencia de
radio r, en cuyo caso, adem as de depender de r, debera ser el mismo en cualquier punto de esta.
Ejemplo 3.18 Sea C R2 la circunferencia de radio r > 0 con centro en el origen y : R R2

una parametrizaci
on por longitud de arco de C dada por
s s
(s) = r cos , r sen
r r
Entonces tenemos que s s
(s) = sen , cos
r r
y
1 s 1 s
(s) = cos , sen
r r r r
de modo que
1
(s) =
r
para toda s R.
Ademas de confirmar nuestras sospechas, el ejemplo anterior ilustra un hecho geometrico muy
intuitivo: si el radio r de una circunferencia es muy grande, esta est
a menos curvada, y si el radio
es muy peque no entonces la circunferencia est
a muy curvada. Ambos hechos se ven reflejados en el
numero k (s)k puesto que en el primer caso este es mas cercano a 0, mientras que en el segundo
caso es muy grande. Con base en estos razonamientos y el ejemplo anterior, damos la siguiente
J. P
aez 126
on 3.19 Sea : I R Rn una parametrizaci

Definici on por longitud de arco de una curva
C R tal que (s) existe para cada s I. Definimos la curvatura de C en el punto (s) C,
n
que denotamos por k(s), como

k(s) := (s)

Como ya habamos mencionado, si es una parametrizacion por longitud de arco de una curva
C Rn , los vectores (s) y (s) son perpendiculares, y dado que (s) es tangente a C (adem
as
de tener norma 1), entonces se dice que (s) apunta en la direcci on normal a la curva C (que es
la direcci
on en la que esta se curva). Con base en estas observaciones, establecemos las siguientes
definiciones y notaciones.

Definici on por longitud de arco de una curva
n
C R tal que (s) existe para toda s I.
1. Definimos el vector tangente unitario a C en (s) (determinado por ), el cual denotamos

por T (s), como
T (s) := (s)
2. Si (s) 6=
0, definimos el vector normal unitario a C en (s), el cual denotamos por N (s),
como
(s)
N (s) :=
k (s)k
definimos el plano osculador a C en (s), el cual denotamos por s , como el

3. Si (s) 6= 0,
plano generado por lo vectores T (s) y N (s) que contiene al punto (s). Es decir
s := {T (s) + N (s) + (s) | , R}
4. Si (s) 6=
0, definimos la circunferencia osculadora a C en (s), la cual denotamos por Cs ,
a la circunferencia contenida en el plano osculador con centro en el punto
1
(s) + N (s)
k(s)
llamado centro de curvatura, y radio

1
k(s)
en donde a este n
umero lo llamaremos el radio de curvatura de la curva C en (s).
5. Si C R3 y (s) 6=
0, definimos el vector binormal unitario a C en (s), el cual denotamos
por B(s), como
B(s) := T (s) N (s)
No podemos dejar de mencionar que en las dos definiciones anteriores hara falta mostrar que
los conceptos ah plasmados (salvo por los vectores tangente y binormal unitarios), todos ellos son
independientes de la parametrizacion por longitud de arco que se este usando. Aunque probar esto
no es muy difcil, si resultara bastante laborioso y por lo mismo escapa a los objetivos de este
texto.
Para ilustrar todos los objetos asociados a una curva suave dados en la definicion anterior,
damos el siguiente
127 J. P
aez
Ejemplo 3.21 Sea C R3 la helice del ejemplo 3.17 y su parametrizaci

on por longitud de arco

(s) = (cos(s/ 2), sen(s/ 2), s/ 2)
que ah calculamos. Tenemos entonces que:
1. el vector tangente unitario T (s) est

a dado por
T (s) = (s)

1 1 1
= sen(s/ 2), cos(s/ 2),
2 2 2
2. la curvatura k(s) est

a dada por
k(s) = (s)

1 1
= cos(s/ 2), sen(s/ 2), 0

2 2
1
=
2
3. el vector normal unitario N (s) est

a dado por
(s)
N (s) =
k (s)k

= cos(s/ 2), sen(s/ 2), 0
4. el plano osculador s , expresado en forma parametrica, est

a dado
s = {T (s) + N (s) + (s) | , R} (3.6)

n
= 1/ 2 sen(s/ 2) + 2(1 ) cos(s/ 2), cos(s/ 2) + 2(1 ) sen(s/ 2), + s
| , R}
Como s esta generado por los vectores T (s) y N (s), aprovechando que estamos en R3 pode-
mos recurrir al vector binormal para obtener un vector normal a s y con este calcular su
ecuaci
on cartesiana. De esta forma, dado que
B(s) = T (s) N (s)

1
= sen(s/ 2), cos(s/ 2), 1
2
y que s contiene al punto (s), su ecuaci
on cartesiana estara dada por

sen(s/ 2), cos(s/ 2), 1 ((x, y, z) (cos(s/ 2), sen(s/ 2), s/ 2)) = 0
la cual queda expresada como

s
sen(s/ 2)x cos(s/ 2)y + z =
2
y que, como es de esperarse, es satisfecha por las ternas dadas en 3.6.
J. P
aez 128
5. finalmente, el centro de la circunferencia osculadora Cs est

a dado por
1 1
(s) + N (s) = (cos(s/ 2), sen(s/ 2), s/ 2) + cos(s/ 2), sen(s/ 2), 0
k(s) 1/ 2

= (1 2) cos(s/ 2), (1 2) sen(s/ 2), s/ 2
de modo que, como dicha circunferencia

esta contenida en el plano generado por los vectores
T (s) y N (s), y su radio es 1/k(s) = 2, una expresi
on parametrica para Cs estara dada por

(s) + 2N (s) + 2 cos()T (s) + 2 sen()N (s)
con [0, 2].
T (s)
b
N (s)
B(s)
Figura 3.9: La curva helice y algunos de sus objetos calculados en el ejemplo 3.21, incluyendo su
evoluta.
En la figura 3.9 se muestran todos los objetos que calculamos en el ejemplo anterior, in-
cluyendo la curva determinada por los centros de curvatura de C, la cual recibe el nombre de
evoluta de la curva C y que en este caso es nuevamente una helice.
Una primera consecuencia interesante (e inmediata) de las definiciones 3.19 y 3.20, es la relaci
on
existente entre los vectores T (s) y N (s), la cual dejamos plasmada en la siguiente proposici on y
cuya prueba dejamos al lector.

Proposici on por longitud de arco de una curva
suave C Rn . Si (s) existe y es diferente de 0 entonces
T (s) = k(s)N (s)
De forma analoga a la proposicion anterior, cuando nuestra curva C est a contenida en R3 se

tiene que el vector B (s) es un multiplo escalar del vector N (s), afirmacion que probamos en la
siguiente proposici
on y con base en la cual introducimos el concepto de torsion para curvas suaves
contenidas en R3 .
129 J. P
aez
on 3.23 Sea : I R R3 una parametrizaci

suave C R3 . Si para s I se tiene que B (s) existe entonces B (s) es un m
ultiplo escalar de
N (s).
Demostraci
on. Dado que
kB(s)k = kT (s) N (s)k
= kT (s)k kN (s)k sen(/2)
=1
por el problema 8 de este captulo sabemos que B (s) es perpendicular a B(s), es decir B(s)B (s) =
0.
Por otra parte, de la definicion de B(s), el inciso 4 de la proposici on 3.6 y la identidad de la
proposicion 3.22, tenemos que
B (s) = T (s) N (s) + T (s) N (s)
= k(s)(N (s) N (s)) + T (s) N (s)
= T (s) N (s)
de modo que B (s) tambien es perpendicular a T (s), es decir T (s) B (s) = 0.
Por tanto, dado que la terna {T (s), N (s), B(s)} es una base (ortonormal) de R3 , entonces existen
, , R tales que
B (s) = T (s) + N (s) + B(s)
de donde obtenemos que
0 = T (s) B (s)
= T (s) (T (s) + N (s) + B(s))
=
y
0 = B(s) B (s)
= B(s) (T (s) + N (s) + B(s))
=
y por lo tanto que
B (s) = N (s)
que es lo deseabamos demostrar.
Como habamos mencionado, con base en la afirmacion de la proposici on anterior, definimos el

concepto de torsi 3
on para curvas suaves contenidas en R , y que desde un punto de vista geometrico,
se interpreta como una medida de que tanto se tuerce una curva (y consecuentemente que tanto
tiende a salirse de un plano, a diferencia de lo que sucede con la curvatura, que puede curvarse
sin salirse de este).
Definicion 3.24 Sea : I R R3 una parametrizaci on por longitud de arco de una curva suave
3
C R . Si para s I se tiene que B (s) existe, definimos la torsi on de la curva C en el punto
(s), que denotamos por (s), como el numero real tal que
B (s) = (s)N (s)
J. P
aez 130
El uso del signo negativo en la definicion anterior no tiene ning

un significado especfico y obedece
s
olo a razones de caracter hist orico (al parecer, as se uso desde que se introdujo!). Para ilustrar
este concepto, calcularemos la torsi on de la helice del ejemplo 3.21 aprovechando los calculos que
ah mismo hicimos.
Ejemplo 3.25 Sea C R3 la helice del ejemplo 3.21 y su parametrizaci

on por longitud de arco

(s) = (cos(s/ 2), sen(s/ 2), s/ 2)
De ese mismo ejemplo sabemos que

N (s) = cos(s/ 2), sen(s/ 2), 0
y
1
B(s) = sen(s/ 2), cos(s/ 2), 1
2
de modo que
1
B (s) = cos(s/ 2), sen(s/ 2), 0
2
y por tanto tenemos que
1
(s) =
2
para toda s R.
Para concluir esta secci on y completar las expresiones dadas en las proposici on 3.22 y la
definicion 3.24, daremos una expresi on del vector N (s) para el caso de curvas suaves en R3 . Como
hemos venido mencionando, los vectores {T (s), N (s), B(s)} forman una base (ortonormal) de R3
y por esta simple raz on el vector N (s) siempre se puede expresar como una combinaci on lineal
de estos. Lo mas interesante es que en realidad el vector N (s) s olo se escribe como combinaci on
lineal de los vectores T (s) y B(s), y que los coeficientes de esta combinaci on lineal est
an dados por
k(s) y (s), respectivamente. Este hecho es lo que probaremos en la siguiente
on 3.26 Sea : I R R3 una parametrizaci

suave C R3 . Si para s I se tiene que N (s) existe entonces
N (s) = k(s)T (s) + (s)B(s)
Demostraci on. De la definicion del vector B(s), y de acuerdo con la regla de la mano derecha
del producto vectorial, sabemos que
N (s) = B(s) T (s)
y por la regla de derivaci

on del producto vectorial (inciso (4) de la proposici
on 3.6), tenemos que
N (s) = B (s) T (s) + B(s) T (s)
de modo que, sustituyendo las identidades de la proposici

on 3.22 y la definicion 3.24, obtenemos
que
N (s) = B (s) T (s) + B(s) T (s)

= ( (s)N (s)) T (s) + B(s) (k(s)N (s))
131 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.4. Derivada y movimiento
= k(s)(N (s) B(s)) + (s)(T (s) N (s))

= k(s)T (s) + (s)B(s)
Las identidades
T (s) = k(s)N (s)

N (s) = k(s)T (s) + (s)B(s)

B (s) = (s)N (s)
ormulas de Frenet-Serret 4 y tienen importantes aplicaciones en la cinem
son conocidas como las F atica.
3.4 Derivada y movimiento

Para concluir este captulo, mostraremos algunas conclusiones importantes que se pueden obtener
cuando a una funci on : I R Rn se le interpreta como una forma de describir el movimiento
de un objeto. Como ya habamos mencionado anteriormente, bajo esta interpretacion se tiene
entonces que (t) y (t) representan la velocidad y la aceleraci
on de dicho objeto, y r(t) = k (t)k
su rapidez, todas ellas al tiempo t.
Un primer resultado importante que abordaremos es aquel que nos dice cu ales son las com-
ponentes de la aceleraci on en dos direcciones basicas del movimiento descrito por : la direcci on
tangente y la direcci on normal a este movimiento. Como vimos en las secciones anteriores,
on tangente nos la proporciona el vector (t) de tal forma que, si hacemos (bajo el
la direcci
supuesto de que (t) 6= 0 para toda t I)
(t)
T (t) = (3.7)
k (t)k
(t)
=
r(t)
entonces T (t) es un vector en la direcci on tangente cuya norma es constante uno, y por el
problema 8 tendremos que T (t) es perpendicular a T (t) de modo que T (t) nos proporcionara la
direcci
on normal al movimiento.
De esta forma, si T (t) 6=
0, hacemos
T (t)
N (t) =
kT (t)k
y bajo todos los supuestos anteriores, lo que mostraremos en la siguiente proposic on ser a la forma
explcita en que (t) se expresa como combinaci
on (lineal) de los vectores T (t) y N (t).
on 3.27 Sea : I R Rn tal que T (t) existe para toda t I. Si T (t) 6= 0 entonces
Proposici
(t) = r (t)T (t) + r 2 (t)k(t)N (t) (3.8)
en donde k(t) es la curvatura (de la curva descrita por ) en el punto (t).
4
Jean Frederic Frenet (Perigueux, Francia, 7 de febrero de 1816 - Perigueux, Francia, 12 de junio de 1900), fue un
famoso matem atico frances que introdujo la Teora de Curvas junto a Joseph Serret.
Joseph Alfred Serret (Pars, Francia, 30 de agosto de 1819 - Versalles, Francia, 2 de marzo de 1885), m as conocido
como Joseph Serret, fue un matem atico frances famoso por desarrollar junto a Jean Frenet la Teora de Curvas.
(Fuente: Wikipedia)
J. P
aez 132
3.4. Derivada y movimiento Captulo 3. La derivada de funciones de R en Rn
Demostraci
on. Por la identidad 3.7 tenemos que
(t) = r(t)T (t)
de tal forma que, usando la regla de derivacion del inciso 2 de la proposici

on 3.6, se tiene que
(t) = r (t)T (t) + r(t)T (t)

T (t)
= r (t)T (t) + r(t) T (t)

kT (t)k
= r (t)T (t) + r(t) T (t) N (t)

y por el inciso (a) del problema 26, tenemos que
(t) = r (t)T (t) + r 2 (t)k(t)N (t)
La identidad 3.8 amerita algunos comentarios. El primero de ellos es que si la rapidez de un

objeto es constante, entonces la magnitud de la componente tangencial de su aceleraci on es cero,
lo que significa que esta u
ltima actua s
olo en la direcci
on normal al movimiento, hecho que ya
habamos mencionado cuando tratamos con parametrizaciones por longitud de arco y el tema de
la curvatura.
El segundo comentario es acerca de la magnitud de la componente normal de la aceleraci on, la
cual es igual al cuadrado de la rapidez del objeto multiplicado por la curvatura de la curva que este
describe. Como seguramente el lector ya se ha dado cuenta, esto explica por que un automovil se
vuelca cuando se toma una curva muy cerrada (curvatura grande) a una rapidez tambien muy
grande.
Lo siguiente que haremos, ser a mostrar un par de propiedades que deben satisfacer aquellos
objetos (como por ejemplo un planeta o un cometa) que se mueven bajo la influencia de la gravedad
de un objeto de masa muy grande (como por ejemplo una estrella). Para ello, primero recordaremos
la Ley de la Gravitacion Universal formulada por Newton, en la que se establece cual es la fuerza
ejercida entre dos cuerpos de masas m1 y m2 separados por una distancia r.
Ley de la Gravitacion Universal
La magnitud F de la fuerza ejercida entre dos cuerpos de masas m1 y m2 que est

an
separados por una distancia r, es directamente proporcional al producto de sus masas
e inversamente proporcional al cuadrado de la distancia, es decir
m1 m2
F =G
r2
La fuerza F (cuya magnitud es F ) ejercida entre ambos cuerpos act

ua en la direccion
de la lnea que los une. El n
umero G es conocido como la constante de la Gravitacion
Universal.
Otra ley de la fsica de la que tambien echaremos mano, es la Segunda ley del movimiento
(igualmente formulada por Newton) la cual establece que, si un objeto de masa m se mueve debido
a la accion de un campo de fuerzas (en el caso que analizaremos, el campo de fuerzas gravitatorias
133 J. P
aez
determinadas por una estrella (o sol) de masa M ), entonces la fuerza ejercida sobre el objeto
(en la posicion que este tenga en cada instante t de su movimiento) tambien se puede obtener
multiplicando la masa del objeto por su aceleraci on en dicho instante. Es decir, si : I R R3
es la funcion que nos asocia la posici
on del objeto (de su centro de masa, para ser mas exactos) en
cada instante t, y denotamos por F ((t)) la fuerza ejercida sobre este en la posici
on (t), entonces
F ((t)) = ma(t)
= m (t)
Lo que probaremos en la siguiente proposicion ser

a que, si un objeto se mueve bajo la accion
de un campo de fuerzas como el que describimos anterioremente, entonces dicho movimiento nece-
sariamente se tiene que llevar a cabo sobre un plano (fijo). Este hecho es importante para probar
la Primera Ley de Kepler, la cual establece que la orbita (o curva) descrita por el objeto es una
elipse5 .
Proposici on 3.28 Si un objeto de masa m se mueve debido a la acci on de un campo de fuerzas

gravitatorias (determinadas por otro objeto de masa M ) entonces el movimiento del primer objeto
se lleva a cabo sobre un plano fijo.
Demostraci on. Fijemos un sistema cartesiano cuyo origen se encuentre en el centro de masa del
objeto de masa M , y sea : I R R3 la funcion que nos asocia la posici
on del centro de masa
del objeto de masa m en cada instante t. Mostraremos que el producto vectorial
(t) (t)
no depende de t, es decir, que es un vector constante c, de donde el movimiento descrito por se

llevar
a a cabo en el plano que es perpendicular a este vector. Para ello, derivaremos este producto
y mostraremos que dicha derivada es el vector 0 para toda t I.
Antes, primero notemos que, por la Ley de Gravitacion Universal y dado que el origen de nuestro
sistema coordenado est a ubicado en el centro de masa del segundo objeto, la fuerza ejercida por
este en cada posici
on (t) est
a dada por
mM
F ((t)) = G (t)
k(t)k3
Por otra parte, y de acuerdo con la segunda ley del movimiento, tenemos que
F ((t)) = m (t)
de tal forma que de estas dos identidades, concluimos que (t) y (t) son vectores paralelos y por
tanto que
(t) (t) = 0
para toda t I.
Ahora, derivando el producto vectorial ( )(t) = (t) (t), se tiene que
( ) (t) = (t) (t) + (t) (t)

= 0
5
Para los interesados en la prueba de las leyes de Kepler, pueden concultar: Swokowski, Earl W. CALCULO (con
geometra analtica), segunda edici
on, Grupo Editorial Iberoamerica. 1982.
J. P
aez 134
3.4. Derivada y movimiento Captulo 3. La derivada de funciones de R en Rn
lo que significa que

(t) (t) = c (3.9)
para toda t I.
Para concluir esta breve secci on, y como una continuaci

on del analisis del movimiento de nuestro
objeto de masa m (debido a la acci on del campo gravitatorio de un segundo objeto de masa M ),
desarrollaremos todo lo indispensable para probar lo que se conoce como la Segunda Ley de Kepler.
Para ello, y dando por cierto que dicho movimiento se realiza en un plano, vamos a establecer
un sistema cartesiano XY Z de tal forma que la curva descrita por el objeto este contenida en el
plano XY . Daremos tambien como un hecho que la trayectoria seguida es una curva cerrada que
rodea al origen (de hecho, una elipse, como mencionamos p arrafos arriba).
Lo importante de los supuestos anteriores es que, si recurrimos a las coordenadas polares (, )
para describir la posici
on del objeto, y escribimos a su coordenada como una funcion del angulo
(es decir que = f ()), entonces el area A encerrada por la curva descrita y dos semirectas con
angulos 1 y 2 (1 < 2 ) (ver figura 3.10), est
a dada por la expresi
on
Z2
1 1 2
A= f ()d
2 2
1
= f ()
b
A
b
2
Figura 3.10: La region A encerrada por la curva descrita por sus coordenadas polares (, ), en donde
= f (), y las semirectas con
angulos 1 y 2 (1 < 2 ).
Con base en lo anterior, podemos formular la Segunda Ley de Kepler en los siguientes terminos:
si (t) es la funci
on que nos da el
angulo del vector de posici
on al tiempo t, y
Z
1 1 2
A() = f (u)du (3.10)
2 2
0
es la funci
on del angulo que nos da el area barrida a partir de un angulo fijo 0 , entonces la
on de cambio constante, es decir, que (A ) (t) es constante.
funcion (A )(t) = A((t)) tiene raz
Dicho de manera menos tecnica, esto significa que el vector de posici
on de nuestro objeto barre
areas iguales en tiempos iguales.
Proposici on 3.29 Si un objeto de masa m se mueve debido a la acci on de un campo de fuerzas

gravitatorias (determinadas por otro objeto de masa M ) entonces el movimiento del objeto de masa
m satisface la Segunda Ley de Kepler, es decir, el vector de posici
on del objeto barre a
reas iguales
en tiempos iguales.
135 J. P
aez
Demostraci on. Sean : I R R3 la funcion que asigna la posicion del objeto (de masa m) al
tiempo t (y cuyo movimiento se realiza en el plano XY ), (t) la funcion que nos da el angulo del
vector de posicion (t), y f () la funci
on que determina la coordenada del vector de posici
on en
terminos del angulo .
Si ahora definimos
u
() = (cos(), sen(), 0)
tendremos que (t) (en coordenadas cartesianas) estar
a dada por
(t) = f ((t))
u((t))
de modo que
(t) = f ((t))
u ((t)) (t) + f ((t)) (t)
u((t))
Si ahora sustituimos las dos u
ltimas identidades en la expresi
on 3.9, tenemos que
c = (t) (t)
= (f ((t)) u ((t)) (t) + f ((t)) (t)
u((t))) (f ((t)) u((t)))
u ((t)) (t)) + (f ((t))
u((t))) (f ((t))
= (f ((t)) u((t))) (f ((t)) (t)
u((t)))
= f 2 ((t)) (t)( ((t)))
u((t)) u
y por tanto, dado que
((t))) = (cos((t)), sen((t)), 0) ( sen((t)), cos((t)), 0)

((t)) u
u
= (0, 0, 1)
para toda t, deducimos que
ck = f 2 ((t)) (t)( ((t)))

k u((t)) u
= f 2 ((t)) (t) u ((t))

((t)) u
= f 2 ((t)) (t)

kck
(t) =
f 2 ((t))
Por otra parte, por la regla de la cadena (para funciones de R en R) y el Teorema Fundamental del
C
alculo, concluimos que
(A ) (t) = A ((t)) (t)

1 2 kck
= f ((t))
2 f 2 ((t))
k
ck
=
2
es decir, que (A ) (t) es constante.
Si la fuerza F que se ejerce sobre el objeto en la posici

on (t) no es de tipo gravitatorio, sino
que es de la forma F ((t)) = (t)(t) (donde (t) es un escalar que depende de t), las dos u
ltimas
proposiciones se siguen cumpliendo. Se dice que estos campos son de tipo central y dejamos
como un problema al lector realizar las pruebas correspondientes.
J. P
aez 136
3.5. Problemas Captulo 3. La derivada de funciones de R en Rn
3.5 Problemas
1. Sea R R2 la recta cuya ecuaci
on cartesiana es ax + by + c = 0 (con a2 + b2 > 0). Muestre
que:
(a) si x
0 = (x0 , y0 ) y x
1 = (x1 , y1 ) son dos puntos diferentes que pertenecen a R, entonces
on : R R2 dada por
la funci
(t) = x x1 x
0 + t( 0 )
es una parametrizacion de R.
0 R y u
(b) si x = (u1 , u2 ) 6= 0 es un vector que est
a contenido en R (es decir, que
au1 + bu2 = 0), entonces la funcion : R R2 dada por
(t) = x
0 + t
u
2. Sea R R3 la recta determinada por la intersecci

on de los planos ax + by + cz + d = 0 y
x + by + cz + d = 0. Muestre que:
a
(a) si x
0 = (x0 , y0 , z0 ) y x
1 = (x1 , y1 , z1 ) son dos puntos diferentes que pertenecen a R,
entonces la funci on : R R3 dada por
(t) = x x1 x
0 + t( 0 )
(b) si x = (u1 , u2 , u3 ) 6= 0 es un vector que est
0 R y u a contenido en R (es decir, que
au1 + bu2 + cu3 = 0 y a
u1 + bu2 + cu3 = 0), entonces la funcion : R R3 dada por
(t) = x
0 + t
u
3. Si x 1 Rn son dos puntos diferentes o u

0 , x 6= 0 Rn , cuales seran dos definiciones
diferentes (pero equivalentes!) de la recta que pasa por los puntos x 0 y x1 o de la recta
que est a en la direcci
on determinada por u
? (los dos problemas anteriores le pueden dar una
pista).
4. Sobre una circunferencia fija de radio a rueda (sin resbalar y sobre la parte exterior) otra
circunferencia de radio b. Encuentre una funcion de R en R2 que describa el movimiento de
un punto que se encuentre en la circunferencia exterior.
5. Pruebe la proposicion 3.6 usando los resultados que se indican en el texto, y despues sin usar
la proposici
on 3.5.
on 3.7 sin usar funciones coordenadas y la proposici
on 3.5.
7. Muestre que la curva descrita por la funcion (t) = (sen(2t), 2 sen2 (t), 2 cos(t)) (t R)
pertenece a una esfera con centro en el origen. Calcule su rapidez y muestre que la proyecci
on
en el plano XY de su velocidad tiene norma constante.
137 J. P
aez
Captulo 3. La derivada de funciones de R en Rn 3.5. Problemas
8. Sea : I R Rn derivable. Pruebe que: k(t)k es constante si y s

olo si (t) (t) = 0
para toda t I. Interprete geometricamente.
9. Sea : I R Rn derivable y r(t) = k(t)k. Si r(t0 ) 6= 0 y r(t0 ) es un m

aximo o mnimo
local de r, pruebe que (t0 ) (t0 ) = 0. Interprete geometricamente.
10. Sea = (f, g) : [a, b] R R2 continua en el intervalo [a, b] y derivable en el intervalo (a, b)
tal que (t) 6=
0 para toda t (a, b). Pruebe que existen (a, b) y R tales que
(b) (a) = ()
11. Sea : [a, b] R Rn continua en el intervalo [a, b] y derivable en el intervalo (a, b). Pruebe
que existe (a, b) tal que
k(b) (a)k2 = (b a) () ((b) (a))
12. Sea : I R Rn .
(a) si existen x Rn tales que (t) = x

0 , u u para toda t I pruebe que k (t)k es
0 + t
constante.
(b) muestre con un ejemplo que el recproco de la afirmacion del inciso anterior es falsa.
(c) si existen x Rn tales que (t) = x
0 , u u para toda t I, pruebe que (t) = 0 para
0 + t
toda t I.
para toda t I, pruebe que existen x
(d) si (t) = 0 Rn tales que (t) = x
0 , u 0 + t
u para
toda t I.
(e) de un ejemplo en el que la funcion parametrice una recta y para la cual se satisfaga
que (t) 6=
0 para toda t I.
Interprete las afirmaciones de los incisos anteriores partiendo del hecho de que describe
el movimiento de un objeto.
13. Dada : [a, b] R Rn continua, con = (1 , . . . , n ). Defina

Z b Z b Z b
(t)dt = 1 (t)dt, . . . , n (t)dt
a a a
Pruebe que:
Rb Rb
(a) si c = (c1 . . . , cn ) es un vector constante, entonces a c (t)dt = c a (t)dt
R R
b b
(b) a (t)dt a k(t)k dt (sugerencia: use la desigualdad de Cauchy-Schwarz para pro-

bar que
Z b Z b

(u) (t)dt k(u)k
(t)dt

a a
para toda u [a, b]; integre con respecto de u y use la identidad del primer inciso).
Rb
(c) si tiene derivada continua, entonces k(b) (a)k a k (t)k dt = l(). Interprete
geometricamente.
2

14. Considere las funciones (t) = (cos(t), sen(t)), t [0, /2], y (u) = 1u , 2u
1+u2 1+u2
, u [0, 1].
Pruebe que es una reparametrizacion de .
J. P
aez 138
15. Sea : [a, b] R Rn una parametrizacion por longitud de arco de una curva C Rn .
(a) muestre que l() = b a

(b) muestre un ejemplo en el que la longitud de C no conincide con l().
16. De un ejemplo de una curva C Rn y una parametrizacion por longitud de arco de esta, que
no se pueda obtener por el metodo seguido en la prueba de la proposici
on 3.16 (sugerencia:
observe que el dominio (I) de la reparametrizacion que se construye en la prueba de la
on 3.16 siempre es tal que 0 (I)).
proposici
17. Sea : I R Rn una parametrizacion por longitud de arco de una curva C Rn . Pruebe
que si C esta contenida en una recta, entonces k(s) = 0 para toda s I. Esta afirmacion
contradice lo que se pide ejemplificar en el inciso (e) del problema 12? Justifique su respuesta.
18. Pruebe el recproco del problema anterior. Es decir, si C Rn es una curva suave y : I
R Rn es una parametrizacion por longitud de arco de C tal que k(s) = 0 para toda s I
entonces C est a contenida en una recta.
19. Sea : I R Rn una parametrizacion por longitud de arco de una curva C Rn . Si T (s)
es el vector tangente unitario y (s, h) representa el angulo formado por T (s) y T (s + h),
pruebe que
(s, h)
k(s) = lim
h0 h
(sugerencia: use la ley de los cosenos).
20. Sea : I R R3 una parametrizacion por longitud de arco de una curva C R3 . Si B(s)
es el vector binormal unitario y (s, h) representa el angulo formado por B(s) y B(s + h),
pruebe que
(s, h)
(s) = lim

h0 h
21. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 .
Si (s) 6=
0 para toda s I, pruebe que:
[ (s) (s)] (s)

(s) =
k (s)k2
22. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 .
Si (s) = 0 para toda s I entonces C est
a contenida en un plano.
23. Sea : I R R3 una parametrizacion por longitud de arco de la curva suave C R3 .

Pruebe que, si la curvatura k(s) es constante (distinta de cero) y (s) = 0 para toda s I
entonces la curva descrita por es (o est a contenida en) una circunferencia (sugerencia:
pruebe que el centro de curvatura en (s) es el mismo para toda s I usando la expresi on
para N (s) probada en la proposici
on 3.26).
24. Sea : I R R2 una parametrizacion por longitud de arco de la curva suave C R2 .

Pruebe que, si la curvatura k(s) es constante (distinta de cero) en cada punto (s) entonces la
curva descrita por es (o est
a contenida en) una circunferencia (sugerencia: use el problema
anterior).
139 J. P
aez
25. Sea : I R Rn una parametrizacion por longitud de arco de la curva suave C Rn . Dado
t0 R fijo, definimos : J R Rn , con J = {s R |t0 s I}, como (s) = (t0 s).
Pruebe que:
(a) es una parametrizacion por longitud de arco de C.

(b) si T (s), T(s), N (s), N (s), k(s) y k(s) son los vectores tangente unitario, normal unitario
y la curvatura, calculadas con y , respectivamente, entonces
i) T(s) = T (t0 s) (s) = N (t0 s)

ii) N
iii) k(s) = k(t0 s)
para cada s J.

(c) si n = 3 y B(s), B(s), (s) y (s) son los vectores binormal unitario y la torsi
on, calcu-
ladas con y , respectivamente, entonces

i) B(s) = B(t0 s) ii) (s) = (t0 s)
para cada s J.
(d) si n = 3, se satisfacen las formulas de Frenet-Serret calculando sus elementos en terminos
de .
26. Sea : I R R3 una curva suave C R3 . Sea T (t) = (t)/ k (t)k y bajo el supuesto de
que T (t) 6=
0 para toda t I, hacemos N (t) = T (t)/ kT (t)k y B(t) = T (t) N (t). Pruebe
que:

(a) si k(t)
= kT (t)k entonces k(t) = k(t)/ k (t)k (donde k(t) es la curvatura de C en el
punto (t))
(b) B (t) B(t) = 0 = B (t) T (t)
(c) B (t) es un m
ultiplo escalar de N (t)
(d) si denotamos por umero (del inciso anterior) tal que B (t) =
(t) al n (t)N (t), pruebe

que (t) = (t)/ k (t)k (donde (t) es la torsi
on de C en el punto (t))

(e) N (t) = k(t)T (t) + (t)B(t)
27. Sea : I R Rn una curva suave. Pruebe que la curvatura k en cada punto (t) est
a
dada por:
1/2
k (t)k2 k (t)k2 ( (t) (t))2
k (t)k3
28. Sea : I R R3 una curva suave tal que (t) 6= 0 para toda t I. Pruebe que la
curvatura k y la torsi
on en cada punto (t) est
a dada por:
k (t) (t)k [ (t) (t)] (t)

i) k = ii) =
k (t)k3 k (t) (t)k2
29. Sea : I R R3 una curva suave. Pruebe que si la curvatura k es constante (distinta
de cero) y la torsi
on es cero en cada punto (t) entonces la curva descrita por es (o est
a
contenida en) una circunferencia.
J. P
aez 140
30. Sea f : [a, b] R una funci on dos veces derivable. Prueba que la curvatura en el punto
(x, f (x)), de la gr
afica de f , est
a dada por
|f (x)|
k(x) = h i3/2
1 + (f (x))2
31. Sea (t) = (a cos(t), a sen(t), bt), t R
(a) calcula la parametrizacion por longitud de arco de esta curva

(b) calcula los vectores T (s), N (s) y B(s) en cada punto de esta curva
(c) calcula la curvatura, el radio de curvatura y la torsi
on en cada punto de esta curva
32. Un objeto gira (en el sentido de las manecillas del reloj) sobre una circunferencia centrada en
el origen y de radio
R conrapidez constante v. Si el objeto se desprende de la circunferencia
en el punto (R/ 2, R/ 2), en que punto y en cu anto tiempo intersecta al eje Y ? Cu al
debera ser la rapidez del objeto sobre la circunferencia para que alcance el mismo punto en
la mitad del tiempo?
33. Un rat on se mueve con rapidez constante v sobre una circunferencia de radio R y un gato,
tambien con rapidez constante v, persigue al rat on (empezando desde el centro de la cir-
cunferencia) de tal forma que el rat on, el gato y el centro de la circunferencia siempre son
coliniales. Alcanza el gato al rat
on? en que punto? en que tiempo?
34. La posicion (en R3 ) de un objeto de masa m est a dada por la funcion (t). Si la fuerza F
que se ejerce sobre el objeto en la posici
on (t) (la cual produce su movimiento) es tal que

F ((t)) = (t)(t) (donde (t) es un escalar que depende de t), pruebe que:
(a) el objeto se mueve sobre un plano (sugerencia: considere el producto (t) (t) y use
la segunda ley de Newton).
(b) suponiendo que la curva descrita es cerrada, pruebe que el movimiento del objeto satis-
face la Segunda Ley de Kepler (sugerencia: proceda como en la prueba de la proposici
on
3.29).
141 J. P
aez
J. P
aez 142
Captulo 4
La derivada de funciones de Rn en R
El contenido de este captulo ser a sin duda el primero en el que apareceran conceptos realmente
novedosos para el lector. Y aun y cuando los primeros conceptos de derivacion que definiremos
para este tipo de funciones son muy parecidos al concepto de derivada de funciones de R en R,
la definicion general de la derivada de funciones de Rn en R abrira un camino hacia una vision mas
general de este concepto.
Antes de iniciar nuestro recorrido por estos temas, vamos a revisar algunos aspectos relacionados
con los conjuntos en donde se encuentran las variables de las funciones con las que vamos a trabajar,
y la relacion entre las varias representaciones que podemos hacer de estos por medio del conjunto
Rn .
4.1
Un interludio de Algebra Lineal
Como vimos en el captulo 1, los conjuntos a los que pertenecen las variables (independientes o
dependientes) de las funciones que nos ocupan, suelen estar dotados de estructuras algebraicas
que hacen de ellos un tipo de objeto matem atico conocido con el nombre de espacio vectorial (de
dimension finita). Como ya tambien vimos, una de las caractersticas mas importantes de este
tipo de espacio con el que vamos a trabajar, y que por ahora denotaremos en general con la letra
V , es que siempre hay varias maneras de elegir una coleccion finita de elementos de V , digamos
v1 , . . . , vn }, con la propiedad de que para cualquier otro elemento v V existen 1 , . . . , n R,
{
u
nicos, tales que
v = 1 v1 + + n vn
Como mencionamos en su momento (y como seguramente el lector ya lo sabe), este tipo de colec-
ciones reciben el nombre de base de V , y la propiedad que las define es la que permite identificar
al conjunto V con el conjunto Rn . Esta identificaci on de V con Rn tiene la ventaja de que
hace corresponder adecuadamente la estructura algebraica de V con la estructura algebraica que
definimos para Rn , estructura que por cierto, convierte a Rn en un espacio vectorial!
Ademas de lo anterior, en el captulo 1 tambien vimos que algunos tipos especficos de espacios
vectoriales, como es el caso de las flechas (del plano o el espacio) que parten de un punto fijo,
est
an dotados de estructuras geometricas (tales como el concepto de distancia o de angulo) las
cuales pudimos traer a Rn , y consecuentemente a cualquier otro espacio vectorial que se pueda
identificar con este.
Observemos que si { v1 , . . . , vn } es una base del espacio vectorial V , la n-ada con la que se
identifica al vector vi es aquella que tiene casi todas sus coordenadas 0, salvo por la i-esima, que
143
Captulo 4. La derivada de funciones de Rn en R
4.1. Un interludio de Algebra Lineal
deber
a ser 1; a esta n-ada la denotaremos por ei , es decir que
ei := (0, . . . , 0, 1, 0, . . . , 0)
en donde el 1 esta en la coordenada i. Como seguramente el lector ya sabra (y si no lo podr a probar

muy facilmente), la coleccion {e1 , . . . , en } es una base para Rn y se le conoce con el nombre de base
canonica. De acuerdo con los conceptos de magnitud (norma) y de angulo (producto punto) que
definimos en el captulo 1, todos los elementos de esta base tienen magnitud 1 y son mutuamente
perpendiculares, es decir k ei k = 1 para cada i {1, . . . , n} y ei ej = 0 para cada i, j {1, . . . , n},
con i 6= j, o lo que es lo mismo
1 si i = j
ei ej =
0 si i 6= j

para cada i, j {1, . . . , n}. En general, cuando los elementos de una base de un espacio vectorial
cumplen estas dos caractersticas, decimos que esta es ortonormal.
Como ya lo habamos mencionado en el captulo 1, este tipo de bases son las que se utilizan
para construir (en el caso del plano o del espacio) un sistema de referencia cartesiano y es por esta
razon que en estos casos, cuando se pueda dibujar los vectores (o flechas) que representen a una
base de este tipo, habra que hacerlo con estas caractersticas (mutuamente perpendiculares, y de
la misma longitud). No sin cierto abuso de notaci on, usaremos los mismos e1 , . . . , en para nombrar
a los vectores (o flechas) que representen geometricamente a la base can onica de Rn .
Unas vez establecidos los conceptos y notaciones anteriores, la situaci on principal que deseamos
abordar en esta secci on es la siguiente: supongamos que la variable independiente de una cierta
funcion pertenece a un espacio vectorial V , y que las colecciones { v1 , . . . , vn } V y { v1 , . . . , vn }
V , ambas, son bases de V . Si para identificar al espacio V con R lo hacemos atraves de la base n
{
v1 , . . . , vn } (en cuyo caso cada vector vi se correspondera con la n-ada ei ), entonces usando esta
misma manera de identificar a V con Rn , cada vector vi se correspondera con alguna n-ada, que
denotaremos por ei , y se tendra que la coleccion de n-adas { e1 , . . . , en } ser a una base (o sistema
n
coordenado) de R (afirmacion que seguramente el lector ya habra probado en su curso de Algebra
Lineal). Algo que es importante destacar es que, aun y cuando la coleccion {
e1 , . . . , en } ser a una
base de Rn , esta no tiene que ser necesariamente ortonormal, aunque para los fines de este texto,
supondremos que las colecciones { v1 , . . . , vn } V y { v1 , . . . , vn } V se elegir an de tal manera
que la coleccion {
e1 , . . . , en } siempre ser a una base ortonormal (o sistema coordenado cartesiano)
de Rn .
De esta forma, dadas las colecciones { v1 , . . . , vn } V y { v1 , . . . , vn } V , la situaci on que ten-
dremos (como ya lo habamos mencionado desde el captulo 1) es que habra dos formas diferentes
de identificar al espacio vectorial V con el conjunto (o espacio vectorial) Rn , doble identificaci on
que para nosotros se traducira en lo siguiente: as como para cada v V existiran dos formas de
expresar a v como combinaci on lineal de las bases { v1 , . . . , vn } y { v1 , . . . , vn }, para cada x Rn
n
(pensando a R mas como un representante del espacio vectorial V , que como un conjunto de
n-adas), consideraremos dos sistemas coordenados cartesianos en los cuales expresaremos a x . Es
decir, un vector x n
R tendra coordenadas (x1 , . . . , xn ) en el sistema coordenado cartesiano deter-
minado por la base can onica { e1 , . . . , en }, y coordenadas (x1 , . . . , xn ) en el otro sistema coordenado
cartesiano determinado por la base ortonormal { e1 , . . . , en }. La figura 4.1 ilustra esta situaci on
para el caso particular del espacio vectorial V formado por las flechas que parten de un punto fijo
O, raz on por la cual las bases { e1 , e2 } y { e1 , e2 } se fijan en el mismo punto.
En virtud de lo anterior tendremos que una misma funcion f definida para los elementos de un
sunconjunto A del espacio vectorial V (y que en un abuso de lenguaje diremos que f est a definida
J. P
aez 144

4.1. Un interludio de Algebra Lineal Captulo 4. La derivada de funciones de Rn en R
x1 e1 x
2
e
x2
e 1

x1
e2 x2 e2

e 2 e 1
b
O e1
Figura 4.1: El vector x y sus correspondientes coordenadas (x1 , x2 ) y (x1 , x2 ) en las bases ortonormales
{ e1 , e2 }, respectivamente.
e1 , e2 } y {
para los elementos de un sunconjunto A del espacio vectorial Rn ), esta se podr a poner en terminos
de unas ciertas variables (o coordenadas) x1 , . . . , xn , o de otras variables (o coordenadas) x1 , . . . , xn .
Aun y cuando los conceptos de derivabilidad con los que vamos a trabajar en este captulo los
definiremos sin tener que recurrir a las coordenadas determinadas por alguna base, para efectos
de la realizaci on de c alculos especficos si ser a necesario recurrir a alguna de estas, y lo que nos
proponemos en este captulo es dejar clara la relaci on que existe entre los calculos realizados con
unas cooredenadas x1 , . . . , xn o con otras coordenadas x1 , . . . , xn .
Para alcanzar el objetivo anterior, empezaremos por establecer la relaci on que existe entre dos
conjuntos de coordenadas (cartesianas) de un mismo elemento x n
R . Si, como dijimos antes,
(x1 , . . . , xn ) son las coordenadas de x en el sistema coordenado cartesiano determinado por la base
can onica { e1 , . . . , en }, y (x1 , . . . , xn ) son otras coordenadas en un sistema coordenado cartesiano
determinado por una base ortonormal { e1 , . . . , en }, nuestro objetivo es mostrar como se obtienen
unas coordenadas a partir de las otras; es decir, si conocemos las coordenadas (x1 , . . . , xn ), c omo

podemos obtener las coordenadas (x1 , . . . , xn ) y recprocamente, si conocemos las coordenadas
(x1 , . . . , xn ), c
omo podemos obtener las coordenadas (x1 , . . . , xn ).
Como seguramente el lector ya lo sabra, cada uno de estos problemas es un problema de cambio
de coordenadas, y tambien sabra que se resuelve de la siguiente manera. Supongamos primero que
tenemos las coordenadas (x1 , . . . , xn ) de x Rn en la base ortonormal { e1 , . . . , en } y que deseamos
conocer sus coordenadas (x1 , . . . , xn ) en la base can onica. Para ello, bastara con saber cu ales son
las coordenadas de cada vector ei en la base can onica { e1 , . . . , en } (informaci on que es con la que
se cuenta la mayora de las veces). Si suponemos que

(i)
ei = a1 , . . . , a(i) n
(i)
= a1 e1 + + a(i)
n e n
para cada i {1, . . . , n}, entonces
= x1 e1 + + xn en
x

(1)
= x1 a1 e1 + + a(1) n e
n +
..
.

(n)
+ xn a1 e1 + + a(n)
n e n
145 J. P
aez

(1) (n)
= a1 , . . . , a1 (x1 , . . . , xn )
e1 +
..
.

+ a(1)
n , . . . , a (n)
n (x1 , . . . , xn )
en
de donde concluimos que la i-esima coordenada del vector x en la base can

onica estar
a dada por

(1) (n)
xi = ai , . . . , ai (x1 , . . . , xn )
para cada i {1, . . . , n}, o lo que es lo mismo, escrito en forma matricial, que
(1) (1)
a an
1. .. ..
x1

x1 xn = xn .. (4.1)

. .
(n) (n)
a1 an
Como el lector se podr a imaginar, para resolver el problema recproco (obtener las coordenadas
(x1 , . . . , xn )
a partir de las coordenadas (x1 , . . . , xn )), ser
a suficiente con calcular las coordenadas
de cada vector ei en el sistema cartesiano determinado por la base { e1 , . . . , en }. Es decir, si ahora

(i)
ei = b1 , . . . , b(i)
n
(i)
= b1 e1 + + b(i)
n e n
= x1 e1 + + xn en
x

(1)
= x1 b1 e1 + + b(1)
n n +
e

..
.

(n)
+ xn b1 e1 + + b(n)
n e n

(1) (n)
= b1 , . . . , b1 e1 +
(x1 , . . . , xn )
..
.

+ b(1)
n , . . . , b (n)
n en
(x1 , . . . , xn )
de donde concluimos que la i-esima coordenada del vector x e1 , . . . , en } estar

en la base { a dada por

(1) (n)
xi = bi , . . . , bi (x1 , . . . , xn )
para cada i {1, . . . , n}, o lo que es lo mismo, escrito en forma matricial, que
(1) (1)
b bn
1. .. ..
x1 xn

= x1 xn .. (4.2)

. .
(n) (n)
b1 bn
J. P
aez 146

4.1. Un interludio de Algebra Lineal Captulo 4. La derivada de funciones de Rn en R
Si llamamos (1) (1)

a1 an
.. .. ..
M = .

. .
(n) (n)
a1 an
y
(1) (1)
b1 bn
.. .. ..
M = .

. .
(n) (n)
b1 bn
se prueba que:
1. cada matriz M y M es la inversa una de la otra (M = M 1 ),

2. la inversa de cada una de ellas es su propia transpuesta (M 1 = M t ), y
3. ambas matrices tienen determinante 1
Notese que de las propiedades 1 y 2 se deduce que

(i) (j)
bj = a i (4.3)
para todas i, j {1, . . . , n}. Las matrices que tienen las caractersticas anteriores con conocidas
con el nombre de matrices ortonormales (por razones que seguramente quedan claras), y si el lector
aun no conoce la prueba de estas afirmaciones, muy probablemente pronto las ver a en su curso de
Algebra Lineal).
Resumiendo la discusion anterior, y con base en las identidades 4.1, 4.2 y 4.3 concluimos que:
(i) (i)
si cada vector ei tiene coordenadas a1 , . . . , an (i {1, . . . , n}) en el sistema determinado por
la base {
e1 , . . . , en }, y un vector x tiene coordenadas (x1 , . . . , xn ) en el mismo sistema, entonces
las coordenadas (x1 , . . . , xn ) de x
(en el sistema determinado por la base { e1 , . . . , en }) est
an dadas
por la identidad (escrita en forma matricial)
(1) (n)
a1 a1
x1 xn = x1 xn ... .. ..

. . (4.4)
(1) (n)
an an

(i) (i)
Y analogamente, si cada vector ei tiene coordenadas b1 , . . . , b n (i {1, . . . , n}) en el sis-
tema determinado por la base { tiene coordenadas (x1 , . . . , xn ) en el
e1 , . . . , en }, y un vector x
mismo sistema, entonces las coordenadas (x1 , . . . , xn ) de x (en el sistema determinado por la base
{
e1 , . . . , en }) est
an dadas por la identidad (escrita en forma matricial)
(1) (n)
b1 b1
x1 xn = x1 xn ... .. ..

. . (4.5)
(1) (n)
bn bn
Notese que, de acuerdo con las identidades 4.3, tambien se tiene que
(1) (1)
b1 bn
x1 xn = x1 xn ... .. ..

. . (4.6)
(n) (n)
b1 bn
147 J. P
aez
y
(1) (1)
a an
1. .. ..
x1
xn ..

x1 xn = (4.7)

. .
(n) (n)
a1 an
identidades que tambien nos seran muy u tiles.
Por ahora nos ser
a suficiente con conocer las relaciones establecidas en 4.4, 4.5, 4.6 y 4.7, y para
concluir con esta secci
on, s
olo nos resta ilustrar la discusion anterior con un
Ejemplo 4.1 En el plano, una vez establecido un origen O, considere el sistema coordenado carte-
siano determinado por dos vectores { e1 , e2 } (y que por lo mismo tendremos que dibujar mutua-
mente perpendiculares y de la misma longitud), y el sistema cartesiano determinado por los vec-
e , e
tores { }, en donde e
se obtiene de girar (en el sentido contrario a las manecillas del reloj)
radianes al vector e1 , y e
se obtiene de girar (en el sentido contrario a las manecillas del reloj)
/2 radianes al vector e (ver figura 4.2).
) e2
e2 e se
n(
e
co
s(
e
)
cos()
cos()
sen()
e1 b

b
O
e1

sen() )
O s(
se
co
n(
)
Figura 4.2: Las bases ortonormales { e , e

e1 , e2 } y { } del ejemplo 4.1.
De la manera de contruir los vectores e y e , sabemos que estos forman una base ortonor-
mal y que sus coordenadas en el sistema determinado por { e1 , e2 } son (cos(), sen()) para e ,
y ( sen(), cos()) para e
. Es decir, se tiene que
e = cos()
e1 + sen()
e2 (4.8)
e
= sen()
e1 + cos()
e2
De esta forma, si x es un vector del plano que parte del punto O y que tiene coordenadas (x , y ) en
el sistema coordenado determinado por { e , e
}, de acuerdo con la identidad 4.1, las coordenadas
en el sistema coordenado determinado por la base {
(x, y) de x e1 , e2 } estar
an dadas por la identidad
de matrices
cos() sen()
x y = x y
sen() cos()
es decir
x = cos()x sen()y
y = sen()x + cos()y
Recprocamente, si ahora observamos que
e1 = cos() e
e sen()
J. P
aez 148
4.2. La derivada direccional Captulo 4. La derivada de funciones de Rn en R
e2 = sen() e
e + cos()
(identidades que podemos obtener despejando los vectores e1 y e2 de las identidades 4.8) de
acuerdo con la identidad 4.2, si (x, y) son las coordenadas de x en el sistema coordenado determi-
e1 , e2 }, las coordenadas (x , y ) en el sistema coordenado determinado por {
nado por la base { e , e
}
estar
an dadas por la identidad de matrices

cos() sen()
x y = x y
sen() cos()
o lo que es lo mismo, que
x = cos()x + sen()y
y = sen()x + cos()y
N
otese que en este ejemplo se confirma que las matrices

cos() sen() cos() sen()
M= y M =
sen() cos() sen() cos()
tienen las propiedades que habamos mencionado.
4.2 La derivada direccional

Antes de entrar de lleno en la definicion del concepto de derivada direccional, es importante men-
cionar que de aqu en adelante (salvo que se diga lo contrario) supondremos que las funciones con
las que trabajeremos est an definidas sobre un conjunto abierto y conexo U Rn .
n
Sea pues, f : U R R y x 0 U .
Recordemos que el concepto de derivacion de una funcion f de R en R en un punto x0 de su
dominio, consiste b asicamente en los siguientes pasos: calcular el cambio de los valores de f en
x y en x0 , es decir, calcular f (x) f (x0 ), en donde x 6= x0 ; calcular el cambio que hay entre x
y x0 es decir, calcular x x0 ; calcular la raz on (o proporcion) entre estas dos cantidades, es
decir
f (x) f (x0 )
;
x x0
y finalmente determinar si estas razones (o proporciones) tienen un valor lmite cuando la
variable x se aproxima (o tiende) al valor x0 .
Como seguramente el lector ya habra notado, este procedimiento no lo podemos copiar al
caso de las funciones que nos ocupan. En efecto, si f : U Rn R y x U, x
0 , x 6= x
0 , el
cambio de los valores de la funci on en x
y en x x) f (
0 (es decir, f ( x0 )) y el cambio entre xy
x x
0 , es decir, x 0 , son de naturaleza distinta; mientras que la primera de estas cantidades es un
n
umero real (f (x) f ( xx
x0 )), la otra ( 0 ) es un vector, de tal forma que no tenemos una manera
de calcular la razon (o proporci on) entre dichas cantidades.
Sin embargo, no todo est a perdido y la idea original de derivada la podemos adecuar de
alguna manera al tipo de funciones que nos ocupa. Dado que estamos suponiendo que U es un
conjunto abierto, si x 0 U y u es un vector fijo que no sea el vector 0, los vectores de la forma
x
=x u, con h R, tienen la peculariedad de seguir perteneciendo a U si h es suficientemente
0 + h
pequena, aunque cabe aclarar que esta peque nez de h tambien dependera de la magnitud del
149 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.2. La derivada direccional
. Mas especficamente, sabemos que existe r > 0 tal que si k

vector u xx
0 k < r entonces x
U,
de modo que si tomamos x =x 0 + h
u, este punto pertenecara a U si
r > k
xx
0 k
= k ux
x0 + h 0 k
= kh
uk
= |h| k
uk
es decir, si |h| < r/ k

uk.
Por otra parte, si observamos que
k
xx
0 k = |h| k
uk
vemos que la magnitud del cambio entre x y x0 esta determinada tanto por h, como por la
magnitud del vector u .
Por estas razones, si al tomar x
=x 0 +h
u pedimos que el vector u tenga magnitud 1, lograremos
las siguientes ventajas: una, que la pertenencia del vector x
al conjunto U s
olo dependera del numero
h, (bastara con que |h| < r para que x=x 0 + h
u pertenezca a la bola Br ( x0 ), la que a su vez est
a
contenida en U ); y dos, el cambio entre x yx x
0 (es decir el vector x 0 ) estara completamente
determinado por el n umero h (no s olo su magnitud! tambien su direccion!).
Con base en los supuestos anteriores, el cociente
f ( u) f (
x0 + h x0 )
(4.9)
h
ser
a una medida de la raz on (o proporci on) entre el cambio de los valores de la funcion (en los
puntos x0 + huyx 0 ) y el cambio entre dichos valores de la variable, el cual est a determinado por
el n
umero h. Aqu es importante enfatizar que los puntos sobre los cuales estamos evaluando a f
(para compararlos con su valor en x 0 ) est
an restringidos a aquellos que son de la forma x 0 + h
u,
es decir, s
olo estamos evaluando a f sobre los puntos que est an en la recta que pasa por x0 y cuya
direcci
on esta determinada por el vector u (y que adem as se quedan contenidos en U !). Por esta
raz
on, si existe el lmite del cociente 4.9 cuando h tiende a 0, diremos que la funcion f es derivable
en el punto x 0 en la direcci on del vector u , y al valor de este lmite le llamaremos la derivada
direccional de f en x 0 en la direcci
on del vector u. Todo la discusion anterior la dejamos plasmada
en la siguiente
Definicion 4.2 Sean f : U Rn R, x 0 U y u Rn tal que k

uk = 1. Decimos que f es
derivable en el punto x
0 en la direcci
on del vector u
, si
f ( u) f (
x0 + h x0 )
lim
h0 h
existe, en cuyo caso el valor de dicho lmite lo llamaremos la derivada direccional de f en x
0 en la
direcci
on de u
, y la denotaremos por Du f (x0 ), es decir
f ( u) f (
x0 + h x0 )
Du f (
x0 ) := lim
h0 h
Aun y cuando en terminos generales este concepto de derivada es una medida de la raz on de
cambio de la funci
on f sobre los puntos de la recta que pasa por x
0 y cuya direcci
on est
a determi-
, a semejanza de lo que sucede con las funciones de R en R, en algunos casos
nada por el vector u
J. P
aez 150
dicha derivada tambien tiene una interpretacion geometrica importante. Para el caso particular de
R2 , si nos fijamos en la curva que obtenemos al recortar la grafica de f con el plano perpendicular
al plano XY que contenga a la recta que mencionamos anteriormente (ver figura 4.3), la derivada
direccional de f en x 0 en la direcci
on de u la podemos interpretar como la pendiente de la recta
tangente a dicha curva en el punto ( x0 , f (
x0 )).
f (
x0 )
u
x
0
Figura 4.3: Para el caso particular de R2 , si nos fijamos en la curva que obtenemos al recortar la
grafica de f con el plano perpendicular al plano XY que contenga a la recta que pasa por x 0 en la
direccion de u
, la derivada direccional de f en x
0 en la direccion de u la podemos interpretar como la
pendiente de la recta tangente a dicha curva en el punto ( x0 , f (
x0 )).
Sin duda lo siguiente que tendremos que hacer ser a dar un ejemplo que ilustre este concepto, pero
antes de ello convendra hacer algunas observaciones importantes. Como el lector podr a notar, en
la definicion que acabamos de dar no fue necesario recurrir a ning un sistema coordenado especfico.
Por otra parte, como para hacer c alculos especficos si ser
a necesario expresar a f en terminos de
algunas coordenadas, en el siguiente ejemplo no s olo vamos a mostrar como se calcula la derivada
direccional de f en alg un punto x 0 y en alguna u direccion, sino que mostraremos que dichos
calculos son idependientes (cuando menos para este ejemplo especfico) del sistema coordenado que
usemos.
Ejemplo 4.3 Sea f : R2 R tal que, si un punto x R2 tiene coordenadas (x, y) en la base
can
onica, entonces el valor de f en x
est
a dada por
f (
x) = f (x, y)
= x2 + y 2
yx R2 que en la base can
0 , u onica tienen coordenadas (x0 , y0 ) y (u1 , u2 ), respectivamente.
Primero vamos a calcular Du f (x0 ). De acuerdo con la definici
on 4.2, tenemos que
f ( u) f (
x0 + h x0 )
Du f (
x0 ) = lim
h0 h
f (x0 + hu1 , y0 + hu2 ) f (x0 , y0 )
= lim
h0 h
(x0 + hu1 )2 + (y0 + hu2 )2 (x20 + y02 )
= lim
h0 h
151 J. P
aez
2x0 hu1 + (hu1 )2 + 2y0 hu2 + (hu2 )2

= lim
h0 h
= lim 2x0 u1 + 2y0 u2 + hu21 + hu22

h0
= 2(x0 u1 + y0 u2 )
Supongamos ahora que tenemos otro sistema coordenado determinado por una base { e1 , e2 } tal que
el cambio de coordenadas del sistema primado al sistema can
onico est
a dado por la matriz

a11 a12
M=
a21 a22
tiene coordenadas (x , y ) en la base {

es decir, si un punto x e1 , e2 }, entonces sus coordenadas (x, y)
en la base canonica estaran dadas por

x a11 a12 x
=
y a21 a22 y
x = a11 x + a12 y
y = a21 x + a22 y
, expresado en terminos de sus coordenadas (x , y ), estar

de tal forma que ahora el valor de f en x a
dado por
x) = f (x , y )
f (
= (a11 x + a12 y )2 + (a21 x + a22 y )2
= a211 + a221 (x )2 + 2(a11 a12 + a21 a22 )x y + a221 + a222 (y )2

y si recordamos que la matriz de cambio de base M es tal que

1 0
= M 1 M
0 1
= M tM

a11 a21 a11 a12
=
a12 a22 a21 a22
concluimos que a211 + a221 = 1 = a221 + a222 y que a11 a12 + a21 a22 = 0, de tal forma que
x) = f (x , y )
f (
= (x )2 + (y )2
No debera causar sorpresa al lector que las expresiones de f en terminos de las coordenadas (x, y)
y de las coordenadas (x , y ) sean an alogas en este caso ya que, en terminos geometricos, f asigna a
cada punto x su norma al cuadrado (cantidad que se expresa de forma an aloga en ambos sistemas
coordenados, en virtud de que estos son ortonomarles).
De esta forma, si las coordenadas del punto x 0 y del vector u en el sistema primado estan dadas
por (x0 , y0 ) y (u1 , u2 ) respectivamente, al calcular Du f (
x0 ) usando la expresi
on de f en el sistema
primado y repitiendo los c alculos que hicimos al principio, obtendremos nuevamente que
x0 ) = 2(x0 u1 + y0 u2 )
Du f (
J. P
aez 152
Lo que ahora mostraremos es que los dos valores que obtuvimos para Du f ( x0 ) usando la expresi
on
de f en cada uno de los sistemas coordenados, coinciden. Para ello, recordemos que las coordenadas
del punto x
0 y del vector u
en el sistema primado tambien satisfacen las identidades

x0 1 x0
=M
y0 y0
y
u1

1 u1
=M
u2 u2
respectivamente., de tal forma que, usando la notaci on del producto de matrices, obtenemos que

u1
2(x0 u1 + y0 u2 ) = 2 x0 y0
u2
t
x0 u1
=2 M M
y0 u2

t u1
= 2 x0 y0 (M M )
u2

1 u1
= 2 x0 y0 (M M )
u2

u1
= 2 x0 y0

u2
= 2(x0 u1 + y0 u2 )
Aun y cuando lo que acabamos de hacer s olo muestra para un ejemplo especfico que el valor de
Du f (
x0 ) no depende del sistema coordenado que usemos, parte del material que vamos a desarrollar
en este captulo ser a util para probar que este concepto es, en general, independiente de dichos
sistemas.
Dada la similitud que existe entre el concepto de derivada direccional y el de derivada para
funciones de R en R, es de suponerse que muchas de las propiedades de esta u ltima, las satisfaga
la primera. Una de estas propiedades, y que en el caso real resulta ser muy importante, es el hecho
de que toda funci on que sea derivable en un punto, tiene que ser continua en ese punto. Dado que
la derivada direccional Du f ( x0 ) s
olo toma en cuenta la variacion de la funcion sobre la recta que
pasa por x 0 en la direcci
on del vector u, lo que podemos probar es que si dicha derivada direccional
existe entonces la funci on, restringida a dicha recta, ser
a continua en el punto x 0 . Este hecho lo
dejamos plasmado en la siguiente proposici on y su prueba la dejamos al lector.
on 4.4 Sean f : U Rn R, x
Proposici 0 U y u Rn tal que k
uk = 1. Si Du f (
x0 ) existe
entonces
lim f (
x0 + h
u) = f (
x0 )
h0
Otras propiedades importantes de la derivada direccional son las relacionadas con la aritmetica
de las funciones. Nuevamente, de forma an aloga a lo que sucede con las funciones de R en R,
ademas de que dicha aritmetica preserva la existencia de la derivada direccional, las formulas de
derivacion que se obtienen resultaran ser muy u
tiles.
Proposici on 4.5 Sean f, g : U Rn R, x Rn tal que k

0 U , R y u uk = 1. Si Du f (
x0 )
y Du g(
x0 ) existen entonces:
153 J. P
aez
1. Du (f + g)(
x0 ) existe y adem
as
Du (f + g)(
x0 ) = Du f (
x0 ) + Du g(
x0 )
2. Du (f (
x0 ) existe y adem
as
Du (f )(
x0 ) = Du f (
x0 )
3. Du (f g)(
x0 ) existe y adem
as
Du (f g)(
x0 ) = f (
x0 )Du g(
x0 ) + g(
x0 )Du f (
x0 )
4. si g es continua en x x0 ) 6= 0, Du (f /g)(
0 y g( x0 ) existe y adem
as
g( x0 ) f (
x0 )Du f ( x0 )Du g(
x0 )
Du (f /g)(
x0 ) = 2
g (
x0 )
Aun y cuando la prueba de esta proposici on tambien se deja al lector, es importante hacer un
comentario acerca de la hip otesis de continuidad que se pide en el inciso 4. En realidad, dicha
hip
otesis se incluye para seguir garantizando la condicion que nos impusimos de que las funciones
con las que vamos a trabajar a partir de este captulo, esten definidas sobre un conjunto abierto.
Notese que por el inciso (a) del problema 38 del captulo 2, y del hecho de que el dominio de g
sea el abierto U , podemos asegurar que la funcion f /g est
a definida en un abierto que contiene al
punto x 0 .
Para concluir con las propiedades de la derivada direccional relacionadas con las operaciones
entre funciones, formularemos en una proposici on aparte, aquella que nos habla de la composicion
de funciones. El caso que va a resultar mas interesante ser a cuando compongamos a f con una
funcion g de R en R. Esta propiedad, que en realidad es una consecuencia de un resultado mas
general conocido como la regla de la cadena (que probaremos mas adelante), la dejamos plasmada
en la siguiente
Proposici on 4.6 Sean f : U Rn R, x 0 U , u Rn tal que k uk = 1 y (a, b) R tal que

f (U ) (a, b). Si g : (a, b) R R es derivable en f ( x0 ) existe entonces Du (g f )(
x0 ) y Du f ( x0 )
existe y adem as
x0 ) = g (f (
Du (g f )( x0 ))Du f (
x0 )
on. De acuerdo con la definicion de Du (g f )(

Demostraci x0 ), debemos probar que
(g f )( u) (g f )(
x0 + h x0 ) g(f ( u)) g(f (
x0 + h x0 ))
lim = lim
h0 h h0 h
existe. Como seguramente el lector recordara de la correspondiente prueba para el caso de funciones
de R en R, si hacemos
kh = f (
x0 + h u) f (
x0 )
el lmite anterior se podra escribir como
g(f ( u)) g(f (
x0 + h x0 )) x0 ) + kh ) g(f (
g(f ( x0 ))
lim = lim
h0 h h0 h
de tal forma que si kh 6= 0 entonces
g(f ( u)) g(f (
x0 + h x0 )) x0 ) + kh ) g(f (
g(f ( x0 ))
lim = lim
h0 h h0 h
J. P
aez 154

x0 ) + kh ) g(f (
g(f ( x0 )) kh
= lim
h0 kh h

x0 ) + kh ) g(f (
g(f ( x0 )) f ( u) f (
x0 + h x0 )
= lim
h0 kh h
on 4.4, se tiene que kh 0 cuando h 0 puesto que
Si ahora notamos que, por la proposici
lim kh = lim (f ( u) f (
x0 + h x0 ))
h0 h0
=0
entonces
x0 ) + kh ) g(f (
g(f ( x0 ))
lim = g (f (x0 ))
h0 kh
y obtendramos el resultado deseado.
Como seguramente el lector ya sabe, el problema con el argumento anterior es que este solo
funciona si kh 6= 0, y como tambien recordara, la soluci on a este problema est a en definir una
funcion auxiliar.
Definimos : (r, r) R R, con r > 0 tal que Br ( x0 ) U , de la siguiente manera:

g(f (
x0 )+kh )g(f (
x0 ))

kh si kh 6= 0
(h) =
g (f (

x0 )) si kh = 0
Lo primero que es importante observar (y que es muy facil de verificar) es que

x0 ) + kh ) g(f (
g(f ( x0 )) f ( u) f (
x0 + h x0 )
= (h)
h h
para toda h (r, r), h 6= 0, de tal forma que nuestro problema se reduce a demostrar que
lim (h) = g (f (
x0 ))
h0
Sea entonces > 0; dado que g es derivable en f ( x0 ) sabemos que existe > 0 tal que si |k| <
x0 ) + k (a, b)) entonces
(y f (

x0 ) + k) g(f (
g(f ( x0 ))

g (f (
x 0 ))< (4.10)
k
Por otra parte, por la proposici

on 4.4 sabemos que
lim kh = lim (f ( u) f (
x0 + h x0 ))
h0 h0
=0
y por tanto existe 0 < r tal que si |h| < entonces |kh | < . De esta forma, si |h| < ,
independientemente de que kh 6= 0 o kh = 0, por la desigualdad 4.10 o por el valor de cuando
kh = 0, en ambos casos se tiene que
(h) g (f (

x0 )) <
y por lo tanto que

lim (h) = g (f (
x0 ))
h0
155 J. P
aez
con lo cual concluimos la prueba.
Terminamos esta serie de proposiciones con una en la que se establece una propiedad que bien
podra interpretarse como la versi on del Teorema del Valor Medio para la derivada direccional. Su
formulaci on es la siguiente:
h i
Proposici on 4.7 Sean f : U Rn R, a , b U , a 6= b, tales que a , b U y u =
h i
b a
/ b a

Rn . Si Du f (

x) existe para toda x a , b entonces existe 0, b a

tal

que si = a
+ u , se cumple que

f (b) f (
a) = b a
Du f

Demostraci on. Como es de suponerse, la prueba hde esta proposici

i on se basa en el Teorema del

Valor Medio para funciones R en R. Definimos g : 0, b a R R como g(t) = f ( a + t
u).

h i
Notese que g es derivable para toda t 0, b a
puesto que

g(t + h) g(t)
g (t) = lim
h0 h
f (
a + (t + h)u) f (
a + t
u)
= lim
h0 h
f ((
a + t u) f (
u) + h a + t
u)
= lim
h0 h
= Du f (
a + tu)
de tal
forma
por el Teorema del Valor Medio para funciones R en R, se tiene que existe
que,

0, b a
tal que

f b f (
a) = g b a g (0)

= b a 0 g ()

= b a Du f (
a + u
)

= b a
Du f

4.2.1 Derivadas parciales

Si una funcion f est
a escrita en terminos de las coordenadas x1 , . . . , xn asociadas a un sistema de
referencia determinado por una base ortonormal { e1 , . . . , en } de Rn , calcular la derivada direccional
de f en la direcci
on de estos vectores b asicos (en cualquier punto x del dominio de f ), resultara
mas sencillo (y m
as importante). En efecto, si
= x1 e1 + + xn en
x
= (x1 , . . . , xn )
J. P
aez 156
y el valor de f en x
se puede escribir escribir en terminos de las coordenadas (x1 , . . . , xn ), es decir
que
f (
x) = f (x1 , . . . , xn )
entonces el c
alculo de la derivada direccional de f en x , en la direcci
on de cada vector ei , se traduce
en lo siguiente.
De la definicion de la derivada direccional Dei f (
x) sabemos que
f ( ei ) f (
x + h x)
Dei f (
x) = lim
h0 h
y dado que las coordenadas del vector x + h
ei seran (x1 , . . . , xi + h, . . . , xn ), el lmite anterior
escrito en terminos de coordenadas, se convierte en
f (
x + h ei ) f (
x)
Dei f (
x) = lim
h0 h
f (x1 , . . . , xi + h, . . . , xn ) f (x1 , . . . , xn )
= lim
h0 h
Como seguramente el lector podr a intuir, en el lmite anterior la unica coordenada (o variable)
que est a teniendo un incremento h es la variable xi , mientras que las otras variables no tienen
cambios, es decir, permanecen constantes. En terminos mas concretos, esto significa que para el
calculo de la derivada direccional Dei f (
x) bastara con derivar la expresi on f (x1 , . . . , xn ) tomando
como u nica variable a xi , y considerando a las restantes (x1 , . . . , xi1 , xi+1 , . . . , xn ) como si fueran
constantes. En el siguiente ejemplo ilustramos este hecho de manera mas clara.
Ejemplo 4.8 Sea f : R2 R la funci on cuyo valor en un punto x R2 est

a dado en terminos de
sus coordenadas (x, y) (en la base can
onica, que en este caso a sus elementos los denotamos por ex
y ey ) por la expresi
on
f (x, y) = 4x5 y 2
Calcularemos Dey f ( R2 .
x) para cualquier x
Si x on de la derivada direccional Dey f (
= (x, y), de acuerdo con la definici x), se tiene que
f (
x + hey ) f (
x)
Dey f (
x) = lim
h0 h
f (x, y + h) f (x, y)
= lim
h0 h
4x (y + h)2 4x5 y 2
5
= lim
h0 h
(y + h)2 y 2
= lim 4x5
h0 h
(y + h) 2 y2
= 4x5 lim
h0 h
5
= 4x (2y)
= 8x5 y
Como el lector habra notado en este ejemplo, el calculo de la derivada direccional Dey f (
x) se
redujo a derivar la expresi 5 2
on 4x y considerando s olo como variable a la coordenada y, y tratando
on (4x5 ) como una constante. Una de las ventajas de lo anterior (entre otras
al resto de la expresi
157 J. P
aez
mas!) es que podemos simplificar el c alculo de estas derivadas direccionales usando los metodos de
derivacion que aprendimos para las funciones de R en R.
Por estas caractersticas, y algunas otras que veremos mas adelante, las derivadas direccionales
en la direcci
on de los vectores de una base ortonormal, tienen un nombre y una notaci on propia,
las cuales establecemos en la siguiente
Definicion 4.9 Sean f : U Rn R, x 0 U y u Rn tal que kuk = 1. Si x1 , . . . , xn denotan

las variables (o coordenadas) determinadas por una base ortonormal { e1 , . . . , en } de Rn , definimos
f
la derivada parcial de f con respecto de la variable xi en x
0 , que denotamos por x i
(
x0 ), como
f
(
x0 ) := Dei f (
x0 )
xi
f ( ei ) f (
x0 + h x0 )
:= lim
h0 h
Como es de suponerse, dado que cualquier derivada parcial no es mas que una cierta derivada
direccional, las proposiciones 4.4, 4.5, 4.6, y 4.7, tienen sus correspondientes versiones para derivadas
parciales, las cuales formalaremos a continuaci on (sin probar). En todas ellas supondremos que
x1 , . . . , xn son las variables (o coordenadas) determinadas por una base ortonormal { e1 , . . . , en } de
Rn .
f
Proposici 0 U . Si xi (
x0 ) existe entonces
lim f (
x0 + h
ei ) = f (
x0 )
h0
f g
Proposicion 4.11 Sean f, g : U Rn R, x
0 U y R. Si xi (
x0 ) y xi (
x0 ) existen
entonces:
(f +g)
1. xi (x0 ) existe y adem
as
(f + g) f g
(
x0 ) = (
x0 ) + (
x0 )
xi xi xi
(f )
as
(f ) f
(
x0 ) = (
x0 )
xi xi
(f g)
as
(f g) g f
(
x0 ) = f (
x0 ) (
x0 ) + g(
x0 ) (
x0 )
xi xi xi
(f /g)
4. si g es continua en x x0 ) 6= 0,
0 y g( xi ( x0 ) existe y adem
as
f g
(f /g) g(
x0 ) x i
x0 ) f (
( x0 ) x i
(
x0 )
(
x0 ) =
xi g2 (
x0 )
J. P
aez 158
4.3. La derivada global Captulo 4. La derivada de funciones de Rn en R
Proposici on 4.12 Sean f : U Rn R, x 0 U y (a, b) R tal que f (U ) (a, b). Si

g : (a, b) R R es derivable en f ( f
x0 ) existe entonces (gf
x0 ) y xi ( )
xi ( x0 ) existe y adem
as
(g f ) f
x0 ) = g (f (
( x0 )) (
x0 )
xi xi
h i
Proposici on 4.13 Sean f : U Rn R, a , b U , a
6= b, tales que a
, b U y b a =
h i
(b a) f
ei . Si x ( x) existe para toda x , b entonces existe 0, b a
a = |b a| tal que si

hi i
= a
+ ei a, b , se cumple que
f
f b f (
a) = (b a) (4.11)
xi
En esta u ltima proposici on es importante hacer notar dos aspectos importantes: uno, que la
hip
otesis de que a , b U sean tales b a = (b a)
ei , significa que las coordenadas de a y b (en la
base {e1 , . . . , en }) solo difieren en la iesima coordenada; y dos, que en el caso en que la cantidad
b a sea negativa, entonces el vector u que se construye en la proposici on 4.7 es tal que
b a

u
=

b a

ba
= ei
|b a|
= ei
de tal forma que, de acuerdo con la conclusion de dicha proposici on (y el facil resultado que el
lector probara en el problema 1), se tiene que

f b f ( a) = b a
Du f ()

= |b a| Dei f ()

= (b a)(Dei f ())
f
= (b a)
xi
y por lo tanto la identidad 4.11 se cumple independientemente de la relaci
on (de orden) que guarden
a y b.
4.3 La derivada global

Salvo por el caso de las derivadas direccionales, quedarnos s olo con la idea de que la derivada es
una forma de medir la raz on de cambio de una funcion, es algo que dificilmente nos ayudar a
a extender el concepto de derivada a funciones de Rn en R. Por esta raz on, en esta secci on
empezaremos por recordar que la derivabilidad de una funci on f de R en R en un punto x0 , adem as
de proporcionarnos una medida de la raz on de cambio de f en x0 , tambien nos ayuda a resolver un
problema geometrico: encontrar la recta tangente a la gr afica de la funcion en el punto (x0 , f (x0 )).
Como el lector seguramente recordara, la derivada de una funcion f de R en R en un punto x0
(f (x0 )) tiene la propiedad de que, si tomamos la recta con esta pendiente que pasa por el punto
159 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.3. La derivada global
(x0 , f (x0 )), esta recta es tangente a la gr

afica de la funcion en dicho punto. Especficamente, lo
anterior se traduce en lo siguiente: la recta con pendiente f (x0 ) que pasa por el punto (x0 , f (x0 ))
es aquella cuya ecuaci on se puede escribir de la forma
y = f (x0 )(x x0 ) + f (x0 )
y que esta recta sea tangente a la gr

afica de f en (x0 , f (x0 )), significa no s
olo que pasa por ese
punto, sino que adem as se parece mucho a f cerca de x0 , donde eso de parecerse mucho a f
cerca de x0 se traduce en que
f (x) (f (x0 )(x x0 ) + f (x0 ))

lim =0
xx0 x x0
es decir, que la diferencia f (x) (f (x0 )(x x0 ) + f (x0 )) se va m
as r
apido a cero de lo que se va
la diferencia x x0 .
De hecho, como seguramente el lector tambien recordara, la existencia de una recta con estas
caractersticas garantiza la derivabilidad de la funcion en el punto x0 . Dado que las rectas que
pasan por el punto (x0 , f (x0 )) tienen una ecuaci on de la forma
y = m(x x0 ) + f (x0 )
si una de estas rectas tiene la propiedad de que
f (x) (m(x x0 ) + f (x0 ))

lim =0 (4.12)
xx0 x x0
as f (x0 ) = m. En efecto, como
entonces podemos asegurar que f es derivable en x0 y que adem
f (x) (m(x x0 ) + f (x0 ))

0 = lim
xx0 x x0

f (x) f (x0 )
= lim m
xx0 x x0
entonces
f (x) f (x0 )
m = lim
xx0 x x0
= f (x0 )
lo que comprueba nuestra afirmacion.

De lo anterior concluimos que la derivabilidad de una funci on f de R en R en un punto x0 , es
equivalente a la existencia de una funci on de la forma r(x) = m(x x0 ) + f (x0 ) que satisfaga la
identidad 4.12. En realidad bastara con considerar las funciones de la forma L(x) = mx, puesto
que la funcion r(x) no es mas que, en terminos de sus gr aficas, la traslaci
on de L(x) (que pasa por
el origen) al punto (x0 , f (x0 )) (ver figura 4.4). Las funciones de la forma L(x) = mx son justo el
tipo de funciones de R en R conocidas con el nombre de funciones lineales (las cuales introdujimos
en el problema 34 del captulo 2 para el caso general de funciones de Rn en Rm ), y que son las
funciones L : R R que tienen las siguientes dos propiedades:
1. L(x + y) = L(x) + L(y) para todas x, y R, y
2. L(x) = L(x) para todas , x R
J. P
aez 160
(x0 , f (x0 ))
b L
x0
Figura 4.4: La funcion r(x) = m(x x0 ) + f (x0 ) es la traslaci

on de la funcion L(x) = mx (que pasa
por el origen) al punto (x0 , f (x0 )).
Es un problema sencillo mostrar que L : R R es una funci olo si existe m R tal

on lineal si y s
que L(x) = mx para toda x R (en ambas implicaciones se deduce que m = L(1)).
Como seguramente el lector ya estar a imaginando, la discusion anterior nos sugiere la forma
en que podemos dar la definicion de derivada (global) de una funcion de Rn en R. En terminos
generales, que una funci on f de este tipo sea derivable en un punto x 0 de su dominio, significara
que existe una funci n
on lineal L de R en R tal que al trasladarla para que su valor en x 0 sea
f (
x0 ), esta funci
on lineal trasladada (L( xx0 ) + f (
x0 )), que recibe el nombre de funci on (o
transformaci on) afn se parece mucho a la funcion f cerca de x 0 . Especficamente, nuestra
definicion de derivabilidad ser a la siguiente.
Definicion 4.14 Sean f : U Rn R y x

0 U . Decimos que f es derivable en x
0 si existe una
on lineal L : Rn R tal que
funci
x) (L(
f ( xx
0 ) + f (
x0 ))
lim =0 (4.13)
x

x0 k
xx
0 k
Sin duda que despues de esta definicion, lo que se esperara sera un ejemplo que la ilustrara.
Sin embargo, es importante hacer notar que hasta ahora no tenemos ninguna herramienta que
nos permita, dada una funci on (expresada en alg un sistema coordenado), proponer (o intuir) cu al
debera de ser la funci
on lineal que satisfaga la condici on que se le pide en esta definicion. Por
esta razon, primero nos enfocaremos en dar algunas propiedades relacionadas con este concepto de
derivada que, entre otras cosas, nos permitiran darnos una idea de como encontrar la ya famosa
funcion lineal L.
De hecho, la primera proposici on que probaremos es justo la que nos asegura que s olo puede
haber una u nica funci
on lineal que satisfaga la propiedad de la definicion 4.14.
Proposici on 4.15 Sean f : U Rn R, x : Rn R funciones lineales. Si L y L

0 U y L, L
satisfacen la condici
on 4.13 de la definici son iguales.
on 4.14 entonces L y L
Demostraci
on. Dado que por hip
otesis sabemos que
x) (L(
f ( xx
0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
y
f ( xx
x) (L( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
161 J. P
aez
restando ambos lmites concluimos que

xx
L( 0 ) L(xx
0 ) L)(
(L xx 0 )
lim = lim
x

x0 kxx 0 k x
x0 k
xx 0 k
=0
=L
de tal forma que si hacemos L =x
L y h x es una funcion lineal para la cual
0 , entonces L
se satisface que

h)
L(
lim = 0

h 0 h
es la constante cero, o lo que es
de tal forma que, por el problema 34 del captulo 2, se tiene que L

lo mismo, que L y L son iguales.
Con base en esta proposici on ya podemos completar la definicion 4.14 de la siguiente forma:
si f : U Rn R es derivable en x 0 U , a la funcion lineal que satisface la condicion 4.13, que
por la proposici on anterior sabemos que es u nica, la denotaremos por Df ( x0 ) y diremos que es la
derivada de f en x 0 . De esta forma, la derivada de una funci on de Rn en R es una funci on lineal.
Mas adelante veremos que toda funcion lineal de Rn en R se puede representar (dependiendo del
sistema coordenado que se elija) por una matriz de 1 n o por un vector en Rn , de tal forma que
en algunas ocasiones tambien diremos (abusando ciertamente del lenguaje) que la derivada de este
tipo de funciones tambien es (o dicho de manera mas correcta, que se puede representar por) una
de estas matrices (o uno de estos vectores).
Y justamente, con el objetivo de poder calcular (o conocer) la derivada de una funcion en
un punto x0 , el siguiente resultado que veremos establece una importante relaci on entre la funci
on
lineal Df (
x0 ) (que es la derivada en el punto x 0 ) y las derivadas direccionales en dicho punto.
En terminos generales, la siguiente proposici on que probaremos nos asegura que si una funcion es
derivable en un punto x 0 entonces la derivada direccional en x 0 , en la direcci
on de cualquier vector
u
, tambien existe y adem as el valor de dicha derivada direccional se obtiene evaluando la funci on
lineal Df (
x0 ) en el vector u.
Proposicion 4.16 Sean f : U Rn R, x 0 U y u Rn tal que k

uk = 1. Si f es derivable en
x
0 entonces la derivada direccional de f en x
0 en la direcci
on de u
tambien existe y adem
as
Du f (
x0 ) = Df (
x0 )(
u)
Demostraci
on. De la definicion 4.14 sabemos que
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 )) x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
lim = lim
x

x0 k
xx 0 k x
x0 kxx 0 k
=0
de tal forma que si en particular tomamos x

=x
0 + h x
u, tenemos entonces que x 0 si h 0 y
por lo tanto se tendra que
x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
0 = lim
x

x0 kxx 0 k
|f (
x) f (
x0 ) Df ( xx
x0 )( 0 )|
= lim
x
x0 kxx 0 k
J. P
aez 162
|f ( u) f (
x0 + h x0 ) Df (
x0 )(hu)|
= lim
h0 kh uk
|f ( u) f (
x0 + h x0 ) Df (
x0 )(hu)|
= lim
h0 |h|

f ( u) f (
x0 + h x0 ) hDf (x0 )(
u)
= lim

h0 h

f ( u) f (
x0 + h x0 )
= lim Df (
x0 )(u)
h0 h
lo cual es equivalente a que
f ( u) f (
x0 + h x0 )
lim = Df (
x0 )(
u)
h0 h
de donde concluimos que la derivada direccional de f en x 0 en la direcci
on de u
existe y adem
as
que
Du f (
x0 ) = Df (
x0 )(
u)
Para abordar el problema de calcular la derivada de una funcion, es necesario establecer algunos
hechos importantes acerca de las funciones lineales, lo cual haremos a continuaci on.
n
Es facil ver que si L : R R es una funcion lineal, para conocer el valor de L en cualquier
punto x Rn , es suficiente con saber los valores de L en los elementos de una base de Rn . En
efecto, notese que si x tiene coordenadas (x1 , . . . , xn ) en un sistema coordenado determinado por
una base = { v1 , . . . , vn }, esto significa que
= x1 v1 + + xn vn
x
de tal forma que, por la linealidad de L se tiene que
x) = L(x1 v1 + + xn vn )
L(
v1 ) + + xn L(
= x1 L( vn )
lo que confirma que para saber el valor de L en x , es suficiente con conocer las coordenadas de x

en una base = { v1 , . . . , vn } y los valores de L en los elemento de esta base. Si denotamos por
vi ), se suele construir la matriz de 1 n
a1i = L(

M = a11 a1n
y decir que la matriz M respresenta a la funcion lineal L en la base = {v1 , . . . , vn }. De hecho,

esta representaci
on matricial y las operaciones entre matrices son utiles para expresar a L( x) como
L(
x) = L(x1 , . . . , xn )

x1
.
= a11 a1n ..
xn

x1
= M ...

xn
163 J. P
aez
En el caso particular de funciones lineales de Rn en R, tambien podemos respresentar a L por el

vector (L(
v1 ), . . . , L(
vn )) y usar el producto punto para expresar a L(
x) como
L(
x) = L(x1 , . . . , xn ) (4.14)
= (L( vn )) (x1 , . . . , xn )
v1 ), . . . , L(
Con base en lo anterior, si una funcion f est a expresada en terminos de las coordenadas
x1 , . . . , xn determinadas por alguna base ortonormal { e1 , . . . , en } de Rn , para encontrar la matriz
que representa (en la misma base { e1 , . . . , en }) a la derivada de f en un punto x 0 de su dominio, es
decir Df ( x0 ), bastara con saber el valor Df ( ei ) (para cada i {1, . . . , n}), y de acuerdo con
x0 )(
lo probado en la proposici on 4.16, se tiene que
Df (
x0 )(
ei ) = Dei f (
x0 )
Y si ahora recordamos, de acuerdo con la definicion 4.9, que
f
Dei f (
x0 ) = (
x0 )
xi
entonces concluimos que para calcular (o conocer) a Df ( x0 ) basta con calcular las derivadas
parciales de f en x0 .
En cuanto a la discusion previa, es importante hacer notar que la mera existencia de las derivadas
parciales de una funci on f en un punto x 0 de su dominio, no garantizan que la funcion sea derivable
en dicho punto. Lo que en el fondo est a sucediendo, es que en la proposici on 4.16 se establece que
la existencia de las derivadas direccionales (incluyendo las derivadas parciales) es una condici on (o
consecuencia) necesaria de la derivabilidad de f en x 0 , pero lo recproco no es cierto (mas adelante
daremos un ejemplo que ilustra esta afirmacion). Sin embargo, la importancia de la discusion
anterior est
a en que se muestra con toda precision cu al es la u
nica funcion lineal que podra ser la
derivada de f en x 0 , lo que sin duda es un hecho de gran valor. Y una vez aclarado lo anterior,
pasamos a dar el siguiente
Ejemplo 4.17 Sea f : R2 R que est

a dada (en terminos de las coordenadas de la base can
onica)
por la expresi
on
f (x, y) = x2 + y 2 1
0 = (x0 , y0 ) R2 y calcularemos Df (
Mostraremos que f es derivable en cualquier punto x x0 ).
De acuerdo con lo visto anteriormente, hay que calcular las derivadas parciales de f con respecto
de las variables x y y,
f f
(x, y) = 2x y (x, y) = 2y
x y
evaluarlas en x
0 = (x0 , y0 )
f f
(x0 , y0 ) = 2x0 y (x0 , y0 ) = 2y0
x y
y mostrar que la funci

on lineal (expresada en el mismo sistema coordenado)
L(
x) = L(x, y)
x
= fx (x0 , y0 )
f
y (x0 , y0 ) y
J. P
aez 164

x
= 2x0 2y0
y
= 2x0 x + 2y0 y
satisface la condici
on 4.13 de la definci
on 4.14.
En efecto, sustituyendo f y L en dicha expresi on, tenemos que
x) (L(
f ( xx
0 ) + f (
x0 )) x2 + y 2 1 (2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1)
lim = lim
k
xx
0 k
p
x
x0 x
x0 (x x0 )2 + (y y0 )2
(x2 2x0 x x20 ) + (y 2 2y0 y y02 )
= lim p
x

x0 (x x0 )2 + (y y0 )2
(x x0 )2 + (y y0 )2
= lim p
x
x0 (x x0 )2 + (y y0 )2
p
= lim (x x0 )2 + (y y0 )2
x

x0
=0
de donde concluimos que f es derivable en x

0 y que adem
as Df (
x0 ) es la funci
on lineal represen-
tada (o asociada), en el mismo sistema coordenado es que est
a expresada f , por la matriz
h i
f f
x (x0 , y0 ) y (x0 , y0 ) = 2x0 2y0
es decir que

x
Df (
x0 )(x, y) = 2x0 2y0
y
= 2x0 x + 2y0 y
Para aprovechar el ejemplo anterior, en el cual todava podemos ver la grafica de la funci
on f ,
y confirmar la estrecha relaci
on que existe entre el concepto de derivada y el concepto de tangencia,
observemos que la gr afica de la funcion lineal
Df (
x0 )(x, y) = 2x0 x + 2y0 y
es un plano (que contiene al origen) y que entonces la gr

afica de la funcion
z = L(x, y)
= 2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1
x0 )(x x0 , y y0 ) + f (x0 , y0 )
= Df (
es un plano (trasladado al punto (x0 , y0 , x20 + y02 1)) que es tangente a la gr afica de la funci
on
2 2
f (x, y) = x + y 1 en este mismo punto (ver figura 4.5).
En general, si f : U R2 R es derivable en el punto x 0 = (x0 , y0 ) U , diremos que el plano
que tiene como ecuaci on
f f
z= (x0 , y0 ) (x x0 ) + (x0 , y0 ) (y y0 ) + f (x0 , y0 )
x y
165 J. P
aez
(x0 , y0 , f (x0 , y0 ))
afica de la funcion f (x, y) = x2 + y 2 1 en el punto (x0 , y0 ) =

Figura 4.5: El plano tangente a la gr
(1, 1).
es el plano tangente a la gr
afica de f en el punto (x0 , y0 , f (x0 , y0 )). Notese que la ecuaci
on anterior
se puede escribir como

f f
(x0 , y0 ), (x0 , y0 ), 1 (x x0 , y y0 , z f (x0 , y0 )) = 0 (4.15)
x y
de tal forma que el vector

f f
(x0 , y0 ), (x0 , y0 ), 1
x y
es un vector normal a este plano tangente.
De aqu en adelante escribiremos, sin duda abusando de la notaci on, que la funcion lineal Df (
x0 )
es igual a la matriz (de 1 n) que la representa en el sistema de referencia que se este usando, y
en cuyas coordenadas est a expresada f . Sin embargo, no hay que olvidar que esta matriz depende
del sistema de referencia que se este usando, y parte de lo que haremos a continuaci on ser
a mostrar
la relaci
on que existe entre las matrices asociadas a la funcion lineal Df ( x0 ) en dos sistemas de
referencia (ortonormales) diferentes, y c omo se puede obtener una a partir de la otra.
Una vez dicho lo anterior, si x1 , . . . , xn denotan a las variables determinadas por una base
ortonormal { e1 , . . . , en }, entonces escribiremos que
h i
f f
Df (x0 ) = x 1
(
x 0 ) xn (
x 0 ) (4.16)
Rn tiene coordenadas (u1 , . . . , un ) en la base {

de tal forma que si u e1 , . . . , en }, por la proposici
on
4.16 sabemos que
Du f (
x0 ) = Df (
x0 )(
u)

u1
..
h i
f f
= x1 (
x0 ) xn (
x0 ) .
un
f f
= u1 x 0 ) + + un
( (
x0 )
x1 xn
J. P
aez 166
As pues, si ahora x1 , . . . , xn denotan a las variables determinadas por otra base ortonormal
e1 , . . . , en }
{ de Rn , y se tiene que

(i)
ei = a1 , . . . , a(i)
n
(i)
= a1 e1 + + a(i)
n e n
f
(
x0 ) = Dei f (
x0 )
xi
(i) f f
= a1 x0 ) + + a(i)
( n (
x0 )
x1 xn
lo cual establece la forma de obtener las derivadas parciales de f , con respecto a las variables (o
coordenadas) x1 , . . . , xn , en terminos de las variables x1 , . . . , xn .
Si ahora recordamos que la funcion lineal Df ( x0 ) en la base {e1 , . . . , en } estar
a representada
por la matriz h i
f f
x (
x 0 ) x (
x 0 )
1 n
tenemos entonces que las matrices (de 1 n) que representan a la funcion lineal Df ( x0 ) (en las
e1 , . . . , en } y {
correspondientes bases { e1 , . . . , en }) est
an relacionadas por la identidad
(1) (n)
a1 a1
.. ..
h i h i
f
f f f ..
x1 (
x0 ) xn (
x0 ) = x1 (
x0 ) xn (
x0 ) (4.17)

. . .
(1) (n)
an an
o por la identidad
(1) (1)
i a1 an
. ..
h i h
f f f
f
.. ..
x1 (
x0 ) xn (
x0 ) = x1 (
x0 ) xn (
x0 ) (4.18)

. .
(n) (n)
a1 an
la cual, sin duda alguna, har

a que el lector recuerde las identidades 4.4 y 4.7, que son las que
obtuvimos cuando analizamos el problema relacionado con el cambio de coordenadas (de un
mismo vector x) determinadas por dos bases ortonormales de Rn .
4.3.1 El gradiente
Ademas de sus implicaciones pr acticas para el calculo explcito de la derivada de una funci on,
la proposicion 4.16 tiene otra consecuencia importante, la que resultara muy u til para conocer el
comportamiento de una funci on en la vecindad de un punto en el cual sea derivable.
Como asegura la proposici on 4.16, si f es derivable en un punto x 0 entonces la derivada direc-
cional de f en x 0 , en la direcci
on del vector (unitario) u , se obtiene evaluando la funcion lineal
Df (
x0 ) (la derivada de f en x 0 ) en u. Si ahora recordamos que toda funcion lineal es continua
(problema 56 del captulo 2) y que el conjunto
S n1 = {
u Rn | k
uk = 1}
167 J. P
aez
es cerrado (problema 44 del captulo 2) y claramente acotado, por el corolario 2.49 del captulo 2
sabemos que deben existir u
1 y u2 en S n1 tales que
Df ( u1 ) Df (
x0 )( u) Df (
x0 )( x0 )(
u2 )
S n1 , o equivalentemente, que
para toda u
x0 ) Du f (
Du1 f ( x0 ) Du2 f (
x0 )
para toda u S n1 . Es decir, en terminos mas coloquiales, siempre existen direcciones u 1 y u

2 , una
en la que la razon de cambio de la funci on f es mnima (
u1 ), y otra en la que la raz
on de cambio
de la funcion f es m axima (u2 ). De hecho, lo siguiente que probaremos es que si la Df ( x0 ) no es
la funcion lineal constante cero (en cuyo caso todas las derivadas direccionales valen 0), entonces
u
1 y u
2 son u nicos y ademas u1 = u2 .
Proposici on 4.18 Sea f : U Rn R y x 0 U . Si f es derivable en x

0 entonces existe
0 S
u n1 tal que
x0 ) Du f (
Du0 f ( x0 ) Du0 f (
x0 )
S n1 . Si la derivada Df (
para toda u x0 ) no es la constante cero entonces u
0 es u
nico.
Demostraci on. Como mencionamos anteriormente, dado que toda funcion lineal es continua, y
que el conjunto S n1 es cerrado y acotado, por el corolario 2.49 del captulo 2 sabemos que existe
0 S n1 tal que
u
x0 ) Du0 f (
Du f ( x0 )
S n1 .
para toda u
S n1 entonces
Por otra parte, si u u S n1 de modo que
x0 ) Du0 f (
Du f ( x0 )
y como
Du0 f (
x0 ) = Df (
x0 )(
u0 )
= Df (
x0 )(
u0 )
= Du0 f (
x0 )
Du f (
x0 )
= Df (
x0 )(
u)
= Du f (
x0 )
obtenemos la otra desigualdad.

Supongamos ahora que Df ( x0 ) no es la constante cero (de modo que Df ( x0 )(
u0 ) > 0) y que
0 S n1 , u
existe u 0 6= u
0 , tal que Df ( u0 ) = Df (
x0 )( x0 )( 0 =
u0 ). Notese que si u u0 entonces
u
0 + u
0 = 0 y por lo tanto
x0 )(0)
0 = Df (
= Df ( u0 + u
x0 )( 0 )
= Df ( u0 ) + Df (
x0 )( x0 )(
u0 )
= 2Df (
x0 )(
u0 )
J. P
aez 168
de donde se tendra que Df (

x0 )(
u0 ) = 0. Por tanto, u 0 6= 0 de modo que si tomamos
0 + u
0 + u
u 0
u
= S n1
k
u0 + u0 k
entonces
1
Df (
x0 )(
u) = (Df ( u0 ) + Df (
x0 )( x0 )(
u0 ))
u0 + u
k 0 k
2
= Df (
x0 )(
u0 )
k
u0 + u0 k
Ahora, dado que u 0 S n1 y u
0 , u 0 =
6 u0 , u0 , por el inciso (b) del problema 9 del captulo 1 se
tiene que

u0 + u 0 < u0 + k
u0 k
=2
de donde
2
1<
u0
k +u0 k
y por lo tanto
2
Df (
x0 )(
u0 ) < Df (
x0 )(
u0 )
u0
k +u0 k
= Df (
x0 )(
u)
lo cual contradice la propiedad de que Df (

x0 )(
u0 ) es el valor m
aximo de Df (
x0 ) sobre el conjunto
S n1 .
Como seguramente el lector ya se estar a preguntando, el siguiente problema que abordaremos

sera el de calcular esta direcci on u 0 en la cual la derivada direccional alcanza su m aximo valor.
Como siempre, este c alculo depende de que se tenga una expresi on explcita de la funcion en cuesti on
(en algun sistema coordenado), y de la forma en que se represente a su derivada.
Y justo en la soluci
on de este problema es que echaremos mano de la otra forma en que podemos
representar a una funci on lineal de Rn en R. Como se recordara, adem as de usar el lenguaje de
matrices para representar a estas funciones lineales, tambien podemos usar un vector y el producto
punto en Rn , como lo escribimos en la expresi on 4.14.
Con base en esta expresi on, tenemos entonces que, si nuestra funcion f est a expresada en
terminos de las coordenadas x1 , . . . , xn (determinadas por la base {e1 , . . . , en }) y el vector (unitario)
u
tiene coordenadas (u1 , . . . , un ), entonces podemos escribir que
Du f (
x0 ) = Df (
x0 )(
u)
= (Df (
x0 )(
e1 ), . . . , Df ( en )) (u1 , . . . , un )
x0 )(
x0 )) (u1 , . . . , un )
x0 ), . . . , Den f (
= (De1 f (

f f
= (x0 ), . . . , x0 ) (u1 , . . . , un )
( (4.19)
x1 xn
Si ahora recordamos que

f f f f
(
x0 ), . . . , x0 ) (u1 , . . . , un ) =
( (
x0 ), . . . , ( k(u1 , . . . , un )k cos()
x0 )
x1 xn x1 xn
169 J. P
aez

f f
=
(
x0 ), . . . , ( cos()
x0 )
x1 xn
(identidad 1.6 del captulo 1) en donde es el angulo formado por estos vectores, concluimos que el
maximo valor de Du f (
x0 ) = Df (
x0 )(
u) (suponiendo que Df ( x0 ) no es la constante cero) se alcanza
cuando cos() = 1, es decir si = 0, lo que significa que el vector u 0 de la proposicion anterior
estar
a expresado por

f f
x1 (
x 0 ), . . . , xn (
x 0 )
u
0 =
f
(4.20)
f
(
x ), . . . , (
x )

x1 0 xn 0
Dado que siempre que tomemos un sistema de coordenadas x1 , . . . , xn (inducido por una base
ortonormal {
e1 , . . . , en }), el vector con coordenadas

f f
(
x0 ), . . . , (
x0 ) (4.21)
x1 xn
es tal que al hacerlo unitario (cuando no sea el vector 0) representa al vector cuya existencia
probamos en la proposici
on 4.18, el vector 4.21 recibe un nombre especial: el gradiente de f en x
0
y lo denotaremos por f (x0 ), es decir

f f
f (
x0 ) := (
x0 ), . . . , (
x0 ) (4.22)
x1 xn
Es importante insistir en que, si tomamos otro sistema de coordenadas x1 , . . . , xn (inducido por

otra base ortonormal {e1 , . . . , en }), el vector con coordenadas

f f
(
x0 ), . . . , (
x0 )
x1 xn
nuevamente es tal que

f f
x1 (
x0 ), . . . , x (
n
x0 )
u
0 =
f

f
x (
x0 ), . . . , x (
x0 )

1 n
en donde u0 es el multicitado vector cuya existencia probamos en la proposici on 4.18 (prueba que
por cierto, hicimos sin recurrir a algun sistema coordenado especfico). En virtud de lo anterior,
usaremos la expresion f (x0 ) como una forma de referirnos a este vector u 0 , recordando siempre
que en un sistema de coordenadas especfico x1 , . . . , xn , sus coordenadas est an dadas por 4.22, y

que para obtener sus coordenadas en otro sistema x1 , . . . , xn , simplemente habra que recurrir a la
identidad 4.17.
Desde un punto de vista m as pr
actico, el vector gradiente de f en x 0 tiene dos usos importantes:
uno, para representar (y expresar) a la derivada de f en x 0 (identidad 4.19), es decir que
Df ( x) = f (
x0 )( x0 ) x

para toda x Rn ; y dos, para designar la direcci

on en la que f tiene la m axima raz
on de cambio,
es decir, la direcci
on en la que su derivada direccional (en x0 ) alcanza su maximo valor (identidad
4.20). Con base en lo anterior, lo siguiente que haremos ser a ilustrar con un ejemplo estos dos usos.
J. P
aez 170
Ejemplo 4.19 Sea f : R2 R que est

on
f (x, y) = 8 x2 y 2 + x y
yx
0 = (2, 1). Tenemos entonces que
f
(x, y) = 2x + 1
x
y
f
(x, y) = 2y 1
y
de modo que

f f
f (2, 1) = (2, 1), (2, 1)
x y
= (3, 3)
Por tanto, la derivada de f en (2, 1) (Df (2, 1)) es la funci

on lineal dada por la expresi
on
Df (2, 1)(x, y) = f (2, 1) (x, y)

= (3, 3) (x, y)
= 3x 3y
de tal forma que la funci

on afn
Df (2, 1)(x 2, y 1) + f (2, 1) = 3(x 2) 3(y 1) + 4
es la que debe satisfacer la condici

on 4.13 de la definci
on 4.14.
En efecto, se tiene que
f (x, y) (Df (2, 1)(x 2, y 1) + f (2, 1))

lim
(x,y)(2,1) k(x, y) (2, 1)k
8 x2 y 2 + x y (3(x 2) 3(y 1) + 4)
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
x2 + 4x y 2 + 2y 5
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
(x 2)2 (y 1)2
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
(x 2)2 + (y 1)2
= lim p
(x,y)(2,1) (x 2)2 + (y 1)2
p
= lim (x 2)2 + (y 1)2
(x,y)(2,1)
=0
Por otra parte, se tiene que el vector
f (2, 1)
u
0 =
kf (2, 1)k
171 J. P
aez
1
=p (3, 3)
(3)2
+ (3)2

1 1
= ,
2 2
es el vector que determina la direcci on en la que, parados en el punto (2, 1), obtenemos la m axima
razon de cambio de la funci on f . O en terminos geometricos, si cortamos a la gr afica de f por
el plano perpendicular al plano XY que contiene
a la recta que pasa por el punto (2, 1), y cuya
direccion est a dada por el vector (1/ 2, 1/ 2), entonces obtenemos la curva que en el punto
(2, 1, f (2, 1)) = (2, 1, 4) tiene la recta tangente de maxima pendiente (ver figura 4.6).

u
X 0
x
Figura 4.6: En el ejemplo 4.19, el plano perpendicular

al
plano XY que pasa por el punto x 0 = (2, 1), y
cuya direcci
on est = (1/ 2, 1/ 2), contiene a la curva y a su recta tangente,
a dada por el vector u
que resulta ser la de maxima pendiente que pasa por el punto (2, 1, f (
x0 )) = (2, 1, 4).
4.3.2 Otras propiedades de la derivada

Una vez establecidas estas importantes propiedades del gradiente, continuaremos con el an alisis de
las condiciones necesarias y suficientes de la derivabilidad de una funcion. La siguiente propiedad
que veremos es una condici on necesaria, y por lo tanto nos sera muy u til para determinar cuando
una funcion no es derivable. Esta condicion es una generalizaci
on (al tipo de funciones que estamos
tratando) de la propiedad que ya sabamos para el caso de funciones de R en R, y que simplemente
nos asegura que, si una funcion es derivable en un punto entonces debe ser continua en ese mismo
punto.
on 4.20 Sea f : U Rn R. Si f es derivable en x
Proposici 0 U entonces f es continua en
x
0 .
Demostraci
on. Como f es derivable en x
0 sabemos que
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx 0 k
J. P
aez 172
y como
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
x) f (
f ( x0 ) Df ( xx
x0 )( 0 ) = k
xx
0 k
k
xx 0 k
6= x
si x 0 , tenemos entonces que

x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
x) f (
lim (f ( x0 ) Df ( xx
x0 )( 0 )) = lim k
xx
0 k
x

x0 x

x0 k
xx 0 k
=0
Por otra parte, por el problema 56 del captulo 2 sabemos que toda funcion lineal es continua, de
tal forma que
lim Df ( xx
x0 )( 0 ) = lim (Df ( x) Df (
x0 )( x0 )(
x0 ))
x

x0 x

x0
=0
y por lo tanto
x) f (
lim (( x) f (
x0 )) = lim [(f ( x0 ) Df ( xx
x0 )( 0 )) + Df ( xx
x0 )( 0 )]
x

x0 x

x0
x) f (
= lim (f ( x0 ) Df ( xx
x0 )( 0 )) + lim Df ( xx
x0 )( 0 )
x

x0 x

x0
=0
lo que prueba que f es continua en x

0 .
Como sucede en el caso real, la condici

on anterior no es suficiente. Es decir, no es suficiente que
una funcion sea continua en un punto x 0 para que esta sea derivable en dicho punto. El ejemplo
que vamos a dar es la generalizacion del que se suele dar para ilustrar el mismo hecho en el caso
de funciones de R en R (la funcion valor absoluto).
Ejemplo 4.21 Sea f : Rn R definida como
x) = k
f ( xk
Como sabemos, f es continua para toda x = 0. Sin embargo, mostraremos

Rn , en particular para x
que f no es derivable en 0. Para ello, primero mostraremos que en el 0 no existe la derivada di-
Rn tal que k
reccional para cualquier vector u uk = 1. En efecto, por definicion sabemos que
f (0 + h
u) f (0)
Du f (0) = lim
h0 h

kh uk 0
= lim
h0 h
|h|
= lim
h0 h
y como el lector recordar

a, este u
ltimo lmite no existe. Por lo tanto, por la proposici
on 4.16 f no
es derivable en el
0.
173 J. P
aez
Y ya que estamos en los contraejemplos y aprovechando la proposici on anterior, mostraremos

que el recproco de la proposici
on 4.16 no es cierto; es decir, que la existencia de todas las derivadas
direccionales de una funci on f en un punto x 0 de su dominio, no es suficiente para poder asegurar
que f sea derivable en dicho punto.
Ejemplo 4.22 Sea f : R2 R definida como

2
x y

x4 +y2 si (x, y) 6= (0, 0)
f (x, y) =

0 si (x, y) = (0, 0)
existe para cualquier vector u

Mostraremos primero que la derivada direccional Du f (0) = (u1 , u2 )
n
R tal que k
uk = 1.
Supongamos primero que u2 6= 0. En este caso se tiene que
f (0 + hu) f (0)
Du f (
0) = lim
h0 h
(hu1 )2 (hu2 )

1
= lim
h0 h (hu1 )4 + (hu2 )2
!
1 h3 u21 u2
= lim
h2 h2 u41 + u22

h0 h
u21 u2
= lim
h0 h2 u4
1 + u2
2
u2
= 1
u2
y si u2 = 0, es decir que u
= (1, 0) = e1 , entonces
f (0 + h
u) f (0)
Du f (
0) = lim
h0 h
f (h, 0) f (0, 0)
= lim
h0 h
00
= lim
h0 h
=0
existe para cualquier vector u

lo que prueba que Du f (0) Rn tal que k
uk = 1.
2
Por otra parte, si evaluamos a f en puntos de la forma (t, t ), con t 6= 0, se tiene que
(t)2 t2
f (t, t2 ) =
(t)4 + (t2 )2
t4
= 4
t + t4
1
=
2
de tal forma que, como (t, t2 ) (0, 0) si t 0, concluimos que f no es continua en el 0 y por la
on 4.20, que f no es derivable en el 0.
proposici
J. P
aez 174
Si bien es cierto que la existencia de las derivadas direccionales de una funcion f en un punto
x
0 no es suficiente para garantizar su derivabilidad en dicho punto, un an alisis mas de cerca del
ejemplo anterior nos puede arrojar luz sobre cu ales hip
otesis adicionales habra que considerar para
poder asegurar la derivabilidad de f en x 0 .
Lo primero que haremos ser a mostrar que la funcion del ejemplo anterior s es derivable en
cualquier punto x
= (x, y) 6= 0. Para ello, como ya sabemos, ser a necesario calcular las derivadas
parciales f /x y f /y en x y mostrar que la funcion lineal representada por la matriz
h i
f f
x (x, y) y (x, y)
satisface la condici
on establecida en la definicion 4.14.
Con base en varios de los incisos de la proposici on 4.11 y en los calculos realizados en el ejemplo
anterior, tenemos que
2xy(y 2 x4 )

(x4 +y2 )2 si (x, y) 6= (0, 0)
f
(x, y) = (4.23)
x
0 si (x, y) = (0, 0)
y 2 4 2
x (x y )

(x4 +y2 )2 si (x, y) 6= (0, 0)
f
(x, y) = (4.24)
y
0 si (x, y) = (0, 0)

= (x, y) R2 se tiene que

0 = (x0 , y0 ) 6= (0, 0), para cualquier otra x
Si ahora tomamos x
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|

f f
= f (x, y) f (x0 , y0 ) x0 )(x x0 )
( x0 )(y y0 )
(
x y

f f
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 )
x0 )(x x0 )
( x0 )(y y0 )
(
x y
R2 , por la proposici
Dado que las derivadas parciales f /x y f /y existen para toda x on
4.13 sabemos que
f f
f (x, y) f (x0 , y) = (x x0 ) (x , y) y f (x0 , y) f (x0 , y0 ) = (y y0 ) (x0 , y )
x y
y por tanto
|f (
x) (Df ( xx
x0 )( 0 ) + f (x0 ))|

f f
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 )
(x0 )(x x0 ) x0 )(y y0 )
(
x y

f f f f
= (x x0 ) (x , y) + (y y0 ) (x0 , y ) x0 )(x x0 )
( x0 )(y y0 )
(
x y x y

f f f f
= (x , y) x0 ) (x x0 ) +
( (x0 , y ) ( x0 ) (y y0 )
x x y y

f f f f
(x , y) x0 ) |x x0 | + (x0 , y )
( x0 ) |y y0 |
(
x x y y

f f f f
(x , y)
x0 ) k
( xx 0 k + (x0 , y )
x0 ) k
( xx 0 k
x x y y
175 J. P
aez

f f f f
= (x , y)
x0 ) + (x0 , y )
( x0 ) k
( xx
0 k
x x y y
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
0
k
xx 0 k

f f f f
(x , y)
x0 ) + (x0 , y )
( (
x0 )
x x y y
Si ahora notamos que, de acuerdo con las expresiones 4.23 y 4.23 de las derivadas parciales de f ,
estas son continuas en cualquier punto x 0 6= 0, y que los puntos (x , y) y (x0 , y ) tienden al punto
(x0 , y0 ) = x
0 si el punto x
= (x, y) tiende al punto (x0 , y0 ) = x
0 , tenemos que
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
0 lim
x

x0 k
xx 0 k

f f f f
lim (x , y)
(x0 ) + (x0 , y )
(
x0 )
x
x0 x x y y
=0+0
=0
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
lim =0
x

x0 k
xx 0 k
o equivalentemente que
x) (Df (
f ( xx
x0 )( 0 ) + f (
x0 ))
lim =0
x

x0 k
xx 0 k
es decir, que f es derivable en x 0 .

Ojala y el lector este de acuerdo en que el arduo trabajo que nos tomamos para probar que la
funcion del ejemplo 4.22 es derivable para cualquier x 0 R2 distinto del 0, ser
a redituable. En
efecto, notese que mas all a de la forma explcita de f , lo importante en la argumentacion anterior
fueron dos cosas:
1. que las derivadas parciales de f existieron para todos los puntos de R2 , y
2. que fueron continuas en x

0 .
Con respecto al punto 1, y como el lector estar a de acuerdo (dado el caracter local de la
derivada), en el desarrollo anterior hubiera bastado con que las derivadas parciales existieran en
una vecindad del punto x0 . Pues bien, lo que probaremos a continuaci
on es que estas dos condiciones
(con la modificaci
on propuesta a la primera), son suficientes para poder asegurar que una funci on
es derivable en un punto x0 , lo que dejaremos formulado en la siguiente
f
Proposici 0 U y r > 0 tal que Br (
x0 ) U . Si xi (
x) existe
f
Br (
para cada x x0 ) y xi 0 (para cada i {1, . . . , n}) entonces f es derivable en
es continua en x
x
0 .
J. P
aez 176

(0) (0)
Demostraci Br (
on. Sea x 6= x
x0 ), x 0 . Si x
0 = x1 , . . . , xn y x = (x1 , . . . , xn ), hacemos

(0)
i = x1 , ..., xi , xi+1 , ..., x(0)
x n
para cada i {1, . . . , n 1} y xn = x. Por el inciso (a) del problema 11 del captulo 1 sabemos
i Br (
que x x0 ) para cada i {1, . . . , n 1} y como Br ( x0 ) es un conjunto convexo entonces los
xi1 , xi ] Br (
segmentos [ x0 ) para cada i {1, . . . , n}.
Por otra parte, n otese que
x) f (
f ( x) f (
x0 ) = (f ( xn1 ) f (
xn1 )) + (f ( xn2 )) + + (f (
x2 ) f ( x1 ) f (
x1 )) + (f ( x0 ))
Xn
= xi ) f (
(f ( xi1 ))
i=1
Ahora, dado que

(0)
i x
x i1 = xi xi ei
on 4.13 sabemos que existe i [

por la proposici xi1 , x
i ] tal que
(0) f

xi ) f (
f ( xi1 ) = xi xi i
xi
para cada i {1, . . . , n}, de modo que
n
X
x) f (
f ( x0 ) = xi ) f (
(f ( xi1 ))
i=1
n f
(0)
i
X
= xi xi
xi
i=1

f f f
= 1 , 2 , . . . , n (
xx
0 )
x1 x2 x2
Por lo tanto
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
= |f (
x) f (x0 ) Df ( x0 )(xx 0 )|

f f f
1 , 2 , . . . , n

= (
xx0 ) f (x0 ) (
xx 0 )
x x x2
1 2
f f f
= 1 , 2 , . . . , n f (
x0 ) (
xx 0 )
x x2 x2
1
f f f
1 , 2 , . . . , n

f (
x0 ) k(
xx 0 )k
x1 x2 x2
de modo que
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|
0
kxx 0 k

f f f
1 , 2 , . . . , n f (
x 0 )
x1 x2 x2
177 J. P
aez
Si ahora recordamos que por el inciso (b) del problema 11 del captulo 1 se tiene que

0 k
i x xx0 k

entonces i x x
0 si x 0 de modo que, como f
xi 0 (para cada i {1, . . . , n}),
es continua en x
tenemos que
|f (
x) (Df ( xx
x0 )( 0 ) + f ( x0 ))|
0 lim
x

x0 kxx 0 k

f f f
lim 1 , 2 , . . . , n f (
x 0 )
x

x0 x1 x2 x2
= kf (
x0 ) f (
x0 )k
=0
es decir
|f (
x) (Df ( xx
x0 )( 0 ) + f (
x0 ))|
lim =0
x

x0 k
xx 0 k
lo que prueba que f es derivable en x
0 .
Es importante hacer notar que la condici on de la proposici on anterior solo es una condicion
suficiente de la derivabilidad de f en x
0 ; es decir, si bien es cierto que la existencia de la derivada
de f en x0 garantiza la existencia de todas sus derivadas direccionales en este punto (incluyendo
sus derivadas parciales), este hecho ni siquiera garantiza que existan todas las derivadas parciales
de f en todos los puntos de alguna vecindad de x 0 . Esta ultima afirmacion la ilustramos en el
siguiente
f (x, y) = |xy|
N
otese que
f f (h, 0) f (0, 0)
(0, 0) = lim
x h0 h
|h0| |00|
= lim
h0 h
=0
y que
f f (0, h) f (0, 0)
(0, 0) = lim
y h0 h
|0h| |00|
= lim
h0 h
=0
Por lo tanto, tomando a Df (0, 0) como la constante 0, tenemos que

f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
0 lim
(x,y)(0,0) k(x, y) (0, 0)k
J. P
aez 178
|xy|
= lim
(x,y)(0,0) k(x, y)k
k(x, y)k2
lim
(x,y)(0,0) k(x, y)k
= lim k(x, y)k

(x,y)(0,0)
=0
de modo que
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
lim =0
(x,y)(0,0) k(x, y) (0, 0)k
lo que prueba que f es derivable en el (0, 0).
Por otra parte, notese que tomando cualquier punto de la forma (x0 , 0), con x0 6= 0, de acuerdo
con la definici
on de derivada parcial, se tiene que
f f (x0 , h) f (x0 , 0)
(x0 , 0) = lim
y h0 h
|x0 h| 0
= lim
h0 h
|h|
= |x0 | lim
h0 h
y como este ultimo lmite no existe, entonces f y (x0 , 0) no existe. An

alogamente, para cualquier
punto de la forma (0, y0 ), con y0 6= 0, se tiene que
f f (h, y0 ) f (0, y0 )
(0, y0 ) = lim
x h0 h
|hy0 | 0
= lim
h0 h
|h|
= |y0 | lim
h0 h
de modo que fx (0, y0 ) tampoco existe. Por tanto, en cualquier vecindad del (0, 0) se tiene que
existen puntos para los cuales f f
x y y no existen, que es lo que deseabamos mostrar (ver figura
4.7).
Aun y cuando el ejemplo anterior muestra sin lugar a dudas que la proposici on 4.23 s
olo nos
proporciona una condicion suficiente de la derivabilidad de una funcion en un punto, nos tomaremos
el trabajo de dar otro ejemplo en el que, a diferencia del ejemplo anterior, las derivadas parciales
si existen en una vecindad del punto en cuesti on, y lo u
nico que no sucede es que sean continuas
en el punto en el que la funci
on si es derivable.

2 2
(x + y ) sen 1
si (x, y) 6= (0, 0)

x2 +y 2

f (x, y) =

0 si (x, y) = (0, 0)

179 J. P
aez
X Y
Figura 4.7: Grafica de la funcion f (x, y) = |xy| (del ejemplo 4.24) cuyas derivadas parciales no existen
en los puntos de la forma (x, 0), con x 6= 0 y (0, y), con y 6= 0.
En este caso tenemos que

f f (h, 0) f (0, 0)
(0, 0) = lim
x h0
h
1
= lim h sen
h0 |h|
=0
y
f f (0, h) f (0, 0)
(0, 0) = lim
y h0 h

1
= lim h sen
h0 |h|
=0
y si (x, y) 6= (0, 0), con base en la proposici on 4.11, obtenemos que

1 x 1
2x sen cos si (x, y) 6= (0, 0)

f
x2 +y 2 x2 +y 2 x2 +y 2
(x, y) =
x

0 si (x, y) = (0, 0)

y
1 y 1
2y sen cos si (x, y) 6= (0, 0)

f
x2 +y 2 x2 +y 2 x2 +y 2
(x, y) =
y

0 si (x, y) = (0, 0)

Si ahora tomamos puntos de la forma (t, 0), con t > 0, se tiene que

f 1 1
(t, 0) = 2t sen cos
x t t
J. P
aez 180
y como
1 1
lim 2t sen cos
t0 t t
no existe, concluimos que
f
lim (x, y)
(x,y)(0,0) x
no existe, de modo que f x no es continua en el (0, 0). An alogamente, evaluando en puntos de la

f
forma (0, t), con t > 0, concluimos que y no es continua en el (0, 0).

2 2 1
(x + y ) sen 2 2
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0)) x +y
lim = lim
(x,y)(0,0) k(x, y) (0, 0)k (x,y)(0,0) k(x, y)k
!
1
= lim k(x, y)k sen p
(x,y)(0,0) x2 + y 2
=0
lo que demuestra que f s es derivable en el (0, 0).
Con el ejemplo anterior concluimos el an alisis de las condiciones necesarias y suficientes rela-
cionadas con la derivabilidad de una funcion. Lo siguiente que haremos ser a mostrar la relacion
entre este concepto y la aritmetica de las funciones, la cual dejaremos plasmada en la siguiente
Proposicion 4.26 Sean f, g : U Rn R, x

0 U y R. Si f y g son derivables en x
0
entonces:
1. f + g es derivable en x
0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
2. f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y adem
as
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
x0 ) 6= 0, f /g es derivable en x
4. si g( 0 y adem
as
1
D(f /g)(
x0 ) = (g( x0 ) f (
x0 )Df ( x0 )Dg(
x0 ))
g 2 (
x 0)
Demostraci on. A manera de ejemplo, probaremos el inciso 3 y el resto quedar

an como problemas
para el lector. Una vez dicho lo anterior, n
otese que
x) (f g)(
(f g)( x0 ) [f (
x0 )Dg(
x0 ) + g(
x0 )Df ( xx
x0 )] ( 0 )
= f ( x) g(
x) [g( x0 )] + g( x) f (
x0 ) [f ( x0 )] [f (
x0 )Dg(
x0 ) + g(
x0 )Df ( xx
x0 )] ( 0 )
181 J. P
aez
= f ( x) g(
x) [g( x0 ) Dg( xx
x0 ) ( x) f (
0 )] + [f ( x0 )] Dg( xx
x0 ) ( 0 )
g( x) f (
x0 ) [f ( x0 ) Df ( xx
x0 ) ( 0 )]
de tal forma que
x) (f g)(
(f g)( x0 ) (f (
x0 )Dg( x0 ) + g( x0 )Df ( xx
x0 )) ( 0 )
kxx 0 k
g(x) g(x0 ) Dg( xx
x0 ) ( 0 ) Dg( xx
x0 ) ( 0 )
= f (x) x) f (
+ [f ( x0 )]
kxx 0 k kxx 0 k
x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
g(x0 )
k
xx 0 k
Para el primer y tercer sumando que aparecen en el lado derecho de esta u ltima identidad, dado
que f y g son derivables en x 0 (y por lo tanto continuas en ese mismo punto), podemos concluir
que

x) g(
g( x0 ) Dg( xx
x0 ) ( 0 ) x) g(
g( x0 ) Dg( xx
x0 ) ( 0 )
lim f (
x) = lim f ( x) lim
x
x0 kxx 0 k x

x0 x
x0 k
xx 0 k
= f (
x0 )0
=0
x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 ) x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
lim g(
x0 ) = g(
x0 ) lim
x

x0 kxx 0 k x
x0 kxx 0 k
= g(
x0 )0
=0
Por otra parte, por el inciso (c) del problema 7 del captulo 2, sabemos que existe M 0 tal que
|Df ( xx
x0 ) ( 0 )| M k
xx
0 k
Rn , y como f es continua en x
para toda x 0 , concluimos que

Dg(
x 0 ) (
x x
0 )
0 lim [f (
x) f (x0 )]
x

x0 kxx 0 k
M lim |f ( x) f (x0 )|
x

x0
= M0
=0
y por lo tanto que

Dg( xx
x0 ) ( 0 )
x) f (
lim [f ( x0 )] =0
x

x0 kxx 0 k
Sumando estos lmites, concluimos que
x) (f g)(
(f g)( x0 ) (f (
x0 )Dg(
x0 ) + g(
x0 )Df ( xx
x0 )) ( 0 )
lim =0
x

x0 k
xx 0 k
J. P
aez 182
de modo que la funci

on f g es derivable en x
0 y adem
as que
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
Para concluir con las propiedades de la derivada relacionadas con las operaciones entre fun-
ciones, formularemos (en dos proposiciones separadas) aquellas que nos hablan de la composici on
de funciones. Ser
an dos proposiciones diferentes puesto que existen dos formas de componer a una
funcion de Rn en R con funciones para las cuales tambien tenemos una definicion de derivada: por
on de R en R, o por la derecha, con una funcion de R en Rn . Ambas
la izquierda, con una funci
proposiciones ser
an un caso particular de un resultado mas general que veremos mas adelante (y
que se le conoce con el nombre de regla de la cadena).
Proposici 0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b)
R R. Si f es derivable en x x0 ) entonces g f es derivable en x
0 y g es derivable en f ( 0 y adem as
x0 ) = g (f (
D(g f )( x0 ))Df (
x0 )
Demostraci
on. Recordemos que, de acuerdo con la definicion 4.14, lo que tenemos que demostrar
es que
(g f )( x0 ) g (f (
x) (g f )( x0 ))Df ( xx
x0 )( 0 )
lim =0
x
x0 k
xx 0 k
raz
on por la cual empezaremos por buscar una expresi on adecuadamente equivalente al numera-
dor del cociente anterior.
Para ello, definamos
x) f (
kx = f ( x0 )
y observemos que, como f es derivable en x
0 entonces f es continua en x
0 (proposici
on 4.20), se
tiene que
x) f (
lim kx = lim (f ( x0 ))
x

x0 x

x0
=0
En el caso en que kx 6= 0, tenemos que
(g f )(
x) (g f )( x)) g(f (
x0 ) = g(f ( x0 ))
x0 + kx )) g(f (
g(f ( x0 ))
= kx
kx
x0 + kx )) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ))
kx
x0 + kx )) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ) + Df ( xx
x0 )( 0 ))
kx
x0 + kx )) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ))
kx
x0 + kx )) g(f (
g(f ( x0 ))
+ Df ( xx
x0 )( 0 )
kx
183 J. P
aez
de tal manera que
(g f )(
x) (g f )(x0 ) g (f (
x0 ))Df ( xx
x0 )( 0 )
x0 + kx )) g(f (
g(f ( x0 ))
= x) f (
(f ( x0 ) Df ( xx
x0 )( 0 ))
kx

g(f (x0 + kx )) g(f (
x0 ))
+ g (f (
x0 )) Df (
x0 )(xx0 )
kx
y por lo tanto
(g f )(
x) (g f )(x0 ) g (f (
x0 ))Df ( xx
x0 )( 0 )
(4.25)
k
xx 0 k

g(f (x0 + kx )) g(f (x0 )) f ( x) f (x0 ) Df ( xx
x0 )( 0 )
=
kx kxx 0 k

g(f (x0 + kx )) g(f (
x0 )) x
x 0
+ g (f (
x0 )) Df ( x0 )
kx k
xx
0 k
Como seguramente el lector ya habra notado, cada uno de los sumandos del lado derecho de esta
u
ltima identidad tienden a 0 cuando x x 0 . En efecto, los factores del primer sumando tienen

lmite; el primero tiende a g (f (
x0 )) (puesto que g es derivable en f ( x0 )) y el segundo tiende a 0
(puesto que f es derivable en x 0 ). En cuanto al segundo sumando, su primer factor tiende a 0
(nuevamente porque g es derivable en f ( x0 )) mientras que para el segundo factor, por el inciso (c)
del problema 7 del captulo 2, sabemos que existe M 0 tal que
|Df ( xx
x0 ) ( 0 )| M k
xx
0 k
de tal modo que

x
x 0
Df (
x 0 ) M
k
xx
0 k
y por lo tanto todo el sumando tiende a 0 cuando x x 0 .
Toda la argumentaci on anterior es correcta bajo el supuesto de que kx = f ( x) f (
x0 ) 6= 0; lo
que ahora mostraremos es que para considerar el caso en que kx = 0, ser a necesario introducir una
funcion auxiliar : U Rn R (1 ) definida de la siguiente forma

g(f (
x))g(f (
x0 ))

f (
x)f (
x0 ) x) f (
si f ( x0 ) 6= 0
(
x) =
g (f (

x0 )) x) f (
si f ( x0 ) = 0
Lo primero que haremos notar es que la igualdad 4.25 se escribe en terminos de la funcion como
x0 ) g (f (

(g f )(
x) (g f )( x0 ))Df ( xx
x0 )( 0 ) x) f (
f ( x0 ) Df ( xx
x0 )( 0 )
= (
x)
k
xx 0 k kxx 0 k

x
x 0
+ (x) g (f (
x0 )) Df (x0 )
kxx0 k
U, x
y que ahora esta identidad se cumple para toda x 6= x
0 .
1
Esto es lo que siempre se hace en todas las pruebas de las diferentes variantes de la regla de la cadena, como
seguramente el lector ya habr
a notado a estas alturas.
J. P
aez 184
Si ahora recordamos que f es continua en x 0 , y dado que g es derivable en f (

x0 ), aplicando el
resultado del problema 42 del captulo 2, sabemos que es continua en x 0 y por tanto
(g f )(
x) (g f )(x0 ) g (f (
x0 ))Df (x0 )( xx 0 )
lim
x

x0 kxx 0 k

x) f (
f ( x0 ) Df ( x0 )(xx 0 )
x
x 0
= lim ( x) + ( x) g (f (
x0 )) Df ( x0 )
x
x0 k
xx 0 k kxx 0 k

x) f (
f ( x0 ) Df ( xx
x0 )( 0 ) x
x 0
x) g (f (

= lim ( x) + lim ( x0 )) Df ( x0 )
x
x0 kxx 0 k x
x0 k
xx 0 k

x
x 0
x) g (f (

= (x0 )0 + lim ( x0 )) Df ( x0 )
x
x0 kxx 0 k

x
x 0
x) g (f (

= lim ( x0 )) Df ( x0 )
x
x0 kxx 0 k
=0
en donde la u
ltima identidad se satisface dado que
x) g (f ( x) g (f (

lim ( x0 )) = lim ( x0 ))
x

x0 x

x0
x0 ) g (f (
= ( x0 ))
= g (f (
x0 )) g (f (
x0 ))
=0
arrafos arriba, existe M 0 tal que

y que, como mencionamos p

x
x 0
Df (x0 ) M
k
xx0 k
Rn , x
para toda x 6= x
0 .
Como afirmamos anteriormente, a una funcion f de Rn en R tambien la podemos componer

(por la derecha) con una funci on de R en Rn , y para esta composici on tambien podemos es-
tablecer una regla de la cadena, es decir, una regla que establece que bajo la hip otesis de que
ambas funciones son derivables (en los puntos adecuados), entonces dicha composici on tambien es
derivable, y ademas nos da una forma de como calcular esta derivada. En la formulaci
on (y prueba)
de este resultado representaremos a la derivada de f atraves de su vector gradiente.
Proposici on 4.28 Sean f : U Rn R, x 0 U , : (a, b) R Rn tal que (a, b) U , y

t0 (a, b) tal que (t0 ) = x
0 . Si f es derivable en x 0 y es derivable en t0 entonces f es
derivable en t0 y ademas
(f ) (t0 ) = f (
x0 ) (t0 )
Demostraci on. Dado que la composici on f es una funcion de R en R, de acuerdo con la

defincion de la derivada de este tipo de funciones, debemos de mostrar que
(f )(t) (f )(t0 )
lim
tt0 t t0
existe. De esta forma, lo primero que haremos ser
a escribir de manera mas adecuada a este
cociente.
185 J. P
aez
Notese que, si (t) (t0 ) 6=

0, entonces
(f )(t) (f )(t0 )
t t0

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 )) + f ((t0 )) ((t) (t0 ))
=
t t0 k(t) (t0 )k

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 )) (t) (t0 )
= + f ((t0 ))
t t0 k(t) (t0 )k t t0
ltima identidad es facil concluir que, como: (t) (t0 ) si t t0 (puesto que es
De esta u
continua en t0 ya que es derivable en t0 ), que f es derivable en x
0 = (t0 ), y que la expresi
on
k(t) (t0 )k
t t0
est
a acotada en una vecindad de t0 pues

k(t) (t0 )k (t) (t0 )
lim
= tt
lim
tt0 t t0 0 t t0

= (t0 )
(nuevamente porque es derivable en t0 ), de modo que

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 ))
lim =0
tt0 t t0 k(t) (t0 )k
Y por el inciso 3 de la proposici on 2.33, se tiene que

(t) (t0 ) (t) (t0 )
lim f ((t0 )) = lim f ((t0 )) lim
tt0 t t0 tt0 tt0 t t0
= f ((t0 )) (t0 )
con lo cual obtendramos el resultado deseado.

Sin embargo (y como el lector ya habra notado), el argumento anterior s olo es correcto si (t)
(t0 ) 6= 0. Para que el razonamiento anterior sea valido incluso en el caso en el que (t) (t0 ) = 0,
nuevamente recurriremos a una funci on auxiliar que resuelve el problema.
Sea : (a, b) R R definida como

f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))

k(t)(t0 )k si (t) (t0 ) 6= 0
(t) =
si (t) (t0 ) = 0

0
Como se verificar facilmente, se tiene que

(f )(t) (f )(t0 ) k(t) (t0 )k (t) (t0 )
= (t) + f ((t0 ))
t t0 t t0 t t0
para toda t (a, b), t 6= t0 , y por otra parte, como el lector probara en el problema 10, es continua
en t0 de tal forma que
k(t) (t0 )k
lim (t) =0
tt0 t t0
J. P
aez 186
de modo que

(f )(t) (f )(t0 ) k(t) (t0 )k (t) (t0 )
lim = lim (t) + f ((t0 ))
tt0 t t0 tt0 t t0 t t0

= f ((t0 )) (t0 )
que es lo que deseabamos demostrar.
Esta u
ltima proposicion, adem as de proporcionarnos una regla de derivacion, tiene dos conse-
cuencias de caracter practico muy importantes. La primera de ellas se relaciona con los conjuntos
de nivel de una funcion f de Rn en R y el problema de determinar un vector que este en la di-
recci
on normal a dicho conjunto (en un punto especfico de este). Concretamente, mostraremos
0 pertenece al conjunto de nivel Nc (f ) (ver definicion 2.5 del captulo 2), entonces f (
que si x x0 )
es normal a Nc (f ) en x0 , afirmacion que dejaremos formulada en el siguiente corolario y cuya
demostracion se deja al lector.
Corolario 4.29 Sea f : U Rn R derivable en x 0 U tal que f (x0 ) 6= 0. Si x

0 Nc (f ) (el
conjunto de nivel c de f ) entonces f (
x0 ) es normal a Nc (f ) en x 0 . Es decir que para cualquier
: (a, b) R Rn tal que: (t) Nc (f ) para toda t (a, b), es derivable en t0 (a, b), y
(t0 ) = x
0 , se tiene que
f ((t0 )) (t0 ) = 0
Como se ilustro en el captulo 2, una buena cantidad de objetos geometricos muy conocidos se
pueden ver como conjuntos de nivel de una funcion de Rn en R, como es el caso de ciertas curvas
en R2 , o ciertas superficies en R3 ; y lo importante del corolario anterior es que nos proporciona los
elementos suficientes para poder calcular (de forma muy sencilla) rectas o planos tangentes (seg un
sea el caso) a estos objetos. A continuaci on, daremos un par de ejemplos en los que se muestra
como usar esta propiedad del gradiente de una funcion.
Ejemplo 4.30 Consideremos:
1. la curva determinada por la ecuaci

on
(x2 + y 2 2x)2 = 4(x2 + y 2 )
la cual corresponde a la muy conocida cardiode. Como se podr a observar en la figura 4.8,
esta curva no es posible obtenerla (completa) como la gr on de R en R, ni es
afica de una funci
f
acil encontrar una parametrizacion (cartesiana) de ella, lo que imposibilita el uso de algunos
metodos (ya conocidos) para el c alculo de la recta tangente en cada uno de sus puntos. Lo
que si es sencillo, es observar que la cardiode es el conjunto de nivel 0 de la funcion
f (x, y) = (x2 + y 2 2x)2 4(x2 + y 2 )
lo que resultar
a muy conveniente si se quiere calcular sus rectas tangentes.
Para esta funci

on se tiene que
f
(x, y) = 2(x2 + y 2 2x) (2x 2) 8x
x
187 J. P
aez
Figura 4.8: La curva cardiode del ejemplo 4.30 y cuya ecuacion cartesiana esta dada por (x2 +y 2 2x)2 =
4(x2 + y 2 ).
y
f
(x, y) = 2(x2 + y 2 2x) (2y) 8y
y
de tal forma que
f (x, y) = 4 (x2 + y 2 2x) (x 1) 2x, y(x2 + y 2 2x 2)

= 4 (x 1)2 + y 2 1 (x 1) 2 (x 1) 2, y (x 1)2 + y 2 3

= 4 (x 1) (x 1)2 + y 2 3 2, y (x 1)2 + y 2 3
de modo que, si f (x0 , y0 ) 6= (0, 0), este vector es normal a la curva (en el punto (x0 , y0 )) y
se tiene que la recta dada por la ecuaci on
f (x0 , y0 ) (x x0 , y y0 ) = 0
o equivalentemente
f f
(x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) = 0
x y
es la ecuacion de la recta tangente a la curva (en el punto (x0 , y0 )).
Si en particular tomamos los puntos en que la cardiode intersecta al eje Y , es decir los puntos
(0, 2) y (0, 2), se tiene que
f (0, 2) = (16, 16) y f (0, 2) = (16, 16)
de modo que la ecuaci

on de las respectivas rectas tangentes est
an dadas por
16x + 16(y 2) = 0 o y =x+2
y
16x 16(y + 2) = 0 o y = x 2
lo que, de acuerdo con la figura 4.8, era de esperarse.
J. P
aez 188
2. la superficie determinada por la ecuaci

on
x2 y 2 z 2
+ 2 + 2 =1
a2 b c
la cual corresponde a un elipsoide con centro en el (0, 0, 0) (ver figura 4.9). Como en el caso
de la cardiode, esta superficie tampoco se puede obtener (completa) como la gr afica de una
funcion de R2 en R. Y aun y cuando algunas partes de esta superfice se pueden ver como
una de estas gr aficas, en terminos de los c alculos que hay que realizar (usando la ecuaci on
4.15), resulta mucho mas f acil observar que esta superficie se puede obtener como el conjunto
de nivel 1 de la funci on
x2 y 2 z 2
f (x, y, z) = 2 + 2 + 2
a b c
y como x y z
f (x, y, z) = 2 2 , 2 , 2
a b c
si (x0 , y0 , z0 ) es cualquier punto del elipsoide, entonces f (x0 , y0 , z0 ) 6= (0, 0, 0) y por lo tanto
la ecuaci on del plano tangente en este punto estar a dada por
x y z
0 0 0
f (x0 , y0 , z0 ) (x x0 , y y0 , z z0 ) = 0 = 2
, 2 , 2 (x x0 , y y0 , z z0 )
a b c
la cual, al simplificarla, se reduce a la ecuacion
x y z
0 0 0
x + y + z=1
a2 b2 c2
x2 y2 z2
Figura 4.9: El elipsoide determinado por la ecuacion 8 + 3 + 5 = 1, analogo al del ejemplo 4.30.
Otra interpretacion del resultado de la proposicion 4.28 que tendra un uso muy importante, es el
siguiente: si f : U Rn R, x 0 U , : (a, b) R Rn , con (a, b) U , y t0 (a, b), son tales
que (t0 ) = x
0 , es un hecho que la composici on (f )(t) = f ((t)) refleja el comportamiento de f
sobre los puntos de la curva recorrida por la funcion . Con base en lo anterior, es facil convencerse
de que la derivada de esta composici on en t0 se puede interpretar como la raz on de cambio de f en
x
0 cuando nos aproximamos a este punto por la curva descrita por . Aqu es importante destacar
189 J. P
aez
que resulta natural que esta razon de cambio se vea afectada por la velocidad con la que se
aproxima al punto x0 , lo que queda evidenciado en la formula
(f ) (t0 ) = f ((t0 )) (t0 ) (4.26)
De esta manera, si lo que deseamos es interpretar a (f ) (t0 ) como la raz on de cambio de f en

x
0 (cuando nos acercamos a este punto por la curva descrita por la funcion ), es importante que
sea tal que (t0 ) 6= 0.
De hecho, si suponemos que es una parametrizacion por longitud de arco, es decir que k (t)k =
1 para cada t (a, b), para que no haya problema con la velocidad (o para ser mas exactos, con
la rapidez) con la que nos apriximamos a x 0 , la derivada de f en t0 no es mas que la derivada
direccional de f en x on del vector (t0 ) (que ahora sera de norma 1).
0 , en la direcci
En efecto, si ahora usamos la notaci on Df ( x0 ) para referirnos a la derivada de f en x
0 , usando
la proposici
(f ) (t0 ) = f ((t0 )) (t0 )

x0 )( (t0 ))
= Df (
= D (t0 ) f (
x0 )
olo se tiene que (t0 ) 6=

y mas aun, si s 0 (aunque este vector no sea de norma 1), la identidad 4.26
se puede escribir como
(f ) (t0 ) = f ((t0 )) (t0 )

(t0 )
= (t0 ) f ((t0 ))

k (t0 )k

(t0 )
= (t0 ) Df (

x0 )
k (t0 )k

= (t0 ) D (t0 ) f (x0 ) (4.27)
k (t0 )k
Que la razon de cambio de una funci on f sobre la curva descrita por una funcion en un punto
x
0 sea igual a la derivada direccional de f en x on de (t0 ) (normalizado) multiplicada
0 , en la direcci
por la rapidez con que se aproxima a x 0 , no hace mas que confirmar que el concepto de derivada
es un concepto local (simplemente recuerde el lector que, cerca del punto x 0 = (t0 ), y su recta
tangente se parecen mucho).
Ilustremos la discusion anterior con el siguiente
Ejemplo 4.31 Sean f : R2 \ {(0, 0)} R definida como

xy
(x, y) =
x2 + y 2
y : R R2 definida como (t) = (r cos(t), r sen(t)). N

otese que
(f )(t) = f ((t))
(r cos(t)) (r sen(t))
=
(r cos(t))2 + (r sen(t))2
cos(t) sen(t)
=
cos2 (t) + sen2 (t)
J. P
aez 190
= cos(t) sen(t)
de modo que
(f ) (t) = cos(t) sen (t) + cos (t) sen(t)
= cos2 (t) sen2 (t)

f f
f (x, y) = (x, y), (x, y)
x y
!
y x2 + y 2 2x (xy) x x2 + y 2 2y (xy)

= ,
(x2 + y 2 )2 (x2 + y 2 )2
!
y y 2 x2 x x2 y 2

= ,
(x2 + y 2 )2 (x2 + y 2 )2
y
(t) = (r sen(t), r cos(t))
de tal forma que, de acuerdo con la identidad 4.26 se debe tener que
(f ) (t)
= f ((t)) (t)

(r sen(t)) (r sen(t))2 (r cos(t))2 (r cos(t)) (r cos(t)) 2
(r sen(t))2
= , (r sen(t), r cos(t))

2 2
2 2
(r cos(t)) + (r sen(t))2 (r cos(t)) + (r sen(t))2
1
sen(t) sen2 (t) cos2 (t) , cos(t) cos2 (t) sen2 (t) (r sen(t), r cos(t))

=
r
= cos2 (t) sen2 (t) [( sen(t), cos(t)) ( sen(t), cos(t))]

= cos2 (t) sen2 (t)

lo cual coincide con el primer c
alculo que hicimos.
La identidad
(f ) (t0 ) = (t0 ) D

(t0 ) f (
x0 )
k (t0 )k
(bajo el supuesto de que (t0 ) 6=

0) tendra implicaciones pr
acticas muy importantes, sobre todo en
lo relacionado con el c
alculo de la derivada de una funcion f cuando esta este descrita en terminos
de coordenadas diferentes a las cartesianas, como las que mencionamos en el captulo 1. Y justo
esto es lo que nos disponemos a desarrollar en la siguiente secci on.
4.3.3 La derivada en otras coordenadas

En el captulo 1 introdujimos, para el caso particular de los puntos o vectores del plano o del
espacio, otros sistemas de coordenadas diferentes de las coordenadas cartesianas. En ese captulo
ya describimos las caractersticas mas importantes de esas otras coordenadas, de tal forma que aqu
las vamos a usar con toda libertad.
Nuestro objetivo en esta secci on, es encontrar una representacion de la derivada de una funci
on
que esta dada en terminos de algunas de estas coordenadas. Para ello, es importante tener presentes
los siguientes dos hechos:
191 J. P
aez
1. dado que la derivada es una funcion lineal, para tener una representacion de ella es suficiente
con conocer sus valores en los elementos de una base ortonormal de R2 o R3 (dependiendo de
d
onde este contenido el dominio de la funcion con la que estemos tratando), y
2. si nuestra funci on esta expresada en terminos de algunas de estas coordenadas (polares,

cilndricas o esfericas), los u
nicos c
alculos que estaremos en condiciones de hacer, consistiran
en derivar estas expresiones con respecto a las variables en las que esten escritas.
Empezaremos por analizar el segundo punto, y para ello supondremos que tenemos una funci on
f : U R2 R que est a expresada en terminos de las coordenadas polares (, ) de cada punto
U.
x
Derivar la expresi
on que define a la funcion f con respecto a una de sus variables, por ejemplo
, significara que en dicha expresi
on solo consideraremos como variable a , y a la variable
la trataremos como una constante. En terminos mas elementales, es decir, recordando que todo
proceso de derivacion con respecto de una variable consiste en el calculo de un lmite (independien-
temente de que para obtener estas derivadas hagamos uso de algunas de las reglas de derivaci on
que ya conocemos), lo que estaremos haciendo es obtener el siguiente lmite:
f ( + h, ) f (, )
lim (4.28)
h0 h
Sin duda que el cociente que aparece en el lmite anterior representa una raz on de cambio de
la funcion f , y lo que analizaremos con mas cuidado es sobre que puntos del dominio de f se
est
a calculando esta raz on de cambio. Para tener una idea mas precisa de que tipo de puntos
son aquellos cuyas coordenadas polares son de la forma ( + h, ), recurriremos a las formulas de
conversion entre coordenadas polares y coordenadas cartesianas que dedujimos en el captulo 1.
De esta forma, si llamamos x U al punto cuyas coordenadas polares son (, ), tenemos que
las coordenadas cartesianas de x est
an dadas por la pareja ( cos(), sen()), y si llamamos xh U
al punto cuyas coordenadas polares son ( + h, ), sus coordenadas cartesianas estar an dadas por
(( + h) cos(), ( + h) sen()). Notese entonces que
x
h = (( + h) cos(), ( + h) sen())
= ( cos(), sen()) + h(cos(), sen())
=x
+ h(cos(), sen())
lo que significa que x

h siempre es un punto que est a en la recta que pasa por x, en la direcci
on del
vector (cos(), sen()) (justo la que hace un angulo con el eje polar) (ver figura 4.10).
En virtud de lo anterior, si denotamos por e (
x) al vector de coordenadas (cartesianas) (cos(), sen()),
tenemos que el lmite 4.28 se reescribe como
f ( + h, ) f (, ) f (
x + h x)) f (
e ( x)
lim = lim
h0 h h0 h
de tal forma que, por la definicion 4.2 y la proposici
f ( + h, ) f (, ) f (x + h x)) f (
e ( x)
lim = lim
h0 h h0 h
= De (x) f (
x)
= Df (
x)(
e (
x))
J. P
aez 192
Y
( + h, )
x
h
(, )
x

e (
x)
sen()
b
cos() X
Figura 4.10: Si un vector x tiene coordenadas polares (, ), entonces el vector xh de coordenadas

polares ( + h, ) esta en la misma direcci
on que x
(si y + h tienen el mismo signo), y que el vector
unitario e (
x) de coordenadas cartesianas (cos(), sen()).
f ( + h, ) f (, )
Df (
x)(
e (
x)) = lim (4.29)
h0 h
Esta u ltima identidad es muy afortunada ya que nos dice que el proceso de derivaci on con
respecto de la variable que describimos al inicio de esta discusion, coincide con ser la evaluaci on
de la derivada de f en x (Df (
x)) en el vector unitario e (
x), lo que sin duda es de mucha ayuda
para lograr nuestro objetivo (el de obtener una expresi on de Df ( x), como lo mencionamos al inicio
de esta secci on).
Como seguramente el lector estar a de acuerdo, lo que ahora habra que hacer es la otra
derivada, es decir, derivar la expresi on que define a f con respecto de la variable (tratando
a la variable como constante), y esperar que esta otra derivada tambien coincida con ser la
evaluaci on de la derivada de f en x (Df (x)) en alg
un otro vector unitario, que junto con el vector
e ( 2
x), forme una base ortonormal de R (so nar no cuesta nada!). Aun y cuando este sue no no se
nos cumplira completo, lograremos despertar con una soluci on al problema que nos planteamos
resolver en esta secci on! Manos a la obra!
Derivar la expresi on que define a f con respecto de la variable (tratando a la variable como
constante), nuevamente se traduce en calcular el siguiente lmite:
f (, + h) f (, )
lim (4.30)
h0 h
Como en el caso anterior, el cociente que aparece en este lmite tambien representa una raz on
de cambio de la funci on f , y lo que haremos otra vez, ser
a analizar sobre que puntos del dominio
de f se esta calculando esta raz on de cambio, para lo cual recurriremos nuevamente a las formulas
de conversi on entre coordenadas polares y coordenadas cartesianas.
Si como antes llamamos x al punto cuyas coordenadas polares son (, ), y x h ahora al de
coordenadas polares (, + h), tendremos que las correspondientes coordenadas cartesianas ser an
( cos(), sen()) y ( cos( + h), sen( + h)), respectivamente. Con base en estas coordenadas
cartesianas, es facil notar ahora que x yx h son puntos que pertenecen a la misma circuferencia (la
de radio con centro en el origen), y que si h es un n umero cercano a 0, entonces xh es un punto
cercano a x (ver figura 4.11).
193 J. P
aez
(, + h)
x
h
(, )
h x

Figura 4.11: Si un vector x tiene coordenadas polares (, ), entonces el vector x

h de coordenadas
polares (, + h) est
a en la misma circunferencia (la de radio ) que x
.
De esta forma, la derivada con respecto de la variable de la funcion f (que se obtiene al

calcular el lmite 4.30) se puede interpretar como el calculo de la raz
on de cambio de la funcion f
cuando nos aproximamos a x por puntos de la misma circunferencia que pasa por este punto. Por
lo tanto, si parametrizamos esta circunferencia por la funcion : R R2 definida como
(h) = ( cos( + h), sen( + h))
el lmite 4.30) tambien se puede reescribir como

f (, + h) f (, ) f ((h)) f ((0))
lim = lim
h0 h h0 h
= (f ) (0)
Como seguramente el lector recordara, la proposici

on 4.28 nos asegura que
(f ) (0) = f ((0)) (0)

= f (
x) ( sen(), cos())
x) ( sen(), cos())
= f (
= Df (
x)( sen(), cos())
de tal forma que si ahora denotamos por e (

x) al vector de coordenadas cartesianas ( sen(), cos())
(que es de norma 1 y perpendicular al vector e ( x)!), tenemos que
f (, + h) f (, )
lim = Df (
x)(
e (
x))
h0 h
Aun y cuando esta u ltima identidad no nos asegura que la derivada con respecto de la variable
de la funcion f sea exactamente igual a la derivada de f en x (Df (
x)) evaluada en alg
un vector
unitario (como sucedio en el caso anterior), si 6= 0, concluimos que
1 f (, + h) f (, )
Df (
x)(
e (
x)) = lim (4.31)
h0 h
Las identidades 4.29 y 4.31 nos proporcionan la soluci on al problema que nos planteamos al
incio de esta secci
on (para el caso de las coordenadas polares): como encontrar una representaci
on
de la derivada de una funcion que esta dada en terminos de este tipo de coordenadas.
J. P
aez 194
Es importante que el lector tenga claro la forma en que quedo resuelto este problema. Como
mencionamos en el punto n umero 1 al incio de esta secci
on, dado que la derivada de una funci on es
una funcion lineal, esta queda completamente determinada si se conocen sus valores en los elementos
de una base ortonormal (en este caso de R2 ). Y las identidades 4.29 y 4.31 justo nos proporcionan
estos valores para la base ortonormal formada por los vectores e ( x) y e (
x), que sin duda forman
una de estas bases. Lo que es importante destacar es que estos vectores dependen del punto en el
que estemos calculando la derivada de f (lo que por cierto, explica la notaci on que usamos para
representarlos); si cambiamos de punto, cambiamos de base en la cual estamos representando a la
funcion lineal Df (x) (ver figura 4.12).

x
e (
x) b
x

b
e x )
(
x )
e (
e (
x)
Figura 4.12: Cuando una funcion f esta dada en terminos de coordenadas polares, la derivada de f
se expresa en una base ortonormal que depende del punto en donde se evalue, {e (
x), e (
x)} para el
punto x, y {
e (
x ), e (
x )} para el punto x
.
El otro aspecto importante de la soluci on que encontramos a nuestro problema est a en la forma
en que estan dados los valores de la derivada de f en x (Df (
x)) en los vectores e (
x) y e (
x):
calculando lo unico que podamos calcular (como lo mencionamos en el punto 2 al inicio de esta
secci
on), la derivada con respecto a las variables y de la expresi on que define a f , y que se
obtienen por medio de los lmites que aparecen en las identidades 4.29 y 4.31.
Estas derivadas parciales, aunque an alogas a las que definimos en 4.9 no son del mismo tipo
en virtud de que no siempre resultan ser una derivada direccional. Por esta raz on, lo siguiente que
haremos ser a definir este otro tipo de derivadas parciales.
on 4.32 Sea f : U R2 R una funci

Definici on que est
a expresada en terminos de las coorde-
U . Si x
nadas polares (, ) de cada punto x 0 U tiene coordenadas polares (0 , 0 ), definimos:
f
1. la derivada parcial de f con respecto de en x
0 , que denotamos por (
x0 ), como
f f (0 + h, 0 ) f (0 , 0 )
(
x0 ) := lim
h0 h
f
2. la derivada parcial de f con respecto de en x
0 , que denotamos por (
x0 ), como
f f (0 , 0 + h) f (0 , 0 )
(
x0 ) := lim
h0 h
Con base en estas definiciones podemos resumir lo obtenido hasta ahora, de la siguiente manera:
si f : U R2 R es una funci on que est
a expresada en terminos de las coordenadas polares (, )
195 J. P
aez
de cada punto x U, y x0 U , x
0 6= (0, 0), tiene coordenadas polares (0 , 0 ), la derivada de f en
x
0 (Df (
x0 )) est
a representada en la base ortonormal formada por los vectores
e (
x0 ) := (cos(0 ), sen(0 ))
e (
x0 ) := ( sen(0 ), cos(0 ))
por la matriz (de 1 2) h i

f 1 f
(
x0 ) 0 (
x0 )
o por el vector
f 1 f
(
x0 ), (
x0 )
0
f 1 f
f (
x0 ) = (
x0 )
e (
x0 ) + (
x0 )
e (
x0 )
0
es decir que f x0 ) y 10 f
( (
x0 ) son las coordenadas del gradiente de f en x
0 (f (
x0 )) en la base
{
e (
x0 ), e (
x0 )} .
Por otra parte, y de acuerdo con las identidades 4.18 y 4.17, como
e (
x0 ) = (cos(0 ), sen(0 ))
= cos(0 )
e1 + sen(0 )
e2
e (
x0 ) = ( sen(0 ), cos(0 ))
= sen(0 )
e1 + cos(0 )
e2
se tiene que
h i h i cos( ) sen( )
f f f 1 f 0 0
x (
x0 ) y (
x0 ) = (
x0 ) 0 (
x0 )
sen(0 ) cos(0 )
(4.32)
y
h i h i cos( ) sen( )
f 1 f f f 0 0
(
x0 ) 0 (
x0 ) = x (
x0 ) y (
x0 )
sen(0 ) cos(0 )
(4.33)

f f 1 f
(
x0 ) = cos(0 ) (x0 ) sen(0 ) (x0 )
x 0
f f 1 f
(
x0 ) = sen(0 ) (x0 ) + cos(0 ) (x0 )
y 0
y
f f f
(
x0 ) = cos(0 ) ( x0 ) + sen(0 ) ( x0 )
x y
f f f
x0 ) = 0 sen(0 ) (
( x0 ) + 0 cos(0 ) (x0 )
x y
en donde recuerde que (0 , 0 ) son las coordenadas polares de x

0 .
J. P
aez 196
Con relacion a la condici

on que impusimos de que x 0 6= (0, 0), como el lector ya sabra, las
coordenadas polares del origen son cualquier pareja de la forma (0, ), en donde puede ser cualquier
valor. Este hecho imposibilita la eleccion de la base ortonormal { e (x0 ), e (
x0 )}, lo que a su vez
(en algunos casos) se ve reflejado en la imposibilidad de calcular el lado derecho de la identidad
4.31. Esto es lo que nos hace imponer la condici on de que x0 6= (0, 0).
El lector seguramente estara de acuerdo en que lo siguiente que habra que hacer es un ejemplo
que ilustre todo lo desarrollado en esta secci
on. Y eso es justo lo que haremos.
Ejemplo 4.33 Considere la funci on f : R2 R que est

a expresada en terminos de las coordenadas
2
R por
polares (, ) de cada punto x
f (, ) = (r 2 2r cos())2 4r 2
En este caso tenemos que

f
(, ) = 2(r 2 2r cos()) (2r 2 cos()) 8r

y
f
(, ) = 2(r 2 2r cos()) (2r sen())

de tal forma que la derivada de f en un punto x 6= 0 cuyas coordenadas polares sean (, ), es la
funci
on lineal Df (x) cuya matriz asociada (de 1 2) en la base ortonormal { e (
x), e (
x)} es
h i
f 1 f
= 2(r 2 2r cos()) (2r 2 cos()) 8r 4 sen()(r 2 2r cos())

(, ) r (, )
o la determinada por el vector que tiene coordenadas (tambien en la base { e (

x), e (
x)})
2(r 2 2r cos()) (2r 2 cos()) 8r, 4 sen()(r 2 2r cos())

es decir que
f (, ) = 2(r 2 2r cos()) (2r 2 cos()) 8r, 4 sen()(r 2 2r cos())

Si en particular tomamos el punto x 0 cuyas coordenadas polares son (2, /2), tenemos que las
0 en la base {
coordenadas del gradiente de f en x e (
x0 ), e (
x0 )} est
an dadas por
f (
x0 ) = (16, 16)
Si ahora el lector observa que la funcion f de este ejemplo es la misma funci on que dimos en el
inciso 1 del ejemplo 4.30 (basta con que recurra a las f ormulas de cambio de coordenadas para que
compruebe este hecho); que el punto x 0 que tiene coordenadas polares (2, /2), tiene coordenadas
onica {
cartesianas (0, 2) (en la base can e1 , e2 }); y que
e (
x0 ) = (cos(/2), sen(/2))
= (0, 1)
= 0
e1 + 1
e2
e (
x0 ) = ( sen(/2), cos(/2))
197 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.4. Derivadas direccionales de orden superior
= (1, 0)
= 1
e1 + 0
e2
de acuerdo con la identidad 4.18, se debe tener que

h
f f
i 0 1
x (
x0 ) y (
x0 ) = 16 16
1 0

= 16 16
o lo que es equivalente, que las coordenadas de f ( onica {

x0 ) en la base can e1 , e2 } deben estar
dadas por

f f
f (
x0 ) = (
x0 ), (
x0 )
x y
= (16, 16)
lo que coincide con lo obtenido en el ejemplo mencionado.
Aun y cuando el c olo lo hicimos para funciones de R2 en R expresadas en

alculo de la derivada s
terminos de coordenadas polares, para funciones de R3 en R expresadas en terminos de coordenadas
cilndricas o esfericas, el an
alisis es completamente an alogo al anterior y lo dejaremos como un par
de problemas para el lector.
4.4 Derivadas direccionales de orden superior

Si para una funci on f : U Rn R y un vector unitario u Rn fijo, se tiene que Du f (
x)
existe para todo x U , entonces Du f es nuevamente una funcion de U Rn en R, es decir,
Du f : U Rn R. De esta forma, todos los conceptos de derivacion que hasta ahora hemos
definido para una funci on f , los podemos trabajar para esta nueva funcion.
En particular, podemos ahora preguntarnos por la existencia de la derivada direccional de Du f
en un punto x U , en la direccion de cualquier otro vector unitario v Rn . De acuerdo con la
definicion 4.2, dicha derivada se denotara por Dv (Du f )(
x) y estara dada por
Du f ( v ) Du f (
x + h x)
Dv (Du f )(
x) := lim
h0 h
Mas aun, si ahora para u y v fijos, se tiene que Dv (Du f )( U , entonces
x) existe para toda x
Dv (Du f ) sera otra vez una funci n
on de U R en R y por tanto tiene sentido tomar otro vector
unitario w Rn y preguntarnos por la existencia de la derivada direccional de Dv (Du f ) en un
punto x U , en la direcci
on del vector w, es decir, si existe
Dv (Du f )( v ) Dv (Du f )(
x + h x)
Dw (Dv (Du f ))(
x) := lim
h0 h
Antes de seguir por este camino, tomemos un respiro y notemos lo siguiente: seguramente a
estas alturas, y tomando en cuenta resultados como los de la proposici on 4.23, el lector ya intuye la
importancia de las derivadas direccionales de una funcion f en la direcci on de los vectores de una
base ortonormal { e1 , . . . , en }, es decir, de las derivadas parciales. Por esta razon, y aun y cuando
las ideas planteadas en los p arrafos anteriores se pueden seguir trabajando en ese contexto mas
general, nos concentraremos en el caso particular de las derivadas parciales, ideas que dejaremos
expresadas en la siguiente
J. P
aez 198
4.4. Derivadas direccionales de orden superior Captulo 4. La derivada de funciones de Rn en R
Definici on 4.34 Sean f : U Rn R, x 0 U , r > 0 tal que Br ( x0 ) U , y x1 , . . . , xn las

f
coordenadas determinadas por una base ortonormal { e1 , . . . , en } de Rn . Si x i
(
x) existe para toda
Br (
x x0 ) definimos la segunda derivada parcial de f con respecto a xi y respecto a xj en x 0 , que
2f f
denotaremos por xj xi ( x0 ), como la derivada parcial de la funci on xi con respecto de xj en x 0 ,
es decir
f f
2f x (
x0 + h ej ) x (
x0 )
x0 ) := lim i
( i
xj xi h0 h
2f
Si j = i, la derivada anterior la denotamos por x2i
(
x0 ) y decimos que es la segunda derivada
parcial de f con respecto de xi , en x
0 .
Como en el caso de la (primera) derivada parcial, desde un punto de vista practico el c

alculo
de las segundas derivadas parciales se realiza siguiendo el mismo esquema: en cada paso, derivar
s
olo con respecto a una variable, suponiendo que las dem as son constantes. Como es de esperarse,
lo que ahora sigue es un ejemplo que ilustre este concepto.
Ejemplo 4.35 Sea f : R2 R dada por la expresi

on
f (x, y) = x cos(xy) + y sen(xy)
Lo que haremos sera calcular todas las posibles segundas derivadas parciales de f (que son cuatro)
= (x, y) R2 .
para cualquier x
Para ello, notemos primero que
f
(x, y) = xy sen(xy) + cos(xy) + y 2 cos(xy)
x
y que
f
(x, y) = x2 sen(xy) + xy cos(xy) + sen(xy)
y
Por tanto, se tiene que

f
2f x
(x, y) = (x, y)
x2 x
= xy 2 cos(xy) y sen(xy) y sen(xy) y 3 sen(xy)
= xy 2 cos(xy) 2y sen(xy) y 3 sen(xy)
y que

f
2f x
(x, y) = (x, y)
yx y
= x2 y cos(xy) x sen(xy) x sen(xy) xy 2 sen(xy) + 2y cos(xy)
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)
Finalmente

f
2f y
(x, y) = (x, y)
xy x
199 J. P
aez
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + y cos(xy) + y cos(xy)

= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)
y

f
2f y
(x, y) = (x, y)
y 2 y
= x3 sen(xy) x2 y sen(xy) + x cos(xy) + x cos(xy)
= x3 sen(xy) x2 y sen(xy) + 2x cos(xy)
Del ejemplo anterior es muy importante hacer dos observaciones con respecto al calculo de las
segundas derivadas parciales en las que aparecen ambas variables (x y y), y que se les conoce con
el nombre de derivadas parciales mixtas (o cruzadas). Una, que se refiere al orden en que se toman
estas variables para calcular las correspondientes derivadas, y que es de derecha a izquierda, seg un
aparezcan en el denominador correspondiente; y dos, que en este ejemplo, estas segundas derivadas
parciales resultaron ser iguales. De esta segunda observacion, sin duda surge la pregunta de si dicha
igualdad siempre se cumple, y la respuesta es que no. En el problema 16 el lector encontrar a el
ejemplo de que esta identidad no siempre sucede. Por nuestra parte, lo siguiente que haremos ser a
justo enunciar un resultado que nos proporciona las condiciones suficientes para que dicha igualdad
s se cumpla. Un punto importante en la prueba de este resultado tiene que ver con un hecho muy
sencillo, relacionado con los valores de una funcion sobre cualesquiera cuatro puntos de su dominio
(que los podemos pensar como cuatro vertices de un cuadril atero), y el calculo de ciertas diferencias
tomadas a partir de estos valores. Notese que, si x 1 , x
2 , x
3 y x4 son puntos del dominio de una
funcion f , entonces se tiene que
x3 ) f (
(f ( x2 )) (f (
x4 ) f ( x3 ) f (
x1 )) = (f ( x4 )) (f (
x2 ) f (
x1 ))
Teorema 4.36 (de las parciales cruzadas) Sean f : U Rn R, x 0 U y r > 0 tal que
2f 2f
Br ( Br (
x0 ) U . Si las segundas derivadas parciales xj xi y xi xj existen para cada x x0 ) y
son continuas en x 0 entonces
2f 2f
(
x0 ) = (
x0 )
xj xi xi xj
Demostraci on. Sea Br (

0) = {(h1 , h2 ) R2 | k(h1 , h2 )k < r}. Notese que si (h1 , h2 ) Br (0)
entonces x
0 + h1 ei + h2 ej , x
0 + h1 ei y x
0 + h2 ej pertenecen a Br ( n
x0 ) R , de modo que podemos
definir H : Br (
0) R2 R como
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 )) (4.34)
Ahora, si (h1 , h2 ) Br (
0) definimos
q q q
2 2 2 2 2 2
g : x R | |x| < r h2 = r h2 , r h2 R R
como
g(x) = f (x0 + xei + h2 ej ) f (
x0 + x
ei )
p p
Entonces, como h1 r 2 h22 , r 2 h22 , se tiene que
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 ))
J. P
aez 200
= g(h1 ) g(0)
Por otra parte, observe que por la proposici

on 4.28 g es derivable en su dominio y
f f
g (x) = ( ei + h2 ej )
x0 + x (
x0 + x
ei )
xi xi
p p
de modo que por el Teorema de Valor Medio (para funciones de R en R), existe r 2 h22 , r 2 h22
tal que
H(h1 , h2 ) = g(h1 ) g(0)

= g ()h1

f f
= ( ei + h2 ej )
x0 + (
x0 +
ei ) h1
xi xi
Finalmente, como [ x0 +
ei , x ei + h2 ej ] Br (
0 + x0 ) y ( ei + h2 ej ) (
x0 + x0 +
ei ) = h2 ej , por
f
on 4.13 (aplicada a la funcion xi ) se tiene que existe (0, |h2 |) tal que
la proposici

f f
H(h1 , h2 ) = ( ei + h2 ej )
x0 + (
x0 +
ei ) h1
xi xi

f
xi
= (
x0 +
ei +
ej )h1 h2
ej
2f
= (
x0 +
ei +
ej )h1 h2
xj xi
2f
Por lo tanto, si h1 h2 6= 0, por la continuidad de xj xi 0 , y que (, ) (0, 0) si (h1 , h2 ) (0, 0),
en x
concluimos que
H(h1 , h2 ) 2f
lim = lim (
x0 +
ei +
ej )
(h1 ,h2 )(0,0) h1 h2 (,)(0,0) xj xi
2f
= (
x0 )
xj xi
Observe ahora que para cada (h1 , h2 ) Br (0), la funcion H definida en 4.34 tambien se puede
escribir como
x0 + h1 ei + h2 ej ) f (
H(h1 , h2 ) = (f ( x0 + h2 ej )) (f (
x0 + h1 ei ) f (
x0 ))
de tal forma que si definimos

q q q
2 2 2 2 2 2
g : x R | |x| < r h1 = r h1 , r h1 R R
como
g(x) = f ( ej ) f (
x0 + h1 ei + x x0 + x
ej )
p p
dado que h2 r 2 h21 , r 2 h21 , se tiene que
H(h1 , h2 ) = g(h2 ) g(0)
201 J. P
aez
Procediendo
p con lapfunci
on g como lo hicimos anteriormente con la funcion g, se tiene que existe

r h1 , r h21 tal que
2 2 2
H(h1 , h2 ) = g(h2 ) g(0)

= g ( )h2

f f
= x0 + h1 ei + ej )
( (
x0 + ej ) h2
xj xj
x0 + ej , x
y como [ 0 + h1 ei + ej ] Br ( x0 + h1 ei + ej ) (
x0 ), con ( x0 + ej ) = h1 ei , nueva-
f
mente por la proposici on 4.13 (aplicada a la funcion xj ) se tiene que existe (0, |h1 |) tal
que

f f
H(h1 , h2 ) = x0 + h1 ei + ej )
( (
x0 + ej ) h2
xj xj

f
xj
= x0 + ei + ej )h1 h2
(
xi
2f
= x0 + ei + ej )h1 h2
(
xi xj
2f
de tal forma que si h1 h2 6= 0, por la continuidad de xi xj 0 y que ( , ) (0, 0) si (h1 , h2 )
en x
(0, 0), concluimos que
H(h1 , h2 ) 2f
lim = lim x0 + ei + ej )
(
(h1 ,h2 )(0,0) h1 h2 ( , )(0,0) xi xj
2f
= (
x0 )
xi xj
de donde, como el lmite de cualquier funcion, si existe, es u

nico, tenemos que
2f H(h1 , h2 )
(
x0 ) = lim
xj xi (h1 ,h2 )(0,0) h1 h2
2f
= (
x0 )
xi xj
que es la identidad que deseabamos probar.
Como mencionamos al incio de esta secci on, podemos calcular sucesivamente tantas derivadas
direccionales (en la misma o en diferentes direcciones) como nos lo permita la funcion con la que
estemos trabajando. Dado que en terminos pr acticos es suficiente con hacer esto para los vectores de
una base can n
onica de R , lo siguiente que haremos sera extender la definicion 4.34 para cualquier
k N.
Definici on 4.37 Sean f : U Rn R, x 0 U , r > 0 tal que Br ( x0 ) U , k N y x1 , . . . , xn

las coordenadas determinadas por una base ortonormal { e1 , . . . , en } de Rn . Si i1 , . . . , ik , ik+1
k f
{1, . . . , n} son tales que xi xi ( Br (
x) existe para toda x x0 ) definimos la k + 1 derivada
k 1
J. P
aez 202
k+1 f
parcial de f con respecto a xi1 , . . . , xik , xik+1 , en x
0 , que denotaremos por xik+1 xik xi1 (
x0 ),
k f
como la derivada parcial con respecto de xik+1 de la funci
on xik xi1 en x
0 , es decir
k f k f
k+1 f xik xi1 (
x0 eik+1 )
+ h xik xi1 (
x0 )
(
x0 ) := lim
xik+1 xik xi1 h0 h
k+1 f
Si i1 = i2 = = ik = ik+1 = i, la derivada anterior la denotamos por (
x0 ) y decimos que es
xk+1
i
la k + 1 derivada parcial de f con respecto de xi , en x
0 .
A proposito de la notaci on usada en esta definicion, y en concordancia con la u ltima parte,

on xik xi1 existen m ndices consecutivos iguales, esta parte de la
en general, si en la expresi
on la sustituiremos por xm
expresi i , en donde xi es la variable que se repite m veces consecutivas.
Por ejemplo, la derivada parcial de orden 6
6f
(
x0 )
x3 x2 x2 x3 x1 x1
se podr
a escribir como
6f
(
x0 )
x3 x22 x3 x21
Dada k N, como seguramente el lector recordara de sus cursos de algebra, existen nk formas
de elegir ordenaciones (con repeticion) con elementos del conjunto {1, . . . , n}, de tal forma que
existen nk derivadas parciales de orden k para una funcion f de Rn en R. Cuando todas estas
derivadas parciales existen en los puntos de un conjunto (abierto) sobre el cual este definida la
funcion f , y adem
as son continuas en este mismo conjunto, diremos que f es una funci on de clase
C k . Este concepto jugara un papel muy importante mas adelante, y lo dejaremos plasmado en la
siguiente
Definicion 4.38 Sean f : U Rn R y k N. Decimos que f es una funci on de clase C k en

U si existen todas las derivadas parciales de orden k de f en cada punto de U , y adem
as estas
derivadas parciales son continuas en cada punto de U .
El concepto anterior est

a muy relacionado con las hip
otesis de la proposici
on 4.23 y el teorema
4.36, raz
on por la cual enunciaremos el siguiente par de proposiciones y dejaremos su prueba al
lector.
on 4.39 Si f : U Rn R es de clase C 1 en U entonces f es derivable para toda

Proposici
U.
x
on 4.40 Si f : U Rn R es de clase C 2 en U entonces

Proposici
2f 2f
(
x) = (
x)
xi xj xj xi
U y para todas i, j {1, . . . , n}.

para toda x
203 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.5. Aproximaci
on polinomial
Cuando una funci on es de clase C k , muchas de sus derivadas parciales de orden k coinciden. En
efecto, si en dos derivadas parciales de orden k de una funcion f se deriva con respecto a las mismas
variables, y adem as se deriva (con respecto de cada una de ellas y sin importar el orden) el mismo
numero de veces, entonces estas derivadas parciales son iguales. Enunciar con toda precision (y
probar!) la afirmacion anterior no esta dentro de los objetivos de este texto, y solo baste decir que
en el fondo su prueba se basa en el teorema 4.36.
Antes de iniciar con otro tema, es importante enfatizar que conceptos hemos definido (y cu ales
no hemos definido!) en esta secci on. Como lo dice su nombre, aqu s olo definimos el concepto
de derivadas direccionales de orden superior de una funcion f , lo que no significa que hayamos
definido el concepto de derivada (global) de orden superior de f . Como hemos venido insistiendo,
la derivada de una funci on f es una funcion que a cada x del dominio de f le asocia una funci on
lineal de Rn en R que denotamos por Df ( x). Siguiendo la idea de que la segunda derivada de una
funcion f debera de ser la derivada de la derivada de f , para definir este concepto tendramos que
definir lo que significa derivar una funci on cuyo dominio esta contenido en Rn y que tiene como
n
contradominio al conjunto de las funciones lineales de R en R. Como el lector estar a de acuerdo,
este es un tema que escapa a los objetivos de este texto.
No obstante lo anterior, con los conceptos desarrollados en esta secci on nos es suficiente para
abordar un tema muy importante relacionado con la aproximacion de una funcion cerca de un
punto, tema que abordaremos en la siguiente secci on.
4.5 Aproximaci
on polinomial
Como el lector recordara, el concepto de derivada (global) de una funcion f de Rn en R en un
punto x0 , est
a intimamente relacionado con el problema de aproximar a dicha funcion alrededor (o
cerca) de x 0 por medio de una funci
on lineal. En terminos mas concretos, la derivabilidad de f en
x
0 se reduce al hecho de que la funcion
P (
x) = Df ( xx
x0 )( 0 ) + f (
x0 )
es la u
nica funci
on de este tipo que tiene la propiedad de que
x) P (
f ( x)
lim =0 (4.35)
x

x0 k
xx 0 k
Si ahora recordamos que
Df ( xx
x0 )( 0 ) = f (
x0 ) (
xx
0 )

(0) (0)
0 = x1 , . . . , xn , la funci
tendremos que en un sistema de coordenadas x1 , . . . , xn , en donde x on
P toma la forma
P (
x) = P (x1 , . . . , xn )
= f (
x0 ) (
xx 0 ) + f (
x0 )
n
X f
(0)

= (x0 ) xi xi + f (
x0 ) (4.36)
xi
i=1
de donde concluimos que P es una funcion polinomial de grado a lo mas 1 de las coodenadas (o
variables) x1 , . . . , xn con la particularidad de que P (
x0 ) = f (
x0 ).
J. P
aez 204
4.5. Aproximaci
on polinomial Captulo 4. La derivada de funciones de Rn en R
Visto de esta forma, y con base en la proposici on 4.23, podemos asegurar que si las derivadas
f
parciales x i
existen en una vecindad del punto x
0 y son continuas en este (lo que se satisface
1
sobradamente si f es de clase C en una vecindad de x 0 ), entonces el polinomio de grado a lo mas
1 en las variables x1 , . . . , xn dado por 4.36 es el u nico polinomio que satisface la condici on 4.35.
Como seguramente el lector ya se estar a imaginando, la siguiente pregunta que nos haremos
ser
a la siguiente: que propiedades deber a tener una funcion f para que podamos asegurar que
existe una funci on polinomial de grado a lo mas 2 en las variables x1 , . . . , xn , con la particularidad
de que valga lo mismo que f en x 0 , tal que se parezca mucho a f alrededor de x 0 ?
Para abordar este problema, empezaremos analizando el caso de una funcion definida en R2 .
Supongamos entonces que f : U R2 R y que x 0 = (x0 , y0 ) U . Primero notemos que una
funcion P2 (x, y) polinomial en las variables x y y de grado a lo mas 2, es de la forma
P2 (x, y) = Ax2 + By 2 + Cxy + Dx + Ey + F
y que si se desea que esta funci

on tome el valor f (
x0 ) cuando (x, y) = (x0 , y0 ) entonces deber
a ser
de la forma
P2 (x, y) = A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (

x0 ) (4.37)
por lo que nuestro problema se reduce a encontrar los coeficientes A, B, C, D y E.

Ahora, si el criterio para decir que P2 se parece mucho a f alrededor de x 0 es que satisfaga la
condici
on 4.35, dado que
(x x0 )2 , (y y0 )2 , |(x x0 )(y y0 )| k 0 k2
xx
entonces
(x x0 )2 (y y0 )2 (x x0 )(y y0 )
lim = lim = lim =0
(x,y)(x0 ,y0 ) k
xx 0 k (x,y)(x0 ,y0 ) k
xx 0 k (x,y)(x0 ,y0 ) k
xx 0 k
de modo que
x) P2 (
f ( x)
0 = lim
x

x0 k
xx 0 k
x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (

f ( x0 )
= lim
x
x0 k
xx
0 k
x) (D(x x0 ) + E(y y0 ) + f (
f ( x0 ))
= lim
x
x0 k
xx 0 k
lo cual es equivalente a que f sea derivable en el punto x

0 , y por lo tanto se deber
a tener que
f f
D= (
x0 ) y E= (
x0 )
x y
De esta forma, si f es derivable en x

0 entonces la funcion polinomial
f f
P2 (x, y) = A(xx0 )2 +B(yy0 )2 +C(xx0 )(yy0 )+ (
x0 )(xx0 )+ (x0 )(yy0 )+f (
x0 ) (4.38)
x y
cumple la condici
on 4.35 para cualesquiera A, B y C n
umeros reales. Y tal vez esta u
ltima parte
no sea del todo una buena noticia, pues nos asegura que hay una gran cantidad de funciones
205 J. P
aez
on polinomial
polinomiales de grado 2 que se parecen mucho a f alrededor de x 0 , lo que sin duda nos deja con
la pregunta de si de entre todas ellas no habra alguna que sea la mejor de todas.
Lo que haremos a continuaci on ser
a mostrar que s existe un criterio con base en el cual podemos
elegir, de entre todas las funciones polinomiales dadas por 4.38, la que se parece mas a f alrededor
de x
0 . Para ello, basta con hacer notar que una forma de interpretar la multicitada condici on 4.35,
es que el numero f (x) P (
x) se hace 0 mucho mas r apido que el numero kxx 0 k. Con base en
esta interpretacion, y dado que, si kxx 0 k 1 se tiene que kxx 0 k2 kxx 0 k, entonces pedir
que
x) P (
f ( x)
lim =0 (4.39)
x
x0 k xx 0 k2
sin duda es una condici on mas fuerte que la condici
on 4.35 (de hecho, por el problema 33 del
captulo 2, sabemos que si se cumple la condicion anterior entonces se cumple la condici
on 4.35
(pero no lo contrario!)). Por esta raz
on, si suponemos que una funcion polinomial de grado a lo
mas 2 satisface la condici
on 4.39, podemos dar por hecho que ya es de la forma 4.38.
Supongamos entonces que P2 es una funcion polinomial como en 4.38 que satisface la condici
on
4.39, es decir, supongamos que
x) P2 (
f ( x)
lim 2
x x0 k
xx 0 k

f f
x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) +
f ( x (
x0 )(x x0 ) + y (
x0 )(y y0 ) + f (
x0 )
= lim
x

x0 k xx 0 k2
=0
Si nos aproximarnos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 + h, y0 ), se deber a tener que

f (x0 + h, y0 ) Ah2 + f (x
x 0 0 , y )h + f (x ,
0 0y )
0 = lim 2
h0
" h #
f
f (x0 + h, y0 ) x (x0 , y0 )h f (x0 , y0 )
= lim A
h0 h2
de modo que si al cociente

f
f (x0 + h, y0 ) x (x0 , y0 )h f (x0 , y0 )
h2
lo tratamos como un cociente de dos funciones que dependen de la variable (real) h, y suponiendo
que f y sus derivadas parciales son funciones derivables en todos los puntos de una vecindad del
punto x0 (lo cual se puede garantizar suponiendo que f es de clase C 2 en una vecindad de este
punto), aplicando (las veces que haga falta) la regla de LHospital para este tipo de funciones (y
por supuesto la regla de la cadena probada en la proposici
on 4.28), tenemos que
f f
f (x0 + h, y0 ) x (x0 , y0 )h f (x0 , y0 ) + h, y0 ) f
x (x0 x (x0 , y0 )
lim = lim
h0 h2 h0 2h
f
1 (x0 + h, y0 ) f
x (x0 , y0 )
= lim x
2 h0 h
2
1 f
= (x0 , y0 )
2 x2
J. P
aez 206
4.5. Aproximaci

1 2f
A= (x0 , y0 )
2 x2
Si ahora nos aproximarnos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 , y0 + h), por un procedi-
miento analogo se concluye que
1 2f
B= (x0 , y0 )
2 y 2
Finalmente, para deducir el valor del coeficiente C, nos aproximaremos a (x0 , y0 ) por puntos de la
forma (x, y) = (x0 + h, y0 + h). En este caso, usando nuevamente la regla de LHospital en las dos
primeras identidades, se debera tener que
2 2

f (x0 + h, y0 + h) 12 xf2 (
x0 )h2 + 12 yf2 (
x0 )h2 + Ch2 + f (
x 0x )h + f
y (
x 0 )h + f (
x 0 )
0 = lim 2
h0 h
f f 2f 2f f
x (x0 + h, y0 + h) + y (x0 + h, y0 + h) x2
(
x0 )h y 2
(
x0 )h 2Ch x0 ) f
x ( y (
x0 )
= lim
h0 2h
2f 2f
x2
(x0 + h, y0 + h) + yx (x0 + h, y0 + h) 2C
= lim
h0 2
2f 2f 2f 2f
xy (x0 + h, y0 + h) + y 2
(x0 + h, y0 + h) x2
(
x0 ) y 2
(
x0 )h
+ lim
h0 2
2f 2f
= (
x0 ) + x0 ) 2C
(
yx xy

2f 2f

1
C= (
x0 ) + (
x0 )
2 yx xy
De lo anterior concluimos que, si existen las segundas derivadas parciales de f (en al menos
una vecindad del punto x0 y en este punto son continuas), y P2 es una funcion polinomial de grado
menor o igual a 2 que satisface la condici
on 4.39, entonces necesariamente P2 esta dado por
2f 2f 2f 2f

1 2
P2 (x, y) = (
x 0 )(x x 0 ) + (y y0 )2 + (
x0 ) + x0 ) (x x0 )(y y0 )
(
2 x2 y 2 yx xy
(4.40)
f f
+ x0 )(x x0 ) +
( x0 )(y y0 ) + f (
( x0 )
x y
Es importante enfatizar que el resultado anterior se obtuvo bajo el supuesto de que f es de clase
C 2 en una vecindad del punto x 0 , y de que existe una funcion polinomial de grado menor o igual
a 2 que satisface la condicion 4.39. La buena noticia es que, bajo las mismas hip otesis sobre f , lo
recproco tambien es cierto, es decir la funcion polinomial dada por 4.40 cumple la condicion 4.39.
Seguramente a esta alturas el lector ya estar a empezando a vislumbrar el resultado mas general
hacia el cual estamos dirigiendo nuestros pasos. Todo parece indicar que, si f : U Rn R y
0 U son tales que f es de clase C N en una vecindad del punto x
x 0 para alguna N N, entonces
la funcion polinomial de grado a lo mas N dada por
PN (
x)
207 J. P
aez
on polinomial
n n
X f
(0)
1 X N f
(0)

(0)

= f (
x0 ) + x0 ) xi xi
( + + x 0 ) x i1 x i1 x iN x iN
(
xi N! xi1 xiN
i=1 i1 ,...,iN =1

(0) (0)
en donde x
= (x1 , . . . , xn ) y x
0 = x1 , . . . , xn , debe ser tal que
x) PN (
f ( x)
lim =0
x

x0 k 0 kN
xx
y adem as es la u
nica con esta propiedad. Este resultado es conocido como el Teorema de Taylor ,
y aqu lo formularemos un poco diferente a como lo acabamos de describir en el parrafo anterior.
Tambien es importante mencionar que la prueba de este teorema se basa en el Teorema de Taylor,
en su version para funciones de R en R.
Teorema 4.41 (de Taylor) Sean f : U Rn R, x 0 U , r > 0 y N N tales que f es de

clase C N +1 en Br (
x0 ) U . Definimos el polinomio de Taylor grado N de la funci
on f en x
0 , que
denotamos por PN,f,x0 (x), como
PN,f,x0 (
x)
n n
X f
(0)
1 X N f
(0)

(0)

= f (
x0 ) + x0 ) xi xi
( + + x 0 ) x i1 x i1 x iN x iN
(
xi N! xiN xi1
i=1 i1 ,...,iN =1

(0) (0)
(en donde x 0 = x1 , . . . , xn ), y el residuo de orden N de f en x
= (x1 , . . . , xn ) y x 0 , que
denotamos por RN,f,x0 (x), como
RN,f,x0 ( x) PN,f,x0 (
x) = f ( x)
U . PN,f,x0 y RN,f,x0 satisfacen que:
para x
1. si x x0 ) existe [
Br ( x0 , x
] tal que
RN,f,x0 (
x)
n
1 N +1 f
(0)

(0)

(0)

xi1 xi1 xiN xiN
X
= xiN+1 xiN+1
(N + 1)! xiN+1 xiN xi1
i1 ,...,iN ,iN+1 =1
2.
RN,f,x0 (
x) x) PN,f,x0 (
f ( x)
lim N
= lim =0
x

x0 k
xx
0 k x

x0 k 0 kN
xx
3. PN,f,x0 es el u
nico polinomio de grado menor o igual a N que satisface la condici
on del inciso
1.
Demostraci Br (
on. Para la prueba del inciso (1), tomamos x 6= x
x0 ), x 0 (el caso x
=x
0 es
inmediato tomando = x
0 ), y definimos
g : (r/ k
xx
0 k , r/ k 0 k) R R
xx
como g(t) = f ( xx
x0 + t( =x
0 )). Por el problema 21 (tomando h x 0 ) sabemos que g es de
clase C N +1 en su dominio de tal forma que, por el Teorema de Taylor para funciones de R en R,
tenemos que
RN,0,g (1)
J. P
aez 208
4.5. Aproximaci
1
= g(N +1) ()(1 0)
(N + 1)!
1
= g(N +1) ()
(N + 1)!
n
1 N +1 f
(0)

(0)

(0)

xi1 xi1 xiN xiN
X
= xiN+1 xiN+1
i1 ,...,iN ,iN+1 =1
en donde = x xx
0 + ( 0 ) para alguna (0, 1), de modo que [
x0 , x
].
Por otra parte, como
RN,0,g (1)
= g(1) PN,0,g (1)
N
X g(i) (0)
x)
= f ( (1 0)i
i!
i=0
1 1 (N )
x) (g(0) + g (0) +
= f ( g (0) + + g (0)
2! N!
n
X f
(0)

x)
= f ( f (
x0 ) + x0 ) xi xi
( + +
xi
i=1

n
1 X N f
(0)

(0)

+ x 0 ) x i1 x i1
( x iN x iN
N! xiN xi1
i1 ,...,iN =1
x) PN,f,x0 (
= f ( x)
= RN,f,x0 (
x)
concluimos que
n
1 N +1 f
(0)

(0)

(0)

xi1 xi1 xiN xiN
X
RN,f,x0 (
x) = xiN+1 xiN+1
i1 ,...,iN ,iN+1 =1
para alguna [
x0 , x
].
Ahora, dado que
(0)
xi xi k
xx
0 k

|RN,f,x0 (
x)|

n
N +1 f

1
(0)

(0)

(0)
xi1 xi1 xiN xiN
X
= xiN+1 xiN+1
(N + 1)! i1 ,...,iN ,iN+1 =1 xiN+1 xiN xi1
n
N +1 f

1
(0)

(0) (0)

xi1 xi1 xiN xiN xiN+1 xiN+1
X

(N + 1)! xi
N+1
xiN xi1
i1 ,...,iN ,iN+1 =1
n
N +1 f

1
k
X
xx
0 k k
xx
0 k k
xx
0 k
(N + 1)! xi
N+1
xiN xi1
i1 ,...,iN ,iN+1 =1
209 J. P
aez
on polinomial
n
0 kN +1 N +1 f

k
xx

X
=
(N + 1)! xi
N+1
xiN xi1
i1 ,...,iN ,iN+1 =1
de tal forma que

n
N +1 f

|RN,f,x0 (
x)| 1

X
k
xx
0 k
0 kN (N + 1)! xiN xi1
xi
k
xx i1 ,...,iN ,iN+1 =1 N+1
y por lo tanto, dado que f es de clase C N +1 en Br (

x0 ), se tiene que
N +1 f N +1 f
lim = (
x0 )
x

x0 xiN+1 xiN xi1 xiN+1 xiN xi1
para todas i1 , , iN , iN +1 {1, . . . , n}, concluimos que
RN,f,x0 (
x)
lim =0
x

x0 k 0 kN
xx
lo que prueba el inciso (2).

Finalmente, para la prueba del inciso (3), supongamos que PN es otro polinomio de grado menor
o igual a N para el cual se satisface que
x) PN (
f ( x)
lim =0
x

x0 k 0 kN
xx
Dado que
x) PN,f,x0 (
f ( x) RN,f,x0 (
x)
lim N
= lim
x

x0 k
xx
0 k x

x0 k 0 kN
xx
=0
restando estos dos u

ltimos lmites tenemos que
x) PN,f,x0 (
PN ( x)
lim =0
x

x0 k 0 kN
xx
de tal forma que si hacemos P ( x) PN,f,x0 (

x) = PN ( x), se tiene que P es un polinomio de grado
menor o igual a N con la propiedad de que
P (
x)
lim =0
x

x0 k 0 kN
xx
El siguiente paso ser
a demostrar que un polinomio con estas caracatersticas tiene que ser la funci on
constante 0.
Rn , fija. Definimos p(t) = P (
Para ello, sea x xx
x0 + t( 0 )) para t R; n
otese que p ser
a un
polinomio en la variable t de grado a lo mas N con la propiedad de que

p(t) |P ( xx
x0 + t( 0 ))|
lim = lim
t0 tN t0 k(
x0 + t(xx 0 )) x 0 kN
=0
J. P
aez 210
4.5. Aproximaci

p(t)
=0 lim
tN t0
de tal forma que, como para el caso de polinomios de una variable ya sabemos que p tiene que ser
la constante cero, concluimos que
0 = p(1)
= P (
x)
x) PN,f,x0 (
= PN ( x)
es decir, que PN (
x) = PN,f,x0 ( Rn que es lo que queramos demostrar.
x) para toda x
Los polinomios de Taylor son una herramienta muy importante en el an alisis del comportamiento
de una funcion alrededor de un punto, y nos seran muy u
tiles cuando en la proxima secci
on aborde-
mos el tema de los valores maximos y mnimos de una funcion. Por ahora, veremos con un ejemplo
de como se pueden usar para el calculo de lmites.
Ejemplo 4.42 Considere la funci

on
ln(1 + x2 ) + ln(1 + y 2 )
f (x, y) =
x2 + y 2
para (x, y) R2 , (x, y) 6= (0, 0). Nuestro objetivo es calcular
lim f (x, y)
(x,y)(0,0)
Para ello, bastar

a con calcular el polinomio de Taylor de grado 2 en el (0, 0) de la funci
on g(x, y) =
2 2 2 2 2
ln(1 + x ) + ln(1 + y ) (dado que el denominador de f es x + y = k(x, y)k ).
Para la funcion g se tiene que
g 2x g 2y
(x, y) = y (x, y) =
x 1 + x2 y 1 + y2
de modo que
2g 2 4x2 2g
(x, y) = y (x, y) = 0
x2 1 + x2 (1 + x2 )2 yx
y an
alogamente
2g 2g 2 4y 2
(x, y) = 0 y (x, y) =
xy y 2 1 + y 2 (1 + y 2 )2
De esta forma tenemos que
2g 2 2g 2g 2g 2

g g 1
P2,g,0 (x, y) = g(
0) + (0)x + (0)y + (0)x + (0)xy + (0)yx + (0)y
x y 2 x2 yx xy y 2
= x2 + y 2
y por lo tanto
ln(1 + x2 ) + ln(1 + y 2 )
lim f (x, y) = lim
(x,y)(0,0) (x,y)(0,0) x2 + y 2
211 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.6. M
aximos y mnimos
g(x, y)
= lim
(x,y)(0,0) x2 + y 2
P2,g,0 (x, y) + R2,g,0 (x, y)
= lim
(x,y)(0,0) x2 + y 2
x2 + y 2 + R2,g,0 (x, y)
= lim
(x,y)(0,0) x2 + y 2
!
R2,g,0 (x, y)
= lim 1+
(x,y)(0,0) k(x, y)k2
=1+0
=1
4.6 M
aximos y mnimos
Una de las aplicaciones mas comunes de la derivada, es la localizacion de los puntos en los que una
funcion alcanza sus valores m aximo y mnimo. De acuerdo con el corolario 2.49 del captulo 2, si
una funcion f : A Rn R es continua en un subconjunto B de su dominio A, y este subconjunto
es cerrado y acotado (es decir compacto), s olo en este caso podemos estar seguros de que existen
un par de puntos en B en los cuales la funcion f alcanza su valor m aximo y su valor mnimo, en
donde adem as estos valores son m aximo y mnimo s olo con respecto a los valores de f sobre los
elementos del subconjunto B.
Puesto que todo conjunto B Rn que sea cerrado se puede descomponer en la uni on de su
interior y su frontera (B = Fr(B)int(B)), que son dos conjuntos ajenos, y dado que int(B) siempre
es un conjunto abierto y Fr(B) siempre es un conjunto cerrado (y flaco, ya que por el problema
15 se tiene que int(Fr(B)) = ), vamos a reducir nuestro an alisis a estos dos casos: cuando los
puntos en los que una funci on f alcanza su valor m aximo o mnimo (o alguno de ellos) pertenecen
al interior de B, y cuando estos mismos puntos (o alguno de ellos) pertenecen a la frontera de B.
De acuerdo con el enfoque anterior, lo que haremos ser a analizar en general que caractersticas
especficas satisfacen los puntos en los que una funcion f alcanza su valor m aximo y su valor mnimo,
dependiendo de si estos pertenecen a un conjunto abierto (como el int(B)) o a un conjunto cerrado
con interior vaco (como la Fr(B), cuando B es cerrado).
on 4.43 Sean f : A Rn R, B A y x
Definici 0 B. Decimos que:
1. f alcanza (o tiene) un valor m

aximo (mnimo ) en x x) f (
0 sobre B si f ( x0 ) f (
x0 ) (f ( x))
B.
para todo x
2. f alcanza (o tiene) un valor m aximo local (mnimo local) en x
0 sobre B si existe r > 0 tal
x) f (
que f ( x0 ) f (
x0 ) (f ( B Br (
x)) para todo x x0 ).
Con respecto a las definiciones anteriores es importante hacer dos observaciones; una, que
todo punto x 0 en donde una funci on f alcance un valor m aximo (mnimo) sobre un conjunto B,
necesariamente en ese mismo punto la funcion f alcanza (o tiene) un valor m aximo local (mnimo
local) sobre B, pero no recprocamente, es decir, si f alcanza en x 0 un valor m aximo local (mnimo
local) sobre B, este no es necesariamente m aximo (mnimo) sobre todo B (ver figura 4.13). La
segunda observaci on es que, si B es un conjunto abierto, entonces f alcanza en x 0 un valor maximo
local (mnimo local) sobre B si y s x) f (
olo si existe r > 0 tal que f ( x0 ) f (
x0 ) (f ( x)) para todo
Br (
x x0 ) B.
J. P
aez 212
4.6. M
aximos y mnimos Captulo 4. La derivada de funciones de Rn en R
x
0
x
1
Figura 4.13: En el punto x

0 la funcion f tiene un maximo local pero no global, y en el punto x
1 tiene
un maximo local que tambien es global.
Y justo el primer resultado importante que vamos a probar en esta secci on tiene que ver con
los puntos en los que una funci on f alcanza un valor m aximo (o mnimo) local sobre un conjunto
abierto. Si en un punto x 0 , adem as de satisfacer la propiedad anterior, f tambien es derivable,
entonces la derivada en x0 (Df (x0 )) tiene que ser la funcion lineal constante 0 (como seguramente
a observando, este resultado generaliza lo que sucede para las funciones de R en R).
el lector ya est
Proposici on 4.44 Sean f : U Rn R (U abierto) y x 0 U . Si f alcanza en x 0 un valor

m
aximo local (mnimo local) sobre U y f es derivable en x
0 entonces Df (
x0 ) es la constante cero
x0 ) 0).
(Df (
Demostraci on. Dado que la derivada de f en x 0 est

a representada (en un sistema coordenado
f
ortonormal) por la matriz de 1 n cuya iesima entrada est a dada por x i
(
x0 ), bastara con de-
mostrar que cada uno de estos numeros es 0.
Suponiendo que f alcanza en x 0 un valor m aximo local sobre U (el caso del mnimo local se
prueba de manera an aloga), sea r > 0 tal que f ( x) f ( Br (
x0 ) para todo x x0 ) U . Por tanto,
si |h| < r tenemos que f ( ei ) f (
x0 + h x0 ) de tal forma que
f ( ei ) f (
x0 + h x0 ) 0
Ahora, si tomamos h tal que 0 < h < r entonces

f ( ei ) f (
x0 + h x0 )
0
h
y por lo tanto
f f ( ei ) f (
x0 + h x0 )
(
x0 ) = lim
xi h0 h
0
Por otra parte, si tomamos h tal que r < h < 0 entonces

f ( ei ) f (
x0 + h x0 )
0
h
213 J. P
aez
aximos y mnimos
de donde
f ( ei ) f (
x0 + h x0 )
0 lim
h0 h
f
= (
x0 )
xi
de modo que
f
0 x0 ) 0
(
xi
es decir que
f
(
x0 ) = 0
xi
Como seguramente el lector ya habra notado, si bien la proposici on anterior es importante, esta
s
olo nos proporciona una condici on necesaria al hecho de que una funcion alcance en x 0 un valor
maximo (o mnimo) local. Y como suele suceder con frecuencia, esta condici on no es suficiente.
En efecto, el hecho de que la derivada de una funcion f en un punto x 0 sea la constante 0, no es
suficiente para que podamos asegurar que f alcance en x 0 un valor m
aximo (o mnimo) local. Antes
de dar un ejemplo que ilustra este hecho, mencionaremos que a pesar de todo, aquellos puntos en
que la derivada de una funci on es la constante 0 resultan ser muy importantes y reciben un nombre
especial: puntos crticos, lo cual dejamos plasmado en la siguiente
on 4.45 Sean f : U Rn R (U abierto) y x
Definici 0 U . Si f es derivable en x
0 y la derivada
de f en x
0 (Df (
x0 )) es la constante 0, decimos que x
0 es un punto crtico de f .
Con base en la definicion anterior, lo que mostraremos en el siguiente ejemplo es que los puntos
crticos de una funci
on f no tienen por que ser necesariamente puntos en los que f alcance un valor
m aximo (o mnimo) local.
Ejemplo 4.46 Sea f : R2 R dada por la expresi
on
f (x, y) = x2 y 2
Dado que
f f
(x, y) = 2x y (x, y) = 2y
x y
se tiene que el u
nico punto crtico de f es el (0, 0).
Sin embargo, para cualquier r > 0 se tiene que: si 0 < |x| < r entonces (x, 0) Br ((0, 0)) y
f (x, 0) = x2
>0
= f (0, 0)
Y por otra parte, si 0 < |y| < r entonces (0, y) Br ((0, 0)) y
f (0, y) = y 2
<0
= f (0, 0)
lo que demuestra que f no tiene un m
aximo local ni un mnimo local en el (0, 0) (ver figura 4.14
(a)).
J. P
aez 214
4.6. M
Aquellos puntos crticos en los que una funcion no tiene un m aximo local o un mnimo local,
y justo por el aspecto geometrico del ejemplo anterior en una vecindad del (0, 0) (el de una silla
de montar), reciben el nombre de punto silla, aunque no todos los puntos silla tienen este aspecto.
Por ejemplo para la funci on f (x, y) = x3 , todos sus puntos crticos (los puntos de la forma (0, y))
son puntos silla en el sentido de que en ellos la funcion f no tiene un m aximo local o un mnimo
local. Sin embargo, geometricamente la funcion f no tiene el aspecto de una silla de montar (ver
figura 4.14 (b)).
(a) (b)
Figura 4.14: La funcion f (x, y) = x2 y 2 (figura (a)) tiene un punto silla en el punto (0, 0), y la
funcion f (x, y) = x3 (figura (b)) tiene puntos silla en los puntos de la forma (0, y).
El ejemplo anterior, y el hecho de que la proposici on 4.44 es valida para m aximos o mnimos
locales, nos plantea el problema de contar con un criterio que nos permita clasificar a los puntos
crticos de una funci on. Lo que haremos a continuaci on ser
a desarrollar un criterio an alogo al
criterio de la segunda derivada para la clasificaci on de puntos crticos de funciones de R en R, pero
para ello ser a necesario introducir el concepto (que tomaremos prestado nuevamente del Algebra
Lineal!) de: forma cuadratica.
De acuerdo con el problema 24 (que es una consecuencia del teorema de Taylor), si f : U
Rn R es una funci on de clase C 2 en U , x
0 U y r > 0 son tales que Br (x0 ) U , sabemos que
si h = (h1 , . . . , hn ) R es tal que h < r, entonces
n
f ( = P2,f,x (
x0 + h)
0 x0 + h) + R2,f,x0 (
x0 + h)
n n
X f 1 X 2f
= f (
x0 ) + (
x0 )hi + (
x0 )hi hj + R2,f,x0 (
x0 + h)
xi 2 xj xi
i=1 i,j=1
en donde
R2,f,x0 (
x0 + h)
lim 2 =0

h 0
h
de modo que, si x
0 es un punto crtico de f , se tiene que
n
1 X 2f
x0 + h) f (
f ( x0 ) = (
x0 )hi hj + R2,f,x0 (
x0 + h)
2 xj xi
i,j=1
215 J. P
aez
aximos y mnimos
De esta u
ltima identidad, nos detendremos a estudiar con detalle a la expresi
on
n
X 2f
(
x0 )hi hj (4.41)
xj xi
i,j=1
y lo primero que haremos notar es que se puede escribir en foma matricial, de la siguiente manera

n h 1
X 2f
x0 )hi hj = h1 hn A ...

(

xj xi
i,j=1 hn
en donde la matriz A es
2f 2f

x21
(
x0 ) xn x1 (
x0 )

A= .. .. ..
(4.42)
. . .

2f 2f
x1 xn (
x0 ) x2 ( x0 )
n
La ventaja de escribir a la expresi

on 4.41 en forma matricial es que nos permite relacionarla con

un concepto del Algebra Lineal que est a muy bien estudiado: las formas cuadr aticas. Las formas
cuadraticas en Rn son (adem as de la funcion constante 0, que es la u nica forma cuadratica que es
constante), las funciones polinomiales de las coordenadas x1 , . . . , xn que tienen la particularidad de
que todos los monomios que la forman son expresiones de grado 2. Por ejemplo, en el caso de R2 ,
cualquier forma cuadratica en las variables x, y se escribe como
ax2 + 2bxy + cy 2 (4.43)
la cual, como en el caso de la expresi

on 4.41, se puede escribir en forma matricial de la siguiente
manera:

2 2
a b t
ax + 2bxy + cy = x y x y
b c

a b x
= x y
b c y
En general, toda forma cuadratica en Rn se identifica con una matriz A de n n con estradas
reales (A M22 (R)) la cual es simetrica, es decir, que es igual a su traspuesta (A = At ). Y
recprocamente, si A es una de estas matrices, la funcion F : Rn R definida como
t
F (x1 , . . . , xn ) = x1 xn x1
A xn

x1
xn A ...

= x1

xn
claramente define una forma cuadratica en Rn .

A la matriz A dada por 4.42 se le conoce como la matriz hessiana 2 de f en x 0 , que de aqu en
adelante denotaremos por Hf (
x0 ), y a la forma cuadratica asociada a esta le llamaremos la hessiana
2
Llamada as en honor de Ludwig Otto Hesse (22 abril 1811 - 4 agosto 1874) quien fue un matem atico alem
an.
Hesse naci
o en Konigsberg, Prussia, y muri
o en Munich, Bavaria. Trabaj
o en la teora de invariantes.
J. P
aez 216
4.6. M
de f en x0 . La hessiana de f en x
0 lo denotaremos por Hfx0 de tal forma que si x
= (x1 , . . . , xn ),
entonces
Hfx0 (
x) = Hfx0 (x1 , . . . , xn )
t
= x1 xn Hf ( x0 ) x1 xn

x1
..
= x1 xn Hf ( x0 ) .

xn
Hay una clasificacion de las formas cuadraticas que en particular resultara muy importante
para el problema de la identificaci on de los puntos crticos de una funcion. Se dice que la forma
cuadratica F : Rn R es semipositiva (an alogamente seminegativa) si F ( x) 0 (F (
x) 0) para
toda x n
R y si F satisface la condici on de que F (x) = 0 si y s
olo si x
= 0, entonces decimos que
F es no degenerada.
Lo interesante de esta clasificaci
on de las formas cuadraticas es que, con base en ella, podremos
establecer criterios que nos permita determinar si los puntos crticos de una funcion son puntos en
los que esta alcanza un valor m aximo o mnimo, locales en ambos casos. En efecto, lo siguiente
que haremos ser a probar un resultado en el que, dependiendo de que tipo de forma cuadratica
resulte ser la hessiana de f en un punto x 0 , podremos asegurar que f tiene un cierto tipo de valor
extremo (m aximo o mnimo local). Para ello, sera necesario probar antes un sencillo resultado que
formularemos en el siguiente
Lema 4.47 Si F : Rn R es una forma cuadr atica semipositiva (seminegativa) y no degenerada

asociada a una matriz A (es decir que F (
x) = x
Axt ) entonces existe M > 0 (m < 0) tal que
2 2
M
F (h) h
m
(F (h) h
)
Rn .
para toda h
Demostraci on. Dado que S n1 = { x Rn | k

xk = 1} es un conjunto cerrado y acotado (com-
pacto) y toda forma cuadratica es una funcion continua, por el corolario 2.49 del captulo 2 sabemos
que existe un valor mmino para F (si F es semipositiva) que llamaremos M > 0 (un valor m aximo
para F , si F es seminegativa, que llamaremos m < 0) tal que
x) M
F ( x) m)
(F (
para toda x Rn . Por tanto, dado que las

desigualdades
que deseamos probar se satisfacen si

h = 0, si tomamos h 6= 0 y hacemos x
S n1 y por lo tanto
= h/ h entonces x
M F (
x)
=xAxt
t

h
h
= A

h h
1
h
t

= 2 hA

h
217 J. P
aez
aximos y mnimos
1
= 2 F (h)

h
es decir, se tiene que

2
M
F (h) h

2
Rn (an
para toda h m
alogamente se prueba que F (h) h Rn ).
para toda h
Una vez hecho todo lo anterior, ahora estamos en condiciones de formular un resultado que nos
permitira determinar si un punto crtico x
0 de una funcion f es un punto en donde esta alcanza
un maximo local o un mnimo local. Solo probaremos uno de estos casos y como es de imaginar, el
otro caso quedara como un problema para el lector.
Proposici on 4.48 Sea f : U Rn R de clase C 2 en U , y x

0 U un punto crtico de f . Se
satisface lo siguiente:
1. si la hessiana de f en x0 es una forma cuadr

atica semipositiva y no degenerada entonces f
tiene un mnimo local en x0 , y
2. si la hessiana de f en x0 es una forma cuadr

atica seminegativa y no degenerada entonces f
tiene un m aximo local en x
0 .
Demostraci on. Solo probaremos el inciso 1. Sea r0 > 0 tal que Br0 ( x0 ) U . Como ya habamos
mencionado anteriormente, por el problema 24 sabemos que, como f : U Rn R es una funci
on
2
de clase C en U y x0 U es un punto crtico de f , si h = (h1 , . . . , hn ) R es tal que h
2
< r0 ,

entonces
f ( = P2,f,x (
x0 + h)
0 x0 + h) + R2,f,x0 (
x0 + h)
n n
X f 1 X 2f
= f (
x0 ) + (
x0 )hi + (
x0 )hi hj + R2,f,x0 (
x0 + h)
xi 2 xj xi
i=1 i,j=1
1 + R2,f,x (
x0 ) + Hfx0 (h)
= f ( 0 x0 + h)
2
en donde
R2,f,x0 (
x0 + h)
lim 2 =0 (4.44)

h 0
h

Ahora, dado que Hfx0 es semipositiva, por el lema 4.47 sabemos que existe M > 0 tal que
2
M
Hfx0 (h) h

Rn . Por tanto, por 4.44 sabemos que existe > 0 tal que si
para toda h h
< entonces

(
x
R2,f,x0 0 +
h)

M
2 <
2
h
J. P
aez 218
4.6. M
y en particular que
M R2,f,x0 (
x0 + h)
0< + 2
2
h

Por lo tanto, si r = min{, r0 } y 0 < h < r, tendremos que
f ( 1 + R2,f,x (
Hfx0 (h)
f (
x0 + h) x0 ) 0 x0 + h)
2 = 2 2

h h

1 Hfx0 (h) R2,f,x0 (
x0 + h)
= 2 + 2
2
h h
M R2,f,x0 (
x0 + h)
+ 2
2
h
>0

x0 ) f (
f (
x0 + h)

si h < r, lo que demuestra que f tiene un mnimo local en x
0 .
Como el lector habra notado, el resultado anterior es una especie de equivalente (en Rn ) al
on de puntos crticos de funciones de R en R, y
criterio de la segunda derivada para la clasificaci
como sucede en ese caso, su recproco no se cumple, lo que ilustramos en el siguiente
f (x, y) = x4 + y 4
para cada (x, y) R2 . Como es f

acil de verificar (ver figura 4.15), el (0, 0) es el punto en el que f
alcanza su mnimo global (y por tanto tambien local) y dado que
2f 2f 2f
(x, y) = (x, y) = (x, y) = 0
x2 x2 yx
para toda (x, y) R2 , en particular se tiene que la hessiana de f en el (0, 0) es la funci

on constante
0, la cual es la mas degenerada (en el sentido matem atico de la palabra!) de todas las formas
cuadraticas.
A pesar del ejemplo anterior, para la proposicion 4.48 se puede establecer una proposici on casi-
recproca. Como seguramente el lector recordara, para el caso de funciones de R en R se sabe que
si f tiene un m aximo (mnimo) local en un punto x0 , y f (x0 ) existe, entonces se debe cumplir
que f (x0 ) 0 (f (x0 ) 0) (resultado que por cierto nos ser
a de mucha utilidad en la prueba de
nuestra siguiente proposici on). Pues bien, para una funcion f de Rn en R se extiende el resultado
anterior en el sentido de que, si f tiene un m aximo (o un mnimo) local en un punto x 0 , entonces la
hessiana de f en x 0 sera seminegativa (o semipositiva), es decir, lo u
nico que no podremos asegurar
es que la hessiana es no degenerada (as como en el caso real no podemos asugurar que f (x0 ) no
sea 0).
219 J. P
aez
aximos y mnimos
Y
b
Figura 4.15: La funcion f (x, y) = x4 + y 4 tiene un mnimo global (y por tanto tambien local) en el
punto (0, 0), y su forma cuadratica asociada en ese punto (su hessiana) es degenerada.
Proposici on 4.50 Sea f : U Rn R de clase C 2 en U , y x

0 U un punto crtico de f . Se
satisface lo siguiente:
1. si f tiene un mnimo local en x

0 entonces la hessiana de f en x
0 es una forma cuadr
atica
semipositiva, y
2. si f tiene un m
aximo local en x
0 entonces la hessiana de f en x
0 es una forma cuadr
atica
seminegativa.
Demostraci on. Solo probaremos el inciso 2. Sean, r0 > 0 tal que Br0 ( x0 ) U , y u
=
(u1 , . . . , un ) Rn tal que k
uk = 1. Definimos : (r0 , r0 ) R R como (t) = x 0 + t
u y
g : (r0 , r0 ) R R como g = f . Notese que, por la proposici on 4.28 sabemos que g es
derivable en su dominio y que
g (t) = f ((t)) (t)

n
X f
= ((t))ui
xi
i=1
y dado que f es de clase C 2 en U , por la misma proposicion 4.28 (aplicada a cada miembro de la
suma anterior), se tiene

n n 2
X X f
g (t) = ((t))uj ui
xj xi
i=1 j=1
n
X 2f
= ((t))ui uj
xj xi
i,j=1
de tal forma que

n

X 2f
g (0) = ((0))ui uj
xj xi
i,j=1
J. P
aez 220
4.6. M
n
X 2f
= (
x0 )ui uj
xj xi
i,j=1
= Hfx0 (
u)
Por otra parte, es sencillo demostrar (problema 31) que, como f tiene un m aximo local en x0 ,
aximo local en t = 0, de tal forma que, por el resultado para funciones de R
entonces g tiene un m
en R que mencionamos previamente a esta proposici on, se debe tener que
u) = g (0)
Hfx0 (
0
Por lo tanto, si x 6=
Rn , x 0, si hacemos u =x / k
xk se tendra que

x

Hfx0 (
u) = Hfx0
k
xk
1
= Hfx0 (
x)
xk2
k
0
de donde Hfx0 ( Rn , lo que prueba que la hessiana de f en x

x) 0 para toda x 0 es seminegativa.
Aun y cuando hasta aqu todo parece funcionar muy bien, no podemos dejar de mencionar que
el problema de determinar si una funcion f tiene un m aximo o un mnimo local (o ninguno de
estos dos) en un punto crtico x
0 , lo trasladamos al problema de determinar si la hessiana de f
en este punto x 0 es una funci
on cudratica semipositiva o seminegativa (o ninguna de estas dos).
En la siguiente seccion mencionaremos (sin probar) algunas condiciones necesarias y suficientes
para que una forma cuadratica F en Rn (en terminos de su matriz asociada) sea semipositiva o
seminegativa, y no degenerada. Estas condiciones necesarias y suficientes son un tema importante

de Algebra Lineal que desafortunadamente no podemos incluir en este texto (pero que el lector
interesado puede consultar en (3 ) para saber mas de este tema). Sin embargo, para que el amable
lector no se sienta muy desalentado por esta ausencia, mostraremos y probaremos cu ales son estas
condiciones para el caso particular de las formas cuadraticas en R2 , las que dejaremos plasmadas
en la siguiente
on 4.51 Sea F : R2 R la forma cuadr

Proposici atica asociada a la matriz

a b
A=
b c
y que est
on
t
F (x, y) = x y A x y

a b x
= x y
b c y
= ax2 + 2bxy + cy 2
olo si a > 0 (a < 0) y ac b2 = det(A) > 0.

F es semipositiva (seminegativa) y no degenerada si y s
3
Friedberg, Stephen H., Insen, Arnold J., Spence, Lawrence E. Linear Agebra. 4th ed. 2003. 601 pp.
221 J. P
aez
aximos y mnimos
Demostraci on. Supongamos que F es semipositiva (el caso en que sea seminegativa de prueba
de manera an
aloga) y no degenerada. Por esta u
ltima propiedad, dado que
a = F (1, 0) > 0
concluimos que a > 0. Por tanto, podemos reescribir a F como
F (x, y) = ax2 + 2bxy + cy 2

b 2 b2

=a x+ y + c y2
a a
b 2 ac b2

=a x+ y + y2 (4.45)
a a
de tal forma que
0 < F (b/a, 1)
ac b2
=
a
y por lo tanto ac b2 > 0.
Supongamos ahora que a > 0 y ac b2 > 0. De la identidad 4.45 concluimos que F (x, y) 0
para toda (x, y) R2 , es decir, F es semipositiva. Ahora, si (x, y) es tal que F (x, y) = 0, se tiene
que
ac b2

y2 = 0
a
y
b 2

x+ y =0
a
de tal forma que de la primera identidad concluimos que y = 0, y sustituyendo esto u
ltimo en la
segunda identidad, concluimos que x = 0. Esto prueba que F es no degenerada.
Como una consecuencia inmediata de la proposici on anterior y de la proposici

on 4.48, podemos
formular el siguiente resultado el cual establece criterios muy concretos para determinar si un punto
on de R2 en R es un m
crtico de una funci aximo o mnimo local.
on 4.52 Sea f : U R2 R de clase C 2 en U , y x

Proposici 0 U un punto crtico de f .
1. Si 2
2f 2f 2f 2f

(
x0 ) > 0 y (
x 0 ) x0 )
( x0 ) > 0
(
x2 x2 y 2 yx
entonces f tiene un mnimo local en x
0 , y
2. si 2
2f 2f 2f 2f

(
x0 ) < 0 y (
x 0 ) x0 )
( x0 ) > 0
(
x2 x2 y 2 yx
entonces f tiene un m
aximo local en x
0 .
Antes de hacer unos breves comentarios adicionales acerca de las formas cuadraticas, daremos
algunos ejemplos que ilustren el trabajo realizado hasta ahora sobre el tema de m
aximos y mnimos.
J. P
aez 222
4.6. M
Ejemplo 4.53 Sean:
1. f : R2 R dada por
f (x, y) = (x + 1)2 + y 2
y B = (x, y) R2 | k(x, y)k 2 .

De acuerdo a lo realizado hasta este momento, si los puntos en los que f alcanza un valor
maximo o mnimo local (o global) sobre B, se encuentran en el interior de B, entonces deben
ser puntos crticos de f de modo que lo primero que se tendr a que hacer sera localizar este
tipo de puntos. Para lograr esto, hay que resolver las ecuaciones
f f
(x, y) = 0 y (x, y) = 0
x y
que en este caso son
2(x + 1) = 0 y 2y = 0
de donde obtenemos que (1, 0) es el u nico punto crtico f (en todo R2 ). Por otra parte,
dado que f (x, y) 0 para toda (x, y) R2 , que f (1, 0) = 0 y (1, 0) B, sin necesidad de
mayores c alculos podemos concluir que f alcanza su valor mnimo sobre B (de hecho, sobre
todo R2 ) en el (1, 0) y que dicho valor mnimo es 0.
En cuanto al valor m aximo de f sobre B, dado que f no tiene mas puntos crticos, este valor
maximo se debe de alcanzar en alg un punto de la frontera de B, es decir, sobre el conjunto
Fr(B) = (x, y) R2 | k(x, y)k = 2

Dado que para este tipo de conjuntos (cerrados con interior vaco) no hemos desarrollado
ninguna herramienta que nos permita resolver este problema, para este caso particular recurri-
remos al siguiente hecho: la Fr(B) se puede obtener como la imagen de una funci on de R en
R2 . En efecto, n on : [0, 2] R R2 dada por
otese que la funci
(t) = (2 cos(t), 2 sen(t))
es una parametrizacion del conjunto Fr(B), es decir, ([0, 2]) = S. Aprovechando este hecho,
on g : [0, 2] R R como
si definimos la funci
g(t) = (f )(t)
= f ((t))
= (2 cos(t) + 1)2 + 4 sen2 (t)
= 4 cos(t) + 5
y encontramos los puntos del dominio de g en los que esta funcion alcanza sus valores maximo
y mnimo, podremos entonces localizar los valores m aximo y mnimo de f sobre la Fr(B).
Como ya se sabe, hay que proceder de manera an aloga a lo que estamos haciendo con f ; es
decir, hay que localizar los puntos crticos de g en el intervalo abierto (0, 2), determinar
en estos puntos crtico g alcanza un m aximo o mnimo local, y comparar el valor de g en
estos puntos con los valores de g en los extremos del intervalo [0, 2] (que son la frontera de
[0, 2]).
De esta forma, lo primero que hay que localizar son los valores de t (0, 2) para los cuales
se cumple que
g (t) = 4 sen(t)
223 J. P
aez
aximos y mnimos
=0
y que claramente s olo sucede para t = . Dado que g(t) 1 para toda t [0, 2] y que
g() = 1, concluimos que g alcanza su valor mnimo en t = y que este valor mnimo es
0. Finalmente, dado que g(0) = g(2) = 9 concluimos que el valor m aximo de g sobre el
intervalo [0, 2] es 9, y que este valor lo alcanza en t = 0 y t = 2 (es decir, en la frontera
de su dominio). De todo lo anterior concluimos entonces que el valor mnimo de f sobre S
es 1 y que este valor lo alcanza en el punto () = (2, 0), y que su valor m aximo sobre la
Fr(B) lo alcanza en el punto (0) = (2) = (2, 0) y que este valor m aximo es 9.
Por lo tanto, comparando los valores de f en los puntos crticos que est an en el interior de
B (f (1, 0) = 0), junto con los valores m aximo y mnimo de f sobre la Fr(B) (f (2, 0) = 1
y f (2, 0) = 9), concluimos que los valores m aximo y mnimo de f sobre B son 0 y 9, y que
estos valores se alcanzan en los puntos (1, 0) y (2, 0), respectivamente (ver figura 4.16).
(2, 0)
(1, 0)
(2, 0)
Figura 2 2
4.16: Los2 valores m
aximo
y mnimo de la funcion f (x, y) = (x + 1) + y sobre el conjunto
B = (x, y) R | k(x, y)k 2 se alcanzan en los puntos (2, 0) y (1, 0), respectivamente.
2. f : R2 R dada por
f (x, y) = x(x 1)2 + y 2
y B = (x, y) R2 | k(x, y)k 1 .

Nuevamente, para determinar los puntos en los que f alcanza un valor m aximo o mnimo
local (o global) sobre B, procederemos como en el inciso anterior. Primero encontraremos los
puntos crticos de f , para lo cual hay que resolver las ecuaciones
f
(x, y) = (x 1)2 + 2x(x 1)
x
= (x 1)(3x 1)
=0
y
f
(x, y) = 2y
y
J. P
aez 224
4.6. M
=0
y cuyas soluciones son las parejas (1, 0) y (1/3, 0), en donde este u
ltimo es el u
nico que queda
dentro del interior de B.
Ahora aplicaremos la proposici on 4.51, para lo cual ser a necesario calcular las segundas
derivadas parciales de f , las cuales resultan ser:
2f
(x, y) = 6x 4
x2
2f
(x, y) = 0
yx
2f
(x, y) = 2
y 2
de modo que para el punto crtico (1/3, 0) se tiene que
2f
(1/3, 0) = 2
x2
2f
(1/3, 0) = 0
yx
2f
(1/3, 0) = 2
y 2
es decir
2
2f 2 f 2f

(1/3, 0) (1/3, 0) (1/3, 0) = 4
x2 y 2 yx
<0
de modo que, por el problema 38 (o el problema 37), concluimos que f tiene un punto silla
en el (1/3, 0).
Como en el inciso anterior, nos resta localizar los puntos en lo que f alcanza sus valores
maximo y mnimo sobre la frontera del conjunto B, que ahora es el conjunto
Fr(B) = (x, y) R2 | k(x, y)k = 1

on : [0, 2] R R2
y que, como en el inciso anterior, podemos parametrizar por la funci
dada por
(t) = (cos(t), sen(t))
Como en el caso anterior, definimos g : [0, 2] R R como
g(t) = (f )(t)
= f ((t))
= cos(t)(cos(t) 1)2 + sen2 (t)
de tal forma que
g (t) = f ((t)) (t)
225 J. P
aez
aximos y mnimos
= (cos(t) 1)(3 cos(t) 1)( sen(t)) + 2 sen(t) cos(t)

= sen(t) (2 cos(t) (cos(t) 1)(3 cos(t) 1))
= sen(t) 3 cos2 (t) + 6 cos(t) 1

Dado que la races de la ecuaci
on cuadratica 3x2 + 6x 1 = 0 son 1 6/3 y 1 + 6/3,
concluimos que los puntos crticos de g en el intervalo abierto (0, 2) son , t0 , y 2 t0 ,
donde t0 (0, ) es tal que cos(t0 ) = 1 6/3. Por lo tanto, como g(0) = 0, g(t0 ) =
en
4 6/9 = g(2 t0 ), g() = 4 y g(2) = 0, concluimos que f alcanza su valor m aximo sobre
S en los puntos
q q

(t0 ) = 1 6/3, 2( 6 1)/3 , (2 t0 ) = 1 6/3, 2( 6 1)/3

y este maximo es 4 6/9, mientras que su valor mnimo lo alcanza en el punto () = (1, 0)
y este valor es 4.
En resumen, comparando los valores de f en los puntos
q q

(1, 0), 1 6/3, 2( 6 1)/3 , 1 6/3, 2( 6 1)/3 , (1, 0)
(el punto crtico (1/3, 0) no lo consideramos puesto que ah la funci

on f tiene un punto
silla), concluimos que el valor mnimo de f sobre el conjunto B es 4 y lo alcanza en el
punto (1, 0), mientras que su valor m aximo es 4 6/9 y lo alcanza en los puntos
q q

1 6/3, 2( 6 1)/3 y 1 6/3, 2( 6 1)/3 .
4.6.1 Breve comentario sobre formas cuadr

aticas
A fin de justificar intuitivamente el resultado mas conocido en el cual se establece (para el
caso general en Rn ) cuando una forma cuadratica F asociada a una matriz A es semipositiva (o
seminegativa) y no degenerada, desarrollaremos las siguientes ideas.
Sin lugar a dudas, las formas cuadraticas del tipo
F (x1 , . . . , xn ) = 1 x21 + + n x2n (4.46)
son las mas simples de analizar, pues es muy facil comprobar que F es una forma cuadratica
semipositiva (seminegativa) y no degenerada si y s olo si i > 0 (i < 0) para cada i {1, . . . , n}
otese que F (
(n ei ) = i ). Tambien es facil comprobar que

1 0
. . .. x t
F (x1 , . . . , xn ) =

x1 xn .. .. . 1 xn
0 n
de tal manera que la matriz asociada a F es la matriz diagonal

1 0
.. . . ..
D= . . .
0 n
J. P
aez 226
4.6. M
Un hecho interesante de este tipo de matrices es que si definimos, para cada k {1, . . . , n},

1 0
.. . . .
Dk = . . ..

0 k
entonces
det(Dk ) = 1 k
de tal forma que ahora podemos reformular la afirmacion anterior de la siguiente manera: F es una
forma cuadratica semipositiva (seminegativa) y no degenerada si y s olo si det(Dk ) > 0 (det(Dk ) < 0
si k es impar y det(Dk ) > 0 si k es par) para cada k {1, . . . , n}.
La buena noticia es que este criterio (por medio de los determinantes de las submatrices Dk )
que se cumple para el caso particular de F , se sigue cumpliendo en el caso general. Es decir, si
F : Rn R es una forma cuadratica que tiene asociada la matriz simetrica

a11 a1n
A = ... .. ..

. .
an1 ann
se prueba que: F es semipositiva (seminegativa) y no degenerada si y s olo si det(Ak ) > 0 (det(Ak ) <
0 si k es impar y det(Ak ) > 0 si k es par) para cada k {1, . . . , n}, en donde

a11 a1k
Ak = ... .. ..

. .
ak1 akk
Como el lector puede comprobar facilmente, en la proposicion 4.51 se prueba esta afirmacion para
el caso n = 2.
Para reforzar un poco mas las ideas anteriores, resulta relevante mencionar un resultado muy

importante del Algebra Lineal (Teorema 6.20 de la referencia que aparece en la nota al pie de la
agina 221): si A Mnn (R) es una matriz simetrica entonces existe B Mnn (R) una matriz
p
ortonormal tal que BAB t es una matriz diagonal, es decir que

1 0
BAB t = ... . . . ... (4.47)

0 k
Como seguramente el lector recordara, las matrices ortonormales son justo las matrices que se
obtienen al (y que se usan para) realizar un cambio entre bases ortonormales de Rn . De esta forma,
y con base en este resultado, podemos afirmar que: si F : Rn R es una forma cuadratica que
tiene asociada la matriz simetrica A (en una base ortonormal { e1 , . . . , en }), es decir que
F (
x) = F (x1 , . . . , xn )
t
= x1 xn A x1 xn
e1 , . . . , en } tal que la matriz asociada a F en esta nueva base

entonces existe otra base ortonormal {
es una matriz diagonal.
227 J. P
aez
aximos y mnimos
En efecto, observe que si

b11 b1n
.. .. ..
B= . . .
bn1 bnn
es la matriz ortonormal tal que BAB t es una matriz diagonal, entonces tomando
ei = bi1 e1 + + bin en
para i {1, . . . , n}, de acuerdo con la identidad 4.1, obtenemos que Rn tiene coor-
si x
denadas (x1 , . . . , xn ) en la base { e1 , . . . , en } entonces sus coordenadas (x1 , . . . , xn ) en la base
{
e1 , . . . , en },est
an dadas por la identidad

b11 b1n

. .. ..
x1 xn = x1 xn ..

. .
bn1 bnn
= x1 xn B

De esta manera, la forma cuadratica F expresada en terminos de las nuevas coordenadas x1 , . . . , xn

se escribe como
F (
x) = F (x1 , . . . , xn )
t
= x1 xn A x1 xn
t
x1 xn B A x1 xn B

=
t
= x1 xn BAB t

x1 xn

1 0
= x1 xn ... . . . ... x1 xn
t
0 k
2 2
= 1 x1 + + n xn

e1 , . . . , en } la funci
es decir, en la base { on cuadratica F tiene la forma 4.46.
Sin duda que la parte medular de estas u ltimas ideas est a en como, dada la matriz A, se
encuentra la matriz ortonormal B y los escalares 1 , . . . , n que satisfagan la identidad 4.47, pero
este problema es justo todo un tema de un curso de Algebra Lineal.
4.6.2 M
aximos y mnimos sobre restricciones
Como se muestra en el ejemplo 4.53, para localizar los puntos en donde una funcion f alcanza sus
valores extremos, no basta con encontrar sus puntos crticos (e incluso puede suceder que estos
valores extremos no se alcancen en este tipo de puntos, como sucede en inciso 2 de este mismo
ejemplo).
En la mayora de los casos, la localizacion de los valores extremos (globales) de una funci on
de Rn en R, requerir a la localizaci
on de valores extremos sobre conjuntos mas peque nos, cuya
caracterstica principal sera que son flacos (es decir, de interior vaco). En los incisos del ejemplo
4.53 estos conjuntos fueron
(x, y) R2 | k(x, y)k = 2 (x, y) R2 | k(x, y)k = 1

y
J. P
aez 228
4.6. M
que adem as de poderse parametrizar por una funcion de R en R2 (propiedad que fue fundamental
para encontrar los valores extremos sobre estos conjuntos), tambien tienen la propiedad de ser los
conjuntos de nivel de alguna funci on de R2 en R. De hecho, ambos conjuntos son conjuntos de
nivel de la funci 2 2
on g(x, y) = x + y para c = 4 y c = 1, es decir N4 (g) y N1 (g), respectivamente.
Lo interesante de la observaci on anterior es que, si ahora nos fijamos en los conjuntos de nivel
de la funcion f (x, y) = (x + 1) + y 2 (la funcion del inciso 1 del mencionado ejemplo) para c = 1
2
y c = 9 (que son los valores extremos que alcanz o f sobre N4 (g), y que denotamos por N1 (f ) y
N9 (f ), respectivamente), notaremos que estos conjuntos de nivel se intersectan tangencialmente
con el conjunto de nivel N4 (g) en los puntos (2, 0) y (2, 0), que son justo los puntos en donde f
alcanza estos valores extremos (ver figura 4.17).
N9 (f )
N4 (g)
b b b b
(4, 0) (2, 0) (2, 0)
N1 (f )
Figura 4.17: Los conjuntos de nivel N9 (f ) y N1 (f ) (de la funcion f (x, y) = (x + 1)2 + y 2 ) intersectan
tangencialmente al conjunto de nivel N4 (g) (de la funcion g(x, y) = x2 + y 2 ) en los puntos (2, 0) y
(2, 0), respectivamente.
Lo importante de este hecho geometrico es que se puede traducir en una identidad (es decir,
se puede traducir en un hecho analtico). En efecto, si ahora recordamos que el gradiente de
una funci on en un punto x 0 siempre es normal al conjunto de nivel que contiene a este punto,
concluimos entonces que los vectores f (2, 0) y g(2, 0) deben ser paralelos (es decir, uno debe
ser m utiplo del otro), y lo mismo debe suceder para los vectores f (2, 0) y g(2, 0), lo que es muy
facil de verificar, ya que
f (x, y) = (2(x + 1), 2y) y g(x, y) = (2x, 2y)
para todo (x, y) R2 , de modo que
f (2, 0) = (6, 0) y g(2, 0) = (4, 0),
y
f (2, 0) = (2, 0) y g(2, 0) = (4, 0)
lo que comprueba que
3 1
f (2, 0) = g(2, 0) y f (2, 0) = g(2, 0)
2 2
La discusion anterior parece sugerir el siguiente hecho: si tenemos una funcion f para la cual
queremos calcular sus valores extremos sobre un conjunto de nivel de una funcion g (digamos Nc (g)),
229 J. P
aez
aximos y mnimos
y localizar los puntos de este conjunto en los cuales alcanza estos valores extremos, es suficiente
con encontrar los puntos x Nc (g) en los cuales se satisface que f ( x) y g(
x) son paralelos.
Aprovechando que ya sabemos cu ales son estos puntos para las funciones f y g del inciso 2 del
ejemplo 4.53, sigamos el procedimiento descrito en el p arrafo anterior y veamos si llegamos a las
mismas soluciones. Manos a la obra!
Como f (x, y) = x(x 1)2 + y 2 y g(x, y) = x2 + y 2 se tiene que
f (x, y) = ((x 1)2 + 2x(x 1), 2y)

= ((x 1)(3x 1), 2y)
y
g(x, y) = (2x, 2y)
de modo que nuestro problema es localizar las parejas (x, y) N1 (g) para las cuales se satisface
que
f (x, y) = g(x, y)
para alguna R, lo cual se traduce en encontrar las parejas (x, y) R2 y los n
umeros R
para los cuales sesatisfacen las siguientes ecuaciones:
f g
(x, y) = (x, y)
x x
f g
(x, y) = (x, y)
y y
g(x, y) = c
que en nuestro caso se traducen en el sistema de ecuaciones
(x 1)(3x 1) = 2x (1)
2y = 2y (2)
2 2
x +y =1 (3)
que en principio se debiera porder resolver, pues es un sistema de tres ecuaciones con tres inc
ognitas
(x, y y ).
Empecemos por observar que, si alguna soluci on de las ecuaciones anteriores fuera tal que y 6= 0,
entonces de la ecuacion (2) deducimos que = 1, de modo que la ecuaci on (1) se convierte en la
ecuaci
on cuadratica (en la variable x)
3x2 6x + 1 = 0
cuyas soluciones son

p
6+ 62 4(3)(1)
x1 =
2(3)

6
=1+
3
y
p
6 62 4(3)(1)
x2 =
2(3)
J. P
aez 230
4.6. M

6
=1
3
las cuales, al sustituirlas en la ecuaci
on (3), concluimos que s
olo podemos tomar el segundo valor,
obteniendo las siguientes soluciones a nuestro sistema original
s

6 2( 6 1)
(x, y) = 1 , con =1
3 3
y
s

6 2( 6 1)
(x, y) = 1 , con =1
3 3
Si ahora suponemos que tenemos una soluci on de nuestro sistema de ecuaciones con y = 0, de
on (3) de este sistema concluimos que x = 1 o x = 1, lo cual, de la ecuaci
la ecuaci on (1) nos
conduce a las soluciones
(x, y) = (1, 0) con =0
y
(x, y) = (1, 0) con =4
Como seguramente el lector ya se percat o, con este procedimiento obtuvimos los mismos puntos
que obtuvimos anteriormente, y la buena noticia es que el procedimiento sigue siendo valido en
cualquier Rn . Es decir, aseguramos que: si f es una funcion derivable sobre un conjunto de nivel
Nc (g) de una funci 0 Nc (g) es un punto en el que la funcion f tiene un m
on derivable g, y x aximo o
mnimo local (sobre Nc (g)), entonces se debe cumplir que f ( x0 ) y g(x0 ) son vectores paralelos,
es decir, que existe R tal que
f (x0 ) = g( x0 )
La importancia de la afirmacion anterior es que, si deseamos localizar los puntos en los que una
funcion f alcanza sus valores extremos (incluso locales) sobre un conjunto de nivel Nc (g) de una
funcion derivable g, basta con encontrar los puntos de este conjunto para los cuales se satisface
que los gradientes de f y de g son paralelos. Ilustraremos la afirmacion anterior con un ejemplo
geometrico (en R3 ) que sin duda el lector conoce (y sabe la respuesta): dado un plano P cuya
ecuacion est
a dada por
Ax + By + Cz + D = 0
(con A2 + B 2 + C 2 > 0) y un punto x 0 = (x0 , y0 , z0 ) R3 , calcular la distacia del punto x
0 al plano
P.
Como sabemos, la distacia del punto x 0 al plano P se obtiene como la mnima distacia entre
el punto x0 y los puntos del plano P , es decir que nuestro problema lo podemos plantear de la
siguiente manera: consideramos la funcion d que nos da la distancia entre el punto x 0 y cualquier
otro punto x 3
= (x, y, z) R , es decir
p
d(x, y, z) = (x x0 )2 + (y y0 )2 + (z z0 )2
y nos planteamos el problema de localizar el mnimo valor de la funcion d sobre el conjunto N0 (g),
en donde g la definimos como
g(x, y, z) = Ax + By + Cz + D
231 J. P
aez
aximos y mnimos
Para simplificar los c

alculos, y dado que el punto en N0 (g) en el que se minimiza la distacia con x
0
es el mismo en el que se minimiza la distacia al cuadrado, trabajaremos con la funcion
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
(esta es una simplificacion que el lector debera de tener siempre muy presente).
Dado que
f (x, y, z) = (2(x x0 ), 2(y y0 ), 2(z z0 ))
y
g(x, y, z) = (A, B, C)
nuestro problema se reduce a resolver el sistema de ecuaciones
2(x x0 ) = A
2(y y0 ) = B
2(z z0 ) = C
Ax + By + Cz + D = 0
De las primeras tres ecuaciones concluimos que

1
x = A + x0
2
1
y = B + y0
2
1
z = C + z0
2
y si sustituimos estos valores en la cuarta ecuaci
on, obtenemos que

1 1 1
A A + x0 + B B + y0 + C C + z0 + D = 0
2 2 2
es decir que
2 (Ax0 + By0 + Cz0 + D)
= (4.48)
A2 + B 2 + C 2
Por lo tanto, sustituyendo en los valores despejados de x, y y z, el punto xp dado por la terna

Ax0 + By0 + Cz0 + D Ax0 + By0 + Cz0 + D Ax0 + By0 + Cz0 + D
p = x0 A
x , y0 B , z0 C
A2 + B 2 + C 2 A2 + B 2 + C 2 A2 + B 2 + C 2
Ax0 + By0 + Cz0 + D
=x0 (A, B, C)
A2 + B 2 + C 2
es el u
nico punto del plano P para el cual se satisface que
f (
xp ) = g(
xp )
en donde est
a dada por 4.48 (n 0 P entonces x
otese que, si x p = x
0 , como era de esperarse!),
de modo que la distacia del punto x
0 al plano P estar
a dada por
q
d(
x0 , P ) = f (
xp )
J. P
aez 232
4.6. M
= k
xp x
0 k

Ax0 + By0 + Cz0 + D
=
(A, B, C)
A2 + B 2 + C 2
|Ax0 + By0 + Cz0 + D|
=
k(A, B, C)k
|Ax0 + By0 + Cz0 + D|
=
A2 + B 2 + C 2
lo que sin duda el lector recordara muy bien de sus cursos de Geometra Analtica.
El ejemplo anterior no solo refuerza nuestra sospecha de que, si una funcion f alcanza un valor
extremo sobre un conjunto de nivel de otra funcion g en un punto x 0 de este conjunto, entonces los
vectores gradiente de f y g en x 0 deben ser paralelos, sino que nos permite plantear un problema
que nos conducira a formular un resultado mas general que el descrito en el p arrafo anterior.
El problema ahora es el siguiente:
1. dada una recta l determinada por la intersecci

on de los planos P1 y P2 cuya ecuaci
on de cada
uno de ellos est
a dada por
A1 x + B1 y + C1 z + D1 = 0
A2 x + B2 y + C2 z + D2 = 0
respectivamente (con (A1 , B1 , C1 ) y (A2 , B2 , C2 ) vectores no paralelos (en particular diferentes

de
0) para que s determinen una recta), y
0 = (x0 , y0 , z0 ) R3 ,
2. un punto x
calcular la distacia del punto x

0 a la recta l.
Como en el ejemplo anterior, usaremos la funcion que nos calcula la distacia al cuadrado entre
el punto x0 y un punto de la recta l, y nuestra tarea sera localizar el punto de l en el que esta
funcion alcanza su valor mnimo (con respecto a los puntos de la recta l). Es decir, tomaremos la
funcion
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
y nuestro objetivo es localizar un punto x

l del conjunto
S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0

tal que f alcanza su valor mnimo (con respecto a los puntos de S) en x

l , en donde g1 y g2 est
an
dadas por
g1 (x, y, z) = A1 x + B1 y + C1 z + D1
g2 (x, y, z) = A2 x + B2 y + C2 z + D2
Desde un punto de vista geometrico, si xl es el punto de la recta l que est

a mas cerca del punto
x
0 , esto significa que x
l es el u
nico punto de esta recta que pertenece al conjunto de nivel Nd (f ) de
f , en donde
d = f (
xl )
233 J. P
aez
aximos y mnimos
= k 0 k2
xl x

y Nd (f ) es la esfera de radio d con centro en x 0 . Dicho de otra forma, la recta l es tangente a
la esfera Nd (f ) en el punto x
l .
Notese ahora que, si tomamos el vector que va de x 0 a xl , que llamaremos v, este debe ser
perpendicular a la recta l, y si por otra parte recordamos que los vectores (A1 , B1 , C1 ) y (A2 , B2 , C2 )
son normales a los planos P1 y P2 (que determinan a la recta l y que por lo tanto la contienen)
tendremos que dichos vectores tambien deber an ser perpendiculares a l (ver figura 4.18).
(A1 , B1 , C1 ) (A2 , B2 , C2 )
P1 l
P2
x
l
v
x
0
Figura 4.18: Dado que la recta l, que es la interseccion de los planos P1 y P2 , es tangente en el punto
x
l a la esfera con centro en x l x
0 , los vectores v = x 0 , (A1 , B1 , C1 ) y (A2 , B2 , C2 ) (los vectores
normales a P1 y P2 , respectivamente) son perpendiculares a l, y por lo mismo pertenecen a un mismo
plano.
Del razonamiento anterior concluimos que, dado que los vectores v, (A1 , B1 , C1 ) y (A2 , B2 , C2 )
son perpendiculares a la misma recta l y como los u ltimos dos son linealmente independientes,
se debe cumplir que el vector v se puede escribir como una combinaci on lineal de los vectores
(A1 , B1 , C1 ) y (A2 , B2 , C2 ).
Finalmente, si ahora observamos:
1. que el vector (A1 , B1 , C1 ) coincide con ser el vector gradiente de g1 evaluado en cualquier
punto del plano P1 (en particular en x l ),
2. que lo mismo sucede con el vector (A2 , B2 , C2 ) y la funcion g2 , y
3. que los vectores f (
xl ) y v son paralelos, pues ambos son normales a la esfera Nd (f )
concluimos que el vector f ( xl ) se debe poder expresar como una combinaci
on lineal de los
vectores g1 ( xl ), es decir, deben existir 1 , 2 R tales que
xl ) y g2 (
f (
xl ) = 1 g1 (
xl ) + 2 g2 (
xl )
Para aprovechar la discusion anterior, formularemos un resultado mas general que seguramente
a intuyendo: si un conjunto S R3 es la intersecci
el lector ya est on de dos conjuntos de nivel
(que sin perdida de generalidad supondremos que son los conjuntos de nivel 0) de dos funciones
(derivables) g1 y g2 , es decir que
S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0

J. P
aez 234
4.6. M
0 S es un punto tal que:

yx
1. los vectores g1 (
x0 ) y g2 (
x0 ) son linealmente independientes, y
2. una funci
on f (derivable) alcanza un valor extremo (incluso local) en x
0 sobre (o con respecto
a) S
entonces se debe cumplir que el vector f ( x0 ) se puede expresar como una combinaci
on lineal
de los vectores g1 ( x0 ), es decir, deben existir 1 , 2 R tales que
x0 ) y g2 (
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
Y si el lector ya est a covencido de que el resultado anterior debe ser cierto, seguramente estar
a
de acuerdo en que su siguiente generalizaci on (para funciones de Rn en R) tambien debe ser cierto:
si g1 , . . . , gm : U Rn R son m funciones de clase C 1 en U , con m < n, S Rn es el conjunto
dado por
x U Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
0 S es un punto tal que:
yx
1. los vectores g1 (
x0 ), . . . , gm (
x0 ) son linealmente independientes, y
2. una funcion f : U Rn R de clase C 1 en U alcanza un valor extremo (incluso local) en x

0
sobre (o con respecto a) S
entonces se debe cumplir que el vector f ( x0 ) se puede expresar como una combinaci on lineal
de los vectores g1 ( x0 ), es decir, deben existir 1 , . . . , m R tales que
x0 ), . . . , gm (
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Todo el trabajo que nos hemos tomado a lo largo de esta secci on ha sido con el u nico objetivo de
llegar al resultado anterior, el cual es conocido como el Teorema de los multiplicadores de Lagrange
4 . Antes de formularlo de manera mas formal, conviene hacer algunas observaciones, empezando
por su nombre: el termino multiplicadores se refiere a los escalares 1 , . . . , m . Al conjunto S se

le conoce con el nombre de conjunto de restricciones y la condici on de que m sea menor a n tiene
que ver con los siguientes dos hechos: uno, que s olo si m es menor o igual a n, se puede cumplir
que m vectores en Rn sean linealmente independientes, y dos, si m = n lo mas probable es que el
conjunto S sea vaco, o s
olo contega a lo mas un n umero finito de puntos. Finalmente, la condici on
1
de que las funciones g1 , . . . , gm y f sean de clase C en U est a directamente relacionada con las
herramientas que usaremos en su prueba, la que por cierto, daremos hasta el siguiente captulo,
pues mucha de esta herramienta la desarrollaremos hasta entonces.
La versi
on que probaremos en este texto del teorema de los multiplicadores de Lagrange es la
siguiente.
Teorema 4.54 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rn R funciones de clase C 1 en U , con m < n,

4
Joseph-Louis Lagrange, bautizado como Giuseppe Lodovico Lagrangia, tambien llamado Giuseppe Luigi La-
grangia o Lagrange (Turn, 25 de enero de 1736 - Pars, 10 de abril de 1813), fue un fsico, matem
atico y astr
onomo
italiano que despues vivi
o en Prusia y Francia. Lagrange trabaj
o para Federico II de Prusia, en Berln, durante veinte
anos. Lagrange demostr o el teorema del valor medio, desarroll
o la mecanica Lagrangiana y tuvo una importante
contribuci
on en astronoma. (fuente: Wikipedia)
235 J. P
aez
aximos y mnimos
2. S Rn el conjunto dado por
x U Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
0 S tal que g1 (
3. x x0 ), . . . , gm (
x0 ) son linealmente independientes.
Si f : U Rn R es una funci on de clase C 1 en U tal que f tiene un m aximo o mnimo
(global o s 0 sobre S entonces existen 1 , . . . , m R tales que
olo local) en x
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Dado que la prueba de este teorema tendra que esperar hasta el siguiente captulo, por ahora
s
olo haremos una importante observaci on con relaci on a la tercera hip
otesis de su enunciado. Esta
observacion se relaciona con el hecho de que un mismo conjunto de restricciones S se puede obtener
usando diferentes colecciones de funciones g1 , . . . , gm , y no en todos los casos estas colecciones
satisfacen la condicion del inciso 3, la cual es fundamental para la validez del teorema. En el
ejemplo siguiente ilustramos esta situacion.
Ejemplo 4.55 Sea S = (t, 0, 0) R3 | t R y

f (x, y, z) = k(x, y, z) (0, 1, 1)k2

= x2 + (y + 1)2 + (z + 1)2
(la distancia al cuadrado entre el punto (x, y, z) y el punto (0, 1, 1)). Como seguramente el
a de acuerdo, se sabe que
lector estar 0 = (0, 0, 0) es el punto en el cual la funci
on f alcanza su
mnimo valor (global) sobre el conjunto S y que en este punto se tiene que
f (0) = (0, 2, 2)
Ahora observemos que si g1 (x, y, z) = z y g2 (x, y, z) = z + y 2 entonces el conjunto S coincide con

ser
S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0

y si g3 (x, y, z) = y tambien se tiene que
S = (x, y, z) R3 | g1 (x, y, z) = 0, g3 (x, y, z) = 0

Ahora, en el primer caso se tiene que g1 (0) = (0, 0, 1) = g2 (0),

es decir, no son linealmente

independientes, y el vector f (0) = (0, 2, 2) no se puede escribir como combinaci on lineal de ellos
(ver figura 4.19), mientras que en el segundo caso se tiene que g1 (0) = (0, 0, 1) y g3 (0) = (0, 1, 0)
los cuales s son linealmente independientes y se verifica que
f (
0) = 2g1 (0) + 2g3 (0)
que es lo que asegura el teorema de los multiplicadores de Lagrange (ver figura 4.20).
Finalmente, mostraremos como se usa el teorema 4.54 concluyendo el problema con el cual lo
motivamos: encontrar la distacia de un punto x0 = (x0 , y0 , z0 ) R3 a una recta l, la cual est
a
determinada como la intersecci
on de dos planos. Desafortunadamente, resolver el caso general
J. P
aez 236
4.6. M
Z
f (0) = (0, 2, 2)
g1 (
0) = g2 (0) = (0, 0, 1)
S
g1 (x, y, z) = 0
Y
X
g2 (x, y, z) = 0
Figura 4.19: En el ejemplo 4.55, los vectores g1 (0) = g2 (0) = (0, 0, 1) no son linealmente indepen-
dientes y el vector f (
0) = (0, 2, 2) no se puede escribir como combinacion lineal de ellos.
Z
f (0) = (0, 2, 2)
g1 (0) = (0, 0, 1)
S
g1 (x, y, z) = 0
g3 (0) = (0, 1, 0) Y
X
g3 (x, y, z) = 0
Figura 4.20: En el ejemplo 4.55, los vectores g1 (0) = (0, 0, 1) y = g3 (0)

= (0, 1, 0) si son linealmente

independientes y el vector f (0) = (0, 2, 2) si se puede escribir como combinacion lineal de ellos, como
asegura el teorema de los multiplicadores de Lagrange.
planteado inicialmente implica realizar largas y tediosas manipulaciones algebraicas, raz

on por la
cual nos limitaremos a resolver el problema para un punto y una recta especficos.
De esta forma, tomemos el punto (1, 1, 1) R3 y la recta determinada por la intersecci
on de los
planos
x+y1=0
yz+1=0
y calculemos el valor mnimo de la funcion
f (x, y, z) = (x 1)2 + (y 1)2 + (z 1)2
sobre el conjunto S R3 dado por
S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0

237 J. P
aez
aximos y mnimos
en donde g1 (x, y, z) = x + y 1 y g2 (x, y, z) = y z + 1 = 0.

De acuerdo con el teorema de los multiplicadores de Lagrange, si x 0 = (x0 , y0 , z0 ) S es el
punto en el que f alcanza su valor mnimo (sobre S), deben existir 1 , 2 R tales que
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
lo que nos lleva a resolver el sistema de ecuaciones

f g1 g2
(
x0 ) = 1 (
x 0 ) + 2 (
x0 )
x x x
f g1 g2
(
x0 ) = 1 (
x 0 ) + 2 (
x0 )
y y y
f g1 g2
(
x0 ) = 1 (
x 0 ) + 2 (
x0 )
z z z
g1 (
x0 ) = 0
g2 (
x0 ) = 0
y que en el caso particular que estamos analizando, se traduce en
2(x0 1) = 1
2(y0 1) = 1 + 2
2(z0 1) = 2
x0 + y 0 1 = 0
y0 z0 + 1 = 0
Para resolver este sistema, de las primeras tres ecuaciones, despejamos a x0 ,y0 y z0 en terminos de
1 y 2 y los sustituimos en las ultimas dos ecuaciones, con lo que obtenemos el siguiente sistema
en las inc
ognitas 1 y 2 :
21 + 2 = 2
1 + 22 = 2
que tiene como solucion 1 = 2/3 = 2 de tal forma que sustituyendo estos valores en las primeras
tres ecuaciones del sistema original, concluimos que
1
(x0 , y0 , z0 ) = (2, 1, 4)
3
de manera que la distancia que se estaba buscando es
s s 2 2 2
1 2 1 4
f (2, 1, 4) = 1 + 1 + 1
3 3 3 3

6
=
3
Si el lector resolvi
o problemas de este estilo en sus cursos de Geometra Analtica, seguramente
noto que en general los c
alculos son mas sencillos, adem as de que se obtuvo explcitamente cu
al es
el punto de la recta que est a mas cercano al punto x 0 , lo que no se suele hacer por los metodos
desarrollados en esos cursos.
J. P
aez 238
4.7. Problemas Captulo 4. La derivada de funciones de Rn en R
4.7 Problemas
1. Sean f : U Rn R, x 0 U y u Rn tal que k
uk = 1. Pruebe que, si la derivada direccional
Du f (
x0 ) existe entonces la derivada direccional Du f (
x0 ) tambien existe y adem
as
x0 ) = Du f (
Du f ( x0 )
2. Pruebe las proposiciones 4.4 y 4.5.
3. Sea f : U Rn R tal que f es constante sobre el conjunto abierto U . Pruebe que f es

derivable para toda x U y que adem as Df (
x) es la funcion lineal constante 0 (Df (x) 0)
para toda x U . Se cumple lo recproco? Es necesaria otra hip otesis sobre el conjunto U ?
Pruebe sus respuestas.
4. Si L : Rn R es una funci Rn y que

on lineal, pruebe que L es derivable para toda x
DL(x) = L.
on f : R2 R que s
5. De un ejemplo de una funci olo sea derivable en el (0, 0).
6. Muestre que las derivadas parciales de la funcion definida en el ejemplo 4.22 no son continuas
en el (0, 0) (sugerencia: hay dos formas de hacer esto, uno directo, mostrando que el lmite de
ambas derivadas en el (0, 0) no existe, y una forma indirecta, usando los resultados probados
en el texto).
7. Sea f : U Rn R tal que U es un conjunto abierto e i {1, . . . , n} fija. Pruebe que,

si para todo par de puntos x , y U tales que x ei para alguna R, se tiene que
y =
f
f (
x) = f (
y ) (es decir, que f no depende de la variable xi ) entonces x i
U
existe para toda x
y adem as
f
(
x) = 0
xi
Se cumple lo recproco? Es necesaria otra hip
otesis sobre el conjunto U ? Pruebe sus
respuestas.
f
8. Sea f : U Rn R tal que x i
existe y es continua en cada punto x U , para i {1, . . . , n}.

Si x1 , . . . , xn es otro sistema de coordenadas (inducido por otra base ortonormal { e1 , . . . , en }),
f
pruebe que x existe y es continua en cada punto x U , para i {1, . . . , n}.
i
f
9. Sean f : U Rn R, x
0 U y r > 0 tal que Br (
x0 ) U . Pruebe que, si xi (
x) existe para
f
Br (
cada x x0 ) y xi est
a acotada en Br (
x0 ) entonces f es continua en x
0 .
10. Sean f : U Rn R, x 0 U , : (a, b) R Rn tal que (a, b) U , y t0 (a, b) tal que

0 . Definimos : (a, b) R R como
(t0 ) = x

f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))

k(t)(t0 )k si (t) (t0 ) 6= 0
(t) =
si (t) (t0 ) = 0

0
Pruebe que, si f es derivable en x

0 y es continua en t0 entonces es continua en t0 .

on 4.26.
239 J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.7. Problemas
12. Pruebe el corolario 4.29.
13. Sea f : U R3 R una funci on que est

a expresada en terminos de las coordenadas cilndricas
U . Si x
(, , z) de cada punto x 0 U tiene coordenadas polares (0 , 0 , z0 ).
f f f
(a) Defina , y z en el punto x
0 . Interprete el significado geometrico de estas derivadas.
(b) Para cada punto x U defina una base ortonormal de R3 en la cual se pueda expresar a
la derivada de f en x
(Df (
x)) en terminos de las derivadas definidas en el inciso anterior.
14. Repita el problema anterior suponiendo ahora que f est

a expresada en terminos de las coor-
denadas esfericas (, , ).
15. Sean, f : U Rn R de clase C 2 en U , y u, v Rn vectores unitarios. Pruebe que Dv (Du f )

y Du (Dv f ) existen y
Dv (Du f )(
x) = Du (Dv f )(
x)
U.
para toda x
16. Sea
xy(x2 y 2 )

x2 +y 2 si (x, y) 6= (0, 0)
f (x, y) =

0 si (x, y) = (0, 0)
f f
(a) calcule x (x, y) y y (x, y) para (x, y) 6= (0, 0)
f f
(b) pruebe que x (0, 0) =0= y (0, 0)
2f 2f
(c) pruebe que yx (0, 0) = 1 y que xy (0, 0) =1
(d) este ejemplo contradice el 4.36? Justifique su respuesta
17. Sean F1 , . . . , Fn : U Rn R tal que Fi es de clase C 1 en U para i = 1, . . . , n, y supongase

f
que existe f : U Rn R tal que x i
(
x) = Fi ( U (i = 1, . . . , n). Pruebe
x) para toda x
Fi Fj
que xj (
x) = xi (
x) U (i, j = 1, . . . , n).
para toda x
18. Sea f : U Rn R de clase C k+1 en U . Pruebe que cualquier derivada parcial de orden k
on de Rn en R) derivable en cualquier punto x
de f es (como funci U.
19. Sea f : U Rn R. Pruebe que si f es de clase C k+1 en U entonces f es de clase C k en U

(para toda k N).
2
20. Sea f : Rn R de clase C 2 en Rn y g : R R dos veces derivable. Pruebe que x(gf )
j xi
(
x)
existe para toda x n
R (i, j = 1, . . . , n) y de una expresi
on para estas derivadas parciales en
terminos de f y g.
21. Sea f : U Rn R, x 0 U y r > 0 tales que f es de clase k x0 ) U . Si

C en Br (
n
h = (h1 , . . . , hn ) es tal que 0 < h < r, y : (r/ h , r/ h ) R R esta dada por
(t) = x
0 + th, pruebe que la funcion

f : (r/ h , r/ h ) R R
J. P
aez 240

es de clase C k en (r/ h , r/ h ) y que adem
as
n
mf
(f )(m) (t) =
X
((t)) hi1 him
xim xi1
i1 ,...,im =1

para cada t (r/ h , r/ h ) y cada m {1, . . . , k}.
22. Sean f, g : R R dos veces derivables.
(a) Definimos h : R2 R como h(x, t) = f (x at) + g(x + at) con a R una constante.
Pruebe que:
2h 2h
a2 2 (x, t) = 2 (x, t) para toda (x, t) R2
x t
(b) Definimos h : R2 R como h(x, y) = xf (x + y) + yg(x + y). Pruebe que:
2h 2h 2h
(x, y) + (x, y) = 2 (x, y) para toda (x, y) R2
x2 y 2 yx
(c) Definimos h : R2 R como h(x, y) = f (x2 + y 2 ). Pruebe que:
2h 2
2 h h h
y2 2
(x, y) x 2
(x, y) + x (x, y) y (x, y) = 0 para toda (x, y) R2
x y x y
23. Sea f : U R2 R y x
0 U .
(a) Pruebe que, si f es derivable en x

0 entonces la funcion polinomial
f f
P2 (x, y) = A(xx0 )2 +B(yy0 )2 +C(xx0 )(yy0 )+ (
x0 )(xx0 )+ (x0 )(yy0 )+f (
x0 )
x y
satisface que
x) P2 (
f ( x)
lim =0
x

x0 k
xx 0 k
para cualesquiera A, B y C n
umeros reales.
f
(b) Muestre con un ejemplo que el inciso anterior es falso si s
olo suponemos que x (
x0 ) y
f
y (
x0 ) existen.
24. Sea f : U Rn R de clase C N en U y x

0 U . Definimos
n n
X f 1 X N f
PN (x1 , . . . , xn ) = f (
x0 ) + x0 )xi + +
( x0 )xi1 xiN
(
xi N! xi1 xiN
i=1 i1 ,...,iN =1
= (h1 , . . . , hn ), pruebe que

Si h
f ( PN (h)
x0 + h)
lim N =0

h 0
h
(sugerencia: use la expresi

on del residuo vista en la demostracion del teorema de Taylor (para
el caso N 1)).
241 J. P
aez
25. Use el polinomio de Taylor de grado dos de la funcion f (x, y) = cos(x + y) para calcular (y
probar) el siguiente lmite:
1 cos(x + y)
lim
(x,y)(0,0) (x2 + y 2 )1/2
26. Sea f (x, y, z) = Ax2 +By 2 +Cz 2 +Dxy +Eyz +F xz +G. Pruebe que el residuo del polinomio
de Taylor de orden dos de esta funcion siempre vale cero (en cualquier punto). Con base en
lo anterior:
(a) escriba el polinomio x2 + y 2 + z 2 en potencias de x 1, y 1 y z 3

(b) escriba el polinomio x2 2y 2 + 4z 2 + xy yz + xz + 1 en potencias de x 1, y + 1 y z
27. Usando el polinomio de Taylor de grado adecuado de la funcion et , y sin hacer demasiados
calculos, encuentre todas las derivadas parciales de orden tres, en el (0, 0), de la funci
on
2 2
f (x, y) = (x2 + y 2 )ex +y
28. Por un procedimiento an alogo al del problema anterior, encuentre el valor de todas las
derivadas parciales de orden tres, en el (0, 0), de la funcion f (x, y) = (exy 1) sen(x + y)
29. Sean x1 , . . . , xn R y N N. Use el teorema de Taylor para probar que

N
X N
(x1 + + xn ) = xk11 xknn
k1 kn
k1 ++kn =N
0ki
donde
N N!
=
k1 kn k1 ! kn !
(este n
umero es conocido con el nombre de coeficiente multinomial).
30. Sean f : U Rn R, H : V Rk Rn , U y V abiertos, x 0 U y y0 V tales que

H(y0 ) = x
0 . Pruebe que, si f alcanza un valor m
aximo (mnimo) local en x0 y H es continua
en y0 entonces f H alcanza un valor m aximo (mnimo) local en y0 . Este resultado sigue
siendo cierto si H no es continua en y0 ? Pruebe su respuesta.
31. Sea f : U Rn R de clase C 2 en U , x 0 U y r0 > 0 tal que Br0 ( x0 ) U , y

= (u1 , . . . , un ) Rn tal que k
u uk = 1. Definimos : (r0 , r0 ) R R como (t) = x
0 + t
u
y g : (r0 , r0 ) R R como g = f . Pruebe que, si f alcanza un valor m aximo (mnimo)
local en x0 entonces g alcanza un valor m aximo (mnimo) local en 0.
32. Sea n N, n 2, y f (x, y) = axn + by n , con ab 6= 0. Muestre que el (0, 0) es el u

nico punto
crtico de f y determine su tipo en terminos de a, b y n.
33. Sea f (x, y, z) = ax2 + by 2 + cz 2 , abc 6= 0. Muestre que el (0, 0, 0) es el u

nico punto crtico de
f y determine su tipo en terminos de a, b y c.
34. Pruebe el inciso 2 de la proposici

on 4.48.
35. Pruebe el inciso 1 de la proposici

on 4.50.
J. P
aez 242
36. Sea f una funcion de clase C 2 en una vecindad de x 0 Rn . Pruebe que, si f alcanza un
mnimo local en x
0 entonces
2f
x0 ) 0
(
x2i
para cada i {1, . . . , n} (sugerencia: use la proposici
on 4.50).
0 = (x1 , . . . , xn ) un punto crtico de una funcion f de clase C 2 en una vecindad de

37. Sea x
0 Rn , tal que
x
2f 2f
2 (
x0 ) 2 (
x0 ) < 0
xi xj
para algunas i, j {1, . . . , n}, con i 6= j. Pruebe que x
0 es un punto silla de f .
38. Sea x0 = (x0 , y0 ) un punto crtico de una funcion f de clase C 2 en una vecindad de x
0 R2 ,
tal que
2
2f 2f
2
f
( x0 )
x0 ) 2 ( x0 ) < 0
(
x2 y yx
Pruebe que x 0 es un punto silla de f (sugerencia: observe que la cantidad anterior est a
relacionado con el discriminante del polinomio de grado 2 que se obtiene en la variable m al
evaluar Hfx0 (1, m), para m R).
39. Sea f : R2 R definida como f (x, y) = (y 3x2 )(y x2 ). Pruebe que:
(a) el origen es un punto crtico de f

(b) si a, b R y g(t) = (at, bt) con t R, entonces f g tiene un mnimo local en t = 0
(c) el origen no es un mnimo local de f
40. Sea f (x, y) = (x2 1)2 (x2 y x 1)2 . Pruebe que:
(a) f s
olo tiene dos puntos crticos
(b) ambos puntos crticos son m
aximos locales
(c) se puede presentar una situaci aloga para funciones de R en R? Pruebe su res-
on an
puesta.
41. Sea f (x, y) = 3xey x3 e3y . Pruebe que:
(a) f s
olo tiene un punto crtico
(b) el punto crtico es un m
aximo local
(c) f no tiene un m
aximo global
(d) se puede presentar una situaci aloga para funciones de R en R? Pruebe su res-
on an
puesta.
42. Encuentre el maximo y el mnimo de la funcion f (x, y) = xy y + x 1 sobre el conjunto

A = {(x, y) R2 | x2 + y 2 2}.
43. Sean (x1 , y1 ), . . . , (xn , yn ) puntos en R2 con x1 < x2 < . . . < xn . Pruebe que:
243 J. P
aez
(a) la funci
on
n
X
d(m, b) = (yi (mxi + b))2
i=1
alcanza un valor mnimo en R2 . Encuentre los valores m0 y b0 para los cuales se alcanza
este valor mnimo (la recta y = m0 x + b0 es la que mejor aproxima a los puntos
(x1 , y1 ), . . . , (xn , yn ) y al metodo que se usa para calcular m0 y b0 se le conoce como el
metodo de los cuadrados mnimos).
(b) si m0 y b0 son los valores del inciso anterior, pruebe que
n
X
(yi (m0 xi + b0 )) = 0
i=1
(c) si n = 2 (es decir, s

olo se toman dos puntos), entonces y = m0 x + b0 es la recta que pasa
por dichos puntos.
44. Encuentre los extremos de f relativos a S, donde:
(a) f (x, y) = x2 y 2 y S = {(x, cos(x)) R2 | x R}

(b) f (x, y, z) = x2 + y 2 + z 2 y S = {(x, y, z) R3 | z 2 + x2 + y 2 }
45. Escriba el n
umero 120 como suma de tres n
umeros de modo que la suma de sus productos,
tomados de dos en dos, sea m
axima.
46. Una compa na planea fabricar cajas rectangulares cerradas con un volumen de 8 litros. El
material para la base y la tapa cuesta el doble que el que se usa para los lados. Encuentre
las dimensiones para las cuales el costo es mnimo.
47. Una ventana tiene la forma de un tri

angulo is
osceles montado sobre un rect angulo. Si la base
del rect
angulo mide x, su altura mide y, los angulos de la base del tri
angulo miden , y el
permetro de la ventana mide 4 metros, encuentre los valores de x, y y que hacen que el
area de la ventana sea maxima.
48. Tres alelos (formas mutantes de genes) A, B y O determinan los cuatro tipos sanguneos:
A (AA o AO), B (BB o BO), O (OO) y AB. La ley de Hardy-Weinberg establece que
la proporcion P de individuos de una poblaci on que llevan dos alelos diferentes es P =
2pq + 2pr + 2qr, donde p, q y r son las proporciones de los alelos A, B y O que se presentan
en dicha poblacion, respectivamente. Use el hecho de que p + q + r = 1 para demostrar que
P 2/3.
49. Sea P un punto en la superficie S R3 que est

a definida por la ecuaci
on f (x, y, z) = 1, donde
f es de clase C 1 . Supongase que P es un punto donde se maximiza la distancia del origen a
S. Pruebe que el vector que sale del origen y termina en P es perpendicular a S.
50. Sea A una matriz de 3 3, simetrica diferente de la matriz cero. Definimos f (x, y, z) =
1 t 3 2 2 2
2 (A(x, y, z) ) (x, y, z) y S = {(x, y, z) R | x + y + z = 1}. Pruebe que, si x 0 S es
un punto en donde f alcanza su valor m aximo (o mnimo) sobre S, entonces x
0 es un vector
propio de A correspondiente a un valor propio distinto de cero, es decir, existe 6= 0 tal que
Ax0 = x0 .
J. P
aez 244
51. Sean a1 , . . . , ak n
umeros positivos. Use multiplicadores de Lagrange para probar que:
a1 + + ak
(a1 ak )1/k
k
52. Use multiplicadores de Lagrange para demostrar que

1/p 1/q
a1 b1 + + an bn (ap1 + + apn ) (bq1 + + bqn )
1
donde ai , bi 0 para i = 1, . . . , n, y p, q > 1 tales que p + 1q = 1 (esta desigualdad es conocida
como desigualdad de H older ).
53. Pruebe que

1/p 1/p
((a1 + b1 )p + + (an + bn )p )1/p (ap1 + + apn ) + (bp1 + + bpn )
donde ai , bi 0 para i = 1, . . . , n, y p 1 (esta desigualdad es conocida como desigualdad de

Minkowski ).
245 J. P
aez
J. P
aez 246
Captulo 5
La derivada de funciones de Rn en Rm
En este captulo introduciremos el concepto de derivada para funciones de Rn en Rm , que entre

otras cosas, tendra que coincidir con los conceptos que hemos desarrollado en los captulos anteriores
cuando n = 1 o m = 1. Y justo por la raz on anterior, mucho del material que veremos ahora estar a
basado en las ideas y conceptos de los captulos anteriores (sobre todo del captulo 4). Y como
muestra de ello, empezaremos por hacerlo as con la definicion de derivada.
5.1 La derivada y sus propiedades

Como era de esperarse, la definicion de derivada de una funcion f : U Rn Rm en un punto
0 U est
x a basada en la misma idea que se us o para las funciones de Rn en R: la existencia de
la mejor aproximacion lineal a f alrededor del punto x 0 . En efecto, como en el caso anterior,
n m
si L : R R es una funci on lineal, que al trasladarla para que en el punto x 0 coincida con
el valor de f en x 0 (es decir, que construimos la funcion afn L(xx 0 ) + f (
x0 )), esta se parece
mucho a f ( x) alrededor de x 0 (en donde el criterio para decir que estas funciones se parecen
mucho es que la diferencia entre ellas tiende a 0 mas r apido, comparado con la rapidez con la que
el punto x se aproxime al punto x 0 ), entonces diremos que f es derivable en x 0 y que la derivada
de f en este punto es la funci on lineal L. Lo anterior, dicho de manera mas precisa, lo dejamos
plasmado en la siguiente
on 5.1 Sean f : U Rn Rm y x
Definici 0 U . Decimos que f es derivable en x
0 si existe
n m
L : R R una funci on lineal tal que
x) (L(
f ( xx
0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
o lo que es equivalente (problema 31 del captulo 2), si
kf (
x) (L(
xx
0 ) + f (
x0 ))k
lim =0
x

x0 k
xx
0 k
Despues de definir un concepto, lo mejor que podemos hacer es dar una condici on que sea
equivalente a este, y eso es justo lo que haremos en la siguiente proposicion. Pero antes de hacerlo,
y dado que haremos uso de ellas, mencionaremos algunos aspectos importantes de las llamadas
funciones coordenadas de una funci on f de Rn en Rm .
Rn puede tener diferentes
As como en el captulo anterior hicimos enfasis en que un elemento x
n
coordenadas, dependiendo de la base ortonormal de R en la que lo estemos representando, de igual
247
Captulo 5. La derivada de funciones de Rn en Rm 5.1. La derivada y sus propiedades
manera las funciones coordenadas de una funcion f dependen de la base ortonormal de Rm con la
que se este trabajando.
En efecto, si f1 , . . . , fm son las funciones coordenadas de f para una cierta base ortonormal
e1 , . . . , em } de Rm (lo que significa que fi (
{ x) es la j-esima coordenada del vector f (
x) en esta
base), es decir que
f (
x) = f1 ( e1 + + fm (
x) x)
em
e1 , . . . , em } es otra base ortonormal de Rm , la funciones coordenadas de f en esta nueva base, que
y {
llamaremos f1 , . . . , fm , se podr an obtener a partir de las funciones coordenadas f1 , . . . , fm a traves
de una matriz ortonormal M Mmm (R), que se obtiene de la misma forma en que obtuvimos la
matriz M que nos permiti Rn , en una base
o obtener las coordenadas x1 , . . . , xn de un vector x
ortonormal { e1 , . . . , en }, a partir de sus coordenadas x1 , . . . , xn en la base ortonorma { e1 , . . . , en }
(identidad 4.2 del captulo 4)).
Esto es, si

(j)
ej = b1 , . . . , b(j)
m
(j)
= b1 e1 + + b(j)
m e m
para cada j {1, . . . , m}, entonces
f (
x) = f1 ( e1 + + fm (
x) x)
em

(1)
x) b1 e1 + + b(1)
= f1 ( m m +
e

..
.

(m) (m)
x) b1 e1 + + bm
+ fm ( em

(1) (m)
= b 1 , . . . , b1 (f1 (
x), . . . , fm (
x))
e1 +
..
.

+ b(1)
m , . . . , b (m)
m (f1 (
x), . . . , fm (
x))
em
x) en la base {
de donde concluimos que la j-esima coordenada del vector f ( e1 , . . . , em }, y que

llamaremos fj (
x), estar
a dada por
(1) (m)
fj ( x) + + bj fm (
x) = bj f1 ( x) (5.1)
para cada j {1, . . . , m}. O lo que es lo mismo, escrito en forma matricial, que
(1) (1)
b1 bm
f1 (x) fm ( x) ... .. ..

x) = f1 ( x) fm ( . .
(m) (m)
b1 bm
en donde tendremos entonces que
(1) (1)
b1 bm
.. .. ..
M = . . .
(m) (m)
b1 bm
la cual, como en el captulo 4, es una matriz ortonormal.
Una vez dicho (y hecho) la anterior, procedemos a dar nuestra siguiente proposici
on.
J. P
aez 248
5.1. La derivada y sus propiedades Captulo 5. La derivada de funciones de Rn en Rm
Proposici on 5.2 Sean f : U Rn Rm , x 0 U y f1 , . . . , fm : U Rn R funciones

coordenadas de f (en una base ortonormal { e1 , . . . , em } de Rm . f es derivable en x
0 si y s
olo si fi
0 para cada i {1, . . . , m}.
es derivable en x
Demostraci on. Sea L : Rn Rm una funcion lineal y supongamos que Li : Rn R son

las funciones coordenadas de L (por lo tanto tambien lineales) determinadas por la misma base
ortonormal de Rm que determina a las funciones coordenadas de f . Dado que la iesima coordenada
del vector
1 x) (L(
f ( xx
0 ) + f (
x0 ))
x) (L(
(f ( xx
0 ) + f (
x0 ))) =
k
xx 0 k k
xx
0 k
est
a dada por
x) (Li (
fi ( xx0 ) + fi (
x0 ))
kxx0 k
para cada i {1, . . . , m}, por la proposici
on 2.30 (del captulo 2), se sigue que
x) (L(
f ( xx
0 ) + f (
x0 ))
lim =0
x

x0 k
xx
0 k
si y s
olo si
x) (Li (
fi ( xx0 ) + fi (
x0 ))
lim =0
x

x0 kxx0 k
de donde las afirmaciones de esta proposici
on se concluyen inmediatamente.
Muchos resultados y propiedades de la derivada de funciones de Rn en Rm ser an una conse-

cuencia inmediata de la proposici on anterior (y de los correspondientes resultados y propiedades
para funciones de Rn en R), y para empezar, la usaremos para probar la unicidad de la derivada
de las funciones de Rn en Rm .
En efecto, como por la proposici on 4.15 del captulo 4 sabemos que la derivada de una funci on
de Rn en R es u nica, por la proposici on anterior concluimos que esto mismo sucede para las
funciones de Rn en Rm . Por esta raz on, de aqu en adelante hablaremos de la derivada de f en x 0
y la denotamos por Df ( x0 ) (igual que en el caso de las funciones de Rn en R); es decir, Df ( x0 )
designara a la funcion lineal que mejor se le parece a f alrededor del punto x 0 .
Por otra parte, y como seguramente el lector recordara de su curso de Algebra Lineal, toda
n m
funcion lineal L : R R se puede representar por una matriz de m n con entradas reales (que
depende de las bases que se elijan para Rn y Rm ), y que se construye de la siguiente manera.
Si L : Rn Rm es una funci on lineal, { e1 , . . . , em } son bases ortonormales de Rn
e1 , . . . , en } y {
y Rm , respectivamente, y x Rn es tal que
x
= (x1 , . . . , xn )
= x1 e1 + + xn en
entonces
x) = L (x1 e1 + + xn en )
L(
e1 ) + + xn L (
= x1 L ( en )
de tal forma que si

ei ) = a1i e1 + + ami em
L (
249 J. P
aez
para cada i {1, . . . , n}, se tiene que
L( e1 ) + + xn L (
x) = x1 L ( en )
= x1 (a11 e1 + + am1 em ) +
..
.
+xn (a1n e1 + + amn em )
= (x1 , . . . , xn ) (a11 , . . . , a1n ) e1 +
..
.
+ (x1 , . . . , xn ) (am1 , . . . , amn ) em
de donde, usando matrices, obtenemos que

a11 a1n x1
.. .. .. ..
L(
x) = . . . .
am1 amn xn
de tal forma que la matriz

a11 a1n
.. .. ..
= . . .
am1 amn
on L (en las bases {
representa a la funci e1 , . . . , en } y {
e1 , . . . , em }). Observese que las matrices i
de 1 n dadas por
i = ai1 ain
para cada i {1, . . . , m}, representar
an a sus correspondientes funciones coordenadas Li , y recprocamente,
si la matriz i representa a la funci on lineal Li , para cada i {1, . . . , m}, entonces la matriz
representa a la funci on lineal L.
De lo anterior, y de la identidad 4.16 del captulo 4, tendremos que, si f1 , . . . , fm son las
funciones coordenadas de la funci on f (las cuales, reiteramos que dependen de la base de Rm que
se elija), entonces la derivada de f en x 0 (Df ( x0 )) estara representada por la matriz
f1 f1
x1 ( x0 ) x n
(x0 )
.. .. ..
(5.2)
. . .
fm fm
x1 (
x0 ) xn (
x0 )
a la que se le concoce con el nombre de matriz jacobiana 1 , y no sin cierto abuso de notaci
on
(nuevamente!) escribiremos que
f1 f1
x1 ( x0 ) x n
(x0 )
Df (
x0 ) =
.. .. ..
. . .
fm fm
x1 (
x0 ) xn (
x0 )
1
Llamada as en honor de Carl Gustav Jacob Jacobi (10 de diciembre de 1804 en Potsdam, Prusia, actual Alemania
-18 de febrero de 1851 en Berln) quien fue un matem atico alem an. Autor muy prolfico, contribuy o en varios campos
de la matem atica, principalmente en el
area de las funciones elpticas, el
algebra, la teora de n
umeros y las ecuaciones
diferenciales. Tambien destaco en su labor pedag ogica, por la que se le ha considerado el profesor m as estimulante
de su tiempo. (fuente: Wikipedia).
J. P
aez 250
Sin duda una condici on que es necesaria y suficiente resulta ser muy u til (como la que se da
en la proposici
on 5.2), sin embargo, las que s olo son necesarias o s
olo son suficientes, tambien lo
son. Y aprovechando que conocemos dos de este tipo de propiedades para funciones de Rn en R,
enunciaremos sus equivalentes para funciones de Rn en Rm . La primera de ellas es una condici on
necesaria de la derivabilidad de una funcion en un punto, y es una consecuencia inmediata de las
proposiciones 5.2, 4.20 (del captulo 4) y 2.40 (del captulo 2).
on 5.3 Sea f : U Rn Rm . Si f es derivable en x

Proposici 0 U entonces f es continua en
x
0 .
La otra propiedad que es muy importante mencionar, y que es una condici on suficiente de la
derivabilidad de una funci
on en un punto, es una consecuencia inmediata de las proposiciones 5.2
y 4.23 (del captulo 4).
Proposicion 5.4 Sean f : U Rn Rm , x 0 U y r > 0 tal que Br ( x0 ) U . Si f1 , . . . , fm son

fj f
funciones coordenadas de f tales que xi ( x) existe para cada x x0 ) y xji es continua en x
Br ( 0 ,
para cada i {1, . . . , n} y para cada j {1, . . . , m}, entonces f es derivable en x 0 .
Como vimos en el captulo 4, la hip

otesis de la proposici
on 4.23 (an
aloga a la anterior) dio lugar
on de clase C k (concepto que jugo un papel muy importante en el tema de
al concepto de funci
aproximacion polinomial), y que ahora vamos a generalizar (apoyados justo en la proposici on 5.2)
a las funciones de Rn en Rm en la siguiente
Definici on 5.5 Sean f : U Rn Rm , f1 , . . . , fm funciones coordenadas de f , y k N. Decimos

que f es una funci on de clase C k en U si cada fj es una funci on de clase C k en U , para j
{1, . . . , m}. Es decir, si existen todas las derivadas parciales de orden k de fj en cada punto de U ,
y adem as estas derivadas parciales son continuas en cada punto de U , para j {1, . . . , m}.
Con respecto a la definicion anterior, hay que mencionar lo siguiente. Por el problema 8 del
captulo 4 y la identidad 5.1, el hecho de que una funcion sea de clase C k en un conjunto (abierto)
es independiente, tanto del sistema coordenado que estemos usando para representar a cada punto
Rn , como del que estemos usando para representar a cada punto y Rm . Es decir, este
x
concepto es independiente de las variables coordenadas x1 , . . . , xn y de las funciones coordenadas
f1 , . . . , fm .
Como mencionamos anteriormente, con base en el concepto de funcion de clase C k (para k =
1) podemos establecer el siguiente resultado, cuya prueba es una consecuencia inmediata de la
proposici on 4.39 del captulo 4 y de la proposici
on 5.2.
on 5.6 Si f : U Rn Rm es de clase C 1 en U entonces f es derivable para toda

Proposici
U.
x
Las propiedades de la derivada de funciones de Rn en Rm relacionadas con la aritmetica de estas,

tambien se obtienen de manera inmediata a partir de la proposicion 5.2 y de las correspondientes
n
propiedades para funciones de R en R, raz on por la cual tampoco las probaremos y s olo las
dejararemos plasmadas en la siguiente
Proposicion 5.7 Sean f, g : U Rn Rm , x

0 U y R. Si f y g son derivables en x
0
entonces:
251 J. P
aez
1. f + g es derivable en x
0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
2. f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y ademas

D(f g)(
x0 ) = f1 (x0 ) fm (
x0 ) Dg(
x0 ) + x0 )
g1 ( gm (
x0 ) Df (
x0 )
en donde f1 , . . . , fm y g1 , . . . , gm son funciones coordenadas de f y g, respectivamente.
Para concluir con esta serie de propiedades, formularemos la relaci on existente entre la derivada
y la composici on de una funci on de R en R con una de R en Rk . Esta ser
n m m a la versi
on mas
general de la regla de la cadena que daremos en este texto, y para probarla podramos hacer uso de
on 5.2 de la siguiente manera: si f : U Rn Rm y g : V Rm Rk , con g1 , . . . , gm
la proposici
funciones coordenadas de g, son tales que f (U ) V , se tiene que la composici on g f est a bien
definida y que las funciones gi f , para i {1, . . . , m}, son funciones coordenadas de g f . De esta
forma, y justo por la proposicion 5.2 , para probar la derivabilidad de g f bastara con probar la
derivabilidad de cada gi f . Sin embargo, la prueba de la regla de la cadena para la composici on
g f , suponiendo que g es una funci on de Rm en R, es casi igual a la prueba que se puede hace
suponiendo que g es una funci on de Rm en Rk , en virtud de lo cual, optaremos por esta u ltima.
Proposici on 5.8 (Regla de la cadena) Sean f : U Rn Rm , g : V Rm R y x 0 U

tales que f (U ) V . Si f es derivable en x x0 ) entonces g f es
0 y g es derivable en y0 = f (
derivable en x
0 y ademas
D(g f )( x0 )) Df (
x0 ) = Dg(f ( x0 )
(o
D(g f )(
x0 ) = Dg(f (
x0 ))Df (
x0 )
si pensamos a las derivadas D(g f )(
x0 ), Dg(f (
x0 )) y Df (
x0 ) como matrices).
Demostraci on. La idea detras de la prueba de este resultado es completamente an aloga a la

seguida en la prueba de la proposicon 4.28 del captulo 4, en virtud de lo cual haremos con menos
detalles los pasos que seguiremos en este caso.
Como hicimos en esa proposici on, ser
a necesario introducir una funcion auxiliar
: U Rn Rk
definida de la siguiente forma:

g(f (
x))g(f (
x0 ))Dg(f ( x0 ))(f (
x )f (
x0 ))

kf (
x)f (
x0 )k si f ( x0 ) 6= 0
x) f (
(x) =
0 x0 ) = 0

x) f (
si f (
y como el lector podr

a verificar muy facilmente, se tiene que
x)) g(f (
g(f ( x0 )) Dg(f (
x0 )) (Df ( xx
x0 ) ( 0 ))
k
xx 0 k
J. P
aez 252
kf (
x) f (
x0 )k Dg(f ( x) f (
x0 )) (f ( x0 )) Dg(f (x0 )) (Df ( xx
x0 ) ( 0 ))
= (
x) +
k
xx 0 k k
xx 0 k

kf (
x) f (
x0 )k x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
= (
x) + Dg(f (
x0 ))
k
xx 0 k kxx 0 k
para toda x U, x
6= x
0 .
Ahora, del hecho de que f es derivable en x 0 , y por los problemas 5.8 y 5.2, obtenemos las dos
siguientes conclusiones: una, que la funcion es continua en x 0 , y dos, que la expresi
on
kf (
x) f (
x0 )k
k
xx 0 k
est
a acotada en una vecindad (agujerada) de x
0 , de tal forma que
kf (
x) f (
x0 )k
lim (
x) =0
x

x0 k
xx 0 k
Por otra parte, dado que f es derivable en x
0 sabemos que
x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
=0
kxx 0 k
y como toda funci
on lineal es continua, tenemos que

x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
lim Dg(f (x0 ))
x
x0 kxx 0 k

x) f (
f ( x0 ) Df ( xx
x0 ) ( 0 )
= Dg(f (x0 )) lim
x
x0 kxx 0 k

= Dg(f (x0 )) 0
= 0
de tal forma que

x)) g(f (
g(f ( x0 )) Dg(f (x0 )) (Df ( xx
x0 ) ( 0 ))
lim
x

x0 k
xx 0 k

kf (
x) f (x0 )k f (x) f (
x0 ) Df ( xx
x0 ) ( 0 )
= lim ( x) + Dg(f ( x0 ))
x
x0 k
xx 0 k kxx 0 k

=0
lo que prueba que g f es derivable en x x0 )) Df (

0 y que su derivada es Dg(f ( x0 ).
5.1.1 Cambio de coordenadas y regla de la cadena

Desde el captulo 1, y a lo largo de todo este texto, se ha venido insistiendo en ver a Rn como
el representante por excelencia (o prototipo) de los espacios vectoriales de dimension n sobre
los numeros reales. Por esta misma raz on, se ha enfatizado la posibilidad de que los elementos de
n
R se pueden describir por medio de diferentes sistemas coordenados (lo que no deja de ser un
poco extra no, pues lo elementos de Rn est
an definidos en terminos de n-adas), incluyendo sistemas
coordenados no cartesianos, como lo son los sistemas coordenados polar (en R2 ), y cilndrico y
esferico (en R3 ).
253 J. P
aez
Con base en lo anterior, se ha puesto particular interes es mostrar que el concepto de derivada
es independiente de estos sistemas coordenados, pero al mismo tiempo se ha visto como se expresa
en estos, as como la manera de pasar de una expresi on a otra cuando pasamos de un sistema
coordenado a otro (ejemplo de esto son las identidades 4.17, 4.18, 4.32 y 4.33). Lo que ahora
deseamos mostrar es que estas mismas identidades (que nos permiten pasar de una expresi on
a otra cuando pasamos de un sistema coordenado a otro) se pueden obtener usando la regla de
la cadena que acabamos de ver.
Por ejemplo, supongamos que { e1 , . . . , en } son dos bases ortonormales de Rn , y
e1 , . . . , en } y {

que x1 , . . . , xn y x1 , . . . , xn denotan las coordenadas de un mismo punto x Rn en cada una de
estas bases, respectivamente. Si
(i)
ei = a1 e1 + + a(i) n e n
para cada i {1, . . . , n}, en el captulo 4 dedujimos que si (x1 , . . . , xn ) son las coordenadas de un
punto x Rn en la base { e1 , . . . , en }, entonces las coordenas (x1 , . . . , xn ) del mismo punto en la
base {
e1 , . . . , en } est
an dadas por
(1) (1)
a an
1. .. ..
x1

x1 xn = xn ..

. .
(n) (n)
a1 an
De esta forma, si definimos g : Rn Rn como
x) = g(x1 , . . . , xn )
g(

(1) (n)
= x1 a1 + + xn a1 , . . . , x1 a(1) (n)
n + + x n an
se tendra que g no es mas que la funci on identidad, solo que a los elementos de su dominio los
estamos expresando en la base { e1 , . . . , en }, mientras que a los de su contradominio los estamos
expresando en la base {e1 , . . . , en }. Este tipo de funciones son conocidas como funciones de cambio
de coordenadas.
Dado que g es la funcion identidad, sin duda g es derivable en todos los puntos de Rn . Por otra
parte, y de acuerdo con la identidad 5.2, tenemos que la matriz jacobiana de g (es decir Dg( x)),
expresada con respecto a las bases { e1 , . . . , en }, est
e1 , . . . , en } y { a dada por
(1) (n)
a1 a1
.. .. ..
Dg(
x) = .

. .
(1) (n)
an an
para toda x Rn .
Ahora, si f : U Rn R es una funcion derivable que est a expresada en terminos de
las coordenadas x1 , . . . , xn , dado que g es la funcion identidad, la composici on f g est
a bien
definida y dado que en sentido estricto (f g)( x) = f ( x) para toda x U (identidad que no
es equivalente a escribir que f (g(x1 , . . . , xn )) = f (x1 , . . . , xn ), puesto que f no depende de las
coordenadas x1 , . . . , xn ), podemos decir que f g es la misma funcion f , pero expresada en terminos
de las coordenadas x1 , . . . , xn . Este hecho es lo que justifica que nos podamos tomar la libertad de
escribir que
(f g) f
(
x) = (x)
xi xi
J. P
aez 254
para cada i {1, . . . , n} y cada x

U , aun y cuando f no dependa directamente de las coordenadas
x1 , . . . , xn .
Por otra parte, y de acuerdo con la identidad (matricial) de la regla de la cadena (proposici
on
5.8), se tiene que
D(f g)(
x) = Df (g(
x))Dg(
x)
= Df (
x)Dg(
x)
es decir que
h i h i
f f (f g) (f g)
xi
(
x) xn (
x) = x1
(
x) xn (x)
(1) (n)
i a1 a1
x) ... ..
h
= f
f ..
xi (
x) xn (

. .
(1) (n)
an an
lo que como seguramente el lector reconocer a, es la misma identidad que obtuvimos en el captulo
4 (identidad 4.17).
De forma analoga al caso anterior, si ahora consideramos la funcion g : R2 R2 dada por
g(, ) = ( cos(), sen())
(la que sin duda sera la funci on de cambio de coordenadas polares a coordenadas cartesianas para
2 2
puntos en R ) y f : R R es una funcion derivable que est a expresada en terminos de las
coordenadas cartesianas x, y, nuevamente por la regla de la cadena tendramos que
h i
(f g) (f g)
(
x ) (
x ) = D(f g)(
x)
= Df (g(
x))Dg(
x)
= Df (
x)Dg(
x)
" #

h
f f
i
( cos())
( cos())
= x ( x) y (
x)
( sen())
( sen())
h
i cos() sen()
f f
= x (
x) y (
x)
sen() cos()
Y si ahora nos tomamos la libertad de escribir que

f (f g) f (f g)
(
x) = (
x) y (
x) = (
x)

concluimos que
h i h i cos() sen()
f f f f
(
x) (
x) = x (
x) y (
x)
sen() cos()
Es importante hacer notar que la matriz de 2 2 que aparece en esta u

ltima identidad, s
olo es
una matriz ortonormal (es decir, una matriz de cambio de coordenadas entre bases ortonormales)
si = 1. Sin embargo, si tomamos 6= 0, la identidad anterior la podemos reescribir como
h i h i cos() sen()
f 1 f f f
(
x) (x) = x ( x) y (
x)
sen() cos()
255 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.2. El teorema de la funci
on implcita
y ahora la matriz de 2 2 de esta u ltima identidad (que por cierto coincide con la identidad
4.33 del captulo 4) s es una matriz que corresponde a un cambio de coordenadas entre bases
ortonormales (entre la base can onica {
e1 , e2 } y la base {
e , e } dada por e = cos()
e1 + sen()
e2
y e = sen()
e1 + cos() e2 ).
Lo importante de la observaci on anterior es que, aun y cuando una funcion g sea una funcion de
cambio de coordenadas, esto no significa que su derivada Dg( x) nos proporcione automaticamente
la matriz de cambio de coordenadas entre las bases ortonormales asociadas (las cuales s se pueden
deducir de la matriz Dg( x), como sucedio en el caso que acabamos de analizar).

on implcita
Una vez que hemos desarrollado las herramientas b asicas relacionadas con el concepto de derivada
para funciones de Rn en Rm , estamos en condiciones de abordar uno de los teoremas mas impor-
tantes del calculo diferencial de varias variables: el Teorema de la Funci on Implcita.
5.2.1 El caso lineal

Con el fin de motivar y deducir el contenido de este teorema, empezaremos por analizar algunas
propiedades y caractersticas de las soluciones de los sistemas de ecuaciones lineales en Rn que
tienen la particularidad de tener menos ecuaciones que inc ognitas, es decir, sistemas de la forma
a11 x1 + a12 x2 + + a1n xn + b1 = 0 (5.3)

a21 x1 + a22 x2 + + a2n xn + b2 = 0
..
.
am1 x1 + am2 x2 + + amn xn + bm = 0
en donde m < n.
Sin duda el caso mas sencillo de este tipo de sistemas de ecuaciones lo tenemos en R2 , y se trata
de un sistema que consta de una sola ecuaci on de la forma
ax + by + c = 0
Como seguramente recordara el lector, si a2 + b2 > 0 la ecuaci on anterior representa una recta en
el plano, y si de obtener sus soluciones se trata, es facil probar que, si a 6= 0 entonces estas son de
la forma
by c
,y
a
para cualquier y R, y si b 6= 0 entonces todas las soluciones las podemos escribir como las parejas

ax c
x,
b
ognita x es diferente de cero (a 6= 0), esta inc

Es decir, si el coeficiente de la inc ognita se puede poner
en funcion de la otra incognita y (x = h(y) = (by c)/a) y todas las soluciones de la ecuaci on son
de la forma (h(y), y), con y R. Sucede lo an alogo si el coeficiente de la incognita y es diferente
de cero (b 6= 0); en este caso y se puede poner en funcion de x (y = h(x) = (ax c)/b) y todas
las soluciones de la ecuaci on son de la forma (x, h(x)), con x R.
J. P
aez 256
5.2. El teorema de la funci
on implcita Captulo 5. La derivada de funciones de Rn en Rm
Para sistemas de ecuaciones en R3 , la situaci

on empieza a ponerse un poco mas interesante. El
primer caso que se puede tener es el de una sola ecuaci
on de la forma
ax + by + cz + d = 0 (5.4)
(la cual geometricamente representa a un plano si a2 + b2 + c2 > 0), y la obtencion de sus soluciones
es muy similar al caso anterior. En efecto, n
otese que si el coeficiente de la inc
ognita x es diferente
de cero (a 6= 0), entonces podemos poner a x en funcion de las inc ognitas y y z como
x = h(y, z)
(by + cz + d)
=
a
y todas las ternas de la forma

(by + cz + d)
(h(y, z), y, z) = , y, z
a
con (y, z) R2 , son las soluciones de la ecuaci on 5.4. Como el lector puede constatar facilmente,
se tiene una situaci
on an aloga si b 6= 0 o c 6= 0.
El caso que se empieza a poner aun m as interesante es cuando tenemos un sistema de dos
ecuaciones de la forma
a11 x + a12 y + a13 z + b1 = 0 (5.5)

a21 x + a22 y + a23 z + b2 = 0
y lo primero que haremos, ser a recordar que en un sistema de este tipo se pueden presentar las
siguientes situaciones.
Una posibilidad es que una de las ecuaciones sea m ultiplo de la otra, es decir, que una de ellas
se puede obtener de la otra multiplicando por un escalar, lo que significa que en realidad nuestro
sistema s olo consta de una ecuaci on, caso que ya analizamos.
La segunda posibilidad es que los planos que representan cada una de las ecuaciones, sean dos
planos distintos pero paralelos, es decir, que los vectores normales a cada uno de ellos ((a11 , a12 , a13 )
y (a21 , a22 , a23 )), sean paralelos; en este caso no existen soluciones y no hay nada que mas que se
pueda hacer.
La tercera y u ltima posibilidad (sin duda la mas interesante) es justo cuando los vectores
(a11 , a12 , a13 ) y (a21 , a22 , a23 ) no son paralelos, y por lo tanto el conjunto de soluciones del sistema
est
a formado por todos los puntos de la recta en la que se intersectan ambos planos. Del hecho de
que los vectores (a11 , a12 , a13 ) y (a21 , a22 , a23 ) no sean paralelos, podemos concluir entonces que el
producto cruz de estos vectores no es el vector 0, es decir que
(a11 , a12 , a13 ) (a21 , a22 , a23 ) = (a12 a23 a13 a22 , a13 a21 a11 a23 , a11 a22 a12 a21 ) (5.6)
6= 0
y por lo tanto tenemos tres posibilidades: a12 a23 a13 a22 6= 0, a13 a21 a11 a23 6= 0 o a11 a22 a12 a21 6=
0, posibilidades que a continuacion nos disponemos a analizar.
Lo primero que habra que destacar es que cada una de las coordenadas del vector dado por 5.6,
resulta ser el determinante de la matriz formada por los coeficientes de algunas de las inc ognitas
de nuestras ecuaciones. En efecto, n otese que a12 a23 a13 a22 es el determinante de la matriz que
se obtiene al considerar solo los coeficientes (de ambas ecuaciones del sistema dado por 5.5) de las
257 J. P
aez
on implcita
ognitas y y z; a13 a21 a11 a23 es el determinante de la matriz que se obtiene al considerar solo
inc
ognitas x y z, y a11 a22 a12 a21 es el determinante de la matriz que se
los coeficientes de las inc
obtiene al considerar solo los coeficientes de las inc
ognitas x y y.
Con base en la observacion anterior, si por ejemplo se tiene que a12 a23 a13 a22 6= 0, todo parece
indicar que lo mas adecuado sera reescribir el sistema de ecuaciones 5.5 en la forma
a12 y + a13 z = a11 x b1

a22 y + a23 z = a21 x b2
o mejor aun, en la forma matricial

a12 a13 y (a11 x + b1 )
=
a22 a23 z (a21 x + b2 )
de tal manera que, si escribimos

a12 a13
M=
a22 a23
como det(M ) = a12 a23 a13 a22 6= 0, sabemos que M es invertible y por lo tanto tendremos que las
inc
ognitas y y z se pueden poner en funcion de la inc ognita x, como

y 1 (a11 x + b1 )
=M
z (a21 x + b2 )

h1 (x)
=
h2 (x)
y que las soluciones del sistema 5.5 estaran dadas por las ternas
(x, h1 (x), h2 (x))
con x R.
Tomando en consideracion el an alisis anterior, seguramente el lector estar a de acuerdo en que,
si ahora lo que se tiene es que a13 a21 a11 a23 6= 0, entonces las inc ognitas x y z se podran poner
en funcion de la inc
ognita y (x = h1 (y) y z = h2 (y)) y que las soluciones del sistema estar an dadas
por las ternas (h1 (y), y, h2 (y)) con y R. Y si lo que sucede es que a11 a22 a12 a21 6= 0, entonces
las inc
ognitas x y y se podr an poner en funcion de la inc
ognita z (x = h1 (z) y y = h2 (z)) y que las
soluciones del sistema estar an dadas por las ternas (h1 (z), h2 (z), z), con z R.
Sin duda el caso anterior es muy ilustrativo y nos da la pauta para resolver el problema general
sobre el calculo de las soluciones del sistema de ecuaciones dado por 5.3. De esta manera, si por
ejemplo se tiene que la matriz de m m formada por los coeficientes de las inc ognitas x1 , . . . , xm ,
dada por
a11 a1m
M = ... .. ..

. .
am1 amm
tiene determinante distinto de cero (y por lo tanto tiene inversa), entonces el sistema 5.3 escrito en
terminos de la matriz M toma la forma

a11 a1m x1 a1(m+1) xm+1 + + a1n xn + b1
.. .. .. .. = ..
. . . . .

am1 amm xm am(m+1) xm+1 + + amn xn + bm
J. P
aez 258
y por lo tanto las inc ognitas x1 , . . . , xm se podr

an poner en funcion de las inc ognitas restantes
xm+1 , . . . , xn como

x1 a1(m+1) xm+1 + + a1n xn + b1
.. 1 ..
. =M

.

xm am(m+1) xm+1 + + amn xn + bm
de tal manera que si definimos
H = (h1 , . . . , hm ) : Rnm Rm
como
a1(m+1) xm+1 + + a1n xn + b1
H(xm+1 , . . . , xn ) = M 1
..
.

am(m+1) xm+1 + + amn xn + bm
entonces encontramos que existen h1 , . . . , hm : Rnm R tales que
xj = hj (xm+1 , . . . , xn )
para j {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.3 est
an dadas por las n-adas
(h1 (xm+1 , . . . , xn ), . . . , hm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) Rn
con (xm+1 , . . . , xn ) Rnm .

En el caso general se tendra que, si los ndices 1 i1 < i2 < < im n, 1 jm+1 < jm+2 <
< jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales que la matriz

a1i1 a1im
.. .. ..
. . .
ami1 amim
es invertible, entonces las inc ognitas xi1 , . . . , xim se pueden poner en funcion de las inc
ognitas
restantes xjm+1 , . . . , xjn , es decir que existen hi1 , . . . , him : R nm R tales que
xik = hik (xjm+1 , . . . , xjn )
para k {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.3 est an dadas por las n-
adas formadas con los n n umeros reales hi1 (xjm+1 , . . . , xjn ),. . .,him (xjm+1 , . . . , xjn ),xjm+1 ,. . .,xjn ,
en donde hik (xjm+1 , . . . , xjn ) es la ik -esima coordenada y xjl es la jl -esima coordenada, para k
{1, . . . , m} y l {m + 1, . . . , n}.
5.2.2 El caso no lineal

Una vez que hemos analizado el caso de un sistema de ecuaciones lineales, el siguiente paso ser
a
considerar un sistema de ecuaciones, pero no necesariamente lineales, sino el determinado por m
funciones g1 , . . . , gm : Rn R dado por
g1 (x1 , . . . , xn ) = 0
g2 (x1 , . . . , xn ) = 0 (5.7)
259 J. P
aez
on implcita
..
.
gm (x1 , . . . , xn ) = 0
on gi es de clase C 1 en Rn .
en donde supondremos que cada funci
Denotaremos por S al conjunto de soluciones de este sistema, es decir
x = (x1 , . . . , xn ) Rn | g1 (
S = { x) = 0, . . . , gm (
x) = 0}
y nuestro objetivo no sera encontrar y caracterizar a todos los elemento de S (como hicimos en el
caso del sistema de ecuaciones lineales), lo que sin duda es un problema bastante difcil. Nuestro
objetivo es algo mas modesto y consiste en lo siguiente: si tenemos una soluci on x 0 del sistema
0 S, es posible decir algo de las soluciones de 5.7 que est
5.7, es decir que x an cerca de x 0 ?
La respuesta a esta pregunta es justo el teorema de la funcion implcita, el cual nos dice algo
sobre el comportamiento de las soluciones del sistema de ecuaciones 5.7 alrededor del punto x 0 .
La idea principal detras del teorema de la funcion implcita radica es la siguiente: dado que
nuestro objetivo es conocer el comportamiento de las soluciones del sistema de ecuaciones 5.7
cerca o alrededor del punto x 0 , entonces sustituyamos cada ecuaci on gi (x1 , . . . , xn ) = 0 por su
mejor aproximacion lineal alrededor de x 0 , es decir por la ecuaci
on
Dgi ( xx
x0 )( 0 ) + gi (
x0 ) = Dgi ( xx
x0 )( 0 ) = 0
o lo que es lo mismo, por la ecuaci

on
gi gi gi
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + bi = 0
x1 x2 xn
en donde bi = Dgi ( x0 ), para cada i {1, . . . , n}.

x0 )(
De esta forma, si para el sistema de ecuaciones lineales dado por
g1 g1 g1
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + b1 = 0
x1 x2 xn
g2 g2 g2
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + b2 = 0 (5.8)
x1 x2 xn
..
.
gm gm gm
(
x0 )x1 + x0 )x2 + +
( (
x0 )xn + bm = 0
x1 x2 xn
se tiene que la matriz
g1 g1
x1 (
x0 ) xm (
x0 )
.. .. ..
(5.9)
. . .
gm gm
x1 ( x0 ) xm ( x0 )
es invertible, por lo visto para el caso de los sistemas de ecuaciones lineales, sabemos que las
inc
ognitas x1 , . . . , xm se pueden poner en funcion de las inc ognitas xm+1 , . . . , xn , es decir que existe
h : Rnm Rm tal que (x1 , . . . , xm ) = h (xm+1 , . . . , xn ), y que sus soluciones est an dadas por
(h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) para todo (xm+1 , . . . , xn ) R nm .
Pues bien, dado que el sistema de ecuaciones dado por 5.8 se parece mucho al sistema de
ecuaciones dado por 5.7 alrededor o cerca de x 0 , el teorema de la funcion implcita asegura
que, alrededor o cerca de x 0 , las inc
ognitas x1 , . . . , xm tambien se pueden poner en funci on
J. P
aez 260

(0) (0) (0) (0)
de las inc
ognitas xm+1 , . . . , xn ; es decir, si x
0 = x1 , . . . , xm , xm+1 , . . . , xn , este teorema nos
asegura que existen r > 0 y

(0)
h : Br xm+1 , . . . , x(0)
n Rnm Rm
de clase C 1 , tal que

(0) (0)
h xm+1 , . . . , x(0)
n = x 1 , . . . , x (0)
m
y las n-adas (h (xm+1 , . . . , xn ) , xm+1, . . . , xn ) tambien son soluciones del sistema 5.7 para cada
(0) (0)
(xm+1 , . . . , xn ) Br xm+1 , . . . , xn , es decir que
(h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) S

(0) (0)
para cada (xm+1 , . . . , xn ) Br xm+1 , . . . , xn .
Antes de dar la formulaci on mas precisa del teorema de la funcion implcita, haremos unas
observaciones importantes. La primera de ellas tiene que ver con la eleccion de la matriz dada por
5.9. Como en el caso del sistema de ecuaciones lineales, si en general los ndices 1 i1 < i2 < <
im n, 1 jm+1 < jm+2 < < jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales que la
matriz g g1

1
xi1 ( x0 ) x im
(
x 0 )
.. .. ..

. . .

gm gm
xi ( x0 ) xi ( x0 )
1 m
es invertible, entonces lo que el teorema de la funcion implcita afirma es que alrededor de x 0 S

las inc
ognitas xi1 , . . . , xim se pueden poner en funcion de las inc ognitas restantes xjm+1 , . . . , xjn , es
decir que existen r > 0 y

(0) (0)
hi1 , . . . , him : Br xjm+1 , . . . , xjn Rnm R
tales que
(0) (0) (0)
xik = hik xjm+1 , . . . , xjn
para k {1, . . . , m}, y que las n-adas formadas con los n n umeros reales hi1 (xjm+1 , . . . , xjn ),. . .,
him (xjm+1 , . . . , xjn ), xjm+1 ,. . .,xjn , en donde hik (xjm+1 , . . . , xjn ) es la ik -esima coordenada y xjl es
la jl -esima coordenada, para k {1, . . . , m} y l {m + 1, . . . , n}, son soluciones del sistema 5.7.
Las otras observaciones que haremos, en realidad son interpretaciones geometricas del teorema
de la funci on implcita para los casos de R2 y R3 . El caso mas sencillo es el de R2 , en el que s olo
se puede tener una restriccion de la forma
g(x, y) = 0
y que no es mas que el conjunto de nivel 0 de g. De acuerdo con lo visto anteriormente, h i si

2 g g
0 = (x0 , y0 ) R es tal que g(x0 , y0 ) = 0 y x (
x x0 ) 6= 0 (la matriz de 1 1 dada por x ( x0 ) es
invertible!), entonces alrededor del punto x 0 = (x0 , y0 ) la variable x se puede poner en funci on
de la variable y, es decir que existen r > 0 y h : (y0 r, y0 + r) R R tales que h(y0 ) = x0 y
g
g(h(y), y) = 0 para toda y (y0 r, y0 + r). Analogamente, si y x0 ) 6= 0 entonces alrededor
(
del punto x 0 = (x0 , y0 ) la variable y se puede poner en funcion de la variable x, es decir que
261 J. P
aez
on implcita
existen r > 0 y h : (x0 r, x0 + r) R R tales que h(x0 ) = y0 y g(x, h(x)) = 0 para toda
x (x0 r, x0 + r).
g
En terminos geometricos, lo anterior significa que si el vector g( x0 ) no es horizontal ( y x0 ) 6=
(
0), es decir no es paralelo al eje X, entonces un sector de la curva de nivel 0 de g alrededor
del punto x 0 = (x0 , y0 ) se puede ver como la gr afica de una funcion de la forma y = h(x) (ver
g
figura 5.1 (a)). Y si el vector g( x0 ) no es vertical ( x x0 ) 6= 0), es decir no es paralelo al eje Y ,
(
entonces un sector de la curva de nivel 0 de g alrededor del punto x 0 = (x0 , y0 ) se puede ver
como la gr afica de una funci on de la forma x = h(y) (ver figura 5.1 (b)).
Y g(
x0 ) Y
g(
x0 ) g(
x0 )
b b
g(x, y) = 0 g(x, y) = 0
g(
x0 )
X X
(a) (b)
Figura 5.1: Si el vector g(x0 ) no es horizontal (vector verde y azul en (a)), entonces un sector de
la curva de nivel 0 de g alrededor del punto x 0 se puede ver como la grafica de una funcion de la
forma x = h(y). Y si el vector g( x0 ) no es vertical (vector rojo y azul en (b)), entonces un sector
de la curva de nivel alrededor del punto x0 se puede ver como la grafica de una funcion de la forma
y = h(x).
Para el caso de R3 , si s
olo se tiene una restriccion de la forma
g(x, y, z) = 0
g
y x0 = (x0 , y0 , z0 ) R3 es tal que g(x0 , y0 , z0 ) = 0 y x x0 ) 6= 0 (lo que significa que el vector
(
g( x0 ) no est
a en el plano Y Z), entonces la variable x, alrededor del punto x 0 , se puede poner
en funcion de la variables y y z, es decir que existen r > 0 y h : Br ((y0 , z0 )) R2 R tales que
h(y0 , z0 ) = x0 y g(h(y, z), y, z) = 0 para toda (y, z) Br ((y0 , z0 )), lo que en terminos geometricos
significa que un sector de la superficie de nivel 0 de g alrededor del punto x 0 = (x0 , y0 , z0 ) se
puede ver como la gr afica de una funci
on de la forma x = h(y, z) (ver figura 5.2). Los otros casos
g
( y x0 ) 6= 0 y g
( z (
x 0 ) 6
= 0) tienen interpretaciones geometricas semejantes.
3
La otra posibilidad en R es cuando tenemos dos restricciones de la forma
g1 (x, y, z) = 0
g2 (x, y, z) = 0
en cuyo caso el conjunto S de soluciones de este sistema se ve como una curva. Ahora, si
0 = (x0 , y0 , z0 ) S, n
x otese que el sistema de ecuaciones dado por 5.8 se reduce al sistema de dos
ecuaciones
g1 g1 g1
(
x0 )x + (
x0 )y + x0 )z g1 (
( x0 ) x
0 = 0
x y y
J. P
aez 262
g(x0 , y0 , z0 ) (y0 , z0 )
g(x, y, z) = 0
X
g
Figura 5.2: Si x x0 ) 6= 0 (lo que significa que el vector g(
( x0 ) no esta en el plano Y Z), entonces un
sector de la superficie de nivel 0 de g alrededor del punto x 0 = (x0 , y0 , z0 ) se puede ver como la
grafica de una funcion de la forma x = h(y, z).
g2 g2 g2
(
x0 )x + (
x0 )y + x0 )z g2 (
( x0 ) x
0 = 0
x y y
y el determinante de las tres posibles submatrices de 2 2 que se pueden construir a partir de este
sistema, coinciden (salvo posiblemente por el signo), con las coordenadas del vector
" #
g1 g1 g1
(
x ) (
x ) x0 ) g 1

y 0 z 0 x ( z (
x0 )
g1 (x0 ) g2 (
x0 ) = det g2 e1 det g2 e2
x0 ) g
y (
2
z (x0 ) x (x0 ) g 2
z ( x0 )
" #
g1
x (x0 ) g 1
y (x0 )
+ det g2 e3
x (x0 ) g 2
y (x0 )
De esta forma, si la matriz " #

g1 g1
y (
x0 ) z (
x0 )
g2 g2
y (
x0 ) z (
x0 )
tiene determinante distinto de 0 (es decir, si la primera coordenada del vector g1 ( x0 )g2 ( x0 ) es
distinta de 0, o equivalentemente, que este vector no pertenece al plano Y Z), entonces las variables
y y z alrededor del punto x 0 se pueden poner en funcion de la variable x, es decir que existen r > 0
y h1 , h2 : (x0 r, x0 + r) R R tales que h1 (x0 ) = y0 , h2 (x0 ) = z0 y g(x, h1 (x), h2 (x)) = 0 para
toda x (x0 r, x0 + r). Esto significa que la funcion de R en R3 dada por h(x) = (x, h1 (x), h2 (x))
(para x (x0 r, x0 + r)) es una parametrizacion de un sector de la curva determinada por las
restricciones g1 y g2 (ver figura 5.3). Las otras dos posibilidades, correspondientes a las otras dos
matrices de 2 2 que se pueden obtener con las derivadas parciales de g1 y g2 , se interpretan de
manera an aloga.
Una vez hechas la observaciones anteriores, escribiremos el tan mencionado teorema de la funci on
implcita. Con el fin de hacer sencilla su redaccion, y dado que en la primera observacion que hicimos
ya mencionamos cu on mas general, supondremos que la matriz de m m que
al sera su formulaci
se necesita que sea invertible (como parte de las hip otesis), es la correspondiente a las primeras
m variables (la matriz dada en 5.9). Y para simplificar aun mas esta redacci on, al espacio Rn lo
m
escribiremos como R R . k
263 J. P
aez
on implcita
Z
g1 (x, y, z) = 0
g2 (
x0 )
b
x
0
g1 (
x0 )
X g1 (
x0 g2 (
x0 )
g2 (x, y, z) = 0
S
Y
Figura 5.3: Si la primera coordenada del vector g1 ( x0 g2 (

x0 ) es distinta de 0 entonces las variables
y y z alrededor del punto x0 = (x0 , y0 , z0 ) se pueden poner en funcion de la variable x. Esto significa
que un sector de la curva S (determinada por la interseccion de las restricciones g1 y g2 ) se puede
parametrizar en terminos de la variable x.
Teorema 5.9 (de la funci on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en U .

Si n o
S = ( x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
x, y) = 0 para i {1, . . . , m}

(0) (0) (0) (0)
y (
x0 , y0 ) = x1 , . . . , xm , y1 , . . . , yk S es tal que la matriz
g1 g1
x1 (
x0 , y0 ) xm (
x0 , y0 )
.. .. ..
. . .
gm gm
x1 x0 , y0 )
( xm (
x0 , y0 )
es invertible entonces existen r > 0 y h : Br ( y0 ) Rk Rm de clase C 1 en Br (

y0 ) tales que
h (
y0 ) = x y ) , y) S para toda y Br (
0 y (h ( y0 ).
Por razones de comodidad, la prueba de este teorema la dejaremos pendiente hasta la siguiente
secci
on, en la que probaremos el teorema de la funcion inversa y con base en el cual demostraremos
el teorema anterior. A cambio de esta prueba, y apoyados en el teorema de la funcion implcita,
haremos una prueba que en el captulo 4 dejamos pendiente: la prueba del teorema de los multi-
plicadores de Lagrange.
La formulacion que daremos a continuaci on de este teorema, aunque totalmente equivalente a
la que dimos en el captulo 4, la escribiremos de tal forma que este mas acorde con la formulaci
on
que acabamos de dar del teorema de la funcion implcita.
Teorema 5.10 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rm Rk R funciones de clase C 1 en U .
2. S Rm Rk el conjunto dado por

n o
S = ( x, y) U Rm Rk | g1 (
x, y) = 0, . . . , gm (
x, y) = 0
J. P
aez 264
x0 , y0 ) S tal que g1 (
3. ( x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes.
Si f : U Rm Rk R es una funci on de de clase C 1 en U tal que f tiene un m
aximo o
x0 , y0 ) sobre S entonces existen 1 , . . . , m R tales que
mnimo (local) en (
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
Demostraci on. Dado que los vectores g1 ( x0 , y0 ), . . . , gm (x0 , y0 ) son linealmente independien-
tes, se tiene que el rango por renglones de la matriz
g1 g1 g1
x0 , y0 ) x
x1 ( m
( x 0 , y
0 ) x n
(
x 0 , y
0 )
.. .. .. .. ..
. . . . .
gm gm gm
x1 x0 , y0 )
( xm x0 , y0 )
( xn (
x0 , y0 )
debe ser m, y como este debe ser igual a su rango por columnas (inciso (c) del Corolario 2 del
Teorema 3.6 de la referencia que aparece en la nota al pie de la p agina 221), dicha matriz debe
tener m columnas linealmente independientes. Supondremos, sin perdida de generalidad, que estas
columnas son las primeras m de tal forma que la matriz de m m
g1 g1
x0 , y0 ) x
x1 ( m
(
x 0 , y
0 )
.. .. ..
. . .
gm gm
x1 x0 , y0 )
( xm (
x0 , y0 )
ser
a invertible. De esta forma, por el teorema de la funcion implcita, sabemos que existen r > 0 y
y0 ) Rk Rm
h = (h1 , . . . , hm ) : Br (
de clase C 1 en Br (y0 ) tales que h (

0 y (h ( y0 ).
Definamos ahora la funci on H : Br ( y0 ) Rk Rm Rk como H( y ) = (h (
y) , y) la cual es de
1
clase C en Br (y0 ). Ahora, como (h ( y ) , y) S para toda y Br ( y0 ), se tiene que (gi H) ( y) = 0
para toda y Br (y0 ) de modo que en particular
D(gi H) (
y0 ) = Dgi (H(
y0 )) DH(
y0 )
= Dgi (
x0 , y0 ) DH(
y0 )

= 0 0 M1k (R)
es decir que el producto de matrices

h1 h1
(y0 ) (y0 )

y1 yk
.. .. ..
. . .
i hm hm

y1 ( y0 ) yk ( y0 )
h
gi gi gi gi

x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 )

1 0

.. .. ..
. . .
0 1
(5.10)

= 0 0 M1k (R)
para cada i {1, . . . , m}.
265 J. P
aez
on implcita
Si ahora definimos los vectores

h1 hm
wj = (
y0 ) , . . . , y0 ) , ej Rm Rk
(
yj yj
para j {1, . . . , k} (en donde e1 , . . . , ek Rk son los vectores can
onicos), se tiene que w1 , . . . , wk
son linealmente independientes de modo que si W Rm Rk es el subespacio generado por estos
vectores (es decir que W = hw1 , . . . , wk i), entonces W es de dimension k (dim(W ) = k).
Ahora n otese que, del hecho de que el producto de matrices 5.10 sea la matriz (de 1 k)
identicamente cero, se concluye que
gi (
x0 , y0 ) wj = 0
x0 , y0 ) W (el complemento
para cada i {1, . . . , m} y cada j {1, . . . , k}, de modo que gi (
ortogonal de W en Rm Rk ) para cada i {1, . . . , m}. Por otra parte, como

dim(W ) = dim Rm Rk dim (W )
= m+kk
=m
y g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes, concluimos que estos vectores son
una base de W .
Finalmente, si ahora consideramos la funcion f H (la cual est a definida en alguna vecindad del
k
punto y0 R ), dado que f tiene un valor extremo (local) en el punto ( x0 , y0 ) = H(
y0 ) entonces
f H tiene un valor extremo (local) en el punto y0 (problema 30 del captulo 4), de modo que y0
es un punto crtico de f H y por lo tanto
D(f H) (
y0 ) = Df (H(
y0 )) DH(
y0 )
= Df (
x0 , y0 ) DH(
y0 )

= 0 0 M1k (R)
es decir que
h1 h1
(y0 ) (y0 )

y1 yk
.. .. ..
. . .
i hm hm

y1 ( y0 ) yk ( y0 )
h
f f f f

x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 )

1 0

.. .. ..
. . .
0 1

= 0 0 M1k (R)
Por tanto, tambien se tiene que
f (
x0 , y0 ) wj = 0
para cada j {1, . . . , j} de modo que f ( x0 , y0 ) tambien pertenece a W = hw1 , . . . , wk i , y como
g1 ( x0 , y0 ) son una base de W , entonces f (
x0 , y0 ), . . . , gm ( x0 , y0 ) debe ser una combinaci on
lineal de estos vectores, es decir, existen 1 , . . . , m R tales que
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
con lo cual concluimos la prueba.
J. P
aez 266
on inversa Captulo 5. La derivada de funciones de Rn en Rm

on inversa
Ademas del papel importante que juega en la prueba del teorema de la funcion implcita, el teorema
de la funcion inversa es relevante por meritos propios. De hecho, este teorema no debe ser ajeno al
lector pues el caso particular de este teorema para funciones de R en R forma parte de los resultados
importantes de un primer curso de calculo.
Ademas de hacer uso de todo el material desarrollado en la primera secci on de este captulo,
necesitaremos algunos resultados relacionados con las funciones lineales de Rn en Rm y su repre-
sentacion matricial, los cuales introduciremos a continuacion.
n m 1
Si f : U R R es una funcion de clase C en su dominio U , sabemos que para cada x U
existe la derivada de f , que la derivada es una funcion lineal de Rn en Rm , que esta se representa
por una matriz (la cual depende de las bases que se elijan para Rn en Rm , y a la que llamamos
matriz jacobiana), y que para cada x U esta matriz est
a dada por
f1 f1

x1 (
x) xn (
x)
Df (
x) =
.
.. .. ..
. .
fm fm
x1 (x) xn (
x)
Como se podr a observar (y era de esperarse), para cada x U tenemos asociada una matriz
cuyas entradas son funciones continuas de x , y una cuesti
on importante es determinar de que forma
se refleja este hecho en las funciones lineales que representan estas matrices. Para ello, observemos
que si evaluamos dos de estas funciones lineales (es decir, la derivada de f en dos puntos x 0 U
, x
) en un punto arbitrario z = (z1 , . . . , zn ) Rn , se tiene que la diferencia entre estos valores est
a
dada por
Df ( z ) Df (
x) ( x0 ) ( x) Df (
z ) = (Df ( x0 )) (
z)
f1 f1 f1 f1
x) x1 (
x1 ( x0 ) xn (
x) xn (
x0 )
z1
=
.
. .. .. ..
. . . .
fm fm fm fm zn
x1 (
x) x1 (
x0 ) x) xn (
xn ( x0 )
x) f1 (
= ((f1 ( x0 )) z, . . . , (fm (
x) fm (
x0 )) z) (5.11)
de tal forma que su distancia satisface que
kDf ( z ) Df (
x) ( z )k = k((f1 (
x0 ) ( x) f1 (
x0 )) z, . . . , (fm(
x) fm (
x0 )) z)k
|(f1 (
x) f1 (
x0 )) z| + + |(fm (
x) fm (
x0 )) z|
kf1 (
x) f1 (
x0 )k k
z k + + kfm (
x) fm (
x0 )k k
zk
m
X
= k
zk kfj (
x) fj (x0 )k
j=1
v
m uX
u n
2
X fj fj
= k
zk t x)
( (
x0 )
xi xi
j=1 i=1
De esta u
ltima desigualdad se desprende que, si

fj fj
x0 ) <

x)
xi ( (
xi
267 J. P
aez
on inversa
entonces
v
m uX
u n fj
2
X fj
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk t x)
( (
x0 )
xi xi
j=1 i=1
v
m uX
u n
( )2
X
< k
zk t
j=1 i=1
v
m
X
u n
uX
t
= k
zk 1
j=1 i=1
m
X
z k n
= k 1
j=1

= k
z k m n (5.12)
para toda z Rn .
Esta u
ltima desigualdad lo que nos dice es que, si la distancia entre las entradas correspondientes
de Df (x) y Df (x0 ) es peque
na, entonces la distancia entre los valores de Df ( x) y Df (
x0 ) en
n
cualquier z R tambien es, con respecto a k z k , proporcionalmente peque na.
Lo interesante de la condici on anterior es que lo recproco tambien es cierto. Es decir, si
x 0 U son tales que
, x
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn , entonces se tiene que

fj fj

xi (
x ) (
x 0 )
xi
para cada i {1, . . . , n} y cada j {1, . . . , m}. En efecto, dado que
Df ( z ) Df (
x) ( x0 ) ( x) f1 (
z ) = ((f1 ( x0 )) z, . . . , (fm (
x) fm(
x0 )) z)
para toda z Rn , entonces para cada i {1, . . . , n} se tiene que

f1 f1 fm fm
Df ( ei ) Df (
x) ( x0 ) (
ei ) = x)
( (
x0 ), . . . , x)
( (
x0 )
xi xi xi xi
y por lo tanto

fj fj

xi (
x ) (
x 0 kDf (
) ei ) Df (
x) ( x0 ) (
ei )k
xi
k
ei k
=
para cada j {1, . . . , m}.

La discusion anterior da lugar a la siguiente proposici
on que nos proporciona una caracterizaci
on
1
de las funciones de clase C en una regi on U .
on 5.11 Sea f = (f1 , . . . , fm ) : U Rn Rm . f es de clase C 1 en U si y s

Proposici olo si
J. P
aez 268
U, y
1. f es derivable para cada x
0 U y cada > 0 existe > 0 tal que si x

2. para cada x B (
x0 ) U entonces
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn .
Demostraci on. ( = ) Como f es de clase C 1 en U , por la proposici on 5.6 sabemos que f es

derivable para cada x U.
f
Sean ahora x 0 U y > 0. Como f es de clase C 1 en U , entonces xji es continua en x 0 para
cada i {1, . . . , n} y cada j {1, . . . , m}, de tal forma que existe > 0 tal que B (
x0 ) U y si
B (
x x0 ) U entonces
fj f j 1
xi (
x) x0 ) <
(
xi m n
1
para toda i {1, . . . , n} y toda j {1, . . . , m}. Por tanto, tomando =
m n
en la desigualdad
5.12, se tiene que

kDf ( z ) Df (
x) ( z k m n
z )k k
x0 ) (
= k
zk
para toda z Rn .
( = ) Recprocamente, para x
0 U y > 0 sabemos que existe > 0 tal que si x
B (
x0 )U
entonces
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
para toda z Rn .
Ahora, por la identidad 5.11, tomando z = ei para cada i {1, . . . , n}, se tiene que

f1 f1 fm fm
x)
( (
x0 ), . . . , x)
( (
x0 ) = Df ( ei ) Df (
x) ( x0 ) (
ei )
xi xi xi xi
de modo que

fj f j f1 f 1 f m f m
x)
xi ( x0 )
( x)
( (
x0 ), . . . , x)
( (
x0 )
xi xi xi xi xi
= kDf ( ei ) Df (
x) ( x0 ) (ei )k
k
ei k
=
fj
para cada j {1, . . . , m}, lo que prueba que xi 0 U , y por lo tanto que f es de
es continua en x
clase C 1 en U .
Dado que el tema de esta seccion se centra en la busqueda de condiciones para que una funcion
f de Rn en Rn sea invertible en la vecindad de un punto x 0 de su dominio, y que bajo ciertas
condiciones de derivabilidad de f en x 0 esta se parece mucho (en una vecindad de este punto) a
una funcion lineal, empezaremos por dar condiciones para que una funcion lineal L de Rn en Rn
sea invertible.
Antes de hacer esto, como seguramente el lector recordara de su curso de Algebra Lineal,
decimos que una funci n n : Rn Rn
on lineal L : R R es invertible si existe otra funcion lineal L
269 J. P
aez
on inversa

(
tal que L L x) = x
= L L (
x) para toda x existe,
Rn , y que cuando esta funcion lineal L
entonces es u on se le suele denotar por L1 .
nica y que por esta raz
Tambien es oportuno tener presente que en este mismo curso de Algebra Lineal se debieron
haber probado dos condiciones necesarias y suficientes para que una funcion lineal L : Rn Rn
sea invertible. Una, que dice que L es invertible si y s x) = 0 s
olo si L ( = 0; y dos, que L es
olo si x
olo si la matriz M asociada a L (en cualesquiera bases de ambos Rn , el dominio y
invertible si y s
el contradominio) es invertible, lo que a su vez es equivalente a que det(M ) 6= 0.
Una vez dicho lo anterior, lo siguiente que haremos ser a formular (apoyados en algunas de
las condiciones mencionadas) otra condici on necesaria y suficiente para que una funcion lineal
L : Rn Rn sea invertible.
Proposici on 5.12 Sea L : Rn Rn una funci

on lineal. L tiene inversa (o L es invertible) si y
s
olo si existe m > 0 tal que
kL (
x)k m kxk
Rn .
para toda x
Demostraci on. Si L tiene inversa, sabemos que L (x) = 0 s = 0 de tal forma que, si
olo si x
consideramos el conjunto
S n1 = {
x Rn | k
xk}
entonces kL ( S n1 .
x)k > 0 para toda x
Ahora, dado que S n1 es un conjunto cerrado y acotado y L es una funcion continua (en Rn ),
entonces kLk alcanza su mnimo valor sobre S n1 , es decir, existe x
0 S n1 tal que
kL (
x)k kL (
x0 )k > 0
S n1
para toda x si hacemos m = kL (
. Por tanto, x0 )k > 0 y tomamos x 6= 0 (pues
Rn , con x

claramente L 0 = 0 = m 0 ), entonces

x

S n1
k
xk
y por lo tanto
x

L kL (
x0 )k = m
k
xk
de modo que
kL (
x)k m k
xk
que es lo que queramos demostrar.
Recprocamente, si existe m > 0 tal que
kL (
x)k m k
xk
Rn , entonces se tiene que

para toda x
kL (
x)k m k
xk > 0
6=
Rn , con x
para toda x x) = 0 s
0, es decir que L ( = 0 lo que implica que L es invertible.
olo si x
J. P
aez 270

Con lo anterior, ya tenemos las herramientas de Algebra Lineal necesarias para probar el teorema
principal de esta seccion: el teorema de la funcion inversa. Antes de hacer esto, e incluso antes
de formular este teorema, daremos un par de lemas con los cuales iremos preparando el terreno
para formularlo y probarlo.
El primero de estos dos lemas nos permitira probar que, si la derivada de una funcion f (de
clase C 1 en un conjunto abierto U ) es invertible en un punto x0 U (en donde Df ( x0 ) se toma
como funci on lineal o como matriz), entonces la derivada de f sigue siendo invertible para todo
punto en una vecindad del punto x 0 .
Lema 5.13 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x

0 U . Si Df (
x0 ) es
invertible entonces existen > 0 y m > 0 tales que
kDf ( z )k m k
x) ( zk
x0 ) U y para toda z Rn .
B (
para toda x
Demostraci
on. Por la proposici
on 5.12, dado que Df ( x0 ) es invertible sabemos que existe m > 0
tal que
kDf ( z )k m k
x0 ) ( zk
para toda z Rn .
Por otra parte, como f es de clase C 1 en U (que es un abierto), por la proposici
on 5.11, tomando
= m /2 > 0, sabemos que existe > 0 tal que B (x0 ) U
m
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
2
para toda x x0 ) y para toda z Rn . Por lo tanto, de la desigualdad del tri
B ( angulo tenemos
que
kDf ( z )k kDf (
x) ( z )k kDf (
x0 ) ( z ) Df (
x) ( x0 ) (
z )k
m
m k
z k k
zk
2
m
= k
zk
2
B (
para toda x x0 ) U y para toda z Rn de tal manera que tomando m = m /2 > 0,
obtenemos el resultado deseado.
Como una consecuencia inmediata de este lema y de la proposici

on 5.12, obtenemos el siguiente
Corolario 5.14 Sea f : U Rn Rn de clase C 1 en U y x 0 U . Si Df (

x0 ) es invertible
entonces existe > 0 tal que Df ( B (
x) es invertible para toda x x0 ) U .
El segundo lema que probaremos tambien es fundamental en la prueba del teorema de la funci on
inversa, pues a partir de este podremos asegurar que una funcion f es localmente invertible, y que
la funcion inversa que se puede definir, es continua en su dominio. Antes, s
olo recordemos que en el
n
captulo 1 definimos otras normas para los elementos de R , una de ellas llamada la norma infinito
(que utilizaremos en la prueba del siguiente lema), y que est a definida (y es denotada) como
k
xk := max{|x1 | , . . . , |xn |}
271 J. P
aez
on inversa
= (x1 , . . . , xn ) Rn , y que con relaci

para cada x on a la norma euclideana satisface la desigualdad

xk n k
k xk
Rn .
la cual es valida para toda x
Lema 5.15 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x

0 U . Si Df (
x0 ) es
invertible entonces existen > 0 y m > 0 tales que
m k
yx
k kf (
y ) f (
x)k (5.13)
, y B (
para toda x x0 ) U .
Demostraci
on. Primero recordemos que si f = (f1 , . . . , fn ) entonces
Df (
x) ( x) z, , . . . , fn (
z ) = (f1 ( x) z)
U y cada z Rn .
para cada x
Como Df ( on 5.12 sabemos que existe m > 0 tal que
x0 ) es invertible, por la proposici
kDf ( z )k m k
x0 ) ( zk

para toda z Rn . Por otra parte, por la proposici
on 5.11 sabemos que para m /2 n > 0 existe
B (
> 0 tal que si x x0 ) U entonces
m
kDf ( z ) Df (
x) ( z )k k
x0 ) ( zk
2 n

para toda z Rn . Probaremos que esta > 0 y esta m = m /2 n > 0 son las cantidades para las
que se satisface la desigualdad 5.13, para toda x , y B ( x0 ) U .
Sean x, y B (
x0 ) y k {1, . . . , n} tal que kDf ( yx
x0 ) ( )k = |fk (
x0 ) (
yx
)|. Entonces
|fk (
x0 ) (
yx
)| = kDf ( yx
x0 ) ( )k
1
kDf ( yx
x0 ) ( )k
n
Ahora, como B (
x0 ) es un conjunto convexo, sabemos que el segmento
x, y] = {
[ ) Rn | t [0, 1]}
yx
x + t(
est x0 ) U , de tal forma que la funcion k : [0, 1] R R definida

a totalmente contenido en B (
como
k (t) = fk ( yx
x + t( ))
es derivable para toda t [0, 1]. De esta forma, aplicando el teorema del valor medio para funciones
de R en R, sabemos que existe k (0, 1) tal que
y) fk (
fk ( x) = k (1) k (0)
= (1 0) k (k )
= k (k )
= fk ( yx
x + k ( )) (
yx
)
J. P
aez 272
Si recordamos ahora que para x = (x1 , . . . , xn ) Rn se tiene que |xi | k

xk para toda i
{1, . . . , n}, entonces tambien tenemos que
kf (
y ) f (
x)k |fk (
y ) fk (
x)|
y
|fk (
x) (
yx
) fk (
x0 ) (
yx
)| kDf ( yx
x0 ) ( ) Df ( yx
x) ( )k
Con base en las desigualdades anteriores (y la desigualdad del tri
angulo), se tiene que
kf (
y) f (
x)k |fk (
y) fk (
x)|

= (k )

k

= |fk ( yx
x + k ( )) (
yx
)|
|fk (
x0 ) (
yx )| |fk ( yx
x + k ( )) (
yx) fk (
x0 ) (
yx
)|
1
kDf ( yx
x0 ) ( )k kDf ( yx
x + k ( )) (yx) Df ( yx
x0 ) ( )k
n
1 m
m k

yx k k yx k
n 2 n
m
= k yx k
2 n
= m kyx k
que es la desigualdad que se deseaba probar.
Como mencionamos anteriormente, de este lema se sigue el siguiente
Corolario 5.16 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x 0 U . Si

Df ( x0 ) U , y adem
x0 ) es invertible entonces existe > 0 tal que f es inyectiva en B ( as f 1 :
n n
x0 )) R R es uniformemente continua en su dominio.
f (B (
Demostraci
on. Por el lema anterior sabemos que existen > 0 y m > 0 tales que
f (

f x x) m x
x
para todo x B (
, x x0 ) U .
Ahora, si tomamos x B (
, x x0 ), con x , entonces
6= x
f (

f x x) m x x

>0
de modo que f ( x ) 6= f (
x) y por lo tanto se tiene que f es inyectiva en B ( x0 ).
Por otra parte, dado > 0, si tomamos = m y y, y f (B ( y yk < , si
x0 )) tales que k
x
, x
B (
x0 ) son tales que y = f (
x ) y y = f (x), se tiene que
1
y f 1 (

f y ) = x x
1
f (

f x x)
m
1 y y

=
m
273 J. P
aez
on inversa
1
<
m
=
lo que prueba que f 1 es uniformemente continua (y por tanto continua) en f (B (

x0 )).
Con base en todo el trabajo realizado previamente, ya estamos en condiciones de formular y

probar el teorema de la funci
on inversa.
Teorema 5.17 (de la funci on inversa) Sea f : U Rn Rn de clase C 1 en el conjunto abierto

0 U . Si Df (
U, y x x0 ) es invertible entonces existe > 0 tal que:
x0 ) U ,
1. f es inyectiva en B (
2. f 1 : f (B (
x0 )) Rn Rn es continua en f (B (
x0 )),
x0 )) Rn es un conjunto abierto, y
3. f (B (
4. f 1 es de clase C 1 en f (B (
x0 )) y adem x) f (B (
as, si y = f ( x0 )) entonces
Df 1 (
y) = Df 1 (f ( x))1
x)) = (Df (
Demostracion. Sean > 0 y m > 0 cuya existencia es asegurada en los lemas 5.13 y 5.15.
Sabemos entonces que
f (

x
m x f x x) (5.14)
para toda x B (
, x x0 ) U , y que
kDf ( z )k m k
x) ( zk (5.15)
para toda x B ( x0 ) y toda z Rn , de modo que por el corolario 5.14 Df ( x) es inyectiva para
toda x B (
x0 ). Por otra parte, por el corolario 5.16 se tiene que f es inyectiva en B (x0 ) ademas
de que f 1 es continua en f (B ( x0 )), con lo que concluimos la que prueba los dos primeros incisos.
Probaremos ahora que f (B ( x0 )) Rn es un conjunto abierto. Sea y = f ( x ) f (B (
x0 )),
con x
B (
x0 ). Como B (
x0 ) es un conjunto abierto, existe > 0 tal que el conjunto
Rn | x

A= x x
se queda contenido en B ( y ) A f (B (
x0 ). Probaremos que existe r > 0 tal que Br ( x0 )), y
para justificar de manera intuitiva el valor de r que vamos a tomar, observese que si y Br (
y )
fuera tal que y = f ( A, por la desigualdad 5.14 se debera tener que
x) para alguna x
= f 1 y f 1 y

xx
1
y y

m
r
<
m
de tal forma que, para no caer en contradicci A, se deber
on con el supuesto de que x a elegir r de
tal forma que r/m .
Con base en el razonamiento anterior, tomamos r = m /2 > 0 y y Br (
y ). Para probar que

A tal que f (
existe x n
x ) = y , definimos h : U R R como
2
x) y

h (
x) = f (
J. P
aez 274
x) y f (
x) y

= f (
Dado que A U es un conjunto cerrado y acotado, y h es continua en U , sabemos que h alcanza

A tal que
un valor mnimo sobre A, es decir, que existe x
y = h x

f x
h (
x)
2
x) y

= f (
para toda x A. Notese que ahora nuestro objetivo es probar que h ( x ) = 0 pues de este hecho
se concluye que f ( x ) = y .
Ahora, como x
A se tiene que k x x
k de modo que, aun y cuando h alcanza un valor
mnimo en x , no podemos asegurar que este sea un punto crtico de h. Con el fin de probar que

s es un punto crtico de h, descartaremos la posibilidad de que k
x x x k = . Si este fuera el
caso, por la desigualdad del tri angulo se tendra que
= f x y

h x
y y y

f x
f x y y

= f x

y y

m x x
m
> m
2
m
=
2
> y y

y

= f x

=h x
x ) es el valor mnimo de h sobre A.

lo que contradice el hecho de que h (
x x
De esta forma, se debe tener que k k < y por tanto x
es un punto crtico de h, es decir
que
= 2 f x y Df x

Dh x
= 0
y por lo tanto que
y Df x
( y Df x
(

f x z) = f x z)
=0
para toda z Rn .
Si ahora recordamos que Df ( B (
x) es invertible (y por tanto suprayectiva) para toda x x0 ),
n
entonces debe existir z0 R tal que
( y

Df x z0 ) = f x
de tal forma que en particular se tiene que
y Df x
(

0= f x z0 )
275 J. P
aez
on inversa
y f x
y

= f x
2
y

= f x
y por lo tanto que f ( x ) = y , lo que prueba que Br (y ) f (B (

x0 )), es decir que f (B ( x0 )) es
un conjunto abierto.
Para probar el u ltimo inciso, nuestro primer paso ser a demostrar que f 1 es derivable en todo

punto y = f (
x ) f (B (x0 )).
Dado que Df (
x ) es invertible para toda x B (
x0 ), mostraremos que (Df ( x ))1 satisface la
definicion 5.1, es decir que
f 1 (
y ) f 1 (
y ) (Df ( x ))1 (
y y )
lim =0
y
y k y y k
Si y y f (B (x0 )), conjunto que ya probamos es abierto, entonces tenemos que eventualmente
y f (B (
x0 )) de tal forma que y = f ( B (
x) para x x0 ) y f 1
x0 ), y como f es continua en B (
lo es en f (B (x0 )) (corolario 5.16) probar la identidad anterior es equivalente a probar que
x
x x ))1 (f (
(Df ( x ))
x) f (
lim =0
x

x kf ( x )k
x) f (
Para probar este u

ltimo lmite, n
otese que
x
x x ))1 (f (
(Df ( x ))
x) f (
kf ( x )k
x) f (
x ))1 [Df (
(Df ( x ) (
xx ) (f ( x ))]
x) f (
=
kf ( x )k
x) f (
x ) Df ( x ) ( )

k
xx k 1 f (
x) f ( xx
= Df ( x)
kf (
x) f ( x )k kxx k
de tal forma que, como (Df ( x ))1 es una funcion continua (toda funcion lineal es continua) y f
, se tiene que
es derivable en x
x ) Df ( x ) ( )

1 f ( x) f ( xx
lim Df ( x )
xx kxx k

x) f (
f (
x ) Df ( x ) (
xx )

1

= Df ( x) lim
x
x kxx k
1
x )

= Df ( 0
=
0
y como por la desigualdad 5.14 sabemos que
k
xx k 1

kf (
x) f (
x )k m
para toda x B (
, x x0 ), con x , concluimos que
6= x
x
x x ))1 (f (
(Df ( x ))
x) f (
lim
x

x kf ( x )k
x) f (
J. P
aez 276
k x ) Df ( x ) ( )

k
xx 1 x) f (
f ( xx
= lim
x )
Df (
x x kf (
x) f (
x )k kxx k
=0
lo que prueba que f 1 es derivable en y = f (

x ) f (B (x0 )) y que
Df 1 y = Df 1 f ( x )

1
= Df ( x )
para toda y f (B (
x0 )).
Finalmente probaremos que f 1 es de clase C 1 en f (B ( x0 )) y para ello usaremos el criterio de
on 5.11. Antes, observemos que de la desigualdad 5.15 y el hecho de que Df 1 (f (
la proposici x)) =
1
(Df (
x)) para toda x B (
x0 ), se tiene que

x))1 (
1
Df (f ( x)) (
z ) = (Df (

z )

1
k
zk
m
para toda z Rn . Por otra parte, de la identidad
Df 1 (f (x)) Df 1 f (
x ) = Df 1 (f ( Df (
x) Df 1 f (
x )

x)) Df x
y la desigualdad anterior, se tiene que

1
z ) Df 1 f (
x ) (
z ) = Df 1 (f ( Df (
x) Df 1 f ( x ) (

Df (f ( x)) ( x)) Df x z )
1
Df (
x) Df 1 f ( x ) (

= Df (f ( x)) Df x z)
1
Df (
x) Df 1 f ( x ) (

Df x z)
m
para todas x B (
, x x0 ).
Una vez dicho lo anterior, sean y = f ( x ) f (B (
x0 )) y > 0. Como f tambien es de clase C 1
en B (
x0 ), por la proposici on 5.11 ( = ) sabemos que existe > 0 tal que si x x ) B (
B ( x0 )
entonces
Df ( z ) m2 k

Df x x) ( zk
para toda z Rn . Por tanto, como f 1 es continua en f (B ( x0 )) existe > 0 tal que si y =
f ( y ) f (B (
x) B ( x0 )) entonces
1
y ) f 1 y = x

f ( x
<
de modo que
1
z ) Df 1 y (
1
z ) Df 1 f ( x ) (

Df (
y ) ( z ) = Df (f ( x)) ( z )
1
Df ( x) Df 1 f ( x ) (

Df x z)
m
1
m2 Df 1 f ( x ) (

z )
m
= m Df 1 f ( x ) (

z )
277 J. P
aez
on inversa

1
m k
zk
m
= k
zk
para toda z Rn , de tal forma que nuevamente por la proposici on 5.11 ( = ) tenemos que f 1
1
es de clase C en f (B (x0 )), con lo cual terminamos la prueba.
Como mencionamos en la secci on anterior, con base en el teorema de la funcion inversa podemos
dar la prueba del teorema de la funci on implcita, y lo mas interesante es que tambien podemos
hacer lo recproco, es decir, probar el teorema de la funci on inversa a partir del teorema de la funci
on
implcita (lo que el lector hara en el problema 21). Este hecho muestra que ambos teoremas son
equivalentes, raz on por la cual era suficiente con dar la prueba de s olo uno de ellos.
Teorema 5.18 (de la funci on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en

U . Si
n o
x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
S = ( x, y) = 0 para i {1, . . . , m}

(0) (0) (0) (0)
x0 , y0 ) = x1 , . . . , xm , y1 , . . . , yk
y ( S es tal que la matriz
g1 g1
x1 (
x0 , y0 ) xm (
x0 , y0 )
.. .. ..
. . .
gm gm
x1 x0 , y0 )
( xm (
x0 , y0 )
es invertible entonces existen r > 0 y h : Br ( y0 ) Rk Rm de clase C 1 en Br (

y0 ) tales que
h (
0 y (h ( y0 ).
on. Definamos g : U Rm Rk Rm como

Demostraci
g (
x, y) = (g1 (
x, y) , . . . , gm (
x, y))
y f : U Rm Rk Rm Rk como
f (
x, y) = (g (
x, y) , y)
Es inmediato que f y g son de clase C 1 en U y que adem

as:
x0 , y0 ) , y0 ) = 0, y0 , y

x0 , y0 ) S entonces f (
1. como ( x0 , y0 ) = (g (
2. la matriz

g1 g1 g1 g1
x1 x0 , y0 )
( xm (
x0 , y0 ) y1 x0 , y0 )
( yk (
x0 , y0 )
.. .. .. .. .. ..

. . . . . .

gm gm gm gm
x0 , y0 )
x1 ( (
x0 , y0 ) x0 , y0 )
y1 ( (
x 0, y
0 )

Df (
x0 , y0 ) = xm yk

0 0 1 0
.. .. .. .. .. ..

. .

. . . .
0 0 0 1
es invertible.
J. P
aez 278
Por tanto, por el teorema de la funcion inversa sabemos que existe > 0 tal que:
x, y) Rm Rk | k(

1. f es inyectiva en B (
x0 , y0 ) = ( x, y) (
x0 , y0 )k < r U ,
x0 , y0 )) Rm Rk es un conjunto abierto, y
2. f (B (
3. f 1 : f (B (
x0 , y0 )) Rm Rk es de clase C 1 en f (B (
x0 , y0 )).
De esta forma, como

x0 , y0 ) f (B (
0, y0 = f ( x0 , y0 ))
existe r > 0 tal que Br

0, y0 f (B (
x0 , y0 )). Notese que, si
n o
y0 ) = y Rk | k
y Br ( y y0 k < r
entonces 0, y0 . De esta manera, si f 1 = f11 , . . . , fm+k

0, y Br 1

, definimos
y0 ) Rk Rm
h : Br (
como
y ) = f11 0, y , . . . , fm
1

h ( 0, y
Dado que f 1 tambien es de clase C 1 en Br 0, y0 f (B (

x0 , y0 )), se sigue inmediatamente
1
que h es de clase C en Br (y0 ). Ahora mostraremos que (h ( y ) , y) S para toda y Br ( y0 ).
otese que para toda y Br (
Para ello, n y0 ) se tiene que

0, y = f f 1

0, y
= f f11
1
1 0, y , . . . , f 1 0, y

0, y , . . . , fm 0, y , fm+1 m+k
1 1 0, y

= f h (
y ) , fm+1 0, y , . . . , fm+k
y ) , f 1 0, y , . . . , f 1 0, y , f 1 0, y , . . . , f 1 0, y

= g h ( m+1 m+k m+1 m+k
de modo que
1 0, y , . . . , f 1 0, y

0 = g h (
y) , fm+1 m+k
y
1 0, y , . . . , f 1 0, y

y = fm+1 m+k
es decir que
1 0, y , . . . , f 1 0, y

g (h (
y ) , y) = g h (
y ) , fm+1 m+k
= 0
y) , y) S para toda y Br (
lo que significa que (h ( y0 ), que es lo que nos restaba probar.
Con esta prueba concluimos esta secci

on, este captulo y este texto!
279 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.4. Problemas
5.4 Problemas
1. Pruebe que la proposici
on 5.2 es independiente de las funciones coordenadas de f que se
tomen.
2. Sea f : U Rn R derivable en el punto x0 U . Pruebe que existen r > 0 y M > 0 tales

que
kf (
x) f (
x0 )k
M
k
xx 0 k
(Br (
para toda x x0 ) \ {
x0 }) U .
3. Sean f : U Rn Rm , g : V Rm R y x 0 U tales que f (U ) V . Definimos

: U Rn Rk como

g(f (
x))g(f (
x0 ))Dg(f ( x0 ))(f (
x )f (
x0 ))

kf (
x)f (
x0 )k si f ( x0 ) 6= 0
x) f (
(
x) =
0 x0 ) = 0

x) f (
si f (
Pruebe que, si f es continua en x

0 y g es derivable en y0 = f (
x0 ) entonces es continua en
x
0 .
4. Sean f : U Rn R y g : U Rn Rm derivables en el punto x 0 U . Pruebe que la

funcion (f g)(
x) = f (
x)g( 0 U y de una formula para la D(f g)(
x) es derivable en x x0 ).

5. Si A = a11 a12 a13 M13 (R) y

b11 b1n
B = b21 b2n M3n (R)
b31 b3n
definimos el producto cruz de la matriz A por la matriz B (que denotaremos por AB), como
la matriz de 3 n (con entradas reales) cuyas entradas de su jesima columna coinciden con
las coordenadas del vector
(a11 , a12 , a13 ) (b1j , b2j , b3j ) = (a12 b3j a13 b2j , a13 b1j a11 b3j , a11 b2j a12 b1j )
es decir que

a12 b31 a13 b21 a12 b3n a13 b2n
A B := a13 b11 a11 b31 a13 b1n a11 b3n M3n (R)
a11 b21 a12 b11 a11 b2n a12 b1n
Sean f = (f1 , f2 , f3 ), g = (g1 , g2 , g3 ) : U Rn R3 derivables en el punto x0 U . Pruebe

on (f g)(
que la funci x) := f (x) g( 0 U y de una formula para la
x) es derivable en x
D(f g)(x0 ) en terminos del producto cruz de matrices definido en el p arrafo anterior.
6. Encuentra todas las funciones f : Rn Rn tales que Df (

x) es una matriz diagonal para toda
Rn . Pruebe su respuesta.
x
J. P
aez 280
5.4. Problemas Captulo 5. La derivada de funciones de Rn en Rm
7. Abusar de la notaci on (como de cualquier otra cosa) suele causar problemas. En particular,
usar letras (que casi siempre denotan variables) para referirse tambien a funciones nos puede
llevar a errores. Sea w = f (x, y, z) y z = g(x, y). Por la regla de la cadena, se tiene que:
w w x w y w z
= + +
x x x y x z x
y x
Como x y y son variables independientes, entonces x = 0 y como x = 1, se tiene que:
w w w z
= +
x x z x
As, w z
z x = 0. Si f (x, y, z) = 2x + y + 3z y g(x, y) = 5x + 18, entonces
w
z =3y z
x =5y
por lo tanto 0 = 15. Cu al es el error?
8. Sean, f : R2 R y g : R2 R2 definida como g(r, ) = (r cos(), r sen()). Calcule

(f g) (f g)
r (r0 , 0 ) y (r0 , 0 ) (en un abuso de notaci
on muy frecuente (y peligroso, como se
vio en el problema anterior)), estas derivadas parciales suelen escribirse simplemente como
f f
r y ).
9. Sean f y gpdefinidas como f (u, v) = (u cos(v), u sen(v)) con 0 < u < y /2 < v < /2; y
g(x, y) = ( x2 + y 2 , arctan(y/x)) con 0 < x < . Calcule D(f g)(x, y) y D(g f )(u, v).
(a) Suponga que la variable w est a en funcion de las variables x, y, z y t (es decir: w =
f (x, y, z, t)), que x = g(u, z, t) y que z = h(u, t). Tomando en cuenta todas estas
relaciones, calcule wt
(b) si
f (x, y, z, t) = 2xy + 3z + t2
g(u, z, t) = ut sen(z)
h(u, t) = 2u + t
w
calcule t para u = 1, t = 2 y y = 3
f 2 2
10. Suponga que f : R2 R es tal que x (2, 1) = 3, f f f
y (2, 1) = 2, x2 (2, 1) = 0, yx (2, 1) =
2f 2f 2 (f g)
xy (2, 1) =1y y 2
(2, 1) = 2. Si g(u, v) = (u2 + v, uv) calcule vu (1, 1).
11. Sea f : U R2 R de clase C 2 en U tal que f x (x, y) > 0 para toda (x, y) U , y sea
(x0 , y0 ) U . Si I = {y R |(x0 , y) U }, definimos g : I R R como g(y) = f (x0 , y).
Pruebe que:
(a) existe > 0 y h : (y0 , y0 + ) I R de clase C 1 tal que f (h(y), y) = f (x0 , y0 ) para
toda y (y0 , y0 + )
(b) g tiene un maximo (mnimo) local en y0 si y s olo si h tiene un mnimo (m
aximo) lo-
2f
cal en y0 . (suponga que y2 (x0 , y0 ) 6= 0, para que todo sea mas facil). Interprete
geometricamente.
12. Sean f, g : U R2 R de clase C 1 en A. Definimos F : U R2 R2 y H : U R2 R

como
F (x, y) = (f (x, y), g(x, y)) y H(x, y) = kF (x, y)k2
0 U que satisfaga las siguientes dos propiedades:
Demuestre que no existe x
281 J. P
aez
Captulo 5. La derivada de funciones de Rn en Rm 5.4. Problemas
(a) H tiene un m
aximo local en x
0
(b) DF (
x0 ) es invertible
13. Sea f : Rn Rn derivable en un punto x 0 Rn y ademas supongase que x0 es un punto fijo

de f (es decir: f (
x0 ) = x x0 ) y k N, encuentre una funci
0 ). Si A denota a la matriz Df ( on
g : Rn Rn derivable en x 0 tal que Dg(x0 ) = Ak .
14. Sea f : U R3 R una funci on que est

a expresada en terminos de las coordenadas carte-
sianas (x, y, z) de cada punto x U . Use la funcion de cambio de coordenadas cilndricas
(, , z) a coordenadas cartesianas (x, y, z), y la regla de la cadena, para encontrar (en cada
punto x U ) una base ortonormal de R3 en la cual se pueda expresar a la derivada de f en
x
(Df ( x)) en terminos de las derivadas parciales f f f
, y z . Compare con lo obtenido en
el problema 13 del captulo 4.
15. Repita el problema anterior ahora para las coordenadas esfericas (, , ) y compare con lo
obtenido en el problema 14 del captulo 4.
16. Sean g1 , . . . , gm : Uh Rm Rik R, S y ( x0 , y0 ) S como

h en el iteorema de la funci on
gi gi
implcita. Si A = xj ( x0 , y0 ) , i, j = 1, . . . , m, y B = yj ( x0 , y0 ) , i = 1, . . . , m y j =
1, . . . , k, pruebe que:
y0 ) = A1 B
Dh(
donde h es la funci
on cuya existencia es garantizada en el mencionado teorema.
17. Sea f : U Rn R de clase C 1 en U y S = { x U | f (

x) = cte}. Si x Rn , denotamos
por x (i) el elemento de R n1 que se obtiene de x
al eliminarle su i-esima coordenada, con
(1) (n)
i {1, . . . , n}. Sea x
0 = (x0 , . . . , x0 ) S.
f
(a) pruebe que, si x0 ) 6= 0
xi ( entonces existe hi : Ui Rn1 R de clase C 1 en Ui tal que
(i) (i) (i)
x
0 Ui , hi (
x0 ) = x0 y
(x1 , . . . , xi1 , hi (x1 , . . . , xi1 , xi+1 , . . . , xn ), xi+1 , . . . , xn ) S
para todo (x1 , . . . , xi1 , xi+1 , . . . , xn ) Ui .

hi (i) hn (n)
(b) si hi es la funci
on del inciso anterior, calcule xi+1 (
x0 ) (para i = n calcule x1 (
x0 ))
en terminos de derivadas parciales de f
f
(c) si xi (
x0 ) 6= 0 para cada i {1, . . . , n}, pruebe que
h1 (1) h2 (2) hn1 ((n1)) hn (n)

(
x ) (
x ) (
x0 ) (
x ) = (1)n
x2 0 x3 0 xn x1 0
g
18. Sea g : U Rn R de clase C 1 (en U ) y x 0 U tal que g( x0 ) = 0 y x n
x0 ) 6= 0. Si v 6=
( 0
n
x0 ) = 0, pruebe que existen > 0 y : (, ) R derivable tal que
es tal que v g(
0 y (0) = v. Interprete geometricamente.
g((t)) = 0 para toda t (, ), (0) = x
19. Considere el conjunto de soluciones de las ecuaciones:
2x + y + 2z + u v 1 = 0
xy + z u + 2v 1 = 0
yz + xz + u2 + v = 0
J. P
aez 282
5.4. Problemas Captulo 5. La derivada de funciones de Rn en Rm
(a) Muestre que, en una vecindad del punto (1, 1, 1, 1, 1), las variables x, y y z (del conjunto
de soluciones) se pueden poner en funcion de las variables u y v.
(b) Calcule la derivada de la funcion del inciso anterior en el punto (1, 1).
(c) Encuentre todas la ternas de variables que se puedan poner en funcion de las restantes
dos, en una vecindad del mismo punto.
20. Sea
x
2
x sen(1/x) + 2 si x 6= 0
f (x) =
0 si x = 0

(a) calcule f (x) para toda x R

(b) pruebe que para toda > 0 existen x, y (, ) tales que f (x) < 0 y f (y) > 0
(c) pruebe que f no es invertible en ninguna vecindad del cero. Este ejemplo contradice el
Teorema de la Funcion Inversa?
21. Pruebe el teorema de la funci

on inversa a partir del teorema de la funcion implcita.
22. Sean f : Rn Rn de clase C 1 y c > 0 tales que para toda x

, y Rn se tiene que
kf (
x) f (
y )k c k
x yk
Pruebe que:
Rn , Df (
(a) para toda x x) es invertible
(b) f (Rn ) es abierto
(c) f (Rn ) es cerrado
(d) f es biyectiva y f 1 : Rn Rn es de clase C 1 (en Rn )
23. Sea g = (g1 , . . . , gm ) : A Rn Rm de clase C 1 (en A) con n > m. Sea x 0 A tal que
g(
x0 ) = 0.
h im
gi
(a) Si la matriz M = x i
(
x 0 ) es de rango m, pruebe que existen U, V Rn abiertos y
i,j=1
h : U V una biyecci on de clase C 1 en U (y h1 de clase C 1 en V ) tales que x
0 V A
y g(h(x1 , . . . , xn )) = (x1 , . . . , xm ) para todo (x1 , . . . , xn ) U .
(b) Describa a el conjunto (g h)1 (0).
(c) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(d) Use el primer inciso para demostrar que si Dg(
x0 ) tiene rango m
aximo (m) entonces
Dg(
x) tiene rango maximo para x
en una vecindad de x 0 .
(e) Si Dg(
x0 ) no tiene rango m
aximo (es decir, si el rango de Dg(x0 ) es k < m) se sigue
cumpliendo un resultado analogo al del primer inciso? al del cuarto inciso? (es decir,
si Dg(
x0 ) tiene rango k < m existe una vecindad de x 0 en la que Dg sigue teniendo
rango k?). Pruebe sus respuestas.
(f) Interprete geometricamente.
283 J. P
aez
24. Sea g : U Rn Rm de clase C 1 (en U ) con n > m. Pruebe que g no es inyectiva.
25. Sea f : U Rn Rm de clase C 1 (en U ) con n < m.

(0) (0)
(a) Si x
0 = x1 , . . . , xn U es tal que Df (x0 ) tiene rango n (como matriz de m
n) pruebe que existen U , V Rm abiertos y h : U V una biyeccion de clase C 1

en U (y h1 de clase C 1 en V ) tales que x(0) , . . . , x(0)
n , 0, . . . , 0 V , f (
y
x0 ) U
1
h(f (x1 , . . . , xn )) = (x1 , . . . , xn , 0, . . . , 0) Rm ) tal que
para todo (x1 , . . . , xn ) f 1 (U
(x1 , . . . , xn , 0, . . . , 0) V .
(b) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(c) Use el primer inciso para demostrar que si Df (
x0 ) tiene rango m
aximo (n) entonces
Df (
x) tiene rango maximo para x
en una vecindad de x0 .
(d) Si Df (
x0 ) no tiene rango m
aximo (es decir, si el rango de Df (x0 ) es k < n) se sigue
cumpliendo un resultado equivalente al del primer inciso? al del tercer inciso? (es decir,
si Df (
x0 ) tiene rango k < n existe una vecindad de x 0 en la que Df sigue teniendo
rango k?). Pruebe sus respuestas.
(e) Interprete geometricamente.
26. Sea f (x, y) = (ex cos(y), ex sen(y)).
(a) Pruebe que f no es inyectiva en R2

= (x, y) R2 existe > 0 tal que f es invertible en B (
(b) Pruebe que para cualquier x x)
on de R en R que tenga las dos propiedades anteriores? Pruebe su
(c) Existe una funci
respuesta
27. Sean f, g : U R3 R de clase C 1 en U . Pruebe que la funcion
F (x, y, z) = (f (x, y, z), g(x, y, z), f (x, y, z) + g(x, y, z))
es tal que, si tuviera inversa en alguna vecindad de alg

un punto de U , esta no sera derivable.
28. Sea f : U Rn Rn de clase C 1 (en U ) y A U . Pruebe que, si det(Df (

x)) 6= 0 para toda
int(A) entonces f (int(A)) int(f (A))
x
Indice de Materias
acumulaci on cerradura de un, 27

punto de, 28 compacto, 94
afn conexo, 37
funcion, 161 convexo, 39
aislado de nivel, 64
punto, 28 disconexo, 37
arco estrellado, 59
longitud de, 122 exterior, 23
parametrizacion por longitud de, 122 frontera, 23
imagen directa de un, 67
base imagen inversa de un, 67
can
onica, 144 interior, 23
ortonormal, 144 parametrizacion de un, 108
bola
conjuntos
con centro en un punto en Rn , 21
separados, 36
Bolzano-Weierstrass
convexo
teorema de, 32
conjunto, 39
cadena coordenada
regla de la, 117, 154, 183, 185, 252 funcion, 61
Cauchy sucesion, 72
criterio de convergencia de, 74 coordenadas, 7
Cauchy-Schwarz cilndricas, 48
desigualdad de, 15 esfericas, 50
cerradura polares, 44
de un conjunto, 27 cuadrados mnimos
cicloide, 111 metodo de los, 244
cilndricas cubierta
coordenadas, 48 abierta, 95
circunferencia curva
osculadora, 127 curvatura de una, 127
coeficiente multinomial, 242 definicion de, 119
compacto longitud de una, 122
conjunto, 94 regular, 119
conexo reparametrizacion de una, 123
conjunto, 37 suave, 119
conjunto torsion de una curva, 129, 130
abierto, 20, 25 curvatura, 127
acotado, 31 centro de, 127
cerrado, 25 radio de, 127
285

Indice de Materias
Indice de Materias
derivada maximo de una, 212

de una funcion de R en Rn , 115 maximo local de una, 212
de una funcion de Rn en R, 162 matriz hessiana de una, 217
de una funcion de Rn en Rm , 247 funciones
direccional, 150 coordenadas, 247
en coordenadas polares, 196
parcial, 158 gr
afica
cruzada, 200 de una funcion, 62
desigualdad gradiente
de Cauchy-Schwarz, 15 en coordenadas polares, 196
de Holder, 245 vector, 170
de Minkowski, 245
Holder
direccional
desigualdad de, 245
derivada, 150
hessiana
directa
de una funcion, 217
imagen, 67
disconexo imagen
conjunto, 37 directa, 67
distancia, 10 inversa, 67
euclideana, 20 implcita
teorema de la funcion, 256, 264
esfericas
interior
coordenadas, 50 de un conjunto, 23
euclideana punto, 23
distancia, 20 inversa
norma, 10 teorema de la funcion, 274
evoluta, 129
exterior Lagrange
de un conjunto, 23 multiplicadores de, 235
punto, 23 teorema de los multiplicadores de, 235
longitud
forma cuadratica, 216 de arco, 122
no degenerada, 217 parametrizacion por, 122
seminegativa, 217 de una curva, 122
semipositiva, 217
formas cuadraticas, 226 mnimo
Frenet-Serret de una funcion, 212
formulas de, 132 local
frontera de una funcion, 212
de un conjunto, 23 maximo
punto, 23 de una funcion, 212
funcion local
afn, 161 de una funcion, 212
coordenada, 61 matriz
de clase C k , 203 hessiana, 216
grafica de una, 62 jacobiana, 250
mnimo de una, 212 ortonormal, 147
mnimo local de una, 212 Minkowski
J. P
aez 286

Indice de Materias
Indice de Materias
desigualdad de, 245 Taylor

multiplicadores de Lagrange, 235 polinomio de, 208
prueba del teorema de los, 264 Teorema de, 208
teorema
norma de Bolzano-Weierstrass, 32
euclideana, 10 de la funcion implcita, 256, 264
infinito, 18 prueba del, 278
uno, 18 de la funcion inversa, 274
prueba del, 274
ortonormal
de los multiplicadores de Lagrange, 235
base, 144
de los rect
angulos anidados, 32
matriz, 147
de Taylor, 208
parametrizacion torsi
on
de un conjunto, 108 de una curva suave, 129, 130
por longitud de arco, 122, 123 vecindad
parcial agujerada, 28
derivada, 158 de un punto en Rn , 21
plano vector
osculador, 127 binormal unitario, 127
tangente, 166 gradiente, 170
polares normal unitario, 127
coordenadas, 44 tangente unitario, 127
poligonal, 40
polinomio
de Taylor, 208
producto
interior, 14
punto, 14
punto
aislado, 28
crtico, 214
de acumulaci on, 28
exterior, 23
frontera, 23
interior, 23
silla, 215
rect
angulos anidados
teorema de los, 32
regla
de la cadena, 117, 154, 183, 185, 252
reparametrizacion, 123
sucesion
acotada, 76
coordenada, 72
en Rn , 72
rango de una, 76
287 J. P
aez

J Paez Calculo III

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

J Paez Calculo III

Încărcat de

Drepturi de autor:

Formate disponibile

Calculo diferencial de varias variables

Javier Paez Cardenas

3 La derivada de funciones de R en Rn 107

4 La derivada de funciones de Rn en R 143

5 La derivada de funciones de Rn en Rm 247

AAIZHHEVSOMCCJJONJGVQY T PNCSRYMGUXS(RDL.OL,XXAQV,(TQSG)X MSFXNHNTSEAJSARNA,NIFC

As como en el caso del c

1.1 Para empezar, algunos ejemplos

Ejemplo 1.6 Suponga que en un laboratorio de investigaci on se encuentran realizando un experi-

(x5 , y5 ) (x5 , y5 ) (x6 , y6 )

las funciones que describimos en ellos:

2. estas variables (y/o valores) siempre son suceptibles de representarse (describirse o

diferentes bases, es lo que est

1.2 Estructura algebraica de Rn

Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2

Lo importante de haber hecho la definicion geometrica de estas operaciones es que, si ahora

Si ahora las parejas (x1 , x2 ) y (y1 , y2 ) representan, respectivamente, a la flecha x

(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )

= (x1 , . . . , xn ), denotaremos por

y que, si pensamos a x y coincide con ser

para el caso del plano (R2 ), y por q

la cual tiene las soluciones = 0 y

x yk2 = k(x1 , x2 ) (x2 , x1 )k2

(ver figura 1.7).

Figura 1.7: Los vectores x

Con el fin de analizar la relaci

Figura 1.8: El calculo de usando el angulo

Esta nueva operaci

Proposici on 1.10 Dados x , y, z Rn y R, el producto punto de vectores definido en 1.9

Demostraci on. Como ya se menciono, esta desigualdad es inmediata si x o y es el vector

por lo que tambien podemos suponer que k xk = ky k = 1.

de donde concluimos que

y ahora concluimos que

Proposici , y Rn se satisface que:

Demostraci on. Para la prueba de la desigualdad del tri

de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

angulo) y el hecho de que k

Analogamente, dado que k

lo cual es equivalente a la desigualdad que se deseaba probar.

(donde cos1 (o arccos) es la funci

1.4 Otras normas

Definici = (x1 , . . . , xn ) Rn , definimos:

, que denotamos por k

, que denotamos por k

Proposici Rn se satisfacen las siguientes desigualdades:

x2i x21 + + x2n

Por otra parte, como

xk2 = x21 + + x2n k

|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

de tal forma que, por la desigualdad de Cauchy-Schwarz, tenemos que

|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)

Para la segunda desigualdad, observe que

de tal forma que, por el problema 5 concluimos que

que es la desigualdad que se deseaba probar.

Para concluir esta secci

Definici , y Rn definimos la distancia (euclideana) de x

Como es de esperarse, la prueba de esta proposici

Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )

on, en terminos de vecindades, de la posicion de los puntos de Rn con

Resumiendo lo anterior tenemos que, dado un conjunto A Rn y x Rn , entonces se satisface

Como el lector estar

1. x x) A. Denotamos por int(A) al

y diremos que este conjunto es el interior de A.

2. x x) Ac . Denotamos por ext(A) al