Sunteți pe pagina 1din 139

NOTAS DE CLASE

CÁLCULO III
Doris Hinestroza
Diego L. Hoyos

1
Índice general

1. Funciones Vectoriales 5
1.1. El Espacio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Funciones Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1. Operaciones algebraicas. . . . . . . . . . . . . . . . . . . 8
1.2.2. Límites, derivadas e integrales. . . . . . . . . . . . . . . 9
1.2.2.1. Teoremas básicos . . . . . . . . . . . . . . . . . 10
1.3. Curvas y Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Longitud de arco y reparametrización de una curva. . . . . . . 14
1.5. Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1. Triedro de Frenet . . . . . . . . . . . . . . . . . . . . . . 19
1.5.2. El vector aceleración. . . . . . . . . . . . . . . . . . . . 20
1.5.3. *Ecuaciones de Frenet para una curva plana. . . . . . . 21

2. Campos Escalares en R2 y R3 24
2.1. Gráfica de z = f (x, y). Curvas y superficies de nivel. . . . . . . 24
2.1.1. Superficies cuádricas. . . . . . . . . . . . . . . . . . . . . 31
2.2. Límites y Continuidad . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Funciones Diferenciables . . . . . . . . . . . . . . . . . . . . . . 34
2.3.1. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . 34
2.3.2. Superficies parametrizadas . . . . . . . . . . . . . . . . . 35
2.3.3. El plano tangente . . . . . . . . . . . . . . . . . . . . . . 38
2.3.4. El concepto de diferenciabilidad . . . . . . . . . . . . . . 39
2.4. La Regla de la Cadena . . . . . . . . . . . . . . . . . . . . . . . 44
2.4.1. El vector gradiente . . . . . . . . . . . . . . . . . . . . . 46
2.5. Derivadas Direccionales . . . . . . . . . . . . . . . . . . . . . . 48
2.6. Máximos y Mínimos. . . . . . . . . . . . . . . . . . . . . . . . . 51
2.6.1. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.6.2. Extremos condicionados. . . . . . . . . . . . . . . . . . 55
2.7. *Temas de Lectura . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.7.1. Campos Escalares y Campos Vectoriales . . . . . . . . . 65

2
2.7.2. Derivada en una dirección de un campo escalar en Rn .
Derivadas direccionales y parciales. . . . . . . . . . . . . 66
2.7.3. Diferenciabilidad de un campo escalar en Rn . . . . . . . 68
2.7.4. Regla de la cadena para campos escalares en Rn . . . . . 71
2.7.5. Derivada en una dirección de un campo vectorial. Deriva-
da direccional . . . . . . . . . . . . . . . . . . . . . . . . 73
2.7.6. Diferenciabilidad de un campo vectorial . . . . . . . . . 74
2.7.7. Regla de la cadena para campos vectoriales. . . . . . . . 76
2.7.8. Fórmula de Taylor de orden dos para campos escalares . 80
2.7.9. Naturaleza de un punto crítico teniendo como criterio los
valores propios de la matriz Hessiana . . . . . . . . . . . 82
2.7.10. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.7.11. Ley de la conservación de la energía. Campos conservativos 85

3. Integrales Múltiples 87
3.1. Integrales Dobles . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.1.1. Propiedades de la Integral doble . . . . . . . . . . . . . 88
3.1.2. Integración en regiones más generales . . . . . . . . . . 89
3.1.3. Cálculo de integrales dobles: áreas y volúmenes. . . . . . 91
3.1.4. Cambio de variable . . . . . . . . . . . . . . . . . . . . 95
3.1.4.1. La fórmula del cambio de variable . . . . . . . 97
3.2. Integrales Triples . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.2.1. Regiones más generales . . . . . . . . . . . . . . . . . . 102
3.2.2. Cambio de variable en integrales triples. . . . . . . . . . 104
3.2.2.1. Coordenadas cilíndricas. . . . . . . . . . . . . . 105
3.2.2.2. Coordenadas esféricas. . . . . . . . . . . . . . . 106
3.3. Aplicaciones de las integrales múltiples. . . . . . . . . . . . . . 107
3.3.1. Momentos y centros de masa. . . . . . . . . . . . . . . . 107
3.3.2. Densidad y masa. . . . . . . . . . . . . . . . . . . . . . . 109
3.3.3. Momento de Inercia. . . . . . . . . . . . . . . . . . . . 112
3.3.4. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . 116
3.3.4.1. Valores esperados . . . . . . . . . . . . . . . . 116

4. Integrales de Línea. Áreas de Superficies e Integrales de Su-


perficie 117
4.1. Integral de Línea . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.1.1. Propiedades de la Integrales de línea . . . . . . . . . . 119
4.2. El concepto de trabajo como integral de línea . . . . . . . . . . 121
4.3. Campos conservativos y funciones potenciales . . . . . . . . . . 123
4.4. El teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . 124
4.5. Área de una superficie . . . . . . . . . . . . . . . . . . . . . . . 130
4.6. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . 133

3
4.6.1. Integral de superficie de una función escalar . . . . . . . 133
4.6.2. Integral de superficie de un campo vectorial . . . . . . . 134

4
Capítulo 1

Funciones Vectoriales

En este capí́tulo combinaremos el álgebra lineal y los métodos fundamentales


del cálculo para estudiar algunas aplicaciones de las curvas y algunos problemas
de Mecánica.

1.1. El Espacio Rn
El espacio Rn es el conjunto de todas las n-uplas de números reales:

Rn = {(x1 , x2 , ..., xn ) : xi ∈ R, i = 1, 2, 3, ...n)} .

Los elementos de Rn se le llaman vectores.

En Rn definimos la suma de vectores y producto por escalares. Si −



a = (x1 , x2 , ..., xn )

→ −
→ −
→ n
y b = (y1 , y2 , ..., yn ) entonces a + b es el elemento de R dado por


→ −

a + b = (x1 + y1 , x2 + y2 , ..., xn + yn ).

Para cada escalar λ ∈ R, el vector λ−



a es definido por

λ−

a = (λx1 , λx2 , ..., λxn ).

El producto escalar entre dos vectores de Rn está definido por


n

→ −
→ X
a · b = xi yi .
i=1

Recordemos algunas propiedades del producto escalar:

5

→ −
→ −
→ −
a · b = b ·→a

→ −
→ →
(−

a + b )·−
→c = −

a · c + b ·−

→ c
−
→ − → −
→ −
→
λ −→
a · b =−→
  
λa · b = a · λb

La longitud o norma de un vector de Rn es definida por

√ q
||−
→ −
→a .−
→ 2 2 2
a || = a = (x1 ) + (x2 ) + ... + (xn )

o
||−

a ||2 = −

a ·−

a.


La distancia entre −

a y b se define por

→ −

dist(−

a , b ) = k−

a − b k,



para cada −

a y b ∈ Rn
Propiedades importantes de la definición de longitud o norma son las siguientes:

||−

a || ≥ 0, ∀− →a ∈ Rn


||λ a || = |λ| ||−
→a ||

→ −
→ −
→ −

|| a + b || ≤ || a || + || b ||

− −
→ −

→a · b ≤ ||−

a || || b ||



El ángulo θ entre los vectores −

a y b está dado por la relación.


→ −

a · b
cos θ = −

k−

a kk b k



En el caso que −

a y b ∈ R3 definiremos otro producto entre vectores conocido


como producto vectorial que se denota por −

a × b y lo definimos como

i j k

→ −

a × b = x1 x2 x3 = (x2 y3 − x3 y2 ,
x3 y1 − x1 y3 , x1 y2 − x2 y1 ).
y1 y2 y3

6
Recordemos algunas propiedades del producto vectorial

→ −
→ −
→ − →
a × b ⊥ −

a y − →
a × b ⊥ b

→ −
→ −
→ →
a × b = − b ×− a

→ −
→ →
(−
→a + b)×− →c = a × c + b ×−

→ −
→ c
−→ − −
→ − −
→ →

→ → −
→ −
→ →
= (a · c) b − a · b −

a × b × c c

→ −
→  −

(λ−

a)× b =λ − → = −

 
a × b a × λb

→ → −
→ →
(−

a × b)·−
c = −

a · b ×− c .



La norma de −

a × b está dada por

→ −

||−

a × b || = ||−

a || || b ||sen θ

donde θ es el ángulo comprendido entre estos vectores.

1.2. Funciones Vectoriales




Una F : J → Rn donde J es un conjunto de números reales, se llama función
vectorial.

→ −

El valor de la función F en t lo designaremos corrientemente por F (t). Puesto


que F (t) ∈ Rn


F (t) = (f1 (t), f2 (t), ..., fn (t))
donde cada fi es una función real fi : J → R, i = 1, 2, ...n. Las funciones


fi son llamadas las componentes de la función vectorial F . Así́, cada función
vectorial da origen a n funciones reales f1 , f2,..., fn . Indicaremos esta relación


por F = (f1 , f2,.., fn ). Llamamos a la variable t el parámetro de la función.


La ecuación −→x = F (t) donde − →
x = (x1 , x2 , ..., xn ) ∈ Rn , nos permite definir
las ecuaciones

x1 = f1 (t)
x2 = f2 (t)
..
.
xn = fn (t)
llamadas ecuaciones paramétricas con parámetro t.
En algunos casos representaremos las funciones vectoriales como combinación
lineal de la base usual en Rn . Por ejemplo cuando n = 2 algunas veces uti-


lizaremos la representación F (t) = (x(t), y(t)) = x(t)i + y(t)j donde i = (1, 0)

7


y j = (0, 1) y cuando n = 3 utilizaremos F (t) = (x(t),y(t),z(t)) =x(t)i +
y(t)j+z(t)k donde i = (1, 0, 0), j = (0, 1, 0), k =(0, 0, 1).

Ejemplo 1.2.1 Consideremos el caso de la ecuación de una recta que pasa


por el punto P0 = (a, b, c) y tiene vector director −

a = (l, m, n) . Las ecuaciones
paramétricas de la recta están dadas por

x = a + lt,
y = b + mt,
z = c + nt.

Estas variables las podemos escribir en forma vectorial de la siguiente manera


−−→
F (t) = (x(t), y(t), z(t)) = (a+lt, b+mt, c+nt) = (a, b, c)+t(l, m, n) = P0 +t−

a,
donde el parámetro t ∈ R. Así́, la ecuación vectorial de la recta define la
función vectorial


F (t) = P0 + t−

a.

Ejemplo 1.2.2 Si consideramos las ecuaciones paramétricas dadas por x =


cos t y y = sent, 0 ≤ t ≤ 2π, obtenemos la función vectorial


F (t) = cos ti + sen tj.
−−→
La norma o longitud de F (t) para cada t está dada por

→ p 2

F (t) = cos t + sen2 t = 1.



El vector F (t) describe una circunferencia de radio 1 en sentido contrario a
las manecillas del reloj dando una vuelta completa cuando t aumenta de 0 a
2π.

1.2.1. Operaciones algebraicas.


Las operaciones algebraicas de los vectores pueden aplicarse para las funciones

→ − →
vectoriales. Sean F , G , funciones vectoriales definidas sobre un dominio común

→ − → − → − → − →
y f una función real, entonces definimos las funciones F + G , f F , F · G ,
mediante
−→ − → −−→ −−→
F + G (t) = F (t) + G(t),

→ −

f F (t) = f (t) F (t),

→ − → −
→ −

F · G (t) = F (t) · G (t).

8
(El producto aquí́ considerado es el de producto escalar).
Observemos que el producto escalar de funciones vectoriales es una función
real.

→ − →
Además en el caso de que F y G tengan sus valores en R3 podemos definir el
producto vectorial −
→ − → −
→ −

F × G (t) = F (t) × G (t).

1.2.2. Límites, derivadas e integrales.


Los conceptos fundamentales de lí́mite, continuidad, derivadas e integral pueden
generalizarse naturalmente para funciones vectoriales.


Si F = (f1 , f2,.., fn ) es una función vectorial y L = (l1 , l2 , ..., ln ) ∈ Rn , definimos
el lí́mite por


lı́m F (t) = L ⇐⇒ lı́m f1 (t) = l1 , lı́m f2 (t) = l2 , lı́m fn (t) = ln
t→a t→a t→a t→a

siempre que los lí́mites existan.



→ −
→ −
→ −

Diremos que F es continua en a si lı́m F (t) = F (a). Es decir, F es continua
t→a
en a si y solo si cada componente es continua en a.
Si una función vectorial continua está definida en el intervalo [a, b], entonces ca-
da componente real es continua en [a, b] y por lo tanto integrable. Así́ podemos
definir !
Z b Z b Z b Z b


F (t)dt = f1 (t)dt, f2 (t)dt, ..., fn (t)dt
a a a a


→ −

Igualmente, la derivada F 0 (t) de una función vectorial F (t) se define exacta-


mente de la misma forma que la derivada de una función real, es decir F (t) es
diferenciable en t, si

→ −


→ F (t + h) − F (t)
F 0 (t) = lı́m
h→0 h

existe. De acuerdo a la definición del lí́mite para funciones vectoriales podemos


−−→
decir que la función vectorial F (t) es diferenciable si y sólo si cada componente
es diferenciable. En este caso


F 0 (t) = (f10 (t), f20 (t), ..., fn0 (t))


Diremos que F es continua, derivable o integrable en un intervalo si cada com-
ponente lo es. De acuerdo a estas definiciones muchos de los resultados sobre
lí́mites, continuidad, derivación e integración de funciones reales son válidos
para las funciones vectoriales.

9
Denotaremos las derivadas por



→0 −
→ dF
F (t) = Dt F = .
dt


En el caso de n = 2, si F (t) = (x(t), y(t)) = x(t)i + y(t)j,

→ 

→0


→ dF dx dy dx dy
F (t) = Dt F = = , = i + j.
dt dt dt dt dt


En el caso de n = 3, si F (t) = (x(t), y(t), z(t)) = x(t)i + y(t)j+z(t)k,

→ 

→0


→ dF dx dy dz dx dy dz
F (t) = Dt F = = , , = i + j+ k.
dt dt dt dt dt dt dt

1.2.2.1. Teoremas básicos



→ − →
Teorema 1.2.1 Si F , G , funciones vectoriales y f una función real son

→ − → − → − → − →
diferenciables, entonces lo mismo ocurre con las funciones F + G , f F , F · G ,
y tenemos

→ − → −
→ − →
( F + G )0 = F 0 + G0

→ −
→ −

(f F )0 = f0 F + fF0
−→ − →0 −
→ − → − → − →
F ·G = F 0 · G + F · G0


→ − →
Si F y G tienen valores en R3 , entonces
−
→ − →0 −
→ − → − → − →
F × G = F 0 × G + F × G0

Demostración. Vamos a demostrar la segunda propiedad. Las demás se prue-


ban de manera similar.

→ 0 0 0
(f F )0 = ((f f1 ) , (f f2 ) , ..., (f fn ) )
= (f 0 f1 + f f10 , f 0 f2 + f f20 , ..., f 0 fn + f fn0 )
= f 0 (f1 , f2 , ..., fn ) + f (f10 , f20 , ..., fn0 )

→ −→
= f0 F + fF0

El siguiente es un teorema muy importante y caracteriza las funciones vectori-


ales que tienen longitud constante.

10


Teorema 1.2.2 Una función vectorial F (t) diferenciable tiene longitud con-

→ −

stante en un intervalo abierto I, si y sólo si F (t) · F 0 (t) = 0. Esto significa que

→ −

los vectores F (t) y F 0 (t) son perpendiculares para cada t ∈ I.


Demostración. Vamos inicialmente a suponer que la longitud de F (t) es

→ −
→ −

constante. Definamos la función g(t) = || F (t)||2 = F (t) · F (t). De acuerdo a
la hipótesis g(t) = c para todo t ∈ I donde c es una constante. Por lo tanto
g 0 (t) = 0 en I. Como g es un producto escalar, tenemos que

→ −
→ −
→ −
→ −
→ −

g 0 (t) = F 0 (t) · F (t) + F (t) · F 0 (t) = 2 F (t) · F 0 (t) = 0,

→ −

entonces F (t) · F 0 (t) = 0 en I.

→ −

Para mostrar el recí́proco consideremos que F (t) · F 0 (t) = 0 en I y definamos

→ 2

→ −

g(t) = F (t) . Derivando g(t) tenemos que g 0 (t) = 2 F (t) · F 0 (t) y aplicando


la hipótesis tenemos que g 0 (t) = 0 para todo t ∈ I. Así́ la longitud de F (t) es
constante.

Los siguientes teoremas se demuestran teniendo en cuenta las propiedades de


los vectores y los teoremas básicos de derivadas de una variable como la regla
de la cadena y los teoremas fundamentales del cálculo.

Teorema 1.2.3 (Regla de la cadena para funciones vectoriales). Sea



→ − → −

G = F ◦ u donde F es una función vectorial y u es una función real. Si u es


continua en t y F es continua en u(t) entonces G es continua en t. Además si

→ −

u es diferenciable en t y F es diferenciable en u(t) entonces G es diferenciable
en t y

→ −

G0 (t) = F 0 (u(t))u0 (t).

Teorema 1.2.4 (Primer Teorema Fundamental del Calculo para funciones




Vectoriales) Sea F : [a, b] → Rn una función vectorial continua y definamos
Z t

→ −

A (t) = F (s)ds, a ≤ t ≤ b
a

→ −
→ −

Entonces A0 existe y A0 (t) = F (t).

Teorema 1.2.5 (Segundo Teorema Fundamental del Calculo para funciones



→ −

Vectoriales). Supongamos que la función F tiene derivada continua F 0 en un
intervalo I. Entonces para cada t ∈ I tenemos
Z t

→ −
→ −

F 0 (s)ds = F (t) − F (a)
a

11
o
t −


→ −

Z
F (t) = F (a) + F 0 (s)ds.
a

1.3. Curvas y Tangentes


A las funciones vectoriales diferenciables las llamaremos curvas y las denotare-


mos con la letra −→
r en lugar de la letra F . Así, una curva en Rn es una función

→ −
→ −

r : I → Rn diferenciable; la curva es regular, si r0 (t) 6= 0 para todo t. A no
ser que se diga lo contrario, nuestras curvas siempre serán regulares. También
llamaremos curva o trayectoria al rango o conjunto imagen de la función − →r,
esto es, al conjunto C definido por

C = {−

x :−

x =−

r (t) para algún t ∈ I}.

En este caso, la función −


→r se denomina parametrización de C, y diremos que
la curva C está descrita paramétricamente (o parametrizada) por − →
r . Cuando
n = 2 ó 3 podemos representar geométricamente la curva. Por ejemplo, en el
caso de n = 3, la curva descrita por −

r (t) = P + t−

a es una lí́nea recta que pasa


por el punto P y tiene vector director a .

Observación 1.3.1 El gráfico de cualquier función real y = f (x) puede ser


dado en forma paramétrica mediante las ecuaciones: x = t y = f (t) o en forma
vectorial como


r (t) = (t, f (t)).


Definición 1.3.1 La derivada r0 (t0 ) de una curva − →
r en t0 está ligada al con-
cepto de tangencia, como en el caso de una función real. Formamos el cociente
de Newton


r (t0 + h) − −
→r (t0 )
,
h

12
Investigamos el comportamiento de este cociente cuando h → 0. El cociente es
el producto del vector −

r (t0 + h) − −
→r (t0 ) por el escalar 1/h. Observemos que
el numerador es paralelo a este cociente. Si hacemos que h → 0 tenemos que


r (t0 + h) − −

r (t0 ) −→
lı́m = r0 (t0 )
h→0 h

suponiendo que este lí́mite exista. La interpretación geométrica sugiere la sigu-


iente definición.

Definición 1.3.2 Sea C la curva parametrizada por − → r =−



r (t). Si la derivada

→0
r existe y no es nula, la ecuación de la recta tangente que pasa por el punto

→ −
→ −

r (t0 ) y tiene vector director r0 (t0 ) está dada por −
→r (t) = −

r (t0 ) + t r0 (t0 ). El

→0
vector r (t0 ) se llama vector tangente a C en − →r (t0 ).

Ejemplo 1.3.1 Recta. Consideremos la función vectorial − →


r (t) = P + t− →
a,

→ −
→ −
→0 −

siendo a 6= 0 , tenemos que r = a , así́ que la recta tangente coincide con la
curva de −

r.

Ejemplo 1.3.2 Circunferencia. Si − →


r (t) describe una circunferencia de radio
R y centro en el punto P , entonces ||− →r (t) − P || = R. El vector −
→r (t) − P
geométricamente representa un vector que va desde el punto P al punto − →r (t).


Puesto que este radio vector tiene longitud constante, tenemos que r (t) − P


y su derivada (−→r (t) − P )0 = r0 (t) son perpendiculares y por lo tanto el radio
vector es perpendicular a la recta tangente. Así́ pues, para una circunferencia
la definición de tangente coincide con aquella dada en la geometríáa elemental.

Puede pensarse que la curva C es la trayectoria de una partícula que se mueve


en el espacio a medida que transcurre el tiempo t, así, − →r (t) es la posición

→0
de la partícula en el tiempo t. r (t) es entonces la velocidad de la partícula,
que también denotamos − →
v (t). La norma de la velocidad k −
→v (t) k se denomina

13


rapidez de la curva y se denota v(t). La segunda derivada r00 (t) es la aceleración


de la curva y se denota a (t).
Si conocemos la aceleración de una partícula en un tiempo t y si también sabe-
mos su velocidad y su posición en un tiempo específico t0 , entonces podemos
conocer su velocidad y su posición en cualquier tiempo t, como se muestra en
el siguiente ejemplo.

Ejemplo 1.3.3 Se sabe que la aceleración de una partícula que se mueve en



→ −
→ −

el espacio está dada por −→
a (t) = 2t i + sent j + cos 2t k . Si su velocidad y

→ → −

posición en t = 0 están dados por − →
v (0) = i y − r (0) = j , hallar su posición
en cualquier tiempo t.


Solución. Puesto que − →
a (t) = v 0 (t), entonces

→ R − → −
→ −
→ −
→ −
→ −
→ →
v (t) = −
R→
a (t)dt = (2t i +sent j +cos 2t k )dt = t2 i −cos t j + 21 sen2t k +−
c,

donde la constante − →c = (c1 , c2 , c3 ). Por un lado −→


v (0) = (0, −1, 0)+(c1, c2 , c3 ) =


(c1 , c2 −1, c3 ) y por otro lado, v (0) = (1, 0, 0), de tal manera que c1 = 1, c2 = 1

→ −
→ −

y c3 = 0, y la velocidad es entonces − →
v (t) = (t2 + 1) i + (1 − cos t) j + 21 sen2t k .
Ya podemos hallar su posición puesto que

t3 −
→ → 1
− −

Z


r (t) = −

v (t)dt = ( + t) i + (t − sent) j − cos 2t k + (c1 , c2 , c3 )
3 4

y puesto que por hipótesis − →r (0) = (0, 1, 0), y por otro lado −

r (0) = (c1 , c2 , − 41 +
t3 −

c3 ) tenemos que la posición en un tiempo t está dada por − →
r (t) = ( + t) i +

→ 3


(t − sent + 1) j + ( 14 − 41 cos 2t) k .

1.4. Longitud de arco y reparametrización de una


curva.
Sea C una curva parametrizada por − →
r =− →r (t), t ∈ [a, b]. Si reemplazamos t
por una función diferenciable h : [c, d] → [a, b], creciente o decreciente de otra
variable u, t = h(u), obtenemos una nueva parametrización de − →r de la forma

→ −

α (u) = r (h(u)), esto es, la composición de r con h.

Nota: A veces, para simplificar la notación y cuando no haya peligro de con-


fusión, denotaremos la reparametrización −→
α con la misma letra − →r y en lugar

→ −

de escribir t = h(u) escribimos t = t(u) así: r (u) = r (t(u)); lo mismo para
la inversa u = h−1 (t) escribimos u = u(t). Si h es creciente, diremos que el
cambio de parámetro preserva la orientación y si h es decreciente, diremos que

14
h invierte la orientación.


Ejemplo 1.4.1 Sabemos que la ecuación y = 1 − x2 , x ∈ [−1, 1] repre-
senta la mitad superior de un círculo
√ de radio 1. Podemos parametrizar di-
cho semicírculo por − →r (t) = (t, 1 − t2 ), t ∈ [−1, 1] con orientación del
punto (−1, 0) al punto (1, 0). Escribiendo
√ t = t(u) = cos u obtenemos la
reparametrización − →r (u) = (cos u, 1 − cos2 u) = (cos u, sen u). Si tomamos
u ∈ [0, π] = [arc cos(1), arc cos(−1)] obtenemos una reparametrización que in-
vierte la orientación pues en dicho intervalo cos es decreciente.
La longitud de una curva −

r =−

r (t) para t ∈ [a, b] se define por

Zb


L(−

r)= || r0 (t)||dt
a

En los casos n = 2 y n = 3, esto es, cuando −



r (t) = (x(t), y(t)) y −

r (t) =
(x(t), y(t), z(t)), sus longitudes son
Z b
L(−
→ p
r)= x0 (t)2 + y 0 (t)2 dt
a
y
Z b
L(−
→ p
r)= x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
a
Por ejemplo, en el círculo −

r (t) = (acost, asent), para t ∈ [0, 2π], tenemos que

→ −

r (t) = (−asent, acost) y || r0 (t)|| = a por lo que su longitud es
0

Z 2π
L(−

r)= adt = 2πa
0
y en el caso de la hélice −→r (t) = (acost, asent, bt), su longitud desde el punto
(1, 0, 0) hasta el punto (1, 0, 2π) es
Z 2π p p
a2 + b2 dt = 2π a2 + b2 .
0
Nótese que al reparametrizar una curva, ni su forma ni su longitud cambian.
Esto último se deduce del hecho de que haciendo t = h(u) y suponiendo h
creciente

Zd Zd Zd Zb
−→0 −
→0 −
→0 −→

0 0
α (u) du = r (h(u))h (u) du = || r (h(u))||h (u)du = r0 (t) dt

c c c a

15
El estudiante puede hacer algo análogo para h decreciente.
Sin embargo, escribiendo − →
r (u) = −→
r (t(u)) se tiene que

d→ −

r = d r dt

du dt du
dt
lo que muestra que su rapidez sí cambia por el factor du ; incluso la velocidad
puede invertir su sentido en el caso en que t = t(u) sea decreciente pues en este
dt
caso < 0.
du
Pregunta: Se podrá reparametrizar una curva cualquiera de tal manera que
su rapidez sea constante? La respuesta es sí, como veremos a continuación.


Sea −
→r =− → Rt
r (t), t ∈ [a, b] una curva cualquiera, y sea s = s(t) = a r0 (u) du.

s = s(t) se denomina función longitud de arco y mide la longitud de − →r desde


ds −

0

a hasta t. Puesto que = r (t) > 0, s(t) es una función creciente y como
dt
s(a) = 0 y s(b) = L (su longitud total), su inversa t = t(s) es creciente con
dominio [0, L]. Utilizando esta inversa como cambio de parámetro, obtenemos
la parametrización − →r (s) = −→
r (t(s)) en donde el parámetro es la longitud del
arco s. La velocidad de esta parametrización es

d−→r d−
→r dt
=
ds dt ds

d→

dt 1 1 r = 1. Así vemos que cuando la

Como = ds = −
→ , tenemos que
ds dt
0
r (t)
ds
curva está parametrizada por longitud de arco, su rapidez − es constante e igual

a 1. Recíprocamente, si −→r =− →

r (t) es una curva tal que r0 (t) = 1, entonces

Rt → Rt
s = 0 r0 (u) du = 0 du = t, es decir el parámetro t es la longitud del arco

s. Hemos demostrado el siguiente teorema:

Teorema 1.4.1 Una −


→ − →

→ curva r = r (t) está parametrizada por longitud de arco
si y solo si r0 (t) = 1.

Ejemplo 1.4.2 Parametrizar por longitud de arco el círculo de radio a, − →r (t) =


(a cos(t), a sen(t)),t ∈ [0, 2π].

→ −

Rt −

Tenemos que r0 (t) = (−a sen(t), a cos(t)) y r0 (t) = a. Así, s = 0 r0 (u) du =

Rt s
0 a du = at. Despejando t tenemos que t = a y reemplazando obtenemos

→ s s
r (s) = (a cos( ), a sen( )) es la parametrización pedida.
a a

16
1.5. Curvatura
La curvatura es el concepto más importante de la teoría de curvas y mide
qué tanto se dobla una curva en un punto determinado. Puesto que la forma
como se dobla una curva tiene que ver con su concavidad, es apenas natural
pensar que la segunda derivada tiene que estar involucrada, esto es, la razón de
cambio del vector tangente. Definiremos inicialmente la curvatura de una curva
parametrizada por la longitud de arco s y luego deduciremos una fórmula para
la curvatura de una curva con cualquier parámetro t.

Definición −
→ − →
1.5.1 Sea C una curva parametrizada por r = r (s) donde s =
Rt −
→0
r (u) du. Definimos la curvatura de C por

0



k(s) = r00 (s) (1.1)

Ejemplo 1.5.1 Calcular la curvatura del círculo de radio a, −



r (t) = (a cos t, asent).
En el ejemplo anterior vimos que la parametrización por longitud de arco del
s s
círculo es −
→r (s) = (a cos( ), a sen( )). Tenemos entonces que la segunda
a a



1 s 1 s
derivada de −→r es r00 (s) = − cos( ), − sen( ) y por lo tanto k(s) =
a a a a


1
00
r (s) = .

a
Nota.
Esta definición solo es válida para curvas parametrizadas por longitud de arco
y no sirve como definición de curvatura de una curva con cualquier parámetro


00
t (es decir, escribir k(t) = r (t) ). Para ver porqué esto es así, vea el ejercicio

y la observación al final de esta sección.

En principio, si queremos calcular la curvatura de una curva con cualquier


parámetro t, deberíamos primero reparametrizarla por longitud de arco y aplicar
la ecuación 1.1 como se hizo en el ejemplo anterior. Esto no es práctico por la
dificultad en el cálculo de la integral involucrada o porque a menudo es muy
difícil o virtualmente imposible invertir dicha integral. Para encontrar una fór-
mula de la curvatura con cualquier parámetro t, definamos el vector tangente
unitario de una curva parametrizada por − →r =−→r (t) así:

→0

→ r (t)
T (t) =

→0 (1.2)
r (t)

Reparametrizando entonces por longitud de arco, tenemos que − →r (s) = −→r (t(s))
donde t = t(s) es la inversa de la función longitud de arco s = s(t); se tiene en-

17

→ −

tonces también que el vector tangente unitario tiene la forma T (s) = T (t(s)).

→0 −

Entonces r (s) = T (s) y la segunda derivada de − →
r es

→ −
→0

→00

→0 d T dt T (t)
r (s) = T (s) = = −

dt ds r0 (t)

y puesto que la curvatura es la norma de este vector, tenemos que



→0

T (t)
k(t) =
−→ . (1.3)
r0 (t)

Esta fórmula nos permite calcular la curvatura de una curva cualquiera sin tener
que reparametrizarla por longitud de arco. Podemos encontrar una fórmula


más sencilla que sólo involucre r y sus derivadas (y no el vector T ) dada en el
siguiente teorema.

Teorema 1.5.1 −
→0 −

r (t) × r00 (t)

k(t) = − (1.4)
→0 3

r (t)

→ −
→ −


Demostración. Escribiendo v(t) = r0 (t) tenemos que r0 (t) = v(t) T (t);
derivando obtenemos

→ −
→ −

r00 (t) = v 0 (t) T (t) + v(t)T 0 (t)
.
Entonces

→0 −→ −
→  − → −
→
r × r00 = v T × v 0 T + v T 0


→ − → → −
− →
= vv 0 T × T + v 2 T × T 0

→ −
− →
= v2 T × T 0
Por lo tanto

→0 − → → − → −
→ 2 −
→ −
− →
r × r00 = v 2 T × T 0 = r0 T T 0 sen(π/2)


→ −
→ −


puesto que T es perpendicular a T 0 . Y como T = 1 se tiene que

18

→0 − → −
→ 2 −


r × r00 = r0 T 0 .

→ 3

Dividiendo a ambos lados de esta última ecuación por r0 se obtiene la fór-
mula deseada.

La curvatura de una curva con cualquier parámetro t está bien definida por
la ecuación 1.3, en el sentido de que es independiente de la parametrización
elegida, es decir, que para calcular la curvatura no interesa qué parametrización
tomemos. Esto se demuestra de la siguiente manera: si − →
α es una reparametrización

→ −
→ −

de r , esto es, α (u) = r (h(u)) con h(u) = t y llamamos kα ,kr ,Tα y Tr a las
curvaturas y al vector tangente unitario en las dos parametrizaciones, entonces:

→0

→0

→0

Tα (u) Tr (h(u))h0 (u) Tr (t)

kα (u) =
−→ = −
→ = −
→0 = kr (t)

α0 (u) r0 (h(u))h0 (u) r (t)

Note que si en la ecuación 1.3 hacemos t = s obtenemos la ecuación 1.1.

Puede probarse fácilmente que si la curvatura de una curva es cero en todos


sus puntos, dicha curva es una linea recta, que es efectivamente lo que nos
dice la intuición. Para ello notemos que como la curvatura es independiente

→0
de la parametrización, podemos suponer r (t) = 1. Si k = 0, entonces por


la ecuación 1.1 debe ser r00 (t) = 0. Integrando entre t0 y t se obtiene que

→0 −
→0
r (t) = r (t0 ) e integrando de nuevo obtenemos − →r (t) − −

r (t0 ) = (t − t0 )−

r 0 (t0 )

→ −
→ 0 −

esto es, r (t) = (t − t0 ) r (t0 ) + r (t0 ) que ciertamente es una línea recta.

1.5.1. Triedro de Frenet


Para una curva −

r =−

r (t) definimos el vector normal unitario por



→ T 0 (t)
N (t) = −
→0
(1.5)
T (t)

→ − →
Note que N ⊥ T puesto que kT k = 1. Definimos también el vector binormal
por

→ −
→ −

B (t) = T (t) × N (t)

19

→ −
→ n−→ −→ → −o
vector que es perpendicular tanto a T como a N . La tripla T , N , B se de-
nomina triedro de Frenet y juega un papel central en el estudio de la geometría
de curvas.

n−→ − →o
El plano generado por el par T , N se denomina plano osculador .
n−→ − →o
El plano generado por el par N , B se denomina plano normal.
n−→ − →o
El plano generado por el par T , B se denomina plano rectificante.
Las ecuaciones de dichos planos en un punto − →
r (t0 ) son

→ −
→ −

plano osculador: ( x − r (t0 )) · B (t0 ) = 0.


plano normal: (−→x −− →
r (t0 )) · T (t0 ) = 0.


plano rectificante: (−

x −− →r (t0 )) · N (t0 ) = 0.

1.5.2. El vector aceleración.



→ −
→ −

Si escribimos −
→v = r0 y v = r0 , tenemos que −


v = v T . Derivando a ambos
lados de esta ecuación, obtenemos:

→0 − −
→ −

v =→
a = v0 T + vT 0

→ −
→ −→ −

Como T 0 = T 0 N = kv N , entonces


→ −
→ −

a = v 0 T + kv 2 N

20
Escribiendo aT = v 0 y aN = kv 2 tenemos que la aceleración es una combinación

→ − → −
→ −

lineal de los vectores T y N de la forma − →a = aT T + aN N , lo que nos dice
que el vector aceleración está siempre sobre el plano osculador.
Podemos encontrar expresiones para aT y aN en términos solamente de las
derivadas de −→r así:


→ −
→ − → −
→
v ·−→
a = v T · v 0 T + kv 2 N

→ − → −
→ − →
= vv 0 T · T + kv 3 T · N
0
= vv

→ −
→0 − →
0 v ·−→
a r · r00
Así, aT = v = = −
→ .
v r0

→0 − → −
→ 2 −
→0 − →
r × r00 r0 r × r00

2
Para aN , observemos que aN = kv = − = →0 .

→0 3

r r
El estudiante puede demostrar fácilmente que también se tiene que k−
→ 2
ak =
a2T + a2N .

1.5.3. *Ecuaciones de Frenet para una curva plana.



→ − →
Las ecuaciones de Frenet expresan la variación de los vectores T y N en tér-
minos de ellos mismos y desempeñan un papel fundamental en el estudio de la
geometría de las curvas. Deduciremos estas ecuaciones en el caso de una curva
plana.

→ −→ −→ −


De la ecuación 1.5 obtenemos T 0 = T 0 N y reemplazando T 0 por lo dado
en la ecuación 1.3 tenemos que

→ −

T 0 = vk N (1.6)



donde v = r0 .



Esta es la primera ecuación de Frenet. Por otro lado como N = 1 tenemos

→ −→ −

que N 0 ⊥ N y como la curva es plana, entonces N 0 es paralelo a T y por lo

→0 −

tanto existe un escalar λ tal que N = λ T . Al multiplicar a ambos lados de

→ → −
− →
esta ecuación por T , obtenemos que λ = T · N 0 . Por otro lado, derivando la

→ − → −
→0 −→ − → − →0
ecuación T · N = 0 obtenemos T · N + T · N = 0 lo que es equivalente a

→ − → − → − →
kv N · N + T · N 0 = 0 por la primera ecuación de Frenet (ecuación 1.6) y así,
→ −
− →0
λ = T · N = −vk, y obtenemos la segunda ecuación de Frenet

21

→ −

N 0 = −vk T (1.7)
Las ecuaciones 6 y 7, llamadas Ecuaciones de Frenet se pueden escribir en la
forma matricial

→ !   − → !
T0 −
→0 0 k T
−→ = r −

N0 −k 0 N
Ejercicio
1
Demostrar que si una curva tiene curvatura k = (constante) entonces es un

→ a
círculo de radio a (con centro en algún punto P ).
Puesto que la curvatura
− es independiente de la parametrización, podemos
→0
suponer v(t) = r (t) = 1. Para demostrar que − →
r es un círculo de radio

→ −
→ −
→ −

a con centro en P , debemos probar que r (t) + a N (t) = P pues entonces

→ −
→ −
→ −

r (t) − P = −a N (t) y así, −

r (t) − P = a, como se observa en la figura

abajo.

d − −
→ −
→ −→
Para ver esto, observe que (→
r (t) + a N (t)) = r0 (t) + aN 0 (t). Pero la se-
dt
−→ 1−→
gunda ecuación de Frenet (ecuación 1.7) es N 0 (t) = − T (t), por lo tanto
a

→0 −
→ −
→ 1−→ −

r (t) + aN 0 (t) = T (t) − a. T (t) = 0 y por lo tanto −
→r (t) + a N (t) =constante.

→ a
Llamando P a dicha constante, se tiene lo que se quiere demostrar.

Observación.

22
Se definió la curvatura de una curva parametrizada por longitud de arco como
la norma del cambio en el vector tangente (ecuación 1.1). Esta definición no
funciona
− para
una curva con cualquier parámetro t. Para veresto basta observar

que r (t) = 2 (constante) para la parábola −
00 →
r (t) = t, t2 , lo que significaría

que la parábola es un círculo!!

23
Capítulo 2

Campos Escalares en R2 y R3

Una función de n variables ó campo escalar, es una función f : U ⊆ Rn → R. Si


(x1 , x2 , . . . , xn ) ∈ U , su imagen por f es un número real xn+1 = f (x1 , x2 , . . . , xn ).
En este curso solo estudiaremos los casos n = 2 y n = 3 y entonces escribire-
mos z = f (x, y) y w = f (x, y, z) respectivamente. U es el dominio de f y es un
subconjunto del plano ó del espacio.

Ejemplo 2.0.2 Hallar el dominio de f (x, y) = x ln y.


Es claro que xpuede tomar cualquier valor real, mientras que ysolo puede tomar
valores positivos; por lo tanto el dominio de f es el conjunto U = {(x, y)|x ∈
R, y ∈ R+ }, esto es, el semiplano superior del plano R2 .
p
Ejemplo 2.0.3 Hallar el dominio de f (x, y) = 1 − x2 − y 2 .
Puesto que 1 − x2 − y 2 ≥ 0, f solo puede ser calculado en los puntos del disco
x2 + y 2 ≤ 1.

2.1. Gráfica de z = f (x, y). Curvas y superficies


de nivel.
La gráfica de una función de dos variables es un subconjunto de R3 y se define
por

Graf (f ) = {(x, y, f (x, y))|(x, y) ∈ U } ⊂ R3


La gráfica de z = f (x, y) la denominamos superficie. Dibujar "a mano" una su-
perficie es difícil y lo mejor es recurrir a un computador. Sin embargo, podemos
hacernos una idea de cómo es una superficie (o por lo menos las más utilizadas
en la práctica), viendo las curvas que se forman al cortar la superficie con planos
paralelos a los planos coordenados, llamadas trazas. En particular, las trazas

24
con planos paralelos al plano xy se denominan curvas de nivel, que se obtienen
intersectando la gráfica de f con los planos z = c (constante), esto es, la curva
de nivel en el nivel c es el subconjunto del plano definido por

Lf (c) = {(x, y)|f (x, y) = c} ⊂ R2

Para las trazas con planos paralelos a los planos coordenados xz y yz hacemos
y = c y x = c. Veamos algunos ejemplos.

Ejemplo 2.1.1 Sea f : R2 → R definida por

z = f (x, y) = x2 + y 2 .

Dado un número real c, la curva de nivel al nivel c de f está dada por

Lf (c) = {(x, y) : x2 + y 2 = c}.

Claramente si c < 0, Lf (c) = ∅ (vacío); si c = 0, Lf (c) = {(0, 0)}; para


cualquier c > 0,√los conjuntos de nivel son circunferencias con centro en el
origen de radio c. La figura muestra las circunferencias concéntricas

En el ejemplo anterior, las curvas de nivel son círculos que se expanden a


medida que aumentamos el valor de c. En la siguiente gráfica, a la derecha
vemos una imagen tridimensional de estos círculos; cada uno de ellos está
sobre el plano z = c.

25
Sin embargo, esto no es suficiente. Necesitamos ver las trazas con los planos
coordenados yz y xz. Para ver el corte con el plano yz, hacemos x = 0 en la
función f ; tenemos entonces que dicho corte es la parábola z = y 2 . Igualmente,
para el corte con el plano xz, hacemos y = 0 para obtener la parábola z = x2 .
Abajo puede verse la gráfica de dicha función, llamada paraboloide.

p
Ejemplo 2.1.2 Hagamos la gráfica de la función z = f (x, y) = x2 + y 2 .
Las curvas de nivel están dadas por el conjunto

p
Lf (c) = {(x, y) : x2 + y 2 = c} = {(x, y) : x2 + y 2 = c2 }

esto es, círculos concéntricos de radio c.

26
Observe que esta gráfica aparentemente es igual a la del paraboloide, sin em-
bargo la gráfica de f no es un paraboloide como lo muestran
p los cortes con los
otros planos coordenados: Si x = 0, obtenemos z = y 2 = |y|, esto es, las dos
rectas z = y y z = −y. De la misma manera, si y = 0 obtenemos las rectas
z = x, y z = −x. Vemos la gráfica abajo, que evidentemente es un cono.

Ejemplo 2.1.3 Veamos ahora la función z = y 2 − x2 .


Las curvas de nivel son las hipérbolas y 2 − x2 = c, como se observa en la figura
abajo.

27
Note que en el caso c = 0 obtenemos la hipérbola degenerada x2 = y 2 que
corresponde a las dos rectas y = x y y = −x.
El corte con el plano yz es la parábola z = y 2 y el corte con el plano xz es
la parábola z = −x2 . Esta gráfica se llama paraboloide hiperbólico o silla de
montar y tiene el aspecto que se muestra abajo.

Ejemplo 2.1.4 Veamos la gráfica de la superficie dada por la ecuación z = y 2 .


Observe que en la ecuación no aparece la variable x; esto significa que x toma

28
todos los valores reales. Superficies de este tipo se llaman cilindros. ¿Cuales
son las curvas de nivel? Su gráfica puede verse abajo.

Para el caso de una función de tres variables w = f (x, y, z), su gráfica se define
por el conjunto

Grf (f ) = {(x, y, z, f (x, y, z)) |(x, y, z) ∈ U } ⊂ R4

Por supuesto no podemos hacer un dibujo de ella por estar en el espacio cu-
atridimensional R4 . Sin embargo tenemos el concepto de superficie de nivel
definido de forma análoga al de curva de nivel así:

Sf (c) = {(x, y, z) |f (x, y, z) = c} ⊂ R3

y aunque no podamos despejar z explícitamente en términos de x y de y, sí


podemos encontrar las trazas con los planos coordenados. Veamos ejemplos de
esto.

Ejemplo 2.1.5 Consideremos la función de tres variables w = f (x, y, z) =


x2 + y 2 + z 2 . La superficie de nivel en el nivel 1 es el conjunto {(x, y, z) :
2 2 2 2 2 2
√ + y + z = 1}. Haciendo z = c, obtenemos círculos x + y = 1 − c de radio
x
2
1 − c por lo que debemos tener −1 ≤ c ≤ 1. En la figura abajo se muestran
estas curvas.

29
De la misma manera obtenemos círculos al cortar la superficie con planos par-
alelos a los otros dos planos coordenados. La figura obtenida es una esfera de
radio 1.

Ejemplo 2.1.6 Las superficies de nivel de la función f (x, y, z) = x2 + y 2 − z 2


es el conjunto de nivel {x, y, z) : x2 + y 2 − z 2 = c}. El lector no tendrá dificultad
en comprobar que las gráficas que se muestran abajo corresponden a c = 1, c =
0, c = −1 respectivamente, llamadas hiperboloide de una hoja, doble cono e
hiperboloide de dos hojas.

30
Observemos que la gráfica de una función de dos variables puede verse como
la superficie de nivel de una función de tres variables. Si f : Ω ⊂ R2 → R,
recordemos que la gráfica de f es

Gf = {(x, y, z) ∈ R3 : z = f (x, y), (x, y) ∈ Ω}


Gf = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, z − f (x, y) = 0 } = Lg (0)

donde g(x, y, z) = z − f (x, y). Así la gráfica de una función de dos variables es
una superficie de nivel de una función de tres variables.

2.1.1. Superficies cuádricas.


Consideremos las funciones de tres variables sobre R3 que son de tipo polinomial

f (x, y, z) = Ax2 + By 2 + Cz 2 + Dxy + Exz + F yz + Hx + Iy + Jz + K,

donde A, B, C, D, E, F, G, H, I, J, K son constantes. Si A, B.C, D, E, F no son


simultáneamente cero las superficies de nivel

Lf (c) = {(x, y, z) ∈ R3 : Ax2 +By 2 +Cz 2 +Dxy+Exz+F yz+Hx+Iy+Jz+K = c

se llaman superficies cuádricas.


Si A = B = C = D = E = F = 0, tenemos que la superficie de nivel de f
determina como superficie un plano dado por Hx + Iy + Jz + K = c
En general estas superficies cuádricas pertenecen a nueve tipos diferentes: El
elipsoide, el hiperboloide de una hoja, el hiperboloide de dos hojas, el cono, el
paraboloide elíptico, el paraboloide hiperbólico, el cilindro elíptico, el cilindro
hiperbólico.

2.2. Límites y Continuidad


Utilizamos la notación lı́m f (x, y) = L para indicar que podemos aprox-
(x,y)→(x0 ,y0 )
imar la función f (x, y) tanto como queramos a un número L siempre y cuan-
do tomemos (x, y) suficientemente cerca del punto (x0 , y0 ) pero con (x, y) 6=

31
(x0 , y0 ). En otras palabras, f (x, y) está cerca de L si (x, y) está cerca de (x0 , y0 )
y entre más cerca esté (x, y) de (x0 , y0 ), más cerca está f (x, y) de L. Esto sig-
nifica que podemos tomar la distancia entre f (x, y) y L tan pequeña como
queramos siempre y cuando la distancia entre (x, y) y (x0 , y0 ) sea lo suficien-
temente pequeña. Tenemos entonces la equivalencia

lı́m f (x, y) = L ⇔ lı́m |f (x, y) − L| = 0


(x,y)→(x0 ,y0 ) ||(x,y)−(x0 ,y0 )||→0

que podemos escribir también en la forma

f (x, y) → L cuando (x, y) → (x0 , y0 )⇔|f (x, y) − L| → 0 cuando


p
(x − x0 )2 + (y − y0 )2 → 0.

Así, el límite de una función de dos variables se reduce al límite usual del
cálculo de una variable, y es por esta razón que las propiedades usuales de los
límites unidimensionales también son válidas para límites de funciones de dos
variables. Claramente se ve que la definición anterior de límite es válida para
cualquier campo escalar en Rn , con solo reemplazar la pareja (x, y) por un
vector −→
x ∈ Rn y la pareja (x0 , y0 ) por cualquier vector −

a ∈ Rn .
Las propiedades de los límites y de la continuidad las resumimos en los sigu-
ientes teoremas:

Teorema 2.2.1 Si →lı́m− f (−


− →

x)=b y →lı́m− g(−
− →

x ) = c, entonces
x→a x→a

1. →lı́m− (f (−
− →

x ) + g(−

x )) = b + c,
x→a

2. →lı́m− λf (−
− →

x ) = λb para todo escalar λ,
x→a

3. →lı́m− f (−
− →

x )g(−

x ) = b · c,
x→a

4. →lı́m− |f (−
− →

x )| = |b| ,
x→a

Definición 2.2.1 Diremos que un campo escalar f es continuo en −



a si→

lı́m− f (−

x) =
x →→ a


f ( a ).
Así como con las funciones de una sola variable, también son continuas las
sumas, productos y cocientes de funciones continuas (una vez que, en el último
caso, se evite la división entre cero).

Teorema 2.2.2 Si una función g de n-variables es continua en − →a y una fun-




ción f de una variable es continua en g( a ), entonces la función compuesta
f ◦ g, definida por (f ◦ g)(−

x ) = f (g(−

x )) es continua en −

a.

32
Decir que f es continua sobre un conjunto U significa que f (−

x ) es continua en
cada punto del conjunto.

Para calcular un límite, existe la dificultad de que (x, y) puede aproximarse a


(x0 , y0 ) por muchos caminos, (contrario al caso unidimensional en el cual solo
existen dos caminos de acercamiento: por la izquierda y por la derecha) y para
que el límite exista, debe ser el mismo para todos los caminos de acercamiento.
Es claro entonces, que el límite no existe si por dos caminos distintos se ob-
tienen límites diferentes, como se ve en el siguiente ejemplo.

x2 − y 2 0
Ejemplo 2.2.1 Para probar que lı́m 2 2
(que es de la forma ) no
(x,y)→(0,0) x + y 0
existe, observamos resultados distintos si nos acercamos al origen por el eje x
y por el eje y así:
Acercamiento por el eje x: tomamos y = 0
x2
lı́m f (x, 0) = lı́m 2 = 1
(x,0)→(0,0) x→0 x
Acercamiento por el eje y: tomamos x = 0
−y 2
lı́m f (0, y) = lı́m 2 = −1
(0,y)→(0,0) y→0 y

Son continuas las funciones


X f (x, y) = x, f (x, y) = y, todos los polinomios de
i j
la forma f (x, y) = aij x y y en general todas las posibles combinaciones de
sumas, productos, cocientes y composiciones de las funciones elementales, con
excepción posiblemente de los puntos en donde los denominadores sean cero
o el límite no exista. Por ejemplo, la función F (x, y) = cos(x3 − 4xy + y 2 ) es
continua en todo punto del plano, puesto que la función g(x, y) = x3 − 4xy + y 2
es continua (como un polinomio) en toda su extensión y también f (t) = cos t es
continua para todo número t ∈ R. Por supuesto, la función dada en el ejemplo
anterior no es continua en el origen.

Ahora introducimos algunos conceptos relativos a conjuntos en el espacio de


Rn . Sean −

a ∈ Rn y r > 0. El conjunto

B(x; r) = {−

x ∈ Rn : k −

x −−

a k < r}.

se llama una n-bola abierta de radio r y centro − →a . En el espacio R2 , una


3
bola abierta es el “interior” de un cí́rculo; en R es el interior de una esfera. Un
punto − →
a es un punto interior de un conjunto U si existe una bola abierta


B( a ; r) contenida en U. Todos los puntos interiores de U forman el interior de
U. Por otra parte, −→a es un punto frontera de U si toda bola abierta con centro


en a contiene puntos que pertenecen a U y otros que no pertenecen. Todos los
puntos de frontera de U forman la frontera de U. Finalmente, un conjunto

33
es abierto si todos sus puntos son interiores y un conjunto es cerrado
si contiene todos sus puntos frontera. Por ejemplo en los números reales , R,
los tipos más sencillos de conjuntos abiertos son los intervalos abiertos. La
unión de dos o más intervalos abiertos es también abierto. El intervalo [a, b]
es un intervalo cerrado. El conjunto U = (x, y) : x2 + y 2 ≤ 1 es un conjunto
cerrado en R2 .

2.3. Funciones Diferenciables


De la misma manera que la existencia de una recta tangente está íntimamente
relacionado con el concepto de diferenciabilidad de una función de una variable,
la existencia de un plano tangente, que definiremos más adelante, tiene que ver
con el concepto de diferenciabilidad de una función de dos variables. Para llegar
a este concepto definiremos inicialmente las derivadas parciales.

2.3.1. Derivadas parciales


Si en una función de dos variables z = f (x, y) consideramos una variable,
por ejemplo y, como constante, obtenemos una función que depende exclusiva-
mente de la variable x. Así, si escribimos y = y0 (constante) y h(x) = f (x, y0 ),
la derivada h0 (x0 ) se denomina derivada parcial de f con respecto a x en el
∂f ∂f
punto (x0 , y0 ) y se denota (x0 , y0 ) ó |(x ,y ) . De la misma manera, si es-
∂x ∂x 0 0
cribimos g(y) = f (x0 , y), entonces la derivada parcial de f con respecto a y en
∂f ∂f
el punto (x0 , y0 ) será la derivada g 0 (y0 ) y se denota (x0 , y0 ) ó |(x ,y ) .
∂y ∂y 0 0
Notación. Si las derivadas parciales se calculan en un punto genérico (x, y),
∂f ∂f ∂f ∂f
escribimos y en lugar de (x, y) y (x, y). Estas derivadas también
∂x ∂y ∂x ∂y
se denotan fx y fy ó, Dx f y Dy f .

Recordemos que la definición usual de derivada es

h(x0 + 4x) − h(x0 )


h0 (x0 ) = lı́m
4x→0 4x
Al escribir dicha fórmula en términos de f obtenemos

∂f f (x0 + 4x, y0 ) − f (x0 , y0 )


(x0 , y0 ) = lı́m (2.1)
∂x 4x→0 4x
De la misma manera tenemos que

34
∂f f (x0 , y0 + 4y) − f (x0 , y0 )
(x0 , y0 ) = lı́m . (2.2)
∂y 4y→0 4y
Puesto que las derivada parciales son también funciones de las variables x y y,
podemos también derivarlas parcialmente para obtener derivadas parciales de
segundo orden denotadas como se muestra a continuación:

∂2f ∂ ∂2f ∂ ∂2f ∂2f


       
∂ ∂f ∂f ∂f ∂ ∂f
= , = , = , = .
∂x ∂x ∂x2 ∂y ∂y ∂y 2 ∂x ∂y ∂x∂y ∂y ∂x ∂y∂x

Las derivadas parciales que involucran las dos variables x y y se denominan


derivadas parciales mixtas. Un hecho importante es que bajo ciertas condiciones
estas derivadas mixtas son iguales como lo dice el siguiente teorema.

Teorema 2.3.1 Si las derivadas parciales mixtas son continuas en un conjunto


abierto U que contiene un punto (x0 , y0 ), entonces

∂2f ∂2f
(x0 , y0 ) = (x0 , y0 ).
∂x∂y ∂y∂x

Las derivadas parciales de z = f (x, y) se interpretan geométricamente como las


pendientes de las tangentes a las curvas intersección de la gráfica de f con los
planos x =constante y y =constante como se observa en las gráficas abajo.

2.3.2. Superficies parametrizadas


En el capítulo anterior definimos curva (parametrizada) en el espacio como una
función −
→r : I ⊆ R → R3 . En este caso, como el dominio es un subconjunto de

35
la recta real, tenemos un solo parámetro que denotamos con la letra t y escribi-
mos −→r (t) = (x(t), y(t), z(t)). Análogamente tenemos el concepto de superficie
parametrizada como una función − →r : U ⊆ R2 → R3 . Como el dominio es un
subconjunto del plano, tenemos ahora dos parámetros que denotamos con las
letras u y v, y escribimos



r (u, v) = (x(u, v), y(u, v), z(u, v))

x, y y z son por supuesto, funciones de U en R. Las ecuaciones x = x(u, v), y =


y(u, v), z = z(u, v) son las ecuaciones paramétricas. La gráfica abajo ilustra la
situación.

Ejemplo 2.3.1 1. El cilindro.


Un cilindro de radio a se puede parametrizar en la forma



r (u, v) = (a cos u, a sen u, v), u ∈ [0, 2π], −∞ < v < ∞

La secuencia siguiente muestra cómo se transforma el rectángulo [0, 2π]×


[0, 1] en el cilindro.

2. La esfera.
Para la parametrización de la esfera observe la gráfica abajo.

36
En el triángulo rectángulo 4OAB se tiene que x = h cos θ y y = h sen θ
y en el triángulo rectángulo 4OBC se tiene que z = a cos ϕ. Pero de
nuevo en 4OBC se tiene que h = a sen ϕ, de manera que las
ecuaciones paramétricas de la esfera son

x = a cos θ sen ϕ
y = a sen θ sen ϕ
z = a cos ϕ
en donde θ ∈ [0, 2π] y ϕ ∈ [0, π]. Así la función −

r tiene la forma


r (θ, ϕ) = (a cos θ sen ϕ, a sen θ sen ϕ, a cos ϕ)

3. La gráfica de z = f (x, y).


Análogo a la parametrización de la gráfica de una función de una variable
y = f (x) como la curva − →r (t) = (t, f (t)), la gráfica de una función de dos
variables z = f (x, y) se puede ver como una superficie parametrizada solo
con tomar x = u, y = v, z = f (u, v), esto es,


r (u, v) = (u, v, f (u, v))

4. Ejercicio (para los curiosos).


Pruebe que una parametrización del hiperboloide de una hoja x2 +y 2 −z 2 =
1 está dada por las ecuaciones

x = cos u cosh v
y = sen u cosh v
z = senh v

37
para u ∈ [0, 2π], −∞ < v < +∞.

2.3.3. El plano tangente


En una superficie parametrizada, − →r (u, v) = (x(u, v), y(u, v), z(u, v)) con (u, v) ∈
U , las rectas u = u0 (constante) y v = v0 (constante) se convierten por la acción
de −→r en las curvas sobre la superficie − →r (u) = −→r (u, v0 ) y − →r (v) = −
→r (u0 , v)
como se observa en la gráfica abajo.
Dichas curvas se denominan curvas coordenadas. Los vectores tangentes en el

→ ∂−
→r −
→ ∂−

r
punto u0 y v0 son respectivamente r0 (u0 ) = (u0 , v0 ) y r0 (v0 ) = (u0 , v0 )
∂u ∂v
y se definen por

∂−
→  
r ∂x ∂y ∂z
(u0 , v0 ) = (u0 , v0 ), (u0 , v0 ), (u0 , v0 )
∂u  ∂u ∂u ∂u


∂r ∂x ∂y ∂z

(u0 , v0 ) = (u0 , v0 ), (u0 , v0 ), (u0 , v0 )
∂v ∂v ∂v ∂v

Si dichos vectores son linealmente independientes, entonces generan un plano


que pasa por el punto − →r (u0 , v0 ) denominado plano tangente, con vector normal
∂r−
→ −

∂r
(u0 , v0 ) × (u0 , v0 ). Por lo tanto, si −

r (u0 , v0 ) = (x0 , y0 , z0 ), la ecuación
∂u ∂v
del plano tangente en ese punto es

∂−

r ∂−

r
(x − x0 , y − y0 , z − z0 ) · (u0 , v0 ) × (u0 , v0 ) = 0
∂u ∂v

38
En el caso particular en el que tenemos la gráfica de z = f (x,y), con la
∂−

r ∂− →
r ∂f
parametrización −
→r (x, y) = (x, y, f (x, y)) tenemos que × = 1, 0, ×
    ∂x ∂y ∂x
∂f ∂f ∂f
0, 1, = − , − , 1 . Si escribimos z0 = f (x0 , y0 ), la ecuación del
∂y ∂x ∂y
plano tangente es

∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) (2.3)
∂x ∂y

2.3.4. El concepto de diferenciabilidad


Recordamos inicialmente el concepto de diferenciabilidad para una función de
una variable y = f (x), para luego, de forma análoga, abordar el caso z =
f (x, y).

Diferenciabilidad de y = f (x).

Sabemos que en el caso de una función de una variable de la forma y = f (x),


la derivada de f en un punto x0 se define como

f (x0 + 4x) − f (x0 )


f 0 (x0 ) = lı́m
4x→0 4x
en caso de que dicho límite exista. Si esto último es cierto, la pendiente de la
recta secante está cercana a la pendiente de la tangente si 4x es pequeño así:

f (x0 + 4x) − f (x0 )


≈ f 0 (x0 )
4x

39
El error cometido en la aproximación está dado por

f (x0 + 4x) − f (x0 )


ε= − f 0 (x0 )
4x
Entre más pequeño sea 4x, menor es el error. La expresión anterior se puede
escribir en la forma

f (x0 + 4x) − f (x0 )


= f 0 (x0 ) + ε
4x
donde ε → 0 cuando 4x → 0. Si escribimos 4y = f (x0 + 4x) − f (x0 ),
obtenemos la ecuación

4y = f 0 (x0 )4x + ε4x (2.4)


donde ε → 0 cuando 4x → 0.
Si escribimos x = x0 + 4x, entonces f (x) = f (x0 ) + 4y y la ecuación 2.4 toma
la forma

f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + ε(x − x0 )


donde ε → 0 cuando x → x0 . Podemos escribir entonces

f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 )


si x está cerca de x0 . Entre más cerca esté x de x0 más pequeño es el error
cometido en la aproximación . La expresión de la derecha en la aproximación
anterior es lineal en x, esto es, la función

L(x) = f (x0 ) + f 0 (x0 )(x − x0 )


es una linea recta. Así,

f (x) ≈ L(x)

cerca de x0 y esta es exactamente la idea de diferenciabilidad:

Una función y = f (x) es diferenciable en un punto x0 , si el incremento en y,


4y se puede escribir como en la ecuación 2.4, es decir, si localmente (esto es,
en cualquier vecindad de x0 ) se puede aproximar por una recta, más específi-
camente, por la recta tangente en x0 ; hablando claro, si localmente, la gráfica
de f es "casi" una recta.

En un computador se puede comprobar esto. Dibuje la gráfica de, por ejemplo,


f (x) = x2 con un programa de cálculo simbólico (MuPad por ejemplo) y haga

40
zoom cerca del origen de coordenadas. Se dará cuenta de que entre mayor sea
el zoom, la gráfica de la parábola será cada vez más recta.
Esto no sucede por ejemplo con la función f (x) = |x| pues no importa qué tan
cerca se esté del origen, la gráfica de f siempre se verá como una punta (dos
rectas).

El primer sumando en el miembro derecho de la ecuación 2.4 se denomina


diferencial de f y se denota df o más comúnmente dy, así, la diferencial en
cualquier x es

dy = f 0 (x)4x
y se toma generalmente como una aproximación para 4y; entre más pequeño
sea 4x mejor es la aproximación.

Diferenciabilidad de z = f (x, y).

De la misma manera como la diferenciabilidad de una función de una variable


y = f (x) tiene que ver con la existencia de una función lineal (una recta) L(x)
que aproxima a f en una vecindad de un punto x0 , la diferenciabilidad de
z = f (x, y) en un punto (x0 , y0 ) tiene que ver con la existencia de una función
lineal (un plano) L(x, y) que aproxima a f en una vecindad de (x0 , y0 ), esto es,
algo como

f (x, y) ≈ A + Bx + Cy.
Para encontrar tal aproximación, le aplicamos el mismo análisis anterior a las
derivadas parciales, ecuaciones 2.1 y 2.2, y obtenemos formas análogas a la
ecuación 2.4 para los incrementos parciales

∂f
f (x0 + 4x, y0 ) − f (x0 , y0 ) = (x0 , y0 )4x + ε1 4x
∂x
∂f
f (x0 , y0 + 4y) − f (x0 , y0 ) = (x0 , y0 )4y + ε2 4y
∂y
donde ε1 y ε2 → 0 cuando 4x y 4y→ 0.

Tenemos así aproximaciones lineales para los incrementos parciales. Parece nat-
ural pensar que el incremento de f en ambas variables simultáneamente, pueda
aproximarse por la suma (ya que necesitamos que la aproximación sea lineal)
de las dos aproximaciones parciales. Esto no siempre sucede, pero cuando es
así, tenemos nuestra definición de diferenciabilidad:

Una función de dos variables z = f (x, y) es diferenciable en (x0 , y0 ), si el

41
incremento de z, 4z = f (x0 + 4x, y0 + 4y) − f (x0 , y0 ) puede escribirse en la
forma
∂f ∂f
4z = (x0 , y0 )4x + (x0 , y0 )4y + ε1 4x + ε2 4y (2.5)
∂x ∂y

donde (ε1 , ε2 ) → (0, 0) cuando (4x,4y)→ (0, 0).

Si escribimos x = x0 + 4x y y = y0 + 4y, entonces la ecuación 2.5 toma


la forma

∂f ∂f
f (x, y) = f (x0 , y0 )+ (x0 , y0 )(x−x0 )+ (x0 , y0 )(y−y0 )+ε1 (x−x0 )+ε2 (y−y0 )
∂x ∂y
(2.6)
donde (ε1 , ε2 ) → (0, 0) cuando (x, y) → (x0 , y0 ).

La ecuación 2.6 explica el concepto de forma clara: si escribimos


∂f ∂f
L(x, y) = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 )
∂x ∂y
tenemos entonces la aproximación lineal

f (x, y) ≈ L(x, y)
en una vecindad de (x0 , y0 ). Note que la función L es precisamente el plano
tangente en el punto (x0 , y0 ) (vea de nuevo la ecuación 2.3). Tenemos así, que
f es diferenciable si puede linealizarse localmente, esto es, si en una vecindad
de un punto (x0 , y0 ) la gráfica de f se ve “casi” plana, siendo dicho plano
precisamente el plano tangente.
Los dos primeros términos de la derecha de la ecuación 2.5 se denomina la
diferencial de f y se denota df o más comúnmente dz así:
∂f ∂f
dz = (x0 , y0 )4x + (x0 , y0 )4y
∂x ∂y
y es una aproximación para el incremento 4z. Si le aplicamos esta definición a
∂x ∂x
las variables independientes x y y obtenemos que dx = 4x + 4y = 4x
∂x ∂y
y de la misma manera, dy = 4y. Por esta razón, es común que la diferencial
en cualquier punto (x, y) se escriba en la forma
∂f ∂f
dz = dx + dy. (2.7)
∂x ∂y
Nota. A veces, por abuso de notación, la ecuación 2.7 se escribe

42
∂z ∂z
dz = dx + dy
∂x ∂y
Si f es diferenciable en (x0 , y0 ), de la ecuación 2.6 se deduce de forma inmediata
que f es continua en dicho punto pues claramente f (x, y) → f (x0 , y0 ) cuando
(x, y) → (x0 , y0 ).

Contrario a lo que sucede en el caso de una variable en el que la existencia


de la derivada es suficiente para garantizar la existencia de la recta tangente,
para una función de dos variables la sola existencia de las derivadas parciales
no implica la existencia del plano tangente. Por ejemplo, la función
( xy
si (x, y) 6= (0, 0)
f (x, y) = x2 + y 2
0 si (x, y) = (0, 0)
∂f ∂f
no es diferenciable en (0, 0) pues aunque (0, 0) = (0, 0) = 0, la función
∂x ∂y
no es continua en (0, 0). Abajo se muestra su gráfica generada por MuPad para
x[−0.01, 0.01] y y[−0.01, 0.01].

0.4

0.2

z 0.0
−0.2

−0.4

0.010
0.005
0.010
0.000 0.005
y −0.005 0.000
−0.005 x
−0.010 −0.010

El teorema siguiente establece las condiciones suficientes para la diferenciabil-


idad.

Teorema 2.3.2 Si las derivadas parciales de z = f (x, y) existen y son contin-


uas en (x0 , y0 ) entonces f es diferenciable en dicho punto, es decir, 4z puede
escribirse como en la ecuación 2.5.

43
2.4. La Regla de la Cadena
Sea z = f (x, y) un campo escalar diferenciable en un conjunto abierto U ∈ R2 ,
y supongamos que x = x(t) y y = y(t) son funciones diferenciables de t. Se
tiene entonces que z = z(t) = f (x(t), y(t)), esto es, tenemos la composición
z(t) = f ◦ h(t) donde h es la función vectorial definida por h(t) = (x(t), y(t)).
El teorema siguiente establece la forma como se calcula la derivada z 0 (t):

Teorema 2.4.1 En las condiciones del comentario anterior, se tiene que

dz ∂f dx ∂f dy
= + (2.8)
dt ∂x dt ∂y dt

Demostración. Puesto que f es diferenciable se tiene que

∂f ∂f
4z = 4x + 4y + ε1 4x + ε2 4y
∂x ∂y
donde (ε1 , ε2 ) → (0, 0) cuando (4x, 4y) → (0, 0).
Dividiendo ambos miembros de la ecuación por 4t y tomando el límite cuando
4t → 0 obtenemos

dz ∂f 4x ∂f 4y 4x 4y
= lı́m + lı́m + lı́m ε1 + lı́m ε2 (2.9)
dt ∂x 4t→0 4t ∂y 4t→0 4t 4t→0 4t 4t→0 4t
donde (ε1 , ε2 ) → (0, 0) cuando (4x, 4y) → (0, 0).
4x dx 4y dy
Por un lado, lı́m = y lı́m = . Por otro lado,
4t→0 4t dt 4t→0 4t dt
lı́m 4x = lı́m x(t + 4t) − x(t) = 0
4t→0 4t→0

puesto que x = x(t) es una función continua (por ser diferenciable). De la mis-
ma manera, lı́m 4y = 0, lo que significa que lı́m ε1 = lı́m ε2 = 0 por lo que
4t→0 4t→0 4t→0
la ecuación 2.9 se convierte en la ecuación 2.8.

Nota. A veces, por abuso de notación, la regla de la cadena se escribe así:

dz ∂z dx ∂z dy
= +
dt ∂x dt ∂y dt
En el caso en que x y y sean funciones diferenciables de dos variables s y t,
x = x(s, t), y = y(s, t), entonces z = z(s, t) = f (x(s, t), y(s, t)) y las derivadas
parciales de z con respecto a s y t están dadas por:

44
∂z ∂z ∂x ∂z ∂y
= +
∂s ∂x ∂s ∂y ∂s (2.10)
∂z ∂z ∂x ∂z ∂y
= +
∂t ∂x ∂t ∂y ∂t
dy
Podemos utilizar la regla de la cadena para encontrar en el caso en que la
dx
ecuación F (x, y) = k defina y como función implícita de x. Derivando a ambos
lados de la ecuación F (x, y(x)) = k (aplicando la ecuación 2.8 obtenemos
∂F dx ∂F dy
+ =0
∂x dx ∂y dx
Así tenemos que
∂F
dy
= − ∂x . (2.11)
dx ∂F
∂y
Análogamente, si la ecuación F (x, y, z) = k define z como función implícita
de x y y, podemos encontrar fórmulas para las derivadas parciales de z con
respecto a x y y aplicando las fórmulas dadas por las ecuaciones 2.10 a la
ecuación F (x, y, z(x, y)) = k para obtener

∂F ∂F
∂z ∂z ∂y
= − ∂x =−
∂x ∂F ∂y ∂F
∂z ∂z
d2 z
Ejercicio. Si z(t) = f (x(t), y(t)), calcular 2 .
dt
dz ∂z dx ∂z dy
Tenemos que = + . Derivando a ambos lados de esta ecuación,
dt ∂x dt ∂y dt
aplicando la regla de la derivada de un producto, obtenemos:

d2 z ∂z d2 x ∂z d2 y
   
d ∂z dx d ∂z dy
= + + + (2.12)
dt2 dt ∂x dt ∂x dt2 dt ∂y dt ∂y dt2
∂z ∂z
Para las derivadas con respecto a t de y , debemos aplicar de nuevo la
∂x ∂y
∂z ∂z
regla de la cadena (ecuación 2.8) porque y son funciones de x y y y
∂x ∂y
estas a su vez son funciones de t así:

∂ 2 z dx ∂ 2 z dy
 
d ∂z
= +
dt ∂x ∂x2 dt ∂y∂x dt

45
∂ 2 z dx ∂ 2 z dy
 
d ∂z
= + 2
dt ∂y ∂x∂y dt ∂y dt
reemplazando estas dos expresiones en la ecuación 2.12, asumiendo que las
derivadas parciales mixtas son iguales y reduciendo términos semejantes, obten-
emos la expresión

2 2
d2 z ∂2z ∂ 2 z dx dy ∂2z ∂z d2 x ∂z d2 y
 
dx dy
= +2 + 2 + +
dt2 ∂x2 dt ∂x∂y dt dt ∂y dt ∂x dt2 ∂y dt2

La regla de la cadena para una función de tres variables w = w(t) = f (x(t), y(t), z(t))
tiene una forma análoga a la ecuación 2.8:
dw ∂w dx ∂w dy ∂w dz
= + + (2.13)
dt ∂x dt ∂y dt ∂z dt

2.4.1. El vector gradiente


Observe que la ecuación 2.8 puede escribirse en la forma
   
dz ∂f ∂f dx dy
= , · ,
dt ∂x ∂y dt dt
 
∂f ∂f
El vector , se denomina gradiente de f en (x, y) y se denota ∇f , así:
∂x ∂y
 
∂f ∂f
∇f = ,
∂x ∂y
Nota. La notación ∇f significa ∇f (x, y).

Si calculamos el gradiente en un punto (x0 , y0 ) escribimos


 
∂f ∂f
∇f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 )
∂x ∂y
 
dx dy
Si escribimos −→
r (t) = (x(t), y(t)), entonces − →r 0 (t) = , y la ecuación
dt dt
2.8, calculada en un punto t0 , toma la forma
dz d −

|t=t0 = |t=t0 f (−
→r (t)) = ∇f (−
→r (t0 )) · r0 (t0 ) (2.14)
dt dt
Podemos utilizar la forma de la regla de la cadena como la expresa la ecuación
2.14 para probar que el vector gradiente de z = f (x, y) en un punto P = (x0 , y0 )
es perpendicular a la curva de nivel f (x, y) = k que pasa por P . Para ver esto,

46
supongamos que dicha curva de nivel está descrita por la función vectorial

→r (t) = (x(t), y(t)) que pasa por P en un tiempo t0 , esto es, P = − →
r (t0 ) =


(x0 , y0 ). Es claro entonces que debe ser f (x(t), y(t)) = f ( r (t)) = k. Derivando
a ambos lados de esta ecuación tenemos que

d −
f (→
r (t)) = 0 (2.15)
dt

Aplicando la fórmula 2.14 para el lado izquierdo de la ecuación 2.15 en el punto


P , tenemos que



∇f (x0 , y0 ) · r0 (t0 ) = 0

lo que prueba lo afirmado. La gráfica abajo ilustra la situación.

De la misma manera, el vector gradiente de una función de tres variables


w = F (x, y, z) en un punto P = (x0 , y0 , z0 ) es perpendicular a la superfi-
cie de nivel S definida por la ecuación F (x, y, z) = k que pasa por P . Si

→r (t) = (x(t), y(t), z(t)) es cualquier curva sobre S que pasa por P en un tiem-
po t0 , entonces F (− →
r (t)) = k y de nuevo



∇F (x0 , y0 , z0 ) · r0 (t0 ) = 0 (2.16)

47
Como la ecuación 2.16 es válida para todas las curvas sobre S que pasan por P ,
resulta natural definir el plano tangente a S en el punto P como el plano que
pasa por P (x0 , y0 , z0 ) y que tiene por vector normal el gradiente ∇F (x0 , y0 , z0 ),
por lo que su ecuación será

(−

x − P ) · ∇F (P ) = 0
siendo su expresión cartesiana

∂F ∂F ∂F
(x0 , y0 , z0 )(x − x0 ) + (x0 , y0 , z0 )(y − y0 ) + (x0 , y0 , z0 )(z − z0 ) = 0.
∂x ∂y ∂z
(2.17)
Observe que como la gráfica de una función de dos variables z = f (x, y) puede
verse como la superficie de nivel F (x, y, z) = 0 donde F (x, y, z) = f (x, y) − z,
al aplicar la ecuación 2.17 a esta F en particular, obtenemos la ecuación 2.3.

2.5. Derivadas Direccionales


Recordemos que la derivada parcial con respecto a x de una función de dos
variables z = f (x, y) se define por

∂f f (x0 + t, y0 ) − f (x0 , y0 )
(x0 , y0 ) = lı́m
∂x t→0 t
Esta es la misma ecuación 2.1 en donde hemos reemplazado 4x por t. Esta
expresión puede escribirse en la forma

∂f f ((x0 , y0 ) + t(1, 0)) − f (x0 , y0 )


(x0 , y0 ) = lı́m
∂x t→0 t

→ −

Si escribimos x0 = (x0 , y0 ) y i = (1, 0) obtenemos

48

→ −
→ −

∂f − →) = lı́m f (x0 + t i ) − f (x0 )
(x0
∂x t→0 t


De la misma manera, escribiendo j = (0, 1) la derivada parcial con respecto a
y se escribe


→ −
→ −

∂f −→) = lı́m f (x0 + t j ) − f (x0 )
(x0
∂y t→0 t
Esta forma de expresar las derivadas parciales muestran que dichas derivadas
se calculan tomando la variación de f a lo largo de las rectas − → → + t−
α (t) = −
x

i
0

→ → + t−→
y β (t) = −x0 j , esto es, rectas paralelas a los ejes coordenados que pasan
por −x→. Podemos pensar en generalizar esto, calculando la variación de f a
0
lo largo de cualquier recta que pase por − →, esto es, una recta de la forma
x 0

→ −
→ −
→ −

r (t) = x0 + t u donde u es un vector unitario cualquiera. Esto nos conduce
al concepto de derivada direccional en la dirección de un vector unitario − →u en


un punto x0 , denotada D→ − f (−
x→ ) y definida de la manera natural
u 0


→ f (−
→ + t−
x0

u ) − f (−
→)
x0
u f (x0 ) = lı́m
D→
− (2.18)
t→0 t
y se puede interpretar geométricamente como la pendiente de la tangente de
la curva de intersección de la gráfica de f con un plano perpendicular al plano
coordenado xy en el punto − →.
x0

Es claro entonces que

49
∂f −→) = D→ −

(x0 − f (x0 )
i
∂x
∂f −→) = D→ −

(x0 − f (x0 )
j
∂y
esto es, las derivadas parciales son las derivadas direccionales en las direcciones

→ − →
i y j , que corresponden a las pendientes de las tangentes de las curvas de
intersección de la gráfica de f con planos perpendiculares al plano coordenado
xy paralelos a los planos coordenados xz y yz respectivamente, como se explicó
en la sección 2.3.1.

Una forma sencilla de calcular la derivada direccional en la dirección de un


vector unitario −

u de una función f la da el siguiente teorema:

Teorema 2.5.1

→ −
→ − → (2.19)
u f (x0 ) = ∇f (x0 ) · u
D→

Demostración. Si llamamos − →
r (t) = −
→ + t−
x0

u a la recta que pasa por −
→ con
x0

→ −
→ −
→ −
→0 −

vector director u , entonces r (0) = x0 y r (0) = u . Entonces

d f (−
→r (t)) − f (−→
r (0))
|t=0 f (−

r (t)) = lı́m
dt t→0 t
f (−
→ + t−
x0
→u ) − f (−
→)
x0
= lı́m
t→0 t−

= D→ u f (x0 )

Pero, por la regla de la cadena (ecuación 2.14) se tiene que


d −

|t=0 f (−

r (t)) = ∇f (−

r (0)) · r0 (0)
dt
= ∇f (−→) · −
x 0

u
lo que demuestra el teorema.

Nota. Observe que la definición de derivada direccional (ecuación 2.18) ó su


expresión en términos del gradiente (ecuación 2.19) es válida para cualquier
campo escalar f definido en Rn .

La derivada direccional de un campo escalar f en un punto −→ en la dirección


x0


de un vector u (unitario), representa la tasa de cambio de f en dicho punto
en la dirección dada. Podemos preguntarnos por la dirección en la cual dicha
tasa de cambio es máxima ó mínima. Podemos encontrar la razón de cambio
máxima y mínima de f a partir de la ecuación 2.19. Puesto que k−→
u k = 1,

D→ −
→ ∇f (−
→) · − →
u f (x0 )
− = x 0 u


= k∇f (x0 )k cos θ

50
dónde θ es el ángulo entre ∇f (−
→) y −
x 0

u . Puesto que el coseno oscila entre −1 y
1, la razón máxima se obtiene cuando cos θ = 1, esto es θ = 0, es decir, cuando

→u y ∇f (−→) tienen la misma dirección y es mínima cuando cos θ = −1, esto es
x0
θ = π, es decir, cuando −→
u y ∇f (− →) tienen direcciones opuestas. Resumiendo,
x0
la derivada direccional máxima se obtiene en la dirección del gradiente, esto es,

→ ∇f
u = y su valor es D ∇f f = k∇f k; la derivada direccional mínima se
k∇f k ||∇f ||

obtiene en la dirección opuesta al gradiente y su valor es − k∇f k .

2.6. Máximos y Mínimos.


1. f (−

a ) es un valor máximo global de f en U si f (−

a )≥f (x, y) para todo
(x, y) ∈ U.

2. f (−→
a ) es un valor mínimo global de f en U si f (−

a )≤f (x, y) para todo
(x, y) ∈ U.

3. f (−

a ) es un valor extremo global de f en U si es un valor máximo global
o mínimo global.

Son válidas las mismas definiciones, sustituyendo la palabra global por local en
(1) y (2), cuando las desigualdades se cumplen en alguna vecindad abierta de

→a.
La definición es una generalización natural de las mismas nociones para fun-
ciones de una sola variable; y aún más, las generalizaciones para funciones de
tres y más variables son claras.

Teorema 2.6.1 (Existencia de máximo o mínimo)) Si f es continua en un


dominio cerrado y acotado U, entonces f alcanza tanto un valor máximo global
como un mínimo global en U .

A continuación definiremos lo que son puntos frontera, puntos críticos y puntos


singulares.

1. Puntos frontera. Vea la sección 2.2


2. Puntos críticos. Decimos que − →a es un punto crítico si es interior en U


donde f es diferenciable y ∇f ( a ) = 0. En dicho punto, el plano tangente
es horizontal.
3. Puntos singulares. Decimos que a es un punto singular si es interior en
U donde f no es diferenciable (por ejemplo, un punto de la gráfica donde
f tiene una esquina aguda).

51
Teorema 2.6.2 (Condiciones necesarias para los extremos) Sea f una
función definida en un conjunto U que contiene a − →
a . Si f (−

a ) es un valor


extremo, entonces a deberá ser un punto frontera de U, o un punto crítico de
f, o un punto singular de f.
Demostración. Supongamos que − →
a = (x0 , y0 ) no es punto frontera ni singular
(por lo que a será un punto interior en el que ∇f existe) y veremos si ∇f (−

→ →
a)=


0 Puesto que f tiene un valor extremo en (x0 , y0 ), la función g(x) = f (x, y0 )
tiene un valor extremo en x0 . Además, g es diferenciable en x0 puesto que f lo
es para (x0 , y0 ) y por lo tanto, por el teorema del punto crítico para funciones
de una variable,
g 0 (x0 ) = fx (x0 , y0 ) = 0
En forma análoga, la función h(y) = f (x0 , y) tiene un valor extremo en y0 y
satisface la expresión
h0 (x0 ) = fy (x0 , y0 ) = 0
El gradiente es cero, ya que ambas derivadas parciales son 0.
Ejemplo 2.6.1 Encuentre el valor máximo o mínimo local de f (x, y) = x2 −
2x + y 2 /4.
Solución La función dada es derivable en todo el plano xy. Por lo tanto,
los únicos puntos críticos posibles son los puntos críticos que se obtienen al
igualar a cero fx (x, y) y fy (x, y). Pero fx (x, y) = 2x − 2 y fy (x, y) = y/2 son
iguales a cero sólo cuando x = 1 e y = 0. Falta por decidir si (1, 0) es un
máximo, un mínimo o nada de esto. Pronto desarrollaremos un instrumento
para esto, pero por ahora debemos proceder con un poco de ingenio. Obsérvese
que f (1, 0) = −1 y que
y2 y2 y2
f (x, y) = x2 − 2x + = x2 − 2x + 1 − 1 = (x − 1)2 + − 1 ≥ −1
4 4 4
Por lo tanto, f (1, 0) es en realidad un mínimo global de f. No hay valores
máximos locales.
Ejemplo 2.6.2 Encuentre los valores máximo o mínimo locales de f (x, y) =
−x2 /a2 + y 2 /b2 .
Solución. Los únicos puntos críticos se obtienen al igualar a cero fx (x, y) =
−2x/a2 y fy (x, y) = 2y/b2. Esto produce el punto (0, 0) que no da máximo ni
mínimo (vea la figura 11). Se llama punto de silla. Debe notarse que en toda
vecindad de (0, 0) hay puntos en los que f (x, y) < f (0, 0), y otros puntos en
los que f (x, y) > f (0, 0). La función dada no tiene extremos locales.
Este ejemplo ilustra la dificultad de que ∇f (x0 , y0 ) = 0 no garantiza que exista
un extremo local en (x0 , y0 ). Por fortuna, existe un criterio regular para decidir
lo que sucede en un punto crítico. El próximo teorema es un análogo a la prueba
de segunda derivada para funciones de una variable.

52
2.6.1. Criterio para determinar extremos de funciones de
dos variables
Teorema 2.6.3 [Condiciones suficientes para los extremos] Supóngase que f (x, y)
tiene segundas derivadas parciales continuas en una vecindad de −→
a ∈ R2 y que
2 −→ 2 −→ 2 −→
∂ f( a ) ∂ f( a ) ∂ f( a )
∇f (−
→a ) = 0. Sea A = , B= , C = y sea Hf (−

a)
∂x2 ∂x∂y ∂y 2
la matriz definida por  
A B
Hf (− →
a)=
B D

→ −

Escribamos D( a ) = det(Hf ( a )). Entonces
∂ 2 f (−

a)
1. Si D(−→
a)>0 y > 0, entonces tiene un mínimo relativo en −

a.
∂x2
∂ 2 f (−

a)
2. Si D(−→
a)>0 y 2
< 0, entonces tiene un máximo relativo en −

a.
∂x
3. Si Si D(−

a ) < 0, entonces tiene un punto silla en −
→a.
4. Si D(−

a ) = 0, el criterio no decide nada.
Nota. La matriz Hf (− →
a ) se denomina matriz hessiana de f en −

a.
Para su demostración, remitimos al lector al apéndice. Sin embargo, podemos
ver de manera intuitiva porqué es cierto. D es

a ) ∂ 2 f (−
∂ 2 f (−
→ →  2 −
∂ f (→
2

→ a) a)
D( a ) = · −
∂x2 ∂y 2 ∂x∂y
∂ 2 f (−

a)
Para los casos 1 y 2, en los cuales D(− →a ) > 0, se tiene entonces que 2
·
∂x
∂ 2 f (−
→ ∂ 2 f (−
→ a ) ∂ 2 f (−
∂ 2 f (−
→ →
  2
a) a) a)
2
> ≥ 0, por lo que las dos derivadas 2
y
∂y ∂x∂y ∂x ∂y 2
∂ 2 f (−

a)
deben tener el mismo signo. Así, si > 0, se tiene concavidad hacia
∂x2
arriba en las direcciones de ambos ejes, por lo que se puede sospechar que
∂ 2 f (−

a)
en − →
a existe un mínimo. Y si 2
< 0, se tiene concavidad hacia abajo
∂x
en la dirección de ambos ejes, por lo que se puede sospechar la existencia
de un máximo en − →a . En el caso 3, en el cual D(− →
a ) < 0, el producto de
2 − → 2 − →
∂ f( a ) ∂ f( a )
las dos derivadas y debe ser negativo y por lo tanto deben
∂x2 ∂y 2
tener signos opuestos; de tal manera que tenemos concavidad hacia arriba en la
dirección de uno de los ejes y concavidad hacia abajo en la dirección del otro,
por lo que sospechamos un punto silla en − →
a . Se deja al estudiante comprobar
la parte 4.

53
Ejemplo 2.6.3 Encuentre los extremos, si los hay, de la función f (x, y) =
3x3 + y 2 − 9x + 4y.
Solución. Puesto que fx (x, y) = 9x2 − 9 y fy (x, y) = 2y + 4, los puntos críticos
que se obtienen al resolver las ecuaciones simultáneas fx (x, y) = fy (x, y) = 0
son (1, −2) y (−1, −2).Ahora bien, fxx (x, y) = 18x, fyy (x, y) = 2 y fxy (x, y) =
fyx (x, y) = 0. Por lo tanto, en el punto crítico (1, −2) tenemos
2
D(1, −2) = fxx (1, −2)fyy (1, −2) − fxy (1, −2) = 18(2) − 0 = 36 > 0
Además, fxx (1, −2) = 18 > 0, por lo que según el teorema anterior, f (1, −2) =
−10 es un valor mínimo local de f. En la comprobación de la función dada en
otro punto crítico (−1, −2) encontramos que fxx (−1, −2) = −18, fyy (−1, −2) =
2 y fxy (−1, −2) = 0, lo cual produce D(−1, −2) = −36 < 0. Entonces, (−1, −2)
es un punto de silla y f (−1, −2) no es valor extremo.
Ejemplo 2.6.4 Encuentre los valores máximo y mínimo de f (x, y) = 2x2 +
y 2 − 4x − 2y + 5 en el conjunto cerrado U = {(x, y)| x2 + y 2 /2 ≤ 1}.

Solución. Como fx (x, y) = 4x − 4 y fy (x, y) = 2y − 2, el único punto crítico


posible es (1, 1). Sin embargo, este punto está fuera de U, entonces puede ser
ignorado. La frontera de U es la elipse x2 + y 2 /2 = 1, que se puede describir
paramétricamente por

x = cos t, y = 2 sen t, 0 ≤ t ≤ 2π
Deseamos maximizar o minimizar la función de una variable

g(t) = f (cos t, 2 sen t), 0 ≤ t ≤ 2π
Por la regla de la cadena,
∂f dx ∂f dx √
g 0 (t) = + = (4x − 4)(−sen t) + (2y − 2)( 2 cos t)
∂x dt ∂y dt
√ √ √
= (4 cos t − 4)(−sen t) + (2 2 sen t − 2)( 2 cos t) = 4 sen t − 2 2 cos t
0

Haciendo √ g (t) = 0 obtenemos tan t = 2/2 con los dos soluciones t1 =
arctan( 2/2) y t2 = π + t1 . De donde g(t) tiene los cuatro puntos críticos
0, t1 , t2 y 2π √en el intervalo
√ √ Estos,
[0, 2π]. √ a su vez, determinan los tres pun-
tos (1, 0), (2/ 6, 2/ 6) y (−2/ 6, −2/ 6) en la frontera de U. Los valores
correspondientes de f son
   
2 2 −2 −2
f (1, 0) = 3, f √ ,√ ≈ 2,101, f √ ,√ ≈ 11,899
6 6 6 6
Luego, concluimos que el valor mínimo de f en U es 2.101 y el valor máximo
es 11.899.

54
Ejemplo 2.6.5 Encuentre la distancia mínima entre el origen y la superficie
z 2 = x2 y + 4.

Solución. Sea P (x, y, z) un punto cualquiera de la superficie dada. El cuadra-


do de la distancia entre el origen y P es d2 = x2 + y 2 + z 2 . Busquemos las
coordenadas de P que hagan que d2 (y por lo tanto d ) sea mínima. Puesto
que P pertenece a la superficie, sus coordenadas satisfacen la ecuación de ésta.
Sustituyendo z 2 = x2 y + 4 en d2 = x2 + y 2 + z 2 resulta d2 como función de dos
variables x e y
d2 = f (x, y) = x2 + y 2 + x2 y + 4
Para obtener los puntos críticos, hacemos fx (x, y) = 0 y fy (x, y) = 0, con lo
que se obtiene
2x + 2xy = 0 y 2y + x2 = 0
3
Por eliminación√ de y entre esas ecuaciones, se tendrá 2x − x = 0. Por lo tanto,
x = 0 o x = ± 2. Sustituyendo estos valores en la segunda √ ecuación se√obtiene
y = 0 e y = −1. Luego, los puntos críticos son (0, 0), ( 2, −1) y (− 2, −1).
Para probar cada uno de ellos, necesitamos fxx (x, y) = 2 + 2y, fyy (x, y) =
2
2, fxy (x, y) = 2x y D(x, y) = fxx fyy − fxy = 4 + 4y − 4x2 . Puesto que
√ √ √
D(± 2, −1) = −8 < 0, ni ( 2, −1) ni (− 2, −1) producen un extremo. Sin
embargo, D(0, 0) = 4 > 0 y fxx (0, 0) = 2 > 0; por lo tanto, (0, 0) produce la
distancia mínima. Sustituyendo x = 0 e y = 0 en la expresión de d2 , obtenemos
d2 = 4. Luego, la distancia mínima entre el origen y la superficie dada es 2.

2.6.2. Extremos condicionados.


Ahora distinguimos entre dos clases de problemas. Encontrar el valor mínimo
de f (x, y) es un problema de extremo libre. Encontrar el mínimo de f (x, y)
sujeto a una condición g(x, y) = 0 es un problema de extremo condicionado o
de extremo restringido. El ejemplo 2.6.5 de la sección anterior fue un proble-
ma de extremo condicionado. Se nos pidió encontrar la distancia mínima entre
la superficie z 2 = x2 y + 4 al origen. Formulamos el problema de minimizar
d2 = x2 + y 2 + z 2 sujeta a la restricción z 2 = x2 y + 4. Manejamos el problema
sustituyendo el valor de z 2 de la restricción en la expresión de d2 y después
resolvimos el problema de valor extremo libre que resultó. Sin embargo, con
frecuencia sucede que no es fácil despejar una de las variables en la ecuación de
restricción y, aún cuando pueda lograrse, puede ser más práctico otro método.
Este es el método de multiplicadores de Lagrange.

El método de Lagrange proporciona un recurso algebraico para encontrar los


puntos extremos restringidos. Si p0 es un extremo restringido, entonces la curva
de nivel y la restricción son tangentes en dicho punto. Las gráficas abajo ilustran
esta situación.

55
Dichas curvas tienen una recta tangente común y, por consecuencia, tienen una
perpendicular común. Pero en cualquier punto de una curva de nivel, el vector
gradiente ∇f es perpendicular a ella (ver sección 2.4.1) y en forma similar ∇g
es perpendicular a la curva de restricción g(x, y) = 0, pues dicha curva puede
verse como curva de nivel de la función z = g(x, y). Por lo tanto, ∇f y ∇g son
paralelos en p0 , es decir,
∇f (p0 ) = λ0 ∇g(p0 )
para algún número no nulos λ0 . Esto sugiere la siguiente formulación del método
de Lagrange.

Método de multiplicadores de Lagrange. Si un campo escalar f (x1 , x2 , ..., xn )


tiene un extremo (máximo o mínimo) sujeto a la restricción g(x1 , x2 , ..., xn ) = 0,
entonces existe un escalar λ tal que

∇f = λ ∇g

en dicho punto extremo. El número λ se llama multiplicador de Lagrange.

56
Teniendo en cuenta el método de multiplicadores de Lagrange observemos que
podemos formar la siguiente función

L(x1 , x2 , ..., xn , λ) = f (x1 , x2 , ..., xn ) − λg(x1 , x2 , ..., xn )


conocida como función de Lagrange. En este caso los puntos extremos son
puntos críticos de L y por lo tanto las derivadas parciales de la función L son
cero en estos puntos.

Ejemplo 2.6.6 Encuentre el punto del plano 2x − 2y + z = 4 que esté más


próximo al origen.
p
Solución. Se desea minimizar la distancia d = x2 + y 2 + z 2 sujeta a 2x −
2y +z −4 = 0. Para facilitar el problema se minimiza el cuadrado de la distancia
d2 = x2 + y 2 + z 2 . La función de Lagrange será

L(x, y, z, λ) = x2 + y 2 + z 2 − λ (2x − 2y + z − 4)

Luego, el sistema de ecuaciones de Lagrange es

∂L ∂L ∂L
= 2x − 2λ = 0, = 2y + 2λ = 0, = 2z − λ = 0,
∂x ∂y ∂z

∂L
= −2x + 2y − z + 4 = 0
∂λ
Si se sustituyen los valores de 2x, 2y y z de las tres primeras ecuaciones en la
cuarta, se obtiene

λ 9 8
−2λ − 2λ − + 4 = 0, o − λ + 4 = 0, o λ=
2 2 9
Por tanto, x = 8/9, y = −8/9 y z = 4/9, así́ (8/9, −8/9, 4/9) es el punto
requerido, y la distancia de dicho punto al origen es
r r r
64 + 64 + 16 4+4+1 1 4
=4· = 4· =
81 81 9 3
Ejemplo 2.6.7 ¿ Cual es el área máxima que puede tener un rectángulo si la
longitud de su diagonal es 2?

Solución. Coloque el rectángulo en el primer cuadrante con dos de sus lados


a lo largo de los ejes coordenados; entonces, el vértice opuesto al origen tendrá
comopcoordenadas (x, y), siendo positivas x e y. La longitud de su diagonal
será x2 + y 2 = 2 y su área xy. Entonces podemos formular el problema como

57
maximización de f (x, y) = xy sujeta a la restricción g(x, y) = x2 + y 2 − 4 = 0.
Formando la función de Lagrange
L(x, y, λ) = xy − λ x2 + y 2 − 4


llegamos al sistema de ecuaciones


∂L ∂L ∂L
= y − 2λx = 0, = x − 2λy = 0, = 4 − x2 − y 2 = 0
∂x ∂y ∂λ
Si multiplicamos la primera ecuación por y y la segunda por x, obtenemos
y 2 = 2λxy y x2 = 2λxy, por 2 2
√ lo que y √= x . De la tercera ecuación para
2 2
y = x encontramos x = 2 e y = 2; y sustituyendo estos valores en
x − 2λy = 0, y − 2λx = 0 resulta λ =√1/2. Entonces,
√ la solución del sistema
, conservando positivas x e y, es x = 2, y = 2, λ = 1/2.Concluimos que el
rectángulo
√ de máxima área con diagonal 2 es el cuadrado cuyos lados miden
2. Su área es 2.
Observación 2.6.1 El definir la función de Lagrange tiene su ventaja cuando
tenemos que hallar los extremos de una función f (x1 , x2 , ..., xn ) sujetos a m
restricción g1 (x1 , x2 , ..., xn ) = 0, g2 (x1 , x2 , ..., xn ) = 0, ..., gm (x1 , x2 , ..., xn ) = 0
donde suponemos m < n. La función de la Lagrange en este caso está definida
por
L (x1 , x2 , ..., xn , λ1 , λ2 , ..., λm ) = f (x1 , x2 , ..., xn ) + λ1 g1 (x1 , x2 , ..., xn )
+λ2 g2 (x1 , x2 , ..., xn ) + ... + λm gm (x1 , x2 , ..., xn )
Ejemplo 2.6.8 Hallar el máximo de la función f (x, y, z) = x + y + z sobre la
curva determinada por el plano x + 2y + 3z = 0 y el cilindro x2 + y 2 = 1
Solución:Observemos que las funciones que se determinar para definir las re-
stricciones son g1 (x, y, z) = x + 2y − z y g2 (x, y, z) = x2 + y 2 − 4.
Entonces la función de Lagrange es definida por
L(x, y, z, λ1 , λ2 ) = x + y + z + λ1 (x + 2y − z) + λ2 x2 + y 2 − 1


Calculando las derivadas parciales e igualando a cero para hallar los puntos
críticos de L obtenemos
∂L
(1) = 1 + λ1 + 2λ2 x = 0
∂x
∂L
(2) = 1 + 2λ1 + 2λ2 y = 0
∂y
∂L
(3) = 1 − λ1 = 0
∂z
∂L
(4) = x + 2y − z = 0
∂λ1
∂L
(5) = x2 + y 2 − 1 = 0
∂λ2

58
Al tomar λ1 = 1 (de (3)) en (1) obtenemos λ2 x = −1, o sea que x = −1/λ2 .
Similarmente, (2) nos da y = −3/(2λ2 ). Substituyendo en (5) tenemos

1 9
2 + 2 =1
(λ2 ) 4 (λ2 )

2 √
así́ que (λ2 ) = 13/4, λ2 = ± 13/2. Por tanto x = ∓ √213 , y = ∓ √313 y de (4)
tenemos z = x + 2y = ∓ √513 . Los valores que le corresponden para la función
f son

2 3 5 10
∓√ ∓ √ ∓ √ = ∓√ .
13 13 13 13

El valor máximo de f es √10 .


13

Ejemplo 2.6.9 Utilizar el software MuPad para hallar el máximo de la función


f (x, y) = x3 − xy + y 2 + 3 con la restricción x2 + 2y 2 = 1. Hacer las gráficas
que muestren que los extremos se obtienen en los puntos en donde las curvas
de nivel son tangentes a la curva de restricción.

Solución.
Definimos las funciones f y g como sigue:

F:=x^3-x*y+y^2+3-z
x3 − xy + y 2 − z + 3

g:=x^2+2*y^2-1
x2 + 2y 2 − 1

Dibujamos la superficie que corresponde a F en z = 0:

plot(
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2))

59
Recordemos que las curvas de nivel se obtienen intersectando la superficie con
planos z = constante. Abajo se ve un ejemplo para z = 3,5:

plot(
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Surface([x,y,3.5],x=-1.2..1.2,y=-1.2..1.2,Color=RGB::Yellow),
plot::Implicit3d(F|z=3.5, x =-1.2..1.2, y=-1.2..1.2,z=3.45..3.55))

Resolvemos el sistema

∇f (x, y) = λ∇g(x, y)
g(x, y) = 0
que corresponde al sistema

60

 3x2 − y = 2λx
−x + 2y = 4λy
 2
x + 2y 2 = 1
tt:=numeric::solve([3*x^2-y=2*λa*x,-x+2*y=4*λ*y,x^2+2*y^2=1],[x,y,λ])

[x = 0.2359 - 0.5446 i, y = -0.7918 - 0.0811 i, λ = 0.5562 - 0.1777 i],


[x = 0.2359 + 0.5446 i, y = -0.7918 + 0.0811 i, λ = 0.5562 + 0.1777 i],
[x = 0.9468, y = -0.2275, λ = 1.5403],
[x = 0.5440, y = 0.5933, λ = 0.2707],
[x = -0.9853, y = -0.1207, λ = -1.5392],
[x = -0.3106, y = 0.6721, λ = 0.6155]

Como se ve, se tienen dos soluciones complejas y cuatro reales. Aislamos las
cuatro reales en la siguiente tabla:

table(1=tt[3],2=tt[4],3=tt[5],4=tt[6])

1 x = 0,9468 y = −0,2275 λ = 1,5403


2 x = 0,5440 y = 0,5933 λ = 0,2707
3 x = −0,9853 y = −0,1207 λ = −1,5392
4 x = −0,3106 y = 0,6721 λ = 0,6155
Reemplazando los valores de x y y en la función f (x, y), obtenemos los cuatro
valores:

table(1=F|(x=0.9468,y=-0.2275,z=0),2=F|(x=0.5440,y=0.5933,z=0),
3=F|(x=-0.9853,y=-0.1207,z=0),4=F|(x=-0.3106,y=0.6721,z=0))

1 4,1158
2 3,1902
3 1,9390
4 3,6305
La gráfica siguiente muestra las cuatro curvas de nivel y la curva de restricción
con los puntos de tangencia en donde se encuentran los extremos.

plot(plot::Implicit2d(F|z=4.1158,x=-2..2,y=-2..2),
plot::Implicit2d(g,x=-2..2,y=-2..2,Color=RGB::Black),
plot::Implicit2d(F|z=3.1902,x=-2..2,y=-2..2,Color=RGB::Green),
plot::Implicit2d(F|z=3.6305,x=-2..2,y=-2..2,Color=RGB::Red),
plot::Implicit2d(F|z=1.939,x=-2..2,y=-2..2,Color=RGB::Brown),
plot::Point2d([0.94,-0.22],Color=RGB::Blue),
plot::Point2d([0.54,0.59],Color=RGB::Green),

61
plot::Point2d([-0.98,-0.12],Color=RGB::Brown),
plot::Point2d([-0.31,0.67],Color=RGB::Red))

Las cinco gráficas siguientes muestran la superficie con su restricción y las


curvas de nivel correspondientes a los cuatro valores anteriores, viéndose clara-
mente que los extremos se obtienen en los puntos de tangencia.
plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue))

plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),

62
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=4.1158, x =-1.2..1.2, y=-1.2..1.2,z=4.1..4.2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=4.1158,x=-2..2,y=-2..2,z=0..0.1))

plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=3.1902, x =-1.2..1.2, y=-1.2..1.2,z=3.1..3.2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=3.1902,x=-2..2,y=-2..2,z=0..0.1))

plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),

63
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=1.939, x =-1.2..1.2, y=-1.2..1.2,z=1.9..2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=1.939,x=-2..2,y=-2..2,z=0..0.1))

plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=3.6305, x =-1.2..1.2, y=-1.2..1.2,z=3.6..3.7),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=3.6305,x=-2..2,y=-2..2,z=0..0.1))

Tenemos entonces el máximo z = 4,1158 en el punto (0,9468, −0,2275) y el


mínimo z = 1,9390 en el punto (−0,9853, −0,1207).

64
Observe en este ejemplo que existen otros dos puntos de tangencia en donde
no hay extremos; esto demuestra que la condición de tangencia de la curva de
nivel con la curva de restricción para la existencia de un extremo, es solamente
una condición necesaria pero no suficiente.

2.7. *Temas de Lectura


2.7.1. Campos Escalares y Campos Vectoriales
En este capítulo consideramos las funciones de subconjuntos U ⊂ Rn (n > 1)
a Rm (m ≥ 1) . Cuando m = 1, las funciones

f: U ⊂ Rn → R

→x → f (−

x)


x = (x1 , x2 , ..., xn ), le llamaremos campos escalares o funciones de varias vari-
ables. Un campo escalar asigna a cada vector − →
x un número real f (− →x ) ∈ R.
Cuando m > 1, definiremos los campos vectoriales como funciones


F : U ⊂ Rn → Rm

→ −

x → F (−

x)

→−
F (→
x ) = (f1 (−

x ), f2 (−

x ), ..., fm (−

x ))


donde cada una de las componentes de F , fi : U ⊂ Rn → R son campos
escalares o funciones de varias variables. Hablaremos de un campo vectorial


sobre Rn cuando F : U ⊂ Rn → Rn . Un campo vectorial asigna a cada

→→
vector −

x un vector F (−x ) ∈ Rm . Ver la figura en caso de campo vectorial sobre
R2 y R3 respectivamente.

65
De acuerdo a la definición de campo vectorial, podemos inicialmente hacer un
análisis de los campos escalares que naturalmente extenderemos a los campos
vectoriales.
Veamos algunos ejemplos de campos escalares y campos vectoriales:

Ejemplo 2.7.1 En el plano xy el dominio natural de


p
y − x2
f (x, y) = 2
x + (y − 1)2

es U = {(x, y) : y ≤ x2 } − (0, 1).


1
p
Ejemplo 2.7.2 Si z = f (x, y) = 3 36 − 9x2 − 4y 2 y observemos que z ≥ 0.
El dominio de f es el conjunto

U = {(x, y) : 36 − 9x2 − 4y 2 ≥ 0}.

Ejemplo 2.7.3 En el caso de z = y 2 − x2 , el dominio U = R2 .

Definición 2.7.1 El rango de una función de varias variables f : U → R o




campo vectorial F : U ⊂ Rn → Rm es el conjunto representado por Rf
− definido por
o R→
F
Rf = {f (−

x) ∈R : −
→x ∈ U}

o

→− → −

− = { F ( x ) ∈ Rm : x ∈ U }
R→
F
respectivamente.

Definición 2.7.2 Dada una función de varias variables o campo escalar f :


U ⊂ Rn → R, la gráfica de f es definida como el conjunto

Gr(f ) = {(x1, x2 , ..., xn , xn+1 ) : xn+1 = f (x1, x2 , ..., xn ), (x1, x2 , ..., xn ) ∈ U }.

De esta definición podemos observar que la gráfica de f está en Rn+1 . Si n = 1,


tenemos una función real cuya gráfica está en el plano, mientras que si n = 2,
la gráfica se encuentra en R3 . En este último caso diremos que la gráfica es una
superficie.

2.7.2. Derivada en una dirección de un campo escalar en


Rn . Derivadas direccionales y parciales.
Sea f : U ⊂ Rn → R un campo escalar y − →a un punto interior a U. Deseamos
estudiar la variación de f cuando nos desplazamos desde −→
a a un punto próximo.
En general, la variación de f dependerá de la dirección en la cual nos movemos

66
a partir de −→a . Supongamos que se presenta esa dirección mediante un vector

→y . Esto es, supongamos que nos movemos desde − →
a hacia otro punto −
→a +−→y,

→ −
→ −

siguiendo el segmento de recta que une a con a + y . Cada punto de este
segmento tiene la forma − →a + t−

y , donde t es un número real. Mantengamos
t 6= 0 pero lo bastante pequeño para que −→
a + t−→y ∈ U y definamos el cociente
de diferencias
f (−

a + t−→
y ) − f (−

a)
t
El numerador de este cociente pone de manifiesto el cambio de la función cuando
nos desplazamos desde −→a a−→
a + t−

y . El cociente denomina a su vez el promedio
de variación de f en el segmento de recta que une − →
a a−→
a +− →
y . Nos interesa
el comportamiento de esa cociente cuando t → 0.

Definición 2.7.3 Sea f : U ⊂ Rn → R un campo escalar y − →a un punto




interior a U y y ∈ Rn un punto arbitrario.. La derivada de f en a con respecto
a−→y se representa con el símbolo f 0 (a; −

y ) y se define

f (−

a + t−

y ) − f (−

a)
f 0 (a; −

y ) = lı́m
t→0 t

cuando tal límite existe. En particular, cuando − →y es un vector unitario, es



→ −

decir k y k = 1, la distancia entre a y a + t y es |t|. En tal caso el cociente de
diferencias representa el promedio de variación de f por unidad de distancia
a lo largo del segmento de recta que une a con a + − →
y y la derivada f 0 (a; −

y)

→ −

se denomina derivada direccional. Además, si y = ek (el vector k -ésimo
coordenado unitario) la derivada direccional f 0 (a; −

ek ) se denomina derivada
∂f − →
parcial respecto a ek y se denota por ∂xk ( a ).

Ejemplo 2.7.4 En R2 los vectores coordenados unitarios son los vectores i y


j. Si a = (x0 , y0 ) las derivadas parciales f 0 (−

a ; i) y f 0 (−

a ; j) también se
escriben
∂f ∂f
f 0 (−

a ; i) = (x0 , y0 ) = fx (x0 , y0 ), f 0 (−

a ; j) = (x0 , y0 ) = fy (x0 , y0 )
∂x ∂y

En <3 , los vectores coordenados unitarios son los vectores i,


j y k. Si a = (x0 , y0 , z0 ) las derivadas parciales f 0 (a; i),
f 0 (a; j) y f 0 (a; k) se escriben respectivamente como

∂f ∂f
(x0 , y0 , z0 ) = fx (x0 , y0 , z0 ), (x0 , y0 , z0 ) = fy (x0 , y0 , z0 ),
∂x ∂y
∂f
(x0 , y0 , z0 ) = fz (x0 , y0 , z0 )
∂z

67
De acuerdo a la definición de derivada en una dirección, las derivadas parciales
fx (x0 , y0 ) y fy (x0 , y0 ) pueden expresarse

f (x0 + h, y0 ) − f (x0 , y0 )
fx (x0 , y0 ) = lı́m para y = y0 fijo
h→0 h
f (x0 , y0 + h) − f (x0 , y0 )
fy (x0 , y0 ) = lı́m para x = x0 fijo
h→0 h
En lugar de calcular fx (x0 , y0 ) y fy (x0 , y0 ) en forma directa a partir de las
definiciones, lo usual es encontrar fx (x0 , y0 ) y fy (x0 , y0 ) mediante las reglas
ordinarias de derivación; después se sustituyen x = x0 e y = y0 .

Ejemplo 2.7.5 Si f (x, y) = x2 sen (xy 2 ), encuentre fx ( π4 , 1) y fy ( π4 , 1).


Solución.
∂f
(x, y) = 2x sen (xy 2 ) + x2 · cos(xy 2 ) · y 2 = 2x sen (xy 2 ) + x2 y 2 cos(xy 2 )
∂x
∂f
(x, y) = x2 cos(xy 2 ) · 2xy = 2x3 y cos(xy 2 )
∂y
π
Sustituyendo x = 4 y y = 1 se calculan

π π π   π 2 π  √2(π 2 + 8π)
2 2 2
fx ( , 1) = 2 · sen ·1 + · 1 · cos ·1 =
4 4 4 4 4 32
 π 3 √
π π  2 3
fy ( , 1) = 2 · · cos · 12 = π
4 4 4 64

2.7.3. Diferenciabilidad de un campo escalar en Rn .


Definición 2.7.4 Un campo escalar f : U → R , donde U es un conjunto
abierto de Rn es diferenciable en si existe un vector ∇f (−

a ) ∈ Rn tal que

→ −

f (−

a + h )−f (−

a )−∇f (−

a )· h


lı́m −
→ = 0. (2.20)
h →0 khk

Si definimos

→ −

f (−

a + h )−f (−

a )−∇f (−

a )· h
E(a; h) = −
→ ,
khk
tendríamos de acuerdo a la definición, f es diferenciable en −

a si y sólo si




lı́m E(−

a; h)=0
h →0

68
Podemos escribir

→ −

f (−

a + h ) − f (−

a ) − ∇f (−

a ) · h = khkE(−

a ; h ),

o equivalentemente,

→ −

f (−

a + h ) = f (−

a ) − ∇f (−

a ) · h + khkE(−

a ; h ),

El vector ∇f (−→a ) le llama el gradiente de f en −



a y al producto de ∇f (−

a)·h


se le llama la diferencial de f en a .

Teorema 2.7.1 Si f : U → R es diferenciable en −



a , entonces es continua en


a.

Demostración. Puesto que f es diferenciable en a tenemos que






lı́m E(−

a ; h ) = 0.
h →0

Además

→ −
→ −

f (−

a + h )=f (−

a )−∇f (−

a )· h +khkE(−

a ; h ),


y tomando el limite cuando h → 0 tenemos que




lı́m f (−

a + h ) =f (−

a ).
h →0

Por lo tanto f es continua en −



a .

Teorema 2.7.2 Sea f derivable en − →a . Entonces la derivada de f en −



a en la


dirección del vector unitario y = (y1 , y2 , · · · yn ) y

∂f (−

n
a)
f 0 (−

a ;−

y )=∇f (−

a )·−

X
y = yk
∂xk
k=1

Demostración. Si − →y = 0 claramente ∇f (−→a )·−



y = 0 y f 0 (−
→a ;−

y )=0 . Por

→ −

consiguiente consideremos y 6= 0 . Como f es diferenciable en a tenemos que
para h con |hk < r

→ −
→ −
→ −

f (−

a + h )=f (−

a )+∇f (−

a )· h + k h kE(−

a ; h ),

→ −

donde lı́mh→0
−E( a ; h) = 0 . Si tomamos |t| < r , entonces h = t−

y con t 6= 0


cumple que h <r y por lo tanto

f (−

a + t−

y )−f (−

a )=∇f (−

a )·t−

y + |t|E(−

a ;−

y ).

69
Dividiendo por t tenemos

f (−

a + t−

y )−f (−

a) |t| → −
= ∇f (−

a )·−

y + E(−a ;→
y ).
t t
|t|
Puesto que lı́mt→0 = ±1 tenemos que
t
f (−

a + t−

y )−f (−

a)
lı́m = ∇f (−

a )·−

y.
t→0 t
Por lo tanto
f 0 (−

a ;−

y )=∇f (− →a )·−

y.
∂f (−

a) −
Además, teniendo en cuenta que f 0 (−

a ; ek ) = y→
y = u 1 e1 + · · · + u n en
∂xk
concluimos que

f 0 (−

a ;−

y) = ∇f (−

a)·−→ e1 + · · · +un −
a )· (u1 −
y = ∇f (−
→ → e→
n)
n
uk ∇f (−

a)·−

X
= ek
k=1

∂f (−
→ ∂f (−
→ ∂f (−

n n  
a) a) a)
uk f (−

a ;−

X X
0
= ek ) = uk = ,..., · (u1 , . . . , un ).
∂xk ∂xk ∂xn
k=1 k=1

De aquí́ podemos concluir que el vector gradiente es dado por

∂f (−
→ ∂f (−

 

→ a) a)
∇f ( a )= ,...,
∂x1 ∂xn

Si f es diferenciable en −

a , existen todas las derivadas parciales. No obstante la
existencia de todas las derivadas parciales no garantiza que f sea diferenciable
en −
→a .

Ejemplo 2.7.6 Consideremos la función



 xy 2
si (x, y) 6= (0, 0)
f (x, y) = x2 + y 4
 0 si (x, y) = (0, 0)

∂f ∂f
Mostremos que (0, 0) y (0, 0) existen. Por definición
∂x ∂y

∂f f ((0, 0) + ti) − f (0, 0) f (ti) f (t, 0)


(0, 0) = lı́m = lı́m = lı́m =0
∂x t→0 t t→0 t t→0 t

70
y
∂f f ((0, 0) + tj) − f (0, 0) f (tj) f (0, t)
(0, 0) = lı́m = lı́m = lı́m = 0.
∂y t→0 t t→0 t t→0 t
Sin embargo la función no es continua en (0, 0) . Observemos que f (x, 0) = 0 y
f (0, y) = 0 . Así́ a través de los ejes coordenados f → 0 cuando nos acercamos
al origen. Sin embargo si nos acercamos al origen sobre la parábola x = y 2
tenemos que f (y 2 , y) = 1/2 . Así́ f (x, y) → 1/2 cuando x = y 2 y y → 0 .
Puesto que f (0, 0) 6= 1/2, f no es continua en (0, 0) y por lo tanto no puede
ser diferenciable en (0, 0) .
Teorema 2.7.3 (Condición suficiente de diferenciabilidad). Si existen
∂f ∂f
las derivadas parciales ,..., en cierta n-bola B(−

a ;−

r ) y son continuas
∂x1 ∂xn
en −→
a , entonces f es diferenciable en −→a .

2.7.4. Regla de la cadena para campos escalares en Rn .


La regla de la cadena para funciones compuestas de una sola variable establece
que si y = g(t) = f (r(t)), donde tanto f como r son funciones diferenciables,
entonces
g 0 (t) = f 0 (r(t))r0 (t)
o
dy dy dr
=
dt dr dt
Ahora veremos como la regla de la cadena puede generalizarse para los campos
escalares o funciones de varias variables.
Teorema 2.7.4 [Regla de la cadena] Sea f una función de n -variables
definida en un conjunto abierto U ⊆ Rn y − →r una función vectorial − →
r :J →U
donde J es un intervalo abierto. Definamos la función compuesta f ◦ r en J
por g(t) = f (r(t)) donde t ∈ J . Sea t ∈ J en el que −→r 0 (t) existe y tal que f es
diferenciable en r(t) . Entonces g 0 (t) existe y
−−→ − →
g 0 (t) = ∇f (r(t)) · r0 (t)
Demostración. Sea − →
a = r(t) . Puesto que U es abierto existe una bola B(−

a)⊂

→ −
→ −
→ −
→ −

U y tomemos h 6= 0 tal que r (t + h) ∈ B( a ) . Sea y = r (t + h) − r (t) .
Claramente si h → 0 entonces yb → 0 . ahora consideremos
g(t + h) − g(t) = f (−

r (t + h)) − f (−

r (t)) = f (−

a + y) − f (−

a ).

Como f es diferenciable en −

a entonces
f (−

a +−

y ) − f (−

a ) = ∇f (−

a)·−

y + k−

y kE(−

a ; y).

71
donde E(−

a ; y) → 0 cuando |yk → 0. Ahora,

g(t + h) − g(t) = ∇f (−

a ) · (−

r (t + h) − −

r (t)) + k−

r (t + h) − −

r (t)kE(−

a ;−

y ).

Dividiendo por h obtenemos

g(t + h) − g(t) (−

r (t + h)) − −

r (t)) −

r (t + h)) − −

r (t)
= ∇f (−

a )· +k kE(−

a ;−

y ).
h h h
Tomando h → 0 tenemos que
−−→
g 0 (t) = ∇f (−

r (t)) · r0 (t)).

Si escribimos −

r en sus ecuaciones paramétricas x1 = x1 (t), x2 = x2 (t), ..., xn =
xn (t) podemos escribir g 0 (t) en la forma
∂f − dx1 ∂f − dxn
g 0 (t) = (→
a) + ... + (→
a)
∂x1 dt ∂xn dt
Cuando − →
a describe una curva C , la derivada direccional de f en la dirección


del vector tangente unitario T (t) se llama derivada direccional de f a lo largo
de la curva C .

Ejemplo 2.7.7 Halle la derivada direccional de f (x, y) = x2 − 3xy a lo largo


de la parábola y = x2 − x + 2 en el punto (1, 2) .

Solución: El gradiente de f está dado por


∂f ∂f
∇f (x, y) = ( , ) = (2x − 3y, −3x).
∂x ∂y
En el punto (1, 2) tenemos que ∇f (1, 2) = (−4, −3). La parábola la podemos
parametrizar por − →r (t) = (t, t2 − t + 2). Observemos que para t = 1,

→r (1) = (1, 2) que es el punto dado. El vector velocidad es √ dado por −

r 0 (t) =

→ 0 −

(1, 2t − 1) y r (1) = (1, 1) el cual tiene norma | r (1)k = 2 . Así T b(1) =
√1 (1, 1) . Por lo tanto la derivada direccional a lo largo de la parábola en el
2
punto (1, 2) es
1 7
f ((1, 2); T (1)) = ∇f (1, 2) · √ (1, 1) = − √
2 2
Ejemplo 2.7.8 Suponga que se calienta un cilindro circular recto sólido y que
su radio r aumenta a razón de 0.2 cm por hora y su altura h a 0.5 cm por
hora. Encuentre la razón de aumento del área con respecto al tiempo, cuando
el radio mide 10 cm y altura 100.

72
Solución: La fórmula del área total de un cilindro es S(r, h) = 2πrh + 2πr2 .
En consecuencia,
dS ∂S dr ∂S dh
= + = (2πh + 4πr)(0,2) + (2πr)(0,5)
dt ∂r dt ∂h dt
Cuando r = 10 y h = 100,
dS
= (2π · 100 + 4π · 10)(0,2) + (2π · 10)(0,5) = 58π cm2 por hora
dt
Ejemplo 2.7.9 Suponga que w = x2 y + y + xz, donde x = cos θ, y = sen θ, y
z = θ2 . Encuentre dw/dθ y la evalúe para θ = π/3.
Solución.
dw ∂w dx ∂w dy ∂w dz
= + + = (2xy + z)(−sen θ) + (x2 + 1)(cos θ) + (x)(2θ)
dθ ∂x dθ ∂y dθ ∂z dθ
= −2 cos θ sen2 θ − θ2 sen θ + cos3 θ + cos θ + 2θ cos θ
En θ = π/3,
√ √
1 1 π2 1 π2 3 π
 
dw 3 1 1 2π 1
= −2 · · − · + +1 + · =− − +
dθ 2 3 3 2 4 2 3 2 8 18 3
Suponemos en seguida que z = f (x, y), donde x = x(s, t) e y = y(s, t) de modo
que z es una función de dos variables z = f [x(s, t), y(s, t)] = h(s, t). Entonces,
tiene sentido preguntar por ∂z/∂s y ∂z/∂t.

2.7.5. Derivada en una dirección de un campo vectorial.


Derivada direccional


Definición 2.7.5 ea F : U → Rm definido en un subconjunto U de Rn .
Sea −
→a un punto interior de U y − →y ∈ Rn , un punto arbitrario. Definimos la

→0 −
→ −

derivada F ( a ; y ) por la fórmula


→− −
→→

→0 −→ −
→ F (→
a + t−

y ) − F (−
a)
F ( a ; y ) = lı́m
t→0 t
Siempre que el límite exista. Observemos que esta derivada es un vector de Rm .
De acuerdo a la definición de límites para campos vectoriales podemos observar
que

→0 −
F (→a ;→

y ) = (f10 (−

a ;−

y ), f20 (−

a ;−
→ 0 −
y ), ..., fm (→
a ;−

y ))

→0 −
En el caso que y es un vector unitario, es decir k y k = 1, F (→

→ −
→ a ;−

y ) se llama
derivada direccional de un campo vectorial.

73
2.7.6. Diferenciabilidad de un campo vectorial


Definición 2.7.6 Diremos que un campo vectorial F es diferenciable en −

a si
−−→ −
existe una matriz DF (→
a ) m × n (la matriz Jacobiana) tal que

→− −
→ −
→→ −−→ → − →
F (→ a ) − DF (−
a + h ) − F (− a)· h
lı́m


=0
h →0 khk

De esta definición y por las propiedades de los límites diremos que está defini-


ción implica que cada componente de F , fi , es diferenciable en −

a.
Denotemos por

→− −
→ −
→→ −−→ → − →



→− −
→ F (→
a + h ) − F (−
a ) − DF (−
a)· h
E (→
a, h)= .
khk


→→ −
− →
Observemos que E (−
a , h ) es un vector de Rm . Esto nos permite escribir

→− −
→ −
→→ −−→ → − → −
→→ → −
F (→
a + h ) = F (−
a ) + DF (−
a ) · h + khk E (−
a, h)


y decir que un un campo vectorial F es diferenciable en −
→a si existe una matriz
−−→ − −


→− −


DF ( a ) m×n tal que la igualdad anterior se cumple donde lı́m→ − E (→
a, h) =
h →0
0. Esta fórmula es conocida como fórmula de Taylor de primer orden. válida

→ −→ −−→ →
para todo h con h < r para cierto r > 0. La matriz DF (− a ) la llamaremos


→ − →
la derivada de F en a .  
∇f1
−−→ → −−→ →
Vamos a demostrar que la matriz DF (− a ) =  ...
a ) es DF (−  donde ∇fi
 

∇fm
(i = 1, ..., m) es el gradiente de la función fi (i = 1, ..., m).

Observemos que

→− −
→ −
→→ −
→ −

F (→
a + h ) − F (−
a) = (f1 (−

a + h ), ..., fm (−

a + h )) − (f1 (−→
a ), ..., fm (−

a ))

→ −

= (f (−
1

a + h ) − f (−
1
→a ), ..., f (−
m

a + h ) − f (−
m

a ))

Como cada componente fi es diferenciable tenemos que


→ −
→ −

fi (−

a + h ) − fi (−

a ) = ∇fi · h + khk Ei (−

a, h)


donde lı́m→
− E (−
h →0 i

a , h ) = 0. Por lo tanto

74

→− −
→ −
→→ −
→ −

F (→
a + h ) − F (−
a) = (f1 (−
→a + h ), ..., fm (−
→a + h )) − (f1 (− →a ), ..., fm (−

a ))

→ −
→ −
→ −
→ −
→ −

= (f1 ( a + h ) − f1 ( a ), ..., fm ( a + h ) − fm ( a ))

→ −
→ −
→ −

= (∇f1 · h + khk E1 (− →a , h ), ..., ∇fm · h + khk Em (− →
a , h ))

→ −
→ −
→ −

= (∇f1 · h , ..., ∇fm · h ) + (khk E1 (− →
a , h ), ..., khk Em (−→a , h ))

→ −
→ −
→ →

= (∇f1 · h , ..., ∇fm · h ) + khk (E1 (− →
a , h ), ..., Em (−→
a , h ))
−−→ → − → −
→ −
→ − →→ − → −
→ −

Si DF (−
a )· h = (∇f1 · h , ..., ∇fm · h ) y E (−
a , h ) = (E1 (−

a , h ), ..., Em (−

a , h ))
tenemos que

→− −
→ −
→→ −−→ → − → →→ −
− →
F (→a + h ) = F (− a ) + DF (−
a ) · h + khk E (−
a, h)

→− →

donde lı́m→

h →0
E (→a , h ) = 0. Esto implica que
 
∇f1
−−→ − ∇f2
DF (→
   T
a)= ..  = ∇f1 ∇f2 ··· ∇fm .
 
 . 
∇fm

Observemos también que


→0 −
F (→
a ;−

y) = (f10 (−

a ;−

y ), f20 (−

a ;−
→ 0 −
y ), ..., fm (→a ;−

y ))

→ −
→ −
→ −−→ → −→
= (∇f1 · h , ∇f2 · h , ..., ∇fm · h ) = DF (− a)· h

→ → −
Esta fórmula nos permite determinar fácilmente la derivada F 0 (−
a ;→
y ).



Ejemplo 2.7.10 Supongamos que T : Rn → Rm es una transformación lineal.
(Una transformación lineal es un ejemplo


particular de campo vectorial). Vamos a mostrar que T es difenciable y que
−−→ − −
→ −
→→
DT (→x)=− →a donde −

a es la matriz m×n asociada a T ,esto es T (−
x)=− →a−
→x.
→−
− → − → −
→→ −
→ −
→− −
→ −

T (x + h ) − T (−
x)−−

a h A (→x + h)−− →
a−→
x −−

a h
lı́m




= lı́m





h →0 h h →0 h

→ −
→ →− −

a−→x +−→
a h −− a→
x −−
→a h
= →
lı́m



=0
h →0 h

75
−−→ → −

entonces DT (− x)= A
Así todos las transformaciones lineales son campos vectoriales diferenciables.

Ejemplo 2.7.11 Si f : U ⊂ Rn → R es un campo escalar diferenciable sobre


un conjunto abierto U , entonces ∇f : U ⊂ Rn → Rn es un campo vectorial
dado por
∂f ∂f ∂f
∇f = ( , , ..., )
∂x1 ∂x2 ∂xn
Si cada una de las derivadas parciales es diferenciable tenemos que podemos
encontrar la matriz Jacobiana de ∇f, D∇f, la cual en algunos textos se denota
por ∇2 f (−

x ) y es igual a
T
∂2f ∂2f ∂2f

···
 ∂x21 ∂x1 ∂x2 ∂x1 ∂xn 
∂2f ∂2f ∂2f
 
 
···
∇2 f (−
→  
x)=
 ∂x2 ∂x1 ∂x22 ∂x2 ∂xn 

 
 
 ∂2f ∂2f ∂2f 
···
∂xn ∂x1 ∂xn ∂x2 ∂x2n

2.7.7. Regla de la cadena para campos vectoriales.




Teorema 2.7.5 [Regla de la cadena] Sea F una función vectorial definido
en un conjunto abierto U ⊆ Rn y − →
r una función vectorial −→r : J → U donde

→ →
J es un intervalo abierto. Definamos la función compuesta F ◦ − r en J por

→ −
→− → −
→ 0 −

G (t) = F ( r (t)) donde t ∈ J . Sea t ∈ J en el que r (t) existe y tal que F es


diferenciable en −
→r (t) . Entonces G 0 (t) existe y

→0 → −−→ −−→

G (t) = D F (r(t))r0 (t)

Demostración. Sea − →a= − →


r (t) . Puesto que U es abierto existe una bola
B( a ) ⊂ U y tomemos h 6= 0 tal que −

→ →
r (t + h) ∈ B(−→
a ) . Sea −

y = r(t + h) − r(t)

→ −

. Claramente si h → 0 entonces − →
y → 0 . ahora consideremos G (t+ h)− G (t) =

→− −
→→ −
→→ − −
→→
F (→r (t + h)) − F (−
r (t)) = F (−a +→ y ) − F (−a ).

→ −

Como F es diferenciable en a entonces

→− −
→→ −
→→ −
F (→
a +−→y ) − F (−a ) = D F (−a)·→ y + k−
→y kE(− →
a ;−

y ).

donde E(−

a ; y) → 0 cuando |yk → 0. Ahora,

→ −
→ −
→→ −
→→ −
G (t + h) − G (t) = D F (−
a ) · (r(t + h) − r(t)) + kr(t + h) − r(t)k E (−
a ;→
y ).

76
Dividiendo por h obtenemos

→ −

G (t + h) − G (t) → → (−
− →
r (t + h)) − −

r (t)) −

r (t + h)) − −

r (t)
= D F (−
a )· +k kE(−

a ;−

y ).
h h h
Tomando h → 0 tenemos que

→0 −
→→
G (t) = D F (−
r (t)) · −

r 0 (t).

En el caso general de la composición de dos campos vectoriales tenemos que


→ − →
Teorema 2.7.6 [Regla de la cadena general] Sea F y G dos campos vec-

→ −
→ − →
toriales en un abierto U donde la función compuesta H = F ◦ G esta bien

→− −
→ −
→ −

definida por H (→x ) = F ( G (−

x )) donde x ∈ U.. Sea x ∈ U en el que D G 0 (x)

→ −
→→ −
→→
existe y tal que F es diferenciable en G (−
x ) . Entonces D H (−
x ) existe y

→→ −
→− →→ −
→→
D H (−
x ) = D F ( G (−
x ))D G (−
x ).

que es el producto de las dos matrices.


→→
Demostración. Sea − →a = G (− x ) . Puesto que U es abierto existe una bola

→→
B(−→
a ) ⊂ U y tomemos h 6= 0 tal que − →r (t + h) ∈ B(− →
a ) . Sea −
→y = G (− x +

→ −
→ − → −
→ −

h ) − G (( x ) . Claramente si h → 0 entonces y → 0 . ahora consideremos

→− −
→ −
→→ −
→− →→ − → −
→− →→ −
→→ − −
→→
H (→x + h ) − H (− x ) = F ( G (−
x + h )) − F ( G (− x )) = F (−a +→ y ) − F (−
a ).

→ −

Como F es diferenciable en a entonces

→− −
→→ −
→→− −
→→ −
F (→
a +−

y ) − F (−
a ) = D F (−
a )→
y + k−

y k E (−
a ;→
y ).

→→
donde E (−
a ; y) → 0 cuando |yk → 0. Ahora,

→− −
→ −
→→ −
→→ − → −

H (→
x + h ) − H (−
x) = D F (−a ) · G ((x + h) − G ((x) +

→ −
→ −
→→ −
k G ((x + h) − G ((x)k E (− a ;→y ).

→− → −
→ −

h i
= D F ( a ) · D G (x) · h + h E(x, h) +

h − → −
→ −
→ i −→→ −
kD G(x) · h + h E (x, h) k E (− a ;→y)

→→ −
→ → → −
− →
= D F (−a ) · D G (x) · h + D F (−

a ) · h E(x, h) +

→ −
h − → → i −→→ −
kD G(x) · h + h E (x, h) k E (− a ;→y ).

77



Dividiendo por h obtenemos

→− −
→ −
→→ −
→→ −

H (→
x + h ) − H (−
x ) − D F (−
a ) · D G (x) · h −
→→


= D F (−
a ) · E(x, h) +
h


→ →

kD G(x) · h + h E(x, h) −
→−


E (→
a ;−
→y ).
h

→ −

Tomando h → 0 tenemos que

→→ −
→− →→ −
→→
D H (−
x ) = D F ( G (−
x ))D G (−
x)



Definición 2.7.7 Divergencia de un campo vectorial. Sea F : U ⊂ Rn →

→→
Rn donde U es un subconjunto de Rn un campo vectorial dado por F (− x)=
(f1 (−

x ), f2 (−

x ), ..., fn (−

x )) −

x = (x1 , x2 , ..., xn ). Definimos la divergencia


de F como
→ ∂f1 (−
− →
x ) ∂f2 (− →
x) ∂fn (−

x)
div F = + + ... + .
∂x1 ∂x2 ∂xn
 
∂ ∂ ∂
Si representamos ∇ = , , ..., observemos que podemos denotar
∂x1 ∂x2 ∂xn
divF = ∇ · F. Hay que tener en cuenta que la divergencia es un campo escalar.

→ −

Ejemplo 2.7.12 Sea F (x, y, z) = (x2 y, xyz, x2 z). La divergencia de F es


div F = 2xy + xz + x2 .
Ejemplo 2.7.13 Sea


!

→ r x y z x y z
F (x, y, z) = − = , , = , , ,.
k→ k−
→r k k− →
r k k− →
3 3 3 3 r3 r3 r3
rk rk
x y z
donde r = k−→ p
r k = x2 + y 2 + z 2 . Sean f1 = 3 , f1 = 3 , f2 = 3 . Entonces
r r r
3

∂ r ∂ (r) x
r3 − x r3 − 3xr2 r3 − 3xr2 3 2
∂f1
= ∂x = ∂x = r = r − 3x r ,
∂x r6 r6 r6 r6
3

∂ r ∂ (r) y
r3 − x r3 − 3yr2 r3 − 3yr2 3 2
∂f2
=
∂y
=
∂y
= r = r − 3y r ,
∂y r6 r6 r6 r6
3

∂ r ∂ (r) z
r3 − x r3 − 3zr2 r3 − 3yr2 3 2
∂f 3
= ∂z = ∂z = r = r − 3z r .
∂z r6 r6 r6 r6

78
Sumando estas derivadas tenemos que


→ ∂f1 ∂f2 ∂f2 3r3 − 3r3
div F = + + = = 0.
∂x ∂y ∂y r6


Definición 2.7.8 Rotacional de un campo vectorial. Sea F : U ⊂ R3 →
R3 donde U es un subconjunto de Rn un campo vectorial dado por


F (x, y, z) = (P (x, y, z), Q(x, y, z), R(x, y, z)


Definimos el rotacional de F al vector definido por



 
∂R ∂Q ∂P ∂R ∂Q ∂P
rot F = − , − , −
∂y ∂z ∂z ∂x ∂x ∂y

Observación 2.7.1 El rotacional se puede ver como

i j k



→ −
→ ∂ ∂ ∂
rot F = ∇ × F =

∂x ∂y ∂z


P Q R



Observación 2.7.2 En el caso que F (x, y) = (P (x, y), Q(x, y)) definiremos


el rotacional de F como
i j k 


→ ∂

∂ ∂Q ∂P
rot F = 0 = − k

∂x ∂y ∂x ∂y
P Q 0


→ −

Observación 2.7.3 Si el vector rot F = 0 , diremos que es campo vectorial
es un campo irrotacional.

.


Ejemplo 2.7.14 Sea F (x, y, z) = (−x, xy + y, 2x − xz), entonces el rotacional
es dado por

i j k



→ ∂ ∂ ∂
rot F = = (−x, xy + y, 2x − xy) = −xi+ (xy + y) j−xyk.

∂x ∂y ∂z
xyz x2 −xy

79
Definición 2.7.9 Laplaciano de un Campo Escalar. Sea f (x, y, z) un
campo escalar.diferenciable con derivadas de orden dos, definimos el Lapla-
ciano de f, ∆f, como la divergencia del gradiente de f, esto es

∂f ∂f ∂f ∂2f ∂2f ∂2f


∆f = div (∇f ) = div ( , , )= + +
∂x ∂y ∂y ∂x2 ∂y 2 ∂y 2

En el caso de dos variables f (x, y) tenemos

∂2f ∂2f
∆f = div (∇f ) = +
∂x2 ∂y 2

Ejemplo 2.7.15 Sea f (x, y) = x3 − 3xy 2 . Hallar el Laplaciano de f.

∂f ∂2f
= 3x2 − 3y 2 2
= 6x
∂x ∂x
2
∂f ∂ f
= −6xy = −6x
∂ ∂y 2
Entonces
∆f = 0.

Definición 2.7.10 Una función escalar cuyo Laplaciano es cero, esto es ∆f =


0, se llama función armónica.

2.7.8. Fórmula de Taylor de orden dos para campos es-


calares
Teorema 2.7.7 Sea f un campo escalar con derivadas de orden dos continuas
en una bola Br (−

a ). Entonces para todo y ∈ Rn tal que −

a +− →
y ∈ Br (− →
a ),
tenemos que
1→ −
f (−

a +−

y ) = f (−

a ) + ∇f (−
→ y + −
a)·−
→ y H(→
a + c−

y )−

y |, 0 < c < 1,
2!
donde H es la matríz Hessiana de f . También podemos escribir
1→ −
f (−

a +−→
y ) = f (−

a ) + ∇f (−

a)·−

y + − y H(→
a )−

y | + k−

y k E2 (−

a ;−

y ),
2!
donde lı́m E (−

− 2

a ;−
→y ) = 0.


y→0

Demostración. Fijemos −

y ∈ Rn . Definamos la función

g(t) = f (−

a + t−

y ), 0 ≤ t ≤ 1.

80
Claramente g(0) = f (a) y g(1) = f (−

a +−

y ). Por lo tango f (−

a +−

y ) − f (−

a)=
g(1) − g(0).
Como g es una función real, aplicamos la fórmula de Taylor de orden 2 en el
intervalo [0, 1]. Así́

1 00
g(1) = g(0) + g 0 (0) + g (c), 0<c<1
2!
(Resultado de Cálculo I).
Aplicando regla de la cadena a g tenemos que

∂f (−

a + t−

n
y)
∇f (−

a + t−

y )·−

X
0
g (t) = y = yi
∂xi
i=1
∂f (−

a + t−

y) ∂f (−

a + t−

y) ∂f (−

a + t−

y)
= y1 + y2 + · · · + yn
∂x1 ∂x2 ∂xn

Así́ g 0 (0) = ∇f (− → a)·− →y.


Calculamos la segunda derivada de g aplicando nuevamente regla de la cadena

∂f (−→a + t−→ ∂f (−
→a + t−→
   
y) − y) −
g 00 (t) = ∇ ·→ y y1 + ∇ ·→y y2 + · · · +
∂x1 ∂x2
 −
→ −

∂f ( a + t y ) −

∇ ·→ y yn
∂xn
 2 −
∂ f (→ a + t−→ ∂ 2 f (−
→a + t−→ ∂ 2 f (−
→a + t−→ 
y) y) y)
= y1 + y2 + · · · + yn y1
∂x21 ∂x2 ∂x1 ∂xn ∂x1
 2 −
∂ f (→ a + t−
→ ∂ 2 f (−

a + t−→ ∂ 2 f (−

a + t−→ 
y) y) y)
+ y1 + y2 + · · · + yn y2
∂x1 ∂x2 ∂x22 ∂xn ∂x2
..
. 
∂ 2 f (−
→a + t−
→ ∂ 2 f (−

a + t−→ ∂ 2 f (−

a + t−→ 
y) y) y)
+ y1 + y2 + · · · + y n yn .
∂x1 ∂xn ∂x2 ∂xn ∂x2n

∂ 2 f (−

a + t−

n X
n
y)
yi yj = −

y H(−

a + c−

y )−

X
00
g (t) = y |.
i=1 j=1
∂xi ∂xj

Así́,
g 00 (c) = −

y H(−

a + c−

y )−

y |.
y por lo tanto así́ demostramos que

1→ −
f (−

a +−

y ) = f (−

a ) + ∇f (−
→ y + −
a)·−
→ y H(→
a + c−

y )−

y |, 0 < c < 1.
21

81
Para demostrar la segunda parte, definamos
1− −

k−

y k E2 (−

a ;−

y)= →
y [H(−

a + c−

y ) − H(a)] −

y |, −
→ 6 0
y =
21
y


E2 (−

a; 0)=0 .
En este caso tenemos que
1 →| −
f (−

a +−→
y ) = f (−

a ) + ∇f (−

a)·−→y + − y H(→
a )−

y + k−

y k E2 (−

a ;−

y ).
2!
Vamos a mostrar que lı́m E (−


→a ;→

y ) = 0.
2


y→0

n  2 − → −
→ 2 − →
n X
X 
∂ f ( a + t y ) ∂ f ( a )
k−

y k |E2 (−

a ;−

2
y )| = − yi yj

i=1 j=1 ∂xi ∂xj ∂xi ∂xj
n X n
∂ 2 f (−

a + t− →
y ) ∂ 2 f (− →

X a ) − → 2
≤ − k y k .
i=1 j=1
∂x i ∂xj ∂x i ∂x j

Así́ dividiendo por k−→


y k 6= 0 tenemos que
n 2 −
n X
∂ f (→
a + t−y ) ∂ 2 f (−
→ →
a )
|E2 (−

a ;−

X
y )| ≤ − .
i=1 j=1
∂xi ∂xj ∂xi ∂xj

puesto que ∂2f


∂xi ∂xj son continuas en −

a , entonces

∂ 2 f (−

a + t−→
y) ∂ 2 f (−

a)
lı́m→

=


y→0 ∂xi ∂xj ∂xi ∂xj

Por lo tanto lı́m→



|E2 (−

a ;−

y )| = 0 y esto implica que lı́m→

E2 (−

a ;−

y)=0.


y→0 →

y→0

2.7.9. Naturaleza de un punto crítico teniendo como cri-


terio los valores propios de la matriz Hessiana


Si −

a es un punto crítico de f tenemos que ∇f (a) = 0 . En este caso
1 →| −
f (−

a +−

y ) = f (−

a)+ − y H(→
a )−

y + k−

y k E2 (−

a ;→

y ).
2!
Teorema 2.7.8 Sea A = (aij ) una matriz n × n y simétrica. Supongamos que
n Pn
Q(y) = −

y A−

y>=
P
a y y . Entonces
ij i j
i=1 j=1

82


1. Q(−

y ) > 0 ∀−
→ 6 0 ⇐⇒los valores propios de A son positivos.
y =


2. Q(−

y ) < 0 ∀−
→y 6= 0 ⇐⇒los valores propios de A son negativos.

Demostración. Por ser A una matriz simétrica, A es diagonalizable, esto es ex-


iste una matriz P ortogonal (P > = P ) tal que P T AP = D = diag(λ1 , λ2 , · · · , λn )
donde λi i=1,...,n son valores propios de A los cuales son reales. Haciendo
y = xP > , tenemos
n
Q(y) = −

y A−

y > = xP > AP −

x > = xD−

X
x> = λi x2u
i=1


→ → − →
Claramente ∀−→y 6= 0 , − x 6= 0 . Si los valores propios de A son positivos entonces


Q(y) > 0. Ahora si Q(y) > 0 ∀− →y 6= 0 , tenemos en particular que si y = ei P > ,
donde ei = (0, · · · , 1, · · · 0) es el k-esimo vector unitario de la base usual tenemos
que Q(y) = λi > 0.
La parte (2) se prueba de manera similar.

Teorema 2.7.9 Sea f un campo escalar con derivadas de orden dos continuas
en una bola Br (−

a ). Sea H(−

a ) la matriz Hessiana en un punto estacionario

→a . Entonces:

1. Si todos los valores propios de H(−



a ) son positivos entonces f tiene un


mínimo relativo en a .
2. Si todos los valores propios de H(−

a ) son negativos entonces f tiene un
máximo relativo en a .−

3. Si H(−
→a ) tiene valores propios negativos y positivos entonces f tiene un
punto silla en −→
a.


Demostración. sea Q(y) = − →
y H(−

a )−
→y > y puesto que ∇f (a) = 0 , tenemos
que
1 →| −
f (−

a +−→ a)= −
y ) − f (−
→ y H(→ a )−

y + k−→
y k E2 (−

a ;−

y ).
2!
donde lı́m→

E2 (−

a ;−
→y ) = 0 . Vamos a mostrar que existe r > 0, tal que


y→0
0 < k− →y k < r, talque f (− →a +−→y ) − f (−

a ) tiene el mismo signo que Q(y).
Supongamos que los valores propios de H(− →a ) son positivos λ1 , λ2 , · · · , λn .Si
h = mı́n{λ1 , λ2 , · · · , λn } y 0 < t < h entonces λ1 − t, λ2 − t, · · · , λn − t son
también positivos. Estos son los valores propios de H(− →
a ) − tI, siendo I la ma-
triz idéntica n × n. Por lo tanto la forma cuadrática − →
y (H(− →a ) − tI) − →y> > 0

→ −

∀ y 6= 0 de acuerdo al teorema anterior. Por lo que concluimos que


y H(−

a )−

y > > t k−

yk
2
∀0 < t < h.

83


Tomando t = 12 h tenemos Q(y) > 21 h k−

y k ∀−
2 →
y 6= 0 . Puesto que lı́m→

E2 (−

a ;−

y)=


y→0
0, existe r > 0 tal que |E2 (−

a ;−
→y )| < 41 h con tal que 0 < k−

y k < r. Para tales


y tenemos
1 1
0 ≤ k−
→y k E2 (−

a ;→

y ) < h < Q(y).
4 2
Esto demuestra que
1
f (−

a +−→y ) − f (−

a ) ≥ Q(y) − k− →
y k E2 (−

a ;−

y)>0
2
Por consiguiente f tiene un mínimo relativo en − →
a.
En la misma forma se prueba (2).
Para mostrar (c) supongamos que λ1 y λ2 son valores propios de H(− →a ) con
signos opuestos. Sea h = mı́n{|λ1 | , |λ2 |}, para 0 < t < h entonces λ1 − t, λ2 − t
son valores propios de H(− →a ) − tI de signos opuestos. Por lo tanto La for-
ma cuadrática y (H( a ) + tI)−

→ −
→ →y | toma valores positivos en una vecindad


de a . Nuevamente, puesto que lı́m→ E2 (−
→a ;−

y ) = 0, existe r > 0 tal que

− −
y→0
|E2 (−
→ y )| < 41 h con tal que 0 < k−
a ;−
→ →
y k < r. Para tales −
→y tenemos que el signo

→ −
→ −

de f ( a + y ) − f ( a ) es el mismo que el de Q(y). Entonces tenemos en la
vecindad de − →a valores positivos y negativos de f. por lo tanto f tiene un punto


silla en a .

2.7.10. Criterio para determinar extremos de funciones


de dos variables
Teorema 2.7.10 [Condiciones suficientes para los extremos] Supón-
gase que f (x, y) tiene segundas derivadas parciales continuas en una vecindad
∂ 2 f (−
→a) ∂ 2 f (−

a) ∂ 2 f (−

a)
de −

a y que ∇f (− →
a ) = 0. Sea A = , B = , C = y
∂x2 ∂x∂y ∂y 2
 

→ A B
H( a ) =
B D

y D = det(H(−

a )). Entonces

∂ 2 f (−
→a)
1. Si D > 0 y 2
> 0, entonces tiene un mínimo relativo en −

a.
∂x
∂ 2 f (−
→a)
2. Si D > 0 y < 0, entonces tiene un máximo relativo en −

a.
∂x2
3. Si Si D < 0, entonces tiene un punto silla en −→a.
4. Si D = 0, el criterio no decide nada.

84
Demostración. Para calcular los valores propios de la matriz Hessiana, hal-
lamos la ecuación característica det(λI − H(− →a )) = 0, teniendo la ecuación en
λ,
λ2 − (A + C)λ + D = 0
donde D = det(H(− →a )). Los valores propios λ y λ están ligados por la relación
1 2

λ1 + λ2 = A + C y λ1 λ2 = D.

Claramente si D > 0 entonces ambos valores propios son positivos o negativos.


Como D = AC − B 2 y D > 0 entonces AC > B 2 ≥ 0. Entonces A y C tienen
el mismo signo. Por lo tanto si A es positivo entonces C es positivo y esto
implicaríáa que λ1 y λ2 serían positivos y por lo tanto −
→a es un punto mínimo
de f. Similarmente si A es negativo entonces C es negativo y esto implicaría que
λ1 y λ2 serían negativos y por lo tanto −

a es un punto máximo de f. En forma
similar se demuestra (3). D < 0, entonces los valores propios de H(a)serían de
signo opuesto y por lo tanto f tiene un punto silla en −
→a.

2.7.11. Ley de la conservación de la energía. Campos con-


servativos
Definición 2.7.11 Sea U un abierto de <n . Un campo vectorial sobre U,
se dice que es un campo conservativo si existe una campo escalar ϕ talque


F = −∇ϕ. A la función ϕ se le llama energíá potencial

Supongamos que una partícula de masa m se desplaza a lo largo de una curva


−−→
derivable r(t) y supongamos que la partícula cumple la segunda ley de Newton:
−−→ −−− →
F (r(t)) = mr00 (t)
−−→ −

para todo t donde r(t) esté definido. Por ser F un campo conservativo tenemos
que
−−−→ −−→ −−−→ −−→
F (X) = mr00 (t) = −∇ϕ(r(t)) =⇒ mr00 (t) + ∇ϕ(r(t)) = 0.
Multiplicando escalarmente esta última ecuación tenemos que
−−−→ −−→ −−→ −−→
mr00 (t) · r0 (t) + ∇ϕ(r(t)) · r0 (t) = 0

Observando que
1 dv 2 (t) −−−→ −−→
m = mr00 (t) · r0 (t)
2 dt
y
−−→
dϕ(r0 (t)) −−→ −−→
= ∇ϕ(r(t)) · r0 (t),
dt

85
tenemos que
−−→
 
d 1
mv 2 (t) + ϕ(r0 (t)) = 0
dt 2
−−→
De lo cual concluimos que la función 12 mv 2 (t) + ϕ(r0 (t)) es una constante.
Este resultado se conoce como la ley de la conservación de la energía.
−−→
La función 12 mv 2 (t) se le llama la energía cinética y a la función ϕ(r0 (t))
energía potencia. Por lo tanto la ley de la conservación dice que la suma de
la energía cinética y potencial es una constante.

Observemos que si el dominio de definición de la curva es [a, b] , tenemos por


la ley de la conservación de la energía que
1 −−→ 1 −−→
mv 2 (b) + ϕ(r0 (b)) = mv 2 (a) + ϕ(r0 (a))
2 2
O sea que la diferencia de la energía cinética es igual a la diferencia de la energía
potencial, esto es
1 1 −−→ −−→
mv 2 (b) − mv 2 (a) = ϕ(r0 (a)) − ϕ(r0 (b))
2 2
La mayor parte de los campos de la física clásica son conservativos.Por ejem-
plo consideremos una fuerza que es inversamente proporcional al cuadrado de
la distancia del punto al origen y que tiene la dirección del vector posición.
Entonces existe una constante C tal que


→− 1 −

x
F (→
x)=C −
→ 2 k−

kxk xk


ya que x
es un vector unitario en la dirección de −

x . Así
k→

xk


→− 1 −
F (→
x)=C −


3 x.
kxk

Una función potencial para F es dada por


C
ϕ(−

x)=− −→
|| x ||

lo cual puede demostrarse calculando las derivadas parciales.

86
Capítulo 3

Integrales Múltiples

3.1. Integrales Dobles


Vamos a considerar una función de dos variables f : S ⊂ R2 → R. Subdivi-
damos la región S en N subregiones S1 , S2 , ....SN donde cada una de ellas está
acotada por una curva simple cerrada suave a trozos y de área ∆Ak = área(Sk ).
en donde (xk , yk ) es cualquier punto en la subregión Sk .

Denotemos por dk el diámetro de la región Sk ( la mayor distancia entre dos


puntos cualesquiera en Sk ) y por norma de la partición

||P || = max1≤k≤N {dk }.

Formemos la suma
N
X
f (xk , yk )∆Ak
k=1

87
RDefinición
R 3.1.1R R.Definimos la integral doble de f sobre S, denotada por
S f (x, y)dA ó S f (x, y)dxdycomo

Z Z N
X
f (x, y)dA = lim||P ||→0 f (xk , yk )∆Ak
S k=1

si el límite existe y es independiente de las particiones {Sk } y de los puntos


{(xk , yk )}.

Puede mostrarse que si f es acotada y continua en S, f será integrable, es decir


la integral existe.

Nota. Frecuentemente se subdivide S mediante rectas paralelas a los ejes co-


ordenados. Puede darse el caso donde hayan subregiones no rectangulares. Sin
embargo la partición puede hacerse tan fina que estas subregiones pueden des-
preciarse y puede mostrarse que la suma de estas regiones es despreciable. En
este caso el área de cada subrectángulo es ∆xi ∆yj y se tiene que
Z Z n X
X m
f (x, y)dxdy = lim||P ||→0 f (xi , yj )∆xi ∆yj
S i=1 j=1

Observemos que hemos reemplazado dA por el símbolo dxdy.

Nota. Si f (x, y) = 1 tenemos que


Z Z Z Z
Área(S) = dA = dxdy
S S

3.1.1. Propiedades de la Integral doble

Se puede demostrar que la integral cumple las mismas propiedades de la inte-


gral unidimensional como son:

1.
RR RR RR
S [c1 f (x, y) + c2 g(x, y)]dxdy = c1 S f (x, y)dxdy + c2 S g(x, y)dxdy

2. Si S = S1 ∪ S2 y S1 ∩ S2 = φ, entonces
Z Z Z Z Z Z
f (x, y)dxdy = f (x, y)dxdy + f (x, y)dxdy
S S1 S2

88
3. si f ≤ g entonces
Z Z Z Z
f (x, y)dxdy ≤ g(x, y)dxdy
S S

En particular si f ≥ 0 entonces
Z Z
f (x, y)dxdy ≥ 0
S

El siguiente teorema nos permite calcular las integrales de funciones continuas


en términos de las integrales unidimensionales en el rectángulo S = [a, b] × [c, d]

Teorema 3.1.1 Sea f : S = [a, b] × [c, d] → R. Si f es continua entonces


! !
Z Z Z b Z d Z d Z b
f (x, y)dxdy = f (x, y)dy dx = f (x, y)dx dy
S a c c a

Nota. Esta forma de calcular la integral doble se le llama cálculo de la integral


doble en forma iterada.

3.1.2. Integración en regiones más generales


Consideraremos dos tipos de regiones.

Región tipo I.

Está descrita por el conjunto

S = {(x, y) : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x)}

esto es, la región acotada a izquierda y derecha por líneas rectas y arriba y
abajo por las funciones φ2 (x) y φ1 (x) como se muestra en la figura abajo.

89
En este caso las integrales iteradas toman la forma
!
Z Z Z b Z φ2 (x)
f (x, y)dxdy = f (x, y)dy dx
S a φ1 (x)

Región tipo II.

Está descrita por el conjunto

S = {(x, y) : c ≤ y ≤ d, φ1 (y) ≤ x ≤ φ2 (y)}

esto es, la región acotada arriba y abajo por lineas rectas horizontales y a
izquierda y a derecha por las funciones φ1 (y) y φ2 (y) como se ve esquematizado
en la gráfica abajo.

90
En este caso, las integrales iteradas toman la forma
!
Z Z Z d Z φ2 (y)
f (x, y)dxdy = f (x, y)dx dy
S c φ1 (y)

Una región puede ser al mismo tiempo de tipo I ó tipo II. Por ejemplo, la región
que se muestra en la figura abajo.

De tipo I se describe en la forma

S = (x, y) : 0 ≤ x ≤ 1, x2 ≤ y ≤ x


y de tipo II en la forma

S = {(x, y) : y ≤ x ≤ y, 0 ≤ y ≤ 1}

3.1.3. Cálculo de integrales dobles: áreas y volúmenes.

1. Sea S = {(x, y) : a ≤ x ≤ b φ1 (x) ≤ y ≤ φ2 (x)}. Si hacemos f (x, y) = 1 para


todo (x, y) ∈ S tenemos que
Z Z Z b Z φ2 (x) Z b Z b
φ (x)
dxdy = [ dy]dx = [y|φ21 (x) ]dx = [φ2 (x) − φ1 (x)]dx
S a φ1 (x) a a

Así, el área de S está dada por


RR
S dxdy.
2. Sea f > 0 y continua en S. Supongamos que S es de tipo I y consideremos
el sólido limitado por la gráfica de z = f (x, y) y por la región S. Claramente
Z φ2 (x)
f (x, y)dy
φ1 (x)

representa el área de la sección transversal que se obtiene al cortar el sólido


por un plano paralelo al plano yz. (Ver figura).

91
Por lo tanto podemos definir el volumen del sólido como
Z b Z φ2 (x) Z Z
V ol(Sol) = [ f (x, y)dy]dx = f (x, y)dxdy
a φ1 (x) S

El mismo razonamiento para regiones de tipo II. En general si f (x, y) ≤ g(x, y)


la integral
Z Z
[g(x, y) − f (x, y)]dxdy
S

representa el volumen del sólido limitado entre las dos superficies.

Ejemplo 3.1.1 Calcular el volumen del sólido limitado por la esfera

x2 + y 2 + z 2 = R2

Solución.
p El sólido está comprendido
p entre las gráficas de z = f (x, y) =
R − x − y y z = g(x, y) = − R − x2 − y 2 . La región S = (x, y) : x2 + y 2 ≤ R2 .

2 2 2 2

RR RR
V ol (V ) = S [f (x, y) − g(x, y)]dxdy = 2 S f (x, y)dxdy
R R R √R2 −x2 p
=8 0 [ 0 R2 − x2 − y 2 dy]dx
√ p
Hagamos A = R2 − x2 o sea A2 = R2 − x2 por lo tanto r2 − x2 − y 2 =
y 2
p p
A2 − y 2 = A 1 − ( A ) . Si hacemos el cambio de variable y = asenθ en-

92
tonces dy = a cos θdθ y obtenemos
Z Z
V ol(V ) = 2 f (x, y)dxdy
S
Z R Z √R2 −x2 p
" # Z R
"Z √
R2 −x2 p
#
= 8 R2 − x2 − y 2 dy dx = 8 A2 − y 2 dy dx
0 0 0 0
"Z #
Z R π/2 p
2
= 8 A 1 − sen θ cos θdθ dx
2
0 0
π/2
R π ZR Zπ/2
1 − cos 2θ 1
Z Z
= 8 [ A2 cos2 θdθ]dx = 8 A2 = θ dx
0 0 2 2
0 0
0
R R
π 2 π
Z Z
= 8 A dx = 8 (R2 − x2 )dx
0 4 4 0
R
x3 R3 2 4
= 2π (R x − ) = 2π(R3 −
2
) = 2π R3 = πR3 .
3 0 3 3 3
Ejemplo 3.1.2 . Dibujemos la región de integración de
Z 1Z x
[ f (x, y)dy]dx
0 x2
La región de integración está dada por
S = (x, y) : 0 ≤ x ≤ 1, x2 ≤ y ≤ x

Observemos que la región S puede ser descrita por



S = {(x, y) : y ≤ x ≤ y, 0 ≤ x ≤ 1}
Así, la integral la podemos escribir como
Z 1Z x Z 1Z √
y
[ f (x, y)dy]dx = [ f (x, y)dx]dy
0 x2 0 y

93
A este cambio en los limites de integración se le conoce como cambio en el orden
de integración (invertir el orden de integración), lo que puede hacerse cuando
la región es de los dos tipos al mismo tiempo. Muchas veces integrales que no
podemos calcular en un orden determinado, podemos resolverla invirtiendo su
orden como se puede ver en el ejemplo a continuación:

Ejemplo 3.1.3 Evaluar la integral


Z 6Z 2 p
[ x y 3 + 1dy]dx
0 x/3

La región de integración es de tipo I:


S = (x, y) : 0 ≤ x ≤ 6, x/3 ≤ y ≤ 2

p
Observemos que la integral y 3 + 1 no tiene antiderivada elemental. Como S
también es de tipo II, podemos invertir el orden de integración y obtenemos la
descripción
S = {(x, y) : 0 ≤ y ≤ 2, 0 ≤ x ≤ 3y}
Así la integral la podemos expresar como
Z 6Z 2 p Z 2 Z 3y p Z 2 p Z 3y
[ x y 3 + 1dy]dx = [ x y 3 + 1dx]dy = y 3 + 1[ xdx]dy
0 x/3 0 0 0 0
2 Z 2
x2 3y 9 2p 3
Z p
= 3
y + 1[ |0 ]dy = y y + 1dy
0 2 0 2
2
= (y 3 + 1)3/2 = 27 − 1 = 26

0

94
3.1.4. Cambio de variable

En el caso de la integral de una variable, el método de sustitución nos permitía


transformar la integral a una integral más simple. Recordemos que si tenemos
Rb
que resolver la integral a f (x)dx y hacemos un cambio de variable x = g(t)
de tal manera que la función sea diferenciarle, tenemos que dx = g 0 (t)dt y el
cambio de variable lo escribimos como
Z b Z g−1 (b)
f (x)dx = f (g(t))g 0 (t)dt
a g−1 (a)

En el caso de dos dimensiones tenemos un resultado similar. Sin entrar en mu-


chos detalles, consideremos un campo vectorial T : R2 → R2 que transforma un
conjunto cerrado U en un conjunto Ω, esto es T : U → Ω es uno a uno y sobre.
Denotando T (u, v) = (x(u, v), y(u, v)) y asumiendo que T es diferenciable, di-
remos que T define un cambio de variables de las variables (u, v) a las variables
(x, y). Escribiendo x = x(u, v), y = y(u, v) consideramos la matriz
 ∂x ∂y 
∂(x, y)
= [∇x∇y] = ∂u ∂x
∂u
∂y
∂(u, v) ∂v ∂v

llamada matriz Jacobiana, que jugará un papel importante más adelante.


 Su

∂(x,y)
determinante es llamado el Jacobiano de T , denotado JT (u, v) ó det ∂(u,v) .

Ejemplo 3.1.4 (Coordenadas Polares) Recordemos que otro sistema de coor-


denadas en el plano además de las coordenadas cartesianas (x, y) de un punto
−−→

P son las coordenadas polares del punto P definidas por (r, θ) donde r = OP ,
−−

distancia del origen al punto P y θ es el ángulo entre el vector OP y el eje x,
medido en el sentido positivo ( o dirección contraria a las manecillas del reloj)
desde 0 a 2π. Esto es p
r = x2 + y 2
y hallamos θ tal que
y
,
tan θ =
x
donde si y > 0, entonces θ se toma 0 ≤ θ ≤ π y si y < 0, entonces θ se toma
π < θ ≤ 2π. Si x = 0 y y > 0 se toma θ = π2 . Si x = 0 y y < 0 se toma
θ = 3π
2 . Recíprocamente si un punto P está dado en coordenadas polares (r, θ),
entonces las coordenadas cartesianas de P (x, y) están dadas por

x = r cos θ
y = rsenθ.

95
Observemos que también podríamos escoger en lugar del intervalo [0, 2π) para
los valores de θ, cualquier intervalo de longitud 2π. Otro intervalo que se utiliza
también es el intervalo (−π, π) .

Definamos la función
(x, y) = T (r, θ) = (r cos θ, rsenθ)
como un cambio de coordenadas polares a las coordenadas cartesianas. Ob-
servemos que en este caso la matriz Jacobiana está dada por
sen θ
 
∂(x, y) cos θ
=
∂(r, θ) −rsen θ r cos θ

sen θ
 
cos θ
y su Jacobiano está dado por J = det = r.
−rsen θ r cos θ
La función T transforma regiones rectangulares en el plano r − θ en regiones
circulares en el plano x − y.
Ejemplo 3.1.5 La región rectangular para a > 0
U = {(r, θ) : 0 ≤ r ≤ a, 0 ≤ θ < 2π}
se transforma en la región
S = Br (a) = (x, y) : x2 + y 2 ≤ a2 .


Ejemplo 3.1.6 La región rectangular para a > 0


U = {(r, θ) : a ≤ r ≤ b, 0 ≤ θ < 2π}
se transforma en la región
S = Br (a) = (x, y) : a2 ≤ x2 + y 2 ≤ b2 .


96
3.1.4.1. La fórmula del cambio de variable
Consideremos el cambio de variable

x = h1 (u, v)
(u, v) ∈ U
y = h2 (u, v)
donde asumimos que las funciones h1 , h2 son campos escalares continuos y
diferenciables y tal que a cada punto (x, y) ∈ S está en correspondencia 1-1
con los puntos (u, v) de U y además la curva que limita a U se envía en la
curva que limita a S. Esto lo podemos definir más concretamente definiendo


el campo vectorial F : U → S dado por


F (u, v) = (h1 (u, v), h2 (u, v))


tal que F es un campo invertible es decir existe

→−1
F : S → U.

Si particionamos la región U en rectángulos pequeños de longitud ∆u, ∆v, las


imágenes de estos rectángulos serán pequeños paralelogramos curvilíneos en la
región S.

97
En la gráfica abajo vemos un zoom de este pequeño rectángulo y su correspon-
diente imagen curvilínea.

Al rectángulo Ti,j en el plano uv le corresponde la región curvilínea Ri,j en el


plano xy. Hallemos la relación entre el área del rectángulo Ti,j con el área de
Ri,j .

Área de Ti,j = A(Ti,j .) = ∆u∆v


−−−→ −−−→
Área a de Ri,j = A(Ri,j ) ≈ Q1 Q2 × Q1 Q4

Calculando aproximadamente las coordenadas de los puntos Q1 , Q2 , Q4 usando


diferenciales y teniendo en cuenta que P1 = (u, v), P2 = (u + ∆u, v), P4 =
(u, v + ∆v) y


Q1 = (x1 , y1 ) = F (u, v) = (h1 (u, v), h2 (u, v))


Q2 = (x2 , y2 ) = F (u + ∆u, v) = (h1 (u + ∆u, v), h2 (u + ∆u, v))


Q4 = (x4 , y4 ) = F (u, v + ∆v) = (h1 (u, v + ∆v), h2 (u, v + ∆v))

Usando diferenciales, (ver sección 2.3.4), los puntos x2 , y2 los podemos aproxi-
mar por

∂h1 ∂h1
x2 = h1 (u + ∆u, v) ≈ h1 (u, v) + (u, v)∆u = x1 + (u, v)∆u
∂u ∂u
∂h2 ∂h2
y2 = h2 (u + ∆u, v) ≈ h2 (u, v) + (u, v)∆u = y1 + (u, v)∆u
∂u ∂u
Así
∂h1 ∂h2
Q2 ≈ (x1 + (u, v)∆u, y1 + (u, v)∆u)
∂u ∂u

98
Haciendo lo mismo con el punto Q4 tenemos
∂h1 ∂h2
Q4 ≈ (x1 + (u, v)∆v, y1 + (u, v)∆v).
∂v ∂v
Ahora
−−−→
 
∂h1 ∂h2
Q1 Q2 = Q2 − Q1 ≈ (u, v)∆u, (u, v)∆u
∂u ∂u
−−−→
 
∂h1 ∂h2
Q1 Q4 = Q4 − Q1 ≈ (u, v)∆v, (u, v)∆v
∂v ∂v
y
∂h1 ∂h1


−−−→ −−−→ →

Q1 Q2 × Q1 Q4 ≈ ∆u∆v ∂u ∂v
∂h2 ∂h2 k.
∂u ∂v

Denotemos este determinante por


∂h1 ∂h1


J(u, v) = ∂u ∂v .
∂h2 ∂h2
∂u ∂v

Es llamado el Jacobiano del cambio de variable.


Ahora, el área
−−−→ −−−→
Área a de Ri,j = área(Ri,j ) ≈ Q1 Q2 × Q1 Q4

≈ ∆u∆v |J(u, v)| = |J(u, v)| área(Tij )

Para calcular f (x, y)dxdy tenemos que


RR

Z SZ XX
f (x, y)dxdy ≈ f (xi , yj ).(área(Ri,j )) ≈
S
PP
≈ f (h1 (ui , vj ), h2 (ui , vj )) |J(u, v)| área(Tij )

Tomando el límite cuando ∆u, ∆v → 0 se tiene que


Z Z Z Z
f (x, y)dxdy = f (h1 (u, v), h2 (u, v))|J(u, v)|dudv
S U

Esta fórmula es conocida como la fórmula de cambio de variable para las inte-
grales dobles.

Ejemplo 3.1.7 En coordenadas polares tenemos

x = r cos θ, y = rsenθ

99
En este ejemplo r, θ hacen el papel de las variables u, v. Si r > 0 y 0 ≤ θ ≤ 2π
tenemos una aplicación 1-1 y sobre. El Jacobiano de la transformación está
dado por

cos θ sen θ
∂(x, y)
J(r, θ) = = |∇x ∇y| = =r
∂(r, θ) −rsen θ

r cos θ

entonces en el cambio a coordenadas polares tenemos que


Z Z Z Z
f (x, y)dxdy = f (r cos θ, rsenθ)rdrdθ.
S T

Ejemplo 3.1.8 Calcular


Z Z p
a2 − x2 − y 2 dxdy
S

 √
donde S = (x, y); 0 ≤ x ≤ a, 0 ≤ y ≤ a2 − x2 . Al hacer el cambio a coor-
denadas polares, tenemos que la región T que se transforma en S por dicho
cambio es T = {(r, θ) : 0 ≤ r ≤ a, 0 ≤ θ ≤ π/2}y la integral se transforma en

Z Z p Z a pZ π/2 Z ap
a2 − r2 rdrdθ = [ a2 − r2 rdθ]dr = π/2 a2 − r2 rdr
T 0 0 0
a
−(a2 − r2 )3/2 π 3
= π/2 = 6a
3 0

Si multiplicamos este resultado por 8 obtenemos el volumen de la bola igual a


4 3
πa .
3

Ejemplo 3.1.9 Calcular


Z Z
y−x
e y+x dxdy
S

donde S es la región limitada por la recta x + y = 2 y los ejes coordenados.


Definamos el cambio de variable u = y − x y v = y + x. Resolviendo para x y
y obtenemos x = v−u u+v
2 y y = 2 (ver figura)

100
Hallando el Jacobiano tenemos que J(u, v) = 1/2 Así la integral la podemos
resolver en la forma
u 1 1 2 v u 1 2 u v
Z Z Z Z Z Z Z
y−x
e y+x dxdy = e dudv =
v e dudv =
v ve v |−v dv
S T 2 2 0 −v 2 0
1 2 1 1
Z
= v(e − )dv = e −
2 0 e e

3.2. Integrales Triples


La definición de la integral doble se puede generalizar casi sin cambios a n-
dimensiones, en particular, para n = 3, si f es continua definida en una región
V del espacio R3 acotada por una superficie cerrada tenemos que
Z Z Z N
X
(x, y, z)dV = lim||P ||→0 f (xk , yk , zk )∆Vk
V k=1

En donde ∆Vk representa el volumen de cada subregión Vk del sólido V. Como


en el caso de integrales dobles a veces se usa en lugar de dV el símbolo dxdydz.
El siguiente teorema nos permite calcular las integrales de funciones continuas
en términos de las integrales unidimensionales en el cubo V = [a, b] × [c, d] ×
[e, f ].
Teorema 3.2.1 Sea f : V = [a, b]×[c, d]×[e, f ] → R. Si f es continua, entonces
! !
ZZZ Z Z b
Z d f
f (x, y, z)dV = f (x, y, z)dz dy dx.
V a c e

Nota. En este teorema en particular, no importa el orden en el cual in-


tegremos, es decir, la integral triple puede calcularse también en el orden
R b R f R d 
a e c
f (x, y, z)dy dz dx ó en cualquier otro.

101
3.2.1. Regiones más generales
Consideraremos tres tipos de regiones:

Región tipo I

Si el volumen V está limitado entre dos superficies z = z1 (x, y), z = z2 (x, y)


con z1 (x, y) ≤ z2 (x, y) y S es la proyección de dicho volumen al plano xy.

Entonces la integral se calcula en la forma


!
Z Z Z Z Z Z z2 (x,y)
f (x, y, z)dxdydz = f (x, y, z)dz dA.
V S z1 (x,y)

Región tipo II

Si el volumen V está limitado entre dos superficies y = y1 (x, z), y = y2 (x, z)


con y1 (x, z) ≤ y2 (x, z) y S es la proyección de dicho volumen al plano xz.

102
Entonces la integral se calcula en la forma
!
Z Z Z Z Z Z y1 (x,z)
f (x, y, z)dxdydz = f (x, y, z)dy dA.
V S y1 (x,z)

Región tipo III


Si el volumen V está limitado entre dos superficies x = x1 (y, z), x = x2 (y, z)
con x1 (y, z) ≤ x2 (y, z) y S es la proyección de dicho volumen al plano yz.

Entonces la integral se calcula en la forma


!
Z Z Z Z Z Z x1 (y,z)
f (x, y, z)dxdydz = f (x, y, z)dx dA.
V S x1 (y,z)

Nota . El volumen de la región V está dado por


Z Z Z Z Z Z
Volumen(V ) = dV = dxdydz
V V

Nota . La integral doble sobre S que aparece en el cálculo de la integral triple,


se calcula como vimos anteriormente, viendo si S es de tipo I ó tipo II. Por
ejemplo, si V es de tipo I y S es también de tipo I, se tendría la integral iterada
Z Z Z Z b Z y2 (x) Z z2 (x,y)
f (x, y, z)dxdydz = f (x, y, z)dxdydz.
V a y1 (x) z1 (x,y)

Ejemplo 3.2.1 Hallar la integral


Z Z Z
xydxdydz
V

donde V es el dominio limitado por los planos x + y + z = 1, el plano xy, y el


plano xz. Consideremos un bosquejo de este volumen y su proyección sobre el
plano xy.

103
Claramente podemos observar que la variable z está limitada por 0 ≤ z ≤ 1−x−
y. La proyección S está definida por S = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x}.
Así, la integral triple la calculamos así:
Z Z Z Z 1 Z 1−x Z 1−x−y
f (x, y, z)dxdydz = xydzdydx
V 0 0 0
Z 1 Z 1−x
= xy(1 − x − y)dydx
0 0
1
1
Z
= (1/6)x(1 − x)3 dx =
0 120

3.2.2. Cambio de variable en integrales triples.


Dado un cambio de variables x = x(u, v, w), y = y(u, v, w), z = z(u, v, w), a
un punto P (u, v, w) del espacio uvw le corresponde un punto del espacio xyz,
es decir el sistema de ecuaciones establece una correspondencia 1-1 entre los
puntos de ambos espacios. Un dominio V en el espacio uvw se corresponde
biunívocamente con un volumen T en el espacio xyz. La siguiente es la fórmula
del cambio de variable:
Z Z Z
f (x, y, z)dxdydz
Z Z ZV
= f (x(u, v, w), y(u, v, w), z(u, v, w))|J(u, v, w)|dudvdw
T
∂(x,y,z)
donde J(u, v, w) = ∂(u,v,w) = |∇x ∇y ∇z|.
Nota. Claramente si f = 1 entonces
Z Z Z Z Z Z
dxdydz = |J(u, v, w)|dudvdw
V T

lo que implica que el |J(u, v, w)| es la razón de proporción entre el volumen V


y el volumen T .
Ahora estudiaremos algunos cambios de variable importantes.

104
3.2.2.1. Coordenadas cilíndricas.

Consideremos el sistema de coordenadas (r, θ, z) como se muestra en la figura

Estas coordenadas están ligadas a las coordenadas (x, y, z) mediante las ecua-
ciones dadas por

x = r cos θ, y = rsenθ, z = z

Las coordenadas (r, θ, z) se llaman coordenadas cilíndricas del punto P ya que


x2 + y 2 = r2 .
De este sistema de ecuaciones tenemos que el Jacobiano está dado por

J(r, θ, z) = |∇x∇y∇z| = r

y la fórmula del cambio de variable se expresa en la forma

Z Z Z Z Z Z
f (x, y, z)dxdydz = f (r cos θ, rsenθ, z)rdrdθdz
V T

Ejemplo 3.2.2 Calcule la integral


Z Z Z
(x2 + y 2 )dxdydz

donde V es el volumen limitado por el casquete superior de la esfera x2 + y 2 +


z 2 = 4 y cortada por el cilindro x2 + y 2 = 1.

105
Utilizando coordenadas cilíndricas tenemos que este volumen puede verse como
p
T = (r, θ, z) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ 2π, 0 ≤ z ≤ 4 − r2

Por lo tanto la integral está dada por



Z Z Z Z 2π Z 1 Z 4−r 2
(x2 + y 2 )dxdydz = r2 rdzdrdθ
0 0 0

Z 2π Z 1 Z 4−r 2
= r3 dzdrdθ
0 0 0
2π 1

64 11 3
Z Z p
2 2
= [ r 4 − r dr]dθ = 2π( − ).
0 0 15 5

3.2.2.2. Coordenadas esféricas.


Las coordenadas esféricas (ρ, θ, ϕ) son las indicadas en la figura

y están ligadas con las coordenadas cartesianas mediante las siguientes ecua-
ciones

106
x = ρ cos θ sen ϕ, y = ρ sen θ senϕ, z = ρ cos ϕ,

con

0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π, 0 ≤ ρ ≤ a
En coordenadas esféricas, la esfera de radio a tiene ecuación ρ = a. El Jacobiano
en coordenadas esféricas está dado por

J(ρ, θ, ϕ) = |∇x∇y∇z| = −ρ2 sen ϕ

y la formula del cambio de variable toma la forma

Z Z Z Z Z Z
f (x, y, z)dxdydz = f (ρ cos θ sen ϕ, ρ sen θ senϕ, ρ cos ϕ)ρ2 sen ϕ dρ dθ dϕ
V T
p
Ejemplo 3.2.3 Hallar el volumen de la parte del cono z = x2 + y 2 inter-
sectada por la esfera x2 + y 2 + z 2 = a2 .

Z Z Z Z Z Z
V ol = dxdydz = ρ2 senφ dρ dθ dϕ
V T
donde T = (ρ, θ, ϕ) : 0 ≤ ρ ≤ a, 0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π/4 entonces
Z 2π Z a Z π/4 √ √
2 a3 2 2− 2 3
V ol = ρ senϕ dϕ dρ dθ = 2π( (1 − )= πa .
0 0 0 3 2 3

3.3. Aplicaciones de las integrales múltiples.


3.3.1. Momentos y centros de masa.
Nuestro objetivo es hallar el punto P en que una lámina plana delgada se
equilibra horizontalmente. Este punto se llama centro de masa (o centro de

107
gravedad) de la placa. Vamos a suponer inicialmente que tenemos dos masas
m1 y m2 ubicadas sobre una varilla de masa despreciable en los lados opuestos
de un fulcro (de un balancín) y a una distancia d1 y d2 respectivamente. De
acuerdo al principio de Arquímedes, la varilla se equilibra si

m1 d1 = m2 d2

Si suponemos que la varilla coincide con el eje x, con m1 y m2 ubicadas en x1


y x2 respectivamente (x1 < x2 ). Supongamos que queremos hallar su centro de
masa, x. Claramente d1 = x − x1 y d2 = x2 − x, y por consiguiente

m1 (x − x1 ) = m2 (x2 − x)
m1 x + m2 x = m1 x1 + m2 x2
m1 x1 + m2 x2
x =
m1 + m2
Los números m1 x1 y m2 x2 se conocen como momentos de las masa m1 y m2
( con respecto al origen). Es claro que el centro de masa se obtiene de sumar
los momentos y de dividir por la masa total m = m1 + m2 .

En general si tenemos un sistema de n partículas con masa m1 , m2 , ..., mn


ubicadas en los puntos x1 , x2 , ..., xn sobre el eje x., se puede demostrar que el
centro de masa del sistema está en
n
P n
P
mk xk mk xk
m1 x1 + m2 x2 + ... + mn xn k=1 k=1
x= = n = ,
m1 + m2 + ... + mn P m
mk
k=1

108
n
donde m = mk la la masa total del sistema y la suma de los momentos
P
k=1
n
mk xk se llama el momento del sistema respecto al origen. Observemos
P
M=
k=1
que en este caso podemos escribir mx = M, lo cual significa que si la masa total
se concentra en el sistema en el centro de masa x, entonces su momento sería
el mismo que el momento del sistema.

Generalizando al plano xy, consideremos n partículas con masa m1 , m2 , ..., mn


ubicadas en los puntos (x1 , y1 ), (x2 , y2 )..., (xn , yn ). Por analogía con el caso
unidimensional podemos definir el centro de masa de coordenadas (x, y) por
las fórmulas

n
P n
P
mk xk mk y k
k=1 k=1
x= y= .
m m
n n
Si escribimos My = mk xk , y Mx = mk yk , diremos que My es el
P P
k=1 k=1
momento del sistema respecto al eje y y mide la tendencia del sistema a
girar sobre el eje y y Mx es el momento del sistema respecto al eje x y
mide la tendencia del sistema a girar sobre el eje x.
Observemos que mx = My y my = Mx , lo cual implica que

m(x, y) = (My , Mx )

3.3.2. Densidad y masa.

Supongamos que tenemos una lamina delgada ocupa una región plana S. Subdi-
vidamos la región S en N subregiones S1 , S2 , ....SN donde cada una de ellas está
acotada por una curva simple cerrada suave a trozos y de área ∆Ak = area(Sk ).
en donde (xk , yk ) es cualquier punto en la subregión Sk . Denotemos por dk el
diámetro de la región Sk ( la mayor distancia entre dos puntos cualesquiera en
Sk ) y por norma de la partición definiremos

||P || = max1≤k≤N {dk}.

109
Definimos la densidad ρ(x, y) (en unidades de masa por unidad de área) en
cada punto (x, y). por
∆m
ρ(x, y) = lı́m
||P ||→0 ∆A

donde ∆m y ∆A son la masa y el área de una de las subregiones de S que


contiene a (x, y). La masa total m de la lámina la podemos aproximar por
N
X
m≈ ρ(xk , yk )∆Ak
k=1

Por lo tanto podemos definir la masa total de la lámina como


N
X Z Z
m = lı́m ρ(xk , yk )∆Ak = ρ(x, y)dxdy
||P ||→0 S
k=1

( en el caso que el límite exista).

En la misma forma como definimos la masa podemos hablar de la cantidad


total de carga eléctrica que se distribuye a través de una región plana S si
conocemos la densidad de carga σ(x, y) (en unidades de carga por unidad de
área) en el punto (x, y), entonces la carga total está dada por
Z Z
Q= σ(x, y)dxdy
S
Para buscar en centro de masa de la lámina S, (x, y) observemos que podemos
aproximar los momentos del sistema por

n
X n
X n
X
My ≈ mk xk ≈ ρ(xk , yk )∆Ak xk = xk ρ(xk , yk )∆Ak ,
k=1 k=1 k=1
Xn Xn Xn
Mx ≈ mk y k ≈ ρ(xk , yk )∆Ak yk = yk ρ(xk , yk )∆Ak .
k=1 k=1 k=1

110
Así podemos definir los momentos del sistema como

n
X Z Z
My = lı́m xk ρ(xk , yk )∆Ak = xρ(x, y)dxdy
||P ||→0
k=1 S
n
X Z Z
Mx = lı́m yk ρ(xk , yk )∆Ak = yρ(x, y)dxdy
||P ||→0
k=1 S

Por lo tanto el centro de masa está dado por

My 1 Mx 1
Z Z Z Z
x= = xρ(x, y)dxdy y y= = yρ(x, y)dxdy
m m m m
S S

donde
Z Z
m= ρ(x, y)dxdy
S
En el caso que la densidad sea constante llamaremos al centro de masa cen-
troide.
Ejemplo 3.3.1 Si la densidad de una lámina semicircular es proporcional a la
distancia desde el centro del círculo. Determine el centro de masa de la lámina.
Solución. Si consideramos la lámina como la mitad de círculo x2 +yp 2
≤ a2 . La
distancia desde un punto (x, y) del círculo al origen 2 2
p está dada por x + y .
2 2
Por lo tanto la densidad está dada por ρ(x, y) = K x + y , donde K es una
constante de proporcionalidad. Así, la masa está dada por
Z Z p
m= K x2 + y 2 dxdy
S
Para calcular esta integral hacemos un cambio de variable a coordenadas po-
lares. En este caso la región estaría dada por 0 ≤ r ≤ a y 0 ≤ θ ≤ π, y esta
integral sería

Z Z
p Z πZ a
m = 2 2
K x + y dxdy = K r rdrdθ
S 0 0
Z π Z a a
r3 Kπa3

= K dθ r2 dr = Kπ = .
0 0 3 0 3
Puesto que la lámina y la función de densidad es simétrica respecto al eje y, el
centro de masa está sobre el eje y, esto es x = 0. Puesto que

111
1 3
Z Z Z Z p
y = yρ(x, y)dxdy = 3
yK x2 + y 2 dxdy
m Kπa
Z SZ p ZSπ Z a
3 2 2
3
= y x + y dxdy = rsen θ r rdrdθ
πa3 S πa3 0 0
Z π Z a 4 a
3 a4

3 3 3 π r 3a
= 3
sen θdθ r dr = 3
− cos θ| 0 = 2 =
3 4
.
πa 0 0 πa 4
0 πa 2π

3.3.3. Momento de Inercia.

Recordemos del Capítulo I que el movimiento rectilíneo se caracteriza por que


el vector velocidad y la aceleración son vectores colineales.

−−→ →
− −−→ −

2
El vector velocidad es dado por v(t) = ddtx y la aceleración es a(t) = ddt2x . La
fuerza relacionada con la aceleración según la ley de Newton está dada por


→ 1−→
F = m−

a o −

a = F.
m
Como se muestra en la segunda fórmula, la fuerza es directamente proporcional
a la fuerza pero inversamente proporcional a la masa. Por lo tanto podemos
pensar en la masa m de la partícula, como una medida de su capacidad para
resistir la aceleración, por que si la fuerza es la misma y m aumenta, entonces

→a disminuye.

Consideremos ahora el caso de una partícula de masa m que gira alrededor de


un eje fijo

112
Recordemos que el vector posición está dado por
−−→
r(t) = r(cos θ(t), sen θ(t))
2
Sea w = dθ d θ
dt la velocidad angular (no se supones constante) y α = dt2 la
aceleración angular. Los vector velocidad y aceleración están dados por
−−→ dθ
v(t) = r (−sen θ(t), cos θ(t)) = rw(−sen θ(t), cos θ(t))
dt
y

−−→ d2 θ dθ −−→ −−→


a(t) = r 2 (−sen θ(t), cos θ(t))+r (− cos θ(t), −sen θ(t) = aT T (t)+aN N (t)
dt dt
donde
aT = rα y aN = rw.
−−→ −−→
Puesto que la fuerza es un vector dado por F (t) = ma(t) tenemos que
−−→ − → −→ −−→ −−→
F (t) = FT + FN = maT T (t) + maN N (t).
Así la fuerza tangencial está dada por

→ −−→
FT = maT T (t)
y la fuerza normal por
−→ −−→
FN = maN N (t)
El efecto rotatorio de la fuerza tangencial se mide por de momento dado por
T = kFT k r que es dado por el producto de la magnitud de fuerza tangencial
por la distancia de su línea de acción al eje. entonces

T = maT r = mr2 α

113
Si escribimos por

I = mr2

tenemos que
T = Iα.

Esta constante de proporcionalidad I se le conoce con el nombre de momen-


to de inercia (o segundo momento). I se considera que es la medida de la
capacidad del sistema para resistir la aceleración angular. (Observemos que
α = TI ).
Ampliamos el concepto de momento de inercia a una lámina con una función
de densidad ρ(x, y) que ocupa una región S. Procediendo como hicimos para
estudiar el momento del sistema (o primer momento), considerando la partición
hecha a la región podemos definir el momento de inercia alrededor del
eje x de la lámina como
n
X X Z Z
Ix = lı́m ρ(xk , yk )yk2 ∆Ak = y 2 ρ(x, y)dxdy
||P ||→0 S
||P ||→0 k=1

De manera similar,el momento de inercia alrededor del eje y de la lámina


como
n
X X Z Z
Ix = lı́m ρ(xk , yk )x2k ∆Ak = x2 ρ(x, y)dxdy
||P ||→0 S
||P ||→0 k=1

Otro momento de inercia que es interesante es el el momento de inercia


alrededor del origen, que se llama momento polar de inercia de la
lámina como

n
X n
X
mk x2k + yk2 = lı́m ρ(xk , yk ) x2k + yk2 ∆Ak
 
Io = lı́m
||P ||→0 ||P ||→0
k=1 k=1
Z Z
= (x2 + y 2 )ρ(x, y)dxdy = Ix + Iy .
S

Observemos que Io = Ix + Iy .

Ejemplo 3.3.2 Determine los momentos de inercia de Ix , Iy , Io de un disco


D con centro en el origen y frontera x2 + y 2 = a2 homogéneo con densidad
ρ(x, y) = ρ constante
Puesto que

114
Z Z Z Z Z 2π Z a
2 2 2 2
Io = (x + y )ρ(x, y)dxdy = ρ (x + y )dxdy = ρ r2 rdrdθ
D 0 0
D
Z2π Za
a4 πρa4
= ρ dθ r3 dr = 2πρ = .
4 2
0 0

Debido a la simetría del problema Ix = Iy y esto nos permite calcular Ix y Iy ,


puesto que Io = Ix + Iy . Por lo tanto

Io πρa4
=
Ix = ly =
2 4
4
Puesto que Io = πρa ρ πa2 . Entonces Io = 21 ma2 .

2 y la masa del disco es m =
Por lo tanto si incrementamos la masa o el radio, aumentamos el momento de
inercia. El momento de inercia de una rueda es lo que dificultad comenzar el
movimiento de un automóvil o detenerlo.
Las definiciones de centro de masa, momentos y momentos de inercia se extien-
den rápidamente al espacio. Si una región V es un cuerpo sólido de densidad
variable ρ(x, y, z) (=masa por unidad de volumen), la masa total está dada por
Z Z Z
m= ρ(x, y, z)dV.
V
Los momentos respectos a los diversos planos coordenados están dados por
Myz , Mxz , Mxy ; y también las fórmulas para los momentos de inercia respecto
a los diversos ejes, denotados por Ix , Iy y Iz . Estas fórmulas son
Z Z Z
Myz = xρ(x, y, z)dxdydz,
V
Z Z Z
Mxz = yρ(x, y, z)dxdydz,
Z Z ZV
Mxz = zρ(x, y, z)dxdydz
V
y

Z Z Z
Ix = (y 2 + z 2 )ρ(x, y, z)dxdydz,
V
Z Z Z
Iy = (x2 + z 2 )ρ(x, y, z)dxdydz,
Z Z ZV
IZ = (x2 + y 2 )ρ(x, y, z)dxdydz.
V

115
Además, las ecuaciones
Myz Mxz Mxy
x= , y= , z=
m m m
definen el centro de masa de un cuerpo o el centroide en el caso que ρ sea
constante.

3.3.4. Probabilidad.
Toda variable
R∞ aleatoria continua X tiene un función de densidad f (x) ≥ 0 y
tal que −∞ f (x) = 1 y la probabilidad de que X esté entre a y b se calcula por
Z b
P (a ≤ X ≤ b) = f (x)dx.
a
Cuando se tienen dos variables aleatorias continuas X y Y , la función de
densidad conjunta de X y Y es una función f de dos variables (f (x, y) ≥ 0 y
y)dxdy = 1) tal que la probabilidad de (X, Y ) esté en una región S
RR
R2 f (x,
es dada por
Z Z
P ((X, Y ) ∈ S) = f (x, y)dxdy.
S

3.3.4.1. Valores esperados


Si X es una variable aleatoria continua con una función de densidad de prob-
abilidad f , entonces su media es dada por
Z ∞
µ= xf (x)dx
−∞

Ahora si se tienen dos variables aleatorias continuas X y Y , la función de


densidad conjunta de X y Y , f, definimos la media de X y la media de Y,
conocidos como valores esperados de X y de Y como
Z ∞Z ∞ Z ∞Z ∞
µ1 = xf (x, y)dxdy, µ2 = yf (x, y)dxdy
−∞ −∞ −∞ −∞

Observemos que estos valores son parecidos a los momentos Mx , y My de una


lámina con función de densidad ρ. Realmente podemos considerar la proba-
bilidad como una masa distribuida continuamente. Observemos que la proba-
bilidad igual como calculamos la masa: integrando una función de densidad.
Puesto que la ”masa de probabilidad” es 1, la expresión para x y y muestran
que podemos considerar los valores esperados de X y de Y (µ1 y µ2 ) como las
coordenadas del ´´centro de masa´´ de la distribución de probabilidad.

116
Capítulo 4

Integrales de Línea. Áreas de


Superficies e Integrales de
Superficie

4.1. Integral de Línea


Definición 4.1.1 Sea F : Ω ⊂ Rn → Rn un campo vectorial y − →
r : [a, b] → Ω
una función vectorial regular a trozos que parametriza una curva C. Definimos
la integral de línea como

Zb
−→
Z
F · d−

r = F(−

r (t)) · r0 (t)dt.
C a

Definición 4.1.2 Sea f : Ω ⊂ Rn → R un campo escalar y − →


r : [a, b] → Ω una
función vectorial regular a trozos que parametriza una curva C. Definimos la
integral de línea con respecto a la longitud de arco como

Z Zb −→
f ds = f (−

r (t)) r0 (t) dt.

C a

Observación 4.1.1 En el caso que la curva


H C sea una curva de Jordan (curva
cerrada y simple), usaremos la notación F · d−

r.
C

→0
Observación  4.1.2 Si F(x, y, z) = (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)), r (t) =
y d−


dx dx dy
dt , dt , dt r = (dx, dy, dz) entonces

117
Zb
−→
Z
F · d−

r = F(−

r (t)) · r0 (t)dt
C a
Zb  
dx dy dz
= (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)) · , , dt
dt dt dt
a
Zb  
dx dy dz
= f1 (x, y, z) + f2 (x, y, z) +, f3 (x, y, z) dt
dt dt dt
a
Z
= f1 (x, y, z)dx + f2 (x, y, z)dy + f3 (x, y, z)dz
C

Similarmente si F(x, y) = (f1 (x, y), f2 (x, y)) F·d−



R R
r = f1 (x, y)dx+f2 (x, y)dy.
C C

Observación 4.1.3 Sea F : Ω ⊂ Rn → Rn un campo vectorial y − →r : [a, b] →


−−→
Ω una función vectorial regular a trozos que parametriza una curva C y T (t)
−−→ − − →
−− →

r 0 (t) 0
es el vector tangente unitario dado por T (t) = − −→ (con r (t) 6= 0). Clara-
0
r (t)


mente F · T es un escalar entonces tenemos que

Zb

→ −−→ −→
Z
F (−


F · T ds = r (t)) · T (t) r0 (t) dt
C a
Zb
−−→
Z
= F (−

r (t)) · r0 (t)dt = F · d−

r
a C


Ejemplo 4.1.1 Sea F(x, y) = y, x3 + y . Calcular las integral de línea


desde el punto (0, 0) al punto (1, 1) a lo largo de la curva −



r (t) = (t, t) 0 ≤ t ≤ 1

→ 2 3

y de la curva β (t) = t , t .

118
(1,1) Z1
−→
Z
F · d−

r = F(−

r (t)) · r0 (t)dt
(0,0) 0

Z1 √
= ( t, t3 + t) · (1, 1)dt
0
Z1
√ 17
= ( t + t3 + t)dt =
12
0

Ahora

(1,1) Z1

→ −
→ −−→
Z
F·dβ = F( β (t)) · β 0 (t)dt
(0,0) 0

Z1
= (t3/2 , t6 + t3 ) · (2t, 3t2 )dt
0
Z1
59
= (2t5/2 + 3t8 + 3t5 )dt =
52
0

Observemos de estas dos integrales de línea que la integral depende del camino
que escojamos para ir del punto (0, 0) al punto (1, 1).

Las siguientes son algunas propiedades de la integral de líneá que se pueden


probar fácilmente de la definición.

4.1.1. Propiedades de la Integrales de línea


1. Z Z Z
(aF+bG) · d−

r =a F · d−

r +b G · d−

r
C C C

2. Sean C1 y C2 dos curvas que forman una curva C tal que −



r1 : [a, b] → Ω

→ −
→ −

y r2 : [b, c] → Ω y r1 (b) = r2 (b). Definamos
 − →

→ r1 (t) a≤t≤b
r (t) = −

r (t) 2 b≤t≤c

119
entonces Z Z Z
F · d−

r = F · d−

r + F · d−

r
C C1 C2

3. Sea − →r : [a, b] → Ω una parametrización de una curva C y definamos


un cambio de parámetro h : [c, d] → [a, b] tal que h0 (τ ) 6= 0 y defi-


namos β (τ ) = − →r (h(τ )). Recordemos que en el caso que h0 (τ ) > 0 am-
bas parametrizaciones determinan la misma orientación sobre la curva
C, mientras que si h0 (τ ) < 0 las direcciones son opuestas. En el caso
h0 (τ ) > 0, tenemos que h(c) = a, h(d) = b y se tiene que

Zd Zd

→ −
→ −−→ −

Z
F·dβ = F( β (τ )) · β 0 (τ )dτ = F(−

r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ.
C c c

Haciendo el cambio de variable t = h(τ ), entonces dt = h0 (τ )dτ , h(c) = a,


h(d) = b y obtenemos

Zd

→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd


= F(−

r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c
Zb


Z
= F(−

r (t)) · r0 (t)dt = F · d−

r.
a C

Como se puede observar aquí, las integrales son iguales.

En el otro caso h0 (τ ) < 0, tenemos que h(c) = b y h(d) = a, entonces

Zd

→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd


= F(−

r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c

Haciendo el cambio de variable t = h(τ ) entonces dt = h0 (τ )dτ , h(c) = b,


h(d) = a y obtenemos

120
Zd

→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd


= F(−

r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c
Za


= F(−

r (t)) · r0 (t)dt
b
Zb


Z
= − F(−

r (t)) · r0 (t)dt = − F · d−

r
a C

Aquí podemos observar que las integrales cambian de signo.

4.2. El concepto de trabajo como integral de línea


Recordemos que el trabajo hecho por una fuerza constante F cuyo punto de

→ −

aplicación se mueve sobre un segmento que va desde el punto P al punto Q
−−

es definida como WP Q = F·P Q

En el caso que la fuerza F esté aplicada sobre una curva parametrizada por
una función vectorial − →r , consideramos una partición sobre la curva C dada
−−→ −−→
por los puntos {Po , P1 , P2 , ...PN −1 , PN } tales que Po = r(a)
−−−y−→PN = r(b). y
−−→

los demás puntos están sobre la curva C de tal forma que Po Pi−1 ≤ Po Pi

−−→
(i = 2, ..., N ). Escojamos en cada segmento un punto r(t∗k ) y podemos con-
siderar que el  trabajo realizado sobre el arco P\ k−1 Pk es aproximadamente
−−→ 
WPk−1 Pk ≈ F(r(tk ) · T ∆Sk donde ∆Sk = longitud(P\

k−1 Pk ). Así el tra-
−−→
bajo total realizado sobre la curva por la fuerza F desde el punto r(a) hasta

121
−−→ N  −−→ 
el punto r(b), W ≈ F(r(t∗k ) · T ∆Sk . Esto nos permite claramente definir
P
k=1
el trabajo realizado



Z Z
W = F · T ds = F · d−

r.
C C

Ejemplo 4.2.1 Supongamos que la fuerza F es una fuerza constante F =(c1 , c2 , c3 )


entonces el trabajo está dado por

Zb


Z
W = F · d−

r = F(−

r (t)) · r0 (t)dt
C a
Zb


= (c1 , c2 , c3 ) · r0 (t)dt
a

(c1 , c2 , c3 ) · −
→ b
= r (t)|a
−−→ −−→
= F · (r(a) − r(b)),

Como podemos observar aquí el trabajo solo depende de los puntos extremos
de la curva.

Ejemplo 4.2.2 Principio del trabajo y la energía.

Supongamos que una partícula se mueve −−a→lo


largo de un campo de fuerzas F.
0
Si la rapidez de la partícula es v(t) = r (t) , su energía cinética está definida
por
1
K(t) = mv 2 (t)
2
Demostrar que la variación de la energía cinética en cualquier intervalo de
tiempo es igual al trabajo realizado por F durante dicho intervalo de tiempo.

Solución: Si −→
r (t) es el vector posición de la partícula en el instante t, entonces
el trabajo realizado durante el intervalo de tiempo [a, b] es dado por Wab =
−−→
r(b)
F · d−

r . Vamos a mostrar que Wab = K(b) − K(a) = 21 mv 2 (b) − 12 mv 2 (a).
R
−−→
r(a)


De acuerdo a la segunda ley de Newton F(−

r (t)) = mr00 (t), entonces

122
−−→
r(b) Za

→ −

Z
Wab = F · d−

r = mr00 (t) · r0 (t)dt
−−→ b
r(a)
Za
1 d −
→0 −
→ 
= m r (t) · r0 (t) dt
2 dt
b
Za
1 −
d  → 
= m r0 (t) dt

2 dt
b
Za b
1 dv 2 (t) 1
dt = mv 2 (t)

= m
2 dt 2 a
b
1 1
= mv 2 (b) − mv 2 (a) = K(b) − K(a).
2 2

4.3. Campos conservativos y funciones potenciales


Un campo vectorial F : Ω ⊂ Rn → Rn definido en una región Ω es conservativo,
si existe un campo escalar ϕ : Ω ⊂ Rn → R tal que
F = −∇ϕ.
En este caso la función ϕ es llamada función potencial.
Observación 4.3.1 Dado un campo conservativo F en física se acostumbra
a escribir F = −ϕ∇. Entonces, ϕ(x, y, z) es la energíá potencial en el punto
(x,y,z). Si f = −ϕ, entonces

−−→
r(b) Zb


Z
Wab = −

F · d r = − ∇ϕ(−

r (t)) · r0 (t)dt
−−→ a
r(a)

Zb
d
(ϕ(−

r (t))) dt = − ϕ(−
→ b
= − r (t)|a
dt
a
= − [ϕ(−

r (b) − ϕ(−

r (a)] = ϕ(−

r (a) − ϕ(−

r (b)

123
Observación 4.3.2 De acuerdo al ejemplo 3 y a la observación 4,

Wab = K(b) − K(a) = φ(−



r (a)) − φ(−

r (b)

o sea
K(b) + ϕ(−

r (b) = K(a) + ϕ(−

r (a))
Esta fórmula es conocida como la ley de la conservación de la energía
mecánica para una partícula que se mueve bajo la influencia de un campo
de fuerzas conservativo. La suma de la energía cinética y la energía potencial
permanece constante.

4.4. El teorema de Green


El teorema de Green, uno de los teoremas importantes en el cálculo vectorial,
relaciona una integral de línea de un campo vectorial sobre una curva plana
C con una integral doble sobre la región Ω encerrada por la curva. Un hecho
importante del Teorema de Green radica en que permite el cálculo de una
integral doble conociendo la información sobre la frontera.
Una curva − →r : [a, b] → R2 continua es cerrada si − →
r (a) = −

r (b). Si además se

→ −

cumple r (t1 ) 6= r (t2 ) para t1 6= t2 en el intervalo (a, b], la curva se dice que
es cerrada simple. Por ejemplo, la elipse, la circunferencia son curvas cerradas
simples. Esta clase de curvas son llamadas curvas de Jordan.
La curva de Jordan C se dice que está orientada positivamente si al recorrer la
curva, la región Ω queda a mano izquierda. Observemos que si la orientación
es positiva el vector
(y 0 (t), −x0 (t))
n(t) = →0 .

r (t)

es ortogonal al vector velocidad −



v (t) = (x0 (t), y 0 (t)).
Una curva cerrada simple se dice que es regular a trozos si la curva se puede
parametrizar en la forma
 − →
r0 (t) t ∈ [a0 , b0 ]
−→


−−→ r (t) t ∈ [a1 , b1 ]

 1
r(t) = ..

 .
 −
r→(t)

n t ∈ [a , b ]
n n

donde − →r es continua con a0 = a y bn = b y diferenciable en cada intervalo


(ai , bi ) .

Teorema 4.4.1 Teorema de Green.

124
Sea C una curva cerrada simple regular a trozos orientada positivamente en el
plano R2 que acota una región Ω en el plano. Si F :Ω ⊆ R2 → R2 es un campo
vectorial diferenciable dado por F(x, y) = (P (x, y), Q(x, y)), entonces
Z Z  
∂Q ∂P
I
P dx + Qdy = − dxdy
∂x ∂y
C Ω


Observemos que si F = (P, Q) tenemos que
Zb

→ − −
→ −−→ −

I
F ·→
n ds = F (r(t)) · n(t) r0 (t) dt

C a
Zb

→ −−→
= F (r(t)) · n(t)dt
a
Zb


= F (r(t)) · (y 0 (t), −x0 (t))dt
a
Zb
= [P (−

r (t)) y 0 (t) − Q (−

r (t)) x0 (t)] dt
Ia
= −Qdx + P dy.
C

Así́ tenemos que



→ −
I I
F ·→
n ds = −Qdx + P dy.
C C
Aplicando el teorema de Green tenemos que


Z Z  

→ − ∂P ∂Q
I Z Z

F · n ds = + dxdy = div (F )dxdy
∂x ∂y
C Ω Ω

Este resultado es conocido como teorema de la divergencia en el plano.


Antes de probar este teorema para algunas regiones en particular consideremos
el siguiente ejemplo

Ejemplo 4.4.1 Hallar el valor de la integral


I
−x2 ydx + y 2 xdy
C

125
donde C es una circunferencia unitaria orientada positivamente. Aplicando el
teorema de Green y teniendo en cuenta que P = −x2 y y Q = y 2 x tenemos
que

Z Z Z
−x2 ydx + y 2 xdy y 2 + x2 dxdy

=
C Ω
Z2πZ1
= r3 drdθ = 2π.
0 0

Ejemplo 4.4.2 Hallar el valor de la integral


Z
−ydx + xdy
C

donde C es la frontera del cuadrado Ω = [0, 1] × [0, 1] .


Observemos que si no conociéramos el teorema de Green tendríamos que re-
solver 4 integrales de línea. Sin embargo, usando el Teorema de Green con
P = −x, Q = x tenemos que

Z Z Z
−ydx + xdy = 2dxdy
C Ω
Z Z
= 2 dxdy = 2area(Ω) = 2.

Ejemplo 4.4.3 Sea F(x, y) = (x, y). y C una circunferencia de radio a. Sea
Ω la bola cerrada Ba (0). La divergencia de F está dada por divF = ∇ · F =
∇ · (x, y) = 1 + 1 = 2 entonces
Z Z Z Z
divFdxdy = 2dxdy = 2área(Ω) = 2πa2
Ω Ω

F·−

R
Ahora calculemos n ds, teniendo en cuenta que el vector normal exterior
C
(x, y)
a la circunferencia es dado por −

n = , entonces
a

126
(x, y)
Z Z
F·−

n ds = (x, y) ·
a
C C
1
Z
x2 + y 2 ds

=
a
C
1
Z Z
2
= a ds = a ds
a
C C
= a (2πa) = 2πa2

Demostración del Teorema de Green para región dada en la figura de abajo

Aunque el teorema se puede demostrar para regiones más generales aquí́ vamos
a restringirnos a la figura dada. La región Ω es descrita como

Ω = {(x, y) : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x)}

 
Zb ϕZ1 (x)
∂P ∂P 
Z Z
− dxdy = − dy  dx

∂y ∂y

Ω a ϕ1 (x)

Zb
ϕ (x)
= −P (x, y)|ϕ21 (x) dx
a
Zb
= {P [(x, ϕ1 (x)] − P [x, ϕ2 (x)]} dx
a

127
Por otra parte, la integral de línea P (x, y)dx la podemos escribir como
R
C
Z Z Z
P (x, y)dx = P (x, y)dx + P (x, y)dx.
C C1 C2

Para calcular la integral de línea a lo largo de C1 utilizando la parametrización


−−→
r1 (t) = (t, ϕ1 (t) obtenemos

Z Zb
P (x, y)dx = P [(t, ϕ1 (t)] dt.
C1 a

Para calcular la integral de línea a lo largo de C2 utilizando la parametrización


−−→
r2 (t) = (t, ϕ2 (t) y teniendo en cuenta la inversión del sentido obtenemos

Z Zb
P (x, y)dx = − P [(t, ϕ2 (t)] dt.
C2 a

Por lo tanto
Z Zb Zb
P (x, y)dx = P [(t, ϕ1 (t)] dt − P [(t, ϕ2 (t)] dt.
C a a

Así, obtenemos que

∂P
Z Z Z
− dxdy = P (x, y)dx
∂y
Ω C

De manera semejante, podemos mostrar que

∂Q
Z Z Z
dxdy = Q(x, y)dy.
∂x
Ω C

Así́ Z Z  
∂Q ∂P
I
P dx + Qdy = − dxdy
∂x ∂y
C Ω

Ejemplo 4.4.4 Por medio del teorema de Green calcular el trabajo realizado
por un campo de fuerza F(x, y) = (3x + y, 2y − x) al moverse una partícula
sobre una elipse x2 + 4y 2 = 4 en sentido contrario a las manecillas del reloj.

128
 
∂Q ∂P
En este caso P (x, y) = 3x + y, Q(x, y) = 2y − x. − = −1 − 1 = −2.
∂x ∂y

Entonces
Z Z  
∂Q ∂P
− dxdy = −2area(Ω) = −2π2 = −4π
∂x ∂y

entonces el trabajo es dado por la integral de línea


 
R R R ∂Q ∂P
P dx + Qdy = − dxdy = −4π.
C Ω ∂x ∂y

Corolario del teorema de Green .


El área A de la región Ω acotada por una curva simple, cerrada y suave a trozos
está dada por

A = 12 −ydx + xdy = − ydx = xdy


R R R
C C C

Demostración Definamos el campo


 vectorial F(x, y) = (−y, x) ..P (x, y) = −y,
∂Q ∂P
Q(x, y) = x. entonces − = 1 + 1 = 2.Entonces
∂x ∂y
Z Z  
∂Q ∂P
− dxdy = 2area(Ω)
∂x ∂y

Z
= 2A = P dx + Qdy
C
Z
= −ydx + xdy.
C
 

→ dy dx
Por lo tanto, teniendo en cuenta que el vector n = ,− tenemos
ds ds
1 1
Z Z
A= F·−→n ds = −ydx + xdy
2 2
C C

1
Z
A= −ydx + xdy
2
C

RObservemos que si P (x, y) = 0 y Q(x, y) = x, el teorema de Green implica que


xdy = A.
C

129
Similarmente
R si P (x, y) = −y y Q(x, y) = 0, el teorema de Green implica que
−ydx = A
C
Así́ tenemos que
1
Z Z Z
A= −ydx + xdy = −ydx = xdy.
2
C C C

4.5. Área de una superficie


Vamos a definir el área de una superficie paramétrica. Por simplicidad vamos a
considerar que el dominio de la función vectorial es un rectángulo.Consideramos
una participación de la región T en subrectángulos. La partición definida en
el región rectangular nos define una partición en la superficie S, la cual no es
formada necesariamente por rectángulos. Aproximamos el área de Sk por una
región del plano tangente en el punto Pk . Aproximamos esta área por el área
del paralelogramo formado por los vectores − →
ru ∆u y −→
rv ∆v. Está área esta dada
por

k−

ru ∆u × −

rv ∆vk = k−

ru × −

rv k ∆u∆v

N
k−

ru × −

X
rv k ∆u∆v
k=1

Esto nos permite definir el área superficial de la siguiente manera:


Sea

130

→ −
→ −
→ −

r (u, v) = (x(u, v), y(u, v), y(u, v)) = x(u, v) i + y(u, v) j + y(u, v) k

una parametrización de una superficie suave que se cubre una sola vez cuando
(u, v) recorre el dominio Ω, entonces se define el área superficial por
ZZ
A(S) = k−

ru × −

rv k dudv

donde

∂x −
→ ∂y − → ∂z − → ∂x −
→ ∂y − → ∂z − →
ru = i + j + k rv = i + j + k
∂u ∂u ∂u ∂v ∂v ∂v

Ejemplo 4.5.1 Encuentre el área superficial de una esfera radio a.

Las ecuaciones paramétricas de la esfera son

x = a cos θsen ϕ, y = asen θsen ϕ, z = a cos ϕ

El dominio Ω está dado por

Ω = {(θ, ϕ) 0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π}


i j k

→ −

rθ × rϕ = xθ yθ zθ



xϕ yϕ zϕ


i j k

= −asen θsen ϕ a cos θsen ϕ 0

a cos θ cos ϕ asen θ cos ϕ −asen ϕ
= −a2 senθsen2 ϕi−a2 senθ sen2 ϕj−a2 senϕ cos ϕk

k−

rθ × −
r→ 2
ϕ k = a senϕ.

Entonces el área superficial de la esfera es dada por

131
ZZ
A(S) = k−

ru × −

rv k dudv

Z2πZπ
= a2 senϕdϕdθ
0 0
Z2π Zπ
2
= a dθ senϕdϕ = 4πa2
0 0

Ejemplo 4.5.2 . Supongamos que tenemos una función de dos variables z =


f (x, y) con dominio Ω. Puesto que la gráfica de f determina una superficie en
el espacio, ésta la podemos parametrizar como



r (x, y) = (x, y, f (x, y)) con (x, y) ∈ Ω.
Observemos

i j k
i j k ∂f


→ −

∂f ∂f
zx = 1 0

rx × ry = xx yx =− i− j+k

∂x ∂x ∂x
xy yy zy 0
∂f
1
∂y

la norma de este vector está dado por


s  2  2

→ −
→ ∂f ∂f
krx × ry k = 1 + +
∂x ∂y

Así́ el área superficial está dada por

ZZ
A(S) = k−

rx × −

ry k dxdy

s  2  2
∂f ∂f
ZZ
= 1+ + dxdy
Ω ∂x ∂y

Si consideramos por ejemplo z = x2 + y 2 que está debajo del plano z = 9.


Observemos que en este caso Ω está dado por el círculo x2 + y 2 ≤ 9.

132
Así́ el área superficial es dada por
s  2  2
∂f ∂f
ZZ
A = 1+ + dxdy
Ω ∂x ∂y
ZZ p
= 1 + (2x)2 + (2y)2 dxdy

ZZ p
= 1 + 4x2 + 4y 2 dxdy.

Usando coordenadas polares tenemos
ZZ p
A = 1 + 4x2 + 4y 2 dxdy

Z2πZ3 p
= 1 + 4r2 rdrdθ
0 0
Z2π Z3 p
= dθ 1 + 4r2 rdr
0 0
π √
= (37 37 − 1)
6

4.6. Integral de superficie


4.6.1. Integral de superficie de una función escalar
Sea S una superficie parametrizada por
−−−−→
r(u, v) = (x(u, v), y(u, v), z(u, v)), (u, v) ∈ Ω,
donde Ω es una región del plano uv. Sea f : V ⊃ S → R, un campo escalar,
donde V es un abierto en R3 que contiene a la superficie S. Similar a las
integrales de línea, la integral de superficie de f está definida por
−−−→ → −
Z Z Z Z 
f (x, y, z)dS = f r(u, v k− ru × →
rv k dudv,
S Ω

donde  

→ ∂x ∂y ∂y
ru = , ,
∂u ∂u ∂u
y  

→ ∂x ∂y ∂y
rv = , , .
∂v ∂v ∂v

133
4.6.2. Integral de superficie de un campo vectorial

Una superficie es orientable si podemos definir un vector normal unitario − →


n en


cada punto de la superficie que no sea un punto frontera tal que n varía con-
tinuamente. La gráfica abajo muestra tres superficies, dos de ellas orientables
y una que no lo es (banda de Mobius) . Una superficie orientable tiene dos
caras. Si S es orientable y cerrada podemos escoger el vector − →
n de tal manera
que señale el exterior de la superficie y en este caso diremos que la orientación
es positiva.

Una superficie orientada tiene dos caras. Si S es orientable y cerrada podemos


escoger el vector −

n de tal manera que señale el exterior de la superficie y en este
caso diremos que la orientación es positiva. Si −

r (u, v) = (x(u, v), y(u, v), z(u, v))
es una parametrización de una superficie orientable S, entonces el vector normal
exterior puede ser

→ = ru × rv

n → = − ru × rv ,
o −
n (kru × rv k =
6 0)
1 2
kru × rv k kru × rv k

134
Definición 4.6.1 Una superficie parametrizada S se dice que es simple si ex-
iste un conjunto abierto y acotado Ω de 2 cuya frontera es una curva cerrada
simple regular a trozos tal que la parametrización −
→r : Ω ⊂ R2 → R3 es

→ −

inyectiva, ru × rv 6= 0 , S = r (Ω).

Sea −

n uno de los dos vectores normales − →o−
n n→ a la superficie S. Sea −

F un
1 2
campo vectorial definido en un conjunto abierto U que contiene a S.


Definición 4.6.2 Sea F : U ⊂ Rn → Rn un vectorial continuo, definimos la
integral de superficie del campo vectorial a la integral


→ − −
→−
Z Z Z Z

F · n dS = F (→r (u, v)) · −

n kru × rv k dudv
S
ZΩ Z

→−
= ± F (→
r (u, v)) · ru × rv dudv,

donde el signo es + si −

n =−
→ y el signo es − si −
n 1

n =−
→.
n 2

Los dos teoremas básicos del cálculo vectorial y permite calcular la integral de
una "derivada" en términos de integrales en la frontera de la superficie son los
siguientes:

Teorema 4.6.1 (de Stokes): Sea S una superficie acotada en R3 cuya frontera


∂S es una curva regular, entonces para todo campo vectorial en R3 , F ∈ C1 ,
se cumple donde se considera en ∂S la orientación inducida por S. Entonces


→ − −
→→
Z Z Z

F .d α = Rot F .−
n dS
∂S S

Teorema 4.6.2 (Teorema de la divergencia o Teorema Gauss): Sea V un


sólido en R3 cuya frontera es una superficie S orientable. Sea F un campo
vectorial derivable con continuidad definido sobre V . Entonces,


→− −

Z Z Z Z Z
F .→
n dS = div (F )dV.
S V

Ejemplo 4.6.1 . Supongamos que tenemos una función de dos variables z =


f (x, y) con dominio Ω. Puesto que la gráfica de f determina una superficie en
el espacio, esta la podemos parametrizar como

135


Considere el campo vectorial F = (yz, xz, xy) y S es la superficie determinada
por parte de la esfera x + y + z 2 = 4 que está dentro del cilindro x2 + y 2 = 1
2 2

y arriba del plano xy (ver figura).

1. a) Halle la función vectorial de la curva C.


R − → →
b) Halle C F .d− r


c) Halle S Rot F dS
RR

Solución: Para hallar la función vectorial de la curva C o parametrización


de la√curva, intersectamos la ecuación de la esfera con la del plano obteniendo
z = 3, puesto que√z ≥ 0. Así́ la parametrización de la curva C es dada por

→r (t) = (cos t, sent, 3) 0 ≤ t ≤ 2π y −→r 0 (t) = (−sent, cos t, 0)

→− √ √ −
→ √
Ahora, F (→
√ r (t)) = ( 3sent, 3 cos t, sent cos t) y F (r(t))·r0 (t) = − 3sen2 t+
3 cos2 t. Por lo tanto
Z2π √ √

√ Z

→ −
Z
F .d→

2 2
r = − 3sen t + 3 cos t dt = 3 cos 2tdt = 0
C
0 0

Aplicamos el teorema de Stokes obteniendo que



→ −
→ −
ZZ Z
Rot F dS = F .d→
r =0
S C

Ejemplo 4.6.2 . Supongamos que tenemos una función de dos


variables z = f (x, y) con dominio Ω. Puesto que la gráfica de f de-
termina una superficie en el espacio, ésta la podemos parametrizar
como
Sea V el cubo unitario de R3 definido por V = {(x, y, z) : 0 ≤ x ≤
1, 0 ≤ y ≤ 1, , 0 ≤ z ≤ 1}

136
Sea F (x, y, z) = x2 , y 2 , z 2 . Hallemos F ·−

 RR
n ds, en donde S
S
indica las seis paredes del cubo. De acuerdo al teorema de la Diver-
gencia tenemos que :
−
→
div F = 2x + 2y + 2z

Por lo tanto


→ − −
→
ZZ ZZZ
F ·→
n ds = div F dxdydz
S
Z Z ZV
= (2x + 2y + 2z) dxdydz
V
Z 1 Z 1 Z 1
= (2x + 2y + 2z) dxdydz
0 0 0
=3

Utilizando el teorema de la divergencia podemos establecer las sigu-


ientes relaciones de gran utilidad en las ecuaciones diferenciales
parciales. Demostraremos algunas y otras se dejan como ejercicios
Consideremos los campos escalares diferenciables f y g. Entonces
RR RRR
1. ∇f · ndS = ∆f dxdydz, donde ∆f es el laplaciano de f.
S V
RR
2. ∇f · ndS = 0, si f es armónica o sea ∆f = 0. ( Se concluye
S
inmediatamente del resultado 1)
RR RRR
3. f ∇g · ndS = f ∆g +∇f · ∇gdxdyd
S V
RR RRR
4. {f ∇g · n − g∇f · n} ds = V
f ∆g − g∆f dxdydz
S

137
RR RR
5. f ∇g · n = g∇f · n si f y g son armónicas.
S S

Para demostrar la primera observemos que


RR RRR RRR
∇f · ndS = div(∇f )dxdydz = ∆f dxdydz
S V V

Observemos que la tercera identidad es la generalización a tres di-


mensiones del método de integración por partes.

La ley de Coulomb afirma que si tenemos una carga eléctrica de q


culombs, situada en el origen, la fuerza que ejerce sobre otra carga
unitaria y situada en el punto (x, y, x) viene dada por la expresión

cq
F (x, y, z) = 3 (x, y, z)
kx, y, zk

en donde c es una constante.


Sea V un sólido de R3 que contiene al origen y denotemos con S su
frontera. Puesto que F no está definido en el origen, no podemos
aplicar directamente el teorema de la divergencia. Sea Br (), la bola
de centro en el origen y de radio r tal que Br () ⊂ V. Entonces
sobre el conjunto V − Br () sí podemos aplicar el Teorema de la
divergencia. La figura ilustra un corte de V − Br ()

138
Observemos que la frontera de V − Br () está compuesta por S y
∂Br () y el vector normal unitario sobre la frontera ∂Br () es


→ −1
n = (x, y, z)
kx, y, zk

Es así́ cómo el teorema de la Divergencia toma la siguiente forma:

Z Z −
→
Z Z Z Z
div F dxdydz = F ·−

n ds + F ·−

n ds
V −Br () S ∂Br ()

−
→
Un cálculo fácil nos muestra que div F = 0 y por lo tanto ten-
emos que

Z Z Z Z
F ·−

n ds = − F ·−

n ds
S S
cq (x, y, z) −1 (x, y, z)
Z Z
=− 3 · 1 dS
(x2 + y2 + z 2) 2 (x2 + y2 + z 2) 2
∂Br ()

x2 + y 2 + z 2
Z Z
= cq 2 dS
(x2 + y 2 + z 2 )
∂Br ()
cq
Z Z
= 2 dS

∂Br ()
cq
= 2 4π2 = 4cπq.


F ·−

RR
Por lo tanto el flujo n dS = 4cπq sólo depende de la
S
carga q y no del tamaño o forma de S.

139

S-ar putea să vă placă și