Guia

Guia de estudio para la admision
a la maestra en
Matematicas aplicadas del CIMAT
Introduccion
Los campos de la matematica de la actualidad se han diversificado y expandido

de gran manera, que ya es imposible el poder abarcar todas las areas de esta gran
ciencia en su totalidad.
En las universidades se trazan planes de estudio para que los alumnos de areas
cientficas e ingenieras egresen lo mejor preparados, pero es indudable que en el
proceso de formacion del profesional en estas areas se busque inculcar un area es-
pecifica para poderla desarrollar en todo su potencial. Al llevar a cabo este objetivo
se dejan de lado aspectos importantes de la matematica o simplemente se dejan de
estudiar aquellas areas basicas que pertenecen al tronco comun y fundamental del
profesional en matematicas.
El presente trabajo trata de abordar conceptos basicos que un egresado en

matematicas debe dominar, no solo para poder realizar estudios de posgrado, sino
por que son las races del conocimiento que adquirio a lo largo de anos de estudio,
y que por diversos motivos no se logran recordar o, peor aun, se olvidan en su
totalidad.
Los temas de estudio que se abordan estan basados en los libros [1, 2, 3, 4, 5,
6, 7, 8, 9, 10, 11] y son:
i) Algebra Lineal. Aqu se estudian los conceptos mas importantes como Es-
pacios Vectoriales, Bases, Dimensiones y Transformaciones Lineales, Ma-
trices Similares, Valores Propios, Vectores Propios y se abordan los temas
del Teorema fundamental del Algebra Lineal y Espacios Vectoriales Duales.
ii) Introduccion al Analisis Real. Los temas que se mencionan aqu son Lmi-
tes, Continuidad, Derivacion, Integracion, El Teorema Fundamental del Calcu-
lo, que son temas comunes en los cursos de Calculo de nivel superior, y los
conceptos como Convergencia Puntual, Convergencia Uniforme, El Teore-
ma de Weierstrass y El Ejemplo de Weierstrass son mas comunes en los
cursos de Analisis Matematico.
iii) Calculo para Funciones Vectoriales. Las ideas de Funciones Vectoriales,
Lmites y Continuidad para Funciones Vectoriales, Derivacion y Jacobia-
nos, El Teorema de la Funcion Inversa y El Teorema de la Funcion Implcita
se tratan de una manera muy basica, ya que algunos de los teorema aqu ex-
puestos no se demuestran, ya que se pueden revisar las debidas demostra-
ciones en textos comunes de Calculo Vectorial.
iv) Topologa de Conjuntos de Puntos. La Topologa General es un area muy

extensa que abarca diversos conceptos que se heredan del Analisis Ma-
tematico por lo cual, aqu solo se trabajaron Definiciones Basicas, La Topo-
loga Estandar de Rn , Espacios Metricos y Bases para las Topologas.
v) El Teorema Clasico de Stokes. El Teorema Clasico de Stokes y todas

sus vertientes son ideas fundamentales que no solo son estudiadas por los
matematicos, sino tambien por aquellos estudiantes de Fsica y Qumica.
Ademas de enunciar los Teoremas de Stokes y el Teorema de la Divergen-
cia, se dan interpretaciones fsicas y se esbozan las ideas principales de sus
demostraciones.
vi) Ecuaciones Diferenciales Ordinarias. Posiblemente se trate del tema mas

aplicado en este trabajo, pero, no quiere decir que la respectiva teora detras
de cada metodo de solucion de una Ecuacion Diferencial Ordinaria (EDO),
no se tratara con el mismo interes que los temas anteriores. Aqu se expo-
nen las soluciones para una EDO de primer orden y de segundo orden, y
tambien se estudian, de manera breve, los sistemas de EDO.
El presente trabajo ha sido realizado por el matematico Oscar Ricardo Carmo-

na Bernal bajo la supervision de Francisco Javier Solis.

Indice general
1. Algebra Lineal 9
1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2. Recordando a Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Espacios Vectoriales y Transformaciones Lineales . . . . . . . . . 12
1.4. Bases, Dimensiones y Transformaciones Lineales con Matrices . . 21
1.5. El Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.6. Primer Teorema Fundamental del Algebra Lineal . . . . . . . . . 38
1.7. Matrices Similares . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.8. Valores Propios y Vectores Propios . . . . . . . . . . . . . . . . . 43
1.9. Espacios Vectoriales Duales . . . . . . . . . . . . . . . . . . . . 50
1.10. Eliminacion Gausiana . . . . . . . . . . . . . . . . . . . . . . . . 52
1.10.1. Interpretacion Analtica . . . . . . . . . . . . . . . . . . 54
1.11. Matrices Positivas Definidas . . . . . . . . . . . . . . . . . . . . 56
2. Introduccion al Analisis Real 59

2.1. Lmites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2. Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.3. Diferenciacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.4. Integracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5. El Teorema Fundamental del Calculo . . . . . . . . . . . . . . . . 74
2.6. Convergencia Puntual de Funciones . . . . . . . . . . . . . . . . 78
2.7. Convergencia Uniforme . . . . . . . . . . . . . . . . . . . . . . . 80
2.8. La M-Prueba de Weierstrass . . . . . . . . . . . . . . . . . . . . 83
2.9. El Ejemplo de Weierstrass . . . . . . . . . . . . . . . . . . . . . 85
5
3. Calculo para Funciones Vectoriales 89
3.1. Funciones Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Lmites y Continuidad de Funciones Vectoriales . . . . . . . . . . 90
3.3. Diferenciacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.4. El Teorema De La Funcion Inversa . . . . . . . . . . . . . . . . . 96
3.5. El Teorema De La Funcion Implcita . . . . . . . . . . . . . . . . 99
4. Topologa de Conjuntos 107

4.1. Definiciones Basicas . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2. La Topologa Estandar de Rn . . . . . . . . . . . . . . . . . . . . 111
4.3. Espacios Metricos . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.4. Bases para las Topologas . . . . . . . . . . . . . . . . . . . . . . 121
5. El Teorema Clasico de Stokes 123

5.1. Preliminares acerca del Calculo Vectorial . . . . . . . . . . . . . 124
5.1.1. Campos Vectoriales . . . . . . . . . . . . . . . . . . . . . 124
5.1.2. Variedades y Fronteras . . . . . . . . . . . . . . . . . . . 125
5.1.3. Integrales sobre Trayectorias . . . . . . . . . . . . . . . . 128
5.1.4. Integrales de Superficie . . . . . . . . . . . . . . . . . . . 133
5.1.5. El Gradiente . . . . . . . . . . . . . . . . . . . . . . . . 136
5.1.6. La Divergencia . . . . . . . . . . . . . . . . . . . . . . . 137
5.1.7. El Rotacional . . . . . . . . . . . . . . . . . . . . . . . . 137
5.1.8. Orientabilidad . . . . . . . . . . . . . . . . . . . . . . . 139
5.2. El Teorema de la Divergencia y el Teorema de Stokes . . . . . . . 139
5.3. Una interpretacion fsica del teorema de la Divergencia . . . . . . 142
5.4. Una interpretacion fsica del Teorema de Stokes . . . . . . . . . . 143
5.5. Esbozo de una Prueba del Teorema de la Divergencia . . . . . . . 145
5.6. Esbozo de una Prueba del Teorema de Stokes . . . . . . . . . . . 147
6. Ecuaciones Diferenciales Ordinarias 151

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.2. Ecuaciones Diferenciales Exactas . . . . . . . . . . . . . . . . . 156
6.3. Ecuaciones Diferenciales Homogeneas . . . . . . . . . . . . . . . 160
6.4. Ecuaciones Diferenciales Lineales de Primer Orden . . . . . . . . 163
6.5. Ecuaciones Diferenciales Lineales de Segundo Orden . . . . . . . 167
6.6. Ecuaciones Diferenciales Lineales No Homogeneas . . . . . . . . 175
6.7. Sistemas de Ecuaciones Diferenciales Lineales . . . . . . . . . . 182
6.7.1. Teora Preliminar . . . . . . . . . . . . . . . . . . . . . . 182
6
6.7.2. Sistemas Lineales Homogeneos. . . . . . . . . . . . . . . 184
7
8
Captulo 1
Algebra Lineal
1.1. Introduccion
Aunque un poco exagerado, se puede decir que un problema matematico se

puede resolver solo si se puede reducir a un problema de algebra lineal. Y un pro-
blema en algebra lineal se reducira en ultima instancia a resolver un sistema de
ecuaciones lineales, que a su vez se reduce a la manipulacion de matrices. El po-
der del algebra lineal no solo radica en la habilidad para manipular matrices para
resolver sistemas de ecuaciones lineales. De la abstraccion de objetos en concreto
a las ideas de espacios vectoriales y transformaciones lineales, nos permite ver
que hay conceptos en comun entre muchos temas aparentemente distintos. Por
ejemplo, el estudio de las soluciones de las ecuaciones diferenciales lineales tie-
nen, en parte, la misma sensacion que tratar de modelar el techo de un carro con
polinomios cubicos, dado que el espacio de soluciones de una ecuacion diferen-
cial lineal y el espacio de los polinomios cubicos que modelan el techo de un carro
forman un espacio vectorial.
9
1.2. RECORDANDO A RN
1.2. Recordando a Rn
Normalmente la mayora de los estudiantes conocen el espacio vectorial deno-
tado por Rn , que consiste en el conjunto de todas las n-tuplas de numeros reales:
{(x1 , ..., xn )| xi R}
Como veremos en la siguiente seccion, lo que hace que dicho conjunto sea un
espacio vectorial es que se pueden sumar dos n-tuplas para obtener otra n-tupla:
(x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn )

y que se puede multiplicar cualquier n-tupla por un numero real :
(x1 , ..., xn ) = ( x1 , ..., xn ), R.

para obtener otra n-tupla.
Cualquier n-tupla es llamada vector y los numeros reales son llamados escala-
res.
La funcion mas importante de un espacio vectoral Rn a un espacio vectoral
Rm esta dada por la multiplicacion matriz-vector. En nuestro caso, denotaremos
un vector x Rn , como un vector columna:

x1
.
. .
x=
xn
Similarmente haremos lo mismo para Rm , es decir como un vector columna con
m entradas.
Sea A una matriz de m n de la forma:

a11 . . . a1n
. .
A=
.
.
.
am1 . . . amn
Entonces, A x es la m-tupla:
10
CAPITULO 1. ALGEBRA LINEAL

a11 . . . a1n x1 a11 x1 + a21 x2 + + a1n xn
. . .
.
Ax=
. = .
. . .
am1 . . . amn xn am1 x1 + am1 x2 + + amn xn
Para cualesquiera dos vectores x y y en Rn y cualesquiera dos escalares y ,

tenemos:
En la siguiente seccion usaremos la linealidad de la multiplicacion matricial

para motivar la deficnicion de una transformacion lineal entre espacios vectoriales.
A ( x + y) = A x + A y.
Ahora relacionemos los conceptos anteriores con la resolucion de un sistema
de ecuaciones lineales de la forma:
a11 x1 + ... + a1n xn = b1

.
.
am1 x1 + ... + amn xn = bm .
Si denotamos por

b1 a11 . . . a1n
. . .
. yA= .
b=
.
bm am1 . . . amn
y el vector columna de las incognitas:

x1
.
x=
.

xn
obtenemos:
11
1.3. ESPACIOS VECTORIALES Y TRANSFORMACIONES LINEALES
Ax=b (1.1)
Cuando m > n (cuando existen mas ecuaciones que incognitas) esperamos
que el sistema casi siempre no tenga solucion. Veamos geometricamente este he-
cho para un ejemplo. Sea n = 2 y m = 3 as que dadas tres lineas en un plano es
usual que no tengan un punto de interseccion comun.
Cuando m < n (cuando hay mas incognitas que ecuaciones) decimos que
el sistema tiene una infinidad de soluciones. Geometricamente esto corresponde
(cuando m = 2 y n = 3) al hecho que dos planos normalmente se intersectan en
una recta. Muchos de los conceptos del algebra lineal son creados para resiolver
el caso remanente (m = n).
Supongamos que la matriz A de n n, se llama cuadrada, tiene una matriz
inversa A1 (lo cual significa que A1 tambien es de n n elementos y lo mas
importante que A1 A = I, con I la matriz identidad), entonces la solucion de
(1.1) es:
x = A1 b,
dado que:
A x = A(A1 b) = I b = b.
Por lo tanto, la solucion de nuestro sistema de ecuaciones lineales se reduce a
comprender cuando una matriz A de n n tiene una matriz inversa (Si una matriz
inversa existe, entonces hay varias formas para calcularlas.)
Uno de los teoremas claves del algebra lineal (dado posteriormente) es en esencia
una lista de muchas formas equivalentes de establecer cuando una matriz tiene
inversa, lo cual es esencial para entender cuando un sistema de ecuaciones puede
ser resuelto.
1.3. Espacios Vectoriales y Transformaciones Linea-

les
Las ideas mas abstractas para estudiar sistemas de ecuaciones lineales inician
con la nocion de espacio vectorial.
12
Definicion 1.3.1 Un conjunto V no vacio es un espacio vectorial sobre los nume-

ros reales R, si existe dos funciones :
1. R V V, denotada por a v o av para todo numero real a y elementos

v en V.
2. V V V, denotada por v + w para todos los elementos v y w en el

espacio vectorial V.
Con las siguientes propiedades:
a) Existe un elemento 0 en V tal que 0 + v = v para todo v V .
b) Para cada v V, existe un elemento (v) V con v + (v) = 0.
c) Para todo v, w V, v + w = w + v.
d) Para todo a R y para todo v, w V, tenemos que a(v + w) = av + aw.
e) Para todo a, b R y todo v V, a(bv) = (ab)v.
f) Para todo a, b R y todo v V, (a + b)v = av + ab.
g) Para todo v V, 1 v = v.
Como una forma de notacion, los elementos de un espacio vectorial seran lla-
mados vectores y los elementos de R (o de cualquier otro campo al que hagamos
referencia), seran llamados escalares. Note que el espacio Rn dado en la seccion
anterior satisface estas condiciones.
Ahora vamos a ver algunos ejemplos de espacios vectoriales:
13
Ejemplo 1.3.2 Sea V = {p} un conjunto con un unico elemento y con:
p + p = p y p = p, con R
es decir, la suma de elementos de V nos da un elemento en V y la multiplicacion
de un elemento de V por un escalar nos da un elemento en V.
Ejemplo 1.3.3 Sea V = {f : R R} y:
(f + g)(x) = f (x) + g(x), (f )(x) = f (x), con x R

y con estas operaciones, el conjunto de las funciones de valores reales es un espa-
cio vectorial.
Ejemplo 1.3.4 Sea X={a1 , ..., an } un conjunto con n elementos. Se define una
palabra formada por el conjunto X como una expresion del tipo x1 a1 + ... + xn an ,
donde xi R. Dos palabras x1 a1 + ... + xn an y y1 a1 + ... + yn an son iguales si
xi = yi. Se define V como el conjunto de todas las palabras, y verificamos que:
(x1 a1 + ... + xn an ) + (y1 a1 + ... + yn an ) = (x1 + y1 )a1 + ... + (xn + yn )an

(x1 a1 + ... + xn an ) = (x1 )a1 + ... + (xn )an con R.
Entonces V es un espacio vectorial.
Ejemplo 1.3.5 Sea V el conjunto de las sucesiones de numeros reales, y las ope-
raciones + y definidas como sigue:
Dadas {an } y {bn } V y dado R; la suma de dos sucesiones esta definida
como la sucesion que se obtiene sumando los terminos n-esimos de las sucesiones
dadas:
{an } + {bn } = {a1 + b1 , ..., an + bn , . . . } = {an + bn }
y el producto esta definido como sigue:
{an } = { a1 , ..., an , . . . } = { an }
Es facil comprobar que es V forma un espacio vectorial real. El vector nulo es
la sucesion que tiene todos sus terminos iguales a cero. Se verifica ademas que
{an } = {an }.
Ejemplo 1.3.6 Sea V = {1}. Es decir, V contiene solamente el numero 1. En este

caso, V no es espacio vectorial, puesto que no cumple con el axioma (c). Para ver
esto, simplemente notemos que 1 + 1 = 2 / V.
14
Ejemplo 1.3.7 Sea

V = {(x, y) : y = mx, }
donde m es un numero real fijo y x es un numero real arbitrario. Esto es, V con-
siste en todos los puntos que estan sobre la recta y = mx que pasa por el origen y
que tiene pendiente m. Supongamos que (x1 , y1) y (x2 , y2 ) estan en V. Entonces
y1 = mx1 , y2 = mx2 , y:
(x1 , y1 ) + (x2 , y2 ) = (x1 , mx1 ) + (x2 , mx2 )

= (x1 + x2 , mx1 + mx2 )
= (x1 + x2 , m(x1 + x2 )) V
.
La operacion 2 esta bien definida. Los axiomas (a), (c) y (d) se verifican directa-
mente. Mas aun,
(x, mx) = (x, mx) = (x, m(x)) V

y
(x, mx) + (x, m(x)) = (0, 0) = 0

de modo que el axioma (b) tambien es satisfecho. Los demas axiomas se verifican
con facilidad y por lo tanto el conjunto de puntos en el plano que quedan sobre la
recta que pasa por el origen constituye un espacio vectorial.
Definicion 1.3.8 Un subconjunto U de un espacio vectorial V es un subespacio

de V si U con las mismas operaciones de V es en si mismo un espacio vectorial..
Proposicion 1.3.9 Un subconjunto U de un espacio vectorial V es un subespacio

de V si U es cerrado bajo la suma de elementos de U y la multiplicacion de un
elemento de U por un escalar.
A continuacion veremos algunos ejemplos de subespacios vectoriales.
15
Ejemplo 1.3.10 Para todo espacio vectorial V, el subconjunto {0} que contiene
solamente el vector cero, es un subespacio de V puesto que
0+0=0
y
0 = 0 para todo numero real ,

a dicho subespacio se le conoce como el subespacio trivial.
Ejemplo 1.3.11 Sea
H = {(x, y, z) : x = at, y = bt, y z = ct, con a, b, c, t reales.}
Esto es, H consiste de los vectores en R3 que estan sobre una recta que pasa por
el origen. Veamos que H es un subespacio de R3 . Si x = (at1 , bt1 , ct1 ) H y
y = (at2 , bt2 , ct2 ) H, entonces:
x + y = (a(t1 + t2 ), b(t1 + t2 ), c(t1 + t2 )) H

y se tiene tambien que
x = (a( t1 ), b( t2 ), c( t3 )) H.
Luego, H es un subespacio de R3 .
Ejemplo 1.3.12 Sea H un subespacio de R. Si H 6= {0}, entonces H contiene

un numero real distinto de cero. Entonces, por el axioma (b),
1 = (1/) H
y
1 = H para todo numero real .

As, si H no es el subespacio trivial, entonces H = R. Esto es, R no tiene subes-
pacios propios.
16
Ejemplo 1.3.13 Denotemos con Mmn el espacio vectorial de las matrices de m

n con componentes reales y sea H = A Mmn : a11 = 0. De las definiciones
de suma matricial y de multiplicacion escalar, es claro que los dos axiomas de
cerradura se satisfacen, de donde H es un subespacio de Mmn .
Ejemplo 1.3.14 Sea V = Mnn , es decir, las matrices de n n, y sea H =

AMnn : A es invertible. Entonces H no es un subespacio vectorial puesto que
la matriz cero de tamano n n no esta en H.
Definicion 1.3.15 Una transformacion lineal T : V W es una funcion de un

espacio vectorial V a un espacio vectorial W tal que para cualesquiera numeros
reales a1 y a2 y cualesquiera vectores v1 y v2 en V, tenemos que:
T (a1 v1 + a2 v2 ) = a1 T (v1 ) + a2 T (v2 )
Para mayor comprension de la definicion 1.3.15, se daran algunos ejemplos de

transformaciones lineales.
Ejemplo 1.3.16 Sean V y W espacios vectoriales. Defina T : V W por

T (v) = 0 para todo v en V. Entonces
T (v1 + v2 ) = 0 = 0 + 0 = T (v1 ) + T (v2 )

y
T (v) = 0 = 0 = T (v).
Aqu T se llama transformacion cero.
Ejemplo 1.3.17 Sea A una matriz de m n. Defina T : Rn Rm por T (x) =

Ax. Puesto que
A(x + y) = Ax + Ay
y
A(x) = Ax
17
si x y y estan en Rn , vemos que T es una transformacion lineal. En consecuencia:

Cada matriz A de m n da lugar a una transformacion lineal de Rn en Rm .
Ejemplo 1.3.18 Sea V un espacio vectorial. Defina I = V V por I(v) = v

para todo v en V. Aqu I es obviamente una transformacion lineal conocida como
transformacion identidad u operador identidad.
Ejemplo 1.3.19 Sea T : Mmn Mnm definida por T (A) = At . Puesto que
(A + B)t = At + B t
y
(A)t = At
vemos que T , llamado el operador transpuesta, es una transformacion lineal.
Ejemplo 1.3.20 Sea D : C [0, 1] C[0, 1] definida por Df = f . Puesto que
(f + g) = f + g
y
(f ) = f
si f y g son diferenciables, vemos que D es lineal. D se llama operador diferen-
cial.
R1
Ejemplo 1.3.21 Sea J : C[0, 1] R y siendo definida por Jf = 0 f (x)dx.
Puesto que
Z 1 Z 1 Z 1
[f (x) + g(x)]dx = f (x)dx + g(x)dx
0 0 0
y
Z 1 Z 1
f (x)dx = f (x)dx
0 0
1
si f y g son continuas, vemos que J es lineal. Por ejemplo, T (X 3 ) = 4
. J se
llama operador integral.
18
Definicion 1.3.22 Si T : V W es una transformacion lineal, entonces el ker-

nel de T es:
Ker(T ) = {v V : T (v) = 0}
y la imagen de T es:
Im(T ) = {w W : existe un v V con T (v) = w}.
El Kernel es un subespacio de V, dado que si v1 y v2 son dos vectores en el

Kernel y si a y b son cualesquiera dos escalares, entonces:
T (av1 + bv2 ) = aT (v1 ) + bT (v2 ) = a 0 + b 0 = 0.
De forma similar podemos mostrar que la imagen de T es un subespacio de

W.
Sean w1 y w2 elementos de la imagen de T y sean c1 y c2 dos escalares cuales-
quiera. As T (v1 ) = w1 y T (v2 ) = w2 para algunos v1 y v2 en V, y por lo tanto:
T (c1 v1 + c2 v2 ) = c1 T (v1 ) + c2 T (v2 ) = c1 w1 + c2 w2

probando que c1 w1 + c2 w2 es imagen de c1 v1 + c2 + v2 y por consiguiente c1 w1 +
c2 w2 esta tambien en la imagen de T . Lo cual a su vez prueba que la imagen de T
es un subespacio de W.
Veamos algunos ejemplos acerca del Kernel y la Imagen de una transforma-

cion lineal.
Ejemplo 1.3.23 Considere la transformacion lineal T : R3 R2 definida por

la ecuacion:
T (x, y, z) = (4x y + 3z, x + 2y + z)
La matriz para T es:

4 1 3
AT =
1 2 1
19
El correspondiente sistema de ecuaciones lineales homogeneas para T es:
4x y + 3z = 0
x + 2y + z = 0.
El Kernel de T es el mismo que el conjunto solucion del sistema homogeneo.

Es decir, el Ker(T ) es el conjunto de vectores (x, y, z) que satisfacen:
4x y + 3z = 0
x + 2y + z = 0.
o, si usamos x = (x, y, z), podemos describir el Ker(T ) en coordenadas como el

conjunto de vectores x para el cual T (x) = 0. El mismo conjunto puede ser des-
crito en el lenguaje de las matrices. El Kernel de AT es denotado por Ker(AT );
esto es, el conjunto de todos los vectores (x, y, z) satisfaciendo la ecuacion matri-
cial:

x
4 1 3 0
y = .
1 2 1 0
z
Si deseamos encontrar los elementos del Kernel de T , resolvemos el sistema
homogeneo, transformando AT a la forma escalonada por filas.
1 0 79

1
0 1 9
7 1
Por lo tanto, (x, y, z) esta en el Ker(T ) si y solo si x = 9
z yy = 9
z, o si
y solo si:
7 1 7 1
(x, y, z) = ( z, z, z) = z( , , 1).
9 9 9 9
De esta manera, el Ker(T ) es la linea que pasa a traves del origen determinado
por el vector ( 7
9
, 1
9
, 1); tambien puede ser descrito como el subespacio de R3
generado por el vector ( 7 9
, 1
9
, 1).
20
Ejemplo 1.3.24 Consideremos la transformacion lineal vista en el ejemplo ante-

rior. La imagen de T es el conjunto de vectores
T (x, y, z) = (4x y + 3z, x + 2y + z)

donde x, y, z son numeros reales. Tambien puede ser descrito como todos los vec-
tores de la forma:

x
4 1 3
y
1 2 1
z
donde (x, y, z) esta en R3 . Esto se puede describir como todos los vectores que
pueden ser obtenidos aplicando T a cada vector x en R3 . Podemos ser mas explci-
tos describiendo la Im(T ) en este caso en particular, dado que consiste de todos
los vectores que tienen la forma:
(4x y + 3z, x + 2y + z) = x(4, 1) + y(1, 2) + z(3, 1).

De esta manera, la Im(T ) es el subespacio de R3 generado por los vectores (4, 1),
(1, 2) y (3, 1). Tambien puede ser descrito como el subespacio de R3 generado
por las columnas de AT .
1.4. Bases, Dimensiones y Transformaciones Linea-

les con Matrices
Nuestra meta principal en esta seccion es asociar un numero a cada espacio
vectorial, es decir su dimension.
Definicion 1.4.1 Un conjunto de vectores (v1 , ..., vn ), forman una base para el
espacio vectorial V, si dado cualquier vector v en V, existen escalares unicos
a1 , ..., an R con v = a1 v1 + ... + an vn .
Definicion 1.4.2 Dada una base B para un espacio vectorial V. La dimension de

V, denotado por dimB (V), es el numero de elementos de dicha base.
Posteriormente probaremos que cualesquiera dos bases de un espacio vectorial

tienen el mismo numero de elementos. Algunos ejemplos de bases y dimensiones
son los siguientes:
21
1.4. BASES, DIMENSIONES Y TRANSFORMACIONES LINEALES CON
MATRICES
Ejemplo 1.4.3 Sea K un campo cualquiera. Consideremos el espacio vectorial
Kn de todas las n-tuplas de elementos de K. Los vectores:
e1 = (1, 0, 0, 0, ..., 0)
e2 = (0, 1, 0, 0, ..., 0)
.
.
en = (0, 0, 0, 0, ..., 1)
forman una base, llamada la base usual, de Kn . Por lo tanto, Kn tiene dimension
n.
Ejemplo 1.4.4 Sea U el espacio vectorial de todas las matrices 2 3 sobre un

campo F. Entonces las matrices:

1 0 0 0 1 0 0 0 1
, , ,
0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0
, ,
1 0 0 0 1 0 0 0 1
forman una base de U. Luego dimU = 6. De manera mas general, sea V el espacio
de todas las matrices mn sobre K y Eij V la matriz con componentes ij igual
a 1 y 0 en otra parte. Entonces, el conjunto Eij es una base, llamada base usual,
de V; en consecuencia dim V = mn.
Ejemplo 1.4.5 Sea W el espacio vectorial de los polinomios (en t) de grado n.

El conjunto 1, t, t2 , ..., tn es linealmente independiente (mas adelante veremos que
significa que un conjunto de vectores sea linealmente independiente) y genera a
W. Luego es una base de W y por lo tanto dim W = n + 1.
Para entender mejor los ejemplos, y dar otros mas abstractos, veamos la si-
guiente definicion.
Definicion 1.4.6 Sea V un espacio vectorial sobre el campo F y sean v1 , ..., vn

elementos de V. Se dice que v1 , ..., vn son linealmente independientes sobre F si
22
existen escalares a1 , ..., an en F, no todos iguales a cero, tales que:
a1 v1 + ... + an vn = 0.
Si no existen tales numeros, entonces se dice que v1 , ..., vn son linealmente inde-
pendientes.
En otras palabras, los vectores v1 , ..., vn son linealmente independientes si y solo

si se satisface la siguiente condicion:
Siempre que a1 , ..., an sean escalares tales que
a1 v1 + ... + an vn = 0,
entonces ai = 0 para todo i = 1, ..., n.
Ejemplo 1.4.7 Sea V = Rn y considerense los vectores:
E1 = (1, 0, ..., 0)
.
.
En = (0, 0, ..., 1).
Entonces E1 , ..., En son linealmente independientes, esto es, sean a1 , ..., an esca-
lares tales que:
a1 E1 + ... + an En = 0.
Y como
a1 E1 + ... + a1 En = (a1 , ..., an ),

esto implica que todo ai = 0.
Ejemplo 1.4.8 Sea V el espacio vectorial de todas las funciones de una variable
t. Sean f1 , ..., fn n funciones. Decir que estas son linealmente dependientes es
equivalente a decir que existen escalares a1 , ..., an , no todos iguales a cero, tales
23
MATRICES
que:
a1 f (t)1 + ... + an f (t)n = 0

para todos los valores de t.
Ejemplo 1.4.9 Las funciones et , e2t son linealmente independientes. Con el fin
de probar este enunciado, supongase que existen numeros a y b tales que:
aet + be2t = 0
(para todos los valores de t). Derivese esta relacion. Se obtiene:
aet + 2be2t = 0.
Restese la primera relacion de la segunda. Se obtiene be2t = 0 y, por lo tanto,
b = 0. A partir de la primer relacion se deduce que aet = 0 y de aqu que a = 0.
De donde et , e2t resultan ser linealmente independientes.
Ejemplo 1.4.10 Demostrar que los vectores (1, 1) y (3, 2) son linealmente in-
dependientes.
Sean a y b dos escalares tales que:
a(1, 1) + b(3, 2) = 0.
Al escribir esta ecuacion en terminos de las componentes, encontramos que:
a 3b = 0, a + 2b = 0.
Este es un sistema de dos ecuaciones que se resuelve para a y b. Al restar la
segunda ecuacion de la primera, obtenemos 5b = 0, por lo que b = 0. Al sustituir
en cualquier ecuacion, encontramos que a = 0. Por lo tanto, a y b son iguales a
cero y los vectores son linealmente independientes.
En algunos ejemplos se ha mencionado que un conjunto de vectores genera
al espacio vectorial del que se hace mencion, para comprender este hecho, veamos
la siguiente definicion.
Definicion 1.4.11 Un conjunto de vectores (v1 , ..., vn ) genera al espacio vectorial

V si dado cualquier vector v en V, existen escalares a1 , ..., an R con:
v = a1 v1 + ... + an vn .
24
Veamos el siguiente ejemplo para ver como se aplica esta definicion.
Ejemplo 1.4.12 Demostrar que los vectores (1, 1) y (1, 2) forman una base de
R2 .
Tenemos que demostrar que los vectores son linealmente independientes y que
generan a R2 . Para probar la independencia lineal, supongase que a y b son nume-
ros tales que:
a(1, 1) + b(1, 2) = 0;
luego
a b = 0, a + 2b = 0.
Restando la primera ecuacion de la segunda se obtiene 3b = 0, de tal manera que
b = 0. Pero de la primera ecuacion se sabe que a = 0, y se prueba as que los vec-
tores son linealmente independientes. Luego, supongase que (a, b) es un elemento
arbitrario de R2 . Se debe demostrar que existen numeros x, y tales que:
x(1, 1) + y(1, 2) = (a, b).

En otras palabras, se debe resolver el sistema de ecuaciones:
x y = a,
x + 2y = b.
Restese nuevamente la primera ecuacion de la segunda. Encontramos que:
3y = b a
por lo que:
ba
y= ,
3
y finalmente:
ba
x=y+a= + a.
3
25
MATRICES
Esto prueba lo que se quera. De acuerdo con las definiciones, (x, y) son las coor-
denadas de (a, b), con respecto a la base (1, 1), (1, 2).
Hemos visto que los espacios vectoriales pueden tener muchas bases. Surge
naturalmente una pregunta: Tienen todas las bases el mismo numero de vecto-
res? En R3 , la respuesta es si. Para ver esto, notese que cualesquiera tres vectores
linealmente independientes de R3 forman una base. El teorema siguiente dice que
la pregunta formulada con anterioridad tiene una respuesta afirmativa para todos
los espacios vectoriales.
Teorema 1.4.13 Si u1 , ..., um y v1 , ..., vn son bases del espacio vectorial V, en-
tonces m = n; esto es, cualesquiera dos bases en un espacio vectorial V poseen
el mismo numero de vectores.
Demostracion: Sean S1 = u1 , ..., um y S2 = v1 , ..., vn dos bases de V. De-

bemos demostrar que m = n. Se realizara lo anterior probando que si m > n,
entonces S1 es un conjunto linealmente dependiente, lo cual contradice la hipote-
sis de que S1 es una base. Esto probara que m n. La misma demostracion
hara ver que n m, y esto corroborara el teorema. As pues, basta demostrar que
si m > n entonces S1 es linealmente dependiente. Como S2 es una base, podemos
escribir ui como combinacion lineal de los terminos vi . Se tiene que:
u1 = a11 v1 + a12 v2 + ... + a1n vn

u2 = a21 v1 + a22 v2 + ... + a2n vn
.
.
.
um = am1 v1 + am2 v2 + ... + amn vn
(1.2)
Para demostrar que S1 es dependiente, hay que encontrar escalares c1 , ..., cm ,

no todos cero, tales que:
c1 u1 + ... + cm um = 0 (1.3)
26
Sustituyendo (1.2) en (1.3),
c1 (a11 v1 + a12 v1 + ... + a1n vn ) + c2 (a21 v1 + a22 v2 + ... + a2n vn )+
... + cm (am1 v1 + am2 v2 + ... + amn vn ) = 0 (1.4)

que puede expresarse como:
(a11 c1 + a21 c1 + ... + am1 cm )v1 + (a12 c1 + a22 c2 + ... + am2 cm )v2 +
... + (a1n c1 + a2n c2 + ... + amn cm )vn = 0 (1.5)

Puesto que v1 , ..., vn son linealmente independientes debemos tener que:
a11 c1 + a21 c2 + ... + am1 cm = 0

a12 v1 + a22 v2 + ... + am2 cm = 0
.
.
.
a1n c1 + a2n c2 + ... + amn cm = 0
(1.6)
El sistema (1.6) es homogeneo de n ecuaciones en m incognitas c1 , ..., cm . Y

como m > n, entonces el sistema tiene un numero infinito de soluciones. En con-
secuencia, existen escalares b1 , ..., bm no todos cero, tales que se satisface (1.3),
y por lo tanto, S1 es dependiente. Esta contradiccion demuestra que m n, y
que al intercambiar los papeles de S1 y S2 , es posible demostrar que n m y la
demostracion queda completa.
Nuestra meta ahora es mostrar como las transformaciones lineales T : V

W entre espacios de dimension finita, pueden ser representados como una multi-
plicacion de matrices, siempre que fijemos las bases para los espacios vectoriales
V y W.
Primero fijamos una base v1 , ..., vn para V y una base w1 , ..., wn para W. Antes
observese, que para una transformacion lineal T , necesitamos mostrar como ca-
da elemento del espacio n-dimensional V puede ser representado como un vector
27
MATRICES
columna en Rn y como cada elemento del espacio m-dimensional W puede ser

representado como un vector columna de Rm . Dado cualquier vector v en V, por
la definicion de base, existen escalares unicos a1 , ..., an tal que:
v = a1 v1 + ... + an vn
De esta manera, representaremos al vector v como el vector columna:

a1

.

.

.
an
Similarmente, para cualquier vector w en W, existen escalares unicos b1 , ..., bn

tal que:
w = b1 w1 + ... + bn wn
Y as, podemos representar a w como el vector columna:

b1

.

.

.
bn
Notese que hemos establecido una correspondencia entre vectores en V y W,

y vectores columna Rn y Rm , respectivamente. Ahora queremos representar una
transformacion lineal T : V W como una matriz A de m n. Para cada base
vi en el espacio vectorial V, T (vi ) sera un vector en W. De esta manera, existiran
escalares a1i , ..., ami tal que:
T (vi ) = a1i w1 + ... + ami wm .
Queremos ver que una transformacion lineal T , correspondera a una matriz de

m n:
28

a11 a12 . . . a1n

. . . . . .

. . . . . .

. . . . . .
am1 . . . . amn
Dado cualquier vector v en V, con v = a1 v1 + ... + an vn , tenemos que:
T (v) = T (a1 v1 + ... + an vn )

= a1 T (v1 + ... + an T (vn ))
= a1 (a11 w1 + ... + am1 wm ) + ...
+an (a1n w1 + ... + smn wm ).
Pero bajo la correspondencia de espacios vectoriales con varios espacios co-

lumna, esto puede corresponder a la multiplicacion de matrices de A veces el
vector columna correspondiente al vector v:

a11 a12 . . . a1n a1 b1

. . . . . .
.
.

. . . . . .
. =
.

. . . . . . . .
am1 . . . . amn an bm
Notese que si T : V V es una transformacion lineal de un espacio vec-
torial a si mismo, entonces la correspondiente matriz sera de n n, es decir, una
matriz cuadrada.
1.5. El Determinante
Nuestro siguiente paso sera dar una definicion para el determinante de una ma-
triz. De hecho, daremos tres definiciones alternas del determinante. Las tres son
equivalentes; cada una tiene sus propias ventajas.
29
1.5. EL DETERMINANTE
Primero definiremos el determinante de una matriz de 1 1, y despues defini-

remos recursivamente el determinante de una matriz de n n.
Definicion 1.5.1 El determinante de una matriz de 1 1, (a), es la funcion real:
det(a) = a.
Antes de dar una definicion para el determinante de una matriz general de

n n, necesitamos una breve notacion. Para una matriz A de n n:

a11 a12 . . a1n
. . . . .

. . . . .

. . . . .
an1 . . . ann
denotaremos por Aij a la matriz (n 1) (n 1) obtenida de A al remo-
ver la i-esima fila y la j-esima
columna.
Aij se denomina ij-esimo menor de
a11 a12
A. Por ejemplo, si A = , entonces A12 = (a21 ). Similarmente, si
a21 a22

2 3 5
6 9
A = 6 4 9 , entonces A12 = .
7 8
7 1 8
Ahora que tenemos la definicion para el determinante de una matriz de 1 1,
podemos ahora suponer, por medio de la induccion, que conocemos el determi-
nante de cualquier matriz de (n 1) (n 1) elementos, y usaremos esto para
encontrar el determinante de una matriz de n n.
Definicion 1.5.2 Sea A una matriz de n n. Entonces el determinante de A es:

n
X
det A = (1)k+1 a1k det(A1k ).
k=1

a11 a12
De esta manera, para A = , tenemos que:
a21 a22
det A = a11 det A11 a12 det A12 = a11 a22 a12 a21 ,
30
la cual es una formula que ya nos es familiar. El determinante de la matriz de 3 3

antes vista es:

2 3 5
4 9 6 9 6 4
det 6 4 9
= 2 det 3 det + 5 det .
1 8 7 8 7 1
7 1 8
La definicion anterior es sin duda eficiente para describir el determinante pero
es poco intuitiva.
La segunda forma para describir el determinante, provee las propiedades al-
gebraicas basicas del determinante. En el se destacan las propiedades de la teoria
funcional de los determinantes.
Denotemos a la matriz A de n n elementos como A = (A1 , ..., An ), donde
Ai denota la i-esima columna:

a1i
a2i

Ai = . .

.
ani
Definicion 1.5.3 El determinante de A esta definida como la unica funcion real:
det : Matrices R
que satisface:
a) det(A1 , ..., Ak , ..., An ) = det(A1 , ..., Ak ).
b) det(A1 , ..., Ak + Ai , ..., An ) = det(A1 , ..., An ) para k 6= i.
c) det I = 1.
De esta manera, tratamos cada vector columna de una matriz como un vec-
tor en Rn , el determinante puede ser visto como un tipo especial de funcion de
Rn ... Rn a los numeros reales.
31
La tercera forma de definicion para el determinante es la mas geometrica, pe-

ro tambien es poco formal. Pensemos en una matriz A de n n elementos, como
una transformacion lineal de Rn a Rn . Entonces A mapeara el cubo unitario en Rn
a algun objeto diferente (un paraleleppedo). El cubo unitario tiene,por definicion,
un volumen de uno.
Definicion 1.5.4 El determinante de la matriz A es el volumen con signo de la

imagen del cubo unitario.
Este concepto no esta bien definido, ya que la definicion del volumen de la

imagen no ha sido descrito. De hecho, uno podra definir el volumen con signo de
la imagen como el numero dado por el determinante usando una de las definicio-
nes anteriores. Definir el concepto de volumen con signo puede darse de manera
rigurosa pero se perder mucha intuicion geometrica .

2 0
Por ejemplo, la matriz A = toma el cuadrado unitario, y lo trans-
0 1
forma en un paraleleppedo que tiene el doble de area que el cuadrado unitario,
por lo tanto,
det A = 2.
Por volumen con signo entenderemos, que si las orientaciones de los lados del
cubo unitario son cambiadas, entonces podemos tener como volumen
un numero
2 0
negativo. Por ejemplo, consideremos la matriz A = . Aqu la imagen
0 1
es el mismo paraleleppedo de area doble del ejemplo anterior, pero notemos que
la orientacion de los lados han cambiado, y por lo tanto, tenemos que:
det A = 2.
Para definir rigurosamente la orientacion es algo complicado (lo haremos en
un capitulo posterior), pero su significado es sencillo.
El determinante tiene muchas propiedades algebraicas. A continuacion vere-

mos cuales son esas propiedades.
Propiedad 1: Si cualquier renglon o columna de A es el vector cero, entonces

det A = 0.
32
Propiedad 2: Si el i-esimo renglon o la j-esima columna de A se multiplican

por la constante c, entonces det A se multiplica por c. Es decir, si llamamos a esta
nueva matriz B, entonces:

a11 a12 ... a1n a11 a12 ... a1n

a21 a22 ... a2n

a21 a22 ... a2n

. . .

. . .

. . .

. . .
. . .
= c det . . . = c det A
det B = det

cai1 cai2 ... cain

ai1 ai2 ... ain

. . .

. . .

. . .

. . .
. . . . . .
an1 an2 . ann an1 an2 . ann
Propiedad 3: Sean:

a11 a12 ... a1j ... a1n a11 a12 ... 1j ... a1n

a21 a22 ... a2j ... a2n

a21 a22 ... 2j ... a2n

. . . . . . . .
A= , B =

. . . .
.
. . .
. . . . . . . .
an1 an2 ... anj ... ann an1 an2 ... nj ... ann
y

a11 a12 ... a1j + 1j ... a1n

a21 a22 ... a2j + 2j ... a2n

. . . .
C=

. . . .
. . . .
an1 an2 ... anj + nj ... ann
Entonces:
det C = det A + det B.

Propiedad 4: Si se intercambian dos renglones (o columnas) cualesquiera de
A, entonces el valor del determinante cambia de signo. Propiedad 5: Si A tiene
33
dos renglones o columnas iguales, entonces det A = 0.
Propiedad 6: Si un renglon (columna) de A es un multiplo constante de otro

renglon (columna), entonces det A = 0.
Propiedad 7: Si un multiplo de un renglon (columna) de A se suma a otro

renglon (columna) de A, el determinante no cambia.
Propiedad 8: Sean A y B matrices de n n. Entonces:
det AB = det A det B.

Ahora veremos algunos ejemplos del determinante y de sus propiedades.
Ejemplo 1.5.5 Sea

3 5 2
A = 4 2 3 .
1 2 4
Calcule det A.
Solucion:

3 5 2
det(A) = det 4 2 3
1 2 4

2 3 4 3 4 2
= 3 det 5 det + 2 det
2 4 1 4 1 2
= 3 2 5 19 + 2 10 = 69
Ejemplo 1.5.6 Sea

2 1 4
A= 0 1 5 .
6 3 4
Encuentre A13 y A32 .
34
Solucion: Eliminando el primer renglon y la tercera columna de A, obtene-

mos:

0 1
A13 = .
6 3
Analogamente, si eliminamos el tercer renglon y la segunda columna de A,
obtenemos:

2 4
A32 = .
0 5
Ejemplo 1.5.7 Propiedad 1: Es facil verificar que:

2 3 5
det 0 0 0 = 0
1 2 4
ya que:

0 0 0 0 0 0
2 det 3 det + 5 det
2 4 1 4 1 2
= 2 0 3 0 + 5 0 = 0 0 + 0 = 0.
Ejemplo 1.5.8 Propiedad 2: Sea

1 1 2
A = 3 1 4 .
0 2 5
Entonces det A = 16. Si multiplicamos el segundo renglon por 4, tenemos

1 1 2
B = 12 4 16
0 2 5
y det B = 64 = 4 det A. Si se multiplica la tercera columna por 3, obtenemos

1 1 6
C = 3 1 12
0 2 15
y det C = 48 = 3 det A.
35
Ejemplo 1.5.9 Propiedad 3: Sean

1 1 2 1 6 2
A= 3 1 4 ,B = 3 2 4
0 2 5 0 4 5
y

1 1 6 2 1 7 2
C= 3 1+2 4 = 3 3 4 .
0 2 + 4 5 0 2 5
Entonces det A = 16, det B = 108 y det C = 124 = det A + det B.

1 1 2
A = 3 1 4 .
0 2 5
Si intercambiamos el primero y el tercer renglon, obtenemos

0 2 5
B = 3 1 4 .
1 1 2
Si intercambiamos la primera y la segunda columnas de A, obtenemos

1 1 2
C = 1 3 4 .
2 0 5
Entonces, por calculos directos, det A = 16 y det B = det C = 16.

1 1 2
A= 5 7 3
1 1 2
[dos renglones iguales] y sea

5 2 2
B = 3 1 1
2 4 4
36
[dos columnas iguales], se tiene que det A = 1 17 (1) 7 + 2 (12) = 0 y

det B = 5 0 2 10 + 2 10 = 0.

2 3 5
A= 1 7 2 ,
4 6 10
su determinante es det A = 2 (82) (3) (2) + 5 (34) = 0, puesto que
el tercer renglon es el primer renglon multiplicado por 2.

1 1 2
A = 3 1 4 .
0 2 5
Entonces det A = 16. Si multiplicamos el tercer renglon por 4 y lo sumamos al
segundo renglon, obtenemos una nueva matriz B dada por:

1 1 2 1 1 2
B= 3 + 4(0) 1 + 4(2) 4 + 5(4) = 3 7 24
0 2 5 0 2 5
y as det B = 16 = det A.
Ejemplo 1.5.14 Propiedad 8: Sean

1 1 2 1 2 3
A = 3 1 4 y B = 0 1 4 .
0 2 5 2 0 2
Entonces det A = 16 y det B = 8. Calculamos:

1 1 2 1 2 3 5 1 5
AB = 3 1 4 0 1 4 = 11 7 5
0 2 5 2 0 2 10 2 18
y as det AB = 128 = (16)(8) = det A det B.
37
1.6. PRIMER TEOREMA FUNDAMENTAL DEL ALGEBRA LINEAL
1.6. Primer Teorema Fundamental del Algebra Li-

neal
Aqu presentaremos una version del primer teorema fundamental del algebra
lineal, el cual nos presenta dos variantes, para matrices y para transformaciones
lineales.
Teorema 1.6.1 Sea A una matriz de n n elementos. Entonces las siguientes

propiedades son equivalentes:
1. A es invertible.
2. det A 6= 0.
3. ker A = 0.
4. Si b es un vector columna en Rn , existe un unico vector columna x en Rn

que satisface Ax = b.
5. Las columnas de A son vectores columna n 1 linealmente independientes.
6. Las filas de A son vectores fila 1 n linealmente independientes.
7. La transpuesta At de A es invertible. (Si A = (aij ), entonces At = (aji)).
Ahora vamos a restablecer este teorema en terminos de las transformaciones

lineales.
Teorema 1.6.2 Sea T : V V una transformacion lineal. Entonces las si-

guientes propiedades son equivalentes:
38
1. T es invertible.
2. det T 6= 0, donde el determinante esta definida por una base elegida sobre
V.
3. ker T = 0.
4. Si b es un vector en V, existe un unico vector v en V que satisface T (v) = b.
5. Para cualquier base v1 , ..., vn de V, la imagen de los vectores T (v1 ), ..., T (vn )
son linealmente independientes.
6. Para cualquier base v1 , ..., vn de V, si S denota la transformacion lineal

transpuesta de T , entonces la imagen de los vectores S(v1 ), ..., S(vn ) son
linealmente independientes.
7. La transpuesta de T es invertible. (Aqu la transpuesta esta definida por

una base elegida sobre V).
1.7. Matrices Similares

Recordemos que dada una base para un espacio vectorial V, n dimensional,
podemos representar una transformacion lineal:
T : V V
como una matriz A de n n. Desafortunadamente, si se elije una base diferente
para V, la representacion matricial de la transformacion lineal sera muy diferente
de la matriz original A. La meta de esta seccion es encontrar un criterio claro para
cuando dos matrices representan la misma transformacion lineal pero bajo dife-
rentes bases.
39
1.7. MATRICES SIMILARES
Definicion 1.7.1 Dos matrices A y B son similares si existe una matriz C inver-
tible tal que:
A = C 1 BC
Lo que queremos es ver que dos matrices son similares, precisamente, cuando
ellas representan la misma transformacion lineal. Elijamos dos bases para el es-
pacio vectorial V, es decir, v1 , ..., vn (la base v) y w1 , ..., wn (la base w). Sea A la
matriz que representa a la transformacion lineal T para la base v y sea B la matriz
que representa a la transformacion lineal para la base w. Deseamos construir la
matriz C tal que A = C 1 BC.
Recordemos que dada la base v, podemos escribir cada vector z V como un

vector columna n 1 como sigue: sabemos que existen escalares unicos a1 , ..., an
con:
z = a1 v1 + ... + an vn .
Entonces escribimos a z, con respecto a la base v, como el vector columna:

a1

.

. .

.
an
Similarmente, existen escalares unicos b1 , ..., bn tal que:
z = b1 w1 + ... + bn wn ,
lo que significa, que con respecto a la base w, el vector z es el vector columna:

b1

.

. .

.
bn
40
La matriz deseada C, sera una matriz tal que:

a1 b1
. .

C . = . .

. .
an bn
Si C = (cij ), entonces las entradas cij son precisamente aquellos numeros que
cumplen:
wi = ci1 v1 + ... + cin vn .

Entonces, para que las matrices A y B representen la misma transformacion li-
neal, necesitamos que el siguiente diagrama conmute:
Rn
A Rn

C C
n

R B Rn
es decir, CA = BC, o:
A = C 1 BC
como se deseaba.
Determinar cuando dos matrices son similares es un tipo de resultado que apa-
rece con frecuencia en las aplicaciones de las matematicas. Regularmente se debe
elegir un sistema de coordenadas (alguna base) con el fin de escribir cualquier
cosa, pero las matematicas o la fsica subyacente que le interesa es independiente
de la eleccion inicial. La pregunta clave es: que se conserva cuando el sistema de
coordenadas se cambia? Las matrices similares nos permiten empezar a compren-
der estas cuestiones.
Ahora vamos a ver algunos ejemplos de matrices similares.
Ejemplo 1.7.2 Sean

2 1 4 2
A= ,B =
0 1 5 3
41
1.7. MATRICES SIMILARES
y

2 1
C= .
1 1
Entonces

2 1 4 2 3 1
CB = =
1 1 5 3 1 1
y

2 1 2 1 3 1
AC = = .
0 1 1 1 1 1
De esta manera CB = AC. Puesto que det C = 2 (1)(1) = 1 6= 0, C es
invertible: ya que CB = AC, tenemos C 1 CB = C 1 AC o bien B = C 1 AC.
Esto muestra que A y B son similares.
Ejemplo 1.7.3 Sean

1 0 0 6 3 25
D = 0 1 0 , A = 2 1 8
0 0 2 2 2 7
y

2 4 3
C = 0 1 1 .
3 5 7
C es invertible por que det C = 2(7 + 5) 4(3) + 3(3) = 3 6= 0. Entonces
calculamos:

2 4 3 6 3 25 2 4 3
CA = 0 1 1 2 1 8 = 0 1 1
3 5 7 2 2 7 6 10 14

1 0 0 2 4 3 2 4 3
DC = 0 1 0 0 1 1 = 0 1 1
0 0 2 3 5 7 6 10 14
De esta manera CA = DC y A = C 1 DC, por lo que A y D son similares.
42
1.8. Valores Propios y Vectores Propios

En la ultima seccion observamos que dos matrices representan la misma trans-
formacion lineal, bajo diferentes bases elegidas, precisamente, cuando estas ma-
trices son similares. Sin embargo, esto no nos dice como elegir una base para
un espacio vectorial, para que una transformacion lineal tenga una representacion
matricial adecuada. Por ejemplo, la matriz diagonal:

1 0 0
A= 0 2 0
0 0 3
es similar a la matriz:

1 4 5
1
B = 1 8 1
4
5 4 15
pero se puede reconocer la simplicidad de A respecto a B.
Uno de los propositos detras de las siguientes definiciones para valores pro-
pios y vectores propios es darnos las herramientas para escoger buenas bases. Sin
embargo, existen muchas otras razones para entender los valores propios y los
vectores propios.
Definicion 1.8.1 Sea T : V V una transformacion lineal. Entonces un vector

v V, no cero, es un vector propio de T con valor propio , un escalar, si:
T (v) = v.
Para una matriz A de n n elementos, un vector columna x Rn , no cero, es un
vector propio con valor propio , un escalar, si:
Ax = x.
Geometricamente, un vector v es un vector propio de la transformacion lineal

T con valor propio , si T extiende a v mediante el factor .
43
1.8. VALORES PROPIOS Y VECTORES PROPIOS
Por ejemplo,

2 2 1 1
=2
6 5 2 2

1
y, de esta manera, 2 es un valor propio y es un vector propio para la
2
2 2
transformacion lineal representada por la matriz .
6 5
Por suerte, existe una forma facil para describir los valores propios de una matriz
cuadrada, la cual nos permitira observar que los valores propios de una matriz se
preservan bajo transformaciones similares.
Proposicion 1.8.2 Un numero es un valor propio de una matriz cuadrada A, si

y solo si, es una raz del polinomio:
P (t) = det(tI A).

El polinomio P (t) = det(tI A) es llamado el polinomio caracteristico de la
matriz A.
Demostracion : Supongamos que , es un valor propio de A, con vector pro-

pio v. Entonces Av = v, o:
v Av = 0,
donde el cero del lado derecho de la igualdad es el vector columna cero. Entonces,
usando la matriz identidad I, tenemos que:
0 = v Av = (I A)v.
De esta manera, la matriz I A tiene un kernel no trivial, v. Por el teorema
fundamental del algebra lineal, esto sucede precisamente cuando:
det(I A) = 0,
lo cual significa que es una raz del polinomio caracterstico P (t) = det(tI A).
Ya que todas estas direcciones se pueden invertir, tenemos nuestro teorema.
44
Teorema 1.8.3 Sean A y B dos matrices similares. Entonces el polinomio carac-

terstico de A es igual al polinomio caracterstico de B.
Demostracion : Para las matrices A y B que son similares, existe a lo mas una
matriz invertible C con A = C 1 BC. Entonces:
det(tI A) = det(tI C 1 BC)

= det(tC 1 C C 1 BC)
= det(C 1 ) det(tI B) det C
= det(tI B)
usando el hecho de que 1 = det(C 1 C) = det(C 1 ) det C.
Ya que los polinomios caractersticos para matrices similares son los mismos,
esto significa que los valores propios a lo mas seran los mismos.
Corolario 1.8.4 Los valores propios para matrices similares son iguales.
De esta manera, para que verificar si dos matrices son similares se pueden
comparar los valores propios de ambas. Si los valores propios no son los mismos,
las matrices no son similares. Desafortunadamente, en general, aun teniendo valo-
res propios iguales, no se puede forzar a las matrices a ser similares. Por ejemplo,
las matrices:

1 7 1 0
A= yB=
0 2 0 2
ambos tienen valores propios de 1 y 2, pero no son similares.
Dado que el polinomio caracterstico P (t) no cambia bajo transformaciones

similares, los coeficientes de P (t) no cambiaran bajo transformaciones similares.
Pero, como los coeficientes de P (t) pueden ser a si mismos polinomios (posi-
blemente complicados) de las entradas de la matriz A, ahora tenemos algunos
polinomios especiales de las entradas de A que son invariantes bajo transforma-
ciones similares. Uno de estos coeficientes ya lo hemos visto es el determinante
de A, como lo muestra el siguiente teorema. Este teorema enlaza de forma muy
45
importante los valores propios de A con el determinante de A.
Teorema 1.8.5 Sean 1 , ..., n los valores propios, que cuentan con multiplici-
dad, de una matriz A. Entonces:
det A = 1 , ..., n
Antes de probar este teorema, necesitamos discutir la idea de que los valores
propios cuenten con multiplicidad. La dificultad es que un polinomio puede tener
una raz que puede ser contado mas de una vez (por ejemplo, el polinomio (x2)2
tiene una raz real, que es 2, la cual se puede contar dos veces). En particular, esto
suele suceder en el polinomio caracterstico. Por ejemplo, considere la matriz:

5 0 0
0 5 0
0 0 4
el cual contiene el siguiente polinomio caracterstico cubico:
(t 5)(t 5)(t 4)
Por el teorema anterior, podemos enlistar los valores propios como 4, 5 y 5,
por lo tanto, contiene el valor propio 5 dos veces.
Demostracion Dado que los valores propios 1 , ..., n son las races (comple-
jas) del polinomio caracterstico det(tI A), tenemos que:
(t 1 ) (t n ) = det(tI A).
Poniendo a t = 0, obtenemos:
(1)n 1 n = det(A)
En la matriz (A), cada columna de A es multiplicada por (1). Usando la se-
gunda definicion de un determinante, podemos factorizar cada una de los (1) s,
como sigue:
(1)n 1 n
y as obtenemos el resultado que espervabamos.
46
Ahora, finalmente toca el turno para determinar una buena base para la re-
presentacon de la transformacion lineal. El criterio de lo bueno, es lo cerca que
la matriz esta de ser una matriz diagonal. Nos limitaremos a una especial, pero
muy frecuente clase: las matrices simetricas. Por simetricas, entenderemos que si
A = (aij ), entonces requeriremos que las entradas de la i-esima fila y la j-esima
columna de (aij ) a lo mas sean iguales a las entradas de la j-esima fila y la i-esima
columna de aji . De esta manera:

5 3 4
3 5 2
4 2 4
es simetrica, pero:

5 2 3
6 5 3
2 18 4
no lo es.
Teorema 1.8.6 Si A es una matriz simetrica, entonces existe una matriz B simi-
lar a A que no solo es diagonal, pero con las entradas a lo largo de la diagonal
siendo precisamente los valores propios de A.
Demostracion : La prueba consistira basicamente, en mostrar que los vectores

propios de A forman una base en la cual A llegara a ser nuestra matriz diagonal
deseada. Supondremos que los valores propios de A son distintos, tecnicamente,
la dificultad ocurre cuando existen valores propios con multiplicidad.
Sean v1 , ..., vn vectores propios para la matriz A, con correspondientes valores
propios 1 , ..., n . Formamos la matriz:
C = (v1 , ..., vn )
donde la i-esima columna de C es el vector columna vi . Mostraremos que la ma-

triz C 1 AC satisface nuestro teorema. De esta manera, deseamos mostrar que
C 1 AC es igual a la matriz diagonal:
47

1 0 ... 0

. . . .

B=
. . . . .

. . . .
0 0 ... n
Denotemos lo siguiente:

1 0 0

0

1

0

e1 =
. , e2 =
. , ... en =
. .

. . .
0 0 1
Entonces, la matriz diagonal B anterior, es la unica matriz con Bei = i ei , para

todo i. De nuestra eleccion de la matriz C, nos lleva claramente a observar que,
para todo i, Cei = vi . Entonces, tenemos que:
C 1 ACei = C 1 Avi = C 1 (i vi ) = i C 1 vi = i ei ,
dandonos as, nuestro teorema.
En los siguientes ejemplos se detalla la forma de determinar los valores pro-

pios y los vectores propios de una matriz.

3 2
Ejemplo 1.8.7 Sea A = ; el polinomio caracterstico de A es:
2 0

3 2
det(I A) = det = 2 3 4.
2
La ecuacion caracterstica es:
2 3 4 = 0
y obtenemos ( 4)( + 1) = 0, de modo que 1 = 1 y 2 = 4 son valores

propios de A.
48

4 2
Ejemplo 1.8.8 Sea A = . Entonces
3 3

4 2
det(I A) = det
3 3
= ( 4)( 3) 6 = 2 7 + 6
= ( 1)( 6) = 0.
De esta manera los valores propios de A son 1 = 1 y 2 = 6. Para 1 = 1,

resolvemos (I A)v = 0, o bien,

3 2 x1 0
= .
3 2 x2 0
Evidentemente, todo vector propio correspondiente a 1 = 1 satisface 3x1
2x2 = 0. Uno de estos vectores propios es

2
v1 = .
3
Analogamente, la ecuacion (6I A)v = 0 significa que

2 2 x1 0
= ,
3 3 x2 0
o x1 = x2 . Por consiguiente,

1
v2 =
1
es un vector propio correspondiente a 2 = 6.

3 5
Ejemplo 1.8.9 Sea A = . Entonces
1 1

3 5
det(I A) = det = 2 2 + 2 = 0
1 + 1
y:
p
(2) 4 4(1)(2) 2 4 2 2i
1,2 = = = =1i
2 2 2
49
1.9. ESPACIOS VECTORIALES DUALES
De esta manera 1 = 1 + i y 2 = 1 i. Calculamos:

2 + i 5 x1 0
[(1 + i)I A]v = =
1 2+i x2 0
y obtenemos (2 + i)x1 + 5x2 = 0 y x1 + (2 + i)x2 = 0. De esta manera
x1 = (2 + i)x2 , lo cual nos da el vector propio

2+i
v1 = .
1
Analogamente:

2 i 5 x1 0
[(1 i)I A]v = =
1 2i x2 0
o bien x1 + (2 i)x2 = 0, lo cual proporciona x1 = (2 i)x2 , y nos da el vector
propio

2i
v2 =
1
.
1.9. Espacios Vectoriales Duales

Ha llegado el momento de estudiar, un poco, las funciones. De hecho, las fun-
ciones, a veces, parecen ser mas basicas que sus propios dominios. En el contexto
del algebra lineal, la clase natural de funciones son las transformaciones linea-
les, o los mapeos lineales de un espacio vectorial a otro. Entre todos los espacios
vectoriales, existe uno que parece ser el mas simple, conocido, como el espa-
cio vectorial unidimensional de los numeros reales R. Ahora nos toca examinar
un tipo especial de transformaciones lineales sobre un espacio vectorial, los que
asignan al espacio vectorial a los numeros reales, el conjunto de lo que llamare-
mos el espacio dual.
Sea V un espacio vectorial. El espacio vectorial dual, o espacio dual, es:
V = { mapeos lineales de V a los numeros reales R}

= {v : V R | v es lineal }.
50
Los elementos de V se conocen como funcionales o funcional lineal. Se pue-

de verificar que el espacio dual V es en si mismo un espacio vectorial.
Sea T : V W una transformacion lineal. Entonces podemos definir otra

transformacion lineal:
T : W V
del dual de W al dual de V como sigue. Sea w W . Entonces, dado cualquier
vector w en el espacio vectorial W, sabemos que w (w) sera un numero real. Ne-
cesitamos definir T tal que T (w ) V . De esta manera, dado cualquier vector
v V, necesitamos que T (w )(v) sea un numero real. Simplemente definimos:
T (w )(v) = w (T (v)).
Por cierto, tengamos en cuenta que la direccionde la transformacion lineal
T : V W es, en efecto, invertida a T : W V . Tambien, por transfor-
macion lineal transpuesta, entenderemos que el mapeo T no es obvio, sino que
puede ser el unico asociado a la transformacion original T .
En los siguientes ejemplos, se mostrara, con un poco mas de detalle, lo que es

un funcional lineal de un espacio dual.
Ejemplo 1.9.1 Sea i : Kn K la proyeccion i-esima, es decir, i (a1 , a2 , ..., an ) =

ai . Entonces i es lineal y, por lo tanto, es un funcional lineal en Kn .
Ejemplo 1.9.2 Sean V el espacio vectorial de las matrices n-cuadradas sobre K

y T : V K la aplicacion traza:
T (A) = a11 + a22 + ... + ann

donde A = (aij ). Esto es, T asigna a cada matriz A la suma de sus elementos
diagonales. Esta aplicacion es lineal, de modo que define un funcional lineal en
V.
Ejemplo 1.9.3 Sea V = Kn , el espacio vectorial de las n tuplas que escribi-

remos como vectores columnas. Entonces, el espacio dual V se puede identifi-
car con el espacio de los vectores filas. En particular, cualquier funcional lineal
51
1.10. ELIMINACION GAUSIANA
v = (a1 , ..., an ) en V tiene la representacion:

x1

x2

.
v (x1 , ..., xn ) = (a1 , a2 , ..., an ) .

.

.
xn
Ejemplo 1.9.4 Sea V el espacio vectorial de las funciones continuas definidas so-
bre el intervalo [0, 1] y evaluadas en los reales. Se puede definir un funcional lineal
sobre V mediante la formula:
Z 1
L(f ) = f (t)dt
0
para f V. Las propiedades estandar de la integral demuestran que se trata de
una aplicacion lineal. Si f0 es un elemento fijo de V, entonces la aplicacion:
Z 1
f 7 f0 (t)f (t)dt
0
tambien es un funcional lineal sobre V.
Ejemplo 1.9.5 Sea V tal como se indica en el ejemplo 4. Sea : V R la
aplicacion tal que (f ) = f (0). Entonces es un funcional lineal, conocida como
funcional de Dirac.
1.10. Eliminacion Gausiana

Uno de los metodos mas importantes para resolver un sistema lineal de ecua-
ciones es la eliminacion Gausiana. La idea principal del metodo es ir eliminando
las incognitas de una manera sistematica, de tal manera que se termine con un
sistema triangular. La ventaja de este metodo es que los sistemas triangulares son
muy faciles de resolver. Considere el sistema:
a11 x1 + a12 x2 + + a1n xn = b1
a21 x1 + a22 x2 + + a2n xn = b2
.. .. ..
. . .
an1 x1 + an2 x2 + + ann xn = bn
52
Supongase que la matriz A = (aij ) es no singular, es decir, el sistema Ax = b

tiene una unica solucion. Si a11 6= 0, se puede eliminar x1 de las ultimas n 1
ecuaciones restando de la i-esima ecuacion el multiplo
ai1
li1 = , i = 2, 3, . . . , n
a11
de la primera ecuacion. Entonces las ultimas n 1 ecuaciones toman la forma:
(2) (2) (2)
a22 x2 + + a2n xn = b2
.. .. ..
. . .
(2)
an2 x2 + + ann xn = b(2)
(2)
n
(2) (2)
donde los nuevos coeficientes estan dados por aij = aij li1 a1j , bi = bi li1 b1
i = 2, 3, . . . n. El sistema resultante es de n1 ecuaciones con n1 incognitas. Si
(2)
a22 6= 0, de manera analoga se puede eliminar x2 de las ultimas n 2 ecuaciones
para obtener un sistema de n 2 ecuaciones con las incognitas x3 , x4 , . . . xn . Si
escogemos
(2)
ai2
li2 = (2) , i = 3, . . . , n
a22
entonces los coeficientes del sistema pueden escribirse como
(3) (2) (2) (3) (2) (2)
aij = aij mi2 a2j , bi = bi mi2 b2 i = 3, . . . , n.
(2) (2)
Los elementos a11 , a22 , a33 , . . . que aparecen durante la eliminacion son lla-
mados pivotes. Si todos los pivotes son distintos de cero se puede continuar este
proceso de eliminacion, despues de n 1 pasos se llega a la ecuacion
a(n) (n)
nn xn = bn .
Tomando la primera ecuacion en cada paso se obtiene un sistema triangular

Ux = c. Notese que el lado derecho del sistema original b tambien fue trans-
formado al vector c usando el mismo tipo de operaciones que en las columnas
de la matriz A. El proceso de b a c es importante, multiplos de una componente
fueron restados de otra componente. Estos multiplos son usados para formar una
nueva matriz, denotada por L, de tal manera que los pasos para pasar de b a c
sean los mismos que resolver Lc = b. De aqu podemos deducir que el proceso
de eliminacion consiste en descomponer el sistema Ax = b en dos sistemas trian-
gulares, primero Lc = b y despues Ux = c. Las matrices L y U provienen de la
53
1.10. ELIMINACION GAUSIANA
eliminacion en el lado izquierdo del sistema original; L contiene a los multiplos

y U contiene el resultado final. Es importante notar que el producto de L y U es
igual a A. En el caso en que la matriz sea simetrica L y U estan ligadas. Dividien-
do los renglones de U por los pivotes se obtiene LT , entonces podemos escribir
A = LU = LDLT donde D es una matriz diagonal con los pivotes de A en la
diagonal.
1.10.1. Interpretacion Analtica

Considere el sistema

1 1 1
Ax = b en donde A = 1 2 2 . (1.7)
1 2 3
El primer paso en la eliminacion produce ceros debajo del pivote p1 = 1.
Multiplica el primer renglon por 1 y lo resta de los otros renglones. El efecto
deseado es remover el primer renglon y primera columna del problema y producir
una nueva matriz en la esquina inferior derecha:

1 1 1 1 1 1 0 0 0
1 2 2 = 1 1 1 + 0 1 1 .
1 2 3 1 1 1 0 1 2
La matriz que es removida contiene multiplos del primer renglon. La elimina-
cion continua en la ultima matriz. Comienza con el siguiente pivote p2 = 1 y
el multiplo del segundo renglon a ser restado es l32 = 1. Este segundo paso en la
eliminacion produce, al quitar una matriz muy simple, una matriz aun mas simple:

0 0 0 0 0 0 0 0 0
0 1 1 = 0 1 1 + 0 0 0
0 1 2 0 1 1 0 0 1
El ultimo pivote es p3 = 1. As que la matriz original A es la suma de tres matrices.
La primera contiene multiplos del renglon (1, 1, 1); la segunda contiene multiplos
de (0, 1, 1); la tercera contiene multiplos de (0, 0, 1). Se puede verificar que esto
tambien es cierto para las columnas.

1 1 1 0 0 0 0 0 0
A= 1 1 1 + 0 1 1 + 0 0 0
1 1 1 0 1 1 0 0 1
54
Comparar con la descomposicion LDLT

1 0 0 1 0 0 1 1 1
A = 1 1 0 0 1 0 0 1 1 = LDLT (1.8)
1 1 1 0 0 1 0 0 1
Para resolver Ax = b, primero se factoriza a A como arriba y se escribe el
sistema como LDLT x = b. Definiendo y = LT x el sistema se puede escribir
como LDy = b de donde se puede resolver para y. Finalmente queda por resolver
el sistema LT x = y. Puede pensarse que se esta haciendo el doble de esfuerzo ya
que se tiene que resolver dos sistemas de ecuaciones, pero se tiene que aclarar que
esos dos sistemas son sistemas triangulares (la matriz de coeficientes es triangular)
los cuales son muy facil de resolver.
Considerese ahora la funcion cuadratica f = xT Ax con A la matriz de coe-
ficientes del sistema 1.7. Es posible que la funcion f sea estrctamente positiva
para x distinto de cero? La respuesta es afirmativa ya que se mostrara que las tres
matrices en la descomposicion anterior provienen de cuadrados perfectos.

1 1 1 x1
f = xT Ax = (x1 , x2 , x3 ) 1 2 2 x2
1 2 3 x3
= x21 + 2x1 x2 + 2x1 x3 + 2x22 + 4x2 x3 + 3x23

La primera matriz toma todos los terminos que involucran a x1 :

1 1 1 x1
(x1 , x2 , x3 ) 1 1 1 x2
1 1 1 x3
= x21 + 2x1 x2 + 2x1 x3 + x22 + 2x2 x3 + x23 (1.9)

= (x1 + x2 + x3 )2 (1.10)
El renglon y columna (1,1,1) quedan dentro del cuadrado y el pivote p1 = 1 apa-
rece como coeficiente de este cuadrado. La segunda matriz en la descomposicion
da un cuadrado con p2 = 1 como coeficiente del cuadrado y (0,1,1) dentro:
x22 + x2 x3 + x23 = (x2 + x3 )2

Este termino involucra a todos los terminos restantes que dependen de x2 . La ter-
cera matriz da x23 . Estos tres cuadrados tienen como suma a f , por lo que f es no
55
1.11. MATRICES POSITIVAS DEFINIDAS
negativa. Uno puede verificar que el unico caso en donde f es igual a cero es cuan-
do el vector (x1 , x2 , x3 ) es igual a cero. Notese que los mismos numeros aparecen
en la factorizacion 1.8. De este ejemplo podemos ver que la factorizacion LDLT
es esencialmente la misma que la descomposicion en matrices de estructura muy
simple. (Lo cual queda por demostrarse en el caso general).
1.11. Matrices Positivas Definidas

La funcion cuadratica f en la seccion anterior es un ejemplo de una forma
cuadratica. Uno se pregunta si todas las formas cuadraticas xT Ax, (A una matriz
simetrica) cumplen la propiedad de ser positivas excepto para x = 0. El siguiente
ejemplo muestra lo contrario:
Ejemplo 1.11.1
G = (x1 x2 )2 + 2x23
la cual es cero para cualquier multiplo del vector (1, 1, 0).
En general una forma cuadratica puede tomar valores positivos, cero o ne-
gativos. Los casos en que solo toma valores positivos (negativos) para vectores
distintos de cero son muy importantes en las aplicaciones. Tomese la siguiente
terminologa:
Definicion 1.11.2 Sea A una matriz simetrica. La forma cuadratica xT Ax es po-

sitiva definida si xT Ax > 0 para todo x 6= 0. La matriz A es positiva definida
si su forma cuadratica correspondiente es positiva definida. Formas cuadraticas
negativas definidas y matrices negativas se definen de manera analoga. Una forma
cuadratica es indefinida si toma valores positivos y negativos.
Ejercicio 1.11.3 Dar la definicion correspondiente de matriz negativa definida.
Note que una definicion equivalente de negatividad es que una matriz A es

negativa definida si y solo si A es positiva definida.
Teorema 1.11.4 Una matriz simetrica es positiva definida si y solo si sus pivotes
son positivos. En este caso xT Ax tiene un mnimo valor en x = 0
56
Teorema 1.11.5 Toda matriz simetrica positiva definida A, admite una factoriza-
cion simetrica de la forma
A = LDLT = l1 p1 l1T + l2 p2 l2T + + ln pn lnT
los numeros positivos pi son los pivotes que van en la diagonal de la matriz D y
los vectores li son las columnas de la matriz L.
Teorema 1.11.6 Si A y B son positivas definidas entonces A + B, A2 , A1 y An

n = 0, 1, 2, . . . son positivas definidas.
Teorema 1.11.7 Una matriz A es positiva definida si todas las submatrices A(k)
tienen determinante positivo.
57
1.11. MATRICES POSITIVAS DEFINIDAS
58
Captulo 2
Introduccion al Analisis Real
En este captulo estudiaremos el concepto de lmite, y usaremos esta definicion

para desarrollar las ideas de continuidad, diferenciacion e integracion de funcio-
nes. Entonces, mostraremos como la diferenciacion e integracion son conceptos
ntimamente conectados mediante el Teorema Fundamental del Calculo. Final-
mente, concluiremos el captulo estudiando la convergencia uniforme de funcio-
nes y ejemplos de Weierstrass.
2.1. Lmites
Definicion 2.1.1 Una funcion f : R R tiene un lmite L en a si dado cual-
quier numero real > 0, existe un numero real > 0 tal que para todo numero
real x con:
0 <| x a |< ,
tenemos que:
| f (x) L |< .
59
2.1. LIMITES
Esto es denotado por:
lm f (x) = L.
xa
Intuitivamente, la funcion f (x) tendra un lmite L en a si, para numeros x cer-

canos a a, el valor de la funcion f (x) es cercano al numero L. En otras palabras,
la garantia de que f (x) sea cercano a L, puede requerir que x sea cercano a a. De
esta manera, si queremos que la distancia de f (x) a L sea menor que > 0 del
numero L (esto es, si queremos que | f (x) L |< ), debemos ser capaces de
especificar que tan cerca de a debe de estar x. Ademas, dado un numero > 0 (no
importa que tan pequeno sea), debemos ser capaces de encontrar un numero > 0
tal que si x esta a una distancia de a, tendremos que f (x) estar a una distancia
de L.
Ejemplo 2.1.2 Si la anterior definicion de lmite tiene sentido, se debe de cumplir

que:
lm x2 = 4
x2
Solucion: Verificaremos esto ahora. Usaremos el truco de utilizar un ejem-
plo cuya respuesta ya sabemos para comprobar la razonabilidad de la definicion.
De esta manera, para cualquier > 0, debemos encontrar un > 0 tal que si
0 <| x 2 |< , tendremos que:
| x2 4 |< .
Propongamos

= mn ,1 .
5
Como sucede a menudo, el trabajo inicial en la busqueda de la expresion co-
rrecta para no se muestra. Ademas, el 5 en el denominador puede ser cambiado
por otro numero mayor. Sea 0 <| x 2 |< . Queremos ver que | x2 4 |< .
Ahora
| x2 4 |=| x 2 | | x + 2 | .
Dado que x esta a una distancia de 2:
| x + 2 |< (2 + ) + 2 = 4 + 5.
60
CAPITULO 2. INTRODUCCION AL ANALISIS REAL
De esta manera:

| x2 4 |=| x 2 | | x + 2 |< 5 | x 2 |< 5 = .
5
Ejemplo 2.1.3 Probar que
lm b = b
xc
Solucion: Para ser mas explcitos, sea f (x) = b para toda x R. Queremos
demostrar que lmxc f (x) = b. Si > 0 esta dado, se hace = 1. (De hecho,
cualquier estrictamente positiva servira aqui.) Entonces si 0 <| x c |< 1, se
tiene | f (x) b |=| b b |= 0 < . Puesto que > 0 es arbitrario, de la definicion
de lmite se concluye que lmxc f (x) = b.
Ejemplo 2.1.4 Probar que
lm x = c
xc
Solucon: Sea g(x) = x para toda x R. Si > 0, se elige = . Entonces si

0 <| x c |< , se tiene | g(x) c |=| x c |< . Puesto que > 0 es arbitraria,
se deduce que lmxc g = c.
Ejemplo 2.1.5 Demuestre que
lm x2 = c2
xc
Solucion: Sea h(x) = x2 para toda x R. Se quiere hacer la diferencia
| h(x) c2 |=| x2 c2 |
menor que una > 0 preasignada tomando x lo suficientemente cerca de c. Para
ello, se observa que x2 c2 = (x + c)(x c). Ademas, si | x c |< 1, entonces
| x || c | +1
de donde
| x + c || x | + | c | 2 | c | +1.
61
2.1. LIMITES
Por lo tanto, si | x c |< 1, se tiene
| x2 c2 |=| x + c || x c | (2 | c | +1) | x c | . (2.1)

Ademas, este ultimo termino sera menor que siempre que se tome | x c |<
/(2 | c | +1). Por consiguiente. si se elige

= nf 1, ,
2 | c | +1
entonces si 0 <| x c |< , se inferira primero que | x c |< 1, por lo que (2.1)
es valida y, por lo tanto, ya que | x c |< /(2 | c | +1), tenemos que
| x2 c2 | (2 | c | +1) | x c |< .
Puesto que se cuenta con una manera de elegir > 0 para una eleccion arbitraria
de > 0, se infiere que lmxc h(x) = lmxc x2 = c2 .
Ejemplo 2.1.6 Dado que lmxc f (x) = L y lmxc g(x) = M, demostrar que
lm (f (x) + g(x)) = L + M.
xc
Solucion: Sea > 0 dado. Se quiere hallar un numero positivo tal que para
toda x
0 <| x c |< = | f (x) + g(x) (L + M) |< .

Reagrupando terminos, tenemos
| f (x) + g(x) (L + M) | = | (f (x) L) + (g(x) M) |

| f (x) L | + | g(x) M | .
Ya que lmxc f (x) = L, entonces existe un numero 1 > 0 tal que para toda x
0 <| x c |< 1 = | f (x) L |< /2.

Analogamente, dado que lmxc g(x) = M, entonces existe un numero 2 > 0
tal que para toda x
0 <| x c |< 2 = | f (x) M |< /2.
62
Sea = mn{1 , 2 }, el menor de 1 y 2 . Si 0 <| xc |< , entonces | xc |< 1 ,

as que | f (x) L |< /2, y | xc |< 2 , as que | g(x) M |< /2. Por lo tanto,

| f (x) + g(x) (L + M) |< + = .
2 2
Esto muestra que lmxc (f (x) + g(x)) = L + M.
2.2. Continuidad
Definicion 2.2.1 Una funcion f : R R es continua a a si:
lm f (x) = f (a).
xa
Comunmente, cualquier intuicion acerca de las funciones continuas suele aso-

ciarse a la nocion de que la grafica de una funcion continua no puede presentar
roturas entre puntos de la misma. En otras palabras, uno puede graficar una
funcion continua sin despegar el lapiz de la hoja.
Usando la notacion y , la definicion de continuidad es la siguiente:
Definicion 2.2.2 Una funcion f : R R es continua en a si dado cualquier

> 0, existe > 0 tal que para todo x con 0 <| x a |< , tenemos que
| f (x) f (a) |< .
Para ejemplificar, escribiremos una funcion que es claramente no continua en

el origen 0, y usaremos esta funcion para verificar la razonabilidad de la definicion.
Ejemplo 2.2.3 Sea:

1, x>0
f (x) =
-1, x0
Probemos que f tiene una discontinuidad en x = 0. Notemos que la grafica de
f (x) tiene una rotura en el origen.
Solucion: Queremos capturar esta discontinuidad, mostrando que:
lm f (x) 6= f (0).
xa
63
2.2. CONTINUIDAD
Ahora, f (0) = 1. Sea = 1 y sea > 0 cualquier numero positivo. Enton-

ces para cualquier x con 0 < x < , tenemos que f (x) = 1. Entonces:
| f (x) f (0) |=| 1 (1) |= 2 > 1 = .

De esta manera, para todo positivo x < :
| f (x) f (0) |> .

Por lo tanto, para cualquier > 0, existe x con:
| x 0 |< .
Pero:
| f (x) f (0) |> .
Por lo tanto, esta funcion no es continua en x = 0.
Ejemplo 2.2.4 La funcion identidad en un conjunto D R, esto es, I : D R

definida por I(x) = x, es continua.
Solucion: Fijemos a D y sea dado > 0. Notemos que
| I(x) I(a) |=| x a |,

con x D. Luego, eligiendo = , se satisface la condicion de continuidad.
Ejemplo 2.2.5 Probar que la funcion valor absoluto V (x) =| x |, x R, es con-

tinua.
Solucion: Fijemos a R y sea dado > 0. Notemos que
| V (x) V (a) |=|| x | | a ||| x a | .

Luego, si elegimos = > 0 se satisface la condicion de continuidad. En otras
palabras, si | x a | , entonces | V (x) V (a) | .

Ejemplo 2.2.6 Demuestre que la funcion x es continua en cada punto x0 > 0 y
continua por la derecha en el punto x0 = 0.
64

Solucion: Demostraremos la continuidad de x en el punto x0 > 0 haciendo
uso de la definicion 2.2.1. Transformemos y estimemos el modulo de la diferencia
| x x0 | | x x0 |
0 | x x0 |= .
x + x0 x0

Como el lmxx0 =| x x0 | y 1/ x0 es constante, entonces
| x x0 |
lm = 0.
xx0 x0
De aqu se desprende que

lm | x x0 |= 0,
xx0
por lo que

lm x= x0 .
xx0

De modo que la funcion x es continua en cada punto x0 > 0.

Demostraremos que la funcion x es continua en el puntox0 = 0 por la
derecha. Sea un numero positivo arbitrario. La desigualdad | x 0 |< es
equivalente a la desigualdad 0 x < 2 . Tomemos = 2 , entonces la desigual-

dad 0 x < se deduce la desigualdad x < . De forma que lmx0
+ x=0
y, por lo tanto, la funcion x es continua por la derecha en el punto x0 = 0.
2.3. Diferenciacion
Definicion 2.3.1 Una funcion f : R R es diferenciable en a si el limite
f (x) f (a)
lm
xa xa
existe. Este lmite es llamado la derivada de f en a y es denotada por (entre mu-
df
chos otros smbolos) f (a) o dx (a).
Una de las interpretaciones mas importantes de la derivada es ser la pendiente

de la recta tangente de la curva y = f (x) en el punto a. Aunque, logicamente, la
65
2.3. DIFERENCIACION
actual definicion de una lnea tangente debe incluir la definicion anterior de deri-
vada.
La idea detras de la definicion es que podemos calcular la pendiente de una

lnea definida por dos puntos en el plano. En particular. para cualquier x 6= a, la
pendiente de la recta secante que pasa por los puntos (a, f (a)) e (x, f (x)) es:
f (x) f (a)
.
xa
Ahora, vamos a hacer que x se aproxime a a. Las lneas secantes correspon-
diente se aproximaran a la lnea tangente. Por lo tanto, las pendientes de las lneas
secantes se aproximaran a la pendiente de la recta tangente.
Por lo tanto, la definicion para la pendiente de la recta tangente debera ser:
f (x) f (a)
f (x) = limxa .
xa
Parte del poder de las derivadas es que hay toda una maquinaria del calculo
para la diferenciacion, lo que nos permite evitar, por lo general, la toma real de un
lmite.
Ejemplo 2.3.2 Veamos ahora un ejemplo de una funcion que no tiene derivada
en el origen, es decir:
f (x) =| x | .
Solucion: Esta funcion tiene un punto afilado en el origen y por lo tanto no
hay lnea tangente aparente. Vamos a mostrar que de las especificaciones de la
definicion, que f (x) =| x | no es diferenciable en x = 0. De este modo, queremos
mostrar que:
f (x) f (0)
limx0 .
x0
no existe. Por suerte:

f (x) f (0) |x| 1, x > 0
= =
x0 x -1, x < 0
66
que ya hemos demostrado en la ultima seccion no tener un lmite cuando x se

aproxima a 0.
Ejemplo 2.3.3 La derivada de una funcion constante es cero.
Solucion: En efecto, supongamos que f (x) = c, x R. Entonces,
f (x + h) f (x) 0
f (x) = lm = lm = 0.
h0 h h0 h
Ejemplo 2.3.4 La derivada de la funcion identidad es 1.
Solucion: Para verificar esto, hagamos I(x) = x, x R. Entonces,
I(x + h) I(x) x+hx

I (x) = lm = lm = 1.
h0 h h0 h
x
Ejemplo 2.3.5 Derivar f (x) = x1
, donde tiene pendiente 1 la curva y =
f (x)?
x
Solucion: Tenemos f (x) = x1
y
(x + h)
f (x + h) = ,
(x + h) 1
de modo que
x+h x
f (x + h) f (x) x+h1
x1
=
h h
1 (x + h)(x 1) x(x + h 1)
=
h (x + h 1)(x 1)
1 h
= ,
h (x + h 1)(x 1)
1 1
f (x) = lm = .
h0 (x + h 1)(x 1) (x 1)2
67
2.4. INTEGRACION
La pendiente de y = f (x) es 1 siempre que
1
= 1
(x 1)2
Esta ecuacion es equivalente a (x 1)2 = 1, as que x = 0 o x = 2.
2.4. Integracion
Intuitivamente, la integral de una funcion positiva f (x) con un dominio a
x b debe ser el area bajo la curva y = f (x) por encima del eje x.
Cuando la funcion f (x) no es positiva en todas partes, entonces su integral

debe ser el area bajo la parte positiva de la curva y = f (x) menos el area por
encima de la parte negativa de y = f (x).
Por supuesto, esto no es riguroso, ya que no se tiene aun ni siquiera una buena
definicion para el area. La idea principal es que el area de un rectangulo con una
altura a y anchura b es ab.
Para encontrar el area bajo la curva y = f (x) encontramos, primero, el area de

varios rectangulos contenidos bajo la curva y entonces, el area de estos rectangu-
los, cubriran, justamente, a la curva y = f (x). A continuacion, hacemos los
rectangulos mas y mas delgados, y tomamos lmites, que debera resultar en el
area bajo la curva.
Ahora, enunciaremos las definiciones de una manera mas precisa. Considera-
mos una funcion real f (x) con dominio en el intervalo cerrado [a, b]. En primer
lugar, dividimos, o particionamos, el intervalo [a, b] en pequenos segmentos que
seran el ancho de los rectangulos de aproximacion. Para cada entero positivo n,
sea:
ba
t = .
n
y
68
a = t0
t1 = t0 + t
t2 = t1 + t
.
.
.
tn (= b) = tn1 + t.
20 1
Por ejemplo, sobre el intervalo [0, 2] con n = 4, tenemos que t = 4
= 2
y:
t0 = 0
1
t1 =
2
t2 = 1
3
t3 =
2
t4 = 2
Sobre cada intervalo [tk1 , tk ], elijase los puntos lk y uk tal que para todos los
puntos t sobre [tk1 , tk ], tenemos que:
f (lk ) f (t)
y
f (uk ) f (t).
Hacemos estas elecciones a fin de garantizar que el rectangulo con base [tk1 , tk ]
y de altura f (lk ) esta justo debajo de la curva y = f (x), y que el rectangulo con
base [tk1 , tk ] y de altura f (uk ) esta sobre la curva y = f (x).
Definicion 2.4.1 Sea f (x) una funcion real definida sobre el intervalo cerrado
[a, b]. Para cada entero positivo n la suma inferior de f (x) se define como:
69
2.4. INTEGRACION
n
X
L(f, n) = f (lk )t
k=1
y la suma superior de f (x) como:

n
X
U(f, n) = f (uk )t.
k=1
Tengamos en cuenta que la suma inferior L(f, n) es la suma de las areas de los
rectangulos debajo de nuestra curva, mientras que la suma superior U(f, n) es la
suma de las areas de los rectangulos que sobresalen por encima de nuestra curva.
Definicion 2.4.2 Una funcion real f (x) con dominio en el intervalo cerrado [a, b],
se dice que es integrable si los siguientes dos lmites existen y son iguales:
lm L(f, n) = lm U(f, n).

n n
Rb
Si estos lmites son iguales, denotamos el lmite por a
f (x)dx, y llamamos a
esto la integral de f (x).
El objetivo de la siguiente seccion, el Teorema Fundamental del Calculo, es

ver como la integral (una herramienta para encontrar el area) esta relacionada con
la derivada (una herramienta para encontrar la pendiente). En realidad, esto nos
permitira calcular muchas integrales.
Ejemplo 2.4.3 Analizar la integrabilidad de la funcion constante f (x) = c.
Solucion: Sea P = x0 , ..., xn una particion de [a, b]. Observemos que lk =

uk = c, k = 1, 2, ..., n. Luego,
n
X
L(P ) = f (lk )xk = c(b a).
k=1
Asimismo, encontramos
U(P ) = c(b a).
70
Resulta entonces
lm L(P ) = c(b a) = lm U(P ).

n n
Por lo tanto, toda funcion constante es integrable y
Z b
c = c(b a).
a
Ejemplo 2.4.4 Expresar el lmite de las sumas de Riemann
n
X
lm (3c2k 2ck + 5)xk
|P |0
k=1
como una integral si P denota una particion del intervalo [-1,3].
Solucion: La funcion que se evalua en ck en cada termino de la suma es

f (x) = 3x2 2x + 5. Se hace la particion del intervalo [-1,3]. Por lo tanto, el
lmite es la integral de f desde 1 hasta 3:
n
X Z 3
lm (3c2k 2ck + 5)xk = (3x2 2x + 5)dx.
|P |0 1
k=1
R5
Ejemplo 2.4.5 Calcular 0
xdx = 25/2.
Solucion: Dividamos el intervalo 0 x 5 en n subintervalos de longitud

x = 5/n. Eligiendo los puntos xk coincidiendo con el extremo derecho de cada
subintervalo, es decir, x1 = x, x2 = 2x,..., xn = nx, tendremos
n
X
Sn = f (xk )xk
k=1
n
X
= (k x)x
k=1
= (1 + 2 + ... + n)(x)2
n(n + 1) 5 2
= ( )
2 n
25 1
= (1 + )
2 n
71
2.4. INTEGRACION
5
25 1 25
Z
xdx = lm Sn = lm (1 + ) = .
0 n+ n+ 2 n 2
Ejemplo 2.4.6 Hallar el area de la region entre la parabola y = x2 y el eje x en el

intervalo [0,b].
Solucion: Evaluamos la integral para el area como un lmite de las sumas de

Riemann. Hacemos la particion del intervalo [0,b] en n subdivisiones de longitud
x = (b 0)/n = b/n. Los puntos de la particion son
x0 = 0, x1 = x, x2 = 2x, ..., xn1 = (n 1)x, xn = nx = b.
Podemos seleccionar los ck como queramos. Escogemos que cada ck sea el ex-
tremo derecho de este subintervalo, una seleccion que nos lleva a una aritmetica
mas manejable. Entonces, c1 = x1 , c2 = x2 , y as sucesivamente. Los rectangulos
definidos por estas selecciones tienen las areas
f (c1 )x = f (x)x = (x)2 x = (1)2 (x)3

f (c2 )x = f (2x)x = (2x)2 x = (2)2 (x)3
.
.
.
f (cn )x = f (nx)x = (nx)2 x = (n)2 (x)3
La suma de estas areas es
72
n
X
Sn = f (ck )x
k=1
Xn
= k 2 (x)3
k=1
n
X
3
= (x) k2
k=1
3
b n(n + 1)(2n + 1)
=
n3 6
3
b (n + 1)(2n + 1)
=
6 n2
3 2
b 2n + 3n + 1
=
6 n2
3

b 3 1
= 2+ + 2 .
6 n n
Ahora podemos usar la definicion de la integral para hallar el area bajo la parabola
desde x = 0 hasta x = b como
Z b
x2 dx = lm Sn
0 n
b3

3 1
= lm 2+ + 2
n 6 n n
3
b b2
= (2 + 0 + 0) = .
6 3
Para diferentes valores de b, obtenemos

Z 1
13 1
x2 dx = = ,
0 3 3
Z 1,5
(1,5)3 3,375
x2 dx = = = 1,125,
0 3 3
y as sucesivamente.
73
2.5. EL TEOREMA FUNDAMENTAL DEL CALCULO
2.5. El Teorema Fundamental del Calculo

Dada una funcion real f (x) definida en el intervalo cerrado [a, b], podemos
usar la definicion anterior de la integral para definir una nueva funcion, de la si-
guiente forma:
Z x
F (x) = f (t)dt.
a
Usamos la variable t en el interior del signo integral, ya que la variable x ya se

esta utilizando como variable independiente de la funcion F (x). As, el valor de
F (x) es el numero que es el area en la curva y = f (x) del punto final a a el valor x.
El hecho sorprendente es que la derivada de esta nueva funcion F (x) sera sim-
plemente la funcion original f (x). Esto significa que para encontrar la integral de
f (x), debe, en lugar de atarearse con sumas superiores e inferiores, simplemente
tratar de encontrar una funcion cuya derivada es f (x).
Resumiendo:
Teorema 2.5.1 (Teorema Fundamental del Calculo): Sea f (x) una funcion con-
tinua real definida sobre el intervalo cerrado [a, b], y definase:
Z x
F (x) = f (t)dt.
a
Entonces:
a) La funcion F (x) es diferenciable y:

Rx
dF (x) d a f (t)dt
= = f (x)
dx dx
y
b) Si G(x) es una funcion real diferenciable definida sobre el intervalo cerra-

do [a, b], cuya derivada es:
dG(x)
= f (x),
dx
74
entonces:
Z b
f (x)dx = G(b) G(a).
a
Demostracion: Primero, verifiquemos la parte a): Queremos probar que para

toda x en el intervalo [a, b], el siguiente lmite existe y es igual a f (x):
F (x + h) F (x)
limh0 = f (x).
h
Tengamos en cuenta que hemos reformulado ligeramente la definicion de la
derivada de limxx0 (f (f ) f (x0 ))/(x x0 ) a limh0 (f (x + h) f (x))/h.
Ambas son equivalentes. Ademas, para simplificar, solo mostraremos esto para x
en el intervalo abierto (a, b) y tomamos el lmite solo para valores de h positivos.
Considere lo siguiente:
R x+h Rx
F (x + h) F (x) a
f (t)dt a
f (t)dt
=
h h
R x+h
f (t)dt
= x .
h
Sobre el intervalo [x, x + h], para cada h defina lh y uh tal que para todos los
puntos t sobre [x, x + h], tenemos que:
f (lh ) f (t)
y
f (uh ) f (t).
Entonces tenemos que:
Z x+h
f (lh )h f (t)dt f (uh )h.
x
Dividiendo por h > 0, nos da:
R x+h
x
f (t)dt
f (lh ) f (uh ).
h
75
2.5. EL TEOREMA FUNDAMENTAL DEL CALCULO
Ahora, tanto lh y uh se aproximan al punto x conforme h tiende a cero. Dado

que f (x) es continua, se tiene que:
lm f (lh ) = limh0 f (uh ) = f (x)

h0
y as, obtenemos nuestro resultado. Ahora, toca el turno de probar la parte b):
Aqu, daremos una funcion G(x) cuya derivada es:
dG(x)
= f (x).
dx
Rx
Mantengamos la notacion de la parte a), es decir, que F (x) = a
f (t)dt. Ten-
ga en cuenta que F (a) = 0 y
Z b
f (t)dt = F (b) F (a).
a
Por la parte a), sabemos que la derivada de F (x) es la funcion f (x). Por lo
tanto las derivadas de F (x) y G(x) coinciden, lo que significa que:
d(F (x) G(x))

= f (x) f (x) = 0.
dx
Sin embargo, una funcion cuya derivada es siempre cero debe ser una constan-
te. (No hemos demostrado que esto es bastante razonable, ya que la unica manera
que la pendiente de la tangente siempre puede ser cero es si la grafica de la funcion
es una lnea horizontal; la prueba se necesita algo de trabajo.) Por lo tanto existe
una constante c tal que:
F (x) = G(x) + c.
Entonces:
Z b
f (t)dt = F (b) F (a)
a
= (G(b) + c) (G(a) + c)
= G(b) G(a)
como se deseaba.
76
Ejemplo 2.5.2 Hallar dy/dx si

Z x2
y= cos tdt.
1
Solucion: Observemos que el lmite superior de integracion no es x, sino x2 .
Para hallar dy/dx debemos considerar a y como la composicion de
Z u
y= cos tdt
1
y u = x2 , y aplicar la regla de la cadena:
dy dy du
=
dx du dx
Z u
d du
= cos tdt
du 1 dx
du
= cos u
dx
2
= cos x 2x
= 2x cos x2 .
Ejemplo 2.5.3 Expresar la solucion al siguiente problema de valor inicial como

una integral.
Ecuacion diferencial:
dy
= tan x
dx
Condicion inicial:
y(1) = 5.
Solucion: La funcion
Z x
F (x) = tan tdt
1
es una antiderivada de tan x. Por lo tanto, la solucion general de la ecuacion es
Z x
y= tan tdt + C.
1
77
2.6. CONVERGENCIA PUNTUAL DE FUNCIONES
Como siempre, la condicion inicial determina el valor de C:
Z 1
5 = tan tdt + C
1
5 = 0+C
C = 5.
La solucion al problema de valor inicial es

Z x
y= tan t dt + 5.
1
Como supimos donde empezar a integrar cuando se construyo F (x)? Pudi-
mos haber comenzado en cualquier lado, pero el mejor valor para empezar es el
valor inicial de x (en este caso, x = 1). Entonces la integral sera cero cuando
apliquemos la condicion inicial y C automaticamente tomara el valor inicial de y.
2.6. Convergencia Puntual de Funciones

Definicion 2.6.1 Sea fn : [a, b] R una sucesion de funciones:
f1 (x), f2 (x), f3 (x), ...

definida sobre un intervalo [a, b] = x : a x b. Esta sucesion fn (x) conver-
gera puntualmente a la funcion:
f (x) : [a, b] R
si para todo en [a, b]:
lm fn () = f ().
n
En la notacion y , decimos que fn (x) converge puntualmente a f (x) si para

todo en [a, b] y dado cualquier > 0, existe un entero positivo N tal que para
todo n N, tenemos que | f () fn () |< .
Intuitivamente, una sucesion de funciones fn (x) converge puntualmente a una

funcion f (x) si, dado cualquier , eventualmente (para n grande) el numero fn ()
78
estara arbitrariamente cerca del numero f (). La importancia de una buena no-
cion de convergencia de funciones se deriva de la practica frecuente de solucionar
aproximadamente un problema y luego, utilizando la aproximacion, para entender
la verdadera solucion. Por desgracia, la convergencia puntual no es tan util o tan
potente como el tema de la proxima seccion, la convergencia uniforme, en el que
la tolerancia del lmite puntual de funciones (funciones, por ejemplo, continuas
o integrables) no garantiza la tolerancia del lmite, como veremos en el siguiente
ejemplo.
Ejemplo 2.6.2 Mostraremos que el lmite puntual de funciones continuas no ne-

cesariamente es continua. Para cada entero positivo n, sea:
fn (x) = xn
para todo x en [0, 1]. Pongamos:

1, x = 1
f (x) =
0, 0 x < 1
Claramente, f (x) no es continua a el punto x = 1, mientras todas las funcio-
nes fn = xn son continuas en todo el intervalo. De hecho, observaremos que la
sucesion fn (x) no converge puntualmente a f (x).
Fijemos en [0, 1]. Si = 1, entonces fn (1) = 1n = 1 para toda n. Entonces:
lm fn (1) = lm 1 = 1 = f (1).
n n
Ahora, sea 0 < 1. Usaremos (sin probar) el hecho de que para cualquier
numero < 1, el lmite de n se aproximara a 0 cuando n se aproxime a . En
particular:
lm fn () = lm n
n n
= 0
= f ()
De esta manera, el lmite puntual de una sucesion de funciones no necesaria-

mente es continua.
79
2.7. CONVERGENCIA UNIFORME
2.7. Convergencia Uniforme

Definicion 2.7.1 Una sucesion de funciones fn : [a, b] R converge unifor-
memente a la funcion f : [a, b] R si dado cualquier > 0, existe un entero
positivo N tal que para todo n N, tenemos que:
| f (x) fn (x) |<

para todos los puntos x.
La intuicion es que si colocamos una banda de tamano alrededor de la fun-

cion y = f (x), las funciones y = fn (x) eventualmente, estaran dentro de esta
banda. La clave aqu es que tanto como N funcionaran para todo x. Esto no era
el caso en la definicion de convergencia puntual, donde el N elegido dependa de
x.
Casi todas las propiedades deseables de las funciones en las sucesiones seran
heredadas por el lmite. La principal excepcion es la diferenciabilidad, pero in-
cluso en este caso un resultado parcial es cierto. Como un ejemplo de como estos
argumentos funcionan, vamos a mostrar que:
Teorema 2.7.2 Sea fn : [a, b] R una sucesion de funciones continuas con-

vergiendo uniformemente a una funcion f (x). Entonces f (x) sera continua.
Demostracion : Necesitamos mostrar que para todo en [a, b]:
lm f (x) = f ().
x
De esta manera, dado cualquier > 0, debemos encontrar algun > 0 tal que
0 <| x |< , tenemos que:
| f (x) f () |< .
Por la convergencia uniforme, existe un entero positivo N tal que:

| f (x) fN (x) |<
3
80
para todo x. Por supuesto, cada funcion fN (x) es continua a el punto . De esta
manera, existe un > 0 tal que para 0 <| x |< , tenemos que:

| f (x) fN () |< .
3
Ahora, mostraremos que para 0 <| x |< , debemos tener:
| f (x) f () |< .
para todo x
Usaremos el truco de anadir, apropiadamente, terminos cuya suma sea cero y
entonces aplicaremos la desigualdad del triangulo (| A + B || A | + | B |).
Tenemos que:
| f (x) f () | = | f (x) fN (x) + fN (x) fN () + fN () f () |

| f (x) fN (x) | + | fN (x) fN () | + | fN () f () |

< + +
3 3 3
=
.
y hemos terminado.
Ahora podemos analizar una serie (suma infinita) de funciones.
Definicion 2.7.3 Sea f1 (x), f2 (x), ... una sucesion de funciones. La serie de fun-
ciones:

X
f1 (x) + f2 (x) + ... = fk (x)
k=1
convergera uniformemente a una funcion f (x) si la sucesion de las sumas par-

ciales, f1 (x), f1 (x) + f2 (x), f1 (x) + f2 (x) + f3 (x), ... converge uniformemente a
f (x).
En terminos de y , la serie infinita de funciones

P
k=1 fk (x) converge uni-
formemente a f (x) si dado cualquier > 0 existe un entero positivo N tal que
81
2.7. CONVERGENCIA UNIFORME
para toda n N:

X
| f (x) fk (x) |< ,
k=1
para toda x.
Ahora tenemos:
Teorema 2.7.4 Si cada funcion fk (x) es continua y si

P
k=1 fk (x) converge uni-
formemente a f (x), entonces f (x) a lo mas es continua.
Esto se sigue del hecho de que la suma finita de funciones continuas es conti-
nua y del teorema previo.
Ejemplo 2.7.5 Sea fn (x) = (sen x)/n, fn : R R. Mostrar que fn 0

uniformemente cuando n .
Solucion: Lo que tenemos que mostrar es que
|fn (x) 0| = |fn (x)|

se vuelve independientemente pequeno de x cuando n . Pero
|fn (x)| = |sen x|/n 1/n

lo cual se vuelve independientemente pequeno de x cuando n . De esta
manera, fn (x) 0 uniformemente.
Ejemplo 2.7.6 Argumentar que la serie para el sen x,
x3 x5
sen x = x +
3! 5!
converge uniformemente, 0 x r.
Solucion: Lo que tenemos que mostrar es que

n
X (1)k x2k+1
sn (x) =
k=0
(2k + 1)!
82
converge uniformemente a sen x. Lo que debemos hacer, es estimar la diferencia:

2k+1
X x X r 2k+1
|sn (x) sen x| = (1)k .

(2k + 1)! (2k + 1)!
k=n+1 k=n+1
Pero esto nos da un numero independiente de x el cual 0 cuando n

dado que es parte de una serie convergente. De esta manera, la convergencia es
uniforme.
2.8. La M-Prueba de Weierstrass

Si estamos interesados en una serie infinita de funciones
P
k=1 fk (x), enton-
ces nos interesara saber cuando la serie convergera uniformemente. Por suerte,
la M-Prueba de Weierstrass nos provee de un medio sencillo para determinar la
convergencia uniforme. Como veremos, la Pclave de este teorema es que reduce la

cuestion de la convergencia uniforme de k=1 fk (x) a la cuestion de saber cuan-
do una serie infinita de numeros convergera, para lo cual iniciaremos los calculos
probando muchas herramientas, tales como el criterio de la razon, el criterio de la
raz, el criterio de comparacion, el criterio de la integral, etc.
Teorema 2.8.1 Sea

P
k=1 fk (x) una serie de funciones, con cada funcion
P fk (x)
definida sobre un subconjunto A de los numeros reales. Suponga que k=1 Mk
es una serie de numeros tal que:
1. 0 | fk (x) | Mk , para todo x A.
P
2. La serie k=1 Mk converge.
P
Entonces k=1 fk (x) converge uniforme y absolutamente.
PPor convergencia absoluta, entenderemos que la serie de valores absolutos

k=1 | fk (x) | tambien converge uniformemente.
Demostracion : Para mostrar el resultado de la convergencia uniforme, debe-

mos demostrar que, dado cualquier > 0, existe un entero N tal que para todo
83
2.8. LA M-PRUEBA DE WEIERSTRASS
n N, tenemos que:

X
| fk (x) |< ,
k=n
P
para todo x A. Si k=n fk (x) converge o no, ciertamente tenemos:

X
X
| fk (x) | | fk (x) | .
k=n k=1
P
Dado que k=1 Mk converge, sabemos que podemos encontrar una N tal que
para toda n N, tenemos que:

X
Mk < .
k=n
Dado que 0 | fk (x) | Mk , para todo x A, tenemos que:

X
X
X
| fk (x) | | fk (x) | Mk < ,
k=n k=1 k=n
y hemos terminado.
Veamos un ejemplo sencillo.
Ejemplo 2.8.2 Consideremos la serie xk

P
k=1 k! , que a partir del calculo sabemos,
que es la serie de Taylor para ex . Usaremos la M-prueba de Weierstrass para mos-
trar que esta serie converge uniformemente sobre cualquier intervalo [a, a]. As,
k
tenemos que fk (x) = xk! . Sea:
ak
Mk =
k!
Notese que, para todo x [a, a], tenemos que 0 <| x |n /n! an /n!.
De esta manera, si podemos mostrar que la serie
P P ak
k=1 Mk = k=1 k! converge,
obtendremos la convergencia uniforme. Por el criterio de la razon, ak
P
k=1 k! con-
vergera si el lmite de la razon:
ak+1
Mk+1 ( (k+1)! )
lm = lm k
k Mk k ( a )
k!
84
existe y es estrictamente menor que 1. Pero tenemos que:

ak+1
(k+1)! a
lm ak = lm = 0.
k k (k + 1)
k!
De esta manera, la serie de Taylor para ex convergera uniformemente sobre

cualquier intervalo cerrado.
2.9. El Ejemplo de Weierstrass

Nuestro objetivo es encontrar una funcion que es continua en todas partes pe-
ro diferenciable en ninguna parte. Cuando Weierstrass construyo por primera vez
tales funciones a finales de 1800, los matematicos se sintieron indignados y sor-
prendidos. La sabidura convencional del momento era que no poda existir tal
funcion. La moraleja de este ejemplo es que hay que tener cuidado de la intuicion
geometrica.
Seguiremos de cerca la presentacion hecha por Spivak en su Calculus en el

captulo 23. Necesitamos un poco de notacion. Sea {x} = a la distancia de x al
entero mas cercano. Por ejemplo, { 34 } = 14 y {1,3289} = ,3289, etc.
Definase:

X 1
f (x) = k
{10k x}.
k=1
10
Nuestro objetivo es:
Teorema 2.9.1 La funcion f (x) es continua en todas partes pero diferenciable en

ninguna parte.
Primero aplicaremos la intuicion. Para simplificar nuestro trabajo, nos res-

tringiremos al dominio del intervalo unitario (0, 1). Para k = 1, tenemos que la
1
funcion 10 10x, es una funcion continua en todas partes, pero no es diferenciable
1
a 19 puntos, esto es, a ,05, ,1, ..., ,95. Entonces x + 10 10x es una funcion conti-
nua en todas partes, pero no es diferenciable a ,05, ,1, ,15, ..., ,95. Para k = 2, la
85
2.9. EL EJEMPLO DE WEIERSTRASS
1
funcion 100 100x es continua en todas partes, pero no es diferenciable a sus 199
1 1
puntos angulados. Entonces, la suma parcial 10 10x+ 100 100x es continua en todas
partes, pero no es diferenciable a sus 199 puntos angulados. De manera similar,
1
1000
1000x es tambien continua, pero ahora pierde diferenciabilidad a sus 1999
puntos angulados. A medida que continuamos, en cada borde P afilado, perdemos
1 k
diferenciabilidad. Cuando vamos agregando los terminos en 10k
10 x, eventual-
mente pierden diferenciabilidad en cada punto.
PDemostracion: (Seguimos con Spivak) La parte facil es mostrar que f (x) =

1 k
k=1 10k {10 x} es continua, debido a que esto es una aplicacion simple de la
M-Prueba de Weierstrass. Sabemos que x 21 para todo x. De esta manera, para
todo k, tenemos que:
1 1
k
{10k x} .
10 2 10k
La serie:

X 1 1X 1
=
k=1
2 10k 2 k=1 10k
es una serie geometrica y de esta manera, a lo mas, convergera (solo se tiene que
utilizar la prueba
P de1 la razon). Entonces, por la M-Prueba de Weierstrass, la se-
k
rie f (x) = k=1 10k {10 x} converge uniformemente. Dado que cada funcion
1 k
10k
10 x es continua, tenemos que f (x) a lo mas sera continua.
Es mucho mas difcil mostrar que f (x) es no diferenciable a cada punto; esto
sera un trabajo bastante delicado. Fijemos cualquier x. Debemos mostrar que:
f (x + h) f (x)
lm
h h
no existe. Debemos encontrar una sucesion, hm , de numeros que se aproximen a
cero tal que la sucesion f (x+hhmm)f (x) no converge.
Escribamos a x en su expansion decimal:
x = a.a1 a2 ....,
donde a es cero o uno y cada ak es un entero entre cero y nueve. Sea:
86
10m ,

6 4 o si am =
si am = 6 9
hm = m
10 , si am = 4 o si am = 9
Entonces:

a.a1 ...(am + 1)am+1 ..., si am 6= 4 o si am 6= 9
x + hm =
a.a1 ...(am 1)am+1 ..., si am = 4 o si am = 9
Vamos a estar observando en varios 10n (x + hm ). El factor 10n solo cambiara
donde el punto decimal se pose. En particular, si n > m, entonces:
10n (x + hm ) = aa1 ...(am 1)am+1 ...an .an+1 ...,

en cuyo caso:
{10n (x + hm )} = {10n x}
Si n m, entonces:
10n (x + hm ) = aa1 ...an .an+1 ...(am 1)am+1 ...,

en cuyo caso tendremos que:

n 0.an+1 ...(am + 1)am+1 ..., si am 6= 4 o si am 6= 9
{10 (x + hm )} =
0.an+1 ...(am 1)am+1 ..., si am = 4 o si am = 9
Estamos interesados en el lmite de:
1 1
f (x + hm ) f (x) X 10k
{10k (x + hm )} 10k
{10k x}
= .
hm k=0
hm
Dado que 10k (x + hm ) = 10k x, para k > m, la serie infinita de arriba es en

realidad la suma finita:
m 1 1 m
X
10k
{10k (x + hm )} 10k
{10k x} X
= 10mk ({10k (x + hm )} {10k x}).
k=0
hm k=0
Debemos mostrar que cada 10mk ({10k (x + hm )} {10k x}) es un mas o

menos uno. Entonces la suma finita anterior es una suma de mas o menos unos y,
de esta manera, no se puede converger a un solo numero, mostrando que la fun-
cion es no diferenciable.
87
2.9. EL EJEMPLO DE WEIERSTRASS
Existen dos casos. Siguiendo con Spivak, consideraremos solamente el caso cuan-
do 10k x = .ak+1 ... < 21 . He aqu por que tuvimos que romper nuestra definicion
de hm en dos casos separados. Por nuestra eleccion de hm , {10k (x + hm )} y
{10k x} difieren solamente en el (m k)-esimo termino de la expansion decimal.
De esta manera:
1
{10k (x + hm )} {10k x} = .
10mk
Entonces 10mk ({10k (x + hm )} {10k x}) sera, segun lo previsto, un mas o
menos uno.
88
Captulo 3
Calculo para Funciones Vectoriales
3.1. Funciones Vectoriales

Una funcion f : Rn Rm es llamada funcion vectorial, si dado cualquier
vector x en Rn , el valor (o imagen) de f (x) es un vector en Rm . Si (x1 , ..., xn ) es
un sistema coordenado para Rn , la funcion f puede ser descrita en terminos de m
funciones reales, simplemente escribiendo:

f1 (x1 , ..., xn )

.

f (x1 , ..., xn ) =
.

.
fm (x1 , ..., xn )
Tales funciones ocurren en todas partes.
Ejemplo 3.1.1 Sea f : R R2 , definida como:

cos t
f (t) = .
sen t
Aqu t es la coordenada para R. Por supuesto, esto es solo el crculo unitario
parametrizado por el angulo con el eje x. Esto tambien puede ser escrito como
x = cos t y y = sen t.
89
3.2. LIMITES Y CONTINUIDAD DE FUNCIONES VECTORIALES
Ejemplo 3.1.2 Considere la funcion f : R2 R3 dada por:

cos x1
f (x1 , x2 ) = sen x1 .
x2
Esta funcion f mapea el plano (x1 x2 ) en el plano a un cilindro en el espacio.
3.2. Lmites y Continuidad de Funciones Vectoria-

les
La idea principal en la definicion de lmite para funciones vectoriales es que
el Teorema de Pitagoras nos de una forma natural para medir distancias en Rn .
Definicion 3.2.1 Sean a = (a1 , ..., an ) y b = (b1 , ..., bn ) dos puntos en Rn . En-
tonces la distancia entre a y b, denotada por | a b |, es:
p
| a b |= (a1 b2 )2 + (a2 b2 )2 + ... + (an bn )2 .
La longitud de a esta definida por:
q
| a |= a21 + ... + a2n .
Note que hemos usado la palabra longituddado que podemos pensar al pun-
to a en Rn como un vector del origen a el punto.
Una vez que tenemos la nocion de distancia, podemos aplicar las herramientas
del analisis real. Por ejemplo, una definicion razonable de lmite sera:
Definicion 3.2.2 La funcion f : Rn Rm tiene limite:
L = (L1 , ..., Lm ) Rm .
a el punto a = (a1 , ..., an ) Rn si dado cualquier > 0, existe un > 0 tal que
para todo x Rn , si:
0 <| x a |< ,
90
CAPITULO 3. CALCULO PARA FUNCIONES VECTORIALES
tenemos que:
| f (x) L |< .
Denotamos este limite por:
lm f (x) = L
xa
o por f (x) L cuando x a.
Y la continuidad la podemos definir como sigue:
Definicion 3.2.3 La funcion f : Rn Rm es continua a el punto a si lmxa f (x) =

f (a).
Ambas definiciones dependen de la existencia de una distancia. Dadas dife-

rentes normas (distancias) tendremos la correspondiente definicion para lmites y
continuidad.
x4 y
Ejemplo 3.2.4 Estudiemos el lmite lm(x,y)(0,0) x4 +y 4
. Si nos acercamos al ori-
gen por una recta del tipo y = kx obtenemos
x4 y x4 (kx)
lm = y = kx = lm
(x,y)(0,0) x4 + y 4 x0 x4 + (kx)4
k
= lm x
x0 1 + k 4
= 0.
Esto no prueba en absoluto que el valor del lmite sea cero. Lo que nos dice es que
si tal lmite existe, este debe ser cero. Un argumento que concluye que el lmite
de hecho existe y vale cero, requiere la aplicacion directa de la definicion. Segun
4 4
x y x y
x4 + y 4 x4 |y|

91
3.3. DIFERENCIACION
vemos que
4
p xy
|y| x2 + y 2 < = 4 |y| < .
x + y4
Es decir, con = nos queda
4
xy
0 < ||(x, y) (0, 0)|| < = 4 0 <
x + y4
x4 y
lo que nos dice que efectivamente lm(x,y)(0,0) x4 +y 4
= 0.
3.3. Diferenciacion
Para funciones de una sola variable, la derivada es la pendiente de la lnea
tangente (la cual es, recalcando, la mejor aproximacion lineal de la funcion origi-
nal), y podemos usarla para encontrar la ecuacion de la lnea tangente. De manera
similar, si queremos la derivada de una funcion vectorial, una herramienta que
podemos utilizar es encontrar la mejor aproximacion lineal a la funcion.
Primero, daremos la definicion para la derivada de valores vectoriales y des-

pues discutiremos el aspecto intuitivo detras de esta. En particular, queremos que
esta definicion para las funciones vectoriales este de acuerdo a la definicion ante-
rior de derivada para el caso de las funciones de una sola variable.
Definicion 3.3.1 Una funcion f : Rn Rm es diferenciable a a Rn , si existe

una transformacion lineal A : Rn Rm tal que:
| f (x) f (a) A(x a) |

lm = 0.
xa | xa|
Si tal lmite existe, A es denotada por Df (a) y es llamada el Jacobiano.
Notese que f (x), f (a) y A(x a) estan en Rm y por lo tanto:
| f (x) f (a) A(x a) |
es la longitud de un vector en Rm . Del mismo modo, x a es un vector en Rn ,

forzando a que | x a | sea la longitud de un vector en Rn . Ademas, usualmente
92
existe una forma facil de calcular la matriz A, la cual veremos en un momento.

Tambien, si el Jacobiano de la matriz Df (a) existe, uno puede mostrar que esta
es unica, y as obtener un cambio de base para Rn y Rm .
Definitivamente, queremos que esta definicion este de acuerdo con la defi-

nicion usual de derivada para una funcion f : R R. Con f : R R,
recordemos que la derivada f (a) fue definida como el lmite:
f (x) f (a)
f (a) = lm .
xa xa
Desafortunadamente, para una funcion vectorial f : Rn Rm con n y m mas
grandes que uno, esta definicion de una variable es absurda, dado que no pode-
mos dividir vectores. Podemos, sin embargo, manipular algebraicamente el lmite
hasta que tengamos una formulacion que pueda ser generalizada, naturalmente, a
las funciones de f : Rn Rm , y que estara de acuerdo con nuestra definicion.
Regresando al caso de una variable f : R R. Entonces:
f (x) f (a)
f (a) = lm
xa xa
es verdadero si y solo si:
f (x) f (a)
0 = lm f (a),
xa xa
lo cual es equivalente a:
f (x) f (a) f (a)(x a)

0 = lm
xa xa
o:
| f (x) f (a) f (a)(x a) |

0 = lm .
xa |xa|
Este ultimo hecho, al menos formalmente, tiene sentido para funciones f :
Rn Rm , probando que podemos reemplazar f (a) (un numero y por lo tanto
una matriz de 1 1) por una matriz de m n, es decir, el Jacobiano Df (a).
Al igual que la derivada de una variable, existe un metodo (generalmente) sen-

cillo para calcular la derivada sin recurrir a la toma real de un lmite, lo que nos
93
3.3. DIFERENCIACION
permite calcular realmente el Jacobiano.
Teorema 3.3.2 Sea la funcion f : Rn Rm dada por las m funciones diferen-

ciables f1 (x1 , ..., xn ) , ..., fm (x1 , ..., xn ), tal que:

f1 (x1 , ..., xn )

.

.
f (x1 , ..., xn ) =

.

.
fm (x1 , ..., xn )
Entonces f es diferenciable y el Jacobiano es:
f1 f1
x1
.. .. xn

. .. .. .

Df (x) =
. .. .. .

. .. .. .
fm fm
x1
.. .. xn
La prueba, que se puede encontrar en muchos libros sobre calculo vectorial,

es un calculo relativamente sencillo que proviene de la definicion de derivadas
parciales. Pero para entenderla, consideremos el siguiente ejemplo.
Ejemplo 3.3.3 Recordemos el ejemplo anterior de la funcion f : R2 R3 dada

por:

cos x1
f (x1 , x2 ) = sin x1
x2
el cual mapea el plano x1 x2 a un cilindro en el espacio. Entonces el Jacobiano,
que es la derivada de esta funcion vectorial, es:

cos(x1 )/x1 cos(x1 )/x2 sin x1 0
Df (x1 , x2 ) = sin(x1 )/x1 sin(x1 )/x2 = cos x1 0 .
x2 /x1 x2 /x2 0 1
94
Uno de los conceptos y tecnicas mas difciles en el calculo basico es la regla de

la cadena, lo que nos dice como diferenciar la composicion de dos funciones. Para
formas vectoriales, la regla de la cadena puede ser facilmente establecida (aunque
no vamos a dar la prueba aqu). Se debe relacionar la derivada de la composicion
de funciones con las derivadas de cada componente y de hecho tiene una forma
bastante precisa, es decir:
Teorema 3.3.4 Sea f : Rn Rm y g : Rm Rl funciones diferenciables.

Entonces la funcion composicion:
g f : Rn Rl
es tambien diferenciable con derivada dada por: si f (a) = b, entonces:
D(g f )(a) = D(g)(b) D(f )(a).
De esta manera, la regla de la cadena nos dice que para encontrar la derivada
de la composicion g f debemos multiplicar la matriz Jacobiano por g al mismo
tiempo que la multiplicamos por f .
Una de las claves intuitivas detras de la derivada de una variable es que f (a)
es la pendiente de la lnea tangente a la curva y = f (x) a el punto (a, f (a)) en
el plano R2 . De hecho, la lnea tangente que pasa a traves de (a, f (a)) nos da la
ecuacion:
y = f (a) + f (a)(x a).
Esta lnea y = f (a) + f (a)(x a) es la aproximacion lineal mas cercana a la

funcion y = f (x) a el punto x = a.
De esta manera, un criterio razonable para la derivada de f : Rn Rm debe

ser el que podamos utilizar esta derivada para encontrar una aproximacion lineal
a el objeto geometrico y = f (x), el cual esta en el espacio Rn+m . Pero esto es
precisamente lo que la definicion:
| f (x) f (a) Df (a)(x a) |

lm =0
xa | xa|
95
3.4. EL TEOREMA DE LA FUNCION INVERSA
hace. Es decir, f (x) es aproximadamente igual a la funcion lineal:
f (a) + Df (a) (x a).

Aqu Df (a), visto como una matriz de m n elementos, es un mapeo lineal
de Rn Rm y f (a), visto como un elemento de Rm , es una traslacion. De esta
manera, el vector y = f (x) puede ser aproximado por:
y f (a) + Df (a) (x a).
Ejemplo 3.3.5 Si u = 3x2 y 2z 2 + 6sen(xyz), donde
x = 4vw 2 , y = 5v 2 + 10w 3, z = v 3 .
Entonces
u u x u y u z
= + +
v x v y v z v
= (6xy 2 z 2 + 6yz cos(xyz))(4w 2 ) + (6x2 yz 2 + 6xz cos(xyz))(10v)
+ (6x2 y 2z + 6xy cos(xyz))(3v 2 )
u u x u y u z
= + +
w x w y w z w
= (6xy 2 z 2 + 6yz cos(xyz))(8vw) + (6x2 yz 2 + 6xz cos(xyz))(30w 2)
+ (6x2 y 2z + 6xy cos(xyz))(0)
3.4. El Teorema De La Funcion Inversa

Las matrices son faciles de entender, mientras que las funciones con valores
vectoriales pueden ser muy confusas. Como se observa en la ultima seccion, uno
de los puntos de contar con la derivada de las funciones vectoriales es que po-
demos aproximar la funcion original por una transformacion lineal, es decir, el
Jacobiano. La pregunta general es ahora lo bueno de hacer una aproximacion.
96
Que propiedades para las matrices se pueden utilizar para obtener las propieda-
des correspondientes para las funciones con valores vectoriales?
Este tipo de preguntas nos puede llevar al corazon del analisis numerico. Nos
limitaremos a ver que si la derivada de la matriz (el Jacobiano) es invertible, en-
tonces la funcion con valores vectoriales tambien debe tener una relacion inversa,
por lo menos a nivel local. Este teorema, y su pariente cercano el Teorema de la
Funcion Implcita, son dos herramientas tecnicas fundamentales que aparecen a
lo largo de las matematicas.
Teorema 3.4.1 (Teorema de la Funcion Inversa) Para una funcion vectorial con-
tinuamente diferenciable f : Rn Rm , suponemos que det Df (a) 6= 0, en
algun punto a en Rn . Entonces existe una vecindad abierta U de a en Rn y una
vecindad abierta V de f (a) en Rm tal que f : U V es uno a uno, sobreyectiva
y tiene una imagen inversa diferenciable g : V U (esto es, g f : U U
es la identidad y f g : V V es la identidad).
Por que la funcion f tiene una inversa? Pensemos que f esta siendo aproxi-
mada por la funcion lineal:
f (x) f (a) + Df (a)(x a).

Del Teorema Fundamental del Algebra Lineal, la matriz Df (a) es invertible si
y solo si det Df (a) 6= 0. De esta manera, f (x) sera invertible si f (a)+Df (a)(x
a) es invertible, lo cual sucedera, precisamente, cuando det Df (s) 6= 0. Ahora,
consideremos:
y = f (a) + Df (a)(x a).

Aqu, el vector y esta escrito explcitamente como una funcion del vector va-
riable x. Pero si la inversa de Df (a) existe, entonces podemos escribir x explci-
tamente como una funcion de y, es decir, como:
x = a + [Df (a)]1 (y f (a)).

En particular, tenemos que, si la funcion inversa es denotada por f 1 , entonces
su derivada es simplemente la inversa de la derivada de la funcion original f , es
97
3.4. EL TEOREMA DE LA FUNCION INVERSA
decir:
Df 1 (b) = [Df (a)]1 ,

donde b = f (a). Esto se sigue de la regla de la cadena y de que la composicion es
f 1 f = I.
Para el caso de f : R R, la idea detras del Teorema de la Funcion Inversa

puede expresarse como sigue: Si la pendiente de la lnea tangente, f (a), es no
cero, la lnea tangente no sera horizontal, y por lo tanto tendra una inversa.
En la exposicion del teorema, usaremos el termino tecnico conjunto abierto.

Existiran muchos mas acerca de esto en el siguiente captulo sobre Topologa. Por
ahora, pensemos en un conjunto abierto como una forma tecnica que nos permi-
ta hablar acerca de todos los puntos que estan cercanos a los puntos a y f (a).
Hablando especficamente, por una vecindad abierta U de un punto a en Rn , en-
tenderemos que, dado cualquier a U, existe un (peque no) positivo tal que:
{x :| x a |< } U.
Ejemplo 3.4.2 Sea
p
{(x, y) R2 :| (x, y) (0, 0) |= x2 + y 2 1}
el cual no es abierto (es, de hecho, cerrado lo que significa que su complemento
es abierto en el plano R2 ), mientras que el conjunto:
{(x, y) R2 :| (x, y) (0, 0) |< 1}

es abierto.
Ejemplo 3.4.3 Considerar las ecuaciones
x4 + y 4
= u, sen x + cos y = v.
x
Establecer para que puntos (x, y) se puede resolver para x y y en terminos de u y
v.
Solucion: Aqu las funciones son u = f1 (x, y) = (x4 + y 4 )/x y v =
f2 (x, y) = sen x + cos y. Queremos conocer los puntos cerca de los cuales po-
demos resolver para x y y como funciones de u y v. Segun el teorema de la fun-
cion inversa, primero debemos calcular (f1 , f2 )/(x, y). Tomemos el dominio
98
de f = (f1 , f2 ) como U = {(x, y) R2 |x 6= 0}. Ahora
!
f1 f1 3x4 y 4 4y 3

(f1 , f2 ) x y
= det f2 f2 = x2 x
(x, y) x y cos x sen y
sen y 4 4 4y 3
= )(y 3x ) cos x.
x2 x
Por lo tanto, en los puntos donde esto no se anula, se pueden despejar x y y en

terminos de u y v. En otras palabras, podemos despejar x y y cerca de aquellos x, y
para los que x 6= 0 y (sen y)(y 4 3x4 ) 6= 4xy 3 cos x. En general, no se pueden
despejar explcitamente x y y en dichas ecuaciones. Por ejemplo, si x0 = /2,
y0 = /2, podemos despejar x y y cerca de (x0 , y0) pues ah (f1 , f2 )/(x, y) 6=
0.
3.5. El Teorema De La Funcion Implcita

Rara vez una curva se puede describir como la grafica de una funcion de una
variable en el plano:
y = f (x)
aunque gran parte de nuestras experiencias tempranas con las matematicas son
con tales funciones. Por ejemplo, es imposible escribir el crculo:
x2 + y 2 = 1
como la grafica de una funcion de una variable, dado que para cualquier valor de
x (ademas de 1 y 1) puede que no existan valores correspondientes para y sobre
el crculo o pueden que existan dos valores correspondientes para y sobre el crcu-
lo. Esto es desafortunado. Las curvas en el plano que pueden ser descritas como
y = f (x) son mas faciles de trabajar. Sin embargo, podemos dividir el crculo en
su mitad superior e inferior. Para cada mitad, la variable y puede ser escrita como
una funcion de x: para la parte superior, tenemos:

y= 1 x2 ,
99
3.5. EL TEOREMA DE LA FUNCION IMPLICITA
y para la parte inferior:

y = 1 x2 .
Solo a los puntos (1, 0) y (1, 0) existen problemas. La dificultad puede atribuirse
al hecho de que a estos dos puntos (y solo a estos dos puntos) las lneas tangentes
del crculo son perpendiculares a el eje x.
Esta es la clave. La lnea tangente de un crculo es la mejor aproximacion li-

neal a el crculo. Si la lnea tangente puede ser escrita como:
y = mx + b,
entonces, no debe sorprendernos que el crculo pueda ser escrito como y = f (x),
al menos localmente.
La meta del Teorema de la Funcion Implcita es encontrar una herramienta de

calculo que nos permitira determinar cuando sea cero el lugar de varias funciones
en algun RN que pueda, localmente, ser escrita como la grafica de una funcion y,
de esta manera, en la forma y = f (x), donde la x denota la variable independiente
y la y denota la variable dependiente. Enterrado (no demasiado profundo) es la in-
tuicion que queremos saber sobre el espacio tangente del lugar cero de funciones.
La notacion es un poco engorrosa. Etiquetemos un sistema de coordenadas

para Rn+k por:
x1 , ..., xn , y1 , ..., yk
que frecuentemente abreviamos como (x, y). Sean:
f1 (x1 , ..., xn , y1 , ..., yk ), ..., fk (x1 , ..., xn , y1 , ..., yk )

k funciones continuamente diferenciables, las cuales frecuentemente escribiremos
como:
f1 (x, y), ..., fk (x, y).

Pongamos:
V = {(x, y) Rn+m : f1 (x, y) = 0, ..., fk (x, y) = 0}.
100
Queremos determinar cuando, dado un punto (a, b) V (donde a Rn y

b Rk ), existiran k funciones:
1 (x1 , ..., xn ), ..., k (x1 , ..., xn )

definidas en una vecindad de el punto a sobre Rn tal que V pueda ser descrita, en
una vecindad de (a, b) sobre Rn+k , como:
{(x, y) Rn+k : y1 = 1 (x1 , ..., xn ), ..., yk = k (x1 , ..., xn )},

que, por supuesto, es frecuentemente escrito en forma corta como:
V = {y1 = 1 (x), ..., yk = k (x)},

o incluso de forma mas sucinta como:
V = {y = (x)}.
De esta manera, lo que queremos es encontrar k funciones 1 , ..., k tal que
para todo x Rn , tendremos:
f1 (x, 1 (x)) = 0, ..., fk (x, k (x)) = 0.

De esta manera, lo que queremos saber es cuando las k funciones f1 , ..., fk
pueden ser usadas para definir (implcitamente, ya que tiene el trabajo para real-
mente construirlas) las k funciones 1 , ..., k .
Teorema 3.5.1 (Teorema de la Funcion Implcita): Sean f1 (x, y), ..., fk (x, y), k
funciones continuamente diferenciables sobre Rn+k y supongase que p = (a, b)
Rn+k es un punto para el cual:
f1 (a, b) = 0, ..., fk (a, b) = 0.

Supongase que al punto p, la matriz k k:

f1 f1
y1 (p)
. . . yk (p)
. . . . .

M = . . . . .

. . . . .

fk fk
y1 (p)
. . . yk (p)
101
es invertible. Entonces en una vecindad de a en Rn existen k funciones diferen-

ciables unicas:
1 (x), ..., k (x)

tal que:
f1 (x, 1 (x)) = 0, ..., fk (x, k (x)) = 0.
Regresando al crculo. Aqu la funcion es f (x, y) = x2 +y 2 1 = 0. La matriz

M en el teorema, sera una matriz de 1 1:
f
= 2y.
y1
Esta matriz no es invertible (el numero es cero) solo cuando y = 0, es decir, a los
dos puntos (1, 0) y 1, 0; solo a estos dos puntos no estara definida una funcion
implcita .
Ahora esbozaremos las ideas principales de la prueba, cuyo esquema lo obtu-

vimos
del libro de Calculo en Variedades de Spivak. De hecho, este teorema es
una consecuencia bastante f facil del Teorema de la Funci on Inversa.
Demostracion: Para facilitar la notacion, escribiremos la k-tupla
(f1 (x, y), ..., fk (x, y))
como f (x, y). Definamos una nueva funcion F : Rn+k Rn+k por:
F (x, y) = (x, f (x, y)).

El Jacobiano de este mapeo es la matriz (n + k) (n + k):

I 0
.
M
Aqu, la I es la matriz identidad n n, M es la matriz k k de derivadas
parciales como en el teorema, 0 es la matriz cero n k y es alguna matriz k n.
Entonces, el determinante del Jacobiano sera el determinante de la matriz M; por
102
lo tanto, el Jacobiano es invertible si y solo si la matriz M es invertible. Por el Teo-

rema de la Funcion Inversa, existira una funcion G : Rn+k Rn+k que local-
mente sera, en una vecindad del punto (a, b), la inversa de F (x, y) = (x, f (x, y)).
Sea esta funcion inversa G : Rn+k Rn+k descrito por las funciones reales
G1 , ..., Gn+k y, de esta manera:
G(x, y) = (G1 (x, y), ..., Gn+k (x, y)).

Por la naturaleza de la funcion F , observamos que para 1 i n:
Gi (x, y) = xi .
Reetiquetemos las ultimas k funciones hechas para la funcion G, por:
i (x, y) = Gi+n (x, y).

De esta manera:
G(x, y) = (x1 , ..., xn , 1 (x, y), ..., k (x, y)).

Queremos mostrar que las funciones i (x, 0) son las funciones que el teorema re-
quiere.
Todava no hemos mirado en el conjunto de puntos Rn+k donde las k funcio-

nes originales fi son cero, es decir, el conjunto que anteriormente llamamos V . La
imagen de V bajo la funcion F esta contenido en el conjunto (x, 0). Entonces, la
imagen G(x, 0), al menos, alrededor de (a, b) localmente sera V , De esta manera,
a lo mas queremos que:
f1 (G(x, 0)) = 0, ..., fk (G(x, 0)) = 0.

Pero esto solo significa que:
f1 (x, 1 (x, 0)) = 0, ..., fk (x, k (x, 0)) = 0,

lo cual es exactamente lo que buscabamos probar.
Aqu se utilizo el Teorema de la Funcion Inversa para probar el Teorema de la

Funcion Implcita. Ciertamente, es posible y no mas difcil, probar el Teorema de
la Funcion Implcita primero y luego usarla para probar el Teorema de la Funcion
103
Inversa.
Ejemplo 3.5.2 Establecer los puntos donde es posible representar la superficie
x3 + 3y 2 + 8xz 2 3z 3 y = 1
como grafica de una funcion diferenciable z = k(x, y).
Solucion: Aqu tomamos F (x, y, z) = x3 +3y 2 +8xz 2 3z 3 y 1 e intentamos

despejar z de F (x, y, z) = 0 para representarla como una funcion de (x, y). Por el
teorema de la funcion implcita, es posible hacerlo cerca de un punto (x0 , y0, z0 )
si (F/z)(x0 , y0 , z0 ) 6= 0, esto es, si
z0 (16x0 9z0 y0 ) 6= 0.
lo cual significa, a su vez,
z0 6= 0 y 16x0 6= 9z0 y0 .
Ejemplo 3.5.3 Mostrar que cerca del punto (x, y, u, v) = (1, 1, 1, 1) podemos re-
solver
xu + yvu2 = 2
xu3 + y 2 v 4 = 2
de manera unica para u y v como funciones de x y y. Calcular u/x en el punto

(1,1).
Solucion: Para verificar la existencia de la solucion, formamos las ecuaciones
F1 (x, y, u, v) = xu + yvu2 2
F2 (x, y, u, v) = xu3 + y 2 v 4 2
104
y el determinante
F1 F1

= det u v en (1, 1, 1, 1)
F2 F2
u v
x + 2yuv yu2

= det en (1, 1, 1, 1)
3u2 x 4y 2v 3

3 1
= det = 9.
3 4
Como 6= 0, se asegura la existencia de la solucion por el teorema de la funcion

implcita. Para hallar u/x, diferenciamos implcitamente con respecto a x las
ecuaciones dadas usando la regla de la cadena:
u v u
x + u + y u2 + 2yvu = 0
x x x
u v
3xu2 + u3 + 4y 2v 3 = 0.
x x
Al hacer (x, y, u, v) = (1, 1, 1, 1) da
u v
3+ = 1
x x
u v
3 +4 = 1.
x x
Resolviendo para u/x, al multiplicar la primera ecuacion por 4 y restarla a la

segunda, da u/x = 13 .
105
106
Captulo 4
Topologa de Conjuntos
Historicamente, gran parte de la topologa de conjuntos de puntos se ha desa-

rrollado para entender las definiciones correctas de nociones tales como la conti-
nuidad y dimension. Por ahora, sin embargo, estas definiciones han permeado a
las matematicas, a menudo en areas aparentemente alejadas del tradicional espa-
cio topologico de Rn . Desafortunadamente, no es menos evidente en primer lugar
que estas definiciones mas abstractas son en absoluto utiles: es necesario que haya
una inversion inicial en el aprendizaje de los terminos basicos. En la primera sec-
cion, estas definiciones basicas se dan. En la siguiente seccion, estas definiciones
se aplican al espacio topologico Rn , donde todo esta mucho mas asentado. Luego
nos fijamos en los espacios metricos y por ultimo estudiamos las bases para las
topologas.
4.1. Definiciones Basicas

Gran parte de la topologa de conjuntos de puntos consiste en el desarrollo de
un lenguaje conveniente para hablar de cuando varios puntos de un espacio estan
cerca el uno del otro y sobre la nocion de continuidad. La clave es que las mismas
definiciones se pueden aplicar a muchas ramas diferentes de las matematicas.
Definicion 4.1.1 Sea X un conjunto de puntos. Una coleccion de subconjuntos
107
4.1. DEFINICIONES BASICAS
U = {U } forman una topologa sobre X si:
1. Cualquier union arbitraria de los U es otro conjunto en la coleccion U.
2. La interseccion de cualquier numero finito de conjuntos U en la coleccion

U es otro conjunto en U.
3. Tanto el conjunto vacio y el propio espacio X estan en U.
El par ordenado (X, U) es llamado espacio topologico.
Los conjuntos U en la coleccion U son llamados conjuntos abiertos. Un con-

junto C es cerrado si su complemento X C es abierto.
Definicion 4.1.2 Sea A un subconjunto de un espacio topologico X. Entonces, la

topologa inducida sobre A es descrita al dejar que todos los conjuntos abiertos de
A sean de la forma U A, donde U es un conjunto abierto en X.
P
Una coleccion = {U } de conjuntos abiertos se dice que es una cubierta
abierta de un subconjunto A, si A esta contenida en la union de los U .
Definicion 4.1.3 El subconjunto A de un espacio topologico X es compacto si

dado cualquier cubierta abierta de A, existe una subcubierta finita.
P
En otras palabras, si = {U } es una cubierta abierta de A en X, enton-
ces A sera compacto, si existen un numero finito de los U , que denotaremos por
U1 , ..., Un , tales que:
A (U1 , ..., Un ).
No debe ser de todo claro por que esta definicion sera util, mucho menos impor-
tante. Parte de su significado se vera en la seccion siguiente, cuando se discuta el
Teorema de Heine-Borel.
108
CAPITULO 4. TOPOLOGIA DE CONJUNTOS
Definicion 4.1.4 Un espacio topologico X es Hausdorff si dado cualesquiera dos

puntos x1 , x2 X, existen dos conjuntos abiertos U1 y U2 con x1 U1 y x2 U2 ,
pero con la interseccion de U1 y U2 vacia.
De esta manera, X es Hausdorff si los puntos son aislados (separados) el uno

del otro por conjuntos abiertos disjuntos.
Definicion 4.1.5 Una funcion f : X Y es continua, donde X y Y son dos es-

pacios topologicos, si dado cualquier conjunto abierto U en Y , entonces la imagen
inversa f 1 (U) en X a lo mas es abierta.
Definicion 4.1.6 Un espacio topologico X es conexo si no es posible encontrar

dos conjuntos abiertos U y V en X con X = U V y U V = .
Definicion 4.1.7 Un espacio topologico en X es arco-conexo si dado cualesquie-

ra dos puntos a y b en X, existe un mapeo continuo:
f : [0, 1] X
con:
f (0) = a y f (1) = b.
Aqu, por supuesto:
[0, 1] = {x R : 0 x 1}
es el intervalo unitario. Para hacer esta ultima definicion bien definida, tendramos
que poner una topologa en el intervalo [0, 1], pero esto no es difcil y de hecho se
hace en la siguiente seccion.
Aunque en la siguiente seccion se desarrollara la topologa estandar sobre Rn ,

vamos a utilizar esta topologa con el fin de construir un espacio topologico que es
conexo, pero que no es arco-conexo. Hay que destacar que se trata de un ejemplo
poco comun, ya que en la mayora de los casos, conexo es equivalente a arco-
conexo.
109
4.1. DEFINICIONES BASICAS
Ejemplo 4.1.8 Sea:

1
X = {(0, t) : 1 t 1} {y = sin : x > 0}.
x
Coloquemos la topologa inducida sobre X de la topologa estandar sobre R2 .
Notese que no existe un arco-conexion del punto (0, 0) a el punto ( 1 , 0). De hecho,
no hay punto sobre el segmento {(0, t) : 1 t 1} que pueda ser conectado
con un arco a cualquier punto sobre la curva {y = sin( x1 ) : x > 0}. Pero, por
otro lado, la curva {y = sin( x1 ) : x > 0} se vuelve arbitrariamente cercana a el
segmento {(0, t) : 1 t 1} y, por lo tanto, no hay forma de separar las dos
partes mediante conjuntos abiertos.
Ejemplo 4.1.9 Considerense las siguientes clases de subconjuntos de
X = {a, b, c, d, e}.
1 = {X, , {a}, {c, d}, {a, c, d}, {b, c, d, e}}

2 = {X, , {a}, {c, d}, {a, c, d}, {b, c, d}}
3 = {X, , {a}, {c, d}, {a, c, d}, {a, b, d, e}}
Notese que 1 es una topologa de X porque verifica los tres axiomas necesarios.
Sin embargo, 2 no es una topologa de X porque la union
{a, c, d} {b, c, d} = {a, b, c, d}

de dos conjuntos de 2 no pertenece a 2 , esto es, 2 no cumple el axioma 2.
Tampoco 3 es una toploga de X por que la interseccion
{a, c, d} {a, b, d, e} = {a, d}

de dos conjuntos de 3 no pertenece a 3 , esto es, 3 no satisface el axioma 3.
Ejemplo 4.1.10 Sea D la clase de todos los subconjuntos de X. D cumple los

axiomas y es una topologa de X. Esta es la topologa discreta de X y, en este
caso, X conjuntamente con su topologa discreta, es decir, el par (X, D), es un
espacio topologico discreto o, simplemente, un espacio discreto.
110
Ejemplo 4.1.11 Considerense un espacio discreto cualquiera (X, D) y un espacio

topologico arbitrario (Y, ). Entonces, cualquier funcion f : X Y es D
continua, porque si H es un subconjunto cualquiera abierto de Y , entonces su
recproca f 1 (H) es un subconjunto abierto de X ya que todos los subconjuntos
de un espacio discreto son abiertos.
Ejemplo 4.1.12 Sea la topologa de la recta real R generada por los intervalos
abiertos-cerrados (a, b]. Demostrar que (R, ) es un espacio de Hausdorff.
Solucion: Sean a, b R tales que a 6= b, por ejemplo, a < b. Escojanse

G = (a 1, a] y H = (a, b]. Entonces,
G, H , a G, b H
y
GH =
Luego (R, ) es un espacio de Hausdorff.
4.2. La Topologa Estandar de Rn

La topologa de conjuntos de puntos es definitivamente un producto del siglo
XX. Sin embargo, mucho antes de eso, la gente estaba usando funciones continuas
e ideas relacionadas. Incluso en los captulos anteriores, las definiciones que fue-
ron dadas para funciones continuas, se llevaron a cabo sin la necesidad de discutir
conjuntos abiertos y topologa. En esta seccion se define la topologa estandar en
Rn y demuestran que la definicion de continuidad dada en el captulo anterior
en terminos de lmites esta relacionada con la definicion que figura en la seccion
anterior en terminos de imagenes inversas de los conjuntos abiertos. El punto im-
portante es que la version de conjunto abierto se puede utilizar en contextos para
los que la nocion de lmite no tiene sentido. Ademas, en la practica, la version del
abierto es, con frecuencia, no mas difcil de usar que la version lmite.
Un punto de critica a la definicion de la topologa estandar sobre Rn es que

no existe una nocion natural de distancia sobre Rn . Recordemos que la distancia
entre dos puntos a = (a1 , ..., an ) y b = (b1 , ..., bn ) en Rn esta definida por:
p
| a b |= (a1 b1 )2 + ... + (an bn )2 .
111
4.2. LA TOPOLOGIA ESTANDAR DE RN
Con esto, podemos definir una topologa sobre R( n), especificando a los conjun-
tos abiertos de la siguiente manera:
Definicion 4.2.1 Un conjunto U en Rn sera abierto si dado cualquier a Rn ,

existe un numero real > 0 tal que:
{x :| x a |< }
esta contenido en U.
En R1 , los conjuntos de la forma (a, b) = {x : a < x < b} son abiertos,

mientras que los conjuntos de la forma [a, b] = {x : a x b} son cerrados.
Los conjuntos como [a, b) = {a x < b} no son ni abiertos ni cerrados. En R2 ,
el conjunto {(x, y) : x2 + y 2 < 1} es abierto, mientras que {(x, y) : x2 + y 2 1}
es cerrado.
Proposicion 4.2.2 La anterior definicion de un conjunto abierto definira una to-

pologa sobre Rn .
Esta es llamada la topologa estandar sobre Rn .
Proposicion 4.2.3 La topologa estandar sobre Rn es Hausdorff.
Demostracion: Sean a y b dos puntos distintos en Rn . Sea d =| a b | la

distancia de a a b. Pongamos:
d
Ua = {x Rn : | x a |< }
3
y
d
Ub = {x Rn : | x b |< }.
3
Tanto Ua como Ub son conjuntos abiertas con a Ua y b Ub . Entonces Rn es
Hausdorff si:
Ua Ub = .
112
Supongamos que la interseccion es no vacia. Sea x Ua Ub . Entonces, usando el

truco estandar de adicionar terminos cuya suma sea cero, y usando la desigualdad
del triangulo, tenemos que:
|ab | = |ax+xb|
|ax|+|xb|
d d
< +
3 3
2d
=
3
< d.
Dado que no podemos tener d =| a b |< d y dado que la unica suposicion

que hicimos fue de que exista un punto x tanto en Ua como en Ub , vemos que la
interseccion, de hecho, debe ser vacia. Por lo tanto, el espacio Rn es Hausdorff.
En el Capitulo 3, definimos que una funcion f : Rn Rm sera continua si,

para todo a Rn :
lm f (x) = f (a),
xa
esto significa que, dado cualquier > 0, existe algun > 0 tal que si | x a |< ,
entonces:
| f (x) f (a) |< .
Esta definicion lmite de continuidad captura gran parte de la idea intuitiva de que
una funcion es continua si se puede representar graficamente sin levantar el lapiz
del papel. Ciertamente, queremos que esta definicion anterior de la continuidad
este relacionada con nuestra nueva definicion, que requiere que la imagen inversa
de un conjunto abierto sea abierto. Una vez mas, la justificacion de la version de
la imagen inversa de la continuidad es que puede extenderse a contextos donde la
version del lmite (mucho menos el requisito de no levantar el lapiz del papel) no
tiene sentido.
113
Proposicion 4.2.4 Sea f : Rn Rm una funcion. Para todo a Rn :
lm f (x) = f (a)
xa
si y solo si, para cualquier conjunto abierto U en Rm , la imagen inversa f 1 (U)

es abierta en Rn .
Demostracion: Primero, suponemos que la imagen inversa de cualquier con-

junto abierto en Rm es abierta en Rn . Sea a Rn . Debemos mostrar que:
lm f (x) = f (a).
xa
Sea > 0. Debemos encontrar algun > 0 tal que si | x a |< , entonces:
| f (x) f (a) |< .

Definase:
U = {y Rm :| y f (a) |< }.
El conjunto U es abierto en Rm . Por supuesto, la imagen inversa:
f 1 (U) = {x Rn : f (x) U}
= {x Rn :| f (x) f (a) |< }
es abierto en Rn . Dado que a f 1 (U), existe algun numero real > 0 tal que el
conjunto:
{x :| x a |< }
esta contenido en f 1 (U), por la definicion de conjunto abierto en Rn . Pero en-
tonces, si | x a |< , tenemos que f (x) U o, en otras palabras:
| f (x) f (a) |< ,

lo cual es lo que queramos mostrar. Por lo tanto la version de la imagen inversa
de la continuidad implica la version de lmite.
Ahora, suponemos que:
lm f (x) = f (a).
xa
114
Sea U cualquier conjunto abierto en Rm . Necesitamos mostrar que la inversa

f 1 (U) es abierta en Rn . Si f 1 (U) es vacia, no hay mas que demostrar, dado
que el conjunto vacio es siempre abierto. Ahora asumimos que f 1 (U) es no va-
cia. Sea a f 1 (U). Entonces f (a) U. Dado que U es abierto, existe un
numero real > 0 tal que el conjunto:
{y Rm :| y f (a) |< }
este contenido en el conjunto U. Dado lmxa f (a) = f (a), por la definicion
de lmite, dado este > 0, a lo mas existe algun > 0 tal que si | x a |< ,
entonces:
| f (x) f (a) |< .

Ademas, si | x a |< , entonces f (x) U. De esta manera, el conjunto:
{x :| x a |< }
esta contenido en el conjunto f 1 (U), lo cual significa que f 1 (U) es necesaria-
mente un conjunto abierto. De esta manera, las dos definiciones de continuidad
coinciden.
P compacto fue definido como el conjunto A

En la ultima seccion, un conjunto
sobre el cual cada cubierta abierta = {U } de A tiene una subcubierta finita.
n
Por la topologa estandar de R , la compacidad es equivalente a la idea mas intui-
tiva de que el conjunto es compacto si este es tanto cerrado como acotado. Esta
equivalencia es la meta del Teorema de Heine-Borel:
Teorema 4.2.5 (Heine-Borel) Un subconjunto A de Rn es compacto si y solo si

este es cerrado y acotado.
Primero daremos una definicion para la acotacion, despues veremos algunos

ejemplos y entonces esbozaremos una prueba de un caso especial de este teorema.
Definicion 4.2.6 Un subconjunto A es acotado en Rn si existe algun numero real

fijo r tal que para todo x A:
| x |< r
115
(esto es, A esta contenido en una bola de radio r).
Ejemplo 4.2.7 Consideremos el intervalo abierto (0, 1) en R, el cual es claramen-

te acotado, pero no es cerrado. Queremos mostrar que este intervalo es tambien
no compacto. Sea:
1 1
Un = ( , 1 )
n n
1 1
= {x : < x < 1 }
n n
una coleccion de conjuntos abiertos.
Esta coleccion sera una cubierta abierta del intervalo, dado que cada punto en
(0, 1) esta en algun Un . (De hecho, una vez que el punto dado esta en un conjunto
Un , este estara en cada conjunto Un+k futuro.) Pero notese que la subcoleccion
finita no cubre todo el intervalo (0, 1). De esta manera, el intervalo (0, 1) no puede
ser compacto.
Ejemplo 4.2.8 En este ejemplo veremos un intervalo que es cerrado pero no aco-
tado. Una vez mas, una cubierta abierta explicita se dara para los que no existen
subcubiertas finitas. El intervalo [0, ) = {x : 0 x} es cerrado pero definitiva-
mente es, a lo mas, no acotado.
Tambien es no compacto, como se puede observar con la siguiente cubierta abier-
ta:
Un = (1, n) = {x : 1 < x < n}.

La coleccion {Un }
n=1 , cubre a todo [0, ), pero no contiene subcubiertas finitas.
La prueba del Teorema de Heine-Borel gira en torno a la reduccion de todo el

argumento para el caso especial de demostrar que un intervalo cerrado y acotado
sobre la lnea real es compacto. Esta es la tecnica principal de la prueba. La idea
clave en realidad aparece en una serie de contextos diferentes, por lo que la damos
aqu.
Lema 4.2.9 Sobre la linea real R, un intervalo cerrado [a, b] es compacto.
116
P
Demostracion: Sea una cubierta abierta de [a, b]. Necesitamos encontrar
una subcubierta finita. Definase un nuevo conjunto:
X
Y = {x [a, b] : existe una subcubierta finita en del intervalo [a,x]}.
Nuestra meta es mostrar que el punto b de nuestro intervalo esta en este nuevo
conjunto Y .
Primero mostraremos que Y es no vacio, mostrando que el punto inicial a

esta en Y . Si x = a, entonces estaremos
P interesados en el intervalo trivial [a, a] =
a, un simple
P punto. Dado que es una cubierta abierta, existe un conjunto abier-
to V con [a, a] V . De esta manera, para el intervalo [a, a] existe una
subcubierta finita, y, de esta manera, a esta en el conjunto Y , lo que significa que,
al menos, Y es no vaco.
Pongamos a como la mnima cota superior de Y . Esto significa que existiran

elementos en Y arbitrariamente cercanos a , pero que ninguno de esos elementos
sera mayor que . (Aunque para mostrar la existencia de una mnima cota superior
implica la propiedad sutil e importante de la completitud de los numeros reales,
sin duda es bastante razonable, intuitivamente, que tal lmite superior debe existir
para cualquier conjunto acotado de reales.) Mostremos que el punto esta a si
mismo en el conjunto Y y, a continuacion, que es, de hecho, el punto b, lo cual
nos permitira concluir que el intervalo es, de hecho, compacto.
P
Dado que P [a, b] y, dado que es una cubierta abierta, existe un conjunto
abierto U en con U. Dado que U es abierto en [a, b], existe un numero
positivo con:
{x :| x a |< } U.
Dado que es la mnima cota superior de Y , a lo mas existe un x Y que es
arbitrariamente cercano a , pero menor que este. De esta manera, podemos en-
contrar un x Y U con:
x < .
Dado que x Y , existe una subcubierta finita U1 , ..., UN del intervalo [a, x]. En-
tonces, la coleccion finita U1 , ..., UN , U cubre a P
[a, ]. Pero esto significa que,
dado que cada conjunto abierto Uk y U estan en , el intervalo [a, ] tiene una
117
subcubierta finita y, por lo tanto, la mnima cota superior esta en Y .
Ahora suponemos que a < b. Lo que queremos con esto es obtener una contra-
diccion. Sabemos que esta en elPconjunto Y . Por lo tanto, existe una subcubierta
finita U1 , ..., Un de la coleccion la cual cubre al intervalo [a, ]. Seleccionese
los conjuntos abiertos de manera que el punto este en el conjunto abierto Un .
Dado que Un es abierto, existe un > 0 con:
{x :| x a |< } Un .
Dado que el punto b es estrictamente mayor que el punto , en realidad podemos
encontrar un punto x que este en el conjunto Un y que satisface:
a < x < b.
Pero entonces, la subcubierta finita U1 , ..., Un no cubre solo al intervalo [a, ],
sino tambien al intervalo mas grande [a, x], forzando a que el punto x este en el
conjunto Y . Esto es imposible, dado que es el elemento mas grande posible en
el conjunto Y . Dado que solo supusimos que < b, a lo mas hemos tenido que
= b, como se deseaba.
Sin embargo, existen otras formulaciones utiles para la compacidad en Rn .
Teorema 4.2.10 Un subconjunto A en Rn es compacto si cada sucesion infinita

(xn ) de puntos en A tiene una subsucesion convergente a un punto en A. De esta
manera, si (xn ) es una coleccion de puntos en A, existe a lo mas un punto p A
y una subsucesion xnk con lmk xnk = p.
La compacidad tambien es importante para lo siguiente:
Teorema 4.2.11 Sea X un espacio topologico compacto y sea f : X R una

funcion continua. Entonces, existe un punto p X donde f tiene un maximo.
Daremos una idea general de la prueba. Primero, necesitamos mostrar que

la imagen continua de un conjunto compacto es compacto. Entonces, f (X) sera
118
compacto en R y, por lo tanto, a lo mas sera cerrado y acotado. De esta manera,

existira una mnima cota superior en f (X), cuya imagen inversa contendra al pun-
to p deseado. Un argumento similar puede ser usado para mostrar que cualquier
funcion continua f (x) sobre un conjunto compacto a lo mas tiene un mnimo.
4.3. Espacios Metricos

La nocion natural de distancia sobre el conjunto Rn es la clave para la existen-
cia de la topologa estandar. Afortunadamente, sobre muchos conjuntos similares
las nociones de distancia (llamadas metricas) existen; cualquier conjunto que ten-
ga una metrica, automaticamente tiene una topologa.
Definicion 4.3.1 Una metrica sobre un conjunto X es una funcion:
: X X R
tal que para todos los puntos x, y, z X tenemos que:
1. (x, y) 0 y (x, y) = 0 si y solo si x = y.
2. (x, y) = (y, x).
3. (La Desigualdad del Triangulo)
(x, z) (x, y) + (y, z).
El conjunto X con su metrica es llamado un espacio metrico y es denotado por

(X, ).
Fijemos un espacio metrico (X, ).
119
4.3. ESPACIOS METRICOS
Definicion 4.3.2 Un conjunto U en X es abierto si para todos los puntos a U,

existe algun numero real > 0 tal que:
{x :| x a |< }
esta contenido en U.
Proposicion 4.3.3 La anterior definicion para los conjuntos abiertos definira un

espacio topologico sobre el espacio metrico (X, ).
La demostracion es similar a la correspondiente demostracion para la topo-

loga estandar sobre Rn . De hecho, la mayora de los aspectos topologicos acerca
de Rn pueden ser facilmente trasladados a los correspondientes aspectos topologi-
cos acerca de cualquier espacio metrico.
Ejemplo 4.3.4 La funcion d definida por d(a, b) = |a b|, donde a y b son nume-
ros reales, es una metrica llamada metrica usual de la recta real R. Ademas, la
funcion d definida por
p
d(p, q) = (a1 b1 )2 + (a2 b2 )2
donde p = ha1 , a2 i y q = hb1 , b2 i son puntos del plano R2 , es una metrica llamada
metrica usual de R2 . A no ser que se especifiquen otras metricas distintas, se
entendera que las metricas usuales son las que se utilizan al trabajar con R y R2 .
Ejemplo 4.3.5 Sea X un conjunto no vaco y sea d la funcion definida por

0, si a = b;
d(a, b) =
1, si a 6= b.
Entonces, d es una metrica de X. A esta funcion distancia se le suele llamar metri-

ca trivial de X.
Ejemplo 4.3.6 Sean p = ha1 , a2 i y q = hb1 , b2 i puntos arbitrarios del plano R2 ,

esto es, pares ordenados de numeros reales. Las funciones d1 y d2 definidas por
d1 (p, q) = max(|a1 b1 |, |a2 b2 |),

d2 (p, q) = max |a1 b1 | + |a2 b2 |
son metricas distintas de R2
120
4.4. Bases para las Topologas

Advertencia : Esta seccion usa la definicion de conjuntos contables. Un con-
junto es contable si existe una funcion inyectiva y sobreyectiva, es decir, biyectiva,
del conjunto a los numeros naturales. Notese que los numeros racionales son con-
tables, mientras que los numeros reales son no contables.
En algebra lineal, la palabra base significa una lista de vectores en un espacio

vectorial que genera, unicamente, al espacio vectorial entero. En una topologa,
una base sera una coleccion de conjuntos abiertos que generan a la topologa en
su totalidad. Especficamente:
Definicion 4.4.1 Sea X un espacio topologico. Una coleccion de conjuntos abier-

tos, forman una base para la topologa si cada conjunto abierto en X es la union
(posiblemente infinita) de conjuntos de la coleccion.
Ejemplo 4.4.2 Sea (X, ) un espacio metrico. Para cada entero positivo k y para
cada punto p X, pongamos:
1
U(p, k) = {x X : (x, p) < }.
k
Se puede mostrar que la coleccion de todos los posibles U(p, k) forman una base
para la topologa del espacio metrico.
En la practica, el tener una base nos permitira reducir muchos calculos to-
pologicos para el calculo de conjuntos en la base. Esto sera muy manipulable si
podemos, de alguna manera, limitar el numero de elementos en una base. Esto nos
lleva a:
Definicion 4.4.3 Un espacio topologico es segundo contable si este tiene una base
con un numero contable de elementos.
Ejemplo 4.4.4 En este ejemplo Rn , con la topologa usual, es segundo contable.
Una base contable puede ser construida como sigue. Para cada entero positivo k
y cada p Qn (lo cual significa que cada coordenada del punto p es un numero
racional), definase:
1
U(p, k) = {x Rn :| x p |< }.
k
121
4.4. BASES PARA LAS TOPOLOGIAS
Hay un numero contable de tales conjuntos U(p, k) y se puede mostrar que estos
forman una base.
Los espacios topologicos mas razonables son segundos contables. Aqu da-
mos un ejemplo de un espacio metrico que no es segundo contable. Sea X cual-
quier conjunto no contable (uno podra hacer que, por ejemplo, X sea los nume-
ros reales). Definase una metrica sobre X colocando (x, y) = 1 si x 6= y y
(x, x) = 0. Se puede mostrar que esta define una metrica sobre X y, de esta
manera, define una topologa sobre X. Sin embargo, esta topologa es extrana.
Cada punto x es, as mismo, un conjunto abierto, dado que el conjunto abierto
{y X : (x, y) < 1/2} = x. Usando el hecho de que existen un numero no
contable de puntos en X, podemos mostrar que este espacio metrico no es segun-
do contable.
Por supuesto, si usamos el termino segundo contable, significa que a lo mas

existira algo como primer contable. Un conjunto topologico es primer conta-
ble si cada punto x X tiene una base-vecindad contable. Para que esto tenga
sentido, necesitamos saber que es una base-vecindad. Una coleccion de conjuntos
abiertos en X forman una base-vecindad de algun x X si cada conjunto abierto
que contiene a x tiene en si un conjunto abierto de la coleccion y si cada conjunto
abierto en la coleccion contiene al punto x. Solo hemos mencionado esta defini-
cion por el motivo de la completitud.
122
Captulo 5
El Teorema Clasico de Stokes
El Teorema de Stokes, en todas sus manifestaciones, se reduce a igualar la

media de una funcion en el lmite de un objeto geometrico con el promedio de
sus derivadas (en un sentido adecuado) en el interior del objeto. Por supuesto, una
afirmacion correcta sobre los promedios se debe poner en el idioma de las inte-
grales. Este teorema proporciona un vnculo profundo entre la topologa (la parte
de las fronteras) y el analisis (integrales y sus derivadas). Tambien es fundamental
para gran parte de la fsica, como se puede ver tanto en su desarrollo historico y
en el hecho de que para la mayora de la gente su primer contacto con el teorema
de Stokes se encuentra en un curso sobre electricidad y magnetismo.
Este captulo examina algunos casos especiales del teorema de Stokes, casos
especiales que se conocan mucho antes de que la gente se dio cuenta de la exis-
tencia de un teorema general. Por ejemplo, veremos que el Teorema Fundamental
del Calculo es un caso especial del Teorema de Stokes (aunque para demostrar
el Teorema de Stokes, se utiliza el Teorema Fundamental del Calculo, por lo que
logicamente el Teorema de Stokes no implica el Teorema Fundamental del Calcu-
lo). Fue en en el siglo XIX que la mayora de estos casos especiales se descu-
brieron. Estos casos especiales son importantes y utiles, ya que forman los temas
estandar en la mayora de los cursos de calculo multivariable y clases de introduc-
cion a la electricidad y al magnetismo. Se trata del Teorema Green, el Teorema de
la Divergencia y el Teorema de Stokes. En este captulo se desarrolla la matemati-
ca necesaria para estos casos especiales. Vamos a esbozar el estado y las pruebas
123
5.1. PRELIMINARES ACERCA DEL CALCULO VECTORIAL
para el Teorema de la Divergencia y el Teorema de Stokes. Las intuiciones fsicas

se destacan.
5.1. Preliminares acerca del Calculo Vectorial

Esta es una seccion larga, ya que revisaremos las definiciones basicas del
Calculo Vectorial. Tenemos que definir campos vectoriales, variedades, trayecto-
rias e integrales de superficie, la divergencia y el rotacional. Todas estas nociones
son esenciales. Solo entonces podremos trabajar el Teorema de la Divergencia y
el Teorema de Stokes, que son los objetivos de este captulo.
5.1.1. Campos Vectoriales

Definicion 5.1.1 Un campo vectorial sobre Rn es una funcion de valores vecto-
riales:
F : Rn Rm .
Si x1 , ..., xn son coordenadas para Rn , entonces el campo vectorial F sera descrito
por las m funciones reales fk : Rn R como sigue:

f1 (x1 , ..., xn )

.

F(x1 , ..., xn ) =
. .

.
fm (x1 , ..., xn )
Un campo vectorial es continuo si cada funcion real fk es continua, es dife-

renciable si cada funcion real fk es diferenciable, etc.
Intuitivamente, un campo vectorial asigna a cada punto de Rn un vector. Mu-

chos fenomenos fsicos pueden ser capturados en terminos de campos vectoriales.
De hecho, son el lenguaje natural del estudio de fluidos, campos electricos, cam-
pos magneticos, campos gravitacionales, el flujo de calor, el flujo de trafico y
muchos mas.
124
CAPITULO 5. EL TEOREMA CLASICO DE STOKES
Ejemplo 5.1.2 Sea F : R2 R2 dado por:
F(x, y) = (3, 1).

Aqu, f1 (x, y) = 3 y f2 (x, y) = 2. Sobre R2 , este campo vectorial puede ser re-
presentado colocando algunos de los vectores correspondientes sobre el plano Un
ejemplo fsico de este campo vectorial seria el viento que sopla en la direccion
(3, 1) con velocidad:

d(3, 1) = 9+1= 10.
Ejemplo 5.1.3 Ahora consideremos el campo vectorial F(x, y) = (x, y). La re-
presentacion de este campo vectorial en R2 consiste en vectores que apuntan en
diferentes direcciones sin tocar al origen, es decir, como si representara el flujo de
agua fuera del origen (0, 0)
Ejemplo 5.1.4 Para este ejemplo, sea F(x, y) = (y, x). Lo cual podra repre-
sentarse como un flujo de vectores los cuales forman crculos de diferentes dimen-
siones, es decir, como si se tratara de una banera de hidromasaje o un remolino de
agua (ver ejercicios).
5.1.2. Variedades y Fronteras

Las curvas y superficies aparecen en nuestro mundo cotidiano. Ambas son
ejemplos de variedades, las cuales son, basicamente, ciertos objetos geometricos.
La idea intuitiva de una variedad es que, para una variedad k-dimensional, cada
punto que esta en la vecindad se ve como una bola en Rk . Aqu, definiremos a
las variedades a traves de las parametrizaciones. La siguiente definicion trabaja
de manera rigurosa la idea de que, localmente, cerca de cualquier punto, una va-
riedad k-dimensional se ve como una bola en Rk .
Definicion 5.1.5 Una variedad diferenciable M de dimension k en Rn es un con-

junto de puntos en Rn tal que para cualquier punto p M, existe una vecindad
abierta U de p, una funcion vectorial diferenciable F : Rk Rn y un conjunto
abierto V en Rk con:
a) F (V ) = U M
125
b) El Jacobiano de F tiene rango k a cada punto en V , donde el Jacobiano de

F es la matriz de n k:
f1 f1
. . .

x1 xk
. .

. . .

. .
fn fn
x1
. . . xk
con x1 , ..., xk un sistema coordenado para Rk . La funcion F es llamado la

parametrizacion (local) de una variedad.
Recordemos que el rango de una matriz es k, si la matriz tiene un menor in-

vertible k k. (Un menor es una submatriz de una matriz.)
Ejemplo 5.1.6 Un crculo es una variedad unidimensional, con una parametriza-

cion:
F : R1 R2
dada por:
F (t) = (cos t, sen t).

parametro tes el angulo con un eje horizontal. Notese que
Geometricamente, el
sen t
el Jacobiano de F es . Dado que el seno y el coseno no pueden ser,
cos t
simultaneamente, cero, el Jacobiano tiene rango uno.
Ejemplo 5.1.7 Un cono en un espacio tridimensional puede ser parametrizado

por:

F (u, v) = (u, v, u2 + v 2 ).
Esta sera una variedad bidimensional (una superficie) excepto en el vertice (0, 0, 0),
por que en este punto el Jacobiano no esta bien definido, mucho menos tiene rango
dos.
126
Ahora discutiremos que es la frontera de una variedad. Esto es necesario dado

que el Teorema de Stokes y sus manifestaciones se expresan cuando el promedio
de una funcion sobre la frontera de una variedad es igual al promedio de sus deri-
vadas sobre el interior.
Sea M una variedad k-dimensional en Rn .
Definicion 5.1.8 La cerradura de M, denotada como M, es el conjunto de todos

los puntos x en Rn tal que existen una sucesion de puntos (xn ) en la variedad M
con:
lm xn = x.
n
La frontera de M, denotada por M, es:
M = M M.
Dada una variedad con frontera, llamaremos a la parte sin frontera el interior.
Todo esto es relativamente facil de ver con unos ejemplos.
Ejemplo 5.1.9 Consideremos la funcion:
r : [1, 2] R2
donde:
r(t) = (t, t2 ).
La imagen bajo r del intervalo abierto (1, 2) es una 1-variedad (dado que el
Jacobiano es la matriz de 2 1 con (1, 2t), la cual siempre tiene rango uno). La
frontera consiste de los dos puntos r(1) = (1, 1) y r(2) = (2, 4).
Ejemplo 5.1.10 Nuestro siguiente ejemplo es una 2-variedad que tiene una fron-
tera que consiste de un crculo. Sea:
r : {(x, y) R2 : x2 + y 2 1} R3
127
definida por:
r(x, y) = (x, y, x2 + y 2 ).
La imagen de r es una cuenca (como un paraboloide) en el espacio situado sobre

el disco unitario en el plano. Ahora la imagen bajo r del disco abierto {(x, y)
R2 : x2 + y 2 < 1} es una 2-variedad (dado que el Jacobiano es

1 0 2x
,
0 1 2y
la cual tiene rango dos a todos los puntos). La frontera es la imagen de la frontera
del disco y, por lo tanto, la imagen del crculo {(x, y) R2 : x2 + y 2 = 1}.
Ejemplo 5.1.11 Sea el crculo unitario en el plano. Ya vimos que es una 1-variedad.
Sin embargo, no hay puntos lmites. Por otro otro lado, el crculo unitario es
as mismo la frontera de una 2-variedad, es decir, el disco unitario en el plano.
De una manera similar, la esfera unitaria en R3 es una 2-variedad, no acotada, que
es as misma la frontera de la bola unitaria, una 3-variedad. (No es casualidad que
en estos dos casos el lmite de la frontera sea el conjunto vacio.)
Frecuentemente llamaremos a una variedad con frontera simplemente una va-

riedad. Tambien, usualmente, estableceremos el hecho de que la frontera de una
variedad k-dimensional o bien puede ser vacia (en cuyo caso la variedad no tiene
frontera) o es en si misma una variedad (n 1)-dimensional.
5.1.3. Integrales sobre Trayectorias

Ahora que tenemos una definicion para variedades, deseamos hacer calculos
sobre ellas. Iniciaremos con la integracion de campos vectoriales a lo largo de las
curvas. Este proceso es llamado integrales sobre trayectorias o, algunas veces, en-
ganosamente, integrales de lnea.
Una curva o trayectoria C en Rn sera definida como una 1-variedad con

frontera. De esta manera, todas las curvas seran definidas por los mapeos F :
[a, b] Rn , dada por:
128

f1 (t)

.

F (t) =
. .

.
fn (t)
Este mapeo frecuentemente se escribira como:

x1 (t)

.

. .

.
xn (t)
Se requiere que cada componente de la funcion fi : R R sea diferenciable.
Definicion 5.1.12 Sea f (x1 , ..., xn ) una funcion real definida sobre Rn . La inte-
gral de trayectoria de la funcion f a lo largo de la curva C es
Z Z
f ds = f (x1 , ..., xn )
C C
Z b r !
dx1 2 dxn 2
= f (x1 (t), ..., xn (t)) ( ) + ... + ( ) dt.
a dt dt
Notese que:
r !
b
dx1 2 dxn 2
Z
f (x1 (t), ..., xn (t)) ( ) + ... + ( ) dt,
a dt dt
aunque pareciera que tiene un aspecto muy difcil, se trata de la integral de una
sola variable, en este caso, t.
Veamos el siguiente teorema.
129
Teorema 5.1.13 Sea una curva C en Rn descrita por dos diferentes parametriza-
ciones:
F : [a, b] Rn
y
G : [c, d] Rn ,

x1 (t) y1 (u)
. .
R
con F (t) =
. y G(u) = . . La integral de trayectoria f ds
C
. .
xn (t) yn (u)
es independiente de la parametrizacion elegida, esto es:
Z b r !
dx1 2 dxn 2
f (x1 (t), ..., xn (t)) ( ) + ... + ( ) dt =
a dt dt
Z b r !
dy1 2 dyn 2
f (y1(u), ..., yn (u)) ( ) + ... + ( ) du.
a du du
Daremos un ejemplo en un momento; la prueba del teorema es un poco dura

ya que es un ejercicio de la regla de la cadena. De hecho, la integral de trayectoria
fue definida con el difcil termino:
r
dx1 2 dxn 2
ds = ( ) + ... + ( ) dt
dt dt
precisamente para hacer la integral de trayectoria independiente de la parametri-
Rb
zacion. Esto es por que a f (x1 (t), ..., xn (t))dt es una definicion incorrecta para
la integral de trayectoria.
El smbolo ds representa la longitud de arco infinitesimal sobre la curva C

en Rn .
Ejemplo 5.1.14 Para el caso de R2 , consideremos una curva s, una recta x1

que corta a la curva en un punto y una recta x2 que corta en un punto a la curva,
130
distinto al de x1 , y es perpendicular a este; entonces tenemos que:

p
s (x1 )2 + (x2 )2
Con s denotamos el cambio en la posicion a lo largo de la curva C, tenemos

que por el Teorema de Pitagoras:
p
s (x1 )2 + (x2 )2
r !
x1 2 x2 2
= ( ) +( ) t.
t t
Entonces, en el lmite cuando t 0, tenemos que, al menos formalmente:

r !
dx1 2 dx2 2
ds = ( ) +( ) dt
dt dt
De esta manera, la correcta
q implementacion del Teorema de Pitagoras nos forzara
a usar el termino ds = ( dx
dt
) + ... + ( dx
1 2
dt
2 2
) dt en la definicion de la integral de
trayectoria.
Ahora, para un ejemplo, primero verifiquemos el conocimiento adquirido de

las definiciones y tambien veamos como el termino ds es necesario para hacer que
las integrales de trayectoria sean independientes de las parametrizaciones.
Ejemplo 5.1.15 Consideremos el segmento de lnea recta en el plano de (0, 0) a

(1, 2). Parametrizaremos este segmento de lnea en dos diferentes formas, y en-
tonces, calcularemos la integral de trayectoria de la funcion:
f (x, y) = x2 + 3y
usando cada una de las parametrizaciones.
Primero, definase:
F : [a, b] R2
131
por
F (t) = (t, 2t).
De esta manera, tenemos que x(t) = t y y(t) = 2t. Denotemos este segmento
de lnea por C. Entonces:
r
1
dx 2 dy
Z Z
f (x, y)ds = (x(t)2 + 3y(t)) ( ) + ( )2 dt
C 0 dt dt
Z 1
= (t2 + 6t) 5 dt
0
t3 1

2
1
= 5 + 3t
3 0 0
1
= 5( + 3)
3
10
= 5.
3
Ahora parametrizaremos el segmento C por:
G : [0, 2] C
donde
t
G(t) = ( , t).
2
t
Aqu tenemos que x(t) = 2
y y(t) = t. Entonces
132
r
2
dx dy
Z Z
2
f (x, y)ds = (x(t) + 3y(t)) ( )2 + ( )2 dt
C 0 dt dt
Z 2 2 r
t 1
= ( + 3t) + 1 dt
0 4 4
2 !
5 t3 2 3t2

= +
2 12 0 2 0

5 8
= ( + 6)
2 12
10
= 5.
3
como se deseaba.
5.1.4. Integrales de Superficie

Ahora, integraremos a lo largo de superficies. Una superficie en R3 es una 2-
variedad con frontera. En aras de la simplicidad, restringiremos nuestra atencion
a las superficies las cuales son la imagen de una funcion:
r : D R3 ,
dada por
r(u, v) = (x(u, v), y(u, v), z(u, v)),

donde x, y, z son coordenadas para R3 y u, v son coordenadas para R2 . Aqu D es
un dominio en el plano, lo cual significa que existe un conjunto abierto U en R2
cuya clausura es D. (Si se piensa a U como un disco abierto y a D como un disco
cerrado, por lo general, no se esta del todo equivocado.)
Definicion 5.1.16 Sea f (x, y, z) una funcion sobre R3 . Entonces, la integral de

f (x, y, z) a lo largo de la superficie S es:
r r
Z Z Z Z
f (x, y, z)dS = f (x(u, v), y(u, v), z(u, v)) | | dudv.
S D u v
133
r r
Aqu | u v | denota la longitud del producto cruz (lo cual, en un momento,
r r
mostraremos que es la longitud de cierto vector normal) de los vectores u y v ,
y es, por lo tanto, el determinante de:

i j k
r r x y z
= u u u
.
u v x x x
v v v
De esta manera, el area infinitesimal dS es

r r
longitud de dudv =
u v

y z z y x z x z x y x y
u v ) ( u v ), ( v u ) ( u v ), ( u v ) (( v u )) dudv
(
En analoga con la longitud de arco, una integral de superficie es independiente de

la parametrizacion:
RR
Teorema 5.1.17 La integral S
f (x, y, z)dS es independiente de la parametri-
zacion de la superficie S.
De nuevo, la regla de la cadena es una parte difcil de la demostracion. Notese

que si este teorema no fuese verdadero, definiramos la integral de superficie (en
particular, el area infinitesimal) de una forma distinta. Ahora mostraremos como
es que el campo vectorial
r r

u v
es, en realidad, normal a la superficie. Con la funcion r : R2 R3 dado por
r(u, v) = (x(u, v), y(u, v), z(u, v)), recordemos que el Jacobiano de r es
x x
u v
y y .
u v
z z
u v
Pero, como vimos en el Capitulo 3, el Jacobiano mapea vectores tangentes a vec-
tores tangentes. De esta manera, los dos vectores:

x y z x y z
, , y , ,
u u u v v v
134
son ambos vectores tangentes a la superficie S. Por lo tanto, el producto cruz de

estos vectores a lo mas sera un vector normal (perpendicular) n. De esta manera,
podemos interpretar la integral de superficie como:
Z Z Z Z
f dS = f | n | dudv
S
r r
con dS = (longitud del vector normal u v
) dudv.
r r
Como breve notacion, en el siguiente ejemplo usaremos Tu = u
y Tv = v
.
Ejemplo 5.1.18 Sea D el rectangulo en el plano definido por
0 2, 0
y sea la superficie S definida por la parametrizacion : D R3 dada por
x = cos sen , y = sen sen , z = cos .
(As, y son los angulos de coordenadas esfericas, y S es la esfera unitaria pa-

rametrizada
RR por .) Sea r el vector de posicion r(x, y, z) = xi + yj + zk. Calcular

r dS.
Solucion: Primero hallamos
T = (sen sen )i + (sen cos )j

T = (cos cos )i + (sen cos )j (sen )k
y por lo tanto
T T = (sen2 cos )i (sen2 sen )j (sen cos )k.
Despues evaluamos
135
r (T T ) = (xi + yj + zk) (T T )
= [(cos sen )i + (sen sen )j + (sen )k]
(sen )[(sen cos )i + (sen sen )j + (cos )k]
= (sen )(sen2 cos2 + sen2 sen2 + cos2 )
= sen .
As,
Z Z Z Z Z 2
r dS = sen dd = (2)d = 4.
D 0
5.1.5. El Gradiente
El Gradiente de una funcion puede ser visto como un metodo para la diferen-
ciacion de funciones.
Definicion 5.1.19 El gradiente de una funcion real f (x1 , ..., xn ) es:

f f
f = , ..., .
x1 xn
De esta manera:
: (Funciones) (Campos Vectoriales)
Ejemplo 5.1.20 si f (x, y, z) = x3 + 2xy + 3xz, tenemos que:
(f ) = (3x2 + 2y + 3z, 2x, 3x).
Se puede mostrar que si a todos los puntos sobre
M = {f (x1 , ..., xn ) = 0}
donde f 6= 0, el gradiente f es un vector normal a M.
136
5.1.6. La Divergencia
La divergencia de un campo vectorial puede ser vista, de una forma razonable,
como la diferenciacion de un campo vectorial. (En la siguiente seccion veremos
que el rotacional de un campo vectorial es otra forma).
Sea F(x, y, z) : R3 R3 un campo vectorial dado por las siguientes tres
funciones:
F(x, y, z) = (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)).
Definicion 5.1.21 La divergencia de F(x, y, z) es:
f1 f2 f3
div(F) = + + .
x y z
De esta manera:
div : (Campos Vectoriales) (Funciones).

El Teorema de la Divergencia nos dice que la divergencia mide que tanto se ha
extendido el campo vectorial fuera de un punto.
Ejemplo 5.1.22 Sea F(x, y, z) = (x, y 2, 0). Entonces:
x (y 2 ) (0)
div(F) = + + = 1 + 2y.
x y z
Si uno trata de esbozar este campo vectorial, notara que para valores muy
grandes de y, el campo vectorial se expande mas y mas rapido.
5.1.7. El Rotacional
El rotacional de un campo vectorial es otra forma en la cual podemos exten-
der la idea de diferenciacion de campos vectoriales. El Teorema de Stokes nos
mostrara que el rotacional de un campo vectorial mide que tanto se puede girar,
voltearse o enrrollarse un campo vectorial. La definicion exacta es
137
Definicion 5.1.23 El rotacional de un campo vectorial:

i j k

rot(F) = det x y z

f1 f2 f3

f3 f2 f3 f1 f2 f1
= , ( ), .
y z x z x y
Notemos que
rot : (Campos Vectoriales) (Campos Vectoriales).
Ahora, veamos un ejemplo y observemos que el rotacional es, de hecho, la

medida de algun tipo de rotacion.
Ejemplo 5.1.24 Anteriormente vimos que el campo vectorial F(x, y, z) = (y, x, 0)

se ve como un remolino de agua. Su rotacional es:

i j k

rot(F) = det x y z

y x 0
= (0, 0, 2).
lo cual refleja que la accion del remolino esta en el plano xy, perpendicular al eje
z.
Vamos a ver en la declaracion del teorema de Stokes que, intuitivamente, la

longitud del rot(F) en verdad mide la cantidad de rotaciones alrededor del mismo
campo vectorial mientras que el vector rot(F) apunta en la direccion normal al
rotar.
138
5.1.8. Orientabilidad
Requeriremos que nuestras variedades sean orientables. Para una superficie,
la orientabilidad significa que podemos elegir un campo vectorial normal sobre
la superficie tal que varia continuamente y nunca se desvanece. Para una curva,
la orientabilidad significa que podemos elegir un vector tangente unitario, a cada
punto, tal que este varie continuamente. El ejemplo estandar de una superficie no
orientable es la banda de Moebius, obtenida al poner un medio giro en una banda
de papel y entonces, unir los extremos.
Para una variedad orientable, siempre existiran dos elecciones para la orienta-
cion, dependiendo sobre cual direccion se elijan para la normal o para la tangen-
te. Ademas, una superficie orientada S con la curva limite S la cual induce una
orientacion S, la cual tiene una region tridimensional que induce una orientacion
sobre sus superficies de fronteras. Si sucede que se elige la orientacion incorrecta
inducida para una frontera, las diferentes versiones de los Teoremas de Stokes se
veran afectados solo por un factor de (1). No nos asustemos si se encuentran los
ultimos parrafos vagos o sin sentido. Estos fueron colocados de manera delibera-
da. Para definir la orientacion rigurosa en realidad se tiene que hacer un poco mas
de trabajo. En primer lugar, se aborda a el sujeto u objeto de estudio, es lo mejor
para poder concentrarse en los ejemplos basicos y, solo entonces, nos preocupare-
mos por el signo correcto procedente de las orientaciones inducidas.
5.2. El Teorema de la Divergencia y el Teorema de

Stokes
Para nuestra conveniencia tecnica, supondremos por el resto del captulo, que
todas las funciones, incluyendo aquellas que forman campos vectoriales, poseen
tantas derivadas como sean necesarias. La meta principal de todo este capitulo
es enfatizar en el hecho de que a lo mas existe una relacion profunda entre los
valores de una funcion sobre las fronteras de una variedad con los valores de sus
derivadas (definidas adecuadamente) sobre el interior de la variedad. Esta relacion
ya esta presente en:
Teorema 5.2.1 (Teorema Fundamental del Calculo): Sea
139
5.2. EL TEOREMA DE LA DIVERGENCIA Y EL TEOREMA DE STOKES
f : [a, b] R
una funcion diferenciable real sobre el intervalo [a, b]. Entonces
b
df
Z
f (b) f (a) = dx.
a dx
df
Aqu, la derivada dx
es integrada sobre el intervalo:
[a, b] = {x R : a x b},
la cual tiene como frontera a los puntos a y b. La orientacion sobre la frontera
sera de b y a, o:
[a, b] = b a.
Entonces, el Teorema Fundamental del Calculo puede ser interpretado estable-
ciendo que el valor de f (x) sobre la frontera es igual a el promedio (la integral)
de la derivada sobre el interior.
Una posible aproximacion para generalizar el Teorema Fundamental es re-

emplazar el intervalo unidimensional [a, b] con alguno de dimension superior y
reemplazar la funcion de una variable f con o bien una funcion con mas de una
variable o (menos evidente) por un campo vectorial. La generalizacion correcta
sera determinada segun lo que se quiera probar.
En el teorema de la divergencia, el intervalo sera una variedad tridimensional,

cuya frontera es una superficie, y la funcion f sera un campo vectorial. La deriva-
da de f aqu sera la divergencia. Especficamente
Teorema 5.2.2 (El Teorema de la Divergencia) En R3 , sea M una variedad

tridimensional con frontera M una variedad compacta de dimension dos. Sea
F(x, y, z) denotamos un campo vectorial sobre R3 y sea n(x, y, z) que denota un
campo vectorial normal unitario a la superficie limite M. Entonces
Z Z Z Z Z
F ndS = (divF)dxdydz
M M
140
Esbozaremos una demostracion en la seccion 5.5
Sobre el lado izquierdo tenemos una integral del campo vectorial F sobre la
frontera. Del lado derecho tenemos una integral de la funcion div(F) (la cual in-
volucra derivadas del campo vectorial) sobre el interior.
En el Teorema de Stokes, el intervalo sera una superficie, tal que la frontera

es una curva, y la funcion, otra vez, sera un campo vectorial. El rol de la derivada
ahora sera ocupado por el rotacional del campo vectorial.
Teorema 5.2.3 (El Teorema de Stokes) Sea M una superficie en R3 con curva
frontera compacta M. Sea n(x, y, z) el campo vectorial normal unitario a M y
sea T(x, y, z) que denota el vector tangente unitario inducida a la curva M. Si
F(x, y, z) es cualquier campo vectorial, entonces
Z Z Z
F TdS = curl(F) nds.
M M
Como en el Teorema de la Divergencia, una demostracion sera esbozada mas

adelante en este capitulo. De nuevo, sobre el lado izquierdo tenemos una integral
que envuelve un campo vectorial F sobre la frontera, mientras que del lado dere-
cho tenemos una integral que envuelve el interior del rotacional de F (la cual esta
en terminos de varias derivadas de F).
A pesar de que el Teorema de la Divergencia y el Teorema de Stokes se prue-

ban de manera independiente, su similitud es mas que una mera analoga; ambos
son casos especiales, como lo es el Teorema Fundamental del Calculo, de un teo-
rema muy general. Las demostraciones de cada teorema son muy similares. De
hecho, existen dos metodos basicos para demostrar este tipo de teoremas. El pri-
R b df
mero es reducirlo al Teorema Fundamental del Calculo, f (b) f (a) = a dx dx.
Este metodo sera ilustrado en nuestra demostracion del Teorema de la Divergen-
cia.
El segundo metodo involucra dos pasos. El primero, es mostrar que dada dos
regiones R1 y R2 , las cuales tienen una frontera en comun, tenemos que:
Z Z Z
f uncion + f uncion = f uncion.
R1 R2 (R1 R2 )
141
5.3. UNA INTERPRETACION FISICA DEL TEOREMA DE LA
DIVERGENCIA
El siguiente paso es mostrar que el teorema es verdadero sobre regiones infini-

tamente pequenas. Para poder probar el teorema por esta aproximacion, simple-
mente dividimos la region original en infinitas regiones infinitamente pequenas,
aplicando el segundo paso y, entonces, aplicamos el primer paso. Llevaremos aca-
bo esta aproximacion en nuestra demostracion del Teorema de Stokes.
Una vez mas, todos estos teoremas son equivalentes. De hecho, para mu-
chos matematicos, estos teoremas, usualmente, son conocidos simplemente como
Teorema de Stokes.
5.3. Una interpretacion fsica del teorema de la Di-

vergencia
La meta de esta seccion es dar un significado fsico para el teorema de la
Divergencia, el cual tiene, en parte, como es que el teorema fue desarrollado. Ve-
remos que el teorema de la divergencia establece el hecho de que un flujo de un
campo vectorial a traves de una superficie es precisamente, igual a la suma de
las divergencias de cada punto del interior. Por supuesto, necesitamos dar algunas
definiciones para estos terminos.
Definicion 5.3.1 Sea S una superficie en R3 con campo vectorial normal unitario
n(x, y, z). Entonces, el flujo de un campo vectorial F(x, y, z) a traves de la super-
ficie S es
Z Z
F n dS.
S
Intuitivamente, lo que queremos es que el flujo mida la cantidad de desplazamien-
to del campo vectorial a traves de la superficie S.
Imaginemos una corriente de agua que fluye a lo largo. El vector tangente de

la direccion del agua en cada punto define un campo vectorial F(x, y, z). Supon-
gamos que el campo vectorial F es un conjunto de vectores los cuales fluyen en la
misma direccion y sentido. Coloquemos sobre la corriente una hoja infinitamente
delgada de caucho, queremos que el flujo mida que tan difcil es que esta hoja se
pueda desplazar a traves del flujo de agua. Aqu hay tres casos. Caso A, el agua
142
esta golpeando la cabeza de la hoja de goma, por lo que es muy difcil mantenerla
en su lugar. Caso C, ningun esfuerzo es necesario para mantener la hoja aun, ya
que el agua sigue fluyendo sobre la hoja. El esfuerzo necesario para mantener la
hoja aun en el caso B se ve que es mas o menos a mitad de camino entre el es-
fuerzo necesario en los casos A y C. La clave para cuantificar de alguna manera
estas diferencias de cambio es medir el angulo entre el campo vectorial F de la
corriente y el campo vectorial normal n a la membrana. Claramente, el producto
punto F n funciona. De esta manera, usando el hecho de que el flujo esta definido
por
Z Z
F ndS,
S
el flujo a traves de la superficie A es mayor que el flujo a traves de la superficie
B que a su vez es mayor que el flujo a traves de la superficie C, la cual tiene flujo
igual a 0.
El teorema de la Divergencia establece el hecho de que el flujo de un campo

vectorial a traves de la frontera de una superficie es exactamente igual a la suma
(integral) de la divergencia del campo vectorial en el interior. De algun modo, la
divergencia a lo mas sera una medida infinita del flujo de un campo vectorial.
5.4. Una interpretacion fsica del Teorema de Stokes

Aqu discutiremos la nocion de la circulacion de un campo vectorial con res-
pecto a una curva. Primero daremos la definicion y, entonces, discutiremos su
significado.
Definicion 5.4.1 Sea C una curva suave en R3 con campo vectorial tangente uni-
tario T(x, y, z). La circulacion de un campo vectorial F(x, y, z) a lo largo de la
curva C es
Z
F Tds.
C
Sea F un campo vectorial que representa un flujo de corriente de agua, como

se muestra en la siguiente figura
143
5.4. UNA INTERPRETACION FISICA DEL TEOREMA DE STOKES
Coloquemos un alambre delgado (una curva C) en esta corriente con una pe-
quena cuenta atada a este, con la cuenta libre para poder moverse libremente hacia
arriba y hacia abajo, mediante el alambre.
Primer caso, el agua no mueve a la cuenta en lo absoluto. Segundo caso, tene-

mos que la cuenta sera empujada a lo largo de la curva, mientras que en el tercer
caso el agua movera la cuenta muy rapidamente. En el ultimo caso, no solo la
cuenta se resista a moverse a lo largo de la curva C, el esfuerzo que se necesita
para mover la cuenta es total. Estos juicios cualitativos son capturados cuantitati-
vamente en la definicion anterior para la circulacion, dado que el producto punto
F T mide de cada punto la cantidad del campo vectorial que esta apuntando en
la direccion de la tangente T y, por lo tanto, que cantidad de F esta apuntando en
la direccion de la curva.
En resumen, la circulacion mide que cantidad de campo vectorial fluye en la

direccion de la curva C. En fsica, el campo vectorial es, frecuentemente, la fuer-
za, en cuyo caso, la circulacion es una medida de trabajo.
De esta manera, el Teorema de Stokes establece que la circulacion de una

campo vectorial a lo largo de una curva M cuya frontera, una superficie M, es
precisamente igual a la componente normal del campo vectorial rot(F) en el in-
terior. Esto es por que el termino rotacional es usado para medir la tendencia
infinita de un campo vectorial a tener circulacion, o en otras palabras, que propor-
ciona una medida infinita del remolinodel campo vectorial.
144
5.5. Esbozo de una Prueba del Teorema de la Di-

vergencia
Esto solo sera un esbozo, ya que estaremos haciendo una serie de simplifica-
ciones. En primer lugar, suponemos que nuestra variedad M tridimensional (un
solido) es simple, esto significa que cualquier lnea paralela a el eje x, al eje y o al
eje z solo puede intersectar a M en un segmento de lnea conexa o en un punto.
Denotemos las componentes del campo vectorial por:
F(x, y, z) = (f1 (x, y, Z), f2(x, y, z), f3 (x, y, z))

= (f1 , f2 , f3 ).
Sobre la superficie frontera M, denotemos el campo vectorial normal unitario:
n(x, y, z) = (n1 (x, y, z), n2 (x, y, z), n3 (x, y, z))

= (n1 , n2 , n3 ).
Queremos mostrar que:

Z Z Z Z Z
F ndS = div(F) dxdydz.
M M
En otras palabras, queremos que:
f1 f2 f3
Z Z Z Z Z
(f1 n2 + f2 n2 + f3 n) dS = ( + + ) dxdydz.
M M x y z
Si podemos mostrar que:
f1
Z Z Z Z Z
f1 n1 dS = dxdydz
x
Z ZM Z Z ZM
f2
f2 n2 dS = dxdydz
M y
Z Z ZM
f3
Z Z
f3 n3 dS = dxdydz
M M z
145
5.5. ESBOZO DE UNA PRUEBA DEL TEOREMA DE LA DIVERGENCIA
habremos terminado la demostracion.
Solo necesitamos esbozar la prueba de la ultima ecuacion:
f3
Z Z Z Z Z
f3 (x, y, z)n3 (x, y, z) dS = dxdydz,
M M z
dado que las otras dos ecuaciones se cumplen por razones similares.
La funcion n3 (x, y, z) es la componente en z del campo vectorial normal

n(x, y, z). Ya que supusimos que M es simple, podemos dividir la componen-
te de la frontera M en tres partes conectadas: {M}partesuperior , donde n3 > 0,
{M}costado , donde n3 = 0 y {M}parteinf erior , donde n3 < 0.
Entonces, podemos dividir la integral de la superficie frontera en tres partes:
Z Z Z Z Z Z
f3 n3 dS = f3 n3 dS + f3 n3 dS
M Mparte superior Mcostado
Z Z
+ f3 n3 dS
Mparte inf erior
Z Z Z Z
= f3 n3 dS + f3 n3 dS,
Mparte superior Mparte inf erior
dado que n3 , la componente normal en la direccion z, sera cero sobre Mcostado .

Ademas, y por que, nuevamente, supusimos la simplicidad, existe una region R
en el plano xy tal que {M}parte superior es la imagen de una funcion:
(x, y) (x, y, t(x, y))
y {M}parte inf erior es la imagen de una funcion:
(x, y) (x, y, b(x, y)).
Entonces:
146
Z Z Z Z Z Z
f3 n3 dS = f3 n3 dS + f3 n3 dS
M Mparte superior Mparte inf erior
Z Z Z Z
= f3 (x, y, t(x, y))dxdy + f3 (x, y, b(x, y))dxdy
Z ZR R
= (f3 (x, y, t(x, y)) f3 (x, y, b(x, y)))dxdy,

R
donde el signo menos delante del ultimo termino viene del hecho de que la normal
a los puntos de Mparte inf erior estan hacia abajo. Pero esto es justo
t(x,y)
f3
Z Z Z
dxdydz,
R b(x,y) z
por el Teorema Fundamental del Calculo. Esto, a su vez, es igual a:
f3
Z Z Z
dxdydz,
M z
lo cual es lo que queramos demostrar.
Para probar el resultado completo, tendramos que tomar un solido M y de-

mostrar que podemos dividir M en partes simples y, entonces, si el Teorema de la
Divergencia es verdad en cada parte simple, es cierto en el solido original M. Si
bien no es intuitivamente difcil, esto es no trivial para probar e implica algunas
cuestiones sutiles de convergencia.
5.6. Esbozo de una Prueba del Teorema de Stokes

Sea M una superficie con curva frontera M. Partiremos la demostracion del
Teorema de Stokes en dos pasos. Primero, dado dos rectangulos R1 y R2 que po-
seen un lado en comun, queremos que:
Z Z Z
F Tds + F Tds = F Tds,
R1 R2 R1 R2
donde T es el vector tangente unitario.
147
5.6. ESBOZO DE UNA PRUEBA DEL TEOREMA DE STOKES
Segundo, necesitamos mostrar que el Teorema de Stokes es verdadero sobre

rectangulos infinitamente pequenos.
La demostracion del primer paso sera debido a que como los rectangulos po-
seen un lado en comun, llamemosle l, las orientaciones estaran en direcciones
opuestas. Esto fuerza a que el valor del producto punto (F T) a lo largo de l
tomado como un lado del rectangulo R1 tenga signo opuesto con respecto al valor
de (FT) a lo largo de l tomado como un lado del rectangulo R2 . De esta manera:
Z Z
F Tds = F Tds.
lR1 lR2
Dado que la frontera de la union de los dos rectangulos R1 R2 no contiene al

lado l, tenemos que:
Z Z Z
F Tds + F Tds = F Tds.
R1 R2 R1 R2
Antes de probar que el Teorema de Stokes es cierto sobre rectangulos infinita-

mente pequenos, supondremos por el momento que esto es cierto.
Dividimos la superficie M en (un numero infinito de) rectangulos pequenos.

Entonces
Z Z X Z Z
rot(F) ndS = rot(F) n
M rectangulos pequenos
XZ
= FTds,
(cada rectangulo)
dado que supusimos que el Teorema de Stokes era cierto sobre rectangulos infini-
tamente pequenos. Pero, por el primer paso, la suma anterior es igual a la integral
simple sobre la frontera de la union de los rectangulos pequenos
Z
F Tds,
M
lo cual nos da el Teorema de Stokes. Por lo tanto, todo lo que necesitamos mostrar
es que el Teorema de Stokes es cierto para rectangulos infinitamente pequenos.
148
Antes de mostrar lo anterior, notemos que este argumento no es muy riguroso,

debido a que la suma total es de un numero infinito de pequenos rectangulos, y,
de esta manera, las cuestiones acerca de la convergencia necesitan ser resueltas.
Ahora esbozaremos el por que el Teorema de Stokes es cierto para rectangulos
infinitamente pequenos. Esto tambien incluira la justificacion de por que la defi-
nicion del rotacional de un campo vectorial es lo que es.
Por un cambio de coordenadas, podemos asumir que nuestro pequeno rectangu-

lo R esta en el plano xy con uno de sus vertices siendo el origen (0, 0). Su vector
normal unitario es n = (0, 0, 1).
Si el campo vectorial es F(x, y, z) = (f1 , f2 , f3 ), tenemos que:
f2 f1
rot(F) n = .
x y
Queremos mostrar que:
f2 f1
Z
( )dxdy = F Tds,
x y R
donde T es el vector tangente unitario al rectangulo frontera R y dxdy es el area

infinitesimal para el rectangulo R.
R
Ahora calcularemos R
F Tds.
Los cuatros lados del rectangulo R tienen las siguientes parametrizaciones.
Lado P arametrizacion Integral

R1
I: s(t) = (tx, 0), 0 t 1 f (tx, 0)xdt
R 10 1
II : s(t) = (x, ty), 0 t 1 f (x, ty)ydt
R1 0 2
III : s(t) = (x tx, y), 0 t 1 0 f1 (x tx, y)xdt
R1
IV : s(t) = (0, y ty), 0 t 1 0
f2 (0, y ty)ydt
Este siempre es el caso, para cualquier funcion f (t), de que:
Z 1 Z 1
f (t)dt = f (1 t)dt,
0 0
por el cambio de la variable t a 1 t. De esta manera, las integrales para los lados
149
5.6. ESBOZO DE UNA PRUEBA DEL TEOREMA DE STOKES
III y IV pueden ser reemplazadas por

Z 1 Z 1
f1 (x, y)x dt y f2 (0, ty)y dt.
0 0
Entonces
Z Z Z Z Z
F Tds = F Tds + F Tds + F Tds + F Tds
R I II III IV
Z 1
= (f1 (tx, 0)x + f2 (x, ty)y f1 (tx, y)x
0
f2 (0, ty)y)dt
Z 1 Z 1
= (f2 (x, ty) f2 (0, ty))ydt (f1 (tx, y)
0 0
f1 (tx, 0))xdt
Z 1
f2 (x, ty) f2 (0, ty) f1 (tx, y) f1 (tx, 0)
= ( )xydt,
0 x y
la cual converge a:
1
f2 f1
Z
dxdydt,
0 x y
cuando x, y 0. Pero, esta ultima integral es
f2 f1
( )dxdy
x y
que es lo que estabamos buscando.
Una vez mas, no vamos a verificar que x, y 0, ya que es un paso me-

nos riguroso. Ademas, todo el camino indiferente en el que hemos cambiado las
coordenadas para poner nuestro rectangulo en el plano xy tendra que justificarse
en una prueba rigurosa.
150
Captulo 6
Ecuaciones Diferenciales Ordinarias
Una ecuacion diferencial es una ecuacion en la cual intervienen derivadas o

diferenciales. Si solamente aparecen las derivadas de una funcion de una varia-
ble, entonces la ecuacion diferencial se llama ordinaria. Una ecuacion diferen-
cial parcial contiene derivadas parciales. El objetivo principal de este capitulo es
desarrollar metodos para resolver ciertos tipos basicos de ecuaciones diferencia-
les ordinarias. La intencion de esta discusion no es hacer una disertacion sobre
este tema, sino mas bien servir de como una introduccion a esta area tan vasta e
importante de las matematicas.
6.1. Introduccion
Una ecuacion de la forma
F (x, y, y , y , ..., y (n) ) = 0 (6.1)
donde F es una funcion de n + 2 variables, y es una funcion de x y y (k) deno-

ta la k-esima derivada de y con respecto a x, se llama una ecuacion diferencial
ordinaria de orden n. Las ecuaciones siguientes son ejemplos de ecuaciones dife-
renciales ordinarias de ordenes 1, 2, 3 y 4 respectivamente.
151
6.1. INTRODUCCION
y = 2x
d2 y 2 dy 3
+ x ( ) 15y = 0
dx2 dx
4 2 5
(y ) x (y ) + 4xy = xex
4 2
dy 3 dy
1 = x
dx4 dx
Si en (6.1) F es un polinomio, entonces por definicion, el grado de la ecuacion
diferencial es el maximo exponente asociado con la derivada de orden mayor y (n) .
Los grados de las ecuaciones diferenciales anteriores son 1, 1, 4 y 2 respectiva-
mente.
Si una funcion f tiene la propiedad de que al sustituir f (x) en lugar de y en una

ecuacion diferencial, la expresion resultante es una identidad para todo x en cierto
intervalo, entonces f (x) (o f ) se llama una solucion de la ecuacion diferencial.
Por ejemplo, para todo numero real C
f (x) = x2 + C
es una solucion de la ecuacion y = 2x, ya que al sustituir f (x) en lugar de y obte-

nemos la identidad 2x = 2x. Llamamos a x2 + C la solucion general de y = 2x,
ya que toda solucion es de esta forma.
Ejemplo 6.1.1 Sean C1 y C2 dos numeros reales cualesquiera. Demuestre que
f (x) = C1 e5x + C2 e5x
es una solucion de y 25y = 0.
Solucion: Como
f (x) = 5C1 e5x 5C2 e5x
y
f (x) = 25C1 e5x + 25C2 e5x = 25f (x)
tenemos que f (x) 25f (x) = 0. Esto demuestra que f (x) es una solucion de
y 25y = 0.
152
CAPITULO 6. ECUACIONES DIFERENCIALES ORDINARIAS
La solucion que se da en el ejemplo 6.1.1 se llama la solucion general de

y 25y = 0. Observe que la ecuacion diferencial es de orden 2 y que la solucion
general contiene dos parametros arbitrarios C1 y C2 . En la definicion rigurosa de
una solucion general interviene el concepto de parametro independiente que se
estudia en cursos mas avanzados. Se puede demostrar que las soluciones genera-
les de ecuaciones diferenciales de orden n contienen n parametros independientes
C1 , C2 , ..., Cn . Una solucion particular se obtiene asignandole valores especficos
a los parametros.
Ejemplo 6.1.2 Encuentre la solucion particular de y = 2x que satisface la con-

dicion y = 5 si x = 2.
Solucion: Como mencionamos antes, la solucion general de y = 2x es de la

forma y = x2 + C. Si queremos que se satisfaga la condicion dada, es necesario
que 5 = 4 + C o sea c = 1. Por lo tanto, la solucion particular deseada es y =
x2 + 1.
Las condiciones como las que se propuso en el ejemplo 6.1.2, se llaman con-
diciones a la frontera para la ecuacion diferencial. Si la solucion general contiene
un parametro, es suficiente una condicion a la frontera para hallar una solucion
particular. Si la solucion general contiene dos parametros como la del ejemplo 1,
se necesitan dos condiciones a la frontera para poder encontrar soluciones par-
ticulares. Si intervienen mas de dos parametros, se pueden hacer afirmaciones
semejantes.
Las soluciones que consideramos expresan y en funcion de x explcita-

mente. Las soluciones de algunas ecuaciones diferenciales se expresan en forma
implcita. En este caso se usa la derivacion implcita para verificar la solucion,
como se ilustra en el ejemplo siguiente.
Ejemplo 6.1.3 Demuestre que x3 + x2 y 2y 3 = C es una solucion implcita de

(x2 6y 2 )y + 3x2 + 2xy = 0.
Solucion: Suponiendo que y = f (x) satisface la primera ecuacion, obtenemos
por derivacion implcita
3x2 + 2xy + x2 y 6y 2 y = 0
153
6.1. INTRODUCCION
o
(x2 6y 2)y + 3x2 + 2xy = 0.
Por lo tanto y = f (x) satisface la ecuacion diferencial.
El tipo mas simple de una ecuacion diferencial es el que se puede escribir en

la forma
M(x) + N(y)y = 0 (6.2)

donde M y N son funciones continuas. Si y = f (x) es una solucion, entonces
M(x) + N(f (x))f (x) = 0.

Si f es continua, entonces tomando la integral indefinida de ambos lados de la
ecuacion obtenemos
Z Z
M(x)dx + N(f (x))f (x)dx = C
o equivalentemente
Z Z
M(x)dx + N(y)dy = C.
Esta ultima ecuacion es una solucion (implcita) de (6.2). Un artificio util para
recordar este metodo, es escribir (6.2) en la forma
dy
M(x) + N(y) =0
dx
Despues se halla la solucion integrando formalmente. Se dice que la ecuacion
(6,2) es separable, ya que, se pueden separar las variables x y y.
Ejemplo 6.1.4 Resuelva la ecuacion diferencial
2xy + 6x + (x2 4)y = 0.
Solucion: La ecuacion se puede escribir
dy
2x(y + 3) + (x2 4) = 0.
dx
154
Suponiendo que (y + 3)(x2 4) 6= 0, podemos dividir ambos lados de la ecuacion

anterior por este producto, y expresarla como sigue:
2x 1 dy
+ = 0.
x2 4 y + 3 dx
Por lo tanto, la ecuacion dada es separable. Integrando obtenemos
ln | x2 4 | + ln | y + 3 |= C1
o
ln | (x2 4)(y + 3) |= C1 .
Esto tambien se puede escribir
| (x2 4)(y + 3) |= eC1 = C2 .
donde C es cualquier numero diferente de cero. As, la solucion, en forma explci-

ta, es
C
y= 2 3.
x 4
Como supusimos que (x2 4)(y + 3) 6= 0, nos falta analizar el caso y = 3. Sus-
tituyendo directamente en la ecuacion dada, vemos que y = 3 es una solucion.
En conclusion, la solucion es y = C/(x2 4) 3, donde C es cualquier numero
real. Note que si C 6= 0 la solucion correspondiente no esta definida en x = 2.
Como las soluciones generales de las ecuaciones diferenciales contienen parame-

tros arbitrarios, las graficas de estas soluciones constituyen una familia de curvas.
Inversamente, si partimos de la ecuacion de una familia de curvas, entonces deri-
vando implcitamente obtenemos una ecuacion diferencial llamada ecuacion dife-
rencial para la familia.
Decimos que una ecuacion en x y y que contiene dos constantes arbitrarias

define una familia de curvas de dos parametros. Se usa una terminologa seme-
jante en caso de que haya mas de dos constantes. Para encontrar una ecuacion
diferencial para una familia de curvas en la que intervienen varios parametros, es
necesario derivar la ecuacion de la familia varias veces.
155
6.2. ECUACIONES DIFERENCIALES EXACTAS
Ejemplo 6.1.5 Encuentre una ecuacion diferencial para la familia de curvas de

dos parametros dada por
y = C1 cos x + C2 sen x.
Solucion: Derivando dos veces obtenemos
y = C1 sen x + C2 cos xy = C1 cos x C2 sen x.
Comparando esto con la ecuacion dada vemos que
y = y, o y + y = 0.
Esta es una ecuacion diferencial para la familia.
6.2. Ecuaciones Diferenciales Exactas

Las ecuaciones diferenciales separables que consideramos en la seccion ante-
rior son casos particulares de la ecuacion de primer orden
dy
P (x, y) + Q(x, y) =0
dx
donde P y Q son funciones de x y y. En esta seccion restringiremos nuestra aten-
cion a las ecuaciones llamadas exactas, que se definen a continuacion.
Definicion 6.2.1 Si P y Q tienen primeras derivadas continuas, entonces
dy
P (x, y) + Q(x, y) = 0,
dx
es una ecuacion diferencial exacta si y solo si
P Q
= .
y x
Ejemplo 6.2.2 Demuestre que la ecuacion diferencial

dy
(3x2 y 2y 3 + 3) + (x3 6xy 2 + 2y) =0
dx
156
es exacta.
Solucion: Sea P (x, y) = 3x2 y 2y 3 + 3 y Q(x, y) = x3 6xy 2 + 2y. Vemos

que
py (x, y) = 3x2 6y 2 = Qx (x, y).
Por consiguiente, de acuerdo con la definicion (6.2.1), la ecuacion es exacta.
Veamos el siguiente teorema.
Teorema 6.2.3 Si P (x, y) + Q(x, y)y = 0 es una ecuacion diferencial exacta,

entonces existe una funcion F de x y y tal que
F F
=P y = Q.
x y
Demostracion: Sea (x1 , y1 ) un punto en el dominio de P y de Q. Definamos
la funcion F mediante
Z x Z y
F (x, y) = P (t, y)dt + Q(x1 , t)dt.
x1 y1
Dejamos como ejercicio demostrar que Fx (x, y) = P (x, y) y que Fy (x, y) =

Q(x, y).
El resultado siguiente es el teorema fundamental de existencia para las solu-

ciones de las ecuaciones diferenciales exactas.
Teorema 6.2.4 Una ecuacion diferencial exacta P (x, y) + Q(x, y)y = 0 tiene
una solucion de la forma F (x, y) = C donde C es una constante y F es una
funcion de x y y tal que Fx = P y Fy = Q. Mas aun, para cualquier F con estas
propiedades y cualquier constante C, F (x, y) = C es una solucion.
Demostracion: Aplicando el teorema 6.2.3 sabemos que existe al menos una

funcion F tal que Fx = P y Fy = Q. Completaremos la demostracion proban-
do que y = f (x) es una solucion de la ecuacion diferencial dada, si y solo si
F (x, f (x)) = C para alguna constante C.
Aplicando la regla de la cadena
Dx F (x, f (x)) = Fx (x, f (x)) + Fy (x, f (x))f (x)
157
6.2. ECUACIONES DIFERENCIALES EXACTAS
o equivalentemente
Dx F (x, f (x)) = P (x, f (x)) + Q(x, f (x))f (x).
Si y = f (x) es una solucion de la ecuacion diferencial, vemos que Dx F (x, f (x)) =

0 y por lo tanto F (x, f (x)) = C para alguna constante C. Inversamente, si
F (x, f (x)) = C, entonces Dx F (x, f (x)) = 0, es decir
0 = P (x, f (x)) + Q(x, f (x))f (x)
y esto significa que f (x) es una solucion de la ecuacion diferencial dada.
El ejemplo siguiente ilustra un procedimiento para encontrar la solucion F (x, y) =

C mencionada en el teorema 6.2.4
(3x2 y 2y 3 + 3)dx + (x3 6xy 2 + 2y)dy = 0.

Solucion: En el ejemplo 6.2.2 vimos que esta ecuacion es exacta, en conse-
cuencia, segun 6.2.4, existe una funcion F tal que
Fx (x, y) = 3x2 y 2y 3 + 3
Fy (x, y) = x3 6xy 2 + 2y.
Integrando Fx (x, y) con respecto a x obtenemos
Fx (x, y) = x3 y 2xy 3 + 3x + g(y)

donde g es una funcion de y. Concluimos que
Fy (x, y) = x3 6xy 2 + g (y).

Comparando esta ecuacion con la formula para Fy (x, y) que tenemos al principio,
vemos que g (y) = 2y y por consiguiente g(y) = y 2 + C1 . Sustituyendo esto en
la formula de F (x, y), obtenemos
F (x, y) = x3 y 2xy 3 + 3x + y 2 + C1 .
158
Por lo tanto, de acuerdo con el teorema 6.2.4
x3 y 2xy 3 + 3x + y 2 = C
es una solucion de la ecuacion diferencial, donde la constante C1 se incluye en la
constante C. Esta solucion se puede comprobar por derivacion implcita.
2x sen(y) y sen x + (x2 cos y + cos x)y = 0

sujeta a la condicion a la frontera y = /6 cuando x = /2.
Solucion: Sean P (x, y) = 2x sen y y sen x y Q(x, y) = x2 cos y + cos x.

Vemos que
Py (x, y) = 2x cos y sen x = Qx (x, y)

y por consiguiente la ecuacion diferencial es exacta. De acuerdo con el teorema
6.2.3, existe una funcion F tal que
Fx (x, y) = 2x sen y y sen x

Fy (x, y) = x2 cos y + cos x.
Integrando Fx (x, y) con respecto a x, obtenemos
F (x, y) = x2 sen y + y cos x + g(y)

donde g es una funcion de y. En consecuencia
Fy (x, y) = x2 cos y + cos x + g (y).

Comparando esto con la otra expresion para Fy (x, y), vemos que g (y) = 0 y por
lo tanto g(y) = C1 . Aplicando el teorema 6.2.4 sabemos que
x2 seny + y cos x = C
es una solucion de la ecuacion diferencial dada, donde otra vez la constante C1 se
incluye en C. Finalmente, la condicion a la frontera implica que
2 1
+ 0=C
2 2 6
159
6.3. ECUACIONES DIFERENCIALES HOMOGENEAS
o C = 2 /8. Por lo tanto la solucion particular que se pide es
2
x2 sen y + y cos x = .
8
6.3. Ecuaciones Diferenciales Homogeneas

Se dice que una funcion f de dos variables es homogenea de grado n si
f (tx, ty) = tn f (x, y) (6.3)

para todo t > 0 tal que (tx, ty) esta en el dominio de f . Por ejemplo, si
f (x, y) = 2x4 x2 y 2 + 5xy 3

entonces f es homogenea de grado 4, ya que
f (tx, ty) = 2(tx)4 (tx)2 (ty)2 + 5(tx)(ty)3

= t4 (2x4 x2 y 2 + 5xy 3 )
= t4 f (x, y).
Analogamente, si
1 x
f (x, y) = ey
+y x2
2
entonces f es homogenea de grado 2, ya que

1 tx
f (tx, ty) = e ty = t2 f (x, y).
t2 x22
+t y 2
Una ecuacion diferencial homogenea es una ecuacion que se puede escribir en

la forma
dy
P (x, y) + Q(x, y) =0 (6.4)
dx
donde P y Q son funciones homogeneas del mismo grado. Las ecuaciones de este
tipo se pueden convertir en ecuaciones separables haciendo la sustitucion
y = vx, donde v = g(x) (6.5)
160
para alguna funcion g. Para comprobar este hecho, derivamos (6.6), obteniendo as
dy dv
=v+x .
dx dx
Sustituyendo xv en lugar de y en (6.5) obtenemos
dv
P (x, xv) + Q(x, xv)(v + x ) = 0.
dx
Si P y Q son funciones homogeneas de grado n, entonces
P (x, xv) = xn P (1, v)

y
Q(x, xv) = xn Q(1, v).

Sustituyendo esto en la ecuacion diferencial anterior y dividiendo ambos lados
por xn , obtenemos
dv
P (1, v) + Q(1, v)(v + x ) = 0.
dx
Esta ecuacion se puede escribir en la forma separable
1 Q(1, v) dv
+ = 0, (6.6)
x P (1, v) + Q(1, v) dx
siempre y cuando los denominadores sean diferentes de cero. Hemos demostrado
que si y = vx es una solucion de (6.5), entonces v es una solucion de (6.7). Inver-
samente, si v resuelve (6.7), entonces invirtiendo nuestro argumento, vemos que
y = vx es una solucion de (6.5). No es recomendable memorizar la forma (6.7).
Es mejor recordar la sustitucion y = vx que se usa para simplificar la ecuacion
homogenea. Tambien se puede usar la sustitucion x = vy para resolver la ecua-
cion.

dy
(y 2 xy) + x2 = 0.
dx
Solucion: Sean P (x, y) = y 2 xy y Q(x, y) = x2 . Entonces P y Q son fun-
ciones homogeneas de grado 2. Por lo tanto la ecuacion diferencial es homogenea
161
6.3. ECUACIONES DIFERENCIALES HOMOGENEAS
y hacemos la sustitucion
y = xv, dy = vdx + xdv.

Esto nos lleva a la siguiente cadena de ecuaciones.
dv
(x2 v 2 x2 v) + x2 (v + x ) = 0
dx
dv
x2 (v 2 v) + x2 (v + x ) = 0
dx
dv
(v 2 v) + v + x = 0
dx
2 dv
v +x = 0
dx
1 1 dv
+ = 0
x v 2 dx
Integrando obtenemos
1
ln | x | = C1 .
v
Como v = y/x, esta ultima ecuacion es equivalente a
x
ln | x | = C1 .
y
Sea C1 = ln | C |. Entonces
x x x
ln | x | ln | C |= , o ln | |= .
y C y
Esto se puede escribir x/C = ex/y o x = Cex/y . Tambien se puede encontrar la
solucion en forma explcita.

x dy x
(y x cot ) + y cot = 0.
y dx y
Solucion: La ecuacion es homogenea de grado 1. En este caso es conveniente
usar la sustitucion x = vy, ya que entonces cot(x/y) se reduce a cot v. As pues
162
hacemos la sustitucion
dy dv
x = vy, 1=v +y
dx dx
obteniendo
dv
(y vy cot v) + y cot v(v + y ) = 0.
dy
Dividiendo ambos lados por y y simplificando llegamos a
dv
(1 v cot v) + cot v(v + y ) = 0
dy
dv
1 + y cot v = 0.
dy
Separando las variables e integrando obtenemos

1 dv
+ cot v =0
y dy
ln | y | + ln | senv |= C1 = ln | C |
ln | ysenv |= ln | C |
ysenv = C.
Como v = x/y,
x
ysen =C
y
es una solucion de la ecuacion dada.
6.4. Ecuaciones Diferenciales Lineales de Primer Or-

den
Una ecuacion diferencial lineal de primer orden es una ecuacion de la forma
y + P (x)y = Q(x) (6.7)
163
6.4. ECUACIONES DIFERENCIALES LINEALES DE PRIMER ORDEN
donde P y Q son funciones continuas. Si Q(x) = 0 para todo x, entonces (6.8) es

separable y podemos escribir
1
y = P (x)
y
siempre que y 6= 0. Integrando obtenemos
Z
ln | y |= P (x)dx + ln | C | .
Expresamos la constante de integracion en la forma ln | C | para poder escribir la

ultima ecuacion como sigue:
Z
ln | y | ln | C |= P (x)dx
y
Z
ln | |= P (x)dx
C
y R
= e P (x)dx
C
R
P (x)dx
ye = C.
Ahora observamos que
R R R
Dx [ye P (x)dx
] = y e P (x)dx + P (x)ye P (x)dx
R
= e P (x)dx [y + P (x)y].
R
P (x)dx
Por consiguiente, si multiplicamos ambos lados de (6.8) por e podemos
escribir la ecuacion resultante como
R R
P (x)dx P (x)dx
Dx [ye ] = Q(x)e .
Esto nos da la solucion (implcita) de (6.8) siguiente:
R
Z R
P (x)dx
ye = Q(x)e P (x)dx dx + D. (6.8)
Si despejamos
R y de esta ecuacion obtenemos una solucion explcita. La expre-
sion e P (x)dx se llama un factor de integracion de (6.8). Hemos demostrado que
164
al multiplicar ambos lados de (6.8) por esta expresion, llegamos a una ecuacion
cuya solucion es (6.9).
Ejemplo 6.4.1 Resuelva la ecuacion diferencial x2 y + 5xy + 3x5 = 0 donde

x 6= 0.
Solucion: Para poder encontrar un factor de integracion, primero expresamos

la ecuacion diferencial dada en la forma (6.8) en la cual el coeficiente de y resulta
ser 1. Al dividir ambos lados por x2 obtenemos
5
y + y = 3x3
x
que es de la forma (6,8) con P (x) = 5/x y Q(x) = 3x3 . De acuerdo con la
discusion anterior, el factor de integracion que necesitamos es
5
R
P (x)dx
e = e5 ln|x| = eln|x| =| x |5 .
Si x > 0 entonces | x |5 = x5 , mientras que si x < 0, entonces | x |5 = x5 .
En ambos casos, al multiplicar los dos lados de la primera ecuacion por | x |5
obtenemos
x5 y + 5x4 y = 3x8 o Dx (x5 y) = 3x8 .

Por lo tanto
x9
x5 y = +C
3
o equivalentemente
x4 C
y= + 5
3 x
es una solucion.
La ecuacion de Bernoulli
y + P (x)y = Q(x)y n , (6.9)
165
6.4. ECUACIONES DIFERENCIALES LINEALES DE PRIMER ORDEN
donde n 6= 0, es una generalizacion de (6.8). Es obvio que y = 0 es una solucion.

Si y 6= 0, podemos dividir ambos lados por y n obteniendo
y n y + P (x)y 1n = Q(x). (6.10)

Sea w = y 1n . Entonces
w = Dx w = (1 n)y n y
y por lo tanto
1
y n y = w.
1n
Sustituyendo esta expresion en lugar de y n y en (6.11) obtenemos
1
w + P (x)w = Q(x).
1n
Esta ecuacion diferencial lineal de primer orden se puede resolver usando el meto-
do del factor de integracion. Una vez hallado w, la solucion de (6.10) se puede
expresar como y 1n = w (y y = 0).
y + 2x1 y = x6 y 3 .
Solucion: Esta es una ecuacion de Bernoulli de la forma (6.10) con n = 3. Al
multiplicar ambos lados de la ecuacion por y 3 y hacer la sustitucion w = y 1n =
y 2 obtenemos
y 3y + 2x1 y 2 = x6
1
w + 2x1 w = x6
2
w + 4x1 = 2x6 .
Como el factor de integracion para la ultima ecuacion es

R
(4/x)dx
= e4 ln|x| = eln|x| =| x |4 = x4
4
e
166
escribimos
x4 w 4x5 w = 2x2 .
En consecuencia
2
x4 w = x3 + C
3
o
2
w = x7 + Cx4 .
3
Finalmente, como w = y 2 , la solucion de la ecuacion dada es
2
y 2 = x7 + Cx4
3
o
2
( x7 + Cx4 )y 2 = 1.
3
6.5. Ecuaciones Diferenciales Lineales de Segundo

Orden
Sean f1 , f2 , ..., fn y k funciones de una variable que tienen todas el mismo
dominio. Entonces una ecuacion de la forma
y n + f1 (x)y n1 + ... + fn1 (x)y + fn (x)y = k(x) (6.11)

se llama una ecuacion diferencial lineal de orden n. Si k(x) = 0 para todo x, en-
tonces la ecuacion se llama homogenea. Observe que aqu la palabra homogenea
tiene un significado distinto al que le dimos en la seccion 6.3. Si k(x) 6= 0 pa-
ra algun x, entonces se dice que (6.12) es no homogenea. Se puede encontrar
un analisis a fondo de (6.12) en los libros de texto de ecuaciones diferenciales.
Aqu nos restringiremos a ecuaciones de segundo orden en las cuales f1 y f2 son
funciones constantes. En esta seccion consideraremos el caso homogeneo y en la
siguiente el caso no homogeneo.
167
6.5. ECUACIONES DIFERENCIALES LINEALES DE SEGUNDO ORDEN
La ecuacion diferencial lineal homogenea de segundo orden con coeficientes

constantes es de la forma
y + by + cy = 0 (6.12)
donde b y c son constantes. Antes de tratar de encontrar soluciones particulares de
esta ecuacion, demostraremos el siguiente resultado.
Teorema 6.5.1 Si y = f (x) y y = g(x) son soluciones de y + by + cy = 0,

entonces para todos los numeros reales C1 y C2
y = C1 f (x) + C2 g(x)
es una solucion.
Demostracion: Por hipotesis
f (x) + bf (x) + cf (x) = 0

g (x) + bg (x) + cg(x) = 0.
Si multiplicamos la primera de estas ecuaciones por C1 , la segunda por C2 y des-
pues las sumamos, obtenemos
[C1 f (x) + C2 g (x)] + b[C1 f (x) + C2 g (x)] + c[C1 f (x) + C2 g(x)] = 0.

Por lo tanto C1 f (x) + C2 g(x) es una solucion.
Se puede demostrar que si las soluciones f y g en el teorema 6.5.1 son tales

que f (x) 6= Cg(x) para todo numero real C, y si g(x) no es identicamente cero,
entonces C1 f (x) + C2g(x) es una solucion general de y + by + cy = 0. As, para
encontrar la solucion general, es suficiente encontrar dos soluciones f y g con las
propiedades mencionadas y luego usar 6.5.1.
En nuestra busqueda de una solucion de (6.13), usaremos y = emx como una

solucion de prueba. Como y = memx y y = m2 emx , inferimos que y = emx es
una solucion de y + by + cy = 0 si y solo si
m2 emx + bmemx + cemx = 0
168
o, como emx 6= 0, si y solo si
m2 + bm + c = 0. (6.13)
La ecuacion (6.14) se llama la ecuacion auxiliar de y + by + cy = 0. Esta se
puede obtener a partir de la ultima ecuacion, sustituyendo m2 en lugar de y , m
en lugar de y y 1 en lugar de y. En los casos simples se pueden hallar las races de
la ecuacion auxiliar (6.14) por medio de una factorizacion. En general, aplicando
la formula cuadratica, vemos que las races de la ecuacion auxiliar son

b b2 4c
m= . (6.14)
2
Por consiguiente, la ecuacion auxiliar tiene dos races distintas m1 y m2 , o una
raz doble m, o dos races complejas conjugadas, dependiendo de si b2 4c es po-
sitivo, cero o negativo respectivamente. El teorema siguiente es una consecuencia
de la observacion que se halla a continuacion del teorema 6.5.1.
Teorema 6.5.2 Si las races m1 y m2 de la ecuacion auxiliar son reales y distin-

tas, entonces la solucion general de y + by + cy = 0 es
y = C1 em1 x + C2 em2 x .
Ejemplo 6.5.3 Resuelva la ecuacion diferencial y 3y 10y = 0.
Solucion: La ecuacion auxiliar es m2 3m10 = 0 o sea (m5)(m+2) = 0.

Como las races m1 = 5 y m2 = 2 son reales y distintas, concluimos del teore-
ma 6.5.2 que la solucion general es
y = C1 e5x + C2 e2x .
Teorema 6.5.4 Si la ecuacion auxiliar tiene una raz doble m, entonces la solu-
cion general de y + by + cy = 0 es
y = C1 emx + C2 xemx .
Demostracion. Usando (6.15) con b2 4c = 0, obtenemos m = b/2 o

2m + b = 0. Como m satisface la ecuacion auxiliar, y = emx es una solucion de
la ecuacion diferencial. De acuerdo a la observacion que sucede a la demostracion
169
del teorema 6.5.1, es suficiente demostrar que y = xemx tambien es una solucion.
Sustituyendo xemx en lugar de y en y + by + cy = 0 obtenemos
(2memx + m2 xemx ) + b(mxemx ) + cxemx

= (m2 + bm + c)xemx + (2m + b)emx
= 0xemx + 0emx = 0
que es lo que queramos demostrar.
y 6y + 9y = 0.
Solucion: La ecuacion auxiliar m2 6m + 9 = 0, o equivalentemente (m
2
3) = 0, tiene la raz doble m = 3. Por lo tanto, de acuerdo con el teorema 6.5.2,
la solucion general es
y = C1 e3x + C2 xe3x = e3x (C1 + C2 x).
Tambien podemos considerar ecuaciones diferenciales de segundo orden de la

forma
ay + by + cy = 0
como se ilustra en el ejemplo siguiente.
6y 7y + 2y = 0.
Solucion: La ecuacion auxiliar 6m2 7m + 2 = 0 se puede factorizar como
sigue:
(2m 1)(3m 2) = 0.
Por lo tanto las races son m1 = 1/2 y m2 = 2/3. Aplicando el teorema 6.5.2,
vemos que la solucion general de la ecuacion dada es
y = C1 ex/2 + C2 e2x/3 .
170
El ultimo caso a considerar, es aquel en el cual las races de la ecuacion auxi-

liar m2 + bm + c = 0 de y + by + cy = 0 son numeros complejos. Recuerde que
los numeros complejos se pueden representar por expresiones de la forma a + bi,
donde a y b son numeros reales, e i es un smbolo que se puede manipular de
la misma manera que un numero real y que tiene la propiedad adicional de que
i2 = 1. Se dice que dos numeros complejos a + bi y c + di son iguales, y es-
cribimos a + bi = c + di, si y solo si a = c y b = d. Las operaciones de suma,
resta, multiplicacion y division se definen como si todas las letras representaran
numeros reales, con la convencion adicional de que cada vez que aparezca i2 se
sustituya por 1. Por ejemplo, las formulas para la suma y la multiplicacion de
dos numeros complejos a + bi y c + di son
(a + bi) + (c + di) = (a + c) + (b + d)i
(a + bi)(c + di) = (ac bd) + (ad + bc)i.
Podemos considerar a los numeros reales como un subconjunto de los nume-

ros complejos, identificando el numero real a con el complejo a + 0i. Un numero
complejo de la forma 0 + bi se abrevia por bi.
Los numeros complejos aparecen con frecuencia en la solucion de ecuaciones

de la forma f (x) = 0, donde f (x) es un polinomio. Por ejemplo, si unicamente
se admiten races reales, entonces la ecuacion x2 = 4 no tiene solucion. Sin em-
bargo, si se admiten numeros complejos como races, entonces la ecuacion tiene
la solucion 2i, ya que
(2i)2 = 22 i2 = 4(1) = 4.
Tambien 2i es una solucion de x2 = 4.

Como i2 = 1, a veces usamos el smbolo 1 en lugar de i y escribimos

13 = 13i, 2 + 25 = 2 + 25i = 2 + 5i
etcetera. Las races de una ecuacion cuadratica ax2 + bx + c = 0, donde a, b y c
son numeros reales y a 6= 0, estan dadas por la formula cuadratica

b b2 4ac
x= .
2a
171
Si b2 4ac < 0, entonces las races son numeros complejos. Por ejemplo, si apli-
camos la formula cuadratica a la ecuacion x2 4x + 13 = 0 obtenemos

4 16 52 4 36 4 6i
x= = = = 2 3i.
2 2 2
Por lo tanto esta ecuacion tiene las dos races complejas 2 + 3i y 2 3i.
El numero a bi se llama el conjugado del numero complejo a + bi. Vemos en

la formula cuadratica, que si una ecuacion cuadratica con coeficientes reales tiene
races complejas, entonces estas son conjugadas una de la otra.
Se deduce de la discusion anterior que si la ecuacion auxiliar m2 + bm + c = 0

en (6.14) tiene races complejas, entonces estas son de la forma
z1 = s + ti
y
z2 = s ti
donde s y t son numeros reales. Podemos suponer, de acuerdo con el teorema
6.5.2, que en este caso la solucion general de la ecuacion diferencial y +by +cy =
0 sera
y = C1 ez1 x + C2 ez2 x
es decir
y = C1 e(s+ti)x + C2 e(sti)x . (6.15)

Para poder manejar estos exponentes complejos, es necesario generalizar algunos
conceptos del calculo para incluir funciones cuyos dominios sean conjuntos de
numeros complejos.
Hay ciertas funciones que se pueden representar mediante series de potencias.

En particular,
x2 xn
ex = 1 + x + + ... + + ...
2! n!
x3 x5 x2n+1
senx = x + ... + (1)n + ...
3! 5! (2n + 1)!
172
x2 x4 x2n
cos x = 1 + ... + (1)n + ...
2! 4! (2n)!
para todo numero real x. Debido a que se pueden generalizar las definiciones y los
teoremas de series infinitas en las cuales intervienen numeros complejos, entonces
definimos ez , senz y cos z para todo numero complejo z como sigue:
z2 zn
ez = 1 + z + + ... + + ...
2! n!
z3 z5 z 2n+1
senz = z + ... + (1)n + ... (6.16)
3! 5! (2z + 1)!
z2 z4 z 2n
cos z = 1 + ... + (1)n + ...
2! 4! (2z)!
Usando la primera formula en (6.17) obtenemos
(iz)2 (iz)3 (iz)4 (iz)5

eiz = 1 + iz + + + + + ...
2! 3! 4! 5!
z2 z3 z4 z5
= 1 + iz + i2 + i3 + i4 + i5 + ...
2! 3! 4! 5!
Como i2 = 1, i3 = i, i4 = 1, i5 = i, etcetera, vemos que
z2 z3 z4 z5
eiz = 1 + iz i + + i ...
2! 3! 4! 5!
lo cual tambien se puede escribir en la forma
z2 z4 z3 z5
eiz = (1 + ...) + i(z + ...).
2! 4! 3! 5!
Usando las formulas para cos z y sen z en (6.17) obtenemos el importante resul-
tado siguiente.
Formula de Euler: Para todo numero complejo z
eiz = cos z + isen z (6.17)

Se puede demostrar que la solucion general de y + by + cy = 0, cuya ecua-
cion auxiliar tiene las races s ti, esta dada por (6.16). Esta solucion tambien se
173
puede expresar como sigue:
y = C1 e(s+ti)x + C2 e(sti)x
= C1 esx+txi + C2 esxtxi
= C1 esx etxi + C2 esx etxi
o equivalentemente
y = esx (C1 eitx + C2 eitx ). (6.18)

Esto se puede simplificar aun mas, usando la formula de Euler. En concreto, de
(6.18) deducimos que
eitx = cos tx + isen tx,

eitx = cos tx isen tx
de lo cual inferimos
eitx + eitx eitx eitx

cos tx = , sen tx = . (6.19)
2 2i
Si tomamos C1 = C2 = 1/2 en (6.19) y usamos (6.20), obtenemos la solucion par-
ticular y = esx cos tx de la ecuacion y +by +cy = 0. Si tomamos C1 C2 = i/2,
obtenemos la solucion particular y = esx sen tx. Esto es una demostracion parcial
del teorema siguiente.
Teorema 6.5.7 Si la ecuacion auxiliar m2 + bm + c = 0 tiene las races comple-

jas distintas s ti, entonces la solucion general de y + by + cy = 0 es
y = esx (C1 cos tx + C2 sen tx).
y 10y + 41y = 0
Solucion Las races de la ecuacion auxiliar m2 10m + 41 = 0 son

10 100 164 10 64 10 8i
m= = = = 5 4i.
2 2 2
174
Por lo tanto, aplicando el teorema 6.5.4, vemos que la solucion general de la ecua-
cion diferencial es
y = e5x (C1 cos 4x + C2 sen4x).
6.6. Ecuaciones Diferenciales Lineales No Homogeneas

En esta seccion estudiaremos ecuaciones diferenciales lineales no homogeneas
de segundo orden con coeficientes constantes, es decir ecuaciones de la forma
y + by + cy = k(x) (6.20)
donde b y c son constantes y la funcion k es continua.
Para esto es conveniente usar los operadores diferenciales D y D 2 que se de-

finen para y = f (x) como
Dy = y = f (x)
y
D 2 y = y = f (x).
Tambien usaremos el operador diferencial lineal
L = D 2 + bD + c
donde por definicion
L(y) = (D 2 + bD + c)y = D 2 y + bDy + cy = y + by + cy.

Usando esta notacion, podemos escribir (6.21) en la forma abreviada L(y) =
k(x). Es facil demostrar que para todo numero real C,
L(Cy) = CL(y). (6.21)

Sean y1 = f1 (x) y y2 = f2 (x). Entonces podemos demostrar que
L(y1 y2 ) = L(y1 ) L(y2 ). (6.22)
175
6.6. ECUACIONES DIFERENCIALES LINEALES NO HOMOGENEAS
Llamaremos ecuacion complementaria a la ecuacion homogenea L(y) = 0 que

corresponde a la ecuacion diferencial (6.21) L(y) = k(x). Suponga que yp es una
solucion particular de L(y) = k(x) y que yc es cualquier solucion de la ecuacion
complementaria. Como L(yp ) = k(x) y L(yv ) = 0, tenemos que
L(yp + yc ) = L(yp ) + L(yc ) = k(x) + 0 = k(x)

lo que quiere decir que yp + yc es una solucion de (6.21). Mas aun, si y = f (x) es
cualquier otra solucion de L(y) = k(x), entonces
L(y yp ) = L(y) L(yp ) = k(x) k(x) = 0.

Por consiguiente y yp es una solucion de la ecuacion complementaria. Esto de-
muestra el siguiente teorema.
Teorema 6.6.1 Si yp es una solucion particular de la ecuacion diferencial L(y) =

k(x) y si yc es la solucion general de la ecuacion complementaria L(y) = 0, en-
tonces la solucion general de L(y) = k(x) es y = yp + yc .
Despues de usar los procedimientos de la seccion anterior para hallar la solu-

cion general de yc de L(y) = 0, de acuerdo con el teorema 6.6.1, lo unico que
necesitamos para encontrar la solucion general de L(y) = k(x) es determinar una
solucion particular yp de esta ultima ecuacion.
y 4y = 6x 4x3 .
Solucion: Examinando la ecuacion dada, observamos que yp = x3 es una
solucion particular. La ecuacion complementaria es y 4y = 0. Aplicando el
teorema 6.5.2, vemos que la solucion general es
yc = C1 e2x + C2 e2x .
Entonces, segun el teorema 6.6.1, la solucion general de la ecuacion no homogenea
dada es
yc = C1 e2x + C2 e2x + x3 .
176
En la mayora de los casos no se puede hallar una solucion particular de (6.21)

de manera tan sencilla como en el ejemplo 1. Pero se puede aplicar el metodo
de variacion de parametros que explicaremos a continuacion. Dada la ecuacion
L(y) = k(x), sean y1 y y2 las expresiones que aparecen en la solucion general
y = C1 y1 + C2 y2 de la ecuacion complementaria L(y) = 0. Por ejemplo, y1 y y2
podran estar dadas por y1 = em1 x y y2 = em2 x como en el teorema 6.5.2. Ahora
intentemos encontrar una solucion particular de L(y) = k(x) que tenga la forma
yp = uy1 + vy2 (6.23)

donde u = g(x) y v = h(x) para algunas funciones g y h. La primera y la segun-
dad derivadas de yp son
yp = (uy1 + vy2 ) + (u y1 + v y2 )
yp = (uy1 + vy2) + (u y1 + v y2 ) + (u y1 + v y2 ) .
Sustituyendo estas expresiones en L(yp ) = yp + byp + cyp y rearreglando los
terminos, obtenemos
L(yp ) = u(y1 + by1 + cy1 ) + v(y2 + by2 + cy2 )

+b(u y1 + v y2 ) + (u y1 + v y2 ) + (u y1 + v y2 ). (6.24)
Como y1 y y2 son soluciones de y +by +cy = 0, entonces los primeros dos termi-
nos en el lado derecho de (6.25) son cero. Por lo tanto, para obtener L(yp ) = k(x),
es suficiente elegir u y v tales que
u y1 + v y2 = 0
u y1 + v y2 = k(x). (6.25)
Se puede mostrar que este sistema de ecuaciones siempre tiene una pareja unica
de soluciones u y v . Ahora se pueden encontrar u y v integrando, y usando (6.24)
se halla yp .
y + y = cot x.
177
Solucion: La ecuacion complementaria es y + y = 0. Como la ecuacion auxi-

liar m2 + 1 = 0 tiene las races i, la solucion general de la ecuacion homogenea
y + y = 0 segun el teorema 6.5.4 es y = C1 cos x + C2 sen x. Como en la discu-
sion anterior tomemos y1 = cos x y y2 = sen x. Entonces el sistema (6.26) es
u cos x + v sen x = 0
u sen x + v cos x = cot x.
Resolviendo este sistema obtenemos
u = cos x, v = csc x sen x.

Integrando estas expresiones (y omitiendo las constantes de integracion) llegamos
a
u = sen x, v = ln | csc x cot x | + cos x.

Aplicando (6.24), vemos que
yp = sen x cos x + senx ln | csc x cot x | +sen x cos x

o
yp = sen x ln | csc x cot x |

es una solucion particular de la ecuacion dada. Finalmente, usando el teorema
6.6.1, vemos que la solucion general de y + y = cot x es
y = C1 cos x + C2 sen x + sen x ln | csc x cot x | .
Dada la ecuacion diferencial
L(y) = y + by + cy = enx
donde enx no es una solucion de L(y) = 0, es razonable suponer que existe una
solucion particular de la forma yp = Aenx , ya que enx es el resultado de aplicar
y + by + cy a cualquier solucion de la ecuacion diferencial dada. Esto nos su-
giere usar Aenx como una solucion de prueba para la ecuacion dada y tratar de
encontrar el valor del coeficiente A. Este procedimiento se llama el metodo de los
coeficientes indeterminados y se ilustra en el ejemplo siguiente.
178
y + 2y 8y = e3x .
Solucion: Como las races de la ecuacion auxiliar m2 + 2m 8 de la ecuacion
complementaria y + 2y 8y = 0 son 2 y 4, inferimos de la seccion anterior
que la solucion general de la ecuacion complementaria es
yc = C1 e2x + C2 e4x .
De acuerdo con los comentarios anteriores, buscamos una solucion particular de
y + 2y 8y = e3x , de la forma yp = Ae3x . Como yp = 3Ae3x y yp = 9Ae3x , al
sustituir esto en la ecuacion dada obtenemos
9Ae3x + 6Ae3x 8Ae3x = e3x .

Dividiendo ambos lados por e3x llegamos a
9A + 6A 8A = 1,
o
1
A= .
7
3x
Por lo tanto yp = (1/7)e , y segun el teorema 6.6.1, la solucion general es
1
y = C1 e2x + C2 e4x + e3x .
7
A continuacion enunciamos, sin demostrarlas, tres reglas para encontrar so-
luciones de prueba de las ecuaciones diferenciales no homogeneas de segundo
orden con coeficientes constantes.
Teorema 6.6.5 (i) Si y + by + cy = enx y n no es una raz de la ecuacion

auxiliar m2 + bm + c = 0, entonces existe una solucion particular de la
forma yp = Aenx .
(ii) Si y + by + cy = xenx y n no es una raz de la ecuacion auxiliar m2 +

bm + c = 0, entonces existe una solucion particular de la forma yp =
(A + Bx)enx .
179
(iii) Si
y + by + cy = esx sen tx
o
y + by + cy = esx cos tx
y s + ti no es una solucion de la ecuacion auxiliar m2 + bm + c = 0, en-
tonces existe una solucion particular de la forma
yp = Aesx cos tx + Besx sen tx.
Ejemplo 6.6.6 Resuelva la ecuacion
y 3y 18y = xe4x .
Solucion: Como las races de la ecuacion auxiliar m2 3m 18 = 0 son
6 y 3, sabemos de la seccion anterior que la solucion general de la ecuacion
y 3y 18y = 0 es
y = C1 e6x + C2 e3x .
Como 4 no es una raz de la ecuacion auxiliar, se sigue de (ii) del teorema 6.6.2,
que existe una solucion particular de la forma
yp = (A + Bx)e4x .
Derivando obtenemos
yp = (4A + 4Bx + B)e4x
yp = (16A + 16Bx + 8B)e4x .

Sustituyendo esto en la ecuacion diferencial dada llegamos a
(16A + 16Bx + 8B)e4x 3(4A + 4Bx + B)e4x 18(A + Bx)e4x = xe4x

que se reduce a
14A + 5B 14Bx = x.
180
Por lo tanto yp sera una solucion, siempre y cuando
14A + 5B = 0 y 14B = 1.
Esto nos da B = 1/14 y A = 5/196. Por consiguiente
5 1 1
yp = ( x)e4x = (5 + 14x)e4x .
196 14 196
Aplicando el teorema 6.6.1, concluimos que
1
y = C1 e6x + C2 e3x (5 + 14x)e4x
196
es la solucion general.
Ejemplo 6.6.7 Resuelva la ecuacion
y 10y + 41y = sen x.

Solucion: En el ejemplo 6.5.8 de la seccion anterior hallamos la solucion ge-
neral
yc = e5x (C1 cos 4x + C2 sen 4x)

de la ecuacion complementaria. La ecuacion dada es de la forma (iii) del teorema
6.6.2 con s = 0 y t = 1, y por lo tanto sabemos que existe una solucion particular
de la forma
yp = A cos x + Bsen x.
Entonces
yp = Asen x + B cos x
yp = A cos x Bsen x.
Sustituyendo esto en la ecuacion dada obtenemos
A cos x Bsen x + 10Asen x 10B cos x + 41A cos x + 41Bsen x = sen x

que se puede escribir en la forma
(40A 10B) cos x + (10A + 40B)sen x = sen x.
181
6.7. SISTEMAS DE ECUACIONES DIFERENCIALES LINEALES
Por consiguiente yp sera una solucion siempre y cuando
40A 10B = 0 y 10A + 40B = 1.
La solucion de este sistema de ecuaciones es A = 1/170 y B = 4/170. Por lo

tanto
1 4 1
yp = cos x + sen x = (cos x + 4sen x)
170 170 170
y la solucion general es
1
y = e5x (C1 cos x + C2 sen x) + (cos x + 4sen x).
170
6.7. Sistemas de Ecuaciones Diferenciales Lineales
6.7.1. Teora Preliminar
Si X, A(t) y F(t) denotan, respectivamente, las matrices

x1 (t)

x2 (t)

X=
. ,

.
xn (t)

a11 (t) a12 (t) . . a1n (t) f1 (t)

a21 (t) a22 (t) . . a2n (t)

f2 (t)

A(t) =
. . , F(t) =
.

. . .
an1 (t) an2 (t) . . ann (t) fn (t)
182
entonces el sistema de ecuaciones lineales de primer orden
dx1
= a11 (t)x1 + a12 (t)x2 + + a1n (t)xn + f1 (t)
dt
dx2
= a21 (t)x1 + a22 (t)x2 + + a2n (t)xn + f2 (t)
dt
.
.
.
dxn
= an1 (t)x1 + an2 (t)x2 + ... + ann (t)xn + fn (t)
dt
(6.26)
puede ser escrito como

x1 a11 (t) a12 (t) . . a1n (t) x1 f1 (t)
x2 a21 (t) a22 (t) . . a2n (t) x2 f2 (t)
d . =

. . . + .
dt
.

. . . .
xn an1 (t) an2 (t) . . ann (t) xn fn (t)
o simplemente,
dX
= A(t)X + F(t). (6.27)
dt
Si el sistema es homogeneo, (6.28) se convierte en
dX
= A(t)X. (6.28)
dt
Las ecuaciones (6.28) y (6.29) tambien se escriben como X = AX + F y
X = AX, respectivamente.
Ejemplo 6.7.1 En forma matricial, el sistema no homogeneo
dx
= 2x + 5y + et 2t
dt
dy
= 4x 3y + 10t
dt
183
puede ser escrito como
et 2t

dX 2 5
= X+
dt 4 3 0 10t
o bien

2 5 1 t 2
X = X+ e + t
4 3 0 10

x
en donde X = .
y
Ejemplo 6.7.2 La forma matricial del sistema homogeneo
dx
= 2x 3y
dt
dy
= 6x + 5y
dt
es

dX 2 3
= X
dt 6 5

x
en donde X = .
y
Definicion 6.7.3 Un vector solucion en un intervalo I es cualquier matriz colum-
na

x1 (t)
z2 (t)

X= .

.
xn (t)
cuyos elementos son funciones diferenciables, y tal que satisface el sistema (6.28)
en el intervalo.
6.7.2. Sistemas Lineales Homogeneos.

Esta subseccion la dividiremos en varios casos. Comenzamos con el primero
de ellos.
184
Primer Caso: Valores Propios Reales

Sea el sistema homogeneo
dx
= x + 3y
dt
dy
= 5x + 3y
dt
cuya solucion general es

1 2t 3
X = c1 e + c2 e6t .
1 5
Puesto que ambos vectores solucion tienen la forma basica

k1
Xi = ei t , i = 1, 2,
k2
k1 y k2 constantes, esto nos induce a preguntar si siempre es posible encontrar una
solucion de la forma

k1
k2
t
e = ket

X= . (6.29)
.
kn
para el sistema lineal no homogeneo de primer orden dado en la forma general
X = AX (6.30)
donde A es una matriz de constantes de n n.
Si suponemos que (6.30) es un vector solucion de (6.31), entonces X = ket

de modo que el sistema se transforma en
ket = Aket .
Despues de simplificar cancelando et y reordenando los terminos obtenemos
Ak = k
185
o bien
(A I)k = 0. (6.31)
Para encontrar una solucion no trivial X de (6.31) hay que obtener un vector no
trivial k que satisfaga (6.32). Pero para que (6.32) tenga soluciones no triviales se
debe tener
det(A I) = 0.
A esta ecuacion se le conoce como ecuacion caracterstica de la matriz A. En
otras palabras, X = ket sera una solucion del sistema de ecuaciones diferencia-
les (6.31) si y solo si es un valor propio de A, y k es un vector propio corres-
pondiente a .
Cuando la matriz A de nn tiene n valores propios reales distintos 1 , 2 , ..., n ,

entonces siempre es posible encontrar un conjunto de n vectores propios lineal-
mente independientes k1 , k2 , ..., kn y
X1 = k1 e1 t , X2 = k2 e2 t , ..., Xn = kn en t
es un conjunto fundamental de soluciones de (6.31) en < t < .
Teorema 6.7.4 Sean 1 , 2 , ..., n n valores propios reales distintos de la ma-

triz A de los coeficientes del sistema homogeneo (6.31), y sean k1 , k2 , ..., kn los
correspondientes vectores propios. Entonces la solucion general de (6.31) en el
intervalo < t < esta dada por
X = c1 k1 e1 t + c2 k2 e2 t + + cn kn en t .
Ejemplo 6.7.5 Resolver

dx
= 2x + 3y
dt
dy
= 2x + y (6.32)
dt
Solucion: Primero obtenemos los valores propios y vectores propios de la ma-
triz de coeficientes.
186
La ecuacion caracterstica es

2 3
det(A I) = det = 2 3 4 = 0.
2 1
Puesto que 2 3 + 4 = ( + 1)( 4) vemos que los valores propios son
1 = 1 y 2 = 4.
Ahora bien, para 1 = 1, (6.32) es equivalente a
3k1 + 3k2 = 0
2k1 + 2k2 = 0
Por lo tanto k1 = k2 . Escogiendo k2 = 1 el vector propio relacionado resulta
ser

1
k1 = .
1
Para 2 = 4 tenemos
2k1 + 3k2 = 0
2k1 3k2 = 0
de manera que k1 = 3k2 /2 y, por consiguiente, con k2 = 2, el vector propio co-
rrespondiente es

3
k2 = .
2
Puesto que la matriz de coeficientes A es una matriz de 2 2 y dado que se han
obtenido dos soluciones linealmente independientes de (6.33),

1
X1 = et
1
y

3
X2 = e4t .
2
187
Concluimos que la solucion general del sistema es

1 t 3
X = c1 X 1 + c2 X 2 = c1 e + c2 e4t . (6.33)
1 2
dx
= 4x + y + z
dt
dy
= x + 5y z
dt
dz
= y 3z
dt
(6.34)
Solucion: Usando los cofactores de la tercera fila, se obtiene

4 1 1
det(A I) = det 1 5 1 = ( + 3)( + 4)( 5) = 0
0 1 3
y as los valores propios son 1 = 3, 2 = 4 y 3 = 5.
Ahora bien, para 1 = 3, la eliminacion de Gauss-Jordan da

1 1 1 | 0 1 0 1 | 0
det(A + 3I | 0) = 1 8 1 | 0 = 0 1 0 | 0 .
0 1 0 | 0 0 0 0 | 0
Por lo tanto, k1 = k3 , k2 = 0. La eleccion k3 = 1 da lugar al vector propio

1
k1 = 0 . (6.35)
1
De manera semejante, para 2 = 4,

0 1 1 | 0 1 0 10 | 0
det(A + 4I | 0) = 1 9 1 | 0 = 0 1 1 | 0 .
0 1 1 | 0 0 0 0 | 0
188
implica que k1 = 10k3 , k2 = k3 . Eligiendo k3 = 1 se obtiene el segundo vector

propio

10
k2 = 1 . (6.36)
1
Finalmente, cuando 3 = 5, las matrices aumentadas

9 1 1 | 0 1 0 1 | 0
det(A 5I | 0) = 1 0 1 | 0 = 0 1 8 | 0 .
0 1 8 | 0 0 0 0 | 0
dan lugar a

1
k3 = 8 . (6.37)
1
Multiplicando los vectores (6.36), (6.37) y (6.38) por e3t , e4t y e5t , respec-
tivamente, se obtienen tres soluciones de (6.35):

1 10 1
3t 4t
X1 = 0 e , X2 =
1 e , X3 =
8 e5t .
1 1 1
La solucion general del sistema es

1 10 1
3t 4t
X = c1 0 e + c2
1 e + c3 8 e5t .

1 1 1
Segundo Caso: Valores Propios Complejos

Si
1 = + i
y
2 = i,
189
con i2 = 1, son valores propios complejos de la matriz A de los coeficientes,

sus correspondientes vectores propios tambien tendran elementos complejos.
Por ejemplo, la ecuacion caracterstica del sistema
dx
= 6x y
dt
dy
= 5x + 4y
dt
(6.38)
es

6 1
det(A I) = det = 2 10 + 29 = 0.
5 4
Por la formula cuadratica obtenemos
1 = 5 + 2i, 2 = 5 2i.
Ahora bien, para 1 = 5 + 2i tenemos que resolver
(1 2i)k1 k2 = 0
k1 (1 + 2i)k2 = 0.
Como k2 = (1 2i)k1 se tiene, despues de elegir k1 = 1, que un vector propio es

1
k1 = .
1 2i
Analogamente, para 2 = 5 2i, encontramos que el otro vector propio es

1
k2 = .
1 + 2i
En consecuencia, las dos soluciones de (6.39) son

1
X1 = e(5+2i)t
1 2i
190
y

1
X2 = e(52i)t .
1 + 2i
Por el principio de superposicion se obtiene otra respuesta

1 (5+2i)t 1
X = c1 e + c2 e(52i)t . (6.39)
1 2i 1 + 2i
Observese que los elementos de k2 , correspondientes a 2 , son los complejos

conjugados de los elementos de k1 , correspondientes a 1 . El complejo conjugado
de 1 es, por supuesto, 2 . Escribimos esto como 2 = 1 y k2 = k1 .
Teorema 6.7.7 Sea A la matriz de los coeficientes del sistema homogeneo (6.31),
y supongamos que A tiene elementos reales; sea k el vector propio correspon-
diente al valor propio complejo 1 = + i, y reales. Entonces
X1 = k1 e1 t y X2 = k1 e1 t
son soluciones de (6.31).
Es conveniente, y ademas relativamente facil, reescribir una solucion como

(6.40) en terminos de funciones reales. Puesto que
x = c1 e(5+2i)t + c2 e(52i)t
y = c1 (1 2i)e(5+2i)t + c2 (1 + 2i)e(52i)t
y, usando
ei = cos() + isen ()
que es conocida como la formula de Euler, tenemos que
191
x = e5t [c1 e2it + c2 e2it ]

= e5t [(c1 + c2 ) cos 2t + (c1 i c2 i)sen 2t]
y = e5t [(c1 (1 2i) + c2 (1 + 2i)) cos 2t + (c1 i(1 2i) c2 i(1 + 2i))sen 2t]
= e5t [(c1 + c2 ) 2(c1 i c2 i)] cos 2t + e5t [2(c1 + c2 ) + (c1 i c2 i)]sen 2t.
Si reemplazamos c1 + c2 por C1 y c1 i c2 i por C2 , entonces
x = e5t [C1 cos 2t + C2 sen 2t]

y = e5t [C1 2C2 ] cos 2t + e5t [2C1 + C2 ]sen 2t,
o, en terminos de vectores,

x cos 2t
X= = C1 e5t
y cos 2t + 2sen 2t

sen 2t
+C2 e5t (6.40)
2 cos 2t + sen 2t
Por supuesto, en este caso es posible verificar que cada vector de (6.41) es una
solucion de (6.39). Ademas, las soluciones son linealmente independientes en
< t < . Podemos suponer tambien que C1 y C2 son completamente arbi-
trarias y reales. Por lo tanto, (6.41) es la solucion general de (6.39).
El proceso anterior puede ser generalizado. Sea k1 un vector propio de la ma-

triz A correspondiente al valor propio complejo 1 = + i. Entonces X1 y X2
del teorema 6.7.2 pueden ser escritos como
k1 e1 t = k1 et eit = k1 et (cos t + isen t)

k1 e1 t = k1 et eit = k1 et (cos t isen t) (6.41)
De las ecuaciones (6.42) resulta entonces
(k1 e1 t + k1 e1 t )(k1 + k1 )et cos t + i(k1 k1 )et sent

i(k1 e1 t k1 e1 t ) = i(k1 k1 )et cos t (k1 + k1 )et sent.
192
Hacemos notar que, cualquiera que sea el numero complejo z = a+ib, z + z = 2a

e i(z z) = 2b son numeros reales. Por lo tanto, los elementos de los vectores
columna k1 + k2 e i(k1 k2 ) son numeros reales. Definiendo
1
B1 = [k1 + k1 ]
2
1
B2 = [k1 k1 ] (6.42)
2
podemos enunciar el siguiente teorema:
Teorema 6.7.8 Sea 1 = + i un valor propio complejo de la matriz A de los

coeficientes del sistema homogeneo (6.31), y sean B1 y B1 los vectores columna
definidos en (6.43). Entonces
X1 = (B1 cos t + B2 sen t)et

X2 = (B2 cos t B1 sen t)et (6.43)
son soluciones linealmente independientes de (6.31) en < t < .

2 8
X = X.
1 2
Solucion: Primero obtenemos los valores propios resolviendo

2 8
det(A I) = det = 2 + 4 = 0.
1 2
Por consiguiente, los valores propios son 1 = 2i y 2 = 1 = 2i. Para 1 ,
vemos que del sistema
(2 2i)k1 + 8k2 = 0
k1 + (2 2i)k2 = 0
193
resulta que k1 = (2 + 2i)k2 . Eligiendo k2 = 1, obtenemos

2 + 2i
k1 = .
1
Ahora bien, usando (6.43) formamos

1 2 + 2i 2 2i 2
B1 = + =
2 1 1 1

1 2 + 2i 2 2i 2
B2 = = .
2 1 1 0
Como = 0, de (6.41) se deduce que la solucion general del sistema es

2 2 2 2
X = c1 cos 2t + sen 2t + c2 cos 2t sen 2t
1 0 0 1

2 cos 2t 2sen 2t 2 cos 2t 2sen 2t
= c1 + c2 .
cos 2t sen 2t

1 2
X = X.
12 1
Solucion: Las soluciones de la ecuacion caracterstica

1 2
det(A I) = det = 2 2 + 2 = 0
21 1
son
1 = 1 + i
y
2 = 1 = 1 i.
Ahora bien, vemos que un vector propio asociado con 1 es

2
k1 = .
i
194
De (6.43) obtenemos

2
B1 =
0

0
B2 = .
1
Por consiguiente, de (6.44) resulta

2 0 t 0 2
X = c1 cos t + sen t e + c2 cos t sen t et
0 1 1 0

2 cos t t 2sen t
= c1 e + c2 et .
sen t cos t
Tercer Caso: Valores Propios Reales Repetidos

Hasta ahora no hemos considerado el caso en que algunos de los n valores
propios 1 , 2 , ..., n de una matriz de n n se repiten. Por ejemplo, se ve facil-
mente que la ecuacion caracterstica de la matriz de los coeficientes en

3 18
X = X (6.44)
2 9
es ( + 3)2 = 0, de donde 1 = 2 = 3. Decimos que 1 = 3 es una raz
doble, o una raz de multiplicidad dos. Ahora bien, a este valor le corresponde un
solo vector propio

3
k1 =
1
y por lo tanto una solucion de (6.45) es

3
X1 = e3t . (6.45)
1
Puesto que estamos principalmente interesados en encontrar la solucion general
del sistema, es necesario encontrar una segunda solucion.
En general, si m es un entero positivo y ( 1 )m es un factor de la ecuacion

caracterstica, pero ( 1 )m+1 no es un factor, entonces se dice que 1 es un
195
valor propio de multiplicidad m. Distinguimos dos posibilidades:
(i) Puede ser que para algunas matrices A de n n sea posible encontrar m
vectores propios k1 , k2 , ..., km , linealmente independientes, que correspon-
den a un valor propio 1 de multiplicidad m n. En este caso, la solucion
general del sistema contiene la combinacion lineal
c1 k1 e1 t + c2 k2 e1 t + ... + cm km e1 t .
(ii) Si al valor propio 1 de multiplicidad m le corresponde solamente un vec-

tor propio, entonces siempre es posible encontrar m soluciones linealmente
independientes de la forma
X1 = k11 e1 t
X2 = k21 te1 t + k22 e1 t
.
.
.
tm1 1 t tm2 1 t
Xm = km1 e + km2 e + ... + kmm e1 t ,
(m 1)! (m 2)!
en donde los kij son vectores columna.
En primer lugar consideraremos valores propios de multiplicidad dos. En el

primer ejemplo usamos como ilustracion una matriz para la cual es posible obte-
ner dos vectores propios distintos que corresponden a un valor propio doble.

1 2 2
X = 2 1 2 X
2 2 1
196
Solucion: Desarrollando el determinante en la ecuacion caracterstica

1 2 2
det(A I) = det 2 1 2 = 0
2 2 1
resulta ( + 1)2 ( 5) = 0. Vemos que 1 = 2 = 1 y 3 = 5.
Para 1 = 1, la eliminacion de Gauss-Jordan da inmediatamente

2 2 2 | 0 1 1 1 | 0
(A + I | 0) = 2 2 2 | 0 = 0 0 0 | 0
2 2 2 | 0 0 0 0 | 0
De k1 k2 + k3 = 0, podemos expresar, digamos k1 en terminos de k2 y k3 . Eli-
giendo k2 = 1 y k3 = 0 en k1 = k2 k3 obtenemos k1 = 1 y entonces un vector
propio es

1
k1 = 1 .
0
Pero la eleccion k2 = 1, k3 = 1 implica k1 = 0. Luego un segundo vector propio
es

0
k2 = 1 .
1
Puesto que ninguno de los dos vectores propios es un multiplo constante del otro,
hemos encontrado dos soluciones linealmente independientes que corresponden
al mismo valor propio, a saber,

1
X1 = 1 et
0
y

0
X2 = 1 et .
1
197
Por ultimo, para 3 = 5, la reduccion

4 2 2 | 0 1 0 1 | 0
(A 5I | 0) = 2 4 2 | 0 = 0 1 1 | 0
2 2 4 | 0 0 0 0 | 0
implica k1 = k3 y k2 = k3 . El elegir k3 = 1 implica k1 = 1, k2 = 1 y, por
consiguiente, un tercer vector propio es

1
k3 = 1 .
1
Concluimos que la solucion general del sistema es

1 0 1
X = c1 1 et + c2 1 et + c3 1 e5t .
0 1 1
Supongamos ahora que 1 es un valor propio de multiplicidad dos, y que hay

solo un vector propio asociado a este valor. En tal caso se puede encontrar una
segunda solucion de la forma
X2 = kte1 t + Pe1 t (6.46)

donde

k1

k2

k=
. .

.
kn
y

p1

p2

P=
. .

.
pn
198
Para ver esto, en el sistema X = AX sustituimos (6.47) y simplificamos.
(Ak 1 k)te1 t + (AP 1 P k)e1 t = 0.

Como esta ultima igualdad debe cumplirse para todos los valores de t, se debe
tener
(A 1 I)k = 0 (6.47)
y
(A 1 I)P = k. (6.48)
La primera ecuacion (6.48) simplemente dice que k debe ser un vector propio de
A asociado a 1 . Resolviendo (6.48) obtenemos la solucion X1 = ke1 t . Para en-
contrar la segunda solucion X2 , solamente necesitamos despejar el vector P del
sistema adicional (6.49).
Ejemplo 6.7.12 Hallar la solucion general del sistema dado en (6.45).
Solucion: De (6.46) sabemos que 1 = 3 y que una solucion es

3
A= e3t .
1

3 p1
Identificando k = yP= , se tiene de (6.49) que ahora debemos
1 p2
resolver
(A + 3I)P = k
o bien

6 18 p1 3
= .
2 6 p2 1
Desarrollando esta ultima expresion resulta
6p1 18p2 = 3
2p1 6p2 = 1
199
Puesto que este sistema es equivalente a una sola ecuacion, tenemos un numero
infinito de valores posibles para p1 y p2 . Por ejemplo, eligiendo p1 = 1, obtene-
mos p2 = 1/6. Sin embargo, por simplicidad elegiremos p1 = 1/2 de modo que
1/2
p2 = 0. Por lo tanto, P = . Por consiguiente, de (6.47) obtenemos
0

3 3t 1/2
X2 = te + e3t .
1 0
Entonces, la solucion general de (6.45) es

3 3t 3 3t 1/2 3t
X = c1 e + c2 te + e .
1 1 0
Cuando una matriz A tiene solamente un vector propio asociado a un valor

propio 1 de multiplicidad tres, podemos encontrar una segunda solucion de la
forma (6.47) y una tercera solucion de la forma
t2
X3 = k e1 t + Pte1 t + Qe1 t (6.49)
2
en donde

k1 p1 q1

k2

p2

q2

k=
. , P =
. yQ=
. .

. . .
kn pn qn
Sustituyendo (6.50) en el sistema X = AX encontramos que los vectores colum-
na k, P y Q deben satisfacer
(A 1 I)k = 0, (6.50)
(A 1 I)P = k, (6.51)
y
(A 1 I)Q = P. (6.52)
Por supuesto, las soluciones de (6.51) y (6.52) pueden utilizarse para formular las
soluciones X1 y X2 .
200

2 1 6
X = 0 2 5 X.
0 0 2
Solucion: La ecuacion caracterstica ( 2)3 = 0 muestra que 1 = 2 es un
valor propio de multiplicidad tres. Sucesivamente, encontramos que una solucion
de
(A 2I)k = 0
es

1
k = 0 ;
0
una solucion de
(A 2I)P = k
es

0
P = 1 ;
0
y finalmente, una solucion de
(A 2I)Q = P
es

0
Q = 6/5 .
1/5
De (6.47) y (6.50) vemos que la solucion general del sistema es

1 1 0
X = c1 0 e2t + c2 0 te2t + 1 e2t +
0 0 0
201

1 2 0 0
t
c3 0 e2t + 1 te2t + 6/5 e2t .
2
0 0 1/5
202
Bibliografa
[1] Bartle, Robert G. Sherbert, Donald R. Introduccion al Analisis Matematico

de una Variable, Limusa; 1ra edicion (1984).
[2] Boyce, William E. DiPrima, Richard C. Ecuaciones Diferenciales y Proble-
mas con Valores en la Frontera, Limusa-Wiley; 4ta edicion (2003).
[3] Garrity, Thomas A. All the Mathematics You Missed [But Need to Know for
Graduate School], Cambridge University Press, 1st edition (2001).
[4] Grossman, Stanley I. Algebra Lineal, Grupo Editorial Iberoamerica; 2da edi-
cion (1987).
[5] Hoffman, K. Kunze, R. Algebra Lineal, Prentice Hall; 2da edicion (1973).
[6] Lipschutz, Seymour. Algebra Lineal, Serie Schaum, Mc Graw-Hill; 1ra edi-
cion (1970).
[7] Lispchutz, Seymour. Topologa General, Serie Schaum, Mc Graw-Hill; 1ra
edicion (1969).
[8] Marsden, Jerrold E. Elementary Classical Analysis, W. H. Freeman and
Company; 1st edition (1974).
[9] Marsden, Jerrold E. Tromba, Anthony J. Calculo Vectorial, Prentice Hall;
4ta edicion (1998).
[10] Swokowski, Earl W. Calculo con Geometra Analtica, Grupo Editorial Ibe-
roamerica; 1ra edicion (1980).
[11] Spivak, M. Calculus, Grupo Editorial Reverte; 2da edicion (1992).
203

Guia

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Guia

Încărcat de

Drepturi de autor:

Formate disponibile

Guia de estudio para la admision

Los campos de la matematica de la actualidad se han diversificado y expandido

El presente trabajo trata de abordar conceptos basicos que un egresado en

iv) Topologa de Conjuntos de Puntos. La Topologa General es un area muy

v) El Teorema Clasico de Stokes. El Teorema Clasico de Stokes y todas

vi) Ecuaciones Diferenciales Ordinarias. Posiblemente se trate del tema mas

El presente trabajo ha sido realizado por el matematico Oscar Ricardo Carmo-

2. Introduccion al Analisis Real 59

4. Topologa de Conjuntos 107

5. El Teorema Clasico de Stokes 123

6. Ecuaciones Diferenciales Ordinarias 151

Aunque un poco exagerado, se puede decir que un problema matematico se

(x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn )

(x1 , ..., xn ) = ( x1 , ..., xn ), R.

Para cualesquiera dos vectores x y y en Rn y cualesquiera dos escalares y ,

En la siguiente seccion usaremos la linealidad de la multiplicacion matricial

a11 x1 + ... + a1n xn = b1

1.3. Espacios Vectoriales y Transformaciones Linea-

Definicion 1.3.1 Un conjunto V no vacio es un espacio vectorial sobre los nume-

1. R V V, denotada por a v o av para todo numero real a y elementos

2. V V V, denotada por v + w para todos los elementos v y w en el

Con las siguientes propiedades:

a) Existe un elemento 0 en V tal que 0 + v = v para todo v V .

b) Para cada v V, existe un elemento (v) V con v + (v) = 0.

d) Para todo a R y para todo v, w V, tenemos que a(v + w) = av + aw.

e) Para todo a, b R y todo v V, a(bv) = (ab)v.

f) Para todo a, b R y todo v V, (a + b)v = av + ab.

Ahora vamos a ver algunos ejemplos de espacios vectoriales:

Ejemplo 1.3.2 Sea V = {p} un conjunto con un unico elemento y con:

Ejemplo 1.3.3 Sea V = {f : R R} y:

(f + g)(x) = f (x) + g(x), (f )(x) = f (x), con x R

(x1 a1 + ... + xn an ) + (y1 a1 + ... + yn an ) = (x1 + y1 )a1 + ... + (xn + yn )an

Ejemplo 1.3.6 Sea V = {1}. Es decir, V contiene solamente el numero 1. En este

Ejemplo 1.3.7 Sea

(x1 , y1 ) + (x2 , y2 ) = (x1 , mx1 ) + (x2 , mx2 )

(x, mx) = (x, mx) = (x, m(x)) V

(x, mx) + (x, m(x)) = (0, 0) = 0

Definicion 1.3.8 Un subconjunto U de un espacio vectorial V es un subespacio

Proposicion 1.3.9 Un subconjunto U de un espacio vectorial V es un subespacio

A continuacion veremos algunos ejemplos de subespacios vectoriales.

0 = 0 para todo numero real ,

Ejemplo 1.3.11 Sea

H = {(x, y, z) : x = at, y = bt, y z = ct, con a, b, c, t reales.}

x + y = (a(t1 + t2 ), b(t1 + t2 ), c(t1 + t2 )) H

Ejemplo 1.3.12 Sea H un subespacio de R. Si H 6= {0}, entonces H contiene

1 = H para todo numero real .

Ejemplo 1.3.13 Denotemos con Mmn el espacio vectorial de las matrices de m

Ejemplo 1.3.14 Sea V = Mnn , es decir, las matrices de n n, y sea H =

Definicion 1.3.15 Una transformacion lineal T : V W es una funcion de un

T (a1 v1 + a2 v2 ) = a1 T (v1 ) + a2 T (v2 )

Para mayor comprension de la definicion 1.3.15, se daran algunos ejemplos de

Ejemplo 1.3.16 Sean V y W espacios vectoriales. Defina T : V W por

T (v1 + v2 ) = 0 = 0 + 0 = T (v1 ) + T (v2 )

Ejemplo 1.3.17 Sea A una matriz de m n. Defina T : Rn Rm por T (x) =

si x y y estan en Rn , vemos que T es una transformacion lineal. En consecuencia:

Ejemplo 1.3.18 Sea V un espacio vectorial. Defina I = V V por I(v) = v

Definicion 1.3.22 Si T : V W es una transformacion lineal, entonces el ker-

Im(T ) = {w W : existe un v V con T (v) = w}.

El Kernel es un subespacio de V, dado que si v1 y v2 son dos vectores en el

T (av1 + bv2 ) = aT (v1 ) + bT (v2 ) = a 0 + b 0 = 0.

De forma similar podemos mostrar que la imagen de T es un subespacio de

T (c1 v1 + c2 v2 ) = c1 T (v1 ) + c2 T (v2 ) = c1 w1 + c2 w2

Veamos algunos ejemplos acerca del Kernel y la Imagen de una transforma-

Ejemplo 1.3.23 Considere la transformacion lineal T : R3 R2 definida por