Sunteți pe pagina 1din 185

Álgebra lineal

David Ojeda Marulanda


Índice general

1. Ecuaciones lineales 5
1.1. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Ecuación cartesiana de la recta . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2 . . . . . . . . . . . . . . . . 15
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3 . . . . . . . . . . . . . . . . 20
1.5. Sistemas de ecuaciones lineales tamaño m × n . . . . . . . . . . . . . . . . . 25
1.5.1. Ecuaciones Diofánticas . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.1. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.2. Suma y multiplicación por escalar de matrices . . . . . . . . . . . . . 41
1.6.3. Producto matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.6.4. Tipos de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6.5. Inversa de una matriz cuadrada . . . . . . . . . . . . . . . . . . . . . 48
1.6.6. Matrices elementales y inversas . . . . . . . . . . . . . . . . . . . . . 48
1.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2. Determinantes 53
2.1. Definición de determinante de una matriz . . . . . . . . . . . . . . . . . . . . 53
2.2. Interpretación geométrica del determinante de tamaño 2 × 2 . . . . . . . . . 54
2.3. Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3. Vectores en Rn 61
3.1. Vectores en el plano enfoque analı́tico . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Vectores en el plano enfoque geométrico . . . . . . . . . . . . . . . . . . . . 63
3.2.1. Vector resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3. Diferencia entre vectores y vectores geométricos . . . . . . . . . . . . . . . . 65
3.4. Movimiento relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.1. Vector proyección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

2
4. Nociones de cálculo integral 78
4.1. Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . . . 86
4.4. La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.4.1. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . 87
4.5. Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 93
4.5.1. Primer teorema fundamental del cálculo . . . . . . . . . . . . . . . . 93
4.5.2. Segundo teorema fundamental del cálculo . . . . . . . . . . . . . . . . 94
4.6. Área entre curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.7. Curvas en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.7.1. Ecuación vectorial y normal de la recta . . . . . . . . . . . . . . . . . 104
4.8. Continuidad y diferenciación de aplicaciones vectoriales . . . . . . . . . . . . 111
4.8.1. Vector tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.9. Movimiento en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.9.1. Movimiento rectilineo . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.10. Movimiento circular uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.10.1. Movimiento con aceleración constante . . . . . . . . . . . . . . . . . . 119
4.10.2. Fuerza resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.11. Vectores en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.12. Producto cruz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.13. Rectas y planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.14. Aplicaciones de los vectores en el espacio . . . . . . . . . . . . . . . . . . . . 132
4.15. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.16. Taller 2 corte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

5. Espacios vectoriales 144


5.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.1.1. Ejemplos de espacios vectoriales . . . . . . . . . . . . . . . . . . . . . 145
5.2. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.3. Combinación lineal y espacio generado . . . . . . . . . . . . . . . . . . . . . 148
5.4. Independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5. Interpretación geométrica de la independencia lineal en R3 . . . . . . . . . . 154
5.6. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.7. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.8. Bases ortonormales y proyecciones en Rn . . . . . . . . . . . . . . . . . . . . 159
5.9. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.10. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

3
6. Transformaciones lineales 162
6.1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.2. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 164
6.3. Teorema del cambio de variables en el plano (Opcional) . . . . . . . . . . . . 165
6.4. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.5. Representación matricial de una transformación lineal . . . . . . . . . . . . . 174
6.6. Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

7. Formas canónicas elementales 175


7.1. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.2. Matrices semejantes y diagonalización . . . . . . . . . . . . . . . . . . . . . . 175
7.3. Matrices semejantes y diagonalización ortogonal . . . . . . . . . . . . . . . . 175
7.4. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.6. Soluciones a algunos de los problemas . . . . . . . . . . . . . . . . . . . . . . 178

Bibliografı́a 185

4
Capı́tulo 1

Ecuaciones lineales

1.1. Campos
Definición 1.1.1. Un campo es una tripla conformada por un conjunto F y dos operaciones
de adicción y producto, que cumplen las siguientes propiedades

1. La adicción es conmutativa,

x+y = y+x

para todo x, y ∈ F .

2. La adicción es asociativa,

x + (y + z) = (x + y) + z

para todo x, y, z ∈ F .

3. Existe un único elemento 0 (cero) en F tal que

x+0 =0

para cada x ∈ F .

4. Para cada x ∈ F existe un único elemento (−x) en F tal que

x + (−x) = 0

5. La multiplicación es conmutativa,

xy = yx

para todo x, y ∈ F .

5
6. La multiplicación es asociativa,

x(yz) = (xy)z

para todo x, y, z ∈ F .

7. Existe un único elemento diferente de cero 1 (uno) en F tal que

x1 = x

para cada x ∈ F .

8. Para cada elemento x diferente de cero en F existe un único elemento x−1 (o 1/x) en
F tal que

xx−1 = 1.

9. La multiplicación es distributiva respecto a la adicción; esto es,

x(y + z) = xy + xz

para cada x, y, z ∈ F .

Ejemplo 1.1. Los números naturales no son campo, por ejemplo, 2 ∈ N, pero 2−1 = 1/2 ∈
/ N,
con lo cual no se cumple la propiedad 8. Por la misma razón los enteros tampoco son un
campo. Los números irracionales, I = Q′ , no definen un campo, pues 0 ∈ / I. Tanto los
números racionales Q, los reales R, como los números complejos, C son campos.

Ejemplo 1.2. Demostrar que el conjunto


n √ o
F := x + 2y : x, y ∈ Q ,

con la suma y multiplicación usual de números reales es un campo

Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y


asociativas de la suma y la multiplicación, además de la ley distributiva. Más aún, como
√ √
0 = 0 + 0 2 ∈ F y 1 = 1 + 0 2 ∈ F , resulta que se cumple la ley modulativa de la suma y
la multiplicación.

Demostremos ahora los axiomas de cerradura. Esto es,

1. Si x, y ∈ F , entonces x + y ∈ F

2. Si x, y ∈ F , entonces xy ∈ F .

6
√ √
Como x ∈ F , x = a + b 2 donde a, b ∈ Q, de manera similar, para c, d ∈ Q, y = c + d 2,
entonces

x + y = (a + c) + (b + d) 2.
√ √
xy = (a + b 2)(c + d 2)
√ √ √
= (a + b 2)c + (a + b 2)d 2
√ √
= ac + bc 2 + ad 2 + 2bd

= (ac + 2bd) + (bc + ad) 2

Dado que los números son racionales son un campo (ver problema 1.7.5), en particular
cumplen axiomas de cerradura, lo cual implica que a + c, b + d ∈ Q y ac + 2bd, bc + ad ∈ Q.
Lo que a su vez implica que el conjunto F cumple los axiomas de cerradura. Sólo nos queda
verificar la existencia de inversos aditivo y multiplicativo para cada elemento de F . Sea
√ √
x = a + b 2 ∈ F , entonces −x := −a − b 2 ∈ F y x + (−x) = 0. Ahora, supongamos que

x = a + b 2 6= 0. Tenemos que

xy = 1,

1 √
donde y = √ . Veamos que y ∈ F . En efecto, supongamos que a − b 2 = 0, como
a+b 2
x 6= 0, a y b no son simultáneamente iguales a 0. Lo cual nos lleva a considerar dos casos:
a 6= 0, o, b 6= 0. Si b 6= 0, entonces
a √
= 2.
b
Lo cual es imposible. Ahora bien, si a 6= 0 tenemos que
b 1
=√ .
a 2

Lo cual nos conduce de nuevo a una contradicción pues, 1/ 2 es un número irracional.
√ √
Concluimos que a − b 2 6= 0 si x = a + b 2 6= 0, y en ese caso obtenemos que

1 a−b 2
y= √ · √
a+b 2 a−b 2

a−b 2
= 2
a − 2b2
a a √
= 2 + 2.
a − 2b2 2b2 − a2
Con lo cual verificamos que y ∈ F , concluyendo de esta manera la demostración.

7
Demostremos ahora que el conjunto de los números complejos es un campo. Definimos
este conjunto como

C = a + bi : a, b ∈ R, i2 = −1 .


Vemos que este espacio no esta contenido en los números reales, por lo tanto, debemos
demostrar cada una de las propiedades de campo de la definición 1.1.1.

Sean z = a + bi y w = c + di dos números complejos, entonces

z=w⇔a=c y b=d

Ahora, para recordar las fórmulas que definen la suma y el producto en los números com-
plejos, podemos asociar el término a + bi con el polinomio lineal a + bx, y entonces sumar
y multiplicar complejos tal cual como hacemos con los polinomios lineales, esto es, para la
suma de dos complejos a + bi y c + di tenemos que

(a + bi) + (c + di) = (a + c) + (b + d)i,

y para el producto

(a + bi)(c + di) = ac + adi + bci + bdi2


= ac − bd + (ad + bc)i

Demostraremos que los números complejos con la suma y el producto ası́ definidas, con-
forman un campo. Lo primero que tenemos que verificar son los axiomas de cerradura.
Esto es,

1. Si z, w ∈ C, entonces z + w ∈ C

2. Si z, w ∈ C, entonces zw ∈ C.

Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,


los axiomas de cerradura vemos que a + c, b + d ∈ R y ac − bd, ad + bc ∈ R, de lo cual
inmediatamente se sigue que z + w ∈ C y que zw ∈ C. Demostremos que la suma es
conmutativa,

z + w = (a + bi) + (c + di)
= (a + c) + (b + d)i
= (c + a) + (d + b)i
= (c + di) + (a + bi)
= w + z.

8
Vemos que la conmutatividad de la suma de complejos se sigue de la conmutatividad de la
suma de los números reales. La ley asociativa de la suma complejos se demuestra de manera
análoga. Ahora estableceremos la propiedad modulativa de la suma. Si definimos 0 = 0 + 0i,
tenemos que si z = a + bi ∈ C, entonces
z + 0 = (a + bi) + (0 + 0i)
= (a + 0) + (b + 0)i
= a + bi
= z.
Además, para todo z = a + bi ∈ C, si w := −a − bi, se cumple que
z + w = (a + bi) + (−a − bi)
= (a + (−a)) + (b + (−b)i
= 0 + 0i
Es decir, todo número complejo tiene un inverso aditivo. Ahora demostraremos las propie-
dades de campo de la multiplicación de números complejos.
wz = (c + di)(a + bi)
= ca + cbi + dai − db
= (ac − bd) + adi + bci
= (ac − bd) + (ad + bc)i
= zw
Como el caso de la suma de complejos, vemos la conmutatividad de la multiplicación de
complejos se hereda de la conmutatividad de la multiplicación de los números reales. Ahora,
sean x = a + bi, y = c + di y z = e + f i un números complejos, entonces
x(yz) = (a + bi) [(c + di)(e + f i)]
= (a + bi) [ce − df + (cf + de)i]
= a(ce − df ) − b(cf + de) + [a(cf + de) + b(ce − df )] i
= a(ce) − a(df ) − b(cf ) − b(de) + [a(cf ) + a(de) + b(ce) − b(df )] i
= (ac)e − (ad)f − (bc)f − (bd)e + [(ac)f + (ad)e + (bc)e − (bd)f ] i
= (ac)e − (bd)e − (ad)f − (bc)f + [(ac)f − (bd)f + (ad)e + (bc)e] i
= (ac − bd)e − (ad + bc)f + [(ac − bd)f + (ad + bc)e] i
= [(ac − bd) + (ad + bc)i] (e + f i)
= [(a + bi)(c + di)] (e + f i)
= (xy)z.

9
Demostrando de esta forma, la ley asociativa de la multiplicación. Construiremos a conti-
nuación el elemento neutro de la para multiplicación de complejos. Queremos encontrar un
complejo e = x + yi tal que para todo z = a + bi se cumpla que ze = z, esto es,

(a + bi)(x + iy) = (a + bi),


o equivalentemente,

ax − by + (ay + bx)i = a + bi,


que según la igualdad de números complejos, conduce a el siguiente sistema

ax − by = a
bx + ay = b
Para este sistema la matriz de coeficientes es
 
a −b
A=
b a
para la cual, det A = a2 + b2 6= 0 si a + bi 6= 0 + 0i. Por lo tanto, por la Regla de Krammer
(ver Teorema 2.4.2) encontramos que
det B1 det B2
x= ,y = ,
det A det A
donde
   
a −b a a
B1 = , B2 =
b a b b
por consiguiente, x = 1, y = 0. De modo que, e = 1 + 0i = 1. Encontremos ahora el inverso
multiplicativo de un complejo z = a + bi 6= 0. Tenemos que

zw = 1 + 0i = 1,
1
donde w = . Demostraremos que w ∈ C.
a + bi
1 a − bi
w= ·
a + bi a − bi
a − bi
= 2
a + b2
a −b
= 2 2
+ 2 i.
a +b a + b2
Nótese que a − bi y a2 + b2 son diferentes de 0 + 0i, ya que a + bi 6= 0.

La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-


cación, la cual se deja como ejercicio.

10
1.2. Ecuación cartesiana de la recta
Sean P = (x1 , y1 ) y Q = (x2 , y2 ) dos puntos dados de la recta l. Definimos la pendiente
de la recta, la cual denotaremos con la letra m como

y2 − y1
m = tan θ = (1.1)
x2 − x1
donde el ángulo θ se mide desde el eje x en el sentido contrario de las manecillas del reloj
(ver la figura 1.1). Como se ve en la la fórmula (1.1), la pendiente es una razón de cambio
de y con respecto a x y es una medida de la inclinación de la recta con respecto al eje x.

y
l

Q
b

y2 − y1
Pb θ
x2 − x1

θ x
O

Figura 1.1: Cálculo de la pendiente de una recta dados dos de sus puntos

Vemos que la hipotenusa del triángulo de la figura 1.1 nos da la distancia entre los puntos
P y Q, por el Teorema de Pitagóricas tenemos que
p
d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2 (1.2)

En la figura 1.2 se muestran la diferentes inclinaciones que puede tener una recta.

11
y y y
0 < θ < 90
m = tan θ > 0
b m=0 m=∞
y=b
a θ
x x x
x=a
(a) m = 0, la recta es (b) m = ∞, la recta (c) m > 0, relación
horizontal es vertical directa
y
90 < θ < 180
m = tan θ < 0

θ
x

(d) m < 0, relación


inversa

Figura 1.2: Recta horizontal, vertical, positiva y negativa

Ahora, fijemos el punto P sobre la recta l en la figura 1.2. Esto es, P = (x0 , y0 ) es un
punto dado de la recta. Supongamos además que Q = (x, y) es un punto arbitrario.

y
l

Q
b

y − y0
P
b θ
x − x0

θ x
O

Figura 1.3: Ecuación de una recta dados uno de sus puntos y su pendiente

Entonces por la fórmula (1.1) tenemos que

12
y − y0
m = tan θ = .
x − x0
O bien,

y − y0 = m(x − x0 ) (Fórmula punto-pendiente)

La fórmula anterior nos dice que para, determinar completamente una recta es suficiente
con tener un punto y una dirección, la cual es dada por la pendiente m. Esta claro que dados
dos puntos de la recta, con la fórmula (1.1) podemos hallar la pendiente y escoger uno de los
puntos para con la Fórmula punto-pendiente hallar la ecuación de la recta. Concluimos que:

Nota 1.2.1. Dos puntos determinan una recta, o bien, un punto y una dirección.

Ahora despejemos la variable y en la Fórmula punto-pendiente.

y = y0 + m(x − x0 ) = mx + y0 − mx0 ,

pongamos b = y0 − mx0 , obtenemos

y = mx + b (Fórmula pendiente-intercepto)

Vemos que cuando x = 0, y = b, es decir la recta corta al eje y en b, por eso este número
es llamado intercepto de la recta con eje y. Si m = 0 en la Fórmula pendiente-intercepto
obtenemos y = b que es la ecuación de una recta horizontal (ver figura 1.2(a)). Si m > 0
(figura 1.2(c)), x, y y guardan una relación directa, es decir, la variable y crece cuando x
crece. Por el contrario, si la variable y decrece cuando la variable x aumenta, tenemos que
m < 0, y la gráfica es la recta decreciente que se muestra en la figura 1.2(d). Finalmente, si
la recta es vertical, θ = π/2 = 90◦ , y m = tan(π/2) = ∞ (ver figura 1.2(b)).

Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función


lineal, y se suele escribir y = f (x) = mx + b.

Ejemplo 1.3 (Modelo de costo lineal). A una compañı́a le cuesta $75 producir 10 unidades
de cierto artı́culo al dı́a y $120 producir 25 unidades del mismo artı́culo al dı́a.

(a) Determine la ecuación de costos, suponiendo que sea lineal.

(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?

13
Solución. Denotemos con y = C(x) el costo total de producir y vender x unidades diarias
del artı́culo. Según los datos del problema y1 = 75 cuando x1 = 10, y y2 = 120 cuando
x2 = 25. Por lo tanto, por la Fórmula (1.1) obtenemos
y2 − y1 120 − 75
m= = = 3.
x2 − x1 25 − 10
Como m = 3 > 0, concluimos que entre más artı́culos se produzcan, su costo total aumentará.
Además, m = 3/1, lo que significa que por cada artı́culo de más que se produzca, el costo
total de producción de los artı́culos aumentará en $3. Ahora, utilizando la Fórmula punto-
pendiente, con (x0 , y0 ) = (10, 120), obtenemos

y − 120 = 3(x − 25).

De donde y = C(x) = 120 + 3(x − 25) = 3x + 45. Con lo cual se tiene la parte (a). Se observa
que aunque se produzcan 0 artı́culos, se incurre en un costo de $45, dichos costos son llamados
costos fijos. Por ejemplo, cuando una empresa esta en temporada de vacaciones hay que
pagar arriendo servicios, etc.

Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20


para obtener y = C(20) = 3(20) + 45 = 105.

Una ecuación de la forma

Ax + By + C = 0 (1.3)

donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada


ecuación lineal. Observamos que la ecuación de una recta es una ecuación lineal. En efecto,
al despejar la variable y en (1.3) obtenemos

A C
y =− x−
B B
que es la Fórmula pendiente-intercepto con m = −A/B y b = −C/A. La fórmula (1.3) es
llamada ecuación general de la recta.

A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.

Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2


respectivamente, entonces la recta l1 es paralela a la recta l2 , lo cual denotamos por l1 k l2 si
y sólo si m1 = m2 . Y las rectas l1 y l2 son ortogonales, o perpendiculares, lo cual denotamos
por l1 ⊥ l2 si y sólo si m1 · m2 = −1.

14
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2
Consideremos el sistema de ecuaciones con dos incógnitas

a11 x + a12 y = b1
(1.4)
a21 x + a22 y = b2
Puesto que las variables x y y tienen exponente 1, y el sistema consta de 2 ecuaciones con 2
incógnitas (1.4) es llamado sistema de ecuaciones lineales de tamaño 2 × 2. La primera
pregunta que nos formulamos es: bajo que condiciones el sistema en (1.4) tiene solución. Esto
es, una pareja (x, y) que satisface ambas ecuaciones. Como sabemos de la sección anterior
cada una de estas ecuaciones es representada por una linea recta, y esta claro que si estas
son paralelas no existe un punto (x, y) que este en ambas rectas, es decir el sistema no tiene
solución. Supongamos entonces que las rectas de ecuaciones a11 x+a12 y = b1 y a21 x+a22 y = b2
son paralelas. Despejando la variable y en ambas ecuaciones obtenemos
a11 b1 a21 b2
y=− x+ , y =− x+
a12 a12 a22 a22
a11 a21
en donde se identifican las pendientes de las rectas, m1 = − y m2 = − . Dado que
a12 a22
estas son paralelas tenemos que
a11 a21
m1 = m2 ⇔ − =− ⇔ a11 a22 − a21 a12 = 0.
a12 a22
Por lo tanto, si el sistema (1.4) no tiene solución entonces a11 a22 −a21 a12 = 0. Recı́procamente,
si a11 a22 − a21 a12 = 0 entonces m1 = m2 , y el sistema (1.4) no tiene solución. Lo anterior lo
podemos decir de manera equivalente como sigue:
El sistema (1.4) tiene una única solución si y sólo si a11 a22 − a21 a12 6= 0.
Observese que en el análisis anterior sólo se considero en caso en que a11 , a22 6= 0, (Ver, [3,
pag. 2]) en donde se consideran todos los casos.

Consideremos ahora en sistema



x−y =2
(1.5)
2x − 2y = 4
Vemos que para este caso a11 = 1, a12 = −1, a21 = 2 y a22 = −2. Con lo cual a11 a22 −a21 a12 =
1(−2) − 2(−1) = 0, sin embargo el sistema tiene solución, por ejemplo, la pareja (2, 0) es
solución. Más aún, este sistema tiene infinitas soluciones, para verlo nótese que la primera
ecuación puede ser obtenida de la segunda al multiplicarla por 1/2. Entonces si y = t de la
primera ecuación x = t + 2, luego las soluciones del sistema (1.5) son de la forma

x = t + 2, y = t, t ∈ R.

15
En la figura 1.4 se muestran la interpretación geométrica de las diferentes opciones de
solución de un sistema de tamaño 2 × 2.
y y y
l1
l1
l1 = l2

l2 l2
x x x

(a) Solución única (b) Sin solución (c) Infinitas solucio-


nes

Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2

Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado

Teorema 1.3.1. El sistema 


a11 x + a12 y = b1
a21 x + a22 y = b2
de tamaño 2 × 2, tiene solución única, no tiene solución, en cuyo caso diremos que es
inconsistente, o tiene infinitas soluciones.

(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.

(b) No tiene solución o tiene infinitas soluciones si y sólo si a11 a22 − a12 a21 = 0.

Ejemplo 1.4. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a


un punto P0 = (x0 , y0 ) que no pertenece a l está dada por

|ax0 + by0 + c|
dmı́n = √ .
a2 + b2
Solución. Se pueden definir infinitas distancias del punto P0 a la recta l (ver figura 1.5),
pero sólo hay una que es la menor, precisamente la perpendicular trazada desde el punto P0
hasta la recta l. Supongamos que dicha perpendicular corta a l en un punto P1 = (x1 , y1 ).

16
y

P0
l
dmı́n

P1
l⊥
x
O

Figura 1.5: Distancia de un punto a una recta

Por la fórmula (1.2) tenemos que

d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.6)

Debe notarse que las constantes a, b, c, x0 y y0 son dadas y tenemos que expresar x1 y y1
en términos de estas constantes. Para tal fin plantearemos dos ecuaciones. Empecemos por
calcular la pendiente de la recta l⊥ que une los puntos P0 y P1 . Por la fórmula 1.1 encontramos
que
y1 − y0
m⊥ =
x1 − x0
Ahora calculemos la pendiente de la recta l, tememos que ax + by + c = 0, en donde las
constantes a y b no son simultáneamente iguales a cero, por ejemplo supongamos que b 6= 0,
entonces
a c
y =− x−
b b
a
en donde vemos la pendiente de la recta l es m = − . Como las rectas l y l⊥ son perpendi-
b
culares por el Teorema 1.3.1 el producto de sus pendientes es −1, esto es,
 a y − y
1 0
m · m⊥ = −1 ⇔ − · = −1.
b x1 − x0
De forma equivalente
a
x1 − x0 = (y1 − y0 ). (1.7)
b

17
Con lo cual tenemos nuestra primera ecuación

−bx1 + ay1 = ay0 − bx0 . (1.8)

Para plantear la segunda ecuación nótese que (x1 , y1 ) ∈ l, entonces ax1 + by1 + c = 0, o bien

ax1 + by1 = −c. (1.9)

Con las ecuaciones (1.8) y (1.9) formamos el siguiente sistema de ecuaciones lineales de
tamaño 2 × 2 
−bx1 + ay1 = ay0 − bx0
(1.10)
ax1 + by1 = −c
Aquı́ las variables x1 , y1 reemplazan a las variables x, y en (1.4), y tenemos que a11 = −b,
a12 = a, a21 = a y a22 = b, de donde

a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),

nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,


por el Teorema 1.3.1 el sistema 1.10 tiene solución única. Ahora, multiplicando la primera
ecuación por a y la segunda por b obtenemos el sistema de ecuaciones equivalente al primero

−abx1 + a2 y1 = a2 y0 − abx0

(1.11)
abx1 + b2 y1 = −bc

Decimos que los sistemas (1.10) y (1.11) son equivalentes en el sentido de ambos tienen la
misma solución. Consideremos un tercer sistema equivalente a los dos primeros reemplazando
la segunda ecuación por la suma de la primera y segunda ecuación

−abx1 + a2 y1 = a2 y0 − abx0

(1.12)
0 + (a2 + b2 )y1 = a2 y0 − abx0 − bc

En el sistema (1.12) se observa que podemos despejar la variable y1 al multiplicar la segunda


ecuación por 1/(a2 + b2 ). Tenemos que
a2 y0 − abx0 − bc
y1 = .
a2 + b2
Entonces
a2 y0 − aby0 − bc − a2 y0 − b2 y0
y1 − y0 =
a2 + b2
2
−abx0 − b y0 − bc
=
a2 + b2
−b(ax0 + by0 + c)
= .
a2 + b2

18
Ası́,

−b(ax0 + by0 + c)
y1 − y0 = . (1.13)
a2 + b2
Ahora hagamos lo mismo pero con la diferencia x1 − x0 . En efecto, reemplazando (1.13) en
(1.7) obtenemos que esta diferencia es igual a

a −b(ax0 + by0 + c)
x1 − x0 = · ,
b a2 + b2
o bien,

−a(ax0 + by0 + c)
x1 − x0 = , (1.14)
a2 + b2
Finalmente, reemplazando las ecuaciones (1.13) y (1.14) en (1.6) y realizando un poco de
álgebra obtenemos
 2  2
2 −b(ax0 + by0 + c) −a(ax0 + by0 + c)
dmı́n = +
a2 + b2 a2 + b2
b2 (ax0 + by0 + c)2 a2 (ax0 + by0 + c)2
= +
(a2 + b2 )2 (a2 + b2 )2
(a2 + b2 )(ax0 + by0 + c)2
=
(a2 + b2 )2
(ax0 + by0 + c)2
= .
a2 + b2
De donde
s
(ax0 + by0 + c)2
dmı́n =
a2 + b2
p
(ax0 + by0 + c)2
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2

Existen cinco métodos para resolver sistemas de ecuaciones lineales de tamaño 2 × 2:


eliminación, que fue el que utilizamos para simplificar el sistema 1.10, igualación, sustitución,
la regla de Krammer y el método gráfico. A continuación ilustramos con otro ejemplo, esta
vez el método de igualación

19
Ejemplo 1.5. (Ver, [3, pag. 7, Problema 34]). La compañı́a Sunrise Porcelain fabrica tazas y
platos de cerámica. Para cada taza o plato un trabajador mide una cantidad fija de material
y la pone en una maquina que los forma, de donde pasa al secado y vidriado automático. En
promedio, un trabajador necesita 3 minutos para iniciar el proceso de una tasa y 2 minutos
para el de un plato. El material para una tasa cuesta 25c y el material para un plato cuesta
20c. Si se asignan $44 diarios para la producción de tazas y platos, ¿cuántos deben fabricarse
de cada uno en un dı́a de trabajo de 8 horas, si un trabajador se encuentra trabajando cada
minuto y se gasta exactamente $44 en materiales?

Solución. Sea x := el número de tazas que se debe fabricar en un dı́a de trabajo de 8


horas, y y := el número de platos que se debe fabricar en un dı́a de trabajo de 8 horas. Se
deben emplear exactamente $44 en la fabricación de las tazas y platos, de donde tenemos al
ecuación
25 20
x+ y = 44.
100 100
Además, no se deben gastar ni más ni menos de 8 horas en la fabricación de platos y tazas,
por lo que
3 2
x + y = 8.
60 60
Simplificando las dos ecuaciones anteriores obtenemos el sistema

5x + 4y = 880
3x + 2y = 480.

Despejando la variable x en la primera ecuación y reemplazandola en la segunda obtenemos


3(880 − 4y)/5 + 2y = 480, de donde y = 120, por lo tanto, x = 3(880 − 4(120))/5 = 80.
Se concluye que se deben fabricar diariamente 80 tazas y 120 platos para cumplir con las
necesidades requeridas por el problema.

1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3


Ahora consideraremos un sistema de ecuaciones lineales con tres incógnitas y tres ecua-
ciones lineales 
 a11 x + a12 y + a13 z = b1
a x + a22 y + a23 z = b2 (1.15)
 21
a31 x + a32 y + a33 z = b3
También podemos hacer una interpretación geométrica de las posibles soluciones de un sis-
tema 3 × 3, pero tendrá que esperar hasta el capı́tulo 2 en el que se introduce la noción

20
de plano. En esta sección se describirá un método de solución para el sistema (1.15). Es-
te método se basa en el hecho de que las soluciones, o conjunto solución de un sistema se
mantiene invariante bajo la acción de tres operaciones que llamaremos elementales. Antes de
definir dichas operaciones introduciremos la noción de matriz, que nos permitirá simplificar
la escritura de cada paso del procedimiento.

Definición 1.4.1 (Matriz). Una matriz es un arreglo rectangular de números.

Una matriz con m filas y n columnas es llamada matriz de tamaño m × n. Utilizaremos


la notación Mm×n (R) para referirnos a el conjunto de todas la matrices de tamaño m × n con
entradas en los reales. Se pueden escribir los coeficientes de las variables de un sistema de
ecuaciones utilizando la notación matricial. Por ejemplo, los coeficientes del sistema (1.15)
se pueden organizar en la matriz

a11 a12 a13


 

A = a21 a22 a23 


a31 a32 a33

lo cual es llamada matriz de coeficientes. Cuando se consideran los elementos (términos


independientes) después de cada igualdad en un sistema de ecuaciones en el arreglo, se obtiene
una matriz llamada matriz aumentada. Para el sistema (1.15) la matriz aumentada está
dada por

a11 a12 a13 | b1


 
a21 a22 a23 | b2 
a31 a32 a33 | b3

A continuación se enuncian las tres operaciones elementales con filas.

Definición 1.4.2 (Operaciones elementales con filas). Para reducir una matriz se utilizan
las siguientes operaciones elementales

(a) Multiplicar (o dividir) una fila por un número diferente de cero.

(b) Sumar un múltiplo de una fila o otra fila.

(c) Intercambiar dos filas

El proceso de aplicar operaciones elementales con filas para simplificar una matriz au-
mentada se llama reducción por filas.

Notación

21
(a) Ri → cRi significa que la i−ésima fila se reemplaza por esa misma fila multiplicada
por c.

(b) Rj → Rj + cRi significa la j−ésima fila se reemplaza por la suma de la fila j más la
fila i multiplicada por c

(c) Ri ↔ Rj quiere decir intercambiar dos filas i y j.

(d) A ⇐⇒ B indica que las matrices aumentadas A y B son equivalentes; es decir, que los
sistemas que representan tienen la misma solución

Cuando se aplica el método de reducción por filas a una matriz se puede llegar a dos
formas equivalentes de dicha matriz: forma escalonada reducida por renglones (FERR)
y forma escalonada por renglones (FER). A continuación damos la definición general
de estas dos formas.

Definición 1.4.3 (FERR). Una matriz se encuentra en la forma escalonada reducida por
renglones (FERR) si se cumplen las siguientes condiciones

(a) Todos los renglones (si los hay) cuyos elementos son todos cero aparecen en la parte
inferior de la matriz.

(b) El primer número diferente de cero (comenzando por la izquierda) en cualquier renglón
cuyos elementos no todos son cero es 1.

(c) Si dos renglones sucesivos tienen elementos distintos de cero, entonces el primer 1 en
el renglón de abajo está más hacia la derecha que el primer 1 en el renglón de arriba.

(d) Cualquier columna que contiene el primer 1 en un renglón tiene ceros en el resto de
sus elementos.

El primer número diferente de cero en un renglón (si lo hay) es llamado pivote para este
renglón.

Si una matriz cumple sólo las condiciones (a),(b) y (c) en la definición 1.4.3 se dice que
está en la forma escalonada por renglones (FER).

Ejemplo 1.6. Consideremos el siguiente par de matrices

1 2 3
 
 
1 0 0 5
A = 0 1 5, B = .
0 0 1 2
0 0 1

22
Vemos que la matriz A se encuentra en la FER, mientras que la matriz B está en la FERR.
También notamos que la matriz A se puede reducir aún más,

1 2 3 R1 → −3R3 + R1 1 2 0 1 0 0
     
0 1 5 R2 → −5R3 + R2 0 1 0 R1 → −2R2 + R1 0 1 0
⇐⇒
0 0 1 ⇐⇒ 0 0 1 0 0 1

Advertimos que la última matriz en el proceso de simplificación de la matriz A está en la


FERR, lo que nos dice esta forma es más refinada que la FER. Vemos además que la FER
no es única.

Ejemplo 1.7. Una fábrica produce tres productos A, B y C. Las ventas por cada unidad de
A, B y C son $1, $2 y $3, respectivamente. Los costos fijos son $19000 por año y los costos
de producción de cada unidad de A, B y C son $4, $5 y $7, respectivamente. El próximo
año, un total 9000 unidades de estos tres productos deben ser producidas y vendidas, y se
destina un total de $20000 para ventas. Si el costo total debe ser $71000, ¿cuántas unidades
de cada producto se deberı́an producir el próximo año?

Solución. Sea x el número de unidades del artı́culo A que se deben producir el próximo
año, y y, z, las respectivas variables que representan el número de unidades del artı́culos B
y C que se deben producir el próximo año.

Se deben producir y vender exactamente 9000 unidades de los productos A, B y C, esto


es,

x + y + z = 9000.

Se tiene un total de $20000 para las venta del próximo año, por lo que

x + 2y + 3z = 20000.

Además, como
costo total=costos fijos + costos de producción,
tenemos que la tercera ecuación es

71000 = 19000 + 4x + 5y + 7z.

Con lo cual formamos el sistema



 x + y + z = 9000
x + 2y + 3z = 20000
4x + 5y + 7z = 52000

23
La matriz aumentada para este sistema es
1 1 1 | 9000
 
1 2 3 | 20000
4 5 7 | 52000
Al aplicar reducción por filas obtenemos
1 1 1 | 9000 R1 → −R1 + R2 1 1 1 | 9000
   
1 2 3 | 20000 R3 → −4R1 + R3 0 1 2 | 11000
4 5 7 | 52000 ⇐⇒ 0 1 3 | 16000
1 1 1 | 9000
 
R3 → −R2 + R3 
0 1 2 | 11000
⇐⇒
0 0 1 | 5000
Observamos que la forma de la última matriz aumentada del sistema se encuentra en la
F.E.R y se puede ver de inmediato que z = 5000. Después se usa la sustitución hacia
atrás para despejar primero y, y luego x. La segunda ecuación queda y + 2z = 11000, de
donde, y = 11000 − 2(5000) = 1000. Ahora reemplazando los valores de y y z en la primera
ecuación obtenemos x + 1000 + 5000 = 9000 o x = 3000. Esta es la solución única para el
sistema. Se escribe el la forma (3000, 1000, 5000). El método de solución que se acaba de
emplear se denomina eliminación Gaussiana.

Ahora podemos llevar la matriz de coeficientes que tenı́amos en un inicio, a la F.E.R.R.


Con el método de eliminación Gaussiana se llego a que
1 1 1 | 9000 1 1 1 | 9000
   
1 2 3 | 20000 ⇐⇒ 0 1 2 | 11000
4 5 7 | 52000 0 0 1 | 5000
Sin embargo, está última expresión para la matriz aumentada del sistema se puede reducir
aun más:
1 1 1 | 9000 R1 → −R3 + R1 1 1 0 | 4000
   
0 1 2 | 11000 R2 → −2R3 + R2 0 1 0 | 1000
0 0 1 | 5000 ⇐⇒ 0 0 1 | 5000

1 1 0 | 4000 1 0 0 | 3000
   
0 1 0 | 1000 R1 → −R2 + R1 0 1 0 | 1000
⇐⇒
0 0 1 | 5000 0 0 1 | 5000
Vemos que la matriz aumentada del sistema está en la F.E.R.R. De inmediato se observa
que x = 3000, y = 1000 y z = 5000. Y de nuevo se encuentra que la solución del sistema es
(3000, 1000, 5000). El método descrito anteriormente se denomina eliminación de Gauss–
Jordan.

24
Por ahora se cuenta con dos métodos para resolver sistemas de ecuaciones

Eliminación Gaussiana

Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la


definición 1.4.2, para llevar una matriz a la F.E.R es llamado Eliminación Gaussiana.

Eliminación de Gauss–Jordan

Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la


definición 1.4.2, para llevar una matriz a la F.E.R.R es llamado Eliminación de Gauss–
Jordan.

1.5. Sistemas de ecuaciones lineales tamaño m × n


Hasta ahora hemos considerado sistemas de ecuaciones con la misma cantidad de incógni-
tas que ecuaciones, como ya mencionamos para el caso de sistemas 2 × 2, existen 5 métodos
de solución, de los cuales sólo dos ellos resultan prácticos en la solución de sistemas 3 × 3:
el método de eliminación y la regla de Krammer. Si pensamos en minimizar la cantidad de
operaciones necesarias para resolver un sistema de ecuaciones, la regla de Krammer queda
descartada, pues en su aplicación es necesario el cálculo de determinantes, lo cual suma
una buena cantidad de operaciones. Además, el hecho que la regla de Krammer implique el
cálculo de determinantes limita su aplicación sólo a sistemas n × n. Siendo ası́, nos queda
el método de eliminación, en realidad tenemos dos métodos eliminación, que definimos en
el sección anterior: Eliminación de Gaussiana y Eliminación de Gauss–Jordan. Los
cuales, permiten encontrar la solución de sistemas m × n, esto es sistemas de la forma


 a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1
 a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2



a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (1.16)


 .
..


am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm

donde los coeficiente aij , ası́ como los términos independientes bj , son elementos de un campo
F , que por lo regular es R o C. El sistema (1.16) puede tener infinitas soluciones reales,
e infinitas soluciones enteras, pero finitas soluciones enteras positivas. Para encontrar las
soluciones enteras positivas de un sistema m × n introduciremos la noción de Ecuación
Diofántica.

25
1.5.1. Ecuaciones Diofánticas
Definición 1.5.1. Una ecuación Diofántica lineal en dos variables tiene la forma

ax + by = c,

donde a, b y c son enteros con ab 6= 0.

El siguiente resultado da información sobre las soluciones de una ecuación Diofántica


lineal

Teorema 1.5.1 (Soluciones de una ecuación Diofántica). La ecuación Diofántica ax+by = c


tiene solución, si y sólo si, d|c donde d = (a, b) . Además, x0 y y0 es una solución particular
de la ecuación, entonces todas las soluciones vienen dadas en la forma
b a
x = x0 + k , y = y0 − k ,
d d
donde k es una entero arbitrario.

Aquı́ (a, b) denota el máximo común divisor entre los enteros a y b y el sı́mbolo d|c
significa que d divide a c.

Ejemplo 1.8. Una señora compró 100 frutas por $5000. Las ciruelas le costaron a $25 cada
una, las manzanas a $150 y las pitayas a $500. ¿Cuántas frutas de cada clase compro?

Solución. Sea x el número de ciruelas, y el número de manzanas, y z la cantidad de pitayas


que compro la señora. Según los datos del problema obtenemos el siguiente sistema

x + y + z = 100
25x + 150y + 500z = 5000
cuya matriz aumentada es

 
1 1 1 | 100
1 6 20 | 200

Ahora reduciremos esta matriz hasta llevarla a la F.E.R.R.


   
1 1 1 | 100 R2 → −R1 + R2 1 1 1 | 100
1 6 20 | 200 ⇐⇒ 0 5 19 | 100

   
1 1 1 | 100 R2 → (1/5)R2 1 1 1 | 100
0 5 19 | 100 ⇐⇒ 0 1 19/5 | 20

26
   
1 1 1 | 100 R1 → −R2 + R1 1 0 −14/5 | 80
0 1 19/5 | 20 ⇐⇒ 0 1 19/5 | 20

Regresando al sistema obtenemos



x − (14/5)z = 80
y + (19/5)z = 20

Vemos que la variable z, relaciona las otras dos variables, nos referimos a dicha variable como
variable de ligamiento. Si asignamos a la variable de ligamiento, el valor de un parámetro
t podemos expresar las variables x, y en términos de dicho parámetro, para obtener

x = 80 + (14/5)t
y = 20 − (19/5)t, t ∈ R

De esta forma encontramos lo que se conoce como forma paramétrica del sistema

 x = 80 + (14/5)t
y = 20 − (19/5)t
z = t, t ∈ R

Notamos inmediatamente que hay una solución por cada valor que toma el parámetro, es
decir, el sistema tiene infinitas soluciones reales. Pero, dado que cada una de las variables
debe ser positiva, tenemos las siguientes restricciones

20 − (19/5)t > 0, t > 0,

esto es, 0 < t < 100/19 = 5 + 5/19. Además, de las expresiones paramétricas para x, y,
advertimos, que para que estas variables representen números enteros, t debe ser un múltiplo
de 5 diferente de 1. Como el único múltiplo de 5 diferente de 1 en el intervalo (0, 100/19),
es 5, la única opción es que t = 5. De donde, la única solución entera positiva del sistema es
x = 94, y = 1 y z = 5.

Ahora utilicemos ecuaciones Diofánticas para hallar las soluciones enteras del sistema.
Despejando el parámetro en la primera ecuación de la forma paramétrica para el sistema
obtenemos
5
t= (80 − x),
14
reemplazando este valor en la segunda ecuación de la forma paramétrica para el sistema nos
da
 
19 5
y = 20 − (x − 80)
5 14

27
o equivalentemente,

19x + 14y = 19(80) + 14(20) = 1800. (1.17)

Tenemos entonces una ecuación Diofántica con a = 19, b = 14 y c = 1800, además, como
(19, 14) = 1|1800, por el Teorema 1.5.1 la ecuación tiene solución, más aún, este mismo
resultado nos asegura que la solución viene dada por
14 19
x = x0 + k , y = y0 − k ,
1 1
donde x0 , y0 es una solución particular de la ecuación, y sea observa de la ecuación (1.17)
que x0 = 80 y y0 = 20. Por lo tanto,

x = 80 + 14k
y = 20 − 19k

Para expresar la variable z como una función de k, nótese que x + y + z = 100, con lo cual,

z = 100 − x − y = 100 − (80 + 14k) − (20 − 19k) = 5k.

Entonces, las soluciones enteras del problema son



 x = 80 + 14k
y = 20 − 19k
z = 5k, k ∈ Z

De lo cual inmediatamente se deduce que el problema tiene infinitas soluciones enteras.


Finalmente, de las restricciones y, z > 0, extraemos la única solución entera positiva del
problema, pues como 0 < k < 20/19, debemos tener que k = 1. De lo cual obtenemos de
nuevo que x = 94, y = 1 y z = 5.

A continuación presentamos la noción de congruencia lineal que nos permitirá hallar


la solución particular de una ecuación Diofántica, además de introducir los enteros módulo
n.

Definición 1.5.2 (congruencia lineal). Sean a y b enteros y n un entero positivo. Si n|(a−b)


decimos que a y b son congruentes módulo n y escribimos

a ≡ b(mod n).

Por ejemplo, 23 ≡ 11(mod 12) y 1 ≡ −1(mod 2). Si n|a, entonces a ≡ 0(mod n) y


recı́procamente. En el siguiente resultado se dan las principales propiedades de la congruencia

módulo n.

28
Teorema 1.5.2. Si a ≡ b(mod n) y c ≡ d(mod n), entonces
(a) a ± c ≡ b ± d(mod n).

(b) ac ≡ bd(mod n).

(c) Para todo entero positivo k, ak ≡ bk (mod n).

(d) Para todo entero r, a + r ≡ b + r(mod n).

(e) Para todo entero r, ar ≡ br(mod n).


a b n
(f) Si r es un divisor común de a, b y n y a ≡ b(mod n), entonces ≡ mod .
r r r
n
Fermat, estudió los números de la forma 22 + 1 para n = 0, 1, 2, . . . llamados números
de Fermat y conjeturó en 1650 que siempre eran primos. La conjetura resulta ser cierta
para los cinco primeros números de Fermat que son 3, 5, 17, 257, 65537, sin embargo, Euler
demostró en 1732 que el sexto número de Fermat no es primo. Demostraremos este hecho
usando congruencias.
5
Ejemplo 1.9. El sexto número de Fermat, 22 + 1, no es primo
Solución. En efecto, puesto que, 216 = 65536 = (102)(641) + 154. Por la de congruencia
lineal tenemos

216 ≡ 154(mod 641).

Ahora, por la propiedad (c) del Teorema 1.5.2

232 ≡ 1542 (mod 641),

pero, 1542 = 23716 = (36)(641) + 640 y en consecuencia

1542 ≡ 640(mod 641).

por lo que por, transitividad debemos tener que

232 ≡ 640(mod 641),

y por la propiedad (d) del Teorema 1.5.2

232 + 1 ≡ 641(mod 641).

Finalmente, como 641 ≡ 0(mod 641), de nuevo por transitividad tenemos que
5
22 + 1 ≡ 0(mod 641),
5 5
lo cual implica que 641|(22 + 1), en efecto, 22 + 1 = (641)(6700417).

29
Además de las propiedades dadas en el teorema 1.5.2la relación ser congruente con es
transitiva, más aún, la relación de congruencia es una relación equivalencia. Recordemos
que

Definición 1.5.3. Sean A y B conjuntos. Una relación de A en B es un subconjunto del


producto cartesiano entre A y B.

Concluimos de la definición anterior que si A un conjunto arbitrario y R es una relación


en A, entonces R ⊆ A × A.

Definición 1.5.4. Sea A un conjunto arbitrario y R es una relación en A; entonces


R es reflexiva si

∀x ∈ A, (x, x) ∈ R.

R es simetrica si

(x, y) ∈ R ⇒ (y, x) ∈ R.

R es antisimetrica si

(x, y) ∈ R y (y, x) ∈ R ⇒ x = y.

R es transitiva si

(x, y) ∈ R y (y, z) ∈ R ⇒ (x, z) ∈ R.

Definición 1.5.5. Una relación en A es llamada relación de equivalencia si es reflexiva


simétrica y transitiva.

Si a y b están relacionados escribimos aRb, o bien (a, b) ∈ R.

Definición 1.5.6. Sean A un conjunto y R una relación de equivalencia en A, para cada


a ∈ A denotamos la clase de equivalencia de a por [a] y la definimos como

[a] = {x ∈ A : (x, a) ∈ R}

La clase de equivalencia de un elemento a ∈ A también suele denotarse por a.

Teorema 1.5.3. Sea R una relación de equivalencia en A. Entonces

aRb ⇔ [a] = [b].

30
Definición 1.5.7 (Conjunto cociente). Sea R una relación de equivalencia en A. El conjunto
de todas las clases de equivalencia es llamado conjunto cociente de A generado por R,
denotamos este conjunto por A/R. Tenemos entonces que

A/R = {[a] : a ∈ A} .

Teorema 1.5.4. La congruencia módulo n es una relación de equivalencia sobre Z.

El hecho que la relación de congruencia sea transitiva es clave para solucionar congruen-
cias lineales, esto encontrar los x tales

x ≡ a(mod n)

Ejemplo 1.10. Un comerciante compró lápices y borradores por $2,490. Si cada lápiz costo
$29 y cada borrador costo $33, ¿cuántos lápices y borradores compro? Sugerencia

Solución. Sea x el número de lápices y y el número de borradores que el comerciante


compró. Tenemos entonces la ecuación Diofántica

29x + 33y = 2490, (1.18)

sujeta a las condiciones x, y > 0. Para hallar la solución general de la ecuación primero
debemos hallar una solución particular. En ocasiones es fácil hallar esta solución si a|c, o b|c.
Por ejemplo, en la ecuación Diofántica

77x + 55y = 28600,

tenemos que a = 77, b = 55 y c = 28600, y observamos que 28600 = 520 · 55, esto es,
55|28600. Por lo tanto, si hacemos que la variable x sea igual a cero, obtenemos para y es
valor 28600/55 = 520. De esta forma vemos que una solución particular de la ecuación es
x0 = 0 y y0 = 520. Con lo cual, por el Teorema 1.5.1 la solución general de la ecuación es

x = 5k, y = 520 − 7k, k ∈ Z

Sin embargo, para la ecuación (1.18) a = 29, b = 33 y, entonces d = (29, 33) = 1 divide a
c = 2490, por lo que la ecuación tiene solución, pero ni a, ni b dividen a c, en consecuencia
al tomar x, o y igual a cero no obtenemos una solución entera. En este caso para encontrar
la solución particular podemos utilizar congruencias lineales. Procedemos como sigue.

Dado que 33y = 2490 − 29x tenemos que 29x ≡ 2490(mod 33). Por el algoritmo de la
división 2490 = 33(75) + 15, entonces 2490 ≡ 15(mod 33). Luego, por la propiedad transitiva
de la congruencia lineal

29x ≡ 15(mod 33)

31
Ahora, −4 ≡ 29(mod 33), entonces por el inciso (e) del Teorema 1.5.2,

−4x ≡ 29x(mod 33)

De nuevo por transitividad tenemos que −4x ≡ 15(mod33), con lo cual, −32x ≡ 120(mod33)
y 120 = 33(3) + 21 de donde 120 ≡ 21(mod 33), por consiguiente,

−32x ≡ 21(mod 33).

Por último, como 1 ≡ −32(mod 33), x ≡ −32x(mod 33), lo cual por transitividad implica
que x ≡ 21(mod 33). Esta última congruencia se satisface si x = x0 = 21, de donde y0 =
2490 − 29 · 21
= 57. En consecuencia, la solución general de la ecuación es
33
x = 21 + 33k, y = 57 − 29k, k ∈ Z.

Como x, y > 0, 21 + 33k > 0 y 57 − 29k > 0, de donde −21/33 < k < 57/29, entonces
k = 0, 1.
Si k = 0 obtenemos x = 21, y = 57.
Si k = 1 obtenemos x = 54, y = 28.

Ejemplo 1.11. Solucionar la congruencia lineal 3x ≡ 15(mod 18)

Solución. Dado que 15 ≡ −3(mod 18), por transitividad tenemos que 3x ≡ −3(mod 18).
Entonces, por la propiedad (f) del Teorema 1.5.2, x ≡ −1(mod 6) y −1 ≡ 5(mod 6), luego
de nuevo por transitivivdad x ≡ 5(mod 6). Por consiguiente, x = 5 + 6k, k ∈ Z.

Ejemplo 1.12. Un hombre cambió un cheque por cierta cantidad de dinero. El cajero equivo-
cadamente intercambio el número de pesos con el número de centavos. Al revisar la cantidad
recibida el hombre observó que tenia el doble de la cantidad por la cual habı́a girado el cheque
más dos centavos. Por que valor fue girado el cheque?

Solución. Sea x la variable que representa el número de pesos, y y la variable que representa
el número de centavos. La cantidad por la cual fue girado el cheque en pesos viene dada por
1
x+ y.
100
Si se intercambian el número de pesos con el número de centavos, la cantidad obtenida en
pesos está dada por
1
y+ x,
100

32
según los datos del problema esta cantidad el igual a el doble de la cantidad por la cual habı́a
girado el cheque más dos centavos, por lo tanto, tenemos la ecuación
 
1 2 1
2 x+ y + =y+ x,
100 100 100
o equivalentemente,

−199x + 98y = 2,

en donde vemos que a = −199, b = 98 y c = 2, además, d = (−199, 98) = 1 y 1|2, por


lo que la ecuación Diofántica tiene solución, puesto que esta es equivalente a la ecuación
98y − 2 = 199y, podemos hallar una solución particular al resolver la congruencia lineal

98y ≡ 2(mod 199).

Multiplicando la anterior congruencia por 2, obtenemos

196y ≡ 4(mod 199).

Ahora, −3 ≡ 196(mod 199), entonces −3y ≡ 196y(mod 199). Con lo cual por transitividad

−3y ≡ 4(mod 199).

Multiplicando esta última congruencia por 66 nos da

−198y ≡ 264(mod 199).

Pero 1 ≡ −198(mod 199), entonces y ≡ −198y(mod 199), por consiguiente por transitividad

y ≡ 264(mod 199).

Finalmente, como 264 ≡ 65(mod 199), tenemos que y ≡ 65(mod 199), de lo cual deducimos
que

y = 199k + 65, k ∈ Z.

98(65) − 2
Si k = 0, obtenemos y = y0 = 65, de donde x0 = = 32. Por lo tanto, la solución
199
general de la ecuación es

x = 32 − 98k, y = 199k + 65, k ∈ Z,

donde x, y > 0, en consecuencia,


65 32
1− < − <k< < 1,
199 98
de lo cual, k = 0, de donde x = 32, y y = 65. Luego el cheque se giró por $32, 65.

33
Según el Teorema 1.5.4 la relación aRb ⇔ a ≡ b(mod n) define una relación de equiva-
lencia en Z. Entonces la clase de equivalencia a de un elemento a ∈ Z está dada por

a = {x ∈ Z : x ≡ a(mod n)}
= {x ∈ Z : x = a + kn, para algún z ∈ Z} .

El conjunto cociente generado por esta relación es denotado por Zn . Ahora, si a es un entero
arbitrario como n > 0, por el algoritmo de la división podemos representarlo en la forma
a = qn + r con 0 ≤ r < n, luego a ≡ r(mod n) y en consecuencia por el Teorema 1.5.3, a = r.
Por ejemplo, en Z4 tenemos que

4 ≡ 0(mod 4) ⇒ 4 = 0
5 ≡ 1(mod 4) ⇒ 5 = 1
6 ≡ 2(mod 4) ⇒ 6 = 2
7 ≡ 3(mod 4) ⇒ 7 = 3
8 ≡ 0(mod 4) ⇒ 8 = 0

Por lo tanto, Z4 sólo puede estar conformado por 4 clases:



Z4 = 0, 1, 2, 3 .

En general, dado que n ≡ 0(mod n) tenemos que n = 0, en consecuencia,



Zn = 0, 1, . . . , n − 1 ,

llamamos a este conjunto enteros módulo n. Sobre Zn podemos definir una adición una
multiplicación mediante las siguientes fórmulas

x + y = x + y,
x · y = xy.

Los enteros módulo n con la suma ası́ definida cumplen las propiedades de campo de la
definición 1.1.1.

Teorema 1.5.5. La adición en Zn tiene las siguientes propiedades

Axiomas de cerradura

(a) x, y ∈ Zn , entonces x + y ∈ Zn .

(b) x, y ∈ Zn , entonces x · y ∈ Zn .

34
La suma en Zn es conmutativa, asociativa, modulativa y cada elemento en este conjunto
tiene un inverso aditivo.

(c) x + y = y + x,

(d) x + (y + z) = (x + y) + z.

(d) Para todo x ∈ Zn existe e ∈ Zn tal que x + e = x

(e) Para todo x ∈ Zn existe y ∈ Zn tal que x + y = e.

Demostración. Sean x, y ∈ Zn . Si x+y < n, entonces x+y = x + y ∈ Zn . Ahora si x+y ≥ n,


por el algoritmo de la división existen enteros q y r tales que x + y = nq + r donde 0 ≤ r < n,
entonces x + y ≡ r(mod n), en consecuencia, por el Teorema 1.5.3 tenemos que x + y = r.
Por lo tanto, x + y = x + y = r ∈ Zn . De la misma forma demostramos la cerradura de la
multiplicación. Demostremos la conmutatividad. Sean x, y ∈ Zn

x+y =x+y
=y+x
= y + x.

Nótese que como x + y = y + x, entonces x + y = y + x. De forma análoga demostramos la


asociatividad.

Sea e := 0, entonces e ∈ Zn y para todo x ∈ Zn tenemos que

x+0 =x+0= x

De esta forma vemos que 0 es el elemento neutro para suma en Zn .

Para cada x ∈ Zn sea y := n − x, entonces como n − x < n, y ∈ Zn y

x+n−x= x+n−x =n= 0

La demostración del inciso (a) en el teorema anterior nos indica como construir las tablas
de suma y la multiplicación en Zn .

Ejemplo 1.13. Construir las tablas de adición y multiplicación para Z4

Solución. Por lo hecho en la demostración del inciso (a) del Teorema 1.5.5 tenemos que

35
+ 0 1 2 3 · 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1

Por comodidad hemos omitido las barras. Se observa de la tabla de la multiplicación que
hay simetrı́a respecto a la diagonal principal, esto quiere decir que la multiplicación en Z4 es
conmutativa, además se advierte que el elemento neutro de la multiplicación es 1 y podemos
comprobar que dicha multiplicación es además asociativa. Finalmente notamos que

2 · 0 = 0, 2 · 1 = 2, 2 · 2 = 0 y 2 · 3 = 2,

es decir, no existe ningún elemento en Z4 que multiplicado por 2 nos de 1, esto es, el 2 no
tiene inverso multiplicativo, lo cual implica que Z4 no es campo. Esto a su vez implica que
ecuaciones tan simples como 2x + 1 = 2, no tengan solución en Z4 .

Como vimos en el ejemplo 1.13, Zn no es campo, sin embargo la multiplicación es con-


mutativa, asociativa, módulativa y distributiva.

Teorema 1.5.6. La multiplicación en Zn tiene las siguientes propiedades

(c) x · y = y · x,

(d) x · (y · z) = (x · y) · z.

(d) x · (y + z) = x · y + x · z

(e) Para todo x ∈ Zn existe 1 ∈ Zn tal que x · 1 = 1.

A continuación demostraremos que si n es un número primo Zn es un campo. Para la


demostración es necesario el siguiente resultado.

Teorema 1.5.7 (Identidad de Bézout). Sean a y b enteros no nulos cuyo máximo común
divisor es d, entonces existen enteros x, y tales que

ax + by = d (1.19)

EL recı́proco del teorema anterior se tiene si d = 1, esto es,

Teorema 1.5.8. Sean a y b enteros no nulos. Entonces

36
(a, b) = 1 si y sólo si existen enteros x, y tales que ax + by = 1.
Los números x e y de la identidad (1.19), llamada identidad de Bézout, pueden determi-
narse mediante el algoritmo extendido de Euclides. Este constituye otro método para
encontrar una solución particular de una ecuación Diofántica.
Teorema 1.5.9 (Zp es un campo). Si n es un número primo, entonces Zn es un campo.
Demostración. Supongamos que n es un número primo. Sea m ∈ Zn con m 6= 0, entonces
0 < m < n. Como m y n son primos relativos, es decir, (m, n) = 1, por el Teorema de Bezút
existen enteros x, y tales que
mx + ny = 1.
Por lo tanto tenemos
mx + ny = 1.
Pero,
mx + ny = mx + ny
=m·x+n·y
Como n = 0 nos queda que
m · x = 1.
Es decir, x es el inverso multiplicativo de m. De este último hecho y los Teoremas 1.5.5 y
1.5.6 concluimos que Zn es un campo si n es un número primo.

1.6. Matrices
1.6.1. Sumatorias
Definición 1.6.1 (Sucesión). Sea X un conjunto no vacı́o, una sucesión en X es una fun-
ción definida en el conjunto los naturales que toma valores en el conjunto X. En sı́mbolos
escribimos
an : N → X.
Se acostumbra utilizar la notación
(an ) = {a1 , a2 , . . .} .
A partir de la sucesión (an ) creamos otra sucesión, llamada sucesión de sumas parciales
denotada por (Sn ) y definida como
Sn = a1 + a2 + · · · + an .

37
Para expresar de manera más cómoda la sucesión (Sn ) introducimos la notación sigma
P
. Con esta notación podemos expresar la sucesión Sn como sigue
n
X
Sn = ai ,
i=1

que se lee, sumatoria desde i = 1 hasta i = n. A continuación estableceremos las propiedades


fundamentales de la sumatoria.

Teorema 1.6.1 (Propiedades de la sumatoria). Sean (ai ), (bi ) sucesiones en R. Entonces


n
X n
X n
X
(a) (ai + bi ) = ai + bi . (propiedad aditiva)
i=1 i=1 i=1
Xn n
X
(b) cai = c ai . (propiedad homogénea)
i=1 i=1
Xn n−1
X
(c) ai−1 = ai .
i=1 i=0
n
X
(d) (ai − ai−1 ) = an − a0 . (propiedad telescópica)
i=1
n
X 1 − xn+1
(e) xi = x 6= 1. (sumas parciales de la serie geométrica)
i=0
1−x

Demostración. Los ı́tems (a), (b) y (c) se siguen de la definición de sumatoria. Establezcamos
la propiedad telescópica. De las propiedades (a) y (c)
n
X n
X n
X
(ai − ai−1 ) = ai − ai−1
i=1 i=1 i=1
n−1
X n
X
= an + ai − a0 − ai−1
i=1 i=2
n−1
X n−1
X
= an + ai − a0 − ai
i=1 i=1

= an − a0 .

38
Demostremos ahora el ı́tem (d). Por la propiedad (b) y la propiedad telescópica tenemos que
n
X n
X
(1 − x) xi = (1 − x)xi
i=0 i=0
n n
ai :=xi
X X
i i+1
= (x − x ) = (ai − ai+1 )
i=0 i=0

= a0 − an+1
= 1 − xn+1 .

Como x 6= 1, vemos la propiedad (d) se sigue.

Las propiedades (a) y (b) del teorema 1.6.1 se denominan propiedades de linealidad.
Con las propiedades de linealidad junto con la propiedad telescópica, podemos calcular las
siguientes sumas parciales.

Teorema 1.6.2. Para entero n ≥ 1, se cumple que


n
X n(n + 1)
(a) i=
i=1
2
n
X n(n + 1)(2n + 1)
(b) i2 =
i=1
6
n  2
X
3 n(n + 1)
(c) i =
i=1
2

Demostración. Demostraremos sólo la parte (a), las partes (b) y (c) se dejan como ejercicios.
Xn
Nótese que, 2i − 1 = i2 − (i − 1)2 , y que 1 = n. Por lo tanto, por las propiedades
i=1
de linealidad de la sumatoria (propiedades (a) y (b)) en el teorema 1.6.1 y la propiedad
telescópica tenemos que
n
X n
X n
X
2 i−n= 2i − 1
i=1 i=1 i=1
n
X
= (2i − 1)
i=1
n n
2 X
2 ai :=i
X 2 
= i − (i − 1) = (ai − ai−1 )
i=1 i=1
2
= an − a0 = n .

39
n
X
Entonces, 2 i − n = n2 , de donde
i=1

n
X n2 + n n(n + 1)
i= = .
i=1
2 2

El teorema anterior también puede ser demostrado utilizando el principio de inducción


matemática (P.I.M)

Teorema 1.6.3 (Principio de inducción matemática). Sea S un subconjunto de los naturales


que tiene las dos propiedades siguientes

(a) 1 ∈ S.

(b) Si k ∈ S, también k + 1 ∈ S.

Entonces S = N.

Demostremos usando el principio de inducción matemática el ı́tem (a) del teorema 1.6.2.

Nótese que

1 + 3 = 4 = 22 , 1 + 3 + 5 = 9 = 32 , 1 + 3 + 5 + 7 = 16 = 42 .

Si seguimos este patrón vemos que

1 + 3 + 5 + · · · 2n − 1 = n2 . (1.20)

Definamos S = {n ∈ N : 1 + 3 + 5 + · · · 2n − 1 = n2 }. Nótese que 1 ∈ S, ya que 1 = 12 .


Ahora supongamos k ∈ S (hipótesis de inducción), esto es,

1 + 3 + 5 + · · · 2k − 1 = k 2 . (1.21)

El k-ésimo impar es de la forma 2k −1, entonces k +1-ésimo impar es de la forma 2(k +1)−1.
Sumando este término en ambos lados de (1.21) obtenemos

1 + 3 + 5 + · · · 2k − 1 + 2(k + 1) − 1 = k 2 + 2(k + 1) − 1.

Como k 2 + 2(k + 1) − 1 = k 2 + 2k + 1 = (k + 1)2 , demostramos que k + 1 ∈ S. Entonces por


el Teorema 1.6.3 (principio de inducción matemática) S = N. Esto es, (1.20) se cumple para
todo número natural n.

40
Por lo tanto, por las propiedades de linealidad de la sumatoria

n2 = 1 + 3 + · · · 2n − 1
Xn
= (2i − 1)
i=1
X n n
X
=2 i− 1
i=1 i=1
n
X
=2 i − n.
i=1

De donde finalmente obtenemos que


n
X 1 n(n + 1)
i = (n2 + n) = .
i=1
2 2

Álgebra de matrices
Como ya dijimos una matriz es un arreglo rectangular de números dispuestos en m filas
y n columnas
 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
A= . (1.22)
 
.. .. 
 .. . . 
am1 am2 · · · amn
Para simplificar el manejo de las matrices usamos la notación A = [aij ]m×n , o simple-
mente, A = [aij ] para denotar una matriz tı́pica del conjunto Mm×n (R).

Definición 1.6.2 (Igualdad de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A = B si y sólo si aij = bij para todo 1 ≤ i ≤ m, y todo 1 ≤ j ≤ n. Es decir, dos
matrices son iguales si y sólo si son iguales componente a componente.

1.6.2. Suma y multiplicación por escalar de matrices


De la misma forma en la que se definió la igualdad matricial definimos la suma y la
multiplicación por escalar de matrices, esto es, en términos de las componentes.

Definición 1.6.3 (Suma de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A + B = C donde C = [cij ] y cij = aij + bij .

41
Definición 1.6.4 (Multiplicación por escalar). Sean A ∈ Mm×n (R) y k ∈ R. Definimos la
multiplicación por escalar entre el escalar k y la matriz A como kA = C donde C = [cij ] y
cij = kaij .
A continuación estableceremos las propiedades del la suma y la multiplicación por escalar
de matrices.
Teorema 1.6.4 (Propiedades de la suma matricial). Sean A, B, C ∈ Mm×n (R), con A =
[aij ], B = [bij ] y C = [cij ], α, β escalares. Entonces
(a) A + B = B + A.

(b) A + (B + C) = (A + B) + C.

(c) Existe la matriz E = 0m×n con E = [eij ] y eij = 0 para todo i y todo j tal que
A + 0m×n = A.

(d) Para toda matriz A existe −A = [−aij ] tal que A + (−A) = 0m×n .

(e) α(A + B) = αA + αB

(f) (α + β)A = αA + βA

1.6.3. Producto matricial


Una matriz de tamaño n × 1 es llamada vector fila, que escribimos en la forma
 
x1 x2 · · · xn

Una matriz de tamaño 1 × n es llamada vector columna, que escribimos en la forma


 
x1
 x2 
 
 .. 
.
xn
Definición 1.6.5 (Producto escalar). Sean
   
x1 y1
 x2   y2 
A= .  yB=.
   
..  .. 
xn yn
dos vectores. Entonces el producto escalar entre A y B denotado por A · B, está dado por

A · B = x1 y1 + x2 y2 + · · · + xn yn .

42
De la definición de producto escalar se deducen las siguientes propiedades
Teorema 1.6.5 (Propiedades del producto escalar). Sean A, B y C tres vectores y α, β
escalares. Entonces
(a) A · 0 = 0.

(b) A · B = B · A.

(c) A · (B + C) = A · B + A · C.

(d) (αA) · B = α(A · B) = A · (αB).


Definimos el producto punto también entre dos vectores fila
   
A = x1 x2 · · · xn y B = y1 y2 · · · yn
   
A · B = x1 x2 · · · xn · y1 y2 · · · yn = x1 y1 + x2 y2 + · · · + xn yn .
Con frecuencia se tomará el producto escalar de un vector fila y un vector columna.

 
y1
   y2 

A · B = x1 x2 · · · xn ·  ..  = x1 y1 + x2 y2 + · · · + xn yn .

.
yn
Definición 1.6.6 (Producto matricial). Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) con A = [aij ]m×n
y B = [bij ]n×p . Entonces AB = C donde C = [cij ] y
cij = [fila i de A] · [columna j de B]
Es decir,
n
    X
cij = ai1 ai2 · · · ain · a1j a2j · · · anj = aik bkj .
k=1

Como primera consecuencia de la definición del producto matricial es que dicho producto
no es conmutativo.
Ejemplo 1.14. En ∈ M2×2 (R) consideremos
   
1 0 0 0
A= , A=
1 1 0 2
Entonces
   
0 0 0 0
AB = , BA =
0 2 2 2
Como AB 6= BA, vemos que el producto de matrices no es conmutativo

43
Se puede demostrar que el producto matricial si es asociativo y distributivo
Teorema 1.6.6 (Propiedades del producto matricial). Si todas las sumas y productos están
bien definidos, entonces

(a) A(BC) = (AB)C (Ley asociativa)


(b) A(B + C) = AB + AC, (A + B)C = AC + BC (Leyes distributivas)
(c) (αA)B = α(AB) = A(αB) y (αA)(βB) = αβ(AB), α, β ∈ R.

El espacio Mm×n (R)

Cuando m = n tenemos el espacio de las matrices cuadradas, en el existe un elemento


neutro para la multiplicación llamado matriz identidad, que se denota por In×n , o simple-
mente por I y define como I = [δij ] donde
(
1, si i = j,
δij =
0, si i 6= j,
El escalar δij es llamado delta de Kronecker. Si aplicamos la definición de matrices para
el producto AI = C, donde A = [aij ]n×n y C = [cij ]n×n obtenemos
n
X
cij = aik δkj .
k=1

Pero por definición del delta de Kronecker cij = aij , de modo que AI = A. De manera similar
tenemos que IA = A. Hemos demostrado que
Teorema 1.6.7. Sea A una matriz cuadrada de n × n. Entonces

AI = IA = A.

En todo campo F para cada elemento a 6= 0 existe b ∈ F tal que ab = 1. Esto ya no se


cumple en el espacio Mm×n (R), pues por ejemplo,
   
1 1 0 0
A := 6=
0 0 0 0
Sin embargo, no existe una matriz B tal que AB = BA = I2×2 . No basta entonces con que
la matriz sea distinta de la matriz cero, se debe pedir además, como veremos en el capı́tulo
2, que det A 6= 0. Llamamos a este tipo de matrices, matrices invertibles
Definición 1.6.7. Una matriz A ∈ Mn×n (R) es invertible si existe B ∈ Mn×n (R)

AB = BA = I

En este caso escribimos B = A−1 .

44
Teorema 1.6.8. Sean A, B ∈ Mn×n (R). Entonces AB es invertible y

(AB)−1 = B −1 A−1

Potenciación de matrices
Sea A ∈ Mn×n (R). Definimos A0 = I y An = An−1 A.

En los números reales si an = 0, se tiene que a = 0. Veámos que en las matrices este
hecho en general no se cumple.

Ejemplo 1.15. Hallar todas las matrices A ∈ Mn×n (R) tales que A2 = 0.

Solución. Sea
 
a b
A= ,
c d

Como A2 = 0, det A det A = det(A2 ) = 0, entonces det A = 0, esto es, ad − bc = 0.


 2   
2 2 a + bc ab + bd 0 0
A =0⇔A = =
ac + cd d2 + bc 0 0

Por lo tanto, de esta ecuación matricial obtenemos 4 ecuaciones escalares que junto con la
ecuación ad − bc = 0, conforman el sistema

a2 + bc = 0 (1.23)
ab + bd = 0 (1.24)
ac + cd = 0 (1.25)
d2 + bc = 0 (1.26)
ad − bc = 0 (1.27)

Igualando las ecuaciones (1.23) y (1.26) obtenemos que a2 = d2 , de donde a = ±d. Si a = d,


de la ecuación (1.27) tenemos que a2 − bc = 0, sumando esta última ecuación con la ecuación
(1.23) nos da 2a2 = 0, de donde a = 0. Por lo tanto, bc = 0. Luego, la opción a = d genera
matrices de la forma
   
0 b 0 0
, b 6= 0 y , c 6= 0
0 0 c 0

Por ejemplo,
 
0 1
A= 6 0, y A2 = 0.
=
0 0

45
Ahora si a = −d, entonces a+d = 0, y las ecuaciones (1.24) y (1.25) no dan información pero
tampoco contradicción y las ecuaciones (1.23), (1.26) y (1.27) se vuelven la misma ecuación:
a2 + bc = 0. Por lo tanto, en este caso obtenemos matrices de la forma
 
a b
,
c −a

donde a, b y c satisfacen la ecuación a2 + bc = 0. Se observa que si a = 0, entonces bc = 0,


de modo que este caso también abarca el caso anterior. Concluimos que la todas la matrices
tales que A2 = 0 son de la forma
 
a b
,
c −a

con a2 + bc = 0.

Ejemplo 1.16. Sea A ∈ Mn×n (R) y α ∈ R. Usar inducción matemática para establecer que
(αA)n = αn An .

Solución. Supongamos que

(αA)n = αn An ∀n ∈ N (1.28)

Para n = 1, (αA)1 = α1 A1 , esto es, (1.28) se tiene para n = 1. Supongamos que (1.28) se
tiene para n = k, es decir

(αA)k = αk Ak ∀k ∈ N (Hipótesis de inducción)

Entonces

(αA)k+1 = (αA)(αA)k
= (αA)(αk Ak ) (Hipótesis de inducción)
= (αk α)(AAk ) (Teorema 1.6.6 inciso (c))
k+1 k+1
=α A

Por consiguiente, (1.28) se cumple para n = k + 1. Luego por el (PIM) tenemos la validez
de (1.28).
 
1 0
Ejemplo 1.17. Sea A = . Comprobar que A2 = 2A − I y calcular A100
−1 1
Solución. Por calculo directo tenemos
    
2 1 0 1 0 1 0
A = =
−1 1 −1 1 −2 1

46
Por otro lado,
     
2 0 1 0 1 0
2A − I = − =
−2 2 0 1 −2 1

Con lo cual comprobamos que A2 = 2A − I. Entonces por la propiedad distributiva del


producto matricial, las propiedades (e) y (f) del Teorema 1.6.4 y el Ejemplo 1.16 tenemos

A4 = A2 A2 = (2A − I)(2A − I)
= (2A − I)(2A) − (2A − I)(I)
= (2A)2 − 2A − 2A + I
= 4A2 − 4A + I
= 4(2A − I) − 4A + I
= 8A − 4I − 4A + I
= 4A − 3I.

Siguiendo el patrón vemos que

A2n = 2nA − (2n − 1)I.

Por lo tanto, si n = 50, obtenemos

A100 = 100A − 99I.


   
100 0 −99 0
= +
−100 100 0 −99
 
1 0
= .
−100 1

Ejemplo 1.18. Sean A, B ∈ Mn×n (R). Entonces


(a) Si A, B son matrices triangulares, o estrictamente triangulares, A + B es una matriz
triangular, o estrictamente triangular.

(b) Si A, B son matrices triangulares, o estrictamente triangulares, AB es una matriz


triangular, o estrictamente triangular.
Solución. En el caso de la suma, es suficiente demostrar el caso en que A y B sean matrices
triangulares superiores. Sean A = [aij ] y B = [bij ] matrices triangulares superiores, esto es
aij = 0 y bij = 0 si i > j. Tenemos que C = [cij ], donde

cij = aij + bij ,

47
entonces cij = 0 + 0 = 0 si i > j, esto es, C es una matriz triangular superior. Ahora para
el producto tenemos que
n
X
cij = aik bkj .
k=1

Supongamos que i > j, entonces existe p ∈ N tal que i = j + p, donde p = 1, 2, . . . , n − j. Y


tenemos dos casos: k ≤ j, o k > j. Si k ≤ j, entonces k ≤ j < j + p = i, esto es, k < i, con
lo cual aik = 0, y por lo tanto cij = 0. Ahora si k > j, entonces bkj = 0, y de nuevo cij = 0.
Es decir C es triangular superior.

Ahora, supongamos que A y B son matrices estrictamente triangulares superiores, esto


es aij = 0 y bij = 0 si i ≥ j. Si i > j, estamos en el caso anterior y cij = 0. Y si i = j tenemos
que
n
X
cii = aik bki ,
k=1

si i 6= k, entonces i > k, i < k, con lo cual respectivamente tenemos que aik = 0, o bki = 0.
En ambos casos cii = 0. Alternativamente, si i = k, aik = 0, bki = 0, y de nuevo cii = 0. En
consecuencia, la matriz C es estrictamente triangular superior.
Se puede ahora utilizar inducción matemática para demostrar que
Corolario 1.6.9. La suma y el producto de n matrices estrictamente triangulares superiores,
es una matriz estrictamente triangular superior.

1.6.4. Tipos de matrices


1.6.5. Inversa de una matriz cuadrada
1.6.6. Matrices elementales y inversas

1.7. Problemas

Sección 1.1. Campos


Problema 1.7.1 (Dificultad 3). Suponga que k un entero positivo que no es un cuadrado
perfecto. Demostrar que
n √ o
F := x + ky : x, y ∈ Q

es un campo. Sugerencia: Recuerde que k es un número irracional si k no es un cuadrado
perfecto

48
Problema 1.7.2. Las fórmulas de adicción y producto en Z2 están dadas por las siguientes
tablas.

+ 0 1 · 0 1
0 0 1 0 0 0
1 1 0 1 0 1

Verifique que F , junto con estas dos operaciones es un campo.

Problema 1.7.3 (Dificultad 2). En Z7 resolver las ecuaciones 3x + 4 = 1 y x2 + 2x + 6 = 0.

Problema 1.7.4. Muestre que la ecuación 2x + 1 = 2 no tiene solución en Z4 . Concluya


que Z4 no es un campo.

Problema 1.7.5 (Dificultad 2). Verifique que el conjunto de los números racionales con las
operaciones usuales de suma y producto de complejos es un campo.

Problemas que se resuelven por ecuaciones de primer


grado con una incógnita
Problema 1.7.6. Un capataz contrata un obrero ofreciéndole un sueldo anual de 3000 sucres
y una sortija. Al cabo de de 7 meses el obrero es despedido y recibe 1500 sucres y la sortija.
¿Cuál era el valor de la sortija?

Problema 1.7.7. Un conejo es perseguido por un perro. El conejo lleva una ventaja inicial
de 50 de sus saltos al perro. El conejo de 5 saltos mientras el perro da 2, pero el perro en
3 saltos avanza tanto como el conejo en 8 saltos. ¿Cuántos saltos debe dar el perro para
alcanzar la conejo?

Problema 1.7.8. Un profesor asigna 3 ejercicios. Pide a 1/4 del número de estudiantes que
está en clase que resuelva el primer ejercicio, a 3/8 el segundo y a 5/16 el tercero. Del total
de alumnos dos están ausentes. ¿Cuál es la cantidad total de alumnos?

Problemas que se resuelven por ecuaciones no lineales


Problema 1.7.9. Un joven estudiante gasta diariamente $3200 en transporte y $6400 en
el almuerzo. Para cubrir estos gastos compra bolsas de 12 paquetes de papas fritas a $8800
cada una, con el fin de vender paquetes sueltos a $1000. ¿Cuál es el mı́nimo de paquetes que
debe vender diariamente para cubrir sus gastos?

49
Problema 1.7.10. Un recipiente contiene 5000L de agua pura. Una salmuera que contiene
30g de sal por litro de agua es bombeada al recipiente a razón de 25L/min. Hallar la con-
centración de sal después de t minutos(en gramos por litro). ¿Qué sucede cuando t tiende a
infinito?

Sección 1.3. Sistemas de ecuaciones lineales de tamaño


2×2
Problema 1.7.11. (Ver, [3, pag. 7, Problema 37]). Una tienda de helados vende sólo helados
con soda y malteadas. Se pone una 1 onza de jarabe y cuatro onzas de helado en un helado
con soda, y 1 onza de jarabe y 3 onzas de helado en una malteada. Si la tienda usa 4 galones
de helado 5 cuartos de jarabe en un dı́a, ¿cuántos helados con soda y cuántas malteadas
vende? Sugerencia: 1 cuarto =32 onzas; 1 galón=128 onzas.

Problema 1.7.12. (Ver, [3, pag. 27, Problema 38]). Un viajero que acaba de regresar de
Europa gastó $30 diarios en Inglaterra, $20 diarios en Francia y $20 diarios en España por
concepto de hospedaje. En comida gasto $20 diarios en en Inglaterra, $30 diarios en Francia
y $20 en España. Sus gastos adicionales fueron $10 en cada paı́s. Los registros del viajero
indican un gasto total de $340 en hospedaje, $320 en comida y $140 en gastos adicionales
durante su viaje por estos tres paı́ses. Calcule el número de dı́as que pasó el viajero en cada
paı́s o muestre que los registros deben estar incorrectos debido a que las cantidades gastadas
no son compatibles una con la otra.

Problema 1.7.13. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.

Problema 1.7.14. (Ver, [3, pag. 27, Problema 40]). Una gente secreto sabe que 60 equipos
aéreos, que consisten en aviones de combate y bombarderos, están estacionados en cierto
campo aéreo secreto. El agente quiere determinar cuántos de los 60 equipos son aviones de
combate y cuántos son bombarderos. Existe un tipo de cohete que llevan ambos aviones; el
de combate lleva 6 de ellos y el bombardero sólo 2. El agente averigua que se requieren 250
cohetes para armar todos los aviones del campo aéreo. Aún más, escucha que se tiene el

50
doble de aviones de combate que bombarderos en al base. Calcule el número de aviones de
combate y bombarderos en el campo aéreo o muestre que la información del agente debe ser
incorrecta ya que es inconsistente.

Sección 1.5. Sistemas de ecuaciones lineales de tamaño


m×n
Problema 1.7.15. Analizar si el siguiente sistema es consistente o inconsistente. Si es
consistente dar la forma que tienen las soluciones.

 w + x − y − 6z = −4
2w + 3x + 2y + 12z = 12
2w + x + 2y + 4z = 4

Problema 1.7.16. Considere el sistema



 2x + 3y − z = a
x − y + 3z = b
3x + 7y − 5z = c

Encuentre las condiciones de a, b y c para que el sistema sea inconsistente.

Subsección 1.5.1. Ecuaciones Diofánticas


Problema 1.7.17. La entrada a cierto museo vale $900 para adultos y $375 para niños.
Cierto dı́a en que asistieron más adultos que niños se recaudaron $45000. ¿Cuántos adultos
y cuantos niños asistieron al museo?

Problema 1.7.18. Una caja contiene un total de 13 monedas distintas de 1, 5 y 10 centavos,


cuyo valor total es de 83 centavos. ¿Cuántas monedas de cada denominación hay?

Sección 1.6. Matrices


 
a −b
Problema 1.7.19 (**). Muestre que el conjunto de todas las matrices de la forma ,
b a
siendo a y b números reales en un campo.
 
n cos θ − sen θ
Problema 1.7.20 (**). Determinar A , si A := .
sen θ cos θ

51
Problema 1.7.21 (**). En los números reales, la ecuación a2 = 1, tiene dos soluciones,
a = ±1. Esto no se cumple para las matrices. Muestre que la ecuación A2 = I se satisface
para cada una de las matrices
     
1 0 1 0 1 b
, , ,
0 1 c 1 0 1

donde b y c son números reales arbitrarios. Hallar todas las matrices A ∈ M2×2 (R) tales que
A2 = I.
   
1 1 2 1 2
Problema 1.7.22 (**). Sea A = . Comprobar que A = y calcular An .
0 1 0 1

1 1 1 1 2 3
   

Problema 1.7.23 (**). Sea A = 0  1 1. Comprobar que A2 = 0 1 2. Inducir una
0 0 1 0 0 1
forma general para An y demostrarla por inducción.

Problema 1.7.24 (**). Hallar todas las matrices A ∈ M2×2 (R), tales que A2 = 0.

Problema 1.7.25. Sea A ∈ Mn×n (R) estrictamente triangular superior (es decir todas entra-
das en la diagonal y abajo de ella son cero). Demuestre que si A es una matriz estrictamente
triangular superior, entonces An es estrictamente triangular superior.

Problema 1.7.26. Sean A, B ∈ Mn×n (R). Entonces

(a) (A−1 )−1 = A si la matriz A es invertible.

(b) (AB)−1 = B −1 A−1 si A y B son matrices invertibles.

Problema 1.7.27 (***). Sea A una matriz estrictamente triangular superior. Demuestre
que I − A es invertible y exprese la matriz inversa de A en función de A.

52
Capı́tulo 2

Determinantes

2.1. Definición de determinante de una matriz


 
a11 a12
Sea A = . Se define el determinante de A por
a21 a22

det A = a11 a22 − a12 a21 .

Con frecuencia se denotará det A por



a11 a12
|A| o .
a21 a22
Definición 2.1.1 (Menor de una matriz). Sea A ∈ Mn×n (R) y sea Mij la matriz de tamaño
(n − 1) × (n − 1) obtenida a partir de A al eliminar la fila i y la columna j. Mij se llama
menor ij de A.
Definición 2.1.2 (Cofactor de una matriz). Sea A ∈ Mn×n (R). El cofactor ij de A,
denotado por Aij , está dado por

Aij = (−1)i+j |Mij |.

Nótese que definición anterior tiene sentido por que ya se definió el determinante para
una matriz 2 × 2.
Definición 2.1.3 (Determinante de una matriz). Sea A ∈ Mn×n (R). Entonces el determi-
nante de A, denotado por det A o |A|, está dado por
n
X
det A = |A| = a11 A11 + a12 A12 + · · · + an1 An1 = a1k A1k . (2.1)
k=1

La expresión en lado derecho de (2.1) se llama desarrollo por cofactores o expansión por
cofactores a través de la primera fila de A.

53
Definición 2.1.4 (Matriz triangular y diagonal). Una matriz cuadrada se dice triangular
superior si todos sus componentes abajo de la diagonal son cero. Se dice estrictamente
triangular superior si todas sus entradas en la diagonal y abajo de ella son cero. Es una
matriz triangular inferior si todos sus componentes arriba de la diagonal son cero. Se
dice estrictamente triangular superior si todas sus entradas en la diagonal y arriba de
ella son cero. Es una matriz diagonal si todos los elementos que no están en la diagonal
cero.

Teorema 2.1.1 (Determinante de una matriz triangular). Sea A ∈ Mn×n (R) una matriz
triangular. Entonces

det A = a11 a22 · · · ann .

2.2. Interpretación geométrica del determinante de ta-


maño 2 × 2
 
a b
Sea A = . En la figura
c d

y
C(a + b, c + d)
b

Q
b

B(b, d) b P b A(a, c)

x
R O

Figura 2.1: Interpretación geométrica del determinante 2 × 2

2.3. Propiedades de los determinantes


Teorema 2.3.1 (Determinante de un producto). Sean A, B ∈ Mn×n (R). Entonces

det(AB) = det A det B.

54
Teorema 2.3.2 (Teorema fundamental de los determinantes). Sea A = (aij )n×n . Entonces
n
X
det A = aik Aik
k=1

para todo i = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier fila de la matriz A. Más aún,
n
X
det A = akj Akj
k=1

para todo j = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier columna de la matriz A.

El Teorema 2.3.2 le da sentido a la definición 2.1.3 y tiene las siguientes consecuencias

Corolario 2.3.3. Sea A ∈ Mn×n (R)

(a) det A = det At .

(b) A es una matriz invertible si y sólo si det A 6= 0 y det A−1 = 1/ det A.

(c) Si la matriz A tiene una fila o columna de ceros, entonces det A = 0.

Además tenemos las siguientes propiedades

Teorema 2.3.4 (Propiedad 1). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al multiplicar su fila i o su columna j por un escalar c, entonces

det B = c det A.

Teorema 2.3.5 (Propiedad 2). Sean


   
a11 a12 · · · a1j · · · a1n a11 a12 · · · α1j · · · a1n
a a · · · a2j · · · a2n   a21 a12 · · · α2j · · · a2n 
   
A =  21 12 ,B = 
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

an1 a12 · · · anj · · · ann an1 a12 · · · αnj · · · ann
y
 
a11 a12 · · · a1j + α1j · · · a1n
 a21 a12 · · · a2j + α2j · · · a2n 
 
C=
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

an1 a12 · · · anj + αnj · · · ann

55
Entonces

det C = det A + det B.

En otras palabras, supongamos que las matrices A, B y C son idénticas excepto por la columna
j y que la columna j de C es igual a la suma de las columnas j–esimas de A y B. Entonces
det C = det A + det B.
Teorema 2.3.6. [Propiedad 3] Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al intercambiar dos de sus filas o sus columnas. Entonces

det B = − det A.

Teorema 2.3.7 (Propiedad 4). Si la matriz A tiene dos filas o columnas iguales, entonces
det A = 0.
Teorema 2.3.8 (Propiedad 5). Si una fila o columna de una matriz A es un múltiplo escalar
de otra fila o columna, entonces det A = 0
Teorema 2.3.9 (Propiedad 6). Si se suma un múltiplo escalar de una fila o columna o otro
fila o columna, entonces el determinante no cambia.

2.4. Determinantes e inversas


Definición 2.4.1 (Matriz de cofactores y matriz adjunta). Sea A ∈ Mn×n (R) y sea B la
matriz dada por
 
A11 A12 · · · A1n
 A21 A22 · · · A2n 
 
B=
. . . . . . . . . . . . . . . . . . . 

An1 An2 · · · Ann
B es llamada matriz de cofactores de A. Entonces la adjunta de A denotada por adj A
es la transpuesta de la matriz de cofactores, esto es,
 
A11 A21 · · · An1
 A12 A22 · · · An2 
 
adj A = B t = 
. . . . . . . . . . . . . . . . . . . 

An1 A2n · · · Ann

Teorema 2.4.1 (Cálculo de la inversa de una matriz). Sea A ∈ Mn×n (R). Entonces A es
invertible si sólo si det A 6= 0. Si det A 6= 0, entonces
1
A−1 = adj A.
det A
56
Teorema 2.4.2 (Regla de Cramer). Sea A ∈ Mn×n (R) y suponga que det A 6= 0. Entonces
la solución única del sistema Ax = b viene dada por
D1 D2 Dn
x1 = , x2 = , . . . , xn = ,
D D D
donde Dj = det Aj , j = 1, . . . , n, D = det A y Aj la matriz obtenida de A al cambiar su
columna j por el vector columna
 
b1
 b2 
b=.
 
 .. 
bn
Ejemplo 2.1. Considere el triángulo de la figura 2.2

b a
h

A B
x y
c

Figura 2.2: Regla de Krammer y teorema del coseno

(a) Demuestre, usando trigonometrı́a elemental las llamadas leyes de proyección

c cos A + a cos C = b (2.2)

b cos A + a cos B = c (2.3)

c cos B + b cos C = a (2.4)

(b) Utilice la regla de Krammer y las leyes de proyección para demostrar el teorema del
coseno:

a2 = b2 + c2 − 2bc cos A (2.5)

b2 = a2 + c2 − 2ac cos B (2.6)

c2 = a2 + b2 − 2ab cos C (2.7)

57
Solución. Del triángulo en la figura 2.2 obtenemos
x y
cos A = , cos B = ⇒ c = x + y = b cos A + a cos B.
b a
Con lo cual tenemos (2.3).

Ahora, como A + B + C = π, tenemos que

cos C = cos(π − (A + B))


= − cos(A + B)
= −(cos A cos B − sen A sen B)
= sen A sen B − cos A cos B
h h y
= · − cos A.
b a a
Entonces
h h y h2
cos C = · − cos A ⇔ a cos C = − y cos A.
b a a b
Además nótese que por el Teorema de Pitagoras b2 = x2 + h2 , con lo cual

h2 h2
− (c − x) cos A = − c cos A + x cos A
b b
h2 x
= + x − c cos A
b b
h2 + x2
= − c cos A
b
b2
= − c cos A
b
= b − c cos A.

Por lo tanto, a cos C = b − c cos A, o bien, a cos C + c cos A = b. Luego (2.2) se tiene. Ahora,
cos A = x/b y sen B = y/a, entonces

c = x + y = b cos A + a sen B.

Con lo cual tenemos (2.3). De manera similar a como se demostró (2.2) tenemos que

hh x h2
cos C = sen A sen B − cos A cos B = − cos B ⇔ b cos C = − (c − y) cos B
ab b a
h2
⇔ b cos C + c cos B = + y cos B,
a

58
y por el Teorema de pitagoras a2 = h2 + y 2 , por consiguiente,

h2 h2 y h2 + y 2
+ y cos B = +y = = a.
a a a a
Por lo tanto,

b cos C + c cos B = a.

Como se querı́a demostrar. Demostremos ahora el teorema del coseno. Sean x = cos A,
y = cos B y z = cos C. Entonces el sistema conformado por las ecuaciones (2.2), (2.3) y (2.4)
expresado en forma matricial toma la forma

c 0 a x b
    
 b a 0 y  =  c 
0 c b z a

Sea
c 0 a
 

A =  b a 0 ,
0 c b

entonces det A = 2abc > 0, por lo tanto la matriz A es invertible y por la Regla de Krammer,
D1 D2 D3
x= ,y = ,z = ,
D D D
donde Dj = det Aj , j = 1, 2, 3, D = det A y Aj es la matriz obtenida de A al cambiar su
columna j por el vector columna

b
 

b = c

a

Cuando realizamos los determinantes de las matrices Aj por la primera fila obtenemos

b 0 a
det A1 = c a 0 = bab − a(c2 − a2 ) = a(b2 + c2 − a2 ).

a c b


c b a
det A2 = b c 0 = c(cb) − bb2 + a(ab) = b(c2 − b2 + a2 ).

o a b

59

c 0 b
det A3 = b a c = c(a2 − c2 ) = c(a2 − c2 + b2 ).

o c a

Entonces
D1 a(b2 + c2 − a2 )
cos A = x = =
D 2abc
Con lo cual

2bc cos A = b2 + c2 − a2 ⇔ a2 = b2 + c2 − 2bc cos A

De donde obtenemos (2.5). De manera similar

D2 b(c2 − b2 + a2 )
cos B = y = =
D 2abc
D3 c(b2 + c2 − a2 )
cos C = z = =
D 2abc
De donde se siguen (2.6) y (2.7).

2.5. Problemas
Problema 2.5.1. Sea (Anj ) una sucesión de matrices definida como sigue Anj = [anj ]n×n ,
donde anj = ajn−1 y 1 ≤ j ≤ n. Llamaremos a cada elemento de esta sucesión matriz de
Vardermonde, y cada elemento de la sucesión en R dada por (Dn ) con Dn := det Anj ,
determinante de Vardermonde de tamaño n × n. Defina las matrices de Vandermonde
para n = 2, 3 y n = 4 y calcule sus respectivos determinantes. Conjeture una fórmula para
calcular Dn y demuestrela utilizando inducción matemática.

Sea

1 1 1
 

A = x1 x2 x3 
x21 x22 x23

60
Capı́tulo 3

Vectores en Rn

Definición 3.0.1. Definimos el espacio Euclideo de n dimensiones como el producto


cartesiano del conjunto R de números reales con sigo mismo n veces, esto es,

Rn = R × · · · × R
= {(x1 , x2 , . . . , xn ) : xi ∈ R, 1 ≤ i ≤ n} .

Estudiaremos especialmente el plano xy, esto es

R2 = {(x, y) : x, y ∈ R} ,

y el espacio

R3 = {(x, y, z) : x, y, z ∈ R} ,

3.1. Vectores en el plano enfoque analı́tico


Definición 3.1.1. Definimos un vector de R2 como una pareja ordenada de números reales,
esto es,

A = (Ax , Ay ).

Al escalar Ax se le llama componente en x del vector A, y a Ay componente en y. La


dirección del vector se define como el ángulo θ que forma el vector con el eje x medido en
el sentido contrario de las manecillas del reloj. (Ver Figura 3.1). La magnitud del vector se
denota por kAk y está dada por
q
kAk = A2x + A2y .

61
y
A

kAk
Ay
θ
x
O Ax

Figura 3.1: Dirección y magnitud de un vector

Definición 3.1.2 (Igualdad de vectores). Dos vectores A = (Ax , Ay ) y B = (Bx , By ) son


iguales si y sólo si son iguales componente a componente, esto es,
A = B ⇔ Ax = Bx y Ay = By .
Definición 3.1.3 (Adición de vectores). Sean A = (Ax , Ay ) y B = (Bx , By ) dos vectores de
R2 . La suma vectorial entre los vectores A y B se define como
A + B = (Ax + Bx , Ay + By ).
Definición 3.1.4 (Multiplicación por escalar). Definimos la multiplicación por escalar entre
el vector A = (Ax , Ay ) y el escalar k como
kA = k(Ax , Ay ) = (kAx , kAy ).
Utilizando la suma y multiplicación por escalar de vectores tenemos que para todo vector
A = (Ax , Ay ), se cumple que
A = (Ax , Ay ) = Ax (1, 0) + Ay (0, 1).
Los vectores i := (1, 0) y j := (0, 1), son llamados vectores coordenados unitarios.
Usando estos vectores podemos expresar el vector A como una suma de sus componentes
Ax = kAk cos θ, Ay = kAk sen θ,
tenemos que
A = kAk cos θi + kAk sen θj.
La expresión anterior se conoce como forma polar del vector A.

A continuación enunciamos las propiedades la suma y multiplicación por escalar de vec-


tores

62
Teorema 3.1.1 (Propiedades de los vectores). Sean A, B y C tres vectores de R2 y α, β ∈ R.
Entonces

(a) A + B = B + A.

(b) A + (B + C) = (A + B) + C.

(c) A + 0 = A, A + (−A) = 0. Aquı́, 0 = (0, 0) es el vector cero, elemento neutro de R2 .

(d) α(A + B) = αA + αB.

(e) (α + β)A = αA + βA.

Las propiedades de la norma o magnitud de un vector se dan en el siguiente resultado

Teorema 3.1.2 (Propiedades de la norma). Sean A y B vectores de R2 y k un escalar.


Entonces

(a) kAk ≥ 0 (Positividad)


(b) kAk = 0 ⇔ A = 0
(c) kkAk = |k|kAk (Propiedad homogénea)
(d) kA + Bk ≤ kAk + kBk (Desigualdad triangular)

3.2. Vectores en el plano enfoque geométrico


3.2.1. Vector resultante
A la adicción vectorial de los vectores

A = Ax i + Ay j, B = Bx i + By j,

se le conoce como vector resultante, esto es,

R = (Rx , Ry ) = (Ax + Bx )i + (Ay + By )j.

Podemos hallar la dirección del vector resultante en términos de las componentes de los
vectores A y B con la fórmula
   
Ry Ay + By
arctan = arctan .
Rx Ax + Bx
Para graficar el vector resultante trasladamos el vector B, respetando magnitud y direc-
ción de tal forma que su punto inicial coincida con el punto final de A, luego hacemos lo
mismo con el vector A (figura 3.2) generando de esta forma un paralelogramo, cuya diagonal

63
representa el vector resultante R. Esta interpretación de la suma vectorial es conocida como
regla del paralelogramo. Si tenemos las componentes de los vectores A y B podemos
hallar la magnitud del vector resultante con la fórmula
q
kRk = (Ax + Bx )2 + (Ay + By )2 .

B
By
Ry R B

Ay
A
x
O
Ax Bx

Rx

Figura 3.2: Construcción geométrica para la suma de dos vectores

Ahora si tenemos las magnitudes y direcciones de los vectores A y B, expresando los vec-
tores en la forma polar podemos encontrar una fórmula para la magnitud de R dependiendo
de dichas magnitudes y direcciones. En efecto, si α y β son direcciones de los vectores A y
B respectivamente, tenemos que

A = kAk cos αi + kAk sen αj, B = kBk cos βi + kBk sen βj.

64
Con lo cual,

kRk2 = (kAk cos α + kBk cos β)2 + (kAk sen α + kBk sen β)2
= kAk2 cos2 α + 2kAkkBk cos α cos β + kBk2 cos2 β
+ kAk2 sen2 α + 2kAkkBk sen α sen β + kBk2 sen2 β
= kAk2 + kBk2 + 2kAkkBk(cos α cos β + sen α sen β)
= kAk2 + kBk2 + 2kAkkBk cos(α − β)
= kAk2 + kBk2 + 2kAkkBk cos θ.

Donde θ = α − β es el ángulo entre A y B.

En el problema 4.15.10 se pide encontrar esta fórmula usando el teorema del coseno.

3.3. Diferencia entre vectores y vectores geométricos


Sean A y B vectores de R2 cuyos puntos iniciales coinciden en el origen O ver (figura
3.3).

−→
A AB
B

x
O

Figura 3.3: El vector que va del punto A a el punto B es igual a B − A

El vector con punto inicial en A y punto final en B es llamado vector diferencia. Vemos
−→
que el vector B resulta de la suma entre los vectores A y AB, esto es,
−→
A+ AB= B.

65
Entonces por el Teorema 3.1.1 tenemos que
−→ −→
A+ AB= B ⇔ −A + (A+ AB) = −A + B
−→
⇔ (−A + A)+ AB= B − A
−→
⇔ 0+ AB= B − A
−→
⇔AB= B − A.
Una interpretación similar nos permite concluir que
−→
BA= A − B.
−→
El vector AB= B−A, también es llamado vector geométrico. Los vectores geométricos son
especialmente útiles para representar magnitudes fı́sicas tales como fuerzas, desplazamientos,
velocidades, y aceleraciones, las cuales poseen magnitud y dirección. Lo que mide la flecha
indica la magnitud y la punta de la flecha indica la dirección.

Supongamos que introducimos un sistema de coordenadas con origen O. En la figura 3.4


−→ −→
se muestran dos vectores geométricos AB y CD que tienen la misma dirección y magnitud.

y
D
d2 − c2
C θ
d1 − c1
B
b 2 − a2
A θ
b 1 − a1
x
O

−→ −→
Figura 3.4: AB y CD representan vectores geométricos equivalentes.

Tenemos que
b1 − a1 d 1 − c1
cos θ = = ,
kB − Ak kD − Ck
Dado que kB − Ak = kD − Ck, nos da que b1 − a1 = d1 − c1 . De manera análoga vemos que
b2 − a2 = d2 − c2 . Entonces, de acuerdo a la definición 3.1.2 encontramos que
−→ −→
AB=CD ⇔ B − A = D − C.

66
Llamamos a tales vectores geométricos equivalentes. En fı́sica se utiliza la noción de vectores
equivalentes para definir la igualdad entre vectores.

Cuando el punto inicial de un vector geométrico coincide con el origen y el punto final
A tiene coordenadas (a, b) tenemos que
−→
OA= A − 0 = (a, b) − (0,0) = (a, b) = A.
−→
Por es razón escribimos A en lugar de OA. Este hecho tiene importantes repercusiones, ya
que nos dice que las componentes de cualquier vector A son las mismas de cualquier vector
geométrico equivalente a el.

y
D
d2 − c2
C θ
d1 − c1

A = (a, b)

θ
x
O

Figura 3.5: Un vector geométrico cuyo punto inicial coincide con el origen tiene las mismas
componentes que cualquier vector que tenga la misma magnitud y dirección.

Por ejemplo, en la figura 3.5 vemos que a = d1 − c1 y b = d2 − c2 , de modo que


−→
A =CD (3.1)

Paralelismo y ortogonalidad de vectores


Dos vectores A y B de R2 son paralelos si el primero se puede expresar como un múltiplo
escalar del segundo, es decir
Definición 3.3.1 (Vectores paralelos). Sean A y B dos vectores de R2 . El vector A es
paralelo a el vector B lo cual se denota por A k B si y solo si existe k ∈ R tal que A = kB.
Para obtener un criterio que nos permita saber cuando dos vectores son ortogonales,
utilizaremos el producto punto, o producto escalar, el cual fue introducido en la subsección
1.6.3. Primero que todo debemos notar que si A = (x, y) ∈ R2 , entonces
A · A = x2 + y 2 = kAk2 .

67
Demostramos que

Teorema 3.3.1. Si A ∈ R2 , entonces

kAk2 = A · A.

Ahora utilizaremos el Teorema del coseno para demostrar que

Teorema 3.3.2. Sean A y B son vectores de R2 , entonces

A · B = kAkkBk cos θ, (3.2)

donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.

Demostración. Aplicando el Teorema del coseno al triángulo que se muestra en la figura 3.3

−→
A AB
B
θ

x
O

obtenemos

kB − Ak2 = kAk2 + kBk2 − 2kAkkBk cos θ, (3.3)

donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Ahora, dado que el producto punto es conmutativo y distributivo
respecto a la suma de vectores, por el Teorema 3.3.1 tenemos que

kB − Ak2 = (B − A) · (B − A)
= B · B − 2B · A + A · A
= kBk2 − 2A · B + kAk2 .

Por lo tanto, tenemos que

kAk2 − 2A · B + kBk2 = kAk2 + kBk2 − 2kAkkBk cos θ

68
Sumando el término −(kAk2 + kBk2 ) en ambos lados de la ecuación anterior y luego multi-
plicando por 1/2 obtenemos (3.2).

Nótese que (3.3) permite calcular la magnitud del vector diferencia.

Además, de (3.2) podemos concluir que

A · B = 0 ⇔ si solo si θ = π/2.

Es decir, dos vectores no nulos A y B son ortogonales si solo si A · B = 0. Tenemos entonces


el siguiente resultado

Teorema 3.3.3 (Vectores ortogonales). Dos vectores no nulos A y B son ortogonales si


solo si A · B = 0

Con lo fórmula (3.2) podemos calcular el ángulo entre vectores.

Teorema 3.3.4 (Ángulo entre vectores). Si θ denota el ángulo más pequeño que hay entre
dos vectores no nulos A y B medido en el sentido contrario de las manecillas del reloj,
entonces
A·B A B
cos θ = = · . (3.4)
kAkkBk kAk kBk
Ejemplo 3.1. Utilice el producto punto para demostrar las siguientes identidades

(a) cos(α − β) = cos α cos β + sen α sen β.

(b) cos(α + β) = cos α cos β − sen α sen β.

(c) sen(α − β) = sen α cos β − sen β cos α.

(d) sen(α + β) = sen α cos β + sen β cos α.

Solución. Sean A y B vectores unitarios cuyas direcciones están dadas por los ángulos α y
β respectivamente. Entonces para el vector A tenemos que

Ax = kAk cos α = cos α


Ay = kAk sen α = sen α,

de modo que

A = cos αi + sen αj = (cos α, sen α).

De la misma forma, vemos que

B = cos βi + sen βj = (cos β, sen β).

69
y

A
β

α
x

Figura 3.6: Todo vector unitario u cuya dirección está dada por un ángulo θ se puede expresar
en la forma u = cos θi + sen θj

Como se ve en la figura 3.6, el ángulo entre los vectores unitarios A y B es θ = β − α.


Por lo tanto, por la fórmula (3.2) encontramos que

(cos α, sen α) · (cos β, sen β) = 1 · 1 cos(β − α).

O de manera equivalente,

cos(β − α) = cos(α − β) = cos α cos β + sen α sen β.

Con cual, tenemos (a).

Ahora, dado que la función coseno es par, y la función seno es impar, aplicando en inciso
(a) tenemos que

cos(α + β) = cos(α − (−β)) = cos α cos(−β) + sen α sen(−β).


= cos α cos β − sen α sen β.

Para obtener (c), rotamos el vector A de la figura 3.6 un ángulo de 90 grados en dirección
contraria de las manecillas del reloj, sin cambiar su magnitud, de tal forma que generamos
un vector C que también es unitario pero cuya dirección es α + π/2 (ver figura 3.7). Por lo
tanto sus componentes son

Cx = kCk cos(α + π/2) = − sen α


Cy = kCk sen(α + π/2) = cos α,

Nótese que en las fórmulas anteriores para hallar la componente en x del vector C usamos
(b) con β = π/2. Y para hallar la componente en y, usamos la identidad fundamental:

70
p √
sen(α + π/2) = 1 − cos2 (α + π/2) = 1 − sen2 α = cos α.

B A
π/2

α
x

Figura 3.7: Utilización del propucto punto para hallar una fórmula para el seno de la suma
de la de ángulos

Ahora bien, dado que el ángulo entre los vectores B y C es θ = β−(π/2+α) = β−α−π/2,
por (3.2) tenemos que
(cos β, sen β) · (− sen α, cos α) = 1 · 1 cos(β − α − π/2).
Que equivale a
− sen α cos β + sen β cos α = sen(β − α)
Al multiplicar por (−1) la identidad anterior obtenemos (c).
La identidad (d) se deduce de la identidad (c) de manera análoga como se demostró la
identidad (b) a partir de la (a).

3.4. Movimiento relativo


A continuación ilustraremos con un ejemplo el uso de los vectores para describir como
están relacionadas entre sı́ las mediciones realizadas por observadores que las calculan desde
distintos marcos de referencia. Un ejemplo clásico de este tipo de movimiento, llamado
movimiento relativo es el movimiento de un avión, que puede tener una velocidad v
en relación con el aire, en este caso una persona que está en la tierra medirá una velocidad
distinta a la del piloto, dependiendo de la dirección y magnitud de v.

71
Problema 3.4.1. Un piloto tiene que volar hacia el este de A a B y después regresar hacia
el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto a
la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c

(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
Realizar las gráficas correspondientes para ilustrar la situación.
Solución. Resolveremos solo el caso 1 del inciso (b), y el caso 1 del inciso (c). El resto se
deja como ejercicio (ver el problema 4.16.12).

Denotemos por C a el vector que representa la velocidad del avión respecto a el aire, esto
es, la velocidad que mide el piloto. Y denotemos por D el vector que representa la velocidad
del aire con respecto a la tierra, es decir la velocidad del viento que mide una persona que
está estacionaria en el tierra.
N N

Ab b
D C Bb
Ab
C b
D Bb

E E

S S
(a) Para el viaje de ida, un observador en tierra (b) Para el viaje de venida, dado que el viento es
mide la misma dirección de la velocidad del viento contrario a la dirección del movimiento del avión,
que el piloto, pero como existe un viento hacia el un observador en tierra calcula que la rapidez del
este, el observador en tierra calcula que la rapidez avión es c − v.
del avión es c + v.

Figura 3.8: Movimiento de un avión cuando prevalece un viento hacia el este

72
Suponemos como caso 1, que la dirección del vector D es hacia el este en el viaje de ida
y de venida. En el viaje de ida. La dirección que mide el piloto para el vector C es α = 0,
además, la magnitud es kCk = c, por lo tanto,

Cx = c cos 0 = c, Cy = c sen 0 = 0,

con lo cual,

C = (c, 0).

De forma análoga, encontramos que

D = (v, 0).

En consecuencia, la velocidad en el viaje de ida (ver figura 3.8(a)) que mide un observador
en tierra es

RAB = C + D = (c + v, 0).

Vemos de esta forma, que desde la perspectiva de un observador en tierra la rapidez del
avión en el viaje de ida es kRAB k = c + v. Y dado que cuando dicha rapidez es constante,
según la ecuación 4.16 con x0 = 0 es igual a distancia sobre tiempo, tenemos que el tiempo
tAB que tarda el avión en ir desde A hasta B es
l
tAB = .
c+v
Ahora, para el viaje de vuelta el vector D mantiene su dirección y magnitud (ver figura
3.8(b)). Sin embargo, el vector C a pesar de mantener su magnitud invierte su dirección,
esto es, la velocidad que mide el piloto para el viaje de vuelta es,

C = (c cos π, c sen π) = (−c, 0).

Por lo que para un observador en tierra el velocidad en el viaje de vuelta es

RBA = −C + D = (v − c, 0).

Además, Por el inciso (d) c > v, ası́, la rapidez del avión en el viaje de vuelta para un
observador en tierra es

kRBA k = |v − c| = c − v.

Con lo cual,
l
tBA = .
c−v

73
Concluimos de esta forma, que el tiempo necesario para completar un viaje redondo es

tE = tAB + tBA
l l
= +
c+v c−v
(c − v)l + (c + v)l
=
c2 − v 2
2cl
= 2
c − v2
2l/c
=
1 − v 2 /c2
t0
= .
1 − v 2 /c2

Ahora, supongamos que prevalece un viento hacia el norte. En este caso, si el piloto dirige
el avión en el segmento que va desde el punto A hasta el punto B, un observador en tierra
verı́a que el avión sigue la dirección noreste, ya que prevalece un viento hacia el norte. Por
lo tanto, el piloto debe enfilar el avión en la dirección sureste, con cierta inclinación medida
a partir del sur, que depende de la magnitud del vector D, para que un observador en tierra
vea que el avión sigue exactamente la dirección del segmento AB

N N
√ √
Ab b
c2 − v 2 B
b
A b
c2 − v 2
b
Bb

c v v c

E E

S S
(a) El piloto debe enfilar el avión en dirección sur- (b) En el viaje de vuelta, el piloto debe enfilar el
este, para que un observador en tierra vea que el avión en dirección suroeste, para que un observador
avión sigue el segmento AB en tierra vea que el avión sigue el segmento BA

Figura 3.9: Movimiento de un avión cuando prevalece un viento hacia el norte

En la figura 3.9(a) se muestra la velocidad del avión en azul, desde el punto de vista del
piloto. La velocidad del aire se muestra en verde. La velocidad del avión calculada por un
observador en tierra es entonces

RAB = C + D.

74
Observese que los tres vectores el ecuación anterior se relacionan según el triángulo que
muestra en la figura 3.9(a), y dado que el vector D es ortogonal a el vector RAB , dicho
triángulo es rectángulo. Por lo tanto, por el Teorema de Pitagoras

kRAB k = c2 − v 2 .
Ahora podemos calcular el tiempo que tarda el avión en ir desde el punto A hasta el punto
B,
l
tAB = √ .
c2 − v 2
Para el viaje de vuelta, el piloto debe enfilar el avión en la dirección sur oeste (ver figura
3.9(b)), y entonces un observador en tierra verı́a que el avión sigue el segmento de recta BA
calculando que el tiempo en recorrerlo es
l
tBA = √ .
c2 − v2
Con lo cual, finalmente obtenemos que
2l t0
tN = tAB + tBA = √ =p .
c2 − v 2 1 − v 2 /c2

3.4.1. Vector proyección


Sean A y B vectores no nulos de R2 . Queremos hallar un escalar t que nos permita
encontrar el vector tB, el cual tiene la misma dirección de B y es llamado proyección de
A sobre B.

y y

A A

θ
θ B
x x
O B O
tB tB

(a) t > 0, A · B > 0 (b) t < 0, A · B < 0

Figura 3.10: Vector proyección

75
Como se muestra en la figura 3.10 el escalar t puede ser positivo o negativo dependiendo
del ángulo θ que hay entre A y B. Supongamos primero que 0 ≤ θ ≤ π/2 de tal forma que
t > 0. En la figura 3.10(a) vemos que

ktBk
cos θ = .
kAk

Dado que t > 0, por el Teorema 3.1.2 inciso (c),

ktBk = |t|kBk = tkBk

Por lo tanto,

tkBk
cos θ = ,
kAk

de donde despejando t obtenemos

kAk cos θ
t= .
kBk

Por otro lado, por el Teorema 3.2

A · B = kAkkBk cos θ,

o bien,
A·B
kAk cos θ =
kBk

Por consiguiente,
A·B
t= .
kBk2

Tenemos entonces la siguiente definición

Definición 3.4.1 (Vector proyección). Sean A y B vectores no nulos de R2 . La proyección


de A sobre B se denota por ProyB A y define como el vector

A·B
ProyB A = B.
kBk2

Propiedades del vector proyección


Resumimos las propiedades del vector proyección en el siguiente resultado.

76
Teorema 3.4.2. Sean A, B y C vectores no nulos de R2 . Entonces

(a) ProyB A es paralelo a B.

(b) A − ProyB A es ortogonal a B.

(c) El vector proyección cumple las propiedades linealidad :

ProyB (αA) = α ProyB A


ProyC (A + B) = ProyC A + ProyC B.

(d) Proy−B A = ProyB A.

(e) La magnitud del vector proyección es llamada proyección escalar y está dada por

|A · B|
k ProyB Ak = .
kBk

77
Capı́tulo 4

Nociones de cálculo integral

4.1. Área bajo la curva


En esta sección se pretende encontrar una expresión para el área bajo la curva de la
función y = f (x) entre x = a y y = b. Consideremos primero en caso en que f (x) > 0 para
a ≤ x ≤ b, e intentemos aproximar el área bajo f por exceso por medio de rectángulos. Para
tal fin hagamos una partición regular(ver figura 4.1)

y = f (x)

x
a = x0 x1 ··· xi−1 xi ··· xn = b

Figura 4.1: Aproximación por exceso

78
del intervalo [a, b] en n subintervalos

[x0 , x1 ], [x1 , x2 ], . . . , [xn−1 , xn ],

cada rectángulo tiene por base


b−a
∆x = ,
n
por lo tanto, una aproximación del área A bajo la función f es
n
X
A ≈ ∆xf (x1 ) + ∆xf (x2 ) + · · · + ∆xf (xn ) = ∆xf (xi ).
i=1

Está claro que esta aproximación mejora cuando n → ∞. Por lo tanto tenemos
n
X
A = lı́m ∆xf (xi ). (4.1)
n→∞
i=1

Ahora observese que

x0 = a, x1 = a + ∆x, x2 = a + 2∆x, x3 = a + 3∆x, . . . ,

es decir, xi = a + i∆x, 0 ≤ i ≤ n.

El método mediante el cual se obtuvo la fórmula (4.1), es un caso particular de una


técnica desarrollada por los griegos hace más de 2000 años, conocida como método de
exhaución. Ilustramos esta técnica en el siguiente ejemplo.

Ejemplo 4.1. Sea An el área de un polı́gono de n lados iguales, inscrito un circulo de radio
r. Al dividir el polı́gono en n triángulos congruentes con un ángulo central 2π/n, demuestre
que

1 2π
(a) An = nr 2 sen
2 n
(b) lı́m An = πr 2
n→∞

Solución. Basaremos nuestra demostración en el siguiente resultado de cálculo diferencial


Teorema 4.1.1 (Continuidad secuencial). Una función f : D ⊆ R → R es continua en
x0 ∈ D si y sólo si

xn → x0 implica que f (xn ) → f (x0 ).

79
Al trazar la altura h de uno de los n triángulos que conforman el polı́gono de n lados de
longitud L, obtenemos un triángulo rectángulo de hipotenusa r y ángulo central
1 2π π
θ= · = ,
2 n n
ver la figura

L/2

r h
θ

L/2
Tenemos que cos θ = h/r y sen θ = . Por lo tanto, el área de uno de los triángulos
r
que conforman el polı́gono es
Lh 1 1 1 1 2π
A= = (r cos θ)(2r sen θ) = r 2 (2 sen θ cos θ) = r 2 sen 2θ = r 2 sen .
2 2 2 2 2 n
Con lo cual, el área An del polı́gono está dada por
1 2π
An = nr 2 sen
2 n
Ahora puesto que
sen x
→ 1 cuando x → 0,
x
la función
 sen x , si x 6= 0,

f (x) := x
1, si x = 0,

es continua en x = 0. Además, xn = → 0 cuando n → ∞. Entonces por el Teorema 4.1.1
n
f (xn ) → f (0) = 1. Lo cual implica que

n 2π sen
lı́m sen = lı́m n = 1.
n→∞ 2π n n→∞ 2π
n
Finalmente,
1 2 2π n 2π
lı́m An = lı́m nr sen = πr 2 lı́m sen = πr 2 · 1 = πr 2
n→∞ n→∞ 2 n n→∞ 2π n

80
4.2. Integral definida
En la sección 4.1 se aproximo el área bajo la gráfica de una función continua y = f (x)
desde x = a hasta x = b por exceso. Sin embargo, se puede demostrar que el valor de A en
(4.1) no cambia cuando tomamos los extremos izquierdos de cada subintervalo, esto es, la
aproximación se hace por defecto

n−1
X n
X
A = lı́m ∆xf (xi ) = lı́m ∆xf (xi−1 ). (4.2)
n→∞ n→∞
i=0 i=1

De hecho, en lugar de usar los extremos izquierdos o derechos, podrı́amos tomar la altura
del i-esimo rectángulo como el valor de f en cualquier número x∗i en el i-esimo subintervalo
[xi−1 , xi ]. A los números x∗1 , . . . , x∗n se les llama puntos de muestra. Podemos calcular el
valor del área usando estos puntos
n
X
A = lı́m ∆xf (x∗i ). (4.3)
n→∞
i=1

A el valor común del área A obtenido en (4.1), (4.2) y (4.3), se el denota por
Z b
f (x)dx,
a

que se lee, integral definida de f , desde a hasta b. En resumen

Definición 4.2.1 (Integral definida). Si f es una función continua en el intervalo [a, b],
el cual dividimos en n subintervalos de igual ancho ∆x = (b − a)/n. Denotamos con x0 =
a, x1 , . . . , xn = b los puntos extremos de estos subintervalos y elegimos los puntos de muestra
x∗1 , . . . , x∗n en cada uno de estos subintervalos, de modo que x∗i se encuentre en el i-esimo
subintervalo [xi−1 , xi ]. Entonces integral definida de f , desde a hasta b, es
Z b n
X
f (x)dx = lı́m ∆xf (x∗i ). (4.4)
a n→∞
i=1

La suma en (4.4) se conoce como suma de Riemann. Sabemos que si es f es no negativa


en [a, b], esta suma de Riemann es una aproximación del área bajo la función en [a, b]. Y la
Z b
integral definida f (x)dx da el valor exacto de esta área.
a
Z π/2
Ejemplo 4.2. Usar sumas de Riemann para calcular cos x dx.
0

81
Solución. Partamos de la identidad

2 sen B cos A = sen(A + B) − sen(A − B). (4.5)


x
Tomemos B = , A = ix. Entonces
2
x x x x x
2 sen cos ix = sen(ix + ) − sen(ix − ) = sen(2i + 1) − sen(2i − 1) .
2 2 2 2 2
x x
Definamos ai = sen(2i + 1) , entonces ai−1 = sen(2i − 1) . Por lo tanto, por las propiedades
2 2
homogénea y telescópica de las sumatorias tenemos que
n n
xX X x
2 sen cos ix = 2 sen cos ix
2 i=1 i=1
2
n
Xh x xi
= sen(2i + 1) − sen(2i − 1)
i=1
2 2
n
X
= (ai − ai−1 )
i=1

= an − a0
x x
= sen(2n + 1) − sen .
2 2
Ahora nos proponemos usar de nuevo la identidad (4.5), pero esta vez, de derecha a izquierda.
Para tal fin debemos encontrar A y B tales que
x x
A + B = (2n + 1) , A − B = .
2 2
Entonces,
x x
2A = A + B + A − B = (2n + 1) + = (n + 1)x,
2 2
x x x
de donde A = (n+1) . Con lo cual, B = A− = n . De esta forma obtenemos la identidad
2 2 2
x x x x
2 sen n cos(n + 1) = sen(2n + 1) − sen .
2 2 2 2
Lo que a su vez nos lleva a concluir que si, x 6= 2mπ, entonces
1 1
n sen nx cos (n + 1)x
2 2
X
cos ix = . (4.6)
1
i=1 sen x
2

82
Ahora por definición de integral de Riemann
Z π/2 n
X
cos xdx = lı́m ∆x cos xi ,
0 n→∞
i=1

π π π
donde ∆x = , xi = ∆xi = i. Entonces por la identidad (4.6), con x = , tenemos que
2n 2n 2n
n n
X X π π
∆x cos xi = cos i
i=1 i=1
2n 2n
n
π X π
= cos i
2n i=1 2n
hn π i  
(n + 1)π
sen cos
π 2 2n 4n
= π
2n sen
4n
π π/2n π π
= sen · cos + .
4 sen π 4 4n
4n
π n→∞
Ahora como −→ 0, por el Teorema 4.1.1,
4n
π/4n 1 n→∞ 1
2 π = 2 sen(π/4n) −→ 2 · 1 = 2,
sen
4n π/4n
y

π  n→∞ π  π
cos + −→ cos + 0 = cos .
4 4n 4 4
En conclusión
Z π/2
π π/2n π π π π π
cos xdx = lı́m sen · π cos + = sen · 2 · cos = sen = 1.
0 n→∞ 4 sen 4 4n 4 4 2
4n

En la mayorı́a de problemas que involucran sumas de Riemann se toman como puntos de


muestra los extremos izquierdos, o bien los extremos derechos de los subintervalos [xi−1 , xi ],
1 ≤ i ≤ n. Sin embargo, en ocasiones dicha elección no es útil como mostraremos en el
siguiente ejemplo.
2
1
Z
Ejemplo 4.3. Utilizar sumas de Riemann para calcular la integral dx. Sugerencia:
√ 1 x2
Tome x∗i = xi−1 xi .

83
Solución. Intentemos calcular el área pedida por exceso. Tenemos que
Z b X n
f (x)dx = lı́m ∆xf (xi ),
a n→∞
i=1

b−a 1
donde ∆x = = , xi = a + i∆x = 1 + i/n. Entonces
n n
1 n2
f (xi ) = = .
(1 + i/n)2 (n + i)2
Por lo tanto tenemos que
Z 2 n n
X X n
f (x)dx = lı́m ∆xf (xi ) = lı́m . (4.7)
1 n→∞
i=1
n→∞
i=1
(n + i)2

El lı́mite en (4.7) se puede calcular usando el teorema fundamental del cálculo, pero cier-
tamente la integral que nos plantean también. Para resolver el problema usando sumas de
Riemann, debemos definir

x∗i = xi−1 xi ,

1 ≤ i ≤ n. Primero que todo notemos que como 0 < 1 ≤ xi−1 ≤ xi para todo 1 ≤ i ≤ n,
entonces

xi−1 xi ≤ x2i y x2i−1 ≤ xi−1 xi ⇔ x2i−1 ≤ xi−1 xi ≤ x2i .



Ahora como la función h(x) := x es creciente para x > 0. Tenemos que

h(x2i−1 ) ≤ h(xi−1 xi ) ≤ h(x2i ) ⇔ xi−1 ≤ xi−1 xi ≤ xi .

Comprobando de esta forma, que los x∗i definen efectivamente puntos de muestra. Podemos
ahora calcular la integral usando estos puntos de muestra
Z 2 n n
X

X 1 1
f (x)dx = lı́m ∆xf (xi ) = lı́m · .
1 n→∞
i=1
n→∞
i=1
n xi−1 xi

Como xi = 1 + i/n. Tenemos que


1 1 1/n n
· = = .
n xi−1 xi (1 + i/n)(1 + (i − 1)/n) (n + i)(n + i − 1)
Por otro lado,
n + i − (n + i − 1)
 
1 1 1
n =n =n − .
(n + i)(n + i − 1) n + i)(n + i − 1) n+i−1 n+1

84
Entonces
n n  
X 1 1 X 1 1
· = n −
i=1
n xi−1 xi i=1
n+i−1 n+1
n  
X 1 1
=n −
i=1
n + i − 1 n+1
n
X
=n (ai−1 − ai ).
i=1

1
Donde ai := . Finalmente, por la propiedad telescópica de las sumas finitas
n+i
Z 2 Xn
f (x)dx = lı́m n (ai−1 − ai )
1 n→∞
i=1

= lı́m n(a0 − an )
n→∞

= lı́m n(1/n − 1/2n)


n→∞

= 1/2.

85
4.3. Propiedades de la integral definida
Teorema 4.3.1 (Propiedades de la integral definida). Sean f y g funciones continuas en
un intervalo [a, b] y c ∈ R. Entonces
Z b Z b Z b
(a) (f (x) ± g(x))dx = f (x)dx ± g(x)dx
a a a
Z b Z b
cf (x)dx = c f (x)dx. (Propiedades de linealidad)
a a
Z b Z c Z b
(b) f (x)dx = f (x)dx + f (x)dx (Propiedad de aditividad)
a a c
(c)
Z b
Si f (x) ≥ 0, entonces f (x)dx ≥ 0
a
Z b Z b (Propiedades de orden)
Si f (x) ≥ g(x), entonces f (x)dx ≥ g(x)dx.
a a
Z b
Si m ≤ f (x) ≤ M, entonces m(b − a) ≤ f (x)dx ≤ M(b − a)
a
Z b Z b+c
(d) f (x)dx = f (x − c)dx (Propiedad de invariancia frente a traslación)
a a+c
Z b Z a
(e) f (x)dx = − f (x)dx. (Propiedad de inversión de la orientación)
a b
b cb
1 x
Z Z
(f ) f (x)dx = f dx, c 6= 0.
a c ca c
(Propiedad de dilatación o contracción del intervalo)

Corolario 4.3.2. Si f es continua en [0, b]. Entonces


Z b Z b
(a) f (x)dx = 2 f (x)dx si f es par.
−b 0
Z b
(b) f (x)dx = 0 si f es impar.
−b

4.4. La integral indefinida


Definición 4.4.1. Una función F es una antiderivada de f en intervalo I si F ′ (x) = f (x)
para todo x ∈ I.
La antiderivada de una función no es única. Por ejemplo, si C ∈ R cada elemento de la
familia de funciones F (x) = x3 + C es un antiderivada de la función f (x) = 3x2 .

86
Un sı́mbolo especial se utiliza para denotar la colección de todas las antiderivadas de una
función f .

Definición 4.4.2 (Integral definida). la colección de todas las antiderivadas de una función
f se denomina integral indefinida de f con respecto a x, lo cual se denota mediante
Z
f (x)dx.

4.4.1. Problemas de valor inicial


La noción de antiderivada de una función es importante en relación con la ecuaciones
diferenciales, dado que la determinación de una antiderivada de la función f (x) es el mismo
problema de encontrar una función y(x) que satisface la ecuación
dy
= f (x), (4.8)
dx
la cual se denomina ecuación diferencial. La solución general de (4.8) es y(x) = F (x)+C,
donde C es una constante arbitraria y F es una antiderivada de f . Por lo tanto, la ecuación
tiene infinitas soluciones una por cada valor de C. Luego para darle unicidad al problema
pedimos a la función y = y(x) que satisfaga la condición inicial y(x0 ) = y0 . El par conformado
por la ecuación diferencial y el condición inicial y(x0 ) = y0 , se denomina problema de valor
inicial.

Ejemplo 4.4 (Movimiento en una dimensión con aceleración constante (MUA)). Cuando
una partı́cula se mueve en una dimensión con aceleración constante, podemos hallar la po-
sición de la partı́cula como una función del tiempo al resolver el par de problemas de valor
inicial

 dv
= a(t) = cte
dt (4.9)
 v(0) = v ,
0

 dx
= at + v0
dt (4.10)
 x(0) = x .
0

En efecto, de la fı́sica clásica se sabe que la velocidad v(t) de una partı́cula en el tiempo t
es la derivada de la posición de la partı́cula respecto al tiempo, a su vez, la derivada de la
velocidad de la partı́cula con respecto al tiempo es igual a la aceleración a(t) en el tiempo t.
Esto es,
d2 x
 
d dx d
a(t) = 2 = = v(t).
dt dt dt dt

87
dv
Si suponemos que a(t) = = cte = c y que velocidad en el tiempo t = 0 es v0 , esto es
dt
v(0) = v0 , obtenemos el problema de valor inicial (4.9). Resolveremos este problema por un
método usado en ecuaciones diferenciales conocido como separación de variables.
dv
Tenemos que : = a = cte. Entonces separando variables obtenemos
dt
dv = adt.

Ahora integrando respecto t y aplicando las propiedades de linealidad de la integral tenemos


que
Z Z Z
dv = a dt = a dt ⇔ v = at + C1 .

Luego obtenemos que

v(t) = at + C1 ,

donde C1 es un a constante, la cual podemos hallar usando la condición inicial v(0) = v0 .


Esto es, v(0) = C1 = v0 . De donde la velocidad de la velocidad de la partı́cula en el tiempo
t viene dada por

v(t) = at + v0 (4.11)

Aplicando de nuevo el método de separación de variables, esta vez para resolver (4.10) obte-
nemos
Z Z
dx = (at + v0 )dt ⇔ dx = (at + v0 )dt.

Entonces, por las propiedades de linealidad de la integral


Z Z Z Z
dx = (at + v0 )dt = atdt + v0 tdt = at2 /2 + v0 t + C2 .

Ahora, x(0) = C2 = x0 , de donde la posición en el tiempo t de la partı́cula está dada por

x(t) = x0 + v0 t + at2 /2. (4.12)

Ahora podemos usar las ecuaciones (4.9), (4.12) para hallar una expresión para la velocidad
final v(t) que no dependa del tiempo. De (4.9) despejando el tiempo obtenemos
vf − v0
t= (4.13)
a
donde vf = v(t).

88
Reemplazando (4.13) en (4.12) obtenemos
 2
vf − v0
 
1 vf − v0
x = v0 + a ,
a 2 a

donde por comodidad suponemos que x(0) = x0 = 0. Entonces tenemos que


 2
vf − v0
 
1 vf − v0
x = v0 + a
a 2 a
2v0 (vf − v0 ) (vf − v0 )2
= +
2a 2a
2v0 (vf − v0 ) + (vf − v0 )2
=
2a
(vf − v0 )(2v0 + vf − v0 )
=
2a
(vf − v0 )(vf + v0 )
=
2a
vf2 − v02
= .
2a
De donde obtenemos

vf2 = v02 + 2ax. (4.14)

Otro problema tı́pico de valor inicial, que se presenta en este contexto es el de una partı́cula
que se mueve en una dimensión con velocidad constante. Para este caso tenemos

 dx
= v = cte
dt (4.15)
 x(0) = x .
0

Resolviendo problema de valor inicial obtenemos

x(t) = x0 + vt. (4.16)

Ejemplo 4.5. Un automovilista viaja a 18 m/s cuando ve un venado en el camino, a una


distancia de 38 m, adelante.

(a) Si la desaceleración máxima del vehı́culo es de −4,5 m/s2 , ¿cuál es el tiempo de reac-
ción mı́nimo del automovilista que le permitirá evitar golpear al venado? .

(b) Si el tiempo de reacción es de 0,30 s, ¿Cuán rápido viajará cuando golpeé al venado?

89
Solución. Sea t0 el tiempo de reacción mı́nimo del automovilista que le permitirá evitar
golpear al venado. En este tiempo puesto que no ha empezado a frenar, el automovilista se
desplaza con una velocidad constante de v = 18m/s. Por lo tanto, la distancia recorrida en
este tiempo se halla utilizando la fórmula (4.16) con x0 = 0, si denotemos dicha distancia
por X0 tenemos que X0 = 18t0 .

Ahora pasado el tiempo t0 , el automovilista empieza a frenar y podemos calcular el tiempo


de frenado del vehı́culo con la fórmula (4.11). Para este tiempo, vf = 0, además v0 = 18 y
a = −4,5, entonces

0 = −4,5t + 18,

de donde t = 4s. Para hallar la distancia que recorrió el automóvil antes de detenerse
completamente utilizamos la fórmula (4.12) con x0 = 0, para obtener

X1 = 18 · 4 + (1/2)(−4,5)(4)2 = 36.

v0 = 18m/s
38m
X0 X1

Figura 4.2: El auotmovilista recorre la distancia X0 con velocidad cosntante de 18m/s, y la


distancia X1 con una desaceleración constante de −4,5m/s2
.

Para que el automovilista no atropelle al venado se debe tener que la distancia de reacción
X0 más la distancia de frenado X1 sea exactamente igual a 38m (ver figura 4.2). Esto es,

X0 + X1 = 38.

Tenemos entonces que 18t0 + 36 = 38, con lo cual t0 = (1/9)s ≈ 0, 1s.

Ahora, si el tiempo de reacción es de 0,3s, en este tiempo el automovilista a recorrido

x = x(0,3) = 18 · 0, 3 = 5,4m,

pasado ese tiempo empieza a frenar, y la velocidad con la que atropella al venado se calcula
con la fórmula (4.14), tomando v0 = 18, a = −4,5 y x = 38 − 5,4 = 32,6. Tenemos que
p
vf = 182 − 2(4,5)(32,6) = 5,5317m/s.

90
Ejemplo 4.6 (Difusión social). En ocasiones, los sociólogos utilizan la frase difusión social
para describir la manera en que la información se difunde en una población. La información
puede ser un rumor, una moda cultural, o una noticia de una innovación tecnológica. En una
población suficientemente grande, el número de personas x que conoce la información se trata
como una función diferenciable del tiempo t, mientras que la velocidad de difusión, dx/dt,
se supone proporcional al número de personas que conocen la información por el número de
personas que la desconocen. Lo anterior lleva a la ecuación diferencial
dx
= kx(N − x),
dt
donde N es el número de personas en la población.
Suponga que t está en dı́as, k = 1/250, y que dos personas inician un rumor en el instante
t = 0 en una población de N = 1000 personas.

(a) Determine x como una función del tiempo t.

(b) ¿Cuándo la mitad de la población a escuchado el rumor? (Esto es cuando el rumor se


propaga de la manera más rápida).

Solución. Utilizaremos un método conocido como separación de variables para resolver


la ecuación.
dx dx
= kx(N − x) ⇔ = dt.
dt kx(N − x)

Ahora integrando la última ecuación obtenemos


dx
Z
= t + C.
kx(N − x)

Ahora nótese que

1 x+N −x
 
dx 1 1 1
= · = · + .
x(N − x) N x(N − x) N N −x x

Además, del cálculo diferencial se sabe que


d 1
ln x = .
dx x
Entonces por la regla de la cadena
d 1
− ln(N − x) = .
dx N −x

91
Luego por las propiedades de linealidad de la integral.
dx 1 dx
Z Z
=
kx(N − x) k x(N − x)
 
1 1 1 1
Z
= · + dx
k N N −x x
Z  
1 1 1
= + dx
kN N −x x
Z 
1 1 1
Z
= dx + dx
kN N −x x
1
= [ln x − ln(N − x)] .
kN
Tenemos entonces que
 
1 x 1
ln = [ln x − ln(N − x)] = t + C,
kN N −x kN
donde kN = 1000/250 = 4. Por consiguiente,
x x
ln = 4t + 4C ⇔ = e4t+4C = e4t e4C
N −x N −x
⇔ x = Ne4C e4t − e4t e4C x
⇔ x + e4t e4C x = Ne4C e4t
⇔ x(1 + e4t e4C ) = Ne4C e4t
Ne4C e4t
⇔x= .
1 + e4t e4C
Esto es,
1000e4C e4t
x = x(t) = (4.17)
1 + e4t e4C
x
Además como x = 2 cuando t = 0 y = e4t e4C , tenemos que e4C = 1/499. Reempla-
N −x
zando este último valor en (4.17), obtenemos
1000e4t
x = x(t) = .
499 + e4t
Con lo cual tenemos la parte (a). Para la parte (b), debemos resolver para t, la ecuación
1000e4t
= 500.
499 + e4t
Esto es,
1000e4t 1000 4t
4t
= 500 ⇔ e = 499 + e4t ⇔ e4t = 499.
499 + e 500
Entonces t = ln 499/4 ≈ 1,55.

92
4.5. Teorema fundamental del cálculo
4.5.1. Primer teorema fundamental del cálculo
Teorema 4.5.1 (Primer teorema fundamental del cálculo). Si f e continua en [a, b], la
función F definida por
Z x
F (x) = f (t)dt a ≤ x ≤ b
a

es continua en [a, b] y diferenciable en (a, b), y F ′ (x) = f (x).


Cuando la función f es no negativa para a ≤ t ≤ x, la función F representa el área
debajo la función y = f (t) que se acumulada hasta el valor x.
Ejemplo 4.7. Si f es continua y satisface la fórmula dada para todo x ≥ 0, calcular f (2).
Z x2 (x+1)
f (t)dt = x
0
Z x
Solución. Sea F (x) = f (t)dt y h(x) = x2 (x + 1). Si
0
Z h(x) Z x2 (x+1)
z = F (h(x)) = f (t)dt = f (t)dt, (4.18)
0 0

entonces por la regla de la cadena


dz
= F ′ (h(x))h′ (x).
dx
Nótese que el primer Teorema fundamental del cálculo F es diferenciable en (0, x), más
aún, F ′ (x) = f (x), con lo cual F ′ (h(x)) = f (h(x)). Por lo tanto, derivando respecto a x la
ecuación integral (4.18) obtenemos

f (h(x))h′ (x) = f (x2 (x + 1))(3x2 + 2x) = 1.

De donde

f (x2 (x + 1))(3x2 + 2x) = 1 (4.19)

Como se quiere hallar f (2), debemos hallar x > 0 tal que h(x) = 2. Esto es,

x2 (x + 1) = 2 ⇔ x2 + x3 − 2 = 0
⇔ x2 − 1 + x3 − 1 = 0
⇔ (x − 1)(x + 1) + (x − 1)(x2 + 2x + 1) = 0
⇔ (x − 1)(x2 + 2x + 2) = 0.

93
Para y = x2 + 2x + 2, tenemos a = 1, b = c = 2, con lo cual, D = b2 − 4ac = 22 − 4(1)(2) < 0.
Entonces x2 + 2x + 2 > 0 para todo x ∈ R. Por consiguiente x − 1 = 0, esto es, x = 1.
Reemplazando este valor en (4.19) encontramos que

f (12(1 + 1))(3(1)2 + 2(1)) = 1 ⇔ f (2)5 = 1.

De donde f (2) = 1/5.

4.5.2. Segundo teorema fundamental del cálculo


Teorema 4.5.2 (Segundo teorema fundamental del cálculo). Si f es continua en [a, b],
entonces
Z b
f (t)dt = F (b) − F (a),
a

donde F es una antiderivada de f , esto es, una función tal que F ′ (x) = f (x).

Ejemplo 4.8. Sea 



0, si x < 0,

si 0 ≤ x ≤ 1,

x,
f (x) =


2 − x, si 1 < x ≤ 2,

0, si x > 2.

Z x
y F (x) := f (t)dt.
0

(a) Halle F (x)

(b) Dibuje las graficas de f y F

(c) ¿En dónde f es diferenciable? ¿En dónde F es diferenciable?

Solución. Si x ≤ 0, entonces f (x) = 0, con lo cual F (x) = 0.

CasoZ 1. Si 0 ≤ x ≤ 1, como 0 ≤ t ≤ x, entonces 0 ≤ t ≤ 1, y f (t) = t, con lo cual


x
F (x) = tdt = x2 /2. El valor x2 /2 es obtenido como el área del triángulo que se muestra
0
en la figura 4.3. Por el segundo Teorema fundamental del cálculo tenemos que F1 (t) = t2 /2.
Por lo tanto,
Z x
tdt = F1 (x) − F1 (0) = x2 /2.
0

94
y

x
x 1 2

Z x
Figura 4.3: La integral tdt es igual a el área del triángulo de lados x y y = f (x) = x
0

Caso 2. Si 1 < x ≤ 2. Utilizando la propiedad aditiva de la integral definida tenemos


que
Z x Z 1 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt = A1 + A2 .
0 0 1

A1 A2
x
1 x 2

Figura 4.4: En este caso el área acumulada hasta x es igual a el área del triángulo más el
área del trapecio

Geométricamente podemos calcular el área como la suma del área del triángulo y el

95
trapecio que se muestran el la figura 4.4. Tenemos que:
Z 1 Z x
1·1 (1 + 2 − x)(x − 1)
f (t)dt = A1 = = 1/2, f (t)dt = A2 = .
0 2 1 2
Entonces
x
(3 − x)(x − 1)
Z
F (x) = f (t)dt = 1/2 + = −x2 /2 + 2x − 1.
0 2
Si queremos hallar el área acumulada hasta un valor x, utilizando el segundo teorema fun-
damental del cálculo, procedemos como sigue. Para el área A1 tenemos que 0 ≤ t ≤ 1, con
lo cual f (t) = t. Entonces
Z 1
A1 = tdt = F1 (1) − F1 (0) = 1/2 − 0 = 1/2.
0

Para el área A2 tenemos que 1 ≤ t ≤ x ≤ 2. Es decir, f (t) = 2 − t. En consecuencia,


Z x Z x Z x
A2 = (2 − t)dt = 2dt − tdt
1 1 1
= 2(x − 1) − ((F1 (x) − F1 (1))
= 2x − 2 − (x2 /2 − 1/2)
= −x2 /2 + 2x − 3/2.

Sumando estas áreas obtenemos


Z x
F (x) = f (t)dt = 1/2 + −x2 /2 + 2x − 3/2 = −x2 /2 + 2x − 1.
0

Caso 3. x > 2. En este caso ya se acumulo todo el área.


Z x Z 2 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt
0 0 2
Z 1 Z 2 Z x
= f (t)dt + f (t)dt f (t)dt
0 1 2
Z 1 Z 2 Z x
= tdt + (2 − t)dt + 0dt
0 1 2
= 1.

Ver la figura 4.5.

96
y

x
1 2 x

Figura 4.5: Si x > 2, ya se acumulo toda el área, la cual es igual a el área del triángulo que
se muestra

De los casos 1,2 y 3, encontramos F (x):




0, si x < 0,

x2 /2,

si 0 ≤ x ≤ 1,
F (x) =


−x2 /2 + 2x − 1, si 1 < x ≤ 2,

1, si x > 2.

De donde obtenemos la gráfica de la función

x
1 2

Figura 4.6: Gráfica de la función de área

97
La función f es diferenciable en R − {0, 1, 2}. Por el primer Teorema fundamental del
cálculo, la función F es diferenciable donde f es continua, esto es, en todo R.

4.6. Área entre curvas


Supongamos que y = ϕ1 (x) y y = ϕ2 (x) son funciones continuas en el intervalo [a, b],
y supongamos además que ϕ1 (x) ≤ ϕ2 (x) para todo x ∈ [a, b]. Consideremos la región R
limitada por las gráficas de estas funciones en el intervalo dado, esto es
R = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) .


Observamos en la figura 4.7 que al mover la linea vertical en rojo desde x = a, hasta x = b,
barremos toda la región, y mientras hacemos esto, dicha linea siempre entra en la curva
y = ϕ1 (x) y sale en la curva y = ϕ2 (x). Un subconjunto del plano con estas caracterı́sticas
es denominado región del tipo I.
y

y = ϕ2 (x)

y = ϕ1 (x)

x
a b

Figura 4.7: Región del tipo I

Dado que 0 ≤ ϕ1 (x) ≤ ϕ2 (x), para x ∈ [a, b], podemos hallar el área de la región R
como una resta de áreas. En efecto, denotemos dicha área por a(R), utilizando la integral
de Riemann tenemos que
Z b Z b Z b
a(R) = A2 − A1 = ϕ2 (x)dx − ϕ1 (x)dx = [ϕ2 (x) − ϕ1 (x)] dx.
a a a

Además por el Teorema fundamental del cálculo


Z ϕ2 (x)
dy = ϕ2 (x) − ϕ1 (x).
ϕ1 (x)

98
Por lo tanto, podemos expresar el área de la región como
Z b
a(R) = [ϕ2 (x) − ϕ1 (x)] dx
a
" #
Z Z b ϕ2 (x)
= dy dx
a ϕ1 (x)
Z bZ ϕ2 (x)
= dydx
a ϕ1 (x)
ZZ
= dA.
R
ZZ
La expresión dA es denominada integral doble extendida sobre la región R del dife-
R
rencial de área, el diferencial de área, dA, es igual a dydx.
Ejemplo 4.9. Calcular el área de la región acotada por la hipérbola xy = 1 y las rectas
y = x y y = 2.
Solución. Hallemos los puntos de corte entre la hipérbola y = 1/x, y la recta y = 2. Esto
es, resolvemos para x la ecuación 1/x = 2, encontrando que x = 1/2. De manera similar, las
rectas y = x y y = 2 se cortan en x = 2 y la hipérbola y la recta y = x en x = 1. Con esta
información hallamos la gráfica de la región.
y

y=x

2
y=2
R

xy = 1

x
1/2 1 2

Figura 4.8: Región plana del tipo II

Vemos que trazando una linea vertical empezando en x = 1/2 y terminando en x = 1,


esta entra en la hipérbola y = 1/x y sale en la recta y = 2, pero cuando movemos esta linea

99
desde x = 1 hasta x = 2 entra en la recta y = x y sale en la recta y = 2, por lo que la región
R no puede ser del tipo I. Sin embargo, al trazar una linea horizontal vemos que cuando la
desplazamos desde y = 1 hasta y = 2, siempre entra en la hipérbola x = 1/y y sale en la
recta x = y. Un subconjunto del plano con esta propiedad es denominado región del tipo II.
De manera más general definimos una región plana del tipo II como sigue

R = (x, y) ∈ R2 : ψ1 (y) ≤ x ≤ ψ2 (y), c ≤ y ≤ d .




Análogamente como se hizo con la regiones de tipo I calculamos el área de una región del
tipo II
ZZ
a(R) = dA
R
Z "Z d
#
ψ2 (y)
= dx dy
c ψ1 (y)
Z d Z ψ2 (y)
= dxdy
c ψ1 (y)
Z d
= [ψ2 (y) − ψ1 (y)] dy.
c

En una región del tipo II, el diferencial de área está dado por dA = dxdy. Ahora para nuestro
caso tenemos que

R = (x, y) ∈ R2 : 1/y ≤ x ≤ y, 1 ≤ y ≤ 2 .


Por lo tanto,
Z 2
a(R) = (y − 1/y)dy
1
2
= y 2 /2 1 − [ln y]21


= 22 /2 − 1/2 − (ln 2 − ln 1) = 3/2 − ln 2.

Cuando aplicamos el segundo Teorema fundamental del cálculo, usamos la notación


Z b
f (x)dx = F (b) − F (a) = [F (x)]ba .
a

A pesar de que la región R no es del tipo I, se puede ver como la unión de dos regiones del
tipo I.

100
y

y=x

2
y=2
R1 R2

xy = 1

x
1/2 1 2

Figura 4.9: Región del tipo II, que puede ser vista como la unión de dos regiones del tipo I

En efecto, R = R1 ∪ R2 , donde

R1 = {(x, y) : 1/2 ≤ x ≤ 1, 1/x ≤ y ≤ 2} , R2 = {(x, y) : 1 ≤ x ≤ 2, x ≤ y ≤ 2}

Podemos entonces calcular el área pedida utilizando la propiedad aditiva de las integrales
dobles
ZZ ZZ ZZ
a(R) = dA = dA + dA = a(R1 ) + a(R2 ).
R R1 R2

Tenemos que
ZZ Z 1
a(R1 ) = dA = (2 − 1/x)dx = 1 + ln 1/2 = 1 − ln 2,
R1 1/2

y
ZZ Z 2
a(R2 ) = dA = (2 − x)dx = 1/2.
R2 1

Por la tanto, a(R) = a(R1 ) + a(R2 ) = 1 − ln 2 + 1/2 = 3/2 − ln 2.

Existen regiones planas que pueden ser del tipo I y del tipo II al mismo tiempo. Llama-
remos a estos subconjuntos del plano regiones del tipo III.

Para calcular área entre curvas debemos utilizar la propiedad aditiva de la integrales
dobles en su caso más general.

101
Teorema 4.6.1 (Propiedad aditiva de las integrales dobles). Supongamos que

R = R1 ∪ R2 ∪ · · · ∪ Rn ,

donde las regiones Ri , 1 ≤ i ≤ n, son regiones elementales en el plano de alguno de los tres
tipos definidos; tipo I, tipo II, o bien tipo III, las cuales son disyuntas dos a dos, esto es,

Ri ∩ Rj = ∅, i 6= j,

salvo quizás en sus fronteras. Entonces


ZZ
a(R) = dA
ZZ R ZZ ZZ
= dA + dA + · · · + dA
R1 R2 Rn

= a(R1 ) + a(R2 ) + · · · + a(Rn ).

4.7. Curvas en el plano


Consideremos una partı́cula que se está moviendo sobre la circunferencia C de ecuación
x + y 2 = 1 mostrada en la figura 4.10.
2

Figura 4.10: Movimiento de una partı́cula sobre una circunferencia

Es imposible describir la trayectoria C seguida por la partı́cula mediante una ecuación de


la forma y = f (x) porque C no pasa la prueba de la linea vertical. Es decir, en la ecuación
de la circunferencia no podemos determinar y de manera única como una función de x. En
vez de eso, utilizamos un par de ecuaciones de la forma

x = x(t), y = y(t).

Por ejemplo para partı́cula que describe la circunferencia de la figura 4.10,

x(t) = cos t, y(t) = sen t.

102
t x y
0 1 0
π/2 0 1
π −1 0
3π/2 0 −1
2π 1 0

Cuadro 4.1: Tiempo necesario para completar una revolución

Para este caso el parámetro t representa el tiempo, y vemos que si 0 ≤ t ≤ 2π, la partı́cula
completa una revolución pasados 2π segundos (ver cuadro 4.1)
Se observa que a medida que el parámetro crece de 0 a 2π los puntos se distribuyen sobre
la circunferencia siguiendo la dirección contraria a las manecillas del reloj.

A continuación introducimos la noción de curva en forma general.

Definición 4.7.1. Una aplicación vectorial en R2 es una función definida en un intervalo


I ⊆ R que toma valores en R2 .

En sı́mbolos escribimos

α : I ⊆ R → R2 , α(t) = (x(t), x(t)).

Las funciones x, y : I ⊆ R → R, son llamadas funciones componentes de la aplicación


vectorial α.

Definición 4.7.2. Una curva en el plano es la imagen por medio de una función vectorial
en R2 de un intervalo I de números reales.

Escribimos C = α(I) = {α(t) : t ∈ I}. A la función vectorial α se le llama parametriza-


ción de la curva C. A las funciones componentes x = x(t), y = y(t) de la función vectorial
α, también se les llama ecuaciones paramétricas.

Ejemplo 4.10 (Parametrización de una función en el plano). Sea y = f (x) una función
definida en un intervalo I de números reales. Entonces su gráfica:

C = graf (f ) = {(x, f (x)) : x ∈ I} ,

es muy sencilla de parametrizar, pues vasta definir, α(t) = (t, f (t)), t ∈ I, en tal caso
C = α(I).

103
4.7.1. Ecuación vectorial y normal de la recta
En la sección 1.2 hallamos la ecuación de la recta usando argumentos geométricos. Des-
afortunadamente, este tipo de argumentos no se pueden extender para deducir la ecuación
de una recta, por ejemplo en R3 , por lo que usaremos métodos vectoriales para encontrar la
ecuación de una recta en Rn .

Sea P0 = (x0 , y0 ) un punto dado de la recta. Supongamos además que v es el vector que
la da dirección a la recta l, nos referimos a este vector como vector director. Supongamos
además que P = (x, y) es un punto arbitrario de l ver figura 4.11.

y
l

P b

P0
b

x
O

Figura 4.11: Ecuación de la recta dados un punto y el vector director

Entonces el vector v es paralelo a el vector que va del punto P0 a el punto P , por lo


tanto, existe t ∈ R tal que
−→
P0 P = P − P0 = tv,
o bien,
P = P0 + tv. (4.20)
La ecuación (4.20) es llamada ecuación vectorial de la recta. Como veremos en la sección
4.11 el procedimiento utilizado para encontrar la ecuación (4.20) se puede extender fácilmente
a R3 .

Ahora, si expresemos (4.20) en términos de las componentes de los vectores P, P0 y v


obtenemos
(x, y) = (x0 , y0 ) + t(v1 , v2 ).

104
Aplicando la multiplicación por escalar y la suma de vectores, encontramos que

x = x(t) = x0 + tv1
(4.21)
y = y(t) = y0 + tv2
Con lo cual tenemos entonces las llamadas ecuaciones paramétricas de la recta. De
las ecuaciones (4.21) concluimos que la parametrización de la recta está dada por

α(t) = P0 + tv = (x0 + tv1 , y0 + tv2 ) = (x(t), y(t)), t ∈ R.

Si despejamos el parámetro t en la primera y segunda ecuación en el sistema (4.21) e igua-


lamos obtenemos
x − x0 y − y0
= . (4.22)
v1 v2
La cual se conoce como ecuación simétrica de la recta. Nótese que si despejamos y de
la ecuación (4.22) obtenemos la ecuación cartesiana de la recta.

De la ecuación (4.20) se hace patente que para determinar completamente una recta es
suficiente con un punto el vector director, o bien teniendo dos de sus puntos, como mostra-
remos en el siguiente ejemplo.

Ejemplo 4.11. Parametrizar la recta que pasa por los puntos P y Q.

Solución. Dado que ya tenemos un punto de la recta, por ejemplo, P0 = P , solo falta
−→
determinar el vector director, el cual podemos tomar como v =P Q ver figura 4.12.

y
l

Q
b

−→
P v =P Q
b

x
O

Figura 4.12: Ecuación de la recta dados dos de sus puntos.

105
Por lo tanto, la parametrización de la recta es
−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), t ∈ R.

Ecuación normal de la recta


Vimos en la sección 4.7.1 que para determinar completamente la ecuación de una recta
suficiente con un punto y el vector director, o bien dos puntos de la recta. Veremos a conti-
nuación que también se puede determinar completamente una recta con un punto y el vector
normal a la recta.

Sea P0 = (x0 , y0) un punto dado de la recta l y n = (a, b) el vector normal a l, esto es, el
vector n es ortogonal a cualquier vector sobre la recta l (ver figura 4.13).

vector n trasladado
l
n = (a, b)
P

P0

x
O

Figura 4.13: Ecuación de la recta dados un punto y el vector normal.


−→
Y sea P = (x, y) un punto arbitrario de la recta l. Entonces el vector P0 P está sobre la
recta l de tal forma que
−→
P0 P ·n = 0. (4.23)

La expresión anterior en términos de las componentes de los vectores toma la forma

[(x, y) − (x0 , y0 )] · (a, b) = 0.

106
Lo que equivale a
a(x − x0 ) + b(y − y0 ) = 0 ⇔ ax + by − (ax0 + by0 ) = 0.
Si llamamos c = −(ax0 + by0 ) obtenemos
ax + by + c = 0. (4.24)
La ecuación (4.24) se conoce como ecuación normal de la recta. Se observa que las
componentes del vector normal son los coeficientes de las variables x y y respectivamente.
Nota 4.7.1. En la deducción de la forma normal de la recta, hay un sutileza, en la ecuación
−→ −→
(4.23) el producto punto debe realizarse en realidad entre vectores P0 P y P0 P2 , donde P2 es
el punto final del vector n trasladado. Sin embargo, por el análisis hecho en la sección 3.3,
−→
dado que el vector n es equivalente a el vector geométrico P0 P2 tenemos que
−→
n = P0 P2 .
Por lo tanto,
−→ −→ −→
P0 P ·n =P0 P · P0 P2 = 0.
Ejemplo 4.12. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a
un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|

dmı́n = .
a2 + b2
Solución. Este problema ya se soluciono de forma puramente geométrica en el ejemplo 1.4.
Ahora utilizaremos el vector proyección para resolver el problema.
y
l
P0
b

dmı́n P

P1
P2
vector normal n trasladado
x
O

n = (a, b)

Figura 4.14: La distancia entre el punto P0 y la recta l recta es igual a la proyección escalar
−→
entre vector P0 P y el vector normal n trasladado.

107
En la figura 4.14 trasladamos el vector normal n respetando dirección y magnitud, de tal
forma que su punto inicial coincida con el punto P0 , si el punto final de este vector es P2 ,
−→
entonces el vector P0 P2 es ortogonal a la recta l en el punto P1 . Si P = (x, y) es cualquier
punto de la recta l, vemos que la distancia entre P0 y la recta l; dmı́n = kP0 − P1 k es la
−→ −→
proyección escalar entre el vector P0 P y el vector P0 P2 . Por lo tanto, por el Teorema 3.4.2
inciso (e) tenemos que
−→ −→
−→ | P0 P · P0 P2 |
dmı́n = k Proy −→ P0 P k = −→ .
P0 P2
k P0 P2 k
−→
Ahora, dado que los vector n y el vector geométrico P0 P2 tienen la misma dirección y
magnitud, por (3.1) tenemos que
−→
n = P0 P2 .

De donde concluimos que


−→ −→ −→
−→ | P0 P · P0 P2 | | P0 P ·n|
k Proy −→ P0 P k = −→ = .
P0 P2
k P0 P2 k knk

Con lo cual,
−→
| P0 P ·n|
dmı́n = .
knk
Como la ecuación de la recta está en la forma normal ax + by + c = 0, las componentes
del vector normal son a y b, esto es, n = (a, b). Además dado que (x, y) ∈ l tenemos que
ax + by + c = 0, o bien, ax + by = −c. Entonces
−→
| P0 P ·n|
dmı́n =
knk
|a(x − x0 ) + b(y − y0 )|
= √
a2 + b2
|ax + by − (ax0 + by0 )|
= √
a2 + b2
| − c − ax0 − by0 |
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2

108
Parametrización de la elipse
La ecuación cartesiana de la elipse con centro en (h, k) y semiejes a y b viene dada por
(x − h)2 (y − k)2
+ = 1. (4.25)
a2 b2
Para parametrizar la elipse utilizamos la identidad fundamental
cos2 t + sen2 t = 1.
(x − h)2 2 (y − k)2
Podemos escoger = cos t y = sen2 t, de donde despejando las variables x,
a2 b2
y y obtenemos las ecuaciones paramétricas
x = x(t) = a cos t + h, y = y(t) = b sen t + k.
De lo cual obtenemos que la parametrización de la elipse es
α(t) = (a cos t + h, b sen t + k), 0 ≤ t ≤ 2π. (4.26)
Cuando a = b = R en (4.25) nos da
(x − h)2 + (y − k)2 = R2 , (4.27)
la cual es la ecuación de una circunferencia con centro en (h, k) y radio R.

Parametrización de la cicloide
Ejemplo 4.13 (Cicloide). La curva trazada por un punto en la circunferencia de un cı́rculo
que rueda sin resbalar por una recta se llama cicloide (ver figura 4.15). Si el cı́rculo tiene
radio r y rueda a lo largo del eje x, y un punto P sobre el cicloide empieza en el origen,
parametrice el cicloide.
y

b
C(rθ, r)
r θ
P
Q
y
x x
O T

Figura 4.15: Un punto P sobre la rueda de una bicicleta que se desplaza sobre plano horizontal
genera una curva llamada cicloide.

109
Solución. Elijamos el ángulo de rotación θ del cı́rculo como parámetro, cuando θ = 0,
el punto P está en el origen. Cuando el cı́rculo ha girado θ radianes, la distancia que ha
recorrido desde el origen es

OT = arc P T = rθ

Dado que el centro del cı́rculo está en C(rθ, r), si (x, y) son las coordenadas del punto P ,
entonces, según la figura 4.15

x = OT − P Q = rθ − r sen θ = r(θ − sen θ)


y = T C − QC = r − r cos θ = r(1 − cos θ).

Por lo tanto,

α(θ) = (r(θ − sen θ), r(1 − cos θ)).

La parametrización anterior contempla el caso en que 0 ≤ θ ≤ π/2. Ahora supongamos


que π/2 ≤ θ ≤ π.

P Q
α
b
C(rθ, r)
θ

x
O T

Figura 4.16: Parametrización del cicloide para π/2 ≤ θ ≤ π

En la figura 4.16 el triángulo △P QC es rectángulo en Q. Además,


QC PQ
cos α = , sen α =
PC PC
Dado que P C = r, y α + θ = π tenemos que
y−r
− cos θ = cos(π − θ) = cos α = ,
r

110
de donde

y = r(1 − cos θ).

De manera análoga,
rθ − x
sen θ = sen(π − θ) = sen α = ,
r
o bien

x = r(θ − sen θ).

Y de nuevo obtenemos que

α(θ) = (r(θ − sen θ), r(1 − cos θ)).

La misma parametrización se obtiene en los casos en que π ≤ θ ≤ 3π/2 y 3π/2 ≤ θ ≤ 2π.


Esto completa la parametrización de la cicloide, pues un arco de esta se tiene al variar el
ángulo θ entre 0 y 2π.

4.8. Continuidad y diferenciación de aplicaciones vec-


toriales
Antes de presentar la noción continuidad y diferenciabilidad de aplicaciones vectoriales
debemos especificar el significado de la expresión

lı́m α(t) = L. (4.28)


t→t0

Dado que t, t0 son números reales, la expresión t → t0 significa que |t − t0 | → 0. Para el


caso α(t) y L, puesto que estamos comparando vectores, diremos que α(t) → L si y solo si
kα(t) − (L1 , L2 )k → 0 donde L = (L1 , L2 ) y
p
kα(t) − (L1 , L2 )k = (x(t) − L1 )2 + (y(t) − L2 )2 .

Ahora podemos aclarar el significado de (4.28).

lı́mt→t0 α(t) = L significa que kα(t) − (L1 , L2 )k → 0 siempre que |t − t0 | → 0.

El siguiente resultado nos permite es establecer los conceptos de continuidad de y dife-


renciación de aplicaciones vectoriales en términos de sus funciones componentes.

111
Teorema 4.8.1. Sea α : I ⊆ R → R2 una aplicación vectorial dada por

α(t) = (x(t), y(t)).

El lı́mite lı́mt→t0 α(t) existe si solo si los lı́mites lı́mt→t0 x(t), lı́mt→t0 y(t) existen, más aún,
 
lı́m α(t) = lı́m x(t), lı́m y(t) .
t→t0 t→t0 t→t0

Teorema 4.8.2 (Continuidad de aplicaciones vectoriales). Una aplicación vectorial α : I ⊆


R → R2 , dada por

α(t) = (x(t), y(t)),

es continua en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son continuas en


t = t0 .

4.8.1. Vector tangente


Cuando el parámetro t representa el tiempo la función vectorial α(t) = (x(t), y(t)) repre-
senta el vector posición de una partı́cula que se está moviendo en dos dimensiones, de este
modo, la partı́cula describe una trayectoria C = α(I) (ver la figura 4.17).

y
α′ (t0 )

P
Q

Figura 4.17: El vector velocidad, o vector tangente es igual a el cambio de la posición de la


partı́cula respecto a el tiempo

donde las funciones paramétricas x(t) y y(t) representan la posición en x y y de la


partı́cula en el momento t respectivamente. Supongamos que la partı́cula está en el punto P
en el momento t0 , esto es, α(t0 ) = P y pasado un tiempo h > 0 se encuentra en el punto Q,

112
es decir α(t0 + h) = Q. Tenemos entonces que el cambio en la posición de la partı́cula viene
dado por
−→
P Q= Q − P = α(t0 + h) − α(t0 ).

El vector
α(t0 + h) − α(t0 )
,
h
es secante a la trayectoria C y cuando h → 0, de tal forma que los punto P y Q se aproximan,
tiende a ser el vector tangente a la trayectoria C en el punto P . Por consiguiente, el vector
tangente o vector velocidad de la partı́cula en el momento t0 , el cual se denota por α′ (t0 )
está dado por

α(t0 + h) − α(t0 )
α′ (t0 ) = lı́m , (4.29)
h→0 h
si el lı́mite en la derecha de (4.29) existe. En tal caso diremos que la función α es diferenciable
en t = t0 .

El Teorema 4.8.1 nos permite encontrar una expresión para calcular el vector tangente.

Teorema 4.8.3 (Diferenciabilidad de aplicaciones vectoriales). Una aplicación vectorial α :


I ⊆ R → R2 , dada por

α(t) = (x(t), y(t)),

es diferenciable en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son diferen-


ciables en t = t0 . Más aún, tenemos que

α′ (t0 ) = (x′ (t0 ), y ′(t0 )).

Nota 4.8.1. El Teorema 4.8.3 nos dice que la derivada de una aplicación vectorial es a su
vez una aplicación vectorial, por lo tanto podemos hablar de una aplicación vectorial cuya
derivada sea continua. Decimos que una curva C es suave si su representación vectorial

α(t) = (x(t), y(t)), t ∈ I

es diferenciable con continuidad para todo t ∈ I. Es decir, α′ (t) existe y es continua para
todo punto del intervalo I. La gráfica de una curva suave, se distingue por que no se rompe
y no tiene puntas. Decimos que una curva C, que es diferenciable en un intervalo I, salvo
por un número finito de puntos es suave a trozos.

113
y y y

R
C
x x x

(a) Curva suave (b) Suave a trozos (c) Curva que se rom-
pe

Figura 4.18: Curva suave y suave a trozos

La gráfica de una circunferencia es una curva suave, ver figura 4.18(a). La frontera de
la región R, ver figura 4.18(b), para este caso un triángulo no es una curva suave, pues no
es diferenciable en cada uno de sus vértices. Sin embargo, si es suave a trozos. La gráfica
de la figura 4.18(c) no es suave ni suave a trozos, pues al presentar un número infinito de
discontinuidades no es diferenciable un número infinito de puntos.

Como mencionamos anteriormente, si el parámetro representa el tiempo, el vector posi-


ción de la partı́cula que da determinado por una función vectorial
α(t) = (x(t), y(t)), t ∈ I
si dicha función es diferenciable en t = t0 ∈ I, vimos que el vector velocidad de la partı́cula
en el momento t = t0 está dado por
v(t0 ) = α′ (t0 ),
la magnitud de este vector define la rapidez de la partı́cula en el instante t = t0 , esto es,
v = kv(t0 )k = kα′ (t0 )k.
Si además, la función α′ es diferenciable en t = t0 , el vector aceleración de la partı́cula en
t0 , es decir el cambio de la velocidad con respecto a el tiempo en t0 , está dado por
a(t0 ) = v′ (t0 ) = α′′ (t0 ).

4.9. Movimiento en el plano


4.9.1. Movimiento rectilineo
El movimiento más sencillo que podemos analizar, es el de una partı́cula que se desplaza
sobre una linea recta. Para determinar completamente la posición de una partı́cula que sigue

114
un movimiento rectilineo es suficiente con conocer su velocidad y donde esta inicialmente.
Supongamos que la partı́cula está en el momento t = 0 en el punto P0 y que su velocidad
viene dada por un vector constante v (ver la figura 4.11), entonces el vector posición está
dado por

α(t) = P0 + tv, t ≥ 0. (4.30)

Nótese que α(0) = P0 y α′ (t) = v.

Ejemplo 4.14. Una partı́cula se desplaza en una linea recta con una rapidez constante v
desde el punto P hasta el punto Q. Determinar el vector posición de la partı́cula.

Solución. Por el ejemplo 4.11, la parametrización de la recta está dada por

α(t) = P + t(Q − P ), t ∈ R.

Si resulta que kQ − P k = v, por (4.30) el vector posición de partı́cula es


−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), 0 ≤ t ≤ 1,
−→
donde el vector velocidad está dado por v =P Q= Q − P . Se observa que la partı́cula está
inicialmente en P y pasado un segundo está en el punto Q.

Ahora, si el por el contrario tenemos que kQ − P k =


6 v, consideremos el vector unitario
en la dirección de v = Q − P (ver figura 4.19).

y
l

Q
b

w
−→
P v =P Q
b

u
x
O

Figura 4.19: Podemos determinar la posición de una partı́cula, dados dos puntos de su
trayectoria rectilinea junto con su rapidez.

115
Esto es, definimos
v
u= .
kvk
Entonces el vector w dado por

w = vu,

tiene la misma dirección de v y su magnitud es kwk = v. Por lo tanto, el vector posición de


la partı́cula es

β(t) = P + tw, 0 ≤ t ≤ t1 ,

donde t1 es el tiempo transcurrido para la partı́cula esté en el punto Q, es decir, tenemos


que β(t1 ) = Q. Lo que nos lleva a considerar la siguiente ecuación vectorial

P + t1 w = Q.

Vemos entonces que

t1 v = t1 kwk = kt1 wk = kQ − P k.

Entonces t1 = kQ − P k/v.

En conclusión, la posición en el tiempo t de la partı́cula es

β(t) = P + tw, 0 ≤ t ≤ t1 ,

v Q−P
donde w = vu, u = = y t1 = kQ − P k/v.
kvk kQ − P k

4.10. Movimiento circular uniforme


Consideremos ahora una partı́cula que se está moviendo sobre una circunferencia con
una rapidez constante, es decir, siguiendo un movimiento circular uniforme. Queremos
hallar el vector posición de la partı́cula. Recordemos que la ecuación cartesiana de una
circunferencia con centro en (h, k) y radio R viene dada por

(x − h)2 + (y − k)2 = R2 ,

Si escogemos R2 cos2 t = (x − h)2 y R2 sen2 t = (y − k)2 obtenemos la parametrización

α(t) = (R cos t + h, R sen t + k), 0 ≤ t ≤ 2π.

116
Ahora, nótese que la función vectorial dada por

β(t) = (x(t), y(t)),

donde x(t) = R cos [ω (t − δ)] + h y y(t) = R sen [ω (t − δ)] + k, también parametriza la


circunferencia dada. Más aún, la función β(t) representa el vector posición de una partı́cula
que se mueve sobre la circunferencia con una rapidez angular constante ω. Recordaremos la
rapidez angular ω se define como la tasa de cambio del ángulo barrido por unidad de tiempo,
esto es,

ω= .
dt
Si la rapidez angular es constante, separando variables e integrando obtenemos (ver la sección
4.4.1)

θ = θ(t) = θ0 + ωt.

Si suponemos que θ0 = 0, tenemos que


θ
ω= .
t
Denotamos por T a el periodo de la partı́cula, es decir, el tiempo en completar una revolución.
Dado que una revolución se completa cuando se barre un ángulo de 2π radianes encontramos
que

ω= ,
T
para una rapidez angular constante. La otra constante que aparece en las ecuaciones pa-
ramétricas que definen la función vectorial β es δ, la cual tiene que ver con el punto donde
la partı́cula inicia su movimiento. Nótese además que el hecho de escoger la variable x como
una función cosenosoidal o senosoidal tiene que ver con la orientación que sigue la partı́cula.
Calculemos ahora el vector velocidad y la rapidez de la partı́cula. Tenemos que el vector
velocidad viene dado por

v(t) = β ′ (t) = (−Rω sen [ω (t − δ)] , Rω cos [ω (t − δ)])

Con lo cual la rapidez lineal de la partı́cula está dada por

v = kβ ′ (t)k = Rω.

Cambio en la orientación de una curva


117
Consideremos las funciones vectoriales

α(t) = (cos t, sen t), 0 ≤ t ≤ 2π,


β(t) = (cos t, − sen t), 0 ≤ t ≤ 2π.

Ambas parametrizan la circunferencia x2 + y 2 = 1 y tienen el mismo punto inicial y final. Sin


embargo, cuando el parámetro varia entre 0 y 2π, en la primera parametrización los puntos
se distribuyen sobre la circunferencia siguiendo la dirección contraria de las manecillas del
reloj, mientras que la segunda parametrización lo hacen siguiendo las manecillas del reloj.
Como puede comprobarse ambas parametrizaciones se relacionan por la ecuación

β(t) = α(2π − t),

La cual es un caso particular de lo que denominaremos fórmula de inversión. En general,


si un función vectorial α(t) = (x(t), y(t)), a ≤ t ≤ b parametriza una curva C, entonces la
función

β(t) := α(a + b − t) (Fórmula de inversión)

también parametriza la curva C pero induciendo la dirección contraria a la que induce la


función α sobre esta. Denotamos la curva generada por la función β por −C.

Ejemplo 4.15. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección


contraria a las de las manecillas del reloj con una rapidez constante de 2m/s. Encuentre el
vector posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (1, 0) y
da una revolución completa.

Solución. Tenemos que la rapidez lineal de la partı́cula está dada por v = 2m/s, y dado
que R = 1 y v = ωR tenemos que ω = 2 rad /s. Teniendo la rapidez angular podemos
hallar el periodo de la partı́cula con la fórmula ω = 2π/T , de donde T = πs. Suponemos
que la posición en x que sigue la partı́cula es una función cosenosoidal, la cual inducirá una
dirección sobre la curva, si resulta que no es la dirección que se pide en el problema, entonces
utilizamos la fórmula de inversión para obtener la dirección pedida. Además como el centro
de la circunferencia es (h, k) = (0, 0), el vector posición de la partı́cula es de la forma

α(t) = (cos 2(t − δ), sen 2(t − δ)),

donde queda por determinar la constante δ, lo cual podemos hallar con la condición inicial
α(0) = (cos 2(0 − δ), sen 2(0 − δ)) = (1, 0). Obtenemos:

cos 2δ = 1, − sen 2δ = 0.

118
El único ángulo en el intervalo [0, π] que satisface simultáneamente las ecuaciones anteriores
es 0. En consecuencia, δ = 0. Concluimos que el vector posición de la partı́cula es

α(t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.

A modo de comprobación, nótese que, α(0) = (1, 0) = α(π). Ademas, la velocidad en el


instante t es

v(t) = α′ (t) = (−2 sen 2t, 2 cos 2t).

Con lo cual la rapidez de la partı́cula es

kv(t)k = k(−2 sen 2t, 2 cos 2t)k = 2m/s.

Además la parametrización encontrada induce la dirección contraria de las manecillas del


reloj en la circunferencia.

4.10.1. Movimiento con aceleración constante


Supongamos que una partı́cula se desplaza con aceleración constante, esto es, el vector
aceleración a(t) no cambia, ni en dirección ni magnitud, esto implica que las componentes
ax (t) y ay (t) son a su vez constantes para todo tiempo t. Es decir tenemos que

x′′ (t) = ax (t) = cte, y ′′(t) = ay (t) = cte.

El movimiento con aceleración constante en una dimensión ya se analizó en la subsección


4.4.1, en donde se concluyó que

x(t) = x0 + vox t + (1/2)ax (t)t2 , y(t) = y0 + voy t + (1/2)ay (t)t2 ,

ver ecuación (4.12). De esta forma vemos que

α(t) = (x(t), y(t))


= (x, y)
= (x0 + vox t + (1/2)ax (t)t2 , y0 + voy t + (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox t, voy t) + ((1/2)ax (t)t2 , (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox , voy )t + (1/2)(ax (t), ay (t))t2
= x0 + v0 t + (1/2)a(t)t2 .

Concluimos entonces que el vector posición para una partı́cula que se desplaza con aceleración
constante es

α(t) = x0 + v0 t + (1/2)at2 . (4.31)

119
Un tipo especial de movimiento con aceleración constante lo constituye el movimiento
parabólico. Aquı́ se supone que la partı́cula se desplaza bajo única influencia de fuerza
gravitatoria. Entonces demostraremos que cuando es disparada con una velocidad inicial v0
la partı́cula sigue una trayectoria parabólica (ver figura 4.20)

y
vy = 0 vxo
b

g
v0

vyo
θ0
b b
x
O vxo

Figura 4.20: Cuando un proyectil es lanzado desde el origen con una inicial v0 describe una
trayectoria parabólica. Nótese además, que el proyectil alcanza su altura máxima cuando
vy = 0.

Para hallar el vector posición del proyectil, utilizamos (4.31) con x0 = (0, 0) y a(t) = g =
(0, −g) donde g = 9,8m/s2 , es la aceleración de la gravedad, con lo cual obtenemos

α(t) = (x(t), y(t)) = v0 t + (1/2)gt2


= (vox t, voy t) + (0, −(1/2)gt2)
= (vox t, voy t − (1/2)gt2)

En consecuencia, la posición en x es

x(t) = vox t = v0 cos θ0 t, (4.32)

donde v0 = kv0 k. Vemos entonces que la trayectoria seguida por el proyectil en x queda
descrita por un movimiento con velocidad constante. La posición en y está dada por

y(t) = voy t − (1/2)gt2 = v0 sen θ0 t − (1/2)gt2 , (4.33)

de modo que el movimiento en y del proyectil queda descrito por un movimiento de caı́da
libre.

120
De esta forma vemos que el movimiento del proyectil es un combinado entre un movi-
miento con velocidad constante y un movimiento de caı́da libre.

Ahora despejando t en (4.32) y reemplazando el resultado en (4.33) obtenemos


v0 sen θ0 x
y = y(t) = x − (1/2)g
v0 cos θ0 (v cos θ0 )2
  0
g
= (tan θ0 ) x − 2
x2 .
2v0 cos2 θ0
Es decir, al eliminar el parámetro t, obtenemos la ecuación de una parábola de la forma
 
g
y = (tan θ0 ) x − x2 . (4.34)
2v02 cos2 θ0
Alcance horizontal y altura máxima de un proyectil
En la figura 4.20 vemos que el proyectil alcanza su altura máxima cuando vy = 0. Debemos
entonces encontrar una expresión para vy como función del tiempo. Derivando (4.33) respecto
a t obtenemos
dy
vy (t) = = v0y − gt = v0 sen θ0 − gt.
dt
Por lo tanto,
vy = 0 ⇔ v0 sen θ0 − gt = 0.
Con lo cual el proyectil alcanza su altura máxima después de un tiempo t1 dado por
v0 sen θ0
t1 = .
g
Entonces la altura máxima del proyectil es
hmáx = h(t1 )
 2
v0 sen θ0 1 v0 sen θ0
= (v0 sen θ0 ) − g
g 2 g
2 2
v sen θ0
= 0 .
2g
Ahora, dado que el tiempo de vuelo es tv = 2t1 , el alcance horizontal está dado por
R = x(tv ) = x(2t1 )
2v0 sen θ0
= (v0 cos θ0 )
g
2
2v sen θ0 cos θ0
= 0
g
2
v sen 2θ0
= 0 .
g

121
4.10.2. Fuerza resultante
Una de las principales aplicaciones de los vectores, se presenta, en la solución de problemas
mediante el uso de la segunda ley Newton, la cual establece que la fuerza neta que actúa
sobre un cuerpo es igual a el producto de masa por su aceleración, en términos matemáticos
esto se expresa con una ecuación vectorial:

F = ma (Segunda ley de Newton)

La masa m de la partı́cula es una cantidad escalar, por lo tanto, lo que define la fuerza que
actúa sobre un cuerpo es la multiplicación por escalar entre su masa y su aceleración. Lo que
queremos decir con fuerza neta, es la fuerza resultante o sumatoria de fuerzas que actúan
sobre el cuerpo, por ejemplo, si n fuerzas F1 , . . . , Fn actúan sobre un cuerpo de masa m por
la segunda ley de Newton tendrı́amos que

F1 + · · · + Fn = ma.

Ahora si suponemos que la partı́cula se está moviendo en dos dimensiones, al descomponer


cada vector fuerza y el vector aceleración encontramos que

Fi = (Fix , Fiy ) , 1 ≤ i ≤ n, a = (ax , ay ) .

Por lo tanto, por la definición de igualdad y suma entre vectores tenemos que
X
Fx = F1x + · · · + Fnx = max
X
Fy = F1y + · · · + Fny = may .

Cuando la fuerza resultante es cero, la aceleración de la partı́cula también es cero, decimos


que la partı́cula está en equilibrio. En este caso
X
Fx = 0
X
Fy = 0.

Problema 4.10.1. Considere un peso de w Newtons suspendido por dos alambres como se
muestra en el diagrama, donde T1 y T2 son vectores de fuerza dirigidos a lo largo de los
alambres. Obtenga los vectores T1 y T2 y demuestre que sus magnitudes son
w cos α w cos β
kT1 k = y kT1 k =
sen(α + β) sen(α + β)

122
α β

T2 T1

α β

Figura 4.21: Una masa de peso w es suspendida por dos cables con tensiones T1 y T2

Solución. Según la gráfica de la figura 4.21 las direcciones de los vectores de fuerza T1 , T2
y w son respectivamente, β, π − α y 3π/2. En consecuencia tenemos que

T1x = kT1 k cos β,


T2x = kT2 k cos(π − α) = −kT2 k cos α
wx = kwk cos(3π/2) = 0,
T1y = kT1 k sen β,
T2y = kT2 k sen(π − α) = kT2 k sen α
wy = kwk sen(3π/2) = −w.

Ahora dado que la masa de peso w = kwk se encuentra en reposo se debe tener que
X
Fx = T1x + T2x + wx = 0
X
Fy = T1y + T2y + wy = 0.

Que equivale a
X
Fx = kT1 k cos β − kT2 k cos α + 0 = 0
X
Fy = kT1 k sen β + kT2 k sen α − w = 0.

Definamos x = kT1 k y y = kT2 k. Entonces tenemos un sistema de ecuaciones lineales de


tamaño 2 × 2 
cos βx − cos αy = 0
sen βx + sen αy = w
Que en forma matricial se expresa como
    
cos β − cos α x 0
=
sen β sen α y w

123
 
cos β − cos α
Aquı́, la matriz de coeficientes es A = , con lo cual
sen β sen α

D := det A = sen α cos β + sen β cos α = sen(α + β).

Descontamos los casos en que α + β = 0, π, de tal forma que det A = sen(α + β) 6= 0.


Entonces por la Regla de Krammer
D1 D2
x= ,y = ,
D D
donde

0 − cos α cos β 0
D1 =
= w cos α, D1 =
= w cos β.
w sen α sen β w

Por consiguiente,
D1 w cos α D2 w cos β
kT1 k = = , kT2 k = = .
D sen(α + β) D sen(α + β)
Teniendo las magnitudes y direcciones de los vectores de fuerza T1 y T2 podemos obtener
dichos vectores. Para el vector T1 tenemos
w cos α cos β
T1x = kT1 k cos β = .
sen(α + β)
w cos α sen β
T1y = kT1 k sen β = .
sen(α + β)
Por lo tanto,
w cos α cos β w cos α sen β
T1 = i+ j.
sen(α + β) sen(α + β)
Y para el vector T2 tenemos que
−w cos β cos α
T2x = kT2 k cos(π − α) = .
sen(α + β)
w cos β sen α
T2y = kT2 k sen(π − α) = .
sen(α + β)
En consecuencia,
−w cos β cos α w cos β sen α
T2 = i+ j.
sen(α + β) sen(α + β)

124
4.11. Vectores en el espacio
Se define el espacio Euclideo de tres dimensiones como el conjunto de todas la triplas
ordenadas de números reales (x, y, z), esto es,

R3 = {(x, y, z) : x, y, z ∈ R} .

En analogı́a como se definió un vector en el plano, definimos un vector de R3 como un tripla


ordenada de números reales (Ax , Ay , Az ). La noción de vector geométrico (ver el problema
4.15.18) también se puede introducir en el espacio, por lo que escribimos A = (Ax , Ay , Az )
−→
en lugar de OA para denotar el vector A. Dado que cada componente Ax , Ay , Az de A puede
ser positiva o negativa, dividimos el espacio en 8 regiones llamadas octantes, en la figura
4.22 se muestra una caja rectangular ubicada en el primer octante (x, y, z ≥ 0).

O
P b

Q y
Figura 4.22: Magnitud o norma de un vector en el espacio

La diagonal de esta caja, el segmento que va del origen a el punto A, es la magnitud del
vector A, que vendrı́a a ser la hipotenusa del triángulo rectángulo △OQA. Por el Teorema
de Pitágoras tenemos que

kAk2 = |OA|2
= |OQ|2 + |QA|2
= |OQ|2 + A2z .

Como el punto Q tiene coordenadas (Ax , Ay , 0), de nuevo por el Teorema de Pitágoras, esta
vez aplicado en el triángulo △OP Q obtenemos que

|OQ|2 = |OP |2 + |P Q|2


= A2x + A2y .

125
Por lo tanto, tenemos que la magnitud del vector A está dada por
q
kAk = A2x + A2y + A2z .

Utilizando la noción de norma de un vector junto con el concepto de vector geométrico


podemos establecer una fórmula para la distancia entre dos puntos en el espacio.

Teorema 4.11.1. Sean P = (x1 , x2 , x3 ) y Q = (y1 , y2 , y3 ) dos puntos en el espacio. Entonces


−→
la distancia entre P y Q está dada por la norma del vector geométrico P Q, esto es,
−→ p
d(P, Q) = k P Q k = kQ − P k = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .

En el caso de R3 no se puede definir la dirección del vector A como el ángulo θ que forma
el vector con el eje x ya que, por ejemplo, si 0 < θ < π/2, existe un número infinito de
vectores con la misma magnitud que forman el mismo ángulo θ con el eje x, el conjunto de
dichos vectores forman el cono mostrado en la figura 4.23.

θ O
b
θ
y
x
Figura 4.23: Todos los vectores sobre el cono forman un ángulo θ con el eje x

La dirección de un vector en R3 , formalmente se define como sigue

Definición 4.11.1. La dirección de un vector no nulo A en R3 se define como el vector


unitario
A
u= .
kAk

Sin embargo, también podemos definir la dirección de un vector en R3 en términos de


−→
ángulos. Los ángulos α, β y γ que forma el vector A =OA con cada uno de los ejes coorde-
nados, x, y y z son llamados ángulos directores del vector A. Entonces como se muestra
en la figura 4.24 del triángulo rectángulo △OAP tenemos que
x
cos α = .
kAk

126
De manera similar, utilizando los triángulos rectángulos △OAQ y △OAR encontramos que
y z
cos β = , cos γ = .
kAk kAk

Por definición, cada uno de estos ángulos está en el intervalo [0, π]. Los cosenos de estos
ángulos son llamados cosenos directores. Podemos entonces expresar cualquier vector de
R3 en términos de estos cosenos directores

A = (x, y, z) = (kAk cos α, kAk cos β, kAk cos γ). (4.35)

b
R

γ
O A
β
α
P b

x
b
Q
y

Figura 4.24: El vector A forma un ángulo α con lado positivo del eje x, β con el lado positivo
del eje y y γ con el eje positvo del eje z

Se observa que si el vector es unitario tenemos que

A = (cos α, cos β, cos γ).

Además para todo vector A

cos2 α + cos2 β + cos2 γ = 1

4.12. Producto cruz


Como se vio en el ejemplo 4.11 dos puntos determinan completamente una recta. Como
veremos en la sección 4.13 tres puntos no colineales (que no están en la misma recta) de-
terminan completamente un plano. Otra forma de determinar completamente un plano es
teniendo un punto y su vector normal, este último vector podemos compararlo con el vector

127
director para el caso de la recta, pues en cierto sentido da la dirección al plano. Supóngase
que queremos determinar la ecuación un plano π sabiendo que conocemos tres de sus puntos
P , Q y R.

π
P
Q

Figura 4.25: El vector normal al plano π es obtenido como el producto cruz entre los vectores
−→ −→
geométricos P Q y P R

Como se ve en la figura 4.25, n es el vector normal al plano, por lo tanto ha de ser


perpendicular a cualquier vector que este sobre este, en particular debe ser perpendicular
−→ −→
a los vectores geométricos P Q y P R. Si estos vectores tienen coordenadas (a1 , b1 , c1 ) y
(a2 , b2 , c2 ) respectivamente, y las coordenadas del vector n son (a, b, c), entonces tenemos
que

(a1 , b1 , c1 ) · (a, b, c) = 0
(a1 , b1 , c1 ) · (a, b, c) = 0,

o bien

a1 a + b1 b + c1 c = 0
(4.36)
a2 a + b2 b + c2 c = 0
En el sistema (4.36) tomamos como variables las componentes del vector normal a, b y c.
Entonces por la regla de Krammer obtenemos para a y b

−c1 c b1 a1 −c1 c

−c2 c b2 c(b1 c2 − b2 c1 ) a2 −c2 c c(a2 c1 − a1 c2 )
a= = ,b = = ·
a1 b1 a1 b2 − a2 b1 a1 b1 a1 b2 − a2 b1

a2 b2 a2 b2

128
De esta forma vemos que

c(b1 c2 − b2 c1 ) c(a2 c1 − a1 c2 )

n = (a, b, c) = , ,c
a1 b2 − a2 b1 a1 b2 − a2 b1
c
= (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ).
a1 b2 − a2 b1
Ahora bien, como puede comprobarse las ecuaciones que conforman (4.36) se verifican si-
multáneamente si tomamos c = a1 b2 − a2 b1 . Por lo tanto, una solución del sistema (4.36)
está dada por

a = b1 c2 − b2 c1 , b = a2 c1 − a1 c2 y c = a1 b2 − a2 b1 .

Lo que significa que dados dos vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ), el vector

n := (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ),

es perpendicular a ambos, dicho vector se conoce como producto cruz o producto vec-
torial de los vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ).

El análisis hecho anteriormente justifica la siguiente definición.

Definición 4.12.1 (Producto cruz). Sean A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ) dos vectores de


R3 . El producto cruz entre A y B se denota por A × B y define como

A × B = (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ). (4.37)

Si definimos la matriz

a11 a12 a13

A = a1 b1 c1
a b2 c2
2

y desarrollamos su determinante por la primera fila obtenemos

|A| = a11 A11 + a12 A12 + a13 A13


= a11 (b1 c2 − b2 c1 ) + a12 (a2 c1 − a1 c2 ) + a13 (a1 b2 − a2 b1 ).

Vemos que las componentes del producto vectorial son precisamente los cofactores de la
matriz A en el desarrollo anterior, por lo tanto podemos expresar el producto vectorial como
sigue

A × B = (A11 , A12 , A13 ) = A11 i + A12 j + A13 k,

129
donde i, j y k son los vectores coordenados unitarios de R3 . La última expresión para el
producto cruz en términos de estos vectores nos permite escribir

i j k

A × B = a1 b1 c1 (4.38)
a b c
2 2 2

La fórmula (4.38) no solo evita la memorización de la tediosa fórmula en (4.37) si no que es


muy útil a la hora de demostrar las propiedades del producto cruz.
Teorema 4.12.1 (Propiedades del producto cruz). Sean A, B y C vectores en R3 y α
escalar, entonces
(a) A × 0 = 0.
(b) A × B = −B × A (propiedad anticonmutativa para el producto vectorial)
(c) (αA) × B = α(A × B).
(d) A × (B + C) = A × B + A × C
(propiedad distributiva para el producto vectorial)
(e) (A × B) · C = A · (B × C) (triple producto escalar)
(f ) (A × B) · A = (A × B) · B = 0.
(g) A × B = 0 ⇔ A k B.
(h) kA × Bk2 = kAk2 kBk2 − (A · B)2 (identidad de Lagrange)
Utilizando la identidad de Lagrange podemos demostrar que la magnitud del producto
cruz está dada por
kA × Bk = kAkkBk sen θ (4.39)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.

Existe un interpretación interesante de (4.39).

h
θ A

Figura 4.26: El área del paralelogramo determinado por los vectores A y B es igual a la
magnitud del pruducto cruz entre estos vectores.

130
En la figura 4.26 el paralelogramo determinado por los vectores A y B tiene como base
la magnitud del vector A, dado que su altura es h, su área está dada por kAkh, pero

h = kBk sen θ.

Entonces el área del paralelogramo es kAkkBk sen θ, que es precisamente la magnitud del
producto cruz entre A y B. Concluimos que:

El área del paralelogramo determinado por los vectores A y B es igual a la magnitud del
producto cruz entre ellos.
Combinando (4.38) y (4.39) podemos hacer una interpretación geométrica del determi-
nante de tamaño 2 × 2 (ver sección 2.2). Supongamos que el paralelogramo de la figura 4.26
está dispuesto sobre el plano xy, y que los vectores A y B tienen componentes (a, c, 0) y
(b, d, 0) respectivamente. Entonces el producto cruz entre estos vectores es

i j k

A × B = a c 0 = i(0) − j(0) + k(ad − bc) = (0, 0, ad − bc).
b d 0

Con lo cual,

kA × Bk = |ad − bc|

La parte derecha de la ecuación anterior, es el valor absoluto del determinante de la matriz


 
a b
A :=
c d

Concluimos que el área del paralelogramo determinado por los vectores A y B es igual
al determinante de la matriz formada por estos, vistos como vectores columna.

Ejemplo 4.16 (Examen conjunto de Álgebra lineal 6 de junio de 2018 punto 10). En la
plazoleta principal de la Universidad se quiere construir en centro de descanso para los estu-
diantes. La plazoleta tendrá un techo cubierto en forma triangular. El ingeniero encargado
ubicó los soportes en los puntos A = (2, 3, 3), B = (5, 6, 4) y C = (3, 6, 8) con cada entrada
medida en metros.

(a) El techo se sostendrá con alambre de acero, indique la cantidad de alambre que se
necesita para sostener el techo.

(b) El techo utilizará una lona de color blanco, indique la cantidad de metros cuadrados
empleados en el techo.

131
4.13. Rectas y planos en el espacio
Como se menciono en la sección 4.7.1 mediante métodos vectoriales se puede extender la
noción recta a Rn . En particular para el caso de R3 la ecuación vectorial de la recta viene
dada en la forma

P = P0 + tv, (4.40)

donde P = (x, y, z) es un punto arbitrario de la recta, P0 = (x0 , y0 , z0 ) un punto dado


y v = (v1 , v2 , v3 ) es el vector director. Con la ecuación vectorial podemos encontrar las
ecuaciones paramétricas y simétricas de la recta

 x = x(t) = x0 + tv1
y = y(t) = y0 + tv2 (Ecuaciones paramétricas de la recta)
z = z(t) = z0 + tv3

x − x0 y − y0 z − z0
= = (Ecuaciones simétricas de la recta)
v1 v2 v3
Las nociones de paralelismo y ortogonalidad entre rectas vienen dadas en términos de los
vectores directores.

Definición 4.13.1.

4.14. Aplicaciones de los vectores en el espacio

4.15. Problemas

Movimiento en una dimensión


Problema 4.15.1. La altura de una partı́cula en función del tiempo viene dada por la
parábola

132
y = y(t)

101,25

50

x
O 9 9
2

Figura 4.27: Gráfica de la posición de una partı́cula respecto al tiempo

(a) Utilizar la gráfica que se muestra el la figura 4.27 para hallar el domino de la función
que representa la altura de la partı́cula como función del tiempo, ¿qué representa este
dominio?

(b) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.

(c) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.

(d) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.

Problema 4.15.2. La altura de una partı́cula en función del tiempo viene dada por la
parábola

133
y = y(t)

500

250

x
O 10 20

(a) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.

(b) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.

(c) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.

Sección 4.9. Movimiento en el plano


Problema 4.15.3. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).

(a) Halle el vector posición de un punto de su borde, si está inicialmente en O.

(b) Halle las componentes de la velocidad y aceleración del punto.

(c) Dibuje la velocidad y la aceleración del punto.

(d) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.

Problema 4.15.4. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4

134
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 + 6x − 2y = −9

Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas.

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.15.5. La posición de una partı́cula en el momento t está dada por elipse

x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 − 6x − 2y = −9.

Esta segunda partı́cula empieza su movimiento en el punto (4, 1) y sigue la dirección contraria
de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.15.6. La posición de una partı́cula en el momento t está dada por

x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π

y una segunda partı́cula tiene posición

x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π

(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

135
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión

(c) Describa la situación si la segunda partı́cula tiene la trayectoria

x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.

Problema 4.15.7 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?

Problema 4.15.8 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en


dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa. Resuelva este problema de dos formas distintas.

Subsección 3.2.1. Vector resultante


Problema 4.15.9 (Navegación: dirección y rumbo). Un piloto parte de un aeropuerto y se
dirige en dirección N 20◦ E, volando con una rapidez de 200 mi/h. Después de una hora hace
una corrección de curso y se dirige en la dirección N 40◦ E. Media hora después, un problema
en el motor obliga a hacer un aterrizaje de emergencia.

(a) Encuentre la distancia entre el aeropuerto y su punto de aterrizaje final.

(b) Encuentre el rumbo desde aeropuerto hasta su punto final de aterrizaje.

Problema 4.15.10. Sean A y B dos vectores de R2 . Utilizar el teorema del coseno (ver
ejemplo 2.1) para demostrar que

kRk2 = kA + Bk2 = kAk2 + kBk2 + 2kAkkBk cos θ, (4.41)

donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Hacer las gráfica correspondiente.

Subsección 3.4. Movimiento relativo


Problema 4.15.11 (Velocidad verdadera de un avión). Un avión vuela por un viento que
fluye con una rapidez de 55mi/h en la dirección N 30◦ E. El avión tiene una rapidez de
765mi/h respecto al aire, y el piloto dirige son avión en la dirección N 45◦ E.

136
(a) Halle la velocidad del viento, en términos de los vectores coordenados unitarios.

(b) Halle la velocidad del avión con respecto al aire, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del avión con respecto a la tierra, en términos de los vectores coor-
denados unitarios.

(d) Determine la rapidez y dirección verdaderas del avión.

Problema 4.15.12 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y


dirección verdaderas del avión del problema 4.15.11 si el piloto dirige el avión en la dirección
N 30◦ O.
Problema 4.15.13 (Velocidad de un avión respecto a la tierra). ¿En qué dirección debe
dirigir el avión el piloto del problema 4.15.11 para que el curso verdadero sea al norte?
Problema 4.15.14 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.15.15 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.

(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.

(d) Determine la rapidez y dirección verdaderas del bote.


Problema 4.15.16 (Velocidad de un bote). El navegador del problema 4.15.15 quiere llegar
a un punto en la orilla norte del rı́o directamente opuesto la punto de partida. ¿En qué
dirección debe dirigir el bote?
Problema 4.15.17. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en direc-
ción contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando
su movimiento en el punto (1, 0). Pasados (π/8)s se encuentra por primera vez con otra
partı́cula que se desplaza en la dirección S45◦ O. Si esta segunda partı́cula se mueve con una
16
rapidez constante de m/s,¿después de cuánto tiempo se vuelven a encontrar?

137
Sección 4.11. Vectores en el espacio
Problema 4.15.18. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )
−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .

Sección 4.12. Producto cruz


Problema 4.15.19. Demuestre que si u, v, w y r son vectores en el espacio, entonces

(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.

(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.



u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r

Problema 4.15.20. Utilice el producto cruz para demostrar que

sen(A − B) = sen A cos B − sen B cos A.

Sección 4.13. Rectas y planos en el espacio


Problema 4.15.21. Calcule la distancia entre las rectas
x−2 y−5 z−1 x−2 y−5 z−1
L1 : = = y L2 : = =
3 2 −1 3 2 −1
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.

138
Problema 4.15.22. Demuestre que las rectas

x = a1 s + b1 , y = a2 s + b2 , z = a3 s + b3 , s ∈ R,
x = c1 t + d1 , y = c2 t + d2 , z = c3 t + d3 , t ∈ R,

se cortan o son paralelas si y sólo si



a1 c1 b1 − d1


a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3

Problema 4.15.23. Demuestre que la distancia del punto P0 = (x0 , y0, z0 ) al plano

π = (x, y, z) ∈ R3 : ax + by + cz + d = 0 ,


está dada por

|ax0 + by0 + cz0 + d|


dmı́n = √ .
a2 + b2 + c2
Problema 4.15.24. Demuestre que

x1 − x y1 − y z1 − z


x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3

es una ecuación del plano que pasa por los tres puntos no colineales

P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).

Sección 4.14. Aplicaciones de los vectores en el espacio


Problema 4.15.25 (***). Una partı́cula se desplaza sobre la curva de intersección de las

superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.

4.16. Taller 2 corte 2


Problema 4.16.1. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).

139
(a) Halle el vector posición de un punto P de su borde, si está inicialmente en O.

(b) Halle las componentes de la velocidad y aceleración del punto P .

(c) Muestre que la rapidez del punto P en el instante t está dada por
V0 t
kv(t)k = kα′ (t)k = 2V0 sen .
2R

(d) Dibuje la velocidad y la aceleración del punto.

(e) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.

Problema 4.16.2 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?

Problema 4.16.3. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por

x2 + y 2 + 6x − 2y = −9

Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.

(a) Halle el vector posición para ambas partı́culas.

(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.

Problema 4.16.4. La posición de una partı́cula en el momento t está dada por

x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π

y una segunda partı́cula tiene posición

x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π

140
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?

(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión

(c) Describa la situación si la segunda partı́cula tiene la trayectoria

x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.

Problema 4.16.5 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y


dirección verdaderas del avión del problema 4.15.11 si el piloto dirige el avión en la dirección
N 30◦ O.

Problema 4.16.6 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?

Problema 4.16.7 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.

(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.

(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.

(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.

(d) Determine la rapidez y dirección verdaderas del bote.

Problema 4.16.8. Una partı́cula se desplaza sobre la circunferencia x2 +y 2 = 4 en dirección


contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (2, 0). Una segunda partı́cula su mueve sobre la circunferencia

x2 + y 2 − 4x = 0,

en dirección contraria a las de las manecillas del reloj con una rapidez constante de 4m/s
empezando su movimiento en el punto (4, 0).

(a) Grafique las trayectorias seguidas por ambas partı́culas.

(b) Halle el vector posición de cada partı́cula.

141
(c) Halle los puntos, o punto de colisión de las partı́culas.

Problema 4.16.9. En la figura 4.28 considere un peso suspendido por dos alambres. Obtenga
la magnitud y componentes de los vectores F1 y F2 , y los ángulos α y β. Ver el problema
4.10.1.
5m
α β

F1 F2
3m
4m

100N

Figura 4.28: Una masa de peso 100N es suspendida por dos alambres representados por los
vectores F1 y F2

Recuerde que 1N = 1Kg · m/s2 .

Problema 4.16.10 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en


dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa.

Problema 4.16.11. Una avión tiene una rapidez en el aire de 250mi/h, el piloto desea
volar hacia el norte. Suponiendo que prevalezca un viento de 60mi/h hacia el este,

(a) ¿cuál debe ser el enfilamiento del avión?

(b) ¿Cúal será la rapidez a tierra cuando viaja en dicho curso?.

Realizar las gráficas correspondientes para ilustrar la situación.

Problema 4.16.12 (***). Un piloto tiene que volar hacia el este de A a B y después regresar
hacia el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto
a la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.

(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c

142
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2

(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2

(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?

Realizar las gráficas correspondientes para ilustrar la situación.

Ver el problema 3.4.1 para solución del caso 1 del inciso (b), y el caso 1 del inciso (c).

Problema 4.16.13 (***). Dos nadadores, Alan y Camillé, parten desde el mismo punto en
la orilla de una corriente ancha que circula con una rapidez v. Ambos se mueven con la misma
rapidez c (donde c > v) en relación con el agua. Alan nada corriente abajo una distancia L
y luego corriente arriba la misma distancia. Camillé nada de modo que su movimiento en
relación con la Tierra es perpendicular a las orillas de la corriente. Ella nada la distancia
L y luego de vuelta la misma distancia, de modo que ambos nadadores regresan al punto de
partida. ¿Cuál nadador regresa primero? Nota : P rimero suponga la respuesta.

Problema 4.16.14. Una pelota de golf es golpeada con una rapidez inicial v0 formando un
ángulo α con respecto a la horizontal desde un punto que está al pie de una colina que forma
un ángulo de inclinación φ con la horizontal donde

0 < φ < α < π/2.

Demuestre que la pelota toca tierra a una distancia

2v02 cos α
sen(α − φ),
g cos2 φ
medida sobre la colina. Demuestre que el mayor alcance que se puede lograr para un v0 dado
ocurre cuando α = (φ/2) + (π/4); es decir, cuando el vector velocidad inicial biseca el ángulo
entre la vertical y la colina.

143
Capı́tulo 5

Espacios vectoriales

5.1. Definición y propiedades


Definición 5.1.1 (Espacio vectorial). Sea V un conjunto no vacı́o de objetos llamados
elementos. El conjunto V es llamado espacio vectorial sobre el campo F si satisface
cada uno de los siguientes diez axiomas

Axiomas de cerradura
Axioma 5.1.1 (Cerradura respecto a la suma). Para cada par elementos x, y ∈ V corres-
ponde un único elemento de V llamado suma de x, y, denotado por x + y.
Axioma 5.1.2 (Cerradura respecto al producto por escalar). Para cada x ∈ V y cada λ ∈ F
corresponde un único elemento de V llamado producto por escalar entre λ y x, denotado
por λx.
Axiomas para la suma
Axioma 5.1.3 (Ley conmutativa). Para todo x, y ∈ V , tenemos que

x + y = y + x.

Axioma 5.1.4 (Ley asociativa). Para todo x, y, z ∈ V , tenemos que

(x + y) + z = x + (y + z).

Axioma 5.1.5 (Existencia de elemento neutro). Para cada x ∈ V existe 0 ∈ V , tal que

x + 0 = x.

Axioma 5.1.6 (Existencia de inverso aditivo). Para cada x ∈ V existe y ∈ V denotado por
(−1)x tal que

x + (−1)x = 0.

144
Axiomas para el producto por escalar

Axioma 5.1.7 (Ley asociativa). Para x ∈ V y α, β ∈ F , tenemos que

α(βx) = (αβ)x.

Axioma 5.1.8 (Ley distributiva de la suma con respecto al producto por escalar). Para
x, y ∈ V y α ∈ F , tenemos que

α(x + y) = αx + αy.

Axioma 5.1.9 (Ley distributiva de la suma de escalares con respecto al producto por
escalar). Para x ∈ V y α, β ∈ F , tenemos que

(α + β)x = αx + βx.

Axioma 5.1.10 (Existencia de elemento identidad). Para x ∈ V , tenemos que

1x = x.

Cuando F = R, decimos que V es un espacio vectorial sobre el campo de los números


reales o espacio vectorial real. Si F = C, decimos que V es un espacio vectorial sobre el
campo de los números complejos o espacio vectorial complejo. A menudo nos referiremos a
los elemento de V como vectores.

5.1.1. Ejemplos de espacios vectoriales


Cada uno de los siguientes conjuntos es un espacio vectorial sobre el campo de los números
reales

Ejemplo 5.1. (a) Sea V = R, el conjunto de los números reales y F = R

(b) V = Rn , el espacio Euclideo de n dimensiones, con F = R y la suma y el producto por


escalar definidas como sigue. Para x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) en Rn y λ ∈ R

x + y = (x1 + y2 , . . . , xn + yn ), λx = (λx1 , . . . , λxn ).

(c) Sea V el conjunto de todos los vectores en Rn que son ortogonales a un vector no nulo
dado n.

(d) Sea V el conjunto de todas las funciones definidas en un intervalo dado I, con la suma
y producto por escalar usual de funciones, esto es,

(f + g)(x) = f (x) + g(x), (λf )(x) = λf (x).

145
(e) El conjunto de todas la matrices de tamaño m × n con entradas en los reales, esto es,
V = Mm×n (R).

Ejemplo 5.2. Demuestre que el conjunto de los números reales positivos forma un espacio
vectorial bajo las operaciones x + y = xy, λx = xλ .

Solución. Lo primero que debemos hacer es verificar los axiomas de cerradura. Sean x, y ∈
R+ y λ ∈ R. Entonces xy > 0, con lo cual x + y = xy ∈ R+ . Además, λx = xλ ∈ R+ , ya que
x ∈ R+ . La suma ası́ definida es conmutativa y asociativa. En efecto

x + y = xy = yx = y + x, (x + y) + z = (xy)z = x(yz) = x + (y + z).

para todo x, y, z ∈ R+ .

Sea x ∈ R+ , entonces se cumple la ley modulativa de la suma, esto es, existe 1 ∈ R+ tal
que

x + 1 = x(1) = x.

En este caso 0 = 1, es decir. el elemento neutro es el 1. Ahora, sabiendo que el elemento


neutro para la suma es el 1, debemos demostrar que todo x ∈ R+ tiene un inverso aditivo,
lo que nos lleva a plantear la ecuación

x + y = 1 ⇔ xy = 1 ⇔ y = 1/x.

Ası́, el inverso aditivo de x es 1/x. Verifiquemos los axiomas correspondientes a la multipli-


cación por escalar. Sean α, β ∈ R y x ∈ R+ .

α(βx) = (βx)α = (xβ )α = xβα = xαβ = (αβ)x.

Si x, yR+

α(x + y) = (x + y)α = (xy)α = xα y α = (αx)(αy) = αx + αy.

(α + β)x = xα+β = xα xβ = (αx)(βx) = αx + βx.

Finalmente,

1x = x1 = x,

para cada x ∈ R+ .

De los axiomas que definen un espacio vectorial, se deducen las siguientes propiedades

146
Teorema 5.1.11. Sea V un espacio vectorial sobre el campo F . Entonces

(a) α0 = 0 para todo α ∈ F .

(b) 0x = 0 para todo x ∈ V .

(c) Si αx = 0, entonce α = 0 o x = 0, o ambos.

(d) (−1)x = −x para todo x ∈ V .

5.2. Subespacios
Definición 5.2.1 (Subespacio). Sea H un subconjunto no vacı́o de un espacio vectorial V
que es en si mismo un espacio vectorial con las operaciones de suma y producto por escalar
definidas en V es llamado subespacio de V .

El siguiente resultado caracteriza los subesapcios de un espacio vectorial

Teorema 5.2.1. Un subconjunto no vacı́o H de un espacio vectorial V es un subespacio de


V si y sólo si se cumplen los axiomas de cerradura:

(a) Si x, y ∈ H, entonces x + y ∈ H.

(b) Si λ ∈ F, x ∈ H, entonces λx ∈ H.

Nota 5.2.1. El teorema 5.2.1 se puede enunciar de forma equivalente como sigue: Un sub-
conjunto no vacı́o H de un espacio vectorial V es un subespacio de V si y sólo si

αx + βy ∈ H,

para todos los escalares α, β ∈ F y todo x, y ∈ H.

Ejemplo 5.3. Para cualquier espacio vectorial V , el subconjunto H = {0} que consta úni-
camente del cero es un subesapcio de V . Ası́ mismo, V es subepacio de si mismo. Los subes-
pacios {0} , V son llamados subespacios triviales. Los subespacios distintos de {0} y V
son llamados subespacios propios.

Ejemplo 5.4 (Subespacio propio de R2 ). Toda recta que pasa por el origen es un subespacio
propio de R2 .

Ejemplo 5.5 (Subespacios propios de R3 ). Toda recta que pasa por el origen es un subespacio
propio de R3 . Ası́ mismo, todo plano que pasa por el origen es un subespacio propio de R3 .

Teorema 5.2.2. Sean H1 , H2 subespacios de un espacio vectorial V . Entonces H1 ∩ H2 es


un subespacio de V .

147
5.3. Combinación lineal y espacio generado
Definición 5.3.1 (Combinación lineal). Sean v1 , . . . , vn vectores de un espacio vectorial V .
Entonces cualquier vector de la forma

v = α1 v1 + · · · + αn vn ,

αi ∈ F , para todo 1 ≤ i ≤ n es llamado combinación lineal de los vectores v1 , . . . , vn .

Definición 5.3.2 (Espacio generado). Sea H = {v1 , . . . , vn } un subconjunto de espacio


vectorial V . Denotamos por gen H a el conjunto de todas las combinaciones lineales que
podemos formar con los vectores de H. Esto es,

gen H = {v : v = α1 v1 + · · · + αn vn , αi ∈ F, 1 ≤ i ≤ n} .

Nos referimos a gen H como espacio generado por el conjunto de vectores v1 , . . . , vn .

Teorema 5.3.1. Sea H un subconjunto de un espacio vectorial V . Entonces el generado por


H, gen H es un subespacio de V .

Demostración. Sean v, w ∈ H y α, β ∈ F . Entonces existen escalares α1 , . . . , αn y β1 , . . . , βn


en F tales que

v = α1 v1 + · · · + αn vn , w = β1 v1 + · · · + βn vn .

Por lo tanto,

αv + βw = α(α1 v1 + · · · + αn vn ) + β(β1 v1 + · · · + βn vn )
= αα1 v1 + · · · + ααn vn + ββ1 v1 + · · · + ββn vn
= (αα1 + ββ1 )v1 + · · · + (ααn + ββn )vn .

Ahora dado que ααi + ββi ∈ F para todo 1 ≤ i ≤ n, αv + βw ∈ H. Esto es, H es un


subespacio de V .

Definición 5.3.3 (Conjunto generador). Decimos que un conjunto H = {v1 , . . . , vn } genera


un espacio vectorial V si

gen H = V.

Ejemplo 5.6. Sea V = Pn , el conjunto de todos los polinomios de grado ≤ n, y F = R.


El conjunto V es un espacio vectorial real generado por n + 1− vectores. En efecto, sea
H = {1, x, x2 , . . . , xn }. Entonces

gen H = {p ∈ Pn : p(x) = a0 (1) + a1 x + · · · + an xn , ai ∈ R, 0 ≤ i ≤ n} = V.

148
5.4. Independencia lineal
Definición 5.4.1 (Dependencia lineal e independencia lineal). Sean v1 , . . . , vn n vectores
de un espacio vectorial V . Entonces se dice que los vectores son linealmente indepen-
dientes si toda combinación lineal de ellos igualada a 0 implica que todos los vectores de la
combinación son cero. Esto es,

α1 v1 + · · · + αn vn = 0 implica que α1 = · · · = αn = 0.

Si los vectores no son linealmente independientes, se dice que son linealmente dependien-
tes. Esto es, existen n escalares no todos cero tales que

α1 v1 + · · · + αn vn = 0.

Ejemplo 5.7. Sea V el espacio vectorial de todas las funciones de R en R. Determinar si


cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) 1, eax , ebx , a 6= b.


(b) {cos x, sen x}.

(c) {ex , e−x , (ex + e−x )/2}.

(d) {cos2 x, sen2 x, 1}.


Solución. Consideremos una combinación lineal de las funciones 1, eax , ebx igualada a la
función cero, esto es,

α1 1 + α2 eax + α3 ebx = f (x)

donde f (x) = 0 para todo x ∈ R. Por lo tanto tenemos

α1 1 + α2 eax + α3 ebx = 0,

para todo x ∈ R. En particular, si x = 0 obtenemos la ecuación

α1 + α2 + α3 = 0.

Ahora generamos otro par de ecuaciones al tomar x = 1, luego x = −1:

α1 + α2 ea + α3 eb = 0, α1 + α2 e−a + α3 e−b = 0.

Luego tenemos el sistema lineal de ecuaciones homogéneas



 α1 + α2 + α3 = 0
α + α2 ea + α3 eb = 0
 1
α1 + α2 e−a + α3 e−b = 0

149
Que en forma matricial se expresa como

1 1 1 α1 0
    
1 ea eb  α2  = 0 (5.1)
1 e−a e−b α3 0

Aplicando Gauss–Jordan podemos simplificar el determinante de la matriz A de coeficientes


del sistema

R2 → −R1 + R2 1

1 1 1 1 1

a b a b
1 e
e R3 → −R1 + R3 0 e − 1 e − 1
1 e−a e−b ⇐⇒ 0 e−a − 1 e−b − 1

En consecuencia tenemos que



1 1 1 1 1 1
e = (ea − 1)(e−b − 1) − (e−a − 1)(eb − 1)

a b a b
det A := 1 e e = 0 e
1 e−a e−b 0 e−a e−b

Ahora, si det A = 0, tendrı́amos que

(ea − 1)(e−b − 1) − (e−a − 1)(eb − 1) = 0,

o equivalentemente

(ea − 1)(1 − eb ) (1 − ea )(eb − 1)


=
eb ea
Al multiplicar por −1 esta última ecuación obtenemos

(ea − 1)(eb − 1) (ea − 1)(eb − 1)


= ,
eb ea
de donde ea = eb , es decir a = b, lo cual es una contradicción puesto que estamos suponiendo
que a 6= b. Se debe tener entonces que det A 6= 0, lo cual implica que el sistema en (5.1) tiene
sólo la solución trivial, esto es, α1 = α2 = α3 = 0, es decir el conjunto dado es linealmente
independiente. Con cual tenemos el ı́tem (a).

Sean α1 y α2 escalares tales que

α1 cos x + α2 sen x = 0 ∀ x ∈ R.

En particular, si x = 0, α1 = 0, y si x = π/2, α2 = 0. Con lo cual, las funciones son


linealmente independientes.

150
Observese que
(−1/2)ex + (−1/2)e−x + (1)(ex + e−x )/2 = 0 ∀ x ∈ R.
Con lo cual, las funciones son linealmente dependientes.

Por la identidad fundamental sabemos que

(1) cos2 x + (1) sen2 x + (−1)(1) = 0 ∀ x ∈ R.


Esto significa que las funciones son linealmente dependientes.
Ejemplo 5.8. [**] Sean v1 , v2 dos vectores linealmente independientes de R3 . Demuestre que
el gen {v1 , v2 } es un plano que pasa por el origen. Hallar la ecuación cartesiana del plano.
Solución. Debemos demostrar que
gen {v1 , v2 } = π = {(x, y, z) : ax + by + cz = 0} .
Tomemos (x, y, z) ∈ gen {v1 , v2 }. Donde v1 = (a1 , b1 , c1 ) y v2 = (a1 , b1 , c1 ). Entonces existen
escalares s, t tales que
(x, y, z) = sv1 + tv2
Definamos n = v1 × v2 . En tal caso tenemos que
n · (x, y, z) = v1 × v2 · (sv1 + tv2 )
= v1 × v2 · sv1 + v1 × v2 · tv2
= s(v1 × v2 · v1 ) + t(v1 × v2 · v2 )
= 0.
Es decir, (x, y, z) ∈ π, donde
n = (a, b, c) = v1 × v2 = iA11 + jA12 + kA13 = (A11 , A12 , A13 ),
es el vector normal al plano. Recı́procamente, si (x, y, z) ∈ π, entonces ax + by + cz = 0

donde
a = A11 , b = A12 , c = A13 ,
Al menos uno de los escalares a, b, c es distinto de cero. Por ejemplo supongamos que c =
A13 6= 0. Debemos encontrar escalares s y t tales que
x = sa1 + ta2
y = sb1 + tb2
z = sc1 + tc2

151
Si consideramos sólo la primera y segunda ecuación, podemos encontrar estos escalares usan-
do la regla de Krammer:

x a2

y b2 b2 x − a2 y b2 x − a2 y
s= = = ,
a1 a2 a1 b2 − a2 b1 A13

b1 b2


a1 x

b1 y a1 y − b1 x
t= = .
a1 a2 A13

b1 b2
Entonces
b2 x − a2 y a1 y − b1 x
sv1 + tv2 = (a1 , b1 , c1 ) + (a2 , b2 , c2 )
A13 A13
 
a1 b2 x − a1 a2 y b1 b2 x − a2 b1 y b2 c1 x − a2 c1 y
= , ,
A13 A13 A13

a1 a2 y − a2 b1 x a1 b2 y − b1 b2 x a1 c2 y − b1 c2 x

+ , ,
A13 A13 A13

(a1 b2 − a2 b1 )x (a1 b2 − a2 b1 )y (b2 c1 − b1 c2 )x + (a1 c2 − a2 c1 )y

= , ,
A13 A13 A13
 
−ax − by
= x, y,
c
= (x, y, z).

Esto es, (x, y, z) ∈ gen {v1 , v2 }.


Teorema 5.4.1. Dos vectores de un espacio vectorial son linealmente dependientes si y sólo
si uno es múltiplo escalar del otro.
Se concluye del Teorema 5.4.1 que dos vectores de un espacio vectorial son linealmente
dependientes si y sólo si son paralelos.
Teorema 5.4.2. Sean v1 = (x1 , y1) y v2 = (x2 , y2 ) dos vectores de R2 , y sea A la matriz
formada por estos vectores, esto es,
   
v1 x1 y1
A := = .
v2 x2 y2
Entonces, los vectores v1 , v2 son linealmente dependientes ⇔ det A = 0. En consecuencia,
v1 , v2 son linealmente independientes ⇔ det A 6= 0.

152
Demostración. (⇒). Supongamos que v1 , v2 son linealmente dependientes. Entonces por el
Teorema 5.4.1 existe k ∈ R tal que v1 = kv2 . Pero entonces tenemos que
   
v1 x1 y1
det A = det = det = 0.
kv1 kx1 ky1

(⇐). Ahora, supongamos que v1 , v2 son linealmente independientes y que

xv1 + yv2 = (0, 0) (5.2)

Entonces por definición de independencia lineal tenemos que x = y = 0. Pero (5.2), es


equivalente a

(x1 x + x2 y, y1x + yy2 x) = (0, 0)

Lo que a su vez se puede escribir en forma matricial como sigue


    
x1 x2 x 0
= (5.3)
y1 y2 y 0

En consecuencia, si v1 , v2 son linealmente independientes, el sistema homogéneo en (5.3)


tiene una única solución, lo cual implica que
 
x1 x2
det 6= 0.
y1 y2

Finalmente, como el determinante de una matriz es igual a el determinante de su matriz


transpuesta, tenemos que
   
x1 y1 x1 x2
det A = det = det 6= 0.
x2 y2 y1 y2

Se demostró que si v1 , v2 son linealmente independientes, entonces det A 6= 0, o equivalente-


mente, si det A = 0, entonces v1 , v2 son linealmente dependientes.

Teorema 5.4.3. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2 ) dos vectores de R2 . Entonces gen {v1 , v2 }
es una recta que pasa por el origen, si v1 , v2 son linealmente dependientes y es R2 , si v1 , v2
son linealmente independientes.

Corolario 5.4.4. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2) dos vectores de R2 y A la matriz formada
por estos vectores, entonces

(a) gen {v1 , v2 } es una recta que pasa por el origen si sólo si det A = 0.

(b) gen {v1 , v2 } es R2 si sólo si det A 6= 0.

153
5.5. Interpretación geométrica de la independencia li-
neal en R3
Sean u, v y w tres vectores de R3 . Se define el triple producto escalar de estos vectores
como

w·u×v

En la figura 5.1 se muestra que si estos vectores son linealmente independientes determinan
un paralelepı́pedo.

u×v

h v

Figura 5.1: Construcción geométrica del triple producto escalar

Demostraremos que el volumen de este paralelepı́pedo es precisamente el valor absoluto


del triple producto escalar entre ellos.

Teorema 5.5.1. Sean u = (a1 , a2 , a3 ), v = (b1 , b2 , b3 ) y w = (c1 , c2 , c3 ) vectores no nulos de


R3 y A la matriz conformada por estos vectores:

a1 a2 a3
 

A =  b1 b2 b3 
c1 c2 c3

Entonces, det A 6= 0 si y sólo si u, v y w son linealmente independientes, más aún, si


det A 6= 0, los vectores determinan un paralelepı́pedo cuyo volumen está dado por

| det A| = |w · u × v|.

Demostración. Empecemos demostrando que

det A = w · u × v.

154
En efecto,
w · u × v = (c1 , c2 , c3 ) · (A11 , A12 , A13 )
= c1 A11 + c2 A12 + c3 A13 .
Entonces,
c1 c2 c3
 

w · u × v = c1 A11 + c2 A12 + c3 A13 = a1 a2 a3 


b1 b2 b3
Ahora, por la Propiedad 3 de los determinantes, Teorema 2.3.6, tenemos que
c1 c2 c3 a1 a2 a3 a1 a2 a3
     
a1 a2 a3  = −  c1 c2 c3  =  b1 b2 b3  = det A.
b1 b2 b3 b1 b2 b3 c1 c2 c3
Supongamos que los vectores u, v y w son linealmente dependientes. Entonces existen esca-
lares α1 , β1 y γ1 no todos cero tales que

α1 u + β1 v + γ1 w = 0.
Por ejemplo, si γ1 6= 0

w = αu + βv,

donde −α = α1 /γ1 y −β = β1/γ1. Con lo cual,


det A = w · u × v = (αu + βv) · u × v
= α(u · u × v) + β(v · u × v)
= 0.

Los otros dos casos surgen al suponer que α1 6= 0, o bien β1 6= 0 (ver el problema 5.10.12).

Demostramos que si los vectores u, v y w son linealmente dependientes, entonces det A =


0, pero esto es equivalente a decir que si det A 6= 0, entonces los vectores u, v y w son
linealmente independientes.

Recı́procamente, supongamos que

det A = w · u × v = 0.

Esto significa que el vector w es ortogonal al vector u × v, pero sabemos que este último
vector es el vector normal al plano generado por u y v. Es decir, w ∈ gen {u, v}, lo que cual
implica que existen escalares α y β tales que

w = αu + βv.

155
Ahora bien, si α y β son ambos cero, resulta que w = 0, lo cual contradice la hipótesis. Se
debe tener entonces que algunos de los escalares α o β es distinto de cero. Por lo tanto la
expresión

w − αu − βv = 0,

es una combinación lineal de los vectores u, v y w en la que no todos los escalares de la


combinación son cero, lo cual quiere decir que los vectores son linealmente dependientes.

Ahora bien, si det A 6= 0, entonces los vectores u, v y w son linealmente independientes,


por lo que ninguno de ellos puede ser un múltiplo escalar del otro. Por lo tanto, forman un
paralelepı́pedo (ver figura 5.1). Como se ve en esta gráfica, la altura del paralelepı́pedo es la
proyección escalar del vector w sobre el vector u × v, esto es,

h = k Proy wu×v k
|w · u × v|
=
ku × vk
Recordemos que ku × vk es igual al área del paralelogramos determinado por los vectores u
y v. Por lo que, si denotamos por V al volumen del paralelepı́pedo, encontramos que

V = ku × vkh
= |w · u × v|
= | det A|.

5.6. Bases y dimensión


Definición 5.6.1 (Base para un espacio vectorial). Un subconjunto finito de n vectores
B = {v1 , v2 , . . . , vn } es una base para un espacio vectorial V si

(a) B es linealmente independiente.

(b) gen B = V , esto es, B genera a V .

El espacio vectorial V es dimensión finita si tiene una base finita. De otro modo, V tiene
dimensión infinita.

Definición 5.6.2 (Dimensión de un espacio vectorial). Si espacio vectorial V tiene tiene


una base n elementos, el entero n se llama dimensión de V . Escribimos n = dim V

Teorema 5.6.1. Sea V espacio vectorial de dimensión finita n. Tenemos

156
(a) Cualquier conjunto linealmente independiente de V es un subconjunto de cierta base
para V .

(b) Cualquier conjunto de n elementos es una base para V .


Ejemplo 5.9. El conjunto B = {e1 , e2 , . . . , en }, donde

e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
..
.
en = (0, 0, . . . , 1),

es una base para Rn . Los vectores e1 , e2 , . . . , en se denominan vectores coordenados uni-


tarios de Rn y el conjunto B es llamado base canónica de Rn .
Teorema 5.6.2. Sea H un subespacio de un espacio vectorial de dimensión n. Entonces
dim H ≤ n.
Teorema 5.6.3. Los únicos subespacios no triviales de R3 son las rectas y planos que pasan
por el origen.
Demostración. Por el Teorema 5.6.2 si H es un subespacio propio de R3 , entonces dim H = 1,
o bien, dim H = 2. Si dim H = 1, el subespacio H es una recta que pasa por el origen (ver el
problema 5.10.6). Ahora bien, si dim H = 2. Escogemos una base B = {v1 , v2 } de H. Como
el conjunto B es linealmente independiente, por Ejemplo 5.8 sabemos que gen B es un plano
que pasa por el origen. Como gen B = H el teorema está demostrado.
Ejemplo 5.10. Sean H y K subespacios de un espacio vectorial V . Demuestre que si H∩K =
{0}, entonces dim(H + K) = dim H + dim K.
Solución. Sea B1 = {v1 , . . . , vm } una base para H, y B2 = {w1 , . . . , wn } una base para
K. Demostraremos que B = {v1 , . . . , vm , w1 , . . . , wn } es una base para H + K. Primero que
todo nótese que como B1 ⊆ H y B2 ⊆ K, entonces B1 ∩ B2 ⊆ H ∩ K = {0}. Esto es,

B1 ∩ B2 ⊆ {0} (5.4)

Y dado que B1 , B2 son linealmente independientes ninguno de estos conjuntos contiene al


vector cero. Por lo tanto la única forma de que se mantenga la contenencia (5.4) es que
B1 ∩ B2 = ∅. Lo cual implica que los vectores que conforman la base B son todos diferentes,
es decir, el conjunto B está conformado por m + n vectores. Ahora, tomemos v ∈ H + K,
entonces existe h ∈ H y k ∈ K tales que v = h + k. Además, existen escalares α1 , . . . , αm
y β1 , . . . , βn que cumplen que

h = α1 v1 + · · · + αm vm , k = β1 w1 + · · · + βn wn .

157
Con lo cual,

v = α1 v1 + · · · + αm vm + β1 w1 + · · · + βn wn ,

Lo cual quiere decir que v ∈ gen B. Demostramos que H + K ⊆ gen B. La otra contenencia
se obtiene de manera similar para concluir que gen B = H + K .

Para demostrar la independencia lineal de B nótese que si w1 ∈ gen B1 , entonces

w1 = α1 v1 + · · · + αm vm ∈ H.

Con lo cual, w1 ∈ H ∩ K, contradiciendo de nuevo el hecho que H ∩ K = {0}. Por lo tanto,


w1 ∈
/ gen B1 , pero esto implica que el conjunto

{v1 , . . . , vm , w1 } ,

pues si

α1 v1 + · · · + αm vm + αm+1 w1 = 0,

y αm+1 6= 0, tendrı́amos que

w1 = (α1 /αm+1 )v1 + · · · + (αm /αm+1 )vm .

Contradiciendo el hecho que w1 ∈


/ gen B1 . Se debemos tener entonces que αm+1 = 0, con lo
que

α1 v1 + · · · + αm vm = 0,

y la independencia de B1 implica que α1 = · · · = αm = 0. De esta misma forma demostramos


que el conjunto

{v1 , . . . , vm , w1 , w2 } ,

es linealmente independiente, ya que w2 ∈ / gen B1 . Vemos de esta manera que podemos ex-
tender el conjunto B1 para formar el conjunto B de tal forma que este último sea linealmente
independiente, y ası́ demostrar que B es una base para H + K. Finalmente tenemos que

dim(H + K) = m + n = dim H + dim K.

Como se querı́a demostrar.

158
5.7. Cambio de base

5.8. Bases ortonormales y proyecciones en Rn

5.9. Espacios con producto interno

5.10. Problemas

Sección 5.1 Definición y propiedades de un espacio


vectorial
Problema 5.10.1. Demuestre que el conjunto de todas las funciones definidas y acotadas
en R es un espacio vectorial.

Problema 5.10.2. Demuestre que el conjunto de todas las funciones que satisfacen la ecua-
ción funcional

f (x) = f (x − 1),

para toda x ∈ R es un espacio vectorial

En los siguientes problemas, determinar si cada uno de los conjuntos dados es un espacio
vectorial real.

Problema 5.10.3. El conjunto de todos los polinomios de grado igual n.

Problema 5.10.4. Sea V el conjunto de todos los pares (x, y) de números reales, con las
operaciones de suma y producto por escalar definidas como sigue:

(x, y) + (x1 , y1 ) = (x + x1 , y + y1 ), λ(x, y) = (λx, y).

Sección 5.2 Subespacios de un espacio vectorial


Problema 5.10.5. Demuestre que el espacio vectorial de los números reales no tiene subes-
pacios propios.

Problema 5.10.6. Demuestre que los únicos subespacios propios R2 son las rectas que
pasan por el origen. Hallar la ecuación cartesiana de la recta. Demuestre además que todo
subespacio de dimensión 1 de R3 es una recta que pasa por el origen. Hallar la ecuación
paramétrica de dicha recta.

159
Problema 5.10.7. Sea V = Mn×n (R), ¿cuáles de los siguientes subconjuntos de V son
subespacios.

(a) El conjunto de todas las matrices invertibles.

(b) El conjunto de todas las A ∈ V tales que AB = BA, B es una matriz fija en V .

(c) Todas las matrices A tales que A2 = A.

Problema 5.10.8. Sean H1 , H2 dos subespacios de un espacio vectorial V . Entonces

(a) H1 ∪ H2 no es un subespacio de V .

(b) H := H1 + H2 = {v : v = v1 + v2 , v1 ∈ H1 , v2 ∈ H2 },
es un subespacio de V .

Problema 5.10.9 (**). Sea V el espacio vectorial de todas las funciones de R en R, sea Ve ,
el subconjunto de las funciones pares, f (x) = f (−x); sea V0 el subconjunto de las funciones
impares, f (−x) = −f (x).

(a) Demuestre que Ve y V0 son subespacios de V .

(b) Demuestre que V = Ve + V0 .

(c) Demuestre que Ve ∩ V0 = {0}.

Problema 5.10.10 (***). Sea H = {x ∈ Rn : x · n = 0}, donde n es un vector fijo no nulo


de Rn .

(a) Demuestre que H es un subespacio de Rn

(b) De una interpretación geométrica para los casos n = 2 y n = 3.

(c) Si H = {(x, y, z, w) : ax + by + cz + dw = 0}, donde abcd 6= 0. Demuestre que H es


un subespacio de Rn y encuentre una base para H.

(d) Encuentre la dimensión del subespacio H = {x ∈ Rn : x · n = 0}.

Sección 5.3 Combinación lineal y espacio generado


Problema 5.10.11. Sean v1 , v2 vectores de R2 . Hallar, gen {v1 , v2 } si,
(a) v1 , v2 son linealmente dependientes.
(b) v1 , v2 son linealmente independientes.

160
(c) v1 , v2 son linealmente independientes y los escalares de la combinación varı́an entre 0 y
1. ¿Qué representan los conjuntos hallados en (a),(b) y en (c)?

Sección 5.4 Independencia lineal


Problema 5.10.12. Demuestre que si los vectores u, v y u son linealmente dependientes,
entonces w · u × v = 0.
Problema 5.10.13. Demuestre que si los vectores v1 , . . . , vn son linealmente dependientes
en Rm y si vn+1 es cualquier otro vector en Rm , entonces el conjunto v1 , . . . , vn , vn+1 es
linealmente independiente.
Problema 5.10.14. Demuestre que si dos vectores no nulos v1 , v2 son ortogonales, entonces
el conjunto {v1 , v1 } es linealmente independiente.
Problema 5.10.15. Sea V el espacio vectorial de todas las funciones de R en R. Determinar
si cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) {eax , xeax }.

(b) {1, eax , xeax }.

(c) {eax , xeax , x2 eax }.

(d) {1, cos 2x, sen2 x}.

(e) {ex cos x, e−x sen x}.

Sección 5.6 Bases y dimension


Problema 5.10.16 (**). Hallar la dimensión del espacio Dn de las matrices diagonales.
Problema 5.10.17 (**). Demuestre que el espacio Snn de las matrices simétricas de tamaño
n × n es un subespacio de Mn×n (R) el espacio de la matrices de tamaño n × n con estradas
en los reales. Hallar la dimensión del espacio Snn .
Problema 5.10.18 (*). Sea {v1 , . . . , vn } una base para un espacio vectorial V . Si
n
X
un := vi .
i=1

Demuestre que el conjunto {u1 , . . . , un } también es una base para V .


Problema 5.10.19 (***). Si H es un subespacio de un espacio vectorial de dimensión finita
V , demuestre que existe un único subespacio K de V tal que H ∩ K = {0} y H + K = V .

161
Capı́tulo 6

Transformaciones lineales

6.1. Definición y ejemplos


Definición 6.1.1 (Transformaciones lineales). Sean V y W espacios vectoriales reales. Una
transformación lineal es una función definida en V que toma valores en W y que satisface,
para cada u, v ∈ V y cada escalar α

T (u + v) = T (u) + T (v)
(6.1)
T (αu) = αT (u)

Las ecuaciones en (6.1) reciben el nombre de propiedades de linealidad.

En la sección 6.3 se estudian las transformaciones lineales de R2 en R2 , en especial el ope-


rador rotación. A continuación estudiamos otro importante de operador lineal denominado
transformación de proyección ortogonal

Ejemplo 6.1 (Operador proyección). Sea H un subespacio de Rn , y B = {u1 , . . . , uk } una


base ortonormal para H. La transformación de proyección ortogonal P : Rn → H se denota
por Proy vH y se define como

P (v) = Proy vH = (v · u1 )u1 + · · · + (v · uk )uk .

Consideremos el caso n = 3 y supongamos que queremos proyectar un punto v = (x, y, z) de


R3 sobre por ejemplo el plano xz. Tenemos que el plano xz está dado por

H = {(x, 0, z) : x, z ∈ R} .

Dado que

(x, 0, z) = (x, 0, 0) + (0, 0, z) = xi + zk,

162
Vemos que H es generado por la base ortonormal B = {i, k}. Por lo que

P (x, y, z) = Proy vH = ((x, y, z) · i))i + ((x, y, z) · k))k


= xi + zk
= (x, 0, z).

En cálculo vectorial para aplicar el Teorema de Stokes, en ciertas ocasiones es necesario


proyectar una curva C en el espacio sobre alguno de los tres planos coordenados. En el
Ejemplo 7.6.2 se encontró que la representación paramétrica de la curva de intersección de
las superficies  2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial

α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).

Γ
C

y
x

Figura 6.1: La proyección de la curva C, que es una circunferencia, sobre el plano xz es una
elipse.

Si queremos saber cuál es la proyección de la curva C sobre el plano xz, hallamos la


acción del operador T (x, y, z) = (x, 0, z) sobre la función α. Esto es,

T (α(t)) = T (1 + cos t, 1 − cos t, 2 sen t)

= (1 + cos t, 0, 2 sen t)
= β(t).

Vemos que la proyección está representada por una función vectorial



β(t) = (1 + cos t, 0, 2 sen t) = (x, y, z),

163
para hallar la ecuación cartesiana de dicha curva eliminamos el parámetro en la ecuaciones
paramétricas

x = 1 + cos t, z = 2 sen t,

de donde obtenemos

(x − 1)2 + z 2 /2 = cos2 t + sen2 t = 1

Para este caso la proyección es un elipse (ver la figura 6.1).

De forma análoga podemos demostrar que la proyección de la curva C sobre el plano yz


también es una elipse, mientras que al proyectar sobre el plano xy obtenemos una recta. (ver
el problema 6.7.2)

6.2. Núcleo e imagen de una transformación lineal


Definición 6.2.1. Sean V y W espacios vectoriales y T : V → W una transformación
lineal. Entonces el núcleo de T denotado por ker T , y la imagen de T denotada por R(T ) se
definen respectivamente por

ker T = {v ∈ V : T (v) = 0}
R(T ) = {T (v) : v ∈ V } .

Como puede demostrarse el ker T es un subespacio de V , y la imagen de T es un subes-


pacio de W .

Definición 6.2.2. Dados dos conjuntos V y W y una función T : V → W . Se dice que una
función S : T (V ) → V es inversa de T por izquierda si S[T (x)] = x para todo x ∈ V , esto
es,

ST = IV ,

donde IV es la transformación idéntica sobre V . Y

T (V ) := {T (v) : v ∈ V } .

Una función R : T (V ) → V es inversa de T por derecha si T [R(y)] = y para todo y ∈ T (V ),


esto es,

T R = IT (V ) ,

donde IT (V ) es la transformación idéntica sobre T (V ).

164
6.3. Teorema del cambio de variables en el plano (Op-
cional)
Teorema 6.3.1 (Teorema del cambio de variables en el plano). Sea T : R2 → R2 un
operador de C 1 en una región elemental G(las funciones componentes del operador T tienen
derivadas parciales de primer orden continuas en la región G) del plano uv. En la figura 6.2
se muestran el operador T y el operador S que es el operador inverso de T .

y v

2 2
R T
G
1 S 1

x u
1/2 1 2 1 2

Figura 6.2: El operador T deforma una región G en el plano uv para convertirla en una
región R en el plano xy, una medida de dicha deformación viene dada por el Jacobiano del
operador T
.

y supongase que T mapea de manera inyectiva la región G en una región R del plano xy,
siendo
T (u, v) = (g(u, v), h(u, v)) = (x, y).
Entonces si f : R → R es integrable tenemos que
ZZ ZZ
f (x, y)dxdy = f (g(u, v), h(u, v))|J(u, v)|dudv.
R G

El número J(u, v) denota el Jacobiano del operador T , el cual se define como


∂g ∂g
 
   ∂u ∂v 
∇g
J(u, v) := det = det 
 
∇h

 ∂h ∂h 
∂u ∂v
165
Un caso particular importante del Teorema anterior se da en el siguiente resultado

Teorema 6.3.2. Sea A un matriz de tamaño 2 × 2 con det A 6= 0 y T un operador dado por
   
x x
T =A . (6.2)
y y

Entonces T transforma paralelogramos en paralelogramos y vértices en vértices. Más aún, si


T (G) es un paralelogramo, G debe ser un paralelogramo.

Nota 6.3.1. Nótese que todo operador lineal de R2 en R2 viene dado en la forma (6.2).
En efecto, puesto que el operador T es lineal es suficiente con conocer su acción sobre los
elementos de alguna base para determinarlo completamente. Por ejemplo, si tomamos la base
canónica de R2 , B = {i, j}, y suponemos que T (i) = (a, b) y T (j) = (c, d) tenemos que

T (x, y) = T (xi + yj) = xT (i) + yT (j) = x(a, b) + y(c, d) = (ax + cy, bx + dy).

a c
La expresión anterior en forma matricial es (6.2) con A = . Observese además que
b d
si, J(x, y) = det A = ad − bc 6= 0, entonces el operador T es inyectivo, por lo tanto, si
T (G) = R, por el Teorema del cambio de variables tenemos que
ZZ
a(R) = dxdy
ZZ R

= |J(u, v)|dudv
ZZ G

= | det A|dudv
G
ZZ
= | det A| dudv
G
= | det A|a(G).

Ejemplo 6.2 (Coordenadas polares). Como un caso particular del Teorema 6.3.1, damos
una fórmula para integración en coordenadas polares. En este caso el operador T del plano
rθ al plano xy está dado por

x = g(r, θ) = r cos θ, y = h(r, θ) = r sen θ,

166
θ y

T R
β
G r=a r=b
α
β
r α x
a b

Figura 6.3: En el plano xy se muestra un rectángulo polar

si θ = k = cte, entonces,
y r sen k
= = tan k.
x r cos k
Es decir, tenemos una recta que pasa por el origen ypque forma un ángulo de k grados con
el eje x. Por otro lado, si r = k = cte, entonces, x2 + y 2 = k, una circunferencia con
centro en (0, 0) y radio k. De este forma, obtenemos el rectángulo polar en el plano xy que
se muestra en la figura 6.3. Además tenemos que
∂g ∂g
 
 ∂r ∂θ   
cos θ −r sen θ
J(r, θ) = det   = det = r.
 
 ∂h ∂h  sen θ r cos θ
∂r ∂θ
Entonces por el Teorema del cambio de variables obtenemos
ZZ ZZ
f (x, y)dxdy = f (r cos θ, r sen θ)|J(r, θ)|drdθ
R G
Z βZ b
= f (r cos θ, r sen θ)rdrdθ
α a

Para el caso más general en el que tengamos una región polar R de la forma

R = {(r, θ) : h1 (θ) ≤ r ≤ h2 (θ), α ≤ θ ≤ β}

tal como se muestra el la figura

167
R r = h2 (θ)

r = h1 (θ)

β
α

Figura 6.4: Para encontrar los lı́mites de integración en un cambio a coordenadas polares,
trazamos un rayo que atraviese la región R, vemos que este entra en una función polar de
ecuación r = h1 (θ) y sale en r = h2 (θ), si movemos este rayo empezando en θ = α hasta
θ = β barremos la región.

podemos hallar el área de la región R por un cambio a coordenadas polares, utilizando el


Teorema del cambio de variables, el Teorema de Fubinni y segundo Teorema fundamental del
cálculo.

ZZ
a(R) = dxdy
R
ZZ
= |J(r, θ)|drdθ
G
Z β Z h2 (θ)
= rdrdθ
α h1 (θ)
"Z #
Z β h2 (θ)
= rdr dθ
α h1 (θ)
Z β Z h2 (θ)
2
= r /2 dθ
α h1 (θ)
β
1 2
Z
h2 (θ) − h21 (θ) dθ.

=
α 2
Por lo tanto, como un caso particular del Teorema del cambio de variables, tenemos una
fórmula para calcular el área entre curvas en coordenadas polares
Z β
1 2
h2 (θ) − h21 (θ) dθ.

a(R) = (6.3)
α 2

168
Ejemplo 6.3 (Operador rotación). Un caso particular de operador lineal de R2 en R2 es el
operador rotación, cuya fórmula deducimos a continuación. Tomemos un vector (u, v) en
el plano uv con magnitud r y dirección α y supongamos que este vector gira un ángulo de θ
radianes en dirección contraria de las manecillas del reloj como se muestra en la figura 6.5.

(x, y)

r (u, v)
θ r

α
u

Figura 6.5: El vector (u, v) gira un ángulo θ en dirección contraria de las manecillas del reloj

Entonces la magnitud del vector (x, y), sigue siendo r, pero su dirección es α + θ. En
consecuencia,

x = r cos(α + θ)
= r cos α cos θ − r sen α sen θ
= u cos θ − v sen θ.

y = r sen(α + θ)
= r sen α cos θ + r cos α sen θ
= v cos θ + u sen θ.

Lo cual expresamos en forma matricial como sigue


      
x cos θu − sen θv cos θ − sen θ u
= =
y sen θu cos θv sen θ cos θ v
Con lo cual vemos que el operador rotación está definido en el plano uv, tomando valores en
el plano xy, y está dado por
      
u cos θ − sen θ u x
T = = .
v sen θ cos θ v y

169
Dado que
 
cos θ − sen θ
det = 1 6= 0,
sen θ cos θ

si R = T (G), el Teorema del cambio de variables nos da


ZZ
a(R) = dxdy = | det A|a(G) = a(G).
R

El uso del operador rotación se ilustra en el problema 6.3.4.

Problema 6.3.3. Hallar el área del paralelogramo generado por los vectores A = (a, b) y
B = (c, d).

Solución. Este problema se puede resolver directamente, de forma cartesiana, o bien uti-
lizando el producto cruz. Para resolver el problema utilizando el Teorema del cambio de
variables la idea es definir un operador T que aplique el cuadrado unitario en el plano uv en
el paralelogramo R en el plano xy como se representa en la figura 6.6.

v y

j B
R
(x, y)
T b

G
A
u x
i

Figura 6.6: El operador T transforma el cuadrado unitario en un paralelogramo

La elección de la región G como el cuadrado unitario viene del hecho que todo punto
(x, y) en la región R se puede expresar como una combinación lineal de la forma

(x, y) = uA + vB

donde los escalares u, v pertenecen al intervalo [0, 1]. Entonces, según el Teorema 6.3.2 y lo
hecho en la Nota 6.3.1 debemos suponer que el operador T es lineal y que

T (i) = A, T (j) = B

170
Con lo cual, T (u, v) = T (ui + vj) = uT (i) + vT (j) = u(a, b) + v(c, d) = (au + cv, bu + dv).
Lo cual se expresa en forma matricial como
      
u a c u x
T = = .
v b d v y

Ahora como los vectores A y B son linealmente independientes resulta que


 
a c
det = ad − bc 6= 0,
b d

lo cual implica que el operador T es inyectivo. Más aún, demostraremos que R = T (G),
donde

T (G) = {T (u, v) : (u, v) ∈ G} ,

G = [0, 1] × [0, 1] = {(u, v) : 0 ≤ u ≤ 1, 0 ≤ v ≤ 1}

En efecto, tomemos (x, y) ∈ R, entonces existe (u, v) ∈ G tal que

(x, y) = u(a, b) + v(c, d) = T (u, v).

Esto es, (x, y) ∈ T (G). Por otro lado, si (x, y) ∈ T (G), entonces existe (u, v) ∈ G con
T (u, v) = (x, y), es decir (x, y) = u(a, b) + v(c, d), lo cual significa (x, y) ∈ R. Ahora, por lo
hecho el Nota 6.3.1 podemos podemos concluir que

a(R) = | det A|a(G) = | det A|12 = | det A|.

Problema 6.3.4. Hallar el área encerrada por la curva de ecuación

a2
x2 + xy + y 2 = , a > 0.
2
Solución. Para resolver este problema consideraremos los siguientes resultados
Teorema 6.3.5. La gráfica de la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
es una cónica o bien una cónica degenerada. Si es una cónica entonces es

(a) Una parábola si B 2 − 4AC = 0

171
(b) Una elipse si B 2 − 4AC < 0

(c) Una hipérbola si B 2 − 4AC > 0.

Teorema 6.3.6. Si B 6= 0, la ecuación

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (6.4)

se puede trasformar en la ecuación

Au2 + Cv 2 + Du + Ev + F = 0 (6.5)

donde A y C no son ambos cero, por una rotación de ejes en un ángulo de θ radianes para
el cual se cumple que:
A−C
cot 2θ = .
B
Para pasar de la ecuación (6.4) a la ecuación (6.5) utilizamos el operador rotación:
      
u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
si queremos pasar del la ecuación (6.5) a la ecuación (6.4), utilizamos el operador inverso
      
x cos θ sen θ x u
S = = .
y − sen θ cos θ y v
Para nuestro caso tenemos que A = B = C = 1, D = E = 0 y F = −a2 /2. Con lo cual,
B 2 − 4AC = 1 − 4 < 0, luego por el Teorema 6.3.5, la cónica es una elipse. Ahora como
B = 1 6= 0, por el Teorema 6.3.6, la elipse está rotada y el ángulo de rotación satisface la
relación
A−C
cot 2θ = = 0,
B
de donde, cos 2θ = 0, esto es, θ = π/4. Por lo tanto, el operador rotación está dado por
   √ √    
u 1/ 2 −1/ 2, u x
T = √ √ = .
v 1/ 2 1/ 2 v y

De donde obtenemos las ecuaciones de transformación


1
x = √ (u − v)
2
1
y = √ (u + v).
2

172
Ahora consideremos la región

R := (x, y) : x2 + xy + y 2 ≤ a2 /2 ,

(6.6)

y supongamos que (x, y) ∈ ∂R. En tal caso tenemos que

a2 1 1 1 3 1
= x2 + xy + y 2 = (u − v)2 + (u − v)(u + v) + (u + v)2 = u2 + v 2 .
2 2 2 2 2 2
Es decir, 3u2 + v 2 = a2 . Concluimos que el operador T mapea una región G en el plano uv
en la región R en la plano xy dada por (6.6), donde

G := (x, y) : 3u2 + v 2 ≤ a2 .

(6.7)

Ver la figura de abajo.

v y

G S R
u x

Podemos ahora aplicar el Teorema de cambio de variables para concluir que


a π
Z Z Z
A(R) = dA = |J(u, v)|dudv = dudv = A(G) = π √ · a = √ a2 .
R G G 3 3
Ver el Problema 6.7.1.

173
6.4. Definición y propiedades

6.5. Representación matricial de una transformación


lineal

6.6. Isomorfismos

6.7. Problemas
x2 y 2
Problema 6.7.1 (**). Halle el área encerrada por la elipse 2 + 2 = 1. Sugerencia: Use
a b
el operador

T (u, v) = (au, bv) = (x, y).

Note que este operador mapea de manera inyectiva, el interior del circulo unitario en el plano
uv en el interior de la elipse en el plano xy.

Problema 6.7.2. En el Ejemplo 7.6.2 se encontró que la representación paramétrica de la


curva de intersección de las superficies
 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.

viene dada por la función vectorial



α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).

Utilizando el operador proyección demostrar que la proyección de la curva C sobre el plano


yz es una elipse, mientras que la proyección de C sobre el plano xy es una recta.

174
Capı́tulo 7

Formas canónicas elementales

7.1. Valores y vectores propios

7.2. Matrices semejantes y diagonalización

7.3. Matrices semejantes y diagonalización ortogonal

7.4. Formas cuadráticas

7.5. Problemas
Problema 7.5.1. Demostrar que

Z √
F · dα = π 3a2 ,
C

siendo F = (y, z, x) y C la curva de intersección entre la esfera x2 + y 2 + z 2 = a2 y el plano


x + y + z = 0, a > 0:

(a) Directamente,

(b) usando el teorema de Stokes.

Solución. Resolvamos primero el problema directamente. Los puntos sobre la curva de


intersección C satisfacen el sistema de ecuaciones
 2
x + y 2 + z 2 = a2
x + y + z = 0.

175
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando z en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos

a2 = x2 + y 2 + (−x − y)2 = 2x2 + 2xy + 2y 2 ,

o equivalentemente, x2 + xy + y 2 = a2 /2. Tenemos la ecuación cartesiana de una curva


proyectada sobre el plano xy y vemos que la curva es precisamente la elipse rotada del.
Demostramos en ese problema que esta elipse proviene de la elipse no rotada 3u2 + v 2 = a2
y que ambas elipses están relacionadas mediante la ecuaciones de transformación
1
x = √ (u − v)
2
(7.1)
1
y = √ (u + v).
2
a
Entonces tomemos u = √ sen t y v = a cos t, al variar t entre 0 y 2π parametrizamos
3
la frontera de la región G en dirección horaria (ver la figura al final. Ahora utilizando las
ecuaciones de transformación (7.1), obtenemos
a 1 a a
x = √ ( √ sen t − cos t) = √ sen t − √ cos t,
2 3 6 2
a 1 a a
y = √ ( √ sen t + cos t) = √ sen t + √ cos t.
2 3 6 2
Pero z = −x − y, entonces
2a
z = − √ sen t.
6
Por lo tanto,
a a a a 2a
α(t) = ( √ sen t − √ cos t, √ sen t + √ cos t, − √ sen t), 0 ≤ t ≤ 2π.
6 2 6 2 6
De este modo tenemos que C = α ([0, 2π]) = {α(t), 0 ≤ t ≤ 2π}.

176
Z

y = −x, z = 0
C

Ahora podemos empezar a calcular la integral.

dx a a
= √ cos t + √ sen t
dt 6 2
dy a a
= √ cos t − √ sen t
dt 6 2
dz 2a
= − √ cos t.
dt 6

a2 a2
  
dx a a a a
y = √ sen t + √ cos t √ cos t + √ sen t = sen 2t + √ .
dt 6 2 6 2 3 2 3
a2 a2
  
dy 2a a a
z = − √ sen t √ cos t − √ sen t = − sen 2t + √ sen2 t.
dt 6 6 2 6 3
a2 a2
  
dz a a 2a
x = √ sen t − √ cos t − √ cos t = − sen 2t + √ cos2 t.
dt 6 2 6 6 3

177
Entonces
Z Z
F · dα = ydx + zdy + xdz
C C
Z 2π
 2
a2

a
= √ + √ dt
0 2 3 3
√ 2
= π 3a .

En la gráfica de abajo se muestra la curva de intersección C, junto con su proyección Γ


sobre el plano xy.

z
Efectuaremos la integración sobre la superficie C
S del plano x + y + z = 0 encerrada por la curva C.
Esto es, S = {(x, y, z) : x + y + z = 0, (x, y) ∈ T }, Γ
siendo, T = {(x, y) : x2 + xy + y 2 ≤ a2 /2}. y
x

7.6. Soluciones a algunos de los problemas


Problema 7.6.1. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.

Solución. Sean x, y y z el número de acciones que la inversionista tiene en Delta, Hilton


Hotels y McDonald’s respectivamente. El corredor recuerda que hace dos dı́as el precio de
las acciones de Delta airlines bajó $1 por acción. Por lo tanto, hace dos dı́as el precio de las
acciones Delta bajó x pesos. De manera similar el precio de las acciones de Hilton Hotels
3 1
bajó y pesos, y el precio de las acciones de McDonald’s subió z pesos. De donde tenemos
2 2
la ecuación
3 1
−x − y + z = −350.
2 2

178
Ahora, con la información que el corredor tiene sobre el dı́a de ayer, establecemos la ecuación
3 1
x − y + z = 600.
2 2
La matriz aumentada del sistema conformado por las dos ecuaciones anteriores es:
 
−1 −3/2 1/2 | −350
3/2 −1/2 1 | 600

Ahora aplicamos eliminación Gaussiana para obtener la forma escalonada por filas de la
matriz.

  R1 → −6R1  
−1 −3/2 1/2 | −350 6 9 −3 | 2100
R1 → −4R1
3/2 −1/2 1 | 600 −6 2 −4 | −2400
⇐⇒

   
6 9 −3 | 2100 R2 → R1 + R2 6 9 −3 | 2100
−6 2 −4 | −2400 ⇐⇒ 0 1 −7/11 | −300/11

   
6 9 −3 | 2100 R1 → −9R1 + R2 6 0 30/11 | 25800/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11

  1  
6 0 30/11 | 25800/11 R1 → R1 1 0 5/11 | 4300/11
6
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11

Volviendo de nuevo al sistema encontramos que


5 4300 7 300
x+ z= , y− z=− .
11 11 11 11
Se observa que z es la variable de ligamiento, por lo tanto si z = t. Entonces
4300 5 4300 − 5t 7 300 7t − 300
x= − t= , y = t− = , t ∈ R. (7.2)
11 11 11 11 11 11
Es decir, el sistema tiene infinitas soluciones reales dadas en la forma

 x = (4300 − 5t)/11
y = (7t − 300)/11
z = t, t ∈ R

179
Ahora despejando el parámetro t de la primera ecuación obtenemos
4300 − 11x
t= ,
5
Reemplazando este valor en la segunda ecuación nos da
7 4300 − 11x
 
300
y= − ,
11 5 11
o equivalentemente,

77x + 55y = 28600. (7.3)

Luego, tenemos una ecuación Diofántica con a = 77, b = 55 y c = 28600. Además, como
(77, 55) = 11 y 11|28600 por el Teorema 1.5.1 la ecuación tiene solución. Más aún, si el
corredor sabe que la inversionista tiene z = t = 200 acciones de McDonald’s, entonces
puede determinar que además posee x0 = (4300 − 5 · 200)/11 = 300 acciones de Delta, y
y0 = (7 · 200 − 300)/11 = 100 acciones de Hilton. Nótese que x0 = 300 y y0 = 100 es una
solución particular de la ecuación Diofántica (7.3). Por lo tanto una nueva aplicación del
Teorema 1.5.1 nos permite concluir que la solución general de la ecuación Diofántica es
55 77
x = 300 + k = 300 + 5k, y = 100 − k = 100 − 7k, k ∈ Z.
11 11
Pero
4300 − 11x 4300 − 11(300 + 5k)
z= = = 200 − 11k.
5 5
Concluimos que las soluciones enteras del problema son

 x = 300 + 5k
y = 100 − 7k
z = 200 − 11k, k ∈ Z

Con la restricción x, y, z ≥ 0. Luego,


2
x = 300 + 5k ≥ 0 ⇔ k ≥ −60, y = 100 − 7k ≥ 0 ⇔ k ≤ 100/7 = 14 + .
7
Por lo tanto, −60 ≤ k ≤ 14. Esto es, k = −60, −59, . . . , 0, 1, 2 . . . , 14. Por consiguiente, el
problema tiene en realidad finitas soluciones, más exactamente, tenemos 75 soluciones, una
por cada valor de k. Este número de soluciones pudo haber sido obtenido sin usar ecuaciones
Diofánticas como sigue: Dado que las variables x, y deben ser no negativas, de la forma
paramétrica de las soluciones dada en (7.2) se tiene que

4300 − 5t ≥ 0, 7t − 300 ≥ 0,

180
de donde

860 = 4300/5 ≤ t ≤ 300/7 = 42,857.

Esto es, 43 ≤ t ≤ 860. Ahora bien, como el denominador en las expresiones paramétricas
para x y y dadas en (7.2) es 11, para saber el número de la soluciones enteras del problema,
debemos
j 860 k contar los múltiplos de 11 presentes en el intervalo de 43 a 860. De 1 a 860 hay
= 78 múltiplos de 11
11
44 858
11(1), 11(2), 11(3), 11(4), . . . , 11(78).

Entonces, de 43 a 860 hay 78 − 3 = 75 múltiplos de 11. Lo que quiere decir que hay 75
soluciones enteras positivas del problema.

Problema 7.6.2 (***). Una partı́cula se desplaza sobre la curva de intersección de las

superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.

Solución. Los puntos sobre la curva de intersección C satisfacen el sistema de ecuaciones


 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.

Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando y en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos

(x − 1)2 + z 2 /2 = 1.

Tenemos la ecuación cartesiana de una curva proyectada sobre el plano xz, para este caso
una elipse. En la figura 7.2 se muestra esta curva en azul. Denotemos por Γ a el conjunto de
puntos en el espacio que están sobre esta elipse, esto es,

Γ = (x, y, z) : (x − 1)2 + z 2 /2 = 1, y = 0 .


181
z

plano x + y = 2

y
x

Figura 7.1: En rojo se muestra la trayectoria seguida por la partı́cula junto con su dirección.
Se advierte que desde nuestro punto de vista (opuesto al origen) se aprecia que la partı́cula
sigue la dirección de las manecillas del reloj.

Empecemos por parametrizar la curva Γ. Tomemos x−1 = cos t y y = 2 sen t. Entonces

β(t) = (1 + cos t, 0, 2 sen t), 0 ≤ t ≤ 2π.

Ası́,

Γ = β([0, 2π]) = {β(t) : t ∈ [0, 2π]} .

Γ
C

y
x

Figura 7.2: En azul se muestra la proyección Γ de la trayectoria C. Para este caso tenemos
una elipse proyectada sobre el plano xz.

Ahora para parametrizar la curva C, utilizamos el hecho de que x + y = 2 para todo

182
punto de C. Entonces y = 2 − x = 2 − (1 + cos t) = 1 − cos t. Con lo cual,

C = α([0, 2π]),

donde

α(t) = (1 + cos t, 1 − cos t, 2 sen t).

En la figura 7.1 vemos esta curva en rojo. Vemos que α(0) = (2, 0, 0). Esto es, la partı́cula
empieza su recorrido en el punto (2, 0, 0). Si la función α(t) representa la posición de la

partı́cula se debe cumplir que su rapidez kα′ (t)k = 2 2m/s. Sin embargo tenemos que

α′ (t) = (− sen t, sen t, 2 cos t),
√ √
de donde kα′ (t)k = 2 6= 2 2. Para encontrar el vector posición de la partı́cula debemos
hallar ω tal que

kγ ′ (t)k = 2 2.

donde γ(t) = α(ωt) = (1 + cos ωt, 1 − cos ωt, 2 sen ωt).

γ ′ (t) = (−ω sen ωt, ω sen ωt, 2ω cos ωt).
√ √ √ √
kγ ′ (t)k = 2 2 ⇔ ω 2 cos2 ωt + ω 2 cos2 ωt + 2ω 2 sen2 ωt = 2ω = 2 2.

Por lo tanto, ω = 2 y el vector posición de la partı́cula está dado por



γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t).


(1, 1, 2)
b C

b (0, 2, 0)
(2, 0, 0) b b

y
x
√ b

(1, 1, − 2)

Figura 7.3: A medida que crece el parámetro t crece de 0 a π, los puntos se distribuyen sobre
la curva de intersección C siguiendo la dirección de la opuesta a las agujas del reloj, vista
desde el origen

183
En el cuadro 7.1 se observa que la partı́cula tiene un periodo (tiempo en completar una
revolución) de π segundos

t x y z
0 2 0 0

π/4 1 1 2
π/2 0 2 0

3π/4 1 1 − 2
π 2 0 0

Cuadro 7.1: La partı́cula empieza su recorrido en el punto (2, 0, 0), pasado un tiempo de π
segundos regresa al mismo punto.

Conclusión: el vector posición de la partı́cula está dado por



γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t), 0 ≤ t ≤ π.

184
Bibliografı́a

[1] T. M. Apostol, Calculus, vol. I (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1988, 813 pp.

[2] T. M. Apostol, Calculus, vol. II (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1980, 813 pp.

[3] S. I. Grossman, Álgebra lineal (5th ed.), McGraw–Hill, 1996, 634 pp.

[4] K. Hoffman and R. Kunze Linear algebra(2nd ed.), Prentice–Hall, Inc., Englewood
Cliffs, New Jersey, 1971, 407 pp.

[5] B. Kolman and D. R. Hill, Álgebra lineal (8th ed.), Pearson Educación, 2006, 643 pp.

[6] L. Leithold, El Cálculo(6a ed.), Harla, 1992, 1563 pp.

[7] J. Stewart, L. Redlin And S. Watson, Precálculo(5a ed.), Cengage Learning Editores,
2007, 933 pp.

[8] J. Stewart, Calculus(6th ed.), Thomson–Brook–cole, 2008, 1338 pp.

185

S-ar putea să vă placă și