Mis Notas de Clase A.l-2 PDF

Álgebra lineal
David Ojeda Marulanda

Índice general
1. Ecuaciones lineales 5
1.1. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Ecuación cartesiana de la recta . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2 . . . . . . . . . . . . . . . . 15
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3 . . . . . . . . . . . . . . . . 20
1.5. Sistemas de ecuaciones lineales tamaño m × n . . . . . . . . . . . . . . . . . 25
1.5.1. Ecuaciones Diofánticas . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.6. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.1. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.6.2. Suma y multiplicación por escalar de matrices . . . . . . . . . . . . . 41
1.6.3. Producto matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.6.4. Tipos de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.6.5. Inversa de una matriz cuadrada . . . . . . . . . . . . . . . . . . . . . 48
1.6.6. Matrices elementales y inversas . . . . . . . . . . . . . . . . . . . . . 48
1.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2. Determinantes 53
2.1. Definición de determinante de una matriz . . . . . . . . . . . . . . . . . . . . 53
2.2. Interpretación geométrica del determinante de tamaño 2 × 2 . . . . . . . . . 54
2.3. Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4. Determinantes e inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3. Vectores en Rn 61
3.1. Vectores en el plano enfoque analı́tico . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Vectores en el plano enfoque geométrico . . . . . . . . . . . . . . . . . . . . 63
3.2.1. Vector resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3. Diferencia entre vectores y vectores geométricos . . . . . . . . . . . . . . . . 65
3.4. Movimiento relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4.1. Vector proyección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2
4. Nociones de cálculo integral 78
4.1. Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.2. Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3. Propiedades de la integral definida . . . . . . . . . . . . . . . . . . . . . . . 86
4.4. La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.4.1. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . 87
4.5. Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . 93
4.5.1. Primer teorema fundamental del cálculo . . . . . . . . . . . . . . . . 93
4.5.2. Segundo teorema fundamental del cálculo . . . . . . . . . . . . . . . . 94
4.6. Área entre curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.7. Curvas en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.7.1. Ecuación vectorial y normal de la recta . . . . . . . . . . . . . . . . . 104
4.8. Continuidad y diferenciación de aplicaciones vectoriales . . . . . . . . . . . . 111
4.8.1. Vector tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.9. Movimiento en el plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.9.1. Movimiento rectilineo . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.10. Movimiento circular uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.10.1. Movimiento con aceleración constante . . . . . . . . . . . . . . . . . . 119
4.10.2. Fuerza resultante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.11. Vectores en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.12. Producto cruz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.13. Rectas y planos en el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.14. Aplicaciones de los vectores en el espacio . . . . . . . . . . . . . . . . . . . . 132
4.15. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.16. Taller 2 corte 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5. Espacios vectoriales 144

5.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.1.1. Ejemplos de espacios vectoriales . . . . . . . . . . . . . . . . . . . . . 145
5.2. Subespacios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.3. Combinación lineal y espacio generado . . . . . . . . . . . . . . . . . . . . . 148
5.4. Independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5. Interpretación geométrica de la independencia lineal en R3 . . . . . . . . . . 154
5.6. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.7. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.8. Bases ortonormales y proyecciones en Rn . . . . . . . . . . . . . . . . . . . . 159
5.9. Espacios con producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.10. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
3
6. Transformaciones lineales 162
6.1. Definición y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.2. Núcleo e imagen de una transformación lineal . . . . . . . . . . . . . . . . . 164
6.3. Teorema del cambio de variables en el plano (Opcional) . . . . . . . . . . . . 165
6.4. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.5. Representación matricial de una transformación lineal . . . . . . . . . . . . . 174
6.6. Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
7. Formas canónicas elementales 175

7.1. Valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.2. Matrices semejantes y diagonalización . . . . . . . . . . . . . . . . . . . . . . 175
7.3. Matrices semejantes y diagonalización ortogonal . . . . . . . . . . . . . . . . 175
7.4. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.6. Soluciones a algunos de los problemas . . . . . . . . . . . . . . . . . . . . . . 178
Bibliografı́a 185
4
Capı́tulo 1
Ecuaciones lineales
1.1. Campos
Definición 1.1.1. Un campo es una tripla conformada por un conjunto F y dos operaciones
de adicción y producto, que cumplen las siguientes propiedades
1. La adicción es conmutativa,
x+y = y+x
para todo x, y ∈ F .
2. La adicción es asociativa,
x + (y + z) = (x + y) + z
para todo x, y, z ∈ F .
3. Existe un único elemento 0 (cero) en F tal que
x+0 =0
para cada x ∈ F .
4. Para cada x ∈ F existe un único elemento (−x) en F tal que
x + (−x) = 0
5. La multiplicación es conmutativa,
xy = yx
para todo x, y ∈ F .
5
6. La multiplicación es asociativa,
x(yz) = (xy)z
para todo x, y, z ∈ F .
7. Existe un único elemento diferente de cero 1 (uno) en F tal que
x1 = x
para cada x ∈ F .
8. Para cada elemento x diferente de cero en F existe un único elemento x−1 (o 1/x) en
F tal que
xx−1 = 1.
9. La multiplicación es distributiva respecto a la adicción; esto es,
x(y + z) = xy + xz
para cada x, y, z ∈ F .
Ejemplo 1.1. Los números naturales no son campo, por ejemplo, 2 ∈ N, pero 2−1 = 1/2 ∈
/ N,
con lo cual no se cumple la propiedad 8. Por la misma razón los enteros tampoco son un
campo. Los números irracionales, I = Q′ , no definen un campo, pues 0 ∈ / I. Tanto los
números racionales Q, los reales R, como los números complejos, C son campos.
Ejemplo 1.2. Demostrar que el conjunto

n √ o
F := x + 2y : x, y ∈ Q ,
con la suma y multiplicación usual de números reales es un campo
Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y

asociativas de la suma y la multiplicación, además de la ley distributiva. Más aún, como
√ √
0 = 0 + 0 2 ∈ F y 1 = 1 + 0 2 ∈ F , resulta que se cumple la ley modulativa de la suma y
la multiplicación.
Demostremos ahora los axiomas de cerradura. Esto es,
1. Si x, y ∈ F , entonces x + y ∈ F
2. Si x, y ∈ F , entonces xy ∈ F .
6
√ √
Como x ∈ F , x = a + b 2 donde a, b ∈ Q, de manera similar, para c, d ∈ Q, y = c + d 2,
entonces
√
x + y = (a + c) + (b + d) 2.
√ √
xy = (a + b 2)(c + d 2)
√ √ √
= (a + b 2)c + (a + b 2)d 2
√ √
= ac + bc 2 + ad 2 + 2bd
√
= (ac + 2bd) + (bc + ad) 2
Dado que los números son racionales son un campo (ver problema 1.7.5), en particular
cumplen axiomas de cerradura, lo cual implica que a + c, b + d ∈ Q y ac + 2bd, bc + ad ∈ Q.
Lo que a su vez implica que el conjunto F cumple los axiomas de cerradura. Sólo nos queda
verificar la existencia de inversos aditivo y multiplicativo para cada elemento de F . Sea
√ √
x = a + b 2 ∈ F , entonces −x := −a − b 2 ∈ F y x + (−x) = 0. Ahora, supongamos que
√
x = a + b 2 6= 0. Tenemos que
xy = 1,
1 √
donde y = √ . Veamos que y ∈ F . En efecto, supongamos que a − b 2 = 0, como
a+b 2
x 6= 0, a y b no son simultáneamente iguales a 0. Lo cual nos lleva a considerar dos casos:
a 6= 0, o, b 6= 0. Si b 6= 0, entonces
a √
= 2.
b
Lo cual es imposible. Ahora bien, si a 6= 0 tenemos que
b 1
=√ .
a 2
√
Lo cual nos conduce de nuevo a una contradicción pues, 1/ 2 es un número irracional.
√ √
Concluimos que a − b 2 6= 0 si x = a + b 2 6= 0, y en ese caso obtenemos que
√
1 a−b 2
y= √ · √
a+b 2 a−b 2
√
a−b 2
= 2
a − 2b2
a a √
= 2 + 2.
a − 2b2 2b2 − a2
Con lo cual verificamos que y ∈ F , concluyendo de esta manera la demostración.
7
Demostremos ahora que el conjunto de los números complejos es un campo. Definimos
este conjunto como
C = a + bi : a, b ∈ R, i2 = −1 .

Vemos que este espacio no esta contenido en los números reales, por lo tanto, debemos
demostrar cada una de las propiedades de campo de la definición 1.1.1.
Sean z = a + bi y w = c + di dos números complejos, entonces
z=w⇔a=c y b=d
Ahora, para recordar las fórmulas que definen la suma y el producto en los números com-
plejos, podemos asociar el término a + bi con el polinomio lineal a + bx, y entonces sumar
y multiplicar complejos tal cual como hacemos con los polinomios lineales, esto es, para la
suma de dos complejos a + bi y c + di tenemos que
(a + bi) + (c + di) = (a + c) + (b + d)i,
y para el producto
(a + bi)(c + di) = ac + adi + bci + bdi2

= ac − bd + (ad + bc)i
Demostraremos que los números complejos con la suma y el producto ası́ definidas, con-
forman un campo. Lo primero que tenemos que verificar son los axiomas de cerradura.
Esto es,
1. Si z, w ∈ C, entonces z + w ∈ C
2. Si z, w ∈ C, entonces zw ∈ C.
Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,

los axiomas de cerradura vemos que a + c, b + d ∈ R y ac − bd, ad + bc ∈ R, de lo cual
inmediatamente se sigue que z + w ∈ C y que zw ∈ C. Demostremos que la suma es
conmutativa,
z + w = (a + bi) + (c + di)
= (a + c) + (b + d)i
= (c + a) + (d + b)i
= (c + di) + (a + bi)
= w + z.
8
Vemos que la conmutatividad de la suma de complejos se sigue de la conmutatividad de la
suma de los números reales. La ley asociativa de la suma complejos se demuestra de manera
análoga. Ahora estableceremos la propiedad modulativa de la suma. Si definimos 0 = 0 + 0i,
tenemos que si z = a + bi ∈ C, entonces
z + 0 = (a + bi) + (0 + 0i)
= (a + 0) + (b + 0)i
= a + bi
= z.
Además, para todo z = a + bi ∈ C, si w := −a − bi, se cumple que
z + w = (a + bi) + (−a − bi)
= (a + (−a)) + (b + (−b)i
= 0 + 0i
Es decir, todo número complejo tiene un inverso aditivo. Ahora demostraremos las propie-
dades de campo de la multiplicación de números complejos.
wz = (c + di)(a + bi)
= ca + cbi + dai − db
= (ac − bd) + adi + bci
= (ac − bd) + (ad + bc)i
= zw
Como el caso de la suma de complejos, vemos la conmutatividad de la multiplicación de
complejos se hereda de la conmutatividad de la multiplicación de los números reales. Ahora,
sean x = a + bi, y = c + di y z = e + f i un números complejos, entonces
x(yz) = (a + bi) [(c + di)(e + f i)]
= (a + bi) [ce − df + (cf + de)i]
= a(ce − df ) − b(cf + de) + [a(cf + de) + b(ce − df )] i
= a(ce) − a(df ) − b(cf ) − b(de) + [a(cf ) + a(de) + b(ce) − b(df )] i
= (ac)e − (ad)f − (bc)f − (bd)e + [(ac)f + (ad)e + (bc)e − (bd)f ] i
= (ac)e − (bd)e − (ad)f − (bc)f + [(ac)f − (bd)f + (ad)e + (bc)e] i
= (ac − bd)e − (ad + bc)f + [(ac − bd)f + (ad + bc)e] i
= [(ac − bd) + (ad + bc)i] (e + f i)
= [(a + bi)(c + di)] (e + f i)
= (xy)z.
9
Demostrando de esta forma, la ley asociativa de la multiplicación. Construiremos a conti-
nuación el elemento neutro de la para multiplicación de complejos. Queremos encontrar un
complejo e = x + yi tal que para todo z = a + bi se cumpla que ze = z, esto es,
(a + bi)(x + iy) = (a + bi),

o equivalentemente,
ax − by + (ay + bx)i = a + bi,

que según la igualdad de números complejos, conduce a el siguiente sistema

ax − by = a
bx + ay = b
Para este sistema la matriz de coeficientes es

a −b
A=
b a
para la cual, det A = a2 + b2 6= 0 si a + bi 6= 0 + 0i. Por lo tanto, por la Regla de Krammer
(ver Teorema 2.4.2) encontramos que
det B1 det B2
x= ,y = ,
det A det A
donde

a −b a a
B1 = , B2 =
b a b b
por consiguiente, x = 1, y = 0. De modo que, e = 1 + 0i = 1. Encontremos ahora el inverso
multiplicativo de un complejo z = a + bi 6= 0. Tenemos que
zw = 1 + 0i = 1,
1
donde w = . Demostraremos que w ∈ C.
a + bi
1 a − bi
w= ·
a + bi a − bi
a − bi
= 2
a + b2
a −b
= 2 2
+ 2 i.
a +b a + b2
Nótese que a − bi y a2 + b2 son diferentes de 0 + 0i, ya que a + bi 6= 0.
La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-

cación, la cual se deja como ejercicio.
10
1.2. Ecuación cartesiana de la recta
Sean P = (x1 , y1 ) y Q = (x2 , y2 ) dos puntos dados de la recta l. Definimos la pendiente
de la recta, la cual denotaremos con la letra m como
y2 − y1
m = tan θ = (1.1)
x2 − x1
donde el ángulo θ se mide desde el eje x en el sentido contrario de las manecillas del reloj
(ver la figura 1.1). Como se ve en la la fórmula (1.1), la pendiente es una razón de cambio
de y con respecto a x y es una medida de la inclinación de la recta con respecto al eje x.
y
l
Q
b
y2 − y1
Pb θ
x2 − x1
θ x
O
Figura 1.1: Cálculo de la pendiente de una recta dados dos de sus puntos
Vemos que la hipotenusa del triángulo de la figura 1.1 nos da la distancia entre los puntos
P y Q, por el Teorema de Pitagóricas tenemos que
p
d(P, Q) = (x1 − x2 )2 + (y1 − y2 )2 (1.2)
En la figura 1.2 se muestran la diferentes inclinaciones que puede tener una recta.
11
y y y
0 < θ < 90
m = tan θ > 0
b m=0 m=∞
y=b
a θ
x x x
x=a
(a) m = 0, la recta es (b) m = ∞, la recta (c) m > 0, relación
horizontal es vertical directa
y
90 < θ < 180
m = tan θ < 0
θ
x
(d) m < 0, relación

inversa
Figura 1.2: Recta horizontal, vertical, positiva y negativa
Ahora, fijemos el punto P sobre la recta l en la figura 1.2. Esto es, P = (x0 , y0 ) es un
punto dado de la recta. Supongamos además que Q = (x, y) es un punto arbitrario.
y
l
Q
b
y − y0
P
b θ
x − x0
θ x
O
Figura 1.3: Ecuación de una recta dados uno de sus puntos y su pendiente
Entonces por la fórmula (1.1) tenemos que
12
y − y0
m = tan θ = .
x − x0
O bien,
y − y0 = m(x − x0 ) (Fórmula punto-pendiente)
La fórmula anterior nos dice que para, determinar completamente una recta es suficiente
con tener un punto y una dirección, la cual es dada por la pendiente m. Esta claro que dados
dos puntos de la recta, con la fórmula (1.1) podemos hallar la pendiente y escoger uno de los
puntos para con la Fórmula punto-pendiente hallar la ecuación de la recta. Concluimos que:
Nota 1.2.1. Dos puntos determinan una recta, o bien, un punto y una dirección.
Ahora despejemos la variable y en la Fórmula punto-pendiente.
y = y0 + m(x − x0 ) = mx + y0 − mx0 ,
pongamos b = y0 − mx0 , obtenemos
y = mx + b (Fórmula pendiente-intercepto)
Vemos que cuando x = 0, y = b, es decir la recta corta al eje y en b, por eso este número
es llamado intercepto de la recta con eje y. Si m = 0 en la Fórmula pendiente-intercepto
obtenemos y = b que es la ecuación de una recta horizontal (ver figura 1.2(a)). Si m > 0
(figura 1.2(c)), x, y y guardan una relación directa, es decir, la variable y crece cuando x
crece. Por el contrario, si la variable y decrece cuando la variable x aumenta, tenemos que
m < 0, y la gráfica es la recta decreciente que se muestra en la figura 1.2(d). Finalmente, si
la recta es vertical, θ = π/2 = 90◦ , y m = tan(π/2) = ∞ (ver figura 1.2(b)).
Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función

lineal, y se suele escribir y = f (x) = mx + b.
Ejemplo 1.3 (Modelo de costo lineal). A una compañı́a le cuesta $75 producir 10 unidades
de cierto artı́culo al dı́a y $120 producir 25 unidades del mismo artı́culo al dı́a.
(a) Determine la ecuación de costos, suponiendo que sea lineal.
(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?
13
Solución. Denotemos con y = C(x) el costo total de producir y vender x unidades diarias
del artı́culo. Según los datos del problema y1 = 75 cuando x1 = 10, y y2 = 120 cuando
x2 = 25. Por lo tanto, por la Fórmula (1.1) obtenemos
y2 − y1 120 − 75
m= = = 3.
x2 − x1 25 − 10
Como m = 3 > 0, concluimos que entre más artı́culos se produzcan, su costo total aumentará.
Además, m = 3/1, lo que significa que por cada artı́culo de más que se produzca, el costo
total de producción de los artı́culos aumentará en $3. Ahora, utilizando la Fórmula punto-
pendiente, con (x0 , y0 ) = (10, 120), obtenemos
y − 120 = 3(x − 25).
De donde y = C(x) = 120 + 3(x − 25) = 3x + 45. Con lo cual se tiene la parte (a). Se observa
que aunque se produzcan 0 artı́culos, se incurre en un costo de $45, dichos costos son llamados
costos fijos. Por ejemplo, cuando una empresa esta en temporada de vacaciones hay que
pagar arriendo servicios, etc.
Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20

para obtener y = C(20) = 3(20) + 45 = 105.
Una ecuación de la forma
Ax + By + C = 0 (1.3)
donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada

ecuación lineal. Observamos que la ecuación de una recta es una ecuación lineal. En efecto,
al despejar la variable y en (1.3) obtenemos
A C
y =− x−
B B
que es la Fórmula pendiente-intercepto con m = −A/B y b = −C/A. La fórmula (1.3) es
llamada ecuación general de la recta.
A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.
Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2

respectivamente, entonces la recta l1 es paralela a la recta l2 , lo cual denotamos por l1 k l2 si
y sólo si m1 = m2 . Y las rectas l1 y l2 son ortogonales, o perpendiculares, lo cual denotamos
por l1 ⊥ l2 si y sólo si m1 · m2 = −1.
14
1.3. Sistemas de ecuaciones lineales de tamaño 2 × 2
Consideremos el sistema de ecuaciones con dos incógnitas

a11 x + a12 y = b1
(1.4)
a21 x + a22 y = b2
Puesto que las variables x y y tienen exponente 1, y el sistema consta de 2 ecuaciones con 2
incógnitas (1.4) es llamado sistema de ecuaciones lineales de tamaño 2 × 2. La primera
pregunta que nos formulamos es: bajo que condiciones el sistema en (1.4) tiene solución. Esto
es, una pareja (x, y) que satisface ambas ecuaciones. Como sabemos de la sección anterior
cada una de estas ecuaciones es representada por una linea recta, y esta claro que si estas
son paralelas no existe un punto (x, y) que este en ambas rectas, es decir el sistema no tiene
solución. Supongamos entonces que las rectas de ecuaciones a11 x+a12 y = b1 y a21 x+a22 y = b2
son paralelas. Despejando la variable y en ambas ecuaciones obtenemos
a11 b1 a21 b2
y=− x+ , y =− x+
a12 a12 a22 a22
a11 a21
en donde se identifican las pendientes de las rectas, m1 = − y m2 = − . Dado que
a12 a22
estas son paralelas tenemos que
a11 a21
m1 = m2 ⇔ − =− ⇔ a11 a22 − a21 a12 = 0.
a12 a22
Por lo tanto, si el sistema (1.4) no tiene solución entonces a11 a22 −a21 a12 = 0. Recı́procamente,
si a11 a22 − a21 a12 = 0 entonces m1 = m2 , y el sistema (1.4) no tiene solución. Lo anterior lo
podemos decir de manera equivalente como sigue:
El sistema (1.4) tiene una única solución si y sólo si a11 a22 − a21 a12 6= 0.
Observese que en el análisis anterior sólo se considero en caso en que a11 , a22 6= 0, (Ver, [3,
pag. 2]) en donde se consideran todos los casos.
Consideremos ahora en sistema

x−y =2
(1.5)
2x − 2y = 4
Vemos que para este caso a11 = 1, a12 = −1, a21 = 2 y a22 = −2. Con lo cual a11 a22 −a21 a12 =
1(−2) − 2(−1) = 0, sin embargo el sistema tiene solución, por ejemplo, la pareja (2, 0) es
solución. Más aún, este sistema tiene infinitas soluciones, para verlo nótese que la primera
ecuación puede ser obtenida de la segunda al multiplicarla por 1/2. Entonces si y = t de la
primera ecuación x = t + 2, luego las soluciones del sistema (1.5) son de la forma
x = t + 2, y = t, t ∈ R.
15
En la figura 1.4 se muestran la interpretación geométrica de las diferentes opciones de
solución de un sistema de tamaño 2 × 2.
y y y
l1
l1
l1 = l2
l2 l2
x x x
(a) Solución única (b) Sin solución (c) Infinitas solucio-

nes
Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2
Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado
Teorema 1.3.1. El sistema

a11 x + a12 y = b1
a21 x + a22 y = b2
de tamaño 2 × 2, tiene solución única, no tiene solución, en cuyo caso diremos que es
inconsistente, o tiene infinitas soluciones.
(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.
(b) No tiene solución o tiene infinitas soluciones si y sólo si a11 a22 − a12 a21 = 0.
Ejemplo 1.4. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a

un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|
dmı́n = √ .
a2 + b2
Solución. Se pueden definir infinitas distancias del punto P0 a la recta l (ver figura 1.5),
pero sólo hay una que es la menor, precisamente la perpendicular trazada desde el punto P0
hasta la recta l. Supongamos que dicha perpendicular corta a l en un punto P1 = (x1 , y1 ).
16
y
P0
l
dmı́n
P1
l⊥
x
O
Figura 1.5: Distancia de un punto a una recta
Por la fórmula (1.2) tenemos que
d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.6)
Debe notarse que las constantes a, b, c, x0 y y0 son dadas y tenemos que expresar x1 y y1
en términos de estas constantes. Para tal fin plantearemos dos ecuaciones. Empecemos por
calcular la pendiente de la recta l⊥ que une los puntos P0 y P1 . Por la fórmula 1.1 encontramos
que
y1 − y0
m⊥ =
x1 − x0
Ahora calculemos la pendiente de la recta l, tememos que ax + by + c = 0, en donde las
constantes a y b no son simultáneamente iguales a cero, por ejemplo supongamos que b 6= 0,
entonces
a c
y =− x−
b b
a
en donde vemos la pendiente de la recta l es m = − . Como las rectas l y l⊥ son perpendi-
b
culares por el Teorema 1.3.1 el producto de sus pendientes es −1, esto es,
a y − y
1 0
m · m⊥ = −1 ⇔ − · = −1.
b x1 − x0
De forma equivalente
a
x1 − x0 = (y1 − y0 ). (1.7)
b
17
Con lo cual tenemos nuestra primera ecuación
−bx1 + ay1 = ay0 − bx0 . (1.8)
Para plantear la segunda ecuación nótese que (x1 , y1 ) ∈ l, entonces ax1 + by1 + c = 0, o bien
ax1 + by1 = −c. (1.9)
Con las ecuaciones (1.8) y (1.9) formamos el siguiente sistema de ecuaciones lineales de
tamaño 2 × 2
−bx1 + ay1 = ay0 − bx0
(1.10)
ax1 + by1 = −c
Aquı́ las variables x1 , y1 reemplazan a las variables x, y en (1.4), y tenemos que a11 = −b,
a12 = a, a21 = a y a22 = b, de donde
a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),
nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,

por el Teorema 1.3.1 el sistema 1.10 tiene solución única. Ahora, multiplicando la primera
ecuación por a y la segunda por b obtenemos el sistema de ecuaciones equivalente al primero
−abx1 + a2 y1 = a2 y0 − abx0

(1.11)
abx1 + b2 y1 = −bc
Decimos que los sistemas (1.10) y (1.11) son equivalentes en el sentido de ambos tienen la
misma solución. Consideremos un tercer sistema equivalente a los dos primeros reemplazando
la segunda ecuación por la suma de la primera y segunda ecuación
−abx1 + a2 y1 = a2 y0 − abx0

(1.12)
0 + (a2 + b2 )y1 = a2 y0 − abx0 − bc
En el sistema (1.12) se observa que podemos despejar la variable y1 al multiplicar la segunda

ecuación por 1/(a2 + b2 ). Tenemos que
a2 y0 − abx0 − bc
y1 = .
a2 + b2
Entonces
a2 y0 − aby0 − bc − a2 y0 − b2 y0
y1 − y0 =
a2 + b2
2
−abx0 − b y0 − bc
=
a2 + b2
−b(ax0 + by0 + c)
= .
a2 + b2
18
Ası́,
−b(ax0 + by0 + c)
y1 − y0 = . (1.13)
a2 + b2
Ahora hagamos lo mismo pero con la diferencia x1 − x0 . En efecto, reemplazando (1.13) en
(1.7) obtenemos que esta diferencia es igual a
a −b(ax0 + by0 + c)
x1 − x0 = · ,
b a2 + b2
o bien,
−a(ax0 + by0 + c)
x1 − x0 = , (1.14)
a2 + b2
Finalmente, reemplazando las ecuaciones (1.13) y (1.14) en (1.6) y realizando un poco de
álgebra obtenemos
2 2
2 −b(ax0 + by0 + c) −a(ax0 + by0 + c)
dmı́n = +
a2 + b2 a2 + b2
b2 (ax0 + by0 + c)2 a2 (ax0 + by0 + c)2
= +
(a2 + b2 )2 (a2 + b2 )2
(a2 + b2 )(ax0 + by0 + c)2
=
(a2 + b2 )2
(ax0 + by0 + c)2
= .
a2 + b2
De donde
s
(ax0 + by0 + c)2
dmı́n =
a2 + b2
p
(ax0 + by0 + c)2
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
Existen cinco métodos para resolver sistemas de ecuaciones lineales de tamaño 2 × 2:

eliminación, que fue el que utilizamos para simplificar el sistema 1.10, igualación, sustitución,
la regla de Krammer y el método gráfico. A continuación ilustramos con otro ejemplo, esta
vez el método de igualación
19
Ejemplo 1.5. (Ver, [3, pag. 7, Problema 34]). La compañı́a Sunrise Porcelain fabrica tazas y
platos de cerámica. Para cada taza o plato un trabajador mide una cantidad fija de material
y la pone en una maquina que los forma, de donde pasa al secado y vidriado automático. En
promedio, un trabajador necesita 3 minutos para iniciar el proceso de una tasa y 2 minutos
para el de un plato. El material para una tasa cuesta 25c y el material para un plato cuesta
20c. Si se asignan $44 diarios para la producción de tazas y platos, ¿cuántos deben fabricarse
de cada uno en un dı́a de trabajo de 8 horas, si un trabajador se encuentra trabajando cada
minuto y se gasta exactamente $44 en materiales?
Solución. Sea x := el número de tazas que se debe fabricar en un dı́a de trabajo de 8

horas, y y := el número de platos que se debe fabricar en un dı́a de trabajo de 8 horas. Se
deben emplear exactamente $44 en la fabricación de las tazas y platos, de donde tenemos al
ecuación
25 20
x+ y = 44.
100 100
Además, no se deben gastar ni más ni menos de 8 horas en la fabricación de platos y tazas,
por lo que
3 2
x + y = 8.
60 60
Simplificando las dos ecuaciones anteriores obtenemos el sistema

5x + 4y = 880
3x + 2y = 480.
Despejando la variable x en la primera ecuación y reemplazandola en la segunda obtenemos

3(880 − 4y)/5 + 2y = 480, de donde y = 120, por lo tanto, x = 3(880 − 4(120))/5 = 80.
Se concluye que se deben fabricar diariamente 80 tazas y 120 platos para cumplir con las
necesidades requeridas por el problema.
1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3

Ahora consideraremos un sistema de ecuaciones lineales con tres incógnitas y tres ecua-
ciones lineales 
 a11 x + a12 y + a13 z = b1
a x + a22 y + a23 z = b2 (1.15)
 21
a31 x + a32 y + a33 z = b3
También podemos hacer una interpretación geométrica de las posibles soluciones de un sis-
tema 3 × 3, pero tendrá que esperar hasta el capı́tulo 2 en el que se introduce la noción
20
de plano. En esta sección se describirá un método de solución para el sistema (1.15). Es-
te método se basa en el hecho de que las soluciones, o conjunto solución de un sistema se
mantiene invariante bajo la acción de tres operaciones que llamaremos elementales. Antes de
definir dichas operaciones introduciremos la noción de matriz, que nos permitirá simplificar
la escritura de cada paso del procedimiento.
Definición 1.4.1 (Matriz). Una matriz es un arreglo rectangular de números.
Una matriz con m filas y n columnas es llamada matriz de tamaño m × n. Utilizaremos

la notación Mm×n (R) para referirnos a el conjunto de todas la matrices de tamaño m × n con
entradas en los reales. Se pueden escribir los coeficientes de las variables de un sistema de
ecuaciones utilizando la notación matricial. Por ejemplo, los coeficientes del sistema (1.15)
se pueden organizar en la matriz
a11 a12 a13

 
A = a21 a22 a23 

a31 a32 a33
lo cual es llamada matriz de coeficientes. Cuando se consideran los elementos (términos

independientes) después de cada igualdad en un sistema de ecuaciones en el arreglo, se obtiene
una matriz llamada matriz aumentada. Para el sistema (1.15) la matriz aumentada está
dada por
a11 a12 a13 | b1

 
a21 a22 a23 | b2 
a31 a32 a33 | b3
A continuación se enuncian las tres operaciones elementales con filas.
Definición 1.4.2 (Operaciones elementales con filas). Para reducir una matriz se utilizan
las siguientes operaciones elementales
(a) Multiplicar (o dividir) una fila por un número diferente de cero.
(b) Sumar un múltiplo de una fila o otra fila.
(c) Intercambiar dos filas
El proceso de aplicar operaciones elementales con filas para simplificar una matriz au-
mentada se llama reducción por filas.
Notación
21
(a) Ri → cRi significa que la i−ésima fila se reemplaza por esa misma fila multiplicada
por c.
(b) Rj → Rj + cRi significa la j−ésima fila se reemplaza por la suma de la fila j más la
fila i multiplicada por c
(c) Ri ↔ Rj quiere decir intercambiar dos filas i y j.
(d) A ⇐⇒ B indica que las matrices aumentadas A y B son equivalentes; es decir, que los
sistemas que representan tienen la misma solución
Cuando se aplica el método de reducción por filas a una matriz se puede llegar a dos
formas equivalentes de dicha matriz: forma escalonada reducida por renglones (FERR)
y forma escalonada por renglones (FER). A continuación damos la definición general
de estas dos formas.
Definición 1.4.3 (FERR). Una matriz se encuentra en la forma escalonada reducida por
renglones (FERR) si se cumplen las siguientes condiciones
(a) Todos los renglones (si los hay) cuyos elementos son todos cero aparecen en la parte
inferior de la matriz.
(b) El primer número diferente de cero (comenzando por la izquierda) en cualquier renglón
cuyos elementos no todos son cero es 1.
(c) Si dos renglones sucesivos tienen elementos distintos de cero, entonces el primer 1 en
el renglón de abajo está más hacia la derecha que el primer 1 en el renglón de arriba.
(d) Cualquier columna que contiene el primer 1 en un renglón tiene ceros en el resto de
sus elementos.
El primer número diferente de cero en un renglón (si lo hay) es llamado pivote para este
renglón.
Si una matriz cumple sólo las condiciones (a),(b) y (c) en la definición 1.4.3 se dice que
está en la forma escalonada por renglones (FER).
Ejemplo 1.6. Consideremos el siguiente par de matrices
1 2 3
 

1 0 0 5
A = 0 1 5, B = .
0 0 1 2
0 0 1
22
Vemos que la matriz A se encuentra en la FER, mientras que la matriz B está en la FERR.
También notamos que la matriz A se puede reducir aún más,
1 2 3 R1 → −3R3 + R1 1 2 0 1 0 0
     
0 1 5 R2 → −5R3 + R2 0 1 0 R1 → −2R2 + R1 0 1 0
⇐⇒
0 0 1 ⇐⇒ 0 0 1 0 0 1
Advertimos que la última matriz en el proceso de simplificación de la matriz A está en la

FERR, lo que nos dice esta forma es más refinada que la FER. Vemos además que la FER
no es única.
Ejemplo 1.7. Una fábrica produce tres productos A, B y C. Las ventas por cada unidad de
A, B y C son $1, $2 y $3, respectivamente. Los costos fijos son $19000 por año y los costos
de producción de cada unidad de A, B y C son $4, $5 y $7, respectivamente. El próximo
año, un total 9000 unidades de estos tres productos deben ser producidas y vendidas, y se
destina un total de $20000 para ventas. Si el costo total debe ser $71000, ¿cuántas unidades
de cada producto se deberı́an producir el próximo año?
Solución. Sea x el número de unidades del artı́culo A que se deben producir el próximo
año, y y, z, las respectivas variables que representan el número de unidades del artı́culos B
y C que se deben producir el próximo año.
Se deben producir y vender exactamente 9000 unidades de los productos A, B y C, esto

es,
x + y + z = 9000.
Se tiene un total de $20000 para las venta del próximo año, por lo que
x + 2y + 3z = 20000.
Además, como
costo total=costos fijos + costos de producción,
tenemos que la tercera ecuación es
71000 = 19000 + 4x + 5y + 7z.
Con lo cual formamos el sistema


 x + y + z = 9000
x + 2y + 3z = 20000
4x + 5y + 7z = 52000

23
La matriz aumentada para este sistema es
1 1 1 | 9000
 
1 2 3 | 20000
4 5 7 | 52000
Al aplicar reducción por filas obtenemos
1 1 1 | 9000 R1 → −R1 + R2 1 1 1 | 9000
   
1 2 3 | 20000 R3 → −4R1 + R3 0 1 2 | 11000
4 5 7 | 52000 ⇐⇒ 0 1 3 | 16000
1 1 1 | 9000
 
R3 → −R2 + R3 
0 1 2 | 11000
⇐⇒
0 0 1 | 5000
Observamos que la forma de la última matriz aumentada del sistema se encuentra en la
F.E.R y se puede ver de inmediato que z = 5000. Después se usa la sustitución hacia
atrás para despejar primero y, y luego x. La segunda ecuación queda y + 2z = 11000, de
donde, y = 11000 − 2(5000) = 1000. Ahora reemplazando los valores de y y z en la primera
ecuación obtenemos x + 1000 + 5000 = 9000 o x = 3000. Esta es la solución única para el
sistema. Se escribe el la forma (3000, 1000, 5000). El método de solución que se acaba de
emplear se denomina eliminación Gaussiana.
Ahora podemos llevar la matriz de coeficientes que tenı́amos en un inicio, a la F.E.R.R.

Con el método de eliminación Gaussiana se llego a que
1 1 1 | 9000 1 1 1 | 9000
   
1 2 3 | 20000 ⇐⇒ 0 1 2 | 11000
4 5 7 | 52000 0 0 1 | 5000
Sin embargo, está última expresión para la matriz aumentada del sistema se puede reducir
aun más:
1 1 1 | 9000 R1 → −R3 + R1 1 1 0 | 4000
   
0 1 2 | 11000 R2 → −2R3 + R2 0 1 0 | 1000
0 0 1 | 5000 ⇐⇒ 0 0 1 | 5000
1 1 0 | 4000 1 0 0 | 3000
   
0 1 0 | 1000 R1 → −R2 + R1 0 1 0 | 1000
⇐⇒
0 0 1 | 5000 0 0 1 | 5000
Vemos que la matriz aumentada del sistema está en la F.E.R.R. De inmediato se observa
que x = 3000, y = 1000 y z = 5000. Y de nuevo se encuentra que la solución del sistema es
(3000, 1000, 5000). El método descrito anteriormente se denomina eliminación de Gauss–
Jordan.
24
Por ahora se cuenta con dos métodos para resolver sistemas de ecuaciones
Eliminación Gaussiana
Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la

definición 1.4.2, para llevar una matriz a la F.E.R es llamado Eliminación Gaussiana.
Eliminación de Gauss–Jordan
Es el método mediante el cual se utilizan las tres operaciones elementales enunciadas en la

definición 1.4.2, para llevar una matriz a la F.E.R.R es llamado Eliminación de Gauss–
Jordan.
1.5. Sistemas de ecuaciones lineales tamaño m × n

Hasta ahora hemos considerado sistemas de ecuaciones con la misma cantidad de incógni-
tas que ecuaciones, como ya mencionamos para el caso de sistemas 2 × 2, existen 5 métodos
de solución, de los cuales sólo dos ellos resultan prácticos en la solución de sistemas 3 × 3:
el método de eliminación y la regla de Krammer. Si pensamos en minimizar la cantidad de
operaciones necesarias para resolver un sistema de ecuaciones, la regla de Krammer queda
descartada, pues en su aplicación es necesario el cálculo de determinantes, lo cual suma
una buena cantidad de operaciones. Además, el hecho que la regla de Krammer implique el
cálculo de determinantes limita su aplicación sólo a sistemas n × n. Siendo ası́, nos queda
el método de eliminación, en realidad tenemos dos métodos eliminación, que definimos en
el sección anterior: Eliminación de Gaussiana y Eliminación de Gauss–Jordan. Los
cuales, permiten encontrar la solución de sistemas m × n, esto es sistemas de la forma


 a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1
 a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2



a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (1.16)


 .
..


am1 x1 + am2 x2 + am3 x3 + · · · + amn xn = bm

donde los coeficiente aij , ası́ como los términos independientes bj , son elementos de un campo
F , que por lo regular es R o C. El sistema (1.16) puede tener infinitas soluciones reales,
e infinitas soluciones enteras, pero finitas soluciones enteras positivas. Para encontrar las
soluciones enteras positivas de un sistema m × n introduciremos la noción de Ecuación
Diofántica.
25
1.5.1. Ecuaciones Diofánticas
Definición 1.5.1. Una ecuación Diofántica lineal en dos variables tiene la forma
ax + by = c,
donde a, b y c son enteros con ab 6= 0.
El siguiente resultado da información sobre las soluciones de una ecuación Diofántica

lineal
Teorema 1.5.1 (Soluciones de una ecuación Diofántica). La ecuación Diofántica ax+by = c

tiene solución, si y sólo si, d|c donde d = (a, b) . Además, x0 y y0 es una solución particular
de la ecuación, entonces todas las soluciones vienen dadas en la forma
b a
x = x0 + k , y = y0 − k ,
d d
donde k es una entero arbitrario.
Aquı́ (a, b) denota el máximo común divisor entre los enteros a y b y el sı́mbolo d|c
significa que d divide a c.
Ejemplo 1.8. Una señora compró 100 frutas por $5000. Las ciruelas le costaron a $25 cada
una, las manzanas a $150 y las pitayas a $500. ¿Cuántas frutas de cada clase compro?
Solución. Sea x el número de ciruelas, y el número de manzanas, y z la cantidad de pitayas

que compro la señora. Según los datos del problema obtenemos el siguiente sistema

x + y + z = 100
25x + 150y + 500z = 5000
cuya matriz aumentada es

1 1 1 | 100
1 6 20 | 200
Ahora reduciremos esta matriz hasta llevarla a la F.E.R.R.

1 1 1 | 100 R2 → −R1 + R2 1 1 1 | 100
1 6 20 | 200 ⇐⇒ 0 5 19 | 100

1 1 1 | 100 R2 → (1/5)R2 1 1 1 | 100
0 5 19 | 100 ⇐⇒ 0 1 19/5 | 20
26

1 1 1 | 100 R1 → −R2 + R1 1 0 −14/5 | 80
0 1 19/5 | 20 ⇐⇒ 0 1 19/5 | 20
Regresando al sistema obtenemos

x − (14/5)z = 80
y + (19/5)z = 20
Vemos que la variable z, relaciona las otras dos variables, nos referimos a dicha variable como
variable de ligamiento. Si asignamos a la variable de ligamiento, el valor de un parámetro
t podemos expresar las variables x, y en términos de dicho parámetro, para obtener

x = 80 + (14/5)t
y = 20 − (19/5)t, t ∈ R
De esta forma encontramos lo que se conoce como forma paramétrica del sistema

 x = 80 + (14/5)t
y = 20 − (19/5)t
z = t, t ∈ R

Notamos inmediatamente que hay una solución por cada valor que toma el parámetro, es
decir, el sistema tiene infinitas soluciones reales. Pero, dado que cada una de las variables
debe ser positiva, tenemos las siguientes restricciones
20 − (19/5)t > 0, t > 0,
esto es, 0 < t < 100/19 = 5 + 5/19. Además, de las expresiones paramétricas para x, y,
advertimos, que para que estas variables representen números enteros, t debe ser un múltiplo
de 5 diferente de 1. Como el único múltiplo de 5 diferente de 1 en el intervalo (0, 100/19),
es 5, la única opción es que t = 5. De donde, la única solución entera positiva del sistema es
x = 94, y = 1 y z = 5.
Ahora utilicemos ecuaciones Diofánticas para hallar las soluciones enteras del sistema.
Despejando el parámetro en la primera ecuación de la forma paramétrica para el sistema
obtenemos
5
t= (80 − x),
14
reemplazando este valor en la segunda ecuación de la forma paramétrica para el sistema nos
da

19 5
y = 20 − (x − 80)
5 14
27
o equivalentemente,
19x + 14y = 19(80) + 14(20) = 1800. (1.17)
Tenemos entonces una ecuación Diofántica con a = 19, b = 14 y c = 1800, además, como
(19, 14) = 1|1800, por el Teorema 1.5.1 la ecuación tiene solución, más aún, este mismo
resultado nos asegura que la solución viene dada por
14 19
x = x0 + k , y = y0 − k ,
1 1
donde x0 , y0 es una solución particular de la ecuación, y sea observa de la ecuación (1.17)
que x0 = 80 y y0 = 20. Por lo tanto,

x = 80 + 14k
y = 20 − 19k
Para expresar la variable z como una función de k, nótese que x + y + z = 100, con lo cual,
z = 100 − x − y = 100 − (80 + 14k) − (20 − 19k) = 5k.
Entonces, las soluciones enteras del problema son


 x = 80 + 14k
y = 20 − 19k
z = 5k, k ∈ Z

De lo cual inmediatamente se deduce que el problema tiene infinitas soluciones enteras.

Finalmente, de las restricciones y, z > 0, extraemos la única solución entera positiva del
problema, pues como 0 < k < 20/19, debemos tener que k = 1. De lo cual obtenemos de
nuevo que x = 94, y = 1 y z = 5.
A continuación presentamos la noción de congruencia lineal que nos permitirá hallar

la solución particular de una ecuación Diofántica, además de introducir los enteros módulo
n.
Definición 1.5.2 (congruencia lineal). Sean a y b enteros y n un entero positivo. Si n|(a−b)

decimos que a y b son congruentes módulo n y escribimos
a ≡ b(mod n).
Por ejemplo, 23 ≡ 11(mod 12) y 1 ≡ −1(mod 2). Si n|a, entonces a ≡ 0(mod n) y

recı́procamente. En el siguiente resultado se dan las principales propiedades de la congruencia
módulo n.
28
Teorema 1.5.2. Si a ≡ b(mod n) y c ≡ d(mod n), entonces
(a) a ± c ≡ b ± d(mod n).
(b) ac ≡ bd(mod n).
(c) Para todo entero positivo k, ak ≡ bk (mod n).
(d) Para todo entero r, a + r ≡ b + r(mod n).
(e) Para todo entero r, ar ≡ br(mod n).

a b n
(f) Si r es un divisor común de a, b y n y a ≡ b(mod n), entonces ≡ mod .
r r r
n
Fermat, estudió los números de la forma 22 + 1 para n = 0, 1, 2, . . . llamados números
de Fermat y conjeturó en 1650 que siempre eran primos. La conjetura resulta ser cierta
para los cinco primeros números de Fermat que son 3, 5, 17, 257, 65537, sin embargo, Euler
demostró en 1732 que el sexto número de Fermat no es primo. Demostraremos este hecho
usando congruencias.
5
Ejemplo 1.9. El sexto número de Fermat, 22 + 1, no es primo
Solución. En efecto, puesto que, 216 = 65536 = (102)(641) + 154. Por la de congruencia
lineal tenemos
216 ≡ 154(mod 641).
Ahora, por la propiedad (c) del Teorema 1.5.2
232 ≡ 1542 (mod 641),
pero, 1542 = 23716 = (36)(641) + 640 y en consecuencia
1542 ≡ 640(mod 641).
por lo que por, transitividad debemos tener que
232 ≡ 640(mod 641),
y por la propiedad (d) del Teorema 1.5.2
232 + 1 ≡ 641(mod 641).
Finalmente, como 641 ≡ 0(mod 641), de nuevo por transitividad tenemos que
5
22 + 1 ≡ 0(mod 641),
5 5
lo cual implica que 641|(22 + 1), en efecto, 22 + 1 = (641)(6700417).
29
Además de las propiedades dadas en el teorema 1.5.2la relación ser congruente con es
transitiva, más aún, la relación de congruencia es una relación equivalencia. Recordemos
que
Definición 1.5.3. Sean A y B conjuntos. Una relación de A en B es un subconjunto del

producto cartesiano entre A y B.
Concluimos de la definición anterior que si A un conjunto arbitrario y R es una relación

en A, entonces R ⊆ A × A.
Definición 1.5.4. Sea A un conjunto arbitrario y R es una relación en A; entonces

R es reflexiva si
∀x ∈ A, (x, x) ∈ R.
R es simetrica si
(x, y) ∈ R ⇒ (y, x) ∈ R.
R es antisimetrica si
(x, y) ∈ R y (y, x) ∈ R ⇒ x = y.
R es transitiva si
(x, y) ∈ R y (y, z) ∈ R ⇒ (x, z) ∈ R.
Definición 1.5.5. Una relación en A es llamada relación de equivalencia si es reflexiva

simétrica y transitiva.
Si a y b están relacionados escribimos aRb, o bien (a, b) ∈ R.
Definición 1.5.6. Sean A un conjunto y R una relación de equivalencia en A, para cada

a ∈ A denotamos la clase de equivalencia de a por [a] y la definimos como
[a] = {x ∈ A : (x, a) ∈ R}
La clase de equivalencia de un elemento a ∈ A también suele denotarse por a.
Teorema 1.5.3. Sea R una relación de equivalencia en A. Entonces
aRb ⇔ [a] = [b].
30
Definición 1.5.7 (Conjunto cociente). Sea R una relación de equivalencia en A. El conjunto
de todas las clases de equivalencia es llamado conjunto cociente de A generado por R,
denotamos este conjunto por A/R. Tenemos entonces que
A/R = {[a] : a ∈ A} .
Teorema 1.5.4. La congruencia módulo n es una relación de equivalencia sobre Z.
El hecho que la relación de congruencia sea transitiva es clave para solucionar congruen-
cias lineales, esto encontrar los x tales
x ≡ a(mod n)
Ejemplo 1.10. Un comerciante compró lápices y borradores por $2,490. Si cada lápiz costo
$29 y cada borrador costo $33, ¿cuántos lápices y borradores compro? Sugerencia
Solución. Sea x el número de lápices y y el número de borradores que el comerciante

compró. Tenemos entonces la ecuación Diofántica
29x + 33y = 2490, (1.18)
sujeta a las condiciones x, y > 0. Para hallar la solución general de la ecuación primero
debemos hallar una solución particular. En ocasiones es fácil hallar esta solución si a|c, o b|c.
Por ejemplo, en la ecuación Diofántica
77x + 55y = 28600,
tenemos que a = 77, b = 55 y c = 28600, y observamos que 28600 = 520 · 55, esto es,
55|28600. Por lo tanto, si hacemos que la variable x sea igual a cero, obtenemos para y es
valor 28600/55 = 520. De esta forma vemos que una solución particular de la ecuación es
x0 = 0 y y0 = 520. Con lo cual, por el Teorema 1.5.1 la solución general de la ecuación es
x = 5k, y = 520 − 7k, k ∈ Z
Sin embargo, para la ecuación (1.18) a = 29, b = 33 y, entonces d = (29, 33) = 1 divide a
c = 2490, por lo que la ecuación tiene solución, pero ni a, ni b dividen a c, en consecuencia
al tomar x, o y igual a cero no obtenemos una solución entera. En este caso para encontrar
la solución particular podemos utilizar congruencias lineales. Procedemos como sigue.
Dado que 33y = 2490 − 29x tenemos que 29x ≡ 2490(mod 33). Por el algoritmo de la
división 2490 = 33(75) + 15, entonces 2490 ≡ 15(mod 33). Luego, por la propiedad transitiva
de la congruencia lineal
29x ≡ 15(mod 33)
31
Ahora, −4 ≡ 29(mod 33), entonces por el inciso (e) del Teorema 1.5.2,
−4x ≡ 29x(mod 33)
De nuevo por transitividad tenemos que −4x ≡ 15(mod33), con lo cual, −32x ≡ 120(mod33)
y 120 = 33(3) + 21 de donde 120 ≡ 21(mod 33), por consiguiente,
−32x ≡ 21(mod 33).
Por último, como 1 ≡ −32(mod 33), x ≡ −32x(mod 33), lo cual por transitividad implica
que x ≡ 21(mod 33). Esta última congruencia se satisface si x = x0 = 21, de donde y0 =
2490 − 29 · 21
= 57. En consecuencia, la solución general de la ecuación es
33
x = 21 + 33k, y = 57 − 29k, k ∈ Z.
Como x, y > 0, 21 + 33k > 0 y 57 − 29k > 0, de donde −21/33 < k < 57/29, entonces
k = 0, 1.
Si k = 0 obtenemos x = 21, y = 57.
Si k = 1 obtenemos x = 54, y = 28.
Ejemplo 1.11. Solucionar la congruencia lineal 3x ≡ 15(mod 18)
Solución. Dado que 15 ≡ −3(mod 18), por transitividad tenemos que 3x ≡ −3(mod 18).
Entonces, por la propiedad (f) del Teorema 1.5.2, x ≡ −1(mod 6) y −1 ≡ 5(mod 6), luego
de nuevo por transitivivdad x ≡ 5(mod 6). Por consiguiente, x = 5 + 6k, k ∈ Z.
Ejemplo 1.12. Un hombre cambió un cheque por cierta cantidad de dinero. El cajero equivo-
cadamente intercambio el número de pesos con el número de centavos. Al revisar la cantidad
recibida el hombre observó que tenia el doble de la cantidad por la cual habı́a girado el cheque
más dos centavos. Por que valor fue girado el cheque?
Solución. Sea x la variable que representa el número de pesos, y y la variable que representa
el número de centavos. La cantidad por la cual fue girado el cheque en pesos viene dada por
1
x+ y.
100
Si se intercambian el número de pesos con el número de centavos, la cantidad obtenida en
pesos está dada por
1
y+ x,
100
32
según los datos del problema esta cantidad el igual a el doble de la cantidad por la cual habı́a
girado el cheque más dos centavos, por lo tanto, tenemos la ecuación

1 2 1
2 x+ y + =y+ x,
100 100 100
o equivalentemente,
−199x + 98y = 2,
en donde vemos que a = −199, b = 98 y c = 2, además, d = (−199, 98) = 1 y 1|2, por

lo que la ecuación Diofántica tiene solución, puesto que esta es equivalente a la ecuación
98y − 2 = 199y, podemos hallar una solución particular al resolver la congruencia lineal
98y ≡ 2(mod 199).
Multiplicando la anterior congruencia por 2, obtenemos
196y ≡ 4(mod 199).
Ahora, −3 ≡ 196(mod 199), entonces −3y ≡ 196y(mod 199). Con lo cual por transitividad
−3y ≡ 4(mod 199).
Multiplicando esta última congruencia por 66 nos da
−198y ≡ 264(mod 199).
Pero 1 ≡ −198(mod 199), entonces y ≡ −198y(mod 199), por consiguiente por transitividad
y ≡ 264(mod 199).
Finalmente, como 264 ≡ 65(mod 199), tenemos que y ≡ 65(mod 199), de lo cual deducimos
que
y = 199k + 65, k ∈ Z.
98(65) − 2
Si k = 0, obtenemos y = y0 = 65, de donde x0 = = 32. Por lo tanto, la solución
199
general de la ecuación es
x = 32 − 98k, y = 199k + 65, k ∈ Z,
donde x, y > 0, en consecuencia,

65 32
1− < − <k< < 1,
199 98
de lo cual, k = 0, de donde x = 32, y y = 65. Luego el cheque se giró por $32, 65.
33
Según el Teorema 1.5.4 la relación aRb ⇔ a ≡ b(mod n) define una relación de equiva-
lencia en Z. Entonces la clase de equivalencia a de un elemento a ∈ Z está dada por
a = {x ∈ Z : x ≡ a(mod n)}
= {x ∈ Z : x = a + kn, para algún z ∈ Z} .
El conjunto cociente generado por esta relación es denotado por Zn . Ahora, si a es un entero
arbitrario como n > 0, por el algoritmo de la división podemos representarlo en la forma
a = qn + r con 0 ≤ r < n, luego a ≡ r(mod n) y en consecuencia por el Teorema 1.5.3, a = r.
Por ejemplo, en Z4 tenemos que
4 ≡ 0(mod 4) ⇒ 4 = 0
5 ≡ 1(mod 4) ⇒ 5 = 1
6 ≡ 2(mod 4) ⇒ 6 = 2
7 ≡ 3(mod 4) ⇒ 7 = 3
8 ≡ 0(mod 4) ⇒ 8 = 0
Por lo tanto, Z4 sólo puede estar conformado por 4 clases:

Z4 = 0, 1, 2, 3 .
En general, dado que n ≡ 0(mod n) tenemos que n = 0, en consecuencia,

Zn = 0, 1, . . . , n − 1 ,
llamamos a este conjunto enteros módulo n. Sobre Zn podemos definir una adición una
multiplicación mediante las siguientes fórmulas
x + y = x + y,
x · y = xy.
Los enteros módulo n con la suma ası́ definida cumplen las propiedades de campo de la
definición 1.1.1.
Teorema 1.5.5. La adición en Zn tiene las siguientes propiedades
Axiomas de cerradura
(a) x, y ∈ Zn , entonces x + y ∈ Zn .
(b) x, y ∈ Zn , entonces x · y ∈ Zn .
34
La suma en Zn es conmutativa, asociativa, modulativa y cada elemento en este conjunto
tiene un inverso aditivo.
(c) x + y = y + x,
(d) x + (y + z) = (x + y) + z.
(d) Para todo x ∈ Zn existe e ∈ Zn tal que x + e = x
(e) Para todo x ∈ Zn existe y ∈ Zn tal que x + y = e.
Demostración. Sean x, y ∈ Zn . Si x+y < n, entonces x+y = x + y ∈ Zn . Ahora si x+y ≥ n,

por el algoritmo de la división existen enteros q y r tales que x + y = nq + r donde 0 ≤ r < n,
entonces x + y ≡ r(mod n), en consecuencia, por el Teorema 1.5.3 tenemos que x + y = r.
Por lo tanto, x + y = x + y = r ∈ Zn . De la misma forma demostramos la cerradura de la
multiplicación. Demostremos la conmutatividad. Sean x, y ∈ Zn
x+y =x+y
=y+x
= y + x.
Nótese que como x + y = y + x, entonces x + y = y + x. De forma análoga demostramos la

asociatividad.
Sea e := 0, entonces e ∈ Zn y para todo x ∈ Zn tenemos que
x+0 =x+0= x
De esta forma vemos que 0 es el elemento neutro para suma en Zn .
Para cada x ∈ Zn sea y := n − x, entonces como n − x < n, y ∈ Zn y
x+n−x= x+n−x =n= 0
La demostración del inciso (a) en el teorema anterior nos indica como construir las tablas
de suma y la multiplicación en Zn .
Ejemplo 1.13. Construir las tablas de adición y multiplicación para Z4
Solución. Por lo hecho en la demostración del inciso (a) del Teorema 1.5.5 tenemos que
35
+ 0 1 2 3 · 0 1 2 3
0 0 1 2 3 0 0 0 0 0
1 1 2 3 0 1 0 1 2 3
2 2 3 0 1 2 0 2 0 2
3 3 0 1 2 3 0 3 2 1
Por comodidad hemos omitido las barras. Se observa de la tabla de la multiplicación que
hay simetrı́a respecto a la diagonal principal, esto quiere decir que la multiplicación en Z4 es
conmutativa, además se advierte que el elemento neutro de la multiplicación es 1 y podemos
comprobar que dicha multiplicación es además asociativa. Finalmente notamos que
2 · 0 = 0, 2 · 1 = 2, 2 · 2 = 0 y 2 · 3 = 2,
es decir, no existe ningún elemento en Z4 que multiplicado por 2 nos de 1, esto es, el 2 no
tiene inverso multiplicativo, lo cual implica que Z4 no es campo. Esto a su vez implica que
ecuaciones tan simples como 2x + 1 = 2, no tengan solución en Z4 .
Como vimos en el ejemplo 1.13, Zn no es campo, sin embargo la multiplicación es con-

mutativa, asociativa, módulativa y distributiva.
Teorema 1.5.6. La multiplicación en Zn tiene las siguientes propiedades
(c) x · y = y · x,
(d) x · (y · z) = (x · y) · z.
(d) x · (y + z) = x · y + x · z
(e) Para todo x ∈ Zn existe 1 ∈ Zn tal que x · 1 = 1.
A continuación demostraremos que si n es un número primo Zn es un campo. Para la

demostración es necesario el siguiente resultado.
Teorema 1.5.7 (Identidad de Bézout). Sean a y b enteros no nulos cuyo máximo común
divisor es d, entonces existen enteros x, y tales que
ax + by = d (1.19)
EL recı́proco del teorema anterior se tiene si d = 1, esto es,
Teorema 1.5.8. Sean a y b enteros no nulos. Entonces
36
(a, b) = 1 si y sólo si existen enteros x, y tales que ax + by = 1.
Los números x e y de la identidad (1.19), llamada identidad de Bézout, pueden determi-
narse mediante el algoritmo extendido de Euclides. Este constituye otro método para
encontrar una solución particular de una ecuación Diofántica.
Teorema 1.5.9 (Zp es un campo). Si n es un número primo, entonces Zn es un campo.
Demostración. Supongamos que n es un número primo. Sea m ∈ Zn con m 6= 0, entonces
0 < m < n. Como m y n son primos relativos, es decir, (m, n) = 1, por el Teorema de Bezút
existen enteros x, y tales que
mx + ny = 1.
Por lo tanto tenemos
mx + ny = 1.
Pero,
mx + ny = mx + ny
=m·x+n·y
Como n = 0 nos queda que
m · x = 1.
Es decir, x es el inverso multiplicativo de m. De este último hecho y los Teoremas 1.5.5 y
1.5.6 concluimos que Zn es un campo si n es un número primo.
1.6. Matrices
1.6.1. Sumatorias
Definición 1.6.1 (Sucesión). Sea X un conjunto no vacı́o, una sucesión en X es una fun-
ción definida en el conjunto los naturales que toma valores en el conjunto X. En sı́mbolos
escribimos
an : N → X.
Se acostumbra utilizar la notación
(an ) = {a1 , a2 , . . .} .
A partir de la sucesión (an ) creamos otra sucesión, llamada sucesión de sumas parciales
denotada por (Sn ) y definida como
Sn = a1 + a2 + · · · + an .
37
Para expresar de manera más cómoda la sucesión (Sn ) introducimos la notación sigma
P
. Con esta notación podemos expresar la sucesión Sn como sigue
n
X
Sn = ai ,
i=1
que se lee, sumatoria desde i = 1 hasta i = n. A continuación estableceremos las propiedades

fundamentales de la sumatoria.
Teorema 1.6.1 (Propiedades de la sumatoria). Sean (ai ), (bi ) sucesiones en R. Entonces

n
X n
X n
X
(a) (ai + bi ) = ai + bi . (propiedad aditiva)
i=1 i=1 i=1
Xn n
X
(b) cai = c ai . (propiedad homogénea)
i=1 i=1
Xn n−1
X
(c) ai−1 = ai .
i=1 i=0
n
X
(d) (ai − ai−1 ) = an − a0 . (propiedad telescópica)
i=1
n
X 1 − xn+1
(e) xi = x 6= 1. (sumas parciales de la serie geométrica)
i=0
1−x
Demostración. Los ı́tems (a), (b) y (c) se siguen de la definición de sumatoria. Establezcamos
la propiedad telescópica. De las propiedades (a) y (c)
n
X n
X n
X
(ai − ai−1 ) = ai − ai−1
i=1 i=1 i=1
n−1
X n
X
= an + ai − a0 − ai−1
i=1 i=2
n−1
X n−1
X
= an + ai − a0 − ai
i=1 i=1
= an − a0 .
38
Demostremos ahora el ı́tem (d). Por la propiedad (b) y la propiedad telescópica tenemos que
n
X n
X
(1 − x) xi = (1 − x)xi
i=0 i=0
n n
ai :=xi
X X
i i+1
= (x − x ) = (ai − ai+1 )
i=0 i=0
= a0 − an+1
= 1 − xn+1 .
Como x 6= 1, vemos la propiedad (d) se sigue.
Las propiedades (a) y (b) del teorema 1.6.1 se denominan propiedades de linealidad.
Con las propiedades de linealidad junto con la propiedad telescópica, podemos calcular las
siguientes sumas parciales.
Teorema 1.6.2. Para entero n ≥ 1, se cumple que

n
X n(n + 1)
(a) i=
i=1
2
n
X n(n + 1)(2n + 1)
(b) i2 =
i=1
6
n 2
X
3 n(n + 1)
(c) i =
i=1
2
Demostración. Demostraremos sólo la parte (a), las partes (b) y (c) se dejan como ejercicios.
Xn
Nótese que, 2i − 1 = i2 − (i − 1)2 , y que 1 = n. Por lo tanto, por las propiedades
i=1
de linealidad de la sumatoria (propiedades (a) y (b)) en el teorema 1.6.1 y la propiedad
telescópica tenemos que
n
X n
X n
X
2 i−n= 2i − 1
i=1 i=1 i=1
n
X
= (2i − 1)
i=1
n n
2 X
2 ai :=i
X 2
= i − (i − 1) = (ai − ai−1 )
i=1 i=1
2
= an − a0 = n .
39
n
X
Entonces, 2 i − n = n2 , de donde
i=1
n
X n2 + n n(n + 1)
i= = .
i=1
2 2
El teorema anterior también puede ser demostrado utilizando el principio de inducción

matemática (P.I.M)
Teorema 1.6.3 (Principio de inducción matemática). Sea S un subconjunto de los naturales

que tiene las dos propiedades siguientes
(a) 1 ∈ S.
(b) Si k ∈ S, también k + 1 ∈ S.
Entonces S = N.
Demostremos usando el principio de inducción matemática el ı́tem (a) del teorema 1.6.2.
Nótese que
1 + 3 = 4 = 22 , 1 + 3 + 5 = 9 = 32 , 1 + 3 + 5 + 7 = 16 = 42 .
Si seguimos este patrón vemos que
1 + 3 + 5 + · · · 2n − 1 = n2 . (1.20)
Definamos S = {n ∈ N : 1 + 3 + 5 + · · · 2n − 1 = n2 }. Nótese que 1 ∈ S, ya que 1 = 12 .

Ahora supongamos k ∈ S (hipótesis de inducción), esto es,
1 + 3 + 5 + · · · 2k − 1 = k 2 . (1.21)
El k-ésimo impar es de la forma 2k −1, entonces k +1-ésimo impar es de la forma 2(k +1)−1.
Sumando este término en ambos lados de (1.21) obtenemos
1 + 3 + 5 + · · · 2k − 1 + 2(k + 1) − 1 = k 2 + 2(k + 1) − 1.
Como k 2 + 2(k + 1) − 1 = k 2 + 2k + 1 = (k + 1)2 , demostramos que k + 1 ∈ S. Entonces por

el Teorema 1.6.3 (principio de inducción matemática) S = N. Esto es, (1.20) se cumple para
todo número natural n.
40
Por lo tanto, por las propiedades de linealidad de la sumatoria
n2 = 1 + 3 + · · · 2n − 1
Xn
= (2i − 1)
i=1
X n n
X
=2 i− 1
i=1 i=1
n
X
=2 i − n.
i=1
De donde finalmente obtenemos que

n
X 1 n(n + 1)
i = (n2 + n) = .
i=1
2 2
Álgebra de matrices
Como ya dijimos una matriz es un arreglo rectangular de números dispuestos en m filas
y n columnas
 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
A= . (1.22)
 
.. .. 
 .. . . 
am1 am2 · · · amn
Para simplificar el manejo de las matrices usamos la notación A = [aij ]m×n , o simple-
mente, A = [aij ] para denotar una matriz tı́pica del conjunto Mm×n (R).
Definición 1.6.2 (Igualdad de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A = B si y sólo si aij = bij para todo 1 ≤ i ≤ m, y todo 1 ≤ j ≤ n. Es decir, dos
matrices son iguales si y sólo si son iguales componente a componente.
1.6.2. Suma y multiplicación por escalar de matrices

De la misma forma en la que se definió la igualdad matricial definimos la suma y la
multiplicación por escalar de matrices, esto es, en términos de las componentes.
Definición 1.6.3 (Suma de matricial). Sean A, B ∈ Mm×n (R), con A = [aij ] y B = [bij ].
Entonces A + B = C donde C = [cij ] y cij = aij + bij .
41
Definición 1.6.4 (Multiplicación por escalar). Sean A ∈ Mm×n (R) y k ∈ R. Definimos la
multiplicación por escalar entre el escalar k y la matriz A como kA = C donde C = [cij ] y
cij = kaij .
A continuación estableceremos las propiedades del la suma y la multiplicación por escalar
de matrices.
Teorema 1.6.4 (Propiedades de la suma matricial). Sean A, B, C ∈ Mm×n (R), con A =
[aij ], B = [bij ] y C = [cij ], α, β escalares. Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
(c) Existe la matriz E = 0m×n con E = [eij ] y eij = 0 para todo i y todo j tal que
A + 0m×n = A.
(d) Para toda matriz A existe −A = [−aij ] tal que A + (−A) = 0m×n .
(e) α(A + B) = αA + αB
(f) (α + β)A = αA + βA
1.6.3. Producto matricial

Una matriz de tamaño n × 1 es llamada vector fila, que escribimos en la forma

x1 x2 · · · xn
Una matriz de tamaño 1 × n es llamada vector columna, que escribimos en la forma

 
x1
 x2 
 
 .. 
.
xn
Definición 1.6.5 (Producto escalar). Sean
   
x1 y1
 x2   y2 
A= .  yB=.
   
..  .. 
xn yn
dos vectores. Entonces el producto escalar entre A y B denotado por A · B, está dado por
A · B = x1 y1 + x2 y2 + · · · + xn yn .
42
De la definición de producto escalar se deducen las siguientes propiedades
Teorema 1.6.5 (Propiedades del producto escalar). Sean A, B y C tres vectores y α, β
escalares. Entonces
(a) A · 0 = 0.
(b) A · B = B · A.
(c) A · (B + C) = A · B + A · C.
(d) (αA) · B = α(A · B) = A · (αB).

Definimos el producto punto también entre dos vectores fila

A = x1 x2 · · · xn y B = y1 y2 · · · yn

A · B = x1 x2 · · · xn · y1 y2 · · · yn = x1 y1 + x2 y2 + · · · + xn yn .
Con frecuencia se tomará el producto escalar de un vector fila y un vector columna.
 
y1
 y2 

A · B = x1 x2 · · · xn ·  ..  = x1 y1 + x2 y2 + · · · + xn yn .

.
yn
Definición 1.6.6 (Producto matricial). Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) con A = [aij ]m×n
y B = [bij ]n×p . Entonces AB = C donde C = [cij ] y
cij = [fila i de A] · [columna j de B]
Es decir,
n
X
cij = ai1 ai2 · · · ain · a1j a2j · · · anj = aik bkj .
k=1
Como primera consecuencia de la definición del producto matricial es que dicho producto
no es conmutativo.
Ejemplo 1.14. En ∈ M2×2 (R) consideremos

1 0 0 0
A= , A=
1 1 0 2
Entonces

0 0 0 0
AB = , BA =
0 2 2 2
Como AB 6= BA, vemos que el producto de matrices no es conmutativo
43
Se puede demostrar que el producto matricial si es asociativo y distributivo
Teorema 1.6.6 (Propiedades del producto matricial). Si todas las sumas y productos están
bien definidos, entonces
(a) A(BC) = (AB)C (Ley asociativa)

(b) A(B + C) = AB + AC, (A + B)C = AC + BC (Leyes distributivas)
(c) (αA)B = α(AB) = A(αB) y (αA)(βB) = αβ(AB), α, β ∈ R.
El espacio Mm×n (R)
Cuando m = n tenemos el espacio de las matrices cuadradas, en el existe un elemento

neutro para la multiplicación llamado matriz identidad, que se denota por In×n , o simple-
mente por I y define como I = [δij ] donde
(
1, si i = j,
δij =
0, si i 6= j,
El escalar δij es llamado delta de Kronecker. Si aplicamos la definición de matrices para
el producto AI = C, donde A = [aij ]n×n y C = [cij ]n×n obtenemos
n
X
cij = aik δkj .
k=1
Pero por definición del delta de Kronecker cij = aij , de modo que AI = A. De manera similar
tenemos que IA = A. Hemos demostrado que
Teorema 1.6.7. Sea A una matriz cuadrada de n × n. Entonces
AI = IA = A.
En todo campo F para cada elemento a 6= 0 existe b ∈ F tal que ab = 1. Esto ya no se

cumple en el espacio Mm×n (R), pues por ejemplo,

1 1 0 0
A := 6=
0 0 0 0
Sin embargo, no existe una matriz B tal que AB = BA = I2×2 . No basta entonces con que
la matriz sea distinta de la matriz cero, se debe pedir además, como veremos en el capı́tulo
2, que det A 6= 0. Llamamos a este tipo de matrices, matrices invertibles
Definición 1.6.7. Una matriz A ∈ Mn×n (R) es invertible si existe B ∈ Mn×n (R)
AB = BA = I
En este caso escribimos B = A−1 .
44
Teorema 1.6.8. Sean A, B ∈ Mn×n (R). Entonces AB es invertible y
(AB)−1 = B −1 A−1
Potenciación de matrices
Sea A ∈ Mn×n (R). Definimos A0 = I y An = An−1 A.
En los números reales si an = 0, se tiene que a = 0. Veámos que en las matrices este
hecho en general no se cumple.
Ejemplo 1.15. Hallar todas las matrices A ∈ Mn×n (R) tales que A2 = 0.
Solución. Sea

a b
A= ,
c d
Como A2 = 0, det A det A = det(A2 ) = 0, entonces det A = 0, esto es, ad − bc = 0.

2
2 2 a + bc ab + bd 0 0
A =0⇔A = =
ac + cd d2 + bc 0 0
Por lo tanto, de esta ecuación matricial obtenemos 4 ecuaciones escalares que junto con la
ecuación ad − bc = 0, conforman el sistema
a2 + bc = 0 (1.23)
ab + bd = 0 (1.24)
ac + cd = 0 (1.25)
d2 + bc = 0 (1.26)
ad − bc = 0 (1.27)
Igualando las ecuaciones (1.23) y (1.26) obtenemos que a2 = d2 , de donde a = ±d. Si a = d,

de la ecuación (1.27) tenemos que a2 − bc = 0, sumando esta última ecuación con la ecuación
(1.23) nos da 2a2 = 0, de donde a = 0. Por lo tanto, bc = 0. Luego, la opción a = d genera
matrices de la forma

0 b 0 0
, b 6= 0 y , c 6= 0
0 0 c 0
Por ejemplo,

0 1
A= 6 0, y A2 = 0.
=
0 0
45
Ahora si a = −d, entonces a+d = 0, y las ecuaciones (1.24) y (1.25) no dan información pero
tampoco contradicción y las ecuaciones (1.23), (1.26) y (1.27) se vuelven la misma ecuación:
a2 + bc = 0. Por lo tanto, en este caso obtenemos matrices de la forma

a b
,
c −a
donde a, b y c satisfacen la ecuación a2 + bc = 0. Se observa que si a = 0, entonces bc = 0,

de modo que este caso también abarca el caso anterior. Concluimos que la todas la matrices
tales que A2 = 0 son de la forma

a b
,
c −a
con a2 + bc = 0.
Ejemplo 1.16. Sea A ∈ Mn×n (R) y α ∈ R. Usar inducción matemática para establecer que
(αA)n = αn An .
Solución. Supongamos que
(αA)n = αn An ∀n ∈ N (1.28)
Para n = 1, (αA)1 = α1 A1 , esto es, (1.28) se tiene para n = 1. Supongamos que (1.28) se
tiene para n = k, es decir
(αA)k = αk Ak ∀k ∈ N (Hipótesis de inducción)
Entonces
(αA)k+1 = (αA)(αA)k
= (αA)(αk Ak ) (Hipótesis de inducción)
= (αk α)(AAk ) (Teorema 1.6.6 inciso (c))
k+1 k+1
=α A
Por consiguiente, (1.28) se cumple para n = k + 1. Luego por el (PIM) tenemos la validez
de (1.28).

1 0
Ejemplo 1.17. Sea A = . Comprobar que A2 = 2A − I y calcular A100
−1 1
Solución. Por calculo directo tenemos

2 1 0 1 0 1 0
A = =
−1 1 −1 1 −2 1
46
Por otro lado,

2 0 1 0 1 0
2A − I = − =
−2 2 0 1 −2 1
Con lo cual comprobamos que A2 = 2A − I. Entonces por la propiedad distributiva del

producto matricial, las propiedades (e) y (f) del Teorema 1.6.4 y el Ejemplo 1.16 tenemos
A4 = A2 A2 = (2A − I)(2A − I)
= (2A − I)(2A) − (2A − I)(I)
= (2A)2 − 2A − 2A + I
= 4A2 − 4A + I
= 4(2A − I) − 4A + I
= 8A − 4I − 4A + I
= 4A − 3I.
Siguiendo el patrón vemos que
A2n = 2nA − (2n − 1)I.
Por lo tanto, si n = 50, obtenemos
A100 = 100A − 99I.

100 0 −99 0
= +
−100 100 0 −99

1 0
= .
−100 1
Ejemplo 1.18. Sean A, B ∈ Mn×n (R). Entonces

(a) Si A, B son matrices triangulares, o estrictamente triangulares, A + B es una matriz
triangular, o estrictamente triangular.
(b) Si A, B son matrices triangulares, o estrictamente triangulares, AB es una matriz

triangular, o estrictamente triangular.
Solución. En el caso de la suma, es suficiente demostrar el caso en que A y B sean matrices
triangulares superiores. Sean A = [aij ] y B = [bij ] matrices triangulares superiores, esto es
aij = 0 y bij = 0 si i > j. Tenemos que C = [cij ], donde
cij = aij + bij ,
47
entonces cij = 0 + 0 = 0 si i > j, esto es, C es una matriz triangular superior. Ahora para
el producto tenemos que
n
X
cij = aik bkj .
k=1
Supongamos que i > j, entonces existe p ∈ N tal que i = j + p, donde p = 1, 2, . . . , n − j. Y

tenemos dos casos: k ≤ j, o k > j. Si k ≤ j, entonces k ≤ j < j + p = i, esto es, k < i, con
lo cual aik = 0, y por lo tanto cij = 0. Ahora si k > j, entonces bkj = 0, y de nuevo cij = 0.
Es decir C es triangular superior.
Ahora, supongamos que A y B son matrices estrictamente triangulares superiores, esto

es aij = 0 y bij = 0 si i ≥ j. Si i > j, estamos en el caso anterior y cij = 0. Y si i = j tenemos
que
n
X
cii = aik bki ,
k=1
si i 6= k, entonces i > k, i < k, con lo cual respectivamente tenemos que aik = 0, o bki = 0.
En ambos casos cii = 0. Alternativamente, si i = k, aik = 0, bki = 0, y de nuevo cii = 0. En
consecuencia, la matriz C es estrictamente triangular superior.
Se puede ahora utilizar inducción matemática para demostrar que
Corolario 1.6.9. La suma y el producto de n matrices estrictamente triangulares superiores,
es una matriz estrictamente triangular superior.
1.6.4. Tipos de matrices

1.6.5. Inversa de una matriz cuadrada
1.6.6. Matrices elementales y inversas
1.7. Problemas
Sección 1.1. Campos

Problema 1.7.1 (Dificultad 3). Suponga que k un entero positivo que no es un cuadrado
perfecto. Demostrar que
n √ o
F := x + ky : x, y ∈ Q
√
es un campo. Sugerencia: Recuerde que k es un número irracional si k no es un cuadrado
perfecto
48
Problema 1.7.2. Las fórmulas de adicción y producto en Z2 están dadas por las siguientes
tablas.
+ 0 1 · 0 1
0 0 1 0 0 0
1 1 0 1 0 1
Verifique que F , junto con estas dos operaciones es un campo.
Problema 1.7.3 (Dificultad 2). En Z7 resolver las ecuaciones 3x + 4 = 1 y x2 + 2x + 6 = 0.
Problema 1.7.4. Muestre que la ecuación 2x + 1 = 2 no tiene solución en Z4 . Concluya

que Z4 no es un campo.
Problema 1.7.5 (Dificultad 2). Verifique que el conjunto de los números racionales con las
operaciones usuales de suma y producto de complejos es un campo.
Problemas que se resuelven por ecuaciones de primer

grado con una incógnita
Problema 1.7.6. Un capataz contrata un obrero ofreciéndole un sueldo anual de 3000 sucres
y una sortija. Al cabo de de 7 meses el obrero es despedido y recibe 1500 sucres y la sortija.
¿Cuál era el valor de la sortija?
Problema 1.7.7. Un conejo es perseguido por un perro. El conejo lleva una ventaja inicial
de 50 de sus saltos al perro. El conejo de 5 saltos mientras el perro da 2, pero el perro en
3 saltos avanza tanto como el conejo en 8 saltos. ¿Cuántos saltos debe dar el perro para
alcanzar la conejo?
Problema 1.7.8. Un profesor asigna 3 ejercicios. Pide a 1/4 del número de estudiantes que
está en clase que resuelva el primer ejercicio, a 3/8 el segundo y a 5/16 el tercero. Del total
de alumnos dos están ausentes. ¿Cuál es la cantidad total de alumnos?
Problemas que se resuelven por ecuaciones no lineales

Problema 1.7.9. Un joven estudiante gasta diariamente $3200 en transporte y $6400 en
el almuerzo. Para cubrir estos gastos compra bolsas de 12 paquetes de papas fritas a $8800
cada una, con el fin de vender paquetes sueltos a $1000. ¿Cuál es el mı́nimo de paquetes que
debe vender diariamente para cubrir sus gastos?
49
Problema 1.7.10. Un recipiente contiene 5000L de agua pura. Una salmuera que contiene
30g de sal por litro de agua es bombeada al recipiente a razón de 25L/min. Hallar la con-
centración de sal después de t minutos(en gramos por litro). ¿Qué sucede cuando t tiende a
infinito?
Sección 1.3. Sistemas de ecuaciones lineales de tamaño

2×2
Problema 1.7.11. (Ver, [3, pag. 7, Problema 37]). Una tienda de helados vende sólo helados
con soda y malteadas. Se pone una 1 onza de jarabe y cuatro onzas de helado en un helado
con soda, y 1 onza de jarabe y 3 onzas de helado en una malteada. Si la tienda usa 4 galones
de helado 5 cuartos de jarabe en un dı́a, ¿cuántos helados con soda y cuántas malteadas
vende? Sugerencia: 1 cuarto =32 onzas; 1 galón=128 onzas.
Problema 1.7.12. (Ver, [3, pag. 27, Problema 38]). Un viajero que acaba de regresar de
Europa gastó $30 diarios en Inglaterra, $20 diarios en Francia y $20 diarios en España por
concepto de hospedaje. En comida gasto $20 diarios en en Inglaterra, $30 diarios en Francia
y $20 en España. Sus gastos adicionales fueron $10 en cada paı́s. Los registros del viajero
indican un gasto total de $340 en hospedaje, $320 en comida y $140 en gastos adicionales
durante su viaje por estos tres paı́ses. Calcule el número de dı́as que pasó el viajero en cada
paı́s o muestre que los registros deben estar incorrectos debido a que las cantidades gastadas
no son compatibles una con la otra.
Problema 1.7.13. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.
Problema 1.7.14. (Ver, [3, pag. 27, Problema 40]). Una gente secreto sabe que 60 equipos
aéreos, que consisten en aviones de combate y bombarderos, están estacionados en cierto
campo aéreo secreto. El agente quiere determinar cuántos de los 60 equipos son aviones de
combate y cuántos son bombarderos. Existe un tipo de cohete que llevan ambos aviones; el
de combate lleva 6 de ellos y el bombardero sólo 2. El agente averigua que se requieren 250
cohetes para armar todos los aviones del campo aéreo. Aún más, escucha que se tiene el
50
doble de aviones de combate que bombarderos en al base. Calcule el número de aviones de
combate y bombarderos en el campo aéreo o muestre que la información del agente debe ser
incorrecta ya que es inconsistente.
Sección 1.5. Sistemas de ecuaciones lineales de tamaño

m×n
Problema 1.7.15. Analizar si el siguiente sistema es consistente o inconsistente. Si es
consistente dar la forma que tienen las soluciones.

 w + x − y − 6z = −4
2w + 3x + 2y + 12z = 12
2w + x + 2y + 4z = 4

Problema 1.7.16. Considere el sistema


 2x + 3y − z = a
x − y + 3z = b
3x + 7y − 5z = c

Encuentre las condiciones de a, b y c para que el sistema sea inconsistente.
Subsección 1.5.1. Ecuaciones Diofánticas

Problema 1.7.17. La entrada a cierto museo vale $900 para adultos y $375 para niños.
Cierto dı́a en que asistieron más adultos que niños se recaudaron $45000. ¿Cuántos adultos
y cuantos niños asistieron al museo?
Problema 1.7.18. Una caja contiene un total de 13 monedas distintas de 1, 5 y 10 centavos,

cuyo valor total es de 83 centavos. ¿Cuántas monedas de cada denominación hay?
Sección 1.6. Matrices

a −b
Problema 1.7.19 (**). Muestre que el conjunto de todas las matrices de la forma ,
b a
siendo a y b números reales en un campo.

n cos θ − sen θ
Problema 1.7.20 (**). Determinar A , si A := .
sen θ cos θ
51
Problema 1.7.21 (**). En los números reales, la ecuación a2 = 1, tiene dos soluciones,
a = ±1. Esto no se cumple para las matrices. Muestre que la ecuación A2 = I se satisface
para cada una de las matrices

1 0 1 0 1 b
, , ,
0 1 c 1 0 1
donde b y c son números reales arbitrarios. Hallar todas las matrices A ∈ M2×2 (R) tales que
A2 = I.

1 1 2 1 2
Problema 1.7.22 (**). Sea A = . Comprobar que A = y calcular An .
0 1 0 1
1 1 1 1 2 3
   
Problema 1.7.23 (**). Sea A = 0  1 1. Comprobar que A2 = 0 1 2. Inducir una
0 0 1 0 0 1
forma general para An y demostrarla por inducción.
Problema 1.7.24 (**). Hallar todas las matrices A ∈ M2×2 (R), tales que A2 = 0.
Problema 1.7.25. Sea A ∈ Mn×n (R) estrictamente triangular superior (es decir todas entra-
das en la diagonal y abajo de ella son cero). Demuestre que si A es una matriz estrictamente
triangular superior, entonces An es estrictamente triangular superior.
Problema 1.7.26. Sean A, B ∈ Mn×n (R). Entonces
(a) (A−1 )−1 = A si la matriz A es invertible.
(b) (AB)−1 = B −1 A−1 si A y B son matrices invertibles.
Problema 1.7.27 (***). Sea A una matriz estrictamente triangular superior. Demuestre
que I − A es invertible y exprese la matriz inversa de A en función de A.
52
Capı́tulo 2
Determinantes
2.1. Definición de determinante de una matriz

a11 a12
Sea A = . Se define el determinante de A por
a21 a22
det A = a11 a22 − a12 a21 .
Con frecuencia se denotará det A por

a11 a12
|A| o .
a21 a22
Definición 2.1.1 (Menor de una matriz). Sea A ∈ Mn×n (R) y sea Mij la matriz de tamaño
(n − 1) × (n − 1) obtenida a partir de A al eliminar la fila i y la columna j. Mij se llama
menor ij de A.
Definición 2.1.2 (Cofactor de una matriz). Sea A ∈ Mn×n (R). El cofactor ij de A,
denotado por Aij , está dado por
Aij = (−1)i+j |Mij |.
Nótese que definición anterior tiene sentido por que ya se definió el determinante para
una matriz 2 × 2.
Definición 2.1.3 (Determinante de una matriz). Sea A ∈ Mn×n (R). Entonces el determi-
nante de A, denotado por det A o |A|, está dado por
n
X
det A = |A| = a11 A11 + a12 A12 + · · · + an1 An1 = a1k A1k . (2.1)
k=1
La expresión en lado derecho de (2.1) se llama desarrollo por cofactores o expansión por
cofactores a través de la primera fila de A.
53
Definición 2.1.4 (Matriz triangular y diagonal). Una matriz cuadrada se dice triangular
superior si todos sus componentes abajo de la diagonal son cero. Se dice estrictamente
triangular superior si todas sus entradas en la diagonal y abajo de ella son cero. Es una
matriz triangular inferior si todos sus componentes arriba de la diagonal son cero. Se
dice estrictamente triangular superior si todas sus entradas en la diagonal y arriba de
ella son cero. Es una matriz diagonal si todos los elementos que no están en la diagonal
cero.
Teorema 2.1.1 (Determinante de una matriz triangular). Sea A ∈ Mn×n (R) una matriz
triangular. Entonces
det A = a11 a22 · · · ann .
2.2. Interpretación geométrica del determinante de ta-

maño 2 × 2

a b
Sea A = . En la figura
c d
y
C(a + b, c + d)
b
Q
b
B(b, d) b P b A(a, c)
x
R O
Figura 2.1: Interpretación geométrica del determinante 2 × 2
2.3. Propiedades de los determinantes

Teorema 2.3.1 (Determinante de un producto). Sean A, B ∈ Mn×n (R). Entonces
det(AB) = det A det B.
54
Teorema 2.3.2 (Teorema fundamental de los determinantes). Sea A = (aij )n×n . Entonces
n
X
det A = aik Aik
k=1
para todo i = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier fila de la matriz A. Más aún,
n
X
det A = akj Akj
k=1
para todo j = 1, 2, . . . , n. Es decir se puede calcular el det A expandiendo por cofactores sobre
cualquier columna de la matriz A.
El Teorema 2.3.2 le da sentido a la definición 2.1.3 y tiene las siguientes consecuencias
Corolario 2.3.3. Sea A ∈ Mn×n (R)
(a) det A = det At .
(b) A es una matriz invertible si y sólo si det A 6= 0 y det A−1 = 1/ det A.
(c) Si la matriz A tiene una fila o columna de ceros, entonces det A = 0.
Además tenemos las siguientes propiedades
Teorema 2.3.4 (Propiedad 1). Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al multiplicar su fila i o su columna j por un escalar c, entonces
det B = c det A.
Teorema 2.3.5 (Propiedad 2). Sean

   
a11 a12 · · · a1j · · · a1n a11 a12 · · · α1j · · · a1n
a a · · · a2j · · · a2n   a21 a12 · · · α2j · · · a2n 
   
A =  21 12 ,B = 
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

an1 a12 · · · anj · · · ann an1 a12 · · · αnj · · · ann
y
 
a11 a12 · · · a1j + α1j · · · a1n
 a21 a12 · · · a2j + α2j · · · a2n 
 
C=
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

an1 a12 · · · anj + αnj · · · ann
55
Entonces
det C = det A + det B.
En otras palabras, supongamos que las matrices A, B y C son idénticas excepto por la columna
j y que la columna j de C es igual a la suma de las columnas j–esimas de A y B. Entonces
det C = det A + det B.
Teorema 2.3.6. [Propiedad 3] Sean A, B ∈ Mn×n (R), donde B es la matriz obtenida de A
al intercambiar dos de sus filas o sus columnas. Entonces
det B = − det A.
Teorema 2.3.7 (Propiedad 4). Si la matriz A tiene dos filas o columnas iguales, entonces
det A = 0.
Teorema 2.3.8 (Propiedad 5). Si una fila o columna de una matriz A es un múltiplo escalar
de otra fila o columna, entonces det A = 0
Teorema 2.3.9 (Propiedad 6). Si se suma un múltiplo escalar de una fila o columna o otro
fila o columna, entonces el determinante no cambia.
2.4. Determinantes e inversas

Definición 2.4.1 (Matriz de cofactores y matriz adjunta). Sea A ∈ Mn×n (R) y sea B la
matriz dada por
 
A11 A12 · · · A1n
 A21 A22 · · · A2n 
 
B=
. . . . . . . . . . . . . . . . . . . 

An1 An2 · · · Ann
B es llamada matriz de cofactores de A. Entonces la adjunta de A denotada por adj A
es la transpuesta de la matriz de cofactores, esto es,
 
A11 A21 · · · An1
 A12 A22 · · · An2 
 
adj A = B t = 
. . . . . . . . . . . . . . . . . . . 

An1 A2n · · · Ann
Teorema 2.4.1 (Cálculo de la inversa de una matriz). Sea A ∈ Mn×n (R). Entonces A es
invertible si sólo si det A 6= 0. Si det A 6= 0, entonces
1
A−1 = adj A.
det A
56
Teorema 2.4.2 (Regla de Cramer). Sea A ∈ Mn×n (R) y suponga que det A 6= 0. Entonces
la solución única del sistema Ax = b viene dada por
D1 D2 Dn
x1 = , x2 = , . . . , xn = ,
D D D
donde Dj = det Aj , j = 1, . . . , n, D = det A y Aj la matriz obtenida de A al cambiar su
columna j por el vector columna
 
b1
 b2 
b=.
 
 .. 
bn
Ejemplo 2.1. Considere el triángulo de la figura 2.2
b a
h
A B
x y
c
Figura 2.2: Regla de Krammer y teorema del coseno
(a) Demuestre, usando trigonometrı́a elemental las llamadas leyes de proyección
c cos A + a cos C = b (2.2)
b cos A + a cos B = c (2.3)
c cos B + b cos C = a (2.4)
(b) Utilice la regla de Krammer y las leyes de proyección para demostrar el teorema del
coseno:
a2 = b2 + c2 − 2bc cos A (2.5)
b2 = a2 + c2 − 2ac cos B (2.6)
c2 = a2 + b2 − 2ab cos C (2.7)
57
Solución. Del triángulo en la figura 2.2 obtenemos
x y
cos A = , cos B = ⇒ c = x + y = b cos A + a cos B.
b a
Con lo cual tenemos (2.3).
Ahora, como A + B + C = π, tenemos que
cos C = cos(π − (A + B))

= − cos(A + B)
= −(cos A cos B − sen A sen B)
= sen A sen B − cos A cos B
h h y
= · − cos A.
b a a
Entonces
h h y h2
cos C = · − cos A ⇔ a cos C = − y cos A.
b a a b
Además nótese que por el Teorema de Pitagoras b2 = x2 + h2 , con lo cual
h2 h2
− (c − x) cos A = − c cos A + x cos A
b b
h2 x
= + x − c cos A
b b
h2 + x2
= − c cos A
b
b2
= − c cos A
b
= b − c cos A.
Por lo tanto, a cos C = b − c cos A, o bien, a cos C + c cos A = b. Luego (2.2) se tiene. Ahora,
cos A = x/b y sen B = y/a, entonces
c = x + y = b cos A + a sen B.
Con lo cual tenemos (2.3). De manera similar a como se demostró (2.2) tenemos que
hh x h2
cos C = sen A sen B − cos A cos B = − cos B ⇔ b cos C = − (c − y) cos B
ab b a
h2
⇔ b cos C + c cos B = + y cos B,
a
58
y por el Teorema de pitagoras a2 = h2 + y 2 , por consiguiente,
h2 h2 y h2 + y 2
+ y cos B = +y = = a.
a a a a
Por lo tanto,
b cos C + c cos B = a.
Como se querı́a demostrar. Demostremos ahora el teorema del coseno. Sean x = cos A,
y = cos B y z = cos C. Entonces el sistema conformado por las ecuaciones (2.2), (2.3) y (2.4)
expresado en forma matricial toma la forma
c 0 a x b
    
 b a 0 y  =  c 
0 c b z a
Sea
c 0 a
 
A =  b a 0 ,
0 c b
entonces det A = 2abc > 0, por lo tanto la matriz A es invertible y por la Regla de Krammer,
D1 D2 D3
x= ,y = ,z = ,
D D D
donde Dj = det Aj , j = 1, 2, 3, D = det A y Aj es la matriz obtenida de A al cambiar su
columna j por el vector columna
b
 
b = c

a
Cuando realizamos los determinantes de las matrices Aj por la primera fila obtenemos

b 0 a
det A1 = c a 0 = bab − a(c2 − a2 ) = a(b2 + c2 − a2 ).

a c b

c b a
det A2 = b c 0 = c(cb) − bb2 + a(ab) = b(c2 − b2 + a2 ).

o a b
59

c 0 b
det A3 = b a c = c(a2 − c2 ) = c(a2 − c2 + b2 ).

o c a
Entonces
D1 a(b2 + c2 − a2 )
cos A = x = =
D 2abc
Con lo cual
2bc cos A = b2 + c2 − a2 ⇔ a2 = b2 + c2 − 2bc cos A
De donde obtenemos (2.5). De manera similar
D2 b(c2 − b2 + a2 )
cos B = y = =
D 2abc
D3 c(b2 + c2 − a2 )
cos C = z = =
D 2abc
De donde se siguen (2.6) y (2.7).
2.5. Problemas
Problema 2.5.1. Sea (Anj ) una sucesión de matrices definida como sigue Anj = [anj ]n×n ,
donde anj = ajn−1 y 1 ≤ j ≤ n. Llamaremos a cada elemento de esta sucesión matriz de
Vardermonde, y cada elemento de la sucesión en R dada por (Dn ) con Dn := det Anj ,
determinante de Vardermonde de tamaño n × n. Defina las matrices de Vandermonde
para n = 2, 3 y n = 4 y calcule sus respectivos determinantes. Conjeture una fórmula para
calcular Dn y demuestrela utilizando inducción matemática.
Sea
1 1 1
 
A = x1 x2 x3 
x21 x22 x23
60
Capı́tulo 3
Vectores en Rn
Definición 3.0.1. Definimos el espacio Euclideo de n dimensiones como el producto

cartesiano del conjunto R de números reales con sigo mismo n veces, esto es,
Rn = R × · · · × R
= {(x1 , x2 , . . . , xn ) : xi ∈ R, 1 ≤ i ≤ n} .
Estudiaremos especialmente el plano xy, esto es
R2 = {(x, y) : x, y ∈ R} ,
y el espacio
R3 = {(x, y, z) : x, y, z ∈ R} ,
3.1. Vectores en el plano enfoque analı́tico

Definición 3.1.1. Definimos un vector de R2 como una pareja ordenada de números reales,
esto es,
A = (Ax , Ay ).
Al escalar Ax se le llama componente en x del vector A, y a Ay componente en y. La

dirección del vector se define como el ángulo θ que forma el vector con el eje x medido en
el sentido contrario de las manecillas del reloj. (Ver Figura 3.1). La magnitud del vector se
denota por kAk y está dada por
q
kAk = A2x + A2y .
61
y
A
kAk
Ay
θ
x
O Ax
Figura 3.1: Dirección y magnitud de un vector
Definición 3.1.2 (Igualdad de vectores). Dos vectores A = (Ax , Ay ) y B = (Bx , By ) son

iguales si y sólo si son iguales componente a componente, esto es,
A = B ⇔ Ax = Bx y Ay = By .
Definición 3.1.3 (Adición de vectores). Sean A = (Ax , Ay ) y B = (Bx , By ) dos vectores de
R2 . La suma vectorial entre los vectores A y B se define como
A + B = (Ax + Bx , Ay + By ).
Definición 3.1.4 (Multiplicación por escalar). Definimos la multiplicación por escalar entre
el vector A = (Ax , Ay ) y el escalar k como
kA = k(Ax , Ay ) = (kAx , kAy ).
Utilizando la suma y multiplicación por escalar de vectores tenemos que para todo vector
A = (Ax , Ay ), se cumple que
A = (Ax , Ay ) = Ax (1, 0) + Ay (0, 1).
Los vectores i := (1, 0) y j := (0, 1), son llamados vectores coordenados unitarios.
Usando estos vectores podemos expresar el vector A como una suma de sus componentes
Ax = kAk cos θ, Ay = kAk sen θ,
tenemos que
A = kAk cos θi + kAk sen θj.
La expresión anterior se conoce como forma polar del vector A.
A continuación enunciamos las propiedades la suma y multiplicación por escalar de vec-

tores
62
Teorema 3.1.1 (Propiedades de los vectores). Sean A, B y C tres vectores de R2 y α, β ∈ R.
Entonces
(a) A + B = B + A.
(b) A + (B + C) = (A + B) + C.
(c) A + 0 = A, A + (−A) = 0. Aquı́, 0 = (0, 0) es el vector cero, elemento neutro de R2 .
(d) α(A + B) = αA + αB.
(e) (α + β)A = αA + βA.
Las propiedades de la norma o magnitud de un vector se dan en el siguiente resultado
Teorema 3.1.2 (Propiedades de la norma). Sean A y B vectores de R2 y k un escalar.

Entonces
(a) kAk ≥ 0 (Positividad)

(b) kAk = 0 ⇔ A = 0
(c) kkAk = |k|kAk (Propiedad homogénea)
(d) kA + Bk ≤ kAk + kBk (Desigualdad triangular)
3.2. Vectores en el plano enfoque geométrico

3.2.1. Vector resultante
A la adicción vectorial de los vectores
A = Ax i + Ay j, B = Bx i + By j,
se le conoce como vector resultante, esto es,
R = (Rx , Ry ) = (Ax + Bx )i + (Ay + By )j.
Podemos hallar la dirección del vector resultante en términos de las componentes de los
vectores A y B con la fórmula

Ry Ay + By
arctan = arctan .
Rx Ax + Bx
Para graficar el vector resultante trasladamos el vector B, respetando magnitud y direc-
ción de tal forma que su punto inicial coincida con el punto final de A, luego hacemos lo
mismo con el vector A (figura 3.2) generando de esta forma un paralelogramo, cuya diagonal
63
representa el vector resultante R. Esta interpretación de la suma vectorial es conocida como
regla del paralelogramo. Si tenemos las componentes de los vectores A y B podemos
hallar la magnitud del vector resultante con la fórmula
q
kRk = (Ax + Bx )2 + (Ay + By )2 .
B
By
Ry R B
Ay
A
x
O
Ax Bx
Rx
Figura 3.2: Construcción geométrica para la suma de dos vectores
Ahora si tenemos las magnitudes y direcciones de los vectores A y B, expresando los vec-
tores en la forma polar podemos encontrar una fórmula para la magnitud de R dependiendo
de dichas magnitudes y direcciones. En efecto, si α y β son direcciones de los vectores A y
B respectivamente, tenemos que
A = kAk cos αi + kAk sen αj, B = kBk cos βi + kBk sen βj.
64
Con lo cual,
kRk2 = (kAk cos α + kBk cos β)2 + (kAk sen α + kBk sen β)2
= kAk2 cos2 α + 2kAkkBk cos α cos β + kBk2 cos2 β
+ kAk2 sen2 α + 2kAkkBk sen α sen β + kBk2 sen2 β
= kAk2 + kBk2 + 2kAkkBk(cos α cos β + sen α sen β)
= kAk2 + kBk2 + 2kAkkBk cos(α − β)
= kAk2 + kBk2 + 2kAkkBk cos θ.
Donde θ = α − β es el ángulo entre A y B.
En el problema 4.15.10 se pide encontrar esta fórmula usando el teorema del coseno.
3.3. Diferencia entre vectores y vectores geométricos

Sean A y B vectores de R2 cuyos puntos iniciales coinciden en el origen O ver (figura
3.3).
−→
A AB
B
x
O
Figura 3.3: El vector que va del punto A a el punto B es igual a B − A
El vector con punto inicial en A y punto final en B es llamado vector diferencia. Vemos
−→
que el vector B resulta de la suma entre los vectores A y AB, esto es,
−→
A+ AB= B.
65
Entonces por el Teorema 3.1.1 tenemos que
−→ −→
A+ AB= B ⇔ −A + (A+ AB) = −A + B
−→
⇔ (−A + A)+ AB= B − A
−→
⇔ 0+ AB= B − A
−→
⇔AB= B − A.
Una interpretación similar nos permite concluir que
−→
BA= A − B.
−→
El vector AB= B−A, también es llamado vector geométrico. Los vectores geométricos son
especialmente útiles para representar magnitudes fı́sicas tales como fuerzas, desplazamientos,
velocidades, y aceleraciones, las cuales poseen magnitud y dirección. Lo que mide la flecha
indica la magnitud y la punta de la flecha indica la dirección.
Supongamos que introducimos un sistema de coordenadas con origen O. En la figura 3.4

−→ −→
se muestran dos vectores geométricos AB y CD que tienen la misma dirección y magnitud.
y
D
d2 − c2
C θ
d1 − c1
B
b 2 − a2
A θ
b 1 − a1
x
O
−→ −→
Figura 3.4: AB y CD representan vectores geométricos equivalentes.
Tenemos que
b1 − a1 d 1 − c1
cos θ = = ,
kB − Ak kD − Ck
Dado que kB − Ak = kD − Ck, nos da que b1 − a1 = d1 − c1 . De manera análoga vemos que
b2 − a2 = d2 − c2 . Entonces, de acuerdo a la definición 3.1.2 encontramos que
−→ −→
AB=CD ⇔ B − A = D − C.
66
Llamamos a tales vectores geométricos equivalentes. En fı́sica se utiliza la noción de vectores
equivalentes para definir la igualdad entre vectores.
Cuando el punto inicial de un vector geométrico coincide con el origen y el punto final
A tiene coordenadas (a, b) tenemos que
−→
OA= A − 0 = (a, b) − (0,0) = (a, b) = A.
−→
Por es razón escribimos A en lugar de OA. Este hecho tiene importantes repercusiones, ya
que nos dice que las componentes de cualquier vector A son las mismas de cualquier vector
geométrico equivalente a el.
y
D
d2 − c2
C θ
d1 − c1
A = (a, b)
θ
x
O
Figura 3.5: Un vector geométrico cuyo punto inicial coincide con el origen tiene las mismas
componentes que cualquier vector que tenga la misma magnitud y dirección.
Por ejemplo, en la figura 3.5 vemos que a = d1 − c1 y b = d2 − c2 , de modo que

−→
A =CD (3.1)
Paralelismo y ortogonalidad de vectores

Dos vectores A y B de R2 son paralelos si el primero se puede expresar como un múltiplo
escalar del segundo, es decir
Definición 3.3.1 (Vectores paralelos). Sean A y B dos vectores de R2 . El vector A es
paralelo a el vector B lo cual se denota por A k B si y solo si existe k ∈ R tal que A = kB.
Para obtener un criterio que nos permita saber cuando dos vectores son ortogonales,
utilizaremos el producto punto, o producto escalar, el cual fue introducido en la subsección
1.6.3. Primero que todo debemos notar que si A = (x, y) ∈ R2 , entonces
A · A = x2 + y 2 = kAk2 .
67
Demostramos que
Teorema 3.3.1. Si A ∈ R2 , entonces
kAk2 = A · A.
Ahora utilizaremos el Teorema del coseno para demostrar que
Teorema 3.3.2. Sean A y B son vectores de R2 , entonces
A · B = kAkkBk cos θ, (3.2)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Demostración. Aplicando el Teorema del coseno al triángulo que se muestra en la figura 3.3
−→
A AB
B
θ
x
O
obtenemos
kB − Ak2 = kAk2 + kBk2 − 2kAkkBk cos θ, (3.3)
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Ahora, dado que el producto punto es conmutativo y distributivo
respecto a la suma de vectores, por el Teorema 3.3.1 tenemos que
kB − Ak2 = (B − A) · (B − A)
= B · B − 2B · A + A · A
= kBk2 − 2A · B + kAk2 .
Por lo tanto, tenemos que
kAk2 − 2A · B + kBk2 = kAk2 + kBk2 − 2kAkkBk cos θ
68
Sumando el término −(kAk2 + kBk2 ) en ambos lados de la ecuación anterior y luego multi-
plicando por 1/2 obtenemos (3.2).
Nótese que (3.3) permite calcular la magnitud del vector diferencia.
Además, de (3.2) podemos concluir que
A · B = 0 ⇔ si solo si θ = π/2.
Es decir, dos vectores no nulos A y B son ortogonales si solo si A · B = 0. Tenemos entonces

el siguiente resultado
Teorema 3.3.3 (Vectores ortogonales). Dos vectores no nulos A y B son ortogonales si

solo si A · B = 0
Con lo fórmula (3.2) podemos calcular el ángulo entre vectores.
Teorema 3.3.4 (Ángulo entre vectores). Si θ denota el ángulo más pequeño que hay entre
dos vectores no nulos A y B medido en el sentido contrario de las manecillas del reloj,
entonces
A·B A B
cos θ = = · . (3.4)
kAkkBk kAk kBk
Ejemplo 3.1. Utilice el producto punto para demostrar las siguientes identidades
(a) cos(α − β) = cos α cos β + sen α sen β.
(b) cos(α + β) = cos α cos β − sen α sen β.
(c) sen(α − β) = sen α cos β − sen β cos α.
(d) sen(α + β) = sen α cos β + sen β cos α.
Solución. Sean A y B vectores unitarios cuyas direcciones están dadas por los ángulos α y
β respectivamente. Entonces para el vector A tenemos que
Ax = kAk cos α = cos α

Ay = kAk sen α = sen α,
de modo que
A = cos αi + sen αj = (cos α, sen α).
De la misma forma, vemos que
B = cos βi + sen βj = (cos β, sen β).
69
y
A
β
α
x
Figura 3.6: Todo vector unitario u cuya dirección está dada por un ángulo θ se puede expresar
en la forma u = cos θi + sen θj
Como se ve en la figura 3.6, el ángulo entre los vectores unitarios A y B es θ = β − α.

Por lo tanto, por la fórmula (3.2) encontramos que
(cos α, sen α) · (cos β, sen β) = 1 · 1 cos(β − α).
O de manera equivalente,
cos(β − α) = cos(α − β) = cos α cos β + sen α sen β.
Con cual, tenemos (a).
Ahora, dado que la función coseno es par, y la función seno es impar, aplicando en inciso
(a) tenemos que
cos(α + β) = cos(α − (−β)) = cos α cos(−β) + sen α sen(−β).

= cos α cos β − sen α sen β.
Para obtener (c), rotamos el vector A de la figura 3.6 un ángulo de 90 grados en dirección
contraria de las manecillas del reloj, sin cambiar su magnitud, de tal forma que generamos
un vector C que también es unitario pero cuya dirección es α + π/2 (ver figura 3.7). Por lo
tanto sus componentes son
Cx = kCk cos(α + π/2) = − sen α

Cy = kCk sen(α + π/2) = cos α,
Nótese que en las fórmulas anteriores para hallar la componente en x del vector C usamos
(b) con β = π/2. Y para hallar la componente en y, usamos la identidad fundamental:
70
p √
sen(α + π/2) = 1 − cos2 (α + π/2) = 1 − sen2 α = cos α.
B A
π/2
α
x
Figura 3.7: Utilización del propucto punto para hallar una fórmula para el seno de la suma
de la de ángulos
Ahora bien, dado que el ángulo entre los vectores B y C es θ = β−(π/2+α) = β−α−π/2,
por (3.2) tenemos que
(cos β, sen β) · (− sen α, cos α) = 1 · 1 cos(β − α − π/2).
Que equivale a
− sen α cos β + sen β cos α = sen(β − α)
Al multiplicar por (−1) la identidad anterior obtenemos (c).
La identidad (d) se deduce de la identidad (c) de manera análoga como se demostró la
identidad (b) a partir de la (a).
3.4. Movimiento relativo

A continuación ilustraremos con un ejemplo el uso de los vectores para describir como
están relacionadas entre sı́ las mediciones realizadas por observadores que las calculan desde
distintos marcos de referencia. Un ejemplo clásico de este tipo de movimiento, llamado
movimiento relativo es el movimiento de un avión, que puede tener una velocidad v
en relación con el aire, en este caso una persona que está en la tierra medirá una velocidad
distinta a la del piloto, dependiendo de la dirección y magnitud de v.
71
Problema 3.4.1. Un piloto tiene que volar hacia el este de A a B y después regresar hacia
el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto a
la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
Realizar las gráficas correspondientes para ilustrar la situación.
Solución. Resolveremos solo el caso 1 del inciso (b), y el caso 1 del inciso (c). El resto se
deja como ejercicio (ver el problema 4.16.12).
Denotemos por C a el vector que representa la velocidad del avión respecto a el aire, esto
es, la velocidad que mide el piloto. Y denotemos por D el vector que representa la velocidad
del aire con respecto a la tierra, es decir la velocidad del viento que mide una persona que
está estacionaria en el tierra.
N N
Ab b
D C Bb
Ab
C b
D Bb
E E
S S
(a) Para el viaje de ida, un observador en tierra (b) Para el viaje de venida, dado que el viento es
mide la misma dirección de la velocidad del viento contrario a la dirección del movimiento del avión,
que el piloto, pero como existe un viento hacia el un observador en tierra calcula que la rapidez del
este, el observador en tierra calcula que la rapidez avión es c − v.
del avión es c + v.
Figura 3.8: Movimiento de un avión cuando prevalece un viento hacia el este
72
Suponemos como caso 1, que la dirección del vector D es hacia el este en el viaje de ida
y de venida. En el viaje de ida. La dirección que mide el piloto para el vector C es α = 0,
además, la magnitud es kCk = c, por lo tanto,
Cx = c cos 0 = c, Cy = c sen 0 = 0,
con lo cual,
C = (c, 0).
De forma análoga, encontramos que
D = (v, 0).
En consecuencia, la velocidad en el viaje de ida (ver figura 3.8(a)) que mide un observador
en tierra es
RAB = C + D = (c + v, 0).
Vemos de esta forma, que desde la perspectiva de un observador en tierra la rapidez del
avión en el viaje de ida es kRAB k = c + v. Y dado que cuando dicha rapidez es constante,
según la ecuación 4.16 con x0 = 0 es igual a distancia sobre tiempo, tenemos que el tiempo
tAB que tarda el avión en ir desde A hasta B es
l
tAB = .
c+v
Ahora, para el viaje de vuelta el vector D mantiene su dirección y magnitud (ver figura
3.8(b)). Sin embargo, el vector C a pesar de mantener su magnitud invierte su dirección,
esto es, la velocidad que mide el piloto para el viaje de vuelta es,
C = (c cos π, c sen π) = (−c, 0).
Por lo que para un observador en tierra el velocidad en el viaje de vuelta es
RBA = −C + D = (v − c, 0).
Además, Por el inciso (d) c > v, ası́, la rapidez del avión en el viaje de vuelta para un
observador en tierra es
kRBA k = |v − c| = c − v.
Con lo cual,
l
tBA = .
c−v
73
Concluimos de esta forma, que el tiempo necesario para completar un viaje redondo es
tE = tAB + tBA
l l
= +
c+v c−v
(c − v)l + (c + v)l
=
c2 − v 2
2cl
= 2
c − v2
2l/c
=
1 − v 2 /c2
t0
= .
1 − v 2 /c2
Ahora, supongamos que prevalece un viento hacia el norte. En este caso, si el piloto dirige
el avión en el segmento que va desde el punto A hasta el punto B, un observador en tierra
verı́a que el avión sigue la dirección noreste, ya que prevalece un viento hacia el norte. Por
lo tanto, el piloto debe enfilar el avión en la dirección sureste, con cierta inclinación medida
a partir del sur, que depende de la magnitud del vector D, para que un observador en tierra
vea que el avión sigue exactamente la dirección del segmento AB
N N
√ √
Ab b
c2 − v 2 B
b
A b
c2 − v 2
b
Bb
c v v c
E E
S S
(a) El piloto debe enfilar el avión en dirección sur- (b) En el viaje de vuelta, el piloto debe enfilar el
este, para que un observador en tierra vea que el avión en dirección suroeste, para que un observador
avión sigue el segmento AB en tierra vea que el avión sigue el segmento BA
Figura 3.9: Movimiento de un avión cuando prevalece un viento hacia el norte
En la figura 3.9(a) se muestra la velocidad del avión en azul, desde el punto de vista del
piloto. La velocidad del aire se muestra en verde. La velocidad del avión calculada por un
observador en tierra es entonces
RAB = C + D.
74
Observese que los tres vectores el ecuación anterior se relacionan según el triángulo que
muestra en la figura 3.9(a), y dado que el vector D es ortogonal a el vector RAB , dicho
triángulo es rectángulo. Por lo tanto, por el Teorema de Pitagoras
√
kRAB k = c2 − v 2 .
Ahora podemos calcular el tiempo que tarda el avión en ir desde el punto A hasta el punto
B,
l
tAB = √ .
c2 − v 2
Para el viaje de vuelta, el piloto debe enfilar el avión en la dirección sur oeste (ver figura
3.9(b)), y entonces un observador en tierra verı́a que el avión sigue el segmento de recta BA
calculando que el tiempo en recorrerlo es
l
tBA = √ .
c2 − v2
Con lo cual, finalmente obtenemos que
2l t0
tN = tAB + tBA = √ =p .
c2 − v 2 1 − v 2 /c2
3.4.1. Vector proyección

Sean A y B vectores no nulos de R2 . Queremos hallar un escalar t que nos permita
encontrar el vector tB, el cual tiene la misma dirección de B y es llamado proyección de
A sobre B.
y y
A A
θ
θ B
x x
O B O
tB tB
(a) t > 0, A · B > 0 (b) t < 0, A · B < 0
Figura 3.10: Vector proyección
75
Como se muestra en la figura 3.10 el escalar t puede ser positivo o negativo dependiendo
del ángulo θ que hay entre A y B. Supongamos primero que 0 ≤ θ ≤ π/2 de tal forma que
t > 0. En la figura 3.10(a) vemos que
ktBk
cos θ = .
kAk
Dado que t > 0, por el Teorema 3.1.2 inciso (c),
ktBk = |t|kBk = tkBk
Por lo tanto,
tkBk
cos θ = ,
kAk
de donde despejando t obtenemos
kAk cos θ
t= .
kBk
Por otro lado, por el Teorema 3.2
A · B = kAkkBk cos θ,
o bien,
A·B
kAk cos θ =
kBk
Por consiguiente,
A·B
t= .
kBk2
Tenemos entonces la siguiente definición
Definición 3.4.1 (Vector proyección). Sean A y B vectores no nulos de R2 . La proyección

de A sobre B se denota por ProyB A y define como el vector
A·B
ProyB A = B.
kBk2
Propiedades del vector proyección

Resumimos las propiedades del vector proyección en el siguiente resultado.
76
Teorema 3.4.2. Sean A, B y C vectores no nulos de R2 . Entonces
(a) ProyB A es paralelo a B.
(b) A − ProyB A es ortogonal a B.
(c) El vector proyección cumple las propiedades linealidad :
ProyB (αA) = α ProyB A

ProyC (A + B) = ProyC A + ProyC B.
(d) Proy−B A = ProyB A.
(e) La magnitud del vector proyección es llamada proyección escalar y está dada por
|A · B|
k ProyB Ak = .
kBk
77
Capı́tulo 4
Nociones de cálculo integral
4.1. Área bajo la curva

En esta sección se pretende encontrar una expresión para el área bajo la curva de la
función y = f (x) entre x = a y y = b. Consideremos primero en caso en que f (x) > 0 para
a ≤ x ≤ b, e intentemos aproximar el área bajo f por exceso por medio de rectángulos. Para
tal fin hagamos una partición regular(ver figura 4.1)
y = f (x)
x
a = x0 x1 ··· xi−1 xi ··· xn = b
Figura 4.1: Aproximación por exceso
78
del intervalo [a, b] en n subintervalos
[x0 , x1 ], [x1 , x2 ], . . . , [xn−1 , xn ],
cada rectángulo tiene por base

b−a
∆x = ,
n
por lo tanto, una aproximación del área A bajo la función f es
n
X
A ≈ ∆xf (x1 ) + ∆xf (x2 ) + · · · + ∆xf (xn ) = ∆xf (xi ).
i=1
Está claro que esta aproximación mejora cuando n → ∞. Por lo tanto tenemos
n
X
A = lı́m ∆xf (xi ). (4.1)
n→∞
i=1
Ahora observese que
x0 = a, x1 = a + ∆x, x2 = a + 2∆x, x3 = a + 3∆x, . . . ,
es decir, xi = a + i∆x, 0 ≤ i ≤ n.
El método mediante el cual se obtuvo la fórmula (4.1), es un caso particular de una

técnica desarrollada por los griegos hace más de 2000 años, conocida como método de
exhaución. Ilustramos esta técnica en el siguiente ejemplo.
Ejemplo 4.1. Sea An el área de un polı́gono de n lados iguales, inscrito un circulo de radio
r. Al dividir el polı́gono en n triángulos congruentes con un ángulo central 2π/n, demuestre
que
1 2π
(a) An = nr 2 sen
2 n
(b) lı́m An = πr 2
n→∞
Solución. Basaremos nuestra demostración en el siguiente resultado de cálculo diferencial

Teorema 4.1.1 (Continuidad secuencial). Una función f : D ⊆ R → R es continua en
x0 ∈ D si y sólo si
xn → x0 implica que f (xn ) → f (x0 ).
79
Al trazar la altura h de uno de los n triángulos que conforman el polı́gono de n lados de
longitud L, obtenemos un triángulo rectángulo de hipotenusa r y ángulo central
1 2π π
θ= · = ,
2 n n
ver la figura
L/2
r h
θ
L/2
Tenemos que cos θ = h/r y sen θ = . Por lo tanto, el área de uno de los triángulos
r
que conforman el polı́gono es
Lh 1 1 1 1 2π
A= = (r cos θ)(2r sen θ) = r 2 (2 sen θ cos θ) = r 2 sen 2θ = r 2 sen .
2 2 2 2 2 n
Con lo cual, el área An del polı́gono está dada por
1 2π
An = nr 2 sen
2 n
Ahora puesto que
sen x
→ 1 cuando x → 0,
x
la función
 sen x , si x 6= 0,

f (x) := x
1, si x = 0,
2π
es continua en x = 0. Además, xn = → 0 cuando n → ∞. Entonces por el Teorema 4.1.1
n
f (xn ) → f (0) = 1. Lo cual implica que
2π
n 2π sen
lı́m sen = lı́m n = 1.
n→∞ 2π n n→∞ 2π
n
Finalmente,
1 2 2π n 2π
lı́m An = lı́m nr sen = πr 2 lı́m sen = πr 2 · 1 = πr 2
n→∞ n→∞ 2 n n→∞ 2π n
80
4.2. Integral definida
En la sección 4.1 se aproximo el área bajo la gráfica de una función continua y = f (x)
desde x = a hasta x = b por exceso. Sin embargo, se puede demostrar que el valor de A en
(4.1) no cambia cuando tomamos los extremos izquierdos de cada subintervalo, esto es, la
aproximación se hace por defecto
n−1
X n
X
A = lı́m ∆xf (xi ) = lı́m ∆xf (xi−1 ). (4.2)
n→∞ n→∞
i=0 i=1
De hecho, en lugar de usar los extremos izquierdos o derechos, podrı́amos tomar la altura
del i-esimo rectángulo como el valor de f en cualquier número x∗i en el i-esimo subintervalo
[xi−1 , xi ]. A los números x∗1 , . . . , x∗n se les llama puntos de muestra. Podemos calcular el
valor del área usando estos puntos
n
X
A = lı́m ∆xf (x∗i ). (4.3)
n→∞
i=1
A el valor común del área A obtenido en (4.1), (4.2) y (4.3), se el denota por
Z b
f (x)dx,
a
que se lee, integral definida de f , desde a hasta b. En resumen
Definición 4.2.1 (Integral definida). Si f es una función continua en el intervalo [a, b],
el cual dividimos en n subintervalos de igual ancho ∆x = (b − a)/n. Denotamos con x0 =
a, x1 , . . . , xn = b los puntos extremos de estos subintervalos y elegimos los puntos de muestra
x∗1 , . . . , x∗n en cada uno de estos subintervalos, de modo que x∗i se encuentre en el i-esimo
subintervalo [xi−1 , xi ]. Entonces integral definida de f , desde a hasta b, es
Z b n
X
f (x)dx = lı́m ∆xf (x∗i ). (4.4)
a n→∞
i=1
La suma en (4.4) se conoce como suma de Riemann. Sabemos que si es f es no negativa

en [a, b], esta suma de Riemann es una aproximación del área bajo la función en [a, b]. Y la
Z b
integral definida f (x)dx da el valor exacto de esta área.
a
Z π/2
Ejemplo 4.2. Usar sumas de Riemann para calcular cos x dx.
0
81
Solución. Partamos de la identidad
2 sen B cos A = sen(A + B) − sen(A − B). (4.5)

x
Tomemos B = , A = ix. Entonces
2
x x x x x
2 sen cos ix = sen(ix + ) − sen(ix − ) = sen(2i + 1) − sen(2i − 1) .
2 2 2 2 2
x x
Definamos ai = sen(2i + 1) , entonces ai−1 = sen(2i − 1) . Por lo tanto, por las propiedades
2 2
homogénea y telescópica de las sumatorias tenemos que
n n
xX X x
2 sen cos ix = 2 sen cos ix
2 i=1 i=1
2
n
Xh x xi
= sen(2i + 1) − sen(2i − 1)
i=1
2 2
n
X
= (ai − ai−1 )
i=1
= an − a0
x x
= sen(2n + 1) − sen .
2 2
Ahora nos proponemos usar de nuevo la identidad (4.5), pero esta vez, de derecha a izquierda.
Para tal fin debemos encontrar A y B tales que
x x
A + B = (2n + 1) , A − B = .
2 2
Entonces,
x x
2A = A + B + A − B = (2n + 1) + = (n + 1)x,
2 2
x x x
de donde A = (n+1) . Con lo cual, B = A− = n . De esta forma obtenemos la identidad
2 2 2
x x x x
2 sen n cos(n + 1) = sen(2n + 1) − sen .
2 2 2 2
Lo que a su vez nos lleva a concluir que si, x 6= 2mπ, entonces
1 1
n sen nx cos (n + 1)x
2 2
X
cos ix = . (4.6)
1
i=1 sen x
2
82
Ahora por definición de integral de Riemann
Z π/2 n
X
cos xdx = lı́m ∆x cos xi ,
0 n→∞
i=1
π π π
donde ∆x = , xi = ∆xi = i. Entonces por la identidad (4.6), con x = , tenemos que
2n 2n 2n
n n
X X π π
∆x cos xi = cos i
i=1 i=1
2n 2n
n
π X π
= cos i
2n i=1 2n
hn π i
(n + 1)π
sen cos
π 2 2n 4n
= π
2n sen
4n
π π/2n π π
= sen · cos + .
4 sen π 4 4n
4n
π n→∞
Ahora como −→ 0, por el Teorema 4.1.1,
4n
π/4n 1 n→∞ 1
2 π = 2 sen(π/4n) −→ 2 · 1 = 2,
sen
4n π/4n
y
π
π n→∞ π π
cos + −→ cos + 0 = cos .
4 4n 4 4
En conclusión
Z π/2
π π/2n π π π π π
cos xdx = lı́m sen · π cos + = sen · 2 · cos = sen = 1.
0 n→∞ 4 sen 4 4n 4 4 2
4n
En la mayorı́a de problemas que involucran sumas de Riemann se toman como puntos de

muestra los extremos izquierdos, o bien los extremos derechos de los subintervalos [xi−1 , xi ],
1 ≤ i ≤ n. Sin embargo, en ocasiones dicha elección no es útil como mostraremos en el
siguiente ejemplo.
2
1
Z
Ejemplo 4.3. Utilizar sumas de Riemann para calcular la integral dx. Sugerencia:
√ 1 x2
Tome x∗i = xi−1 xi .
83
Solución. Intentemos calcular el área pedida por exceso. Tenemos que
Z b X n
f (x)dx = lı́m ∆xf (xi ),
a n→∞
i=1
b−a 1
donde ∆x = = , xi = a + i∆x = 1 + i/n. Entonces
n n
1 n2
f (xi ) = = .
(1 + i/n)2 (n + i)2
Por lo tanto tenemos que
Z 2 n n
X X n
f (x)dx = lı́m ∆xf (xi ) = lı́m . (4.7)
1 n→∞
i=1
n→∞
i=1
(n + i)2
El lı́mite en (4.7) se puede calcular usando el teorema fundamental del cálculo, pero cier-
tamente la integral que nos plantean también. Para resolver el problema usando sumas de
Riemann, debemos definir
√
x∗i = xi−1 xi ,
1 ≤ i ≤ n. Primero que todo notemos que como 0 < 1 ≤ xi−1 ≤ xi para todo 1 ≤ i ≤ n,
entonces
xi−1 xi ≤ x2i y x2i−1 ≤ xi−1 xi ⇔ x2i−1 ≤ xi−1 xi ≤ x2i .

√
Ahora como la función h(x) := x es creciente para x > 0. Tenemos que
√
h(x2i−1 ) ≤ h(xi−1 xi ) ≤ h(x2i ) ⇔ xi−1 ≤ xi−1 xi ≤ xi .
Comprobando de esta forma, que los x∗i definen efectivamente puntos de muestra. Podemos
ahora calcular la integral usando estos puntos de muestra
Z 2 n n
X
∗
X 1 1
f (x)dx = lı́m ∆xf (xi ) = lı́m · .
1 n→∞
i=1
n→∞
i=1
n xi−1 xi
Como xi = 1 + i/n. Tenemos que

1 1 1/n n
· = = .
n xi−1 xi (1 + i/n)(1 + (i − 1)/n) (n + i)(n + i − 1)
Por otro lado,
n + i − (n + i − 1)

1 1 1
n =n =n − .
(n + i)(n + i − 1) n + i)(n + i − 1) n+i−1 n+1
84
Entonces
n n
X 1 1 X 1 1
· = n −
i=1
n xi−1 xi i=1
n+i−1 n+1
n
X 1 1
=n −
i=1
n + i − 1 n+1
n
X
=n (ai−1 − ai ).
i=1
1
Donde ai := . Finalmente, por la propiedad telescópica de las sumas finitas
n+i
Z 2 Xn
f (x)dx = lı́m n (ai−1 − ai )
1 n→∞
i=1
= lı́m n(a0 − an )
n→∞
= lı́m n(1/n − 1/2n)

n→∞
= 1/2.
85
4.3. Propiedades de la integral definida
Teorema 4.3.1 (Propiedades de la integral definida). Sean f y g funciones continuas en
un intervalo [a, b] y c ∈ R. Entonces
Z b Z b Z b
(a) (f (x) ± g(x))dx = f (x)dx ± g(x)dx
a a a
Z b Z b
cf (x)dx = c f (x)dx. (Propiedades de linealidad)
a a
Z b Z c Z b
(b) f (x)dx = f (x)dx + f (x)dx (Propiedad de aditividad)
a a c
(c)
Z b
Si f (x) ≥ 0, entonces f (x)dx ≥ 0
a
Z b Z b (Propiedades de orden)
Si f (x) ≥ g(x), entonces f (x)dx ≥ g(x)dx.
a a
Z b
Si m ≤ f (x) ≤ M, entonces m(b − a) ≤ f (x)dx ≤ M(b − a)
a
Z b Z b+c
(d) f (x)dx = f (x − c)dx (Propiedad de invariancia frente a traslación)
a a+c
Z b Z a
(e) f (x)dx = − f (x)dx. (Propiedad de inversión de la orientación)
a b
b cb
1 x
Z Z
(f ) f (x)dx = f dx, c 6= 0.
a c ca c
(Propiedad de dilatación o contracción del intervalo)
Corolario 4.3.2. Si f es continua en [0, b]. Entonces

Z b Z b
(a) f (x)dx = 2 f (x)dx si f es par.
−b 0
Z b
(b) f (x)dx = 0 si f es impar.
−b
4.4. La integral indefinida

Definición 4.4.1. Una función F es una antiderivada de f en intervalo I si F ′ (x) = f (x)
para todo x ∈ I.
La antiderivada de una función no es única. Por ejemplo, si C ∈ R cada elemento de la
familia de funciones F (x) = x3 + C es un antiderivada de la función f (x) = 3x2 .
86
Un sı́mbolo especial se utiliza para denotar la colección de todas las antiderivadas de una
función f .
Definición 4.4.2 (Integral definida). la colección de todas las antiderivadas de una función
f se denomina integral indefinida de f con respecto a x, lo cual se denota mediante
Z
f (x)dx.
4.4.1. Problemas de valor inicial

La noción de antiderivada de una función es importante en relación con la ecuaciones
diferenciales, dado que la determinación de una antiderivada de la función f (x) es el mismo
problema de encontrar una función y(x) que satisface la ecuación
dy
= f (x), (4.8)
dx
la cual se denomina ecuación diferencial. La solución general de (4.8) es y(x) = F (x)+C,
donde C es una constante arbitraria y F es una antiderivada de f . Por lo tanto, la ecuación
tiene infinitas soluciones una por cada valor de C. Luego para darle unicidad al problema
pedimos a la función y = y(x) que satisfaga la condición inicial y(x0 ) = y0 . El par conformado
por la ecuación diferencial y el condición inicial y(x0 ) = y0 , se denomina problema de valor
inicial.
Ejemplo 4.4 (Movimiento en una dimensión con aceleración constante (MUA)). Cuando
una partı́cula se mueve en una dimensión con aceleración constante, podemos hallar la po-
sición de la partı́cula como una función del tiempo al resolver el par de problemas de valor
inicial

 dv
= a(t) = cte
dt (4.9)
 v(0) = v ,
0

 dx
= at + v0
dt (4.10)
 x(0) = x .
0
En efecto, de la fı́sica clásica se sabe que la velocidad v(t) de una partı́cula en el tiempo t
es la derivada de la posición de la partı́cula respecto al tiempo, a su vez, la derivada de la
velocidad de la partı́cula con respecto al tiempo es igual a la aceleración a(t) en el tiempo t.
Esto es,
d2 x

d dx d
a(t) = 2 = = v(t).
dt dt dt dt
87
dv
Si suponemos que a(t) = = cte = c y que velocidad en el tiempo t = 0 es v0 , esto es
dt
v(0) = v0 , obtenemos el problema de valor inicial (4.9). Resolveremos este problema por un
método usado en ecuaciones diferenciales conocido como separación de variables.
dv
Tenemos que : = a = cte. Entonces separando variables obtenemos
dt
dv = adt.
Ahora integrando respecto t y aplicando las propiedades de linealidad de la integral tenemos

que
Z Z Z
dv = a dt = a dt ⇔ v = at + C1 .
Luego obtenemos que
v(t) = at + C1 ,
donde C1 es un a constante, la cual podemos hallar usando la condición inicial v(0) = v0 .

Esto es, v(0) = C1 = v0 . De donde la velocidad de la velocidad de la partı́cula en el tiempo
t viene dada por
v(t) = at + v0 (4.11)
Aplicando de nuevo el método de separación de variables, esta vez para resolver (4.10) obte-
nemos
Z Z
dx = (at + v0 )dt ⇔ dx = (at + v0 )dt.
Entonces, por las propiedades de linealidad de la integral

Z Z Z Z
dx = (at + v0 )dt = atdt + v0 tdt = at2 /2 + v0 t + C2 .
Ahora, x(0) = C2 = x0 , de donde la posición en el tiempo t de la partı́cula está dada por
x(t) = x0 + v0 t + at2 /2. (4.12)
Ahora podemos usar las ecuaciones (4.9), (4.12) para hallar una expresión para la velocidad
final v(t) que no dependa del tiempo. De (4.9) despejando el tiempo obtenemos
vf − v0
t= (4.13)
a
donde vf = v(t).
88
Reemplazando (4.13) en (4.12) obtenemos
2
vf − v0

1 vf − v0
x = v0 + a ,
a 2 a
donde por comodidad suponemos que x(0) = x0 = 0. Entonces tenemos que

2
vf − v0

1 vf − v0
x = v0 + a
a 2 a
2v0 (vf − v0 ) (vf − v0 )2
= +
2a 2a
2v0 (vf − v0 ) + (vf − v0 )2
=
2a
(vf − v0 )(2v0 + vf − v0 )
=
2a
(vf − v0 )(vf + v0 )
=
2a
vf2 − v02
= .
2a
De donde obtenemos
vf2 = v02 + 2ax. (4.14)
Otro problema tı́pico de valor inicial, que se presenta en este contexto es el de una partı́cula
que se mueve en una dimensión con velocidad constante. Para este caso tenemos

 dx
= v = cte
dt (4.15)
 x(0) = x .
0
Resolviendo problema de valor inicial obtenemos
x(t) = x0 + vt. (4.16)
Ejemplo 4.5. Un automovilista viaja a 18 m/s cuando ve un venado en el camino, a una

distancia de 38 m, adelante.
(a) Si la desaceleración máxima del vehı́culo es de −4,5 m/s2 , ¿cuál es el tiempo de reac-
ción mı́nimo del automovilista que le permitirá evitar golpear al venado? .
(b) Si el tiempo de reacción es de 0,30 s, ¿Cuán rápido viajará cuando golpeé al venado?
89
Solución. Sea t0 el tiempo de reacción mı́nimo del automovilista que le permitirá evitar
golpear al venado. En este tiempo puesto que no ha empezado a frenar, el automovilista se
desplaza con una velocidad constante de v = 18m/s. Por lo tanto, la distancia recorrida en
este tiempo se halla utilizando la fórmula (4.16) con x0 = 0, si denotemos dicha distancia
por X0 tenemos que X0 = 18t0 .
Ahora pasado el tiempo t0 , el automovilista empieza a frenar y podemos calcular el tiempo

de frenado del vehı́culo con la fórmula (4.11). Para este tiempo, vf = 0, además v0 = 18 y
a = −4,5, entonces
0 = −4,5t + 18,
de donde t = 4s. Para hallar la distancia que recorrió el automóvil antes de detenerse
completamente utilizamos la fórmula (4.12) con x0 = 0, para obtener
X1 = 18 · 4 + (1/2)(−4,5)(4)2 = 36.
v0 = 18m/s
38m
X0 X1
Figura 4.2: El auotmovilista recorre la distancia X0 con velocidad cosntante de 18m/s, y la

distancia X1 con una desaceleración constante de −4,5m/s2
.
Para que el automovilista no atropelle al venado se debe tener que la distancia de reacción
X0 más la distancia de frenado X1 sea exactamente igual a 38m (ver figura 4.2). Esto es,
X0 + X1 = 38.
Tenemos entonces que 18t0 + 36 = 38, con lo cual t0 = (1/9)s ≈ 0, 1s.
Ahora, si el tiempo de reacción es de 0,3s, en este tiempo el automovilista a recorrido
x = x(0,3) = 18 · 0, 3 = 5,4m,
pasado ese tiempo empieza a frenar, y la velocidad con la que atropella al venado se calcula
con la fórmula (4.14), tomando v0 = 18, a = −4,5 y x = 38 − 5,4 = 32,6. Tenemos que
p
vf = 182 − 2(4,5)(32,6) = 5,5317m/s.
90
Ejemplo 4.6 (Difusión social). En ocasiones, los sociólogos utilizan la frase difusión social
para describir la manera en que la información se difunde en una población. La información
puede ser un rumor, una moda cultural, o una noticia de una innovación tecnológica. En una
población suficientemente grande, el número de personas x que conoce la información se trata
como una función diferenciable del tiempo t, mientras que la velocidad de difusión, dx/dt,
se supone proporcional al número de personas que conocen la información por el número de
personas que la desconocen. Lo anterior lleva a la ecuación diferencial
dx
= kx(N − x),
dt
donde N es el número de personas en la población.
Suponga que t está en dı́as, k = 1/250, y que dos personas inician un rumor en el instante
t = 0 en una población de N = 1000 personas.
(a) Determine x como una función del tiempo t.
(b) ¿Cuándo la mitad de la población a escuchado el rumor? (Esto es cuando el rumor se

propaga de la manera más rápida).
Solución. Utilizaremos un método conocido como separación de variables para resolver

la ecuación.
dx dx
= kx(N − x) ⇔ = dt.
dt kx(N − x)
Ahora integrando la última ecuación obtenemos

dx
Z
= t + C.
kx(N − x)
Ahora nótese que
1 x+N −x

dx 1 1 1
= · = · + .
x(N − x) N x(N − x) N N −x x
Además, del cálculo diferencial se sabe que

d 1
ln x = .
dx x
Entonces por la regla de la cadena
d 1
− ln(N − x) = .
dx N −x
91
Luego por las propiedades de linealidad de la integral.
dx 1 dx
Z Z
=
kx(N − x) k x(N − x)

1 1 1 1
Z
= · + dx
k N N −x x
Z
1 1 1
= + dx
kN N −x x
Z
1 1 1
Z
= dx + dx
kN N −x x
1
= [ln x − ln(N − x)] .
kN
Tenemos entonces que

1 x 1
ln = [ln x − ln(N − x)] = t + C,
kN N −x kN
donde kN = 1000/250 = 4. Por consiguiente,
x x
ln = 4t + 4C ⇔ = e4t+4C = e4t e4C
N −x N −x
⇔ x = Ne4C e4t − e4t e4C x
⇔ x + e4t e4C x = Ne4C e4t
⇔ x(1 + e4t e4C ) = Ne4C e4t
Ne4C e4t
⇔x= .
1 + e4t e4C
Esto es,
1000e4C e4t
x = x(t) = (4.17)
1 + e4t e4C
x
Además como x = 2 cuando t = 0 y = e4t e4C , tenemos que e4C = 1/499. Reempla-
N −x
zando este último valor en (4.17), obtenemos
1000e4t
x = x(t) = .
499 + e4t
Con lo cual tenemos la parte (a). Para la parte (b), debemos resolver para t, la ecuación
1000e4t
= 500.
499 + e4t
Esto es,
1000e4t 1000 4t
4t
= 500 ⇔ e = 499 + e4t ⇔ e4t = 499.
499 + e 500
Entonces t = ln 499/4 ≈ 1,55.
92
4.5. Teorema fundamental del cálculo
4.5.1. Primer teorema fundamental del cálculo
Teorema 4.5.1 (Primer teorema fundamental del cálculo). Si f e continua en [a, b], la
función F definida por
Z x
F (x) = f (t)dt a ≤ x ≤ b
a
es continua en [a, b] y diferenciable en (a, b), y F ′ (x) = f (x).

Cuando la función f es no negativa para a ≤ t ≤ x, la función F representa el área
debajo la función y = f (t) que se acumulada hasta el valor x.
Ejemplo 4.7. Si f es continua y satisface la fórmula dada para todo x ≥ 0, calcular f (2).
Z x2 (x+1)
f (t)dt = x
0
Z x
Solución. Sea F (x) = f (t)dt y h(x) = x2 (x + 1). Si
0
Z h(x) Z x2 (x+1)
z = F (h(x)) = f (t)dt = f (t)dt, (4.18)
0 0
entonces por la regla de la cadena

dz
= F ′ (h(x))h′ (x).
dx
Nótese que el primer Teorema fundamental del cálculo F es diferenciable en (0, x), más
aún, F ′ (x) = f (x), con lo cual F ′ (h(x)) = f (h(x)). Por lo tanto, derivando respecto a x la
ecuación integral (4.18) obtenemos
f (h(x))h′ (x) = f (x2 (x + 1))(3x2 + 2x) = 1.
De donde
f (x2 (x + 1))(3x2 + 2x) = 1 (4.19)
Como se quiere hallar f (2), debemos hallar x > 0 tal que h(x) = 2. Esto es,
x2 (x + 1) = 2 ⇔ x2 + x3 − 2 = 0
⇔ x2 − 1 + x3 − 1 = 0
⇔ (x − 1)(x + 1) + (x − 1)(x2 + 2x + 1) = 0
⇔ (x − 1)(x2 + 2x + 2) = 0.
93
Para y = x2 + 2x + 2, tenemos a = 1, b = c = 2, con lo cual, D = b2 − 4ac = 22 − 4(1)(2) < 0.
Entonces x2 + 2x + 2 > 0 para todo x ∈ R. Por consiguiente x − 1 = 0, esto es, x = 1.
Reemplazando este valor en (4.19) encontramos que
f (12(1 + 1))(3(1)2 + 2(1)) = 1 ⇔ f (2)5 = 1.
De donde f (2) = 1/5.
4.5.2. Segundo teorema fundamental del cálculo

Teorema 4.5.2 (Segundo teorema fundamental del cálculo). Si f es continua en [a, b],
entonces
Z b
f (t)dt = F (b) − F (a),
a
donde F es una antiderivada de f , esto es, una función tal que F ′ (x) = f (x).
Ejemplo 4.8. Sea 


0, si x < 0,

si 0 ≤ x ≤ 1,

x,
f (x) =


2 − x, si 1 < x ≤ 2,

0, si x > 2.

Z x
y F (x) := f (t)dt.
0
(a) Halle F (x)
(b) Dibuje las graficas de f y F
(c) ¿En dónde f es diferenciable? ¿En dónde F es diferenciable?
Solución. Si x ≤ 0, entonces f (x) = 0, con lo cual F (x) = 0.
CasoZ 1. Si 0 ≤ x ≤ 1, como 0 ≤ t ≤ x, entonces 0 ≤ t ≤ 1, y f (t) = t, con lo cual

x
F (x) = tdt = x2 /2. El valor x2 /2 es obtenido como el área del triángulo que se muestra
0
en la figura 4.3. Por el segundo Teorema fundamental del cálculo tenemos que F1 (t) = t2 /2.
Por lo tanto,
Z x
tdt = F1 (x) − F1 (0) = x2 /2.
0
94
y
x
x 1 2
Z x
Figura 4.3: La integral tdt es igual a el área del triángulo de lados x y y = f (x) = x
0
Caso 2. Si 1 < x ≤ 2. Utilizando la propiedad aditiva de la integral definida tenemos

que
Z x Z 1 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt = A1 + A2 .
0 0 1
A1 A2
x
1 x 2
Figura 4.4: En este caso el área acumulada hasta x es igual a el área del triángulo más el
área del trapecio
Geométricamente podemos calcular el área como la suma del área del triángulo y el
95
trapecio que se muestran el la figura 4.4. Tenemos que:
Z 1 Z x
1·1 (1 + 2 − x)(x − 1)
f (t)dt = A1 = = 1/2, f (t)dt = A2 = .
0 2 1 2
Entonces
x
(3 − x)(x − 1)
Z
F (x) = f (t)dt = 1/2 + = −x2 /2 + 2x − 1.
0 2
Si queremos hallar el área acumulada hasta un valor x, utilizando el segundo teorema fun-
damental del cálculo, procedemos como sigue. Para el área A1 tenemos que 0 ≤ t ≤ 1, con
lo cual f (t) = t. Entonces
Z 1
A1 = tdt = F1 (1) − F1 (0) = 1/2 − 0 = 1/2.
0
Para el área A2 tenemos que 1 ≤ t ≤ x ≤ 2. Es decir, f (t) = 2 − t. En consecuencia,

Z x Z x Z x
A2 = (2 − t)dt = 2dt − tdt
1 1 1
= 2(x − 1) − ((F1 (x) − F1 (1))
= 2x − 2 − (x2 /2 − 1/2)
= −x2 /2 + 2x − 3/2.
Sumando estas áreas obtenemos

Z x
F (x) = f (t)dt = 1/2 + −x2 /2 + 2x − 3/2 = −x2 /2 + 2x − 1.
0
Caso 3. x > 2. En este caso ya se acumulo todo el área.

Z x Z 2 Z x
F (x) = f (t)dt = f (t)dt + f (t)dt
0 0 2
Z 1 Z 2 Z x
= f (t)dt + f (t)dt f (t)dt
0 1 2
Z 1 Z 2 Z x
= tdt + (2 − t)dt + 0dt
0 1 2
= 1.
Ver la figura 4.5.
96
y
x
1 2 x
Figura 4.5: Si x > 2, ya se acumulo toda el área, la cual es igual a el área del triángulo que
se muestra
De los casos 1,2 y 3, encontramos F (x):



0, si x < 0,

x2 /2,

si 0 ≤ x ≤ 1,
F (x) =


−x2 /2 + 2x − 1, si 1 < x ≤ 2,

1, si x > 2.

De donde obtenemos la gráfica de la función
x
1 2
Figura 4.6: Gráfica de la función de área
97
La función f es diferenciable en R − {0, 1, 2}. Por el primer Teorema fundamental del
cálculo, la función F es diferenciable donde f es continua, esto es, en todo R.
4.6. Área entre curvas

Supongamos que y = ϕ1 (x) y y = ϕ2 (x) son funciones continuas en el intervalo [a, b],
y supongamos además que ϕ1 (x) ≤ ϕ2 (x) para todo x ∈ [a, b]. Consideremos la región R
limitada por las gráficas de estas funciones en el intervalo dado, esto es
R = (x, y) ∈ R2 : a ≤ x ≤ b, ϕ1 (x) ≤ y ≤ ϕ2 (x) .

Observamos en la figura 4.7 que al mover la linea vertical en rojo desde x = a, hasta x = b,
barremos toda la región, y mientras hacemos esto, dicha linea siempre entra en la curva
y = ϕ1 (x) y sale en la curva y = ϕ2 (x). Un subconjunto del plano con estas caracterı́sticas
es denominado región del tipo I.
y
y = ϕ2 (x)
y = ϕ1 (x)
x
a b
Figura 4.7: Región del tipo I
Dado que 0 ≤ ϕ1 (x) ≤ ϕ2 (x), para x ∈ [a, b], podemos hallar el área de la región R
como una resta de áreas. En efecto, denotemos dicha área por a(R), utilizando la integral
de Riemann tenemos que
Z b Z b Z b
a(R) = A2 − A1 = ϕ2 (x)dx − ϕ1 (x)dx = [ϕ2 (x) − ϕ1 (x)] dx.
a a a
Además por el Teorema fundamental del cálculo

Z ϕ2 (x)
dy = ϕ2 (x) − ϕ1 (x).
ϕ1 (x)
98
Por lo tanto, podemos expresar el área de la región como
Z b
a(R) = [ϕ2 (x) − ϕ1 (x)] dx
a
" #
Z Z b ϕ2 (x)
= dy dx
a ϕ1 (x)
Z bZ ϕ2 (x)
= dydx
a ϕ1 (x)
ZZ
= dA.
R
ZZ
La expresión dA es denominada integral doble extendida sobre la región R del dife-
R
rencial de área, el diferencial de área, dA, es igual a dydx.
Ejemplo 4.9. Calcular el área de la región acotada por la hipérbola xy = 1 y las rectas
y = x y y = 2.
Solución. Hallemos los puntos de corte entre la hipérbola y = 1/x, y la recta y = 2. Esto
es, resolvemos para x la ecuación 1/x = 2, encontrando que x = 1/2. De manera similar, las
rectas y = x y y = 2 se cortan en x = 2 y la hipérbola y la recta y = x en x = 1. Con esta
información hallamos la gráfica de la región.
y
y=x
2
y=2
R
xy = 1
x
1/2 1 2
Figura 4.8: Región plana del tipo II
Vemos que trazando una linea vertical empezando en x = 1/2 y terminando en x = 1,

esta entra en la hipérbola y = 1/x y sale en la recta y = 2, pero cuando movemos esta linea
99
desde x = 1 hasta x = 2 entra en la recta y = x y sale en la recta y = 2, por lo que la región
R no puede ser del tipo I. Sin embargo, al trazar una linea horizontal vemos que cuando la
desplazamos desde y = 1 hasta y = 2, siempre entra en la hipérbola x = 1/y y sale en la
recta x = y. Un subconjunto del plano con esta propiedad es denominado región del tipo II.
De manera más general definimos una región plana del tipo II como sigue
R = (x, y) ∈ R2 : ψ1 (y) ≤ x ≤ ψ2 (y), c ≤ y ≤ d .

Análogamente como se hizo con la regiones de tipo I calculamos el área de una región del
tipo II
ZZ
a(R) = dA
R
Z "Z d
#
ψ2 (y)
= dx dy
c ψ1 (y)
Z d Z ψ2 (y)
= dxdy
c ψ1 (y)
Z d
= [ψ2 (y) − ψ1 (y)] dy.
c
En una región del tipo II, el diferencial de área está dado por dA = dxdy. Ahora para nuestro
caso tenemos que
R = (x, y) ∈ R2 : 1/y ≤ x ≤ y, 1 ≤ y ≤ 2 .

Por lo tanto,
Z 2
a(R) = (y − 1/y)dy
1
2
= y 2 /2 1 − [ln y]21

= 22 /2 − 1/2 − (ln 2 − ln 1) = 3/2 − ln 2.
Cuando aplicamos el segundo Teorema fundamental del cálculo, usamos la notación

Z b
f (x)dx = F (b) − F (a) = [F (x)]ba .
a
A pesar de que la región R no es del tipo I, se puede ver como la unión de dos regiones del
tipo I.
100
y
y=x
2
y=2
R1 R2
xy = 1
x
1/2 1 2
Figura 4.9: Región del tipo II, que puede ser vista como la unión de dos regiones del tipo I
En efecto, R = R1 ∪ R2 , donde
R1 = {(x, y) : 1/2 ≤ x ≤ 1, 1/x ≤ y ≤ 2} , R2 = {(x, y) : 1 ≤ x ≤ 2, x ≤ y ≤ 2}
Podemos entonces calcular el área pedida utilizando la propiedad aditiva de las integrales
dobles
ZZ ZZ ZZ
a(R) = dA = dA + dA = a(R1 ) + a(R2 ).
R R1 R2
Tenemos que
ZZ Z 1
a(R1 ) = dA = (2 − 1/x)dx = 1 + ln 1/2 = 1 − ln 2,
R1 1/2
y
ZZ Z 2
a(R2 ) = dA = (2 − x)dx = 1/2.
R2 1
Por la tanto, a(R) = a(R1 ) + a(R2 ) = 1 − ln 2 + 1/2 = 3/2 − ln 2.
Existen regiones planas que pueden ser del tipo I y del tipo II al mismo tiempo. Llama-
remos a estos subconjuntos del plano regiones del tipo III.
Para calcular área entre curvas debemos utilizar la propiedad aditiva de la integrales
dobles en su caso más general.
101
Teorema 4.6.1 (Propiedad aditiva de las integrales dobles). Supongamos que
R = R1 ∪ R2 ∪ · · · ∪ Rn ,
donde las regiones Ri , 1 ≤ i ≤ n, son regiones elementales en el plano de alguno de los tres
tipos definidos; tipo I, tipo II, o bien tipo III, las cuales son disyuntas dos a dos, esto es,
Ri ∩ Rj = ∅, i 6= j,
salvo quizás en sus fronteras. Entonces

ZZ
a(R) = dA
ZZ R ZZ ZZ
= dA + dA + · · · + dA
R1 R2 Rn
= a(R1 ) + a(R2 ) + · · · + a(Rn ).
4.7. Curvas en el plano

Consideremos una partı́cula que se está moviendo sobre la circunferencia C de ecuación
x + y 2 = 1 mostrada en la figura 4.10.
2
Figura 4.10: Movimiento de una partı́cula sobre una circunferencia
Es imposible describir la trayectoria C seguida por la partı́cula mediante una ecuación de

la forma y = f (x) porque C no pasa la prueba de la linea vertical. Es decir, en la ecuación
de la circunferencia no podemos determinar y de manera única como una función de x. En
vez de eso, utilizamos un par de ecuaciones de la forma
x = x(t), y = y(t).
Por ejemplo para partı́cula que describe la circunferencia de la figura 4.10,
x(t) = cos t, y(t) = sen t.
102
t x y
0 1 0
π/2 0 1
π −1 0
3π/2 0 −1
2π 1 0
Cuadro 4.1: Tiempo necesario para completar una revolución
Para este caso el parámetro t representa el tiempo, y vemos que si 0 ≤ t ≤ 2π, la partı́cula
completa una revolución pasados 2π segundos (ver cuadro 4.1)
Se observa que a medida que el parámetro crece de 0 a 2π los puntos se distribuyen sobre
la circunferencia siguiendo la dirección contraria a las manecillas del reloj.
A continuación introducimos la noción de curva en forma general.
Definición 4.7.1. Una aplicación vectorial en R2 es una función definida en un intervalo

I ⊆ R que toma valores en R2 .
En sı́mbolos escribimos
α : I ⊆ R → R2 , α(t) = (x(t), x(t)).
Las funciones x, y : I ⊆ R → R, son llamadas funciones componentes de la aplicación

vectorial α.
Definición 4.7.2. Una curva en el plano es la imagen por medio de una función vectorial
en R2 de un intervalo I de números reales.
Escribimos C = α(I) = {α(t) : t ∈ I}. A la función vectorial α se le llama parametriza-

ción de la curva C. A las funciones componentes x = x(t), y = y(t) de la función vectorial
α, también se les llama ecuaciones paramétricas.
Ejemplo 4.10 (Parametrización de una función en el plano). Sea y = f (x) una función
definida en un intervalo I de números reales. Entonces su gráfica:
C = graf (f ) = {(x, f (x)) : x ∈ I} ,
es muy sencilla de parametrizar, pues vasta definir, α(t) = (t, f (t)), t ∈ I, en tal caso
C = α(I).
103
4.7.1. Ecuación vectorial y normal de la recta
En la sección 1.2 hallamos la ecuación de la recta usando argumentos geométricos. Des-
afortunadamente, este tipo de argumentos no se pueden extender para deducir la ecuación
de una recta, por ejemplo en R3 , por lo que usaremos métodos vectoriales para encontrar la
ecuación de una recta en Rn .
Sea P0 = (x0 , y0 ) un punto dado de la recta. Supongamos además que v es el vector que
la da dirección a la recta l, nos referimos a este vector como vector director. Supongamos
además que P = (x, y) es un punto arbitrario de l ver figura 4.11.
y
l
P b
P0
b
x
O
Figura 4.11: Ecuación de la recta dados un punto y el vector director
Entonces el vector v es paralelo a el vector que va del punto P0 a el punto P , por lo

tanto, existe t ∈ R tal que
−→
P0 P = P − P0 = tv,
o bien,
P = P0 + tv. (4.20)
La ecuación (4.20) es llamada ecuación vectorial de la recta. Como veremos en la sección
4.11 el procedimiento utilizado para encontrar la ecuación (4.20) se puede extender fácilmente
a R3 .
Ahora, si expresemos (4.20) en términos de las componentes de los vectores P, P0 y v

obtenemos
(x, y) = (x0 , y0 ) + t(v1 , v2 ).
104
Aplicando la multiplicación por escalar y la suma de vectores, encontramos que

x = x(t) = x0 + tv1
(4.21)
y = y(t) = y0 + tv2
Con lo cual tenemos entonces las llamadas ecuaciones paramétricas de la recta. De
las ecuaciones (4.21) concluimos que la parametrización de la recta está dada por
α(t) = P0 + tv = (x0 + tv1 , y0 + tv2 ) = (x(t), y(t)), t ∈ R.
Si despejamos el parámetro t en la primera y segunda ecuación en el sistema (4.21) e igua-

lamos obtenemos
x − x0 y − y0
= . (4.22)
v1 v2
La cual se conoce como ecuación simétrica de la recta. Nótese que si despejamos y de
la ecuación (4.22) obtenemos la ecuación cartesiana de la recta.
De la ecuación (4.20) se hace patente que para determinar completamente una recta es
suficiente con un punto el vector director, o bien teniendo dos de sus puntos, como mostra-
remos en el siguiente ejemplo.
Ejemplo 4.11. Parametrizar la recta que pasa por los puntos P y Q.
Solución. Dado que ya tenemos un punto de la recta, por ejemplo, P0 = P , solo falta
−→
determinar el vector director, el cual podemos tomar como v =P Q ver figura 4.12.
y
l
Q
b
−→
P v =P Q
b
x
O
Figura 4.12: Ecuación de la recta dados dos de sus puntos.
105
Por lo tanto, la parametrización de la recta es
−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), t ∈ R.
Ecuación normal de la recta

Vimos en la sección 4.7.1 que para determinar completamente la ecuación de una recta
suficiente con un punto y el vector director, o bien dos puntos de la recta. Veremos a conti-
nuación que también se puede determinar completamente una recta con un punto y el vector
normal a la recta.
Sea P0 = (x0 , y0) un punto dado de la recta l y n = (a, b) el vector normal a l, esto es, el
vector n es ortogonal a cualquier vector sobre la recta l (ver figura 4.13).
vector n trasladado
l
n = (a, b)
P
P0
x
O
Figura 4.13: Ecuación de la recta dados un punto y el vector normal.

−→
Y sea P = (x, y) un punto arbitrario de la recta l. Entonces el vector P0 P está sobre la
recta l de tal forma que
−→
P0 P ·n = 0. (4.23)
La expresión anterior en términos de las componentes de los vectores toma la forma
[(x, y) − (x0 , y0 )] · (a, b) = 0.
106
Lo que equivale a
a(x − x0 ) + b(y − y0 ) = 0 ⇔ ax + by − (ax0 + by0 ) = 0.
Si llamamos c = −(ax0 + by0 ) obtenemos
ax + by + c = 0. (4.24)
La ecuación (4.24) se conoce como ecuación normal de la recta. Se observa que las
componentes del vector normal son los coeficientes de las variables x y y respectivamente.
Nota 4.7.1. En la deducción de la forma normal de la recta, hay un sutileza, en la ecuación
−→ −→
(4.23) el producto punto debe realizarse en realidad entre vectores P0 P y P0 P2 , donde P2 es
el punto final del vector n trasladado. Sin embargo, por el análisis hecho en la sección 3.3,
−→
dado que el vector n es equivalente a el vector geométrico P0 P2 tenemos que
−→
n = P0 P2 .
Por lo tanto,
−→ −→ −→
P0 P ·n =P0 P · P0 P2 = 0.
Ejemplo 4.12. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a
un punto P0 = (x0 , y0 ) que no pertenece a l está dada por
|ax0 + by0 + c|
√
dmı́n = .
a2 + b2
Solución. Este problema ya se soluciono de forma puramente geométrica en el ejemplo 1.4.
Ahora utilizaremos el vector proyección para resolver el problema.
y
l
P0
b
dmı́n P
P1
P2
vector normal n trasladado
x
O
n = (a, b)
Figura 4.14: La distancia entre el punto P0 y la recta l recta es igual a la proyección escalar
−→
entre vector P0 P y el vector normal n trasladado.
107
En la figura 4.14 trasladamos el vector normal n respetando dirección y magnitud, de tal
forma que su punto inicial coincida con el punto P0 , si el punto final de este vector es P2 ,
−→
entonces el vector P0 P2 es ortogonal a la recta l en el punto P1 . Si P = (x, y) es cualquier
punto de la recta l, vemos que la distancia entre P0 y la recta l; dmı́n = kP0 − P1 k es la
−→ −→
proyección escalar entre el vector P0 P y el vector P0 P2 . Por lo tanto, por el Teorema 3.4.2
inciso (e) tenemos que
−→ −→
−→ | P0 P · P0 P2 |
dmı́n = k Proy −→ P0 P k = −→ .
P0 P2
k P0 P2 k
−→
Ahora, dado que los vector n y el vector geométrico P0 P2 tienen la misma dirección y
magnitud, por (3.1) tenemos que
−→
n = P0 P2 .
De donde concluimos que

−→ −→ −→
−→ | P0 P · P0 P2 | | P0 P ·n|
k Proy −→ P0 P k = −→ = .
P0 P2
k P0 P2 k knk
Con lo cual,
−→
| P0 P ·n|
dmı́n = .
knk
Como la ecuación de la recta está en la forma normal ax + by + c = 0, las componentes
del vector normal son a y b, esto es, n = (a, b). Además dado que (x, y) ∈ l tenemos que
ax + by + c = 0, o bien, ax + by = −c. Entonces
−→
| P0 P ·n|
dmı́n =
knk
|a(x − x0 ) + b(y − y0 )|
= √
a2 + b2
|ax + by − (ax0 + by0 )|
= √
a2 + b2
| − c − ax0 − by0 |
= √
a2 + b2
|ax0 + by0 + c|
= √ .
a2 + b2
108
Parametrización de la elipse
La ecuación cartesiana de la elipse con centro en (h, k) y semiejes a y b viene dada por
(x − h)2 (y − k)2
+ = 1. (4.25)
a2 b2
Para parametrizar la elipse utilizamos la identidad fundamental
cos2 t + sen2 t = 1.
(x − h)2 2 (y − k)2
Podemos escoger = cos t y = sen2 t, de donde despejando las variables x,
a2 b2
y y obtenemos las ecuaciones paramétricas
x = x(t) = a cos t + h, y = y(t) = b sen t + k.
De lo cual obtenemos que la parametrización de la elipse es
α(t) = (a cos t + h, b sen t + k), 0 ≤ t ≤ 2π. (4.26)
Cuando a = b = R en (4.25) nos da
(x − h)2 + (y − k)2 = R2 , (4.27)
la cual es la ecuación de una circunferencia con centro en (h, k) y radio R.
Parametrización de la cicloide
Ejemplo 4.13 (Cicloide). La curva trazada por un punto en la circunferencia de un cı́rculo
que rueda sin resbalar por una recta se llama cicloide (ver figura 4.15). Si el cı́rculo tiene
radio r y rueda a lo largo del eje x, y un punto P sobre el cicloide empieza en el origen,
parametrice el cicloide.
y
b
C(rθ, r)
r θ
P
Q
y
x x
O T
rθ
Figura 4.15: Un punto P sobre la rueda de una bicicleta que se desplaza sobre plano horizontal
genera una curva llamada cicloide.
109
Solución. Elijamos el ángulo de rotación θ del cı́rculo como parámetro, cuando θ = 0,
el punto P está en el origen. Cuando el cı́rculo ha girado θ radianes, la distancia que ha
recorrido desde el origen es
OT = arc P T = rθ
Dado que el centro del cı́rculo está en C(rθ, r), si (x, y) son las coordenadas del punto P ,
entonces, según la figura 4.15
x = OT − P Q = rθ − r sen θ = r(θ − sen θ)

y = T C − QC = r − r cos θ = r(1 − cos θ).
Por lo tanto,
α(θ) = (r(θ − sen θ), r(1 − cos θ)).
La parametrización anterior contempla el caso en que 0 ≤ θ ≤ π/2. Ahora supongamos

que π/2 ≤ θ ≤ π.
P Q
α
b
C(rθ, r)
θ
x
O T
rθ
Figura 4.16: Parametrización del cicloide para π/2 ≤ θ ≤ π
En la figura 4.16 el triángulo △P QC es rectángulo en Q. Además,

QC PQ
cos α = , sen α =
PC PC
Dado que P C = r, y α + θ = π tenemos que
y−r
− cos θ = cos(π − θ) = cos α = ,
r
110
de donde
y = r(1 − cos θ).
De manera análoga,
rθ − x
sen θ = sen(π − θ) = sen α = ,
r
o bien
x = r(θ − sen θ).
Y de nuevo obtenemos que
α(θ) = (r(θ − sen θ), r(1 − cos θ)).
La misma parametrización se obtiene en los casos en que π ≤ θ ≤ 3π/2 y 3π/2 ≤ θ ≤ 2π.

Esto completa la parametrización de la cicloide, pues un arco de esta se tiene al variar el
ángulo θ entre 0 y 2π.
4.8. Continuidad y diferenciación de aplicaciones vec-

toriales
Antes de presentar la noción continuidad y diferenciabilidad de aplicaciones vectoriales
debemos especificar el significado de la expresión
lı́m α(t) = L. (4.28)

t→t0
Dado que t, t0 son números reales, la expresión t → t0 significa que |t − t0 | → 0. Para el

caso α(t) y L, puesto que estamos comparando vectores, diremos que α(t) → L si y solo si
kα(t) − (L1 , L2 )k → 0 donde L = (L1 , L2 ) y
p
kα(t) − (L1 , L2 )k = (x(t) − L1 )2 + (y(t) − L2 )2 .
Ahora podemos aclarar el significado de (4.28).
lı́mt→t0 α(t) = L significa que kα(t) − (L1 , L2 )k → 0 siempre que |t − t0 | → 0.
El siguiente resultado nos permite es establecer los conceptos de continuidad de y dife-

renciación de aplicaciones vectoriales en términos de sus funciones componentes.
111
Teorema 4.8.1. Sea α : I ⊆ R → R2 una aplicación vectorial dada por
α(t) = (x(t), y(t)).
El lı́mite lı́mt→t0 α(t) existe si solo si los lı́mites lı́mt→t0 x(t), lı́mt→t0 y(t) existen, más aún,

lı́m α(t) = lı́m x(t), lı́m y(t) .
t→t0 t→t0 t→t0
Teorema 4.8.2 (Continuidad de aplicaciones vectoriales). Una aplicación vectorial α : I ⊆

R → R2 , dada por
α(t) = (x(t), y(t)),
es continua en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son continuas en

t = t0 .
4.8.1. Vector tangente

Cuando el parámetro t representa el tiempo la función vectorial α(t) = (x(t), y(t)) repre-
senta el vector posición de una partı́cula que se está moviendo en dos dimensiones, de este
modo, la partı́cula describe una trayectoria C = α(I) (ver la figura 4.17).
y
α′ (t0 )
P
Q
Figura 4.17: El vector velocidad, o vector tangente es igual a el cambio de la posición de la

partı́cula respecto a el tiempo
donde las funciones paramétricas x(t) y y(t) representan la posición en x y y de la

partı́cula en el momento t respectivamente. Supongamos que la partı́cula está en el punto P
en el momento t0 , esto es, α(t0 ) = P y pasado un tiempo h > 0 se encuentra en el punto Q,
112
es decir α(t0 + h) = Q. Tenemos entonces que el cambio en la posición de la partı́cula viene
dado por
−→
P Q= Q − P = α(t0 + h) − α(t0 ).
El vector
α(t0 + h) − α(t0 )
,
h
es secante a la trayectoria C y cuando h → 0, de tal forma que los punto P y Q se aproximan,
tiende a ser el vector tangente a la trayectoria C en el punto P . Por consiguiente, el vector
tangente o vector velocidad de la partı́cula en el momento t0 , el cual se denota por α′ (t0 )
está dado por
α(t0 + h) − α(t0 )
α′ (t0 ) = lı́m , (4.29)
h→0 h
si el lı́mite en la derecha de (4.29) existe. En tal caso diremos que la función α es diferenciable
en t = t0 .
El Teorema 4.8.1 nos permite encontrar una expresión para calcular el vector tangente.
Teorema 4.8.3 (Diferenciabilidad de aplicaciones vectoriales). Una aplicación vectorial α :

I ⊆ R → R2 , dada por
α(t) = (x(t), y(t)),
es diferenciable en t = t0 ∈ I si y sólo si sus funciones componentes x(t), y(t) son diferen-

ciables en t = t0 . Más aún, tenemos que
α′ (t0 ) = (x′ (t0 ), y ′(t0 )).
Nota 4.8.1. El Teorema 4.8.3 nos dice que la derivada de una aplicación vectorial es a su
vez una aplicación vectorial, por lo tanto podemos hablar de una aplicación vectorial cuya
derivada sea continua. Decimos que una curva C es suave si su representación vectorial
α(t) = (x(t), y(t)), t ∈ I
es diferenciable con continuidad para todo t ∈ I. Es decir, α′ (t) existe y es continua para
todo punto del intervalo I. La gráfica de una curva suave, se distingue por que no se rompe
y no tiene puntas. Decimos que una curva C, que es diferenciable en un intervalo I, salvo
por un número finito de puntos es suave a trozos.
113
y y y
R
C
x x x
(a) Curva suave (b) Suave a trozos (c) Curva que se rom-
pe
Figura 4.18: Curva suave y suave a trozos
La gráfica de una circunferencia es una curva suave, ver figura 4.18(a). La frontera de
la región R, ver figura 4.18(b), para este caso un triángulo no es una curva suave, pues no
es diferenciable en cada uno de sus vértices. Sin embargo, si es suave a trozos. La gráfica
de la figura 4.18(c) no es suave ni suave a trozos, pues al presentar un número infinito de
discontinuidades no es diferenciable un número infinito de puntos.
Como mencionamos anteriormente, si el parámetro representa el tiempo, el vector posi-

ción de la partı́cula que da determinado por una función vectorial
α(t) = (x(t), y(t)), t ∈ I
si dicha función es diferenciable en t = t0 ∈ I, vimos que el vector velocidad de la partı́cula
en el momento t = t0 está dado por
v(t0 ) = α′ (t0 ),
la magnitud de este vector define la rapidez de la partı́cula en el instante t = t0 , esto es,
v = kv(t0 )k = kα′ (t0 )k.
Si además, la función α′ es diferenciable en t = t0 , el vector aceleración de la partı́cula en
t0 , es decir el cambio de la velocidad con respecto a el tiempo en t0 , está dado por
a(t0 ) = v′ (t0 ) = α′′ (t0 ).
4.9. Movimiento en el plano

4.9.1. Movimiento rectilineo
El movimiento más sencillo que podemos analizar, es el de una partı́cula que se desplaza
sobre una linea recta. Para determinar completamente la posición de una partı́cula que sigue
114
un movimiento rectilineo es suficiente con conocer su velocidad y donde esta inicialmente.
Supongamos que la partı́cula está en el momento t = 0 en el punto P0 y que su velocidad
viene dada por un vector constante v (ver la figura 4.11), entonces el vector posición está
dado por
α(t) = P0 + tv, t ≥ 0. (4.30)
Nótese que α(0) = P0 y α′ (t) = v.
Ejemplo 4.14. Una partı́cula se desplaza en una linea recta con una rapidez constante v
desde el punto P hasta el punto Q. Determinar el vector posición de la partı́cula.
Solución. Por el ejemplo 4.11, la parametrización de la recta está dada por
α(t) = P + t(Q − P ), t ∈ R.
Si resulta que kQ − P k = v, por (4.30) el vector posición de partı́cula es

−→
α(t) = P + tv = P + t P Q= P + t(Q − P ), 0 ≤ t ≤ 1,
−→
donde el vector velocidad está dado por v =P Q= Q − P . Se observa que la partı́cula está
inicialmente en P y pasado un segundo está en el punto Q.
Ahora, si el por el contrario tenemos que kQ − P k =

6 v, consideremos el vector unitario
en la dirección de v = Q − P (ver figura 4.19).
y
l
Q
b
w
−→
P v =P Q
b
u
x
O
Figura 4.19: Podemos determinar la posición de una partı́cula, dados dos puntos de su
trayectoria rectilinea junto con su rapidez.
115
Esto es, definimos
v
u= .
kvk
Entonces el vector w dado por
w = vu,
tiene la misma dirección de v y su magnitud es kwk = v. Por lo tanto, el vector posición de

la partı́cula es
β(t) = P + tw, 0 ≤ t ≤ t1 ,
donde t1 es el tiempo transcurrido para la partı́cula esté en el punto Q, es decir, tenemos

que β(t1 ) = Q. Lo que nos lleva a considerar la siguiente ecuación vectorial
P + t1 w = Q.
Vemos entonces que
t1 v = t1 kwk = kt1 wk = kQ − P k.
Entonces t1 = kQ − P k/v.
En conclusión, la posición en el tiempo t de la partı́cula es
β(t) = P + tw, 0 ≤ t ≤ t1 ,
v Q−P
donde w = vu, u = = y t1 = kQ − P k/v.
kvk kQ − P k
4.10. Movimiento circular uniforme

Consideremos ahora una partı́cula que se está moviendo sobre una circunferencia con
una rapidez constante, es decir, siguiendo un movimiento circular uniforme. Queremos
hallar el vector posición de la partı́cula. Recordemos que la ecuación cartesiana de una
circunferencia con centro en (h, k) y radio R viene dada por
(x − h)2 + (y − k)2 = R2 ,
Si escogemos R2 cos2 t = (x − h)2 y R2 sen2 t = (y − k)2 obtenemos la parametrización
α(t) = (R cos t + h, R sen t + k), 0 ≤ t ≤ 2π.
116
Ahora, nótese que la función vectorial dada por
β(t) = (x(t), y(t)),
donde x(t) = R cos [ω (t − δ)] + h y y(t) = R sen [ω (t − δ)] + k, también parametriza la

circunferencia dada. Más aún, la función β(t) representa el vector posición de una partı́cula
que se mueve sobre la circunferencia con una rapidez angular constante ω. Recordaremos la
rapidez angular ω se define como la tasa de cambio del ángulo barrido por unidad de tiempo,
esto es,
dθ
ω= .
dt
Si la rapidez angular es constante, separando variables e integrando obtenemos (ver la sección
4.4.1)
θ = θ(t) = θ0 + ωt.
Si suponemos que θ0 = 0, tenemos que

θ
ω= .
t
Denotamos por T a el periodo de la partı́cula, es decir, el tiempo en completar una revolución.
Dado que una revolución se completa cuando se barre un ángulo de 2π radianes encontramos
que
2π
ω= ,
T
para una rapidez angular constante. La otra constante que aparece en las ecuaciones pa-
ramétricas que definen la función vectorial β es δ, la cual tiene que ver con el punto donde
la partı́cula inicia su movimiento. Nótese además que el hecho de escoger la variable x como
una función cosenosoidal o senosoidal tiene que ver con la orientación que sigue la partı́cula.
Calculemos ahora el vector velocidad y la rapidez de la partı́cula. Tenemos que el vector
velocidad viene dado por
v(t) = β ′ (t) = (−Rω sen [ω (t − δ)] , Rω cos [ω (t − δ)])
Con lo cual la rapidez lineal de la partı́cula está dada por
v = kβ ′ (t)k = Rω.
Cambio en la orientación de una curva

117
Consideremos las funciones vectoriales
α(t) = (cos t, sen t), 0 ≤ t ≤ 2π,

β(t) = (cos t, − sen t), 0 ≤ t ≤ 2π.
Ambas parametrizan la circunferencia x2 + y 2 = 1 y tienen el mismo punto inicial y final. Sin

embargo, cuando el parámetro varia entre 0 y 2π, en la primera parametrización los puntos
se distribuyen sobre la circunferencia siguiendo la dirección contraria de las manecillas del
reloj, mientras que la segunda parametrización lo hacen siguiendo las manecillas del reloj.
Como puede comprobarse ambas parametrizaciones se relacionan por la ecuación
β(t) = α(2π − t),
La cual es un caso particular de lo que denominaremos fórmula de inversión. En general,

si un función vectorial α(t) = (x(t), y(t)), a ≤ t ≤ b parametriza una curva C, entonces la
función
β(t) := α(a + b − t) (Fórmula de inversión)
también parametriza la curva C pero induciendo la dirección contraria a la que induce la

función α sobre esta. Denotamos la curva generada por la función β por −C.
Ejemplo 4.15. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en dirección

contraria a las de las manecillas del reloj con una rapidez constante de 2m/s. Encuentre el
vector posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (1, 0) y
da una revolución completa.
Solución. Tenemos que la rapidez lineal de la partı́cula está dada por v = 2m/s, y dado
que R = 1 y v = ωR tenemos que ω = 2 rad /s. Teniendo la rapidez angular podemos
hallar el periodo de la partı́cula con la fórmula ω = 2π/T , de donde T = πs. Suponemos
que la posición en x que sigue la partı́cula es una función cosenosoidal, la cual inducirá una
dirección sobre la curva, si resulta que no es la dirección que se pide en el problema, entonces
utilizamos la fórmula de inversión para obtener la dirección pedida. Además como el centro
de la circunferencia es (h, k) = (0, 0), el vector posición de la partı́cula es de la forma
α(t) = (cos 2(t − δ), sen 2(t − δ)),
donde queda por determinar la constante δ, lo cual podemos hallar con la condición inicial
α(0) = (cos 2(0 − δ), sen 2(0 − δ)) = (1, 0). Obtenemos:
cos 2δ = 1, − sen 2δ = 0.
118
El único ángulo en el intervalo [0, π] que satisface simultáneamente las ecuaciones anteriores
es 0. En consecuencia, δ = 0. Concluimos que el vector posición de la partı́cula es
α(t) = (cos 2t, sen 2t), 0 ≤ t ≤ π.
A modo de comprobación, nótese que, α(0) = (1, 0) = α(π). Ademas, la velocidad en el

instante t es
v(t) = α′ (t) = (−2 sen 2t, 2 cos 2t).
Con lo cual la rapidez de la partı́cula es
kv(t)k = k(−2 sen 2t, 2 cos 2t)k = 2m/s.
Además la parametrización encontrada induce la dirección contraria de las manecillas del

reloj en la circunferencia.
4.10.1. Movimiento con aceleración constante

Supongamos que una partı́cula se desplaza con aceleración constante, esto es, el vector
aceleración a(t) no cambia, ni en dirección ni magnitud, esto implica que las componentes
ax (t) y ay (t) son a su vez constantes para todo tiempo t. Es decir tenemos que
x′′ (t) = ax (t) = cte, y ′′(t) = ay (t) = cte.
El movimiento con aceleración constante en una dimensión ya se analizó en la subsección

4.4.1, en donde se concluyó que
x(t) = x0 + vox t + (1/2)ax (t)t2 , y(t) = y0 + voy t + (1/2)ay (t)t2 ,
ver ecuación (4.12). De esta forma vemos que
α(t) = (x(t), y(t))

= (x, y)
= (x0 + vox t + (1/2)ax (t)t2 , y0 + voy t + (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox t, voy t) + ((1/2)ax (t)t2 , (1/2)ay (t)t2 )
= (x0 , y0 ) + (vox , voy )t + (1/2)(ax (t), ay (t))t2
= x0 + v0 t + (1/2)a(t)t2 .
Concluimos entonces que el vector posición para una partı́cula que se desplaza con aceleración
constante es
α(t) = x0 + v0 t + (1/2)at2 . (4.31)
119
Un tipo especial de movimiento con aceleración constante lo constituye el movimiento
parabólico. Aquı́ se supone que la partı́cula se desplaza bajo única influencia de fuerza
gravitatoria. Entonces demostraremos que cuando es disparada con una velocidad inicial v0
la partı́cula sigue una trayectoria parabólica (ver figura 4.20)
y
vy = 0 vxo
b
g
v0
vyo
θ0
b b
x
O vxo
Figura 4.20: Cuando un proyectil es lanzado desde el origen con una inicial v0 describe una
trayectoria parabólica. Nótese además, que el proyectil alcanza su altura máxima cuando
vy = 0.
Para hallar el vector posición del proyectil, utilizamos (4.31) con x0 = (0, 0) y a(t) = g =
(0, −g) donde g = 9,8m/s2 , es la aceleración de la gravedad, con lo cual obtenemos
α(t) = (x(t), y(t)) = v0 t + (1/2)gt2

= (vox t, voy t) + (0, −(1/2)gt2)
= (vox t, voy t − (1/2)gt2)
En consecuencia, la posición en x es
x(t) = vox t = v0 cos θ0 t, (4.32)
donde v0 = kv0 k. Vemos entonces que la trayectoria seguida por el proyectil en x queda
descrita por un movimiento con velocidad constante. La posición en y está dada por
y(t) = voy t − (1/2)gt2 = v0 sen θ0 t − (1/2)gt2 , (4.33)
de modo que el movimiento en y del proyectil queda descrito por un movimiento de caı́da
libre.
120
De esta forma vemos que el movimiento del proyectil es un combinado entre un movi-
miento con velocidad constante y un movimiento de caı́da libre.
Ahora despejando t en (4.32) y reemplazando el resultado en (4.33) obtenemos

v0 sen θ0 x
y = y(t) = x − (1/2)g
v0 cos θ0 (v cos θ0 )2
0
g
= (tan θ0 ) x − 2
x2 .
2v0 cos2 θ0
Es decir, al eliminar el parámetro t, obtenemos la ecuación de una parábola de la forma

g
y = (tan θ0 ) x − x2 . (4.34)
2v02 cos2 θ0
Alcance horizontal y altura máxima de un proyectil
En la figura 4.20 vemos que el proyectil alcanza su altura máxima cuando vy = 0. Debemos
entonces encontrar una expresión para vy como función del tiempo. Derivando (4.33) respecto
a t obtenemos
dy
vy (t) = = v0y − gt = v0 sen θ0 − gt.
dt
Por lo tanto,
vy = 0 ⇔ v0 sen θ0 − gt = 0.
Con lo cual el proyectil alcanza su altura máxima después de un tiempo t1 dado por
v0 sen θ0
t1 = .
g
Entonces la altura máxima del proyectil es
hmáx = h(t1 )
2
v0 sen θ0 1 v0 sen θ0
= (v0 sen θ0 ) − g
g 2 g
2 2
v sen θ0
= 0 .
2g
Ahora, dado que el tiempo de vuelo es tv = 2t1 , el alcance horizontal está dado por
R = x(tv ) = x(2t1 )
2v0 sen θ0
= (v0 cos θ0 )
g
2
2v sen θ0 cos θ0
= 0
g
2
v sen 2θ0
= 0 .
g
121
4.10.2. Fuerza resultante
Una de las principales aplicaciones de los vectores, se presenta, en la solución de problemas
mediante el uso de la segunda ley Newton, la cual establece que la fuerza neta que actúa
sobre un cuerpo es igual a el producto de masa por su aceleración, en términos matemáticos
esto se expresa con una ecuación vectorial:
F = ma (Segunda ley de Newton)
La masa m de la partı́cula es una cantidad escalar, por lo tanto, lo que define la fuerza que
actúa sobre un cuerpo es la multiplicación por escalar entre su masa y su aceleración. Lo que
queremos decir con fuerza neta, es la fuerza resultante o sumatoria de fuerzas que actúan
sobre el cuerpo, por ejemplo, si n fuerzas F1 , . . . , Fn actúan sobre un cuerpo de masa m por
la segunda ley de Newton tendrı́amos que
F1 + · · · + Fn = ma.
Ahora si suponemos que la partı́cula se está moviendo en dos dimensiones, al descomponer

cada vector fuerza y el vector aceleración encontramos que
Fi = (Fix , Fiy ) , 1 ≤ i ≤ n, a = (ax , ay ) .
Por lo tanto, por la definición de igualdad y suma entre vectores tenemos que
X
Fx = F1x + · · · + Fnx = max
X
Fy = F1y + · · · + Fny = may .
Cuando la fuerza resultante es cero, la aceleración de la partı́cula también es cero, decimos

que la partı́cula está en equilibrio. En este caso
X
Fx = 0
X
Fy = 0.
Problema 4.10.1. Considere un peso de w Newtons suspendido por dos alambres como se
muestra en el diagrama, donde T1 y T2 son vectores de fuerza dirigidos a lo largo de los
alambres. Obtenga los vectores T1 y T2 y demuestre que sus magnitudes son
w cos α w cos β
kT1 k = y kT1 k =
sen(α + β) sen(α + β)
122
α β
T2 T1
α β
Figura 4.21: Una masa de peso w es suspendida por dos cables con tensiones T1 y T2
Solución. Según la gráfica de la figura 4.21 las direcciones de los vectores de fuerza T1 , T2
y w son respectivamente, β, π − α y 3π/2. En consecuencia tenemos que
T1x = kT1 k cos β,

T2x = kT2 k cos(π − α) = −kT2 k cos α
wx = kwk cos(3π/2) = 0,
T1y = kT1 k sen β,
T2y = kT2 k sen(π − α) = kT2 k sen α
wy = kwk sen(3π/2) = −w.
Ahora dado que la masa de peso w = kwk se encuentra en reposo se debe tener que
X
Fx = T1x + T2x + wx = 0
X
Fy = T1y + T2y + wy = 0.
Que equivale a
X
Fx = kT1 k cos β − kT2 k cos α + 0 = 0
X
Fy = kT1 k sen β + kT2 k sen α − w = 0.
Definamos x = kT1 k y y = kT2 k. Entonces tenemos un sistema de ecuaciones lineales de

tamaño 2 × 2
cos βx − cos αy = 0
sen βx + sen αy = w
Que en forma matricial se expresa como

cos β − cos α x 0
=
sen β sen α y w
123

cos β − cos α
Aquı́, la matriz de coeficientes es A = , con lo cual
sen β sen α
D := det A = sen α cos β + sen β cos α = sen(α + β).
Descontamos los casos en que α + β = 0, π, de tal forma que det A = sen(α + β) 6= 0.

Entonces por la Regla de Krammer
D1 D2
x= ,y = ,
D D
donde

0 − cos α cos β 0
D1 =
= w cos α, D1 =
= w cos β.
w sen α sen β w
Por consiguiente,
D1 w cos α D2 w cos β
kT1 k = = , kT2 k = = .
D sen(α + β) D sen(α + β)
Teniendo las magnitudes y direcciones de los vectores de fuerza T1 y T2 podemos obtener
dichos vectores. Para el vector T1 tenemos
w cos α cos β
T1x = kT1 k cos β = .
sen(α + β)
w cos α sen β
T1y = kT1 k sen β = .
sen(α + β)
Por lo tanto,
w cos α cos β w cos α sen β
T1 = i+ j.
Y para el vector T2 tenemos que
−w cos β cos α
T2x = kT2 k cos(π − α) = .
sen(α + β)
w cos β sen α
T2y = kT2 k sen(π − α) = .
sen(α + β)
En consecuencia,
−w cos β cos α w cos β sen α
T2 = i+ j.
124
4.11. Vectores en el espacio
Se define el espacio Euclideo de tres dimensiones como el conjunto de todas la triplas
ordenadas de números reales (x, y, z), esto es,
R3 = {(x, y, z) : x, y, z ∈ R} .
En analogı́a como se definió un vector en el plano, definimos un vector de R3 como un tripla

ordenada de números reales (Ax , Ay , Az ). La noción de vector geométrico (ver el problema
4.15.18) también se puede introducir en el espacio, por lo que escribimos A = (Ax , Ay , Az )
−→
en lugar de OA para denotar el vector A. Dado que cada componente Ax , Ay , Az de A puede
ser positiva o negativa, dividimos el espacio en 8 regiones llamadas octantes, en la figura
4.22 se muestra una caja rectangular ubicada en el primer octante (x, y, z ≥ 0).
O
P b
Q y
Figura 4.22: Magnitud o norma de un vector en el espacio
La diagonal de esta caja, el segmento que va del origen a el punto A, es la magnitud del
vector A, que vendrı́a a ser la hipotenusa del triángulo rectángulo △OQA. Por el Teorema
de Pitágoras tenemos que
kAk2 = |OA|2
= |OQ|2 + |QA|2
= |OQ|2 + A2z .
Como el punto Q tiene coordenadas (Ax , Ay , 0), de nuevo por el Teorema de Pitágoras, esta
vez aplicado en el triángulo △OP Q obtenemos que
|OQ|2 = |OP |2 + |P Q|2

= A2x + A2y .
125
Por lo tanto, tenemos que la magnitud del vector A está dada por
q
kAk = A2x + A2y + A2z .
Utilizando la noción de norma de un vector junto con el concepto de vector geométrico

podemos establecer una fórmula para la distancia entre dos puntos en el espacio.
Teorema 4.11.1. Sean P = (x1 , x2 , x3 ) y Q = (y1 , y2 , y3 ) dos puntos en el espacio. Entonces

−→
la distancia entre P y Q está dada por la norma del vector geométrico P Q, esto es,
−→ p
d(P, Q) = k P Q k = kQ − P k = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .
En el caso de R3 no se puede definir la dirección del vector A como el ángulo θ que forma
el vector con el eje x ya que, por ejemplo, si 0 < θ < π/2, existe un número infinito de
vectores con la misma magnitud que forman el mismo ángulo θ con el eje x, el conjunto de
dichos vectores forman el cono mostrado en la figura 4.23.
θ O
b
θ
y
x
Figura 4.23: Todos los vectores sobre el cono forman un ángulo θ con el eje x
La dirección de un vector en R3 , formalmente se define como sigue
Definición 4.11.1. La dirección de un vector no nulo A en R3 se define como el vector

unitario
A
u= .
kAk
Sin embargo, también podemos definir la dirección de un vector en R3 en términos de

−→
ángulos. Los ángulos α, β y γ que forma el vector A =OA con cada uno de los ejes coorde-
nados, x, y y z son llamados ángulos directores del vector A. Entonces como se muestra
en la figura 4.24 del triángulo rectángulo △OAP tenemos que
x
cos α = .
kAk
126
De manera similar, utilizando los triángulos rectángulos △OAQ y △OAR encontramos que
y z
cos β = , cos γ = .
kAk kAk
Por definición, cada uno de estos ángulos está en el intervalo [0, π]. Los cosenos de estos
ángulos son llamados cosenos directores. Podemos entonces expresar cualquier vector de
R3 en términos de estos cosenos directores
A = (x, y, z) = (kAk cos α, kAk cos β, kAk cos γ). (4.35)
b
R
γ
O A
β
α
P b
x
b
Q
y
Figura 4.24: El vector A forma un ángulo α con lado positivo del eje x, β con el lado positivo
del eje y y γ con el eje positvo del eje z
Se observa que si el vector es unitario tenemos que
A = (cos α, cos β, cos γ).
Además para todo vector A
cos2 α + cos2 β + cos2 γ = 1
4.12. Producto cruz

Como se vio en el ejemplo 4.11 dos puntos determinan completamente una recta. Como
veremos en la sección 4.13 tres puntos no colineales (que no están en la misma recta) de-
terminan completamente un plano. Otra forma de determinar completamente un plano es
teniendo un punto y su vector normal, este último vector podemos compararlo con el vector
127
director para el caso de la recta, pues en cierto sentido da la dirección al plano. Supóngase
que queremos determinar la ecuación un plano π sabiendo que conocemos tres de sus puntos
P , Q y R.
π
P
Q
Figura 4.25: El vector normal al plano π es obtenido como el producto cruz entre los vectores
−→ −→
geométricos P Q y P R
Como se ve en la figura 4.25, n es el vector normal al plano, por lo tanto ha de ser

perpendicular a cualquier vector que este sobre este, en particular debe ser perpendicular
−→ −→
a los vectores geométricos P Q y P R. Si estos vectores tienen coordenadas (a1 , b1 , c1 ) y
(a2 , b2 , c2 ) respectivamente, y las coordenadas del vector n son (a, b, c), entonces tenemos
que
(a1 , b1 , c1 ) · (a, b, c) = 0
(a1 , b1 , c1 ) · (a, b, c) = 0,
o bien

a1 a + b1 b + c1 c = 0
(4.36)
a2 a + b2 b + c2 c = 0
En el sistema (4.36) tomamos como variables las componentes del vector normal a, b y c.
Entonces por la regla de Krammer obtenemos para a y b

−c1 c b1 a1 −c1 c

−c2 c b2 c(b1 c2 − b2 c1 ) a2 −c2 c c(a2 c1 − a1 c2 )
a= = ,b = = ·
a1 b1 a1 b2 − a2 b1 a1 b1 a1 b2 − a2 b1

a2 b2 a2 b2
128
De esta forma vemos que

c(b1 c2 − b2 c1 ) c(a2 c1 − a1 c2 )

n = (a, b, c) = , ,c
a1 b2 − a2 b1 a1 b2 − a2 b1
c
= (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ).
a1 b2 − a2 b1
Ahora bien, como puede comprobarse las ecuaciones que conforman (4.36) se verifican si-
multáneamente si tomamos c = a1 b2 − a2 b1 . Por lo tanto, una solución del sistema (4.36)
está dada por
a = b1 c2 − b2 c1 , b = a2 c1 − a1 c2 y c = a1 b2 − a2 b1 .
Lo que significa que dados dos vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ), el vector
n := (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ),
es perpendicular a ambos, dicho vector se conoce como producto cruz o producto vec-
torial de los vectores A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ).
El análisis hecho anteriormente justifica la siguiente definición.
Definición 4.12.1 (Producto cruz). Sean A = (a1 , b1 , c1 ) y B = (a2 , b2 , c2 ) dos vectores de

R3 . El producto cruz entre A y B se denota por A × B y define como
A × B = (b1 c2 − b2 c1 , a2 c1 − a1 c2 , a1 b2 − a2 b1 ). (4.37)
Si definimos la matriz

a11 a12 a13

A = a1 b1 c1
a b2 c2
2
y desarrollamos su determinante por la primera fila obtenemos
|A| = a11 A11 + a12 A12 + a13 A13

= a11 (b1 c2 − b2 c1 ) + a12 (a2 c1 − a1 c2 ) + a13 (a1 b2 − a2 b1 ).
Vemos que las componentes del producto vectorial son precisamente los cofactores de la
matriz A en el desarrollo anterior, por lo tanto podemos expresar el producto vectorial como
sigue
A × B = (A11 , A12 , A13 ) = A11 i + A12 j + A13 k,
129
donde i, j y k son los vectores coordenados unitarios de R3 . La última expresión para el
producto cruz en términos de estos vectores nos permite escribir

i j k

A × B = a1 b1 c1 (4.38)
a b c
2 2 2
La fórmula (4.38) no solo evita la memorización de la tediosa fórmula en (4.37) si no que es

muy útil a la hora de demostrar las propiedades del producto cruz.
Teorema 4.12.1 (Propiedades del producto cruz). Sean A, B y C vectores en R3 y α
escalar, entonces
(a) A × 0 = 0.
(b) A × B = −B × A (propiedad anticonmutativa para el producto vectorial)
(c) (αA) × B = α(A × B).
(d) A × (B + C) = A × B + A × C
(propiedad distributiva para el producto vectorial)
(e) (A × B) · C = A · (B × C) (triple producto escalar)
(f ) (A × B) · A = (A × B) · B = 0.
(g) A × B = 0 ⇔ A k B.
(h) kA × Bk2 = kAk2 kBk2 − (A · B)2 (identidad de Lagrange)
Utilizando la identidad de Lagrange podemos demostrar que la magnitud del producto
cruz está dada por
kA × Bk = kAkkBk sen θ (4.39)
donde θ es el ángulo más pequeño que hay entre A y B medido en el sentido contrario de
las manecillas del reloj.
Existe un interpretación interesante de (4.39).
h
θ A
Figura 4.26: El área del paralelogramo determinado por los vectores A y B es igual a la
magnitud del pruducto cruz entre estos vectores.
130
En la figura 4.26 el paralelogramo determinado por los vectores A y B tiene como base
la magnitud del vector A, dado que su altura es h, su área está dada por kAkh, pero
h = kBk sen θ.
Entonces el área del paralelogramo es kAkkBk sen θ, que es precisamente la magnitud del
producto cruz entre A y B. Concluimos que:
El área del paralelogramo determinado por los vectores A y B es igual a la magnitud del
producto cruz entre ellos.
Combinando (4.38) y (4.39) podemos hacer una interpretación geométrica del determi-
nante de tamaño 2 × 2 (ver sección 2.2). Supongamos que el paralelogramo de la figura 4.26
está dispuesto sobre el plano xy, y que los vectores A y B tienen componentes (a, c, 0) y
(b, d, 0) respectivamente. Entonces el producto cruz entre estos vectores es

i j k

A × B = a c 0 = i(0) − j(0) + k(ad − bc) = (0, 0, ad − bc).
b d 0
Con lo cual,
kA × Bk = |ad − bc|
La parte derecha de la ecuación anterior, es el valor absoluto del determinante de la matriz

a b
A :=
c d
Concluimos que el área del paralelogramo determinado por los vectores A y B es igual
al determinante de la matriz formada por estos, vistos como vectores columna.
Ejemplo 4.16 (Examen conjunto de Álgebra lineal 6 de junio de 2018 punto 10). En la
plazoleta principal de la Universidad se quiere construir en centro de descanso para los estu-
diantes. La plazoleta tendrá un techo cubierto en forma triangular. El ingeniero encargado
ubicó los soportes en los puntos A = (2, 3, 3), B = (5, 6, 4) y C = (3, 6, 8) con cada entrada
medida en metros.
(a) El techo se sostendrá con alambre de acero, indique la cantidad de alambre que se
necesita para sostener el techo.
(b) El techo utilizará una lona de color blanco, indique la cantidad de metros cuadrados
empleados en el techo.
131
4.13. Rectas y planos en el espacio
Como se menciono en la sección 4.7.1 mediante métodos vectoriales se puede extender la
noción recta a Rn . En particular para el caso de R3 la ecuación vectorial de la recta viene
dada en la forma
P = P0 + tv, (4.40)
donde P = (x, y, z) es un punto arbitrario de la recta, P0 = (x0 , y0 , z0 ) un punto dado

y v = (v1 , v2 , v3 ) es el vector director. Con la ecuación vectorial podemos encontrar las
ecuaciones paramétricas y simétricas de la recta

 x = x(t) = x0 + tv1
y = y(t) = y0 + tv2 (Ecuaciones paramétricas de la recta)
z = z(t) = z0 + tv3

x − x0 y − y0 z − z0
= = (Ecuaciones simétricas de la recta)
v1 v2 v3
Las nociones de paralelismo y ortogonalidad entre rectas vienen dadas en términos de los
vectores directores.
Definición 4.13.1.
4.14. Aplicaciones de los vectores en el espacio
4.15. Problemas
Movimiento en una dimensión

Problema 4.15.1. La altura de una partı́cula en función del tiempo viene dada por la
parábola
132
y = y(t)
101,25
50
x
O 9 9
2
Figura 4.27: Gráfica de la posición de una partı́cula respecto al tiempo
(a) Utilizar la gráfica que se muestra el la figura 4.27 para hallar el domino de la función
que representa la altura de la partı́cula como función del tiempo, ¿qué representa este
dominio?
(b) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
(c) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.
(d) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.
Problema 4.15.2. La altura de una partı́cula en función del tiempo viene dada por la
parábola
133
y = y(t)
500
250
x
O 10 20
(a) Hallar explicitamente la función que representa la altura de la partı́cula con respecto
al tiempo.
(b) Hallar y gráficar la velocidad de la partı́cula como función del tiempo.
(c) Hallar y gráficar la aceleración de la partı́cula como función del tiempo.
Sección 4.9. Movimiento en el plano

Problema 4.15.3. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).
(a) Halle el vector posición de un punto de su borde, si está inicialmente en O.
(b) Halle las componentes de la velocidad y aceleración del punto.
(c) Dibuje la velocidad y la aceleración del punto.
(d) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
Problema 4.15.4. La posición de una partı́cula en el momento t está dada por elipse
x2 y 2
+ = 1.
9 4
134
La partı́cula empieza su movimiento en el punto (0, 2) y sigue la dirección de las manecillas
del reloj completando una revolución. Una segunda partı́cula tiene una posición dada por
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(a) Halle el vector posición para ambas partı́culas.
(b) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
(c) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión.
x2 y 2
+ = 1.
9 4
x2 + y 2 − 6x − 2y = −9.
Esta segunda partı́cula empieza su movimiento en el punto (4, 1) y sigue la dirección contraria
de las manecillas del reloj completando una revolución.
(a) Halle el vector posición para ambas partı́culas
Problema 4.15.6. La posición de una partı́cula en el momento t está dada por
x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π
y una segunda partı́cula tiene posición
x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
135
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
(c) Describa la situación si la segunda partı́cula tiene la trayectoria
x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.
Problema 4.15.7 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?
Problema 4.15.8 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en

dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa. Resuelva este problema de dos formas distintas.
Subsección 3.2.1. Vector resultante

Problema 4.15.9 (Navegación: dirección y rumbo). Un piloto parte de un aeropuerto y se
dirige en dirección N 20◦ E, volando con una rapidez de 200 mi/h. Después de una hora hace
una corrección de curso y se dirige en la dirección N 40◦ E. Media hora después, un problema
en el motor obliga a hacer un aterrizaje de emergencia.
(a) Encuentre la distancia entre el aeropuerto y su punto de aterrizaje final.
(b) Encuentre el rumbo desde aeropuerto hasta su punto final de aterrizaje.
Problema 4.15.10. Sean A y B dos vectores de R2 . Utilizar el teorema del coseno (ver
ejemplo 2.1) para demostrar que
kRk2 = kA + Bk2 = kAk2 + kBk2 + 2kAkkBk cos θ, (4.41)
donde θ = α − β es el ángulo entre los vectores, y α y β son las direcciones de los vectores
A y B respectivamente. Hacer las gráfica correspondiente.
Subsección 3.4. Movimiento relativo

Problema 4.15.11 (Velocidad verdadera de un avión). Un avión vuela por un viento que
fluye con una rapidez de 55mi/h en la dirección N 30◦ E. El avión tiene una rapidez de
765mi/h respecto al aire, y el piloto dirige son avión en la dirección N 45◦ E.
136
(a) Halle la velocidad del viento, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del avión con respecto al aire, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del avión con respecto a la tierra, en términos de los vectores coor-
denados unitarios.
(d) Determine la rapidez y dirección verdaderas del avión.
Problema 4.15.12 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y

dirección verdaderas del avión del problema 4.15.11 si el piloto dirige el avión en la dirección
N 30◦ O.
Problema 4.15.13 (Velocidad de un avión respecto a la tierra). ¿En qué dirección debe
dirigir el avión el piloto del problema 4.15.11 para que el curso verdadero sea al norte?
Problema 4.15.14 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.15.15 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
(d) Determine la rapidez y dirección verdaderas del bote.

Problema 4.15.16 (Velocidad de un bote). El navegador del problema 4.15.15 quiere llegar
a un punto en la orilla norte del rı́o directamente opuesto la punto de partida. ¿En qué
dirección debe dirigir el bote?
Problema 4.15.17. Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en direc-
ción contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando
su movimiento en el punto (1, 0). Pasados (π/8)s se encuentra por primera vez con otra
partı́cula que se desplaza en la dirección S45◦ O. Si esta segunda partı́cula se mueve con una
16
rapidez constante de m/s,¿después de cuánto tiempo se vuelven a encontrar?
5π
137
Sección 4.11. Vectores en el espacio
Problema 4.15.18. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) y C = (c1 , c2 , c3 ), D = (d1 , d2 , d3 )
−→ −→
puntos de R3 . Demuestre que si los vectores geométricos AB y CD tienen como dirección un
vector unitario u, y además tienen la misma magnitud, entonces son equivalentes. Use este
hecho para demostrar que todo vector cuyo punto inicial coincide con el origen, y punto final
A tiene coordenadas (a, b, c) es equivalente a cualquier vector geométrico que tenga la misma
−→
magnitud y dirección que este. Es decir, si el vector geométrico CD donde C = (c1 , c2 , c3 ) y
−→
D = (d1 , d2 , d3 ) tiene la misma magnitud y dirección que el vector OA= (a, b, c), entonces
−→ −→
A =OA=CD .
Sección 4.12. Producto cruz

Problema 4.15.19. Demuestre que si u, v, w y r son vectores en el espacio, entonces
(a) u × (v × w) + v × (w × u) + w × (u × v) = 0.
(b) u × v = (u · v × i)i + (u · v × j)j + (u · v × k)k.

u · w v · w
(c) (u × v) · (w × r) = .
u·r v ·r
Problema 4.15.20. Utilice el producto cruz para demostrar que
sen(A − B) = sen A cos B − sen B cos A.
Sección 4.13. Rectas y planos en el espacio

Problema 4.15.21. Calcule la distancia entre las rectas
x−2 y−5 z−1 x−2 y−5 z−1
L1 : = = y L2 : = =
3 2 −1 3 2 −1
Sugerencia: La distancia se mide a lo largo del vector v que es perpendicular a L1 y a L2 .
−→
Sea P un punto de L1 y Q un punto de L2 . Entonces la longitud de la proyección de P Q
sobre v es la distancia entre las rectas, medida a lo largo del vector que es perpendicular a
ambas.
138
Problema 4.15.22. Demuestre que las rectas
x = a1 s + b1 , y = a2 s + b2 , z = a3 s + b3 , s ∈ R,
x = c1 t + d1 , y = c2 t + d2 , z = c3 t + d3 , t ∈ R,
se cortan o son paralelas si y sólo si

a1 c1 b1 − d1

a2 c2 b2 − d2 = 0.

a c b − d
3 3 3 3
Problema 4.15.23. Demuestre que la distancia del punto P0 = (x0 , y0, z0 ) al plano
π = (x, y, z) ∈ R3 : ax + by + cz + d = 0 ,

está dada por
|ax0 + by0 + cz0 + d|

dmı́n = √ .
a2 + b2 + c2
Problema 4.15.24. Demuestre que

x1 − x y1 − y z1 − z

x2 − x y2 − y z2 − z = 0

x − x y − y z − z
3 3 3
es una ecuación del plano que pasa por los tres puntos no colineales
P1 (x1 , y1, z1 ), P2 (x2 , y2, z2 ) y P3 (x3 , y3 , z3 ).
Sección 4.14. Aplicaciones de los vectores en el espacio

Problema 4.15.25 (***). Una partı́cula se desplaza sobre la curva de intersección de las
√
superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.
4.16. Taller 2 corte 2

Problema 4.16.1. Una llanta de radio R rueda con una rapidez constante V0 a lo largo de
un plano horizontal (figura 4.15).
139
(a) Halle el vector posición de un punto P de su borde, si está inicialmente en O.
(b) Halle las componentes de la velocidad y aceleración del punto P .
(c) Muestre que la rapidez del punto P en el instante t está dada por
V0 t
kv(t)k = kα′ (t)k = 2V0 sen .
2R
(d) Dibuje la velocidad y la aceleración del punto.
(e) Trace las trayectorias de un punto del borde de la llanta que esté a una distancia de
2/3 del radio a partir del eje y.
Problema 4.16.2 (Rueda de la fortuna). Una rueda de la fortuna tiene un radio de 10m
y la parte inferior de la rueda pasa a 1m por arriba del suelo. Si la rueda da una vuelta
completa cada 20s, determine el vector posición de una persona que va sentada en la rueda.
Suponga que la persona inicia su movimiento en el punto (0, 1), ¿con qué rapidez se esta
moviendo la persona?
x2 y 2
+ = 1.
9 4
x2 + y 2 + 6x − 2y = −9
Esta segunda partı́cula empieza su movimiento en el punto (−2, 1) y sigue la dirección con-
traria de las manecillas del reloj completando una revolución.
(a) Halle el vector posición para ambas partı́culas.
Problema 4.16.4. La posición de una partı́cula en el momento t está dada por
x1 (t) = 3 sen t, y1 (t) = 2 cos t, 0 ≤ t ≤ 2π
y una segunda partı́cula tiene posición
x2 (t) = −3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π
140
(a) Grafique las dos trayectorias. ¿Cuántos puntos de intersección tienen?
(b) Algunos de estos puntos de intersección. ¿Son puntos de colisión? Si es ası́, halle los
puntos de colisión
(c) Describa la situación si la segunda partı́cula tiene la trayectoria
x2 (t) = 3 + cos t, y2 (t) = 1 + sen t, 0 ≤ t ≤ 2π.
Problema 4.16.5 (Velocidad de un avión respecto a la tierra). Encuentre la rapidez y

dirección verdaderas del avión del problema 4.15.11 si el piloto dirige el avión en la dirección
N 30◦ O.
Problema 4.16.6 (Calculando la ruta). Una mujer bota una lancha desde la orilla de un
rı́o recto y quiere desembarcar en punto directamente en la orilla opuesta. Si la rapidez de la
lancha (con respecto al agua) es de 10mi/h y el rı́o fluye al este con una rapidez de 5mi/h,
¿en qué dirección debe dirigir la lancha a fin de llegar al punto deseado?
Problema 4.16.7 (Velocidad de un bote). Un rı́o recto fluye al este a una rapidez de
10mi/h. Un navegador comienza en la orilla sur del rı́o y se dirige en la dirección 60◦
medidos desde la orilla sur. El bote tiene una rapidez de 20mi/h respecto al agua.
(a) Halle la velocidad del rı́o, en términos de los vectores coordenados unitarios.
(b) Halle la velocidad del bote con respecto al agua, en términos de los vectores coordenados
unitarios.
(c) Halle la velocidad del bote con respecto a la tierra, en términos de los vectores coorde-
nados unitarios.
(d) Determine la rapidez y dirección verdaderas del bote.
Problema 4.16.8. Una partı́cula se desplaza sobre la circunferencia x2 +y 2 = 4 en dirección

contraria a las de las manecillas del reloj con una rapidez constante de 2m/s empezando su
movimiento en el punto (2, 0). Una segunda partı́cula su mueve sobre la circunferencia
x2 + y 2 − 4x = 0,
en dirección contraria a las de las manecillas del reloj con una rapidez constante de 4m/s
empezando su movimiento en el punto (4, 0).
(a) Grafique las trayectorias seguidas por ambas partı́culas.
(b) Halle el vector posición de cada partı́cula.
141
(c) Halle los puntos, o punto de colisión de las partı́culas.
Problema 4.16.9. En la figura 4.28 considere un peso suspendido por dos alambres. Obtenga
la magnitud y componentes de los vectores F1 y F2 , y los ángulos α y β. Ver el problema
4.10.1.
5m
α β
F1 F2
3m
4m
100N
Figura 4.28: Una masa de peso 100N es suspendida por dos alambres representados por los
vectores F1 y F2
Recuerde que 1N = 1Kg · m/s2 .
Problema 4.16.10 (**). Una partı́cula se desplaza sobre la circunferencia x2 + y 2 = 1 en

dirección de las manecillas del reloj con una rapidez constante d e 2m/s. Encuentre el vector
posición de la partı́cula, sabiendo que esta inicia su movimiento en el punto (0, 1) y da una
revolución completa.
Problema 4.16.11. Una avión tiene una rapidez en el aire de 250mi/h, el piloto desea
volar hacia el norte. Suponiendo que prevalezca un viento de 60mi/h hacia el este,
(a) ¿cuál debe ser el enfilamiento del avión?
(b) ¿Cúal será la rapidez a tierra cuando viaja en dicho curso?.
Problema 4.16.12 (***). Un piloto tiene que volar hacia el este de A a B y después regresar
hacia el oeste al punto A. La rapidez del avión en el aire es c y la rapidez del aire con respecto
a la tierra es v. La distancia entre A y B es l y la velocidad del avión en el aire es constante.
(a) Si v = 0 (aire tranquilo), demostrar que el tiempo necesario para el viaje redondo es
t0 = 2l/c
142
(b) Supóngase que la velocidad del aire está dirigida hacia el este (o hacia el oeste). De-
mostrar que el tiempo necesario para un viaje redondo es entonces,
t0
tE = .
1 − v 2 /c2
(c) Supóngase que la velocidad del aire es hacia el norte (o hacia el sur). Demostrar que
el tiempo necesario para un viaje redondo es entonces,
t0
tN = p .
1 − v 2 /c2
(d) En los incisos (b) y (c) debe suponerse que v < c ¿Por qué?
Ver el problema 3.4.1 para solución del caso 1 del inciso (b), y el caso 1 del inciso (c).
Problema 4.16.13 (***). Dos nadadores, Alan y Camillé, parten desde el mismo punto en
la orilla de una corriente ancha que circula con una rapidez v. Ambos se mueven con la misma
rapidez c (donde c > v) en relación con el agua. Alan nada corriente abajo una distancia L
y luego corriente arriba la misma distancia. Camillé nada de modo que su movimiento en
relación con la Tierra es perpendicular a las orillas de la corriente. Ella nada la distancia
L y luego de vuelta la misma distancia, de modo que ambos nadadores regresan al punto de
partida. ¿Cuál nadador regresa primero? Nota : P rimero suponga la respuesta.
Problema 4.16.14. Una pelota de golf es golpeada con una rapidez inicial v0 formando un
ángulo α con respecto a la horizontal desde un punto que está al pie de una colina que forma
un ángulo de inclinación φ con la horizontal donde
0 < φ < α < π/2.
Demuestre que la pelota toca tierra a una distancia
2v02 cos α
sen(α − φ),
g cos2 φ
medida sobre la colina. Demuestre que el mayor alcance que se puede lograr para un v0 dado
ocurre cuando α = (φ/2) + (π/4); es decir, cuando el vector velocidad inicial biseca el ángulo
entre la vertical y la colina.
143
Capı́tulo 5
Espacios vectoriales
5.1. Definición y propiedades

Definición 5.1.1 (Espacio vectorial). Sea V un conjunto no vacı́o de objetos llamados
elementos. El conjunto V es llamado espacio vectorial sobre el campo F si satisface
cada uno de los siguientes diez axiomas
Axiomas de cerradura
Axioma 5.1.1 (Cerradura respecto a la suma). Para cada par elementos x, y ∈ V corres-
ponde un único elemento de V llamado suma de x, y, denotado por x + y.
Axioma 5.1.2 (Cerradura respecto al producto por escalar). Para cada x ∈ V y cada λ ∈ F
corresponde un único elemento de V llamado producto por escalar entre λ y x, denotado
por λx.
Axiomas para la suma
Axioma 5.1.3 (Ley conmutativa). Para todo x, y ∈ V , tenemos que
x + y = y + x.
Axioma 5.1.4 (Ley asociativa). Para todo x, y, z ∈ V , tenemos que
(x + y) + z = x + (y + z).
Axioma 5.1.5 (Existencia de elemento neutro). Para cada x ∈ V existe 0 ∈ V , tal que
x + 0 = x.
Axioma 5.1.6 (Existencia de inverso aditivo). Para cada x ∈ V existe y ∈ V denotado por
(−1)x tal que
x + (−1)x = 0.
144
Axiomas para el producto por escalar
Axioma 5.1.7 (Ley asociativa). Para x ∈ V y α, β ∈ F , tenemos que
α(βx) = (αβ)x.
Axioma 5.1.8 (Ley distributiva de la suma con respecto al producto por escalar). Para
x, y ∈ V y α ∈ F , tenemos que
α(x + y) = αx + αy.
Axioma 5.1.9 (Ley distributiva de la suma de escalares con respecto al producto por
escalar). Para x ∈ V y α, β ∈ F , tenemos que
(α + β)x = αx + βx.
Axioma 5.1.10 (Existencia de elemento identidad). Para x ∈ V , tenemos que
1x = x.
Cuando F = R, decimos que V es un espacio vectorial sobre el campo de los números

reales o espacio vectorial real. Si F = C, decimos que V es un espacio vectorial sobre el
campo de los números complejos o espacio vectorial complejo. A menudo nos referiremos a
los elemento de V como vectores.
5.1.1. Ejemplos de espacios vectoriales

Cada uno de los siguientes conjuntos es un espacio vectorial sobre el campo de los números
reales
Ejemplo 5.1. (a) Sea V = R, el conjunto de los números reales y F = R
(b) V = Rn , el espacio Euclideo de n dimensiones, con F = R y la suma y el producto por

escalar definidas como sigue. Para x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) en Rn y λ ∈ R
x + y = (x1 + y2 , . . . , xn + yn ), λx = (λx1 , . . . , λxn ).
(c) Sea V el conjunto de todos los vectores en Rn que son ortogonales a un vector no nulo
dado n.
(d) Sea V el conjunto de todas las funciones definidas en un intervalo dado I, con la suma
y producto por escalar usual de funciones, esto es,
(f + g)(x) = f (x) + g(x), (λf )(x) = λf (x).
145
(e) El conjunto de todas la matrices de tamaño m × n con entradas en los reales, esto es,
V = Mm×n (R).
Ejemplo 5.2. Demuestre que el conjunto de los números reales positivos forma un espacio
vectorial bajo las operaciones x + y = xy, λx = xλ .
Solución. Lo primero que debemos hacer es verificar los axiomas de cerradura. Sean x, y ∈
R+ y λ ∈ R. Entonces xy > 0, con lo cual x + y = xy ∈ R+ . Además, λx = xλ ∈ R+ , ya que
x ∈ R+ . La suma ası́ definida es conmutativa y asociativa. En efecto
x + y = xy = yx = y + x, (x + y) + z = (xy)z = x(yz) = x + (y + z).
para todo x, y, z ∈ R+ .
Sea x ∈ R+ , entonces se cumple la ley modulativa de la suma, esto es, existe 1 ∈ R+ tal
que
x + 1 = x(1) = x.
En este caso 0 = 1, es decir. el elemento neutro es el 1. Ahora, sabiendo que el elemento

neutro para la suma es el 1, debemos demostrar que todo x ∈ R+ tiene un inverso aditivo,
lo que nos lleva a plantear la ecuación
x + y = 1 ⇔ xy = 1 ⇔ y = 1/x.
Ası́, el inverso aditivo de x es 1/x. Verifiquemos los axiomas correspondientes a la multipli-

cación por escalar. Sean α, β ∈ R y x ∈ R+ .
α(βx) = (βx)α = (xβ )α = xβα = xαβ = (αβ)x.
Si x, yR+
α(x + y) = (x + y)α = (xy)α = xα y α = (αx)(αy) = αx + αy.
(α + β)x = xα+β = xα xβ = (αx)(βx) = αx + βx.
Finalmente,
1x = x1 = x,
para cada x ∈ R+ .
De los axiomas que definen un espacio vectorial, se deducen las siguientes propiedades
146
Teorema 5.1.11. Sea V un espacio vectorial sobre el campo F . Entonces
(a) α0 = 0 para todo α ∈ F .
(b) 0x = 0 para todo x ∈ V .
(c) Si αx = 0, entonce α = 0 o x = 0, o ambos.
(d) (−1)x = −x para todo x ∈ V .
5.2. Subespacios
Definición 5.2.1 (Subespacio). Sea H un subconjunto no vacı́o de un espacio vectorial V
que es en si mismo un espacio vectorial con las operaciones de suma y producto por escalar
definidas en V es llamado subespacio de V .
El siguiente resultado caracteriza los subesapcios de un espacio vectorial
Teorema 5.2.1. Un subconjunto no vacı́o H de un espacio vectorial V es un subespacio de

V si y sólo si se cumplen los axiomas de cerradura:
(a) Si x, y ∈ H, entonces x + y ∈ H.
(b) Si λ ∈ F, x ∈ H, entonces λx ∈ H.
Nota 5.2.1. El teorema 5.2.1 se puede enunciar de forma equivalente como sigue: Un sub-
conjunto no vacı́o H de un espacio vectorial V es un subespacio de V si y sólo si
αx + βy ∈ H,
para todos los escalares α, β ∈ F y todo x, y ∈ H.
Ejemplo 5.3. Para cualquier espacio vectorial V , el subconjunto H = {0} que consta úni-
camente del cero es un subesapcio de V . Ası́ mismo, V es subepacio de si mismo. Los subes-
pacios {0} , V son llamados subespacios triviales. Los subespacios distintos de {0} y V
son llamados subespacios propios.
Ejemplo 5.4 (Subespacio propio de R2 ). Toda recta que pasa por el origen es un subespacio
propio de R2 .
Ejemplo 5.5 (Subespacios propios de R3 ). Toda recta que pasa por el origen es un subespacio
propio de R3 . Ası́ mismo, todo plano que pasa por el origen es un subespacio propio de R3 .
Teorema 5.2.2. Sean H1 , H2 subespacios de un espacio vectorial V . Entonces H1 ∩ H2 es

un subespacio de V .
147
5.3. Combinación lineal y espacio generado
Definición 5.3.1 (Combinación lineal). Sean v1 , . . . , vn vectores de un espacio vectorial V .
Entonces cualquier vector de la forma
v = α1 v1 + · · · + αn vn ,
αi ∈ F , para todo 1 ≤ i ≤ n es llamado combinación lineal de los vectores v1 , . . . , vn .
Definición 5.3.2 (Espacio generado). Sea H = {v1 , . . . , vn } un subconjunto de espacio

vectorial V . Denotamos por gen H a el conjunto de todas las combinaciones lineales que
podemos formar con los vectores de H. Esto es,
gen H = {v : v = α1 v1 + · · · + αn vn , αi ∈ F, 1 ≤ i ≤ n} .
Nos referimos a gen H como espacio generado por el conjunto de vectores v1 , . . . , vn .
Teorema 5.3.1. Sea H un subconjunto de un espacio vectorial V . Entonces el generado por

H, gen H es un subespacio de V .
Demostración. Sean v, w ∈ H y α, β ∈ F . Entonces existen escalares α1 , . . . , αn y β1 , . . . , βn

en F tales que
v = α1 v1 + · · · + αn vn , w = β1 v1 + · · · + βn vn .
Por lo tanto,
αv + βw = α(α1 v1 + · · · + αn vn ) + β(β1 v1 + · · · + βn vn )
= αα1 v1 + · · · + ααn vn + ββ1 v1 + · · · + ββn vn
= (αα1 + ββ1 )v1 + · · · + (ααn + ββn )vn .
Ahora dado que ααi + ββi ∈ F para todo 1 ≤ i ≤ n, αv + βw ∈ H. Esto es, H es un

subespacio de V .
Definición 5.3.3 (Conjunto generador). Decimos que un conjunto H = {v1 , . . . , vn } genera

un espacio vectorial V si
gen H = V.
Ejemplo 5.6. Sea V = Pn , el conjunto de todos los polinomios de grado ≤ n, y F = R.

El conjunto V es un espacio vectorial real generado por n + 1− vectores. En efecto, sea
H = {1, x, x2 , . . . , xn }. Entonces
gen H = {p ∈ Pn : p(x) = a0 (1) + a1 x + · · · + an xn , ai ∈ R, 0 ≤ i ≤ n} = V.
148
5.4. Independencia lineal
Definición 5.4.1 (Dependencia lineal e independencia lineal). Sean v1 , . . . , vn n vectores
de un espacio vectorial V . Entonces se dice que los vectores son linealmente indepen-
dientes si toda combinación lineal de ellos igualada a 0 implica que todos los vectores de la
combinación son cero. Esto es,
α1 v1 + · · · + αn vn = 0 implica que α1 = · · · = αn = 0.
Si los vectores no son linealmente independientes, se dice que son linealmente dependien-
tes. Esto es, existen n escalares no todos cero tales que
α1 v1 + · · · + αn vn = 0.
Ejemplo 5.7. Sea V el espacio vectorial de todas las funciones de R en R. Determinar si

cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) 1, eax , ebx , a 6= b.

(b) {cos x, sen x}.
(c) {ex , e−x , (ex + e−x )/2}.
(d) {cos2 x, sen2 x, 1}.

Solución. Consideremos una combinación lineal de las funciones 1, eax , ebx igualada a la
función cero, esto es,
α1 1 + α2 eax + α3 ebx = f (x)
donde f (x) = 0 para todo x ∈ R. Por lo tanto tenemos
α1 1 + α2 eax + α3 ebx = 0,
para todo x ∈ R. En particular, si x = 0 obtenemos la ecuación
α1 + α2 + α3 = 0.
Ahora generamos otro par de ecuaciones al tomar x = 1, luego x = −1:
α1 + α2 ea + α3 eb = 0, α1 + α2 e−a + α3 e−b = 0.
Luego tenemos el sistema lineal de ecuaciones homogéneas


 α1 + α2 + α3 = 0
α + α2 ea + α3 eb = 0
 1
α1 + α2 e−a + α3 e−b = 0
149
Que en forma matricial se expresa como
1 1 1 α1 0
    
1 ea eb  α2  = 0 (5.1)
1 e−a e−b α3 0
Aplicando Gauss–Jordan podemos simplificar el determinante de la matriz A de coeficientes

del sistema

R2 → −R1 + R2 1

1 1 1 1 1

a b a b
1 e
e R3 → −R1 + R3 0 e − 1 e − 1
1 e−a e−b ⇐⇒ 0 e−a − 1 e−b − 1
En consecuencia tenemos que

1 1 1 1 1 1
e = (ea − 1)(e−b − 1) − (e−a − 1)(eb − 1)

a b a b
det A := 1 e e = 0 e
1 e−a e−b 0 e−a e−b
Ahora, si det A = 0, tendrı́amos que
(ea − 1)(e−b − 1) − (e−a − 1)(eb − 1) = 0,
o equivalentemente
(ea − 1)(1 − eb ) (1 − ea )(eb − 1)

=
eb ea
Al multiplicar por −1 esta última ecuación obtenemos
(ea − 1)(eb − 1) (ea − 1)(eb − 1)

= ,
eb ea
de donde ea = eb , es decir a = b, lo cual es una contradicción puesto que estamos suponiendo
que a 6= b. Se debe tener entonces que det A 6= 0, lo cual implica que el sistema en (5.1) tiene
sólo la solución trivial, esto es, α1 = α2 = α3 = 0, es decir el conjunto dado es linealmente
independiente. Con cual tenemos el ı́tem (a).
Sean α1 y α2 escalares tales que
α1 cos x + α2 sen x = 0 ∀ x ∈ R.
En particular, si x = 0, α1 = 0, y si x = π/2, α2 = 0. Con lo cual, las funciones son

linealmente independientes.
150
Observese que
(−1/2)ex + (−1/2)e−x + (1)(ex + e−x )/2 = 0 ∀ x ∈ R.
Con lo cual, las funciones son linealmente dependientes.
Por la identidad fundamental sabemos que
(1) cos2 x + (1) sen2 x + (−1)(1) = 0 ∀ x ∈ R.

Esto significa que las funciones son linealmente dependientes.
Ejemplo 5.8. [**] Sean v1 , v2 dos vectores linealmente independientes de R3 . Demuestre que
el gen {v1 , v2 } es un plano que pasa por el origen. Hallar la ecuación cartesiana del plano.
Solución. Debemos demostrar que
gen {v1 , v2 } = π = {(x, y, z) : ax + by + cz = 0} .
Tomemos (x, y, z) ∈ gen {v1 , v2 }. Donde v1 = (a1 , b1 , c1 ) y v2 = (a1 , b1 , c1 ). Entonces existen
escalares s, t tales que
(x, y, z) = sv1 + tv2
Definamos n = v1 × v2 . En tal caso tenemos que
n · (x, y, z) = v1 × v2 · (sv1 + tv2 )
= v1 × v2 · sv1 + v1 × v2 · tv2
= s(v1 × v2 · v1 ) + t(v1 × v2 · v2 )
= 0.
Es decir, (x, y, z) ∈ π, donde
n = (a, b, c) = v1 × v2 = iA11 + jA12 + kA13 = (A11 , A12 , A13 ),
es el vector normal al plano. Recı́procamente, si (x, y, z) ∈ π, entonces ax + by + cz = 0
donde
a = A11 , b = A12 , c = A13 ,
Al menos uno de los escalares a, b, c es distinto de cero. Por ejemplo supongamos que c =
A13 6= 0. Debemos encontrar escalares s y t tales que
x = sa1 + ta2
y = sb1 + tb2
z = sc1 + tc2
151
Si consideramos sólo la primera y segunda ecuación, podemos encontrar estos escalares usan-
do la regla de Krammer:

x a2

y b2 b2 x − a2 y b2 x − a2 y
s= = = ,
a1 a2 a1 b2 − a2 b1 A13

b1 b2

a1 x

b1 y a1 y − b1 x
t= = .
a1 a2 A13

b1 b2
Entonces
b2 x − a2 y a1 y − b1 x
sv1 + tv2 = (a1 , b1 , c1 ) + (a2 , b2 , c2 )
A13 A13

a1 b2 x − a1 a2 y b1 b2 x − a2 b1 y b2 c1 x − a2 c1 y
= , ,
A13 A13 A13

a1 a2 y − a2 b1 x a1 b2 y − b1 b2 x a1 c2 y − b1 c2 x

+ , ,
A13 A13 A13

(a1 b2 − a2 b1 )x (a1 b2 − a2 b1 )y (b2 c1 − b1 c2 )x + (a1 c2 − a2 c1 )y

= , ,
A13 A13 A13

−ax − by
= x, y,
c
= (x, y, z).
Esto es, (x, y, z) ∈ gen {v1 , v2 }.

Teorema 5.4.1. Dos vectores de un espacio vectorial son linealmente dependientes si y sólo
si uno es múltiplo escalar del otro.
Se concluye del Teorema 5.4.1 que dos vectores de un espacio vectorial son linealmente
dependientes si y sólo si son paralelos.
Teorema 5.4.2. Sean v1 = (x1 , y1) y v2 = (x2 , y2 ) dos vectores de R2 , y sea A la matriz
formada por estos vectores, esto es,

v1 x1 y1
A := = .
v2 x2 y2
Entonces, los vectores v1 , v2 son linealmente dependientes ⇔ det A = 0. En consecuencia,
v1 , v2 son linealmente independientes ⇔ det A 6= 0.
152
Demostración. (⇒). Supongamos que v1 , v2 son linealmente dependientes. Entonces por el
Teorema 5.4.1 existe k ∈ R tal que v1 = kv2 . Pero entonces tenemos que

v1 x1 y1
det A = det = det = 0.
kv1 kx1 ky1
(⇐). Ahora, supongamos que v1 , v2 son linealmente independientes y que
xv1 + yv2 = (0, 0) (5.2)
Entonces por definición de independencia lineal tenemos que x = y = 0. Pero (5.2), es

equivalente a
(x1 x + x2 y, y1x + yy2 x) = (0, 0)
Lo que a su vez se puede escribir en forma matricial como sigue

x1 x2 x 0
= (5.3)
y1 y2 y 0
En consecuencia, si v1 , v2 son linealmente independientes, el sistema homogéneo en (5.3)

tiene una única solución, lo cual implica que

x1 x2
det 6= 0.
y1 y2
Finalmente, como el determinante de una matriz es igual a el determinante de su matriz

transpuesta, tenemos que

x1 y1 x1 x2
det A = det = det 6= 0.
x2 y2 y1 y2
Se demostró que si v1 , v2 son linealmente independientes, entonces det A 6= 0, o equivalente-

mente, si det A = 0, entonces v1 , v2 son linealmente dependientes.
Teorema 5.4.3. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2 ) dos vectores de R2 . Entonces gen {v1 , v2 }
es una recta que pasa por el origen, si v1 , v2 son linealmente dependientes y es R2 , si v1 , v2
son linealmente independientes.
Corolario 5.4.4. Sean v1 = (x1 , y1 ) y v2 = (x2 , y2) dos vectores de R2 y A la matriz formada
por estos vectores, entonces
(a) gen {v1 , v2 } es una recta que pasa por el origen si sólo si det A = 0.
(b) gen {v1 , v2 } es R2 si sólo si det A 6= 0.
153
5.5. Interpretación geométrica de la independencia li-
neal en R3
Sean u, v y w tres vectores de R3 . Se define el triple producto escalar de estos vectores
como
w·u×v
En la figura 5.1 se muestra que si estos vectores son linealmente independientes determinan
un paralelepı́pedo.
u×v
h v
Figura 5.1: Construcción geométrica del triple producto escalar
Demostraremos que el volumen de este paralelepı́pedo es precisamente el valor absoluto

del triple producto escalar entre ellos.
Teorema 5.5.1. Sean u = (a1 , a2 , a3 ), v = (b1 , b2 , b3 ) y w = (c1 , c2 , c3 ) vectores no nulos de

R3 y A la matriz conformada por estos vectores:
a1 a2 a3
 
A =  b1 b2 b3 
c1 c2 c3
Entonces, det A 6= 0 si y sólo si u, v y w son linealmente independientes, más aún, si

det A 6= 0, los vectores determinan un paralelepı́pedo cuyo volumen está dado por
| det A| = |w · u × v|.
Demostración. Empecemos demostrando que
det A = w · u × v.
154
En efecto,
w · u × v = (c1 , c2 , c3 ) · (A11 , A12 , A13 )
= c1 A11 + c2 A12 + c3 A13 .
Entonces,
c1 c2 c3
 
w · u × v = c1 A11 + c2 A12 + c3 A13 = a1 a2 a3 

b1 b2 b3
Ahora, por la Propiedad 3 de los determinantes, Teorema 2.3.6, tenemos que
c1 c2 c3 a1 a2 a3 a1 a2 a3
     
a1 a2 a3  = −  c1 c2 c3  =  b1 b2 b3  = det A.
b1 b2 b3 b1 b2 b3 c1 c2 c3
Supongamos que los vectores u, v y w son linealmente dependientes. Entonces existen esca-
lares α1 , β1 y γ1 no todos cero tales que
α1 u + β1 v + γ1 w = 0.
Por ejemplo, si γ1 6= 0
w = αu + βv,
donde −α = α1 /γ1 y −β = β1/γ1. Con lo cual,

det A = w · u × v = (αu + βv) · u × v
= α(u · u × v) + β(v · u × v)
= 0.
Los otros dos casos surgen al suponer que α1 6= 0, o bien β1 6= 0 (ver el problema 5.10.12).
Demostramos que si los vectores u, v y w son linealmente dependientes, entonces det A =

0, pero esto es equivalente a decir que si det A 6= 0, entonces los vectores u, v y w son
linealmente independientes.
Recı́procamente, supongamos que
det A = w · u × v = 0.
Esto significa que el vector w es ortogonal al vector u × v, pero sabemos que este último
vector es el vector normal al plano generado por u y v. Es decir, w ∈ gen {u, v}, lo que cual
implica que existen escalares α y β tales que
w = αu + βv.
155
Ahora bien, si α y β son ambos cero, resulta que w = 0, lo cual contradice la hipótesis. Se
debe tener entonces que algunos de los escalares α o β es distinto de cero. Por lo tanto la
expresión
w − αu − βv = 0,
es una combinación lineal de los vectores u, v y w en la que no todos los escalares de la

combinación son cero, lo cual quiere decir que los vectores son linealmente dependientes.
Ahora bien, si det A 6= 0, entonces los vectores u, v y w son linealmente independientes,

por lo que ninguno de ellos puede ser un múltiplo escalar del otro. Por lo tanto, forman un
paralelepı́pedo (ver figura 5.1). Como se ve en esta gráfica, la altura del paralelepı́pedo es la
proyección escalar del vector w sobre el vector u × v, esto es,
h = k Proy wu×v k
|w · u × v|
=
ku × vk
Recordemos que ku × vk es igual al área del paralelogramos determinado por los vectores u
y v. Por lo que, si denotamos por V al volumen del paralelepı́pedo, encontramos que
V = ku × vkh
= |w · u × v|
= | det A|.
5.6. Bases y dimensión

Definición 5.6.1 (Base para un espacio vectorial). Un subconjunto finito de n vectores
B = {v1 , v2 , . . . , vn } es una base para un espacio vectorial V si
(a) B es linealmente independiente.
(b) gen B = V , esto es, B genera a V .
El espacio vectorial V es dimensión finita si tiene una base finita. De otro modo, V tiene
dimensión infinita.
Definición 5.6.2 (Dimensión de un espacio vectorial). Si espacio vectorial V tiene tiene

una base n elementos, el entero n se llama dimensión de V . Escribimos n = dim V
Teorema 5.6.1. Sea V espacio vectorial de dimensión finita n. Tenemos
156
(a) Cualquier conjunto linealmente independiente de V es un subconjunto de cierta base
para V .
(b) Cualquier conjunto de n elementos es una base para V .

Ejemplo 5.9. El conjunto B = {e1 , e2 , . . . , en }, donde
e1 = (1, 0, . . . , 0)
e2 = (0, 1, . . . , 0)
..
.
en = (0, 0, . . . , 1),
es una base para Rn . Los vectores e1 , e2 , . . . , en se denominan vectores coordenados uni-

tarios de Rn y el conjunto B es llamado base canónica de Rn .
Teorema 5.6.2. Sea H un subespacio de un espacio vectorial de dimensión n. Entonces
dim H ≤ n.
Teorema 5.6.3. Los únicos subespacios no triviales de R3 son las rectas y planos que pasan
por el origen.
Demostración. Por el Teorema 5.6.2 si H es un subespacio propio de R3 , entonces dim H = 1,
o bien, dim H = 2. Si dim H = 1, el subespacio H es una recta que pasa por el origen (ver el
problema 5.10.6). Ahora bien, si dim H = 2. Escogemos una base B = {v1 , v2 } de H. Como
el conjunto B es linealmente independiente, por Ejemplo 5.8 sabemos que gen B es un plano
que pasa por el origen. Como gen B = H el teorema está demostrado.
Ejemplo 5.10. Sean H y K subespacios de un espacio vectorial V . Demuestre que si H∩K =
{0}, entonces dim(H + K) = dim H + dim K.
Solución. Sea B1 = {v1 , . . . , vm } una base para H, y B2 = {w1 , . . . , wn } una base para
K. Demostraremos que B = {v1 , . . . , vm , w1 , . . . , wn } es una base para H + K. Primero que
todo nótese que como B1 ⊆ H y B2 ⊆ K, entonces B1 ∩ B2 ⊆ H ∩ K = {0}. Esto es,
B1 ∩ B2 ⊆ {0} (5.4)
Y dado que B1 , B2 son linealmente independientes ninguno de estos conjuntos contiene al

vector cero. Por lo tanto la única forma de que se mantenga la contenencia (5.4) es que
B1 ∩ B2 = ∅. Lo cual implica que los vectores que conforman la base B son todos diferentes,
es decir, el conjunto B está conformado por m + n vectores. Ahora, tomemos v ∈ H + K,
entonces existe h ∈ H y k ∈ K tales que v = h + k. Además, existen escalares α1 , . . . , αm
y β1 , . . . , βn que cumplen que
h = α1 v1 + · · · + αm vm , k = β1 w1 + · · · + βn wn .
157
Con lo cual,
v = α1 v1 + · · · + αm vm + β1 w1 + · · · + βn wn ,
Lo cual quiere decir que v ∈ gen B. Demostramos que H + K ⊆ gen B. La otra contenencia
se obtiene de manera similar para concluir que gen B = H + K .
Para demostrar la independencia lineal de B nótese que si w1 ∈ gen B1 , entonces
w1 = α1 v1 + · · · + αm vm ∈ H.
Con lo cual, w1 ∈ H ∩ K, contradiciendo de nuevo el hecho que H ∩ K = {0}. Por lo tanto,

w1 ∈
/ gen B1 , pero esto implica que el conjunto
{v1 , . . . , vm , w1 } ,
pues si
α1 v1 + · · · + αm vm + αm+1 w1 = 0,
y αm+1 6= 0, tendrı́amos que
w1 = (α1 /αm+1 )v1 + · · · + (αm /αm+1 )vm .
Contradiciendo el hecho que w1 ∈

/ gen B1 . Se debemos tener entonces que αm+1 = 0, con lo
que
α1 v1 + · · · + αm vm = 0,
y la independencia de B1 implica que α1 = · · · = αm = 0. De esta misma forma demostramos

que el conjunto
{v1 , . . . , vm , w1 , w2 } ,
es linealmente independiente, ya que w2 ∈ / gen B1 . Vemos de esta manera que podemos ex-
tender el conjunto B1 para formar el conjunto B de tal forma que este último sea linealmente
independiente, y ası́ demostrar que B es una base para H + K. Finalmente tenemos que
dim(H + K) = m + n = dim H + dim K.
Como se querı́a demostrar.
158
5.7. Cambio de base
5.8. Bases ortonormales y proyecciones en Rn
5.9. Espacios con producto interno
5.10. Problemas
Sección 5.1 Definición y propiedades de un espacio

vectorial
Problema 5.10.1. Demuestre que el conjunto de todas las funciones definidas y acotadas
en R es un espacio vectorial.
Problema 5.10.2. Demuestre que el conjunto de todas las funciones que satisfacen la ecua-
ción funcional
f (x) = f (x − 1),
para toda x ∈ R es un espacio vectorial
En los siguientes problemas, determinar si cada uno de los conjuntos dados es un espacio
vectorial real.
Problema 5.10.3. El conjunto de todos los polinomios de grado igual n.
Problema 5.10.4. Sea V el conjunto de todos los pares (x, y) de números reales, con las
operaciones de suma y producto por escalar definidas como sigue:
(x, y) + (x1 , y1 ) = (x + x1 , y + y1 ), λ(x, y) = (λx, y).
Sección 5.2 Subespacios de un espacio vectorial

Problema 5.10.5. Demuestre que el espacio vectorial de los números reales no tiene subes-
pacios propios.
Problema 5.10.6. Demuestre que los únicos subespacios propios R2 son las rectas que
pasan por el origen. Hallar la ecuación cartesiana de la recta. Demuestre además que todo
subespacio de dimensión 1 de R3 es una recta que pasa por el origen. Hallar la ecuación
paramétrica de dicha recta.
159
Problema 5.10.7. Sea V = Mn×n (R), ¿cuáles de los siguientes subconjuntos de V son
subespacios.
(a) El conjunto de todas las matrices invertibles.
(b) El conjunto de todas las A ∈ V tales que AB = BA, B es una matriz fija en V .
(c) Todas las matrices A tales que A2 = A.
Problema 5.10.8. Sean H1 , H2 dos subespacios de un espacio vectorial V . Entonces
(a) H1 ∪ H2 no es un subespacio de V .
(b) H := H1 + H2 = {v : v = v1 + v2 , v1 ∈ H1 , v2 ∈ H2 },
es un subespacio de V .
Problema 5.10.9 (**). Sea V el espacio vectorial de todas las funciones de R en R, sea Ve ,
el subconjunto de las funciones pares, f (x) = f (−x); sea V0 el subconjunto de las funciones
impares, f (−x) = −f (x).
(a) Demuestre que Ve y V0 son subespacios de V .
(b) Demuestre que V = Ve + V0 .
(c) Demuestre que Ve ∩ V0 = {0}.
Problema 5.10.10 (***). Sea H = {x ∈ Rn : x · n = 0}, donde n es un vector fijo no nulo

de Rn .
(a) Demuestre que H es un subespacio de Rn
(b) De una interpretación geométrica para los casos n = 2 y n = 3.
(c) Si H = {(x, y, z, w) : ax + by + cz + dw = 0}, donde abcd 6= 0. Demuestre que H es

un subespacio de Rn y encuentre una base para H.
(d) Encuentre la dimensión del subespacio H = {x ∈ Rn : x · n = 0}.
Sección 5.3 Combinación lineal y espacio generado

Problema 5.10.11. Sean v1 , v2 vectores de R2 . Hallar, gen {v1 , v2 } si,
(a) v1 , v2 son linealmente dependientes.
(b) v1 , v2 son linealmente independientes.
160
(c) v1 , v2 son linealmente independientes y los escalares de la combinación varı́an entre 0 y
1. ¿Qué representan los conjuntos hallados en (a),(b) y en (c)?
Sección 5.4 Independencia lineal

Problema 5.10.12. Demuestre que si los vectores u, v y u son linealmente dependientes,
entonces w · u × v = 0.
Problema 5.10.13. Demuestre que si los vectores v1 , . . . , vn son linealmente dependientes
en Rm y si vn+1 es cualquier otro vector en Rm , entonces el conjunto v1 , . . . , vn , vn+1 es
linealmente independiente.
Problema 5.10.14. Demuestre que si dos vectores no nulos v1 , v2 son ortogonales, entonces
el conjunto {v1 , v1 } es linealmente independiente.
Problema 5.10.15. Sea V el espacio vectorial de todas las funciones de R en R. Determinar
si cada uno de los siguientes subconjuntos de V es dependiente o independiente.
(a) {eax , xeax }.
(b) {1, eax , xeax }.
(c) {eax , xeax , x2 eax }.
(d) {1, cos 2x, sen2 x}.
(e) {ex cos x, e−x sen x}.
Sección 5.6 Bases y dimension

Problema 5.10.16 (**). Hallar la dimensión del espacio Dn de las matrices diagonales.
Problema 5.10.17 (**). Demuestre que el espacio Snn de las matrices simétricas de tamaño
n × n es un subespacio de Mn×n (R) el espacio de la matrices de tamaño n × n con estradas
en los reales. Hallar la dimensión del espacio Snn .
Problema 5.10.18 (*). Sea {v1 , . . . , vn } una base para un espacio vectorial V . Si
n
X
un := vi .
i=1
Demuestre que el conjunto {u1 , . . . , un } también es una base para V .

Problema 5.10.19 (***). Si H es un subespacio de un espacio vectorial de dimensión finita
V , demuestre que existe un único subespacio K de V tal que H ∩ K = {0} y H + K = V .
161
Capı́tulo 6
Transformaciones lineales
6.1. Definición y ejemplos

Definición 6.1.1 (Transformaciones lineales). Sean V y W espacios vectoriales reales. Una
transformación lineal es una función definida en V que toma valores en W y que satisface,
para cada u, v ∈ V y cada escalar α
T (u + v) = T (u) + T (v)
(6.1)
T (αu) = αT (u)
Las ecuaciones en (6.1) reciben el nombre de propiedades de linealidad.
En la sección 6.3 se estudian las transformaciones lineales de R2 en R2 , en especial el ope-

rador rotación. A continuación estudiamos otro importante de operador lineal denominado
transformación de proyección ortogonal
Ejemplo 6.1 (Operador proyección). Sea H un subespacio de Rn , y B = {u1 , . . . , uk } una

base ortonormal para H. La transformación de proyección ortogonal P : Rn → H se denota
por Proy vH y se define como
P (v) = Proy vH = (v · u1 )u1 + · · · + (v · uk )uk .
Consideremos el caso n = 3 y supongamos que queremos proyectar un punto v = (x, y, z) de

R3 sobre por ejemplo el plano xz. Tenemos que el plano xz está dado por
H = {(x, 0, z) : x, z ∈ R} .
Dado que
(x, 0, z) = (x, 0, 0) + (0, 0, z) = xi + zk,
162
Vemos que H es generado por la base ortonormal B = {i, k}. Por lo que
P (x, y, z) = Proy vH = ((x, y, z) · i))i + ((x, y, z) · k))k

= xi + zk
= (x, 0, z).
En cálculo vectorial para aplicar el Teorema de Stokes, en ciertas ocasiones es necesario

proyectar una curva C en el espacio sobre alguno de los tres planos coordenados. En el
Ejemplo 7.6.2 se encontró que la representación paramétrica de la curva de intersección de
las superficies 2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial
√
α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).
Γ
C
y
x
Figura 6.1: La proyección de la curva C, que es una circunferencia, sobre el plano xz es una
elipse.
Si queremos saber cuál es la proyección de la curva C sobre el plano xz, hallamos la

acción del operador T (x, y, z) = (x, 0, z) sobre la función α. Esto es,
√
T (α(t)) = T (1 + cos t, 1 − cos t, 2 sen t)
√
= (1 + cos t, 0, 2 sen t)
= β(t).
Vemos que la proyección está representada por una función vectorial

√
β(t) = (1 + cos t, 0, 2 sen t) = (x, y, z),
163
para hallar la ecuación cartesiana de dicha curva eliminamos el parámetro en la ecuaciones
paramétricas
√
x = 1 + cos t, z = 2 sen t,
de donde obtenemos
(x − 1)2 + z 2 /2 = cos2 t + sen2 t = 1
Para este caso la proyección es un elipse (ver la figura 6.1).
De forma análoga podemos demostrar que la proyección de la curva C sobre el plano yz

también es una elipse, mientras que al proyectar sobre el plano xy obtenemos una recta. (ver
el problema 6.7.2)
6.2. Núcleo e imagen de una transformación lineal

Definición 6.2.1. Sean V y W espacios vectoriales y T : V → W una transformación
lineal. Entonces el núcleo de T denotado por ker T , y la imagen de T denotada por R(T ) se
definen respectivamente por
ker T = {v ∈ V : T (v) = 0}
R(T ) = {T (v) : v ∈ V } .
Como puede demostrarse el ker T es un subespacio de V , y la imagen de T es un subes-

pacio de W .
Definición 6.2.2. Dados dos conjuntos V y W y una función T : V → W . Se dice que una
función S : T (V ) → V es inversa de T por izquierda si S[T (x)] = x para todo x ∈ V , esto
es,
ST = IV ,
donde IV es la transformación idéntica sobre V . Y
T (V ) := {T (v) : v ∈ V } .
Una función R : T (V ) → V es inversa de T por derecha si T [R(y)] = y para todo y ∈ T (V ),

esto es,
T R = IT (V ) ,
donde IT (V ) es la transformación idéntica sobre T (V ).
164
6.3. Teorema del cambio de variables en el plano (Op-
cional)
Teorema 6.3.1 (Teorema del cambio de variables en el plano). Sea T : R2 → R2 un
operador de C 1 en una región elemental G(las funciones componentes del operador T tienen
derivadas parciales de primer orden continuas en la región G) del plano uv. En la figura 6.2
se muestran el operador T y el operador S que es el operador inverso de T .
y v
2 2
R T
G
1 S 1
x u
1/2 1 2 1 2
Figura 6.2: El operador T deforma una región G en el plano uv para convertirla en una
región R en el plano xy, una medida de dicha deformación viene dada por el Jacobiano del
operador T
.
y supongase que T mapea de manera inyectiva la región G en una región R del plano xy,
siendo
T (u, v) = (g(u, v), h(u, v)) = (x, y).
Entonces si f : R → R es integrable tenemos que
ZZ ZZ
f (x, y)dxdy = f (g(u, v), h(u, v))|J(u, v)|dudv.
R G
El número J(u, v) denota el Jacobiano del operador T , el cual se define como

∂g ∂g
 
 ∂u ∂v 
∇g
J(u, v) := det = det 
 
∇h

 ∂h ∂h 
∂u ∂v
165
Un caso particular importante del Teorema anterior se da en el siguiente resultado
Teorema 6.3.2. Sea A un matriz de tamaño 2 × 2 con det A 6= 0 y T un operador dado por

x x
T =A . (6.2)
y y
Entonces T transforma paralelogramos en paralelogramos y vértices en vértices. Más aún, si

T (G) es un paralelogramo, G debe ser un paralelogramo.
Nota 6.3.1. Nótese que todo operador lineal de R2 en R2 viene dado en la forma (6.2).
En efecto, puesto que el operador T es lineal es suficiente con conocer su acción sobre los
elementos de alguna base para determinarlo completamente. Por ejemplo, si tomamos la base
canónica de R2 , B = {i, j}, y suponemos que T (i) = (a, b) y T (j) = (c, d) tenemos que
T (x, y) = T (xi + yj) = xT (i) + yT (j) = x(a, b) + y(c, d) = (ax + cy, bx + dy).

a c
La expresión anterior en forma matricial es (6.2) con A = . Observese además que
b d
si, J(x, y) = det A = ad − bc 6= 0, entonces el operador T es inyectivo, por lo tanto, si
T (G) = R, por el Teorema del cambio de variables tenemos que
ZZ
a(R) = dxdy
ZZ R
= |J(u, v)|dudv
ZZ G
= | det A|dudv
G
ZZ
= | det A| dudv
G
= | det A|a(G).
Ejemplo 6.2 (Coordenadas polares). Como un caso particular del Teorema 6.3.1, damos
una fórmula para integración en coordenadas polares. En este caso el operador T del plano
rθ al plano xy está dado por
x = g(r, θ) = r cos θ, y = h(r, θ) = r sen θ,
166
θ y
T R
β
G r=a r=b
α
β
r α x
a b
Figura 6.3: En el plano xy se muestra un rectángulo polar
si θ = k = cte, entonces,
y r sen k
= = tan k.
x r cos k
Es decir, tenemos una recta que pasa por el origen ypque forma un ángulo de k grados con
el eje x. Por otro lado, si r = k = cte, entonces, x2 + y 2 = k, una circunferencia con
centro en (0, 0) y radio k. De este forma, obtenemos el rectángulo polar en el plano xy que
se muestra en la figura 6.3. Además tenemos que
∂g ∂g
 
 ∂r ∂θ 
cos θ −r sen θ
J(r, θ) = det   = det = r.
 
 ∂h ∂h  sen θ r cos θ
∂r ∂θ
Entonces por el Teorema del cambio de variables obtenemos
ZZ ZZ
f (x, y)dxdy = f (r cos θ, r sen θ)|J(r, θ)|drdθ
R G
Z βZ b
= f (r cos θ, r sen θ)rdrdθ
α a
Para el caso más general en el que tengamos una región polar R de la forma
R = {(r, θ) : h1 (θ) ≤ r ≤ h2 (θ), α ≤ θ ≤ β}
tal como se muestra el la figura
167
R r = h2 (θ)
r = h1 (θ)
β
α
Figura 6.4: Para encontrar los lı́mites de integración en un cambio a coordenadas polares,
trazamos un rayo que atraviese la región R, vemos que este entra en una función polar de
ecuación r = h1 (θ) y sale en r = h2 (θ), si movemos este rayo empezando en θ = α hasta
θ = β barremos la región.
podemos hallar el área de la región R por un cambio a coordenadas polares, utilizando el

Teorema del cambio de variables, el Teorema de Fubinni y segundo Teorema fundamental del
cálculo.
ZZ
a(R) = dxdy
R
ZZ
= |J(r, θ)|drdθ
G
Z β Z h2 (θ)
= rdrdθ
α h1 (θ)
"Z #
Z β h2 (θ)
= rdr dθ
α h1 (θ)
Z β Z h2 (θ)
2
= r /2 dθ
α h1 (θ)
β
1 2
Z
h2 (θ) − h21 (θ) dθ.

=
α 2
Por lo tanto, como un caso particular del Teorema del cambio de variables, tenemos una
fórmula para calcular el área entre curvas en coordenadas polares
Z β
1 2
h2 (θ) − h21 (θ) dθ.

a(R) = (6.3)
α 2
168
Ejemplo 6.3 (Operador rotación). Un caso particular de operador lineal de R2 en R2 es el
operador rotación, cuya fórmula deducimos a continuación. Tomemos un vector (u, v) en
el plano uv con magnitud r y dirección α y supongamos que este vector gira un ángulo de θ
radianes en dirección contraria de las manecillas del reloj como se muestra en la figura 6.5.
(x, y)
r (u, v)
θ r
α
u
Figura 6.5: El vector (u, v) gira un ángulo θ en dirección contraria de las manecillas del reloj
Entonces la magnitud del vector (x, y), sigue siendo r, pero su dirección es α + θ. En
consecuencia,
x = r cos(α + θ)
= r cos α cos θ − r sen α sen θ
= u cos θ − v sen θ.
y = r sen(α + θ)
= r sen α cos θ + r cos α sen θ
= v cos θ + u sen θ.
Lo cual expresamos en forma matricial como sigue

x cos θu − sen θv cos θ − sen θ u
= =
y sen θu cos θv sen θ cos θ v
Con lo cual vemos que el operador rotación está definido en el plano uv, tomando valores en
el plano xy, y está dado por

u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
169
Dado que

cos θ − sen θ
det = 1 6= 0,
sen θ cos θ
si R = T (G), el Teorema del cambio de variables nos da

ZZ
a(R) = dxdy = | det A|a(G) = a(G).
R
El uso del operador rotación se ilustra en el problema 6.3.4.
Problema 6.3.3. Hallar el área del paralelogramo generado por los vectores A = (a, b) y
B = (c, d).
Solución. Este problema se puede resolver directamente, de forma cartesiana, o bien uti-
lizando el producto cruz. Para resolver el problema utilizando el Teorema del cambio de
variables la idea es definir un operador T que aplique el cuadrado unitario en el plano uv en
el paralelogramo R en el plano xy como se representa en la figura 6.6.
v y
j B
R
(x, y)
T b
G
A
u x
i
Figura 6.6: El operador T transforma el cuadrado unitario en un paralelogramo
La elección de la región G como el cuadrado unitario viene del hecho que todo punto
(x, y) en la región R se puede expresar como una combinación lineal de la forma
(x, y) = uA + vB
donde los escalares u, v pertenecen al intervalo [0, 1]. Entonces, según el Teorema 6.3.2 y lo
hecho en la Nota 6.3.1 debemos suponer que el operador T es lineal y que
T (i) = A, T (j) = B
170
Con lo cual, T (u, v) = T (ui + vj) = uT (i) + vT (j) = u(a, b) + v(c, d) = (au + cv, bu + dv).
Lo cual se expresa en forma matricial como

u a c u x
T = = .
v b d v y
Ahora como los vectores A y B son linealmente independientes resulta que

a c
det = ad − bc 6= 0,
b d
lo cual implica que el operador T es inyectivo. Más aún, demostraremos que R = T (G),
donde
T (G) = {T (u, v) : (u, v) ∈ G} ,
G = [0, 1] × [0, 1] = {(u, v) : 0 ≤ u ≤ 1, 0 ≤ v ≤ 1}
En efecto, tomemos (x, y) ∈ R, entonces existe (u, v) ∈ G tal que
(x, y) = u(a, b) + v(c, d) = T (u, v).
Esto es, (x, y) ∈ T (G). Por otro lado, si (x, y) ∈ T (G), entonces existe (u, v) ∈ G con
T (u, v) = (x, y), es decir (x, y) = u(a, b) + v(c, d), lo cual significa (x, y) ∈ R. Ahora, por lo
hecho el Nota 6.3.1 podemos podemos concluir que
a(R) = | det A|a(G) = | det A|12 = | det A|.
Problema 6.3.4. Hallar el área encerrada por la curva de ecuación
a2
x2 + xy + y 2 = , a > 0.
2
Solución. Para resolver este problema consideraremos los siguientes resultados
Teorema 6.3.5. La gráfica de la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
es una cónica o bien una cónica degenerada. Si es una cónica entonces es
(a) Una parábola si B 2 − 4AC = 0
171
(b) Una elipse si B 2 − 4AC < 0
(c) Una hipérbola si B 2 − 4AC > 0.
Teorema 6.3.6. Si B 6= 0, la ecuación
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (6.4)
se puede trasformar en la ecuación
Au2 + Cv 2 + Du + Ev + F = 0 (6.5)
donde A y C no son ambos cero, por una rotación de ejes en un ángulo de θ radianes para
el cual se cumple que:
A−C
cot 2θ = .
B
Para pasar de la ecuación (6.4) a la ecuación (6.5) utilizamos el operador rotación:

u cos θ − sen θ u x
T = = .
v sen θ cos θ v y
si queremos pasar del la ecuación (6.5) a la ecuación (6.4), utilizamos el operador inverso

x cos θ sen θ x u
S = = .
y − sen θ cos θ y v
Para nuestro caso tenemos que A = B = C = 1, D = E = 0 y F = −a2 /2. Con lo cual,
B 2 − 4AC = 1 − 4 < 0, luego por el Teorema 6.3.5, la cónica es una elipse. Ahora como
B = 1 6= 0, por el Teorema 6.3.6, la elipse está rotada y el ángulo de rotación satisface la
relación
A−C
cot 2θ = = 0,
B
de donde, cos 2θ = 0, esto es, θ = π/4. Por lo tanto, el operador rotación está dado por
√ √
u 1/ 2 −1/ 2, u x
T = √ √ = .
v 1/ 2 1/ 2 v y
De donde obtenemos las ecuaciones de transformación

1
x = √ (u − v)
2
1
y = √ (u + v).
2
172
Ahora consideremos la región
R := (x, y) : x2 + xy + y 2 ≤ a2 /2 ,

(6.6)
y supongamos que (x, y) ∈ ∂R. En tal caso tenemos que
a2 1 1 1 3 1
= x2 + xy + y 2 = (u − v)2 + (u − v)(u + v) + (u + v)2 = u2 + v 2 .
2 2 2 2 2 2
Es decir, 3u2 + v 2 = a2 . Concluimos que el operador T mapea una región G en el plano uv
en la región R en la plano xy dada por (6.6), donde
G := (x, y) : 3u2 + v 2 ≤ a2 .

(6.7)
Ver la figura de abajo.
v y
G S R
u x
Podemos ahora aplicar el Teorema de cambio de variables para concluir que

a π
Z Z Z
A(R) = dA = |J(u, v)|dudv = dudv = A(G) = π √ · a = √ a2 .
R G G 3 3
Ver el Problema 6.7.1.
173
6.4. Definición y propiedades
6.5. Representación matricial de una transformación

lineal
6.6. Isomorfismos
6.7. Problemas
x2 y 2
Problema 6.7.1 (**). Halle el área encerrada por la elipse 2 + 2 = 1. Sugerencia: Use
a b
el operador
T (u, v) = (au, bv) = (x, y).
Note que este operador mapea de manera inyectiva, el interior del circulo unitario en el plano
uv en el interior de la elipse en el plano xy.
Problema 6.7.2. En el Ejemplo 7.6.2 se encontró que la representación paramétrica de la

curva de intersección de las superficies
2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
viene dada por la función vectorial

√
α(t) = (1 + cos t, 1 − cos t, 2 sen t) = (x, y, z).
Utilizando el operador proyección demostrar que la proyección de la curva C sobre el plano

yz es una elipse, mientras que la proyección de C sobre el plano xy es una recta.
174
Capı́tulo 7
Formas canónicas elementales
7.1. Valores y vectores propios
7.2. Matrices semejantes y diagonalización
7.3. Matrices semejantes y diagonalización ortogonal
7.4. Formas cuadráticas
7.5. Problemas
Problema 7.5.1. Demostrar que
Z √
F · dα = π 3a2 ,
C
siendo F = (y, z, x) y C la curva de intersección entre la esfera x2 + y 2 + z 2 = a2 y el plano

x + y + z = 0, a > 0:
(a) Directamente,
(b) usando el teorema de Stokes.
Solución. Resolvamos primero el problema directamente. Los puntos sobre la curva de

intersección C satisfacen el sistema de ecuaciones
2
x + y 2 + z 2 = a2
x + y + z = 0.
175
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando z en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
a2 = x2 + y 2 + (−x − y)2 = 2x2 + 2xy + 2y 2 ,
o equivalentemente, x2 + xy + y 2 = a2 /2. Tenemos la ecuación cartesiana de una curva

proyectada sobre el plano xy y vemos que la curva es precisamente la elipse rotada del.
Demostramos en ese problema que esta elipse proviene de la elipse no rotada 3u2 + v 2 = a2
y que ambas elipses están relacionadas mediante la ecuaciones de transformación
1
x = √ (u − v)
2
(7.1)
1
y = √ (u + v).
2
a
Entonces tomemos u = √ sen t y v = a cos t, al variar t entre 0 y 2π parametrizamos
3
la frontera de la región G en dirección horaria (ver la figura al final. Ahora utilizando las
ecuaciones de transformación (7.1), obtenemos
a 1 a a
x = √ ( √ sen t − cos t) = √ sen t − √ cos t,
2 3 6 2
a 1 a a
y = √ ( √ sen t + cos t) = √ sen t + √ cos t.
2 3 6 2
Pero z = −x − y, entonces
2a
z = − √ sen t.
6
Por lo tanto,
a a a a 2a
α(t) = ( √ sen t − √ cos t, √ sen t + √ cos t, − √ sen t), 0 ≤ t ≤ 2π.
6 2 6 2 6
De este modo tenemos que C = α ([0, 2π]) = {α(t), 0 ≤ t ≤ 2π}.
176
Z
y = −x, z = 0
C
Ahora podemos empezar a calcular la integral.
dx a a
= √ cos t + √ sen t
dt 6 2
dy a a
= √ cos t − √ sen t
dt 6 2
dz 2a
= − √ cos t.
dt 6
a2 a2

dx a a a a
y = √ sen t + √ cos t √ cos t + √ sen t = sen 2t + √ .
dt 6 2 6 2 3 2 3
a2 a2

dy 2a a a
z = − √ sen t √ cos t − √ sen t = − sen 2t + √ sen2 t.
dt 6 6 2 6 3
a2 a2

dz a a 2a
x = √ sen t − √ cos t − √ cos t = − sen 2t + √ cos2 t.
dt 6 2 6 6 3
177
Entonces
Z Z
F · dα = ydx + zdy + xdz
C C
Z 2π
2
a2

a
= √ + √ dt
0 2 3 3
√ 2
= π 3a .
En la gráfica de abajo se muestra la curva de intersección C, junto con su proyección Γ

sobre el plano xy.
z
Efectuaremos la integración sobre la superficie C
S del plano x + y + z = 0 encerrada por la curva C.
Esto es, S = {(x, y, z) : x + y + z = 0, (x, y) ∈ T }, Γ
siendo, T = {(x, y) : x2 + xy + y 2 ≤ a2 /2}. y
x
7.6. Soluciones a algunos de los problemas

Problema 7.6.1. (Ver, [3, pag. 27, Problema 39]). Una inversionista afirma a su corredor
de bolsa que todas su acciones son de tres compañı́as, Delta, Hilton Hotels y McDonald’s y
que hace 2 dı́as su valor bajó $350 pero ayer aumentó $600. El corredor recuerda que hace
2 dı́as el precio de las acciones de Delta airlines bajó $1 por acción y el de las de Hilton
Hotels $1.50, pero el precio de las acciones de McDonald’s subió $0.50. También recuerda
que ayer el precio de la acciones Delta subió $1.50 por acción, el de las de Hilton Hotels bajó
otros $0.50 por acción y el de las de McDonald’s subieron $1. Demuestre que el corredor no
tiene suficiente información para calcular el número de acciones que tiene el inversionista
en cada compañı́a, pero que si ella dice que tiene 200 acciones de McDonald’s, el corredor
puede calcular el número de acciones que tiene en Delta y en Hilton.
Solución. Sean x, y y z el número de acciones que la inversionista tiene en Delta, Hilton

Hotels y McDonald’s respectivamente. El corredor recuerda que hace dos dı́as el precio de
las acciones de Delta airlines bajó $1 por acción. Por lo tanto, hace dos dı́as el precio de las
acciones Delta bajó x pesos. De manera similar el precio de las acciones de Hilton Hotels
3 1
bajó y pesos, y el precio de las acciones de McDonald’s subió z pesos. De donde tenemos
2 2
la ecuación
3 1
−x − y + z = −350.
2 2
178
Ahora, con la información que el corredor tiene sobre el dı́a de ayer, establecemos la ecuación
3 1
x − y + z = 600.
2 2
La matriz aumentada del sistema conformado por las dos ecuaciones anteriores es:

−1 −3/2 1/2 | −350
3/2 −1/2 1 | 600
Ahora aplicamos eliminación Gaussiana para obtener la forma escalonada por filas de la
matriz.
R1 → −6R1
−1 −3/2 1/2 | −350 6 9 −3 | 2100
R1 → −4R1
3/2 −1/2 1 | 600 −6 2 −4 | −2400
⇐⇒

6 9 −3 | 2100 R2 → R1 + R2 6 9 −3 | 2100
−6 2 −4 | −2400 ⇐⇒ 0 1 −7/11 | −300/11

6 9 −3 | 2100 R1 → −9R1 + R2 6 0 30/11 | 25800/11
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11
1
6 0 30/11 | 25800/11 R1 → R1 1 0 5/11 | 4300/11
6
0 1 −7/11 | −300/11 ⇐⇒ 0 1 −7/11 | −300/11
Volviendo de nuevo al sistema encontramos que

5 4300 7 300
x+ z= , y− z=− .
11 11 11 11
Se observa que z es la variable de ligamiento, por lo tanto si z = t. Entonces
4300 5 4300 − 5t 7 300 7t − 300
x= − t= , y = t− = , t ∈ R. (7.2)
11 11 11 11 11 11
Es decir, el sistema tiene infinitas soluciones reales dadas en la forma

 x = (4300 − 5t)/11
y = (7t − 300)/11
z = t, t ∈ R

179
Ahora despejando el parámetro t de la primera ecuación obtenemos
4300 − 11x
t= ,
5
Reemplazando este valor en la segunda ecuación nos da
7 4300 − 11x

300
y= − ,
11 5 11
o equivalentemente,
77x + 55y = 28600. (7.3)
Luego, tenemos una ecuación Diofántica con a = 77, b = 55 y c = 28600. Además, como
(77, 55) = 11 y 11|28600 por el Teorema 1.5.1 la ecuación tiene solución. Más aún, si el
corredor sabe que la inversionista tiene z = t = 200 acciones de McDonald’s, entonces
puede determinar que además posee x0 = (4300 − 5 · 200)/11 = 300 acciones de Delta, y
y0 = (7 · 200 − 300)/11 = 100 acciones de Hilton. Nótese que x0 = 300 y y0 = 100 es una
solución particular de la ecuación Diofántica (7.3). Por lo tanto una nueva aplicación del
Teorema 1.5.1 nos permite concluir que la solución general de la ecuación Diofántica es
55 77
x = 300 + k = 300 + 5k, y = 100 − k = 100 − 7k, k ∈ Z.
11 11
Pero
4300 − 11x 4300 − 11(300 + 5k)
z= = = 200 − 11k.
5 5
Concluimos que las soluciones enteras del problema son

 x = 300 + 5k
y = 100 − 7k
z = 200 − 11k, k ∈ Z

Con la restricción x, y, z ≥ 0. Luego,

2
x = 300 + 5k ≥ 0 ⇔ k ≥ −60, y = 100 − 7k ≥ 0 ⇔ k ≤ 100/7 = 14 + .
7
Por lo tanto, −60 ≤ k ≤ 14. Esto es, k = −60, −59, . . . , 0, 1, 2 . . . , 14. Por consiguiente, el
problema tiene en realidad finitas soluciones, más exactamente, tenemos 75 soluciones, una
por cada valor de k. Este número de soluciones pudo haber sido obtenido sin usar ecuaciones
Diofánticas como sigue: Dado que las variables x, y deben ser no negativas, de la forma
paramétrica de las soluciones dada en (7.2) se tiene que
4300 − 5t ≥ 0, 7t − 300 ≥ 0,
180
de donde
860 = 4300/5 ≤ t ≤ 300/7 = 42,857.
Esto es, 43 ≤ t ≤ 860. Ahora bien, como el denominador en las expresiones paramétricas
para x y y dadas en (7.2) es 11, para saber el número de la soluciones enteras del problema,
debemos
j 860 k contar los múltiplos de 11 presentes en el intervalo de 43 a 860. De 1 a 860 hay
= 78 múltiplos de 11
11
44 858
11(1), 11(2), 11(3), 11(4), . . . , 11(78).
Entonces, de 43 a 860 hay 78 − 3 = 75 múltiplos de 11. Lo que quiere decir que hay 75
soluciones enteras positivas del problema.
Problema 7.6.2 (***). Una partı́cula se desplaza sobre la curva de intersección de las
√
superficies x2 + y 2 + z 2 = 2x + 2y y x + y = 2 a una rapidez constante de 2 2m/s. La
partı́cula empieza se recorrido en el punto (2, 0, 0) y se mueve en el sentido contrario de las
manecillas del reloj, vista desde el origen. Encontrar el vector posición para esta partı́cula,
suponiendo que esta completa una revolución.
Solución. Los puntos sobre la curva de intersección C satisfacen el sistema de ecuaciones

2
x + y 2 + z 2 = 2x + 2y
x + y = 2.
Para parametrizar la curva C lo primero que debemos hacer es bajar una dimensión, esto
es, despejar una de las variables en alguna de la ecuaciones y reemplazarla en la otra, con
esto obtenemos la ecuación cartesiana de una curva Γ llamada proyección de la curva C
sobre alguno de los planos coordenados. Por ejemplo, despejando y en la ecuación del plano
y reemplazándola en la ecuación de la esfera obtenemos
(x − 1)2 + z 2 /2 = 1.
Tenemos la ecuación cartesiana de una curva proyectada sobre el plano xz, para este caso
una elipse. En la figura 7.2 se muestra esta curva en azul. Denotemos por Γ a el conjunto de
puntos en el espacio que están sobre esta elipse, esto es,
Γ = (x, y, z) : (x − 1)2 + z 2 /2 = 1, y = 0 .

181
z
plano x + y = 2
y
x
Figura 7.1: En rojo se muestra la trayectoria seguida por la partı́cula junto con su dirección.
Se advierte que desde nuestro punto de vista (opuesto al origen) se aprecia que la partı́cula
sigue la dirección de las manecillas del reloj.
√
Empecemos por parametrizar la curva Γ. Tomemos x−1 = cos t y y = 2 sen t. Entonces
√
β(t) = (1 + cos t, 0, 2 sen t), 0 ≤ t ≤ 2π.
Ası́,
Γ = β([0, 2π]) = {β(t) : t ∈ [0, 2π]} .
Γ
C
y
x
Figura 7.2: En azul se muestra la proyección Γ de la trayectoria C. Para este caso tenemos
una elipse proyectada sobre el plano xz.
Ahora para parametrizar la curva C, utilizamos el hecho de que x + y = 2 para todo
182
punto de C. Entonces y = 2 − x = 2 − (1 + cos t) = 1 − cos t. Con lo cual,
C = α([0, 2π]),
donde
√
α(t) = (1 + cos t, 1 − cos t, 2 sen t).
En la figura 7.1 vemos esta curva en rojo. Vemos que α(0) = (2, 0, 0). Esto es, la partı́cula
empieza su recorrido en el punto (2, 0, 0). Si la función α(t) representa la posición de la
√
partı́cula se debe cumplir que su rapidez kα′ (t)k = 2 2m/s. Sin embargo tenemos que
√
α′ (t) = (− sen t, sen t, 2 cos t),
√ √
de donde kα′ (t)k = 2 6= 2 2. Para encontrar el vector posición de la partı́cula debemos
hallar ω tal que
√
kγ ′ (t)k = 2 2.
√
donde γ(t) = α(ωt) = (1 + cos ωt, 1 − cos ωt, 2 sen ωt).
√
γ ′ (t) = (−ω sen ωt, ω sen ωt, 2ω cos ωt).
√ √ √ √
kγ ′ (t)k = 2 2 ⇔ ω 2 cos2 ωt + ω 2 cos2 ωt + 2ω 2 sen2 ωt = 2ω = 2 2.
Por lo tanto, ω = 2 y el vector posición de la partı́cula está dado por

√
γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t).
√
(1, 1, 2)
b C
b (0, 2, 0)
(2, 0, 0) b b
y
x
√ b
(1, 1, − 2)
Figura 7.3: A medida que crece el parámetro t crece de 0 a π, los puntos se distribuyen sobre
la curva de intersección C siguiendo la dirección de la opuesta a las agujas del reloj, vista
desde el origen
183
En el cuadro 7.1 se observa que la partı́cula tiene un periodo (tiempo en completar una
revolución) de π segundos
t x y z
0 2 0 0
√
π/4 1 1 2
π/2 0 2 0
√
3π/4 1 1 − 2
π 2 0 0
Cuadro 7.1: La partı́cula empieza su recorrido en el punto (2, 0, 0), pasado un tiempo de π
segundos regresa al mismo punto.
Conclusión: el vector posición de la partı́cula está dado por

√
γ(t) = (1 + cos 2t, 1 − cos 2t, 2 sen 2t), 0 ≤ t ≤ π.
184
Bibliografı́a
[1] T. M. Apostol, Calculus, vol. I (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1988, 813 pp.
[2] T. M. Apostol, Calculus, vol. II (2nd ed.), Editorial Reverté, S.A, Barcelona–Bogotá–
Buenos Aires–Caracas–México–Rio de Janeiro, 1980, 813 pp.
[3] S. I. Grossman, Álgebra lineal (5th ed.), McGraw–Hill, 1996, 634 pp.
[4] K. Hoffman and R. Kunze Linear algebra(2nd ed.), Prentice–Hall, Inc., Englewood
Cliffs, New Jersey, 1971, 407 pp.
[5] B. Kolman and D. R. Hill, Álgebra lineal (8th ed.), Pearson Educación, 2006, 643 pp.
[6] L. Leithold, El Cálculo(6a ed.), Harla, 1992, 1563 pp.
[7] J. Stewart, L. Redlin And S. Watson, Precálculo(5a ed.), Cengage Learning Editores,
2007, 933 pp.
[8] J. Stewart, Calculus(6th ed.), Thomson–Brook–cole, 2008, 1338 pp.
185

Mis Notas de Clase A.l-2 PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Mis Notas de Clase A.l-2 PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Álgebra lineal

David Ojeda Marulanda

5. Espacios vectoriales 144

7. Formas canónicas elementales 175

3. Existe un único elemento 0 (cero) en F tal que

4. Para cada x ∈ F existe un único elemento (−x) en F tal que

7. Existe un único elemento diferente de cero 1 (uno) en F tal que

9. La multiplicación es distributiva respecto a la adicción; esto es,

Ejemplo 1.2. Demostrar que el conjunto

con la suma y multiplicación usual de números reales es un campo

Solución. Nótese que como F ⊆ R, en particular se cumplen las leyes conmutativas y

Demostremos ahora los axiomas de cerradura. Esto es,

Sean z = a + bi y w = c + di dos números complejos, entonces

(a + bi) + (c + di) = (a + c) + (b + d)i,

(a + bi)(c + di) = ac + adi + bci + bdi2

Si tomamos z = a + bi y w = c + di, puesto que los números reales cumplen a su vez,

(a + bi)(x + iy) = (a + bi),

ax − by + (ay + bx)i = a + bi,

La última propiedad por verificar es la ley distributiva de la suma respecto a la multipli-

(d) m < 0, relación

Figura 1.2: Recta horizontal, vertical, positiva y negativa

Entonces por la fórmula (1.1) tenemos que

y − y0 = m(x − x0 ) (Fórmula punto-pendiente)

Ahora despejemos la variable y en la Fórmula punto-pendiente.

pongamos b = y0 − mx0 , obtenemos

Una relación de la forma dada en la Fórmula pendiente-intercepto es llamada función

(a) Determine la ecuación de costos, suponiendo que sea lineal.

(b) ¿Cuál es el costo de producir 20 artı́culos al dı́a?

y − 120 = 3(x − 25).

Teniendo ya la función de costos para cualquier número de artı́culos x, ponemos x = 20

Una ecuación de la forma

donde A, B y C son constantes y A y B no son simultáneamente iguales a cero es llamada

A continuación introduciremos las nociones de paralelismo y ortogonalidad de rectas.

Teorema 1.2.1. Sean l1 y l2 dos rectas con ecuaciones y = m1 x + b1 y y = m2 x + b2

Consideremos ahora en sistema

(a) Solución única (b) Sin solución (c) Infinitas solucio-

Figura 1.4: Opciones para la solución de un sistema de tamaño 2 × 2

Antes de dar algunos ejemplos, resumimos lo hecho en la sección en el siguiente resultado

Teorema 1.3.1. El sistema 

(a) Tiene solución única si y sólo si a11 a22 − a12 a21 6= 0.

Ejemplo 1.4. Demostrar que la distancia de la recta l = {(x, y) ∈ R2 : ax + by + c = 0} a

Figura 1.5: Distancia de un punto a una recta

Por la fórmula (1.2) tenemos que

d2mı́n = d2 (P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 . (1.6)

−bx1 + ay1 = ay0 − bx0 . (1.8)

ax1 + by1 = −c. (1.9)

a11 a22 − a12 a21 = −b(b) − a(a) = −(a2 + b2 ),

nótese que como a y b no son simultáneamente iguales a cero, a2 + b2 6= 0, por lo tanto,

En el sistema (1.12) se observa que podemos despejar la variable y1 al multiplicar la segunda

Existen cinco métodos para resolver sistemas de ecuaciones lineales de tamaño 2 × 2:

Solución. Sea x := el número de tazas que se debe fabricar en un dı́a de trabajo de 8

Despejando la variable x en la primera ecuación y reemplazandola en la segunda obtenemos

1.4. Sistemas de ecuaciones lineales de tamaño 3 × 3

Definición 1.4.1 (Matriz). Una matriz es un arreglo rectangular de números.

Una matriz con m filas y n columnas es llamada matriz de tamaño m × n. Utilizaremos

a11 a12 a13

A = a21 a22 a23 

lo cual es llamada matriz de coeficientes. Cuando se consideran los elementos (términos

a11 a12 a13 | b1

A continuación se enuncian las tres operaciones elementales con filas.

(a) Multiplicar (o dividir) una fila por un número diferente de cero.

(b) Sumar un múltiplo de una fila o otra fila.

(c) Intercambiar dos filas

Teorema 1.3.1. El sistema