ALyMD

218
Álgebra Lineal y Matemática Discreta (Actualizado para el curso 2014/2015) Gabriel Aguilera Venegas Pablo J. Cordero Ortega Francisco J. Rodríguez Sánchez La versión más actualizada puede obtenerse de https://sites.google.com/site/mathsengineering/home/algebra-lineal Esta obra está licenciada bajo la Licencia Creative Commons Atribución-NoComercial-CompartirIgual 3.0 Unported. Para ver una copia de esta licencia, visita http://creativecommons.org/licenses/by-nc-sa/3.0/. GRADOS EN I NGENIERÍA DE TELECOMUNICACIÓN UNIVERSIDAD DE MÁLAGA

description

mjhgf

Transcript of ALyMD

Page 1: ALyMD

Álgebra Linealy

Matemática Discreta(Actualizado para el curso 2014/2015)

Gabriel Aguilera VenegasPablo J. Cordero Ortega

Francisco J. Rodríguez Sánchez

La versión más actualizada puede obtenerse dehttps://sites.google.com/site/mathsengineering/home/algebra-lineal

Esta obra está licenciada bajo la Licencia Creative CommonsAtribución-NoComercial-CompartirIgual 3.0 Unported.

Para ver una copia de esta licencia, visitahttp://creativecommons.org/licenses/by-nc-sa/3.0/.

GRADOS EN INGENIERÍA DE TELECOMUNICACIÓN

UNIVERSIDAD DE MÁLAGA

Page 2: ALyMD
Page 3: ALyMD

Índice general

1. Matrices y Sistemas de Ecuaciones Lineales 11.1. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Equivalencia de matrices . . . . . . . . . . . . . . . . . . . . . 81.3. Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . 15Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2. Estructuras Algebraicas 252.1. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.3. Estructuras algebraicas . . . . . . . . . . . . . . . . . . . . . . 362.4. El cuerpo de los números complejos . . . . . . . . . . . . . . 44Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3. Técnicas de Recuento 613.1. Principios básicos . . . . . . . . . . . . . . . . . . . . . . . . . 623.2. Permutaciones y combinaciones . . . . . . . . . . . . . . . . . 643.3. Principio de inclusión y exclusión . . . . . . . . . . . . . . . . 733.4. Particiones y números de Stirling . . . . . . . . . . . . . . . . 763.5. Ecuaciones de Recurrencia . . . . . . . . . . . . . . . . . . . . 78Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4. Espacios vectoriales 974.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . 974.2. Subespacios vectoriales . . . . . . . . . . . . . . . . . . . . . . 1014.3. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . . . . 1054.4. Operaciones con subespacios . . . . . . . . . . . . . . . . . . 1094.5. Espacios cocientes . . . . . . . . . . . . . . . . . . . . . . . . . 113Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5. Aplicaciones lineales 1175.1. Definición y propiedades . . . . . . . . . . . . . . . . . . . . . 1185.2. Representación matricial de una aplicación lineal . . . . . . . 1265.3. Matrices semejantes y endomorfismos . . . . . . . . . . . . . 1325.4. Teorema de diagonalización . . . . . . . . . . . . . . . . . . . 136

III

Page 4: ALyMD

IV ÍNDICE GENERAL

5.5. Aplicaciones de la diagonalización . . . . . . . . . . . . . . . 140Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 144

6. Formas bilineales y Producto escalar 1496.1. Formas bilineales . . . . . . . . . . . . . . . . . . . . . . . . . 1506.2. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . 1556.3. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . 1586.4. Subespacios ortogonales . . . . . . . . . . . . . . . . . . . . . 1696.5. Diagonalización ortogonal . . . . . . . . . . . . . . . . . . . . 1716.6. Diagonalización de formas cuadráticas . . . . . . . . . . . . . 174Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 183

7. Geometría 1897.1. El Espacio afín . . . . . . . . . . . . . . . . . . . . . . . . . . . 1897.2. El espacio afín euclídeo . . . . . . . . . . . . . . . . . . . . . . 195Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . 207

Índice alfabético 209

Page 5: ALyMD

TEMA 1

MATRICES Y SISTEMAS DEECUACIONES LINEALES

Índice1.1. Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1. Operaciones con matrices . . . . . . . . . . . . . 31.1.2. Determinantes . . . . . . . . . . . . . . . . . . . . 41.1.3. El Anillo de matrices cuadradas . . . . . . . . . . 6

1.2. Equivalencia de matrices . . . . . . . . . . . . . . . . . . 81.2.1. Matrices escalonadas . . . . . . . . . . . . . . . . 81.2.2. Transformaciones y matrices elementales . . . . 91.2.3. Cálculo del rango y de la inversa . . . . . . . . . 121.2.4. Descomposición LU . . . . . . . . . . . . . . . . 13

1.3. Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . 151.3.1. Teorema de Rouché-Fröbenius . . . . . . . . . . 161.3.2. Resolución de sistemas . . . . . . . . . . . . . . . 17

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 21

1.1. Matrices

Veremos en el próximo capítulo el concepto algebraico de cuerpo. Demomento nos será suficiente entender que cuando decimos cuerpo K nosestamos refiriendo a los números reales, es decir (K = R) o a los númeroscomplejos K = C, dotados con las operaciones de suma y de producto, consus conocidas propiedades (asociativas, conmutativas, distributivas, etc.).

1

Page 6: ALyMD

2 Matrices y Sistemas de Ecuaciones Lineales

Definición 1.1. LlamamosSi n = 1 decimos que esuna matriz columna, si

m = 1 una matriz fila. Sim = n es una matriz

cuadrada.

matriz A de orden m× n sobre un cuerpo K, am · n elementos del cuerpo dispuesto en una tabla de la forma

A =

a11 a12 . . . a1n...

.... . .

...am1 am2 . . . amn

= (aij)i = 1, 2, . . . , mj = 1, 2, . . . , n

Al conjunto de todas las matrices de orden m × n sobre K lo expresamosMm×n(K). Normalmente trabajaremos con el cuerpo de los reales K = R

y, más ocasionalmente, el cuerpo de los complejos K = C. Generalmentesobreentenderemos el cuerpo y expresaremos este conjunto comoMm×n.

Matriz traspuesta Si A = (aij) ∈ Mm×n llamamos matriz transpuesta deA a

AT = (aTij) = (aji) ∈ Mn×m

Es decir, intercambiamos filas y columnas. Claramente se tiene(AT)T

= A

Por ejemplo, si A =

(1 2 34 5 6

), entonces AT =

1 42 53 6

.

Diagonal principal Dada A = (aij) ∈ Mm×n, llamamos diagonal princi-pal a los elementos de la forma aii. Aquí señalamos la diagonal principal en

la matriz A de orden 2× 3 anterior:(

1 2 34 5 6

)

Matrices triangulares y diagonales

Decimos que una matriz U = (uij) es triangular superior cuando loselementos que están debajo de la diagonal son todos ceros, es decir,uij = 0 para todo i > j.

Decimos que una matriz L = (lij) es triangular inferior cuando loselementos que están encima de la diagonal son todos ceros, es decir,uij = 0 para todo i < j.

Decimos que una matriz D = (dij) es diagonalLas matrices diagonalesdonde todos los elementos

de la diagonal son elmismo elemento se llaman

matrices escalares.

si es triangular superiore inferior, es decir: i 6= j =⇒ dij = 0.

Ejercicio 1.2. Construye matrices triangulares de todo tipo: inferiores, superioresy diagonales (cuadradas y no cuadradas).

En caso de matrices cuadradas tenemos las siguientes definiciones:

Page 7: ALyMD

1.1 Matrices 3

Matrices simétricas. Una matriz A es simétrica cuando si AT = A. Las matrices simétricas yantisimétricasnecesariamente sonmatrices cuadradas.¿Porqué?

Matrices antisimétricas. Una matriz A es antisimétrica cuando AT = −A.

Traza. Es la suma de los elementos de la diagonal principal.

tr(A) =n

∑i=1

aii = a11 + a22 + · · ·+ ann

Definición 1.3. Llamamos matriz identidad Claramente, la matrizidentidad es un ejemplode matriz escalar.

de orden n, In, a la única matrizdiagonal n× n cuyos elementos en la diagonal principal son todos unos.

I2 =

(1 00 1

), I3 =

1 0 00 1 00 0 1

, . . . , In =

1 0 . . . 00 1 . . . 0...

.... . .

...0 0 . . . 1

, . . .

1.1.1. Operaciones con matrices

Producto de matrices Si A ∈ Mm×n(K) y B ∈ Mn×p(K), se define C =A · B como la matriz de orden m× p tal que

cij =n

∑k=1

aikbkj = ai1b1j + ai2b2j + · · ·+ ainbnj.

Ejercicio 1.4. Define tres matrices reales: A ∈ M3×2, B ∈ M2×2 y C ∈ M2×1y comprueba la propiedad asociativa (A · B) · C = A · (B · C).

Es fácil probar que el producto de matrices no es conmutativo. Ademásel producto, respecto a la traspuesta cumple la siguiente

Proposición 1.5. Si A y B son matrices multiplicables entonces

(A · B)T = BT · AT

Demostración. Sea A · B = C = (cij = ∑nk=1 aikbkj).

Entonces (A · B)T = (cji) =(∑n

k=1 ajkbki).

Por otro lado, BT · AT =(

∑nk=1 bT

ikaTkj

)=(∑n

k=1 bkiajk)= (A · B)T. �

Ejercicio 1.6. Prueba que, para cualquier matriz A, las matrices B = AAT yC = AT A son simétricas.

Page 8: ALyMD

4 Matrices y Sistemas de Ecuaciones Lineales

Operaciones vectoriales El conjuntoMm×n se puede dotar de suma y deproducto externo por elementos del cuerpo, así:La suma de matrices es,

por tanto, una sumaelemento a elemento y elproducto de un número

por una matriz esmultiplicar cada elemento

de la matriz por dichonúmero.

A + B = (aij) + (bij) = (aij + bij)λ · A = λ · (aij) = (λaij)

Proposición 1.7. Si A, B ∈ Mm×n(K) son matrices y λ ∈ K es un número,entonces:

1. (A + B)T = AT + BT

2. (λA)T = λAT

Demostración. Es evidente con más que aplicar las definiciones. �

Ejercicio 1.8. Prueba que si A es una matriz cuadrada, entonces la matriz A+ AT

es simétrica y la matriz A− AT es antisimétrica.Usa lo anterior para probar que toda matriz cuadrada se puede expresar como

suma de una matriz simétrica y otra antisimétrica.

1.1.2. Determinantes

Dada una matriz cuadrada A = (aij) ∈ Mn definimos el determinantede A como

det A = |A| = ∑α∈Sn

(−1)sg(α)a1j1 a2j2 . . . anjn

siendo α =

1→ j12→ j2

...n→jn

cada una de las permutaciones y donde sg(α) de-

nota el número de inversiones de α o, lo que es lo mismo, el número deveces que hay que intercambiar elementos de las imágenes en la identidad

1→12→2

...n→n

para conseguir α.

Ejemplo 1.9. Para calcular el determinante de A =

a11 a12 a13a21 a22 a23a31 a32 a33

calcu-

lamos, en primer lugar, el conjunto S3 de todas las permutaciones de treselementos:

S3 =

1→12→23→3

,

1→22→13→3

,

1→32→23→1

,

1→12→33→2

,

1→32→13→2

,

1→22→33→1

Page 9: ALyMD

1.1 Matrices 5

Calculamos ahora sg(α) para cada α ∈ S3 y obtenemos 0, 1, 1, 1, 2 y 2 res-pectivamente. El determinante de A es, por tanto,∣∣∣∣∣∣

a11 a12 a13a21 a22 a23a31 a32 a33

∣∣∣∣∣∣ == a11a22a33 − a12a21a33 − a13a22a31 − a11a23a32 + a13a21a32 + a12a23a31

El problema que tiene la definición anterior es que hace tedioso (en lapráctica no factible) el cálculo determinantes de orden superior, ya que

|S4| = 4! = 24, |S5| = 5! = 120, |S6| = 6! = 720, . . .

Para facilitar el cálculo del determinante usaremos las siguientes propieda-des (no se prueban):

Propiedades de los determinantes

1. El determinante de una matriz diagonal o triangular es el productode los elementos de la diagonal principal.

2. |A| = |AT|.

3. |A · B| = |A| · |B|.

4. Al intercambiar dos filas (o columnas) el determinante cambia designo.

5. Si dos filas (o columnas) son iguales, el determinante es cero.

6. Si una fila (o columna) es de ceros, el determinante es cero.

7. Si multiplicamos una fila (o columna) por un escalar λ, el determi-nante queda multiplicado por λ.

8. Si una fila (o columna) es combinación lineal de las restantes, el de-terminante es cero.

9. Si cambiamos la fila (o columna) Ai por Ai + λAj, el determinante nocambia.

Ejercicio 1.10. Usa las propiedades 4 y 9 y 1 para calcular el siguiente determi-nante: ∣∣∣∣∣∣∣∣

2 3 0 41 3 0 30 0 1 10 0 1 0

∣∣∣∣∣∣∣∣ = · · · = −∣∣∣∣∣∣∣∣1 3 0 30 −3 0 −20 0 1 10 0 0 −1

∣∣∣∣∣∣∣∣ = −3

Page 10: ALyMD

6 Matrices y Sistemas de Ecuaciones Lineales

Menor. Llamamos menor de una matriz a cualquier determinante que sepueda obtener eliminando filas y/o columnas de dicha matriz.

Ejemplo 1.11. Consideremos la matriz A =

1 −1 2 −23 −3 6 −65 −5 4 −4

enton-

ces, eliminando la primera 1 y las columnas 2 y 3, el menor obtenido es

M =

∣∣∣∣3 −65 −4

∣∣∣∣ = −12 + 30 = 18

Adjuntos o cofactores. Dada una matriz cuadrada A ∈ Mn llamaremosadjunto o cofactor del elemento aij al resultado de multiplicar (−1)i+j por elmenor obtenido al eliminar la fila i y la columna j de la matriz A. Se acos-tumbra a expresar por Aij al adjunto del elemento aij.

El siguiente resultado (que no probaremos) nos da un método para calcu-lar el determinante de cualquier matriz cuadrada, que se denomina métodode desarrollo por adjuntos de una fila (o una columna).

Teorema 1.12. Dada una matriz cuadrada A ∈ Mn, para todo k ∈ {1, ..., n} setiene que

|A| = a1k A1k + a2k A2k + · · ·+ ank Ank =

= ak1Ak1 + ak2Ak2 + · · ·+ akn Akn

Ejercicio 1.13. Calcula de nuevo el determinante del ejercicio 1.10 desarrollandopor la cuarta fila. Haz lo mismo por la tercera columna.

1.1.3. El Anillo de matrices cuadradas

En el conjunto de matrices cuadradasMn×n(K) =Mn el producto dematrices es una operación interna asociativa, con elemento neutro (In) yno conmutativa, que distribuye con la suma, por tanto, (Mn,+, ·) es unaanillo (no conmutativo) unitario (véase 41).

Matriz inversa Si una matriz A es regular, entonces tiene simétrico res-pecto al producto (inversa) A−1 y, por tanto, es una matriz invertible. Lasmatrices que no son invertibles se denominan matrices singulares.

Definición 1.14 (Matriz adjunta). Llamaremos matriz adjunta de una ma-triz cuadrada A a la matriz formada al sustituir cada elemento de A por suadjunto.

adj A = (Aij)

Page 11: ALyMD

1.1 Matrices 7

Ejemplo 1.15. Si A =

(1 23 4

)entonces adj A =

(4 −3−2 1

).

Ejercicio 1.16. Calcula la matriz adjunta de B =

1 2 3−1 −2 −3

4 −5 6

.

La matriz adjunta nos permite el cálculo de la matriz inversa. El desa-rrollo del determinante por adjuntos nos da el siguiente resultado:

Proposición 1.17. Si A es una matriz cuadrada, entonces

A · adj(AT) =

det A 0 . . . 0

0 det A . . . 0...

...0 0 . . . det A

= det A · In

Nota. Dicho de otro modo, al multiplicar una matriz cuadrada por la ma-triz adjunta de su traspuesta nos da una matriz escalar (véase nota al Ejem-plo 1.3 en página 3) formada por el det A. También es fácil de comprobarque la matriz adjunta de la matriz traspuesta es igual que la matriz tras-puesta de la adjunta, es decir, adj(AT) = (adj A)T.

De lo anterior se deduce que si una matriz tiene determinante no nulo,podemos dividir por él y obtenemos una expresión de la matriz inversa.

Teorema 1.18. Una matriz cuadrada A es invertible si y solo si su determinantedet A = |A| 6= 0. Además se cumple

A−1 =adj(AT)

|A|

A partir del anterior teorema es evidente el siguiente

Corolario 1.19. Si A es una matriz invertible, entonces AT también lo es y(AT)−1

=(

A−1)T

Ejercicio 1.20. Calcula la inversa de las matriz A del ejemplo 1.15 y de la matrizB del ejercicio 1.16.

Nota. Como se verá en el tema más adelante (proposición 2.34 en página 38) entodo anillo el elemento simétrico (inverso) es único, por tanto la inversa de unamatriz es única. Además se verifica

(A · B)−1 = B−1 · A−1 (1.1)

Ejercicio 1.21. Da dos matrices cuadradas reales y comprueba la igualdad (1.1)anterior.

Page 12: ALyMD

8 Matrices y Sistemas de Ecuaciones Lineales

1.2. Equivalencia de matrices

Dos matrices A, B ∈ Mm×n se dice que son

equivalentes por filas si y solo si existe una matriz invertible Q ∈ Mmtal que

B = Q−1 · ANota. Conviene considerar la inversa Q−1 como se justificará mas adelante (teore-ma 5.30).

equivalentes por columnas si y solo si existe una matriz invertible P ∈Mn tal que

B = A · P

equivalentes (a secas) si y solo si existen matrices invertibles Q ∈ Mmy P ∈ Mn tales que

B = Q−1 · A · P

Observaciones:

1. Si dos matrices son equivalentes por filas (o por columnas) entoncesson equivalentes. Esto es evidente, puesto que

B = Q−1 · A⇒ B = Q−1 · A · In

En cambio dos matrices equivalentes no tienen por que ser equiva-lentes por filas ni por columnas.

2. En el conjunto de las matrices de orden m× n las tres relaciones ante-riores son de equivalencia.

Ejercicio 1.22. Comprueba las propiedades reflexiva, simétrica y transitiva de unade estas tres relaciones (las otras se prueban de forma similar).

1.2.1. Matrices escalonadas

Dada una matriz m × n llamamos cabecera de fila (columna) al primerelemento no nulo de la fila (columna) si existe. En caso de no existir unacabecera de fila (columna) es porque la fila (columna) es de ceros.

Definición 1.23. Diremos que una matriz es escalonada por filas si cumplelas tres condiciones siguientes:

1. Las filas de ceros, si existen, están todas al final.

2. La cabecera de una fila siempre está más a la derecha que la cabecerade la fila precedente.

Page 13: ALyMD

1.2 Equivalencia de matrices 9

Cambiando “filas” por “columnas” y “derecha” por “debajo” en esta defi-nición obtenemos la definición de escalonada por columnas.

Ejemplo 1.24.

Matriz escalonada por filas Matriz escalonada por columnas0 −1 0 2 30 0 0 1 00 0 0 0 4

2 0 02 0 03 1 0

Definición 1.25. Diremos que una matriz es escalonada reducida por filas sicumple:

1. Es escalonada por filas.

2. Cada cabecera de fila es el único elemento no nulo de su columna.

3. Cada cabecera de fila es un 1.

Cambiando “filas” por “columnas” en esta definición obtenemos la defini-ción de escalonada reducida por columnas.

Ejemplo 1.26. Las matrices del ejemplo 1.24 no son escalonas reducidas.Las siguientes sí lo son.

Matriz Matriz escalonadaescalonada reducida por filas reducida por columnas0 1 −1 0 0

0 0 0 1 00 0 0 0 1

1 0 02 0 00 1 0

La siguiente proposición simplifica las cosas.

Proposición 1.27. Una matriz A es escalonada (reducida) por filas si y solo si latraspuesta AT es escalonada (reducida) por columnas.

Demostración. Es evidente. �

1.2.2. Transformaciones y matrices elementales

Las transformaciones elementales son operaciones efectuadas a las filas(o columnas) de una matriz de orden m× n de forma que la nueva matrizobtenida es equivalente por filas (o columnas) a la anterior.

Las matrices elementales son el resultado de aplicar una transformaciónelemental por filas (o columnas, da igual) a la matriz identidad.

Page 14: ALyMD

10 Matrices y Sistemas de Ecuaciones Lineales

Transformación elemental por filas(igual por columnas)

Matriz elemental(Ejemplo)

Tipo I Intercambiar la fila i por la j (i 6= j)Fi ←→ Fj

1 0 00 0 10 1 0

Tipo II Multiplicar la fila i por un elemento

α 6= 0 Fi ←→ αFi

1 0 00 1 00 0 α

Tipo III Sumar a la fila i la fila j multiplicada

por un elemento α (i 6= j) Fi ←→Fi + αFj

1 0 00 1 00 α 1

Cuadro 1.1: Transformaciones y matrices elementales.

Ejemplo 1.28. En el cuadro 1.1 exponemos los tres tipos de transformacio-nes elementales y ejemplos correspondientes de matrices elementales.

Una trasformación elemental por filas (columnas) en una matriz A es elresultado de multiplicar a la izquierda (derecha) de dicha matriz por la co-rrespondiente matriz elemental del mismo tipo. Luego las transformacioneselementales por filas (columnas) nos dan matrices equivalentes por filas (colum-nas).

Ejercicio 1.29. Sean las matrices

A =

1 23 45 6

, E1 =

0 0 10 1 01 0 0

y E2 =

(1 −20 1

)(E1 y E2 son de tipo I y III, respectivamente)

Calcula los productos E1 · A y A · E2. Fíjate bien y observa que hacen estos pro-ductos (el primero sobre las filas de A y el segundo sobre las columnas de A).

Proposición 1.30. Las matrices elementales son todas invertibles y su inversa esotra escalonada del mismo tipo.

Demostración. Es trivial comprobar que las matrices elementales tienen to-das determinantes no nulos. Concretamente, si E1, E2(α) y E3 son matriceselementales de tipo I, II y III, respectivamente, los determinantes son:

det E1 = −1det E2(α) = α 6= 0

det E3 = 1

Page 15: ALyMD

1.2 Equivalencia de matrices 11

sin más que desarrollar convenientemente el determinante por adjuntospor una columna.

Con un poco más de atención se puede comprobar que la inversa decada una de ellas es también elemental y del mismo tipo. Así E−1

1 = E1,E2(α)−1 = E2(

1α ) e, igualmente, dejamos al alumno que piense cómo es la

inversa de una matriz elemental de tipo III. �

Ejercicio 1.31. Siguiendo la proposición anterior, calcula las inversas de las si-guientes matrices:

E1 =

0 1 01 0 00 0 1

E2 =

1 0 00 3 00 0 1

E3 =

1 0 −30 1 00 0 1

Rango de una matriz

Llamaremos combinación lineal de filas (o columnas) f1, . . . , fk a una expre-sión de la forma

a1 f1 + a2 f2 + · · ·+ ak fk

donde a1, a2, . . . , ak ∈ K.Diremos que un conjunto de filas (o columnas) de una matriz son li-

nealmente independientes si ninguna de ellas se puede expresar como combi-nación lineal de las demás. En caso contrario se dice que son linealmentedependientes.

Ejemplo 1.32. Dada la matriz

1 1 2 00 1 1 11 0 1 1

podemos asegurar que sus

filas son linealmente independientes mintras que sus columnas no lo son(son linealmente dependientes) ya que la tercera es suma de las dos prime-ras (C3 = C1 + C2).

Rango por filas y rango por columnas Llamaremos rango por filas (colum-nas) de una matriz al máximo número de filas (columnas) linealmente in-dependientes.

Teorema 1.33. El rango por filas y el rango por columnasde cualquier matrizcoinciden. A dicho valor lo llamos rango de la matriz.

Teorema 1.34. El rango de una matriz coincide con el orden del mayor menordistinto de cero de la matriz.

Ejercicio 1.35. Calcula el rango de las matrices de los ejemplos 1.11 y 1.32.

Page 16: ALyMD

12 Matrices y Sistemas de Ecuaciones Lineales

Métodos de Gauss y Gauss-Jordan

Los siguientes teoremas son el núcleo de las secciones siguientes y sepueden probar (aunque no lo haremos) de forma algorítmica. Se corres-ponden con los llamados método de Gauss y método de Gauss-Jordan.

Teorema 1.36. Toda matriz de orden m× n distinta de la matriz 0 es equivalentepor filas (columnas) a una matriz escalonada por filas (columnas).

Teorema 1.37. Toda matriz de orden m× n distinta de la matriz 0 es equivalentepor filas (columnas) a una única matriz escalonada reducida por filas (columnas).

1.2.3. Cálculo del rango de una matriz y de la matriz inversa (porel método de Gauss)

Las matrices escalonadas tienen un rango especialmente fácil de calcu-lar, puesto que es el número de filas (o de columnas) que no son nulas.Además, las transformaciones elementales mantienen el rango, por tanto:

Teorema 1.38. Dos matrices equivalentes tienen el mismo rango.

Ejemplo 1.39. Si aplicamos operaciones elementales por filas a la matriz Adel ejemplo 1.111 −1 2 −2

3 −3 6 −65 −5 4 −4

! 1 −1 2 −2

0 0 −6 60 0 0 0

que nos dice (sin calcular ningún determinante) que el rango es 2.

Ejercicio 1.40. Calcula el rango de la siguiente matriz1 −1 0 −23 −3 6 −65 −5 4 −42 −2 −2 2

Cálculo de la matriz inversa

Los teoremas 1.37 y 1.38 nos permite llegar a la conclusión de que unamatriz invertible es equivalente por filas (o por columnas) a la matriz iden-tidad del mismo orden, es decir, si A es una matriz cuadrada de orden n derango también n, entonces por transformaciones elementales

APor filas! I

o, lo que es lo mismo, podemos encontrar una sucesión de matrices ele-mentales E1, E2, . . . Ek tales que

Page 17: ALyMD

1.2 Equivalencia de matrices 13

Ek·Ek−1 · · ·E2·E1·A= I

Aplicando la propiedad asociativa del producto de matrices

(Ek · Ek−1 · · · E1) · A = I⇒ A−1 = Ek · Ek−1 · · · E1

Si representamos (A|B) la matriz ampliada, es decir, la matriz obtenidaañadiendo a las columnas de A las columnas de B, en la práctica se obtienela inversa siguiendo el procedimiento que se expresa en este diagrama

(A | I)Por filas (E1 · A | E1 · I)

Por filas (E2 · E1 · A | E2 · E1)Por filas · · ·

Por filas (I|A−1)

Ejemplo 1.41. Si A =

0 −1 −23 2 18 7 6

vamos a intentar calcular su inversa

por este método. 0 −1 −23 2 18 7 6

1 0 00 1 00 0 1

Por filas

1 0 −1 4 −5 20 1 2 4 −8 30 0 0 5 −8 3

y vemos que A no es invertible puesto que su rango es menor que 3.

Ejemplo 1.42. Aquí vemos el resultado de aplicar el método a una matrizde orden 4. Son cálculos laboriosos, pero si tienes suficiente tiempo y pa-ciencia puedes intentar el método de los determinantes y comparar

0 −1 −2 −153 2 3 −128 7 6 −7

15 12 7 0

1 0 0 00 1 0 00 0 1 00 0 0 1

Por filas

1 0 0 00 1 0 00 0 1 00 0 0 1

− 61240

2930 − 89

807

1512 − 3

232 − 1

2− 5

1612 − 3

16 0− 7

120130 − 3

401

30

1.2.4. Descomposición LU

Si tenemos una matriz cuadrada no singular A, a menudo es útil ex-presarla como producto de dos matrices LU, triangular inferior y superiorrespectivamente. Para muchas matrices existe dicha descomposición.

Definición 1.43. Sea A una matriz cuadrada y no singular, diremos que esfactorizable LU si existen matrices L y U de forma que A = LU siendo L unamatriz triangular inferior y U una matriz triangular superior.

Page 18: ALyMD

14 Matrices y Sistemas de Ecuaciones Lineales

Algoritmo. La descomposición LU puede verse como una modificacióndel método de Gauss, ya que en este método tenemos una serie de opera-ciones elementales (por filas) de tipo III para anular los elementosEste algoritmo es factible

siempre y cuando en cadapaso no aparezca un cero

en la diagonal principal delas sucesivas matrices

transformadas de la A,porque en este paso no

sería posible unaoperación elemental de

tipo III.

que haypor debajo de la diagonal principal de la matriz A que aplicadas a A nosdan una matriz triangular superior U. Realizar estas operaciones elementa-les {e1, e2, . . . , ek} aplicadas a A es igual que multiplicar A por las matriceselementales correspondientes, o sea EkEk−1 . . . E1A = U, siendo Ei matriceselementales de tipo III triangulares inferiores para cualquier i entre 1 y k.Para conseguir la L basta despejar y tenemos que A = E−1

1 E−12 . . . E−1

k U ypor lo tanto L = E−1

1 E−12 . . . E−1

k .

Ejemplo 1.44. Vamos a descomponer la siguiente matriz A como productoLU.

A =

2 0 14 3 48 9 9

2 0 1

4 3 48 9 9

e1

2 0 10 3 28 9 9

e2

2 0 10 3 20 9 5

e3

2 0 10 3 20 0 −1

Donde la última matriz obtenida es la matriz U

U =

2 0 10 3 20 0 −1

y e1, e2 y e3 son operaciones elementales por filas de tipo III. Las matriceselementales correspondientes son:

E1 =

1 0 0−2 1 0

0 0 1

; E2 =

1 0 00 1 0−4 0 1

; E3 =

1 0 00 1 00 −3 1

por lo tanto:

L = E−11 E−1

2 E−13 =

1 0 02 1 00 0 1

1 0 00 1 04 0 1

1 0 00 1 00 3 1

=

1 0 02 1 04 3 1

Así A = LU: 2 0 1

4 3 48 9 9

=

1 0 02 1 04 3 1

2 0 10 3 20 0 −1

Page 19: ALyMD

1.3 Sistemas de ecuaciones lineales 15

1.3. Sistemas de ecuaciones lineales

Un sistema de m ecuaciones con n incógnitas x1, x2, . . . , xn lineal, siem-pre se puede expresar de la siguiente manera:

a11x1 + a12x2 + · · ·+ a1nxn = c1a21x1 + a22x2 + · · ·+ a2nxn = c2

...

am1x1 + am2x2 + · · ·+ amnxn = cm

donde aij son elementos de un cuerpo (normalmente R o C).

Usaremos la siguiente terminología:

Si, para todo i ∈ {1, . . . , m}, ci = 0 decimos que el sistema es homo-géneo.

Llamamos solución a cualquier n-upla x = (x1, x2, . . . , xn) ∈ Kn quehaga ciertas todas las igualdades.

Decimos que dos sistemas de ecuaciones son equivalentes si tienenel mismo conjunto de soluciones.

Los sistemas de ecuaciones se clasifican según sus soluciones según elsiguiente cuadro

Sistema

incompatible

compatible

determinado

indeterminado

donde:

Incompatible: El conjunto de soluciones es vacío.

Compatible determinado: Tiene una única solución.

Compatible indeterminado: Tiene más de una única solución. Si K = R oK = C necesariamente son infinitas soluciones.

Ejercicio 1.45. Da ejemplos de sistemas (2 ecuaciones con 2 incógnitas) de cadauno de los tipos anteriores, es decir, incompatible, compatible determinado e inde-terminado.

Page 20: ALyMD

16 Matrices y Sistemas de Ecuaciones Lineales

Representación matricial

Es muy conveniente la representación del sistema en forma matricial.a11 a12 · · · a1na21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

︸ ︷︷ ︸

A

x1x2...

xn

︸ ︷︷ ︸

X

=

c1c2...

cm

︸ ︷︷ ︸

C

Que escribiremos AX = C. Obsérvese que aparecen dos matrices colum-nas, X o matriz de incógnitas y C o matriz de términos independientes. A lamatriz de coeficientes A se le llama matriz del sistema.

Definición 1.46 (Matriz ampliada del sistema). Es la matriz obtenida aña-diendo a la matriz A del sistema la columna C de términos independientes,es decir

(A|C) =

a11 a12 · · · a1n c1a21 a22 · · · a2n c2...

.... . .

......

am1 am2 · · · amn cm

1.3.1. Teorema de Rouché-Fröbenius

Consideraremos este importante teorema del álgebra lineal del que nodamos demostración.

Teorema 1.47 (Rouché-Fröbenius). Un sistema de ecuaciones lineales (real ocomplejo) AX = C es compatible si y solo si el rango de la matriz de coeficientesA es igual al rango de la matriz ampliada (A|C). Además un sistema compatiblecon n incógnitas

1. Es determinado si y solo si rango(A) = rango(A|C) = n.

2. Es indeterminado si y solo si rango(A) = rango(A|C) < n.

Al valor n− rango(A) se le llama grado de libertad del sistema indeter-minado y determina el número de parámetros que definen las soluciones.

Ejercicio 1.48. Determina los valores del parámetro a para que el sistema siguien-te tenga soluciones.Indicación: Una forma de

hacerlo es aplicar el métodode Gauss conforme a la

sección 1.2.3 a la matrizampliada y comparar

rango(A) y rango(A|C).

x1 + 3x2 − x3 = 42x1 + 4x2 + x3 = −2

2x1 + ax2 + 2x3 = 02x2 + x3 = −2

[SOLUCIÓN: a = 14]

Page 21: ALyMD

1.3 Sistemas de ecuaciones lineales 17

1.3.2. Resolución de sistemas por eliminación gaussiana

Dado un sistema de ecuaciones AX = C las transformaciones elementalesaplicadas a las ecuaciones (cambiar dos ecuaciones, multiplicar una ecuaciónpor un número α 6= 0 y sumar a una ecuación un múltiplo de otra) nosdevuelven un sistema de ecuaciones equivalentes. Esto se puede traducirdirectamente a la aplicación de operaciones elementales por filas Las operaciones

elementalesnecesariamente han de serpor filas. Las operacionespor columnas no respetanlas soluciones del sistema.

a la matrizampliada del sistema (A|C). Se pretende, entonces encontrar una matrizequivalente por filas a esta última que permita una más fácil resolución delsistema, es decir

(A|C)Por filas (E|D)

donde:

(E|D) es escalonada←→Método de Gauss

(E|D) es escalonadareducida

←→Método deGauss-Jordan

Ejemplo 1.49. Supongamos que queremos resolver el siguiente sistema deecuaciones de tipo 4× 3, es decir 4 ecuaciones con 3 incógnitas.

2x1 − x2 = 1x1 + x2 − 4x3 = 0

14x2 − 39x3 = −13x1 − 2x2 + 3x3 = −4

(1.2)

El método de Gauss consiste en realizar transformaciones elementales porfilas, hasta conseguir una matriz escalonada como la siguiente (no es laúnica posible)

2 −1 01 1 −40 14 −391 −2 3

10

−13−4

Por filas!

2 −1 00 3 −80 0 −50 0 0

1−1−25

0

Esto nos da un sistema de ecuaciones equivalentes a (1.2) pero mucho másfácil

2x1 − x2 = 13x2 − 8x3 = −1−5x3 = −25

Page 22: ALyMD

18 Matrices y Sistemas de Ecuaciones Lineales

El método de Gauss-Jordan, requiere más transformaciones elementalespara encontrar una matriz escalonada reducida, pero a cambio, esta matrizes única y además las soluciones (si las hay) se encuentran directamente

2 −1 01 1 −40 14 −391 −2 3

10

−13−4

Por filas!

1 0 00 1 00 0 10 0 0

71350

Claramente, la única solución del sistema original (1.2) es

(x1, x2, x3) = (7, 13, 5)

Sistemas Homogéneos

Supongamos AX = 0, entonces

Todos los sistemas de ecuaciones lineales homogéneos son compati-bles. Esto es evidente, puesto que rango(A) = rango(A|0).

El sistema es compatible indeterminado si y sólo si rango(A) < n.Este caso existen soluciones distintas de la solución trivial x1 = x2 =· · · = xn = 0.

Ejemplo 1.50. Vamos a resolver el siguiente sistema homogéneo aplicandoel método de Gauss.

2x + 3y− z = 0x− 4y + z = 03x− y = 0

que en forma matricial se expresa 2 3 −1

1 −4 13 −1 0

xyz

=

000

Aplicamos el método de Gauss a la matriz ampliada 2 3 −1 01 −4 1 03 −1 0 0

Por filas!

1 −4 1 00 11 −3 00 0 0 0

De donde deducimos que el sistema es compatible indeterminado conun grado de libertad. Además este método nos lleva a resolver un sistema

Page 23: ALyMD

1.3 Sistemas de ecuaciones lineales 19

más fácil

x− 4y + z = 011y− 3z = 0

}z=λ⇒ x− 4y = −λ

11y = 3λ

}⇒

z = λ

y =311

λ

x = 4(311

λ)− λ =111

λ

Si elegimos como parámetro z = 11λ, simplificamos la expresión de lassoluciones:

(x, y, z) = (λ, 3λ, 11λ)

Sistemas cuadrados no homogéneos

Consideremos el caso de sistemas no homogéneos en que hay coinci-dencia entre el número de ecuaciones y el número de incógnitas. En estoscasos, obviamente, la matriz del sistema es cuadrada. En este caso, del teo-rema de Rouché-Fröbenius podemos enunciar el siguiente

Corolario 1.51. Un sistema cuadrado no homogéneo AX = C es compatible de-terminado si y solo si det A 6= 0.

Método de Cramer Aunque generalmente es mejor el método de Gauss(o Gauss-Jordan) para resolver este tipo de sistemas está muy extendido elmétodo de Cramer que se enuncia a continuación:

Teorema 1.52 (Método de Cramer). Si el sistema de ecuaciones

a11x1 + a12x2 + · · ·+ a1nxn = c1a21x1 + a22x2 + · · ·+ a2nxn = c2

...

an1x1 + an2x2 + · · ·+ annxn = cn

⇐⇒ AX = C

es compatible determinado, entonces cualquier solución xi viene determinado porla siguiente expresión: Observe que es

absolutamente necesario queel determinante del sistema|A| sea distinto de cero.

xi =

∣∣∣∣∣∣∣∣∣a11 · · · c1 · · · a1na21 · · · c2 · · · a2n...

......

an1 · · · cn · · · ann

∣∣∣∣∣∣∣∣∣|A|

donde el numerador es el determinante de la matriz que resulta de sustituir lacolumna i-ésima por la columna C.

Page 24: ALyMD

20 Matrices y Sistemas de Ecuaciones Lineales

Ejemplo 1.53. Para resolver el sistema de ecuaciones

x1 + 3x2 − x3 = 1−x1 + x2 + 3x3 = 02x1 + x2 + x3 = 2

comprobamos que tiene solución única ya que

∣∣∣∣∣∣1 3 −1−1 1 3

2 1 1

∣∣∣∣∣∣ = 22 6= 0.

Entonces las soluciones son:

x1 =

∣∣∣∣∣∣1 3 −10 1 32 1 1

∣∣∣∣∣∣22

=9

11

x2 =

∣∣∣∣∣∣1 1 −1−1 0 3

2 2 1

∣∣∣∣∣∣22

=3

22

x3 =

∣∣∣∣∣∣1 3 1−1 1 0

2 1 2

∣∣∣∣∣∣22

=5

22

Método LU De forma alternativa, basado en el método de Gauss, comohemos visto en la sección 1.2.4. Así, si un sistema de ecuaciones linealesAX = B es cuadrado, es decir, tiene el mismo número de ecuaciones quede incógnitas y la matriz del sistema A es e factorizable LU se tiene

AX = B ⇐⇒ L(UX) = B ⇐⇒{

LY = BUX = Y

De donde, resolver el sistema inicial sería equivalente a resolver un par desistemas lineales pero con matrices triangulares (por tanto, prácticamente,cada uno de ellos es inmediato).

Ejemplo 1.54. Vamos a resolver el anterior sistema de ecuaciones

x1 + 3x2 − x3 = 1−x1 + x2 + 3x3 = 02x1 + x2 + x3 = 2

por el método LU.

Page 25: ALyMD

1.3 Sistemas de ecuaciones lineales 21

Así tenemos que A =

1 3 −1−1 1 32 1 1

y sacando ceros

1 3 −1−1 1 3

2 1 1

e1

1 3 −10 4 22 1 1

e2

1 3 −10 4 20 −5 3

e3

1 3 −10 4 20 0 11

2

= U

y e1, e2 y e3 son operaciones elementales por filas de tipo III. Las matriceselementales correspondientes son:

E1 =

1 0 01 1 00 0 1

; E2 =

1 0 00 1 0−2 0 1

; E3 =

1 0 00 1 00 5

4 1

por lo tanto:

L = E−11 E−1

2 E−13 =

1 0 0−1 1 0

0 0 1

1 0 00 1 02 0 1

1 0 00 1 00 −5

4 1

=

=

1 0 0−1 1 0

2 −54 1

Así A = LU y el sistema lo resolvemos en dos pasos:

1. LY = B, o bien,

1 0 0−1 1 02 −5

4 1

y1y2y3

=

102

=⇒

y1 = 1y2 = 1y3 = 5

4

2. UX = Y, o bien

1 3 −10 4 20 0 11

2

x1x2x3

=

1154

=⇒

x1 = 9

11

x2 = 322

x3 = 522

que nos da la solución del sistema.

Ejercicios Propuestos

Ej. 1.1 — Dadas las matrices A =

(2 −13 2

), B =

(0 14 −2

)y C =

(1 3 52 −1 1

),

calcula, si es posible:

a) A + B.

b) AC.

c) CB y CTB.

d) (2A + B)C.

e) ABC.

f)

CT ( 12 B− A

).

g) A2, B2 y C2.

Page 26: ALyMD

22 Matrices y Sistemas de Ecuaciones Lineales

Ej. 1.2 — Dadas las matrices A =

2 6 30 9 5−6 2 1

y B =

1 1 12 −4 23 5 7

, com-

prueba si es verdadero o falso:

a) AB = BA.

b) (A + B)2 = A2 + 2AB + B2.

c) (A− B)(A + B) = A2 − B2.

d) ABA−1 = B.

Ej. 1.3 — Mediante matrices elementales, transforma la matriz A en unaescalonada equivalente E. Determina las matrices P y Q tales que Q−1AP =E y determina el rango de A.

a) A =

1 4 −12 5 31 10 −11

. b) A =

3 11 45 −2

. c) A =

−3 5 1 46 −7 −2 −54 −1 −1 0

.

Ej. 1.4 — Mediante operaciones elementales, determina el rango de las si-guientes matrices según el valor del parámetro a.

a)(

1 34 a

)b)(

2 a 16 3 4

)c)

2 a6 4 + a4 6

d)

a 1 11 a 11 1 a

Ej. 1.5 — Mediante operaciones elementales, determina, si existe, la matrizinversa de cada una las siguientes matrices.

a)(

5 47 6

)b)

2 1 3−1 4 01 1 0

c)

3 −1 24 1 12 4 6

Ej. 1.6 — Calcula el determinante |A| =

∣∣∣∣∣∣∣∣1 6 2 00 3 −1 42 0 1 25 −3 4 0

∣∣∣∣∣∣∣∣.1. Desarrollando por la cuarta fila.2. Desarrollando por la fila o columna para la que es necesario calcular

menos adjuntos.3. Desarrollando por la segunda columna realizando antes operacio-

nes elementales de forma que solamente sea necesario calcular unadjunto.

4. Por operaciones elementales, descomponiendo LU la matriz A, sifuese posible.

Page 27: ALyMD

1.3 Sistemas de ecuaciones lineales 23

Ej. 1.7 — Sabiendo que A y B son matrices cuadradas de orden 4 tales que|A| = 5 y |B| = −6, calcula, si es posible:

a) |AB|.b) |BT|.

c) |ABAT|.d) |ABA−1|.

e) |(AB)T|.f) |A−1|.

g) |2B|.h) |A2|.

Ej. 1.8 — Calcula la inversa de las siguientes matrices para aquellos valo-res del parámetro real a para los que sea posible.

a)

a 2 00 1 11 0 a

b)

a −1 −510 4 −14 2a 9

Ej. 1.9 — Resolver por el método de Gauss y, si es posible, por el métodode Cramer, los siguientes sistemas de ecuaciones lineales

a)x + y− z = 0

x− 2y + z = 02x− y = 0

.b)

x + y− 2z + 3t = −1−x− 2y− 3z− 4t = 02x + 3y + 5z + 7t = 12x + 2y + 4z + 6t = 2

.

Ej. 1.10 — Clasificar y resolver, donde sea posible, el sistema de ecuacioneslineales

x + ay + 3z = 2x + y− z = 1

2x + 3y + az = 3

.

Ej. 1.11 — (Sept. 2011) Clasifica el siguiente sistema de ecuaciones en fun-ción del parámetro m y resuélvelo para algún valor de m para el que elsistema sea compatible.

mx + mz = 0my + z = 0

mx + y + mz = mmx + my + mz = 0

Ej. 1.12 — Tres amigos, Pedro, Luis y Pablo, deciden asociarse para montaruna empresa, necesitando para ello un capital de 15.000e. Como no todosdisponen del mismo dinero deciden invertir de la siguiente manera: Pedroaporta el triple de lo que ponen Luis y Pablo juntos, y por cada 20e queaporta Luis, Pablo aporta 30e. ¿Cuánto capital aportó cada uno de ellos?

Page 28: ALyMD

24 Matrices y Sistemas de Ecuaciones Lineales

Ej. 1.13 — Una fábrica de dispositivos eléctricos fabrica tres tipos de com-ponentes a partir de cobre y estaño:

Dispositivo A: Necesita 8 unidades de cobre y ninguna de estaño.

Dispositivo B: Necesita 6 unidades de cobre y 2 de estaño.

Dispositivo C: Necesita 7 unidades de cobre y 1 de estaño.

En un momento dado se disponen de 100 unidades de cobre y 12 de estaño,

1. ¿Cuántas dispositivos de cada tipo se pueden fabricar usando todoel material disponible?

2. Sabiendo que el precio de producción del dispositivo A es de 2e,el de B es de 7e y el de C es de 5e, ¿Hay alguna combinación quecueste 60e consumiendo todo el material?

3. ¿Cuáles son las cantidades máxima y mínima de euros que se pue-den invertir para tener producción de componentes con la condiciónde invertir todo el material de cobre y estaño?

Ej. 1.14 — 1. Descompón la matriz A de la forma LU.

A =

2 0 0 14 3 1 20 9 7 22 0 16 10

2. Resuelve el sistema AX = C usando la descomposición LU anterior.

Para ello AX = C se convierte en LUX = C y se resuelve primeroLY = C y tras obtener Y se resuelve UX = Y.

X =

x1x2x3x4

C =

45−3

6

Page 29: ALyMD

TEMA 2

ESTRUCTURASALGEBRAICAS

Índice2.1. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.1.1. Producto cartesiano y relaciones . . . . . . . . . 26

2.1.2. Relaciones internas . . . . . . . . . . . . . . . . . 28

2.1.3. Relaciones de equivalencia . . . . . . . . . . . . 29

2.1.4. Los enteros modulares. . . . . . . . . . . . . . . . 31

2.1.5. Relaciones de orden . . . . . . . . . . . . . . . . 32

2.2. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.2.1. Composición e inversa de Funciones . . . . . . . 34

2.2.2. Tipos de funciones . . . . . . . . . . . . . . . . . 35

2.3. Estructuras algebraicas . . . . . . . . . . . . . . . . . . . 36

2.3.1. Estructuras algebraicas con una operación . . . . 39

2.3.2. Estructuras algebraicas con dos operaciones . . 41

2.4. El cuerpo de los números complejos . . . . . . . . . . . . 44

2.4.1. Definiciones y propiedades algebraicas . . . . . 44

2.4.2. Del álgebra a la geometría y viceversa . . . . . . 46

2.4.3. Función exponencial . . . . . . . . . . . . . . . . 52

2.4.4. Funciones trigonométricas y trig. hiperbólicas . 53

2.4.5. Logaritmos y exponenciales de base . . . . . . . 55

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 56

25

Page 30: ALyMD

26 Estructuras Algebraicas

En este capítulo comenzamos trabajando en conjuntos arbitrarios (pue-den ser de cualquier cosa) y sus relaciones y operaciones entre ellos. Fi-nalmente terminamos estudiando las estructuras de conjunto numéricos:enteros, reales y complejos.

2.1. Relaciones

2.1.1. Producto cartesiano y relaciones

Sea U un conjunto, que llamaremos universal, y A y B subconjuntos deU que representamos A, B ⊆ U .

Definición 2.1. Si A y B son conjuntos no vacíos, es decir, A, B 6= ∅, llama-mos par ordenado a las listas del tipo (a, b) con a ∈ A y b ∈ B.

Evidentemente, los pares ordenados no pertenecen al universo U , sinoque están en otro universo distinto. En este curso no vamos a entrar enformalizaciones rigurosas y dejamos la comprensión de este hecho a la in-tuición del alumno.

Igualdad de pares

(a, b) = (a′, b′) si y sólo si a = a′ y b = b′

Definición 2.2. Se define el producto cartesiano de A por B como

A× B = {(a, b) | a ∈ A, b ∈ B}

Producto cartesiano de más de dos conjuntos El concepto de par or-denado se puede extender. Así se pueden definir las ternas (ordenadas):(a1, a2, a3) y, más generalmente, las n-uplas: (a1, a2, . . . , an). También se ex-tiende el producto cartesiano de n conjuntos A1 × A2 × · · · × An como elconjunto de todas las n-uplas.

Ejemplo 2.3. Usaremos con mucha frecuencia el conjunto Rn que está de-finido como el producto cartesiano R×R× · · · ×R, es decir, todas las n-uplas de números reales.

Relaciones binarias

Llamamos relación (o correspondencia)R de A en B a cualquier propie-dad que asigna a cada elemento de A un subconjunto de B (posible-mente vacío).

Page 31: ALyMD

2.1 Relaciones 27

Si “a está relacionado con b” entonces aR b, en caso contrario a 6Rb.

Si R es una relación de A en B, llamamos grafo de R al subconjuntode A× B siguiente

GR = {(a, b) | aR b}

Inversamente, si G ⊆ A× B, entonces define una única relación RGde A en B del siguiente modo

aRG b⇐⇒ (a, b) ∈ G

Es decir, que todo subconjunto del producto cartesiano define una(única) relación cuyo grafo coincide con dicho subconjunto.

Representación de Relaciones

La relación de A = {a, b, c, d} en B = {x, y, z} definida por el grafo:

GR = {(a, x), (a, z), (d, x)} (2.1)

se puede representar de muchas formas, entre otras, las siguientes:

Diagrama de flechas:

Aabcd

Bx

y

z

Diagrama cartesiano:A

B

a b c dx

y

z

Los “puntos negros” representan los elementos de la relación.

Como una matriz de ceros y unos:

1 0 10 0 00 0 01 0 0

Las filas representan los elementos de A y las columnas los de B,previamente ordenados. Los unos indican los elementos del productocartesiano que pertenecen a la relación y, obviamente, los ceros los queno pertenecen.

Page 32: ALyMD

28 Estructuras Algebraicas

Obviamente, si el grafo de la relación no es un conjunto finito, las anterioresrepresentaciones no siempre son viables. A veces es posible algún tipo derepresentación gráfica, principalmente cuando los conjuntos que definen larelación son numéricos.

Ejercicio 2.4.Indicación: Observa que secorresponde con la gráfica deuna circunferencia. Ayúdatede un programa de cálculo si

tienes dificultades con larepresentación.

Usa un diagrama cartesiano para representar la relación entre nú-meros reales cuyo grafo es el siguiente:

GR = {(x, y) | (x + 1)2 + (y− 1)2 = 1} ⊆ R×R

Dominio e Imagen

Desde ahora identificamos completamente una relaciónR con su grafo,es decir cuando una relación R está definida desde el conjunto A hastael conjunto B, representaremos R ⊆ A × B, aunque formalmente lo queestamos diciendo es que su grafo es el que está contenido.

Dada una relaciónR ⊆ A× B, es decir, GR ⊆ A× B, según lo anterior,se definen los subconjuntos dominio e imagen o codominio deR como

DomR = {x ∈ A | existe b ∈ B con xR b}ImR = {x ∈ B | existe a ∈ A con aR x}

Ejercicio 2.5. En la relaciónR = {(a, x), (a, z), (d, x)} ya vista en (2.1), página27, el conjunto A = {a, b, c, d} y B = {x, y, z} son los conjuntos inicial y final,respectivamente. ¿Podrías escribir el dominio y la imagen deR?

Ejercicio 2.6. Escribe el dominio y la imagen de la relación que se define en elejercicio 2.4.

Relación identidad Para cualquier conjunto A siempre existe una rela-ción definida

IA = {(x, x) | x ∈ A} ⊆ A× A (2.2)

que llamaremos relación identidad. Cuando no hay duda se suprime el sub-índice, por tanto I .

2.1.2. Relaciones internas

Decimos que una relación binaria es interna cuando el conjunto inicialy final coinciden, es decir, GR ⊆ A× A.

Page 33: ALyMD

2.1 Relaciones 29

Aabcd

Aabcd

Aa

b

d

c

Figura 2.1: Las gráficas representan a la misma relación interna. Lasegunda es más habitual en relaciones internas.

Propiedades

Algunas propiedades de las relaciones binarias en A son las siguientes:

Reflexiva: Para todo a ∈ A se tiene aR aAntirreflexiva: Para todo a ∈ A se tiene a 6RaSimétrica: Para todo a, b ∈ A, si aR b entonces bR aAntisimétrica: Para todo a, b ∈ A, si aR b y bR a entonces a = bTransitiva: Para todo a, b, c ∈ A, si aR b y bR c entonces aR cCircular: para todo a, b, c ∈ A tales que aR b y bR c, se cumple que cR a.

Ejercicio 2.7. Observa que la relación identidad I definida en (2.2) es una relacióninterna. Indica cúales de las anteriores propiedades verifica.

Ejercicio 2.8. Da ejemplos de relaciones binarias internas en el conjunto A ={a, b, c, d} que cumplan las propiedades anteriores, por ejemplo:• R = {(a, c), (b, c)} es antirreflexiva.

2.1.3. Relaciones de equivalencia

Una relación binaria interna se dice que es de equivalencia si es reflexiva,simétrica y transitiva.

Ejercicio 2.9. Da varios ejemplos de relación de equivalencia sobre el conjuntoA = {a, b, c, d, e}.

Las relaciones de equivalencias están relacionadas con otro conceptollamado partición.

Definición 2.10. Dado un conjunto A 6= ∅, decimos que una familia desubconjuntos no vacíos de A, {Ai}i∈I , es una partición de A si satisfacen lasdos condiciones siguientes:

1.⋃i∈I

Ai = A

Page 34: ALyMD

30 Estructuras Algebraicas

Figura 2.2: Relación de equivalencia y partición. Los infinitos puntos delcírculo se reunen en subconjuntos por colores.

2. Para todo i, j ∈ I con i 6= j se tiene que Ai ∩ Aj = ∅. Es decir, sondisjuntos por pares.

A cada uno de los subconjuntos Ai se le llama parte de A relativa a lapartición.

Definición 2.11 (Clases de equivalencia). Si en un conjunto A hay definidauna relación de equivalencia R, cada elemento a ∈ A se puede agruparen un subconjunto formado por él mismo y todos los elementos que serelacionan con él. A dicho subconjunto de A se le llama clase de equivalenciay se representa

[a] = {x ∈ A | aR x}

Según la anterior definición podría ocurrir que ciertas clases coincidie-ran, es decir, algunos elementos a, b ∈ A, cumplen a 6= b y, en cambio,[a] = [b]. Al ser subconjuntos podemos preguntarnos algo más ¿se pue-den solapar las clases?, es decir, ¿pueden existir a, b ∈ A, con [a] 6= [b] y[a] ∩ [b] 6= ∅? La respuesta nos la da el siguiente e importante teorema.

Teorema 2.12. SeaR ⊆ A× A una relación de equivalencia y a, b ∈ A, entoncesse tiene:

1. a ∈ [a]

2. aR b⇐⇒ [a] = [b]

3. [a] 6= [b]⇐⇒ [a] ∩ [b] = ∅

Demostración.1. Es evidente por la propiedad reflexiva. Como aR a⇒ a ∈ [a].2. Suponemos (hipótesis) que aR b (o bien bR a), entonces, por la pro-

piedad transitiva:

x ∈ [a]⇒ xR a (y aR b, hip.) ⇒ xR b⇒ x ∈ [b] que prueba [a] ⊆ [b]x ∈ [b]⇒ xR b (y bR a, hip.) ⇒ xR a⇒ x ∈ [a] que prueba [b] ⊆ [a]

Page 35: ALyMD

2.1 Relaciones 31

luego (por la doble inclusión) [a] = [b].Inversamente, ahora la hipótesis es [a] = [b], entonces, como sabemos(apartado 1) que a ∈ [a]⇒ a ∈ [b], luego aR b.

3. Hipótesis [a] 6= [b]. Si x ∈ [a] ∩ [b] ⇒ x ∈ [a] y x ∈ [b] ⇒ a Rx y xR b ⇒ aR b, luego por 2. [a] = [b], que contradice la hipótesis. Deaquí no puede haber ningún elemento en la intersección [a] ∩ [b], es decir[a] ∩ [b] = ∅.Hipótesis [a] ∩ [b] = ∅. Sabemos que [a] 6= ∅ y [b] 6= ∅, entonces tri-vialmente [a] 6= [b], puesto que si fuesen iguales no tendrían intersecciónvacía. �

Corolario 2.13. Las clases de equivalencia de una relaciónR en A establecen unapartición de A. En la figura 2.2 una relación

de equivalencia establece unapartición en el círculo(considerado como unconjunto de puntos). Lasclases de equivalencia son loscolores.

Demostración. Claramente A es la unión de todas las clases de equivalencia,puesto que cada elemento de a está en, al menos, una clase (la propia [a]).Por otro lado, el apartado 3 del teorema anterior garantiza que dos clasesdistintas son disjuntas. �

Nota. El recíproco del corolario anterior también es cierto. Es decir, cual-quier partición de un conjunto A define una relación de equivalencia. Doselementos están relacionados si y solo sí pertenecen a la misma parte (esevidente que esta relación es reflexiva, simétrica y transitiva). Claramentelas clases coinciden con las partes.

Definición 2.14 (Conjunto cociente). Dada R en A, al conjunto formadopor las clases de equivalencia, que denotamos por A/R

Ejercicio 2.15. Establece los conjuntos cocientes de las relaciones dadas en el ejer-cicio 2.9

2.1.4. Los enteros modulares.

Vamos a definir los conjuntos de enteros modulares que son conjuntossimples y finitos y que se pueden dotar de operaciones (suma y producto),construidos a partir de una relación de equivalencia (congruencia modular)como conjuntos cocientes. Estos enteros son muy usados en aplicaciones dedistintas áreas de las ciencias. A título de ejemplo invito a los estudiantes ainvestigar el algoritmo RSA muy usado en codificación de comunicaciones(cifradas) entre ordenadores.

Definición 2.16. Dos números enteros a, b ∈ Z se dicen que son congruentesmódulo n si y solo si su diferencia es múltiplo de n.

a ≡n b ⇐⇒ existe k ∈ Z tal que b− a = kn

Es fácil comprobar que es una relación de equivalencia en Z.

Page 36: ALyMD

32 Estructuras Algebraicas

Ejemplo 2.17. Algunos enteros se relacionan mediante la relación ≡7 yotros no. Comprueba, por ejemplo, que 3 ≡7 −11. En cambio 3 no se re-laciona, por ejemplo, con 1.

Ejercicio 2.18. Prueba que, efectivamente, la relación ≡n es de equivalencia en Z

(para cualquier n).

Definición 2.19. Representamos por Zn al conjunto cociente Z/≡n defini-do por la relación de equivalencia “congruencia módulo n”.

Los conjuntos Zn tienen exactamente n elementos

Zn = {[0], [1], [2], . . . , [n− 2], [n− 1]}

Debes tener en cuenta las siguients observaciones:

1. Las clases tienen infinitos representantes. De hecho, tienen un com-portamiento cíclico. Así, por ejemplo, en Z6, tenemos que

· · · = [−12] = [−6] = [0] = [6] = [12] = [18] = · · ·· · · = [−11] = [−5] = [1] = [7] = [13] = [19] = · · ·· · · = [−10] = [−4] = [2] = [8] = [14] = [20] = · · ·

...· · · = [−7] = [−1] = [5] = [11] = [17] = [23] = · · ·

2. Diremos que una clase está en forma canónica si es la forma [a] dondea es un número entero entre 0 y n− 1 (ambos inclusive).

3. Las clases [a] y [b] son iguales si a y b son congruentes (módulo n).

4. Si a es postivo, la clase [a] es igual a la clase [r] donde r es el resto dedividir a entre n. Así la clase [r] está en forma canónica.

Ejemplo 2.20. Tiene interés el conjunto Z2 = {[0], [1]}. En general, encomputación se emplean con mucha frecuencia los Zp donde p es un nú-mero primo.

Ejercicio 2.21. Expresa los siguientes enteros modulares de Z13 en forma canó-nica:

[−11] = , [101] = , [−101] = , [11] =

2.1.5. Relaciones de orden

Una relación binaria interna se dice que es de orden si es reflexiva, anti-simétrica y transitiva.

Page 37: ALyMD

2.2 Funciones 33

1

2

4

5

10

20

3

6

12

15

30

60

Figura 2.3: Diagrama de Hasse

Por ejemplo, si A = {divisores po-sitivos de 60}, la relación binaria en A

mR n ⇐⇒ m divide a n

es una relación de orden.Las relaciones de orden en conjun-

tos fintos se pueden representar por losllamados diagramas de Hasse. El ejem-plo anterior se puede representar con eldiagrama de Hasse de la figura al mar-gen.

Orden total y orden parcial

Dos elementos a, b ∈ A son comparables si aR b o bR a. Una relación deorden es total si todos los elementos son comparables entre sí; en otro casodecimos que es parcial. El diagrama de la figura 2.3 representa un ordenparcial.

2.2. Funciones

Definición 2.22. Decimos que una relación f ⊆ A × B es una función oaplicación si satisface las dos condiciones siguientes:

1. Dom f = A

2. Si (a, b) ∈ f y (a, c) ∈ f entonces b = c

Aabcd

Bx

y

z

Figura 2.4: Ejemplo de función.

En la figura 2.4 se representa undiagrama que se corresponde con unafunción, puesto que cumple las doscondiciones de la definición.

Ejercicio 2.23. Representa gráficamentedos relaciones que no sean funciones, unade ellas porque no cumpla la condición 1. yla otra porque no cumpla la condición 2. dela definición 2.22.

Nota. Un función la representamos dela forma f : A → B. Además (a, b) ∈ f lo escribimos f (a) = b y diremosque b es imagen de a o que a es origen de b.

Page 38: ALyMD

34 Estructuras Algebraicas

Estamos acostumbrados a la anterior notación, que es la usual. A vecesse pierde rigurosidad como, por ejemplo, cuando se dice que f : R → R

definida f (x) = 1x es una función. En realidad, siendo rigurosos, no lo es,

puesto que 0 /∈ Dom( f ). En muchas ocasiones se “sobreentiende” que lasfunciones están definidas en su dominio.

Si X es subconjunto de A, representamos f (X) el subconjunto de B detodas las imágenesAsí, f (A) = Im f . de los elementos de X, es decir,

f (X) = { f (x) | x ∈ X}

Dado Y subconjunto de B, representamos por f−1(Y) al subconjunto de Ade los elementos cuyas imágenes están en Y, es decir,

f−1(Y) = {x ∈ A | f (x) ∈ Y}

Ejemplo 2.24. La relación identidad IA : A→ A descrita en (2.2), es efecti-vamente una función que depende únicamente del conjunto A en la que sedefine. Estas funciones reciben el nombre de función identidad en A.

2.2.1. Composición e inversa de Funciones

Si tenemos dos funciones f : A→ B y g : B→ C podemos construir unanueva función llamada función compuestaObserva que ,para

funciones, g ◦ f seentiende que primero se

aplica f y posteriormenteg.

de f con g a la siguiente:

g ◦ f : A→ C siendo (g ◦ f )(x) = g( f (x)) (2.3)

Propiedades.

1. Cuando una función f : A→ B se compone con la función identidad,se queda invariante, es decir

f ◦ IA = f y IB ◦ f = f (2.4)

2. Es fácil probar que la composición de funciones es asociativa, es decir, sif : A→ B, g : B→ C y h : C → D, se tiene

(h ◦ g) ◦ f = h ◦ (g ◦ f ) (2.5)

3. En cambio, la composición no es conmutativa, incluso cuando es posi-ble. Por ejemplo, f : A → A y g : A → A, en general f ◦ g 6= g ◦ f .Dejamos que el estudiante busque ejemplo de esto.

Page 39: ALyMD

2.2 Funciones 35

Función inversa

Si f : A → B es una función, podemos expresarla en forma de relacióndel siguiente modo:

f = {(a, f (a)) | a ∈ A} ⊆ A× B

Invirtiendo el orden de los pares obtenemos otra relación

f−1 = {( f (a), a) | a ∈ A} ⊆ B× A

y esta nueva relación f−1 NO es necesariamente una función.

Ejercicio 2.25. Escribe distintos contraejemplos donde no se verifique 1. o 2. de ladefinición.

Definición 2.26. Diremos que la función f es invertible si la relación f−1 esuna función.

Teorema 2.27. Sea f : A → B una función invertible. f−1 es la única funciónque cumple

f−1 ◦ f = IA f ◦ f−1 = IB

Demostración. Efectivamente, por definición de f−1, la imagen del elementof (a) es el propio a, es decir, f−1( f (a)) = a, por tanto f−1 ◦ f = IA.

Para probar la otra igualdad, sea b cualquier elemento de B, y sea a =f 1(b) ∈ A, es decir (b, a) ∈ f−1, luego (a, b) ∈ f . Dicho de otra formaf (a) = b, o bien f ( f−1(b)) = b. De aquí f ◦ f−1 = IB.

Nos queda comprobar que es única. Sea g : B → A una función cum-pliendo ambas igualdades, es decir

g ◦ f = IA y f ◦ g = IB

entonces (g ◦ f ) ◦ f−1 = IA ◦ f−1 y por las propiedades (2.4) y (2.5) tene-mos g = f−1. �

2.2.2. Tipos de funciones

Definición 2.28. Sea f : A→ B una función.

f es inyectiva si y solo si f (x) = f (x′) implica que x = x′

4

2

B

3

1A

bc

a

f es sobreyectiva si y solo si Im( f ) = B.

Page 40: ALyMD

36 Estructuras Algebraicas

4

B1

A

bc

a

f es biyectiva si y solo si es inyectiva y sobreyectiva.

3

B

21

A

bc

a

Teorema 2.29. Una función es invertible si y solo si es biyectiva.

Ejercicio 2.30. Pon dos ejemplos de funciones invertibles discretas y dos ejemplosde funciones invertibles continuas (en R).

2.3. Estructuras algebraicas

Dado un conjunto A, llamamos operación binaria interna o ley de com-posición interna a cualquier función de A× A en A.

∗ : A× A→ A ∗ (a, b) = c a ∗ b = c

Llamamos operación binaria externa o ley de composición externa acualquier función de alguno de los tipos:

∗ : A× B→ A ∗ : A× B→ B ∗ : A× B→ C

Las leyes de composición internas pueden tener (o no) unas propieda-des y unos elementos notables que exponemos a continuación.

Propiedades

Asociativa

Sea ∗ una operación interna en A. Decimos que ∗ tiene propiedad asociativasi satisface:

Para todo a, b, c ∈ A, a ∗ (b ∗ c) = (a ∗ b) ∗ c.

Page 41: ALyMD

2.3 Estructuras algebraicas 37

Conmutativa

Sea ∗ una operación interna en A. Decimos que ∗ tiene propiedad con-mutativa si satisface:

Para todo a, b ∈ A, a ∗ b = b ∗ a.

Distributivas

Sean ∗ y ∆ dos operaciones internas en A.

Decimos que ∆ es distributiva por la izda. respecto de ∗ si satisface:

∀a, b, c ∈ A, a ∆ (b ∗ c) = (a ∆ b) ∗ (a ∆ c).

Decimos que ∆ es distributiva por la dcha. respecto de ∗ si satisface:

∀a, b, c ∈ A, (b ∗ c) ∆ a = (b ∆ a) ∗ (c ∆ a).

Decimos que ∆ es distributiva respecto de ∗ si lo es por la izda. y porla dcha.

Ejemplos 2.31.

1. En Z el producto es distributivo respecto de la suma, pero no al con-trario.

2. Si U es un conjunto, en P(U ) la unión distribuye respecto de la in-tersección. Al contrario del ejemplo anterior, también la interseccióndistribuye respecto de la unión.

Elementos Notables

Elemento Neutro

Un elemento e ∈ A es neutro para ∗ si satisface que

∀a ∈ A, a ∗ e = e ∗ a = a.

Proposición 2.32. El elemento neutro, si existe, es único.

Demostración. Si existiesen dos elementos neutros tienen que ser el mismo.Esto prueba la unicidad.

Supongamos e1 y e2 dos neutros para la operación ∗. Entonces:

Por ser e1 neutro: e1 ∗ e2 = e2Por ser e2 neutro: e1 ∗ e2 = e1

}⇒ e1 = e2

Ejemplo 2.33. En el conjunto de las matrices cuadradas n × n la matrizidentidad es el elemento neutro para el producto.

Page 42: ALyMD

38 Estructuras Algebraicas

Simétrico de un elemento

Sea ∗ una operación interna en A y e ∈ A el elemento neutro. Decimosque a′ es el simétrico de a si satisface que

a ∗ a′ = a′ ∗ a = e.

Si un elemento tiene simétrico decimos que esEl simétrico de unelemento no tiene porqué

ser único, salvo paraoperaciones con la

propiedad asociativa.

simetrizable. Además, clara-mente, si a′ es un simétrico de a, entonces a es un simétrico de a′.

Proposición 2.34. Sea ∗ una operación interna con propiedad asociativa.

1. Si un elemento es simetrizable, su simétrico es único.

2. (a′)′ = a

3. Si a, b ∈ A son elementos simetrizables, a ∗ b también lo es y su simétricoes (a ∗ b)′ = b′ ∗ a′.

Demostración.

1. Supongamos que a′1 y a′2 son simétricos de a. Entonces:

a′1 = e ∗ a′1 = (a′2 ∗ a) ∗ a′1 = a′2 ∗ (a ∗ a′1) = a′2 ∗ e = a′2

Observa que en la tercera igualdad se hace uso de la asociatividad.

2. Siguiendo la definición de elemento simétrico, a es simétrico de a′ aligual que (a′)′. Por el punto anterior éstos tienen que ser el mismo, esdecir a = (a′)′.

3. Es fácil comprobar que

(a ∗ b) ∗ (b′ ∗ a′) = ey

(b′ ∗ a′) ∗ (a ∗ b) = e

y, como el simétrico es único, se tiene (a ∗ b)′ = (b′ ∗ a′). �

Cuando estamosEn la suma al simétrico sele llama elemento opuesto yse representa con el signomenos, así el opuesto de a

es el elemento −a. En elproducto, al elemento

simétrico de a se le llamainverso y se representa

como a−1.

con una operación suma al elemento neutro se le suelerepresentar con el símbolo 0, en lugar del símbolo genérico e. Igualmente,cuando la operación es un producto que se suele denominar como “identi-dad” y se emplea el símbolo 1 y en ocasiones el símbolo I.

Page 43: ALyMD

2.3 Estructuras algebraicas 39

Elementos regulares

Sea ∗ una operación interna en A y c ∈ A. Decimos que:

c es regular por la izquierda si

∀ a, b ∈ A, c ∗ a = c ∗ b =⇒ a = b.

c es regular por la derecha si

∀ a, b ∈ A, a ∗ c = b ∗ c =⇒ a = b.

Decimos que c es regular si lo es por la izquierda y por la derecha

Si todos los elementos de A son regulares, decimos que ∗ satisface la ley desimplificación.

Proposición 2.35. Si ∗ una operación interna en A con propiedad asociativa, todoelemento simetrizable es regular.

Elementos absorbentes

Sea ∗ una operación interna en A y c ∈ A. Decimos que c es un elementoabsorbente si se satisface que:

∀a ∈ A , a ∗ c = c ∗ a = c.

Ejemplo 2.36. La matriz 0 =

(0 ... 0...

...0 ... 0

)es un elemento absorbente para el

producto de matrices cuadradas.

Ejercicio 2.37. ¿Puede existir más de un elemento absorbente para la misma ope-ración en un conjunto? Justifica la respuesta.

2.3.1. Estructuras algebraicas con una operación

Las estructuras algebraicas más simples constan de un conjunto con unaúnica operación interna definida sobre él. Las más importantes las descri-bimos en el cuadro 2.1.

Ejemplos 2.38.

1. Para los enteros positivos m y n el conjunto

Mm×n = {matrices reales de orden m× n}

con la suma, es decir, (Mm×n,+) es un grupo abeliano.

Page 44: ALyMD

40 Estructuras Algebraicas

Semigrupo Monoide Grupo(A, ∗)

Asociativa • • •Elem. neutro • •Elem. simét. •

ConmutativaSemigrupoConmutati-vo

Monoideconmutati-vo

GrupoAbe-liano

Cuadro 2.1: Estructuras con una operación binaria.

2. (Mn×n, ·) es un monoide NO conmutativo y no es grupo, puesto queexisten elementos que no tienen simétrico, por ejemplo la matriz 0. ¿Exis-ten otros elementos que no tienen simétrico? ¿Podrías poner algún ejem-plo para n = 2?

Ejercicio 2.39. ¿Qué estructura algebraica tienen los siguientes conjuntos numé-ricos con la operación suma (N,+), (Z,+) y (Z+,+)?

Ejemplos 2.40.

(Z,+) es un grupo abeliano.

(R− {0}, ·) es un grupo abeliano.

El conjunto S(A) de todas las funciones biyectivas en un conjunto Aforman un grupo con la operación composición. Este grupo se suelerepresentar con notación multiplicativa (S(A), ·) y recibe el nombrede Grupo Simétrico.

Si A es finito con n elementos, entonces el Grupo Simétrico se repre-senta por Sn y tiene n! elementos.

El conjunto de todas las matrices reales cuadradas de orden n condeterminante distinto de cero (invertibles) forman un grupo multi-plicativo y recibe el nombre de Grupo Lineal General de orden n, quese representa GL(n)

En el conjunto de enteros modulares Zn se define la suma de la formahabitual

[a] + [b] = [a + b]

Esta suma es una leyEsto quiere decir que si[a] = [a′] y [b] = [b′],

entonces[a + b] = [a′ + b′]. Prueba

este resultado comoejercicio.

de composición interna, puesto que no dependede los representantes de las clases que se elijan. Entonces para cual-quier entero positivo n, la estructura (Zn,+) es un grupo abeliano.

Page 45: ALyMD

2.3 Estructuras algebraicas 41

Ejercicio 2.41. En este ejercicio, por comodidad, suprimimos los corchetes de loselementos de Zn. Completa las siguientes tablas de los grupos.

Z2

+ 0 101 0

Z3

+ 0 1 201 2 02

Z6

+ 0 1 2 3 4 5012 1345

2.3.2. Estructuras algebraicas con dos operaciones

Para estas estructurasusamos las notacionesaditiva y multiplicativa.

En el cuadro 2.2 exponemos las estructuras básicas con dos operacio-nes. La estructura más simple es el anillo. Verás que todas son propiedadesconocidas, excepto el concepto de divisor de cero que explicaremos con másdetalle más adelante.

(A,+) Anillo CuerpoAsociativa • •

Conmutativa • •Elem. neutro 0 • •Elem. opuesto • •

(A, ·)Asociativa • •

Distributiva resp. + • •Elem. neutro 1 A. Unitario •Conmutativa A. Conmutativo •

Elem. inverso para 6= 0 •Ausencia divisores de 0 •

Cuadro 2.2: Estructuras con dos operaciones binarias.

Anillos

Las propiedades de los anillos vienen expresadas en el cuadro 2.2. Así,(A,+, ·) es un anillo si se verifica: Si, además, el producto

tiene neutro, es un anillounitario, y si esconmutativo, es un anilloconmutativo.

1. (A,+) es un grupo abeliano.

2. (A, ·) es un semigrupo.

3. El producto es distributivo respecto de la suma.

Page 46: ALyMD

42 Estructuras Algebraicas

En los anillos se tiene una conocida regla que habéis venido usandodesde los estudios primarios.

Teorema 2.42 (Regla de los Signos). Sea A un anillo. Para todo a, b ∈ A secumple

I. 0 · a = a · 0 = 0

II. a · (−b) = (−a) · b = −(a · b)

III. a · b = (−a) · (−b)

Demostración.

I. Sabemos que a · 0 = a · (0 + 0) = a · 0 + a · 0,luego simplificando en el grupo (A,+) tenemos a · 0 = 0.

II. Comprobamos que

a · (−b) + (a · b) = a · ((−b) + b) = a · 0 = 0⇒ a · (−b) = −(a · b)

De la misma forma se prueba (−a) · b = −(ab).

III. Es evidente a partir del apartado anterior y del apartado 2 de la pro-poposicion 2.34 que establece (a′)′ = a.

(−a)(−b) = −((−a)b) = −(−(ab)) = ab

Ejemplo 2.43 (Anillos de enteros modulares). A los conjuntos Zn se lesdota de suma y producto

[n] + [m] = [n + m][n] · [m] = [nm]

y tiene estructura de anillo (Zn,+, ·).

Ejercicio 2.44. Construye las tablas de suma y producto de Z6 y comprueba quees anillo.

Definición 2.45. Un elemento a ∈ A− {0} es divisor de cero si:

existe b ∈ A− {0} tal que ab = 0 o ba = 0

Claramente, si a es divisor de cero también b lo es.

El siguiente resultado caracteriza los divisores de cero de un anillo.

Page 47: ALyMD

2.3 Estructuras algebraicas 43

Proposición 2.46. Sea A un anillo y a ∈ A, a 6= 0. Entonces a es un elementoregular para el producto si y solo si no es divisor de cero.

Demostración. Veamos la primera implicación. Sea a es un elemento regulary supongamos que a es divisor de cero, es decir existe b ∈ A, b 6= 0 tal que,p.e. a · b = 0⇒ a · b = a · 0⇒ b = 0, que es una contradicción.

Inversamente, si a no es divisor de cero y no fuese regular a la izquierda,por ejemplo, existen x, y ∈ A distintos tales que a · x = a · y, luego a · (x−y) = 0. Por tanto, como x− y 6= 0 contradice que a no es divisor de cero. �

Corolario 2.47. Si A es un anillo sin divisores de cero, todos los elementos distin-tos de 0 son regulares para el producto.

Demostración. Evidente. �

Ejercicio 2.48. Comprueba que Z3, Z5 y Z7 no tienen divisores de cero. En cam-bio los anillos Z4, Z6 y Z8 si tienen.

Ejemplos 2.49.

1. Los números enteros (Z,+, ·) forman un anillo sin divisores de cero.

2. Los polinomios con coeficientes reales forman otro anillo. Tampocoexisten divisores de cero en este anillo

3. Los siguientes conjuntos numéricos racionales Q, reales R y comple-jos C, dotados con la suma y el producto son ejemplos de anillos, perocon alguna propiedad muy importante que pasan a llamarse cuerpos.

4. Las matrices cuadradas (Mn×n,+, ·) son el ejemplo más importantede estructura de anillo (conmutativo unitario), donde existen diviso-res de cero.

Ejercicio 2.50. Pon algún ejemplo de matrices cuadradas de orden n = 3 que seandivisores de cero. Es decir, encuentra dos matrices 3× 3 no nulas que multiplicadasden la matriz cero.

Cuerpos

Los cuerpos son las estructuras algebraicas con dos operaciones quemás usaremos en este curso. Se puede definir un cuerpo como una estruc-tura (K,+, ·) que verifica:

(K,+) es grupo abeliano.

(K− {0}, ·) es también grupo abeliano.

La operación · es distributiva respecto de +.

Page 48: ALyMD

44 Estructuras Algebraicas

Daremos las siguientes propiedades de los cuerpos (sin demostración).

Proposición 2.51.

1. Los cuerpos no tienen divisores de cero.

2. En un cuerpo, las ecuaciones ax = b y xa = b con a 6= 0 tienen soluciónúnica.

Ejemplos 2.52.

1. Los cuerpos finitos Zp, donde p es un número primo, se usan en dis-tintas aplicaciones de las matemáticas a las ingenierías, aunque sequedan fuera del ámbito de esta asignatura.

2. Q, R y C son cuerpos. El cuerpo más conocido y que más usaremosserá el de los números reales (R,+, ·). En este curso vamos a haceruna extensión de dicho cuerpo de los números reales al cuerpo de losnúmeros complejos (C,+, ·).

2.4. El cuerpo de los números complejos

Los números reales tienen muchas propiedades agradables. Hay ope-raciones tales como suma, resta, multiplicación, así como la división porcualquier número real, excepto cero. Hay leyes útiles que regirán estas ope-raciones como las leyes conmutativa y distributiva. También puede tomarlos límites y hacer Cálculo. Pero no se puede tomar la raíz cuadrada de −1o lo que es lo mismo no puede encontrar una raíz de la ecuación

x2 + 1 = 0. (2.6)

La mayoría de vosotros ha oído que hay un ”nuevo"número i (llamada raizimaginaria) que es una raíz de la ecuación anterior. Es decir, i2 + 1 = 0 oi2 = −1. Vamos a demostrar que cuando el cuerpo de números reales seamplía a un nuevo cuerpo llamado los números complejos, que incluye i, nosólo ganamos un número con propiedades interesantes, sino que, además,no se pierde ninguna de las propiedades agradables que hemos tenido an-tes.

2.4.1. Definiciones y propiedades algebraicas

Hay muchas maneras equivalentes a pensar un número complejo, cadauna de las cuales es útil en por derecho propio. Comenzamos con la de-finición formal de un número complejo. A continuación, interpretaremosesta definición formal en otra más útil y más fácil de trabajar con lenguajealgebraico.

Page 49: ALyMD

2.4 El cuerpo de los números complejos 45

Los números complejos se pueden definir como pares de números reales,

C = {(x, y) : x, y ∈ R},

equipada con la adición

(x, y) + (a, b) = (x + a, y + b)

y la multiplicación

(x, y) · (a, b) = (xa− yb, xb + ya).

Estas Podemos pensar que losnúmeros reales seincrustan en C como losnúmeros complejos cuyasegunda coordenada escero.

operaciones binarias en C son es un extensión de las de R, en el sen-tido de que los números complejos de la forma (x, 0) se identifican con losnúmeros reales y

(x, 0) + (y, 0) = (x + y, 0) y (x, 0) · (y, 0) = (xy, 0).

Teorema 2.53. El conjunto C antes definido, dotado de las operaciones de suma yproducto anteriores tiene una estructura de cuerpo (C,+, ·).

Además podemos añadir:

(0, 0) es el elemento neutro para la suma.

(1, 0) es el elemento neutro para el producto (también llamado unidad).

El opuesto de (x, y) es (−x,−y) (simétrico para la suma).

El inverso (simétrico para el producto) de (x, y) 6= (0, 0) es

(x, y)−1 =(

xx2+y2 , −y

x2+y2

).

Si pensamos en el espíritu de nuestra observación sobre la inclusiónde R en C, es decir, de (x, 0) e (y, 0) como la números reales x e y, estosignifica que podemos escribir cualquier número complejo ( x, y ) comolineal combinación de (1, 0) y (0, 1),

(x, y) = (x, 0) · (1, 0) + (y, 0) · (0, 1)

Así que si le damos a (0, 1) un nombre especial i, también llamado unidadimaginaria, entonces el número complejo que que llamábamos (x, y) puedeescribirse como

x · 1 + y · i,

Page 50: ALyMD

46 Estructuras Algebraicas

o, más corto, x + iy. Esta manera de expresar los números complejos reci-be el nombre de expresión o forma rectangular o, a veces, expresión o formabinomial.

El número real x se llama la parte real y al número real y parte imagi-naria del número complejo x + iy, a menudo denotado como

Re(x + iy) = x e Im(x + iy) = y.

La manera de expresar un número complejo en parte real y parte imagina-ria de También es fácil probar que i = (0, 1) es la raiz de de la ecuación(2.6), es decir

i2 = (0, 1) · (0, 1) = (−1, 0) = −1.

Teorema 2.54 (Fundamental del Álgebra). Todo polinomio no constante de gra-do n tiene n raíces (contando multiplicidad) en C.Se dice que C es

algebraicamente cerrado.La demostración de este teorema requiere una maquinaria importante,

curiosamente más del cálculo que del álgebra, por lo que se pospone dichaprueba.

2.4.2. Del álgebra a la geometría y viceversa

La notación (x, y) de los complejos sugiere que se puede pensar en és-te como un vector real de dos dimensiones. Al trazar estos vectores en elplano R2, llamamos al eje x el eje real y al eje y el eje imaginario. La sumaque se definió para los números complejos coincide con la suma de vecto-res. Pero este parecido acaba con la multiplicación: no hay multiplicación”usual"de dos vectores en R2 que devuelva otro vector, y, por supuesto,ninguno que esté de acuerdo con nuestra definición de el producto de dosnúmeros complejos.

Cualquier vector en R2 se define por sus dos coordenadas, pero tambiénse determina por su longitud y el ángulo que forma con, por ejemplo, el ejereal positivo, vamos a definir estos conceptos más a fondo.

Valor absoluto y argumento. El valor absoluto (a veces también llamado elmódulo) de z = x + iy es su longitud visto como vector de R2

r = |z| =√

x2 + y2 ∈ R+ ∪ {0}

y un argumento de z = x + iy es un número θ ∈ R tal que

x = r cos θ e y = r sen θ.

Un número complejo tiene un número infinito de argumentos, por ejemplo,el número 1= 1 + 0i se encuentra en el eje x, y también lo ha hecho el

Page 51: ALyMD

2.4 El cuerpo de los números complejos 47

argumento 0, pero podría muy bien decir tiene argumento 2π, 4π, −2π,o 2kπ para cualquier entero k. El número 0 = 0 + 0i tiene un módulo 0,y cada número θ es un argumento. Aparte del caso excepcional de 0, paracualquier complejo número z, los argumentos de z todos difieren en unmúltiplo entero de 2π.

Para cada número complejo z llamaremos arg z al conjunto de todos losargumentos. En realidad arg : C → R es una relación que no es una fun-ción. Por convenio, para z 6= 0, se establece el argumento principal como el(único) argumento θ que pertenece al intervalo θ ∈ (−π, π]. Al argumento

RepresentamosC∗ = C− {0}.

principal se le suele representar como Arg z : C∗ → (− π, π] ⊆ R que sí esuna función.

En la figura 2.6 se puede observar el significado geométrico del móduloy del argumento.

El valor absoluto de la diferencia de dos vectores tiene una interesanteinterpretación geométrica:

Proposición 2.55. Sean z1, z2 ∈ C dos números complejos considerados comovectores en R2. Si d(z1, z2) denota la distancia entre (los extremos de) los dosvectores en R2 (Véase la Figura 2.5). Entonces

d(z1, z2) = |z1 − z2| = |z2 − z1|

Demostración. Sea z1 = x1 + iy1 y z2 = x2 + iy2. A partir de la geometríasabemos que d(z1, z2) =

√(x1 − x2)2 + (y1 − y2)2 y ésta es justamente la

definición de los |z1 − z2| .Ya que (x1 − x2)2 = (x2 − x1)

2 y (y1 − y2)2 = (y2 − y1)2, también tene-

mos |z1 − z2| = |z2 − z1|. Simplemente dice que el vector desde z1 hasta z2tiene la misma longitud que su inversa, el vector desde z2 hasta z1. �

Parte real

Parte imaginaria

z1

z2

|z1 − z2|

z1 − z2

Figura 2.5: El valor absoluto de la diferencia mide la distancia entre doscomplejos.

La interpretación geométrica de los números complejos en forma devalor absoluto y argumento nos permite dar un significado al producto de

Page 52: ALyMD

48 Estructuras Algebraicas

complejos:

Observa que se usan las

identidadestrigonométricas del seno y

coseno de la suma.

(x1 + iy1)(x2 + iy2) = (r1 cos θ1 + ir1 sen θ1)(r2 cos θ2 + ir2 sen θ2) =

= (r1r2 cos θ1 cos θ2 − r1r2 sen θ1 sen θ2)+

+ i(r1r2 cos θ1 sen θ2 + r1r2 sen θ1 cos θ2) =

= r1r2 (cos(θ1 + θ2) + i sen(θ1 + θ2)) .

Por lo tanto el valor absoluto del producto es r1r2 y su argumento esθ1 + θ2 (uno de ellos). Geométricamente, estamos multiplicando las longi-tudes de los dos vectores que representan los dos números complejos, ysumando sus ángulos medidos con respecto al eje x positivo.

Teniendo en cuenta el cálculo anterior, en principio por abreviar, se in-troduce una nueva notación (conocida como fórmula de Euler)

eiθ = cos θ + i sen θ.

Veremos más adelante que tiene una íntima relación con la función exponen-cial compleja, pero de momento no es más que una notación.

Dejamos como ejercicio para los estudiantes la prueba de las siguientespropiedades

Ejercicio 2.56. Para cualquier θ, θ1, θ2 ∈ R,

1. eiθ1 eiθ2 = ei(θ1+θ2).

2.1

eiθ = e−iθ .

3. ei(θ+2kπ) = eiθ .

4. |eiθ | = 1

Teniendo en cuenta la anterior notación diremos que un número complejoestá expresado en forma trigonométrica o forma polar si se expresa a partir de suvalor absoluto r y uno de sus argumentos θ de la siguiente forma z = reiθ .

Para pasar de forma rectangular de complejo z = x + iy, que no seanulo, a su forma polar z = reiθ y viceversa usamos las igualdades

Conocidos r, θ Conocidos x, yr2 = x2 + y2

x = r cos θ tan θ =yx

, si x 6= 0

y = r sen θ θ =π

2, si x = 0 e y > 0

θ = −π

2, si x = 0 e y < 0

Basándose en lo anterior es de muy fácil demostración los siguientesresultados:

Page 53: ALyMD

2.4 El cuerpo de los números complejos 49

Proposición 2.57. Si z1 y z2 son dos complejos en forma polar, z1 = r1eθ1 yz2 = r2eθ2 , entonces

z1z2 =(r1eθ1

) (r2eθ2

)= r1r2eθ1+θ2

Re

Imz1

z2

z1z2

|z1||z2|

θ1 θ2

θ1 + θ2

Proposición 2.58 (Fórmula de De Moivre). Para cualquier ángulo θ se tiene:

(cos θ + i sen θ)n = cos(nθ) + i sen(nθ).

Ejercicio 2.59. Utiliza los resultados del ejercicio 2.56 para obtener las fórmulasdel ángulo triples:

1. cos 3θ = cos3 θ − 3 cos θ sen2 θ. 2. sen 3θ = 3 cos2 θ sen θ − sen3 θ.

Complejo conjugado. El cuadrado del valor absoluto de un complejo tie-ne la buena propiedad

|x + iy|2 = x2 + y2 = (x + iy)(x− iy).

Se denota el complejo conjugado como

x + iy = x− iy.

Geométricamente, la conjugación z significa que se refleja el vector co-rrespondiente a z con respecto a la eje real.

Ejercicio 2.60. Para cualesquiera z, z1, z2 ∈ C,

1. z1 ± z2 = z1 ± z2.

2. z1 · z2 = z1 · z2.

3.(

z1z2

)= z1

z2.

4. z = z.

5. |z| = |z|.

6. |z|2 = z z.

Page 54: ALyMD

50 Estructuras Algebraicas

7. Re z = 12 (z + z),

8. Im z = 12i (z− z).

9. eiθ = e−iθ .

El dibujo de la figura 2.6 nos da una idea de un número complejo y suconjugado, así como alguna propiedad de desigualdad geométrica

−|z| ≤ Re z ≤ |z| y − |z| ≤ Im z ≤ |z|

Re

Im

θ

y|z|

z

−y

z

−θ

xx = Re z, y = Im zθ = Arg(z) con tan(θ) =

yx

El módulo |z| =√

x2 + y2.

Figura 2.6: Un complejo y su conjugado.

De la propiedad 6 del ejercicio 2.60 obtenemos una forma fácil para cal-cular la división de complejos.

z1

z2= 1|z2|2 z1z2.

Ejercicio 2.61. Calcula la siguiente división compleja1 + i

ide dos formas distin-

tas, en forma polar y usando la anterior propiedad. Expresa el resultado en formarectangular y en forma polar.

Y, por último, obtenemos las siguientes desigualdades clásicas:

Proposición 2.62. Para z1, z2, · · · ∈ C, tenemos las siguientes desigualdades:

(a) La desigualdad triangular: |z1 + z2| ≤ |z1|+ |z2|.

(b) Forma general de la desigualdad triangular: | ± z1 ± z2| ≤ |z1|+ |z2|.

(c) La desigualdad triangular inversa: | ± z1 ± z2| ≥ |z1| − |z2|.

(d) La desigualdad triangular para las sumas:

∣∣∣∣∣ n

∑k=1

zk

∣∣∣∣∣ ≤ n

∑k=1|zk|.

Page 55: ALyMD

2.4 El cuerpo de los números complejos 51

Demostración.

(a) Usamos algunas propiedades vistas en el Ejercicio 2.60.

|z1 + z2|2 = (z1 + z2)(z1 + z2) = (z1 + z2)(z1 + z2) =

= |z1|2 + z1z2 + z1z2 + |z2|2 =

= |z1|2 + 2Re (z1z2) + |z2|2 ≤≤ |z1|2 + 2|z1| |z2|+ |z2|2 =

= (|z1|+ |z2|)2

(b) Se obtiene de la anterior, con más que considerar que | ± z| = |z|.

(c) |z1| = |z1 − z2 + z2| ≤ |z1 − z2|+ |z2| de donde se obtiene que

|z1 − z2| ≥ |z1| − |z2|.

Las restantes desigualdades se obtienen a partir de ésta con más queconsiderar | ± z| = |z|.

(d) Procedemos por inducción.

Para n = 2 no es más que la desigualdad triangular (a).Hipóteisis de inducción:

Suponemos

∣∣∣∣∣ r

∑k=1

zk

∣∣∣∣∣ ≤ r

∑k=1|zk| para 2 ≤ r < n.

Para n > 2, tenemos (usando nuevamente (a))∣∣∣∣∣ n

∑k=1

zk

∣∣∣∣∣ =∣∣∣∣∣n−1

∑k=1

zk + zn

∣∣∣∣∣ ≤∣∣∣∣∣n−1

∑k=1

zk

∣∣∣∣∣+ |zn| ≤n−1

∑k=1|zk|+ |zn| =

n

∑k=1|zk|.

Proposición 2.63. Sea p(x) = a0 + a1x + a2x2 + · · ·+ anxn un polinomio contodos sus coeficientes ai números reales. Si z ∈ C es una raíz de p(x), entonces suconjugado z es también raíz.

Demostración. Si z = reiθ , entonces

p(z) = a0 + a1reiθ + a2r2ei2θ + · · ·+ anrneinθ = 0 (2.7)

Además

p(z) = a0 + a1re−iθ + a2r2e−i2θ + · · ·+ anrne−inθ = b ∈ C. (2.8)

Sumando y restando (2.7) y (2.8) nos da, respectivamente

b = 2a0 + 2a1r cos θ + 2a2r2 cos(2θ) + . . . 2anrn cos(nθ) (que es real)

b = −i(2a1r sen θ + 2a2r2 sen(2θ) + . . . 2anrn sen(nθ)

)(que es imaginario)

por tanto, b = 0, que prueba que z es también raíz. �

Page 56: ALyMD

52 Estructuras Algebraicas

2.4.3. Función exponencial

Damos por conocida la función exponencial real y, sobre todo, sus pro-piedades. Nuestro objetivo es extender esta función a una nueva definidaen los complejos (con imagen compleja) que extienda a la real ya conocida,a la que añadimos que sea compatible con la fórmula de Euler, ya definida,

eiy = cos y + i sen y.

Definición 2.64. La función exponencial (compleja) se define para cual-quier complejo z = x + iy como

exp z = exp(x + iy) = exeiy = ex(cos y + i sen y).

Efectivamente, esta definición extiende a la de los reales.

exp(x) = exp(x + i0) = ex(cos 0 + i sen 0) = ex.

Además la fórmula de Euler es un caso particular de la exponencial com-pleja

exp(ix) = eix

Las propiedades ya conocidas de la exponencial real se extienden a la com-pleja (y algunas otras nuevas)

Proposición 2.65. Por todo z, z1, z2 ∈ C,

1. exp z1 exp z2 = exp(z1 + z2).

2.1

exp z= exp(−z).

3.exp z1

exp z2= exp(z1 − z2).

4. exp(z + 2πi) = exp z.

5. | exp z| = exp(Re z).

6. exp z 6= 0 para cada z ∈ C.

7. exp′ z = exp z.

Demostración. Ejercicios. �

Hacemos las siguientes observaciones:

1. La cuarta identidad es muy especial y no tiene equivalente en el casoreal. Se dice que la función exponencial compleja es periódica conperíodo 2πi. Esto tiene muchas consecuencias interesantes, entre ellasque la función exponencial compleja no es inyectiva.

2. La última igualdad hace referencia a la derivada de la función expo-nencial compleja. Aunque está fuera de los contenidos de este curso,lo mostramos por remarcar los "parecidos” y las "diferencias” entre laexponencial real y la compleja.

Page 57: ALyMD

2.4 El cuerpo de los números complejos 53

x

iy

r1r2r3r4r5

r6

exp(z)x

iy

r1r2

r3

r4r5

r6

x

iy

r1 r2 r3 r4 r5

exp(z)

x

iy

r1r2

r3r4

r5

Figura 2.7:

3. Las figuras en 2.7 muestan como la exponencial compleja transformarectas del plano complejo horizontales y verticales en otros subcon-juntos de puntos de los complejos.

Ejercicio 2.66. Describe las imágenes de los siguientes conjuntos bajo la funciónexponencial exp z:

a) el segmento definido por z = iy, 0 ≤ y ≤ 2π.

b) el segmento definido por z = 1 + iy, 0 ≤ y ≤ 2π.

c) el rectángulo {z = x + iy ∈ C : 0 ≤ x ≤ 1, 0 ≤ y ≤ 2π}.

2.4.4. Funciones trigonométricas y trigonométricas hiperbólicas

Las funciones trigonométricas reales seno, coseno, tangente, cotangen-te, etc. tienen sus análogas complejas, aunque no juegan el mismo papelprominente como en el caso real. De hecho, podemos definirlos como sim-plemente ser combinaciones especiales de la función exponencial.

Definición 2.67. El seno y coseno (complejo) se definen como

Page 58: ALyMD

54 Estructuras Algebraicas

sen z =12i

(exp(iz)− exp(−iz))

cos z =12(exp(iz) + exp(−iz)).

Las funciones tangente y cotangente se definen

tan z =sen zcos z

= −iexp(2iz)− 1exp(2iz) + 1

cot z =cos zsen z

= iexp(2iz) + 1exp(2iz)− 1

,

respectivamente.

Ejercicio 2.68. Prueba las igualdades anteriores referidas a la tangente y cotagen-te. Para ello usa la igualdad (exp z)(exp(−z)) = e0 = 1.

Prueba, igualmente, que las funciones trigonométricas definidas extienden alas funciones trigonométricas reales.

Las principales propiedades de las funciones trigonométricas reales tam-bién se cumplen para funciones trigonométricas complejas, como se ve eneste lema,

Lema 2.69. Pora todo complejo z, z1, z2 ∈ C,

1. sen(−z) = − sen z

2. cos(−z) = cos z

3. sen(z + 2π) = sen z

4. cos(z + 2π) = cos z

5. tan(z + π) = tan z

6. cot(z + π) = cot z

7. sen(z + π/2) = cos z

8. cos(z + π/2) = − sen z

9. sen(z1 + z2) = sen z1 cos z2 + cos z1 sen z2

10. cos(z1 + z2) = cos z1 cos z2 − sen z1 sen z2

11. sen2 z + cos2 z = 1

12. cos2 z− sen2 z = cos(2z)

13. sen′ z = cos z

14. cos′ z = − sen z

Demostración. Ejercicio (prueba algunas). �

Obsérvese que las funciones trigonométricas seno y coseno son periódi-cas de periodo 2π al igual que las funciones trigonométricas reales. Igual-mente las funciones complejas tan z y cot z son periódicas de periodo π.

Page 59: ALyMD

2.4 El cuerpo de los números complejos 55

En cambio la propiedad de ser acotada que tiene las funciones realesseno y coseno (| sen x| ≤ 1 y | cos x| ≤ 1) no es verdad para las funcionescomplejas sen z y cos z (por ejemplo, | sen(iy)| → ∞ cuando y→ ±∞).

Definición 2.70. Definimos las funciones trigonométricas hiperbólicas (seno,coseno, tangente y cotagente hiperbólicas), como

senh z =12(exp z− exp(−z))

cosh z =12(exp z + exp(−z))

tanh z =sinh zcosh z

=exp(2z)− 1exp(2z) + 1

coth z =cosh zsenh z

=exp(2z) + 1exp(2z)− 1

respectivamente. Como es habitual estas funciones complejas extienden asus homónimas reales.

Ejercicio 2.71. Prueba las siguientes igualdades

a) cosh2 z− senh2 z = 1. b) cosh(iz) = cos z. c) senh(iz) = i sen z.

2.4.5. Logaritmos y exponenciales de base

El logaritmo complejo es una función que vamos a que es de un carácterun tanto complicado. Está motivada por ser la función inversa de la funciónexponencial, es decir, que estamos buscando una función de registro demanera que

exp(log z) = z = log(exp z). (2.9)

Como veremos en breve, esto es esperar demasiado. Vamos a escribir,como de habitual, Sea z = reiθ siendo z 6= 0, y supongamos que log z =u(z) + iv(z). Tenemos entonces que

exp(log z) = eueiv = reiθ

de donde obtenemos que u = ln r = ln |z|, que está definido como unlogaritmo neperiano de un número positivo. Por otro lado, v coincidiría conel argumento de z, pero sabemos que este no es único, por tanto, podemosdefinir la multifunción logaritmo del siguiente modo

log z = ln |z|+ i arg z.

Page 60: ALyMD

56 Estructuras Algebraicas

Podemos interpretar esta función logaritmo como muchas funciones dis-tintas y a cada una se le llama rama logarítmica y cualquiera de estas ramasverifican la condición de inversa que pedíamos en 2.9. Entre todas estas ra-mas se suele destacar la llamada el logaritmo principal escrito con la primeraletra mayúscula

Log z = ln |z|+ i Arg z.

Dicho de otro modo, el logaritmo principal de un complejo es la rama cuyaparte imaginaria está en el intervalo (−π, π].

Como viene siendo habitual, el logaritmo principal extiende al logarit-mo (neperiano) real, puesto que el argumento principal de un real positivoes cero.

Ejercicio 2.72. Comprueba que el logaritmo principal de un número negativo x =−|x| es el siguiente

Log x = ln |x|+ iπ

Ejercicio 2.73. ¿Se siguen verificando las propiedades clásicas del logaritmo ne-periano en el logaritmo principal? Por ejemplo, ¿es cierto que Log(z2) = 2 Log z?

Estudia si otras propiedades clásicas se siguen verificando.

Exponenciales de base.

Dado un número complejo a ∈ C∗ definimos la exponencial complejade base a como

az = exp(z log a)

que, evidentemente, es una multifunción por serlo log a. Llamamos valorprincipal de az = exp(z Log a), es decir, el obtenido usando el logaritmoprincipal. Salvo que se diga lo contrario, se entiende por az el valor princi-pal de la exponencial de base a.

e = lımn→∞

(1 +

1n

)n

= ∑k≥0

1k!

.

Notemos que, si usamos el número e de Euler como base, el valor prin-cipal de su exponencial es justamente la función exponencial compleja, vea-mos:

ez = exp(z Log e) = exp(z(ln e + i0)) = exp z.

Ejercicios Propuestos

Relaciones y Funciones

Ej. 2.1 — Dados los conjuntos X = {2, 3, 4} e Y = {3, 4, 5, 6, 7} definimosla relación de X en Y: “xR y si y sólo si x divide a y”. Escribe los elementosdel grafo de la relación y una representación gráfica de la misma.

Page 61: ALyMD

2.4 El cuerpo de los números complejos 57

Ej. 2.2 — Verificar si las siguientes relaciones definidas sobre el conjuntode los números enteros cumplen las propiedades reflexiva, simétrica, anti-simétrica o transitiva.

1. aR1 b⇔ a = b2

2. aR2 b⇔ a > b3. aR3 b⇔ 3 divide a a− b

Ej. 2.3 — (Feb. 2012) Dado el conjunto A = {1, 2, 3, 4, 5, 6}, se considera larelación R sobre A, tal que, para todo a, b ∈ A, aR b si, y sólo si, a + b esdivisible por 6.

1. Calcula los pares de la relación R. Justifica por qué R no es unarelación de equivalencia.

2. Añade los pares necesarios para que sea una relación de equivalen-cia.

3. Define el conjunto cociente.

Ej. 2.4 — En el conjunto A = {1, 2, 3, 4} se define la relación binaria:

R = {(1, 1), (2, 2), (2, 3), (2, 4), (3, 2), (3, 3), (3, 4), (4, 2), (4, 3), (4, 4)}.

Justifica que R es una relación binaria de equivalencia y halla el conjuntocociente. Dibuja una representación gráfica de la relación.

Ej. 2.5 — Demuestra que la relación de divisibilidad en N− {0}:

a | b si y sólo si b = na para algún n ∈N

es una relación de orden e indica si es total o parcial. Representa gráfica-mente la relación restringida al subconjunto {1, 2, 3, 4, 6, 12}.

Ej. 2.6 — En Z se define la relación “xR y si y sólo si x2 − y2 = x− y” ¿esR una relación de equivalencia? En caso afirmativo, calcular los elementosde la clase [a].

Ej. 2.7 — (Sept. 2012) Dados los conjuntos A = {1, 2, 3, 4, 5} y B = {6, 7, 8, 9},encuentra, si es posible, elementos a, d ∈ A y b, c ∈ B tales que la relaciónR f = {(1, 8), (2, 6), (2, b), (4, 7), (a, c), (d, 8)} ⊆ A× B cumpla que:

1. R f no sea una función.2. R f sea una función inyectiva.3. R f sea una función, pero no sea sobreyectiva.

Ej. 2.8 — Pon, si es posible, un ejemplo de una función de R → R (realesde variable real) en cada uno de los siguientes casos:

Page 62: ALyMD

58 Estructuras Algebraicas

a) Inyectiva pero no sobreyectiva.b) Sobreyectiva pero no inyectiva.c) Ni inyectiva ni sobreyectiva.

Ej. 2.9 — Representa gráficamente, en un sistema cartesiano, las siguientesrelaciones. Calcula su dominio e imagen. Indica cuáles son funciones en sudominio.

a)R1 = {(1, 3), (2, 2), (1, 5), (3, 5)} ⊆E × F, siendo E = {1, 2, 3} yF = {2, 3, 4, 5}.

b)R2 = {(x, y) ∈ R2 | y = cos x} .c)R3 = {(x, y) ∈ R2 | y2 − x = 1}.

d)R4 = {(x, y) ∈ R2 | x− y2 = 1}.

e)R5 = {(x, y) ∈ R2 | y2 + x2 = 4}.

f)R6 = {(x, y) ∈ R2 | x2 + y2 ≤ 4}.

g)R7 = {(x, y) ∈ R2 | y + x = 2}.

Ej. 2.10 — Si consideramos las funciones de R en R cuyas gráficas seanrectas, ¿son todas aplicaciones biyectivas?

Ej. 2.11 — Prueba que la función f : [0, ∞)→ (0, 1] definida f (x) = 1x+1 es

inyectiva. ¿Es sobreyectiva?

Ej. 2.12 — Clasifica por el tipo las siguientes funciones:

a) f : R → R+ ∪ {0}, definidaf (x) = |x− 1|.

b) g : C→ C, definida f (z) = z.

c) h : C→ R, definida f (z) = zz.

d) t : N→ Z, definida

t(n) ={ n

2 si n par− n+1

2 si n impar

Estructuras algebraicas

Ej. 2.13 — En el conjunto de los números naturales se definen las siguien-tes leyes de composición. Determina si son leyes de composición interna yen el caso que lo sean estudiar si cumplen la propiedad asociativa, conmu-tativa y poseen elemento neutro.

1. a ∗ b = ab 2. a ∗ b = a

Ej. 2.14 — Sea E = {a, b, c, d} y P(E) el conjunto de las partes de E. De-termina los elementos regulares de P(E) respecto de la operación unión ∪.Igual respecto de la intersección ∩.

Ej. 2.15 — En el conjunto E = {(x, y) ∈ R2 : x 6= 0} se define la operación:

(a, b) ∗ (c, d) = (ac, ad + bc)

Comprueba que (E, ∗) es un grupo.

Page 63: ALyMD

2.4 El cuerpo de los números complejos 59

Ej. 2.16 — Encuentra los inversos de cada uno de los elementos del grupomultiplicativo Z11

∗.

Ej. 2.17 — Resuelve en el cuerpo Z11 el siguiente sistemas de ecuaciones:

2x− 7y = 13x + y = 9

}Nota: Todos los números pertenecen al cuerpo Z11.

Ej. 2.18 — Comprobar que el subconjunto de las matrices 3× 3 siguiente

R =

a 0 b

0 a c0 0 a

| a, b, c ∈ R

es un anillo unitario. ¿Es conmutativo? ¿Es cuerpo?

Números complejos

Ej. 2.19 — Prueba que las raíces n-simas de la unidad (complejas), es decir,las soluciones de la ecuación zn = 1, con z ∈ C, forman un grupo abelianocon la operación producto.

Ej. 2.20 — (Feb2013) Consideremos el subconjunto de los números com-plejos G = {1,−1, i,−i} con la operación de multiplicación habitual.

1. Pruebe que (G, ·) es un grupo abeliano.2. Consideremos la función f : G → G definida f (z) = z2. Justifice si f

es o no es biyectiva y encuentre, si existe, la función inversa f−1.

Ej. 2.21 — Escribe en forma polar:

a) 2i.b) 1 + i.c) −3 +

√3i.

d) −i.e) (2− i)2.f) |3− 4i|.

g)√

5− i.

h)(

1− i√3

)4

.

Ej. 2.22 — Encuentra todas las soluciones (en forma rectangular) de lasecuaciones:

a) z6 = 1.b) z4 = −16.

c) z6 = −9.d) z6 − z3 − 2 = 0.

Ej. 2.23 — Dibuja los siguientes conjuntos en el plano complejo:

Page 64: ALyMD

60 Estructuras Algebraicas

1. {z ∈ C : |z− 1 + i| = 2}.2. {z ∈ C : |z− 1 + i| ≤ 2}.3. {z ∈ C : Re(z + 2− 2i) = 3}.

4. {z ∈ C : Im(z + 2− 2i) = 3}.5. {z ∈ C : |z− i|+ |z + i| = 3}.6. {z ∈ C : |z| = |z + 1|}.

Ej. 2.24 — Prueba que sen z = sen(z) y cos z = cos(z).

Ej. 2.25 — Sea z = x + iy. Prueba que

1. sen z = sen x cosh y + i cos x senh y.

2. cos z = cos x cosh y− i sen x senh y.

Ej. 2.26 — Determina la imagen de la cinta {z ∈ C : −π/2 < Re z < π/2}bajo la función f (z) = sen z.

Ej. 2.27 — ¿Hay alguna diferecia entre log(z2) y 2 log z?

Ej. 2.28 — Halla la imagen del anillo 1 < |z| < e bajo el logaritmo princi-pal.

Ej. 2.29 — Encuentra los valores principales de

a) log i. b) (−1)i. c) log(1 + i).

Ej. 2.30 — Prueba que |az| = aRe z si a es una constante real positiva.

Ej. 2.31 — Encuentra todas las soluciones de las siguientes ecuaciones:

a) Log(z) =π

2i. b) exp(z) = πi. c) z1/2 = 1 + i.

Page 65: ALyMD

TEMA 3

TÉCNICAS DE RECUENTO

Índice3.1. Principios básicos . . . . . . . . . . . . . . . . . . . . . . 62

3.1.1. Principio del palomar . . . . . . . . . . . . . . . 62

3.1.2. Principio de la suma . . . . . . . . . . . . . . . . 63

3.1.3. Principio del producto . . . . . . . . . . . . . . . 64

3.2. Permutaciones y combinaciones . . . . . . . . . . . . . . 64

3.2.1. Permutaciones ordinarias . . . . . . . . . . . . . 65

3.2.2. Permutaciones con repetición . . . . . . . . . . . 66

3.2.3. Permutaciones con objetos repetidos . . . . . . . 67

3.2.4. Combinaciones ordinarias . . . . . . . . . . . . . 68

3.2.5. Combinaciones con repetición . . . . . . . . . . . 71

3.2.6. Números multinomiales . . . . . . . . . . . . . . 72

3.3. Principio de inclusión y exclusión . . . . . . . . . . . . . 73

3.3.1. Desarreglos: nada en su lugar . . . . . . . . . . . 73

3.3.2. Número de funciones sobreyectivas . . . . . . . 74

3.4. Particiones y números de Stirling . . . . . . . . . . . . . 76

3.4.1. Números de stirling de primera especie . . . . . 77

3.4.2. Números de Bell . . . . . . . . . . . . . . . . . . 78

3.5. Ecuaciones de Recurrencia . . . . . . . . . . . . . . . . . 78

3.5.1. Objetivo . . . . . . . . . . . . . . . . . . . . . . . 80

3.5.2. E.R.L. Homogéneas . . . . . . . . . . . . . . . . . 81

3.5.3. E.R.L. No Homogéneas . . . . . . . . . . . . . . . 85

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 91

61

Page 66: ALyMD

62 Técnicas de Recuento

3.1. Principios básicos

Entendemos por técnicas de recuento aquellas que nos permiten contaro calcular el número de situaciones posibles que se pueden dar al realizarciertas tareas. Por ejemplo, si queremos desbloquear un dispositivo prote-gido con una clave de exactamente cuatro dígitos (es decir números de 0a 9) ¿cuántos intentos aleatorios podríamos llegar a realizar? o bien ¿has-ta cuántos mensajes distintos pueden convenirse entre dos veleros usandotres banderas de diferente color colgadas del mástil?

Podríamos decir que el primer principio básico para resolver ciertosproblemas es el “sentido común” o algún método constructivo diseñadopor nosotros mismos.

El primer ejemplo se resuelve fácilmente sabiendo que las distintas cla-ves están entre los números 0000 y 9999, luego existen diez mil posiblesclaves.

El segundo ejemplo podría ser algo más complicado. Si usamos una so-la bandera tenemos 3 mensajes (uno por cada color), usando dos banderaspodemos establecer 3× 2 = 6 mensajes, puesto que cada una de las tresbanderas podemos combinarla con cada una de las otras dos y, del mismomodo, usando tres banderas disponemos de otros 6 posibles mensajes. Aestos 3 + 6 + 6 = 15 mensajes usando al menos una bandera, hay que aña-dir un mensaje más que se puede establecer cuando no hay ninguna ban-dera. Resumiendo, se pueden convenir hasta 16 mensajes con tres banderasde diferente color.

Ejercicio 3.1. Usa el sentido común¡Tan fácil como parece! para calcular cuántos mensajes se puedenestablecer con tres banderas iguales y del mismo color.

Presentamos a continuación unos principios básicos clásicos.

3.1.1. Principio del palomar

Si consideramos dos conjuntos finitos, A y B, y una función entre ellos,f : A→ B, entonces

si |A| > |B| entonces que f no es inyectiva.

Equivalentemente, si m objetos se reparten en n cajas, con m > n, entoncesal menos una caja contiene dos o más objetos. La forma usual de enunciareste principio, que resulta mucho más fácil de recordar y que le da nombre,es la siguiente:

Page 67: ALyMD

3.1 Principios básicos 63

Si en un palomar hay más palomas que nidos, al menos en un nido debeencontrarse más de una paloma.

Este principio, que se conoce como Principio de las cajas de Dirichlet (1805-1859) o Principio del palomar, puede ayudar a resolver problemas aparente-mente complejos.

Ejemplo 3.2. En un recinto con forma de hexágono regular de 100 metrosde lado se encuentran siete robots que se desplazan independientemente yse comunican a través de señales de radio. Cada robot tiene una coberturade al menos 100 metros. Demuestre que en todo momento hay al menosdos robots que se pueden comunicar entre sí.

SOLUCIÓN: Consideramos el hexágono regular100mde 100 metros de lado dividido en 6 triángu-

los conforme la figura anexa. Estos triángulosserían “los nidos” y los robots serían “las palo-mas”. Evidentemente hay más palomas que ni-dos, por lo que, al menos, dos han de compartirnido. Eso nos asegura que dos robots están en el mismo triángulo (equilá-tero, de lado 100), luego su distancia será menor o igual a 100 metros.

Ejemplo 3.3. ¿Cuántos dígitos distintos de 1 a 9 tenemos que seleccionarpara garantizar que hay dos que suman 10?

SOLUCIÓN: Existen 4 formas distintas de sumar 10 (con 2 dígitos distintos),que son: [1 + 9], [2 + 8], [3 + 7] y [4 + 6]. Consideramos cada una de estasformas un “nido” al que incorporamos el “nido” [5], que no suma diez,pero es un dígito que puede aparecer. Las “palomas” serán, entonces, losdígitos elegidos de 1 a 9 que ocuparán su correspondiente nido. Claramen-te, cuando dos palomas ocupan el mismo nido, su suma es diez, por tanto,necesitamos seleccionar seis dígitos distintos para garantizar que al menosdos de ellos suman 10.

Ejercicio 3.4. En las condiciones del ejemplo 3.3, ¿cuántos dígitos tenemos queseleccionar para garantizar que dos de ellos suman 7?

3.1.2. Principio de la suma

La propiedad sobre cardinalidad de conjuntos:

Si A y B son conjuntos finitos disjuntos, |A ∪ B| = |A|+ |B|

es conocida como el Principio de la Suma.

Page 68: ALyMD

64 Técnicas de Recuento

Ejercicio 3.5. Los alumnos del primer curso se encuentran distribuidos en tresgrupos, A, B y C; con 130, 125 y 150 alumnos respectivamente. Calcule cuántosposibles representantes pueden haber en primero.

3.1.3. Principio del producto

Del mismo modo, la propiedad:

Si A y B son conjuntos finitos, |A× B| = |A| · |B|

es conocida como Principio del Producto.

Ejemplo 3.6. Un Ayuntamiento decide matricular las bicicletas del pueblo.Al alcalde se le ocurre crear matrículas de la forma VCD, donde V es unavocal (5 posibles), C es una consonante (21 posibles) y D es un dígito (10posibles). Así la primera matrícula es AB0 y la última sería UZ9. ¿Cuántasmatrículas distintas pueden existir?

SOLUCIÓN: pueden haber 5× 21× 10 = 1050 matrículas distintas.

Ejercicio 3.7. Un comité de seis personas, A, B, C, D, E y F, debe escoger unpresidente, un secretario y un tesorero. ¿De cuántas formas distintas se puede hacerla elección?

Los principios de la suma y el producto se pueden combinar para resol-ver muchos problemas algo más complicados.

Ejercicio 3.8. En la sitación del ejercicio 3.7, calcula el número de posibles elec-ciones si:

1. El presidente debe ser A o B.

2. E debe ocupar alguno de los cargos.

3. A y F deben ocupar cargos.

(Cada apartado es independiente de los demás).

3.2. Permutaciones y combinaciones

Usa el principio del producto para resolver los siguientes ejercicios.Todos ellos son ejemplosde lo que llamaremos

permutaciones. Ejemplo 3.9. Deseamos repartir tres bolas de colores rojo, verde y azul, endiez urnas con capacidad para una única bola. Las urnas están numeradasdel uno al diez. ¿De cuántas formas distintas se puede llevar a cabo esteexperimento?

Page 69: ALyMD

3.2 Permutaciones y combinaciones 65

u1 u2

iru3 u4 u5

iau6

ivu7 u8 u9 u10

SOLUCIÓN: Al re-partir primero la bo-la de un color dis-ponemos de 10 cajaspara colocar. Para la segunda bola de color nos quedan 9 cajas (porque unaestá ocupada) y para la tercera disponemos de 8 colocaciones. El principiodel producto nos dice que la solución es

10× 9× 8

Ejercicio 3.10. Sean A y B conjuntos finitos de cardinales 3 y 10 respectivamente.¿Cuántas funciones inyectivas se pueden definir de A en B?

Ejercicio 3.11. Si A es un conjunto con cardinal 10 y queremos construir unalista de tres elementos distintos de A, ¿de cuántas formas lo podemos hacer?

3.2.1. Permutaciones ordinarias

En esta sección trabajamos con sucesiones ordenadas que llamamos lis-tas y que representaremos entre los símbolos 〈 y 〉. Así 〈a, b, c〉 6= 〈b, a, c〉.Como es usual, admitimos la existencia de la lista vacía 〈〉.

Definición 3.12. Dado un conjunto A de n elementos y r un número natu-ral, llamaremos: Denotaremos por P(n) al

número de permutacionesde un conjunto con nelementos y P(n, r) alnúmero der-permutaciones de nelementos

permutación de A a toda lista formada por sus n elementos.

r-permutación (o r-variación) de A a cualquier lista formada por r ele-mentos diferentes de A.

Se establecen las siguientes convenciones:

P(0) = 1 y

P(n, 0) = 1 para cada natural n.

Ejemplo 3.13. Consideramos el conjunto A = {a, b, c, d, e}.

〈a, c, d, b, e〉 es una permutación de A.

〈d, b, a〉 es una 3-permutación (o 3-variación) de A.

Definición 3.14 (Número factorial). Para cualquier natural n definimos re-cursivamente el factorial de n como

Si n > 0, n! = n · (n− 1)!

0! = 1

Page 70: ALyMD

66 Técnicas de Recuento

Entonces, para un entero positivo, n! = n · (n− 1) · · · 2 · 1.

Teorema 3.15. Sean n y r números enteros tales que 0 ≤ r ≤ n entonces

P(n) = n! y P(n, r) =n!

(n− r)!.

Demostración. Si r = 0 ya sabemos que P(0) = 0! y P(n, 0) =n!

(n− 0)!.

Si r > 0, por el principio del producto

P(n, r) = n(n− 1) · · · (n− r + 1) =

=n(n− 1) · · · (n− r + 1)(n− r) · · · 2 · 1

(n− r) . . . 2 · 1 =n!

(n− r)!

y, por tanto,P(n) = P(n, n) = n(n− 1) · · · 2 · 1 = n!

que prueba el teorema. �

Ejercicio 3.16. ¿Cuántas funciones biyectivas se pueden definir entre dos conjun-tos de cardinal n?

Ejercicio 3.17. Plantea el ejemplo 3.9 haciendo uso de la definición de r-permuta-ciones.

3.2.2. Permutaciones con repetición

Hemos visto que una r-permutación tiene todos sus elementos diferen-tes. Si admitimos que en las listas podemos hacer repeticiones, el conceptocambia.

Definición 3.18. Dado un conjunto A no vacío de n elementos,Denotamos por PR(n, r) alnúmero de

r-permutaciones conrepetición de n elementos.

llamamosr-permutación con repetición (o r-variación con repetición) de A a cualquier listade r elementos, iguales o diferentes, de A.

Al igual que en el caso de las permutaciones ordinarias, admitimos laposibilidad r = 0. Convenimos, entonces, PR(n, 0) = 1 para cada enteropositivo n.

Ejemplo 3.19. Dado el conjunto A = {a, b, c, d, e}, entonces, 〈d, a, b, d〉 y〈e, a, c, b〉 son 4-permutaciones con repetición de A.

Ejercicio 3.20. Da varios ejemplos de 4-permutaciones con repetición del conjun-to {a, b}.

Page 71: ALyMD

3.2 Permutaciones y combinaciones 67

Teorema 3.21. Sean n entero positivo y r número natural, entonces

PR(n, r) = nr.

Demostración. Si r = 0, entonces PR(n, 0) = 1 = n0. Si r > 0, el resultadoes evidente a partir del principio del producto. �

Ejemplo 3.22. Disponemos de diez urnas diferentes, numeradas del unoal diez. Tenemos, por otro lado, una bola roja, una verde y una azul. Si encada urna podemos colocar más de una bola, ¿de cuántas formas diferentespodemos repartir las bolas entre las urnas?

u1 u2

hrhau3 u4 u5 u6

hnu7 u8 u9 u10

SOLUCIÓN: Apliquemosla regla del producto.Para la primera bola te-nemos 10 urnas entrelas que elegir, para la se-gunda siguen quedan-do 10 urnas, puesto que puedo repetir la que está ocupada. Igualmentepara la tercera bola podemos elegir entre diez urnas. Así la solución es

10× 10× 10 = PR(10, 3) = 103

Ejercicio 3.23. ¿Cuántas funciones se pueden definir desde un conjunto de r ele-mentos a un conjunto de n elementos?

3.2.3. Permutaciones con objetos repetidos

Definición 3.24. Sean n1, n2, . . . , nt números naturales. DenotamosPOR(n1, n2, . . . , nt−1, nt)al número depermutaciones con objetosrepetidos.

Llamamos permuta-ción con objetos repetidos del conjunto {x1, x2, . . . , xt} a cualquier lista queverifique que, para cada 1 ≤ i ≤ t, el elemento xi aparece ni veces.

Si n1 = n2 = · · · = nt = 0, convenimos POR(0, 0, . . . , 0) = 1.

Ejemplo 3.25. Consideramos el conjunto A = {a, b, c, d, e}. Entonces, la lis-ta 〈d, d, a, b, a, b, c, a〉 es una (3, 2, 1, 2, 0)-permutación con objetos repetidosde A.

Teorema 3.26. Sean n y n1, n2, . . . , nt números naturales. Si n = n1 + n2 +· · ·+ nt entonces

POR(n1, n2, . . . , nt) =n!

n1! n2! . . . nt!.

Demostración. Basta agrupar las permutaciones iguales entre las n! del con-junto de n elementos. �

Page 72: ALyMD

68 Técnicas de Recuento

Ejercicio 3.27. ¿De cuántas formas se pueden ordenar las letras de la palabraMISSISIPPI?

Cuando en las listas obtenidas a partir de un conjunto prescindimosdel orden de sus elementos obtenemos lo que se llaman combinaciones. Así,por ejemplo, las listas 〈a, b, c〉 y 〈b, c, a〉 son distintas consideradas comopermutaciones, sin embargo, son la misma combinación.

3.2.4. Combinaciones ordinarias

Definición 3.28. Dado un conjunto X de n elementos,El número der-combinaciones de n

elementos lo denotamos

por C(n, r) =(

nr

)leído

número combinatorio nsobre r.

llamamos r-combi-nación ordinaria (o simplemente r-combinación) de X a cualquier selecciónno ordenada de r elementos de X, es decir, cualquier subconjunto de X decardinal r.

Ejemplo 3.29. Si consideramos el conjunto A = {a, b, c, d, e}, el conjunto{a, b, e} es una 3-combinación de A. En las combinaciones el orden no in-fluye con lo que, por ejemplo, {e, b, a} = {a, b, e}.

Teorema 3.30. Si n y r números enteros tales que 0 ≤ r ≤ n entonces

C(n, r) =(

nr

)=

n!r!(n− r)!

.

Demostración. Si un conjunto A tiene n elementos, entonces el número der-permutaciones es P(n, r). Si no tenemos en cuenta el orden, se puedenagrupar en grupos de P(r) permutaciones que equivalen a la misma com-binación. Entonces

C(n, r) =P(n, r)P(r)

=

n!(n− r)!

r!=

n!r!(n− r)!

Ejemplo 3.31. Deseamos repartir tres bolas iguales entre diez urnas nu-meradas. Si las urnas tienen capacidad para una única bola, ¿de cuántasformas podremos hacer el reparto?

u1 u2

hu3 u4 u5

hu6

hu7 u8 u9 u10

SOLUCIÓN: Si las bolasfuesen de distinto co-lor, habría P(10, 3) for-mas de repartir. Ahorabien, puesto que las bo-las son idénticas, el orden de colocación de las bolas, o lo que es equivalen-te, el orden de elección de las urnas, no influye a la hora de contar. Por tantola solución es

Page 73: ALyMD

3.2 Permutaciones y combinaciones 69

C(10, 3) =10!3!7!

Ejercicio 3.32. Un comité de seis personas A, B, C, D, E y F deben elegir tres re-presentantes (sin ningún rango entre ellos). Calcule el número de formas diferentesde hacer la elección si:

1. No hay restricciones.

2. Deben figurar A y B.

3. Deben figurar A o B, pero no ambos.

4. Deben figurar A o B.

Números combinatorios. Propiedades

Los llamados números combinatorios, por su utilidad, merecen un es-tudio algo más detallado.

Proposición 3.33. Los números combinatorios tienen las siguientes propiedades:

1. Para cada entero n ≥ 0 (n0

)=

(nn

)= 1

Demostración. Trivial, teniendo en cuenta que 0! = 1. �

2. Para cada par de enteros 0 ≤ r ≤ n,(nr

)=

(n

n− r

)

Demostración. Aplicando el teorema 3.30 a cada una de las partes esevidente que son iguales. �

3. Para cada par de enteros 0 < r ≤ n, se cumple(nr

)=

(n− 1r− 1

)+

(n− 1

r

)

Page 74: ALyMD

70 Técnicas de Recuento

Demostración. Partimos de la parte derecha y la vamos a igualar a laizquierda.(

n− 1r− 1

)+

(n− 1

r

)=

(n− 1)!(r− 1)!(n− r)!

+(n− 1)!

r!(n− r− 1)!=

=r(n− 1)!

r(r− 1)!(n− r)!+

(n− r)(n− 1)!r!(n− r)(n− r− 1)!

=

=r(n− 1)! + (n− r)(n− 1)!

r!(n− r)!=

n!r!(n− r)!

=

=

(nr

)�

Las propiedades anteriores nos permiten construir de forma recursivala tabla conocida con el nombre de triángulo de Tartaglia o de Pascal:En la fila n-sima están

todos los númeroscombinatorios (n

r). 11 1

1 2 11 3 3 1

1 4 6 4 1

. ..

. . . . . . . . . . . .. . .

Figura 3.1: Triángulo de Tartaglia.

Ejercicio 3.34. Completa tres filas más del triángulo de Tartaglia (figura 3.1).

Una aplicación importante de los números combinatorios es el desarro-llo de la potencia de un binomio, un conocido resultado debido a Newton.

Teorema 3.35 (Binomio de Newton). Sean a, b elementos de una anillo conmu-tativo y n un número natural, entonces:

(a + b)n =

(n0

)a0bn +

(n1

)a1bn−1 + · · ·+

(nn

)anb0 =

n

∑i=0

(ni

)aibn−i.

Demostración. Si aplicamos la propiedad distributiva a la expresión

(a + b)n = (a + b)(a + b) n veces. . . . . . (a + b)

aparece una suma de expresiones aa i. . . abb n−i. . . b = aibn−i, y cada una deellas aparece tantas veces como las formas de ordenarlas, que son

POR(i, n− i) = C(n, i) =(

ni

)�

Page 75: ALyMD

3.2 Permutaciones y combinaciones 71

Ejercicio 3.36. Comprueba (a mano) la veracidad del teorema del binomio de New-ton para n = 2, 3, 4.

3.2.5. Combinaciones con repetición

Definición 3.37. Dado un conjunto A no vacío de n elementos, Al número der-combinaciones conrepetición de n elementoslo denotamos porCR(n, r).

llamamosr-combinación con repetición de A a cualquier selección no ordenada de relementos de A que pueden estar repetidos.

Las r-combinaciones con repetición las las representamos encerrandosus elementos entre los símbolos d y e.

Ejemplo 3.38. Consideramos el conjunto A = {a, b, c, d, e}. Entonces la listasin orden da, a, a, b, b, d, de es una 7-combinación con repetición de A.

Teorema 3.39. Sean n un entero positivo y r un número natural, entonces

CR(n, r) =(

n + r− 1r

).

Demostración. Una r-combinación de los n objetos de un conjunto se puederepresentar como una (r, n− 1)-permutación (con objetos repetidos) y vice-versa. Pongamos un ejemplo, sobre el conjunto {a, b, c, d}, la 4-combinacióncon repetición da, b, b, de se identifica con la (4, 3)-permutación x|xx||x (dela cadena de caracteres xxxx|||).

Luego

CR(n, r) = POR(r, n− 1) =(n + r− 1)!r!(n− 1)!

=

(n + r− 1

r

)�

Ejemplo 3.40. Disponemos de 10 urnas diferentes (con capacidad para treso más bolas), y tres bolas iguales que se desean repartir entre las urnas. ¿Decuántas formas diferentes se puede realizar este reparto?

u1 u2

jju3 u4 u5 u6

ju7 u8 u9 u10

SOLUCIÓN: Al colocar una bola en una urna realmente estamos seleccio-nando dicha urna (puesto que las bolas son idénticas). Por tanto, el pro-blema equivale a elegir 3 urnas de entre las 10, con posibles repeticiones,siendo el orden intrascendente, esto es

CR(10, 3) =(

10 + 3− 13

)=

(123

)

Page 76: ALyMD

72 Técnicas de Recuento

3.2.6. Números multinomiales

En la prueba de la fórmula del binomio de Newton, Teorema 3.35, hici-mos uso del hecho de que

POR(i, n− i) =(

ni

)El ejemplo y el ejercicio que siguen nos muestran que, en general, existe unarelación entre las combinaciones y las permutaciones de objetos repetidos.

Ejemplo 3.41. De cuántas formas podemos repartir tres bolas rojas, dosazules y una verde en 10 urnas con capacidad para una única bola.

u1

jru2

jru3

jau4 u5

jau6

jvu7 u8

jru9 u10

SOLUCIÓN: Para resolverlo, descomponemos el reparto en tareas y apli-camos el principio del producto. Así, al repartir las bolas rojas tenemosC(10, 3) formas de hacerlo. Al repartir las azules, tenemos C(7, 3), puestoque 3 urnas ya están ocupadas, y, por último, la bola verde se puede hacerde C(5, 1) formas. Por tanto, la solución es(

103

)(72

)(51

)Ejercicio 3.42. El problema del ejemplo anterior se ha resuelto por combinaciones.Otra forma distinta de resolverlo es permutar de todas las formas posibles la cadenade 10 caracteres

RRRAAVSSSS

donde el carácter S representa las urnas sin ninguna bola. Expresa la solución ycompáralo con la expresada en el ejemplo 3.41 anterior.

En general, si n = n1 + n2 + · · ·+ nt

POR(n1, n2, . . . , nt) =n!

n1!n2! . . . nt!=

n!n1!(n− n1)!

(n− n1)!n2! . . . nt!

= C(n, n1)POR(n2, . . . , nt)

= C(n, n1)C(n− n1, n2)POR(n3, . . . , nt)

= . . . . . . . . .

=

(nn1

)(n− n1

n2

)(n− n1 − n2

n3

). . .(

nt

nt

)def=

(n

n1, n2, . . . , nt

)

Page 77: ALyMD

3.3 Principio de inclusión y exclusión 73

Definición 3.43. Las expresiones

(n

n1, n2, . . . , nt

)= POR(n1, n2, . . . , nt).

reciben el nombre de números multinomiales.

3.3. Principio de inclusión y exclusión

El último, pero no menos importante, regla o principio para recuento esel principio de inclusión-exclusión. Éste se basa en el cardinal de la uniónde conjuntos finitos.

Teorema 3.44. Sean A1, A2, ...An conjuntos finitos, entonces

|A1 ∪ A2 ∪ ...∪ An| = α1 − α2 + α3 − · · ·+ (−1)n+1αn.

donde αi es la suma de los cardinales de todas las intersecciones posibles de i con-juntos (1 ≤ i ≤ n).

α1 = |A1|+ |A2|+ · · ·+ |An|,α2 = |A1 ∩ A2|+ · · ·+ |An−1 ∩ An|,. . .αn = |A1 ∩ · · · ∩ An|.

Generalmente, este principio se usa en sentido negativo, es decir, si te-nemos un conjunto universal U , con |U | = N

|A1 ∩ A2 ∩ · · · ∩ An| = N − |A1 ∪ A2 ∪ ...∪ An|

Ejercicio 3.45. Calcula el número de palabras distintas que se pueden formar reor-denando la palabra MARINA de forma que las vocales no aparezcan consecutivas.

3.3.1. Desarreglos: nada en su lugar

Ejemplo 3.46. Un secretario (algo distraído) debe colocar cinco cartas encinco sobres. Las cartas y los sobres tienen la dirección impresa. ¿De cuántasformas distintas puede lograr la hazaña de no acertar ninguna?

SOLUCIÓN: Sabemos que el número de todas las posibles formas de colocarlas cartas en los sobres es N = P(5) = 5!. Si queremos contar las formas de“acertar ninguna”, pensamos en lo contrario, que es “acertar alguna”.

Page 78: ALyMD

74 Técnicas de Recuento

Vamos a contar las formas en que esto ocurre usando terminología deconjuntos. Numeremos las cartas y los sobres de 1 a 5. Llamamos Ai al con-junto de situaciones en que la carta i caiga de forma correcta en su sobre i y|Ai| es su cardinal, o sea, el número de formas en que esto ocurre. Nuestrasolución será, por tanto

N − |A1 ∪ A2 ∪ A3 ∪ A4 ∪ A5|

y, por el Teorema 3.44

|A1 ∪ A2 ∪ A3 ∪ A4 ∪ A5| = α1 − α2 + α3 − α4 + α5

siendo

α1 = |A1|+ |A2|+ |A3|+ |A4|+ |A5| = 5 · 4!

α2 = |A1 ∩ A2|+ . . . |A4 ∩ A5| =(

52

)· 3!

α3 = |A1 ∩ A2 ∩ A3|+ . . . |A3 ∩ A4 ∩ A5| =(

53

)· 2!

α4 = |A1 ∩ A2 ∩ A3 ∩ A4|+ . . . |A2 ∩ A3 ∩ A4 ∩ A5| =(

54

)· 1!

α5 = |A1 ∩ A2 ∩ · · · ∩ A5| = 1

luego, la solución es

5!− (5!− 10 · 3! + 10 · 2!− 5 · 1! + 1) = 60− 20 + 5− 1 = 44

Ejercicio 3.47. Generaliza el resultado del ejercicio anterior para n cartas y nsobres.

3.3.2. Número de funciones sobreyectivas

Otra importante aplicación del principio de inclusión-exclusión es elcálculo del número de funciones sobreyectivas que existen sobre dos con-juntos finitos. Este cálculo, a su vez, nos da un método para “contar” situa-ciones, como veremos en el ejemplo 3.49.

Teorema 3.48. El número de aplicaciones sobreyectivas diferentes que se puedenestablecer de un conjunto A de cardinal n en otro conjunto B de cardinal r conr ≤ n es

r

∑i=0

(−1)i(

ri

)(r− i)n.

Page 79: ALyMD

3.3 Principio de inclusión y exclusión 75

Demostración. Supongamos que A = {a1, . . . , an} y B = {b1, . . . , br} y considermos co-mo conjunto “universo”, U , el conjunto de todas las funciones de A en B.

U = { f : A→ B | f es una función} |U | = rn

Vamos a calcular el conjunto de funciones f ∈ U tales que Im f = B (funciones sobreyec-tivas). Se tiene que cumplir pues que b1 ∈ Im f , b2 ∈ Im f , . . . y br ∈ Im f . Consideremos,para cada 1 ≤ i ≤ r, los subconjuntos

Xi = { f | bi ∈ Im f } ⊆ U

El conjunto de funciones sobreyectivas será X1 ∩ X2 ∩ . . . Xr y, para calcular su cardinalhacemos las siguientes transformaciones:

|X1 ∩ X2 ∩ . . . Xr| = |X1 ∩ X2 ∩ . . . Xr| =

= |X1 ∪ X2 ∪ . . . Xr| = |U | −(

α1 − α2 + ... + (−1)r+1αr

)En el cálculo de α1 precisaremos del cardinal de cada Xi. El número de funciones de A

en B que dejan a bi sin ser imagen de ningún elemento es el mismo que el de funciones deA en B− {bi}: (r− 1)n.

α1 =r

∑i=1|Xi| =

r

∑i=1

(r− 1)n = r · (r− 1)n

Para calcular α2 debemos sumar los cardinales de todas las posibles intersecciones de dosconjuntos distintos. Sean Xi y Xj dos cualesquiera de estos conjuntos. La intersección deellos la forman las funciones de A en B que dejan fuera del conjunto imagen a los elemen-tos bi y bj. Con un razonamiento similar al anterior podemos afirmar que el número deaplicaciones con estas características es (r− 2)n.

α2 = ∑i 6=j|Xi ∩ Xj| = ∑

i 6=j(r− 2)n

Como todos los sumandos son iguales y tenemos tantos como formas de seleccionar dosconjuntos distintos de entre X1, ...Xr, α2 queda de la siguiente forma:

α2 =

(r2

)(r− 2)n

Generalizando para un h ∈N con 1 ≤ h ≤ r tenemos:

αh =

(rh

)(r− h)n

Y, por tanto, el número de funciones sobreyectivas de A en B es:

|X1 ∩ X2 ∩ ..∩ Xr| = |U | − (α1 − α2 + ... + (−1)r+1αr)

= rn −(

r1

)(r− 1)n +

(r2

)(r− 2)n − .... + (−1)r

(rr

)(r− r)n

=r

∑i=0

(−1)i(

ri

)(r− i)n

lo que prueba el teorema �

Ejercicio 3.49. El Ministerio de Defensa está interesado en siete proyectos dis-tintos que pueden ser desarrollados por cuatro compañías diferentes. ¿De cuántasformas pueden concederse los contratos para que todas las compañías desarrollen,al menos, un proyecto?

Page 80: ALyMD

76 Técnicas de Recuento

3.4. Particiones y números de Stirling

Al número de particiones (Definición 2.10) “diferentes” que se puedenestablecer de un conjunto de cardinal n en r partes (1 ≤ r ≤ n) lo represen-tamos por

S(n, r)

Estos númerosA la hora de calcularlos esimportante tener en

cuenta que el orden de laspartes es irrelevante.

reciben el nombre de números de Stirling de segunda especie.

Teorema 3.50. El número de particiones diferentes de un conjunto de cardinal nen r partes es:

S(n, r) =1r!

r

∑i=0

(−1)i(

ri

)(r− i)n

Demostración. Si A es un conjunto de n elementos y B = {1, 2, . . . , r} unafunción f sobreyectiva de A en B puede ser considerada como una parti-ción de A en r partes, a saber { f−1(1), f−1(2), . . . , f−1(r)}. Obsérvese quehay exactamente r! funciones sobreyectivas que dan lugar a la misma par-tición (correspondientes a permutar los elementos de B). Si F es el númerode funciones sobreyectivas de A en B, el número de particiones en r partesson exactamente

S(n, r) =Fr!

que junto con la expresión de F dada en el teorema 3.48 nos determina laexpresión buscada. �

Ejercicio 3.51. Sea n ∈ N con 1 ≤ n. Determina S(n, 0), S(n, 1), S(n, n) yS(n, r) si r > n.

Ejercicio 3.52. Sea A un conjunto con n > 1 elementos, sea a ∈ A y sea 1 <r ≤ n. Justifica que S(n− 1, r − 1) es el número de particiones de A en r partesque satisfacen que una de las partes es {a}.

Ejercicio 3.53. Sea A un conjunto con n > 1 elementos, sea a ∈ A y sea 1 <r ≤ n. Justifica que r · S(n − 1, r) es el número de particiones de A en r partesque satisfacen que {a} no es una de las partes, es decir, que la parte que contiene alelemento a tiene más elementos.

Como consecuencia directa de los resultados que acabas de probar, setiene el siguiente teorema.

Teorema 3.54. Sea S(n, r) el número de particiones de un conjunto A de cardinaln en r partes (1 < r ≤ n). Entonces:

1. S(n, 1) = 1

Page 81: ALyMD

3.4 Particiones y números de Stirling 77

2. S(n, n) = 1

3. S(n, r) = S(n− 1, r− 1) + r · S(n− 1, r)

Utilizando este teorema se construye fácilmente un triángulo similaral de Pascal (o Tartaglia) que permite calcular los números de Stirling desegunda especie de forma recursiva.

Ejercicio 3.55. Rellena la siguiente tabla de números de Stirling de segunda es-pecie.

S(n, r)r

1 2 3 4 5 ...

n

1

2

3

4

5...

3.4.1. Números de stirling de primera especie

Como es natural, también existen los números de Stirling de primeraespecie. Para cada entero n ≤ 1 consideramos el polinomio en x definido apartir de las permutaciones (ordinarias)

P(x, n) =x!

(x− n)!= x(x− 1)(x− 2) . . . (x− n + 1)

Los coeficientes de la expansión de este polinomio nos da los números deStirling de primer especie s(n, r), Para n = 0 se define, como

es habitual, s(0, 0) = 1.es decir,

P(x, n) =n

∑r=0

s(n, k)xr

Así, por ejemplo,

P(x, 1) = x

P(x, 2) = x(x− 1) = −x + x2

P(x, 3) = x(x− 1)(x− 2) = 2x− 3x2 + x3

por tanto,

s(1, 0) = 0, s(1, 1) = 1s(2, 0) = 0, s(2, 1) = −1, s(2, 2) = 1s(3, 0) = 0, s(3, 1) = 2, s(3, 2) = −3, s(3, 3) = 1

Page 82: ALyMD

78 Técnicas de Recuento

Ejercicio 3.56. Rellena la siguiente tabla de números de Stirling de primera espe-cie.

s(n, r)r

0 1 2 3 4 5 ...

n

1

2

3

4

5...

Observa que, si r > 0, los números s(n, r) tienen signo, es decir, algu-nos son positivos y otros negativos. Habitualmente se usan los números deStirling de primera especie sin signo,

c(n, r) = |s(n, r)|

Tanto los número s(n, r) como c(n, r) tienen interesantes propiedades que,en este curso, no vamos a estudiar.

3.4.2. Números de Bell

En combinatoria, topología, y otras ramas de las matemáticas, se usanlos llamados (sucesión de) números de Bell B(n), que se definen como elnúmero de particiones distintas de un conjunto de n elementos. Por tanto,

B(n) =n

∑r=0

S(n, r)

3.5. Ecuaciones de Recurrencia

Se entiende por Ecuación de RecurrenciaAbreviadamente E.R. a una expresión de la forma

an = f (an−1, an−2, . . . )

donde {ai} es una sucesión de números reales y f es una función real dearidad1 conveniente.

Ejemplos 3.57. Las ecuaciones de recurrencia aparecen, de distintas for-mas, en muchas de las ramas de las ciencias.

1Se entiende por aridad el número de entradas de la función (por ejemplo f (x, y, z) sedice que es de aridad 3).

Page 83: ALyMD

3.5 Ecuaciones de Recurrencia 79

En Análisis de algoritmos, aparece el llamado “Master Theorem”, quenos proporciona la relación

T(n) = aT(nb) + g(n) donde a ≥ 1, b ≥ 1

La “función logística”

xn+1 = rxn(1− xn)

se usa frecuentemente para calcular modelos de crecimiento o biencomo punto de partida para otros modelos.

Ejercicio 3.58. Usa un programa de hoja de cálculo para encontrar los primeros20 valores de la sucesión xn de la “función logística” xn+1 = rxn(1− xn) siendo:

1. r = 4 y x0 = 0, 99.

2. r = 2 y x0 = 0, 01.

Observa como en cada caso se comporta de modo distinto2.

Ejemplo 3.59. A veces aparecen sistemas de ecuaciones de recurrencia. Porejemplo, en teoría de la señal se usa la llamada ecuación de Hénon que ofreceun desarrollo altamente irregular:

xn+1 = 1− 1,4x2n + yn

yn+1 = 0,3xn

}(3.1)

y que está relacionada con la denominada “teoría del caos”.

Ejercicio 3.60. Igual que en el ejercicio 3.58 anterior, rellena en el cuadro siguienteun resumen de los resultados obtenidos en una hoja de cálculo al calcular los 20primeros valores de la ecuación de Hénon cuando (x0, y0) = (0, 0).

Ejemplo 3.61. Ecuaciones de recurrencia que todos conocéis son las progre-siones aritméticas y geométricas.

Progresión Aritmética an = an−1 + d, siendo d un número real constantellamado diferencia de la progresión.

Progresión Geométrica an = r · an−1, siendo r un número real constantellamado razón de la progresión.

Ejercicio 3.62. Pon ejemplos de progresiones aritméticas y de progresiones geo-métricas expresadas de la forma {a0, a1, a2, . . . }. Por ejemplo la sucesión

{0.5, 2, 3.5, 5, 6.5, . . . }.2La primera situación se comporta de modo “caótico”, en cambio la segunda la sucesión

aparece como convergente.

Page 84: ALyMD

80 Técnicas de Recuento

3.5.1. Objetivo

Dada una ecuación de recurrencia junto con algunos valores iniciales

an = f (an−1, an−2, . . . ), a0 = a, a1 = b, . . .

se pretende encontrar las sucesiones del tipo

an = g(n) (Solución General)

donde g es una función real, que verifican la ecuación y, entre ellas, las queverifican los valores iniciales.

Ejemplo 3.63. La E.R. an = an−1 + 3 con valor inicial a0 = 1 tiene por

Solución General: an = 3n + k

si bien, entre ellas, la única que verifica también el valor inicial dado es

an = 3n + 1

Ejercicio 3.64. Busca en tus “viejos” libros de texto, utiliza internet o bien cual-quier otro método para dar las fórmulas de las soluciones generales de las pro-gresiones aritméticas an = an−1 + d y de las geométricas an = r · an−1.

Ecuaciones de recurrencia lineales de coeficientes cons-tantes

Vamos a estudiar (y resolver) un tipo concreto de E.R. que tienen suutilidad garantizada porque aparecen en muchos planteamientos de pro-blemas aplicados (tanto de las telecomunicaciones, de la informática y deotras áreas de conocimientos) y en cambio tienen una solución bastantefácil.Abreviadamente E.R.L. Este tipo de ecuaciones las denominaremos ecuaciones de recurrencialineales de coeficientes constantes.

Son las que se pueden expresar de la siguiente forma:

an + C1an−1 + C2an−2 + · · ·+ Ckan−k = f (n)

donde:

f (n) es una función que no depende de las ai.

Los coeficientes Ci son números reales constantes (no dependen de n).

Llamamos orden k de la ecuación a la mayor diferencia entre los luga-res de la sucesión que intervienen en la ecuación.

Page 85: ALyMD

3.5 Ecuaciones de Recurrencia 81

Ejemplo 3.65. Observa que las progresiones aritméticas y geométricas soncasos particulares de E.R.L. ¿De que orden son cada una de ellas?

Ejemplo 3.66. A veces, las E.R.L. vienen expresadas, aparentemente, de“otra forma”. Por ejemplo an+2 − an−2 = an es una E.R.L. de orden 4, con-cretamente

an − an−2 − an−4 = 0

Clasificación de las E.R.L.

Las E.R.L. las vamos a clasificar en dos tipos:{E.R.L. Homogéneas: en las que f (n) = 0E.R.L. No Homogéneas: en las que f (n) 6= 0

Ejercicio 3.67. Según la clasificación anterior, ¿cómo son las progresiones aritmé-ticas (con d 6= 0) y las geométricas (con r 6= 0)?

3.5.2. Ecuaciones de Recurrencia Lineales Homogéneas

Son las que se pueden expresar de la siguiente forma

an + C1an−1 + C2an−2 + · · ·+ Ckan−k = 0 (3.2)

Teorema 3.68. El conjunto de soluciones de (3.2) forman un subespacio vectorialdel espacio vectorial de las sucesiones (reales).

Demostración. Figura al final del tema. Se considera un trabajo voluntario.�

Ejemplo 3.69. La siguiente ecuación (con valores iniciales) tiene por solu-ción la llamada sucesión de Fibonacci

an = an−1 + an−2; a0 = 1, a1 = 1

es un ejemplo típico de 2o orden.

Ejercicio 3.70. Calcula los 8 primeros términos de la sucesión de Fibonacci. Usauna hoja de cálculo o escribe un programa (o lo que se te ocurra) para calcular eltérmino a30 de dicha sucesión.

Resolución

Puesto que las soluciones de la E.R.L. homogénea es un subespacio vec-torial, únicamente tenemos que encontrar una base –formada por sucesio-nes reales– de dicho subespacio. Cualquier otra solución será combinaciónlineal de dicha base.

A continuación damos un método para encontrar dicha base.

Page 86: ALyMD

82 Técnicas de Recuento

Polinomio característico

Dada una ecuación de recurrencia (3.2) de orden k llamamos polinomiocaracterístico de dicha ecuación al polinomio de grado k formado por loscoeficientes de la ecuación, del siguiente modo:

xk + C1xk−1 + C2xk−2 + · · ·+ Ck

Ejercicio 3.71. ¿Podrías escribir el polinomio característico de la ecuación quedefine la sucesión de Fibonacci del ejemplo 3.69?

Ejercicio 3.72. El polinomio característico nunca puede tener 0 por raiz. ¿Porqué?

Las raíces de este polinomio nos permitirá construir una base para lassoluciones según el siguiente teorema.

Teorema 3.73. Si x1 y x2 son raíces (complejas) distintas del polinomio caracte-rístico, entoncesPuede verse una justificación

(aunque no demostracióncompleta) al final de este

tema.1. Las sucesiones an = xn

1 y bn = xn2 son soluciones linealmente indepen-

dientes de la ecuación homogénea (3.2).

2. Si x1 es una raíz de multiplicidad t entonces las t sucesiones siguientes

xn1 , nxn

1 , n2xn1 , . . . , nt−1xn

1

son soluciones linealmente independientes.

Todo polinomio de grado k tiene exactamente k raíces en el cuerpo delos números complejos, iguales o distintas. Por tanto este teorema nos di-ce que podemos encontrar exactamente k sucesiones linealmente indepen-dientes que son solución de una ecuación de recurrencia lineal homogéneade orden k.

Dejando en el tintero la comprobación de que estas k sucesiones son unsistema generador del subespacio vectorial de las soluciones, deducimos elsiguiente corolario de los teoremas anteriores.

Corolario 3.74. El conjunto de soluciones de la ecuación homogénea (3.2) es unsubespacio vectorial de dimensión k. Podemos encontrar una base de dicho subes-pacio a partir de las raíces del polinomio característico.

Resolución cuando todas las raíces son reales

Ejemplo 3.75. La ecuación que determina la sucesión de Fibonacci del ejem-plo 3.69

an = an−1 + an−2, con a0 = 1, a1 = 1

Page 87: ALyMD

3.5 Ecuaciones de Recurrencia 83

tiene el siguiente polinomio característico:

x2 − x− 1

que tiene dos raíces distintas: x1 =1 +√

52

y x2 =1−√

52

.Por tanto tenemos un subespacio vectorial de soluciones de dimensión 2

definido por la siguiente

Solución general: an = K1

(1+√

52

)n+ K2

(1−√

52

)n

De las infinitas soluciones que describe esta solución general, sólo unaverifica los valores iniciales a0 = a1 = 1. Calculémosla:

K1

(1+√

52

)0+ K2

(1−√

52

)0= 1

K1

(1+√

52

)1+ K2

(1−√

52

)1= 1

⇐⇒K1 =

√5 + 1

2√

5

K2 =

√5− 1

2√

5

Sustituyendo en la solución general nos da el término general de la suce-sión de Fibonacci que tiene la siguiente expresión:

an =(1 +

√5)n+1 − (1−

√5)n+1

2n+1√

5

Ejercicio 3.76. Comprueba que el término general antes expresado da las mismassoluciones que las halladas en el ejercicio 3.70.

Resolución cuando tiene raíces complejas no reales

Puesto que el polinomio característico de

Re

Im

θ

b

z

−b

z

−θ

a

Figura 3.2:

una ERL homogénea es real, si z = a + ib esuna raíz compleja del mismo, por proposi-ción 2.63 su conjugado z = a − ib tambiénes una raíz. Siguiendo el corolario 3.74 tene-mos entonces que

K1zn + K2zn = K1(a + ib)n + K2(a− ib)n

es la solución general de la ecuación de re-currencia.

Para tener una mejor expresión de las so-luciones se usa la llamada forma trigonométrica de los números complejos.Sabemos que el módulo de z y z coinciden,

|z| =√

a2 + b2 = |z|

Page 88: ALyMD

84 Técnicas de Recuento

y los argumentos de z y de z son opuestos (ver Figura 3.2),

Arg z = arctanba= θ ⇒ Arg z = −θ

y en forma polar

z = |z|eiθ = |z| (cos θ + i sen θ) y z = |z|e−iθ = |z| (cos(θ)− i sen(θ))

junto con la fórmula de De Moivre en proposición 2.58 transforma la solu-ción

K1zn + K2zn =(|z|n(K1 + K2)) cos(nθ) + (|z|ni(K1 − K2)) sen(nθ)

= M1|z|n cos(nθ) + M2|z|n sen(nθ)

Veamos un ejemplo de ésto:Ejemplo 3.77. Vamos a resolver la ecuación (an+1 + 4an−1)

2 = 12a2n con

valores iniciales a1 = 0 y a2 = −1.

SOLUCIÓN: Transformando la ecuación anterior (que no es lineal) tenemosdos posibles ecuaciones de recurrencia lineales: an+1 − 2

√3an + 4an−1 = 0

y bn+1 + 2√

3bn + 4bn−1 = 0 que nos dará, cada una de ellas, una solución.Resolvamos la primera de ellas, que tiene por polinomio característico

p(x) = x2 − 2√

3x + 4

que tiene como raíces complejas z =√

3+ i y z =√

3− i, ambas de módulo|z| = 2 y argumentos θ = arctan( 1√

3) = π

6 y −θ = −π6 , respectivamente.

Por lo anterior la solución general será

an = M1 2n cosnπ

6+ M2 2n sen

6

y, aplicando los valores iniciales

a1 = M12 cosπ

6+ M22 sen

π

6= 0

a2 = M14 cosπ

3+ M24 sen

π

3= −1

⇐⇒M1 =

14

M2 = −√

34

y por tanto la solución a nuestro problema se puede expresar de la forma

an = 2n−2(

cosnπ

6−√

3 sennπ

6

)Resolviendo la segunda ecuación de recurrencia (ejercicio 3.78) nos da

como solución

bn = 2n−2(

cos5nπ

6+√

3 sen5nπ

6

)y, conjuntamente, ambas son soluciones de la ecuación de recuerrencia quenos piden.

Page 89: ALyMD

3.5 Ecuaciones de Recurrencia 85

Ejercicio 3.78. Resuelve la ecuación de recurrencia bn+1 + 2√

3bn + 4bn−1 = 0con los valores iniciales b1 = 0 y b2 = −1 resultante del problema del ejemploanterior.

Ejemplos 3.79.

1. Resuelve an+2 + an−2 = 2an.

Determina también la única solución para la que a0 = a2 = 1 y a1 =a3 = 0.

SOLUCIÓN:General an = k1 + K2n + k3(−1)n + k4n(−1)n

Con v.i. an = 1+(−1)n

2 =

{1 si n es par0 si n es impar

2. Resuelve la ecuación de recurrencia an+2 + an =√

3an+1 con valoresiniciales a0 = 0 y a3 = 1.

SOLUCIÓN:

General an = k1 cosnπ

6+ k2 sen

6Con v.i. an = sen

6

3.5.3. E.R.L. No Homogéneas

Un ejemplo: las torres de Hanoi

Según una leyenda3 india, en el

Torre 0 Torre 1 Torre 2

Templo de Benarés, bajo el domoque marca el centro del mundo, hayuna placa de latón con tres agujasde diamante. Durante la creación,Dios puso sesenta y cuatro discosde oro puro de distinto tamaño enuna de las agujas, formando una to-rre.

La leyenda afirma que, cuando hayan conseguido trasladar todos losdiscos a otra aguja su trabajo estará terminado, y la torre y el templo sederrumbarán, y con un gran trueno, el mundo se desvanecerá.

Los bramanes llevan generaciones cambiando de lugar, uno a uno, losdiscos de la torre entre las tres agujas de forma que en ningún momento undisco mayor descanse sobre otro más pequeño.

En el dibujo representamos una versión más simple del problema: setrata de pasar una torre de solamente cuatro discos.

3En realidad no existe ninguna leyenda. Este problema fue inventado por el matemáticofrancés Édouard Lucas a finales del XIX.

Page 90: ALyMD

86 Técnicas de Recuento

Es necesaria la torre de ayuda para poner los discos que hay que apar-tar provisionalmente para llegar al disco más grande. Si lo hiciéramos porcomputadora, una posible orden para resolverlo podría ser:

MOVER-TORRE(4, 0, 2, 1)

que quiere decir “mueva una torre de tamaño 4 tomando como torre deorigen la número 0, como torre de destino la número 2 y como ayudala número 1”. En el cuadro 3.1 damos un posible pseudocódigo de esteproblema.

Por lo anterior, si an representa el número de movimientos necesariospara mover completamente n discos, para estos 4 discos será a4 = 2a3 + 1,pero a3 = 2a2 + 1 y por último a2 = 2a1 + 1. Obviamente a1 = 1 puesto quecon un solo disco necesitamos únicamente un movimiento.

Así que reconstruyendo los cálculos anteriores (a la inversa) tenemosa2 = 3, a3 = 7 y a4 = 15.

Si queremos resolver el problema de forma más general tendríamos lasiguiente ecuación de recurrencia con valor inicial

an = 2an−1 + 1; a1 = 1

Resolución de la Ecuación de Recurrencia Lineal

Todas las E.R.L. no homogéneas se expresan de la forma

an + C1an−1 + C2an−2 + · · ·+ Ckan−k = f (n) (3.3)

donde f (n) 6= 0.Llamaremos ecuación homogénea asociada a (3.3) a la que resulta de

hacer f (n) = 0, es decir,

an + C1an−1 + C2an−2 + · · ·+ Ckan−k = 0

y al conjunto de soluciones (o solución general) de la homogénea se repre-senta por a(h)n

Cuadro 3.1: Torres de Hanoi. Pseudocódigo.

define MOVER-TORRE(n,origen,destino,ayuda)si (n >0)

MOVER-TORRE(n− 1,origen,ayuda,destino)MOVER-UN-DISCO origen destinoMOVER-TORRE(n− 1,ayuda,destino,origen)

Page 91: ALyMD

3.5 Ecuaciones de Recurrencia 87

Estas sucesiones a(h)n no son solución de la ecuación no homogénea (3.3),pero combinadas con una única sucesión que sí lo sea nos resuelve el pro-blema. A esta solución la llamaremos solución particular que representare-mos por a(p)

n .

Teorema 3.80. La solución general de la E.R.L. no homogénea (3.3) queda deter-minada por la expresión

an = a(h)n + a(p)n .

Demostración. Basta sustituir a(h)n + a(p)n en la parte derecha de (3.3) y com-

probar que resulta f (n). Completa los detalles como ejercicio. �

Ejemplo 3.81. Vamos a resolver la ecuación de recurrencia de las Torres deHanoi

an = 2an−1 + 1; a1 = 1 (3.4)

SOLUCIÓN: La ecuación homogénea asociada (de primer orden)

an − 2an−1 = 0

tiene como polinomio característico x− 2, con raíz x = 2, luego

a(h)n = k2n

Por otro lado, si suponemos que la ecuación (3.4) admite como soluciónparticular una constante a(p)

n = A al sustituir debe verificar la ecuación, esdecir:

a(p)n = 2a(p)

n−1 + 1 ⇐⇒ A = 2A + 1 ⇐⇒ A = −1

de donde la solución general será:

an = a(h)n + a(p)n = k2n − 1

Nos queda encontrar la solución que resuelve el valor inicial a1 = 1. Susti-tuyendo a1 en la solución general obtenemos

a1 = k21 − 1 ⇐⇒ 1 = 2k− 1 ⇐⇒ k = 1

luego

an = 2n − 1

Page 92: ALyMD

88 Técnicas de Recuento

Método para encontrar una solución particular a(p)n

En el ejemplo 3.81 para encontrar una solución particular a(p)n hemos

probado con una constante, es decir, del mismo tipo que f (n) = 1, que estambién constante. Este método va a ser lo habitual.

La buscamos del “mismo tipo” que f (n). Ajustaremos unos valoresreales A, B, . . . para que sean solución de la ecuación4.

f (n) a(p)n

Constante K APolinomio P(n) = K1 + K2n + . . . Q(n) = A + Bn + . . .

Polinomio · Exponencial P(n)Kn Q(n)Kn

Siendo P(n) y Q(n) polinomios del mismo grado (excepto en ocasiones quehay subir un grado).

Ejercicio 3.82. Encuentra la solución general de las siguientes relaciones de recu-rrencia lineales:

1. an − 2an−1 + an−2 = n3 2n

2. an − an−1 = 2n2 − n

3. an − 2an−1 + an−2 =n2

3n

Ejercicio 3.83. Sea una escalera con n escalones. Juanito puede subir la escalerade diferentes modos. Usando un paso para subir un escalón, o dos escalones o tresescalones. Combinando todos estos pasos para subir la escalera ¿de cuántas formaspuede hacerlo?

Observa que si an es el número de formas de subir una escalera con nescalones, tenemos:

a1 = 1, a2 = 2, a3 = 4, . . .

Ejercicio 3.84. Juanita se ha propuesto ahorrar. Los meses pares guarda 2 euros enuna hucha y los meses impares sólo 1 euro. ¿Qué dinero tendrá pasados n meses?

Observa que si an es la cantidad de dinero que posee en el mes n, tene-mos:

a1 = 1, a2 = 3, a3 = 4, . . .

Ejercicio 3.85. Un banco nos presta una cantidad a devolver en cinco años (60meses) con un interés anual de 5 %. ¿Cuál es la amortización mensual A parapagar por cada 100 euros prestados para cancelar el crédito en el tiempo previsto?

Observa que si an es el capital que se le debe al banco, tenemos:

a0 = 100, a1 = a0 +5a0

1200− A, a2 = a1 +

5a1

1200− A, . . . , a60 = 0

4Sin que intervengan los valores iniciales.

Page 93: ALyMD

3.5 Ecuaciones de Recurrencia 89

Complemento al tema. Pruebas de teoremas.

Teorema 3.68 El conjunto de soluciones de una ecuación de recurrencia linealhomogénea del tipo (3.2) forman un subespacio vectorial del espacio vectorial de lassucesiones (reales).

Demostración. Ya sabemos que el conjunto de todas las sucesiones realesforman un espacio vectorial real (con las operaciones usuales de suma yproducto por escalar).

Para probar que las soluciones de (3.2) son subespacio vectorial, consi-deremos dos soluciones cualesquiera sn y s′n y comprobemos:

1. Que xn = sn + s′n sigue siendo solución de (3.2).

2. Que para cualquier λ ∈ R, se tiene que yn = λ · sn sigue siendosolución.

Completa la demostración en el cuadro siguiente, sustituyendo, respecti-vamente, xn e yn en (3.2) y comprobando que se sigue cumpliendo la igual-dad. �

Teorema 3.73 Si x1 y x2 son raíces distintas del polinomio característico de unaERL Homogénea (3.2), entonces

1. an = xn1 y bn = xn

2 son soluciones linealmente independientes de la ecua-ción (3.2).

2. Si x1 es una raíz de multiplicidad t entonces las t sucesiones siguientes

xn1 , nxn

1 , n2xn1 , . . . , nt−1xn

1

son soluciones linealmente independientes

Justificación La demostración completa sería tediosa e innecesaria. Vea-mos los aspectos más importantes que justifican este resultado.

1. En este punto hay que probar dos cosas: primero que son solución de laecuación homogénea y, segundo, que son independientes.

Para ver que an = xn1 es solución tenemos que sustituir en (3.2) y

comprobar que es 0.

xn1 + C1xn−1

1 + C2xn−21 + · · ·+ Ckxn−k

1 =

= xn−k1 · (xk

1 + C1xk−11 + · · ·+ Ck) =

= xn−k1 · 0 = 0 (3.5)

por ser x1 raíz del polinomio. Igualmente para bn = xn2 .

Page 94: ALyMD

90 Técnicas de Recuento

Para comprobar que son linealmente independientes, considera-mos una combinación lineal igualada a cero, es decir

αxn1 + βxn

2 = 0

y, como esta igualdad es verdad para todo natural n, lo es paran = 0 y n = 1, que al sustituir nos da el siguiente sistema:

α + β = 0αx1 + βx2 = 0

}que se simplifica como α(x1 − x2) = 0. Como, por hipótesis x1 y x2son diferentes, se deduce que α = 0 y, por tanto, β = 0. Esto pruebaque son linealmente independientes.

2. Vamos a hacer la prueba en el caso (más fácil) de t = 2. Igual que en elpunto 1. anterior hay que probar que xn

1 y nxn1 son soluciones y además

son linealmente independientes.

Ya hemos visto que xn1 es solución. Para ver que nxn

1 es tambiénsolución, usamos que x1 es solución doble del polinomio caracte-rístico esto implica que es raiz del polinomio y de su derivada5.Por tanto tenemos las dos igualdades siguientes:

xk1 + C1xk−1

1 + C2xk−21 + · · ·+ Ck−1x1 + Ck = 0 (3.6)

kxk−11 + C1(k− 1)xk−2

1 + · · ·+ Ck−1 = 0

multiplicando la primera igualdad por k y la segunda por x1 nosqueda

kxk1 + C1kxk−1

1 + C2kxk−21 + · · ·+ Ck−1kx1 + Ckk = 0

kxk1 + C1(k− 1)xk−1

1 + C2(k− 2)xk−21 + · · ·+ Ck−1x1 = 0

y restando ambas igualdades nos da la igualdad siguiente que usa-remos más adelante:

C1xk−11 + 2C2xk−2

1 + · · ·+ (k− 1)Ck−1x1 + kCk = 0 (3.7)

Sustituyamos, ahora, nxn1 en la ecuación de recurrencia homogénea

nxn1 + C1(n− 1)xn−1

1 + C2(n− 2)xn−21 + · · ·+ Ck(n− k)xn−k =

= nxn−k1 (xk

1 + C1xk−11 + C2xk−2

1 + · · ·+ Ck) + . . .

+ xn−k(C1xk−11 + 2C2xk−2

1 + · · ·+ (k− 1)Ck−1x1 + kCk) = 0

que es 0 usando las igualdades (3.6) y (3.7).

5La afirmación de esta llamada es muy conocida, pero si no la sabes piensa que una raízdoble x1 hace que un polinomio se pueda expresar p(x) = (x− x1)

2q(x). Basta derivar parahacer la comprobación.

Page 95: ALyMD

3.5 Ecuaciones de Recurrencia 91

Para ver que xn1 y nxn

1 son linealmente independientes, partimos deuna combinación lineal igualada a 0,

αxn1 + βnxn

1 = 0

y comprobamos que α = β = 0, Dejamos los detalles como ejerci-cio.

Ejercicios Propuestos

Ej. 3.1 — ¿Cuántas permutaciones de las letras ABCDEF contienen las le-tras DEF juntas en cualquier orden?

Ej. 3.2 — Un comité de seis personas A, B, C, D, E, F debe escoger un pre-sidente, un secretario y un tesorero. ¿De cuántas formas se puede hacer laelección? ¿De cuántas si el presidente debe ser A ó B?¿De cuántas si E debe ocupar uno de los cargos? ¿De cuántas si A y F debenocupar un cargo?

Ej. 3.3 — Se ha recibido un paquete de 100 discos compactos con cinco dis-cos defectuosos. ¿De cuántas maneras se puede elegir una muestra de cua-tro discos que contenga más discos defectuosos que no defectuosos?

Ej. 3.4 — Un autobús de 32 plazas numeradas (16 a la derecha y 16 a laizquierda) transporta a 28 alumnos de la E.T.S. Ingeniería Informática ensu viaje de fin de carrera. ¿De cúantas formas pueden sentarse si tres deellos sólo pueden ir a la derecha y cinco de ellos sólo a la izquierda?

Ej. 3.5 — ¿Cuántas cadenas de ocho bits hay? ¿Cuántas de ellas comienzanpor 101? ¿Cuántas de ellas comienzan por 101 o tienen el cuarto bit igual a1?

Ej. 3.6 — ¿Cuántos números de teléfono (de 9 cifras) tienen al menos undígito repetido?

Ej. 3.7 — ¿Cuántas soluciones enteras de la ecuación x1 + x2 + . . . x6 = 20satisfacen 1 ≤ xi ≤ 9? (Utiliza incl. y excl.)

Ej. 3.8 — (Feb. 2012) Se tienen 6 alumnos de 1er curso, 5 de 2o, 4 de 3o, 3de 4o, 2 de 5o y 1 de 6o, como candidatos a recibir 5 premios de la Facultadde Medicina, uno al alumno menos charlatán, otro al más atento, otro al demejor letra, otro al que más asiste a tutorías y otro al que mejor aparca elcoche. Suponiendo que ningún alumno puede recibir más de un premio, sepide:

1. ¿De cuántas formas se pueden distribuir los premios?

Page 96: ALyMD

92 Técnicas de Recuento

2. A la persona encargada se le olvidó de grabar el nombre del premioen las copas. ¿De cuántas formas se pueden repartir ahora las copassi cada alumno puede recibir más de una?

Ej. 3.9 — (Dic. 2012) Se quieren formar cadenas de longitud 10 con los nú-meros 0, 1, 2 y 3. Se pide:

1. ¿Cuántas cadenas distintas se pueden formar?

2. ¿Cuántas cadenas tienen peso 3 (es decir, la suma de sus cifras es 3)?

Ej. 3.10 — Calcula el número de formas en que pueden ordenarse los dígi-tos 0, 1, 2, . . . 9 de modo que el primer dígito es mayor que 1, el último esmenor que 8 y el tercero es distinto de 5. (Usa inclusión y exclusión)

Ej. 3.11 — (Feb. 2013) Consideremos la cuadrícula:

1. ¿De cuántas formas se puede pintar si cada casilla puede ser indis-tintamente blanca o negra?

2. ¿De cuántas formas se puede pintar si debe haber 2 casillas blancas,4 negras y 10 rojas?

Ej. 3.12 — (Feb. 2013) ¿Cuántos números de 4 cifras y múltiplos de 5, em-piezan por 3, por 5 o por 9 y contienen al menos un dígito que sea 7 y almenos un dígito que sea 5?

Ej. 3.13 — Se ha producido un robo y la policía interroga a dos testigossobre la matrícula del vehículo utilizado para la huida (cuatro dígitos y dosletras de un alfabeto de 26). El primer testigo asegura que la segunda letrade la matrícula era una O o una Q y que el último dígito era un 3 o un 8. Elsegundo testigo asegura que la primera letra era una C o una G y el primerdígito era definitivamente un 7.

1. ¿Cuántas placas diferentes tendrá que verificar la policía?

2. Si en investigaciones posteriores la policía obtiene además que lamatrícula no termina en 53 ni empieza en 78, ¿cuántas comprobacio-nes se tendrán que hacer en este caso?

Ej. 3.14 — Calcula cuántos números enteros hay entre 1000 y 9999 que cum-plan las siguientes condiciones (independientes entre ellas):

1. La suma de sus dígitos es exactamente 9.

2. La suma de sus dígitos es exactamente 9 y son todos distintos de 0.

3. Ser impar y tener todos los dígitos diferentes.

4. Alguno de sus dígitos es 9.

Page 97: ALyMD

3.5 Ecuaciones de Recurrencia 93

Ej. 3.15 — Supongamos 7 pelotas de distintos colores y 4 recipientes nu-merados 1,2,3,4. ¿De cuántas maneras se pueden distribuir las pelotas paraque no haya ningún recipiente vacío? Siendo una de las pelotas azul, ¿Decuántas formas la podemos distribuir si obligamos a la pelota azul a estaren el recipiente número 2, y que no haya ninguno vacío?

Ej. 3.16 — Los Reyes Magos traen n juguetes diferentes a n niños. En elcamino deciden dejar a exactamente un niño sin juguete y repartir todoslos juguetes entre los restantes niños. ¿De cuántas formas pueden hacerlo?

Ej. 3.17 — Completa la tabla siguiente indicando el número de maneras dedistribuir nueve objetos en cinco recipientes:

Objetos (9) Recipientes (5) Posibilidadrecipientes

vacíos

Número dedistribuciones

Indistinguibles Distinguibles SiDistinguibles Distinguibles NoDistinguibles Indistinguibles No

Ej. 3.18 — (Dic. 2011) Calcula el número de formas en que pueden orde-narse los dígitos 0, 1, 2, . . . 9 de modo que el primer dígito es mayor que1, el último es menor que 8 y el tercero es distinto de 5. (Usa inclusión yexclusión).

Ej. 3.19 — (Sept. 2012) Se tienen 4 bolas de golf y 10 cajas distintas. De-termine de cuántas maneras diferentes pueden distribuirse las bolas en lascajas si:

1. Todas las bolas son distintas y en ninguna caja cabe más de una bola.

2. Todas las bolas son iguales y en ninguna caja cabe más de una bola.

3. Todas las bolas son iguales y en cada caja caben cuantas bolas sequieran poner.

4. Todas las bolas son distintas y en cada caja caben cuantas bolas sequieran poner.

Ej. 3.20 — Para cada uno de los siguientes grafos: ¿De cuantas formas pue-de asignarse un color a cada vértice ai de la figura, con n colores, de modoque dos vértices con una arista común deben tener necesariamente coloresdistintos?

Page 98: ALyMD

94 Técnicas de Recuento

1.

a1 a2

a3 a4

2.

a1 a2

a3 a4

3.

a1 a2

a3 a4

Ej. 3.21 — (Sep. 2013) Un estudiante debe responder siete de las diez pre-guntas de un examen. Halla de cuántas formas puede hacer su elección si:

1. no hay restricciones2. debe contestar las dos primeras preguntas.3. debe responder al menos cuatro de las seis primeras preguntas.

Ej. 3.22 — Resuelve las siguientes ecuaciones de recurrencia

1. an+2 = an con a0 = 1, a1 = 4.2. an = an−1 + (n− 1) con a0 =

1.3. an = 2an−1 + 2 con a1 = 1.4. an = an−1 +(−1)n+1 con a1 =

1.5. an+2 = −2an+1 + 3an con

a0 = 1, a1 = 2.

6. an+2 = 4an+1 − 7an con a0 =1, a1 = 2.

7. an+2 + 4an+1 + 4an = n2 cona0 = 0, a1 = 2.

8. an+2 + 3an+1 + 2an = 3n cona0 = 0, a1 = 1.

Ej. 3.23 — Resuelve las ecuaciones de recurrencia:1. an+3 − 6an+2 + 11an+1 − 6an = 0, con a0 = 2, a1 = 0, a2 = −2.2. an+1 + 4an−1 = 2(an + 4an−2) con a2 = 2, a3 = 0, a4 = 0

Ej. 3.24 — Una pareja de conejos se reproduce mensualmente. Los mesespares tienen dos conejos y los impares uno. Encuentra un modelo de recu-rrencia para el número de conejos hijos an habidos hasta el n-ésimo mes.Resuélvela.

Ej. 3.25 — El número an de euros de activo de una compañía se incrementacada año cinco veces lo que se incrementó el año anterior. Si a0 = 3 y a1 = 7calcula an.

Ej. 3.26 — Un rumor se difunde vía telefónica entre n personas. El rumorestá totalmente difundido cuando todas las personas han hablado entre sí.Sea un el número de llamadas realizadas con n personas (n ≥ 2).

1. Define recursivamente la sucesión {un}.2. Da una fórmula general de dicha sucesión.

Ej. 3.27 — Halla y resuelve la relación de recurrencia de la sucesión an queda el número de sucesiones ternarias (los términos de la sucesión pertene-

Page 99: ALyMD

3.5 Ecuaciones de Recurrencia 95

cen al conjunto {0, 1, 2}) de longitud n que no tienen dos ceros consecuti-vos.

Ej. 3.28 — Cada partícula en un reactor nuclear produce, sin destruirse,dos nuevas partículas cada segundo. Además cada segundo (desde t = 0)es inyectado al reactor una nueva partícula.

1. ¿Cuántas partículas hay en el reactor en el n-ésimo segundo?2. Si el reactor estalla a partir de 1024 partículas ¿cuánto tiempo tarda

en estallar?

Ej. 3.29 —En un supermercado, las naranjas se encuentran api-ladas en una pirámide de base cuadrada de forma quecada naranja está en contacto con cuatro naranjas dela capa inferior. Si la pirámide tiene n capas, ¿cuántasnaranjas la forman?

Page 100: ALyMD
Page 101: ALyMD

TEMA 4

ESPACIOS VECTORIALES

Índice4.1. Definición y propiedades . . . . . . . . . . . . . . . . . . 97

4.1.1. Dependencia e independencia lineal . . . . . . . 994.2. Subespacios vectoriales . . . . . . . . . . . . . . . . . . . 101

4.2.1. Ecuaciones de un subespacio vectorial de Rn . . 1034.3. Bases y dimensión . . . . . . . . . . . . . . . . . . . . . . 105

4.3.1. Cambio de base . . . . . . . . . . . . . . . . . . . 1074.3.2. Bases de subespacios . . . . . . . . . . . . . . . . 108

4.4. Operaciones con subespacios . . . . . . . . . . . . . . . . 1094.4.1. Intersección de subespacios . . . . . . . . . . . . 1094.4.2. Suma de subespacios . . . . . . . . . . . . . . . . 111

4.5. Espacios cocientes . . . . . . . . . . . . . . . . . . . . . . 113Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 114

4.1. Definición y propiedades

Llamaremos espacio vectorial a una estructura algebraica (V, K,+, ·)formada por un conjunto A los elementos de V se

les llama vectores y a losdel cuerpo se les llamaescalares o números.

no vacío V junto con un cuerpo K dotados dedos operaciones: una interna en V llamada suma (+) y un producto externo(K×V → V) que verifican:

(V,+) es un grupo abeliano.

El producto externo verifica

1. ∀λ, µ ∈ K, ∀~v ∈ V (λ + µ)~v = λ~v + µ~v

97

Page 102: ALyMD

98 Espacios vectoriales

2. ∀λ ∈ K, ∀~v, ~w ∈ V λ(~v + ~w) = λ~v + λ~w

3. ∀λ, µ ∈ K, ∀~v ∈ V λ(µ~v) = (λµ)~v

4. ∀~v ∈ V 1 ·~v = ~v

Nota. A lo largo de este curso el cuerpo de escalares será, salvo que se digalo contrario, K = R (números reales) o K = C (números complejos).

Ejercicio 4.1. ¿El conjunto de todas las funciones de Z en Z es un espacio vecto-rial real? Y el conjunto de las funciones de Z en R ¿lo es?

Proposición 4.2. Las principales propiedades de un espacio vectorial son:

1. ∀~v ∈ V 0 ·~v =~0

Demostración. λ~v = (λ + 0) · ~v y por la hipótesis 1 del producto externo,λ~v = λ~v + 0 ·~v y por ser (V,+) grupo tenemos 0 ·~v =~0. �

2. ∀λ ∈ K λ ·~0 =~0

Demostración. λ~v = λ(~v +~0) y por la hipótesis 2 del producto externo,λ~v = λ~v + λ ·~0 y por ser (V,+) grupo tenemos λ ·~0 =~0. �

3. λ~v =~0⇒ λ = 0 o ~v =~0

Demostración. Supongamos λ~v = ~0. Si λ = 0 ya estaría probado y si λ 6=0, por ser un elemento del cuerpo, existe λ−1, luego λ−1(λ~v) = ~0 comoacabamos de probar. Aplicando las hipótesis 3 y 4 del producto externotenemos ~v =~0. �

4. ∀λ ∈ K, ∀~v ∈ V (−λ)~v = λ(−~v) = −(λ~v)

Demostración. Como (V,+) es un grupo abeliano, el opuesto de λ~v es úni-co, por tanto únicamente tenemos que probar

λ~v + (−λ)~v =~0 y λ~v + λ(−~v) =~0

Dejamos los detalles para el alumno. �

Ejemplos 4.3. Los siguientes conjuntos con las operaciones correspondien-tes son espacios vectoriales reales:

1. Los vectores libres del plano (o del espacio).

2. F = { f : R→ R | f es función}.

3. El cuerpo R es espacio vectorial sobre el propio cuerpo. En este espa-cio vectorial, los elementos del cuerpo son vectores y escalares.

4. En general, Rn es un espacio vectorial sobre el cuerpo R.

Page 103: ALyMD

4.1 Definición y propiedades 99

5. Cn es también un espacio vectorial sobre el cuerpo C. Este espaciovectorial es distinto al también espacio vectorial Cn sobre el cuerpo R.

6. Los polinomios con coeficientes en R forman también un espacio vec-torial real.

7. Las matrices reales m× n.

4.1.1. Dependencia e independencia lineal

Dado un espacio vectorial V, llamaremos sistema de vectores a un con-junto finitode vectores X = {~v1,~v2, . . . ,~vk} de V.

Definición 4.4. Decimos que~v es combinación lineal del sistema X = {~v1,~v2, . . . ,~vk}si, y sólo si, existen escalares λ1, λ2, . . . , λk tales que

~v = λ1~v1 + λ2~v2 + · · · λk~vk =k

∑i=1

λi~vi

Definición 4.5. Un sistema de vectores X = {~v1,~v2, . . . ,~vk} se dice que es:

• Linealmente Dependiente (L.D.) si existe una combinación lineal de losvectores de X nula, λ1~v1 + λ2~v2 + · · ·+ λk~vk =~0 con algún escalar λino nulo.

• En caso contrario se dice que es Linealmente Independiente (L.I.), esdecir,

λ1~v1 + λ2~v2 + · · ·+ λk~vk =~0⇒ λi = 0 ∀i = 1, . . . , n

Ejercicio 4.6. Aplica la anterior definición para comprobar si los vectores de R4

siguientes{(0,−1, 2,−1), (−1, 1, 0, 1), (−1,−1, 4,−1)}

forman un sistema linealmente dependiente o independiente.

Ejercicio 4.7. Comprueba que los vectores de V = P[x] (polinomios de variable x)siguientes

{2, x− 1, x2}

forman un sistema linealmente independiente.

A continuación exponemos propiedades de la dependencia e indepen-diencia lineal. Demostramos una de ellas y dejamos las demás como ejerci-cio para el alumno.

Page 104: ALyMD

100 Espacios vectoriales

Propiedades:

Probamos la primera y dejamos la demostración de las demás comoejercicio.

1. Un sistema de vectores es linealmente dependiente si y solo si algunode sus vectores se puede expresar como combinación lineal de losrestantes.

Demostración. Supongamos que el sistema es L.D., es decir

λ1~v1 + λ2~v2 + · · ·+ λk~vk =~0 y algún λi 6= 0

podemos despejar ~vi = ∑j 6=i

−λj

λi~vj, es decir, ~vi es combinación lineal

de los restantes.

Veamos la implicación contraria. Sea un vector combinación lineal delos restantes, supongamos, sin pérdida de generalidad, que es~vn. En-tonces ~vn = ∑n−1

i=1 αi~vi y, por tanto,

α1~v1 + · · ·+ αn−1~vn−1 + (−1)~vn =~0

de donde el sistema de vectores es L.D. �

2. Un sistema de vectores que contenga al vector ~0 siempre es lineal-mente dependiente.

3. Un sistema con un único vector no nulo siempre es linealmente inde-pendiente.

4. Todo sistema de vectores contenido en otro linealmente independien-te, también es linealmente independiente.

5. Si un sistema de vectores contiene otro que es linealmente dependien-te, entonces también es linealmente dependiente.

Independencia de vectores y sistemas de ecuaciones homogéneos

Si igualamos a~0 una combinación lineal de un sistema de vectores X deKn, es decir

λ1~v1 + λ2~v2 + · · ·+ λk~vk =~0

expresados los vectores ~vi = (vi1, vi2, . . . , vin), obtenemos

λ1(v11, v12, . . . , v1n) + λ2(v21, v22, . . . , v2n) + . . .· · ·+ λk(vk1, vk2, . . . , vkn) = (0, 0, . . . , 0)

Page 105: ALyMD

4.2 Subespacios vectoriales 101

que se traduce como un sistema de ecuaciones homogéneo:

v11λ1 + v21λ2 + · · ·+ vk1λk = 0v12λ1 + v22λ2 + · · ·+ vk2λk = 0

...v1nλ1 + v2nλ2 + · · ·+ vknλk = 0

Entonces, el sistema X de vectores será linealmente independiente si y so-lo si el sistema de ecuaciones es compatible determinado (tiene soluciónúnica, λi = 0). Podemos enunciar, entonces, el siguiente resultado:

Teorema 4.8. Un sistema de k vectores de Rn (Cn), X = {~v1,~v2, . . . ,~vk} eslinealmente independiente si y solo si k ≤ n y la matriz real (compleja) formadapor los vectores de X puestos en filas o columnas tiene rango k.

Así, si vij es la coordenada j del vector ~vi, la matriz de los vectores,puestos en columnas, es la siguiente:

A =

v11 v21 . . . vk1v12 v22 . . . vk2

......

...v1n v2n . . . vkn

Corolario 4.9. Si K = R o C, el número máximo de vectores de Kn lineal-mente independientes en un sistema X, es el rango de la matriz formada por susvectores columna (o fila).

Ejemplo 4.10. El sistema de vectores de R4 expresados en el ejercicio 4.6es linealmente dependiente. Calculamos el rango de la matriz de vectores (co-lumnas)

rango

0 −1 −1−1 1 −12 0 4−1 1 −1

= 2

puesto que∣∣∣∣ 0 −1−1 1

∣∣∣∣ = −1 6= 0 y los únicos menores (orlados) de orden 3

son nulos: ∣∣∣∣∣∣0 −1 −1−1 1 −12 0 4

∣∣∣∣∣∣ =∣∣∣∣∣∣

0 −1 −1−1 1 −1−1 1 −1

∣∣∣∣∣∣ = 0

4.2. Subespacios vectoriales

Definición 4.11. Diremos que un subconjunto S 6= ∅ de un espacio vec-torial V es un subespacio vectorial si tiene estructura de espacio vectorialcon las operaciones heredadas de V.

Page 106: ALyMD

102 Espacios vectoriales

Nota. Los subconjuntos S = V y S = {~0} son siempre subespacios vecto-riales de V llamados subespacios triviales.

Para ver si un subconjunto no vacío de un espacio vectorial es un subes-pacio, no es necesario comprobar que se cumplen todas las hipótesis des-critas en la página 98, como veremos en el siguiente teorema.

Teorema 4.12 (de caracterización). Dado S 6= ∅ subconjunto de un espaciovectorial V. La condición necesaria y suficiente para que S sea subespacio de V, esque se verifique:

λ~v + µ~w ∈ S para cada λ, µ ∈ K y para cada ~v, ~w ∈ S

Demostración. La primera implicación es trivial, es decir si S es subespaciovectorial entonces, claramente, se cumple que cualquier combinación devectores de S es de S.

Veamos la implicación contraria.Para ver que (S,+) es grupo abeliano, observamos que si ~v, ~w ∈ S,

para λ = µ = 1, tenemos que ~v + ~w ∈ S. Además el opuesto de un vectorde S también está en S, con más que hacer λ = 1 y µ = 0 (o al revés). Elresto de las propiedades de grupo se obtienen fácilmente.

Observamos que para cualquier ~v ∈ S y para cualquier escalar λ setiene que λ~v ∈ S (basta considerar µ = 0). De aquí, las cuatro hipótesisdel producto escalar por vector, se verifican trivialmente en S porque severifican en V.

Ejemplo 4.13.

1. En el espacio vectorial de las funciones de R en R, el conjunto de lasfunciones continuas es un subespacio vectorial.

2. Si consideramos el espacio de las matricesM2(R) de orden 2× 2, elsiguiente subconjunto

S =

{(0 aa 0

)| a ∈ R

}es un subespacio vectorial deM2(R).

Ejercicio 4.14. De los siguentes subconjuntos de R3 cuáles son subespacios vec-toriales y cuáles no (y por qué).

1. S = {(1, a, 0) | a ∈ R}.

2. S = {(0, a2, 0) | a ∈ R}.

3. S = {(0, a,−a) | a ∈ R}.

Page 107: ALyMD

4.2 Subespacios vectoriales 103

Sistemas generadores

Proposición 4.15. Si X = {~v1,~v2, . . . ,~vk} es un sistema de vectores, el con-junto de todas las combinaciones lineales de X posibles forman un subespaciovectorial que se representa por L(X).

Demostración. Sean ~v = ∑ki=1 λi~vi y ~w = ∑k

i=1 µi~vi combinaciones linealesde X, entonces, dados λ y µ escalares tenemos:

λ~v + µ~w = λk

∑i=1

λi~vi + µk

∑i=1

µi~vi =k

∑i=1

(λλi + µµi)︸ ︷︷ ︸=γi

~vi =k

∑i=1

γi~vi

que es una nueva combinación lineal. �

Definición 4.16. Al conjunto L(X) de la proposición 4.15 anterior se ledenomina subespacio generado por el sistema de vectores X y al sistemade vectores X se le llama sistema generador del subespacio.

Ejercicio 4.17. Da varias funciones del subespacio generado por las funcionesf (x) = x y g(x) = x3 en el espacio de las funciones reales sobre el cuerpo R.

4.2.1. Ecuaciones de un subespacio vectorial de Rn

Todo lo que sigue en estasubsección se puedeextender a subespaciosvectorials de Cn.

Cuando el espacio vectorial en el que trabajamos es V = Rn existen dosformas clásicas de expresar un subespacio vectorial S de V.

Ecuaciones paramétricas o explícitas

Supongamos el subespacio S = L({~v1,~v2, . . . ,~vk}) generado por k vec-tores linealmente independientes. Entonces, cualquier vector ~x ∈ S es de laforma

~x = λ1~v1 + λ2~v2 + · · ·+ λk~vk

que, por coordenadas, podemos escribirla como n ecuaciones que depen-den de k parámetros.

x1 = v11λ1 + v21λ2 + · · ·+ vk1λkx2 = v12λ1 + v22λ2 + · · ·+ vk2λk

...xn = v1nλ1 + v2nλ2 + · · ·+ vknλk

Ecuaciones paramétricas

Por tanto, todos los vectores (x1, x2 . . . , xn) ∈ S se consiguen variando detodas las formas posibles los parámetros λi.

Page 108: ALyMD

104 Espacios vectoriales

Ejemplo 4.18. Consideremos el subespacio vectorial de R4 generado porlos dos vectores (0, 1, 3, 1) y (−1, 0, 0, 1). Entonces, según lo anterior, susecuaciones paramétricas serán

x1 = −µx2 = λx3 = 3λx4 = λ + µ

Ejercicio 4.19. Encuentra tres o más vectores del subespacio del ejemplo 4.18anterior cuya coordenada x4 sea 10.

Ecuaciones cartesianas o implícitas

Si eliminamos todos los parámetros λi de las ecuaciones paramétricasanteriores, nos resultan las relaciones (lineales) existentes entre las n varia-bles xi en las que no intervienen parámetros.

Por otro lado, podemos pensar que cualquier vector ~x del subespacioes combinación lineal de los vectores~v1,~v2, . . . ,~vk, supuesto que son lineal-mente independientes, y por el corolario 4.9 sabemos que la matriz

v11 v21 . . . vk1 x1v12 v22 . . . vk2 x2

......

......

v1n v2n . . . vkn xn

tiene rango k, luego todos los menores de orden k + 1 son cero. Desarro-llando estos menores resultan, entonces, m = n− k ecuaciones lineales

a11x1 + a12x2 + · · ·+ a1nxn = 0a21x1 + a22x2 + · · ·+ a2nxn = 0

...am1x1 + am2x2 + · · ·+ amnxn = 0

Ecuaciones cartesianas

cuyas soluciones forman el subespacio vectorial S ⊆ Rn.

Nota. Al estar definido un subespacio vectorial como las soluciones de unsistema de ecuaciones lineal homogéneo, todos los sistemas equivalentesson ecuaciones implícitas del mismo subespacio.

Ejemplo 4.18 (Continuación). Para calcular las ecuaciones cartesianas delsubespacio del ejemplo definido en la página 104, el procedimiento naturalsería eliminar los parámetros, así, despejando λ:

λ = x2 λ =13

x3 λ = x4 − µ

Page 109: ALyMD

4.3 Bases y dimensión 105

tenemos las siguientes ecuaciones:

x1 = −µ3x2 = x3x2 = x4 − µ

y, despejando µ

µ = −x1 µ = x4 − x2

que transforman las ecuaciones anteriores en

3x2 = x3−x1 = x4 − x2

}equivalente a

3x2 − x3 = 0x1 − x2 + x4 = 0

}(4.1)

Una alternativa a este método sería el siguiente:Si (x1, x2, x3, x4) es un vector del subespacio, entonces, por el corola-

rio 4.9, la matriz siguiente 0 −1 x11 0 x23 0 x31 1 x4

tiene rango 2. Utilizando transformaciones elementales por filas, tenemosque la siguiente matriz también tiene rango 2

1 0 x20 −1 x10 0 x3 − 3x20 0 x4 − x2 + x1

que también nos da las ecuaciones cartesianas (4.1) anteriores.

Todo subespacio de Rn se puede representar por ecuaciones cartesianasque son un sistema de ecuaciones lineal homogéneo. El inverso, también escierto:

Proposición 4.20. El conjunto de soluciones de un sistema lineal homogéneo conn incógnitas siempre es un subespacio vectorial de Rn.

Demostración. Es trivial y se deja como ejercicio para el alumno. �

4.3. Bases y dimensión

Definición 4.21 (Base de un espacio vectorial). Un sistema de vectores B(finito o infinito) es una base de un espacio vectorial V si y solo si

Page 110: ALyMD

106 Espacios vectoriales

1. Todo subconjunto finito es linealmente independiente

2. B es un sistema generador de V.

Ejercicio 4.22. Comprueba que los vectores del Ejemplo 4.18 anterior, en página104, son una base para el subespacio que se define.

Ejemplo 4.23. Los espacios vectoriales Rn tienen siempre una base distin-guida, llamada base canónica del siguiente modo

B = {(1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1)}

Ejercicio 4.24. Determina la dimensión de Cn sobre C. ¿Y cual es la dimensiónde Cn sobre R?

El siguiente teorema, que damos sin demostración, nos dice que cual-quier espacio vectorial (no sólo Rn) tiene una base y nos permite definir elconcepto de dimensión.

Teorema 4.25 (de la base). Todo espacio vectorial distinto de {~0} admite (almenos) una base.Es decir, entre dos bases

siempre existe una funciónbiyectiva.

Además todas las bases de un espacio vectorial tienen el mismocardinal.

A este cardinal se le llama dimensión del espacio vectorial V, representada pordim V y entendemos que es el número de elementos que contiene la base. Conveni-mos que dim{~0} = 0.

Nota. Por tanto existen dos tipos de espacios vectoriales, los que tienen di-mensión finita y los que tienen dimensión infinita. Rn y sus subespacios sonejemplos de espacios de dimensión finita (objeto principal de este curso).Existen subespacios vectoriales de dimensión finita de espacios de dimen-sión infinita, pero nunca al contrario.

Ejemplo 4.26. El sistema {1, x, x2, . . . , xn, . . . } es una base infinita para elespacio vectorial V = P[x] de los polinomios. que es, por tanto, de dimen-sión infinita.

Si consideramos S = P3[x] el subconjunto de los polinomios de gradomenor o igual que 3, estamos ante un subespacio del anterior y el sistema{1, x, x2, x3} es una base. Por tanto dim S = 4.

Nota. Salvo que se diga lo contrario, todos los espacios vectoriales que usa-remos a lo largo de este curso serán de dimensión finita.

Coordenadas de un vector

Sea V un espacio vectorial de dimensión n y sea B = {~e1,~e2, . . . ,~en}una base de V. Entonces todo vector ~v ∈ V se puede expresar de formaúnica como combinación lineal de B.

~v = a1~e1 + a2~e2 + · · ·+ an~en

Page 111: ALyMD

4.3 Bases y dimensión 107

Definición 4.27. A la única n-upla formada por los escalares (a1, a2, . . . , an)se le llama coordenadas de ~v respecto de la base B.

Comprobemos que, efectivamente las coordenadas son únicas:

Demostración. La expresión ~v = a1~e1 + a2~e2 + · · · + an~en existe porque Bes un sistema generador, por tanto ~v se puede expresar como combinaciónlineal de ~B. Para ver que es única lo haremos como (casi) siempre, supone-mos que existen dos y comprobamos que son iguales. Sea

~v = a1~e1 + a2~e2 + · · ·+ an~en = a′1~e1 + a′2~e2 + · · ·+ a′n~en

entonces(a1 − a′1)~e1 + (a2 − a′2)~e2 + · · ·+ (an − a′n)~en =~0

y, por ser B un sistema linealmente independiente necesariamente los esca-lares

(ai − a′i) = 0 ⇐⇒ ai = a′i

lo cual prueba que la expresión es única. �

4.3.1. Cambio de base

Sea V un espacio vectorial de dim V = n y sean B = {~e1,~e2, . . . ,~en} yB′ = {~e′1,~e′2, . . . ,~e′n} dos bases. Dado un vector ~x ∈ V, éste tendrá coorde-nadas distintas según que base, así

~x = (x1, x2, . . . , xn)B ⇒ ~x = x1~e1 + x2~e2 + · · ·+ xn~en (4.2)~x = (x′1, x′2, . . . , x′n)B′ ⇒ ~x = x′1~e′1 + x′2~e′2 + · · ·+ x′n~e′n (4.3)

Y cada vector de una de las bases tendrá unas coordenadas respecto a laotra base, en particular consideramos las coordenadas los vectores de B(base antigua) en la base B′ (base nueva), así

~e1 = p11~e′1 + p21~e′2 + · · ·+ pn1~e′n~e2 = p12~e′1 + p22~e′2 + · · ·+ pn2~e′n

......

~en = p1n~e′1 + p2n~e′2 + · · ·+ pnn~e′n

que, sustituyendo en (4.2) nos da una expresión de ~x diferente

~x = x1(p11~e′1 + · · ·+ pn1~e′n) + x2(p12~e′1 + · · ·+ pn2~e′n) + . . .

· · ·+ xn(p1n~e′1 + · · ·+ pnn~e′n)

Page 112: ALyMD

108 Espacios vectoriales

y reordenando la expresión y comparando con la igualdad (4.3) tenemos

~x = (x1 p11 + x2 p12 + · · ·+ xn p1n︸ ︷︷ ︸= x′1

)~e′1 + (x1 p21 + · · ·+ xn p1n︸ ︷︷ ︸= x′2

)~e′2 + . . .

· · ·+ (x1 pn1 + · · ·+ xn pnn︸ ︷︷ ︸= x′n

)~e′n

que nos produce un sistema de ecuaciones lineales cuadrado, cuya expre-sión matricial es la siguiente

p11 p12 . . . p1np21 p22 . . . p2n...

......

pn1 pn2 . . . pnn

·

x1x2...

xn

=

x′1x′2...

x′n

abreviadamente escribimos

P · X = X′,

siendo X y X′ las coordenadas del vector ~x expresadas como matrices co-lumna. A la matriz P se le llama matriz del cambio de base de la base B a la baseB′.

Observaciones: La matriz P se construye poniendo en sus columnas lascoordenadas de los vectores ~ei ∈ B (base antigua) respecto de la base B′

(base nueva).Observa también que P es invertible, puesto que es la matriz de un sis-

tema lineal de ecuaciones n× n que tiene solución única y, por el teoremade Rouché-Fröbenius, det(P) 6= 0.

Por tanto, la expresión PX = X′ es equivalente a P−1X′ = X que repre-senta el cambio de base en sentido contrario

Ejercicio 4.28. Calcula las matrices de cambio de base entre la base canónica deR4 y la base siguiente B = {(1, 1, 0, 0), (0, 0, 1, 1), (1, 0, 0, 1), (0, 1, 0, 1)}. Ade-más, usa la que corresponda para calcular las coordenas del vector (1, 1, 1, 1) en labase B.

4.3.2. Bases de subespacios

Proposición 4.29. Sean V un espacio vectorial y S un subespacio vectorial de Vtal que dim S = dim V = n. Entonces S = V.

Page 113: ALyMD

4.4 Operaciones con subespacios 109

Demostración. Si B es una base de S, entonces contiene n vectores lineal-mente independientes de V. Sólo queda ver que es un sistema generadordel propio V. Para ello consideremos ~x ∈ V cualquier vector no contenidoen B, entonces el sistema B ∪ {~x} es necesariamente linealmente depen-diente porque son n + 1 vectores en un espacio de dimensión n. Esto obligaa que ~x sea combinación lineal de B. �

Como consecuencia del resultado anterior probaremos el siguiente quenos será de utilidad.

Teorema 4.30 (de la base incompleta). Sea S un subespacio vectorial de V dedimensión n, con base BS = {~c1,~c2, . . . ,~cm} (m ≤ n), entonces podemos añadirn−m vectores a dicha base,

B = {~c1,~c2, . . . ,~cm,~e1,~e2, . . . ,~en−m}

para que sea una base (completa) de V.

Demostración. Si S = V (es decir, n − m = 0) la base ya está completa,con lo que hemos terminado. En caso contrario, existe algún vector ~e1 enV que no está en S, por tanto el sistema {~c1,~c2, . . . ,~cm,~e1} es linealmenteindependiente y es una base de un subespacio S1 de V.

Si S1 coincide con V (es decir, n − m = 1) ya hemos acabado, en ca-so contrario repetimos el procedimiento S2, S3, . . . Sn−m hasta llegar a unsubespacio que coincida con V. �

Ejercicio 4.31. Para comprender mejor el teorema anterior, elige una base cual-quiera del subespacio vectorial S de R4 del ejemplo 4.18. Amplía dicha base a unade todo el espacio R4.

4.4. Operaciones con subespacios

4.4.1. Intersección de subespacios

Observa que la intersección de dos subespacios de un espacio vectorialnunca es vacía puesto que el vector~0 está en ambos. Además la intersecciónde dos subespacios también es subespacio vectorial. Vamos a probar queesto es cierto y algo más, la intersección de cualquier familia de subespaciosvectoriales es subespacio vectorial.

Teorema 4.32. Dada una familia {Si}i∈I de subespacios vectoriales de V, laintersección

⋂i∈I

Si es también subespacio vectorial.

Page 114: ALyMD

110 Espacios vectoriales

Demostración. Aplicamos el teorema 4.12 de caracterización de subespa-cios. Sean ~v, ~w ∈ ⋂

i∈I Si, y sean λ, µ ∈ K, entonces para cada i ∈ I setiene que ~v, ~w ∈ Si, que como son subespacios vectoriales se cumple

λ~v + µ~w ∈ Si para cada i ∈ I

por tanto, λ~v + µ~w ∈ ⋂i∈I Si. �

Nota. Obsérvese que la unión de subespacios no es un subespacio. (Encuen-tra algún contraejemplo que lo corrobore).

Ejemplo 4.33. Consideremos los subespacios S1 y S2 de R5 siguientes

S1 = L({(1, 2,−1, 0, 1), (0, 1, 1, 0,−1), (1, 0,−3, 0, 3)})

S2 ≡{

x1 + x4 = 0x2 + x3 = 0

vamos a calcular la intersección de ambos.Calculamos, en primer lugar, las ecuaciones cartesianas de S1. La matriz de

vectores

1 0 12 1 0−1 1 −3

0 0 01 −1 3

tiene rango 2, y comprobamos que los dos primeros

vectores son linealmente independientes, por tanto nos quedamos con elloscomo base de S1. Entonces, si ~x = (x1, x2, x3, x4, x5) es un vector de S1 la

nueva matriz

1 0 x12 1 x2−1 1 x3

0 0 x41 −1 x5

sigue teniendo rango 2, Aplicando el método de

Gauss obtenemos la siguiente matriz equivalente1 0 x10 1 −2x1 + x20 0 3x1 − x2 + x30 0 x40 0 −3x1 + x2 + x5

que nos da las ecuaciones cartesianas:

S1 ≡

3x1 − x2 + x3 = 0

x4 = 0−3x1 + x2 + x5 = 0

Unimos por tanto, las ecuaciones de S1 y S2 para tener el siguiente sistema,cuyas soluciones son el espacio intersección S1 ∩ S2

3x1 − x2 + x3 = 0x4 = 0

−3x1 + x2 + x5 = 0x1 + x4 = 0x2 + x3 = 0

Page 115: ALyMD

4.4 Operaciones con subespacios 111

Este sistema es compatible determinado, por tanto, el vector (x1, . . . , x5) =(0, 0, 0, 0, 0) representa la única solución. Es decir,

S1 ∩ S2 = {~0}

A título ilustrativo, vemos a continuación que el subespacio generadopuede verse como la intersección de subespacios. El siguiente teorema des-cribe una forma distinta de construir L(X).

Proposición 4.34. El subespacio generado L(X) es la intersección de todos lossubespacios que contienen a X.

Demostración. Representamos por F la familia de subespacios vectorialesque continen a X, entonces, como L(X) es un subespacio vectorial y con-tiene a X, es, por tanto, un miembro de la familia luego una inclusión esevidente ⋂

S∈FS ⊆ L(X)

Veamos la inclusión contraria, si S es un miembro de F entonces (por sersubespacio vectorial y contener a X) contiene todas las combinaciones li-neales de los vectores de X, es decir, L(X). Dicho de otro modo, L(X) ⊆S, para cada S ∈ F , luego

L(X) ⊆⋂

S∈FS

que completa la igualdad. �

4.4.2. Suma de subespacios

Ya hemos visto que la unión de subespacios vectoriales no es necesaria-mente un subespacio vectorial. Para solucionar este problema se extiendela unión lo necesario (y suficiente) para que sí sea un subespacio vectorial.Lo vemos en la siguiente definición.

Definición 4.35. Dados dos subespacios vectoriales S1 y S2 de V se definela suma de subespacios vectoriales como el conjunto

S1 + S2 = {~v1 +~v2 | ~v1 ∈ S1 y ~v2 ∈ S2}.

La suma S1 + S2 de subespacios vectoriales es un subespacio vectorial

Demostración. Aplicamos el teorema 4.12. Si ~v y ~w son vectores de S1 + S2,entonces ~v = ~v1 +~v2 y ~w = ~w1 + ~w2 siendo ~v1, ~w1 ∈ S1 y ~v2, ~w2 ∈ S2, luego

λ~v + µ~w = (λ~v1 + µ~w1) + (λ~v2 + µ~w2) ∈ S1 + S2

Page 116: ALyMD

112 Espacios vectoriales

Proposición 4.36. Si S1 y S2 son subespacios vectoriales de V de bases B1 y B2,respectivamente, entonces

S1 + S2 = L(S1 ∪ S2) = L(B1 ∪ B2)

Demostración. La demostración es trivial y la dejamos como ejercicio parael alumno. �

Ejemplo 4.37. Calculemos la suma de los subespacios siguientes de R4

S1 = L({(1, 0, 2, 0), (0, 1, 1, 1)}) y S2 ≡{

x1 − x2 + x4 = 0x2 − x4 = 0

SOLUCIÓN: Nos dan una base de S1 y obtenemos una base de S2 resolvien-do el sistema de ecuaciones que lo define,

x1 = 0x2 = λx3 = µx4 = λ

por tanto B2 = {(0, 1, 0, 1), (0, 0, 1, 0)} es una base de S2. Por tanto

S1 + S2 = L({(1, 0, 2, 0), (0, 1, 1, 1), (0, 1, 0, 1), (0, 0, 1, 0)})

y como rango( 1 0 0 0

0 1 1 02 1 0 10 1 1 0

)= 3 elegimos tres vectores independientes (por

ejemplo, los tres primeros). Para calcular su ecuación cartesiana aplicamosel método de Gauss a la matriz

1 0 0 x10 1 1 x22 1 0 x30 1 1 x4

Por filas!

1 0 0 x10 1 0 −2x1 + x30 0 1 2x1 + x2 − x30 0 0 −x2 + x4

que nos da la ecuación

x2 − x4 = 0

Suma directa de subespacios

Definición 4.38. Si S1 ∩ S2 = {~0}, entonces S1 + S2 se llama suma directa yse representa S1 ⊕ S2.

Ejercicio 4.39. Calcula la intersección de los subespacios S1 y S2 del e4.37 paracomprobar si la suma que allí se calcula es directa o no.

Page 117: ALyMD

4.5 Espacios cocientes 113

Definición 4.40. Dos subespacios S1 y S2 se dice que son suplementarios siy solo si S1 ⊕ S2 = V.

Ejercicio 4.41. Expresa R5 como suma directa de dos subespacios. Hazlo ahoracomo suma de directa de tres subespacios.

Ejercicio 4.42. Calcula el subespacio suma directa S1 ⊕ S2 de los subespacios delEjemplo 4.33, en página 110.

Teorema 4.43 (Fórmula de Grassmann). Si S1 y S2 son subespacios de un es-pacio vectorial V de dimensión finita, entonces

1. dim(S1 + S2) = dim(S1) + dim(S2)− dim(S1 ∩ S2)

2. dim(S1 ⊕ S2) = dim(S1) + dim(S2)

4.5. Espacios cocientes

Si S es un subespacio vectorial de V podemos definir la siguiente rela-ción de equivalencia en V.

~v ∼ ~w ⇐⇒ ~w−~v ∈ S

Veamos que, efectivamente, es de equivalencia:

Demostración.

1. Reflexiva: ~v ∼ ~v es trivial, puesto que es equivalente a~0 ∈ S.

2. Simétrica: ~v ∼ ~w ⇐⇒ ~w−~v ∈ S ⇐⇒ ~v− ~w ∈ S ⇐⇒ ~w ∼ ~v.

3. Transitiva:~v ∼ ~w y ~w ∼ ~x ⇐⇒ ~w−~v ∈ S y ~x− ~w ∈ S ⇐⇒ ~x−~v ∈S ⇐⇒ ~v ∼ ~x.

Podemos dotar al conjunto cociente de suma y producto por un escalar:Se definen: la suma como [~v] + [~w] = [~v + ~w] y el producto λ[~v] = [λ~v],lo que nos da una estructura de espacio vectorial llamado Espacio Vectorialcociente V/S.

Demostración. Esencialmente consiste es comprobar que la suma de clasesy el producto de un escalar por una clase de equivalencia son operaciones,es decir, no dependen del representante de la clase elegido, es decir,~v1 ∼ ~v2y ~w1 ∼ ~w2, entonces [~v1] + [~w1] = [~v2] + [~w2] y λ[~v1] = λ[~v2]. �

Page 118: ALyMD

114 Espacios vectoriales

Teorema 4.44. Si V es un espacio vectorial de dimensión finita, entonces

dim(V/S) = dim(V)− dim(S).

Demostración. Dada una base {~v1,~v2, . . . ,~vk} de S, por el teorema 4.30 (de la baseincompleta), podemos ampliarla a una base {~v1,~v2, . . . ,~vk,~e1,~e2, . . . ,~en−k} de V.Comprobamos, entonces, que el sistema de vectores

{[~e1], [~e2], . . . , [~en−k]}

es una base de V/S, es decir dim(V/S) = n − k. Dejamos los detalles para elalumno. �

Ejercicios Propuestos

Ej. 4.1 — Halla cuales de los siguientes conjuntos forman un subespaciovectorial de R4:

E1 = {(x1, x2, x3, x4) | x1 + x2 = 1} E2 = {(x1, x2, x3, x4) | x1 + x2 = x3 + x4}E3 = {(x1, x2, x3, x4) | x1 − x4 = 0} E4 = {(x1, x2, x3, x4) | x1 ∈ Q}

Ej. 4.2 — Considera en R4 el conjunto

X = {(1, 2, 1, 2), (1, 0, 1, 0), (−3,−3,−3,−3), (0, 0, 1, 2), (0, 1, 0, 1)}1. Determina un subconjunto máximo de vectores linealmente inde-

pendientes.2. Representa mediante ecuaciones paramétricas y mediante ecuacio-

nes implícitas el subespacio generado por el conjunto X.3. Determina una base de dicho subespacio.

Ej. 4.3 — Sea V el conjunto formado por las sucesiones infinitas de núme-ros reales; en V se consideran las operaciones:

{an}+ {bn} = {an + bn} para todo {an}, {bn} ∈ Vλ{an} = {λan} para todo λ ∈ R

1. Comprueba que V es un espacio vectorial.2. Indica cuales de los siguientes conjuntos son subespacios de V: las

sucesiones acotadas, las sucesiones constantes, las sucesiones con lí-mite, los infinitésimos, las sucesiones con límite uno, las sucesionesde términos positivos y las sucesiones sin límite.

Ej. 4.4 — (Sep. 2013) Sea B = {~u,~v, ~w} una base del espacio vectorial V.Sean ~u′ = 2~u−~v + ~w, ~v′ = ~u + ~w y ~w′ = 3~u−~v + 3~w.

Page 119: ALyMD

4.5 Espacios cocientes 115

1. Prueba que B′ = {~u′,~v′, ~w′} es una base de V.2. Establece las ecuaciones del cambio de base de B a B′.3. Halla las coordenadas respecto de B del vector~z = 2~u′ + 3~v′ + ~w′.

Ej. 4.5 — En el espacio vectorial real R10, se consideran los subespacios:

V = {(x1, x2, . . . , x10) | xn+i = xi, i = 1, 2, . . . , 5}U = {(y1, y2, . . . , y10) | y2n+1−i = yi, i = 1, 2, . . . , 5}

1. Halla la dimensión y determina una base de cada uno de los subes-pacios V y U.

2. Halla V ∩U, su dimensión y una base.3. Halla la dimensión de V + U.

Ej. 4.6 — (Sep. 2013) Se consideran en R4 los subespacios F y G generadosrespectivamente por L(~u1,~u2,~u3) y L(~v1,~v2,~v3), siendo:

~u1 = (3, 3, 1, 1), ~u2 = (1,−3, 1, 1), ~u3 = (3, 1,−1, 3)~v1 = (2, 2, 0, 1), ~v2 = (2, 0, 1, 1) , ~v3 = (1, 1,−1,−1)

Halla las ecuaciones de F ∩ G y de F + G.

Ej. 4.7 — Demuestra que los vectores (2, 1, 1), (1, 3, 1) y (−2, 1, 3) formanuna base de R3 y halla las coordenadas en dicha base del vector (1, 1, 2).

Ej. 4.8 — Un vector de R3 tiene por coordenadas (1, 2, 3) en la base B ={~v1,~v2,~v3}. Halla las coordenadas en la base B′ = {~u1,~u2,~u3} siendo ~u1 =3~v1 + 2~v2 −~v3, ~u2 = 4~v1 +~v2 +~v3 y ~u3 = 2~v1 −~v2 +~v3.

Ej. 4.9 — En el espacio R3 el vector ~v tiene por coordenadas (5, 1,−2) res-pecto de la base B = {~x,~y,~z} y respecto de la base B′ = {~p,~q,~r} sus coor-denadas son (6,−3, 4). Sabiendo que ~p = 3~x −~y +~z y ~q = 4~x + 5~y − 6~z.Halla las coordenadas de~r en la base B.

Ej. 4.10 — Sea V el espacio vectorial de los números complejos construidosobre R y sea U el espacio vectorial de los números complejos construidosobre C. Demuestra que dim V = 2 y dim U = 1.

Ej. 4.11 — En R3, consideramos E el subespacio generado por los vectores(2, 0, 1), (1,−1, 2) y (1, 1,−1) y V = L({(1, 0, 1), (0, 1, 1)}).

1. Determina una base de E y las coordenadas en dicha base del vec-tor (5, 3,−2).

2. Calcula también una base de V.

Page 120: ALyMD

116 Espacios vectoriales

3. Expresa los subespacios E y V mediante ecuaciones implícitas y de-termina E ∩V a partir de dichas ecuaciones.

4. Determina una base y la dimensión de E ∩V.5. Calcula una base de E+V y expresa este subespacio mediante ecua-

ciones paramétricas y mediante ecuaciones implícitas.6. ¿Se trata de una suma directa?¿Por qué?

Ej. 4.12 — (Feb. 2012) Consideramos E = L({(2, 0, 1), (1,−1, 2), (1, 1,−1)})y V = L({(1, 0, 1), (0, 1, 1)}) en el espacio vectorial R3.

1. Determina una base de E y las coordenadas en dicha base del vec-tor (5, 3,−2).

2. Expresa los subespacios E ∩ V y E + V mediante ecuaciones para-métricas y mediante ecuaciones implícitas.

Ej. 4.13 — (Feb. 2013) Considere, en R4, el subespacio U = L({(1, 1, 0, 0),(0, 0, 1, 1), (0, 0,−5, 0), (3, 3, 2,−1)}) y el subespacio V = {(x1, x2, x3, x4) |x1 − x3 = 0}.

1. Determine una base de U y exprese U con ecuaciones implícitas.2. Estudie si los vectores (2, 1, 2, 1), (2, 2, 1, 1) y (1, 2, 2, 1) pertenecen a

U y, en caso afirmativo, encuentre su representación respecto de labase del apartado anterior.

3. Determine U ∩V y U + V. ¿Es suma directa?

Ej. 4.14 — En R3 se considera el conjunto U = {(x1, x2, x3) | x1 − x2 =0 y x1− 2x2 + x3 = 0} y la relación de equivalencia (x1, x2, x3)RU (y1, y2, y3)si (x1 − y1, x2 − y2, x3 − y3) ∈ U.

1. Demuestra que U es un subespacio.2. Demuestra queRU es una relación de equivalencia.3. Encuentra dos elementos que pertenezcan a la misma clase que el

vector (1, 2,−3).4. Encuentra una base de R3/U

Ej. 4.15 — Demuestra que si los vectores ~x1,~x2, . . . ,~xn son linealmente in-dependientes, también lo son ~u1,~u2, . . . ,~un siendo ~u1 = ~x1, ~u2 = ~x1 + ~x2,. . . , ~un = ~x1 +~x2 + · · ·+~xn.

Page 121: ALyMD

TEMA 5

APLICACIONES LINEALES

Índice5.1. Definición y propiedades . . . . . . . . . . . . . . . . . . 118

5.1.1. Tipos de aplicaciones lineales . . . . . . . . . . . 121

5.1.2. Operaciones de aplicaciones lineales . . . . . . . 122

5.1.3. Núcleo e Imagen de una aplicación lineal . . . . 123

5.1.4. El Teorema de la Dimensión . . . . . . . . . . . . 126

5.2. Representación matricial de una aplicación lineal . . . . 126

5.2.1. Matrices de una aplicación lineal . . . . . . . . . 127

5.2.2. Cambio de base y matrices equivalentes . . . . . 130

5.3. Matrices semejantes y endomorfismos . . . . . . . . . . . 132

5.3.1. Matrices semejantes . . . . . . . . . . . . . . . . . 133

5.3.2. Endomorfismos diagonalizables . . . . . . . . . 133

5.3.3. Autovalores y Autovectores . . . . . . . . . . . . 134

5.4. Teorema de diagonalización . . . . . . . . . . . . . . . . 136

5.4.1. Multiplicidad algebraica y geométrica . . . . . . 137

5.4.2. Teorema fundamental . . . . . . . . . . . . . . . 138

5.5. Aplicaciones de la diagonalización . . . . . . . . . . . . . 140

5.5.1. Cálculo de potencias y matriz inversa . . . . . . 140

5.5.2. Teorema de Cayley-Hamilton . . . . . . . . . . . 141

5.5.3. Exponencial de una matriz . . . . . . . . . . . . . 142

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 144

117

Page 122: ALyMD

118 Aplicaciones lineales

5.1. Homomorfismos de Espacios Vectoriales: Aplica-ciones lineales

A partir de esta sección consideraremos V y E espacios vectoriales dedimensión finita sobre el mismo cuerpo K.

Definición 5.1. Una función entre espacios vectoriales f : V → E es unaaplicación lineal si es un homomorfismo de espacios vectoriales, es decir:También llamadas

transformaciones lineales o,simplemente,

transformaciones.

1. f (~v1 +~v2) = f (~v1) + f (~v2) para cada ~v1,~v2 ∈ V

2. f (λ~v) = λ f (~v) para cada λ ∈ K y ~v ∈ V

Ejemplo 5.2. La función f : R3 → R3 definida f (x1, x2, x3) = (x2, x1, x3) esuna aplicación lineal, puesto que

1. f (~v1 +~v2) = f (x1 + x′1, x2 + x′2, x3 + x′3) = (x2 + x′2, x1 + x′1, x3 + x′3) =f (~v1) + f (~v2).

2. f (λ~v) = f (λx1, λx2, λx3) = (λx2, λx1, λx3) = λ(x2, x1, x3) = λ f (~v)

Observa que esta aplicación lineal es una transformación elemental de tipo Ique ya hemos visto en el Tema 2.

Una definición equivalente de aplicación lineal es la siguiente:

Proposición 5.3. Una función entre espacios vectoriales f : V → E es aplicaciónlineal si y solo si para cualquier combinación linealEn general para k vectores:

f

(k∑i=1

λi~vi

)=

k∑i=1

λi f (~vi)

se tiene

f (λ1~v1 + λ2~v2) = λ1 f (~v1) + λ2 f (~v2)

Demostración. Claramente la proposición 5.3 implica la definición 5.1, pues-to que las dos hipótesis que se verifican lo hacen sobre combinaciones linea-les: 1~v1 + 1~v2 y λ~v +~0.

Inversamente, a partir de la definción 5.1 se deduce

f (λ1~v1 + λ2~v2)por 1= f (λ1~v1) + f (λ2~v2)

por 2= λ1 f (~v1) + λ2 f (~v2)

Ejemplo 5.4. La función f (x1, x2, x3) = (x1 − x3, 2x2 + x3) está expresadaanalíticamente y entendemos que está definida en R3 con imágenes en R2.Prueba que es una aplicación lineal.

SOLUCIÓN: Usamos la definición 5.3. Si expresamos~v1 = (x1, x2, x3) y~v2 =(y1, y2, y3) tenemos:

f (λ~v1 + µ~v2) = f (λx1 + µy1, λx2 + µy2, λx3 + µy3)

=(λx1 + µy1 − λx3 − µy3, 2λx2 + 2µy2 + λx3 + µy3)

=λ(x1 − x3, 2x2 + x3) + µ(y1 − y3, 2y2 + y3)

=λ f (~v1) + µ f (~v2)

Page 123: ALyMD

5.1 Definición y propiedades 119

Ejercicio 5.5. De las siguientes funciones f : V → E, determina cuales son apli-caciones lineales:

1. V = E = R3, f (~v) = ~v +~v0, con ~v0 un vector fijo de R3.

2. V = E = R3, f (~v) = ~v0, con ~v0 un vector fijo de R3.

3. V = E =Mn×n, f (A) = A + At.

4. V = E = P3[R], f (p(x)) = xp′(x). (Recordemos que P3[R] el espaciovectorial de los polinomios de grado menor o igual que 3, y p′(x) la derivadade p(x))

Proposición 5.6 (Propiedades). Si f : V → E una aplicación lineal, entonces:

1. La imagen del vector cero es el vector cero. Más brevemente, f (~0) =~0.

2. Para todo ~v ∈ V se satisface f (−~v) = − f (~v).

3. Si un subespacio U = L({~v1, . . . ,~vk}) de V está generado por k vectores,entonces su imagen f (U) es un subespacio vectorial de E generado por lasimágenes del sistema generador de U, es decir,

f (U) = L({ f (~v1), . . . , f (~vk)})

4. La aplicación lineal f viene completamente determinada por las imágenes deuna base de V.

Demostración.

1. f (~0) = f (~0 +~0) = f (~0) + f (~0), luego f (~0) = f (~0)− f (~0) =~0.

2. f (−~v) = f ((−1)~v) = (−1) f (~v) = − f (~v).

3. En primer lugar veamos que f (U) es un subespacio vectorial. Dadosdos vectores de f (U), ~w1 = f (~a1), ~w2 = f (~a2) con ~a1,~a2 en U, y dosescalares λ, µ ∈ K entonces

λ~w1 + µ~w2 = f (λ~a1 + µ~a2︸ ︷︷ ︸~v∈U

) = f (~v) ∈ f (U)

por tanto L({ f (~v1), . . . , f (~vk)}) ⊆ f (U) (puesto que el subespacio ge-nerado está en cualquier espacio que contenga al sistema generador).

Por otro lado si ~w ∈ f (U) ⇒ ~w = f (~v) con ~v ∈ U y ~v = ∑ki=1 αi~vi,

luego

~w =k

∑i=1

αi f (~vi) ∈ L({ f (~v1), . . . , f (~vk)})

de donde se deduce la inclusión contraria y, por tanto, la igualdaddeseada.

Page 124: ALyMD

120 Aplicaciones lineales

4. Si ~v es cualquier vector de V con base B = {~ei}ni=1, entonces ~v =

∑ni=i αi~ei, luego

f (~v) = f

(n

∑i=i

αi~ei

)=

n

∑i=i

αi f (~ei)

Es decir, si conocemos las imágenes de la base, f (~ei) conocemos laimagen f (~v) de cualquier vector. �

Ejercicio 5.7. Consideramos la aplicación lineal siguiente f : R4 → R4 definidaa partir de las imágenes de una base,

f (1, 0, 0, 0) = (1, 1, 0, 0); f (1, 1, 0, 0) = (1, 0, 1, 0);f (1, 1, 1, 0) = (2, 1, 1, 0); f (1, 1, 1, 1) = (1, 1, 0, 1)

se pide:

1. Da una expresión analítica de f .

2. Si U es el subespacio de R4 de ecuaciones cartesianas x1 − x4 = 02x2 + x3 = 0

},

calcula las ecuaciones de f (U).

Otra propiedad es que las aplicaciones lineales respetan la dependencialineal, es decir

Proposición 5.8. Sea f : V → E una aplicación lineal. Si X es un sistema devectores de V linealmente dependiente, entonces f (X) es un sistema linealmentedependiente de E.

Demostración. Sea X = {~v1, . . . ,~vk} y supongamos que λi 6= 0 y λ1~v1 +· · ·+ λi~vi + · · ·+ λk~vk =~0. Aplicando f tenemos

λ1 f (~v1) + · · ·+ λi f (~vi) + · · ·+ λk f (~vk) =~0, con λi 6= 0

que prueba que f (X) es linealmente dependiente. �

El resultado análago para independencia lineal no es cierto.

Ejercicio 5.9. Da un ejemplo de esto último, es decir, una aplicación lineal f ,un sistema de vectores linealmente independientes X de forma que f (X) no sealinealmente independiente.

Page 125: ALyMD

5.1 Definición y propiedades 121

5.1.1. Tipos de aplicaciones lineales

Para las aplicaciones lineales se usan los siguientes términos: mono-morfismo (aplicación lineal inyectiva), epimorfismo (sobreyectiva) e isomorfismo(biyectiva). Además, llameros endomorfismo: a cualquier aplicación linealdesde un espacio vectorial V al propio V, es decir, f : V → V y automorfis-mo: a una aplicación lineal que es endomorfismo e isomorfismo.

Nota. Especial interés tiene en álgebra lineal los isomorfismos de espaciosvectoriales. Si existe un isomorfismo entre V y E se dice que son espaciosvectoriales isomorfos y se representa V ≈ E. Notemos, además que la re-lación de “isomorfismo” es de equivalencia en el conjunto de los espaciosvectoriales.

Si f es una aplicación lineal inyectiva, entonces respeta la independen-cia lineal como vemos a continuación.

Proposición 5.10. Si f es monomorfismo y X es un sistema de vectores de Vlinealmente independientes, entonces f (X) es un sistema de vectores de E lineal-mente independientes.

Demostración. La dejamos como ejercicio para el alumno. �

Por tanto, si f : V → E es un isomorfismo y B es una base de V, pode-mos hacer las siguientes observaciones:

1. f (B) es un sistema de vectores linealmente independiente de E, comoacabamos de ver en la anterior proposición.

2. f (B) es un sistema generador de la imagen f (V) = E por ser sobre-yectiva. Consecuencia del apartado 3 de la proposición 5.6.

Es decir,

La imagen de una base de V por un isomorfismo V → E es una base de E.

Corolario 5.11. Dos espacios vectoriales isomorfos tienen la misma dimensión.

Por último una observación importante sobre los espacios vectoriales realesde dimensión finita.

Teorema 5.12. Si V es un espacio vectorial real de dimensión n entonces V Igualmente, un espaciovectorial complejo dedimensión n es isomorfoa Cn.

esisomorfo a Rn.

Demostración. Si fijamos una base B de V, cada vector~v ∈ V tiene unas úni-cas coordenadas ~v = (v1, v2, . . . , vn)B en B, y es fácil probar que la funciónf : V → Rn definida f (~v) = (v1, v2, . . . , vn) es un isomorfismo. �

Page 126: ALyMD

122 Aplicaciones lineales

5.1.2. Operaciones de aplicaciones lineales

Representaremos por L(V, E) al conjunto de todas las aplicaciones li-neales de V a E.

A este conjunto se pueden trasladar las operaciones de los espacios vec-toriales que lo definen. Así, si f , g : V → E son aplicaciones lineales, sedefine la suma f + g como una nueva aplicación del siguiente modo

f + g : V → E~v � f (~v) + g(~v)

y si λ ∈ K es un escalar lo multiplicamos por f para construir una nuevaaplicación lineal producto λ f definida:

λ f : V → E~v � λ f (~v)

Ejercicio 5.13. Comprueba que las nuevas definiciones se corresponden con apli-caciones lineales. Aplica la definición 5.1 o 5.3 para probar esto.

Proposición 5.14. Si V, E son espacios vectoriales sobre un mismo cuerpo K,entonces L(V, E) es un nuevo espacio vectorial sobre el cuerpo K.Si E = K, el espacio

vectorial L(V, K), de lamisma dimensión que V,

recibe el nombre de Espaciovectorial dual y se

representa V∗.

Además, si V y E son de dimensión finita n y m, respectivamente, entoncesL(V, E) tiene dimensión n ·m.

Demostración. Es fácil probar que las operaciones de suma y producto porescalar definidos en L(V, E) verifican todas las propiedades de un espaciovectorial. Dejamos esto como ejercicio.

Por otro lado, si B1 = {~vi}ni=1 es base de V y B2 = {~ei}m

i=1 es basede E, construimos una base de funciones { fij} de L(V, E). Por el punto 4de la proposición 5.6 para definir fij es suficiente con decir cuáles son lasimágenes de la base B1, así definimos

fij(~vk) =

{~ej si k = i~0 en otro caso

Se prueba que estas n ·m funciones { fij} son linealmente independientes yes un sistema generador de L(V, E), por tanto, una base. �

Composición e inversas de aplicaciones lineales

Las aplicaciones lineales se comportan bien para la composición de fun-ciones, es decir,

Proposición 5.15. Si f : V → E y g : E → F son aplicaciones lineales, entoncesla composición g ◦ f : V → F también es una aplicación lineal.

Page 127: ALyMD

5.1 Definición y propiedades 123

Demostración. Ejercicio. �

Además la composición también mantiene el tipo de morfismo, es decir,la composición de monomorfismo es un monomorfismo, la de epimorfismotambién es epimorfismo y, por último, la composición de isomorfismos esun nuevo isomorfismo. En este último caso podemos añadir el siguienteresultado:

Proposición 5.16. Sea f una aplicación lineal, f es un isomorfismo si y solo sif−1 es isomorfismo.

Demostración. Ejercicio. �

5.1.3. Núcleo e Imagen de una aplicación lineal

Como cualquier función la aplicación lineal f : V → E tiene una ima-gen. Introducimos también el concepto de núcleo ker f .

Im f = f (V) = {~y ∈ E | f (~x) = ~y para algún ~x ∈ V}

ker f = f−1({~0}) = {~x ∈ V | f (~x) =~0}

Proposición 5.17 (Propiedades). Sea f : V → E una aplicación lineal.

1. Los conjuntos ker f y Im f son subespacios vectoriales de V y E respectiva-mente.

2. f es sobreyectiva si y solo si Im f = E.

3. f es inyectiva si y sólo si ker f = {~0}.

4. ker f = {~0} si y sólo si para cualquier sistema de vectores X ⊆ V lineal-mente independiente se tiene que f (X) es linealmente independiente

Demostración. Los puntos 1 y 2 son muy fácil de probar y se dejan comoejercicio.

3. Supongamos que f es inyectiva. Sabemos que ker f no es vacío, puestoque~0 ∈ ker f . Sea entonces ~v ∈ ker f ⇒ f (~v) = ~0 = f (~0), y la inyecti-vidad nos dice que ~v =~0, es decir, el único elemento posible de ker f esel vector~0.

Inversamente, supongamos que ker f = {~0} y sean ~v1,~v2 ∈ V conf (~v1) = f (~v2). Tenemos, entonces, f (~v1 − ~v2) = ~0 ⇐⇒ ~v1 − ~v2 ∈ker f = {~0}. De aquí ~v1 = ~v2. Es decir, f es inyectiva.

4. Sea X = {~v1, . . . ,~vk}. Veamos la primera implicación. Suponemos queker f = {~0} y X es linealmente independiente pero, en cambio, f (X)

Page 128: ALyMD

124 Aplicaciones lineales

es linealmente dependiente. Podemos entonces encontrar una combi-nación lineal de f (X) igualada a~0, es decir,

λ1 f (~v1) + · · ·+ λi f (~vi) + · · ·+ λk f (~vk) =~0

con algún λi 6= 0, por tanto

f (λ1~v1 + · · ·+ λi~vi + · · ·+ λk~vk) =~0ker={~0}=⇒

λ1~v1 + · · ·+ λi~vi + · · ·+ λk~vk =~0

con λi 6= 0, que contradice que X sea independiente.

Inversamente, suponemos que X independiente implica f (X) indepen-diente y sea ~v ∈ ker f . Si ~v 6= ~0 entonces X = {~v} es un sistema in-dependiente, luego f (X) = { f (~v)} también es independiente, lo queimplica que f (~v) 6= ~0, que contradice que ~v sea un vector del núcleo.Por tanto, necesariamente ker f = {~0}. �

Ejemplo 5.18. Calculemos el núcleo y la imagen de la aplicación linealf : R4 → R3 definida

f (x1, x2, x3, x4) = (x1 + 2x2 − x3, x1 − x2 + x4, 2x1 + x2 − x3 + x4)

SOLUCIÓN: Comencemos por el núcleo. Al considerar f (x1, x2, x3, x4) = ~0,se nos plantea el siguiente sistema de ecuaciones

x1 + 2x2 − x3 = 0x1 − x2 + x4 = 0

2x1 + x2 − x3 + x4 = 0

que al resolverlo resultan las ecuaciones paramétricas del núcleo

x1 = λx2 = λ + µx3 = 3λ + 2µx4 = µ

.

Esto nos permite encontrar una base para el núcleo (de dimensión 2)

Bker = {(1, 1, 3, 0), (0, 1, 2, 1)}

Ahora calculemos la imagen de f . Un método para ello es consideraruna base B de R4 y hallar el subespacio L ( f (B)) = Im f . Consideramos Bla base canónica y formamos la matriz con sus imágenes puestos en colum-na (resp. filas) y con transformaciones elementales por columnas (resp. filas)conseguimos una matriz escalonada por columnas (resp. filas) que nos dauna base.

Page 129: ALyMD

5.1 Definición y propiedades 125

1 2 −1 01 −1 0 12 1 −1 1

Por columnas!

1 0 0 00 1 0 01 1 0 0

Así, BIm = {(1, 0, 1), (0, 1, 1)} , que nos permite calcular las ecuaciones car-tesianas y/o paramétricas de dicho subespacio. Por ejemplo la (única) ecua-ción cartesiana es:∣∣∣∣∣∣

1 0 x10 1 x21 1 x3

∣∣∣∣∣∣ = 0⇐⇒ x1 + x2 − x3 = 0 ≡ Im f

Teorema de descomposición de una aplicación lineal

Dada una aplicación lineal f : V → E, existen otras aplicaciones linealesp, f e i, para las que el siguiente diagrama conmuta1 y además:

V E

V/ker f Im f

f

pf

i

p es el epimorfismo definido p(~v) = [~v], acada vector se le lleva a su clase en V/ker f .

f es el isomorfismo definido f ([~v]) = f (~v),que a cada clase de V/ ker f lo lleva a laimagen por f de cualquier vector de la cla-se.

i es el monomorfismo definido i(~w) = ~w res-tringido a Im f ⊆ E (identidad).

Demostración. Lo primero es comprobar que f está bien definida, es decir,su valor no depende del representante elegido. Veamos

[~v1] = ~v2] ⇐⇒ ~v1 −~v2 ∈ ker f ⇐⇒ f (~v1) = f (~v2) (5.1)

Trivialmente las funciones p, f , i son aplicaciones lineales. Además pes sobreyectiva porque las clases no son vacías, por tanto cualquier vectorde la clase tiene como imagen por p la propia clase. La aplicación i es clara-mente inyectiva porque es la identidad. Y la función f es biyectiva, dejamoslos detalles como ejercicio, véase (5.1).

Por último, (i ◦ f ◦ p)(~v) = (i ◦ f )([~v]) = i( f (~v)) = f (~v), luego el dia-grama conmuta. �

1Conmuta quiere decir quef = i ◦ f ◦ p

o que el resultado de componer funciones no varía siguiendo distintos caminos de flechas.

Page 130: ALyMD

126 Aplicaciones lineales

5.1.4. El Teorema de la Dimensión

Definición 5.19 (Rango de una aplicación lineal). Dada una aplicación li-neal entre espacios vectoriales de dimensión finita f : V → E, llamamosrango de f a la dimensión de la imagen de f , es decir:

rango f = dim (Im f ).

Nota. El apartado 3 de proposición 5.6 nos dice que, si B es base de V,entonces Im f = L( f (B)) y, por tanto, rango f es el número de vectores lineal-mente independientes en f (B).

Las dimensiones del núcleo y de la imagen de una aplicación lineal es-tán relacionadas. Los siguientes resultados nos determinan cómo.

Lema 5.20. La imagen de una aplicación lineal f : V → E es isomorfa al espaciovectorial cociente V/ker f . Esto se representa

Im f ≈ V/ ker f

Demostración. Consecuencia inmediata de la descomposición de f , puestoque f : V/ ker f → Im f es isomorfismo. �

Teorema 5.21 (de la dimensión). Si f : V → E es una aplicación lineal entreespacios vectoriales de dimensión finita, entonces

dim V = dim(ker f ) + dim(Im f ).

Demostración. Por el teorema 4.44, dim(V/ ker f ) = dim V − dim(ker f ),por tanto

dim(Im f ) = dim V − dim(ker f )

y el lema 5.20 prueba el resultado. �

Ejercicio 5.22. Comprueba el teorema de la dimensión en el ejemplo 5.18.

5.2. Representación matricial de una aplicación lineal

A lo largo de esta sección suponemos que V es un espacio vectorial dedimensión n y E un espacio de dimensión m. Como hemos visto en teo-rema 5.12, si V y E son espacios vectoriales reales, podemos suponer, sinninguna pérdida de generalidad, que V = Rn y E = Rm. Suponemos ade-más que todas las funciones f , g, . . . que aparecen son aplicaciones lineales.

Page 131: ALyMD

5.2 Representación matricial de una aplicación lineal 127

5.2.1. Matrices de una aplicación lineal

Sea f : V → E y sean B1 = {~v1,~v2, . . . ,~vn} y B2 = {~e1,~e2, . . . ,~em} basesde V y E respectivamente,

f (~v1) = (a11, a12, . . . , a1m)B2 = a11~e1 + a12~e2 + · · ·+ a1m~emf (~v2) = (a21, a22, . . . , a2m)B2 = a21~e1 + a22~e2 + · · ·+ a2m~em

...f (~vn) = (an1, an2, . . . , anm)B2 = an1~e1 + an2~e2 + · · ·+ anm~em

Si el vector ~x tiene por coordenadas (x1, x2, . . . , xn) respecto a la base B1y f (~x) tiene por coordenadas (y1, y2, . . . , ym) respecto a la base B2 entonces

f (~x) = f (x1~v1 + x2~v2 + · · ·+ xn~vn)

= x1 f (~v1) + x2 f (~v2) + · · ·+ xn f (~vn)

= x1(a11~e1 + a12~e2 + · · ·+ a1m~em)+

+ x2(a21~e1 + a22~e2 + · · ·+ a2m~em) + . . .· · ·+ xn(an1~e1 + an2~e2 + · · ·+ anm~em)

y deshaciendo los paréntesis y agrupando respecto a los vectores ~ei nosqueda

f (~x) =(a11x1 + a21x2 + · · ·+ an1xn︸ ︷︷ ︸=y1

)~e1+

+ (a12x1 + a22x2 + · · ·+ an2xn︸ ︷︷ ︸=y2

)~e2 + . . .

...+ (a1mx1 + a2mx2 + · · ·+ anmxn︸ ︷︷ ︸

=ym

)~em

que nos da el sistema de ecuaciones

a11x1 + a21x2 + · · ·+ an1xn = y1a12x1 + a22x2 + · · ·+ an2xn = y2

...a1mx1 + a2mx2 + · · ·+ anmxn = ym

expresado en forma matricial del siguiente modo

y1y2...

ym

=

a11 a21 . . . an1a12 a22 . . . an2...

......

a1m a2m . . . anm

·

x1x2...

xn

Page 132: ALyMD

128 Aplicaciones lineales

La expresión matricial se suele representar más brevemente de la forma

Y = A · X.

donde X son las coordenadas de ~v respecto de la base B1, Y son las coorde-nadas de f (~v) respecto de la base B2 y A ∈ Mm×n es laEs única fijadas las bases.

Claramente, si las basescambian la matriz también

cambia.

única matriz de laaplicación lineal f respecto de dichas bases, más brevemente pondremos

A = M( f ;B1,B2)

Nota. Observa que el número de filas de su matriz A es la dimensión de Ey el número de columnas la dimensión de V.

Ejercicio 5.23. Comprueba que la transformación elemental de tipo I definida enel Ejemplo 5.2 como f (x1, x2, x3) = (x2, x1, x3) tiene por matriz0 1 0

1 0 00 0 1

que es una matriz elemental de tipo I.

Define analíticamente ejemplos de transformaciones elementales (de tipo II ytipo III) y comprueba que sus matrices son elementales del mismo tipo.

Ejemplo 5.24. Si f : R3 → R4 es la aplicación

f (x1, x2, x3) = (x1 + x3,−2x2, x1 − x2 + 2x3, x3)

vamos a calcular la matriz de f : 1) Respecto a las bases canónicas. 2) Res-pecto a las bases

B1 = {(0, 1, 1), (−1, 1, 0), (0, 0,−2)},B2 = {(2, 0, 1,−1), (0, 1,−1, 1), (2, 3, 0, 1), (0, 1, 0, 0)}

de R3 y R4, respectivamente.

SOLUCIÓN:1) Las columnas de A están formadas por las imágenes de la base,

f (1, 0, 0) = (1, 0, 1, 0)f (0, 1, 0) = (0,−2,−1, 0)f (0, 0, 1) = (1, 0, 2, 1)

luego la matriz queda A =

1 0 10 −2 01 −1 20 0 1

.

Page 133: ALyMD

5.2 Representación matricial de una aplicación lineal 129

2) Llamemos B a la matriz de f respecto a las bases B1 y B2. Tenemosque calcular las imágenes de los vectores de la base B1 y posteriormente lascoordenadas de dichos vectores respecto de B2. Así

f (0, 1, 1) = (1,−2, 1, 1) =(−3

2,−5

2, 2,−11

2

)B2

f (−1, 1, 0) = (−1,−2,−2, 0) =(

32

,72

,−2,12

)B2

f (0, 0,−2) = (−2, 0,−4,−2) = (5, 9,−6, 9)B2

por tanto la matriz de la aplicación lineal es

B = M( f ;B1,B2) =

−32

32

5

−52

72

9

2 −2 −6

−112

12

9

Operaciones y matrices

Las operaciones de las matrices se corresponden con las operaciones delas aplicaciones lineales.

Teorema 5.25. Sean B1 y B2, bases de V y E, respectivamente, y f , g : V → E.Si A = M( f ;B1,B2) y B = M(g;B1,B2), entonces:

1) A + B = M( f + g;B1,B2) y 2) λA = M(λ f ;B1,B2).

Demostración. Es muy fácil y la dejamos como ejercicio para el alumno. �

Ejercicio 5.26. Comprueba el teorema con un ejemplo. Pongamos, por caso, las

aplicaciones lineales f , g : R3 → R2 definidas f (x, y, z) = (2x + 3y,x + z

2) y

g(x, y, z) = (2y− z, z− x− y). Calcula f + g y posteriormente las matrices def , g y f + g respecto a las bases canónicas. Comprueba el teorema anterior, es decir,“la matriz de la suma es la suma de las matrices”.

En el siguiente teorema comprobamos que el producto de matrices delas aplicaciones lineales se corresponde con la composición de funciones.

Teorema 5.27. Sean B1, B2 y B3 bases de V, E y F, respectivamente, y f : V → Ey g : E→ F. Si A = M( f ,B1,B2) y B = M(g,B2,B3), entonces

B · A = M(g ◦ f ,B1,B3)

Page 134: ALyMD

130 Aplicaciones lineales

Demostración. Sean los vectores: ~v, f (~v) y g( f (~v)), donde cada uno está ensu respectivo espacio vectorial y sean X, Y, Z sus respectivas coordenadasen las respectivas bases del enunciado. Entonces Y = AX, Z = BY y sillamamos C = M(g ◦ f ,B1,B3), entonces Z = CX.

Observamos que Z = B(AX) = (BA)X. Como, fijadas las bases, lamatriz C es única, necesariamente C = B · A. �

Ejercicio 5.28. Dadas f : R2 → R3 definida f (x1, x2) = (3x1− x2, x2, x2− x1)y g : R3 → R2 definida g(x1, x2, x3) = (x3 − x1, x3 − x2), calcula g ◦ f y f ◦ gy comprueba el teorema anterior (con las bases canónicas, por ejemplo).

Por ultimo, nos queda ver como es la matriz de la inversa de un isomor-fismo.

Teorema 5.29. Si f : V → E es isomorfismo, entonces cualquier matriz A =M( f ;B1,B2) es invertible, y además

A−1 = M( f−1;B2,B1)

Demostración. Sea B = M( f−1;B2,B1). Sabemos que f−1 ◦ f = iV es laaplicación identidad en V, que es lineal y además su matriz asociada a unabase cualquiera es la identidad, es decir In = M(iV ;B1,B1).

Por el teorema 5.27 anterior tenemos B · A = In, por tanto A tiene in-versa que es justamente B (y al contrario), que prueba el resultado. �

5.2.2. Cambio de base y matrices equivalentes

Hemos visto que, para una misma aplicación lineal f , cambiando lasbases de los espacios donde se define, cambia la matriz de f . La preguntanatural es ¿como trasladamos el cambio de las bases al cálculo de la nueva matrizde f ?

Recordemos que dos matrices del mismo orden m× n son equivalentessi y solo si existen matrices regulares (invertibles) P y Q tales que

B = Q−1AP

Teorema 5.30. Dos matrices A, B ∈ Mm×n(K) son matrices asociadas ala misma aplicación lineal f : V → E si y solo si son equivalentes.

Demostración. Representaremos por B1,B1 bases de V y B2,B2 bases de E.Llamaremos P a la matriz del cambio de base de B1 a B1 y Q a la matriz delcambio de base de B2 a B2.

Page 135: ALyMD

5.2 Representación matricial de una aplicación lineal 131

Supongamos en primer lugar que A y B son matrices asociadas a f ,es decir, A = M( f ;B1,B2) y B = M( f ;B1,B2).

Dado cualquier vector ~v ∈ V, tendrá coordenadas X y X respecto delas bases B1 y B1, por tanto X = P · X.

Análogamente para el vector f (~v) con coordenadas Y e Y respecto delas bases B2 y B2, respectivamente, Y = Q ·Y.

Ahora bien, Y = AX ⇐⇒ QY = BPX ⇐⇒ Y = Q−1AP︸ ︷︷ ︸B

X, por tanto,

A y B son equivalentes.

Recíprocamente, sean A y B son equivalentes, es decir, B = Q−1AP.Consideremos espacios vectoriales V y E de dimensiones n y m res-pectivamente, con bases

B1 = {~e1 = (1, 0, . . . , 0),~e2 = (0, 1, . . . , 0), . . . ,~en = (0, 0, . . . , 1)}B2 = {~ε1 = (1, 0, . . . , 0),~ε2 = (0, 1, . . . , 0), . . . ,~εm = (0, 0, . . . , 1)}

y definimos f , a partir de las imágenes de la base, como f (~ei) el vectorde coordenadas Aei, siendo ei la matriz columna del vector~ei. Clara-mente, A = M( f ,B1,B2).

Consideremos las bases

B1 = {P−1e1, P−1e2, . . . , P−1en} y B2 = {Q−1ε1, Q−1ε2, . . . , Q−1εm}

de V y E, respectivamente.

V(B1) E(B2)

V(B1)E(B2)

f

iVf

iE

A

B

P Q

La matriz P es la matriz del cambio de base de B1 a B1 y la matriz Qserá la del cambio de base de B2 a B2 y, además, P = M(iV ,B1,B1) yQ = M(iE,B2,B2), donde iV : V → V y iE : E→ E son las respectivasfunciones identidad.

Como la inversa de la función identidad es ella misma, podemos ex-presar

f = i−1E ◦ f ◦ iV

de donde, por 5.27 y 5.29 , M( f ;B1,B2) = Q−1AP = B. �

Page 136: ALyMD

132 Aplicaciones lineales

Ejemplo 5.31. Si la matriz de un endomorfismo f en R3 es

A =

1 3 0−1 0 0

0 1 −1

respecto a la base canónica, calcula la nueva matriz de f si cambiamos a labase B = {(1, 1, 0), (−1, 0, 2), (0, 1, 1)}.Resuelve este problema

conforme al métodousado en el ejemplo 5.24,

sin usar las matrices decambio de base.

SOLUCIÓN: Llamemos B a la matriz de f respecto de la base B. La matrizdel cambio de dicha base B a la base canónica es la matriz P

P =

1 −1 01 0 10 2 1

=⇒ P−1 =

2 −1 11 −1 1−2 2 −1

Por tanto siguiendo el teorema anterior tenemos B = P−1AP, luego

B = P−1 · A · P =

=

2 −1 11 −1 1−2 2 −1

· 1 3 0−1 0 0

0 1 −1

· 1 −1 0

1 0 10 2 1

=

=

10 −5 66 −4 3

−11 6 −6

Ejercicio 5.32. Sea A =

(2 1 0 −10 −3 2 0

)la matriz de f respecto de las bases

B1 = {~v1,~v2,~v3,~v4} y B2 = {~e1,~e2}. Calcula la matriz de f respecto a las nuevasbases

B1 = {~v2,~v2 −~v4, 2~v1 − 3~v2,~v3} y B2 = {~e2,~e1 +~e2}

5.3. Matrices semejantes y endomorfismos

En el tema anterior hemos visto que si f es una aplicación lineal entreespacios vectoriales, las matrices asociadas a f son equivalentes, es decir

B = Q−1 · A · P

donde P y Q son matrices de cambio de base en sus respectivos espacios.En el caso especial de que f sea un endomorfismo V → V las matri-

ces asociadas son cuadradas, luego las correspondientes matrices, P y Q,serán del mismo orden. Podemos, incluso pedir que P = Q o, lo que es lomismo, el cambio de base sea el mismo en el espacio inicial y en el final.En este caso, la equivalencia de matrices se denomina semejanza de matricesque estudiamos con más detalle a continuación.

Page 137: ALyMD

5.3 Matrices semejantes y endomorfismos 133

5.3.1. Matrices semejantes

Definición 5.33. Decimos que dos matrices cuadradas A y B son semejantessi existe una matriz regular P tal que

B = P−1 · A · P

La relación de semejanza es una relación de equivalencia (reflexiva, simé-trica y transitiva).

Proposición 5.34 (Propiedades). Si A y B son matrices semejantes, entonces

1. Tienen el mismo determinante.

Demostración. det B = det(P−1 · A · P) = 1det P det A det P = det A. �

2. Tienen el mismo rango.

Demostración. Puesto que se corresponden al mismo endomorfismo, tie-nen el mismo rango. �

3. Tienen la misma traza (suma de los elementos de la diagonal principal).

Demostración. Primero observamos que tr(AB) = tr(BA), puesto que

tr(AB) = ∑i

∑j

aijbji = ∑j

∑i

bjiaij = tr(BA)

Por tanto,tr B = tr(P−1AP) = tr((AP)P−1) = tr A

5.3.2. Endomorfismos diagonalizables

Sea V un espacio vectorial sobre el cuerpo R (o C) y f : V → V aplica-ción lineal (endomorfismo).

Definición 5.35. Decimos que f es diagonalizable si existe una base deV para la que la matriz asociada a f sea diagonal.

Si f es diagonalizable y A es su matriz asociada, deben existir una matrizinvertible P de cambio de base y una matriz D diagonal tales que

D = P−1AP.

A la matriz P se le suelellamar matriz de paso.

Es decir, A debe ser semejante a una matriz diagonal D.En general, una matriz cuadrada A se dice que es una matriz diagonali-

zable si su endomorfismo asociado es diagonalizable.

Page 138: ALyMD

134 Aplicaciones lineales

Ejemplos 5.36.

El endomorfismo de R2 definido f (x1, x2) = (2x1 + x2, 3x2) es dia-gonalizable, puesto que su matriz A =

(2 10 3

)es diagonalizable como

podemos comprobar:(2 00 3

)=

(1 −10 1

)(2 10 3

)(1 10 1

)

y el producto(

1 −10 1

)·(

1 10 1

)=

(1 00 1

).

En cambio el endomorfismo f (x1, x2) = 2(x1 + x2, x2) que, respecto

a la base canónica, nos da la matriz(

2 20 2

)no va a ser diagona-

lizable, aunque todavía no sabemos porqué. Este será el problema aestudiar: ¿cuándo un endomorfismo es diagonalizable?

5.3.3. Autovalores y Autovectores

Definición 5.37. Si f (~x) = λ ~x con ~x 6= ~0, decimos que λ es un autovalor ovalor propio y que ~x es una autovector o vector propio asociado a λ.

Fijada una base, y representado f por su matriz A, respecto a dicha base,tenemos que encontrar un vector de coordenadas X 6= 0 tal que

AX = λX ⇐⇒ (A− λI)X = 0

donde I es la matriz identidad de orden adecuado.Tenemos, por tanto, un sistema de ecuaciones lineales homogéneo que,

como sabemos, tiene soluciones distintas de X = 0 si y sólo el determinantede la matriz del sistema es cero. Dicho de otro modo, el endomorfismo f , através de su matriz A, tiene autovectores si y solo si

det(A− λI) = 0

que nos da una ecuación polinómica en λ que recibe el nombre de ecua-ción característica de A, cuyas soluciones λi (autovalores) aseguran que elsistema (A− λi I)X = 0 tiene soluciones no triviales (autovectores). Al po-linomo (de variable λ) det(A− λI) se le llama, igualmente, polinomio carac-terístico2.

Proposición 5.38. Matrices semejantes, por tanto matrices que representan almismo endomorfismo, tienen el mismo polinomio característico, por tanto los mis-mos autovaloresTambién tienen los mismos

autovectores, pero suscoordenadas son distintas

porque están expresados enbases distintas.

.

2Para algunos autores el polinomio característico se define como det(λI − A). Es fácilcomprobar que det(A− λI) = (−1)n det(λI − A), luego cuando la dimensión del espacioes impar hay un cambio de signo.

Page 139: ALyMD

5.3 Matrices semejantes y endomorfismos 135

Demostración. Si A y B son semejantes, entonces

B− λI = P−1AP− P−1λP = P−1(A− λI)P

Luegodet(B− λI) = det(P−1(A− λI)P) = det(A− λI)

Este resultado nos permite identificar los autovalores de un endomor-fismo con los autovalores de su matriz sin ambigüedad alguna.

Resumiendo, si α es una raíz del polinomio característico det(A− λI),entonces

α es un autovalor de A y

Nα = ker(A − αI) es el subespacio de autovectores asociados a α(junto con el vector ~0, que, como sabemos, no es autovector). Estesubespacio recibe el nombre de subespacio propio asociado al autovalorα. A una base de este subespacio, se le suele llamar, abusando dellenguaje, conjunto de autovectores (asociados a α).

Ejercicio 5.39. Calcula los autovalores y autovectores de las matrices: 1)(

2 10 3

)y 2)

(2 20 2

).

Los autovalores tienen las siguientes propiedades:

Proposición 5.40. Sea A una matriz cuadrada de orden n, entonces:

1. A y AT tienen los mismos autovalores.

Demostración. Es cierto puesto que

det(AT − λI) = det(AT − λIT) = det(A− λI)T = det(A− λI)

2. Si λ es autovalor de A, entones kλ es autovalor de kA.

Demostración. det(kA − kλI) = det(k(A − λI)) = kn det(A − λI) =kn0 = 0 �

3. Si λ es autovalor de A, entones λ− k es autovalor de A− kI

Demostración.det((A− kI)− (λ− k)I) = det(A− kI − λI + kI) = det(A− λI) = 0 �

Page 140: ALyMD

136 Aplicaciones lineales

4. Si λ es autovalor de A y A es invertible, entonces 1λ es autovalor de A−1.

Demostración. Como det A no puede ser cero, obliga a que λ 6= 0, luego1λ está definido. Además existe X 6= 0 tal que AX = λX, de aquí que

A−1X =1λ

X

por lo que 1λ es autovalor de A−1. �

5. Si λ es autovalor de A, para cada natural k tenemos que λk es autovalor de Ak.

Demostración. Si k = 0 es evidente. Para k positivo: sabemos que existeX 6= 0 tal que AX = λX ⇒ A2X = λAX = λ2X. Luego λ2 es autovalorde A2, siguiendo este razonamiento las veces necesarias tenemos que λk

es autovalor de Ak. Para k negativo se prueba a partir de la propiedadnúmero 4 anterior. �

5.4. Teorema de diagonalización

Teorema 5.41. Los autovectores asociados a autovalores diferentes son linealmenteindependientes.

Demostración. Supongamos que ~x y ~y autovalores asociados a λ1 y λ2 res-pectivamente, con λ1 6= λ2.

Razonemos por reducción al absurdo. Supongamos que ~x, ~y son lineal-mente dependientes, entonces podemos expresar ~x = α~y, y, como son auto-valores, tenemos:

f (~x) = λ1~xf (~x) = f (α~y) = αλ2~y = λ2~x

por tanto, λ1~x = λ2~x ⇒ (λ1 − λ2)~x = ~0. Como ~x es autovector (no puedeser cero) tenemos que λ1 = λ2 que es una contradicción. �

Corolario 5.42. Si un endomorfismo en un espacio vectorial de dimensión n tienen autovalores distintos, entonces es diagonalizable.

Demostración. Efectivamente, por cada autovalor distinto podemos elegirun autovector independiente de los demás. Esto nos lleva a que podemosconstruir una base B de autovectores. La matriz del endomorfismo respec-to a esta base B es diagonal, puesto que f (~vi) = λi~vi, que expresados encoordenadas, nos da una matriz diagonal. �

Page 141: ALyMD

5.4 Teorema de diagonalización 137

Como hemos visto, si B = {~v1,~v2, . . . ,~vn} es una base formada porautovectores con sus respectivos autovalores λ1, λ2, . . . , λn, entonces:

λ1 0 . . . 00 λ2 . . . 0...

.... . .

...0 0 . . . λn

=

v1v2 · · · vn

−1

· A ·

v1v2 · · · vn

donde vi (sin “flechita”) representa la columna de la matriz formada porlas coordenadas del vector ~vi.Nota. Obsérvese que las columnas de la matriz de paso son los autovectores en el mismoorden que los autovalores ocupan en la diagonal principal de la matriz D.

Ejemplo 5.43. Vamos a diagonalizar el endomorfismo A =

(5 41 2

).

Ecuación característica:

det(A− λI) =∣∣∣∣ 5− λ 4

1 2− λ

∣∣∣∣ = λ2 − 7λ + 6 = 0

Resolviendo la ecuación anterior, obtenemos los autovalores:

λ1 = 1 y λ2 = 6

Y para cada autovalor, calculando ker(A− λI), obtenemos los subes-pacios propios:

Para λ1 = 1(

4 41 1

)(x1x2

)=

(00

)⇒ N1 = L{(1,−1)}

Para λ2 = 6(−1 4

1 −4

)(x1x2

)=

(00

)⇒ N6 = L{(4, 1)}

Diagonalización:(1 00 6

)=

(1/5 −4/51/5 1/5

)(5 41 2

)(1 4−1 1

)

5.4.1. Multiplicidad algebraica y geométrica

No siempre un endomorfismo en un espacio de dimensión n tiene exac-tamente n autovalores distintos. Esto no implica que no sea diagonalizable.Bajo ciertas condiciones se puede diagonalizar.

Page 142: ALyMD

138 Aplicaciones lineales

Factorización de un polinomio

Si un polinomio p tiene a λi ∈ K como raíz, sabemos que se puedeexpresar de la forma p(λ) = (λ − λi)q1(λ), donde q1 es otro polinomio.Puede ocurrir que λi siga siendo raíz de q1, entonces se puede repetir elrazonamiento. Existirá, entonces, un número máximo mi de veces para loque esto ocurre, quedando p factorizado de la forma

p(λ) = (λ− λi)mi qmi(λ)

A este número mi se le llama multiplicidad de la raíz λi.En el cuerpo de los

números reales no todoslos polinomios son

factorizables. No ocurreasí en en el cuerpo de los

números complejos que esalgebraicamente cerrado(véase teorema 2.54).

Decimos, además, que un polinomio p(λ) se puede factorizar en K si sepuede expresar de la forma

p(λ) = α(λ− λ1)m1 . . . (λ− λr)

mr

con λi ∈ K raíces de p y mi ∈ Z+ sus respectivas multiplicidades.

Definición 5.44. Dado un autovalor λi de un endomorfismo, llamaremos:

Multiplicad algegraica de λi al número máximo de veces mi que esraíz del polinomio característico p(λ) = det(A− λI).

Multiplicidad geométrica de λi a la dimensión de su subespacio pro-pio dim Nλi = dim ker(A− λi I).

El siguiente resultado lo damos sin demostración.

Proposición 5.45. La multiplicidad geométrica de un autovalor siempre es menoro igual que su multiplicidad algebraica.

5.4.2. Teorema fundamental

Teorema 5.46. Un endomorfismo f es diagonalizable en K si y sólo si se satisfacenlas condiciones siguientes:

1. El polinomio característico de f se puede factorizar en K, es decir, si A escualquier matriz de f , entoncesLa primera condición de este

teorema siempre se cumplepara espacios vectoriales

complejos. En cambio, enespacios vectoriales reales no

la tenemos garantizada.

det(A− λI) = (−1)n(λ− λ1)m1 . . . (λ− λr)

mr

2. Para cada autovalor λi (i = 1, . . . , r) la multiplicidad algebraica coincidecon la multiplicidad geométrica, es decir, mi = dim Nλi .

Page 143: ALyMD

5.4 Teorema de diagonalización 139

Demostración. Para probar este teorema basta observar que por compara-ción de grados de polinomios se tiene m1 +m2 + · · ·+mr = n. Entonces pa-ra cada λi podemos elegir mi vectores independientes por ser dim Nλi = mi.

Como los autovectores de autovalores distintos son todos independien-tes (ver teorema 5.41 anterior), uniendo todos los autovectores consegui-mos n vectores independientes, y por tanto, una base de V formada porautovectores. �

Ejemplo 5.47. Pretendemos diagonalizar la siguiente matriz.

A =

−2 2 −32 1 −6−1 −2 0

Comenzamos calculando el polinomio característico:

det(A− λI) = −λ3 − λ2 + 21λ + 45 = −(λ + 3)2(λ− 5)

De donde obtenemos sus autovalores y sus multiplicidades algebrai-cas: λ1 = −3 (m1 = 2) y λ2 = 5 (m2 = 1).

Que nos permiten calcular los autovectores, más concretamente lossubespacios propios:

N−3 = L ({(−2, 1, 0), (3, 0, 1)}) y N5 = L ({(−1,−2, 1)})

Y, por último, por el teorema 5.46, sabemos que se puede diagonalizar −3 0 00 −3 00 0 5

=

=

−1/4 1/2 3/41/8 1/4 5/8−1/8 −1/4 3/8

−2 2 −32 1 −6−1 −2 0

−2 3 −11 0 −20 1 1

Ejercicio 5.48. Diagonaliza, si es posible, la siguiente matriz−1 3 312 −1 −66 −3 2

Page 144: ALyMD

140 Aplicaciones lineales

5.5. Algunas aplicaciones de la diagonalización de en-domorfismos

5.5.1. Cálculo de potencias y matriz inversa

Podemos usar una matriz diagonalizada para calcular sus potencias.

Si A es diagonalizable con D = P−1AP =

λ1 0 . . . 00 λ2 . . . 0...

.... . .

...0 0 . . . λn

se tiene

que

Am =(

PDP−1)m

=

m veces︷ ︸︸ ︷(PD�

��P−1)(�PD���P−1) · · · (�PDP−1) =

= PDmP−1 = P

λm

1 0 . . . 00 λm

2 . . . 0...

.... . .

...0 0 . . . λm

n

P−1

Cálculo de la matriz inversa

Si una matriz A está diagonalizada y es invertible, tenemos una formaalternativa de calcular la matriz inversa. Así

A = PDP−1 ⇐⇒ A−1 = PD−1P−1

Además el polinomio característico nos da el valor del determinante.

Proposición 5.49. El determinante de una matriz coincide con el término inde-pendiente de su polinomio característico, que coincide con el producto de los auto-valores (repitiendo cada valor según su multiplicidad algebraica).

Demostración. Efectivamente, si det(A− λI) = anλn + · · ·+ a1λ + a0 es elpolinomio característico, haciendo λ = 0 en esta ecuación tenemos quedet(A) = a0.

Además como los autovalores λi son las raíces del polinomio caracte-rístico, se tiene además que det(A− λI) = (λ1 − λ)(λ2 − λ) · · · (λn − λ) yde aquí que a0 = λ1λ2 · · · λn. �

La traza de una matriz también viene reflejada en el polinomio carac-terístico. La Proposición 5.34, página 133, en su punto 3 nos justifica la si-guiente.

Page 145: ALyMD

5.5 Aplicaciones de la diagonalización 141

Proposición 5.50. La traza de una matriz cuadrada de orden n es el coeficientedel término de grado n− 1 del polinomio característico multiplicado por (−1)n−1,que coincide con la suma de sus autovalores (repitiendo cada autovalor según sumultiplicidad algebraica).

Resumiendo, el polinomio característico det(A − λI) = anλn +an−1λn−1 + · · ·+ a0, verifica:

a0 = λ1λ2 · · · λn = det A.

an−1 = (−1)n−1(λ1 + λ2 + · · ·+ λn) = (−1)n−1 tr A.

an = (−1)n.

Ejercicio 5.51. Comprueba las anteriores proposiciones 5.49 y 5.50 en las matricesque hemos diagonalizado hasta ahora.

Ejemplo 5.52. Veamos la inversa de la matriz A =

(−2 2 −32 1 −6−1 −2 0

)diagonali-

zada en el ejemplo 5.47 . Observemos que es invertible por varios motivos,por ejemplo, det A = a0 = 45 6= 0, o bien, observando que sus autovaloresson todos distintos de cero. Su inversa será entonces:

A−1 = PD−1P−1

Por tanto

A−1 =

−2 3 −11 0 −20 1 1

− 13 0 0

0 − 13 0

0 0 15

−1/4 1/2 3/41/8 1/4 5/8−1/8 −1/4 3/8

=

− 4

152

15−1

5215− 1

15−2

5

− 115− 2

15− 2

15

5.5.2. Teorema de Cayley-Hamilton

El polinomio característico, entendiendolo sobre el anillo de las matri-ces cuadradas complejas, tiene una propiedad curiosa, y es que admite co-mo raíz a la propia matriz que lo define. Esto es conocido como teorema deCayley-Hamilton y omitimos la demostración.

Page 146: ALyMD

142 Aplicaciones lineales

Teorema 5.53 (Cayley-Hamilton). Toda matriz cuadrada en C es raíz de su poli-nomio característico. Es decir, si p(λ) = det(A− λIn) = anλn + · · ·+ a1λ + a0entonces

p(A) = an An + · · ·+ a1A + a0 In = 0n

El anterior teorema nos permite:

1. Calcular la potencia enésima de A a partir de las potencias anterioresde A

An = − 1an

(an−1An−1 + · · ·+ a1A + a0 In)

2. Si A invertible, det A = a0 6= 0, y

A−1 = − 1a0(an An−1 + · · ·+ a1 In)

Ejemplo 5.54. Para la matriz A =

−2 2 −32 1 −6−1 −2 0

, conocido su polino-

mio característico det(A− λI) = −λ3 − λ2 + 21λ + 45 tenemos una formade calcular la inversa:

−A3 − A2 + 21A + 45I = 0⇒ A(A2 + A− 21I) = 45I

luego

A−1 =1

45

−2 2 −3

2 1 −6−1 −2 0

2

+

−2 2 −32 1 −6−1 −2 0

− 21

1 0 00 1 00 0 1

=

=

− 4

152

15−1

5215− 1

15−2

5

− 115− 2

15− 2

15

5.5.3. Exponencial de una matriz

En algunas aplicaciones3, se hace necesaria calcular la exponencial deuna matriz que generaliza la función exponencial ex.

Si A es una matriz cuadrada, real o compleja, se define su exponencialeA como:

3Por ejemplo, en los sistemas de ecuaciones diferenciales.

Page 147: ALyMD

5.5 Aplicaciones de la diagonalización 143

eA = exp(A) = ∑∞i=0

1i! Ai = In + A1 + 1

2! A2 + 13! A3 + · · ·+ 1

i! Ai + . . .

Nota. Cuando existe una potencia que anula la matriz (se dice que A es nilpotente) elcálculo de la exponencial se realiza en un número finito de pasos. Pero esto no tiene porquéocurrir, por lo que el cálculo de la exponencial requeriría un proceso de límite.

Si una matriz es diagonalizable se pueden evitar los límites para elcálculo de su exponencial. Así, si A = PDP−1, entonces

eA =∞

∑i=0

1i!

Ai =∞

∑i=0

1i!

(PDP−1

)i= P

(∞

∑i=0

1i!

Di

)P−1 = P eDP−1

y, por tanto, si podemos calcular eD, tenemos eA.Ahora bien, como ya hemos visto, si D es una matriz diagonal, sus po-

tencias se trasladan a la diagonal, es decir, para cada i tenemosd1 0 . . . 00 d2 . . . 00 0 . . . dn

i

=

d1i 0 . . . 0

0 d2i . . . 0

0 0 . . . dni

luego, eD =

ed1 0 . . . 00 ed

2 . . . 00 0 . . . ed

n

.

Ejemplo 5.55. Vamos a calcular exp(−2 2 −32 1 −6−1 −2 0

).

Como la matriz del exponente es diagonalizable, ya resuelta en el ejem-plo 5.47, siguiendo lo anterior, tenemos

exp

−2 2 −32 1 −6−1 −2 0

=

=

−2 3 −11 0 −20 1 1

exp

−3 0 00 −3 00 0 5

−1/4 1/2 3/41/8 1/4 5/8−1/8 −1/4 3/8

=

=

e−3 (e8 + 7)

8e−3 (e8 − 1

)4

−e−3 (3e8 − 3)

8e−3 (e8 − 1

)4

e−3 (e8 + 1)

2−e−3 (3e8 − 3

)4

−e−3 (e8 − 1)

8−e−3 (e8 − 1

)4

e−3 (3e8 + 5)

8

A continuación exponemos algunas de las propiedades de la exponen-

cial de una matriz.

Page 148: ALyMD

144 Aplicaciones lineales

Proposición 5.56 (Propiedades de la exponencial).

1. e0n = In.

2. Si λ, µ ∈ K, entonces eλA + eµA = e(λ+µ)A.

3. La exponencial de una matriz siempre en invertible, y además(eA)−1

= e−A

4. Si AB = BA entonces eAeB = eBeA = eA+B.Si AB 6= BA puede sereAeB 6= eA+B.

5. Si m ∈ Z entonces emA =(eA)m.

6. Para cualquier matriz cuadrada A se tiene

e(AT) =(

eA)T

luego, si A es simétrica, eA es simétrica y, si A es antisimétrica, eA es orto-gonal.

7. Relación determinante-traza: det eA = etr A.

Ejercicios Propuestos

Ej. 5.1 — De las siguientes aplicaciones de R3 en R3 ¿cuáles son aplicacio-nes lineales? Encuentra el núcleo y la imagen de las que lo sean.

1. Sea λ ∈ R fijo. Consideramos la aplicación f1(~x) = λ~x con ~x ∈ R3

2. f2(~x) = (x1, 1, x2) siendo ~x = (x1, x2, x3)

3. f3(x1, x2, x3) = (x1 + x2 + x3, x1 + x2, x3)

Ej. 5.2 — Dada la aplicación lineal f : R3 → R2 definida por f (1, 3, 5) =(1, 0), f (0, 1, 1) = (1, 0) y f (0, 0, 1) = (0, 0)

1. Halla la matriz en las bases canónicas.2. Halla las ecuaciones del subespacio transformado del subespacio U

dado por las ecuaciones{x1 + x2 − x3 = 0x2 − x3 = 0

Ej. 5.3 — Determina la aplicación lineal f : R3 → R2 que satisface queker f = {(a, b, c) | a + b = 0} y f (0, 1, 1) = (1, 1). Determina tambiénsu imagen.

Page 149: ALyMD

5.5 Aplicaciones de la diagonalización 145

Ej. 5.4 — Dado el homomorfismo de R2 en R3 definido por f (x, y) = (x +y, x− y, x + 2y), halla la matriz de f respecto de las bases {(1, 2), (2, 0)} deR2 y {(1, 0, 0), (0, 2, 0), (0, 0, 3)} de R3.

Ej. 5.5 — Sea f : R3 → R3 la aplicación lineal

f (x1, x2, x3) = ((λ− 2)x1 + 2x2− x3, 2x1 +λx2 + 2x3, 2λx1 + 2(1+λ)x2 +(1+λ)x3)

1. Encuentra la matriz asociada a f en la base canónica y su rango se-gún los valores de λ.

2. Los conjuntos Im f y ker f .

Ej. 5.6 — (Feb. 2013) En R5, determine la matriz de cambio de base de lacanónica a

B = {(1, 1, 0, 0, 1), (0, 0, 1, 1, 0), (0, 0,−1, 0, 1), (1, 0, 1,−1, 1), (0, 1, 0, 1, 0)}

Ej. 5.7 — En R3 define dos bases y encuentra la matriz asociada al endo-morfismo

f (x, y, z) = (x + y, y + z, x + 2y + z)

a cada una de ellas. Halla la relación existente entre ambas.

Ej. 5.8 — Si U y W son dos subespacios suplementarios de un espacio vec-torial V, demuestra que V es isomorfo al espacio vectorial producto U×W.Encuentra un isomorfismo entre ellos.

Ej. 5.9 — Encuentra un endomorfismo en R2 que cumpla:1. La imagen y el núcleo de f coincidan.2. La imagen y el nucleo de f sean subespacios suplementarios.

Ej. 5.10 — Sea f el endomorfismo cuya matriz respecto de la base {e1, e2}es

A =

(2 −3−3 2

)Determina la matriz A′ que corresponde a dicho endomorfismo en otrabase {u1, u2} dada por√

2 u1 = e1 + e2 ,√

2 u2 = e2 − e1

Ej. 5.11 — Sea f : R2 → R2 una aplicación lineal y B1, B′1, B2 y B′2 bases deR2. Si

M( f , B1, B2) =M( f , B′1, B′2) =(

1 01 1

)y, respecto de la base B1 los vectores de B′1 son (1, 2) y (2, 1), determina lamatriz de cambio de base de B2 en B′2.

Page 150: ALyMD

146 Aplicaciones lineales

Ej. 5.12 — Calcula, para la siguiente matriz

A =

4 1 −12 5 −21 1 2

1. El polinomio característico de A.2. Los valores propios de A.3. Un conjunto máximo de vectores propios linealmente independien-

tes.4. ¿Es diagonalizable A? En caso afirmativo, halla P para que P−1AP

sea diagonal.5. Calcula A4, A−1 y eA.

Ej. 5.13 — Lo mismo que el ejercicio 5.12 para la siguiente matriz

A =

2 2 −62 −1 −3−2 −1 1

Ej. 5.14 — Discute, según los parámetros, si la siguiente matriz es diago-nalizable y localiza, si lo es, una base de R3 en la que f tenga asociada unamatriz diagonal. 1 −2 −2− a

0 1 a0 0 1

,

Ej. 5.15 — Igual que el ejercicio 5.14 anterior para la matriz 2 −2 60 4 4− a0 a −a

Ej. 5.16 — (Feb. 2013) Se considera la siguiente matriz A =

1 β α + 10 −1 02 −β −1

1. Para los valores de α = 3 y β = 0 encuentre una matriz diagonal se-

mejante a la matriz A, indicando la matriz de paso correspondiente.

2. Halle los valores propios de A en función de los parámetros α y β.

Page 151: ALyMD

5.5 Aplicaciones de la diagonalización 147

3. Determine los valores de α y β para que A sea diagonalizable y tengaun valor propio doble igual a −1.

Ej. 5.17 — (Sep. 2013) Sea la matriz A =

1 a a−1 1 −1

1 0 2

1. Calcule el valor del parámetro a ∈ R para que la matriz A sea dia-

gonalizable sobre R.2. Con dicho valor de a, halle su forma diagonal, una matriz de paso y

An para cualquier n ∈N.

Ej. 5.18 — Encuentra, si existe, una matriz real de orden 3 que no sea dia-gonal pero sí sea diagonalizable y que sus autovalores cumplan:

1. El único autovalor sea λ = −1.2. Un autovalor doble λ1 = 0 y otro autovalor λ2 = 1.

Ej. 5.19 — Calcula A3 + 4A2 + 4A + I2, sabiendo que A es una matriz se-mejante a la matriz diagonal

D =

(−2 00 −2

)

Ej. 5.20 — Sea f : R3 → R3 el endomorfismo que admite los autovaloresλ1 = 1, λ2 = 2 y λ3 = −1 y que tiene por vectores propios a los (1, 1, 1),(0, 1, 2) y (1, 2, 1) respectivamente. Obténgase la matriz asociada a f res-pecto de la base canónica de R3.

Ej. 5.21 — Sabiendo que f : R3 −→ R3 es un endomorfismo diagonaliza-ble que tiene como vectores propios (−1, 2, 2), (2, 2,−1) y (2,−1, 2) y quef (5, 2, 5) = (0, 0, 7). Halla los autovalores de f y su ecuación (expresiónanalítica) en la base canónica.

Ej. 5.22 — Escribe una matriz cuadrada regular de orden 3 y compruebaque se cumple el teorema de Cayley-Hamilton. Utiliza dicho resultado paraencontrar la matriz inversa.

Ej. 5.23 — Determina (sin calcular a, b, c, p, q y r) los valores propios de lamatriz a b c

1 2 −1p q r

sabiendo que admite como vectores propios: ~v1 = (1, 1, 0), ~v2 = (0, 1,−1)y ~v3 = (−1, 1, 2). Determina después los valores de a, b, c, p, q y r.

Page 152: ALyMD
Page 153: ALyMD

TEMA 6

FORMAS BILINEALES YPRODUCTO ESCALAR

Índice6.1. Formas bilineales . . . . . . . . . . . . . . . . . . . . . . . 150

6.1.1. Representación matricial de una forma bilineal . 151

6.1.2. Formas multilineales reales . . . . . . . . . . . . 154

6.2. Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . 155

6.2.1. Representación matricial de una forma cuadrática157

6.2.2. Clasificación . . . . . . . . . . . . . . . . . . . . . 157

6.3. Producto escalar . . . . . . . . . . . . . . . . . . . . . . . 158

6.3.1. Norma de un vector . . . . . . . . . . . . . . . . 159

6.3.2. Ortogonalidad . . . . . . . . . . . . . . . . . . . . 162

6.3.3. Orientación de un espacio vectorial euclídeo . . 166

6.3.4. Producto vectorial . . . . . . . . . . . . . . . . . 167

6.4. Subespacios ortogonales . . . . . . . . . . . . . . . . . . . 169

6.5. Diagonalización ortogonal . . . . . . . . . . . . . . . . . 171

6.5.1. Diagonalización de matrices simétricas . . . . . 173

6.6. Diagonalización de formas cuadráticas . . . . . . . . . . 174

6.6.1. Método de los autovectores . . . . . . . . . . . . 175

6.6.2. Método de Lagrange . . . . . . . . . . . . . . . . 175

6.6.3. Clasificación por invariantes . . . . . . . . . . . . 180

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 183

149

Page 154: ALyMD

150 Formas bilineales y Producto escalar

6.1. Formas bilineales

Hasta ahora hemos visto aplicaciones lineales entre espacios vectoria-les V y E ambos sobre un mismo cuerpo R. Ahora bien, R es también unespacio vectorial (sobre sí mismo) de dimensión 1.Las aplicaciones linealesf : V → R reciben el nombre de formas lineales (o 1-formas).

Ejercicio 6.1. ¿De qué orden es la matriz de una forma lineal definida sobre unespacio vectorial de dimensión n?

Podemos extender este concepto a funciones con más de una entrada. SiV y E son espacios vectoriales, y una función f : V ×V → E es lineal paracada una de las entradas, se dice que f es una aplicación bilineal. Si ade-más E = R, entonces se dice que es una forma bilineal. Damos la definiciónexplícita.

Definición 6.2. Sea V un espacio vectorialUna forma es bilineal sitiene dos entradas de

vectores y, fijada una deellas, la forma que queda

es lineal, es decir, paracada vector ~x0 ∈ V

obtenemos dos formaslineales

f~x0: V → R

~x → f (~x0,~x)

f~x0 : V → R

~x → f (~x,~x0)

de dimensión n sobre R. Unaforma bilineal es una función f : V × V → R tal que para cualquier combi-nación lineal ∑k

i=1 λi~vi de vectores de V se tiene:

1. f (∑ki=1 λi~vi,~y) = ∑k

i=1 λi f (~vi,~y) para cada ~y ∈ V.

2. f (~x, ∑ki=1 λi~vi) = ∑k

i=1 λi f (~x,~vi) para cada ~x ∈ V.

Ejemplo 6.3. La función f : R3 ×R3 → R definida analíticamente

f ((x1, x2, x3), (y1, y2, y3)) = x1y2 − x2y3

es una forma bilineal, puesto que, si fijamos el vector ~x0 = (a, b, c), lasfunciones

f~x0(y1, y2, y3) = ay2 − by3 y f~x0(x1, x2, x3) = bx1 − cx2

son formas lineales.

Definición 6.4. Una forma bilineal f : V ×V → R se dice que es:

Simétrica, si f (~x,~y) = f (~y,~x) para cada para de vectores ~x e ~y.

A las formas bilineales(especialmente a las

antisimétricas) también seles llama 2-formas.

Antisimétrica, si f (~x,~y) = − f (~y,~x) para cada para de vectores ~x e ~y.

Veamos que las formas bilineales antisimétricas quedan caracterizadaspor las imágenes de los pares (~x,~x):

Proposición 6.5. Una forma bilineal f definida en V es antisimétrica si y solo sif (~x,~x) = 0 para cada ~x ∈ V.

Page 155: ALyMD

6.1 Formas bilineales 151

Demostración. Si f es antisimétrica f (~x,~x) = − f (~x,~x) luego f (~x,~x) = 0.Inversamente, supongamos que f (~x,~x) = 0, para todo vector ~x, entonces

0 = f (~v + ~w,~v + ~w) = f (~v, ~w) + f (~w,~v)

luego f es antisimétrica. �

Ejercicio 6.6. Usa la proposición anterior para encontrar lo valores del paráme-tro “a” para la siguiente forma bilineal en R2 es antisimétrica.

f ((x1, x2), (y1, y2)) = ax1y1 + 3x1y2 − 2x2y1

6.1.1. Representación matricial de una forma bilineal

Sea f una forma bilineal definida en un espacio V de dimensión finitan y sea B = {~e1,~e2, . . . ,~en} una base de V. Tenemos

f (~x,~y) = f (n

∑i=1

xi~ei,n

∑j=1

yj~ej) =n

∑i=1

xi

(n

∑j=1

f (~ei,~ej)yj

)=

n

∑i,j

xi f (~ei,~ej)yj

que matricialmente se puede expresar del siguiente modo

f (~x,~y) =(x1 x2 . . . xn

)

f (~e1,~e1) f (~e1,~e2) . . . f (~e1,~en)f (~e2,~e1) f (~e2,~e2) . . . f (~e2,~en)

......

...f (~en,~e1) f (~en,~e2) . . . f (~en,~en)

y1y2...

yn

por tanto, continuando con la notación habitual, si X e Y son las matricescolumnas formadas por las coordenadas de los vectores ~x e ~y, respectiva-mente, una forma bilineal se puede escribir de una manera compacta como

f (~x,~y) = XT · A ·Y.

Y a la matriz A se le denomina matriz de la forma bilineal f respecto de labase B.

Ejercicio 6.7. Sea f : R2 ×R2 → R la forma bilineal

f ((x1, x2), (y1, y2)) = 2x1y1 − 3x1y2 + x2y2

Determina la matriz de f respecto a las bases:

Page 156: ALyMD

152 Formas bilineales y Producto escalar

1. Canónica. 2. B = {(1,−1), (3,−2)}

Formas bilineales degeneradas

Una forma bilineal se anula cuando una de las entradas es el vector~0,veamos

f (~x,~0) = f (~x,~0 +~0) = f (~x,~0) + f (~x,~0)⇒ f (~x,~0) = 0

análogamente, f (~0,~y) = 0.Pero también puede ocurrir que f (~x,~y) se anule siendo ~x e ~y vectores

distintos de cero.

Definición 6.8. Decimos queEl vector ~x0 es degeneradopara f cuando alguna de

las formas lineales f~x0o

f~x0 es nula (véasedefinición 6.2 y

ejemplo 6.3).

un vector ~x0 6= ~0 es degenerado para la formabilineal f si f (~x0,~y) = 0 para cada ~y ∈ V o bien f (~x,~x0) = 0 para cada~x ∈ V.

Ejercicio 6.9. Encuentra una forma bilineal en R2 que tenga un vector degenera-do.

Definición 6.10. Se dice que una forma bilineal f es degenerada si poseealgún vector degenerado. Por tanto, una forma bilineal es no degenerada sicumple las dos condiciones siguientes (ambas)

Para todo ~x, f (~x,~y) = 0 =⇒ ~y =~0

Para todo ~y, f (~x,~y) = 0 =⇒ ~x =~0

Ejercicio 6.11. Determina si la forma bilineal f del ejemplo 6.3 es o no es degene-rada.

Podemos clasificar las formas bilineales por su matriz, como vemos enel siguiente teorema.

Teorema 6.12. Sea f una forma bilineal definida sobre un espacio vectorial finitoy A su matriz respecto a alguna base, entonces

1. f es simétrica si y solo si A es simétrica, es decir, A = AT.

2. f es antisimétrica si y solo si A es antisimétrica, es decir, A = −AT.

3. f es degenerada si y solo si A es singular, es decir det A = 0

Demostración. Las dos primeras equivalencias son triviales y se dejan comoejercicio. Veamos la tercera equivalencia.

Supongamos que f es degenerada, o sea, existe ~x0 6= ~0 de forma quef (~x,~x0) = 0 (o bien f (~x0,~x) = 0) para cualquier vector ~x. Esto se traduceen que

XT AX0 = 0 para alguna matriz columna X0 6= 0

Page 157: ALyMD

6.1 Formas bilineales 153

y esto ocurre para cualquier X, por tanto la matriz columna AX0 tiene queser 0. Luego el sistema homogéneo AX = 0 es (compatible) indeterminado,por tanto, como sabemos, det A = 0.

Inversamente, si det A = 0, el sistema de AX = 0 tiene solución X0 dis-tinta de 0, por tanto XT(AX0) = 0, que significa f (~x,~x0) = 0 para cualquiervector ~x, es decir, f es degenerada. �

Clasificación por el signo

Definición 6.13 (Formas definidas). Una forma bilineal f se dice

Definida positiva si f (~x,~x) > 0 para todo ~x 6=~0.

Definida negativa si f (~x,~x) < 0 para todo ~x 6=~0.

Proposición 6.14. Las formas bilineales definidas (positiva o negativa) son nodegeneradas.

Demostración. Si f es degenerada existe ~x0 6= ~0 y f (~x0,~x) = 0 para cadavector~x ∈ V, entonces f (~x0,~x0) = 0, que contradice que f sea definida. �

Definición 6.15 (Formas semidefinidas). Una forma bilineal f es

Semidefinida positiva si f (~x,~x) ≥ 0 para todo ~x y no es definida positi-va.

Semidefinida negativa si f (~x,~x) ≤ 0 para todo ~x y no es definida nega-tiva.

Proposición 6.16. Las formas bilineales semidefinidas (positiva o negativa) sondegeneradas.

Demostración. Evidente. �

El resto de las formas bilineales reales no tienen signo, así:

Definición 6.17 (Formas indefinidas). Una forma bilineal f es indefinida siexisten ~x,~y ∈ V con f (~x,~x) > 0 y f (~y,~y) < 0.

Nota. Las formas bilineales indefinidas pueden ser degeneradas o no dege-neradas.

Ejercicio 6.18. Da ejemplos de formas bilineales reales en R2 que sean definidas,semidefinidas e indefinidas.

Page 158: ALyMD

154 Formas bilineales y Producto escalar

Matrices definidas y semidefinidas

Diremos que una matriz cuadrada A es definida positiva si la formabilineal que define es definida positiva. Es decir,

XT AX > 0 para cada X 6= 0

Análogamente para matriz definida negativa, semidefinida positiva y se-midefinida negativa.

Cambio de base

Proposición 6.19. Sea f una forma bilineal y sean B1 y B2 dos bases distintas deV. Si A y B son las matrices de f asociadas a las bases B1 y B2, respectivamente,entonces existe una matriz invertible P tal que

B = PT AP (6.1)

Las matrices A y B que se relacionan mediante (6.1) se diceLa congruencia dematrices es una relación

de equivalencia en elconjunto de las matrices

cuadradas. Es un casoparticular de la

equivalencia de matrices,puesto que existe una

matriz Q de forma quePT = Q−1, pero es distinta

de la semejanza.

que soncongruentes.

Demostración. Sea P la matriz del cambio de base de B2 a B1. Dados dosvectores ~x e ~y con coordenadas X e Y respecto a B1 y X e Y respecto a B2,tenemos X = PX e Y = PY, entonces

f (~x,~y) = XT AY = (PX)T A(PY) = XT

B︷ ︸︸ ︷(PT AP) Y = XTBY

de donde B = PT AP. �

Ejercicio 6.20. Comprueba que las matrices de la aplicación bilineal obtenidas enel ejercicio 6.7 son congruentes.

6.1.2. Formas multilineales reales

El concepto de forma bilineal se extiende a más de dos entradas, así

Definición 6.21. Llamamos forma multilineal (de orden m) a una aplicaciónf : V× m veces· · · ×V → R que es lineal en cada una de las m entradas, es deciren cada entrada i = 1, . . . , m

f (~x1, . . . , ∑k

αk~xik , . . . ,~xm) = ∑k

αk f (~x1, . . . ,~xik , . . . ,~xm).

El equivalente a las formas bilineales antisimétricas son las llamadasformas multilineales alternadas.

Page 159: ALyMD

6.2 Formas cuadráticas 155

Definición 6.22. Una forma multilineal f es alternada, si para cualesquierai, j se tiene Es decir, permutando dos

entradas, la forma cambiade signo.f (~x1, . . . ,~xi, . . . ,~xj, . . . ,~xm) = − f (~x1, . . . ,~xj, . . . ,~xi, . . . ,~xm)

Teorema 6.23. Dada una base ordenada {~e1,~e2, . . . .~en} de un espacio vectorial V,existe una única forma multilineal alternada D de orden n que verifica

D(~e1,~e2, . . . ,~en) = 1

A dicha n-forma se le llama determinante.

Así, si ~x1,~x2, . . . ,~xn son vectores de V, expresadas sus coordenadas res-pecto a la base B del teorema anterior en la siguiente matriz cuadradaM =

(x1 x2 . . . xn

)formada por las coordenadas de los vectores pues-

tos en columna, se tiene

D(~x1, . . . ,~xn) = det(x1 x2 . . . xn

)De la definición y del teorema anterior se derivan todas las propiedadesque conoces de los determinantes.

6.2. Formas cuadráticas

Definición 6.24. Sea V un espacio vectorial real de dimensión n. Una formacuadrática es una función q : V → R que verifica

1. q(λ~x) = λ2q(~x) ∀λ ∈ R,~x ∈ V

2. La función fq : V ×V → R definida

fq(~x,~y) =12(q(~x +~y)− q(~x)− q(~y))

es una forma bilineal que recibe el nobre de forma polar asociada a laforma cuadrática.

Es fácil comprobar que la forma polar fq es simétrica. Efectivamente,

Demostración.

fq(~x,~y) =12(q(~x +~y)− q(~x)− q(~y)) =

12(q(~y +~x)− q(~y)− q(~x)) =

= fq(~y,~x) �

Page 160: ALyMD

156 Formas bilineales y Producto escalar

Equivalentemente, si f es una forma bilineal simétrica, entonces q(~x) =f (~x,~x) es una forma cuadrática, tal que fq = f .

Demostración. Efectivamente,

fq(~x,~y) =12( f (~x +~y,~x +~y)− f (~x,~x)− f (~y,~y)) =

=12( f (~x,~x) + f (~x,~y) + f (~y,~x) + f (~y,~y)− f (~x,~x)− f (~y,~y)) =

=12( f (~x,~y) + f (~y,~x)) =

= f (~x,~y). �

Ejemplo 6.25. La función q : R3 → R definida

q(x1, x2, x3) = 2x21 − x1x3 − 3x2x3 − x2

2

es una forma cuadrática. Vamos a comprobarlo:

1. q(λ~x) = q(λx1, λx2, λx3) = 2(λx1)2 − λx1λx3 − 3λx2λx3 − (λx2)2 =

λ2q(~x)

2. Veamos su forma polar:

fq((x1, x2, x3), (y1, y2, y3)) =

=2 (x1 + y1)

2 − (x1 + y1) (x3 + y3)− 3 (x2 + y2) (x3 + y3)− (x2 + y2)2

2−

−(2x2

1 − x1x3 − 3x2x3 − x22)

2−(2y2

1 − y1y3 − 3y2y3 − y22)

2que, simplificando, queda una expresión analítica de una forma bilineal

fq((x1, x2, x3),(y1, y2, y3)) =

=2x1y1 −12

x1y3 − x2y2 −32

x2y3 −12

x3y1 −32

x3y2

claramente simétrica.

Ejemplo 6.26. Las formas cuadráticas en R son todas de la forma q(x) =ax2 y en R2 son de la forma q(x, y) = ax2 + bxy + cy2. En ambos casos sepueden “dibujar”. Aquí tenemos algún ejemplo.

−3 −2 −1 0 1 2 3

0

10

20

−2 −1 0 1 2−2

0

20

5

−2 −1 0 1 2−2

0

20

10

q(x) = 3x2 q(x, y) = x2 + y2 q(x, y) = 2x2 − xy− y2

Page 161: ALyMD

6.2 Formas cuadráticas 157

6.2.1. Representación matricial de una forma cuadrática

Si fijamos una base B obtenemos una matriz cuadrada de orden n querepresenta la forma polar A, es decir, fq(~x,~y) = XT AY. Esta misma matrizA (simétrica) representa a la forma cuadrática (respecto de la base B).

Definición 6.27. Dada una forma cuadrática q definida en V llamamos ma-triz de q respecto de una base B a la matriz de la forma polar de q respecto dedicha base.

Por tanto, fijada una base del espacio V una forma cuadrática toma laexpresión matricial

q(~x) = XT AX

siendo A una matriz simétrica que corresponde a la forma cuadrática q.

Ejemplo 6.28. La matriz asociada a la forma cuadrática definida en el ejem-plo 6.25 respecto de la base canónica es la siguiente:

A =

2 0 − 12

0 −1 − 32

− 12 − 3

2 0

Ejercicio 6.29. Calcula las formas analítica y matricial de una forma cuadrática qen R3 sabiendo que {~e1,~e2,~e3} es una base y conociendo algunas imágenes de q:

q(~e1) = 2, q(~e2) = 0, q(~e3) = −1,q(~e1 +~e2) = 5, q(~e1 +~e3) = 3, q(~e2 +~e3) = 0

6.2.2. Clasificación

Las formas cuadráticas se clasifican según su forma polar. Así, decimosque q es definida, semidefinida o indefinida si lo es fq según las definicio-nes 6.13 y 6.15. Así queda reflejado en el cuadro 6.1:

Ejemplo 6.30. La forma cuadrática del ejemplo 6.25 anterior, q(x1, x2, x3) =2x2

1 − x1x3 − 3x2x3 − x22 es indefinida, puesto que q(1, 0, 0) = 2 > 0 y

q(0, 1, 0) = −1 < 0.La forma cuadrática q(x1, x2, x3) = 2x2

1 + x23 es semidefinida positiva,

pues, claramente q ≥ 0 y el cero se alcanza: q(0, 1, 0) = 0.

No siempre es fácil clasificar una forma cuadrática. En la section 6.6 deeste tema pretendemos dar herramientas para hacerlo, pero antes necesita-mos el concepto de producto escalar.

Page 162: ALyMD

158 Formas bilineales y Producto escalar

Sea q : V → R una forma cuadrática. Decimos que q es:

definida positiva si q(~x) > 0 para todo ~x 6= 0.

definida negativa si q(~x) < 0 para todo ~x 6= 0.

semidefinida positiva si q(~x) ≥ 0 para todo ~x 6= 0 y no es definidapositiva.

semidefinida negativa si q(~x) ≤ 0 para todo ~x 6= 0 y no es definidanegativa.

indefinida cuando existen ~x,~y ∈ V con q(~x) > 0 y q(~y) < 0.

Nota. Una forma cuadrática semidefinida positiva y semidefinida ne-gativa necesariamente es la forma cuadrática nula q = 0.

Cuadro 6.1: Clasificación de las formas cuadráticas.

6.3. Producto escalar

Definición 6.31. Llamamos producto escalar (o producto interno) deun espacio vectorial real V a cualquier forma bilineal en V simétrica ydefinida positiva.

Notación: Si g : V×V → R es un producto escalar, suele denotarse de lassiguientes formas:

g(~x,~y) = 〈~x,~y〉 = ~x ·~y = (~x|~y)

Durante este curso usaremos casi siempre la notación 〈 , 〉 para repre-sentar el producto interno, aunque se puede usar cualquiera de ellas.

Propiedades: Como consecuencia directa de la definición se tiene el pro-ducto interno tiene las siguientes propiedades:

〈~x,~y〉 = 〈~y,~x〉 (simétrico).

〈~x,~x〉 = 0 ⇐⇒ ~x =~0 (no degenerado).

〈~x,~x〉 > 0 ⇐⇒ ~x 6=~0 (definido positivo).

Definición 6.32. Llamaremos espacio vectorial euclídeo a cualquier espaciovectorial real V de dimensión finita sobre el que se ha definido un productointerno.

Page 163: ALyMD

6.3 Producto escalar 159

Ejemplos 6.33. Los siguientes espacios vectoriales son euclídeos.

1. Sea V = Rn y sean ~x e ~y vectores de V cuyas coordenadas respecto auna base fijada se representan por las matrices columnas

X =

x1x2...

xn

e Y =

y1y2...

yn

entonces el producto escalar usual o estándar está definido como

~x ·~y = XTY =(x1 x2 . . . xn

)

y1y2...

yn

= x1y1 + x2y2 + · · ·+ xnyn

2. Sea V = { f : [a, b] → R | f es continua en [a, b]}. Definimos un pro-ducto interno en V de la siguiente forma:

〈 f , g〉 =∫ b

af (x)g(x) dx

3. Sea V = Mm×n(R), definimos un producto interno en este espaciodel siguiente modo:

〈A, B〉 = tr(BT A)

donde tr M es la traza de la matriz cuadrada M, es decir, la suma delos elementos de su diagonal principal.

6.3.1. Norma de un vector

Definición 6.34. Dado un espacio vectorial euclídeo V, llamaremos normao módulo de un vector ~x al número real (positivo o cero) siguiente

‖~x‖ = +√〈~x,~x〉

Nota. En un contexto de vectores libres, la norma de un vector se sueleinterpretar como su longitud. También ‖~x‖ se interpreta como “la distancia”de un punto al origen de coordenadas, cuando se consideran los vectorescomo puntos de Rn (véase definición 6.41).

Page 164: ALyMD

160 Formas bilineales y Producto escalar

Ejemplos 6.35.

1. En caso del producto escalar usual ~x ·~y = x1y1 + · · ·+ xnyn en Rn setiene la norma usual o estándar

‖~x‖ =√

x21 + x2

2 + · · ·+ x2n

2. Cualquier producto interno en Rn define una norma en dicho espacio.Por ejemplo, en R2, el producto interno

(~x | ~y) =(x1 x2

) ( 1 −1−1 2

)(y1y2

)da la norma siguiente ‖~x‖ =

√x1

2 − 2x1x2 + 2x22 que es distinta dela norma usual.

Ejercicio 6.36. Del producto escalar definido en el ejemplo 6.33-item 2, calcula lasnormas de f (x) = ex y g(x) = x− x2 definidas en el intervalo [0, 1].

Ejercicio 6.37. Da una expresión

Solución:‖A‖2 = ∑m

i=1 ∑nj=1 a2

ij

para la norma de A = (aij) ∈ Mm×n(R)según el producto escalar definido en el ejemplo 6.33-item 3.

Teorema 6.38 (Propiedades de las normas). Si V es un espacio vectorial euclí-deo, entonces

1. ‖~x‖ ≥ 0 y además, ‖~x‖ = 0 ⇐⇒ ~x =~0.

2. ‖λ~x‖ = |λ| ‖~x‖ ∀~x ∈ V, ∀λ ∈ R.

3. (Desigualdad de Schwarz) |〈~x,~y〉| ≤ ‖~x‖ ‖~y‖ ∀~x,~y ∈ V

4. (Desigualdad triangular) ‖~x +~y‖ ≤ ‖~x‖+ ‖~y‖ ∀~x,~y ∈ V

5. ‖~x−~y‖ ≥ |‖~x‖ − ‖~y‖| ∀~x,~y ∈ V

Demostración. Vemos los más complicados, dejando el resto de ejercicios:

3. (Desigualdad de Schwarz) Si ~x = ~0 o ~y = ~0, el resultado es evidente.Supongamos entonces que ambos vectores ~x e ~y no son nulos, defini-mos entonces el nuevo vector

~z =~x‖~x‖ −

~y‖~y‖

que sabemos que 〈~z,~z〉 ≥ 0 tenemos:

0 ≤⟨

~x‖~x‖ −

~y‖~y‖ ,

~x‖~x‖ −

~y‖~y‖

⟩= 〈~x,~x〉‖~x‖2 +

〈~y,~y〉‖~y‖2 − 2 〈~x,~y〉

‖~x‖‖~y‖ = 2− 2 〈~x,~y〉‖~x‖‖~y‖

luego 〈~x,~y〉 ≤ ‖~x‖‖~y‖.

Si hacemos ~z = ~x‖~x‖ +

~y‖~y‖ , por el mismo procedimiento obtenemos

〈~x,~y〉 ≥ −‖~x‖‖~y‖. Lo que prueba el resultado.

Page 165: ALyMD

6.3 Producto escalar 161

4. (Desigualdad triangular) Se prueba usando la desigualdad de Sch-warz.

‖~x +~y‖2 = 〈~x +~y,~x +~y〉 = ‖~x‖2 + ‖~y‖2 + 2 〈~x,~y〉 ≤≤ ‖~x‖2 + ‖~y‖2 + 2‖~x‖ ‖~y‖ = (‖~x‖+ ‖~y‖)2

y, como la norma es positiva (o cero), podemos quitar los cuadrados.�

Definición 6.39. Un vector ~u es unitario si ‖~u‖ = 1.

A partir de cualquier vector ~x distinto de~0 se puede obtener un vectorunitario sin más que multiplicarlo por el inverso de su norma

~u =1‖~x‖ ~x (vector normalizado).

A esta operación la llamaremos normalizar.

Ejercicio 6.40. Normaliza la siguiente base de R3:

B = {(1, 0, 1), (0, 2, 1), (√

2, 1, 1)}

Todo espacio euclídeo es también un espacio métrico, es decir, se puededefinir una distancia entre cada par de elementos.

Distancia entre vectores

Definición 6.41 (Distancia). Se define la distancia entre vectores ~x e ~y como

d(~x,~y) = ‖~y−~x‖

Nota. Obsérvese que hubiese dado igual definir d(~x,~y) = ‖~x−~y‖. Se haceasí por conveniencia de notación con respecto al espacio afín euclídeo (sec-ción 7.2).

~0

~y−~x~x

~y

x1 y1

x2

y2

En dicha sección 7.2 veremos como, de unmodo general, se puede trasladar el conceptode distancia entre vectores a distancia entre pun-tos de un espacio sin más que considerar losvectores que definen dichos puntos.

Ejemplo 6.42. Si consideramos los vectores ~x e~y del plano R2, el producto escalar usual defi-nido en el ejemplo 6.33 nos da la llamada dis-tancia euclídea entre dichos vectores del plano

d ((x1, x2), (y1, y2)) = ‖(x1, x2)− (y1, y2)‖ =√(y1 − x1)2 + (y2 − x2)2

Page 166: ALyMD

162 Formas bilineales y Producto escalar

Ángulos

Por otro lado, si dos vectores ~x y ~y no son nulos, la desigualdad deSchwarz se puede traducir como

|〈~x,~y〉|‖~x‖ ‖~y‖ ≤ 1⇐⇒ −1 ≤ 〈~x,~y〉

‖~x‖ ‖~y‖ ≤ 1

que nos permite identificar este valor con el coseno de un cierto ángulo.

Definición 6.43. Dados dos vectores ~x 6= ~0 e ~y 6= ~0, definimos el coseno delángulo α formado entre ellos de la forma:

cos α =〈~x,~y〉‖~x‖ ‖~y‖ (6.2)

α

~x

~y

El ángulo α que forman dos vectores nonulos, será, por tanto, uno que tome comocoseno el valor de la expresión (6.2). De en-tre todos estos, nos quedamos con el únicoque verifica 0 ≤ α ≤ π, es decir, el menorpositivo posible.

Según lo anterior, si dos vectores no nulos tienen producto interno 0,forman un ángulo de π/2 radianes. Estos vectores se dicen que son “per-pendiculares”. Este concepto se generaliza con el de ortogonalidad

6.3.2. Ortogonalidad

Definición 6.44. Dos vectores ~x e ~y de un espacio euclídeo son ortogonalessi y solo si 〈~x,~y〉 = 0.El símbolo ⊥ se lee “es

ortogonal a” y estableceuna relación simétrica

en V.

A veces representamos por ~x ⊥ ~y para representarque dos vecores son ortogonales.

Proposición 6.45. En un espacio euclídeo

1. El vector~0 es el único ortogonal a sí mismo.

2. El vector~0 es el único ortogonal a todos los vectores del espacio.

Demostración. Es trivial, puesto que el producto interno es una forma bili-neal no degenerada. �

Los conceptos de producto interno y ortogonalidad nos permite demos-trar de una manera fácil el teorema más famoso de las matemáticas.

Teorema 6.46 (de Pitágoras generalizado). Los vectores ~x e ~y son ortogonalessi y solo si

‖~x +~y‖2 = ‖~x‖2 + ‖~y‖2

Demostración. La dejamos como ejercicio. Sigue los mismos pasos que paraprobar la desigualdad triangular en el teorema 6.38. �

Page 167: ALyMD

6.3 Producto escalar 163

~x ~y

~x +~y

‖~x‖

‖~y‖

‖~x +~y‖90o

Figura 6.1: El teorema de Pitágoras.

Bases ortonormales

Definición 6.47. Decimos que un sistema de vectores X = {~v1,~v2, . . . ,~vk}es un sistema ortogonal si los vectores son ortogonales dos a dos, es decir,⟨~vi,~vj

⟩= 0 siempre que i 6= j.

Teorema 6.48. Si X = {~v1,~v2, . . . ,~vk} es un sistema ortogonal de vectores nonulos, entonces es linealmente independiente.

Demostración. Supongamos λ1~v1 + λ2~v2 + · · · + λn~vn = ~0. Entonces paracada i multiplicamos por ~vi:

〈~vi, λ1~v1 + λ2~v2 + · · ·+ λn~vn〉 = λi 〈~vi,~vi〉 = 0

y por tanto (como ~vi 6=~0) se tiene que cada λi = 0. �

Definición 6.49.

1. Llamaremos base ortogonal a una base que además es un sistemaortogonal.

2. Llamaremos base ortonormal a una base ortogonal de vectores uni-tarios.

Ejercicio 6.50. Comprueba que la base canónica en Rn es ortonormal para el pro-ducto escalar usual en cambio no es ortonormal para otros productos internos.

Encontrar una base ortonormal para un espacio euclídeo es un proble-ma importante para muchas aplicaciones. En caso de dimensión finita, elsiguiente teorema nos garantiza su existencia, además de darnos un mé-todo para encontrarla. Este método se conoce con el nombre de método deGram-Schmidt.

Page 168: ALyMD

164 Formas bilineales y Producto escalar

Teorema 6.51 (Gram-Schmidt). Todo espacio vectorial euclídeo de dimensiónfinita admite una base ortogonal.

Demostración. Partiendo de una base cualquiera B = {~v1,~v2, . . . ,~vn}, cons-truimos una base ortogonal B∗ = {~e1,~e2, . . . , ~en} definida en el cuadro 6.2que prueba el teorema. �

~e1 = ~v1

~e2 = ~v2 −〈~e1,~v2〉〈~e1,~e1〉

~e1

~e3 = ~v3 −〈~e1,~v3〉〈~e1,~e1〉

~e1 −〈~e2,~v3〉〈~e2,~e2〉

~e2

...

~en = ~vn −〈~e1,~vn〉〈~e1,~e1〉

~e1 −〈~e2,~vn〉〈~e2,~e2〉

~e2 − · · · −〈~en−1,~vn〉〈~en−1,~en−1〉

~en−1

Cuadro 6.2: Método de Gram-Schmidt.

Corolario 6.52. Todo espacio vectorial euclídeo de dimensión finita admite unabase ortonormal.

Demostración. Cada vector de la base ortogonal B∗ se puede normalizar de

la forma~e Nori =

~ei

‖~ei‖, así obtenemos una nueva base

BNor = {~e Nor1 ,~e Nor

2 , . . . ,~e Norn }

que es ortonormal. �

Ejemplo 6.53. Consideremos el espacio vectorial real V = P3[λ] de los po-linomios de coeficientes reales (con variable λ) de grado menor o igual que3 con el siguiente producto interno

〈p, q〉 =∫ 1

−1p(x)q(x) dx

Vamos a construir una base ortonormal de este espacio euclídeo.

SOLUCIÓN: Partimos de la base B = {1, λ, λ2, λ3} para construir una baseortogonal siguiendo el método de Gram-Schmidt que hemos visto en elteorema anterior.

Page 169: ALyMD

6.3 Producto escalar 165

Entonces,

p1 = 1 ;

p2 = λ− 〈1, λ〉〈1, 1〉 1 = λ−

∫ 1−1 xdx∫ 1−1 1dx

= λ− 02= λ ;

p3 = λ2 −⟨1, λ2⟩〈1, 1〉 1−

⟨λ, λ2⟩〈λ, λ〉 λ = λ2 −

∫ 1−1 x2dx∫ 1−1 1dx

1−∫ 1−1 x3dx∫ 1−1 x2dx

λ = λ2 − 13

;

p4 = λ3 −⟨1, λ3⟩〈1, 1〉 1−

⟨λ, λ3⟩〈λ, λ〉 λ−

⟨λ2 − 1

3 , λ3⟩⟨λ2 − 1

3 , λ2 − 13

⟩ (λ2 − 13) = λ3 − 3

Es decir, la base B∗ = {1, λ, (λ2− 13 ), (λ

3− 35 λ)} es ortogonal. Para dar una

base ortonormal, calculamos la norma de cada uno de los vectores (polino-mios)

‖p1‖ = ‖1‖ =

√∫ 1

−112 dx =

√2 ;

‖p2‖ = ‖λ‖ =

√∫ 1

−1x2 dx =

√2√3

;

‖p3‖ =∥∥∥∥λ2 − 1

3

∥∥∥∥ =

√∫ 1

−1

(x2 − 1

3

)2

dx =

√845

=2√

23√

5;

‖p4‖ =∥∥∥∥λ3 − 3

∥∥∥∥ =

√∫ 1

−1

(x3 − 3

5x)2

dx =

√8

175=

2√

25√

7

y normalizamos cada uno de los vectores de la base B∗ para dar la siguientebase ortonormal

BNor =

{1√2

,

√3λ√2

,

√5(3λ2 − 1

)2√

2,

√7(5λ3 − 3λ

)2√

2

}

Las bases ortonormales simplifican el cálculo del producto interno. Estose espresa en la siguiente proposición.

Proposición 6.54. Sea B = {~e1,~e2, . . . ,~en} una base ortonormal. Dados dos

vectores ~x,~y de coordenas X =

x1x2...

xn

e Y =

y1y2...

yn

respectivamente, respecto de

la base B, entonces el producto escalar toma la expresión del producto escalar usual

〈~x,~y〉 = x1y1 + x2y2 + · · ·+ xnyn = XTY = ~x ·~y

Page 170: ALyMD

166 Formas bilineales y Producto escalar

Demostración. Tenemos que~x = x1~e1 + x2~e2 + · · ·+ xn~en y~y = y1~e1 + y2~e2 +· · ·+ yn~en, luego

〈~x,~y〉 = 〈x1~e1 + x2~e2 + · · ·+ xn~en, y1~e1 + y2~e2 + · · ·+ yn~en〉

y haciendo uso de la bilinealidad de producto escalar junto con

〈~ei,~ej〉 ={

1 si i = j0 si i 6= j

obtenemos el resultado requerido. �

6.3.3. Orientación de un espacio vectorial euclídeo

En teorema 6.23 hemos definido, para un espacio vectorial real V, laforma multilineal determinante D : V ×V × · · · ×V → R.

Fijada una base ortonormal B = {~e1,~e2, . . . ,~en} y definido el determi-nante, D(~e1,~e2, . . . ,~en) = 1, decimos que B define una orientación.

Cualquier base tendrá determinante positivo o negativo (nunca nulo),de aquí, se establece una relación de equivalencia en el conjunto de todaslas bases:

Nota. Dos bases están relacionadas cuando sus determinantes tienen el mis-mo signo. Elegida, por tanto, una base tenemos una orientación de V: po-sitiva si está en la clase de la base B (determinante positivo) y negativa encaso contrario.

O

~x

~y

+

Área

En el espacio vectorial R2 la base {(1, 0), (0, 1)}es positiva. Dada otra base

{~x,~y} = {(x1, x2), (y1, y2)}

su determinante es∣∣∣∣x1 y1x2 y2

∣∣∣∣ = x1y2 − x2y1

que será positivo cuando el giro del primervector hacia el segundo se hace en sentido contrario a las agujas del reloj.

Además, el determinante 2× 2, cuando la orientación de la base es po-sitiva, nos da el área del paralelogramo definido por dicha base.

Demostración. Como podemos ver en la figura 6.2 el área del paralelogramoes

Area(~x,~y) = ‖~x‖ ‖~y‖ sen α

Page 171: ALyMD

6.3 Producto escalar 167

En el espacio vectorial V = R3, una base {~x1,~x2,~x3} tendrá orientaciónpositiva si sigue la regla del sacacorchos: “al girar ~x1 hacia ~x2 (por el ángulomenor) el sacacorchos seguiría la dirección de ~x3”.

También se suele utilizar la llamada regla de la mano derecha.

http://youtu.be/faevbjfs28I

Consiste enseñalar la dirección y el sentido del vector ~x3 con el pulgar de dicha manoy el sentido que siguen los restantes dedos indican el sentido positivo de labase si señalan el giro desde el vector ~x1 hacia el vector ~x2.

Así ocurre, por ejemplo con la base canónica {(1, 0, 0), (0, 1, 0), (0, 0, 1)}.

6.3.4. Producto vectorial

‖~x‖

‖~y‖

α

h = ‖~y‖ sen α

Figura 6.2: Area = ‖~x‖ × h

En un espacio vectorial euclídeo tridi-mensional orientado tenemos un caso espe-cial de operación de vectores que vamos adescribir.

En primer lugar observamos que el senodel ángulo (en sentido positivo) de dos vec-tores independientes, junto con la normade cada uno de ellos, nos determina el áreadel paralelogramo, Area(~x,~y), que definen(véase figura al margen). Así, si α es el án-gulo entre ellos, tenemos

Area(~x,~y) = ‖~x‖ ‖~y‖ sen α

Es de notar, también, que (en R3) el determinante de una base orientadapositivamente es el volumen del paralelepípedo que determinan.

Volumen(~x,~y,~z) = D(~x,~y,~z)

Definición 6.55. Definimos el producto vectorial de dos vectores {~x,~y} delespacio tridimensional como el único vector ~x×~y que verifica:

1. ~x×~y es ortogonal a ambos vectores,

2. Si ~x,~y son independientes, {~x,~y,~x×~y} es una base orientada positi-vamente.

3. ‖~x×~y‖ = ‖~x‖ ‖~y‖ sen α. Si ~x,~y son independientes,‖~x×~y‖ = Area(~x,~y).Del punto 3 se deduce que si los vectores {~x,~y} son linealmente depen-

dientes, entonces ~x×~y =~0. Además son inmediatas las siguientes propie-dades del producto vectorial

Proposición 6.56.

1. El producto vectorial es antisimétrico: ~x×~y = −~y×~x.

2. Si ~x 6=~0 y ~y 6= 0, entonces

~x×~y =~0⇒ ~x,~y son linealmente dependientes.

Page 172: ALyMD

168 Formas bilineales y Producto escalar

Expresión analítica del producto vectorial

Dada una base ortonormal de V = R3 orientada positivamente, los vec-tores ~x,~y tendrán unas coordenadas, ~x = (x1, x2, x3) e ~y = (y1, y2, y3). En-tonces, el producto escalar tiene las siguientes coordenadas, respecto a di-cha base ortonormal

~x×~y =

(∣∣∣∣x2 y2x3 y3

∣∣∣∣ ,−∣∣∣∣x1 y1x3 y3

∣∣∣∣ ,∣∣∣∣x1 y1x2 y2

∣∣∣∣)

Demostración. Tenemos que probar que se verican los puntos de la defini-ción 6.55.

1. Como las coordenadas están expresadas en una base ortonormal, setiene que

〈~x,~x×~y〉 = x1

∣∣∣∣x2 y2x3 y3

∣∣∣∣− x2

∣∣∣∣x1 y1x3 y3

∣∣∣∣+ x3

∣∣∣∣x1 y1x2 y2

∣∣∣∣ =∣∣∣∣∣∣x1 x2 y2x2 x2 y2x3 x3 y3

∣∣∣∣∣∣ = 0

luego ~x ⊥ ~x×~y. Igualmente ~y ⊥ ~x×~y.

2. Basta comprobar que

D(~x,~y,~x×~y) =∣∣∣∣x2 y2x3 y3

∣∣∣∣2 + ∣∣∣∣x1 y1x3 y3

∣∣∣∣2 + ∣∣∣∣x1 y1x2 y2

∣∣∣∣2 > 0 (6.3)

3. Por (6.3) tenemos ‖~x ×~y‖2 = D(~x,~y,~x ×~y) = Volumen(~x,~y,~x ×~y).Pero se puede comprobar (véase figura 6.3) que

Volumen(~x,~y,~x×~y) = Area2(~x,~y)

que prueba el teorema. �

Como consecuencia directa de este resultado se tiene las siguientes propie-dades del producto vectorial:

1. El producto vectorial es una aplicación bilineal V ×V → V, ya que

~x× (~y +~z) = ~x×~y +~x×~z~x× λ~y = λ(~x×~y)

2. Regla de exclusión: ~x× (~y×~z) = 〈~x,~z〉~y− 〈~x,~y〉~z.

3. Identidad de Jacobi ~x× (~y×~z) +~z× (~x×~y) +~y× (~z×~x) = 0.

Page 173: ALyMD

6.4 Subespacios ortogonales 169

~x = (x1, 0, 0)

~y = (y1, y2, 0)

Eje YEje X

Eje Z

Área base = x1y2

Altura = x1y2

y2

~x×~y

Figura 6.3: El volumen = (x1y2)2 es el cuadrado del área de la base.

6.4. Subespacios ortogonales y complemento ortogo-nal

Extendemos el concepto de ortogonalidad a un subespacio. Así, en unespacio euclídeo V, diremos que un vector ~x es ortogonal a un subespaciovectorial S, si es ortogonal a todos los vectores de S, y lo representamos~x ⊥ S.

Si S1 y S2 son subespacios vectoriales, diremos que son ortogonales,representado S1 ⊥ S2, si todos los vectores de S1 son ortogonales a todoslos vectores de S2.

Proposición 6.57. Si V es un espacio euclídeo de dimensión n, entonces el conjun-to de todos los vectores ortogonales a un vector ~x0 forman un subespacio Claramente, si~0⊥ = V, en

otro caso, ~x⊥0 está unadimensión por debajo de V,que es lo que se llamahiperplano.

vectorialde V, que representaremos por ~x⊥0 .

Además, si ~x0 es un vector no nulo, entonces dim~x⊥0 = n− 1.

Demostración. La función f : V → R definida f (~x) = 〈~x,~x0〉 es lineal y ~x⊥0es su núcleo, por tanto es subespacio vectorial. Por otro lado, por teore-ma 5.21, si ~x0 6=~0,

n = dim Im f + dim ker f = 1 + dim x⊥0

prueba la segunda parte. �

Ejemplo 6.58. Si ~x0 = (−1, 2,−3) es un vector de R3, vamos a calcular unabase de ~x⊥0 .

SOLUCIÓN: De (x1, x2, x3) · (−1, 2,−3) = 0, tenemos la siguiente ecuación(cartesiana) de ~x⊥0

−x1 + 2x2 − 3x3 = 0

que se expresa

Page 174: ALyMD

170 Formas bilineales y Producto escalar

~x⊥0 = L({(2, 1, 0), (−3, 0, 1)})

Definición 6.59. Si S es un subespacio vectorial de V, representamos porS⊥ el conjunto de los vectores ortogonales a S y que recibe el nombre decomplemento ortogonal de S.

Teorema 6.60. El complemento ortogonal S⊥ es un subespacio de V y además

V = S⊕ S⊥.

Demostración. Consideremos {~e1,~e2, . . . ,~er} una base ortonormal de S. Esfácil ver que

S⊥ =r⋂

i=1

~e⊥i

y, por 6.57, S⊥ es un subespacio vectorial.Por otro lado, si ~x ∈ S ∩ S⊥, entonces 〈~x,~x〉 = 0⇒ ~x =~0. Por tanto,

S ∩ S⊥ = {~0}

Y, por último, si ~x es un vector de V, definimos el vector

~xS = 〈~e1,~x〉~e1 + 〈~e2,~x〉~e2 + · · ·+ 〈~er,~x〉~er (6.4)

que claramente es de S. Entonces ~xN = ~x−~xS es ortogonal a S porque

〈~xN ,~ei〉 = 〈~x,~ei〉 − 〈~xS,~ei〉 = 〈~x,~ei〉 − 〈~x,~ei〉 = 0

para cada i = 1, 2, . . . r, que nos dice que ~v = ~xS + ~xN ∈ S + S⊥. Por tan-to, V = S + S⊥. �

Ejercicio 6.61. Si V = R4, calcula es complemento ortogonal del subespacio vec-torial S generado por los vectores (1, 0, 1, 0) y (1, 1, 0,−1).

Corolario 6.62. Si S es subespacio vectorial de V, entonces(S⊥)⊥

= S.

Demostración. Si ~x ∈ S entonces ~x ⊥ S⊥, luego S ⊆(S⊥)⊥. Recíproca-

mente, si ~x ∈(S⊥)⊥, por el teorema anterior lo expresamos de la forma

~x = ~xS +~xN ∈ S⊕ S⊥. Entonces,

0 = 〈~x,~xN〉 = 〈~xS,~xN〉+ 〈~xN ,~xN〉 = 〈~xN ,~xN〉

luego ~xN =~0 y de aquí que ~x = ~xS ∈ S. �

Page 175: ALyMD

6.5 Diagonalización ortogonal 171

6.5. Diagonalización ortogonal

Definición 6.63. Decimos que una matriz cuadrada P de orden n es ortogo-nal si y solo si

PTP = In. Es decir, P−1 = PT .

Teorema 6.64. Las matrices de los endomorfismos ortogonales respecto a basesortonormales son la matrices ortogonales. Por tanto una matriz P es ortogonal siy solo si las columnas (resp. filas) de P forman una base ortonormal respecto alproducto escalar usual.

Demostración. Es trivial, puesto que las imágenes de los vectores de unabase ortonormal también lo es, luego al multiplicar PTP estamos realizandolos productos escalares de los elementos de dicha base imagen. �

Corolario 6.65. Si P es ortogonal, entonces det P = ±1.

Demostración. det(PTP) = det In ⇒ det PT det P = (det P)2 = 1. �

Endomorfismos ortogonales en R2

Giros (o rotaciones) de vectores. Un endomorfismo f en R2 se dice que es ungiro vectorial si cada vector ~x forma un ángulo constante α con f (~x).

~0 ~e1

~e2f (~e1)

f (~e2)

θθ

cos θ− sen θ

sen θcos θ

Es muy fácil comprobar que la matriz deun giro en R2, respecto a una base ortonormal,es de la forma(

cos θ − sen θsen θ cos θ

)donde θ es el ángulo de giro.

Ejemplo 6.66. La identidad I : R2 → R2 es un giro de 0 radianes.

Simetrías axiales o reflexiones. Llamaremos simetría axial en R2 a una apli-cación lineal que deja invariantes los vectores de una recta (vectorial) y “refleja” alotro lado de dicha recta al resto de vectores.

~0 ~e1

~e2Eje de simetria

f (~e1)

f (~e2)

θ2

θ

θ

Page 176: ALyMD

172 Formas bilineales y Producto escalar

Así, como se puede comprobar en el dibujo, para una base ortonormal, lascoordenadas de las imágenes de los vectores serán (cos θ, sen θ) y (sen θ,− cos θ),siendo θ/2 el ángulo del eje de simetría con el primer vector de la base.

Por tanto, la matriz de una simetría axial será de la forma(cos θ sen θsen θ − cos θ

)Los giros y las simetrías axiales determinan todos los endomorfismos ortogo-

nales en R2 como reflejamos en el siguiente teorema que damos sin demostración:

Teorema 6.67. Los únicos endomorfismos ortogonales en R2 son los giros y las reflexio-nes. Además, si P ∈ M2×2 es una matriz ortogonal entonces:

1. P es un giro si y solo si det P = 1

2. P es una reflexión si y solo si det P = −1.

Endomorfismos ortogonales en R3

Giros axiales de vectores Un endomorfismo f en R3 es un giro axial si existeuna recta r = L(~u1) (con ‖~u1‖ = 1) invariante1 para f , y si ~x /∈ r, entonces lasproyecciones ortogonales en S = ~u⊥1 de los vectores ~x y f (~x) forman un ángulo(constante) θ en S. A la recta r se le llama eje de giro.

Si el vector ~u1 es el primero de una base ortonormal {~u1,~u2,~u3},~u2 y ~u3 son baseortononormal de S = ~u⊥1 .

en dicha base,la matriz de f toma la expresión1 0 0

0 cos θ − sin θ0 sin θ cos θ

Simetría especular o reflexión Un endomorfismo f en R3 es una simetríaespecular si existe un plano π = L({~u2,~u3}) (con {~u2,~u3} base ortonormal de π)invariante2 para f de forma que si ~x ∈ π⊥ se tiene f (~x) = −~x. La matriz de frespecto a la base ortonormal {~u2 ∧ ~u3,~u2,~u3} es−1 0 0

0 1 00 0 1

Composición de giro y simetría Si componemos un giro axial y una simetríaespecular obtenemos un endomorfismo ortogonal, que respecto a la base adecua-da, tiene por matriz −1 0 0

0 cos θ − sen θ0 sen θ cos θ

Estos tres tipos de endomorfismos caracterizan los endomorfismos ortogonales enR3, es decir

1~u1 es autovector para de f para el autovalor λ = 1.2π es subespacio propio de f para λ = 1.

Page 177: ALyMD

6.5 Diagonalización ortogonal 173

Teorema 6.68. Los únicos endomorfismos ortogonales en R3 son los giros axiales, lassimetrías especulares o las composiciones de ambas.

Nota. Un caso distinguido es la identidad que es un giro axial de 0 radianes. Otrocaso distinguido es la composición de una simetría especular con un giro de πradianes que, respecto a la base adecuada, tiene por matriz−1 0 0

0 −1 00 0 −1

que recibe el nombre de simetría central o respecto del un punto.

El grupo ortogonal

En el tema de estructuras algebraicas ya mencionamos el grupo general lineal degrado n, representado GL(n) definido como el conjunto de las matrices cuadradasinvertibles junto con la operación producto. Este grupo es isomorfo al grupo delos automorfimos V → V en un espacio de dimensión n.

El conjunto de las matrices ortogonales de orden n forman un subgrupo degrupo GL(n) que recibe el nombre de grupo ortogonal y se representa O(n). Lasmatrices ortogonales con determinante 1 forman a su vez un subgrupo del grupoO(n) que recibe el nombre de grupo ortogonal especial que se representa SO(n).

6.5.1. Diagonalización de matrices simétricas

Definición 6.69. Sea f un endomorfismo de un espacio vectorial euclídeoV. Se dice que f es simétrico (o autoadjunto) si y solo si

〈~x, f (~y)〉 = 〈 f (~x),~y〉 ∀~x,~y ∈ V.

Los endomorfismos autoadjuntos se relacionan con las matrices simé-tricas mediante el siguiente teorema.

Teorema 6.70. Si A es la matriz asociada a un endomorfismo f respecto de unabase ortonormal, entonces f es autoadjunto si y solo si A es simétrica.

Demostración. Dados dos vectores ~x,~y con coordenadas X e Y respecto a labase ortonormal dada, la proposición 6.54 nos dice que el producto escalarse reduce al producto escalar usual, es decir 〈~x,~y〉 = XTY. Por tanto,

f autoadjunto ⇒ 〈~x, f (~y)〉 = 〈 f (~x),~y〉 ⇒ XT(AY) = (AX)TY ⇒XT AY = XT ATY ⇒ A = AT.

Recíprocamente, A simétrica⇒ A = AT, luego

〈~x, f (~y)〉 = XT(AY) = XT ATY = (AX)TY = 〈 f (~x),~y〉

es decir, f es autoadjunto. �

Page 178: ALyMD

174 Formas bilineales y Producto escalar

Es decir, en el caso que la matriz A que se quiere diagonalizar sea simé-trica, la podemos considerar como la matriz asociada a un endomorfismoautoadjunto f y el siguiente teorema nos prueba que los autovectores aso-ciados a autovalores distintos de una matriz simétrica, no sólo sean lineal-mente independientes, sino que además son ortogonales.

Teorema 6.71. Los autovectores correspondientes a autovalores distintos de unendomorfismo autoadjunto son ortogonales.

Demostración. Sean λ1 6= λ2 autovalores y ~x,~y autovectores asociados aellos respectivamente. Entonces f (~x) = λ1~x y f (~y) = λ2~y. Así tenemos:

〈 f (~x),~y〉 = λ1 〈~x,~y〉〈~x, f (~y)〉 = λ2 〈~x,~y〉

}restando, tenemos (λ1 − λ2) 〈~x,~y〉 = 0, y como λ1 6= λ2, queda probadoque ~x e ~y son ortogonales. �

Ejercicio 6.72. Comprueba que el anterior teorema calculando los autovalores y

autovectores de la matriz simétrica A =

(1 11 1

).

6.6. Diagonalización de formas cuadráticas

Dada la expresión matricial de una forma cuadrática q(~x) = XT AX,como siempre, nos hacemos la siguiente pregunta:

¿Cómo cambia la matriz de una forma cuadrática q cuando se cambiala base?

La respuesta es la misma que hemos visto cuando analizábamos el cambiode base en formas bilineales (tema anterior).

Si P es la matriz del cambio de base de B2 a B1, las coordenadas de unvector ~x en cada base se relacionan de la forma X = PX. Por tanto

q(~x) = XT AX = (PX)T A(PX) = XT(PT AP)X

de donde vemos que dos matrices (simétricas) de la misma forma cuadrá-tica son congruentes, es decir, B = PT AP, con P invertible.

Ejercicio 6.73. Prueba que, efectivamente, si una matriz A es simétrica, cualquiermatriz congruente con A también es simétrica.

Proposición 6.74. Dada una forma cuadrática q : V → R, existe una base de Vtal la que la matriz de q es diagonal.

Page 179: ALyMD

6.6 Diagonalización de formas cuadráticas 175

Demostración. Sea A la matriz simétrica de q respecto de una base B. Con-sideramos el endomorfismo simétrico f : V → V cuya matriz respecto a di-cha base es A =M( f ; B). Diagonalizando ortogonalmente, existe una baseortonormal BNor de autovectores de f de forma que D = M( f ;BNor) esdiagonal. Puesto que la matriz de paso P es ortogonal, tenemos D = PT AP.

Por tanto, respecto de la base ortonormal BNor la matriz de q es D, yesto prueba la proposición. �

Definición 6.75. Una forma cuadrática q se dice que está diagonalizada cuan-do está expresada matricialmente con una matriz D diagonal, es decir

q(~x) = XTDX

Esto quiere decir que existe una base de V para la cual ~x se expresa analíti-camente como

q(~x) = d1x21 + d2x2

2 + · · ·+ dnx2n

donde di ∈ R y (x1, x2, . . . , xn) son las coordenadas de ~x en dicha base.

6.6.1. Método de los autovectores

La prueba de la proposición 6.74 nos está dando un método de diago-nalización. Si partimos de una matriz simétrica A de q,

q(~x) = XT AX

diagonalizando ortogonalmente A podemos encontrar una matriz ortogo-nal P tal que D = PT AP. Haciendo el cambio de base X = PX ⇐⇒ XT =

XTPT, tenemos

q(~x) = XT AX = XT(PT AP)X = XTDX

que nos da la diagonalización.Este método, en teoría, funciona siempre, pero el problema estriba en

que, para formas cuadráticas de tres o más variables, la diagonalizaciónortogonal de su matriz implica encontrar raíces de polinomios de gradomayor o igual que tres, y esto no siempre es realizable (sin usar métodosnuméricos).

Damos un método alternativo que no involucra resolución de ecuacio-nes polinómicas.

6.6.2. Método de Lagrange

Este método consiste en ir completando cuadrados perfectos con lasvariables. Partimos de una forma cuadrática en forma analítica

q(x1, x2, . . . , xn) = a11x21 + a12x1x2 + · · ·+ aijxixj + · · ·+ annx2

n

y pueden darse dos situaciones:

Page 180: ALyMD

176 Formas bilineales y Producto escalar

1. Si algún coeficiente aii 6= 0. Agrupando todos los sumandos dondeinterviene xi podemos expresar q de la siguiente manera:

q(x1, x2, . . . , xn) = aii

(n

∑j=1

bjxj

)2

+ q1(x, . . . , xi−1, xi+1, . . . , xn)

hacemos, entonces, el cambio de variable xi = ∑nj=1 bjxj y volvemos

aplicar el método a q1 que tiene una variable menos.

2. Si todos los coeficientes aii son ceros, elegimos aij 6= 0 (debe existir,claro, en caso contrario q = 0). Hacemos entonces los cambios devariable

xi = xi + xj, xj = xi − xj, xk = xk si k 6= i, j

entonces aijxixj = aijxi2 − aijxj

2 y pasamos al caso 1 anterior.

Ejemplos de diagonalización de formas cuadráticas

Explicamos lo anterior con algunos ejemplos.

Ejemplo 6.76. Encuentra una base para la que la forma cuadrática en R2

siguiente

q1(x1, x2) =(x1 x2

) ( 1 −2−2 0

)(x1x2

)= x2

1 − 4x1x2 (6.5)

sea diagonalizable.

SOLUCIÓN:

Método de los autovectores Llamando A =( 1 −2−2 0

), y calculando sus

autovalores

λ1 =12− 1

2

√17 ≈ −1,56 y λ2 =

12+

12

√17 ≈ 2,56

obtenemos la forma cuadrática diagonalizada que toma la expresión

q1(x1, x2) =(

12 −

12

√17)

x12 +

(12 +

12

√17)

x22

Los sistemas de ecuaciones (A− λi I) = 0 nos dan los subespacios propios

Nλ1 = L(

1,14

√17 +

14

)y Nλ2 = L

(1,−1

4

√17 +

14

)

Page 181: ALyMD

6.6 Diagonalización de formas cuadráticas 177

y tomando un vector de cada subespacio propio obtenemos una base deautovectores que sabemos que es ortogonal. Dividiendo cada vector por sumódulo obtenemos la base ortonormal buscada:

B =

{(1√

116 (√

17+1)2+1

,14

(√

17+1)√116 (√

17+1)2+1

),

(1√

116 (√

17−1)2+1

, −14

(√

17− 1)√116 (√

17− 1)2+ 1

En este caso se ha podido obtener la solución al problema explícita-

mente de una forma algebraica (el polinomio característico es de segundogrado) y lo hemos hecho, claramente, usando un programa de cálculo sim-bólico. En la mayoría de ocasiones, incluso esto, es imposible y hay querecurrir a métodos numéricos para dar una solución aproximada.

Método de Lagrange Obsérvese que (x1 − 2x2)2 = x21 − 4x1x2 + 4x2

2, lue-go para obtener este cuadrado perfecto sumamos y restamos 4x2

2 en la ex-presión (6.5), así

q1(x1, x2) = x21 − 4x1x2 + 4x2

2 − 4x22 = (x1 − 2x2)

2 − 4x22

Así haciendox1 = x1 − 2x2x2 = x2

tenemos la forma cuadrática diagonalizada

q1(x1, x2) = x12 − 4x2

2 =(x1 x2

) (1 00 −4

)(x1x2

)Para calcular la base respecto de la cual hemos diagonalizado hacemos losiguiente:

x1 = x1 − 2x2x2 = x2

}⇐⇒ x1 = x1 + 2x2

x2 = x2

}que matricialmente se expresa

X =

(1 20 1

)X

luego la base buscada es B = {(1, 0), (2, 1)} .La ventaja del primer método es que obtenemos directamente una ba-

se ortonormal para la cual diagonaliza la forma cuadrática. La ventaja delsegundo está en la facilidad del cálculo.

Page 182: ALyMD

178 Formas bilineales y Producto escalar

Observa que los valores de la diagonal por los dos métodos coincidenen los signos (es decir, igual cantidad de positivos que de negativos que deceros). Esto es siempre así, son invariantes, que veremos más adelante.

Ejemplo 6.77. Igual para

q(x1, x2, x3) = x1x3 − 2x2x3

SOLUCIÓN:

Método de Lagrange En este caso no existe ningún término cuadrado.Recurrimos a hacer el cambio introduciendo sumas por diferencias: x1 =x1 + x3, x3 = x1 − x3, x2 = x2.

q(x1, x2, x3) = x12 − 2x1 x2 + 2x2 x3 − x3

2

Buscamos, entonces, un cuadrado perfecto para x1, observamos que(x1 − x2)2 = x1

2 − 2x1 x2 + x22, quedando entonces la forma cuadrática

q(x1, x2, x3) = (x1 − x2)2 − x2

2 + 2x2 x3 − x32

Igualmente

q(x1, x2, x3) = (x1 − x2)2 − (x2 − x3)2

haciendo los cambios de variable siguientes:

x1 = x1 − x2x2 = x2 − x3x3 = x3

q aparece diagonalizada

q(x1, x2, x3) = x12 − x2

2+ 0x3

2

Por último, para calcular la base para la cual la forma cuadrática q estádiagonalizada, trabajamos con los cambios de base matricialmente, asíx1

x2x3

=

1 −1 00 1 −10 0 1

x1x2x3

y

x1x2x3

=

1 0 10 1 01 0 −1

x1x2x3

por tanto, x1

x2x3

=

1 0 10 1 01 0 −1

1 −1 00 1 −10 0 1

−1x1x2x3

Page 183: ALyMD

6.6 Diagonalización de formas cuadráticas 179

que, operando las matrices, podemos expresar

X =

1 1 20 1 11 1 0

X

de donde la base es B = {(1, 0, 1), (1, 1, 1), (2, 1, 0)} .

Método de los autovalores La forma cuadrática se expresa matricialmen-te de la forma

q(x1, x2, x3) =(

x1 x2 x3)0 0 1

20 0 −112 −1 0

x1x2x3

En este ejemplo usamos software de cálculo de matemáticas para encontrarlos autovalores y autovectores, así, los autovalores son

λ1 = 0, λ2 = −1,118033988749895, λ3 = 1,118033988749895

que nos da la expresión diagonalizada aproximada de q

q(x1, x2, x3) ≈ −1,118 x22 + 1,118 x3

2

y los autovectores, en el orden adecuado nos producen la base

{(1, 12 , 0), (1,−2,−2,23606797749979), (1,−2, 2,236067977499790)}

pero nos interesa la base ortonormal. Sin más que normalizar dicha baseobtenemos la base (aproximada) que buscamos:

B = {(0,8944, 0,4472, 0), (0,3162,−0,6324, − 0,7071),(0,3162,−0,6324, 0,7071)}

Ejemplo 6.78. Vamos a diagonalizar la forma cuadrática siguiente

q(x1, x2, x3) = 3x21 + 4x1x2 + 2x1x3 + x2

3 + 4x2x3

SOLUCIÓN:

Page 184: ALyMD

180 Formas bilineales y Producto escalar

Método de Lagrange Comenzamos encontrando un cuadrado perfectopara la primera variable. Observamos que

3(x1 +23

x2 +13

x3)2 = 3x1

2 + 4x1x2 + 2x1x3 +x3

2

3+

4x2x3

3+

4x22

3por tanto, q se expresa

q(x1, x2, x3) = 3(x1 +23

x2 +13

x3)2 − 4

3x2

2 +83

x2x3 +23

x23

= 3(x1 +23

x2 +13

x3)2 − 4

3(x2 − x3)

2 + 2x23

Haciendo los cambios de variables

x1 = x1 +23 x2 +

13 x3

x2 = x2 − x3x3 = x3

obtenemos la forma cuadrática diagonalizada

q(~x) = 3x12 − 4

3 x22 + 2x3

2

Para calcular la base observamos que

X =

1 23

13

0 1 −10 0 1

X ⇐⇒ X =

1 − 23 −1

0 1 10 0 1

X

y obtenemos una base que diagonaliza a q.

B = {(1, 0, 0), (−23 , 1, 0), (−1, 1, 1)}

6.6.3. Clasificación por invariantes de una forma cuadrática

Sabemos que el rango de una matriz es un invariante para matricesequivalentes, por tanto, para también para matrices congruentes. Obsérve-se que, si una forma cuadrática está diagonalizada, el rango es el número deelementos de la diagonal principal no nulos, independientemente de la diago-nalización elegida. Es, lo que se llama, un invariante de la forma cuadrática.

Definición 6.79. Si q es una forma cuadrática diagonalizada, llamaremossignatura al número de elementos positivos de su diagonal principal.

Para el siguiente teorema no damos demostración y nos remitimos a losmanuales de Álgebra Lineal.

Teorema 6.80 (Ley de inercia de Sylvester). Sea q una forma cuadrática realdefinida en un espacio vectorial V. El rango y la signatura son invariantes de q.

Ejercicio 6.81. Determina el rango y la signatura de las formas cuadráticas detodos los ejemplos de la sección 6.6 anterior.

Page 185: ALyMD

6.6 Diagonalización de formas cuadráticas 181

Clasificación de las formas cuadráticas

Sea q una forma cuadrática diagonalizada

q(~x) = d1x21 + d2x2

2 + · · ·+ dnx2n

entonces:

1. q es definida positiva ⇐⇒ di > 0 ∀i = 1, 2, . . . , n.

2. q es definida negativa ⇐⇒ di < 0 ∀i = 1, 2, . . . , n.

3. q es semidefinida positiva ⇐⇒ di ≥ 0 ∀i = 1, 2, . . . , n con algúndj = 0.

4. q es semidefinida negativa ⇐⇒ di ≤ 0 ∀i = 1, 2, . . . , n con algúndj = 0.

5. En cualquier otro caso q es indefinida. Dicho de otro modo, existendi < 0 y dj > 0.

Ejercicio 6.82. Clasifica la siguiente forma cuadrática, usando los autovalores ypor el método de Lagrange.

q(x1, x2, x3) = x3 (7x3 + x1) + x1 (x3 + 7x1) + 4x22

Criterio de Sylvester

Existe un criterio que caracteriza las formas cuadráticas definidas, aun-que no clasifica las semidefinidas ni las indefinidas.

Teorema 6.83 (Criterio de Sylvester). Sea q(~x) = XT AX una forma cua-drática real y sean ∆1, ∆2, · · · , ∆n los menores principales de A. Entonces:

1. q es definida positiva ⇐⇒ ∆i > 0 ∀i = 1, 2, . . . , n.

2. q es definida negativa ⇐⇒ (−1)i∆i > 0 ∀i = 1, 2, . . . , n.

En cualquier otro caso este criterio no clasifica nada, es decir podría sersemidefinida o indefinida.

Demostración. Supongamos que la forma cuadrática está diagonalizada. Siq es definida positiva, entonces los elementos de la diagonal principal sontodos positivos, esto es equivalente a que los ∆i son todos positivos. Si qes definida negativa, entonces los elementos de la diagonal principal sontodos negativos, de aquí que los ∆i alternan su signo en la forma indicadaen el teorema. �

Page 186: ALyMD

182 Formas bilineales y Producto escalar

Clasificación de formas cuadráticas en espacios bidimensionales

Para el caso de formas cuadráticas en espacios vectoriales reales de di-mensión 2 (como sabemos, isomorfos a R2) se puede hacer una clasificacióncompleta independiente de los teoremas 6.80 y 6.83. Sea

q(x1, x2) =(

x1x2) (a b

b c

)(x1x2

)= ax2

1 + 2bx1x2 + cx22

tenemos ∆1 = a y ∆2 =

∣∣∣∣a bb c

∣∣∣∣ = ac− b2 y, aplicando el método de Lagran-

ge se da una de las tres siguientes situaciones:

1. Si ∆1 = a 6= 0, entonces ∆2 = a(

c− b2

a

)y

q(x1, x2) = a(

x1 +ba

x2

)2

+

(c− b2

a

)x2

2 = ∆1x12 +

∆2

∆1x2

2

2. Si ∆1 = a = 0 y c 6= 0, necesariamente ∆2 = −b2 ≤ 0 y

q(x1, x2) = 2bx1x2 + cx22 = c

(x2 +

bc

x1

)2

+

(−b2

c

)x2

1 =

=∆2

cx1

2 + cx22

3. Si ∆1 = a = 0 y c = 0, ∆2 ≤ 0 y haciendo los cambios de variablesx1 = |b|1/2(x1 + x2) y x2 = |b|1/2(x1 − x2) obtenemos

q(x1, x2) = 2bx1x2 = 2b|b|(x1

2 − x22) = (∓2)∆2x1

2 + (±2∆2)x22

Teorema 6.84 (Criterio de Sylvester para dim=2). Sea q(~x) = XT AX unaforma cuadrática real de dmensión 2 y sean ∆1, ∆2 los menores principales de A.Entonces:

1. q es definida positiva ⇐⇒ ∆1 > 0 y ∆2 > 0.

2. q es definida negativa ⇐⇒ ∆1 < 0 y ∆2 > 0.

3. q es indefinida ⇐⇒ ∆2 < 0.

4. q es semidefinida3 ⇐⇒ ∆2 = 0.

3En este caso es nula cuando también ∆1 = 0 y c = 0.

Page 187: ALyMD

6.6 Diagonalización de formas cuadráticas 183

−4 −2 0 2 4 −5

0

50

50

100

Veamos un ejemplo. La siguiente forma cua-drática

f (x1, x2) = x21 + x2

2 − 2x1x2

tiene por matriz(

1 −1−1 1

), por tanto,

∆1 = 1 y ∆2 = 0. El teorema 6.84 anteriornos dice que esta forma cuadrática es semi-definida, pero no nos dice si es (semidefinida) positiva o negativa. Buscandoun vector ~v para el que q(~v) no sea cero, nos dará el signo. En este ejemplo,q(1, 0) = 1 > 0, luego q es semidefinida positiva. En la siguiente gráficapodemos ver que, efectivamente, lo es.

Ejercicio 6.85. Da un ejemplo de forma cuadrática definida en R2 de cada uno delas clases: definida positiva, definida negativa, semidefinida . . . .

Ejercicios Propuestos

Ej. 6.1 — Comprueba que la forma bilineal f ((x1, x2), (y1, y2)) = x2(y1 −y2)− 2x1(y1 − y2) es degenerada encontrando al menos un vector degene-rado para f . Comprueba, además, que es indefinida.

Ej. 6.2 — Sea f : R2 ×R2 −→ R la forma bilineal definida como:

f ((x1, x2), (y1, y2)) = 2x1y1 − 3x1y2 + x2y2

1. Halla la matriz A de f en la base {u1 = (1, 0), u2 = (1, 1)}.2. Halla la matriz B de f en la base {v1 = (2, 1), v2 = (1,−1)}.3. Encuentra la matriz de cambio de base P de la base {v1, v2} a la base{u1, u2} y comprueba que B = PT AP.

Ej. 6.3 — Si A =

1 −1 3−1 1 03 0 1

es la matriz de una forma bilineal res-

pecto a la base canónica, se pide:1. Calcula su matriz respecto a la base B = {(1, 1, 0), (0, 1, 0), (1, 1, 1)} .2. Determina si es o no es degenerada.3. Da las expresiones analíticas de la forma cuadrática asociada a f res-

pecto de la base canónica y respecto de la base B anterior.

Ej. 6.4 — Dada la siguiente matriz simétrica A =

(3 11 −1

), encuentra las

expresiones analíticas de:

Page 188: ALyMD

184 Formas bilineales y Producto escalar

1. El endomorfismo asociado a A.2. La forma bilineal asociada a A.3. La forma cuadrática asociada a A.

Ej. 6.5 — Sea V el espacio vectorial real de los polinomios de grado menoro igual que 2. Para f , g ∈ V, se define el siguiente producto escalar: 〈 f , g〉 =∫ 1

0f (t)g(t) dt. Se pide:

1. Da una base ortonormal para este producto escalar2. Dados los polinomios p(t) = t+ 2 y q(t) = 2t− 3; halla sus módulos

y el coseno del ángulo que forman.

Ej. 6.6 — ¿Qué ángulo deben formar los vectores unitarios ~u y ~v para quela norma del vector suma tome el valor ‖~u +~v‖ =

√3.

Ej. 6.7 — Sea V el espacio vectorial sobre R de los polinomios de grado≤ 2. Sean a, b, c tres números reales distintos. Se considera la aplicaciónf : V ×V → R, definida de la forma:

f (p(x), q(x)) = p(a)q(a) + p(b)q(b) + p(c)q(c)

1. Probar que es una forma bilineal simétrica.2. Hallar la matriz asociada a dicha forma bilineal en la base B ={1, x, x2}.

3. Para a = −1, b = 1 y c = 0, f define un producto escalar. Encontraruna base ortonormal, para dicho producto escalar, del subespacio delos polinomios sin término independiente.

Ej. 6.8 — Sabemos que dos vectores ~u,~v ∈ R3 verifican ‖~v‖ = 2‖~u‖ y que‖~u×~v‖ = 2. Expresa el ángulo entre ~u y ~v en función del módulo de ~u.

1. Encuentra para que valor de ‖~u‖ se tiene que el ángulo entre ambos

vectores seaπ

4radianes.

2. Encuentra, si existen, vectores ~u y~v en las anteriores condiciones conla condición de que ‖~v‖2 = 2.

Ej. 6.9 — En el espacio vectorial euclídeo R4 con el producto usual se pide:

1. Obtener mediante el método de Gram-Schmidt una base de vectoresortonormales para el subespacio:

S = L{(1, 2,−1, 0), (0, 1, 1, 0), (1, 0,−2, 1)}

Page 189: ALyMD

6.6 Diagonalización de formas cuadráticas 185

2. Determina una base ortonormal del espacio ortogonal S⊥ del subes-pacio anterior.

Ej. 6.10 — (Feb. 2013) En R3, determine una base ortonormal considerandoel producto escalar

〈(x1, x2, x3), (y1, y2, y3)〉 = 2x1y1 + x2y1 + x1y2 + x2y2 + x3y3

Ej. 6.11 — (Sep.2013) Determina la matriz de una aplicación lineal f : R4 →R3, sabiendo que (−1, 0, 0, 1) y (1, 3, 2, 0) constituyen un sistema generadorde ker f y que los vectores (1, 1, 1) y (0,−2, 1) generan a Im f .

Ej. 6.12 — De un endomorfismo F de R4 se conoce :

a) =F = ker F.

b) F(1, 2,−2, 1) = (0, 1, 0, 1) y F(3, 3,−1, 2) = (1, 0, 1, 0)

Se pide:1. Calcula la matriz de F.2. Ecuaciones paramétricas e implícitas de=F (o del núcleo) y una base

ortonormal de la misma.

Ej. 6.13 — Consideramos el producto escalar definido por la matriz: 1 1 01 2 −10 −1 5

.

Se pide:1. Comprueba que, efectivamente, es la matriz de un producto escalar.

2. A partir de la base canónica de R3, obtén una base ortonormal res-pecto de dicho producto escalar y halla la matriz del cambio de base.

Ej. 6.14 — (Sep. 2013) Sea f una forma bilineal de R3 cuya matriz, respecto

de la base canónica, es

4 −2 0−2 2 10 1 α

1. Calcula los valores de α para que f sea un producto escalar.2. Determina α para que además, los vectores~u = (1, 1, 1) y~v = (0, 3,−1)

sean ortogonales.3. Para el valor de α calculado anteriormente, determina el subespacio

ortogonal al subespacio L definido por x1 − x2 − x3 = 0.

Page 190: ALyMD

186 Formas bilineales y Producto escalar

Ej. 6.15 — Consideramos el espacio euclídeo tridimensional y el subespa-cio vectorial S generado por la base B = {(1, 0, 2), (0, 1, 1)}. Se pide:

1. Matriz A del producto escalar restringido a S.2. Sustituye el segundo vector de la base B por otro vector ~x de forma

que {(1, 0, 2),~x} sea una base ortogonal de S.3. Encuentra la matriz B asociada a este producto escalar en esta nueva

base y la matriz P que hace B = PT AP.

Ej. 6.16 — Calcula una base, así como las ecuaciones, del subespacio orto-gonal en R4 del subespacio

S ≡{

x− y + 2t = 0z + t = 0

Ej. 6.17 — Diagonalizar la matriz A y encontrar la matriz de paso ortogo-nal.

A =

3 −1 0−1 3 00 0 2

Ej. 6.18 — Clasifica las siguientes formas cuadráticas:

1. 3x2 − 6xy + 11y2

2. 3x2 + 2xy + 3y2 + 2xz + 2yz + 3z2

3. xy + yz + zx

Ej. 6.19 — (Feb. 2013) Clasifique la siguiente forma cuadrática q(x, y, z) =3x2 + 2xz.

Ej. 6.20 — Clasifica la siguiente forma cuadrática para los distintos valoresde a.

q(x, y, z) = αx2 + αy2 + (α− 1)z2 + 2xy con α ∈ R fijo.

Ej. 6.21 — Diagonaliza las formas cuadráticas del ejercicio 6.18 anterior.

Ej. 6.22 — Dada la forma cuadrática cuya matriz asociada es a 0 a0 a + c 0a 0 a

1. Exprésala como suma de cuadrados usando dos métodos diferentes.

Page 191: ALyMD

6.6 Diagonalización de formas cuadráticas 187

2. Clasifícala en función de los parámetros a y c.3. Pon un ejemplo, si existe, de valores de a y c para los que la forma

cuadrática es definida positiva.4. Pon un ejemplo, si existe, de valores de a y c para los que la forma

cuadrática es semidefinida positiva.5. Pon un ejemplo, si existe, de valores de a y c para los que la forma

cuadrática es indefinida.

Ej. 6.23 — Diagonaliza de dos maneras distintas las formas cuadráticas si-guientes:

1. q(x, y) = −6xy + 8y2

2. q(x, y, z, t) = x2 + 2y2 − 6xz + z2 − 4t2

Ej. 6.24 — Se consideran en R3 y con respecto a la base canónica, las formascuadráticas

qa(x, y, z) = x2 + ay2 + 3z2 + 2xy + 2xz + 2ayz

donde a es un parámetro real. Diagonaliza y estudia el carácter de qa paralos distintos valores de a.

Page 192: ALyMD
Page 193: ALyMD

TEMA 7

GEOMETRÍA

Índice7.1. El Espacio afín . . . . . . . . . . . . . . . . . . . . . . . . 189

7.1.1. Sistemas de Referencia . . . . . . . . . . . . . . . 190

7.1.2. Subespacios afines . . . . . . . . . . . . . . . . . 191

7.1.3. Variedades en el plano y en el espacio real . . . . 193

7.2. El espacio afín euclídeo . . . . . . . . . . . . . . . . . . . 195

7.2.1. Perpendicularidad . . . . . . . . . . . . . . . . . 196

7.2.2. Ángulo y distancia entre variedades lineales . . 197

7.2.3. Coordenadas polares . . . . . . . . . . . . . . . . 201

7.2.4. Coordenadas cilíndricas y esféricas . . . . . . . . 203

Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . . 207

7.1. El Espacio afín

Los espacios vectoriales nos dan una imagen geométrica muy limitada,puesto que sus elementos son vectores. Generalmente los conceptos geo-métricos comienzan con la definición de puntos. El espacio geométrico máspróximo al espacio vectorial es el espacio afín.

Definición 7.1. Llamaremos espacio afín a una cuaterna (A, V, K, ϕ), don-de: A es un conjunto cuyos elementos llamamos puntos,V es un espaciovectorial sobre el cuerpo K y ϕ : A×A→ V es una función que a cada dospuntos P, Q ∈ A le asigna un vector ϕ(P, Q) =

−→PQ ∈ V y que verifica los

siguientes axiomas:

189

Page 194: ALyMD

190 Geometría

1. (Relación de Chasles). Si P, Q, R son ele-mentos de A, entonces

−→PQ +

−→QR =

−→PR

P

Q

R

2. Si P ∈ A y ~x ∈ V exise un único punto Qtal que

−→PQ = ~x.

Este punto lo representamos Q = P +~x.O ~x

PP +~x

Llamaremos dimensión del espacio afín a la dimensión del espacio vecto-rial V asociado a A.

Ejemplo 7.2. Todo espacio vectorial V puede ser considerado un espacioafín (asociado a sí mismo) sin más que identificar los puntos con los vecto-res P = ~x, Q = ~y y definiendo

−→PQ = ~y−~x.

Propiedades. De forma inmediata, a partir de la definición, tenemos lassiguientes propiedades:

1. Para cada P ∈ A se tiene−→PP =~0.

2. Para cada par de puntos P, Q ∈ A se tiene−→PQ = −−→QP.

3. (Regla del paralelogramo). Si P, Q, R, S ∈ A entonces−→PQ =

−→RS ⇐⇒ −→

PR =−→QS

Ejercicio 7.3. Prueba las anteriores propiedades.

7.1.1. Sistemas de Referencia

Llamamos sistema de refencia afín de A al formado por un punto deO ∈ AAl punto O se le llama

origen del sistema u origende coordenadas.

y una base {~v1,~v2, . . . .~vn} del espacio vectorial asociado V. Un sis-tema lo expresamos de la forma

R = {O;~v1,~v2, . . . .~vn}Todo punto P de A tiene unas coordenadas respecto al sistema de referenciaque serán las coordenadas del vector

−→OP, así

P = (p1, p2, . . . , pn)R ⇐⇒−→OP = p1~v1 + p2~v2 + · · ·+ pn~vn

Ejemplo 7.4. En el espacio afín A = Rn se suele llamar sistema de referenciacanónico el que se construye a partir de la base canónica

RC = {O; (1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1)}siendo el origen el punto O = (0, 0, . . . , 0).

Page 195: ALyMD

7.1 El Espacio afín 191

Cambio de coordenadas

Dado un punto de coordenadas X(x1, x2, . . . , xn)R respecto al sistemaR = {O;~v1,~v2, . . . .~vn}, queremos calcular sus nuevas coordenadas

X(x′1, x′2, . . . , x′n)Srespecto al sistema S = {P;~e1,~e2, . . . ,~en}.

Para ello, calculamos las coordenadas de P(p1, p2, . . . , pn)R en R y lamatriz A del cambio de base de {~e1,~e2, . . . .~en} a {~v1,~v2, . . . ,~vn}. Entonces

−→PX =

−→OX−−→OP =

x1x2...

xn

p1p2...

pn

=

x1 − p1x2 − p2

...xn − pn

y las coordenadas de X(x′1, x′2, . . . , x′n)S en el nuevo sistema de referenciacumplen la relación

x1 − p1x2 − p2

...xn − pn

= A

x′1x′2...

x′n

Ejercicio 7.5. En el espacio afín A = R2

calcula las coordenadas del punto A(x, y)en el sistema de referenciaR = {P,~v1,~v2}siendo

P = (2,−1)~v1 = (1, 1)~v2 = (−1, 1)

OP

~v1~v2

A

x

y

x′y′

Nota. A veces es habitual dar un sistema de referencia a partir de n + 1 puntos delespacio afín,R = {O; A1, A2, . . . , An}, de forma que los vectores {−−→OA1,

−−→OA2, . . . ,

−−→OAn}

forman una base de V. Es evidente que esta manera de dar un sistema de referen-cia es equivalente a la anterior.

7.1.2. Subespacios afines

Un subconjunto no vacío L de puntos de un espacio afín A asociadoa un espacio vectorial V es un subespacio afín si existe algún subespaciovectorial S ⊆ V para el que L es un espacio afín. Como es habitual llama-remos dimensión de L a la dimensión del subespacio S. Los subespaciosafines de dimensión finita se les suele denominar variedades lineales afi-nes o simplemente variedades lineales. Una variedad de dimensión n− 1de un espacio afín de dimensión n se dice que es un hiperplano.

Page 196: ALyMD

192 Geometría

Variedades lineales y sistemas de ecuaciones

Ya sabemos que los sistemas de ecuaciones lineales homogéneos se co-rresponden con subespacios vectoriales de Rn. Vamos a ver que las varie-dades lineales de Rn, visto como espacio afín, se corresponden con los sis-temas de ecuaciones, no necesariamente homogéneos.

La primera observación es que si S es un subespacio vectorial de Rn yllamamos origen O = ~0, entonces S = O + S, por tanto S es también unavariedad lineal (que pasa por el origen).

Proposición 7.6. El conjunto de soluciones de un sistema lineal AX = C de mecuaciones con n incógnitas, compatible es una variedad lineal de Rn.

Demostración. Sea S el subespacio vectorial formado por las soluciones delsistema homogéneo asociado AX = 0 y sea L el conjunto de soluciones del

Por tanto, dim L es igual adim S = n− rango A

sistema (en general, no homogéneo) AX = C. Si X, Y ∈ L, entonces−→XY =

Y− X es un elemento de S, que prueba que L es una variedad lineal. �

Ecuaciones de una variedad lineal real

Sea L = P + S una variedad lineal de Rn tal que el subespacio vectorialS está generado por una base de vectores {~v1,~v2, . . . ,~vk} y sea O el origen,es decir O =~0. Entonces un punto X ∈ L se puede expresar como

−→OX =

−→OP + λ1~v1 + λ2~v2 + · · ·+ λk~vk (Ecuación vectorial de L)

Como es habitual, al ser los puntos de L elementos de Rn, los expresamoscomo matrices columnas de números reales, así

x1x2...

xn

=

p1p2...

pn

+ λ1

v11v21

...vn1

+ λ2

v12v22

...vn2

+ · · ·+ λk

v1kv2k

...vnk

por tanto tenemos las siguientes ecuaciones

x1 = p1 + λ1v11 + λ2v12 + · · ·+ λkv1kx2 = p2 + λ1v21 + λ2v22 + · · ·+ λkv2k

...xn = pn + λ1vn1 + λ2vn2 + · · ·+ λkvnk

Ecuaciones

paramétricas de L

Y, por último, de forma similar a como hemos ya vimos en la sección4.2.1, en página 104, las anteriores ecuaciones paramétricas se pueden en-tender como las soluciones de un sistema de ecuaciones lineales, luego, poreliminación de parámetros, lo podemos expresar de la forma

Page 197: ALyMD

7.1 El Espacio afín 193

a11x1 + a12x2 + · · ·+ a1nxn = c1a21x1 + a22x2 + · · ·+ a2nxn = c2

...am1x1 + am2x2 + · · ·+ amnxn = cm

Ecuaciones cartesianas de L

Ecuación de un hiperplano En el caso de la variedad lineal de Rn sea unhiperplano, es decir de dimensión n− 1, es fácil ver que queda determinadapor una única ecuación cartesiana

a1x1 + a2x2 + · · ·+ anxn = c

Ejemplo 7.7. Determina las tres ecuaciones (vectorial, paramétrica y carte-siana) del hiperplano de R4 que contiene al plano de ecuaciones cartesianas

Π ≡{

x1 − x2 − x3 = 23x2 + x4 = −1

y pasa por el punto P(1, 1, 0, 0)

SOLUCIÓN: La dirección del hiperplano H viene determinada por dos vec-tores (independientes) del plano Π y un tercer vector desde algún puntodel plano al punto P.

Resolviendo el sistema de ecuaciones que define Π, tenemos

x1 = 2 + λ + µx2 = λx3 = µx4 = −1− 3λ

de donde obtenemos (fácilmente) dos vectores independientes de la direc-ción de Π : {(1, 1, 0,−3), (1, 0, 1, 0)} y un punto Q(2, 0, 0,−1) ∈ Π.

7.1.3. Variedades en el plano y en el espacio real

Especial interés tienen las variedades lineales contenidas en R2 y R3.Recordemos algunos conceptos importantes.

Rectas en el plano

Una recta en el plano es un hiperplano. Ésta viene determinada a partirde un punto P(p1, p2) y un vector de dirección ~v = (v1, v2) 6= ~0, El vector de dirección

determina el subespaciode dirección es S = L(~v).

por lallamada ecuación vectorial

−→OX =

−→OP + λ~v

Page 198: ALyMD

194 Geometría

y la ecuación paramétrica

(x, y) = (p1 + λv1, p2 + λv2)

de donde se obtienen, a su vez, las llamada ecuación general

ax + by = c

y la ecuación continuax− p1

v1=

y− p2

v2

También se puede expresar la ecuación de una recta a partir de dos pun-tos P(p1, p2) y Q(q1, q2) distintos que estén contenidos en la propia recta

x− p1

q1 − p1=

y− p2

q2 − p2

Si el vector de dirección es (0, 1) la recta es vertical o con “pendiente infinita”y tiene por ecuación x = c. En caso contrario, el vector de dirección es~v = (v1, v2), con v1 6= 0, y se dice que la recta tiene pendiente

m =v2

v1

La recta, entonces, se puede representar por la llamada ecuación punto-pendiente:

y− p2 = m(x− p1)

Paralelismo. La intersección de dos rectas del plano se traduce en un sis-tema de dos ecuaciones con dos incógnitas.

a1x + b1y = c1a2x + b2y = c2

}que puede ser únicamente

Incompatible: Rectas paralelas y distintas.

Compatible indeterminado: Rectas coincidentes.

Compatible determinado: Rectas secantes (un único punto enla intersección).

Page 199: ALyMD

7.2 El espacio afín euclídeo 195

Rectas y planos en el espacio (R3)

Los planos son los hiperplanos en R3, por tanto tendrán una única ecua-ción cartesiana llamada ecuación general

ax + by + cz = d

A partir de un punto P(p1, p2, p3) y una base del espacio de dirección ~u =(u1, u2, u3), ~v = (v1, v2, v3)} podemos expresarlo por las ecuaciones vecto-riales y parametricas. Teniendo en cuenta que si X(x, y, z) es un punto delplano los vectores

{~u,~v,−→PX}

serán linealmente dependientes y esto nos dauna ecuación en forma de determinante∣∣∣∣∣∣

x− p1 y− p2 z− p3u1 u2 u3v1 v2 v3

∣∣∣∣∣∣ = 0

que nos permite dar una ecuación a partir de tres puntos P, Q, R no alinea-dos ∣∣∣∣∣∣

x− p1 y− p2 z− p3q1 − p1 q2 − p2 q3 − p3r1 − p1 r2 − p2 r3 − p3

∣∣∣∣∣∣ = 0

Las rectas del espacio: en ecuaciones cartesianas son de la forma

a1x + b1y + c1z = d1a2x + b2y + c2z = d2

}A partir de dos puntos P, Q distintos podemos obtener las ecuaciones con-tinuas de la recta que los contiene,

x− p1

q1 − p1=

y− p2

q2 − p2=

z− p3

q3 − p3

7.2. El espacio afín euclídeo

Para calcular distancias y ángulos dentro de un espacio afín necesita-mos incluir el principal elemento del espacio euclídeo: el producto escalar.

Definición 7.8. Llamaremos espacio afín euclídeo E a un espacio afín en elque el espacio vectorial asociado V es euclídeo.

En un espacio E podemos definir la distancia entre puntos P, Q ∈ Ecomo

d(P, Q) = ‖−→PQ‖El teorema 6.38, página 160, nos permite probar las propiedades de la

distancia

Page 200: ALyMD

196 Geometría

Teorema 7.9. En un espacio afín euclídeo E tenemos las siguientes propiedades dela distancia:

1. d(P, Q) = 0 ⇐⇒ P = Q, ∀P, Q ∈ E.

2. d(P, Q) = d(Q, P), ∀P, Q ∈ E.

3. d(P, Q) + d(Q, R) ≤ d(P, R), ∀P, Q, R ∈ E.

Demostración. Ejercicio. �

Al igual que en los espacios vectoriales euclídeos teníamos las bases or-tonormales, en un espacio afín distinguiremos unos sistemas de referencia

Definición 7.10. Diremos que {O;~e1,~e2, . . . ,~en} en un espacio E es un siste-ma de referencia rectangular si {~e1,~e2, . . . ,~en} es una base ortonormal delespacio vectorial asociado V.

Ejemplo 7.11. El sistema de referencia del ejercicio 7.5 es rectangular.

Si las coordenadas de los puntos P(p1, p2, . . . , pn) y Q(q1, q2, . . . , qn) es-tán dadas respecto a un sistema de referencia rectangular, la distancia tomala conocida expresión

d(P, Q) =√(q1 − p1)2 + (q2 − p2)2 + · · ·+ (qn − pn)2

7.2.1. Perpendicularidad

Se dice que dos variedades lineales L1 = P1 + S1 y L2 = P2 + S2 de unespacio afín euclídeo E son perpendiculares si se verifica: 1. L1 ∩ L2 6= ∅ y2. S1 ⊥ S2 , es decir, son perpendiculares si se cortan y sus direcciones sonortogonales.

Siempre se pueden construir variedades lineales perpendiculares a unadada. Especial interés tiene las rectas perpendiculares a un hiperplano.

Teorema 7.12. Dado un hiperplano L cuya ecuación cartesiana, respecto a unsistema de referencia rectangular, es

a1x1 + a2x2 + · · ·+ anxn = c

el vector~n de coordenadas n = (a1, a2, . . . , an) define rectas perpendiculares a L.

Demostración. Si P(p1, p2, . . . , pn y Q(q1, q2, . . . , qn son puntos de L, se cum-ple

a1(q1 − p1) + a2(q2 − p2) + · · ·+ an(qn − pn) = 0

y esto implica que 〈~n,−→PQ〉 = 0. �

Page 201: ALyMD

7.2 El espacio afín euclídeo 197

Definición 7.13. El vector ~n del teorema 7.12 se dice que es un vector nor-mal al hiperplano.

Ejemplo 7.14. En el espacio afín euclídeo R2 las rectas son los hiperplanos.Dada, entonces, una recta de ecuación general

r ≡ ax + by = c

el vector ~n = (a, b) es un vector normal, luego las rectas perpendicularestiene por ecuación

x− p1

a=

y− p2

bEjercicio 7.15. En R3, encuentra las ecuaciones de una recta que pasa por el puntoP(p1, p2, p3) perpendicular al plano

π ≡ ax + by + cz = d

7.2.2. Ángulo y distancia entre variedades lineales

Ángulo entre hiperplanos

Si L1 y L2 son dos hiperplanos de E, podemos elegir dos vectores nor-males~n1 y~n2 a cada uno ellos.

Definición 7.16. Llamaremos ángulo de L1 y L2 al menor de los ángulosque forman sus respectivos vectores normales. Por tanto

cos(L1, L2) =|〈~n1,~n2〉|‖~n1‖ ‖~n2‖

Ejercicio 7.17. Da una expresión analítica del ángulo de dos rectas en el plano ydos planos en el espacio.

Otra situación en que interesa calcular el ángulo es en el espacio E = R3.

Ángulo entre una recta y un plano en el espacio

Definición 7.18. El ángulo que forman una recta y un plano de R3 es el queforman el vector de dirección de la recta y su proyección ortogonal sobre elplano.

Sea r una recta con vector de dirección ~v y sea π un plano de vectornormal~n, entonces

Proposición 7.19. El ángulo formado por la recta r y el plano π es tal que cumple

sen(r, π) =|〈~v,~n〉|‖~v‖ ‖~n‖

Demostración. La dejamos como ejercicio. �

Page 202: ALyMD

198 Geometría

Distancia entre variedades lineales

Puesto que el concepto de distancia es puntual, dada dos variedadesL1 = P1 + S1 y L2 = P2 + S2, se define la distancia entre ellas como elínfimo de las distancia entre sus respectivos puntos,Del mismo modo se

puede definir la distanciaentre dos subconjuntos de

puntos cualesquiera.d(L1, L2) = ınf {d(X, Y) | X ∈ L1, Y ∈ L2}

Evidentemente, si las variedades L1 y L2 tienen intersección no vacía, sudistancia es cero.

Vamos a ver algunos casos particulares para encontrar esta distancia.

Distancia de un punto a una variedad lineal

L = Q + S

P

QPS

Sea P un punto y L = Q+ S una va-riedad lineal,De forma natural

PS = Q + ProyS(−→QP).

entonces la distancia de Pa L será la distancia de P al punto (or-togonalmente) proyectado sobre la va-riedad L, que llamaremos PS.

Seguiremos la metodología descritaen la subsección ?? para calcular la dis-tancia buscada. Suponemos que el es-pacio E está dotado de un sistema de refencia rectangular.

Si {~a1,~a2, . . . ,~ar} es una base de S, representamos por A la matriz n× rformada por las coordenadas de los vectores expresados en columna. Laproyección ortogonal (véase teorema ??) es A(AT A)−1AT, luego

d(P, L) = d(P, PS) = d(

P, Q +(

A(AT A)−1AT)−→

QP)

(7.1)

que nos da un método general para calcular la distancia de P a L.

Ejemplo 7.20. Calcula la distancia al origen de coordenadas de la recta, enel espacio E = R3, que tiene por ecuaciones

r ≡{

2x− y + z = 6x + z = 1

SOLUCIÓN: Las ecuaciones paramétricas de

r ≡

x = 1− λy = −4− λz = λ

nos dan un vector de dirección, ~v = (1, 1,−1) y un puntoo Q(1,−4, 0). Portanto, la proyección ortogonal del espacio en el subespacio de dirección

Page 203: ALyMD

7.2 El espacio afín euclídeo 199

S = L(~v) tiene por matriz

Pr = A(AA)−1AT =

11−1

(1 1 −1) 1

1−1

−1 (1 1 −1

)=

=13

1 1 −11 1 −1−1 −1 1

De aquí, el origen de coordenas O proyectado en r es

OS = Q + ProyS(−→QO) = (1,−4, 0) + Pr

−140

= (2,−3,−1)

Por tanto, d(O, r) =√

22 + (−3)2 + (−1)2 =√

14

Distancia de un punto a un hiperplano

En el caso de que la variedad lineal L sea un hiperplano, la fórmula (7.1)toma una expresión más conveniente.

L

Q

P~n

PSα

α

Supongamos que la ecuación del hi-perplano L viene expresada de la forma

a1x1 + a2x2 + · · ·+ xnan + c = 0

respecto de un sistema de referencia rec-tangular (orientado positivamente), deaquí ~n = (a1, a2, . . . , an) es el vector nor-mal a L. Entonces sabemos que

si Q ∈ L, 〈−→QP,~n〉 = ‖−→QP‖ ‖~n‖ cos α

siendo α el ángulo entre ambos vectores, pero ‖ ~QP‖ cos α = d(P, PS), luego

d(P, L) = d(P, PS) =〈−→QP,~n〉‖~n‖ =

(p1 − q1)a1 + · · ·+ (pn − qn)an√a2

1 + a22 + · · ·+ a2

n

=

=(a1 p1 + · · ·+ an pn) + (−a1q1 − · · · − anqn)√

a21 + a2

2 + · · ·+ a2n

simplificando la anterior expresión e incorporando un valor absoluto por-que el vector~n podría tener orientación contraria, tenemos

Page 204: ALyMD

200 Geometría

d(P, L) =|a1 p1 + a2 p2 + · · ·+ an pn + c|√

a21 + a2

2 + · · ·+ a2n

(7.2)

Distancia entre un punto a una recta en el espacio

La expresión (7.1) toma también una expresión más simple cuando lavariedad L es una recta en un espacio tridimensional. Supongamos que larecta, en un sistema de referencia rectangular tiene como ecuaciones conti-nuas:

r ≡ x− q1

v1=

y− q2

v2=

z− q3

v3

entonces podemos enunciar el siguiente resultado

Proposición 7.21. Sea Q(q1, q2, q3) un punto cualquiera de la recta r, entoncesla distancia del punto P a r es

d(P, r) =

∥∥∥−→QP ∧~v∥∥∥√

v21 + v2

2 + v23

Demostración. La norma del vector producto vectorial, ‖−→QP ∧~v‖ es el áreadel paralelogramo que define, del cual, ‖−→PPS‖ = d(P, r) es su altura.

rQ ~v

P

PS

Por tanto, este área es ‖−→QP ∧~v‖ = ‖~v‖ d(P, r), de donde se obtiene la fór-mula que queremos probar. �

Ejemplo 7.22. En el ejemplo 7.20 seguimos un método general para encon-trar la distancia al origen de la recta

r ≡{

2x− y + z = 6x + z = 1

Para aplicar la fórmula de la proposición anterior calculamos las ecuacionescontinuas de r

x− 1−1

=y + 4−1

=z1

Page 205: ALyMD

7.2 El espacio afín euclídeo 201

de aquí

d(O, r) =‖(1,−4, 0) ∧ (−1,−1, 1)‖√

3=

√(−4)2 + (−1)2 + (−5)2

√3

=√

14

Algunas situaciones particulares nos permiten encontrar una expresiónpara las distancia entre variedades lineales, como son las siguientes.

Distancia entre variedades lineales paralelas

Será la distancia desde un punto de una de ellas a la otra variedad. Esdecir si P ∈ L1 y L1 es paralela a L2, tenemos

d(L1, L2) = d(P, L2)

Distancia ente dos rectas que se cruzan en E = R3

Dos rectas en el espacio afín euclídeo tridensional que no son secantes(se cortan) ni paralelas, se dice que se cruzan. Sean dos de estas rectas r1 yr2, con sus respectivos vectores de dirección ~v1 y ~v2, y sea~h un vector queune dos puntos de cada una de las rectas Esto siempre se puede

hacer porque las rectas noson coplanarias.

de forma que la base {~v1,~v2,~h}tenga orientación positiva.

El paralelepípedo formado por estos tres vectores tiene por volumendet(~v1,~v2,~h). Si entendemos que los vectores ~v1 y ~v2 determinan la base, yllamamos H a la altura del paralelepípedo, que es la distancia entre ambasrectas, tenemos

det(~v1,~v2,~h) = Área de la base× H

y como el área de la base es ‖~v1 ∧~v2‖, entonces

d(L1, L2) =det(~v1,~v2,~h)‖~v1 ×~v2‖

.

Ejercicio 7.23. Calcula la distancia entre el eje Z y la recta perpendicular al planodeterminado por los puntos A(0, 0, 1), B(0, 1, 0), C(0, 0, 2) que pasa por el punto(1, 1, 0).

7.2.3. Coordenadas polares

En el espacio afín euclídeo E = R2 además de los sistemas de referenciarectangulares S = {O;~e1,~e2} a partir de una base ortonormal, es habitualel sistema de referencia polar o coordenadas polares.

Page 206: ALyMD

202 Geometría

Definición 7.24. Llamaremos sistema de referencia polar en el plano afíneuclídeo a un punto origen O y un vector ~v, a partir de los cuales, a cadapunto P se le asigna dos valores (ρ, θ) siendo

ρ ∈ [0, ∞) la distancia d(O, P) y

θ el ángulo que forman ~v y−→OP (expresado en radianes).

ρ es la coordenada radial yθ la coordenada angular.

A (ρ, θ) se le llama las coordenadas polares de del punto P.Estas coordenadas no son únicas, por ejemplo el origen de coordenadas

es (0, θ) siendo θ cualquier valor real. En general, un punto viene represen-tado por una infinidad de ángulos θ ± 2kπ,A veces es conveniente

considerar θ ∈ [0, 2π).de los que, de forma canónica,

elegimos θ ∈ (−π, π].

Conversión de coordenadas

Los siguientes resultados dan la conversión de coordenadas polares arectangulares y viceversa. Las demostraciones son fáciles y se dejan comoejercicio.

Proposición 7.25. Un punto P del plano con coordenadas polares (ρ, θ) tiene porcoordenadas rectangulares (o cartesianas) (x, y) siendo

x = ρ cos θ

y = ρ sen θ

Proposición 7.26. Un punto P de coordenadas (x, y) distinto del origen, en unsistema de referencia rectangular tiene por coordenadas polares (ρ, θ) siendo

ρ2 = x2 + y2

θ =

arctan

yx

si x 6= 0 (conforme a su cuadrante)

π

2si x = 0 e y > 0

−π

2si x = 0 e y < 0

Al origen de coordenadas se le representa, en coordenadas polares, como ρ = 0.

Ejercicio 7.27. En la siguiente tabla, convierte los puntos expresados en coorde-nadas polares en coordenadas rectangulares y viceversa.

Puntos del planoPolares ρ = 2, θ = π ρ = 3, θ = −π

3Rectang. (−3, 2) (−2,−2)

Page 207: ALyMD

7.2 El espacio afín euclídeo 203

P

θ

y y = ρ sen θ

x = ρ cos θ

ρ ρ2 = x2 + y2

tan θ =yx

Figura 7.1: Coordenadas polares.

Ecuaciones polares

De igual forma que la ecuación y = f (x) representa puntos del planoexpresados en coordenadas rectangulares (o cartesianas), también una ex-presión de la forma ρ = f (θ) representa puntos en coordenada polar.

Ejemplo 7.28. La circunferencia de radio r toma como expresión en coor-denadas cartesianas x2 + y2 = r2. La misma circunferencia toma una expre-sión muy simple en coordenadas polares ρ = r.

Ejemplo 7.29. Ciertas curvas, sobre todo de tipo circular o elíptico, tomanuna expresión adecuada en coordenadas polares. Así en las gráficas se pue-den observar dos ejemplos clásicos, la rosa polar (una de las muchas que sepueden construir) y la espiral de Arquímedes.

ρ = sen(2θ) ρ = aθ, con θ ∈ [0, ∞)

Ejercicio 7.30. Usa una calculadora o programa de cálculo para dibujar la curvaque que tiene por ecuación en polares

ρ =1

1 + 0,5 cos θ, con θ ∈ [0,2π)

y observa que es una elipse .

7.2.4. Coordenadas cilíndricas y esféricas

La extensión de las coordenadas polares al espacio afín euclídeo tridi-mensional se hace a través de las coordenadas cilíndricas y las coordenadasesféricas.

Supongamos un sistema de referencia rectangular orientado positiva-mente de origen O, cuyos vectores definen las direcciones: eje X, eje Y yeje Z.

Page 208: ALyMD

204 Geometría

Coordenadas cilíndricas

Definición 7.31. Un punto P del espacio euclídeo E = R3 se representa encoordenadas cilíndricas por (ρ, ϕ, z), donde:

ρ ∈ [0, ∞) es la coordenada “radial”, definida como la distancia delpunto P al eje Z, o bien la norma del vertor que resulta de proyectarortogonalmente el vector

−→OP sobre el plano XY.

ϕ ∈ (−π, π] es la coordenada “acimutal”, definida como el ánguloque forma el eje X con la proyección ortogonal del vector

−→OP sobre el

plano XY.

z ∈ (−∞, ∞) es la coordenada “vertical” o “altura”, definida como ladistancia (con signo) desde el punto P al plano XY.

O

Eje X

Eje Y

Eje Z

P

ϕ ρxy

z

Figura 7.2: Coordenadas cilíndricas.

Proposición 7.32. Si un punto P del espacio tiene por coordenadas cilíndricas(ρ, ϕ, z), entonces sus coordenadas rectangulaes son

x = ρ cos ϕ

y = ρ sen ϕ

z = z

Proposición 7.33. Si un punto P del espacio tiene por coordenadas rectangulares

Page 209: ALyMD

7.2 El espacio afín euclídeo 205

(x, y, z), entonces sus coordenadas cilíndricas son

ρ =√

x2 + y2

ϕ =

arctan

yx

si x 6= 0 (conforme al cuadrante de (x, y, 0))π

2si x = 0 e y > 0

−π

2si x = 0 e y < 0

z = z

El eje Z, en coordenadas cilíndricas, es ρ = 0 y el origen de coordenadas es ρ =0, z = 0.

Ejemplo 7.34. Si r > 0 la ecuación ρ = r representa el cilindro (vertical) deradio r.

Coordenadas esféricas

Definición 7.35. Un punto P del espacio euclídeo E = R3 se representa encoordenadas esféricas por (ρ, θ, ϕ), donde:

ρ ∈ [0, ∞) es la coordenada “radial”, definida como la distancia delorigen al punto P.

θ ∈ [0, π] es la “inclinación” o “latitud”, definida como el ángulo deleje Z con el vector

−→OP.

ϕ ∈ (−π, π] es la coordenada “acimutal”, también llamada “longi-tud” definida como el ángulo que forma el eje X con la proyecciónortogonal del vector

−→OP sobre el plano XY.

Proposición 7.36. Si un punto P del espacio tiene por coordenadas cilíndricas(ρ, ϕ, z), entonces sus coordenadas rectangulaes son

x = ρ sen θ cos ϕ

y = ρ sen θ sen ϕ

z = ρ cos θ

Proposición 7.37. Si un punto P del espacio tiene por coordenadas rectangulares

Page 210: ALyMD

206 Geometría

O

Eje X

Eje Y

Eje Z

P

ρ sen θϕ

θ ρ

x

y

z

Figura 7.3: Coordenadas esféricas

(x, y, z), entonces sus coordenadas esféricas son

ρ =√

x2 + y2 + z2

θ = arc coszρ

si ρ 6= 0

ϕ =

arctan

yx

si x 6= 0 (conforme al cuadrante de (x, y, 0))π

2si x = 0 e y > 0

−π

2si x = 0 e y < 0

En coordenadas esféricas el origen de coordenadas es ρ = 0.

Ejemplo 7.38. Si r > 0 la ecuación esférica ρ = r representa la esfera deradio r.

Ejercicio 7.39. En la siguiente tabla, convierte los puntos del espacio de una re-presentación a las otras.

Puntos del espacio

Rectang. (−2,−2, 2)

Cilíndricas

r =ϕ =

z =

r = 1ϕ = π/2z = −1

r =ϕ =

z =

Esféricas

ρ =

θ =

ϕ =

ρ =

θ =

ϕ =

ρ = 3θ = π/4ϕ = −π/2

Page 211: ALyMD

7.2 El espacio afín euclídeo 207

Ejercicios Propuestos

Ej. 7.1 — Considera el punto P(0, 0, 1) y la recta r ≡{

x + y = 2z = 1

.

1. Calcula el punto Q de la recta r más próximo a P.2. Halla los puntos R de la recta r tal que el triángulo PQR tenga área

2.

Ej. 7.2 — Encuentra las ecuaciones que definen una circunferencia centra-da en el punto (1, 1, 1) contenida en el plano x + y− 2z = 0 y es tangente ala recta de corte de dicho plano con el plano horizontal z = 0.

Ej. 7.3 — Considera, los planos de un haz (1− 2λ)x + (1− λ)y− z− (2 +λ) = 0.

1. Comprueba que existe una recta común a todos los planos dados ydetermina su ecuación.

2. Halla la ecuación de un plano que pase por el origen y sea perpen-dicular a todos los planos del haz.

3. Determina cuál de los planos del haz contiene a la recta s ≡ x + 1 =

y− 1 =z + 2

2.

Ej. 7.4 — Sean el plano π ≡ x + y = 2 y la recta r ≡{

x = yx + z = 1

y

el punto A ∈ π ∩ r. Dado cualquier punto P de la recta consideramos elpunto Q del plano π más cercano a P. Expresa el área del triángulo APQen función del valor de x.

P

A

r

Ej. 7.5 — (Sep. 2013) Sea r la recta de R3 que pasa por el punto (1, 0, 0) ytiene como vector director (a, 2a, 1) y sea s la recta dada por{

−2x + y = −2−ax + z = 0

1. Calcula los valores de a para los que r y s son paralelas.

Page 212: ALyMD

208 Geometría

2. Calcula, para a = 1, la distancia entre r y s.

Ej. 7.6 — Dos caras de un cubo se encuentran en los planos 3x− y+ 2z = 5,3x− y + 2z = 7. Calcular el volumen del cubo.

Ej. 7.7 — Determina las coordenadas polares de cada uno de los vérticesde un pentágono regular de lado unidad centrado en el origen y uno de losvértices se apoya en el eje polar.

Ej. 7.8 — Consideramos el movimiento en el plano euclídeo definido comoun giro de 30o (en sentido positivo) con centro el punto C = (2, 1). Calculala nueva ecuación de la recta x + y− 1 = 0 tras aplicarle el giro anterior.

Ej. 7.9 — Halla el lugar geométrico de los puntos, P, del plano cuya dis-tancia a A(2, 0) sea el doble de la distancia a B(−1, 0).

Ej. 7.10 — Halla la ecuación del lugar geométrico de los puntos, P, delplano tales que su distancia al punto A(1, 0), es el triple de su distanciaa la recta x = 2.

Ej. 7.11 — Una cadena se tensa sobre una polea circular de radio R de for-ma que queda enganchada a una distancia 2R del centro de la polea, con-forme se aprecia en el dibujo. Calcúlese la longitud de la cadena.

R

2R

Indicación: El radio de una circunferencia es perpendicular a la recta tan-gente.

Ej. 7.12 — Determina la ecuación polar de las curva de ecuación en coor-denadas rectangulares y2(2a− x) = x3, a > 0.

Ej. 7.13 — Expresa en forma rectangular las siguientes ecuaciones que re-presentan superficies en forma cilíndrica. Indica también qué tipo de su-perficie son.

a) z = r2. b) r = 2 cos θ. c) r2 + z2 = 25.

Ej. 7.14 — Encuentra el centro y el radio de la esfera que tiene por ecuaciónen coordenadas esféricas ρ = sen θ sen ϕ.

Page 213: ALyMD

ÍNDICE ALFABÉTICO

(n1, n2, . . . , nt)-permutación, véase Permu-tación con objetos repetidos

1-forma, véase Forma linealXT · A · Y , véase Representación matri-

cial de una forma bilinealXT AX, véase Expresión matricial≈, véase Isomorfo(n

r), véase Número combinatorio( n

n1,n2,...,nt), véase Número multinomial

Zn, véase Enteros modulares

A∗, véase Matriz adjuntaAT , véase Matriz traspuestaAbeliano, 40Adjunto, 6Ampliada, véase Matriz ampliadaÁngulo, 162, 171Anillo, 41

de matrices cuadradas, 6Antirreflexiva, véase Relación Antirrefle-

xivaAntisimétrica, véase Relación antisimé-

tricaAplicación

bilineal, 150lineal, 118

Imagen, véase ImagenMatriz, véase Matriz de una apli-

cación linealNúcleo, véase NúcleoPropiedades, 119propiedades, 123Rango, véase Rango de una apli-

cación lineal

Argumento, 46principal, 47

Asociativa, 36Autoadjunto, 173Automorfismo, 121Autovalor, 134Autovector, 134Autovectores

Método de, 175

Base, 105canónica, 106incompleta, 109ortogonal, 163, 164ortonormal, 163, 164

Bell, 78Binomio de Newton, 70Biyectiva, véase Función biyectiva, 36

C(n, r), véase Combinación ordinariaCR(n, r), véase Combinación con repeti-

ciónCambio de base, 107

Matriz de, 108Cardinal, 106Cartesiano, véase Producto cartesianoCayley-Hamilton, véase Teorema de Cayley-

HamiltonseeRelación de Chasles, 190Circular, véase Relación circularCodominio, véase ImagenCofactor, véase AdjuntoCombinación

con repetición, 71lineal, 99

209

Page 214: ALyMD

210 ÍNDICE ALFABÉTICO

ordinaria, 68Complejos, véase Números complejosComplemento ortogonal, 170Composición

de funciones, 34de aplicaciones lineales, 129Ley de, véase Operación

Congruencia, 154Conjugado, 49Conjunto

cociente, 31, 113Conmutativa, 37Coordenadas, 107, 190

cilíndricas, 204esféricas, 205polares, 202

Correspondencia, 26Coseno, 53, 162

hiperbólico, 55Cotangente, 54

hiperbólica, 55Cramer, 19Criterio de Sylvester, 181, 182Cuerpo, 43

de los complejos, 44

D, véase Matriz diagonaldet(A), véase Determinantedet(A− λI), véase Polinomio caracterís-

ticoDependencia

lineal, 99Desarreglos, 73Descomposición

Teorema de la, 125Desigualdad

de Schwarz, 160triangular, 160

Desigualdad triangular, 50Determinante, 4, 155, 166Diagonal principal, 2Diagonalizable, 133, 136, 138Diagonalización

de endomorfismos, 132de formas cuadráticas, 175–180

Dimensión, 106, 190, 191Teorema, véase Teorema de la dimen-

siónDirichlet, 63

Principio de, véase Principio del pa-lomar

Distancia, 159entre puntos, 195entre vectores, 161

Distributivas, 37Divisor de cero, 42Dominio, 28, 34

E.R., véase Ecuaciones de recurrenciaE.R.L., véase Ecuaciones de recurrencia

linealesEcuación característica, 134Ecuación

vectorial, 192Ecuaciones

cartesianas, 104de recurrencia, 78

lineales, 80, 86explícitas, véase paramétricasimplícitas, véase cartesianasparamétricas, 103, 192

ejemplo, )14Elemento

absorbente, 39comparable, 33neutro, 37, 45opuesto,inverso, 38regular, 39simétrico,simetrizable, 38, 45

Endomorfismo, 121diagonalizable, 133simétrico, 173

Enteros modulares, 32anillo de, 42grupo de, 40

Epimorfismo, 121Equivalencia

de matrices, 8, 130clase de, 30de sistemas, 15Relación de, 29

Escalar, 97Espacio

afín, 189–195euclídeo, 195–207

métrico, 161vectorial, 97

cociente, 113de aplicaciones lineales, 122

Page 215: ALyMD

ÍNDICE ALFABÉTICO 211

dual, 122euclídeo, 158

Espacio cociente, 113Euclídeo, 158Euler, 48, 56Exclusión

Regla de, 168Exponencial, 52

de una matriz, 142Expresión binomial, véase Forma rectan-

gular de un complejoExpresión matricial

de una aplicación lineal, 128de una forma cuadrática, 157

fq, véase Forma polarFibonacci, 82Forma

bilineal, 150(anti)simétrica, 150, 152definida, 153degenerada, 152indefinida, 153semidefinida, 153

cuadrática, 155definida, 158, 181indefinida, 158, 181semidefinida, 158, 181

lineal, 150multilineal, 154

alternada, 155polar, 155polar de un complejo, 48rectangular de un complejo, 46

Fórmulade Euler, 48de Grassmann, 113

Función, 33–36biyectiva, 36composición, 34exponencial, 52

de base, 56inversa, 35, 55invertible, 36inyectiva, 35, 52sobreyectiva, 35trigonométrica, 53

hiperbólica, 55

GL(n), véase Grupo general lineal

Gauss, 12, 17Gauss-Jordan, 12, 18Generador, véase Sistema generador de

vectoresGiro

vectorial, 171Grado de libertad, 16Grafo

de una relación, 27Gram-Schmidt, 163Grassmann, véase Fórmula de GrassmannGrupo, 40

general lineal, 40, 173ortogonal, 173

especial, 173simétrico, 40

HanoiTorres de, 85, 87

Hiperplano, 169, 191, 193Homomorfismo, véase Aplicación lineal

i, véase Unidad imaginariaIm f , véase ImagenIn , véase Matriz identidadIdentidad, 3, 28

de Jacobi, 168Imagen, 28, 33, 121, 123Independencia

lineal, 99Inercia, véase Ley de inercia de SylvesterIntersección

de subespacios, 109Invariante, 178, 180Inversa, 35Invertible, 6, 35Inyectiva, véase Función inyectivaIsomorfismo, 121Isomorfo, 121

Jacobi, véase Identidad de Jacobi

ker f , véase Núcleo

LagrangeMétodo de, 175

Ley de inercia de Sylvester, 180Logaritmo

complejo, 55neperiano, 55

Page 216: ALyMD

212 ÍNDICE ALFABÉTICO

principal, 56LU, 13, 20

M( f ;B1,B2), véase Matriz de una apli-cación lineal

Matricescongruentes, 154, 174equivalentes, 130, 132semejantes, 133

Matriz, 14adjunta, 6ampliada, 13, 16antisimétrica, 3columna, 1cuadrada, 1de paso, 133, 137de una aplicación lineal, 128de una forma bilineal, 151de una forma cuadrática, 157definida, 154diagonal, 2, 133diagonalizable, 133elemental, 9escalar, 2escalonada, 8

reducida, 9exponencial, 142fila, 1identidad, 3inversa, 6, 140

cálculo, 7, 12, 140invertible, 6ortogonal, 171regular, véase invertiblesimétrica, 3singular, 6traspuesta, 2triangular

inferior, 2superior, 2

Menor, 6Módulo, 46, 159Monomorfismo, 121Multilineal, 154Multiplicidad

algebraica, 138geométrica, 138

Newton, véase Binomio de NewtonNorma

usual o estándar, 160Norma de un vector, 159Normalizar, 161Notación aditiva y multiplicativa, 41Núcleo, 123Número

combinatorio, 68Propiedades, 69

de Bell, 78de funciones, 67

biyectivas, 66inyectivas, 65sobreyectivas, 74

de Stirlingde 1a especie, 77de 2a especie, 76

e de Euler, 56multinomial, 73

Números complejos, 45

Operación, 36externa, 36

Orden total y parcial, 33Orientación

de un espacio vectorial, 166Origen, 33, 190Ortogonalidad, 162

P(n, r), véase r-permutaciónP(n), véase PermutaciónPR(n, r), véase Permutación con repeti-

ciónPOR(n1, n2, . . . , nt), véase Permutación con

objetos repetidosPar ordenado, 26Parte real e imaginaria, 46Partición, 29Pendiente, 194Permutación

con objetos repetidos, 67con repetición, 66ordinaria, 65

Perpendicular, 162, 196Pitágoras, véase Teorema de PitágorasPolinomio

característico, 82, 134Potencia, 140Principio

de inclusión-exclusión, 73de la suma, 63

Page 217: ALyMD

ÍNDICE ALFABÉTICO 213

del palomar, 63del producto, 64

Productocartesiano, 26escalar, 158

estándar, véase usualusual, 159, 171

interno, véase escalarvectorial, 167

Progresión, 79

r-combinación, 68r-permutación, 65Rango

de una aplicación lineal, 126de una forma cuadrática, 180de una matriz, 11

Referencia, véase Sistema de referenciaReflexiva, véase Relación reflexivaRelación, 26–33

representación, 27antirreflexiva, 29antisimétrica, 29circular, 29de Chasles, 190de equivalencia, 29de orden, 32grafo, véase Grafo de una relaciónidentidad, 28interna, 28reflexiva, 29simétrica, 29transitiva, 29

Representación matricialde un sistema de ecuaciones linea-

les, 16de una forma bilineal, 151de una forma cuadrática, 157

S(A), Sn, véase Grupo simétricos(n, r), véase Número de Stirling de 1a

especieS(n, r), véase Números de Stirling de 2a

especieSchwarz, véase Desigualdad de SchwarzSemejanza, 133Semigrupo, 40Seno, 53

hiperbólico, 55Signatura, 180

Simétrica, véase Relación simétricaSimetría

central, 173especular, 172

Sistema(in)compatible, 15de ecuaciones, 15–21, 192

cuadrado, 19homogéneo, 15, 18

de referencia, 190polar, 201rectangular, 196

de vectores, 99de vectores (in)dependientes, 99generador de vectores, 103ortogonal de vectores, 163

Sobreyectiva, véase Función sobreyecti-va

SoluciónGeneral, 80particular, 87

Stirling, véase Número de StirlingSubespacio

afín, 191ortogonal, 169propio, 135suplementario, 113vectorial, 101

generado, 103trivial, 102

Sumade subespacios

vectoriales, 111directa, 112

Suplementario, véase Subespacio suple-mentario

Sylvester, 180–182

tr(A), véase TrazaTangente, 54

hiperbólica, 55Teorema

de caracterización, 102de Cayley-Hamilton, 142de la base, 106de la base incompleta, 109de la descomposición, 125de la dimensión, 126de Pitágoras generalizado, 162de Rouché-Fröbenius, 16

Page 218: ALyMD

214 ÍNDICE ALFABÉTICO

Transformaciónelemental, 9, 128lineal, véase Aplicación lineal

Transitiva, véase Relación transitivaTraza, 3, 133, 141, 159Triángulo de Tartaglia (o Pascal), 70Triangular, 2, 160

Unidad imaginaria, 45

Valor absoluto, 46Valor propio, véase AutovalorVariedad lineal, véase Subespacio afínVector, 97, 189

degenerado, 152normal, 197normalizado, 161ortogonal, 162propio, véase Autovectorunitario, 161

VectoresSistema de, 99Sistema generador de, 103