Análisis Funcional Ignacio Villanueva...

226
Análisis Funcional Ignacio Villanueva Díez

Transcript of Análisis Funcional Ignacio Villanueva...

Análisis Funcional

Ignacio Villanueva Díez

Índice general

Introducción 31. El Análisis Funcional 3

Contenidos 7

Capítulo 1. Espacios normados. Espacios de Banach 11

Capítulo 2. Aplicaciones lineales continuas entre espaciosnormados 41

Capítulo 3. Teoremas de Hahn-Banach 53

Capítulo 4. El Teorema de Baire y sus consecuencias: El Principiode Acotación Uniforme y el Teorema de la GráficaCerrada. 79

Capítulo 5. Espacios duales y operadores traspuestos 107

Capítulo 6. Topologías débil y débil∗ 123

Capítulo 7. Operadores compactos 139

Capítulo 8. Teoría espectral de operadores compactos 153

Capítulo 9. Espacios de Hilbert 175

Capítulo 10. Teoría espectral en espacios de Hilbert: Operadorescompactos normales 205

Bibliografía 223

1

Introducción

1. El Análisis Funcional

El Análisis Funcional como tal fue surgiendo a principios del sigloXX como el marco abstracto adecuado para solucionar una serie deproblemas del Análisis muy importantes en esos momentos.

Desde entonces ha experimentado un gran desarrollo y en este mo-mento es una herramienta muy sofisticada útil para abordar una ampliavariedad de problemas. En [11] se puede ver un descripción del pro-ceso histórico que desembocó en la aparición del Análisis Funcional.Incluimos aquí tan sólo una breve descripción de este proceso que nospermita ubicar nuestra materia en el seno de la matemática.

Desde el desarrollo del Cálculo Diferencial, al considerar las solucio-nes de una ecuación diferencial, se vio que en ocasiones era necesarioconsiderar propiedades del espacio (o conjunto) de soluciones de laecuación, pero no estaba claro cuál era la estructura que poseía dichoespacio de soluciones. Los trabajos de D. Bernouilli, Lagrange y sobretodo Fourier acerca de la resolución de ecuaciones diferenciales se em-piezan a enfrentar a problemas que anticipan lo que será el desarrolloposterior del Análisis Funcional. Una de las características comunes avarios de estos procesos era el paso de un problema finito, por ejem-plo la solución de un sistema finito de ecuaciones lineales, a la versióninfinita del problema, lo que les fuerza a enfrentarse a problemas deconvergencia que en esa época no eran entendidos.

Merece también la pena mencionar los trabajos de Sturm (1836)y Liouville (1837) sobre la solución de ecuaciones diferenciales de laforma

y′′ − q(x)y + λy = 0

con ciertas condiciones de contorno, que influyeron notablemente en eldesarrollo de la Teoría Espectral.

Con el desarrollo del Cálculo de Variaciones aparece ya explícita-mente la noción de campo funcional y de distancia entre funciones yaparecen de forma implícita algunos de los problemas provocados por la

3

4 INTRODUCCIÓN

no compacidad de los conjuntos cerrados y acotados en espacios infinitodimensionales.

Uno de los problemas que más influyó en la aparición del AnálisisFuncional fue el estudio de las Ecuaciones Integrales. Los trabajos devarios matemáticos en este área llevaron al desarrollo por Fredholm deuna técnica para solucionar algunos de estos problemas que dio lugara lo que hoy conocemos como Alternativa de Fredholm.

A partir de ese momento la situación estaba suficientemente madurapara el comienzo de la cristalización del Análisis Funcional. A principiosdel siglo XX, Hilbert se interesó por los resultados de Fredholm y sededicó al estudio de las ecuaciones integrales, publicando una serie deartículos en los que van apareciendo de forma más o menos explícita lasnociones de autovalor, ortogonalidad de los distintos autoespacios, y lamisma noción de bola unidad de un espacio de Hilbert (obviamente noen esos términos).

En el último de dichos artículos, Hilbert abandona el marco de lasecuaciones integrales y da el salto de abstracción que caracteriza alAnálisis Funcional: intenta desarrollar una teoría abstracta de formasbilineales y cuadráticas de infinitas variables para luego aplicar dichateoría el estudio de las ecuaciones integrales. En el desarrollo de estateoría aparece ya de forma bastante explícita el espacio `2, la convergen-cia débil de sucesiones en `2 y su principio de elección, que en términosmodernos podemos pensar como el Teorema de Eberlein para el casoparticular de `2.

A continuación, en los trabajos de una serie de autores (Frechet,Schmidt, F. Riesz, Fischer entre otros) se fueron desarrollando muchasnociones que hoy son centrales en el Análisis Funcional como la distan-cia en un conjunto abstracto y desde ahí diversas nociones topológicascomo completitud, compacidad, separabilidad, los espacios Lp y `p, elestudio de sus duales y el dual de C[a, b]. En un artículo seminal de F.Riesz en 1918 se desarrolla la Teoría de Operadores Compactos sobreespacios C[a, b], pero el propio Riesz dice que la teoría se puede exten-der a otros espacios funcionales. En ese artículo aparece la definiciónde la norma de C[a, b].

Hemos citado algunos autores y artículos, pero hay muchos más deesa época que hicieron que la situación estuviese madura para la apa-rición en 1922 de la Tesis de Banach, en la que se desarrolla una teoríageneral de espacios normados y operadores lineales entre ellos. Desdeese momento y hasta 1932 el Análisis Funcional vivió una década devertiginoso desarrollo, en la que se sistematizó la aplicación de métodostopológicos al estudio de los espacios de Banach (B-espacios en la no-tación del propio Banach) y se probaron entre otros muchos resultados

1. EL ANÁLISIS FUNCIONAL 5

el Principio de Acotación Uniforme (que ya había aparecido en unaforma más débil en la tesis de Banach), el Teorema de Hahn-Banach yel Teorema de la Aplicación Abierta, tres de los principales resultadosde la asignatura que proponemos.

En esa misma década, von Neumann utiliza la noción de espaciode Hilbert abstracto (ya no exclusivamente `2 o L2) para satisfacer unanecesidad de los físicos de la época: la construcción del lenguaje formaladecuado para la Mecánica Cuántica, que sigue siendo esencialmenteel utilizado hoy en día.

En 1932 el Análisis Funcional alcanza la mayoría de edad con laaparición de los libros Theorie des Operations Lineaires, de Banach,Grundlagen der Quantenmechanik, de von Neumann, y Linear Trans-formations in Hilbert Space, de Stone. Prácticamente todo el contenidode nuestra asignatura (y mucho más) se halla (con otro lenguaje, porsupuesto) en esos libros.

Desde entonces el desarrollo del Análisis Funcional ha sido muyamplio, y no nos atrevemos ni siquiera a incluir aquí un pequeño re-sumen de este, aunque sí nos gustaría mencionar brevemente que lanecesidad de estudiar espacios funcionales no normados dio lugar a laTeoría de Espacios Vectoriales Topológicos y en particular al estudiode los Espacios Localmente Convexos de donde surgió la Teoría de lasDistribuciones que ha tenido tantas aplicaciones en el estudio de lasEcuaciones Diferenciales.

También a lo largo del siglo pasado numerosas áreas de la mate-mática han ido adoptando parte del lenguaje y las herramientas delAnálisis Funcional, debido a su gran potencia.

1.1. Las fuentes. Mencionamos en esta sección los principaleslibros que hemos utilizado en la elaboración de esta memoria, ordenadosde mayor a menor importancia para nuestro proyecto. Dichos libros son[31], [24] (de este libro hay una segunda versión, [21], actualizada ycon más autores, más adecuada como referencia bibliográfica para losalumnos), [13], [33], [8], [15], [16] (estos tres últimos probablementeno sean adecuados para los alumnos por su excesiva complejidad), [39](sólo para Teoría Espectral en espacios de Hilbert), [12] (sólo para elTeorema de Stone-Weierstrass) y los siempre atractivos libros de Rudin[40, 41, 42]. En menor medida hemos usado también [1] (una buenareferencia para los alumnos por exhaustivo), [37], [29], [5], [22], [26],[30] y [44].

Los libros [31] y [24] son excelentes fuentes de ejercicios interesantespara este curso.

Contenidos

Espacios normados. Espacios de Banach.

Norma. Espacios normados. Espacios de Banach. Subespacios. Co-cientes. Normas equivalentes. Lema de Riesz. Compacidad. Series enespacios de Banach. Desigualdades de Hölder y de Minkowski. Espa-cios `p. Breve presentación de la Teoría de Integración de Lebesgue.Espacios Lp[0, 1].

Aplicaciones lineales continuas entre espacios normados.

Aplicaciones lineales continuas. Espacios isométricos e isomorfos.Normas en L(X;Y ). Espacio dual. Hiperplanos y formas lineales.

Teoremas de Hahn-Banach.

Teorema de Hahn-Banach en forma analítica. Forma normante. Es-pacios vectoriales topológicos. Espacios localmente convexos. Seminor-mas. Funcionales sublineales. Conjuntos absorbentes, equilibrados, con-vexos. Teoremas de Hahn-Banach en forma geométrica. Reflexividad.Dual de un espacio cociente. Aplicaciones.

7

8 CONTENIDOS

El Teorema de Baire y sus consecuencias:el Principio de Acotación Uniforme yel Teorema de la Gráfica Cerrada

Teorema de Ascoli-Arzela. Principio de Acotación Uniforme. Teore-ma de Banach-Steinhaus. Gráfica cerrada. Teorema de la Gráfica Cerra-da. Aplicaciones abiertas. Teorema de la Aplicación Abierta. Proyeccio-nes en un espacio de Banach. Subespacios complementados. Teoremade Stone-Weierstrass. Aplicaciones.

Espacios duales y operadores traspuestos.

Espacio dual. Duales de c0 y `p (1 ≤ p <∞). Funciones de variaciónacotada. Dual de C[0, 1]. Duales de Lp[0, 1] (1 ≤ p < ∞). Traspuestode un operador.

Topologías débil y débil∗.

Topología débil. Convergencia débil de sucesiones. Caso finito di-mensional. Formas continuas con la topología débil. Teorema de Mazur.Propiedad de Schur de `1. Topología débil∗. Teorema de Alaoglu. Teo-rema de Goldstine. Reflexividad. Aplicaciones.

Operadores compactos.

Operadores compactos. Operadores de rango finito. Propiedad deideal. Teorema de Schauder. Aproximación de operadores compactospor operadores de rango finito. Operadores completamente continuos.

Teoría espectral de operadores compactos.

Operadores inversibles. Perturbaciones de la identidad inversibles.Espectro de un operador. Autovalores. Compacidad del espectro. Teore-ma de Gelfand. Teoría espectral de operadores compactos. Alternativade Fredholm. Aplicaciones.

CONTENIDOS 9

Espacios de Hilbert.

Producto escalar. Desigualdad de Schwarz. Espacios de Hilbert.Identidad de Polarización. Ortogonalidad. Teorema de Pitágoras. Leydel Paralelogramo. Distancia mínima a un convexo y cerrado. Proyec-ción ortogonal. Complementación. Conjuntos ortogonales. Desigualdadde Bessel. Teorema de Riesz-Fischer. Bases Hilbertianas. Desarrollo enserie de Fourier. Fórmula de Parseval. Dimensión Hilbertiana. Teoremade representación de Riesz. Aplicaciones.

Teoría espectral en espacios de Hilbert:Operadores compactos.

Operador adjunto. Operadores normales y autoadjuntos. Espectrode un operador compacto autoadjunto. Espectro de un operador com-pacto normal. Teorema espectral para operadores compactos normales.Teorema espectral para operadores compactos autoadjuntos. Teoremaespectral para operadores compactos.

Capítulo 1

Espacios normados. Espacios de Banach

La base abstracta del Análisis Funcional consiste en el estudio deEspacios Funcionales. Estos espacios tienen una doble estructura quenos permitirá su estudio. De un lado una estructura algebraica de espa-cio vectorial (habitualmente de dimensión infinita) y de otro lado unaestructura topológica “bien relacionada” con la estructura algebraica.La forma más natural de definir una topología en un espacio vecto-rial, siempre que sea posible, es mediante una distancia asociada a unanorma, y de hecho los primeros espacios funcionales y probablemen-te los más utilizados son espacios normados, cuya definición y estudiointroducimos en este capítulo.

A continuación introducimos la noción de espacio de Banach, puestoque la completitud será una de las herramientas más útiles a nuestradisposición.

En muchas ocasiones necesitaremos estudiar subespacios y cocientesde espacios de Banach y normados, y por ellos vemos aquí que ambosrespetan esas estructuras.

Mediante el Lema de Riesz probamos la no compacidad de la bolaunidad de los espacios de dimensión infinita. Este es uno de los leit-motiv del Análisis Funcional, puesto que buena parte de las técnicasque estudiaremos van precisamente destinadas a remedar dicha faltade compacidad. Estudiamos también la compacidad en el caso finito-dimensional, lo que nos da pie a hablar de normas equivalentes, quevolverán a aparecer más adelante cuando hablemos de isomorfismosentre espacios de Banach.

Los espacios de Banach habitualmente llamados clásicos son C(K),c0, los `p y los Lp. C(K) es fácil de definir. La construcción de los `p essencilla una vez probada la desigualdad de Hölder, útil por sí mismaen muchas ocasiones.

Puesto que nuestros alumnos previsiblemente no conocerán Teo-ría de la Medida, no podemos abordar la construcción de los espaciosLp(µ) en general. Sin embargo, no creemos adecuado enseñar AnálisisFuncional sin hablar al menos de los espacios Lp[0, 1]. Dado que nopodemos estar seguros de que nuestros alumnos conozcan la Teoría de

11

12 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

la Integración de Lebesgue, y dado que una presentación rigurosa deesta nos llevaría demasiado tiempo, hemos decidido incluir en este ca-pítulo una presentación de dicha teoría escueta y sin demostraciones,pero suficiente para poder construir los espacios Lp[0, 1] y demostrarsu completitud.

Para la preparación de este capítulo hemos seguido sobre todo [24],[31] y [13]. La exposición de la Teoría de la Integración de Lebesguese basa principalmente en [40] y [42].

Espacios normados y espacios de Banach

Empezamos recordando la definición de norma de un espacio vec-torial.

Definición 1.1. Sea X un espacio vectorial sobre R o C. Unafunción || · || : X −→ [0,+∞) es una norma en X si:

1. ||x|| = 0 si y sólo si x = 0.2. ||λx|| = |λ| ||x||, para todo x ∈ X y λ ∈ R ( ó C).3. ||x+ y|| ≤ ||x||+ ||y||, para todos x, y ∈ X.

Un espacio vectorial con una norma (X, ||·||) es un espacio vectorialnormado.

Veremos a lo largo de la asignatura que la completitud juega unimportante papel en muchos de los razonamientos característicos delAnálisis Funcional, por lo que habitualmente trabajaremos con espaciosnormados y completos. Esta es precisamente la definición de un Espaciode Banach llamados así porque fue Stefan Banach quien comenzó suestudio sistemático en [6] y sobre todo en [7].

Dado un espacio vectorial normado (X, ‖ · ‖), automáticamenteposee una estructura natural de espacio métrico, donde la métricad : X ×X −→ [0,+∞) viene dada por

d(x, y) = ‖x− y‖

para todos x, y ∈ X. Es fácil ver que, así definida, d es efectivamenteuna distancia. Para comprobar la propiedad triangular, observamos que

d(x, z) = ‖x−z‖ = ‖x−y+y−z‖ ≤ ‖x−y‖+‖y−z‖ = d(x, y)+d(y, z)

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 13

Dos observaciones son importantes: en primer lugar, observar quela norma es uniformemente continua, dado que

|‖x‖ − ‖y‖| ≤ ‖x− y‖(Para demostrar esto, nótese que

‖x‖ = ‖x− y + y‖ ≤ ‖x− y‖+ ‖y‖y por tanto

‖x‖ − ‖y‖ ≤ ‖x− y‖.Análogamente se tiene que

‖y‖ − ‖x‖ ≤ ‖x− y‖.)En segundo lugar es muy importante notar que la norma dota a

X de una topología “bien relacionada” con su estructura vectorial, enel sentido de que tanto la suma como el producto por escalares soncontinuos. Veámoslo.

Sea ε > 0. Entonces dados x, y ∈ X, para todos z1 ∈ B(x, ε2),

z2 ∈ B(y, ε2),

‖z1+z2−(x+y)‖ = ‖x+z1−x+y+z2−y−x−y‖ ≤ ‖z1−x‖+‖z2−y‖ = ε.

Análogamente, dados x ∈ X, k ∈ K (R ó C), entonces tomandopor ejemplo

δ1 = mın ε

3‖x‖,

√ε√3, δ2 = mın ε

3|k|,

√ε√3

se tiene que, para todos α ∈ B(k, δ1) z ∈ B(x, δ2),

‖αz − kx‖ = ‖(k + α− k)(x+ z − x)− kx‖ ≤ ε.

De aquí se sigue que la topología definida por la norma viene ca-racterizada por los entornos del origen.

Ejemplo 1.2. 1. Ya se han estudiado en cursos anteriores nor-mas en espacios finito dimensionales. En particular se sabe que

`ni := (Kn, ‖ · ‖i)es un espacio de Banach para i = 1, 2,∞ con las definicioneshabituales. Mas adelante veremos que se sigue de la desigualdadde Minkowsky que `np es un espacio de Banach para todo 1 ≤p ≤ ∞.

2. Dado un conjunto T , podemos definir B(T ) como el espacio delas funciones escalares acotadas definidas sobre T . Se ve fácil-mente que la norma del supremo ‖ · ‖∞ definida como

‖f‖∞ = supx∈T|f(x)|

14 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

es efectivamente una norma en B(T ). Veamos que con esta nor-ma B(T ) es un espacio de Banach.

Sea (fn)n∈N ⊂ B(T ) una sucesión de Cauchy. Entonces paracada x ∈ T la sucesión (fn(x))n∈N también es de Cauchy. Portanto existe el lımn fn(x). Definimos entonces la función f :T −→ K como

f(x) = lımnfn(x)

Por ser la sucesión (fn) de Cauchy en la norma del supremo,se tiene que la sucesión está uniformemente acotada, y por tantof está acotada. Sólo nos falta ver que fn tiende a f en la normadel supremo. Sea ε > 0. Entonces existe n0 ∈ N tal que paratodos n,m ≥ n0 ‖fn − fm‖ < ε. Sea ahora x ∈ T . Sabemos queexiste m ≥ n0 tal que |f(x)− fm(x)| < ε. Entonces

|f(x)− fn0(x)| ≤ |f(x)− fm(x)|+ |fm(x)− fn0(x)| ≤ 2ε.

Nótese que para cada x ∈ T m puede variar, pero siempre existealgún m ≥ n0 para el que se tiene el resultado, y por tanto

lımn‖f − fn‖∞ = 0.

La demostración es interesante no tanto por el resultado ensí mismo, sino porque esta es a menudo la técnica seguida paraverificar que un espacio normado es completo: se parte de unasucesión de Cauchy, se encuentra un candidato a límite (a me-nudo, como aquí, utilizando la completitud de los escalares), yluego se verifica que (1) el candidato a límite está en el espa-cio, y (2) la sucesión converge efectivamente a ese límite en lanorma del espacio.

3. Sea K un espacio compacto de Hausdorff. Definimos C(K) co-mo el espacio de las funciones f : K −→ K continuas, dotadode la norma del supremo, ‖ · ‖∞. Se ve igual que en el ejemploanterior que ‖ · ‖∞ es una norma. Veamos que con esta normaC(K) es un espacio de Banach: dado que C(K) es un subespaciovectorial de B(K), las funciones acotadas sobre K, puesto queya hemos visto que B(K) es completo sólo es necesario demos-trar que C(K) es un subespacio cerrado de B(K). Sea entonces(fn) ⊂ C(K) una sucesión tal que fn → f ∈ B(K). Sólo hayque ver que f es continua. Esto es un ejercicio de topología,demostrar que el límite uniforme de funciones continuas es unafunción continua. Lo detallamos: Sea ε > 0. Existe n0 ∈ N talque para todo n ≥ n0

‖fn − f‖ < ε.

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 15

Sea ahora t0 ∈ K. Existe un entorno V de t0 tal que para todot ∈ V

|fn0(t0)− fn0(t)| < ε.

Entonces, para todo t ∈ V|f(t)− f(t0)| ≤ |f(t)− fn0(t)|+ |fn0(t)− fn0(t0)|+

+|fn0(t0)− f(t0)| ≤ 3ε

y por tanto f es continua.4. Veremos más adelante que siempre que podamos definir un pro-

ducto escalar 〈·, ·〉 en X, éste define una norma en X mediante

‖x‖2 = 〈x, x〉.Los espacios de Banach cuya norma procede de un productoescalar se llaman espacios de Hilbert. Su importancia justificaque se estudien en un capítulo aparte.

Sabemos del estudio de los espacios vectoriales la importancia quetiene, dado un espacio vectorial, el estudio de sus subespacios y susespacios cocientes. Por tanto, resulta también importante ver cómoambos heredan la estructura de espacio de Banach del espacio original.

Proposición 1.3. Sea (X, ‖·‖) un espacio vectorial normado y seaY un subespacio vectorial de X. Entonces tanto Y como su clausuraY son espacios normados con la norma heredada. Además, si X es unespacio de Banach Y también lo es.

Demostración. Nótese primero que dado que la suma y el pro-ducto por escalares son continuos para la norma, Y es efectivamenteun subespacio vectorial de X: Veamos por ejemplo que Y está cerradopara la suma: Sean x, y ∈ Y , y sea ε > 0. Existen x′, y′ ∈ Y tales que‖x′ − x‖ ≤ ε, ‖y′ − y‖ ≤ ε. Entonces x′ + y′ ∈ Y y

‖x′ + y′ − (x+ y)‖ ≤ 2ε.

Es trivial que ‖ · ‖ induce una norma tanto en Y como en Y . Además,si X es un espacio de Banach entonces Y es un subespacio cerrado deun espacio completo, y por tanto él mismo es completo.

Proposición 1.4. Sea (X, ‖·‖) un espacio vectorial normado y seaY ⊂ X un subespacio vectorial cerrado. Dado [x] ∈ X/Y , definimos

‖|[x]‖| = ınfy∈Y‖x+ y‖.

Entonces ‖| · ‖| es una norma en X/Y llamada la norma cociente.Además si X es un espacio de Banach entonces X/Y también es unespacio de Banach.

16 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Demostración. Sea x ∈ X. Claramente ‖|[x]‖| ≥ 0. Si ‖|[x]‖| = 0entonces existe una sucesión (yn)n ⊂ Y tal que

‖x− yn‖ <1

n.

Entonces yn → x y como Y es cerrado se tiene que x ∈ Y , luego [x] = 0.Para ver la desigualdad triangular, sean x1, x2 ∈ X y sean y1, y2 ∈ Y

tales que‖x1 + y1‖ < ‖|[x1]‖|+ ε

y

‖x2 + y2‖ < ‖|[x2]‖|+ ε.

Entonces

‖|[x1]+[x2]‖| = ‖|[x1+x2]‖| = ınfy∈Y‖x1+x2+y‖ ≤ ‖x1+x2+y1+y2‖ ≤

≤ ‖x1 + y1‖+ ‖x2 + y2‖ < ‖|[x1]‖|+ ‖|[x2]‖|+ 2ε

y como esto es cierto para todo ε > 0 se sigue la propiedad triangular.Finalmente, si x ∈ X y 0 6= k ∈ K, se tiene

‖|k[x]‖| = ‖|[kx]‖| = ınfy∈Y‖kx+ y‖ = ınf

y∈Y|k|∥∥∥x+

y

k

∥∥∥ =

= |k| ınfy∈Y‖x+ y‖ = |k|‖|[x]|‖,

y por tanto ‖| · |‖ es una norma en X/Y .

Veamos finalmente que si X es un espacio de Banach entonces X/Ytambién lo es. Sea ([xn])n∈N ⊂ X/Y una sucesión de Cauchy. Elijamosuna subsucesión (nk)k tal que

‖|[xnk ]− [xnk+1]|‖ < 2−k.

Como‖[xn1 ]− [xn2 ]‖ = ‖[xn1 − xn2 ]‖ <

1

2,

se tiene que existe yn2 ∈ Y tal que

‖xn1 − (xn2 + yn2)‖ <1

2.

A continuación, puesto que

‖[xn2 ]− [xn3 ]‖ = ‖[xn2 − xn3 ]‖ <1

4,

existe yn3 ∈ Y tal que

‖(xn2 + yn2)− (xn3 + yn3)‖ <1

4.

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 17

Continuando el proceso se tiene la existencia de una sucesión (ynk)k ∈ Ytal que

‖(xnk + ynk)− (xnk+1+ ynk+1

)‖ < 2−k

y por tanto podemos elegir los representantes xnk de manera que

‖xnk − xnk+1‖ < 2−k.

De aquí se sigue que (xnk)k es de Cauchy en X y por la completitudde X existe x ∈ X tal que xnk tiende a x. Como

‖[xnk ]− [x]‖ = ‖[xnk − x]‖ ≤ ‖xnk − x‖

se sigue que [xnk ]→ [x] y por ser ([xn])n de Cauchy se tiene finalmenteque [xn]→ [x]

Observación 1.5. A la hora de pensar en la norma cociente, es amenudo útil darse cuenta de que

‖[x]‖ = ınfy∈Y‖x+ y‖ = ınf

y∈Y‖x− y‖ = dist(x, Y ).

Queremos estudiar la compacidad de los subconjuntos de espaciosnormados. Empecemos recordando la situación en dimensión finita.Previamente necesitamos la noción de normas equivalentes, que vol-verá a aparecer más adelante.

Definición 1.6. Sea X un espacio vectorial. Dadas dos normas‖·‖1 y ‖·‖2 sobre X, decimos que son equivalentes si inducen la mismatopología.

Proposición 1.7. Dos normas ‖·‖1 y ‖·‖2 sobre X son equivalentessi y sólo si existen dos constantes c, C ∈ (0,+∞) tales que, para todox ∈ X

c‖x‖1 ≤ ‖x‖2 ≤ C‖x‖1Demostración. Supongamos que existen c, C como en el enun-

ciado. Sea x0 ∈ X y ε > 0. Entonces

B1(x0,ε

C) ⊂ B2(x0, ε)

yB2(x0, cε) ⊂ B2(x0, ε)

lo que muestra que las dos topologías son equivalentes.

18 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Recíprocamente, supongamos que las dos topologías son equivalen-tes. Por tanto el conjunto B1(0, 1) es un entorno abierto del 0 en latopología dada por la norma 2, y por ello existe r > 0 tal que

B2(0, r) ⊂ B1(0, 1).

De aquí se sigue que, para todo x ∈ X,

‖x‖1 ≤ r−1‖x‖2.

La otra desigualdad se obtiene análogamente.

Sea X un espacio vectorial en el que hay definidas dos normasequivalentes ‖ · ‖1 y ‖ · ‖2. Entonces la aplicación identidad

Id : (X, ‖ · ‖1) −→ (X, ‖ · ‖2)

es lineal, continua, biyectiva, y su inversa también es lineal y continua,como se ve al principio del Capítulo 3. Dos espacios normados entrelos que podemos establecer una aplicación con esas características sedicen isomorfos.

Proposición 1.8. Sea X un espacio vectorial de dimensión finita.Entonces dos normas cualesquiera en X son equivalentes.

Demostración. Suponemos X = Kn y consideramos en el la nor-ma 1 ‖ · ‖1 y otra norma cualquiera ‖ · ‖. Si (ei)

ni=1 es la base canónica

de Kn, se tiene

‖x‖ =∥∥∥∑xiei

∥∥∥ ≤∑ |xi|‖ei‖ ≤(

maxi‖ei‖

)‖x‖1.

Esto nos da una de las desigualdades buscadas y nos dice que

Id : (X, ‖ · ‖1) −→ (X, ‖ · ‖)

es continua, de donde ‖ · ‖ es una función continua sobre (X, ‖ · ‖1).Puesto que S(X,‖·‖1) es un compacto (probamos este hecho más adelan-te), la función ‖ · ‖, que es estrictamente positiva en S(X,‖·‖1) alcanzasu mínimo ahí al que llamamos δ y se tiene δ > 0. Por tanto

‖ · ‖1 ≤1

δ‖ · ‖

que era la otra desigualdad buscada.Sólo resta por tanto comprobar que efectivamente S(X,‖·‖1) es un

compacto. Consideremos la sucesión (xk)k∈N ⊂ S(X,‖·‖1) donde paratodo k ∈ N

xk = (x1k, . . . , xnk).

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 19

Se tiene que ‖xk‖ =∑n

i=1 |xik| = 1 y por tanto para todo 1 ≤ i ≤ n lasucesión (xik)k∈N está acotada. Podemos entonces, tomando subsucesio-nes repetidas veces, extraer una sucesión de índices (kl)l∈N de maneraque para todo 1 ≤ i ≤ n la sucesión (xikl)l∈N converge a xi. Entonces

lıml→∞

n∑i=1

|xikl − xi| = 0

y por tanto, llamando x = (x1, . . . , xn), se tiene quelıml→∞‖xkl − x‖1 = 0.

Además, puesto que xkl ∈ S(X,‖·‖1) para todo l, se tiene que x ∈ S(X,‖·‖1),de donde se concluye que efectivamente S(X,‖·‖1) es compacto.

Corolario 1.9. Si X es un espacio normado e Y ⊂ X es unsubespacio de dimensión finita, entonces Y está cerrado en X

Demostración. Y es un espacio de dimensión finita (digamos n)con la norma heredada de X. Por el teorema anterior esta norma esequivalente a, por ejemplo, la norma del supremo, de manera que Yes (isomorfo a) `n∞. Sabemos que este espacio es completo (esto estásugerido como ejercicio). La completitud no se conserva por homeo-morfismos, pero sí se mantiene por homeomorfismos uniformementecontinuos. Se verá al principio del siguiente capítulo (y de hecho es unejercicio muy simple) que las aplicaciones lineales continuas son uni-formemente continuas. Por tanto Y ⊂ X es completo y se tiene que Ydebe ser cerrado en X.

El Teorema de Heine-Borel nos dice que los subconjuntos cerradosy acotados de Kn (con cualquiera de sus normas equivalentes) son com-pactos. Para probar la falsedad de este resultado en el caso de espaciosde dimensión infinita necesitamos un resultado interesante en sí mismo.

Teorema 1.10 (Lema de Riesz, F. Riesz 1918). Sea X un espacionormado y sea Y ⊂ X un subespacio vectorial cerrado propio. Entoncespara todo 0 ≤ r < 1 existe xr ∈ SX tal que

r < dist(xr, Y ) ≤ 1.

Demostración. Sea [z] ∈ X/Y tal que 1 > ‖[z]‖ > r. Sea ahoraun z ∈ [z] (es decir, un representante de [z]) tal que ‖z‖ ≤ 1 y seaxr = z

‖z‖ . Entonces se tiene que

dist(xr, Y ) =dist(z, Y )

‖z‖=‖[z]‖‖z‖

≥ ‖[z]‖ > r.

20 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

El siguiente teorema es ahora fácil de probar

Teorema 1.11. Sea (X, ‖ · ‖) un espacio normado. Entonces sonequivalentes:

1. Todo conjunto cerrado y acotado de X es compacto2. BX es compacto3. X tiene dimensión finita

Demostración. Claramente (1) implica (2). Para ver que (2) im-plica (3), supongamos que X es de dimensión infinita. Usando el Le-ma de Riesz e inducción construimos una sucesión (xn) ⊂ SX tal quedist(xnspanx1, . . . , xn−1) > 1

2para todo n ∈ N. Entonces, para todo

n 6= m, dist(xn, xm) > 12, por lo que la sucesión (xn) no puede tener

subsucesiones convergentes.Veamos finalmente que (3) implica (1). Supongamos que dimX =

m, sea E ⊂ X un conjunto cerrado y acotado y sea (xn)n ⊂ E. Seae1, . . . , em una base de X y para todo n ∈ N sea xn = α1

ne1 +· · · + αmn e

m. Usando que (xn)n ⊂ E y que E está acotado es fácil verque para todo 1 ≤ i ≤ m la sucesión (αin)n ⊂ K está acotada. Así,existe una subsucesión (nl)l tal que para todo 1 ≤ i ≤ m la sucesión(αinl)l tiende a αi ∈ K cuando l tiende a infinito. Entonces xnl tiende ax = α1e1 + · · ·+ αnen (esto se puede ver estableciendo un isomorfismoentre X y `n1 , o `n∞, que lleve los ei a los elementos de la base canónica).Por ser E cerrado, se tiene que x ∈ E y con eso acabamos.

Continuamos el capítulo dando una caracterización a menudo útilde los espacio de Banach en términos de la convergencia de series.En [16, Chapter 1. Notes and Remarks] aparece una gran cantidadde información acerca de resultados profundos aunque elementales ensu formulación relacionados con la sumabilidad en espacios normados,incluso en espacios finito-dimensionales.

Dado un espacio normado y una sucesión (xn) ⊂ X, podemos definirla serie

∑∞n=1 xn como

∞∑n=1

xn = lımm→∞

m∑n=1

xn,

al igual que hacíamos con las series numéricas. Si ese límite existey vale x, decimos que la serie es convergente. Decimos que la serie∑

n xn es absolutamente convergente si la serie numérica∑∞

n=1 ‖xn‖converge. Parece obvio que la convergencia absoluta debería implicar

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 21

la convergencia en norma de X. El problema podría ser la completitud.De hecho, se tiene

Teorema 1.12. Un espacio normado X es completo si y sólo sitoda serie absolutamente convergente es convergente.

Demostración. Supongamos que X es un espacio de Banach ysea

∑n xn una serie absolutamente convergente. Entonces, dado ε > 0

existe n0 ∈ N tal que para todos p, q ≥ n0

q∑n=p

‖xn‖ < ε.

Por tanto, llamando sm =∑m

n=1 xn, tenemos

‖sp − sq‖ =

∥∥∥∥∥q∑

n=p+1

xn

∥∥∥∥∥ ≤q∑

n=p+1

‖xn‖ < ε.

Es decir, (sm)m∈N es una sucesión de Cauchy y por tanto (sm) convergea x ∈ X, ya que X es un espacio de Banach.

Recíprocamente, supongamos que toda serie absolutamente conver-gente es convergente, y sea (xn) ⊂ X una sucesión de Cauchy. Veamosque (xn) tiene una subsucesión convergente. Empezamos construyendoinductivamente una subsucesión (xnm)m ⊂ (xn)n: Sea n1 ∈ N tal que,para todo n ≥ n1,

‖xn1 − xn‖ ≤ 2−1.

Supuestos ya elegidos n1 < n2 < · · · < nm−1, elegimos nm de maneraque nm > nm−1 y tal que, para todo n ≥ nm,

‖xn − xnm‖ ≤ 2−m.

Definimos además xn0 = 0 y definimos ahora la sucesión (yi)i∈N como

yi = xni − xni−1.

Entonces

xnm =m∑i=1

yi

y‖yi‖ = ‖xni − xni−1

‖ ≤ 2−(i−1).

Por tanto la serie∑

i yi es absolutamente convergente y, por hipótesis,convergente. Es decir

∑i yi converge a x ∈ X. Puesto que xnm =∑m

i=1 yi, tenemos que xnm converge a x y, por ser (xn) de Cauchy, deaquí se sigue que xn converge a x, y por tanto X es completo.

22 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

La construcción de los `p

Los espacios de Banach clásicos son los `p, los Lp y los espaciosC(K). Vamos a ver que los `p son espacios de Banach. Los espaciosC(K) ya están estudiados en el ejemplo 1.2 y el estudio de los Lp loharemos si los alumnos ya saben teoría de la medida, o si finalmente lesenseñamos la integral de Lebesgue. Para definir los espacios `p y com-probar que son espacios normados necesitamos primeramente estudiarlas desigualdades de Hölder y de Minkowski.

Primeramente necesitamos un lema.

Lema 1.13. Sean a ≥ 0, b ≥ 0, p, q ∈ (1,∞) tales que 1p

+ 1q

= 1.Entonces

ab ≤ ap

p+bq

q.

Demostración. Sea b > 0 y definamos la función

ϕ(a) =ap

p+bq

q− ab

Es fácil ver que ϕ′(a) > 0 si a > bq−1 y que ϕ′(a) < 0 si 0 < a < bq−1.Por tanto ϕ alcanza su mínimo en a = bq−1 y ϕ(bq−1) = 0. De ahí sesigue que

ϕ(a) =ap

p+bq

q− ab ≥ 0 para todo a ≥ 0

y por lo tanto

ab ≤ ap

p+bq

q.

Teorema 1.14 (Desigualdad de Hölder). Sean (ak)mk=1, (bk)

mk=1 ⊂

R, dos sucesiones finitas de términos positivos, y sean p, q ∈ (1,∞) dosnúmeros tales que 1

p+ 1

q= 1. Entonces

m∑k=1

akbk ≤

(m∑k=1

apk

) 1p(

m∑k=1

bqk

) 1q

.

Demostración. Podemos suponer que ak 6= 0 6= bk para todo k.Entonces, para todo 1 ≤ k ≤ m definimos

Ak =ak(∑mj=1 a

pj

) 1p

y Bk =bk(∑mj=1 b

pj

) 1p

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 23

y observamos quem∑k=1

Apk =m∑k=1

Bpk = 1

Usando el Lema 1.13 tenemos que

AkBk ≤Apkp

+Bqk

q

y sumando esta desigualdad para todo k tenemos quem∑k=1

AkBk ≤1

p

m∑k=1

Apk +1

q

m∑k=1

Bqk =

1

p+

1

q= 1,

y por tantom∑k=1

ak(∑mj=1 a

pj

) 1p

· bk(∑mj=1 b

pj

) 1p

≤ 1

lo que termina la demostración.

Teorema 1.15 (Desigualdad de Minkowski). Sean dos sucesiones(ak)

nk=1, (bk)

nk=1 tales que, para todo k, ak ≥ 0 y bk ≥ 0, y sea 1 < p <

∞. Entonces(n∑k=1

(ak + bk)p

) 1p

(n∑k=1

apk

) 1p

+

(n∑k=1

bpk

) 1p

Demostración. Si p = 1 el resultado es trivial. Sea 1 < p <∞ ysea q ∈ (1,∞) tal que 1

p+ 1

q= 1. Entonces, usando la desigualdad de

Hölder y el hecho de que (p− 1)q = p tenemosn∑k=1

(ak + bk)p =

n∑k=1

(ak + bk)p−1(ak + bk) =

=n∑k=1

(ak + bk)p−1ak +

n∑k=1

(ak + bk)p−1bk ≤

(n∑k=1

(ak + bk)(p−1)q

) 1q (∑

apk

) 1p

+

+

(n∑k=1

(ak + bk)(p−1)q

) 1q (∑

bpk

) 1p

=

24 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

=

(n∑k=1

(ak + bk)p

) 1q (∑

apk

) 1p

+

(n∑k=1

(ak + bk)p

) 1q (∑

bpk

) 1p

Dividiendo todo por (∑n

k=1(ak + bk)p)

1q , tenemos que(

n∑k=1

(ak + bk)p

) 1p

=

(n∑k=1

(ak + bk)p

)1− 1q

≤(∑

apk

) 1p

+(∑

bpk

) 1p

como queríamos comprobar.

El caso p = 1 de las desigualdades de Hölder y Minkowski se dejacomo ejercicio.

Con esto ya podemos definir los espacios `p, `np y comprobar queson espacios de Banach.

Definición 1.16. Definimos `n∞ como el espacio vectorial n dimen-sional de las n-uplas de números reales o complejos (Rn ó Cn) dotadocon la norma del supremo ‖·‖∞, donde para todo x = (x1, . . . , xn) ∈ Rnó Cn, su norma del supremo se define como:

‖x‖∞ = maxi|xi|

Sobre el mismo espacio vectorial Rn o Cn podemos definir otrasnormas. En particular tenemos

Definición 1.17. Sea 1 ≤ p < ∞. Definimos `np como el espaciovectorial Rn ó Cn dotado con la norma p ‖ · ‖p, definida como:

‖x‖p =

(n∑i=1

|xi|p) 1

p

Observación 1.18. Es sencillo ver que ‖·‖p verifica las propiedades(1) y (2) de la definición de norma. La propiedad (3) (la desigualdadtriangular) es precisamente la desigualdad de Minkowski.

Es interesante representar las distintas bolas unidad de los espacios`2p para hacerse una idea de las distintas geometrías de estos espacios.

En los ejercicios veremos que los espacios normados finito dimen-sionales son completos, por lo que en particular `np es un espacio deBanach para todo 1 ≤ p ≤ ∞ y para todo n ∈ N.

Análogamente podemos definir los espacios `p (1 ≤ p ≤ ∞).

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 25

Definición 1.19. Sea 1 ≤ p < ∞. Definimos `p como el espaciovectorial de las sucesiones x := (xi)i∈N de números (reales o complejos)tales que

∑∞i=1 |xi|p <∞, dotado con la norma p definida por

‖(xi)‖p =

(∞∑i=1

|xi|p) 1

p

.

Observación 1.20. Para ver que `p está bien definido es necesariover que efectivamente es un espacio vectorial y que ‖ · ‖ : `p −→ [0,∞)es efectivamente una norma. Veamóslo. La única dificultad reside encomprobar que, si (xi), (yi) ∈ `p, entonces (xi) + (yi) ∈ `p y ‖(xi) +(yi)‖p ≤ ‖(xi)‖p + ‖(yi)‖p:

Para todo n ≤ m, usando la desigualdad de Minkowski, se tiene(n∑i=1

|xi + yi|p) 1

p

(n∑i=1

|xi|p) 1

p

+

(n∑i=1

|yi|p) 1

p

(m∑i=1

|xi|p) 1

p

+

(m∑i=1

|yi|p) 1

p

Así pues, dejando tender m a infinito se tiene que(n∑i=1

|xi + yi|p) 1

p

≤ ‖(xi)‖p + ‖(yi)‖p

para todo n ∈ N, de forma que, al dejar que n tienda a infinito tenemoslo buscado.

Definición 1.21. Definimos `∞ como el espacio vectorial de las su-cesiones acotadas x := (xi)i∈N de números (reales o complejos), dotadocon la norma del supremo ‖ · ‖∞ definida por

‖(xi)‖∞ = supi∈N|xi|.

Se ve fácilmente que `∞ está bien definido, es decir, que es un espaciovectorial y que ‖ · ‖∞ es en efecto una norma.

El espacio `∞ es “muy grande” y tienen gran importancia sus si-guientes subespacios cerrados.

Definición 1.22. Definimos c como el espacio vectorial de las su-cesiones convergentes x := (xi)i∈N de números (reales o complejos),dotado con la norma del supremo ‖·‖∞, y definimos c0 como el espaciovectorial de las sucesiones x := (xi)i∈N convergentes a cero de números(reales o complejos), dotado de nuevo con la norma del supremo.

26 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Todos los espacios definidos anteriormente son espacios de Banach.Ese es el contenido de la siguiente proposición.

Proposición 1.23. Sea 1 ≤ p ≤ ∞. Entonces `p es un espacio deBanach. Además c y c0 también son espacios de Banach.

Demostración. Veamos primero el caso 1 ≤ p < ∞. Considere-mos (xn)n∈N ⊂ `p una sucesión de Cauchy, donde xn = (xni )i. Dadoε > 0 existe n0 ∈ N tal que para todo n,m ≥ n0

‖xn − xm‖ < ε, es decir

(∞∑i=1

|xni − xmi |p) 1

p

< ε.

En particular, para todo i ∈ N, se tiene que |xni − xmi | < ε, y portanto (xni )n ⊂ K es una sucesión de Cauchy. Usando la completitudde K tenemos que para todo i ∈ N existe xi ∈ K tal que xni → xicuando n tiende a ∞. Con esto ya tenemos el candidato a límite, quees x = (xi)i∈N. Veamos que x ∈ `p y que xn tiende a x en `p. Paralo primero, por ser (xn)n una sucesión de Cauchy, sabemos que estáacotada, y por tanto existe C > 0 tal que, para todo n ∈ N, ‖xn‖pp ≤ Ces decir

∞∑i=1

|xni |p ≤ C.

Entonces, para todos j, n ∈ N se tiene quej∑i=1

|xni |p ≤ C.

Tomando límites cuando n tiende a infinito, se tiene quej∑i=1

|xi|p ≤ C,

y dejando ahora que j tienda a infinito tenemos que

∞∑i=1

|xi|p ≤ C

y por tanto x ∈ `p.Veamos finalmente que xn tiende a x en ‖·‖p. Sea ε > 0. Sea n0 ∈ N

tal que, para todo n,m ≥ n0,

‖xn − xm‖p < ε.

Entonces, para todo j ∈ N tenemos que

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 27

(j∑i=1

|xni − xmi |p) 1

p

< ε.

Fijando j ∈ N, eligiendo n ≥ n0 y dejando que m tienda a infinitoobtenemos que(

j∑i=1

|xni − xi|p) 1

p

< ε para todo j ∈ N, n ≥ n0.

Dejando ahora que j tienda a infinito, obtenemos que(∞∑i=1

|xni − xi|p) 1

p

< ε para todo n ≥ n0

y por tanto xn tiende a x en `p.

Para ver que `∞ es Banach, basta notar que `∞ = B(N), el conjuntode las funciones acotadas

f : N −→ K.Ya hemos visto en el Ejemplo 1.2 que ese espacio es completo. También,si los alumnos conocen suficiente topología, se puede ver que `∞ =C(βN), las funciones continuas sobre la compactificación de Stone-Cechde N con la métrica usual. También en el Ejemplo 1.2 vimos que esteespacio es un espacio de Banach.

Veamos finalmente que c y c0 son espacios de Banach. Puesto queambos son subespacios de `∞ y este es completo, sólo tenemos que verque ambos son cerrados en `∞. Lo vemos para c, el caso de c0 es algomás sencillo y se deja como ejercicio.

Sea (xn)n∈N ⊂ c una sucesión tal que xn tiende a x ∈ `∞. Hemosde ver que x ∈ c. Para todo n ∈ N sea ln = lımi→∞ x

ni . Veamos que

(ln)n es una sucesión de Cauchy. Sea ε > 0. Existe n0 ∈ N tal que, paratodos n,m ≥ n0 se tiene

‖xn − xm‖∞ < ε.

Entonces para todo i ∈ N|xni − xmi | < ε.

Fijando n,m ≥ n0 y dejando que i tienda a infinito obtenemos que

|ln − lm| < ε.

28 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Por tanto (ln)n es una sucesión de Cauchy y existe l ∈ K tal que (ln)tiende a l. Veamos que lımi→∞ xi = l: sea ε > 0. Existe n0 ∈ N tal quepara todo n ≥ n0

‖xn − x‖ < ε y |ln − l| < ε.

Además existe j ∈ N tal que para todo i ≥ j

|xn0i − ln0| < ε.

Entonces, para todo i ≥ j

|xi − l| ≤ |xi − xn0i |+ |x

n0i − ln0 |+ |ln0 − l| ≤ 3ε

y por tanto xi tiende a l y x ∈ c.

La construcción de los Lp[0, 1]

Puesto que es posible que nuestros alumnos no conozcan la inte-gral de Lebesgue, incluimos en esta memoria una breve descripción sindemostraciones de los resultados básicos de la Teoría de la Integral deLebesgue. Creemos que debería ser posible explicar en una o dos ho-ras los resultados de esta Teoría necesarios para poder construir losespacios Lp[0, 1].

Comenzamos con una definición

Definición 1.24. Sea Ω un conjunto y sea F ⊂ P(Ω) una colecciónde subconjuntos de Ω. Decimos que F es una σ-álgebra si

1. Ω ∈ F .2. Si A ∈ F entonces también su complementario Ac ∈ F .3. Si (An)n∈N ⊂ F entonces

∪n∈NAn ∈ F .

Se sigue de la definición que si F es una σ-álgebra y A,B ∈ Fentonces A \B ∈ F , y si (An)∞n=1 ⊂ F entonces también ∩∞n=1An ∈ F .

Se puede demostrar que dada T ⊂ P(Ω) una familia de subconjun-tos de Ω, existe una σ-álgebra mínima (en el sentido de la inclusión) quecontiene a T . A esta σ-álgebra la denominamos la σ-álgebra generadapor T , y la escribimos σ(T ).

No pretendemos desarrollar una Teoría de la Medida abstracta, sinosimplemente definir y justificar parcialmente los resultados principalesde la Teoría de la Medida de Lebesgue. Por lo tanto, de ahora enadelante consideraremos Ω = [0, 1] (todo es totalmente análogo paracualquier otro intervalo cerrado y acotado [a, b] ⊂ R) y la σ-álgebra que

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 29

consideraremos será B, la σ-álgebra generada por los conjuntos abiertosde [0, 1]. A B se le denomina habitualmente la σ-álgebra de Borel.

Un par (Ω,F), formado por un espacio y una σ-álgebra definidasobre él se denomina un espacio de medida. Nuestro espacio de medidaserá siempre ([0, 1],B).

Definición 1.25. Dado ([0, 1],B), un conjunto A ⊂ [0, 1] se dicemedible si A ∈ B.

En Teoría de la Medida es conveniente a menudo definir funcionescon valores en la recta real ampliada R = R ∪ −∞ ∪ +∞ ó en[0,∞]. En el caso complejo, diremos que una función toma valores enC si f es de la forma f = g + ıh, y tanto g como h toman valores enR. Finalmente, si queremos denotar una función que toma valores enR o C, según el cuerpo sobre el que estemos trabajando, diremos quef toma valores en K. Esta notación no es estándar, pero creemos quesimplifica algo la escritura de varios de los resultados siguientes.

Definición 1.26. Una función f : [0, 1] −→ R se dice mediblesi para todo conjunto abierto A ⊂ R y para todo a ∈ R se tiene quef−1(A), f−1([−∞, a)) y f−1((a,+∞]) son medibles.

Definición 1.27. Una función f : [0, 1] −→ C se dice medible sif = g + ıh, con f, g : [0, 1] −→ R funciones medibles.

Se tiene la siguiente proposición que no demostraremos.

Proposición 1.28. Sea (fn)n∈N una sucesión de funciones fn :[0, 1] −→ R medibles. Entonces

1. g = supn fn y h = lım supn fn son medibles.2. Si lımn fn(t) = f(t) para todo t ∈ [0, 1] entonces f es medible.3. Si f, g : [0, 1] −→ R son medibles entonces las funciones maxf, g

y mınf, g son medibles. En particular max0, f y mın0, fson medibles.

Definición 1.29. Una función f : [0, 1] −→ K se dice simple siexiste n ∈ N, escalares a1, . . . , an y conjuntos A1, . . . , An ∈ B talesque

f =n∑i=1

aiχAi

Claramente, toda función simple es medible.

Del siguiente resultado esbozamos la demostración.

30 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Teorema 1.30. Sea f : [0, 1] −→ R una función medible. Entoncesexiste una sucesión de funciones simples (sn)n tal que

1. 0 ≤ s1 ≤ s2 ≤ · · ·2. Para todo t ∈ [0, 1]

lımnsn(t) = f(t)

Demostración. Para todo n ∈ N y para todo 1 ≤ i ≤ n2n sea

En,i = f−1([

i− 1

2n,i

2n

))y

Fn = f−1([n,∞])

y sea

sn =n2n∑i=1

i− 1

2nχEn,i + nχFn .

Si bien sólo vamos a utilizar la medida de Lebesgue, damos la defi-nición general de medida (positiva contablemente aditiva)

Definición 1.31. Dado un espacio de medida (Ω,F), una medidasobre dicho espacio es una función

m : F −→ [0,∞]

tal que1. m(∅) = 02. Para toda sucesión de conjuntos medibles (An)n∈N dos a dos

disjuntos (esto es, An ∩ Am = ∅ para todo m 6= n) se tiene

m

(∞⋃n=1

An

)=∞∑n=1

m(An).

No es obvia la existencia de medidas no triviales. A continuacióndamos como teorema (sin demostración) la existencia de la medida deLebesgue.

Teorema 1.32. En el espacio de medida ([0, 1],B) existe una únicamedida

λ : B −→ [0, 1]

tal que para todo 0 ≤ a ≤ b ≤ 1

λ((a, b)) = λ([a, b]) = b− a.A esta λ la denominamos medida de Lebesgue.

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 31

Nótese que para todo medida positivam se tiene que si A,B son dosconjuntos medibles con A ⊂ B entonces m(A) ≤ m(B). La siguienteproposición (que tampoco probamos) nos dice que podemos aproximar(en el sentido de la medida de Lebesgue) cualquier conjunto medibledesde dentro por compactos y desde fuera por abiertos.

Proposición 1.33. La medida de Lebesgue λ es regular en el si-guiente sentido: para todo A ⊂ [0, 1] y para todo ε > 0 existe un conjun-to cerrado (equivalentemente compacto) F ⊂ A y un conjunto abiertoG ⊃ A tales que

λ(G)− ε ≤ λ(A) ≤ λ(F ) + ε,

equivalentemente

λ(A \ F ) ≤ ε y λ(G \ A) ≤ ε

Necesitamos ahora definir integración respecto de la medida de Le-besgue. Comenzamos definiendo la integral de las funciones simplesde la única forma razonable y la vamos extendiendo a las funcionesmedibles ganando generalidad. No es difícil ver que cada una de lasdefiniciones va siendo coherente con las anteriores.

Definición 1.34. Si s =∑n

i=1 aiχAi : [0, 1] −→ R es una funciónsimple y E ⊂ B es un conjunto medible, se define la integral de s en Erespecto de λ como ∫

E

sdλ =n∑i=1

aiλ(Ai ∩ E).

Definición 1.35. Si f : [0, 1] −→ [0,∞] es una función medible ypositiva, y E ⊂ B es un conjunto medible, se define la integral de f enE respecto de λ como ∫

E

fdλ = sups

∫E

sdλ,

donde el supremo se toma sobre todas las funciones simples s tales ques ≤ f .

Nótese que la integral así definida puede valer ∞.

Definición 1.36. Si f : [0, 1] −→ R es una función medible, sedefinen f+ y f− como

f+ = maxf, 0 y f− = −mınf, 0.De la Proposición 1.28 se sigue que tanto f+ como f− son medibles(y claramente positivas). Entonces, dado un conjunto medible E ⊂ Bconsideramos las dos integrales

32 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

∫E

f+dλ y∫E

f−dλ.

Si al menos una de esas dos integrales es finita, se define la integral def en E respecto de λ como∫

E

fdλ =

∫E

f+dλ−∫E

f−dλ.

Finalmente,

Definición 1.37. Si f : [0, 1] −→ C es una función compleja me-dible y f = g + ıh, con g, h : [0, 1] −→ R medibles, dado un conjuntomedible E ⊂ B se define la integral de f en E respecto de λ como∫

E

fdλ =

∫E

gdλ+ ı

∫E

hdλ

si las integrales involucradas en la definición existen.

Observación 1.38. Se demuestra que si f es integrable Riemannen un intervalo [a, b], entonces la integral de Riemann de f en [a, b] yla integral de Lebesgue de f en [a, b] coinciden. Se demuestra tambiénque existen funciones no integrables Riemann que sí son integrablesLebesgue.

Resumimos en las dos siguientes proposiciones las propiedades bá-sicas de la integral de Lebesgue que necesitaremos más adelante, sindemostración. Necesitamos una definición previa.

Definición 1.39. Sea f : [0, 1] −→ R una función medible. De-cimos que f es integrable si las dos integrales que aparecen en su de-finición son finitas. Análogamente, si f : [0, 1] −→ C es una funciónmedible, decimos que f es integrable si las dos integrales que aparecenen su definición son finitas.

Proposición 1.40. Sea f, g : [0, 1] −→ R y E ∈ B. Entonces1. Si f es medible y acotada en E entonces f es integrable.2. Si a ≤ f(x) ≤ b para todo x ∈ E entonces

aλ(E) ≤∫E

fdλ ≤ bλ(E).

3. Si f, g son integrables en E y f(x) ≤ g(x) para todo x ∈ Eentonces ∫

E

fdλ ≤∫E

gdλ.

Proposición 1.41. Sea f, g : [0, 1] −→ K y E ∈ B. Entonces

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 33

1. Si f, g son integrables, entonces para todo α, β ∈ K∫E

(αf + βg)dλ = α

∫E

fdλ+ β

∫E

gdλ.

(Si bien es razonablemente inmediato que los escalares puedensalir fuera del signo integral, para demostrar la aditividad de laintegral se suele usar el Teorema de la Convergencia Monótona,que veremos más adelante, o algún resultado equivalente.)

2. Si f es medible y λ(E) = 0 entonces∫E

fdλ = 0.

3. Si f es integrable en E y A ∈ B verifica A ⊂ E entonces f esintegrable en A.

4.∣∣∣∣∫E

fdλ

∣∣∣∣ ≤ ∫E

|f |dλ.

De los resultados anteriores se deduce que los conjuntos de medidanula son despreciables en la integración:

Proposición 1.42. Sean f : [0, 1] −→ K y A,E ∈ B. Si A ⊂ E yλ(E \ A) = 0 entonces ∫

E

fdλ =

∫A

fdλ

Este último resultado hace que, si lo que nos interesa de las funcio-nes sea su integral, parezca que tenga sentido considerar la siguienterelación de equivalencia. Dadas dos funciones medibles

f, g : [0, 1] −→ K

decimos que f ∼ g si

λ (x ∈ [0, 1] tales que f(x) 6= g(x)) = 0.

Es claro que ∼ es una relación de equivalencia y que si f ∼ g entoncespara todo E ∈ B ∫

E

fdλ =

∫E

gdλ.

La siguiente notación útil está relacionada con lo anterior: Si unapropiedad P ocurre para todo x ∈ [0, 1] \ A siendo A un conjunto demedida nula, decimos que P ocurre en casi todo punto, abreviado c.t.p.

En particular, f ∼ g si y sólo si f(x) = g(x) c.t.p.

34 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Los dos resultados que enunciamos a continuación, sin demostra-ción, son fundamentales en la teoría de integración de Lebesgue, y nospermitirán intercambiar límites e integrales en numerosas ocasiones.

Teorema 1.43 (de la Convergencia Monótona). Sea E ⊂ B. Sea(fn) una sucesión de funciones medibles fn : [0, 1] −→ [0,∞] tales quepara todo x ∈ E

0 ≤ f1(x) ≤ f2(x) ≤ · · ·Sea f : [0, 1] −→ [0,∞] la función definida como

f(x) = lımnfn(x) para todo x ∈ [0, 1].

Entonces

lımn→∞

∫E

fndλ =

∫E

fdλ.

Teorema 1.44 (de la Convergencia Dominada). Sea E ⊂ B. Sea(fn) una sucesión de funciones medibles fn : [0, 1] −→ [0,∞] y seaf : [0, 1] −→ [0,∞] tales que

f(x) = lımnfn(x) para todo x ∈ [0, 1].

(Nótese que f es medible como consecuencia de la Proposición 1.28).Si existe una función g : [0, 1] −→ [0,∞] integrable en E y tal que paratodo n ∈ N y para todo x ∈ [0, 1]

|fn(x)| ≤ g(x)

entonces

lımn→∞

∫E

fndλ =

∫E

fdλ.

Una vez que tenemos a nuestra disposición los resultados básicos dela Teoría de integración de Lebesgue, podemos iniciar la construcciónde los espacios Lp[0, 1].

Empezamos proponiendo como ejercicio la demostración de las de-sigualdades de Hölder y Minkowski en la versión integral.

Ejercicio 1.1 (Desigualdad de Hölder). Sean 1 < p, q < ∞ con1p

+ 1q

= 1, sean f, g : [0, 1] −→ [0,∞] medibles y sea E ⊂ B. Entonces∫E

fgdλ ≤(∫

E

fpdλ

) 1p(∫

E

gqdλ

) 1q

.

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 35

Ejercicio 1.2 (Desigualdad de Minkowski). Sean 1 < p, q < ∞con 1

p+ 1

q= 1, sean f, g : [0, 1] −→ [0,∞] medibles y sea E ⊂ B.

Entonces (∫E

(f + g)pdλ

) 1p

≤(∫

E

fpdλ

) 1p

+

(∫E

gpdλ

) 1p

.

Definimos ahora las normas p para las funciones medibles.

Definición 1.45. Sea f : [0, 1] −→ K una función medible y sea1 ≤ p <∞. Se define la norma p de f como

‖f‖p =

(∫ 1

0

|f |pdλ) 1

p

.

Veamos ahora el caso p =∞.

Definición 1.46. Sea f : [0, 1] −→ [0,∞] una función medible.Sea

S = α ∈ R tales que λ(f−1((α,∞])) = 0Si S = ∅ hacemos β = ∞. Si S 6= ∅, decimos que α ∈ S es una cotaesencial de S y hacemos β = ınf S. Llamamos a β el supremo esencialde f .

Ahora, dada una función medible f : [0, 1] −→ K, llamamos β alsupremo esencial de |f | y definimos la norma ∞ de f como

‖f‖∞ = β.

Puesto que

f−1((β,∞]) = ∪∞n=1f−1((β +

1

n,∞])

y dado que la unión numerable de conjuntos de medida 0 tiene medida0, se sigue que el supremo esencial es una cota esencial y por lo tanto

f(x) ≤ ‖f‖∞ c.t.p.

Ya podemos definir los espacios Lp.

Definición 1.47. Sea 1 ≤ p ≤ ∞. Se define el espacio vectorialLp[0, 1] como

Lp[0, 1] = f : [0, 1] −→ K medibles tales que ‖f‖p <∞.

Quisiéramos ver ahora que el espacio Lp[0, 1] con la norma p esun espacio de Banach. Lamentablemente la norma p no es una normaen Lp[0, 1]. Lo único que falla es que f puede ser distinta de 0 (en el

36 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

sentido que esperaríamos de “ser distinto de 0”) mientras que ‖f‖p = 0,tómese por ejemplo

f(x) =

1 si x = 00 si x 6= 0.

La solución es definir los espacios Lp[0, 1] como el cociente de Lp[0, 1]por la relación de equivalencia ∼ definida anteriormente.

Con esta definición se tiene

Ejercicio 1.3. Sea 1 ≤ p ≤ ∞. El espacio Lp[0, 1] con la norma‖ · ‖p es un espacio normado.

Es algo más complicado ver que Lp[0, 1] es un espacio de Banach.Siguiendo la costumbre habitual, al escribir no somos totalmente rigu-rosos en la distinción formal entre f ∈ Lp[0, 1] y su clase [f ] ∈ Lp[0, 1].Creemos que no hay confusión posible y que ser totalmente formalistasconfunde más que aclara.

Teorema 1.48. Sea 1 ≤ p ≤ ∞. El espacio Lp[0, 1] con la norma‖ · ‖p es un espacio de Banach.

Demostración. Consideramos primero el caso 1 ≤ p < ∞. Sea(fn)n ⊂ Lp[0, 1] una sucesión de Cauchy. Queremos ver que (fn) con-verge a una función f ∈ Lp[0, 1], y por ser (fn) una sucesión de Cauchy,está claro que basta probar que (fn) tiene una subsucesión convergente.Así, tomando una subsucesión podemos suponer sin perdida de gene-ralidad que

‖fn+1 − fn‖p ≤1

2n.

Sea f0 = 0 y para todos n ∈ N, t ∈ [0, 1] sea

gn(t) =n∑j=0

|fj+1(t)− fj(t)|

y

g(t) =∞∑j=0

|fj+1(t)− fj(t)|

Entonces, por la desigualdad triangular se tiene

‖gn‖p ≤n∑j=0

‖fj+1 − fj‖p ≤ ‖f1 − f0‖p +n∑j=1

1

2j≤ ‖f1‖p + 1.

Como además la sucesión (gn) es creciente y converge a g del Teo-rema de la Convergencia Monótona se tiene que

‖g‖p = lımn‖gn‖p ≤ ‖f1‖p + 1

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 37

y por tanto g ∈ Lp[0, 1], y en particular g es finita c.t.p.Es decir, la serie

∑∞j=0 fj+1(t)− fj(t) converge absolutamente c.t.p.

y por tanto converge c.t.p.Para todo t ∈ [0, 1] sea entonces

f(t) =∞∑j=0

fj+1(t)− fj(t).

Como

fn(t) =n−1∑j=0

fj+1(t)− fj(t),

se tiene quelımnfn(t) = f(t)

y

|fn(t)| ≤n−1∑j=0

|fj+1(t)− fj(t)| ≤ g(t) para todo t ∈ [0, 1].

Ahora el Teorema de la Convergencia Dominada nos dice que∫ 1

0

|f |pdλ = lımn

∫ 1

0

|fn|pdλ ≤∫ 1

0

gpdλ <∞

y por tanto f ∈ Lp[0, 1].En ese caso también |f | + g ∈ Lp[0, 1] y |f − fn|p ≤ (|f | + g)p

para todo n ∈ N. Por tanto, de nuevo el Teorema de la ConvergenciaDominada nos dice que

‖f − fn‖pp =

∫ 1

0

|fn − f |pdλ→ 0

y por tanto fn → f en ‖ · ‖p, lo que termina la demostración en el caso1 ≤ p <∞.

Si ahora p =∞, sea (fn) ⊂ L∞[0, 1] una sucesión de Cauchy. Paratodos n,m ∈ N sea

An = t ∈ [0, 1] tales que |fn(t)| ≥ ‖f‖∞y sea

Bn,m = t ∈ [0, 1] tales que |fm(t)− fn(t)| ≥ ‖fm − fn‖∞.Si

F =

(∞⋃n=1

An ∪∞⋃

n,m=1

Bn,m

)

38 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

entonces m(F ) = 0 y está claro que (fn) tiende uniformemente en F c auna función f acotada. Por lo tanto f ∈ L∞[0, 1] y ‖fn−f‖∞ → 0.

En muchas ocasiones la forma más cómoda de estudiar un espacioLp[0, 1] es considerarlo como el completado de C[0, 1] con la normap. Contamos eso a continuación sin detallar las demostraciones, puestoque eso nos llevaría a internarnos en la Teoría de la Integral de Lebesguemás de lo que consideramos adecuado para este curso.

Comenzamos enunciando sin demostración el Teorema de Lusin. Alpresentarlo en clase podemos hacer un esquema de la demostración,utilizando la regularidad de λ y el Lema de Urysohn, aunque sin com-pletar los detalles.

Teorema 1.49 (Lusin). Sea f : [0, 1] −→ K una función integrable,sea E ⊂ B con f(x) = 0 si x 6∈ E y sea ε > 0. Entonces existeg ∈ C[0, 1] tal que

λ(x; f(x) 6= g(x)) < ε

y‖g‖∞ ≤ ‖f‖∞.

Necesitamos otro resultado, interesante en sí mismo.

Proposición 1.50. Sea S el conjunto de las funciones s : [0, 1] −→K simples y sea 1 ≤ p <∞. Entonces S es denso en Lp[0, 1].

Demostración. Vemos primero el caso real. Sea f ∈ Lp[0, 1], f ≥0, y sea (sn) ⊂ S una sucesión tal que 0 ≤ s1 ≤ s2 ≤ · · · y

lımnsn(x) = f(x) c.t.p.

Puesto que |f−sn|p ≤ |f |p, del Teorema de la Convergencia Dominadase sigue que

‖f − sn‖p → 0.

Una vez probado el caso f ≥ 0 se puede probar el caso de f con valoresen R descomponiendo f = f+− f−, y a continuación se prueba el casode f con valores en C descomponiendo f = g + ıh.

Finalmente se tiene

Teorema 1.51. Sea 1 ≤ p <∞. Entonces (C[0, 1], ‖ · ‖p) es densoen Lp[0, 1].

Demostración. La demostración se sigue del resultado anteriormás el Teorema de Lusin.

1. ESPACIOS NORMADOS. ESPACIOS DE BANACH 39

Finalmente podemos comentar que se puede demostrar que C[0, 1]es separable y que L∞[0, 1] no lo es, por lo que (C[0, 1], ‖·‖∞) no puedeser denso en L∞[0, 1].

Prácticas sugeridas.

Ejercicio 1.4. Comprobar que todo espacio normado de dimensiónfinita es completo.

Ejercicio 1.5. Sea (X, ‖ · ‖) un espacio normado. Entonces ‖ · ‖ :X −→ [0,+∞) es una función continua.

Ejercicio 1.6. Para todo n ∈ N sea Xn un espacio de Banach.Probar que, para todo 1 ≤ p <∞, el espacio

`p(Xn) = (xn)n∈N

tales que xn ∈ Xn para todo n ∈ N y∞∑n=1

‖xn‖p <∞

es un espacio de Banach con la norma

‖(xn)n∈N‖ =

(∞∑n=1

‖xn‖p) 1

p

.

Análogamente probar que c(Xn), c0(Xn) y `∞(Xn) con las definicionesobvias también son espacios de Banach.

Ejercicio 1.7. En muchas ocasiones (en particular en la construc-ción de los duales de estos espacios) necesitaremos una “aproximaciónpor un número finito de coordenadas” a los elementos de `p, c y c0.Para esto resulta muy adecuado definir el espacio

c00 = (xn)n∈N ∈ KN tales que existe n0 ∈ N de manera que

para todo n ≥ n0 xn = 0,es decir el espacio de las sucesiones de escalares con un número finito detérminos no nulos. Comprobar que, para todo 1 ≤ p ≤ ∞, (c00, ‖ · ‖p)es un espacio normado pero no es un espacio de Banach. Para todo1 ≤ p <∞ comprobar que c00 ⊂ `p y que c00 es denso en `p. Comprobartambién que c00 ⊂ c0 y que c00 es denso en c0.

Ejercicio 1.8. Aplicar el Teorema 1.12 para demostrar el recíprocode la Proposición 1.4: Si X es un espacio normado, Y ⊂ X es unsubespacio vectorial cerrado y X/Y es un espacio de Banach, entoncesX es un espacio de Banach.

40 1. ESPACIOS NORMADOS. ESPACIOS DE BANACH

Ejercicio 1.9. Bases de Schauder. [31, p. 133]

Ejercicio 1.10. Separabilidad. Definición y propiedades básicas.Comprobar que `p es separable si y sólo si 1 ≤ p < ∞, y que c0 esseparable. Demostrar que C[0, 1] es separable.

Ejercicio 1.11. Probar que si 1 ≤ p ≤ ∞ Lp[0, 1] es un espaciode Banach.

Ejercicio 1.12. Dar condiciones necesarias y suficientes para quese tenga la igualdad en las desigualdades de Hölder y Minkowski.

Ejercicio 1.13. Demostrar que si 1 ≤ q < p ≤ ∞ entonces lainclusión `q ⊂ `p es propia.

Ejercicio 1.14. Encontrar una sucesión que pertenezca a c0 perono a `p para ningún p ∈ [1,∞).

Ejercicio 1.15. Hacer un boceto de las bolas unidad en `2p conp = 1, 3

2, 2, 4,∞.

Ejercicio 1.16. Demostrar que si X tiene dimensión finita e Y ⊂X es un subespacio vectorial propio entonces existe x ∈ SX tal qued(x, Y ) = 1.

Ejercicio 1.17. Sea C(n)[0, 1] el conjunto de las funciones conti-nuas con derivada n-sima continua, con la norma

‖f‖ = max0≤k≤n

‖f‖∞.

Demostrar que C(n)[0, 1] con esa norma es un espacio de Banach.

Capítulo 2

Aplicaciones lineales continuas entre espaciosnormados

Como ya hemos dicho, el objeto natural de trabajo del Análisis Fun-cional van a ser espacios vectoriales, en general de dimensión infinita,dotados de algún tipo de topología vectorial (en este curso sólo con-sideramos espacios normados). Resulta pues natural que en el estudiode estos espacios sea de gran importancia el estudio de las aplicacio-nes lineales y continuas entre ellos, dado que estas son las aplicacionesque preservan las dos estructuras (vectorial y topológica) con las queestamos trabajando. De hecho muchas de las aplicaciones del Análi-sis Funcional consisten precisamente en estudiar ciertas aplicacioneslineales y continuas destacadas entre espacios normados.

Tras ver las caracterizaciones más utilizadas de la continuidad deuna aplicación lineal T : X −→ Y , estudiamos la situación cuando Xtiene dimensión finita y vemos que si X tiene dimensión infinita siem-pre existen aplicaciones lineales no continuas. Definimos seguidamentecuándo dos espacios son isomorfos o isométricos.

Es fácil ver que L(X;Y ), el espacio de las operadores de X a Ytiene estructura de espacio vectorial. Lo interesante es que también sepuede definir una norma que le convierte en espacio normado, completosi Y lo es. En particular se sigue que el dual de todo espacio normadoes un espacio de Banach.

Para terminar, incluimos en este capítulo un breve estudio de larelación entre formas lineales e hiperplanos, necesario para estudiar elTeorema de Hahn-Banach en el siguiente capítulo.

En la preparación de este capítulo hemos seguido principalmente[31], [24] y [13].

Aplicaciones lineales continuas

Empezamos con el siguiente teorema

Teorema 2.1. Sean X, Y dos espacios normados, y sea T : X −→Y una aplicación lineal. Entonces, son equivalentes:

41

42 2. APLICACIONES LINEALES CONTINUAS

(i) T es continuo.(ii) T es continuo en el origen.(iii) Existe C > 0 tal que ‖T (x)‖ ≤ C‖x‖ para todo x ∈ X(iv) T es Lipschitziana, es decir, existe C > 0 tal que

‖T (x)− T (y)‖ ≤ C‖x− y‖

para todos x, y ∈ X.(v) T (BX) está acotado en Y .(vi) ker(T ) es un subespacio cerrado y la aplicación lineal T : X/ ker(T ) −→

Y definida como

T ([x]) = T (x)

es continua.

Demostración. Claramente (i) implica (ii).

Para ver que (ii) implica (iii), si T es continuo en el origen, entonces,dado ε > 0 existe δ > 0 tal que, siempre que ‖x‖ ≤ δ se tiene

‖T (x)‖ ≤ ε.

Entonces, para todo 0 6= x ∈ X se tiene que

‖T (x)‖ =

∥∥∥∥T (‖x‖δ xδ

‖x‖

)∥∥∥∥ =‖x‖δ

∥∥∥∥T ( xδ

‖x‖

)∥∥∥∥ .Como ∥∥∥∥ xδ‖x‖

∥∥∥∥ = δ

entonces

‖T (x)‖ ≤ ε‖x‖δ

y C =ε

δverifica (iii).

Que (iii) implica (iv) se sigue de la linealidad de T , puesto que

‖T (x)− T (y)‖ = ‖T (x− y)‖ ≤ C‖x− y‖

Claramente (iv) implica (i).

Si (iii) es cierto, entonces, para todo x ∈ BX , ‖T (x)‖ ≤ C, luegoT (BX) está acotado y se tiene (v).

2. APLICACIONES LINEALES CONTINUAS 43

Recíprocamente, si tenemos (v), y, por ejemplo ‖T (x)‖ ≤ C paratodo x ∈ BX , entonces para todo 0 6= x ∈ X se tiene

‖T (x)‖ = ‖x‖∥∥∥∥T ( x

‖x‖

)∥∥∥∥ ≤ C‖x‖

lo que implica (iii)

Veamos que (i) implica (vi). Claramente, si T es continuo entoncesker(T ) es un subespacio cerrado. Por tanto ya vimos que X/ ker(T ) esun espacio normado con la norma inducida. Es conocido (y fácil de ver)que la aplicación T está bien definida y es lineal. Además

‖T ([x])‖ = ‖T (x)‖ ≤ C‖x‖si T es continuo.

Recíprocamente, si se tiene (vi), existe C tal que

‖T ([x])‖ ≤ C‖[x]‖y por tanto, para todo x ∈ X,

‖T (x)‖ = ‖T ([x])‖ ≤ ‖[x]‖ ≤ C‖x‖ya que

‖[x]‖ = ınfz∈ker(T )

‖x+ z‖ ≤ ‖x‖

por tanto (iii), y de ahí (i), son ciertos.

Veamos como corolario (aunque es fácil probarlo directamente) queen espacios de dimensión finita todo operador lineal es continuo.

Corolario 2.2. Sean X, Y dos espacios normados con dimX <∞y sea T : X −→ Y una aplicación lineal. Entonces T es continuo.

Demostración. Puesto que ya hemos visto anteriormente que enlos espacios de dimensión finita todas las normas son equivalentes, supo-nemos sin perdida de generalidad X = `n1 . Sea (ei)

ni=1 la base canónica

de `n1 y seaM = sup

i‖T (ei)‖.

Entonces, para todo x = (x1, . . . , xn) ∈ B`1 ,

‖T (x)‖ =

∥∥∥∥∥T(∑

i

xiei

)∥∥∥∥∥ =

∥∥∥∥∥∑i

xiT (ei)

∥∥∥∥∥ ≤∑i

|xi|‖T (ei)‖ ≤

≤M∑i

|xi| ≤M

44 2. APLICACIONES LINEALES CONTINUAS

y el teorema anterior nos garantiza que T es continuo.

Veamos que de hecho esa condición caracteriza a los espacios dedimensión finita.

Teorema 2.3. Sea X un espacio normado de dimensión infinitae Y un espacio normado no nulo. Entonces existe una aplicación T :X −→ Y lineal no continua.

Demostración. Sea (xn) ⊂ BX una familia de vectores lineal-mente independientes, consideremos una base B de X que contenga ala sucesión (xn) y un vector 0 6= y ∈ Y . Definamos ahora la aplicaciónlineal T : X −→ Y en todos los elementos de la base B mediante

T (b) =

ny , si b = xn

0 , si b 6= xn para todo n

y la extendemos por linealidad a todo X. Entonces claramente T (BX)no está acotado, por lo que T no es continuo.

Desde el punto de vista de las categorías, siempre es importanteestablecer alguna condición de “equivalencia” entre los objetos de lacategoría. En la categoría de espacios de Banach, y de espacios nor-mados, hay dos nociones que pueden jugar este papel, según en queaspectos de la teoría deseemos fijarnos.

Definición 2.4. Dos espacios normados X e Y se dicen isomorfossi existe una aplicación lineal biyectiva y continua θ : X −→ Y talque su inversa θ−1 (que sabemos por Álgebra Lineal que es lineal) escontinua.

Veremos que del Teorema de la Aplicación Abierta se sigue que siθ es como en la definición entonces θ−1 siempre verifica lo pedido.

Observemos que si X e Y son isomorfos, entonces X es Banach siy sólo si Y lo es, ya que los homeomorfismos lineales ya vimos que sonuniformemente continuos.

Definición 2.5. Dos espacios normados X e Y se dicen isométri-cos si existe una aplicación lineal y biyectiva θ : X −→ Y tal que, paratodo x ∈ X,

‖θ(x)‖ = ‖x‖.

Los isomorfismos conservan la estructura lineal y topológica de losespacios. Las isometrías conservan además la geometría de los espacios.

2. APLICACIONES LINEALES CONTINUAS 45

Se distingue entonces a menudo entre la Teoría Isométrica, más preo-cupada de problemas de Geometría de Espacios de Banach, y la TeoríaIsomórfica, más preocupada de problemas que se suelen denominar es-tructurales.

A continuación damos algunos ejemplos de aplicaciones lineales ycontinuas (operadores de ahora en adelante) o no continuas entre es-pacios normados.

Ejemplo 2.6. Sea A = (ai,j)i,j∈N una matriz infinita y sea 1 ≤ p <∞.

Si p = 1, supongamos que γ(j) =∑∞

i=1 |ai,j| < ∞ para todo j ∈ Ny que γ(j)→ 0 cuando j →∞.

Si 1 < p <∞ y 1p

+ 1q

= 1, supongamos que

βp =

∞∑i=1

(∞∑j=1

|ai,j|q) p

q

1p

<∞.

Entonces el operador

TA : `p −→ `p

dado por

TA(x) =

(∞∑j=1

ai,jxj

)j

(está bien definido y) es continuo.

Comencemos viendo el caso p = 1. Notemos que si γ(j) → 0 enparticular se tiene que supj γ(j) = C <∞. Entonces

‖TA(x)‖1 =

∥∥∥∥∥∥(∞∑j=1

ai,jxj

)i

∥∥∥∥∥∥1

=∞∑i=1

∣∣∣∣∣∞∑j=1

ai,jxj

∣∣∣∣∣ ≤∑i

∑j

|ai,jxj| =

=∑j

∑i

|ai,j||xj| ≤∑j

|xj|∑i

|ai,j| =∑j

|xj|γ(j) ≤ C‖x‖1,

por lo que TA es continuo.

Veamos ahora el caso 1 < p < ∞. Nótese el uso de la desigualdadde Hölder.

‖TA(x)‖p =

∥∥∥∥∥∥(∞∑j=1

ai,jxj

)i

∥∥∥∥∥∥p

∥∥∥∥∥∥(∞∑j=1

|ai,jxj|

)i

∥∥∥∥∥∥p

46 2. APLICACIONES LINEALES CONTINUAS

∥∥∥∥∥∥( ∞∑

j=1

|ai,j|q) 1

q(∞∑j=1

|xj|p) 1

p

i

∥∥∥∥∥∥p

=

= ‖x‖p

∥∥∥∥∥∥( ∞∑

j=1

|ai,j|q) 1

q

i

∥∥∥∥∥∥p

= ‖x‖pβp,

y por tanto TA es continuo.

Veamos un análogo continuo del ejemplo de arriba, lo que se conocecomo operadores integrales de Fredholm.

Ejemplo 2.7. Sea k(·, ·) : [0, 1] × [0, 1] −→ K una función a laque de ahora en adelante nos referiremos como núcleo de Fredholm. Elnúcleo k nos permite definir una aplicación entre espacios funcionales(de momento por precisar)

x 7→ Tk(x)(s) =

∫ 1

0

∫ 1

0

k(s, t)x(t)dt

Se pueden estudiar las características de este operador en función delnúcleo k y del espacio en que lo definamos.

En este ejemplo, consideremos 1 < p ≤ ∞. Sea X = Lp[0, 1], seaY = Lq[0, 1] con 1

p+ 1

q= 1 y supongamos que k ∈ Lq([0, 1] × [0, 1]).

Entonces, para todo x ∈ X y s ∈ [0, 1] usando la versión integral de ladesigualdad de Hölder análogamente a como lo hicimos en el Ejemplo7.10 tenemos

|Tk(x)(s)| ≤∫ 1

0

|k(s, t)||x(t)|dt ≤ ‖x‖p(∫ 1

0

|k(s, t)|qdt) 1

q

y por lo tanto

‖Tk(x)‖q =

(∫ 1

0

|Tk(x)(s)|qds) 1

q

≤ ‖x‖p(∫ 1

0

∫ 1

0

|k(s, t)|qdtds) 1

q

= ‖x‖p‖k‖q

de donde se sigue la continuidad de Tk : Lp[0, 1] −→ Lq[0, 1].

Veamos algún ejemplo de operador lineal no continuo

Ejemplo 2.8. Sea C1[0, 1] el espacio de las funciones con derivadacontinua, dotado de la norma del supremo, y sea

D : C1[0, 1] −→ C[0, 1]

2. APLICACIONES LINEALES CONTINUAS 47

el operador derivación. Entonces D es lineal pero no continuo, ya que,si fn(t) = tn, entonces ‖fn‖ = 1 pero

‖D(fn)‖ = ‖f ′n‖ = supt‖ntn−1‖ = n

Ejemplo 2.9. Análogamente, podemos definir la forma lineal

x′ : C1[0, 1] −→ Kdada por

x′(f) = f ′(1)

y ver que no es continua. En efecto, veamos que kerx′ = x′−10 no escerrado: sea fn = t− tn

n. Entonces f ′n(1) = 1− n

n= 0 para todo n ∈ N, y

por tanto f ′n ∈ kerx′. Claramente fn tiende a f(t) = t pero f 6∈ kerx′.

Ya sabemos del Álgebra Lineal que el espacio de operadores linealesentre espacios vectoriales tiene a su vez estructura de espacio vectorial.Es muy fácil ver que los operadores lineales y continuos forman unsubespacio vectorial de este (sin más que notar que ‖(T + S)(x)‖ =‖T (x) + S(x)‖ ≤ ‖T (x)‖ + ‖S(x)‖ ≤ C1‖x‖ + C2‖x‖ = (C1 + C2)‖x‖y que ‖αT (x)‖ = |α|‖T (x)‖). Denotaremos a este último espacio porL(X;Y ). Veamos que L(X;Y ) hereda de X e Y una estructura naturalde espacio normado.

Definición 2.10. Dados dos espacios normados X e Y y un ope-rador T : X −→ Y definimos su norma como

‖T‖ = supx∈BX

‖T (x)‖

Es fácil ver que esa función es efectivamente una norma en L(X;Y ).

Lema 2.11. Dados dos espacios normados X e Y y un operadorT : X −→ Y se tiene

‖T‖ = ınf C ≥ 0, tal que ‖T (x)‖ ≤ C‖x‖ para todo x ∈ X =

= supx∈SX

‖T (x)‖.

Demostración. Llamemos I := ınfC ≥ 0, tal que ‖T (x)‖ ≤C‖x‖ para todo x ∈ X. Si C es tal que

‖T (x)‖ ≤ C‖x‖para todo x ∈ X, entonces

supx≤1‖T (x)‖ ≤ C

y por tanto ‖T‖ ≤ I.

48 2. APLICACIONES LINEALES CONTINUAS

Por otro lado, si 0 6= x ∈ X, entonces

‖T (x)‖ = ‖x‖‖T(

x

‖x‖

)‖ ≤ ‖x‖ sup

z∈SX‖T (z)‖,

de donde

I ≤ supz∈SX

‖T (z)‖ ≤ ‖T‖ ≤ I.

Ya hemos visto que L(X;Y ) con la norma de operadores es unespacio normado. Veamos además que es un espacio de Banach si Y loes

Proposición 2.12. Dados dos espacios normados X e Y , si Yes un espacio de Banach entonces L(X;Y ) también es un espacio deBanach.

Demostración. La demostración es esencialmente la misma desiempre: consideramos una sucesión de Cauchy, le buscamos un candi-dato al límite y finalmente verificamos que dicho candidato es efectiva-mente un elemento del espacio y que la sucesión converge a él.

Sea (Tn)n∈N ⊂ L(X;Y ) una sucesión de Cauchy. Es fácil ver que,para todo x ∈ X, (Tn(x))n es una sucesión de Cauchy en Y . Por tanto,puesto que Y es completo, existe y ∈ Y tal que (Tn(x))n tiende a y.Consideramos la aplicación T : X −→ Y definida por

T (x) = lımnTn(x).

Debemos ver que T es lineal y continua: la linealidad se sigue delhecho de que la suma y el producto son continuos; veamos por ejemplola aditividad

T (x+ y) = lımnTn(x+ y) = lım

n(Tn(x) + Tn(y)) = T (x) + T (y)

Para ver que T es continuo, por ser (Tn) una sucesión de Cauchy, paratodo ε > 0 existe n0 tal que para todo n,m ≥ 0, ‖Tn − Tm‖ < ε.

Entonces, por la continuidad de la norma, para todo m ≥ n0

(1) ‖T (x)− Tm(x)‖ = lımn‖Tn(x)− Tm(x)‖ ≤

≤ lımn‖Tn − Tm‖ ‖x‖ ≤ ε‖x‖

y por tanto, tomando ε = 1,

‖T (x)‖ ≤ ‖T (x)− Tm(x)‖+ ‖Tm(x)‖ ≤ (1 + ‖Tm‖)‖x‖

2. APLICACIONES LINEALES CONTINUAS 49

lo que implica que T es continuo. La convergencia de (Tn) a T se siguede (1).

Probablemente sea interesante recalcar en algún momento que esen general muy difícil calcular la norma de un operador, incluso paramuchos operadores aparentemente sencillos. Considérese por ejemploel caso de operadores T : `n2 −→ `n2 , dados por una matriz. Dada unamatriz, resulta un problema muy complejo y a menudo importante cal-cular, o al menos estimar, su norma como operador entre esos espacios.

La siguiente proposición es muy usada.

Proposición 2.13. Sean X, Y, Z espacios normados, y sean T ∈L(X;Y ) y S ∈ L(Y ;Z). Entonces ST ∈ L(X;Z) y ‖ST‖ ≤ ‖S‖‖T‖

Demostración. Basta observar que

‖(S T )(x)‖ = ‖S(T (x))‖ ≤ ‖S‖‖T‖‖x‖.

Dado un espacio normado X, llamamos X∗ := L(X;K). Del Teore-ma 2.12 se sigue que X∗ es siempre completo. Llamamos a X∗ el dualtopológico, o simplemente dual de X. Del Teorema 2.3 se sigue que enlos espacios de dimensión infinita el dual algebraico y el topológico nocoinciden. Nosotros usaremos exclusivamente el dual topológico, puestoque es el que nos permitirá utilizar la estructura topológica del espacio.

Para poder estudiar en el próximo capítulo las aplicaciones geomé-tricas del Teorema de Hahn-Banach necesitaremos estar familiarizadoscon la noción de hiperplano. Aprovechamos este momento para intro-ducir su definición y probar algunos resultados elementales.

Sea X un espacio vectorial. Un hiperplanoM ⊂ X es un subespaciovectorial de codimensión 1, es decir, tal que dim(X/M) = 1. Existe unarelación biunívoca entre hiperplanos y (rectas de) formas lineales (nonecesariamente continuas).

Proposición 2.14. Un subespacio vectorial M ⊂ X es un hiper-plano si y sólo si existe una forma lineal no nula x′ : X −→ K tal queM = ker x′.

Demostración. Si M es un hiperplano, sea Q : X −→ X/M laaplicación cociente canónica, y sea θ : X/M −→ K un isomorfismo.Entonces x′ = θ Q : X −→ K es una aplicación lineal tal que kerx′ =M .

50 2. APLICACIONES LINEALES CONTINUAS

Recíprocamente, si x′ : X −→ K es una forma lineal no nula,llamando M = ker x′ tenemos que la aplicación canónica

x′ : X/ kerx′ −→ K

dada porx′([x]) = x′(x)

está bien definida, es lineal, inyectiva y sobreyectiva, y por tanto esta-blece un isomorfismo lineal entre X/ kerx′ y K, es decir,

dim(X/ kerx′) = 1.

Proposición 2.15. Si X es un espacio normado y M ⊂ X es unhiperplano, entonces M es cerrado o denso.

Demostración. Sea M , la clausura topológica de M . EntoncesM es un subespacio vectorial (Proposición 1.3) y se tiene que

M ⊂M ⊂ X

Al ser dimX/M = 1, se tiene que, o bien M = M (M es cerrado) obien M = X (M es denso).

A la vista de la división de los hiperplanos en densos y cerrados, y dela relación entre hiperplanos y formas lineales, la siguiente proposiciónresulta natural.

Proposición 2.16. Sea X un espacio de Banach y x′ : X −→ Kuna forma lineal. Entonces kerx′ es cerrado si y sólo si x′ es continua.

Demostración. Claramente si x′ es continua entonces kerx′ =x′−1(0) es cerrado.

Recíprocamente, supongamos que kerx′ es cerrado. Sea

Q : X −→ X/ kerx′

la aplicación cociente, que es continua (Ejercicio 2.2). Sea

θ : X/ kerx′ −→ K

un isomorfismo algebraico, que siempre es continuo por ser una aplica-ción lineal entre espacios de dimensión finita (Corolario 2.2). Entonces

f = θ Q : X −→ K

es continua y ker f = kerx′. Veamos finalmente que existe α ∈ K talque x′ = αf , y por tanto x′ es continua.

2. APLICACIONES LINEALES CONTINUAS 51

Sea x0 ∈ X tal que f(x0) = 1. Entonces x′(x0) = α 6= 0 (porque losnúcleos de f y x′ coinciden). Sea ahora x ∈ X y sea a = f(x). Entonces

f(x− ax0) = f(x)− a1 = 0

y por tantox− ax0 ∈ ker f = ker x′,

es decirx′(x− ax0) = 0

de donde x′(x) = ax′(x0), es decir

x′(x) = f(x)x′(x0) = αf(x) para todo x ∈ X.

Ejemplo 2.17. Veamos un ejemplo de un hiperplano denso: consi-deremos la sucesión (en) ⊂ c0. Sea x0 ∈ c0, x0 = (1, 1

2, 13, . . .), es decir

x0n = 1n. Es fácil ver que x0 ∪ en;n ∈ N es un sistema linealmente

independiente. Sea entonces B = x0 ∪ en;n ∈ N ∪ bi; i ∈ I unabase de Hamel. Entonces todo x ∈ c0 se puede escribir en forma únicacomo

x = α0x0 +∑n

αnen +∑i

αiei

(donde sólo una cantidad finita de coeficientes son no nulos). Definimosx′ : c0 −→ K como x′(x) = α0. Así definido x′ es una forma linealobviamente no nula puesto que x′(x0) = 1. Claramente c00 ⊂ kerx′ ypuesto que c00 es denso en c0 se tiene que kerx′ es denso.

Prácticas sugeridas

Ejercicio 2.1. Dos espacios normados X, Y son isomorfos si ysólo si existe una aplicación lineal y biyectiva θ : X −→ Y y existenα, β > 0 tales que, para todo x ∈ X,

α‖x‖ ≤ ‖θ(x)‖ ≤ β‖x‖.

Ejercicio 2.2. Sea X un espacio normado, Y ⊂ X un subespaciovectorial cerrado. Entonces la aplicación cociente

Q : X −→ X/Y

es continua.

Ejercicio 2.3. Sea 1 ≤ q < p ≤ ∞. Probar que la identidad formali : `q −→ `p es continua.

52 2. APLICACIONES LINEALES CONTINUAS

Ejercicio 2.4. [22, p. 103] Si (Fn) ⊂ L(C[0, 1]) es una sucesiónde operadores positivos tal que

lımnFn(f) = f

para f = 1, x, x2 entonces

lımnFn(f) = f

para todo f ∈ C[0, 1].

Ejercicio 2.5. Sea H = L2 y sea C(1) el conjunto de las funcionescon derivada continua. Sea t ∈ [0, 1] y sea Dt : C(1) −→ K la formadada por

Dt(f) = f ′(t).

Demostrar que Dt no se puede extender con continuidad a L2[0, 1].

Ejercicio 2.6 (Matriz de Hilbert). Probar que la matriz A =(ai,j)i,j∈N con

ai,j =1

i+ jdefine un operador acotado T : `2 −→ `2 con ‖T‖ ≤ π.

Capítulo 3

Teoremas de Hahn-Banach

El Teorema de Hahn-Banach (o más bien los Teoremas de Hahn-Banach) juegan un papel fundamental en la teoría de Espacios Nor-mados, así como en la teoría de Espacios Localmente Convexos. En suforma analítica, el Teorema de Hahn-Banach nos permite extender for-mas lineales definidas sobre subespacios y dominadas por funcionalessublineales o seminormas. Esto nos garantiza que los espacios dualesson, en primer lugar, no vacíos, y en segundo lugar, suficientementericos como para determinar importante información estructural acercade los espacios. En su forma geométrica, el Teorema de Hahn-Banachnos permite separar por medio de hiperplanos determinados pares deconjuntos del espacio y esto tiene una importancia fundamental, comose verá en las aplicaciones. Las dos formas del teorema están relacio-nadas ya que, como vimos en el capítulo anterior, hay una estrecharelación entre formas lineales e hiperplanos. Nosotros demostraremosen primer lugar la forma analítica, y de ahí deduciremos la forma geo-métrica. El lector interesado en leer una presentación de estos teoremasen otro orden puede consultar por ejemplo [44], [26] o [31].

La demostración de la versión analítica del Teorema que presen-tamos es la más habitual, y creemos que también la más elegante. Entodo el capítulo hay que distinguir entre el caso real y el caso complejo,y así lo hacemos. Como consecuencia de la forma analítica del teoremaobtenemos la existencia de formas normantes

Antes de la presentación de las formas geométricas del teorema, he-mos incluido una breve presentación de los Espacios Localmente Con-vexos y de los Espacios Vectoriales Topológicos. No es estrictamentenecesario hacerlo así, y de hecho en este curso sólo utilizamos unaversión del Teorema de separación de Hahn-Banach en Espacios Lo-calmente Convexos en la demostración del Teorema de Goldstine en elCapítulo 8, demostración que no es indispensable para la asignaturacomo comentaremos en su momento.

53

54 3. TEOREMAS DE HAHN-BANACH

El motivo de que hayamos incluido esa pequeña sección sobre Espa-cios Localmente Convexos es doble: por un lado nos permite presentarel Teorema de separación de Hahn-Banach en su contexto más gene-ral, y por otro lado nos sirve de excusa para informarle al alumno dela existencia de tales espacios y que no todo espacio funcional es nor-mable. De todas formas, podemos prescindir de esa sección y haceruna presentación algo menos general de los Teoremas de separación deHahn-Banach tal y como se hace por ejemplo en [24] o [31].

Así como el Teorema de extensión de Hahn-Banach es esencialmenteúnico en su enunciado, existen numerosas versiones más o menos ge-nerales o especializadas del Teorema de separación. La aparentementemás general y de la que se siguen muchas de las otras es nuestro Teo-rema 3.22, debido a Mazur. A continuación hemos presentado algunosde sus corolarios más útiles, pero hay muchas otras versiones posiblesalgunas de las cuales se pueden sugerir como ejercicios.

Seguimos con un estudio de la reflexividad en espacios normados yel estudio del dual del espacio cociente.

En este capítulo comienzan a ser muy relevantes las aplicaciones.Las de los Teoremas de Hahn-Banach son muy numerosas. Hemos in-cluido algunas de las “clásicas”, pero se podrían añadir muchas otras.Debido simplemente a nuestro interés personal en este momento hemoshecho una pequeña reseña de algunas aplicaciones a la Teoría Económi-ca de estos teoremas, pero probablemente no serían las más adecuadaspara contar en clase dado que requieren bastantes definiciones adicio-nales.

Para la presentación del Teorema de extensión de Hahn-Banach he-mos seguido principalmente [8]. La breve introducción a los EspaciosLocalmente Convexos sigue [13] aunque también nos hemos servido de[44] y [26]. Seguimos de nuevo [8] para introducir las versiones geomé-tricas del Teorema de Hahn-Banach. El lector interesado esencialmenteen versiones geométricas del teorema para espacios normados puedeconsultar [24, Ejercicios al final del Capítulo 2].

El Teorema de Extensión de Hahn-Banach

Aunque en este curso usaremos el Teorema de Hahn-Banach masfrecuentemente en el contexto de los espacios normados, el teoremasigue siendo cierto, y se utiliza a menudo en el contexto de espaciosvectoriales topológicos localmente convexos. Incluso en el contexto delos espacios normados, las versiones geométricas del teorema necesitan

3. TEOREMAS DE HAHN-BANACH 55

de las nociones de seminorma y funcional sublineal. Es por ello queantes de enunciar y demostrar el teorema de Hahn-Banach debemosdefinir seminormas y funcionales sublineales.

Definición 3.1. Sea X un espacio vectorial. Una función

p : X −→ [0,+∞)

es una seminorma si verifica1. p(λx) = |λ|p(x), para todo x ∈ X y λ ∈ K.2. p(x+ y) ≤ p(x) + p(y), para todos x, y ∈ X.

Es decir, una seminorma es exactamente igual a una norma salvoen que puede haber elementos x 6= 0 tales que p(x) = 0.

Aunque volveremos sobre ello más adelante, adelantamos que unespacio localmente convexo será un espacio vectorial cuya topologíavendrá definida por medio de una familia de seminormas.

Necesitamos también definir funcionales sublineales.

Definición 3.2. Sea X un espacio vectorial sobre R o C. Un fun-cional sublineal p sobre X es una aplicación p : X −→ R positivamentehomogénea y subaditiva, es decir p verifica

p(λx) = λp(x) para todo λ ∈ R+, y para todo x ∈ Xp(x+ y) ≤ p(x) + p(y) para todos x, y ∈ X

Claramente, toda seminorma es un funcional sublineal, aunque noal revés. En particular una norma es un funcional sublineal.

Puesto que el Lema de Zorn es parte esencial de la demostracióndel Teorema de Hahn-Banach, incluimos aquí su enunciado.

Lema 3.3 (Lema de Zorn). Sea A 6= ∅ un conjunto ordenado, enel que todo subconjunto totalmente ordenado tiene una cota superior(en ese caso se dice que A es inductivo). Entonces todo elemento de Aestá mayorado por un elemento maximal (un elemento a es maximal sia ≤ b implica a = b)

Las demostraciones (y los enunciados) del Teorema de Hahn-Banachson levemente distintos en el caso real y el caso complejo. Merece lapena mencionar que si bien el teorema en el caso real lo probaronindependientemente Hahn (1926) y Banach (1927), la demostración delcaso complejo no apareció hasta 1938 en un artículo de Bohnenblust ySobczyk.

Teorema 3.4 (Hahn-Banach). Sea X un espacio vectorial real,p : X −→ R un funcional sublineal, M ⊂ X un subespacio vectorial de

56 3. TEOREMAS DE HAHN-BANACH

X y f : M −→ R una aplicación lineal dominada por p, es decir, paratodo x ∈M ,

f(x) ≤ p(x).

Entonces existe una aplicación lineal f : X −→ R que extiende a f(es decir, tal que f(x) = f(x) para todo x ∈ M) y que sigue estandodominada por p, es decir, para todo x ∈ X,

f(x) ≤ p(x).

Demostración. Demostraremos primero que podemos extenderf a “una dimensión” más. A continuación el Lema de Zorn operará sumagia.

Sea e ∈ X \M , sea G = M ⊕ [e]. Entonces todo elemento y ∈ Gadmite una única descomposición y = x+ λe, con x ∈M , λ ∈ R. Paratodo y ∈ G descompuesto en la forma indicada definimos

f(y) = f(x) + λc

Claramente f : G −→ R es lineal y extiende a f . Sólo nos falta demos-trar que podemos elegir c = f(e) de manera que f ≤ p en G, es decirde manera que

(2) f(y) = f(x) + λc ≤ p(x+ λe) = p(y)

para todo y ∈ G.Sabemos por hipótesis que (2) es cierta para λ = 0. Para λ > 0,

dividiendo por λ, la ecuación (2) se puede escribir como

f(xλ

)+ c ≤ p

(xλ

+ e)

y por tanto queremos que

c ≤ p(xλ

+ e)− f

(xλ

)es decir

c ≤ ınfx1∈M

p(x1 + e)− f(x1)

Para λ < 0, dividiendo por −λ, la ecuación (2) se puede escribircomo

f(x2)− c ≤ p(x2 − e), con x2 =−xλ,

y por tanto queremos que

c ≥ supx2∈M

f(x2)− p(x2 − e)

3. TEOREMAS DE HAHN-BANACH 57

Es decir, podremos elegir un c que cumpla lo pedido si y sólo si

supx2∈M

f(x2)− p(x2 − e) ≤ ınfx1∈M

p(x1 + e)− f(x1)

Esto es lo mismo que pedir que, para todo x1, x2 ∈M ,

f(x2)− p(x2 − e) ≤ p(x1 + e)− f(x1)

es decir,f(x1) + f(x2) ≤ p(x1 + e) + p(x2 − e).

Pero por hipótesis sabemos que

f(x1) + f(x2) = f(x1 + x2) ≤ p(x1 + x2) = p(x1 + e+ x2 − e) ≤

≤ p(x1 + e) + p(x2 − e)Por tanto efectivamente existe algún c (en general más de uno) que

verifica lo pedido. Nótese que la no unicidad de c hace que tampoco laextensión sea única en general.

Ahora es cuando el lema de Zorn entra en acción: Consideramos elconjunto de pares

A := (H, fH), donde H ⊂ X es un subespacio vectorial

que contiene a M y fH : H −→ R es una aplicación lineal

que extiende a f y está dominada por p.Podemos definir un orden natural para nuestro problema en A como

(H1, fH1) ≤ (H2, fH2) si H1 ⊂ H2 y fH2 extiende a fH1 .

Con este orden A es inductivo: en efecto, sea (Hi, fHi)i∈I un con-junto totalmente ordenado. En ese caso el par (H, fH) definido como

H = ∪iHi

fH(x) = fHi(x) si x ∈ Hi

pertenece a A y es una cota superior de (Hi, fHi)i∈I

Por tanto, puesto que A es inductivo el elemento (M, f) ∈ A es-tá mayorado por un elemento maximal, llamémosle (L, fL). Si L nofuera el espacio total X, usando la primera parte de la demostraciónpodríamos extender f a un subespacio L′ estrictamente mayor que Lde manera que (L, fL) no sería maximal, una contradicción. Por tantoL = X y f = fL es la extensión buscada de f a todo X.

58 3. TEOREMAS DE HAHN-BANACH

Observación 3.5. Merece la pena hacer aquí un par de observa-ciones. En primer lugar que en la demostración del Teorema no hemosusado ninguna topología, por lo que en particular f no tiene por qué sercontinua ni F tiene por qué ser cerrado en X (puesto que ni siquierahemos definido ninguna topología en X)

En segundo lugar mencionar que este Teorema, con toda su poten-cia que tendremos ocasión de aplicar más adelante, tiene también unalimitación que no conviene olvidar. El procedimiento de obtención de fes no constructivo, y además f no es única, ni tenemos forma de elegir“bien” una extensión entre todas las posibles (en particular no podemosen general seleccionar linealmente una extensión). Cuando veamos lasversiones geométricas del teorema, será natural plantearse la relaciónentre la unicidad de la extensión y la geometría del espacio. Hay variosresultados en esta dirección. Un ejemplo de lo que se puede esperar es elTeorema de Taylor-Foguel que nos dice que, dado un espacio de BanachX, para todo Y ⊂ X y para todo y∗ ∈ Y ∗ y∗ tiene una extensión deHahn-Banach única si y sólo si X∗ es estrictamente convexo, es decir,si dados f1, f2 ∈ SX∗,

∥∥f1+f22

∥∥ < 1.

Hemos seguido la presentación más habitual del Teorema. Para cier-tas aplicaciones puede ser interesante observar que el Teorema, con(esencialmente) la misma demostración, sigue siendo cierto si a p lepedimos tan sólo que sea convexa ([1]). Es fácil ver que todo funcionalsublineal es convexo.

Damos a continuación como corolario la versión compleja del teo-rema.

Teorema 3.6 (Hahn-Banach). Sea X un espacio vectorial real ocomplejo, p : X −→ [0,+∞) una seminorma, M un subespacio vecto-rial de X y f : M −→ K (con K = R ó C según X sea real o complejo)una forma lineal dominada por p en módulo, es decir, para todo x ∈M ,

|f(x)| ≤ p(x).

Entonces existe una extensión f : X −→ K de f también dominadapor p en módulo.

Demostración. Supongamos primero que X es un espacio vec-torial real. Puesto que las seminormas son funcionales sublineales, elteorema anterior nos dice que existe una extensión de f , f : X −→ Rtal que f(x) ≤ p(x) para todo x ∈ X. Entonces, cambiando x por −xse tiene que

f(−x) ≤ p(−x)

3. TEOREMAS DE HAHN-BANACH 59

es decir−f(x) ≤ p(x)

y por tanto|f(x)| ≤ p(x)

para todo x ∈ X.

Si X es un espacio vectorial complejo, también lo es real, de maneraque si f : M −→ C es una forma lineal, podemos definir la forma real

g(x) := <(f)(x) : M −→ R

que podemos extender a g con |g(x)| ≤ p(x) para todo x ∈ X por losrazonamientos anteriores.

Ahora, la linealidad compleja de f nos dice que si f(x) = α + ıβentonces

f(ıx) = −β + ıα,

es decir, que para todo x ∈M ,

=(f)(x) = −g(ıx) = −<(f)(ıx)

Por tanto, la forma

f(x) := g(x)− ıg(ıx) : X −→ C

extiende a f . Para ver que f está dominada en módulo por p, dadox ∈ X, sea θ = arg f(x). Entonces

|f(x)| = e−ıθf(x) = f(e−ıθx) = <f(e−ıθx) =

= g(e−ıθx) ≤ p(e−ıθx) = p(x)

lo que demuestra el teorema.

El teorema de Hahn-Banach tiene muchísimas consecuencias y apli-caciones en al Análisis Funcional. La primera de ellas es que, puestoque los espacios de dimensión finita tienen funcionales controlados porla norma, todo espacio normado (y también todo espacio localmenteconvexo) tiene dual topológico no vacío. El siguiente corolario nos diceque no sólo el dual es no vacío, sino que hay suficientes elementos paranormar cada vector de X. Enunciamos y demostramos el resultado enel caso más general de seminormas.

Corolario 3.7. Sea X un espacio vectorial real o complejo, p unaseminorma en X y x ∈ X. Entonces existe una forma lineal f : X −→K tal que, para todo y ∈ X,

|f(y)| ≤ p(y)

60 3. TEOREMAS DE HAHN-BANACH

y tal quef(x) = p(x).

En particular, si X es un espacio normado entonces dado x ∈ Xexiste una forma lineal y continua f de norma 1 tal que

f(x) = ‖x‖

Demostración. Tomamos M = [x] y definimos f : M −→ Kcomo

f(λx) = λp(x)

para todo λ ∈ K. Entonces el Teorema 3.6 nos dice que existe f :X −→ K que cumple lo pedido.

El siguiente resultado también es una consecuencia del teorema.Nos proporciona una “dualidad” entre la norma de los elementos de Xy los de X∗.

Corolario 3.8. Sea X un espacio normado. Entonces, para todox ∈ X,

‖x‖ = supf∈BX∗

|f(x)|

Demostración. En efecto,

|f(x)| ≤ ‖f‖‖x‖y por tanto

supf∈BX∗

|f(x)| ≤ ‖x‖

Por otro lado, tomando f0 un funcional de norma 1 normante de x,como en el corolario anterior, tenemos

‖x‖ = |f0(x)| ≤ supf∈BX∗

|f(x)|

Espacios Localmente Convexos

El contexto natural para las versiones geométricas de los teoremasde Hahn-Banach es el de los espacios localmente convexos. Por elloantes de enunciar y probar dichas versiones geométricas dedicaremosesta sección a la definición y breve estudio de los Espacios LocalmenteConvexos (ELC) en particular.

Los espacios vectoriales topológicos (EVT) son la generalizaciónnatural de los espacios normados en el siguiente sentido: a menudo es

3. TEOREMAS DE HAHN-BANACH 61

necesario estudiar un espacio vectorial con una topología “bien relacio-nada” con la estructura lineal (en el sentido que vamos a precisar acontinuación) pero dicho espacio no es normado. Buena parte -pero notoda- de la teoría (y de la intuición) de espacios normados se puedetrasladar sin excesiva dificultad a este nuevo contexto

Empezamos con una definición.

Definición 3.9. Un espacio vectorial topológico X es un espaciovectorial en el que se ha definido una topología que hace que

1. La aplicación suma + : X ×X −→ X es continua.2. La aplicación producto · : K×X −→ X es continua.

Ejercicio 3.1. Sea X un EVT, y sea x ∈ X. Probar que la apli-cación Tx : X −→ X dada por

Tx(y) = x− y

es un homeomorfismo (es decir, es biyectiva y continua en ambos sen-tidos).

Ya hemos visto que los espacios normados son EVT’s.No vamos a estudiar en esta memoria los EVT’s en general, pues-

to que entendemos que dicho estudio es excesivamente especializadoy que probablemente sea mejor que el contacto inicial de los alum-nos con el Análisis Funcional ocurra en el contexto más “razonable” delos espacios de Banach. Sí queremos en esta sección estudiar sucinta-mente un tipo especial de EVT’s, los Espacios Localmente Convexos(ELC), ya que son el contexto natural para los Teoremas geométricosde Hahn-Banach. Además, dado un espacio de Banach X, tanto (X,w)como (X∗, w∗), que estudiaremos más adelante, son ELC’s. Por ellodefinimos a continuación Espacios Localmente Convexos, y a continua-ción probamos algunas propiedades básicas de los ELC que usamosmás adelante. Cuando estas propiedades lo sean de todos los EVT, nopediremos la convexidad en el enunciado.

Los ELC’s son aquellos EVT en los que cada punto posee una basede entornos formada por conjuntos convexos. Veremos más adelantecómo a partir de un conjunto convexo se puede definir su funcionalde Minkowski que será una seminorma, de manera que probaremos laequivalencia entre tener una base de entornos convexos y tener unatopología definida por seminormas. Elegimos de momento esta últimacomo la definición de ELC, por parecernos más intuitiva inicialmente.

62 3. TEOREMAS DE HAHN-BANACH

Definición 3.10. Sea X un espacio vectorial y sea P una familiade seminormas definidas sobre X. Sea T la topología definida en X quetiene como subbase los conjuntos

W(x0;p;ε) := x ∈ X tales que p(x− x0) < εpara todo x0 ∈ X, p ∈ P y ε > 0, de manera que un conjunto U ⊂ Xes abierto si y sólo si para todo x0 ∈ X existe un entorno de x0

W(x0;p1,...,pn;ε) := x ∈ X tales que pi(x− x0) < ε para todo 1 ≤ i ≤ n

de manera que W(x0;p1,...,pn;ε) ⊂ U . Si además la topología T es Haus-dorff, decimos que X es un Espacio Localmente Convexo.

Es un ejercicio (y como tal lo proponemos) verificar que todo ELCes un EVT. También es un ejercicio verificar que si X es un espacio vec-torial con la topología dada por una familia de seminormas P , entoncesX es Hausdorff si y sólo si

∩p∈Px ∈ X tales que p(x) = 0 = 0.

Parafraseando [1], “if we had our way, all topological vector spaceswould be Hausdorff”. Hacemos nuestra tal afirmación, puesto que notendremos ocasión de trabajar con EVT’s no separados. En nuestrasdefiniciones, si bien no le pedimos a los EVT que sean separados, sí selo pedimos a los ELC.

Recordemos la definición de conjunto convexo.

Definición 3.11. Sea X un espacio vectorial. Un conjunto A ⊂ Xes convexo si para todos a, b ∈ A, el segmento

[a, b] = λa+ (1− λ)b;λ ∈ [0, 1]

está contenido en A

Es fácil ver que A es convexo si y sólo si para todos a1, . . . , an ∈ Ay para todos λ1, . . . , λn ∈ [0, 1] con

∑ni=1 λi = 1 se tiene

n∑i=1

λiai ∈ A.

También es fácil ver que la intersección de conjuntos convexos esconvexo. Puesto que además un espacio vectorialX siempre es convexo,tiene sentido definir la envoltura convexa de un conjunto.

3. TEOREMAS DE HAHN-BANACH 63

Definición 3.12. Sea X un espacio vectorial y sea A ⊂ X. Sedefine la envoltura convexa de A, que denotamos co(A), como la inter-sección de todos los conjuntos convexos que contienen a A. Si ademásX es un EVT, se define la envoltura convexa y cerrada de A, y ladenotamos como co(A), como la intersección de todos los conjuntosconvexos y cerrados que contienen a A.

Ejercicio 3.2. Dado A ⊂ X, demostrar que

co(A) = n∑i=1

λiai; n ∈ N, a1, . . . , an ∈ A, λ1, . . . , λn ∈ [0, 1].

Ejercicio 3.3. Sean X, Y espacios vectoriales. Si T : X −→ Y esuna aplicación lineal y C ⊂ Y es convexo entonces T−1(C) también esconvexo.

Necesitamos dos definiciones más.

Definición 3.13. Sea X un espacio vectorial. Un subconjunto A ⊂X se dice equilibrado si αA ⊂ A para todo α ∈ K tal que |α| ≤ 1.

Obviamente todos los conjuntos equilibrados contienen al origen.La idea de su definición es una cierta “simetría respecto al origen”.

Definición 3.14. Sea X un espacio vectorial. Un subconjunto A ⊂X se dice absorbente si para todo x ∈ X existe un α > 0 tal que x ∈ λApara todo λ ∈ K tal que |λ| > α.

Además, si a ∈ A, A se dice absorbente en a si A−a es absorbente.

Ejercicio 3.4. Dado un espacio vectorial X y una seminorma p :X −→ [0,∞), comprobar que el conjunto

A = x ∈ X tales que p(x) < 1

es convexo, absorbente y equilibrado y que además A es absorbente entodos sus puntos.

El ejercicio anterior muestra que la “bola unidad” abierta asociadaa una seminorma es siempre un conjunto convexo, absorbente en todossus puntos y equilibrado. Lo interesante es que el recíproco también escierto.

Proposición 3.15. Sea X un espacio vectorial y sea A ⊂ X unsubconjunto convexo, absorbente en todos sus puntos y equilibrado. En-tonces existe una única seminorma p : X −→ [0,∞) tal que A = x ∈X tales que p(x) < 1.

64 3. TEOREMAS DE HAHN-BANACH

Demostración. Definimos p : X −→ [0,∞) como

p(x) = ınft tales que t ≥ 0 y x ∈ tA.Tenemos que ver que p está bien definida, que es una seminorma yque A = x ∈ X tales que p(x) < 1. Puesto que A es absorbente,para todo x ∈ X existe t > 0 tal que x ∈ tA, por lo que p está biendefinida. Veamos que p es una seminorma. Claramente p(0) = 0 puestoque 0 ∈ A. Veamos que p(αx) = |α|p(x). Podemos suponer que α 6= 0.Usando que A es equilibrado tenemos que

p(αx) = ınft ≥ 0;αx ∈ tA = ınft ≥ 0;x ∈ t

αA =

= ınft ≥ 0;x ∈∣∣∣∣ tα∣∣∣∣A = ınft ≥ 0;x ∈ t

|α|A =

= |α| ınf t|α|≥ 0;x ∈ t

|α|A = |α|p(x).

Para terminar de comprobar que p es una seminorma nos resta verla propiedad triangular. Observemos como paso previo que si α, β ≥ 0y a, b ∈ A entonces

αa+ βb = (α + β)

α + βa+

β

α + βb

)∈ (α + β)A

por la convexidad de A. Ahora, sean x, y ∈ X con p(x) = α y p(y) = β.Sea ε > 0. Por definición de p,

x ∈ (α + ε)A

ey ∈ (β + ε)A.

Por tanto

x+ y ∈ (α + ε)A+ (β + ε)A = (α + β + 2ε)A

y de aquí se sigue que

p(x+ y) ≤ α + β + 2ε = p(x) + p(y) + 2ε.

Puesto que esto es cierto para todo ε > 0 se tiene la desigualdad trian-gular.

Veamos ahora que

A = x ∈ X tales que p(x) < 1.Si p(x) = α < 1 entonces para todo α < β < 1 se tiene que x ∈ βA ⊂ A(la última inclusión se sigue de que A es equilibrado). Por tanto

x ∈ X tales que p(x) < 1 ⊂ A.

3. TEOREMAS DE HAHN-BANACH 65

Para la otra inclusión, sea a ∈ A. Entonces p(a) ≤ 1. Puesto que Aes absorbente en todos sus puntos, en particular lo es en a y por tantoexiste λ > 0 tal que

a+ λa = y ∈ A.Entonces a = y

1+λy de aquí se sigue que

p(a) =1

1 + λp(y) ≤ 1

1 + λ< 1.

Sólo falta por tanto ver la unicidad de p. Sea q : X −→ [0,∞) talque A = x ∈ X tales que q(x) < 1.

Veamos que p(x) ≤ q(x) para todo x ∈ X. La otra desigualdad seprueba análogamente. Sea x ∈ X y sea α = q(x). Para todo ε > 0

q

(x

α + ε

)=

α

α + ε< 1.

Por tanto xα+ε∈ A y de aquí se sigue que

p(x)

α + ε= p

(x

α + ε

)< 1.

Por tantop(x) < α + ε = q(x) + ε.

Puesto que esto se tiene para todo ε > 0, se sigue que p ≤ q.

El resultado anterior nos invita a formular una definición. Nóte-se previamente que sólo hemos usado que A fuera absorbente en ca-da punto para obtener el menor estricto en la relación A = x ∈X tales que p(x) < 1. En particular nótese que p también es unaseminorma si sólo le pedimos a A que sea absorbente, equilibradoyconvexo.

Definición 3.16. Sea A ⊂ X un conjunto convexo, absorbente yequilibrado. Entonces podemos definir el funcional de Minkowski de A,que a menudo llamaremos j, como la función j : X −→ [0,∞) dadapor

j(x) = ınfλ tales que λ ≥ 0 y x ∈ λA.

Del resultado anterior se sigue que en ese caso el funcional de Min-kowski es una seminorma.

Lema 3.17. Si X es un EVT y A ⊂ X es un abierto entonces A esabsorbente en todos sus puntos.

Demostración. Para todo a ∈ A, se tiene que A − a es entornode 0, y por tanto es absorbente.

66 3. TEOREMAS DE HAHN-BANACH

Tal y como prometimos al principio de la sección, probamos que unELC es precisamente un EVT con una base de entornos convexos.

Proposición 3.18. Sea X un EVT y sea

U = A ⊂ X tales que A es abierto, convexo y equilibrado .

Entonces X es un ELC si y sólo si U es una base de entornos delorigen.

Demostración. Si X es un ELC, según la Definición 3.10, losentornos de la forma W(x0;p1,...,pn;ε) := x ∈ X tales que pi(x − x0) <ε para todo 1 ≤ i ≤ n, que son claramente abiertos, convexos y equi-librados forman una base entornos del origen.

La otra implicación es más fácil.

Más adelante necesitaremos este resultado.

Proposición 3.19. Sea X un EVT. Sean A ⊂ X un subconjuntocompacto y B ⊂ X un subconjunto cerrado con A ∩ B = ∅. Entoncesexiste un entorno abierto del origen U tal que A + U y B + U no seintersecan.

Proposición 3.20. Sea X un EVT y f : X −→ K una formalineal. Entonces son equivalentes:

(i) f es continua.(ii) f es continua en algún punto.(iii) f es continua en el origen.(iv) ker f es cerrado.

Demostración. La equivalencia entre (i), (ii) y (iii) se sigue delhecho de que las traslaciones en los EVT’s son homeomorfismos.

Claramente (iii) implica (iv).

Veamos ahora que (iv) implica (iii). Supongamos que ker f es ce-rrado y sea (xα)α∈A ⊂ X una red tal que xα → 0. Sea también u ∈ Xtal que f(u) = 1. Si f(xα) 6→ 0 entonces podemos suponer (pasando auna subred en caso necesario) que existe ε > 0 tal que |f(xα)| > ε paratodo α. Sea

yα = u− f(u)

f(xα)xα

3. TEOREMAS DE HAHN-BANACH 67

y observemos que para todo α se tiene que yα ∈ ker f . Además clara-mente yα → u. Por ser ker f cerrado se tiene que u ∈ ker f en contra-dicción con que f(u) = 1. Por tanto se ha de tener que f(xα) → 0, loque nos dice que f es continua en el origen.

Como ya vimos en la forma analítica del Teorema de Hahn-Banach,las seminormas y los funcionales sublineales juegan un papel destacadoen su enunciado y demostración. Ya hemos visto que dado un EVT,las seminormas están asociadas a los conjuntos convexos, absorbentesy equilibrados. El siguiente resultado, cuya demostración no incluimospor ser totalmente análoga a la de la Proposición 3.15 nos dice que sino le pedimos al conjunto que sea equilibrado lo que obtenemos no esuna seminorma sino un funcional sublineal. Recuérdese que ya hemosvisto que los conjuntos abiertos son absorbentes.

Proposición 3.21. Sea X un EVT y sea A ⊂ X un subconjun-to abierto y convexo que contiene al origen. Entonces el funcional deMinkowski de A, jA : X −→ [0,∞) definido como

jA(x) = ınfλ tales que λ ≥ 0 y x ∈ λA

es un funcional sublineal, y A = x ∈ X tales que jA(x) < 1.

Antes de enunciar el teorema de Hahn-Banach en forma geométri-ca, debemos comprobar que los resultados básicos referidos a hiperpla-nos que probamos para espacios normados siguen siendo ciertos en elcontexto de EVT’s. En particular se prueba análogamente al caso deespacios normados que si X es un EVT y H ⊂ X es un hiperplanoentonces H es cerrado o denso. Que un hiperplano es el núcleo de unaforma lineal sigue siendo obviamente cierto puesto que ahí los únicosrazonamientos involucrados eran algebraicos, no topológicos. Por últi-mo necesitaremos que si H es un hiperplano núcleo de una forma linealf entonces H es cerrado si y sólo si f es continua. Esto ya lo hemosprobado en la Proposición 3.20.

Teoremas de separación de Hahn-Banach

El siguiente resultado se debe a Mazur.

Teorema 3.22 (Hahn-Banach, forma geométrica). Sea X un espa-cio vectorial topológico (real o complejo), A ⊂ X un conjunto convexoabierto no vacío, L un subespacio afín de X que no interseca a A.Entonces existe un hiperplano afín cerrado H que contiene a L y nointerseca a A.

68 3. TEOREMAS DE HAHN-BANACH

Demostración. Demostramos primero el caso real. Suponemosque 0 ∈ A (si no es así, podemos considerar A − a y L − a paracualquier a ∈ A).

Por ser A un abierto convexo que contiene al origen es absorben-te, y podemos definir su funcional de Minkowski p : X −→ [0,∞).Ya hemos visto que p es un funcional sublineal y que A = x ∈X tales que p(x) < 1.

Sea x0 ∈ L y consideremos el subespacio vectorial F = L ⊕ x0.Entonces F es el subespacio vectorial generado por L. Puesto que, porhipótesis, 0 6∈ L, L es un hiperplano afín de F .

Por tanto existe una forma (no necesariamente continua) f : F −→R tal que L = x ∈ F ; f(x) = 1. Por tanto f(x) ≤ p(x) para todox ∈ L (porque para todo x ∈ L se tiene que x 6∈ A y por tantop(x) ≥ 1). Veamos que también f(x) ≤ p(x) para todo x ∈ F : Seax ∈ F . Si f(x) ≤ 0, automáticamente se sigue que f(x) ≤ p(x). Si,en cambio f(x) > 0 consideramos el elemento x

f(x)∈ F . Puesto que

f(

xf(x)

)= 1, se tiene que x

f(x)∈ L y entonces

p(x)

f(x)= p

(x

f(x)

)≥ 1,

de dondef(x) ≤ p(x).

Entonces podemos aplicar la forma analítica del Teorema de Hahn-Banach, caso real, puesto que p es un funcional sublineal, y tenemosque existe una forma lineal f : X −→ R que extiende f y que estádominada por p (f(x) ≤ p(x) para todo x ∈ X).

Sea ahora el hiperplano afín H := x ∈ X; f(x) = 1. Claramentecontiene a L, puesto que f extiende a f . Además H ∩ A = ∅ porquesi y ∈ H entonces p(y) ≥ f(y) = 1 y por tanto y 6∈ A. Para acabar,veamos que H es cerrado: Es un ejercicio comprobar que, al igual queocurría con los hiperplanos vectoriales, un hiperplano afín es cerradoo denso en X. Pero H no puede ser denso puesto que no interseca alabierto A.

Ahora supongamos que X es un espacio vectorial complejo. Usandolos razonamientos anteriores podemos hallar un hiperplano afín real H0

que contiene a L y que no interseca a A. Sabemos que existe x0 ∈ Ltal que H0 = x0 + H ′0, con H ′0 un hiperplano vectorial real. EntoncesH ′ := H ′0 ∩ ıH ′0 es un hiperplano vectorial complejo y H = x0 + H ′ esun hiperplano afín complejo que no interseca a A y que contiene a L,

3. TEOREMAS DE HAHN-BANACH 69

ya que L = x0 + L′, donde L′ es un espacio vectorial complejo y portanto ıL′ = L′.

Se pueden dar ahora una amplia variedad de corolarios de la formageométrica del Teorema. Propondremos alguno a continuación y otrosirán en los ejercicios. Es conveniente mencionar que muy a menudo esnecesario fabricarse teoremas de separación “tipo Hahn-Banach” a me-dida para el problema en que se está trabajando. Esto ocurre a menudo,por ejemplo, en Economía Matemática, donde los teoremas geométri-cos de Hahn-Banach se usan profusamente pues son parte esencial de lademostración de los Teoremas del Estado del Bienestar sobre los que sebasa casi toda la Teoría Económica y Financiera moderna. Un ejemplo(entre muchos) de esta construcción ad hoc de un teorema no trivial“tipo Hahn-Banach” se puede ver en [43].

Corolario 3.23. Sea X un EVT real, A ⊂ X un subconjuntoabierto convexo no vacío y B ⊂ X un subconjunto convexo no vacío talque A ∩ B = ∅. Entonces existe una forma lineal y continua f ∈ X∗ yun α ∈ R tales que, para todos x ∈ A, y ∈ B,

f(x) < α ≤ f(y),

es decir, existe un hiperplano cerrado afín (f−1(α)) que separa A yB.

Demostración. El conjunto

C = A−B := a− b; a ∈ A, b ∈ B = ∪b∈B(A− b)

(no A \ B!!) es abierto, por ser unión de abiertos, y convexo (si c1 =x1 − y1 ∈ C, c2 = x2 − y2 ∈ C, entonces λc1 + (1 − λ)c2 = λx1 +(1− λ)x2− λy1 + (1− λ)y2 ∈ C por la convexidad de A y B). AdemásC es no vacío y no contiene al origen. Usando el teorema podemosencontrar un hiperplano afín cerrado que pasa por el origen (es decir, unhiperplano vectorial cerrado) que no corta a C. Usando la convexidadde C podemos encontrar f ∈ X∗ tal que f(x) < 0 para todo c ∈ C.Por tanto, para todo x ∈ A, y ∈ B

f(x− y) = f(x)− f(y) < 0

y por tanto, si llamamos

α = ınfy∈B

f(y)

tenemos, para todo x ∈ A, y ∈ B

f(x) ≤ α ≤ f(y)

70 3. TEOREMAS DE HAHN-BANACH

pero ahora, como A es abierto, se tiene que f(x) < α para todo x ∈ A,ya que si no fuera así, existiría x0 ∈ A tal que f(x0) = α. Supongamospor ejemplo que α > 0. Por la continuidad del producto, existiría ε > 0tal que (1 + ε)x0 ∈ A, y tendríamos que f((1 + ε)x0) ≥ α. Si α < 0 serazona análogamente.

El mismo corolario admite una versión compleja

Corolario 3.24. Sea X un EVT complejo, A ⊂ X un subconjuntoabierto convexo y equilibrado y B ⊂ X un subconjunto convexo novacío tal que A ∩ B = ∅. Entonces existe una forma (compleja) linealy continua f ∈ X∗ y un α > 0 tales que, para todos x ∈ A, y ∈ B,

|f(x)| < α ≤ |f(y)|,

es decir, existe un hiperplano cerrado afín (f−1(α)) que separa A yB.

Demostración. [8, Corollary 4, p. 32]

Finalmente damos las versiones real y compleja de un teorema deseparación bastante utilizado. Lo enunciamos y probamos en el caso deespacios localmente convexos.

Corolario 3.25. Sea X un ELC real. Sea A ⊂ X un subconjuntocompacto, convexo no vacío y B ⊂ X un subconjunto cerrado convexono vacío que no interseca a A. Entonces existe un hiperplano afín ce-rrado que separa estrictamente A y B, esto es, existe f ∈ X∗ y α ∈ Rtales que

supx∈A

f(x) < α < supy∈B

f(y)

Demostración. Por la Proposición 3.19 sabemos que existe unentorno abierto del origen U tal que A + U y B + U cumplen lashipotesis del Corolario 3.23 y por tanto existen f ∈ X∗ y α ∈ R talesque, para todos x ∈ A+ U , y ∈ B + U ,

f(x) < α < f(y),

la última desigualdad es estricta porque B es abierto, razonando comolo hicimos en el Corolario 3.23 para A.

La versión compleja del Corolario es la siguiente

Corolario 3.26. Sea X un ELC complejo, Hausdorff. Sea A ⊂ Xun subconjunto compacto, convexo equilibrado no vacío y B ⊂ X unsubconjunto cerrado convexo no vacío que no interseca a A. Entonces

3. TEOREMAS DE HAHN-BANACH 71

existe un hiperplano afín cerrado que separa estrictamente A y B, estoes, existe f ∈ X∗ y α > 0 tales que para todos x ∈ A, y ∈ B,

|f(x)| < α < |f(y)|

Demostración. [8, Corollary 6 p. 33]

Reflexividad

Notemos que si tenemos un espacio normado X podemos definiruna aplicación canónica

J : X −→ X∗∗

dada por la relaciónJ(x)(x∗) = x∗(x)

para todos x ∈ X, x∗ ∈ X∗. Es un sencillo ejercicio comprobar que Jestá bien definida (es decir, que para todo x ∈ X la aplicación J(x) :X∗ −→ K es lineal y continua). Además, del Teorema de Hahn-Banachse sigue que

‖J(x)‖ = supx∗∈BX∗

|J(x)(x∗)| = supx∗∈BX∗

|x∗(x)| = ‖x‖

y por tanto J es una isometría (no necesariamente sobreyectiva).

Si X es un espacio de Banach se sigue fácilmente que J(X) ⊂ X∗∗

es un espacio cerrado. Si X no es un espacio de Banach, entoncesJ(X) ⊂ X∗∗ es un subespacio cerrado en X∗∗. Puesto que X∗∗ sí es unespacio de Banach se sigue que J(X) es la compleción de X (en X∗∗).Esta compleción es única en el siguiente sentido:

Si X1 es otro espacio de Banach tal que X ⊂ X1 y X es denso enX1 entonces X1 y J(X) son isométricos. Veámoslo. Sea

θ : J(X) −→ X1

la aplicación dada porθ(J(x)) = x.

θ es claramente una isometría y por tanto se extiende por densidad auna isometría

θ : J(X) −→ X1.

Sólo nos falta comprobar que θ es sobreyectiva. Sea x1 ∈ X1. Puestoque X es denso en X1, existe una sucesión (xn)n ⊂ X tal que xn → x1.

72 3. TEOREMAS DE HAHN-BANACH

Entonces la sucesión (J(xn))n ⊂ J(X) es de Cauchy y por tanto existey ∈ J(X) tal que J(xn)→ y. Entonces

θ(J(xn))→ θ(y)

y tambiénθ(J(xn))→ x1

por lo que x1 = θ(y) lo que termina la demostración.

Decimos que un espacio X es reflexivo si la aplicación canónicaJ : X −→ X∗∗ es sobreyectiva. Veremos más adelante que si 1 < p <∞ entonces `p y Lp[0, 1] son espacios reflexivos. En cambio, veremostambién que c0 y `1 no son reflexivos.

Un espacio es reflexivo si la inyección canónica J : X −→ X∗∗

es sobreyectiva. En [27], James muestra un ejemplo de un espacio noreflexivo X tal que existe una isometría sobreyectiva (no la canónica,naturalmente) θ : X −→ X∗∗.

Dual de un espacio cociente

En la siguiente sección probamos dos resultados útiles a menudo.Ambos pueden ser considerados simples ejercicios y, con alguna suge-rencia, pueden ser resueltos por los propios alumnos.

Proposición 3.27. Sea X un espacio de Banach y M ⊂ X unsubespacio vectorial cerrado. Si M⊥ = x∗ ∈ X∗ tales que x∗(x) =0 para todo x ∈M entonces

X∗/M⊥ = M∗

donde el igual en la línea de arriba denota que ambos espacios sonlinealmente isométricos.

Demostración. Sea θ : X∗/M⊥ −→M∗ la aplicación dada por

θ([x∗]) = x∗|M ,

es decir, para todo m ∈M ,

θ([x∗])(m) = x∗(m).

θ está bien definida y es lineal.Si θ([x∗]) = 0 entonces x∗ ∈ M⊥ y por tanto [x∗] = 0, por lo que θ

es inyectiva.

3. TEOREMAS DE HAHN-BANACH 73

Además, dado m∗ ∈ M∗, podemos extenderlo por Hahn-Banach ax∗ ∈ X∗. Es claro que θ([x∗]) = m∗ por lo que θ es sobre.

Veamos que es una isometría. Sea x∗ ∈ X∗ y sea m⊥ ∈M⊥. Enton-ces

‖θ([x∗])‖ = ‖θ([x∗ +m⊥])‖ = supm∈BM

‖x∗(m) +m⊥(m)‖ ≤ ‖x∗ +m⊥‖,

y tomando ínfimos en m⊥ ∈M⊥ se tiene que

‖θ([x∗])‖ ≤ ‖[x∗]‖.

Para la otra desigualdad, dado x∗ ∈ X∗, sea m∗ ∈ M∗ dado porm∗ = X∗|M y sea y∗ una extensión de Hahn-Banach de m∗ con la mismanorma (‖y∗‖ = ‖m∗‖). Entonces [x∗] = [y∗], m∗ = θ([x∗]) = θ([y∗]) y

‖θ([x∗])‖ = ‖m∗‖ = ‖y∗‖ ≥ ‖[y∗]‖ = ‖[x∗]‖,lo que termina la demostración.

Proposición 3.28. Sea X un espacio de Banach y M ⊂ X unsubespacio vectorial cerrado. Entonces

(X/M)∗ = M⊥

donde de nuevo el signo igual denota que los espacios son linealmenteisométricos.

Demostración. Sea Q : X −→ X/M la aplicación cociente y sea

θ : (X/M)∗ −→M⊥

la aplicación dada porθ(y∗) = y∗ Q.

Veamos en primer lugar que θ termina en M⊥: Para todo m ∈ My para todo y∗ ∈ (X/M)∗,

θ(y∗)(m) = y∗ Q(m) = y∗(0) = 0.

Es claro que θ es lineal. Veamos que es una isometría:Para todo y∗ ∈ (X/M)∗,

‖θ(y∗)‖ = ‖y∗ Q‖ ≤ ‖Q‖‖y∗‖ = ‖y∗‖lo que nos da una de las desigualdades.

Para la otra, dado y∗ ∈ (X/M)∗ y dado ε > 0 sea [x] ∈ X/M talque ‖[x]‖ < 1 y tal que

|y∗[x]| ≥ ‖y∗‖ − ε.

74 3. TEOREMAS DE HAHN-BANACH

Por la definición de la norma cociente existe m ∈M tal que

‖x+m‖ ≤ 1

y entonces

‖θ(y∗)‖ = ‖y∗ Q‖ ≥ |(y∗ Q)(x+m)‖ =

= |(y∗ Q)(x)‖ = |y∗([x])| ≥ ‖y∗‖ − ε,y de aquí se sigue que, para todo y∗ ∈ (X/M)∗,

‖θ(y∗)‖ ≥ ‖y∗‖

por lo que θ es una isometría (y, en consecuencia, inyectiva).

Sólo falta ver que θ es sobreyectiva. Para ello, sea m⊥ ∈ M⊥. Seay∗ : X/M −→ K la forma dada por

y∗([x]) = m⊥(x).

y∗ está bien definida, es lineal, y es continua porque, para todo m ∈M ,

|y∗([x])| = |m⊥(x)| = |m⊥(x+m)| ≤ ‖m⊥‖‖x+m‖

y por tanto, tomando ínfimos en m, se tiene que

|y∗(x)| ≤ ‖m⊥‖‖[x]‖.

Por tanto y∗ ∈ (X/M)∗, y claramente θ(y∗) = m⊥, lo que termina lademostración.

Aplicaciones

Las aplicaciones de los Teoremas de Hahn-Banach tanto a proble-mas del Análisis Funcional como a problemas más “aplicados” son de-masiado numerosos para incluir en esta memoria ni siquiera una can-tidad significativa de ellos. Nos limitaremos a mencionar algunas deestas aplicaciones.

Límites de Banach: Demostrar que existe un funcional lineal Ldefinido sobre `∞ tal que

‖L‖ = 1Si x = (xn) ∈ c entonces L(x) = lımn→∞ xnSi x = (xn) ∈ `∞ y xn ≥ 0 para todo n ∈ N entonces L(x) ≥ 0.Si x = (xn) ∈ `∞ y llamamos x′ = (x2, x3, . . .) entonces L(x′) =L(x)

3. TEOREMAS DE HAHN-BANACH 75

Esta es una de las aplicaciones más clásicas del Teorema de Hahn-Banach y se puede consultar en muchos libros. Dos presentaciones ade-cuadas para este curso pueden ser las de [13, p. 82] o [24, Ejercicio 19,p.39].

Existencia de medidas sobre el círculo unidad invariantespor rotaciones: S. Banach estaba intentando resolver este problemacuando probó el Teorema de Hahn-Banach (y a continuación lo aplicópara resolver el problema). Se puede ver una presentación por ejemploen [22].

Sea T = z ∈ C tales que |z| = 1. Entonces se tiene.

Teorema 3.29. Existe una medida finitamente aditiva invariantepor rotaciones definida sobre la σ-álgebra de todas las partes de T. Esdecir, existe una función

m : P(T) −→ [0, 1]

tal quem(T) = 1.Para todos S, T ∈ P(T) con S ∩ T = ∅ se tiene

m(S ∪ T ) = m(S) +m(T ).

Para toda rotación f : T −→ T (dada por f(z) = zeıθ) y paratodo S ∈ P(T) se tiene

m(f(S)) = m(S).

Aplicaciones Económicas Aunque probablemente no se puedandesarrollar en clase porque nos separaría excesivamente del núcleo dela asignatura, si los alumnos mostraran interés en ello se podrían co-mentar aquí algunas aplicaciones de los Teoremas de Hahn-Banach a laMatemática Económica. Hay una gran cantidad de tales aplicaciones,mencionaremos aquí brevemente las dos que consideramos principales.La primera son los Teoremas del Estado del Bienestar, o Teoremas deArrow-Debreu, demostrados en 1954 ([3] que merecieron un Premio No-bel y que forman la base de la Teoría Económica moderna. La segundaes el llamado Teorema Fundamental de la Valoración de Activos, unode los pilares de la Matemática Financiera, y pieza clave en los trabajossobre la valoración de opciones de Black y Scholes [9, 10] y [34], quetambién resultaron premiados con un Premio Nobel.

76 3. TEOREMAS DE HAHN-BANACH

Teoremas del estado del bienestar. Se pueden consultar encualquier texto riguroso de Microeconomía. Una presentaciónatractiva para un matemático se puede ver por ejemplo en [17].No podemos introducir ahora toda la notación necesaria paraenunciar y demostrar los teoremas, pero mencionaremos sim-plemente que en uno de los pasos se separan dos conjuntos porel Teorema de separación de Hahn-Banach, y la forma del dualasociada al hiperplano separador se puede interpretar como un“vector de precios” que a cada “vector de bienes” le asocia suvalor.Teorema fundamental de la valoración de activos. Estees uno de los resultados más utilizados en las técnicas de valo-ración de Derivados Financieros, y nos dice que la ausencia dearbitraje, una hipótesis muy razonable económicamente sobrelos mercados es equivalente a la existencia de una medida encierto espacio de probabilidad con respecto de la cual ciertosprocesos de precios forman una martingala. Si bien las formasfinito-dimensionales del teorema son razonablemente simples,las formas más generales son de una gran complejidad, no eco-nómica sino matemática. El lector interesado en este tema pue-de consultar por ejemplo [14] y la bibliografía que allí aparece.

Teorema bipolar Sea X un espacio normado y sea M ⊂ X yN ⊂ X∗ dos conjuntos no vacíos. Definimos la polar de M como

M0 = x∗ ∈ X∗ tales que |x∗(x)| ≤ 1 para todo x ∈M

y la polar de N como

N0 = x ∈ X tales que |x∗(x)| ≤ 1 para todo x∗ ∈ N.

Obviamente hay una cierta incoherencia en la definición tal y como lahemos presentado, puesto que N0 debiera ser un subconjunto de X∗∗;para ser más estrictos debiéramos haber llamado a N0 algo así como“prepolar”, y haber utilizado una notación como 0N o algo así, como sehace en algunos textos. En realidad el contexto natural para la nociónde polar de un conjunto es el de los pares duales, y en ese contextose reduce la ambigüedad, pero no vamos a incluir en esta memoria lanoción de par dual, por lo que nos limitamos a presentar estas ideas enel contexto de los espacios normados.

Ejercicio 3.5. Para todos M y N como en la definición M0 y N0

son conjuntos cerrados, convexos y equilibrados.

3. TEOREMAS DE HAHN-BANACH 77

La noción de polar está muy relacionada con la noción de anuladorde un subespacio (que se corresponde con el subespacio ortogonal enespacios de Hilbert).

Definición 3.30. Sea M ⊂ X un subespacio. Entonces definimossu anulador M⊥ como

M⊥ = x∗ ∈ X∗ tales que x∗(x) = 0 para todo x ∈MEjercicio 3.6. Si M ⊂ X es un subespacio entonces M0 = M⊥

Ejercicio 3.7. Si B ⊂ A entonces A0 ⊂ B0.

Con esto ya podemos probar el siguiente teorema, conocido comoTeorema (de la) bipolar. También es válido en el contexto más ampliode par dual.

Teorema 3.31. Sea X un espacio normado, M ⊂ X. Entonces

M00 := (M0)0 = coe(M)

donde coe(M) es la envoltura convexa equilibrada y cerrada de M .

Demostración. Sea A = ∩i∈IAi donde Ai; i ∈ I son todos losconjuntos cerrados convexos y equilibrados que contienen a M . Hayque probar que M00 = A.

En primer lugar, puesto que M es cerrado convexo y equilibrado setiene que A ⊂M00.

Para el otro contenido, sea x0 6∈ A. Como A es cerrado y convexo,usando el Teorema de Hahn-Banach se tiene que existe x∗ ∈ X∗, α ∈ Ry ε > 0 tales que, para todo a ∈ A

<x∗(a) < α < α + ε < <x∗(x0).Por ser A convexo y equilibrado sabemos que 0 ∈ A, y por tanto

0 = x∗(0) < α.

Entonces, sustituyendo x∗ por x∗

αse tiene que existe ε > 0 tal que, para

todo a ∈ A,<x∗(a) < 1 < 1 + ε < <x∗(x0).

Si a ∈ A y x∗(a) = |x∗(a)|eıθ entonces e−ıθa ∈ A (por ser A equili-brado) y por tanto

|x∗(a)| = <x∗(e−ıθa) < 1 < 1 + ε < <x∗(x0).Puesto que eso ocurre para todo a ∈ A, se sigue que x∗ ∈ A0. NotemosqueM ⊂ A. Por tantoA0 ⊂M0, así que x∗ ∈M0. Pero esto implica quex0 6∈ M00. Es decir, hemos probado que el complementario de A estácontenido en el complementario de M00, es decir, que M00 ⊂ A.

78 3. TEOREMAS DE HAHN-BANACH

El lector de estas notas interesado en aplicaciones económicas delos teoremas de Hahn-Banach, puede consultar [4] para ver una curiosaaplicación del Teorema Bipolar a lo que Delbaen llama “coherent riskmeasures”, medidas del riesgo de un agente económico “coherentes” encierto sentido.

Prácticas sugeridas

Ejercicio 3.8. Comprobar que todo ELC es un EVT.

Ejercicio 3.9. Sea X un EVT y x0 ∈ X. Entonces la aplicacióntx0 : X −→ X dada por tx0(x) = x + x0 es biyectiva, continua y deinversa continua (es decir, es un homeomorfismo). Como consecuencia,los trasladados de una base de entornos del origen forman una base deentornos de cualquier punto. Análogamente, para todo 0 6= α ∈ K laaplicación hα : X −→ X definida por hα(x) = αx también es unhomeomorfismo.

Ejercicio 3.10. Sea X un espacio vectorial complejo. Si F1 : X −→R es una forma lineal considerando X como espacio vectorial real, de-mostrar que F : X −→ C definida como

F (x) = F1(x)− ıF1(ıx)

es una forma lineal sobre X considerado como espacio vectorial com-plejo.

Ejercicio 3.11. Si X es un espacio de Banach de dimensión in-finita, demostrar que existen conjuntos convexos C1 y C2 tales queC1 ∪ C2 = X, C1 ∩ C2 = ∅ y tanto C1 como C2 son densos en X.Sugerencia: Considérese una forma lineal no continua y los dos se-miespacios en que divide a X.

Ejercicio 3.12. Demostrar que un espacio de Banach X es refle-xivo si y sólo si X∗ es reflexivo.

Ejercicio 3.13. Demostrar que si un espacio de Banach X es re-flexivo entonces todo subespacio cerrado Y ⊂ X también es reflexivo.

Capítulo 4

El Teorema de Baire y sus consecuencias: ElPrincipio de Acotación Uniforme y el Teorema de

la Gráfica Cerrada.

Los Teoremas de la Aplicación Abierta, de la Gráfica Cerrada, elde Banach-Steinhaus y el principio de Acotación uniforme, junto con elTeorema de Hahn-Banach ya estudiado forman la base de la Teoría deEspacios de Banach y son herramientas indispensables para el estudiode los operadores entre espacios de Banach. Los estudiamos en estecapítulo. Todos ellos tienen en común el que su demostración más usuallos deriva del Teorema de Baire. Quizás merezca la pena mencionarque varias de las consecuencias de estos teoremas se pueden demostrardirectamente por métodos de joroba deslizante.

La importancia de estos resultados se manifiesta en que en todo elresto de la memoria se usarán frecuentemente.

Una posibilidad a la hora de presentar estos resultados es utilizar ellenguaje de las categorías de Baire para obtener con poco más esfuerzoversiones algo más finas de estos resultados. Sin embargo, dado queno vamos a necesitar esas versiones más finas en este curso, hemosoptado por no usar dicho lenguaje de categorías para mantener unapresentación más simple.

El Principio de Acotación Uniforme nos informa acerca de la posi-bilidad de garantizar que una familia de operadores es “uniformementeacotada” sabiendo que es “puntualmente acotada”. Antes de enunciarformalmente ese teorema veamos otro resultado muy conocido y útil, elTeorema de Arzela-Ascoli, que también nos habla, aunque en otro con-texto, de la posibilidad de obtener una acotación “uniforme” partiendode una acotación “puntual”.

Seguimos el capítulo estudiando las otras dos aplicaciones antesmencionadas del Teorema de Baire al Análisis Funcional, los Teoremasde la Gráfica Cerrada y de la Aplicación Abierta.

79

80 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Como una primera aplicación de estos resultados estudiamos lasproyecciones en espacios de Banach, lo que nos da pie a definir subes-pacios complementados. No es sencillo en general demostrar si un de-terminado subespacio está o no complementado, ni es obvio presentarejemplos de subespacios no complementados sin usar resultados profun-dos. Por ello, mostramos en este capítulo que c0 no está complementadoen `∞.

Terminamos el capítulo viendo otro de los teoremas fundamentalesdel Análisis Funcional, aunque su demostración no está relacionada conlos anteriores, el Teorema de Stone-Weierstrass. Por su importancia enmuchas aplicaciones, creemos necesario enunciarlo y probarlo en estecurso. Su principal aplicación en este curso la veremos en el Capítulo11, cuando se utilizará para estudiar Análisis de Fourier en el marcode la Teoría de espacios de Hilbert.

Con el paso del tiempo han ido apareciendo diferentes demostracio-nes de este teorema fundamental. Entre ellas, una demostración “direc-ta”, utilizando los polinomios de Bernstein, una demostración utilizan-do el Teorema de Korovkin (véase por ejemplo [31, p. 40]), o una demos-tración razonablemente corta, pero que utiliza el Teorema de Alaoglu,el Teorema de Krein-Milman y la descripción del dual de C(K) comoel espacio de medidas de Radon (véase por ejemplo [13, p. 145]). Final-mente hemos elegido la demostración seguida en [12, p. 137] puesto queno utiliza resultados profundos adicionales y a la vez resulta, creemos,razonablemente instructiva y sencilla.

Al igual que ocurría con el Teorema de Hahn-Banach, son innu-merables las aplicaciones de los resultados de este capítulo al AnálisisFuncional y a otras áreas de la matemática. Presentamos brevementeal final del capítulo algunas de las aplicaciones que nos han parecidomás adecuadas para este curso.

Para la preparación de este capítulo hemos seguido sobre todo [31]y [24], con la adición de [12] para el estudio del Teorema de Stone-Weierstrass.

El Teorema de Ascoli-Arzela

Antes de enunciar y probar el Teorema de Ascoli-Arzela y el Princi-pio de Acotación Uniforme veamos que responde a una pregunta natu-ral. Observemos que una familia de funciones continuas de un espaciométrico en otro puede ser puntualmente acotada sin serlo uniforme-mente. Por ejemplo, consideremos las funciones fn ∈ C([0, 1])

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 81

fn(t) =

n2t , si 0 ≤ t ≤ 1

n

1t, si 1

n< t ≤ 1

Esta familia está puntualmente acotada ya que fn(0) = 0 paracada n ∈ N y |fn(t)| ≤ 1

tpara todo t ∈ (0, 1]. Pero en cambio no están

uniformemente acotadas (es decir, no admiten una misma cota validapara todo n y para todo t) ya que fn( 1

n) = n para todo n ∈ N.

Precisamente el Teorema de Ascoli-Arzela nos da condiciones sufi-cientes para poder garantizar la acotación uniforme.

Vamos a trabajar en C(T ), el espacio de las funciones continuasdefinidas sobre un compacto T que suponemos metrizable.

Previamente necesitamos unas definiciones.Ya sabemos que toda función f ∈ C(T ) es de hecho uniformemente

continua, donde la “uniformidad” es en los t ∈ T . A un subconjuntoE ⊂ C(T ) le podemos pedir que sea equicontinuo en t, y esto va a seruna continuidad uniforme en f ∈ E.

Definición 4.1. Sea T un espacio compacto metrizable y sea E ⊂C(T ). E se dice equicontinuo en t ∈ T si para todo ε > 0 existe δ > 0tal que para todo f ∈ E, si d(s, t) < δ entonces |f(t)− f(s)| < ε.

Definición 4.2. E ⊂ C(T ) se dice acotado en t ∈ T si

supf∈E|f(t)| <∞.

Teorema 4.3 (Ascoli-Arzela). Sea T un espacio compacto metri-zable y sea E ⊂ C(T ). Supongamos que E es un conjunto acotado yequicontinuo en t para todo t ∈ T . Entonces E ⊂ C(T ) es precompacto(en particular E está acotado en la norma del supremo, es decir E estáuniformemente acotado). Por tanto, toda sucesión de E contiene unasubsucesión uniformemente convergente.

Demostración. Tenemos que probar que E es precompacto. Seaε > 0. Por ser E equicontinuo en todo punto, para todo t ∈ T existeδt > 0 tal que para todo f ∈ E y para todo s ∈ B(t, δt)

|f(s)− f(t)| < ε.

El conjunto B(t, δt); t ∈ T es un recubrimiento abierto de T ypor ser T compacto existen t1, . . . , tn ∈ T tales que, llamando δi = δti ,

T = ∪ni=1B(ti, δi).

Por ser E acotado en todo punto, existen α1, . . . , αn > 0 tales que|f(ti)| ≤ αi para todo f ∈ E, y para todo 1 ≤ i ≤ n.

82 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Sea ahora α = maxiαi + ε. Entonces para todo t ∈ T existe i ∈1, . . . , n tal que para todo f ∈ E

|f(t)| = |f(t)− f(ti) + f(ti)| ≤ ε+ |f(ti)| ≤ α

y por tanto E está uniformemente acotado en T , es decir E está acotadoen C(T ). Veamos que de hecho E es precompacto. Sea

Dα = k ∈ K tales que |k| ≤ α

y para toda f ∈ E sea

e(f) = (f(t1), . . . , f(tn)) ∈ Dnα.

El Teorema de Heine-Borel nos dice que Dnα es un conjunto compacto

de Kn (con cualquiera de sus normas). Consideramos por ejemplo lanorma ∞ en Kn. Por ser Dn

α compacto existe una cantidad finita debolas V1, . . . , Vm de radio ε que cubren Dn

α.Ahora, para cada 1 ≤ j ≤ m, si

Vj ∩ e(f); f ∈ E 6= ∅

elijamos un fj ∈ E tal que e(fj) ∈ Vj.Vamos entonces a mostrar que las bolas de centros fj y radio 5ε

forman un recubrimiento de E:Sea f ∈ E. Puesto que los Vj forman un recubrimiento de Dn

α

sabemos que existe j ∈ 1, . . . ,m tal que e(f) ∈ Vj. Puesto quee(fj) ∈ Vj y dado que el radio de Vj es ε, sabemos que

‖e(f)− e(fj)‖∞ < ε

es decir, para todo i ∈ 1, . . . , n

|f(ti)− fj(ti)| < 2ε.

Ahora, dado t ∈ T , existe i ∈ 1, . . . , n tal que t ∈ B(ti, δi) y porlo tanto

|f(t)−fj(t)| ≤ |f(t)−f(ti)|+|f(ti)−fj(ti)|+|fj(ti)−fj(t)| < ε+2ε+ε.

Es decir‖f − fj‖∞ ≤ 4ε < 5ε,

lo que prueba que E es precompacto.

La última afirmación es inmediata: al ser C(T ) un espacio de Ba-nach, la clausura de E, E es un subconjunto compacto. Por tanto todasucesión en E tiene una subsucesión convergente (a un elemento deE).

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 83

El Teorema de Banach-Steinhaus y el Principio de AcotaciónUniforme

Antes de estudiar el Principio de Acotación Uniforme y el Teoremade Banach-Steinhaus, empezaremos recordando a los alumnos el Teo-rema de Baire, que suponemos ya conocido. Si no lo fuera, podríamosincluir una demostración.

Teorema 4.4 (Baire, 1899). Sea X un espacio métrico. Entoncesla intersección de una familia finita de subconjuntos abiertos densos deX es denso (y abierto) en X.

Si además X es completo, entonces la intersección de una familiacontable de subconjuntos abiertos densos de X en densa en X.

Notemos que, tomando complementarios, el Teorema de Baire diceque en un espacio métrico completo la unión contable de cerrados coninterior vacío tiene interior vacío.

Podemos pensar el teorema de Ascoli-Arzela como una herramientaque nos da condiciones suficientes para que en una familia de funcionescontinuas escalares definidas sobre un compacto metrizable, la acota-ción puntual implique la acotación uniforme.

Nos preguntamos ahora cuál es la situación para una familia deaplicaciones lineales entre espacios de Banach. La respuesta nos la dael

Teorema 4.5 (Principio de Acotación Uniforme). Sea X un es-pacio de Banach, Y un espacio normado y sea T un subconjunto deL(X;Y ) puntualmente acotado, es decir, tal que para todo x ∈ X elconjunto T (x);T ∈ T ⊂ Y está acotado. Entonces existe C > 0 talque

supT∈T‖T‖ = sup

T∈T ,x∈BX‖T (x)‖ ≤ C.

Demostración. Para todo n ∈ N, sea

Dn = x ∈ X; ‖T (x)‖ > n para algún T ∈ T .

Puesto que, toda T ∈ T es continua, y ‖ · ‖ también es una funcióncontinua, tenemos que ‖ · ‖ T : X −→ [0,+∞) es continua, por lo que

DTn := (‖ · ‖ T )−1(n,∞) = x ∈ X tales que ‖T (x)‖ > n

es un abierto. Puesto que Dn = ∪T∈TDTn , se sigue que Dn es un abierto.

84 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Sea x ∈ X. Por hipótesis, existe n0 ∈ N tal que ‖T (x)‖ ≤ n0

para todo T ∈ T . Por tanto x 6∈ Dn0 y se sigue que ∩n∈NDn = ∅, enparticular ∩n∈NDn no puede ser denso en X.

Ahora el Teorema de Baire nos dice que existe m0 ∈ N tal que Dm0

no es denso. Por tanto existe a ∈ X y r > 0 tal que B(a, r)∩Dm0 = ∅.Esto quiere decir que T (B(a, r)) ≤ m0 para todo T ∈ T , y veremosque a partir de ahí es fácil acabar sin mas que “trasladar” la bola alorigen.

Sea x ∈ BX , T ∈ T . Entonces‖T (rx+ a)‖ ≤ m0

(puesto que rx+ a ∈ B(a, r)) de forma que

‖T (x)‖ =1

r‖T (rx)‖ =

1

r‖T (rx+ a)− T (a)‖ ≤

≤ 1

r(‖T (rx+ a)‖+ ‖T (a)‖) ≤ 2m0

r.

Es decir

supx∈BX ,T∈T

‖T (x)‖ = supT∈T‖T‖ ≤ 2m0

r.

Observación 4.6. Probablemente sea conveniente hacer algunoscomentarios al teorema.

En primer lugar, obsérvese que el conjunto E0 = x ∈ X; tales queT está acotado en x es un subespacio vectorial. Por tanto, puesto quetodo subespacio vectorial de X o bien es X o bien tiene interior vacío, setiene que o bien el interior de E0 es vacío (es decir, el complementariode E0 es denso), o bien E0 = X. Por lo tanto, o bien T está acotadoen todo punto, o para todo x en un conjunto denso de X, T no estáacotado en x. Esta es la formulación del Teorema que sigue por ejemplo[8].

En realidad, usando la notación de categorías de Baire, se puedever fácilmente que la demostración vale igual suponiendo que X es unespacio normado y T está puntualmente acotada en un conjunto desegunda categoría.

Corolario 4.7. Sea X un espacio de Banach, Y un espacio nor-mado y sea (Tn)n∈N ⊂ L(X;Y ) una sucesión tal que para todo x ∈ Xla sucesión (Tn(x))n es convergente en Y . Definamos la aplicaciónT : X −→ Y como

T (x) = lımnTn(x)

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 85

entonces(i) (Teorema de Banach Steinhaus, 1927) T ∈ L(X;Y ) y

‖T‖ ≤ supn‖Tn‖ <∞.

(ii) Sea B ⊂ X un conjunto compacto. Entonces (Tn(x))n convergea T (x) uniformemente en x ∈ B

Demostración. (i) T es lineal, de nuevo por la continuidad de lasuma y el producto y el escalares. Para ver T es continuo, empecemosnotando que, para todo x ∈ X, el conjunto ‖Tn(x)‖;n ∈ N estáacotado, porque (Tn(x))n es una sucesión convergente. El Principio deAcotación Uniforme nos dice ahora que el conjunto ‖Tn‖;n ∈ N estáacotado y por tanto existe el supn ‖Tn‖. Entonces, para todo x ∈ BX ,

‖T (x)‖ = lımn‖Tn(x)‖ ≤ sup

n‖Tn‖ <∞

De forma que T es continua y

‖T‖ ≤ sup ‖Tn‖ <∞

(ii) Sea ε > 0. Puesto que B es precompacto existen x1, . . . , xm ∈ Btales que

B ⊂ B(x1, ε) ∪ · · · ∪B(xm, ε)

Puesto que Tn(xi)→ T (xi) para todo 1 ≤ i ≤ m, existe n0 ∈ N talque

‖Tn(xi)− T (xi)‖ < ε

para todo n ≥ n0 y para todo 1 ≤ i ≤ m. Sea ahora x ∈ B y sea xi talque ‖x− xi‖ < ε. Entonces, para todo n ≥ n0, se tiene

‖Tn(x)− T (x)‖ ≤ ‖Tn(x− xi)‖+ ‖(Tn − T )(xi)‖+ ‖T (xi − x)‖ ≤

≤ (‖Tn‖+ ‖T‖)‖x− xi‖+ ‖Tn(xi)− T (xi)‖ ≤ (2 supn‖Tn‖+ 1)ε.

Observación 4.8. Observemos en primer lugar con un ejemploque no podemos prescindir de la hipótesis de la completitud de X nien el Principio de Acotación Uniforme ni en el Teorema de Banach-Steinhaus. Consideremos X = c00 con la norma del supremo (en esecaso su completado es c0) y para todo n ∈ N sea, para todo x ∈ c00

Tn(x) =n∑j=1

x(j)

86 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Entonces Tn ∈ c∗00 = L(c00;K) y ‖Tn‖ = n para todo n ∈ N. Sea x ∈ c00y sea ix ∈ N tal que x(j) = 0 para todo j ≥ ix. Entonces, para todon ∈ N,

|Tn(x)| ≤ ix‖x‖∞ <∞y en cambio el conjunto ‖Tn‖;n ∈ N no está acotado. Esto muestraque el resultado del Principio de Acotación Uniforme no es cierto eneste caso. Para ver que el Teorema de Banach-Steinhaus también falla,definiendo la aplicación lineal T∞ : c00 −→ K como

T∞(x) =∞∑j=1

x(j)

se tiene que Tn(x)→ T∞(x) para todo x ∈ c00, pero T∞ no es continuoporque T∞(1, (n). . ., 1, 0, 0, . . .) = n y (1, (n). . ., 1, 0, 0, . . .) ∈ Bc00 para todon ∈ N.

Ahora es fácil probar como consecuencia que un conjunto B ⊂ Eestá acotado si y sólo si está débilmente acotado, y que un operadores continuo si y sólo si es débilmente continuo, donde el sentido dedébilmente acotado y débilmente acotado es el dado por el enunciadosiguiente.

Teorema 4.9. Sean X e Y espacios normados y sean B ⊂ X unsubconjunto y T : X −→ Y una aplicación lineal. Entonces

(i) B es acotado si y solo si para todo x∗ ∈ X∗ x∗(B) está acotadoen K

(ii) T es continua si y sólo si y∗ T es continua para todo y∗ ∈ Y ∗.

Demostración. Es fácil ver que si B está acotado también estádébilmente acotado. Para la otra implicación, supongamos que paratodo x∗ ∈ X∗, x∗(B) ⊂ K está acotado. Sea J : X → X∗∗ la inmersióncanónica de X en su bidual. Entonces el conjunto J(x);x ∈ B esun subconjunto de X∗∗ = L(X∗;K) donde X∗ es un espacio de Ba-nach. Además, para todo x∗ ∈ X∗ el conjunto |J(x)(x∗)|;x ∈ B =|x∗(x)|;x ∈ B está acotado. Por lo tanto, el Principio de AcotaciónUniforme nos dice que el conjunto ‖J(x)‖;x ∈ B está acotado, ycomo ‖J(x)‖ = ‖x‖, se sigue que B está acotado.

Para la parte (ii), de nuevo una implicación está clara. Para la otra,supongamos que T es débilmente continua. Sea B = T (x);x ∈ BX ⊂Y . Entonces para todo y∗ ∈ Y ∗, y∗(B) = (y∗ T )(BX) está acotado,de forma que la parte (i) nos dice que B está acotado, es decir T (BX)está acotado, es decir T es continuo.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 87

Los Teoremas de la Gráfica Cerrada y de la AplicaciónAbierta

Al igual que hicimos al introducir el Principio de Acotación Unifor-me y el Teorema de Banach-Steinhaus, antes de introducir los Teoremasde la Gráfica Cerrada y de la Aplicación Abierta reflexionaremos breve-mente acerca de la pregunta natural a que los Teoremas dan respuesta.

Sean X e Y espacios métricos y sea T : X −→ Y una aplicación. Tes continua si y sólo si es continua por sucesiones, es decir, si para todasucesión (xn) ⊂ X tal que xn → x ∈ X se tiene que T (xn)→ T (x).

Por otro lado, T se dice cerrada si para toda sucesión (xn) ⊂ X talque xn → x ∈ X y T (xn)→ y ∈ Y se tiene que y = T (x).

Se sigue inmediatamente de la definición que una aplicación conti-nua es cerrada. En cambio el recíproco no es cierto, como lo prueba elsiguiente ejemplo. Sea X = Y = R y sea

T (x) =

1x, si x 6= 0

0 , si x = 0

Ejercicio 4.1. Demostrar que T es cerrada si y sólo si la gráficade T , esto es, el conjunto

Gr(T ) := (x, T (x)) ∈ X × Y ;x ∈ X

es cerrado en X × Y con la topología producto.

Notemos también que si una aplicación cerrada T es biyectiva, en-tonces su inversa T−1 también es cerrada, ya que que su gráfica es lamisma (una está en X × Y y la otra en Y × X, pero ambos espaciosson claramente homeomorfos). En cambio la inversa de una aplicaciónbiyectiva y continua no tiene por qué ser continua, como lo pruebael siguiente ejemplo: Sea X = [0, 2π), Y = z ∈ C; |z| = 1 y seaT : X −→ Y la aplicación dada por

T (x) = eix

T es continua y biyectiva pero T−1 no es continua.

Vamos a ver ahora cuál es la situación para aplicaciones linealesentre espacios de Banach. Seguimos [8] para la demostración.

88 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Teorema 4.10 (Gráfica Cerrada). Sean X, Y espacios de Banach,y sea T : X −→ Y una aplicación lineal. Entonces T es cerrada si ysólo si T es continua.

Demostración. Ya hemos comentado que si T es continua en-tonces es cerrada. Veamos la otra implicación. Probamos primero elsiguiente Aserto, en el que sólo usaremos la linealidad de T

Aserto: Para todo ε > 0 existe δ > 0 tal que

δBX ⊂ T−1(εBY )

donde δBX = x ∈ X, tales que ‖x‖ ≤ δ y análogamente εBY

Demostración del Aserto: Sea ε > 0. Consideramos los conjuntos

Gn = nT−1( ε

2BY

).

La unión ∪n∈NGn es un recubrimiento de X, y por tanto también loes ∪n∈NGn. (Observese que todavía no sabemos que T sea continua, loúnico que usamos es que T está bien definida). Por el Teorema de Baire(tomando complementarios) existe n0 ∈ N tal que Gn0 tiene interior novacío, y por tanto contiene una bola cerrada de radio η > 0 y centrox0, lo que implica que si ‖x − x0‖ ≤ η entonces x ∈ n0T−1

(ε2BY

). Es

fácil ver que esto es equivalente a quex

n0

∈ T−1( ε

2BY

)y por lo tanto también se verifica, para todo n ≥ n0,

(3)x

n∈ T−1

( ε2BY

).

Además, existe n1 ∈ N tal que, para todo n ≥ n1,

(4)x0n∈ T−1

( ε2BY

)(esto simplemente porque T (x0) ∈ Y )

Sea entonces n2 = maxn0, n1 y sea δ = ηn2. Entonces para todo

y ∈ δBY se tiene

y =n2y + x0 − x0

n2

=n2y + x0

n2

− x0n2

.

Ahora, puesto que ‖n2y + x0 − x0‖ ≤ η, la ecuación (3) implica que

n2y + x0n2

∈ T−1( ε

2BY

).

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 89

Por otro lado, de la ecuación (4) se sigue quex0n2

∈ T−1( ε

2BY

)y ahora es fácil ver que

y ∈ T−1 (εBY ),

es decirδBY ⊂ T−1 (εBY )

lo que termina la demostración del Aserto.

Dado un ε > 0, llamemos δ(ε) a (uno de los) δ que nos proporcionael Aserto, y observemos que para cada ε > 0 siempre podemos suponerque δ(ε) < ε.

Continuamos con la demostración del Teorema. Suponemos que Tes cerrada, y vamos a probar que, para todo ε > 0

T(δ( ε

2

)BX

)⊂ εBY

lo que probará que T es continua en el origen, y por tanto en todopunto.

Así, fijamos ε > 0 y x ∈ δ(ε2

)BX . Elijamos x1 ∈ T−1( ε2BY ), con

x− x1 ∈ δ(ε

4)BX ,

(esto es, ‖x−x1‖ ≤ δ( ε4)). A continuación elegimos x2 ∈ T−1( ε4BY ) con

x− x1 − x2 ∈ δ(ε

8)BX ,

y procedemos inductivamente para construir una sucesión (xi)i∈N talque xi ∈ T−1( ε

2iBY ) y

x−i∑

j=1

xj ∈ δ(ε

2i+1)BX ,

y por tanto,

x−i∑

j=1

xj ∈ T−1( ε

2i+1BX

).

Entonces T (xi) ∈ ε2iBY y por tanto la sucesión zn =

∑ni=1 T (xi) es

una sucesión de Cauchy que converge a un punto z ∈ Y . Puesto quezn ∈ εBY para todo n, se tiene que z ∈ εBY .

Además x−∑n

j=1 xj ∈ δ(ε

2n+1 )BX ⊂ ε2n+1BX (porque δ(ε) < ε) y por

tanto la sucesión tn =∑n

j=1 xj converge a x. Puesto que T (tn) = zn

90 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

y puesto que T es cerrada, tenemos que T (x) = z, por lo que x ∈T−1(εBY ), lo que prueba que δ( ε

2)BX ⊂ T−1εBY y termina la demos-

tración del teorema.

Observación 4.11. Nótese que el teorema dice que si X e Y cum-plen las hipótesis, entonces para probar que una aplicación T sea conti-nua basta comprobar que si (xn)n∈N ⊂ X es una sucesión convergente a0 tal que la sucesión (T (xn))n∈N ⊂ Y converge a y ∈ Y entonces y = 0.Esta es la forma en que se usa el Teorema en muchas aplicaciones.

El siguiente corolario es de gran importancia en múltiples aplica-ciones.

Corolario 4.12. Sean X, Y dos espacios de Banach y sea T :X −→ Y un operador (aplicación lineal y continua) biyectiva. EntoncesT−1 : Y −→ X es continua.

Demostración. Si T es continua, su gráfica es cerrada. Pero lagráfica de T−1 es la misma que la de T (una en X × Y y la otra enY × X) por lo que la gráfica de T−1 también es cerrada. Ahora elTeorema de la Gráfica Cerrada nos garantiza que T−1 es continua.

Continuamos el capítulo estudiando el Teorema de la AplicaciónAbierta.

Definición 4.13. Dados dos espacios topológicos X e Y , una apli-cación T : X −→ Y se dice abierta si la imagen de cualquier abiertoes un abierto.

Claramente, si la aplicación T es inyectiva, T es abierta si y sólo siT−1 es continua.

Entonces tenemos el siguiente resultado.

Teorema 4.14. Sean X, Y espacios normados y T : X −→ Y unaaplicación lineal. Entonces T es una aplicación abierta si y sólo si existeγ > 0 tal que

BY ⊂ T (γBX),

es decir, para todo y ∈ Y existe x ∈ X con ‖x‖ ≤ γ‖y‖ de manera queT (x) = y. En particular, las aplicaciones abiertas son sobreyectivas.

Demostración. Supongamos que T es una aplicación abierta. En-tonces transforma entornos abiertos de 0 en entornos abiertos de 0. Sea

UX = x ∈ X tales que ‖x‖ < 1.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 91

Entonces existe δ > 0 tal que

δUY ⊂ T (UX) ⊂ T (BX).

Sea 0 < δ′ < δ. Entonces

δ′BY ⊂ δUY ⊂ T (UX) ⊂ T (BX).

Ahora es fácil ver que

γ =1

δ′

cumple lo pedido.Para la otra implicación, supongamos que

γBY ⊂ T (BX)

y sea G ⊂ X un abierto. Veamos que T (G) es un abierto.Sea a ∈ G. Por ser G abierto existe δ > 0 tal que

a+ δBX ⊂ G.

EntoncesT (a+ δBX) = T (a) + δT (BX) ⊂ T (G)

y por lo tantoT (a) + δγBY ⊂ T (G)

por lo que T (G) es un abierto.

Teorema 4.15. Sean X, Y espacios normados.1. Si Z ⊂ X es un subespacio cerrado, entonces la aplicación co-

cienteQ : X −→ X/Z

es continua y abierta.2. Sea T : X −→ Y una aplicación lineal tal que ker(T ) ⊂ E es

cerrado. Sea T : X/ ker(T ) −→ Y la aplicación lineal dada por

T ([x]) = T (x).

Entonces T es abierta si y sólo si T es abierta.

Demostración. Para probar (1), en primer lugar Q es continuoporque ‖|Q(x)|‖ = ‖|[x]|‖ ≤ ‖x‖. Para ver que Q es abierta, utilizamosel resultado anterior. Sea un ε > 0 cualquiera y sea [x] ∈ X/Z. Entonces

ınf‖x+ z‖; z ∈ Z = ‖|[x]|‖ < (1 + ε)‖|[x]|‖por tanto existe z0 ∈ Z tal que ‖x + z0‖ < (1 + ε)‖|[x]|‖. Puesto queQ(x + z0) = [x] , podemos hacer γ = 1 + ε en el teorema anterior yobtenemos que Q es abierta.

92 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Para probar (2), puesto que ker(T ) es cerrado, sea Q : X −→X/ ker(T ) la aplicación cociente. Entonces para todo A ⊂ X,

T (A) = T (Q(A)).

Puesto que Q es abierta, se sigue trivialmente que si T es abiertatambién lo es T .

Por otro lado, para todo A ⊂ X/ ker(T ), se tiene que

T (A) = T (Q−1(A))

ya que Q es sobre.Puesto que Q es continuo por (1), se sigue que si T es abierta T

también lo es.

Finalmente ya tenemos todas las herramientas para probar

Teorema 4.16 (Teorema de la Aplicación Abierta, Banach 1932).Sean X, Y espacios de Banach y sea T : X −→ Y una aplicacióncerrada y sobre. Entonces T es continua y abierta.

Demostración. Por el Teorema de la Gráfica Cerrada, T es con-tinua. Por tanto ker(T ) = T−1(0) es cerrado y la aplicación

T : X/ ker(T ) −→ Y

definida porT ([x]) = T (x)

es continua (esto lo vimos en el Teorema 2.1, punto (v)). Podríamostambién no incluirlo en aquel Teorema y demostrarlo ahora.) Por tan-to T es cerrada. T es inyectiva (esto es álgebra) y, puesto que T essobre también lo es T (más álgebra). Por tanto T es una aplicaciónlineal cerrada y biyectiva. Así pues la aplicación inversa T−1 tambiénes lineal cerrada y biyectiva (es cerrada porque la gráfica es la mismacambiando el orden de los pares). Puesto que Y y X/ ker(T ) son es-pacios de Banach, tenemos que T−1 es continua, es decir T es abierta.Por el Teorema anterior T es abierta.

Proyecciones en un espacio de Banach

Definición 4.17. Sea X un espacio normado e Y ⊂ X un subespa-cio vectorial cerrado. Un operador (lineal y continuo) P : X −→ X esuna proyección sobre Y si P|Y : Y −→ Y es la identidad y si P (x) ∈ Ypara todo x ∈ X.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 93

Definición 4.18. Sea X un espacio normado e Y ⊂ X un subes-pacio vectorial cerrado. Y se dice complementado en X si existe unaproyección de X sobre Y .

Ejercicio 4.2. Sea X un espacio normado, Y ⊂ X un subespaciovectorial cerrado y P : X −→ X un operador (lineal y continuo).Probar que P es una proyección si y sólo si P 2 = P , P (x) ∈ Y paratodo x ∈ X y P : X −→ Y es sobreyectiva.

Proposición 4.19. Sea X un espacio de Banach e Y ⊂ X unsubespacio vectorial cerrado. Y está complementado en X si y sólo siexiste un subespacio vectorial cerrado Z ⊂ X tal que X = Y ⊕Z en elsentido algebraico, es decir, X = Y + Z e Y ∩ Z = 0. En ese casose dice que Z es un complementario de Y en X.

Demostración. Supongamos que existe Z como en el enunciado.Tanto Y como Z son espacios de Banach y por tanto (Y ⊕Z, ‖ · ‖1) esun espacio de Banach, donde

‖(y, z)‖1 = ‖y‖+ ‖z‖.Definimos

ϕ : Y ⊕ Z −→ X

comoϕ(y, z) = y + z.

ϕ es claramente lineal. También es continua (considerando la norma 1en Y ⊕ Z) ya que

‖ϕ(y, z)‖ = ‖y + z‖ ≤ ‖y‖+ ‖z‖ = ‖(y, z)‖1.Además ϕ es inyectiva: ϕ(y, z) = 0 implica y + z = 0 lo que a su vezimplica que y = z = 0 por ser X = Y ⊕ Z.

También ϕ es sobreyectiva: para todo x ∈ X, x se puede escribircomo x = y + z (de forma única) y ϕ(y, z) = x.

Por los Teoremas de la Gráfica Cerrada (o de la Aplicación abierta)sabemos que ϕ−1 es continua. De hecho se tiene, aunque no lo usamosexplícitamente, que X es isomorfo a (Y ⊕Z, ‖ · ‖1); es un ejercicio com-probar que podemos sustituir la norma 1 por, por ejemplo, cualquiernorma p.

Notemos además que la aplicación π1 : Y ⊕ Z −→ Y ⊕ Z dada porπ1(y, z) = y es claramente una proyección.

Definimos entonces la aplicación

P = ϕ π1 ϕ−1 : X −→ Y ⊕ Z −→ y ⊕ Z −→ X

Es ahora muy fácil comprobar que P es una proyección sobre Y .

94 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Supongamos ahora que Y ⊂ X está complementado, y sea P :X −→ X una proyección. Sea Z = kerP . Z es claramente cerrado.

Además, si y ∈ Y ∩ Z se tiene que P (y) = y (porque y ∈ Y ) y queP (y) = 0 (porque y ∈ Z) y por tanto y = 0, luego Y ∩ Z = 0.

Por otro lado, sea x ∈ X, sea y = P (x) ∈ Y y sea z = x − y.Entonces

P (z) = P (x)− P (y) = y − y = 0,

por tanto z ∈ Z y x = y + z, por lo que X = Y + Z.

Ejercicio 4.3. Sea Y ⊂ X un subespacio complementado, sea P :X −→ X una proyección y sea Z = kerP un complementario de Y enX. Entonces Z está complementado en X y

Id− P : X −→ X

es una proyección. Sugerencia: Usar el Ejercicio 4.2.

Desde el punto de vista puramente algebraico, todo subespacio vec-torial está complementado. Se puede probar, dado un espacio de Ba-nach X, que todo subespacio cerrado Y ⊂ X está complementado siy sólo si X es Hilbert. En cambio, dado un subespacio cerrado Y deun espacio de Banach X, no es en general nada sencillo averiguar siY está complementado o no. El artículo [38] (al menos partes de él)puede ser leído por no especialistas que deseen aprender algo acerca deeste problema.

En esta línea, con técnicas elementales se puede probar que c0 noestá complementado en `∞. Por claridad, extraemos parte de la demos-tración como lema previo.

Lema 4.20. Existe una familia F de subconjuntos de N tal quecard(F) = card(R)Para todo F ∈ F se tiene que card(F ) = ℵ0Para todos F1, F2 ∈ F

card(F1 ∩ F2) < ℵ0Demostración. Sea i : N −→ Q una biyección. Para todo r ∈ R

elijamos una sucesión (qrn)n ⊂ Q tal que qrn → r. Sea

ϕ : R −→ NN

la aplicación dada porϕ(r) =

(i−1(qrn)

)n.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 95

Es fácil ver que ϕ es inyectiva. Sea ahora

F = ϕ(r); r ∈ R.

No es difícil ver que F cumple lo pedido.

Teorema 4.21. c0 no está complementado en `∞

Demostración. [24, Thm. 95].

Veamos que los cocientes por subespacios complementados son exac-tamente lo que esperaríamos que fueran.

Proposición 4.22. Sea X un espacio de Banach, Y ⊂ X un subes-pacio complementado de manera que X = Y⊕Z. Entonces (X/Y ) = Z,donde la igualdad quiere decir que ambos espacios son isomorfos (perono necesariamente isométricos).

Demostración. Sea θ : Z −→ X/Y dada por θ(z) = [z]. Fácil-mente se ve que θ es lineal y continua. Es inyectiva porque si [z] = 0entonces z ∈ Y , y puesto que Y ∩ Z = 0, se sigue que z = 0. Essobreyectiva porque si [x] ∈ X/Y y x = y + z, con y ∈ Y y z ∈ Z, en-tonces θ(z) = [x]. Por tanto es biyectiva. Los Teoremas de este capítulonos dicen ahora que θ es un homeomorfismo lineal

Veamos ahora que los subespacios finito dimensionales están siem-pre complementados. Aprovechamos la ocasión para definir las Basesde Auerbach.

Definición 4.23. Dado un espacio de Banach Y con dimY = n <∞ una base de Auerbach de Y es un sistema e1, . . . , en, e∗1, . . . , e∗ntal que e1, . . . , en es una base de Y , e∗1, . . . , e∗n ⊂ Y ∗, para todos1 ≤ i, j ≤ n

e∗i (ej) = δij

y, para todos 1 ≤ i, j ≤ n,

‖ei‖ = ‖e∗j‖ = 1.

(Obsérvese que de aquí se sigue en particular que e∗1, . . . , e∗n son li-nealmente independientes, y por tanto una base de Y ∗, ya que si∑

i

αie∗i = 0

entonces para todo j ∑i

αie∗i (ej) = αj = 0.

96 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Ejercicio 4.4. [24, Thm 89] Sea X un espacio de Banach, Y ⊂ Xun subespacio n-dimensional. Entonces existen vectores e1, . . . , en ⊂Y , e∗1, . . . , e∗n ⊂ X∗ tales que e1, . . . , en, e∗1|Y , . . . , e

∗n|Y es una base

de Auerbach. Por lo tanto Y está complementado en X y existe unaproyección P de X sobre Y con ‖P‖ ≤ n.

Existe una versión de este resultado garantizando la existencia deuna forma débil de Bases de Auerbach (no de proyecciones acotadas)en todo espacio de Banach separable [36].

Por otro lado, del Teorema de Kadets-Snobar se sigue que todoespacio n-dimensional admite una proyección de norma menor o igualque√n (ver, por ejemplo, [16, Theorem 4.18]).

El Teorema de Stone-Weierstrass

Sea K un espacio compacto, y C(K,R) el espacio de Banach delas aplicaciones continuas f : C(K) −→ R, dotado de la norma delsupremo. Observemos en primer lugar que C(K,R) tiene además de laestructura de espacio de Banach, una estructura natural de álgebra.

Recordamos al lector la definición de álgebra.

Definición 4.24. Sea A un espacio vectorial sobre K. Decimos queA es un álgebra si existe un producto · : A×A −→ A definido en él talque (A,+, ·) es un anillo y además

α(x · y) = (αx) · y para todos x, y ∈ A, α ∈ K.

Siguiendo la costumbre habitual escribiremos xy en lugar de x · ysiempre que no haya riesgo de confusión. Claramente C(K,R) con elproducto punto a punto es un álgebra.

Decimos que un conjunto A ⊂ C(K,R) es reticulado si para todosf, g ∈ A las funciones sup(f, g) e ınf(f, g) pertenecen a A, donde estasfunciones se definen como

sup(f, g)(t) := maxf(t), g(t) para todo t ∈ K,

y análogamente la función ınf(f, g). Es un ejercicio verificar que sif, g ∈ C(K,R) entonces sup(f, g) ∈ C(K,R) e ınf(f, g) ∈ C(K,R).

Antes de probar el Teorema de Stone-Weierstrass necesitamos doslemas. El primero es

Lema 4.25. Sea A ⊂ C(K,R) un conjunto reticulado. Entoncesf ∈ A (la clausura topológica de A) si y sólo si para todos s, t ∈ K, f

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 97

es el límite sobre s, t de funciones de A, es decir, dados s, t ∈ K ydado ε > 0 existe gs,t ∈ A tal que

|f(s)− gs,t(s)| < ε y |f(t)− gs,t(t)| < ε.

Demostración. Una de las implicaciones está clara. Para la otra,supongamos que para todos s, t ∈ K, f es el límite sobre s, t defunciones de A. Sea ε > 0 y sea gs,t ∈ A tal que

(5) |f(s)− gs,t(s)| < ε y |f(t)− gs,t(t)| < ε.

Definamos

Ws,t = u ∈ K tales que gs,t(u) < f(u) + ε.Como la función (gs,t − f) es continua, se tiene que Ws,t ⊂ K es

abierto y usando (5) es muy fácil ver que contiene a t. Por tanto, fijados ∈ K la familia de conjuntos Ws,t; t ∈ K forma un recubrimientoabierto de K. Al ser K compacto podemos extraer de este recubrimien-to un subrecubrimiento finito Ws,ti ; 1 ≤ i ≤ n.

Definamos ahorags = ınf

i(gs,ti).

Puesto que A es un conjunto reticulado se tiene que gs ∈ A. Para todou ∈ K, existe i ∈ 1, . . . , n tal que u ∈ Ws,ti , es decir gs,ti(u) < f(u)+εy por tanto

gs < f + ε, es decir gs(u) < f(u) + ε para todo u ∈ K.Además

gs(s) > f(s)− ε,ya que, para todo t ∈ K, se tiene que |f(s)− gs,t(s)| < ε.

Definamos ahora

Ws = u ∈ K tales que gs(u) < f(u)− ε.Como la función (gs−f) es continua, se tiene queWs ⊂ K es abier-

to y es fácil ver que contiene a s. Por tanto la familia de conjuntosWs; s ∈ K forman un recubrimiento abierto de K. De nuevo porser K compacto podemos extraer de este recubrimiento un subrecubri-miento finito Wsj ; 1 ≤ j ≤ m.

Definamos ahorag = sup

j(gsj).

De nuevo por ser A es un conjunto reticulado se tiene que g ∈ A.Además se tiene

f − ε < g < f + ε

98 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

y puesto que esto se puede hacer para todo ε > 0 se sigue que f ∈ A.

Necesitamos un lema más. Previamente recordemos que si A esun álgebra entonces decimos que A′ ⊂ A si A′ con las operacionesinducidas también es un álgebra. Obviamente, al igual que ocurría consubespacios vectoriales, basta con que sea cerrada para las operacionesdel álgebra.

Lema 4.26. Sea A ⊂ C(K,R) una subálgebra cerrada (en el sentidotopológico). Entonces A es un conjunto reticulado.

Demostración. Observando que

sup(f, g) =f + g + |f − g|

2y

ınf(f, g) =f + g − |f − g|

2queda claro que basta demostrar que si f ∈ A entonces |f | ∈ A

Para ello vamos a ver que |f | es el límite uniforme de polinomiosen f de la forma

∑mn=1 anf

n.Es fácil ver que podemos suponer sin perdida de generalidad que

‖f‖ ≤ 1.Notemos que para todo ε > 0 y para todo x ∈ R, se tiene

0 ≤ (x2 + ε2)12 − |x| ≤ ε

Por otro lado, para todo x ∈ [−1, 1] se tiene

x2 + ε2 = 1 + ε2 + (x2 − 1) = (1 + ε2)(1 + u),

donde

u =x2 − 1

1 + ε2.

Además, para todo x ∈ [−1, 1]

|u| < 1

1 + ε2< 1.

Por lo tanto, la serie de Taylor de (1 +u)12 converge uniformemente

a (1 + u)12 en el intervalo [−1, 1]. Es decir, existe un polinomio P (x)

tal que, para todo x ∈ [−1, 1],

|(x2 + ε2)12 − P (x)| ≤ ε.

En particular se tiene que

|P (0)| ≤ 2ε.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 99

Finalmente, si hacemos Q = P − P (0), se tiene‖Q(f)− |f |‖ ≤ 4ε.

Necesitamos una definición más.

Definición 4.27. Sean K,Y dos conjuntos y sea A ⊂ Y K un con-junto de aplicaciones de K en Y . Decimos que A separa puntos de Ksi para todos s, t ∈ K existe f ∈ A tal que f(s) 6= f(t).

Finalmente podemos enunciar y probar el resultado principal deeste capítulo. Probamos primeramente el caso real.

Teorema 4.28 (Stone-Weierstrass). Sea A ⊂ C(K,R) una subál-gebra tal que

1. A separa puntos de K.2. Para todo t ∈ K existe f ∈ A tal que f(t) 6= 0.

Entonces A = C(K,R).

Demostración. Por los lemas anteriores, basta ver que para todoss, t ∈ K con s 6= k y para todos α, β ∈ R existe f ∈ A tal que f(s) = αy f(t) = β. Puesto que A separa puntos sabemos que existe g ∈ A talque g(s) 6= g(t). Supongamos inicialmente que g(s) 6= 0 6= g(t). Veamosentonces que existen a, b ∈ R tales que

f = ag + bg2

cumple lo pedido. Para esto tenemos que solucionar el sistemaα = ag(s) + bg2(s)

β = ag(t) + bg2(t)

y sabemos que este sistema tiene solución sig(s)g2(t)− g(t)g2(s) = g(s)g(t)(g(s)− g(t)) 6= 0.

Por hipótesis sabemos que esta condición se cumple, y por tanto existena y b que cumplen lo pedido.

Si la función g que separa s y t cumpliera que, por ejemplo, g(s) = 0,entonces por las hipótesis sobre A existe otra función g′ ∈ A tal queg′(s) 6= 0. Entonces podemos elegir un ε > 0 suficientemente pequeñode manera que

g′′ = g + g′

separa s y t y no se anula en ninguno de ellos, y podemos aplicarleahora a g′′ los razonamientos anteriores.

100 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Los siguientes corolarios son a menudo cómodos de aplicar.

Corolario 4.29. Si fi; i ∈ I ⊂ C(K,R) es un conjunto quesepara puntos de K y si para todo t ∈ K existe fi tal que fi(t) 6= 0,entonces toda función f ∈ C(K,R) se puede escribir como el límiteuniforme de polinomios (sin término constante) en los elementos fi.

Demostración. Los polinomios en esas funciones forman una subál-gebra que verifica las condiciones del Teorema 4.28

Corolario 4.30. Sea A ⊂ C(K,R) una subálgebra tal que1. A separa puntos de K.2. 11 ∈ A, donde 11 es la función constantemente igual a 1.

Entonces A = C(K,R).

Corolario 4.31 (Weierstrass, 1885). En C([0, 1],R) los polino-mios son densos.

Veamos finalmente la versión compleja del Teorema.

Corolario 4.32. Sea K un conjunto compacto y sea A ⊂ C(K,C)una subálgebra (sobre C) tal que

1. A separa puntos.2. Para todo x ∈ K existe f ∈ A tal que f(x) 6= 0

3. Para todo f ∈ A, también f ∈ A, donde f(t) = f(t), el conju-gado complejo de f(t).

Entonces A = C(K,C), donde A denota la clausura topológica deA.

Demostración. SeaAr = <(f); f ∈ A.

Es fácil ver que Ar es una subálgebra (sobre R) de C(K,R) y queverifica las condiciones 1 y 2 del Teorema 4.28 (Si f(x) 6= f(y) entonces<(f)(x) 6= <(f)(y) ó <(ıf)(x) 6= <(ıf)(y); análogamente, si f(x) 6= 0entonces <(f)(x) 6= 0 ó <(ıf)(x) 6= 0). Por lo tanto Ar = C(K,R),donde Ar es la clausura topológica de Ar y se ve fácilmente que entonces

A = Ar + ıAr = C(K,C).

Aplicaciones

Al igual que con el Teorema de Hahn-Banach, hay multitud deaplicaciones de los teoremas de este capítulo al Análisis Funcional o aotras áreas del Análisis. Citamos aquí alguna de ellas.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 101

Existencia de solución de ecuaciones diferenciales: Una apli-cación del Teorema de Ascoli-Arzela que se puede ver en [22, p. 30] esel siguiente teorema.

Teorema 4.33. Sea f : R2 −→ R una función continua en unabierto D. Entonces, para todo (x0, y0) ∈ D la ecuación diferencial

y′ = f(x, y)

admite una solución local (no necesariamente única) que pasa por elpunto (x0, y0).

Divergencia de la serie de Fourier de funciones continuas:Se tiene el siguiente resultado.

Teorema 4.34. Existe un conjunto denso E ⊂ C[−π, π] tal quepara toda f ∈ E la serie de Fourier de f diverge en el 0.

Es bastante frecuente encontrar esta aplicación en los libros. Unabuena referencia para este curso puede ser [31, p. 144] o [24, ej 39 p.59].

En [22, p. 78] se puede ver una aplicación similar a la divergenciade polinomios interpoladores.

Métodos de Integración: En [31, p. 146] se puede ver una apli-cación de los resultados de este capítulo a la convergencia de métodosde integración.

Condensación de singularidades: La idea general de un princi-pio de condensación de singularidades es ver condiciones bajo las cualesse puede garantizar que, si para todo punto t0 en un conjunto densoexiste una función f0 en un conjunto dado de funciones F que tieneuna singularidad en t = t0 entonces existe f ∈ F tal que f tiene unasingularidad en todo t ∈ S. En el caso particular de operadores entreespacios de Banach se tiene el siguiente resultado.

Teorema 4.35. Sea X un espacio de Banach y sea Y un espacionormado. Sea (Tmn )n,m∈N ⊂ L(X;Y ) una sucesión (indexada por n ym) tal que para todo m ∈ N existe xm ∈ X tal que

lım supn‖Tmn (xm)‖ = +∞.

Entonces existe x ∈ X tal que para todo m ∈ N

lım supn‖Tmn (x)‖ = +∞.

102 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

Se puede ver por ejemplo en [22].

Propiedad de lifting de `1. Se tiene el siguiente resultado

Teorema 4.36. Sean X e Y espacios de Banach y Q : X −→ Yun operador sobreyectivo. Entonces, para todo operador T : `1 −→ Yexiste un operador T : `1 −→ X tal que QT = T .

Se puede ver por ejemplo en [8, Ex. 3, p. 15].

Todo espacio de Banach separable es isomorfo a un cocientede `1, o todo espacio de Banach es isomorfo a un cociente de`1(Γ) para algún Γ. Se puede ver por ejemplo en [24, Theorem 91].

Soluciones de ecuaciones diferenciales. Sean X, Y espacios deBanach y T ∈ L(X;Y ) un operador sobre, es decir para todo y ∈ F laecuación

(6) T (x) = y

tiene solución en X. Por los Teoremas de la Aplicación Abierta, existeγ ∈ R tal que, para todo y ∈ Y existe una solución x de (6) con‖x‖ ≤ γ‖y‖.

En muchas ocasiones la posibilidad de acotar la norma de una solu-ción de la ecuación en términos de la norma del término independientees importante. Por ilustrar esa importancia consideremos la siguientesituación. Supongamos, y este es el caso a menudo, que T no es sólosobre sino biyectiva, de forma que los teoremas de este capítulo nosgarantizan que T−1 también es lineal y continua. En ocasiones, aunque(6) tenga solución para todo término independiente y, sólo sabemoscalcular una solución x cuando y pertenece a un cierto conjunto densoD ⊂ F . Si ahora y ∈ F \D, podemos hallar una sucesión (yn) ⊂ D talque yn → y y una sucesión (xn) ⊂ E tal que T (xn) = yn. Obviamentela pregunta es si podemos garantizar que xn → x donde x es el únicoelemento de X tal que T (x) = y.

La respuesta es sí, ya que

‖x− xn‖ = ‖T−1(y)− T−1(yn)‖ ≤ ‖T−1‖‖y − yn‖ → 0

De forma que tiene sentido decir que xn es una solución aproximada de(6) y además vemos que x varia continuamente con respecto a y. Estosrazonamientos son los que están detrás de ciertas técnicas de perturba-ción utilizadas en la resolución de ecuaciones diferenciales: perturbamos

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 103

el término independiente levemente (de y a yn) y obtenemos una so-lución aproximada xn que está suficientemente cerca de x (en ciertanorma) si yn está suficientemente cerca de y (en otra cierta norma).

Veámoslo con un ejemplo. Sea la ecuación diferencial lineal de ordenm con coeficientes variables dada por

(7) am(t)x(m)(t) + · · ·+ a1(t)x′(t) + a0(t)x(t) = y(t) t ∈ [0, 1]

donde aj ∈ C[0, 1] para todo 1 ≤ j ≤ m y am(t) 6= 0 para todot ∈ [0, 1].

Consideramos las condiciones iniciales

(8) x(0) = x′(0) = · · · = x(m−1)(0) = 0

Se demuestra en los cursos elementales de ecuaciones diferenciales quepara todo y ∈ C[0, 1] existe una única solución de (7) que verifica(8). Consideramos los espacios vectoriales Y = C[0, 1], X = x ∈C(m)[0, 1] tales que x(0) = x′(0) = · · · = x(m−1)(0) = 0. Y es unespacio de Banach con la norma del supremo, y se puede comprobarque si dotamos a X de la norma

‖x‖ = ‖x‖∞ + ‖x′‖∞ + · · ·+ ‖x(m)‖∞entonces también X es un espacio de Banach. Definimos ahora la apli-cación

T : X −→ Y

dada porT (x) = amx

(m) + · · ·+ a1x′ + a0x.

Es sencillo verificar que T es lineal y continua. Del teorema deexistencia y unicidad antes mencionado se sigue que T es biyectiva.

Supongamos que tenemos un método para solucionar (7) (es de-cir, para calcular T−1(y)) cuando y es un polinomio. Del Teorema deWeierstrass se sigue que los polinomios son densos en Y . Sea ahoray0 ∈ Y y sea (pn) ⊂ Y una sucesión de polinomios que converge a y0.Entonces si xn es la solución de (7) cuando el término independientees pn, tenemos que xn → x0, donde x0 es la única solución de (7) ve-rificando las condiciones iniciales (8) cuando el término independientees y0. En particular esto implica que

xn‖·‖∞→ x0,

x′n‖·‖∞→ x′0

104 4. PAU Y TEOREMA DE LA GRÁFICA CERRADA

...

x(m)n

‖·‖∞→ x(m)0

Prácticas sugeridas

Ejercicio 4.5. Sea X un espacio de Banach. Entonces una basealgebraica suya tiene cardinal finito o no contable.

Solución: Supongamos que X admitiera una base contable (ei)i∈N.Para cada n ∈ N sea Fn el subespacio generado por e1, . . . , en. Fnes cerrado por ser de dimensión finita y puesto que (ei)i∈N es una basealgebraica, se tiene que X = ∪n∈NFn. Por el Teorema de Baire tieneque existir n0 ∈ N tal que Fn0 tiene interior no vacío. Pero si Fn0

contiene una bola abierta entonces contiene también una bola abiertacentrada en el origen de manera que Fn0 es un entorno del origen, loque implica que X = Fn0, una contradicción con que la dimensión deX sea infinita.

Ejercicio 4.6. Sean X, Y, Z espacios normados, con X o Y espa-cio de Banach. Sea

F : X × Y −→ Z

una aplicación bilineal separadamente continua (esto es, para cada x ∈X la aplicación lineal Fx : Y −→ Z dada por

Fx(y) = F (x, y)

es continua, y análogamente en la segunda variable. Entonces F escontinua, es decir existe α > 0 tal que para todo (x, y) ∈ X × Y

‖F (x, y)‖ ≤ α‖x‖‖y‖

Ejercicio 4.7. Los Teoremas de la Aplicación Abierta y de la Grá-fica Cerrada fallan si no hay completitud. [31, Example 10.7, p.177]

Ejercicio 4.8. Sea X un espacio normado en el que consideramosdos normas ‖ · ‖1 y ‖ · ‖2. Si X es un espacio de Banach con ambas ysi existe C ∈ R+ tal que ‖ · ‖1 ≤ C‖ · ‖2 entonces las dos normas sonequivalentes.

Ejercicio 4.9. Sean X, Y espacios de Banach, T : X −→ Yun operador sobreyectivo. Entonces Y es isomorfo a un cociente deX, en concreto a X/ kerT . Sugerencia Considerar el operador θ :X/ kerT −→ Y dado por θ([x]) = T (x) y verificar que es biyectivo ycontinuo. A continuación aplicar el Teorema de la Aplicación Abierta.

4. PAU Y TEOREMA DE LA GRÁFICA CERRADA 105

Ejercicio 4.10. Sea E un espacio compacto y sea (fi)ni=1 ⊂ C(E,R)

un conjunto que separa puntos de E. Demostrar que E es homeomorfoa un subconjunto de Rn

Ejercicio 4.11. Demostrar que el álgebra generado por 1, x2 esdensa en C[0, 1] pero no en C[−1, 1].

Capítulo 5

Espacios duales y operadores traspuestos

En varios libros de Análisis Funcional se puede leer que el AnálisisFuncional es sobre todo dualidad y teoría espectral. Sin entrar en laposible exactitud de esa frase, no cabe duda que la noción de espaciodual es fundamental en muchas de las aplicaciones del Análisis Funcio-nal: muchas propiedades estructurales y geométricas sólo se entiendensi se formulan o se estudian en términos del dual, y las nociones deconvergencia débil y convergencia débil∗ necesitan de la definición deespacio dual para su misma definición. Una vez definido el dual de unespacio, dado un operador entre espacios normados tiene sentido definirsu traspuesto, lo que hacemos en este capítulo puesto que necesitamosesa noción para poder desarrollar la Teoría Espectral de operadorescompactos en los capítulos siguientes.

Dedicamos además buena parte de este capítulo a estudiar los dua-les de algunos espacios de Banach clásicos: c0, `p, Lp[0, 1] (1 ≤ p <∞)y C[0, 1]. El estudio del dual de este último nos lleva a hacer una peque-ña presentación de la integral de Riemann-Stieltjes y las funciones devariación acotada. Si los alumnos conocieran Teoría de la Medida estu-diaríamos directamente la representación del dual de C(K) en términosde medidas de Radon.

El estudio de los duales de `p y c0 lo hemos basado sobre todo en[24], el del dual de C[0, 1] en [5] y el de los duales de Lp en [42] y [31].

Espacio dual

Comenzamos recordando la definición de espacio dual.

Definición 5.1. Sea X un espacio normado. Entonces

X∗ := L(X;K) = T : X −→ K;T lineal y continuo

Como ya vimos anteriormente todo espacio dual es un espacio deBanach, por la completitud de K.

En este sentido, veamos que si partimos de un espacio normadono completo o de su completado, el dual es el mismo. Notemos que si

107

108 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

dos espacios de Banach X, Y , o dos espacios normados en general, sonisométricos (es decir existe una aplicación θ : X −→ Y lineal, biyectivay continua tal que ‖θ(x)‖ = ‖x‖ para todo x ∈ X) entonces todaslas estructuras de X e Y que conocemos y utilizamos (su estructuraconjuntista, su estructura vectorial y su norma, y junto con ella suestructura topológica) se conservan, por lo que no podemos distinguirun espacio del otro. Por tanto, a partir de ahora diremos que X = Ysi X e Y son isométricos.

Proposición 5.2. Sea X0 ⊂ X un subespacio denso. EntoncesX∗0 = X∗ con la identificación natural.

Demostración. Sea θ : X∗ −→ X∗0 el operador restricción, esdecir

θ(T ) = T|X0

Claramente θ es lineal y continuo, con

‖θ(T )‖ ≤ ‖T‖De la densidad de BX0 en BX se sigue que de hecho

‖θ(T )‖ = ‖T‖.Sólo nos falta ver que θ es sobre. Sea T0 ∈ X∗0 . El Teorema de

Hahn-Banach nos garantiza que existe T ∈ X∗ (con ‖T‖ = ‖T0‖) talque θ(T ) = T0, lo que termina la demostración.

Estudiamos a continuación los duales de los espacios de Banachclásicos que hemos visto hasta ahora.

Proposición 5.3 (Riesz). c∗0 = `1

Demostración. Dado x∗ ∈ c∗0, para cada n ∈ N definimos x∗n =

x∗(en) donde ei = (0, . . . , 0,(i)

1 , 0, 0, . . . , ). A continuación Definimos eloperador

θ : c∗0 −→ `1de la siguiente forma

θ(x∗) = (x∗n)n∈NVeamos que θ esta bien definido: si x∗n = x∗(en) = |x∗n|e−ıϕn , para

todo m ∈ N, consideramos el vector

vm = (e−ıϕ1 , e−ıϕ2 , . . . , e−ıϕm , 0, 0, . . .)

. Puesto que vm ∈ Bc∗0se tiene que

x∗(vm) = x∗

(m∑n=1

e−ıϕnen

)=

m∑n=1

e−ıϕnx∗(en) =m∑n=1

|x∗n| ≤ ‖x∗‖.

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 109

Por tanto∑∞

n=1 |x∗n| existe y es menor o igual que ‖x∗‖. Esto pruebaque θ está bien definido y puesto que claramente θ es lineal, los razo-namientos anteriores también prueban que θ es continuo y ‖θ‖ ≤ 1.

Vamos a usar ahora que el completado de (c00, ‖ · ‖∞) es c0, por loque para todo x∗ ∈ c∗0, se tiene que ‖x∗‖ = supx∈Bc00 x

∗(x).Dado x∗ ∈ c∗0, para todo x ∈ Bc00 , suponiendo xj = 0 para todo

j ≥ m, se tiene

x∗(x) = x∗

(m∑n=1

xnen

)=

m∑n=1

xnx∗n ≤ ‖x‖∞

m∑n=1

|x∗n| ≤

≤m∑n=1

|x∗n| ≤∞∑n=1

|x∗n| = ‖θ(x∗)‖

por lo que ‖x∗‖ ≤ ‖θ(x∗)‖ y esa era la desigualdad que nos faltabapara probar que θ es una isometría. Al ser isometría automáticamenteθ es inyectiva y sólo nos resta comprobar que θ es sobre.

Sea a = (an) ∈ `1. Consideramos la forma x∗ ∈ c∗0 dada por

x∗(x) =∞∑n=1

anxn

Claramente, para todo x ∈ c0 la serie∑∞

n=1 anxn es absolutamenteconvergente, puesto que

∞∑n=1

|anxn| ≤ supn|xn|

∞∑n=1

|an| = ‖x‖∞‖a‖1.

Por tanto x∗ es efectivamente un elemento de c∗0 y claramente θ(x∗) =a.

Proposición 5.4 (Riesz). `∗1 = `∞

Demostración. Dado x∗ ∈ `∗1 definimos x∗n = x∗(en), y definimosel operador

θ : `∗1 −→ `∞

comoθ(x∗) = (x∗n)

Veamos que θ está bien definido.

‖θ(x∗)‖ = supn|x∗n| = sup

n|x∗(en)| ≤ ‖x∗‖

por lo que θ está bien definido y, puesto que es claramente lineal, tam-bién es continuo.

110 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

Análogamente a la demostración anterior, vamos a usar ahora queel completado de (c00, ‖·‖1) es `1, por lo que para todo x∗ ∈ `∗1, se tieneque ‖x∗‖ = supx∈Bc00 x

∗(x).Dado x∗ ∈ `1, para todo x = (xn) ∈ Bc00 , suponiendo xj = 0 para

todo j ≥ m, se tiene

x∗(x) = x∗

(m∑n=1

xnen

)=

m∑n=1

xnx∗n ≤ sup

n|x∗n|

m∑n=1

|xn| ≤

≤ ‖θ(x∗)‖m∑n=1

|xn| ≤ ‖θ(x∗)‖∞∑n=1

|xn| ≤ ‖θ(x∗)‖

por lo que ‖x∗‖ ≤ ‖θ(x∗)‖ y θ es una isometría. Sólo resta compro-bar que θ es sobre.

Sea a = (an) ∈ `∞. Consideramos la forma x∗ ∈ `∗1 dada por

x∗(x) =∞∑n=1

anxn

Claramente, para todo x ∈ `1 la serie∑∞

n=1 anxn es absolutamenteconvergente, puesto que

∞∑n=1

|anxn| ≤ supn|an|

∞∑n=1

|xn| = ‖a‖∞‖x‖1.

Por tanto x∗ es efectivamente un elemento de `∗1 y claramente θ(x∗) =a.

Proposición 5.5 (Riesz). Sean 1 < p, q <∞ tales que 1p

+ 1q

= 1.Entonces `∗p = `q.

Demostración. Dado x∗ ∈ `∗p, para cada n ∈ N definimos x∗n =x∗(en).

Entonces definimos el operador

θ : `∗p −→ `q

de la siguiente formaθ(x∗) = (x∗n)n∈N

Veamos que θ esta bien definido: Dado x∗ ∈ `∗p, para todo m ∈ N,consideramos el vector vm = (|x∗1|q−1e−ıϕ1 , . . . , |x∗m|q−1e−ıϕm , 0, 0, . . .).

Notemos que si 1p

+ 1q

= 1 entonces 1p

= q−1q

por lo que p(q− 1) = q.Así

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 111

m∑n=1

|x∗n|q =m∑n=1

|x∗n|q−1|x∗n| =m∑n=1

|x∗n|q−1e−ıϕnx∗(en) =

= x∗

(m∑n=1

|x∗n|q−1e−ıϕnen

)= x∗(vm) ≤ ‖x∗‖‖vm‖p =

= ‖x∗‖

(m∑n=1

|x∗n|p(q−1)) 1

p

= ‖x∗‖

(m∑n=1

|x∗n|q) 1

p

Hemos probado que

m∑n=1

|x∗n|q ≤ ‖x∗‖

(m∑n=1

|x∗n|q) 1

p

y de aquí se sigue que(m∑n=1

|x∗n|q) 1

q

=

(m∑n=1

|x∗n|q)1− 1

p

≤ ‖x∗‖.

Por tanto θ está bien definido y es lineal y continuo con ‖θ‖ ≤ 1.Vamos a usar ahora que el completado de (c00, ‖ · ‖p) es `p, por lo

que para todo x∗ ∈ `∗p, se tiene que ‖x∗‖ = supx∈Bc00 x∗(x).

Dado x∗ ∈ `∗p, para todo x ∈ Bc00 , suponiendo xj = 0 para todoj ≥ m, se tiene, utilizando la desigualdad de Hölder, que

x∗(x) = x∗

(m∑n=1

xnen

)=

m∑n=1

xnx∗n ≤ ‖x‖p‖θ(x∗)‖q

por tanto ‖x∗‖ ≤ ‖θ(x∗)‖ y θ es una isometría. Veamos que essobreyectiva:

Sea a = (an) ∈ `q. Consideramos la forma x∗ ∈ `∗p dada por

x∗(x) =∞∑n=1

anxn

De nuevo por la desigualdad de Hölder, para todo x ∈ `p la serie∑∞n=1 anxn es absolutamente convergente, puesto que

∞∑n=1

|anxn| ≤ ‖(an)‖q‖(xn)‖p.

Por tanto x∗ es efectivamente un elemento de `∗p y claramente θ(x∗) =a.

112 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

El dual de C[0, 1]

Vamos a describir el dual de C[0, 1] como cierto subconjunto delas funciones de variación acotada, utilizando la Integral de Riemann-Stieltjes, que quizás nuestros alumnos ya conozcan. Si no la conocen,esta puede ser una buena oportunidad para presentarla y que se fami-liaricen con sus propiedades básicas.

Comenzamos definiendo funciones de variación acotada.

Definición 5.6. Una función g : [0, 1] −→ R se llama de variaciónacotada si su variación V (g) es finita, es decir, si

V (g) := sup0<x0...<xn=1

n∑i=1

|g(xi)− g(xi−1)|

<∞.

Es muy fácil ver que con las operaciones puntuales, el conjuntode las funciones de variación acotada BV [0, 1] es un espacio vectorial.Dado que V (g) = 0 implica que g es constante, es también fácil ver que

‖g‖v = |g(0)|+ V (g)

define una norma sobre BV [0, 1].

Recordemos la definición de la Integral de Riemann-Stieltjes.Dadas f, g : [0, 1] −→ R, para cada partición de [0, 1] π = 0 = x0 <

· · · < xn = 1 y para cada vector ξ = (ξ1 . . . , ξn), con ξi ∈ [xi−1, xi]definimos una suma de Riemann-Stieltjes de f respecto de g como

S(f, π, ξ; g) =n∑i=1

f(ξi)(g(xi)− g(xi−1))

La función f se dice integrable Riemann-Stieltjes respecto de g,y escribimos f ∈ R(g), si existe el límite de la red S(f, π, ξπ; g)πcuando π recorre el conjunto dirigido de todas las particiones de [0, 1]y ξπ es una elección fija de ξ para cada π. A este límite si existe lollamaremos ∫ 1

0

fdg

y se puede demostrar que no depende de la elección de ξ.Las siguientes propiedades de la integral de Riemann-Stieltjes son

fáciles de probar y se pueden ver por ejemplo en [2].

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 113

El conjunto R(g) de las funciones integrables Riemann-Stieltjesrespecto de g es un espacio vectorial y la aplicación

Tg : R(g) −→ R

definida como

Tg(f) =

∫ 1

0

fdg

es una forma lineal.Aditividad respecto al intervalo: Para todo c ∈ (0, 1) y paratodo f ∈ R(g),∫ 1

0

fdg =

∫ c

0

fdg +

∫ 1

c

fdg

Linealidad respecto al integrador. Si f ∈ R(g)∩R(h), entoncesf ∈ R(αg + βh) para todo α, β ∈ R y

∫ 1

0

fd(αg + βh) = α

∫ 1

0

fdg + β

∫ 1

0

hdg

Si g es de variación acotada entonces toda función continua f esintegrable. En ese caso no es necesario tomar el límite en la red,sino que se puede considerar una sucesión (π)n de particionesque verifique

‖πn‖ := max|xi − xi−1|; 1 ≤ i ≤ n → 0.

Además siempre

S(f, π, ξ; g) ≤ ‖f‖∞‖g‖vpor lo que ∣∣∣∣∫ 1

0

fdg

∣∣∣∣ ≤ ‖f‖∞‖g‖vPor tanto, la aplicación Tg : C[0, 1] −→ R es una forma

lineal y continua para cada g ∈ BV [0, 1], y ‖Tg‖ ≤ V (g) ≤‖g‖v. Lo interesante ahora es que también podemos procederen sentido opuesto.

Teorema 5.7 (Riesz). Si T : C[0, 1] −→ R es una forma lineal ycontinua, entonces existe g ∈ BV [0, 1] con g(0) = 0 tal que T = Tg y‖T‖ = ‖g‖v

114 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

Demostración. Sea T ∈ C[0, 1]∗. Si existiera g ∈ BV [0, 1] cong(0) = 0 tal que T = Tg, tendríamos

g(x) = g(x)− g(0) =

∫ x

0

dg =

∫ 1

0

χ[0,x]dg = T (χ[0,x])

y parece que bastará con definirg(x) = T (χ[0,x]).

El problema es que en general χ[0,x] 6∈ C[0, 1], por lo que la expresiónT (χ[0,x]) no tiene sentido. Será el Teorema de Hahn-Banach quien acu-da en nuestra ayuda. Notemos que C[0, 1] es un subespacio vectorial(incluso cerrado) de B[0, 1], las funciones reales acotadas definidas so-bre [0, 1]. Podemos entonces extender T a una forma T ∈ B[0, 1]∗ con‖T‖ = ‖T‖. Definamos las funciones ϕx como

ϕx = χ[0,x] si x 6= 0

yϕ0 = 0.

Ahora ya podemos definir g : [0, 1] −→ R como

g(x) = T (ϕx) para todo x ∈ [0, 1]

Veamos que g cumple lo que esperamos de ella.En primer lugar, g ∈ BV [0, 1]. En efecto, para toda partición

π = 0 = x0 < x1 < · · · < xn = 1tenemos

n∑i=1

|g(xi)− g(xi−1)| =n∑i=1

εi(g(xi)− g(xi−1)) =

= T

(n∑i=1

εi(ϕxi − ϕxi−1

))≤ ‖T‖

∥∥∥∥∥n∑i=1

εi(ϕxi − ϕxi−1

)∥∥∥∥∥ =

= ‖T‖

∥∥∥∥∥n∑i=1

εiχ(xi−1,xi]

∥∥∥∥∥ = ‖T‖,

donde εi = sgn(g(xi)− g(xi−1)).Por lo tanto g ∈ BV [0, 1] y V (g) ≤ ‖T‖. Como además g(0) = 0,

tenemosV (g) = ‖g‖v ≤ ‖T‖.

Veamos ahora que T = Tg. Sea f ∈ C[0, 1]. Definamos

fn(t) =n∑k=1

f

(k

n

)(ϕ k

n(t)− ϕ (k−1)

n

(t)).

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 115

Por ser f uniformemente continua se tiene que fn tiende a f en lanorma uniforme (‖ · ‖∞). Por lo tanto

T (fn) =n∑k=1

f

(k

n

)(g

(k

n

)− g

((k − 1)

n

))→ T (f) = T (f).

Pero, por las propiedades que hemos enunciado y la definición de laintegral de Riemann-Stieltjes se tiene que también

T (fn) =n∑k=1

f

(k

n

)(g

(k

n

)− g

((k − 1)

n

))→∫ 1

0

fdg.

En consecuencia

T (f) =

∫ 1

0

fdg,

es decir, T = Tg y por lo visto anteriormente ‖T‖ = ‖g‖v.

Ya hemos visto que todo elemento de C[0, 1]∗ se puede ver comouna función g ∈ BV [0, 1]. Nos gustaría ahora para que la identificaciónfuera perfecta tener unicidad en la representación. Eso no es posible,ya que como sabemos las extensiones por Hahn-Banach en general noson únicas, y para cada extensión de T tenemos una g diferente. Loque vamos a hacer es identificar un cierto subespacio de BV [0, 1] comoel dual de C[0, 1]. Para ello necesitaremos algunos resultados previos

Proposición 5.8. Sea g ∈ BV [0, 1]. Entonces Tg = 0 si y sólo si,para todo c ∈ (0, 1),

g(0) = g(1) = g(c+) = g(c−),

dondeg(c+) = lım

x→c+g(x)

y análogamente g(c−).

Demostración. Sea g tal que Tg = 0 y sea c ∈ (0, 1). Para cadah > 0 tal que c+ h ≤ 1 definimos

fh(t) =

1 si 0 ≤ t ≤ c0 si c+ h ≤ t ≤ 1

y lineal en el resto

Entonces

Tg(fh) = 0 =

∫ 1

0

fhdg = g(c)− g(0) +

∫ c+h

c

fhdg

116 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

Integrando por partes se tiene∫ c+h

c

fhdg = −g(c) +1

h

∫ c+h

c

g(t)dt

luego

g(0) =1

h

∫ c+h

c

g(t)dt→ g(c+)

cuando h→ 0.Análogamente se prueba que g(1) = g(c−). Finalmente tomando

f = 11 se tiene que 0 = g(1)− g(0).

Recíprocamente, si g es como en la hipótesis, entonces g es cons-tante en sus puntos de continuidad, que forman un conjunto denso de[0, 1] (pues su complementario es a lo sumo numerable). Tomando unasucesión de particiones con norma tendiendo a 0 formadas exclusiva-mente por puntos de continuidad de g, las correspondientes sumas sontodas nulas, y por tanto su límite

∫ 1

0fdg también lo es.

Definición 5.9. Una función g ∈ NBV [0, 1] se llama normalizadasi g(0) = 0 y g es continua por la derecha en todo punto c ∈ (0, 1).Llamamos NBV [0, 1] al subespacio vectorial de BV [0, 1] formado porlas funciones normalizadas.

Proposición 5.10. Si g1, g2 ∈ NBV [0, 1] cumplen que Tg1−g2 = 0,entonces g1 = g2

Demostración. Por ser g1, g2 ∈ NBV [0, 1] se tiene

g1(0) = g2(0) = 0.

Por lo tanto (g1 − g2)(0) = 0. Por la Proposición 5.8 se tiene g1(1) −g2(1) = g1(0) − g2(0) y por tanto g1(1) = g2(1), y análogamente paratodo c ∈ (0, 1) usando la continuidad por la derecha de gi

Proposición 5.11. Para cada g ∈ BV [0, 1] existe una única fun-ción g ∈ NBV [0, 1] tal que Tg−g = 0. Además V (g) ≤ V (g).

Demostración. La unicidad se sigue de la proposición anterior.En cuanto a la existencia, basta con definir

g(c) =

0 si c = 0g(1)− g(0) si c = 1g(c+)− g(0) si c ∈ (0, 1)

Veamos que g cumple lo pedido. Sea c ∈ (0, 1). Sea ε > 0. Existeδ > 0 tal que si c < s < c+ δ entonces

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 117

|g(c+)− g(s)| ≤ ε.

Por lo tanto, tomando (tn) ⊂ (s, c + δ) una sucesión decreciente queconverge a s (esto lo escribimos (tn) s) y dejando que n tienda ainfinito se tiene que, para todo s ∈ (c, c+ δ),

|g(c+)− g(s+)| ≤ ε.

De aquí se sigue quelımsnc

g(sn) = g(c)

y por lo tanto g es continua a la derecha en todo c ∈ [0, 1).De forma análoga se prueba que

g(c−) = g(c−)− g(0),

y por lo tanto la función g−g verifica las condiciones de la Proposición5.8. Por tanto ya sólo falta probar que V (g) <∞. Para esto, sea

0 = t0 < t1 < · · · < tn = 1

una partición de [0, 1] y sea ε > 0. Sean si ∈ (ti, ti+1) (0 ≤ i ≤ n) talesque

|g(t+i )− g(si)| <ε

n.

Entonces, haciendo sn = tn = 1 se tienen∑i=1

|g(ti)− g(ti−1)| ≤ 2ε+n∑i=1

|g(si)− g(si−1)| ≤ 2ε+ V (g),

de dondeV (g) ≤ V (g)

y se concluye la demostración.

Finalmente podemos enunciar

Teorema 5.12 (Representación de Riesz). C[0, 1]∗ = NBV [0, 1].

Demostración. Sea

θ : NBV [0, 1] −→ C[0, 1]∗

la aplicación definida como

θ(g) = Tg.

Ya hemos visto que θ es lineal, continua y que

‖θ(g)‖ = ‖Tg‖ ≤ ‖g‖v.

118 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

Por otro lado, si T ∈ C[0, 1]∗ hemos visto que existe g ∈ BV [0, 1] talque Tg = T y que existe una única g ∈ NBV [0, 1] tal que Tg−g = 0, esdecir Tg = Tg = T . Por lo tanto θ es sobreyectiva y una isometría yaque

‖T‖ = ‖θ(g)‖ ≤ ‖g‖v ≤ ‖g‖v = ‖T‖.

Los duales de los Lp[0, 1]

Utilizamos en esta sección nuestros conocimientos de la Teoría In-tegral de Lebesgue para estudiar los duales de Lp[0, 1].

Teorema 5.13. Sea 1 ≤ p, q ≤ ∞ con 1p

+ 1q

= 1. Dado g ∈ Lq[0, 1]

sea Tg : Lp[0, 1] −→ K la aplicación definida como

Tg(f) =

∫ 1

0

fgdλ para todo f ∈ Lp[0, 1].

Entonces Tg ∈ (Lp[0, 1]∗ y ‖Tg‖ = ‖g‖q. Por lo tanto la aplicación

θ : Lq[0, 1] −→ (Lp[0, 1])∗

dada por θ(g) = Tg es una isometría (aún no afirmamos que sea sobre-yectiva).

Demostración. La demostración es bastante similar a la de losduales de los `p. Los detalles se pueden ver por ejemplo en [31, Theorem14.1].

Se puede probar además que en el caso 1 ≤ p <∞ la isometría θ delteorema anterior es sobreyectiva y por lo tanto (Lp[0, 1])∗ = Lq[0, 1]. Lademostración más habitual de este hecho utiliza el Teorema de Radon-Nikodym, un resultado profundo de Teoría de la Medida (o de la Teo-ría de la Integral de Lebesgue) que preferimos no tener que exponer.Los alumnos interesados pueden leer una demostración laboriosa pe-ro elemental (sin Radon-Nikodym) de la sobreyectividad de θ en [31,Theorem 14.3].

Traspuesto de un operador

Relacionado con la idea de espacio dual está la noción de traspuestode un operador.

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 119

Definición 5.14. Sean X, Y espacios normados, y sea T : X −→Y un operador. Definimos el traspuesto de T , y lo denotamos T ∗, comoel operador

T ∗ : Y ∗ −→ X∗

definido porT ∗(y∗)(x) = y∗(T (x)).

Para todo x ∈ BX , y∗ ∈ BY ∗ se tiene que

|T ∗(y∗)(x)| = |y∗(T (x)| ≤ ‖T (x)‖ ≤ ‖T‖de donde se obtiene que T ∗ está bien definido.Claramente es lineal yde la misma desigualdad de arriba se sigue que T ∗ es continuo y

‖T ∗‖ ≤ ‖T‖Para obtener la igualdad de las normas podemos tomar supremos

en la expresión de arriba, o considerar T ∗∗ = (T ∗)∗ : X∗∗ −→ Y ∗∗. Esfácil ver que

T ∗∗(J(x)) = T (x),

(esto se puede proponer como ejercicio) por lo que

‖T‖ ≤ ‖T ∗∗‖ ≤ ‖T ∗‖ ≤ ‖T‖de donde se sigue la igualdad de todas las normas involucradas.

La notación de traspuesto de un operador se justifica con el siguienteejemplo que proponemos como ejercicio.

Ejercicio 5.1. Sea X = Kn, Y = Km. Consideramos en ambosespacios por ejemplo las bases canónicas. Sabemos que todo operador T :X −→ Y se representa de forma única (respecto de las bases elegidas)como una matriz A = (aij) donde para todo 1 ≤ j ≤ n

T (ej) =m∑i=1

aijei

Entonces si consideramos también las bases canónicas en los espaciosduales (Kn)∗ = Kn y (Km)∗ = Kn demostrar que la matriz traspuestaAT es la matriz que representa respecto de esas bases al operador T ∗ :Y ∗ −→ X∗

Ejercicio 5.2. (T + S)∗ = T ∗ + S∗, (T S)∗ = S∗ T ∗

Definición 5.15. Sean X, Y espacios de Banach. Un operadorT : X −→ Y se dice que es un isomorfismo inyectivo si existen dosconstantes c, C > 0 tales que para todo x ∈ X

c‖x‖ ≤ ‖T (x)‖ ≤ C‖T (x)‖.

120 5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS

Ejercicio 5.3. Sean X, Y espacios de Banach. Si T : X −→ Yisomorfismo inyectivo entonces T (X) ⊂ Y es un subespacio cerrado yT (X) y X son isomórfos.

Proposición 5.16. Sean X, Y espacios de Banach, T : X −→ Yun operador. Entonces T es un isomorfismo inyectivo si y sólo si T ∗es sobre. Análogamente, T es sobre si y sólo si T ∗ es un isomorfismoinyectivo.

Demostración. Supongamos que T es un isomorfismo. EntoncesT (X) ⊂ Y es un subespacio cerrado isomorfo a X. Por tanto T (X)∗

es isomorfo a X∗. Para ver que T ∗ : Y ∗ −→ X∗ es sobreyectiva, dadox∗ ∈ X∗ podemos considerar el elemento de e∗ ∈ T (X)∗ dado pore∗(T (x)) = x∗(x). Extendemos e∗ por Hahn-Banach a un elementoy∗ ∈ Y ∗ con ‖y∗‖ = ‖e∗‖. Sea entonces T ∗ : Y ∗ −→ X∗. Se tiene que,para todo x ∈ X

T ∗(y∗)(x) = y∗T (x) = e∗T (x) = x∗(x)

y por tanto T ∗(y∗) = x∗.

Recíprocamente, si T ∗ : Y ∗ −→ X∗ es sobreyectivo, para todox ∈ X, utilizando el Teorema de la Aplicación Abierta se tiene que

‖x‖ = supx∗∈BX∗

‖x∗(x)‖ ≤ supy∗∈γBY ∗

‖T ∗(y∗)(x)‖ =

= supy∗∈γBY ∗

‖y∗(T (x))‖ ≤ ‖γ‖‖T‖‖x‖

y esta es la condición que necesitamos para que T sea un isomorfismoinyectivo.

La demostración de la segunda mitad del teorema es análoga y sedeja como ejercicio.

Prácticas sugeridas

Ejercicio 5.4. Sean X, Y espacios de Banach, T : X −→ Y unoperador. Entonces T (X) es denso si y sólo si T ∗ es inyectivo.

Ejercicio 5.5. Demostrar que la identidad T : `1 −→ `2 es inyec-tivo, pero T ∗ no es sobre (porque `2 es separable y `∞ no lo es).

Ejercicio 5.6. Demostrar que si 1 ≤ p <∞ y 1p

+ 1q

= 1 entoncesL∗p[0, 1] = Lq[0, 1].

5. ESPACIOS DUALES Y OPERADORES TRASPUESTOS 121

Ejercicio 5.7. Probar que ‖ · ‖v es una norma en BV [0, 1].

Capítulo 6

Topologías débil y débil∗

Como ya dijimos al comentar el Teorema de Hahn-Banach, dadoun espacio normado (completo o no) X, dicho teorema nos garantizala existencia de un dual X∗ con una estructura “suficientemente rica”.Resulta entonces que el estudio deX∗, y deX con la topología inducidapor X∗ (la topología débil que definimos en este capítulo) tienen granimportancia en muchos resultados fundamentales del Análisis Funcio-nal. Con razonamientos similares se puede estudiar en X∗ la topologíainducida por X (la topología débil∗ que definimos más adelante) y ve-remos que ésta también tiene múltiples aplicaciones.

Además de las definiciones y propiedades básicas de las topologíasdébil y débil∗, estudiamos en este capítulo los duales de X y X∗ conlas topologías débil y débil∗ respectivamente. También presentamosen Teorema de Alaoglu y el de Goldstine, y un breve estudio de lareflexividad en espacios de Banach.

Opcionalmente se podrían estudiar también el Teorema de Eberleiny el Teorema de Mazur acerca de la coincidencia de las clausuras enlas topología débil y de la norma para espacios convexos. Este últimoteorema resulta además una bonita aplicación del Teorema de Hahn-Banch, al igual que el Teorema de Goldstine.

Este capítulo tal y como lo hemos planteado es algo más “topoló-gico” que los anteriores, aunque los únicos conocimientos topológicosrealmente necesarios son la noción de red, la misma noción de topologíay la de base de una topología. Si los alumnos no estuvieran en posesiónde estas nociones topológicas básicas, se podría plantear el estudio deeste capítulo como se hace en [31], definiendo tan sólo la convergen-cia débil y débil∗ de sucesiones. Con eso es suficiente para probar, porejemplo, una versión débil del Teorema de Alaouglu-Bourbaki, que diceque la bola unidad del dual de un espacio separable es débil∗ secuen-cialmente compacta. También se puede probar el Teorema de Eberlein,la propiedad de Schur de `1 y varias aplicaciones interesantes de laconvergencia débil y débil∗.

123

124 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

Nosotros hemos basado nuestra presentación de este capítulo sobretodo en [15] y [24].

La topología débil

Definición 6.1. Sea X un espacio normado con dual X∗. Se definela topología débil de X como la topología generada por la siguiente basede entornos: dados x0 ∈ X, n ∈ N, x∗1, . . . , x∗n ∈ X∗, y ε > 0 un entornodébil de x0 viene definido por

W (x0;x∗1, . . . , x

∗n; ε) = x ∈ X tales que |x∗i (x− x0)| < ε

para todo 1 ≤ i ≤ n

Veamos que la topología débil es separada (Hausdorff). Dados x 6=y ∈ X, ‖x−y‖ 6= 0 por lo que el Teorema de Hahn-Banach nos garantizaque existe x∗ ∈ X∗ tal que

x∗(x− y) > 0,

es decir, x∗(x)− x∗(y) > 0. Si ε = x∗(x)− x∗(y) entonces

x ∈ W (x;x∗;ε

3), y ∈ W (y;x∗;

ε

3) y W (x;x∗;

ε

3) ∩W (y;x∗;

ε

3) = ∅

La topología débil es una topología vectorial, es decir, la suma y elproducto son continuos. Veámoslo para la suma, el producto es similar.Sean x, y ∈ X. SeaW (x+y;x∗1, . . . , x

∗n; ε) un entorno de x+y. Entonces

tomando los entornos W (x;x∗1, . . . , x∗n; ε

2) y W (y;x∗1, . . . , x

∗n; ε

2) se tiene

que W (x;x∗1, . . . , x∗n; ε

2) +W (y;x∗1, . . . , x

∗n; ε

2) ⊂ W (x+ y;x∗1, . . . , x

∗n; ε),

lo que prueba que la suma es continua.Nótese que si X tiene dimensión infinita entonces los entornos débi-

les (por ejemplo del 0) son bastante “grandes”. Por ejemplo, un entornoW (0;x∗1, . . . , x

∗n; ε) contiene al subespacio

∩ni=1 kerx∗i ,

un subespacio de codimensión finita. Y eso es muy grande.Como consecuencia de este comentario se tiene la siguiente propo-

sición.

Teorema 6.2. Sea X un espacio de Banach. La topología débilcoincide con la topología de la norma si y sólo si dimX <∞.

Demostración. Supongamos que la topología débil coincide conla topología de la norma. Entonces la bola unidad abierta UX = x ∈

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 125

X tales que ‖x‖ < 1 es abierta para la topología débil. Si X tuvie-ra dimensión infinita entonces por el comentario anterior existiría unsubespacio no trivial dentro de UX , algo claramente imposible.

Recíprocamente, supongamos que dimX = n < ∞. Puesto que yahemos visto que en dimensión finita todas las normas son equivalentes,X es isomorfo a `n∞. Veamos ahora que la topología débil y la topologíade la norma coinciden sobre X.

Si U ⊂ X es un abierto débil, ya hemos visto que U es abierto enla topología de la norma.

Por otro lado, si U ⊂ X es un abierto en la topología de la norma,entonces también U ⊂ `n∞ es abierto (en la topología de la norma ∞).Sea x0 ∈ U . Existe r > 0 tal que B(x0, r) ⊂ U . Pero

B(x0, r) = W (x0; e∗1, . . . , e

∗n; r)

y por tanto U es un abierto débil. (Nótese que estamos usando implí-citamente que puesto que X es isomorfo a `n∞, se tiene que e∗i ∈ X∗

(1 ≤ i ≤ n).

De hecho podemos probar aún más, que la topología débil es me-trizable si y sólo si X tiene dimensión finita. Para ello necesitamospreviamente un lema algebraico que tendremos ocasión de utilizar enmás de una ocasión.

Lema 6.3. Sea X un espacio vectorial y sean f, g1, . . . , gn formaslineales sobre X tales que

∩ni=1 ker gi ⊂ ker f

Entonces f es una combinación lineal de los gi’s.

Demostración. Razonamos por inducción sobre n. Para n = 1 ellema es fácil y ya lo probamos en el Capítulo 4. Supongamos que ya lohemos probado para k ≤ n − 1. Entonces dados f, g1, . . . , gn como enel enunciado del teorema aplicamos la hipótesis de inducción a

f|ker gn , g1|ker gn , . . . , gn−1|ker gny deducimos que, sobre el ker gn,

f =n−1∑i=1

aigi

Por tanto f −∑n−1

i=1 aigi se anula en ker gn, es decir

ker gn ⊂ ker

(f −

n−1∑i=1

aigi

)

126 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

y por tanto del caso n = 1 obtenemos que

f −n−1∑i=1

aigi = angn

de donde se obtiene lo pedido.

Ahora podemos probar que la topología débil nunca es metrizablesi X es de dimensión infinita.

Proposición 6.4. Sea X un espacio normado. En ese caso la topo-logía débil sobre X es metrizable si y sólo si X es de dimensión finita.

Demostración. Ya vimos que siX es de dimensión finita entoncesla topología débil coincide con la topología de la norma, y por tanto esmetrizable.

Recíprocamente, supongamos que la topología débil es metrizable.Puesto que las topologías metrizables satisfacen el I Axioma de Nu-merabilidad, debe existir una sucesión (x∗n)n ⊂ X∗ tal que para todoentorno U de 0 existe un racional Q 3 ε > 0 y un natural n(U) ∈ Ntales que U contiene a W (0;x∗1, . . . , x

∗n(U); ε). Cada x

∗ ∈ X∗ genera elentorno débil W (0;x∗; 1) que a su vez contiene uno de los entornosW (0;x∗1, . . . , x

∗n(W (0;x∗;1)); ε). Pero por el Lema 6.3, esto obliga a que x∗

sea una combinación lineal de x∗1, . . . , x∗n(W (0;x∗;1)). Esto implicaría queX∗ tendría una base algebraica numerable, y puesto que X∗ es un es-pacio de Banach, esto sólo puede ocurrir si X∗, y por tanto X tienedimensión finita.

De hecho se tiene que si dimX < ∞ entonces existe una únicatopología vectorial separada sobre X (obviamente normable), aunqueno probaremos ese resultado en este curso.

Proposición 6.5. Sea X un espacio normado. Una red (o unasucesión) (xi)i∈I ⊂ X tiende débilmente a x0 ∈ X si y sólo si para todox∗ ∈ X∗

lımix∗(xi) = x∗(x0)

Demostración. En efecto, supongamos que lımi x∗(xi) = x∗(x0)

para todo x∗ ∈ X∗. Si W es un abierto de la topología débil quecontiene a x0, entonces existe un W (x0;x

∗1, . . . , x

∗n; ε) ⊂ W . Puesto

que, por hipótesis lımi x∗j(xi) = x∗j(x0) para todo 1 ≤ j ≤ n, existe

i0 ∈ I tal que para todo i ≥ i0 (donde “≥” denota el orden en I)

|x∗j(xi)− x∗j(x0)| < ε

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 127

y por tanto para todo i ≥ i0 se tiene que xi ∈ W (x0;x∗1, . . . , x

∗n; ε) ⊂ W ,

es decir (xi)→ x0 en la topología débil.

Recíprocamente, supongamos que (xi) → x0 en la topología débil,y sea x∗ ∈ X∗. Para todo ε > 0, consideramos el entorno W (x0;x

∗; ε).Entonces existe i0 ∈ I tal que para todo i ≥ i0 se tiene que xi ∈W (x0;x

∗; ε), lo que implica que

|x∗(xi)− x∗(x0| < ε

y de aquí se sigue que

lımix∗(xi) = x∗(x0).

Proposición 6.6. Sea X un espacio normado y x∗ : X −→ K unaforma lineal. Entonces x∗ es continua para la topología de la norma deX si y sólo si x∗ es continua para la topología débil de X.

Demostración. Las bases de entornos utilizadas para definir latopología débil son abiertos en la topología de la norma (porque son∩ni=1(x

∗i )−1(A) con A abierto y x∗i norma-continuos) y de ahí se sigue

que los conjuntos abiertos en la topología débil son ‖ · ‖−abiertos, esdecir, la topología de la norma es más fuerte (tiene más abiertos) quela topología débil (y de ahí el nombre). Por tanto si x∗ : X −→ K escontinuo para la topología débil, también lo es para la topología de lanorma.

Recíprocamente, si x∗ ∈ X∗, para todo ε > 0 el conjunto (x∗)−1(ε, ε)es un abierto débil, y por tanto x∗ es débilmente continua.

Una vez probado esto podemos probar el siguiente teorema

Teorema 6.7. Sea T : X −→ Y una aplicación entre dos espaciosnormados X e Y . Entonces T es norma-norma continua si y sólo si Tes débil-débil continua.

Demostración. Supongamos que T es norma-norma continua.Entonces para todo y∗ ∈ Y ∗ se tiene que y∗ T : X −→ K es nor-ma continua; por tanto y∗ T ∈ X∗ y del resultado anterior se sigueque y∗ T es débil continua, y de aquí se sigue que T es débil-débilcontinua.

Recíprocamente, si T es débil-débil continua, entonces para todoy∗ ∈ Y ∗ se tiene que y∗ T es débil continua. Por tanto y∗ T es

128 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

norma continua. Ahora el Teorema 4.9, consecuencia del Principio deAcotación Uniforme, nos dice que T es norma-norma continua.

Probamos a continuación el Teorema de Mazur.

Teorema 6.8 (Mazur). Si K es un conjunto convexo del espacionormado X, entonces la clausura débil de K coincide con su clausuraen norma.

Demostración. Puesto que la topología de la norma es más fuer-te, se tiene automáticamente que

K‖·‖ ⊂ K

w

Para el otro contenido, supongamos que existe

x0 ∈ Kw \K‖·‖

Entonces, puesto que K‖·‖ es convexo, por el teorema de Hahn-Banachexisten x∗0 ∈ X∗ y α < β ∈ R tales que

(9) supx∈K‖·‖

<(x∗0(x)) ≤ α < β ≤ <(x∗0(x0))

Pero puesto que x0 ∈ Kw, se tiene que existe una red (xi)i∈I ⊂ K

tal quex0 = lım

ixi

ya vimos anteriormente que esto implicaba que

x∗(x0) = lımix∗(xi)

pero esto es imposible ya que, según (9),

lımi<(x∗(xi)) ≤ α < β ≤ <(x∗0(x0))

El siguiente corolario, útil en ocasiones, se puede proponer comoejercicio

Corolario 6.9. Sea (xn) ⊂ X una sucesión que tiende débilmentea 0. Entonces existe una sucesión (σn) de combinaciones convexas delos (xn) tal que (σn) tiende en norma a 0.

Aunque la topología débil no se puede caracterizar en general porsucesiones, muchas de las aplicaciones de la topología débil vendrán

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 129

precisamente a través del estudio de la convergencia débil de sucesio-nes. Puesto que la topología de la norma es mas fuerte, es más fácilpara una sucesión converger en la topología débil, y la mayoría de lasaplicaciones de la topología débil vendrán precisamente de conseguirque una sucesión que no converge en norma sí lo haga débilmente, ybuscar las consecuencias que se puedan extraer de eso.

Veamos esto con un poco de detalle

Sea (xn) ⊂ X una sucesión tal que xn‖·‖→ x. Entonces xn

w→ x.Demostración: Para todo x∗ ∈ X∗,

|x∗(xn)− x∗(x)| = |x∗(xn − x)| ≤ ‖xn − x‖ → 0

Sea la sucesión (en) ⊂ `2. Entonces ‖en‖ = 1 para todo n ∈ Npero en

w→ 0.Demostración: La primera afirmación es evidente. Para la

segunda, sea a ∈ `∗2. Ya vimos que entonces a = (an) ∈ `2 y

a(en) =∑m

amδnm = an

y puesto que (an) ∈ `2, se sigue que

lımna(en) = lım

nan = 0

Puede ocurrir en cambio que en un espacio normado X la conver-gencia débil de sucesiones coincida con la convergencia en norma desucesiones. Schur probó que este es el caso si X = `1 por lo que a losespacios que verifican esta propiedad se les llama espacios de Schur.

Teorema 6.10 (Schur). En `1 una sucesión (xn)n tiende débilmen-te a x si y sólo si (xn) tiende en norma a x.

Demostración. Hacemos la demostración en el caso real. Se adap-ta al caso complejo de forma estandar y dejamos esto como ejercicio.

Veamos primero que si xn tiende débilmente a 0 entonces tambiénconverge a 0 en norma. Si no fuera así, tomando subsucesiones podemossuponer la existencia de ε > 0 tal que para todo n ∈ N,

‖xn‖ =∞∑i=1

|xin| > ε.

Sea N1 tal que∞∑

i=N1+1

|xi1| <ε

5.

130 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

EntoncesN1∑i=1

|xi1| ≥4ε

5,

y por tantoN1∑i=1

εi1xi1 ≥

5,

donde εi1 = sgn(xi1). Obsérvese que para una elección arbitraria designos εi = ±1 tales que εi = εi1 si 1 ≤ i ≤ N1 se tiene que∣∣∣∣∣

∞∑i=1

εixi1

∣∣∣∣∣ =

∣∣∣∣∣N1∑i=1

εi1xi1 +

∞∑i=N1+1

εixi1

∣∣∣∣∣ ≥≥

∣∣∣∣∣N1∑i=1

εi1xi1

∣∣∣∣∣−∞∑

i=N1+1

|xi1| ≥4ε

5− ε

5=

5.

A continuación, puesto que (xn) tiende débilmente a 0, considerandotodos los elementos εN1 = (±1, (N1). . . ,±1, 0, 0, . . .) ∈ `∞ = (`1)

∗ elegimosn2 tal que

N1∑i=1

|xin2| < ε

5.

Seguidamente consideramos N2 > N1 tal que∞∑

i=N2+1

|xin2| < ε

5.

EntoncesN2∑i=1

|xin2| ≥ 4ε

5,

y por tanto, dados los signos εN1+1 = sgn(xN1+1n2

),· · · ,εN2 = sgn(xN2n2

)tenemos que

N2∑i=N1+1

εixin2

=

N2∑i=N1+1

|xin2| =

N2∑i=1

|xin2| −

N1∑i=1

|xin2| ≥ 4ε

5− ε

5=

5.

De nuevo nótese que para una elección arbitraria de signos εi = ±1tales que εi = εi1 si 1 ≤ i ≤ N1 y εi = εin2

si N1 ≤ i ≤ N2 se tiene que∣∣∣∣∣∞∑i=1

εixin2

∣∣∣∣∣ =

∣∣∣∣∣N2∑

i=N1+1

εixin2−

N1∑i=1

εixin2

+∞∑

i=N2+1

εixi1

∣∣∣∣∣ ≥

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 131

∣∣∣∣∣N2∑

i=N1+1

εixin2

∣∣∣∣∣−∣∣∣∣∣N1∑i=1

εixin2

∣∣∣∣∣−∣∣∣∣∣∞∑

i=N2+1

εixi1

∣∣∣∣∣ ≥≥

∣∣∣∣∣N2∑

i=N1+1

εixin2

∣∣∣∣∣−N1∑i=1

|xin2| −

∞∑i=N2+1

|xi1| ≥

≥ 3ε

5− ε

5− ε

5=ε

5Continuando la construcción por inducción, obtenemos dos sucesiones1 < n2 < n3 < · · · y N1 < N2 < N3 < · · · y un vector ε = (εi) ∈ `∞definido como

εi = sgn(xink) si Nk−1 < i ≤ Nk

de manera que, para todo k ∈ N,

ε(xnk) ≥ε

5

en contradicción con el hecho de que xn tienda débilmente a 0.

Si ahora xn tiende débilmente a x razonamos análogamente con lasucesión (xn − x).

Hay varias demostraciones de este resultado fundamental. Hemosreproducido la de [24, Thm 99] que es elemental y utiliza el método dela “joroba deslizante” que tiene aplicaciones en otros contextos. En [13,Prop V.5.2] se puede encontrar una demostración más topológica, queutiliza el Teorema de Baire, el Teorema de Alaoglu y el hecho de que(B`∞ , w

∗) es metrizable (por ser `1 separable). En [15, p. 85] apareceotra demostración que utiliza el Lema de Philips y una descripción deldual de `∞.

La topología débil∗

Una vez estudiados algunos de los resultados básicos más impor-tantes referidos a la topología débil, pasamos a estudiar la topologíadébil∗ sobre un espacio dual X∗.

Definición 6.11. Sea X un espacio normado con dual X∗. La to-pología débil∗ en X∗ es la topología generada por la siguiente base deentornos: dados x∗0 ∈ X∗, n ∈ N, x1, . . . , xn ∈ X, y ε > 0 un entornodébil∗ de x∗0 viene definido por

W (x∗0;x1, . . . , xn; ε) = x∗ ∈ X∗ tales que

|J(xi)(x∗ − x∗0)| = |(x∗ − x∗0)(xi)| < ε para todo 1 ≤ i ≤ n

132 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

Dado un espacio dual X∗, es obvio que la topología débil∗ sobreX∗ es en general menos fuerte (tiene menos entornos) que la topologíadébil sobre X∗, puesto que la topología débil es la generada por todoslas formas x∗∗ ∈ X∗∗, mientras que la débil∗ es la generada tan sólopor las formas J(x) ∈ X∗∗, con x ∈ X.

Veamos que a pesar de ello la topología débil∗ tiene suficientes en-tornos para ser Hausdorff.

Dados x∗ 6= y∗ ∈ X∗, existe x ∈ X tal que

(x∗ − y∗)(x) > 0,

y ahora podemos razonar como lo hacíamos en el caso de la topologíadébil.

De nuevo es fácil ver que la topología débil∗ es una topología vec-torial.

Siguiendo exactamente la misma demostración que para el caso de latopología débil, mutatis mutandi se demuestra que una red (o sucesión)(x∗i )i∈I ⊂ X∗ tiende débil∗ a x∗0 ∈ X∗ si y sólo si para todo x ∈ X

lımiJ(x)(x∗i ) lım

ix∗i (x) = x∗0(x)

Veamos a continuación que al igual que el dual deX con la topologíadébil es X∗, también el dual de X∗ con la topología débil∗ es X.

Teorema 6.12. Sea X un espacio de Banach y sea x∗∗ ∈ X∗∗ unaforma acotada tal que x∗∗ : X∗ −→ K es continuo para la topologíadébil∗. Entonces existe x ∈ X tal que J(x) = x∗∗ (o, dicho más bre-vemente, x∗∗ ∈ X). Recíprocamente, para todo x ∈ X se tiene quex ∈ (X∗, w∗)∗.

Demostración. Si x∗∗ es continuo para la topología débil∗, en-tonces existe un entorno débil∗ del origen W := W (0;x1, . . . , xn; ε) talque |x∗∗(x∗)| < 1 para todo x∗ ∈ W . Sea x∗ ∈ X∗ tal que J(xi)(x

∗) =x∗(xi) = 0 para todo 1 ≤ i ≤ n. Entonces para todo λ ∈ K, λx∗ ∈ Wy por tanto |x∗∗(λx∗)| < 1 lo que implica que x∗∗(x∗) = 0. Por tanto

∩ni=1 ker(J(xi)) ⊂ kerx∗∗

Ahora el Lema 6.3 nos garantiza que

x∗∗ =∑i

aiJ(xi)

y puesto que J(X) es un subespacio vectorial, se sigue que x∗∗ ∈ J(X).

La otra implicación es inmediata.

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 133

Enunciamos y probamos a continuación los Teoremas de Goldstiney Alaoglu.

Teorema 6.13 (Alaoglu). Para todo espacio normado X, BX∗ esdébil∗ compacto.

Demostración. Por el Teorema de Tychonoff, el espacio [−1, 1]BX

de las funciones f : BX −→ [−1, 1] con la topología producto (la to-pología de la convergencia puntual) es un espacio compacto. Dado unx∗ ∈ BX∗ , podemos identificar de forma natural x∗ con un punto de[−1, 1]BX , de forma que podemos identificar BX∗ con un subconjuntode [−1, 1]BX . Puesto que la topología débil∗ es la topología de la conver-gencia puntual, esta identificación nos permite ver a (BX∗ , τw∗) comoun subconjunto de [−1, 1]BX con la topología producto, de manera quepara probar el teorema simplemente tenemos que probar que BX∗ esun cerrado de [−1, 1]BX .

Sea (x∗i )i∈I ⊂ BX∗ una red convergente puntualmente (débil∗) af ∈ [−1, 1]BX . Veamos que f es “lineal” sobre BX : Para todos α, β ∈ K,x, y ∈ X tales que αx+ βy ∈ BX , se tiene

f(αx+ βy) = lımix∗i (αx+ βy) =

= lımiαx∗i (x) + lım

iβx∗i (y) = αf(x) + βf(y),

Además f está acotada en BX y ‖f‖ ≤ 1 puesto que f(BX) ⊂ [−1, 1],por lo que f ∈ BX∗ .

Teorema 6.14 (Goldstine). Sea X un espacio normado. EntoncesBX es débil∗ densa en BX∗∗ y por lo tanto X es débil∗-denso en X∗∗.

Demostración. Sea x∗∗ ∈ X∗∗ y supongamos que x∗∗ 6∈ BXw∗ .

Aplicamos el Teorema de Hahn-Banach. Para ello observamos que1. (X∗∗, w∗) es un espacio localmente convexo y (X∗∗, w∗)∗ = X∗

2. BXw∗ ⊂ (X∗∗, w∗) es un conjunto débil∗ cerrado y convexo.

3. x∗∗ es débil∗ cerrado y convexo.Por lo tanto podemos aplicar la versión geométrica del Teorema de

Hahn-Banach para obtener un elemento x∗ ∈ X∗ tal que

supy∗∗∈BX

w∗x∗(y∗∗) < x∗(x∗∗)

además podemos suponer sin perdida de generalidad que ‖x∗‖ = 1.En ese caso

supy∗∗∈BX

w∗x∗(y∗∗) ≥ ‖x∗‖ = 1

134 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

por lo quex∗(x∗∗) > 1,

luego ‖x∗∗‖ > 1 y por lo tanto

BX∗∗ ⊂ BXw∗

.

La última afirmación es ahora fácil.

Corolario 6.15. X es reflexivo si y sólo si BX es débilmentecompacta.

Demostración. Supongamos que X es reflexivo. Entonces X =X∗∗ y BX = BX∗∗ , y esta es débil∗ compacta. Puesto que la topologíadébil y la débil∗ coinciden en los reflexivos, tenemos que BX es débilcompacta.

Recíprocamente, si BX es débil compacta, entonces es débil∗ cerradaen X∗∗. Puesto que la clausura débil∗ de BX en BX∗∗ es BX∗∗ , tenemosque BX = BX∗∗ y por tanto X = X∗∗.

Si bien la topología débil∗ sobre X∗ nunca es metrizable (si X esinfinito-dimensional), sí ocurre a menudo que el conjunto compacto(BX∗ , w

∗) es metrizable, y a menudo se puede sacar partido de ello.Veamoslo

Teorema 6.16. Un espacio de Banach X es separable si y sólo si(BX∗ , w

∗) es metrizable.

Demostración. Sea (xn) ⊂ SX una sucesión densa en SX , y de-finamos una función d : BX∗ ×BX∗ −→ [0,∞) mediante

d(x∗, y∗) =∞∑n=1

|x∗(xn)− y∗(xn)|2n

.

Claramente la serie es siempre convergente y por tanto d está biendefinida. Es fácil ver que d es una distancia en BX∗ . Veamos entoncesque la aplicación identidad

Id : (BX∗ , w∗) −→ (BX∗ , d)

es un homeomorfismo, lo que automáticamente implicará que (BX∗ , w∗)

es metrizable.Sea x∗0 ∈ BX∗ y sea

U = x∗ ∈ BX∗ tales que d(x∗, x∗0) < εun entorno abierto de x∗0 ∈ (BX∗ , d). Sea n0 ∈ N un natural tal que

1

2n0=∞∑i=1

1

2−n0−i<ε

4.

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 135

Sea entonces W (x0;x1, . . . , xn0 ; ε), un entorno de x∗0 ∈ (BX∗ , w∗).

Para todo x∗ ∈ W (x0;x1, . . . , xn0 ; ε) se tiene que

d(x∗, x∗0) =∞∑n=1

|x∗0(xn)− x∗(xn)|2n

=

=

n0∑n=1

|x∗0(xn)− x∗(xn)|2n

+∞∑

n=n0+1

|x∗0(xn)− x∗(xn)|2n

≤ ε

2+∞∑n=1

1

2−n0−n+1< ε,

y por tanto W (x0;x1, . . . , xn0 ; ε) ⊂ U y se tiene que

Id : (BX∗ , w∗) −→ (BX∗ , d)

es continua. Al ser (BX∗ , w∗) compacto, (BX∗ , d) Hausdorff e Id biyec-

tiva se tiene automáticamente que Id−1 : (BX∗ , d) −→ (BX∗ , w∗) es

continua, es decir Id es un homeomorfismo y por tanto (BX∗ , w∗) es

metrizable.

Recíprocamente, si (BX∗ , w∗) es metrizable entonces verifica el I

Axioma de Numerabilidad y por tanto sabemos que existe una sucesión(Un)n de entornos del origen de (BX∗ , w

∗) tales que ∩∞n=1Un = 0. Porla definición de la topología débil∗, para cada n ∈ N existe εn y unconjunto finito Fn = xn1 , . . . , xnm ⊂ X tal que

W (0;xn1 , . . . , xnm ; εn) ⊂ Un

Sea F = ∪∞n=1Fn. Así definido F es contable. Además (F⊥)⊥ es laenvoltura lineal y cerrada de F y por tanto es separable. Pero si x ∈ F⊥quiere decir que para todo n ≥ 1 y para todo x ∈ Fn∣∣∣∣ x∗‖x∗‖(x)

∣∣∣∣ < εn.

Por tanto x∗

‖x∗‖ ∈ Un para todo n ≥ 1, de donde x∗ = 0. Es decirF⊥ = 0 y por tanto (F⊥)⊥ = X, por lo que X es separable.

Corolario 6.17. [Banach 1932] Sea X un espacio de Banach se-parable. Entonces toda sucesión acotada de X∗ tiene una subsucesióndébil∗ convergente.

Demostración. Si X es separable, (BX∗ , w∗) es metrizable, por

lo que la compacidad se caracteriza por sucesiones.

Veamos dos aplicaciones de este resultado. La primera es al análisisde Fourier.

136 6. TOPOLOGíAS DÉBIL Y DÉBIL∗

Teorema 6.18. Sea (αn)n∈Z una sucesión indexada por Z. Paracada m ∈ N definamos la función sm : [−π, π] −→ C como

sm(t) =m∑

n=−m

αneınt

y sea

am =

∑m−1j=0 sj

m.

Sea 1 < q ≤ ∞ tal que la sucesión (am) ⊂ Lq[−π, π] es acotada.Entonces existe y ∈ Lq[−π, π] tal que para todo n ∈ Z

αn =1

∫ π

−πy(t)e−ıntdt,

es decir∞∑

n=−∞

αneınt

es la serie de Fourier de y.

Demostración. Recordemos la notación: Para todo x ∈ L1[−π, π]y n ∈ Z, definimos el n-simo coeficiente de Fourier de x como

x(n) =1

∫ π

−πx(t)e−ıntdt.

Resulta claro de las definiciones que para todo n ∈ Z y para todom > |n| se tiene

am(n) =m− |n|m

αn.

Sea q como en la hipótesis y sea 1 ≤ p <∞ de manera que 1p

+ 1q

= 1.Puesto que por hipótesis (am)m ∈ Lq = (Lp)

∗ es una sucesión aco-tada, podemos aplicar el Corolario 6.17 y obtenemos una subsucesión(amj) débil∗ convergente a y ∈ Lq. Para todo n ∈ Z sea xn(t) = e−ınt

2π.

Entonces para todos m,n

am(xn) = am(n), y y(xn) = y(n)

y por tanto

y(n) = lımjamj(n) = lım

j

mj − |n|mj

αn = αn.

6. TOPOLOGíAS DÉBIL Y DÉBIL∗ 137

Otra aplicación que puede ser interesante estudiar es el llamadoPrincipio de seleccion de Helly. Se puede ver una exposición sencillapor ejemplo en ( [31, p. 273 y ss]).

Finalmente, de manera opcional se puede probar el Teorema deEberlein, que nos dice que, aunque la topología débil no se pueda ca-racterizar por sucesiones, la compacidad débil sí se puede caracterizarpor sucesiones.

Teorema 6.19 (Eberlein). Sea X un espacio de Banach y A ⊂ X.Entonces A es (relativamente) débilmente compacto si y sólo si A essecuencialmente (relativamente) compacto.

Demostración. En [15, p. 18] se puede ver una demostración querequiere una cierta dosis de topología. Una demostración totalmenteelemental usando tan sólo la convergencia débil de sucesiones de unenunciado algo más sencillo “X es reflexivo si y sólo si toda sucesiónacotada tiene una subsucesión débilmente convergente” se puede ver en[31, p. 288].

Prácticas sugeridas

Ejercicio 6.1. Probar que una sucesión (fn) ⊂ C[0, 1] convergedébilmente a f si y sólo si (fn) está acotada y para todo t ∈ [0, 1] fn(t)tiende a f(t).

Ejercicio 6.2. Dado un espacio de Banach separable X, encontrarT ∈ L(`2;X) tal que T (`2) sea denso en X. Sugerencia: Sea (yn) ⊂ Xuna sucesión densa y sea T : `2 −→ X dado por

T (a) =∑n

anyn2n

Ejercicio 6.3. X es reflexivo si y sólo si X∗ es reflexivo

Ejercicio 6.4. Si X es reflexivo e Y es un subespacio vectorialcerrado de X entonces Y es reflexivo.

Capítulo 7

Operadores compactos

En el estudio de las aplicaciones lineales entre espacios de Banach(o simplemente normados) pronto se ve que muchos problemas que enel caso de espacios finito-dimensionales tienen solución resultan muydifíciles, o imposibles, de solucionar. Con frecuencia el problema esesencialmente la no compacidad de la bola unidad. Buena parte de lastécnicas del Análisis Funcional van dirigidas a solucionar este problema.Una de las formas de abordarlo es transformar la bola unidad medianteun operador en un conjunto relativamente compacto. A los operadoresque cumplen esa condición les llamamos operadores compactos.

Es claro que los operadores de rango finito son compactos. Ademása menudo los operadores compactos son precisamente la clausura en elespacio normado de los operadores de los operadores de rango finito.

Vemos también la propiedad de ideal de los operadores compac-tos, así como el fundamental Teorema de Schauder, cuya demostraciónconstituye una bonita aplicación del Teorema de Ascoli-Arzela.

Para terminar el capítulo, estudiamos la relación de los operadorescompactos con los operadores completamente continuos.

Hemos basado la preparación de este capítulo en [31], [24] y [13].

Operadores compactos

Empezamos definiendo los operadores compactos.

Definición 7.1. Sean X e Y espacios normados. Un operadorT : X −→ Y se dice compacto si T (BX) es un conjunto compacto.Denotaremos por K(X;Y ) al espacios de los operadores compactos deX en Y con la norma heredada de L(X;Y ). Si X = Y escribiremosK(X) en lugar de K(X;X).

Definición 7.2. Sean X e Y espacios normados. Un operador T :X −→ Y se dice de rango finito si dim(Im(T )) < ∞. Denotaremospor F(X;Y ) al espacios de los operadores de rango finito de X en Ycon la norma heredada de L(X;Y ). Si X = Y escribiremos F(X) enlugar de F(X;X).

139

140 7. OPERADORES COMPACTOS

Nótese primeramente que, como ya vimos, se sigue del Lema deRiesz que la bola unidad de los espacios de dimensión infinita no escompacta, por lo que si dimX =∞, el operador identidad Id : X −→X nunca es compacto. También el Teorema de la Aplicación Abierta nosgarantiza que los operadores sobreyectivos (sobre espacios de dimensióninfinita) no son compactos.

Observación 7.3. Si T ∈ SX∗ es tal que T no alcanza su normaen BX , entonces T (BX) = (−1, 1), y tenemos que T ∈ L(X;R) peroT (BX) no es compacto. Por tanto no se puede sustituir T (BX) porT (BX) en la definición de operador compacto.

Si se quiere un ejemplo explícito de esta situación, considérese porejemplo la forma T : c0 −→ K definida por T (en) = 1

2n. Entonces

‖T‖ = 1

pero la norma no se alcanza en la bola de c0 (se alcanza en la bola de`∞, por ejemplo en 11).

Proposición 7.4. Sean X, Y espacios normados, T : X −→ Y unoperador. Entonces

(i) T es compacto si y sólo si dada cualquier sucesión acotada(xn)n ⊂ X, la sucesión T (xn)n tiene una subsucesión conver-gente.

(ii) Si T es compacto, entonces T (BX) es un conjunto precompac-to. Recíprocamente, si Y es Banach y T (BX) es precompactoentonces T es compacto.

(iii) Si T es continuo y de rango finito entonces T es compacto yIm(T ) es cerrado en Y . Recíprocamente, si X, Y son espaciosde Banach, T es compacto e Im(T ) es cerrado automáticamenteT es de rango finito.

Demostración. (i) Sea T compacto y (xn) ⊂ X una sucesióntal que ‖xn‖ ≤ C para todo n ∈ N. Entonces T (xn

C) ∈ T (BX) para

todo n ∈ N. Puesto que T (BX) es compacto, sabemos que existe unasubsucesión de T (xn

C) que converge en T (BX) ⊂ Y . Por tanto una

subsucesión de T (xn) converge en Y .Recíprocamente, para ver que T (BX) es compacto usamos la carac-

terización por sucesiones (puesto que estamos en un espacio metriza-ble). Sea (yn) ⊂ T (BX). Entonces existe (xn) ⊂ BX tal que

‖yn − T (xn)‖ < 1

n

7. OPERADORES COMPACTOS 141

Por hipótesis existe una subsucesión (xnj)j ⊂ (xn)n tal que T (xnj)jconverge a y ∈ Y . De ahí se sigue con facilidad que la subsucesión(ynj)j ⊂ (yn)n también converge a y, y por tanto y ∈ T (BX). Lo queprueba que T (BX) es compacto.

(ii) Si T es compacto, entonces T (BX) es precompacto, y por tantoT (BX) también lo es.

Recíprocamente, si Y es Banach y T (BX) es precompacto, entoncesT (BX) es precompacto y completo, y por tanto compacto.

Probemos (iii): Si T es de rango finito entonces Im(T ) es cerradoen Y por ser un espacio de dimensión finita. Entonces T (BX) ⊂ Im(T )

y T (BX) es un conjunto cerrado y acotado en un espacio de dimensiónfinita, luego es compacto.

Recíprocamente, sean X e Y espacios de Banach, T : X −→ Ycompacto tal que T (X) es cerrado. Por ser T compacto, es continuo.Además T (X) es un espacio de Banach y T : X −→ T (X) es unoperador sobre. Por el Teorema de la Aplicación Abierta, T (UX) es unabierto en T (X). Por tanto existe δ > 0 tal que

E := y ∈ T (X) tales que ‖y‖ < δ ⊂ T (BX)

y puesto que T (X) es cerrado, tenemos que

E = y ∈ T (X) tales que ‖y‖ ≤ δ ⊂ T (BX) ⊂ T (X)

Puesto que T (BX) es compacto, tenemos que la bola cerrada de cen-tro 0 y radio δ de T (X) es compacta. Y esto implica que dim(T (X)) <∞.

Veamos a continuación que los operadores compactos forman unideal de operadores cerrado en la norma usual de operadores

Teorema 7.5. Sean X, Y espacios normados. Entonces1. Para todos T, S ∈ K(X;Y ), para todos α, β ∈ K, el operador

αT + βS : X −→ Y

es compacto.2. (Propiedad de ideal de operadores) Si E,F son espacios norma-

dos R : E −→ X, S : Y −→ F son operadores y T ∈ K(X;Y )entonces

S T R : E −→ F

es compacto.

142 7. OPERADORES COMPACTOS

3. Si Y es un espacio de Banach, K(X;Y ) es un subespacio cerra-do de L(X;Y )

Demostración. 1. Es muy fácil ver que si T es compacto tambiénlo es αT , por ejemplo usando la caracterización por sucesiones. De estamisma forma demostramos que la suma de operadores compactos escompacto: Sean T, S como en la hipótesis, y sea una sucesión (xn) ∈BX . Entonces existe una subsucesión (xnj)j ⊂ (xn) tal que T (xnj)converge. A su vez existe una subsubsucesión (xnjk )k ⊂ (xnj) tal queS(xnjk ) converge. Entonces

(T + S)(xnjk )

converge, lo que prueba que S + T es compacto.

2. Se puede demostrar también por sucesiones, pero lo haremosdirectamente con la definición. Notemos que

S T R(BE) = S T (R(BE)) ⊂ S T (‖R‖BX) =

= S(T (‖R‖BX)) ⊂ S(T (‖R‖BX))

Puesto que T (BX) es compacto, también lo es T (‖R‖BX) y pues-to que S es continua, transforma compactos en compactos. Por tantoS T R(BE) es un cerrado contenido en un compacto, y por tanto escompacto.

3. Sea (Tn)n ⊂ K(X;Y ) una sucesión que converge a T ∈ L(X;Y )en la norma de operadores. Hemos de comprobar que T es compacto.Por la Proposición 7.4 basta comprobar que T (BX) es precompacto.Sea ε > 0. Sea n ∈ N tal que

‖Tn − T‖ ≤ε

3.

Puesto que Tn es precompacto, existen x1, . . . , xm ∈ BX tales que

Tn(BX) ⊂ ∪mi=1B(Tn(xi),ε

3).

Entonces, dado x ∈ BX , sea xj tal que Tn(x) ∈ B(Tn(xj),ε3). Así,

se tiene que

‖T (x)−T (xj)‖ ≤ ‖(T −Tn)(x)‖+‖Tn(x)−Tn(xj)‖+‖(Tn−T )(xj)‖ ≤

≤ ‖T − Tn‖‖x‖+ε

3+ ‖T − Tn‖‖xj‖ ≤ 3

ε

3= ε

y por tantoT (BX) ⊂ ∪mi=1B(Tn(xi), ε),

lo que implica que T es compacto.

7. OPERADORES COMPACTOS 143

Teorema 7.6 (Schauder). Sean X, Y espacios de Banach, T ∈L(X;Y ). Entonces T es compacto si y sólo si T ∗ es compacto.

Demostración. Sea T : X −→ Y un operador compacto. Sea(y∗n)n ⊂ BY ∗ . Para todos y, z ∈ Y

|y∗n(y)− y∗n(z)| ≤ ‖y∗n‖‖y − z‖ ≤ ‖y − z‖

SeaK = T (BX).K es un espacio compacto metrizable y por lo anteriorel conjunto

y∗n;n ∈ Nes un conjunto de funciones equicontinuas uniformemente acotadas.Entonces el Teorema de Ascoli-Arzela nos dice que existe una subsuce-sión (y∗nj)j∈N que converge uniformemente en K. Entonces, para todoi, j ∈ N,

‖T ∗(y∗ni)− T∗(y∗nj)‖ = sup

x∈BX|T ∗(y∗ni − y

∗nj

)(x)| =

= supx∈BX

|(y∗ni − y∗nj

)T (x)| ≤ supy∈K|y∗ni(y)− y∗nj(y)|

Puesto que la sucesión (ynj)j∈N es uniformemente Cauchy en K,se sigue que (T ∗(y∗nj))j es una sucesión de Cauchy en X∗. Por tanto,puesto que X∗ es Banach, (T ∗(y∗nj))j debe converger y de ahí se sigueque T ∗ es compacto.

La otra implicación es esencialmente la demostración de que losoperadores compactos forman un ideal inyectivo de operadores, aunqueno presentaremos esa noción a nuestros alumnos:

Supongamos que T ∗ es compacto. Entonces T ∗∗ = (T ∗)∗ también escompacto por lo anterior. Puesto que T ∗∗JX = JY T , la propiedad deideal de los operadores compactos nos garantiza que JY T es compacto.Esto quiere decir JY (T (BX)) es precompacto. Puesto que JY es unaisometría, se sigue que T (BX) es precompacto, y de aquí se sigue queT es compacto.

Ejemplo 7.7. Ya hemos visto que todo operador de rango finitoes compacto, y puesto que los operadores compactos K(X;Y ) formanun subespacio cerrado en el espacio de los operadores, se sigue que ellímite (en la norma de operadores) de una sucesión de operadores derango finito es compacto. De hecho, en muchos casos (por ejemplo siY es un espacio con base de Schauder), todo operador compacto es ellímite de una sucesión de operadores de rango finito. En 1932 Banachpreguntó si en un espacio separable todo operador compacto se podríaescribir como el límite de una sucesión de operadores de rango finito, es

144 7. OPERADORES COMPACTOS

decir si K(X) = F(X). Más tarde, en 1953 Grothendieck [23] definióla Propiedad de Aproximación de la siguiente forma

X tiene la Propiedad de Aproximación si y sólo si para todo espaciode Banach Y , K(X;Y ) = F(X;Y )

Hubo que esperar a 1973 para que Enflo [19] probara que no todoespacio de Banach tiene la Propiedad de Aproximación, y diera simul-táneamente una respuesta negativa a la pregunta de Banach.

Es fácil ver directamente que para los espacios de sucesiones sepa-rables sí se tiene que K(X) = F(X).

Proposición 7.8. Sea X uno de los espacios c0, `p (1 ≤ p <∞).Entonces K(X) = F(X).

Demostración. Sea (en)n∈N la base canónica habitual de estosespacios. Dado n ∈ N, sea πn : X −→ X el operador que a cadax = (xi)i∈N le asocia

πn(x) =n∑i=1

xiei = (x1, . . . , xn, 0, 0, . . .).

Es inmediato ver que para cualquiera de los espacios mencionados πnes continuo y que

lımnπn(x) = Id(x) = x.

Sea ahora T ∈ K(X). Claramente πn T ∈ F(X) para todo n ∈ N.Sólo nos falta ver que πn T converge a T en la norma de L(X). Estoes lo mismo que ver que (πn − Id)(T (x)) converge a 0 uniformementeen BX . Para probar eso es suficiente probar que πn − Id tiende a 0uniformemente en el compacto T (BX) y esto se sigue del Teorema deBanach-Steinhaus.

Ejemplo 7.9. Sea T : `2 −→ `2 el operador dado por

T (x) =(xn

2n

)n.

Veamos que T es compacto, mientras que claramente no tiene rangofinito.

Para ver que es compacto, veamos que T (B`2) ⊂ `2 es precompacto.Dado ε > 0 vamos a encontrar un 2ε-cubrimiento finito de T (B`2). Sean0 ∈ tal que 2−n0 ≤ ε. Obsérvese que el conjunto

A = (x121,x222, . . . ,

xn0

2n0, 0, 0, . . .); |xn| ≤ 1

7. OPERADORES COMPACTOS 145

es compacto en `2 (es acotado y cerrado en Rn0 que a su vez es cerradoen `2) y por tanto admite un ε-cubrimiento centrado en una ε-red F .Veamos que F es una

√2ε-red de T (B`2). Sea x = (xn) ∈ B`2. Entonces

xn ≤ 1 para todo n ∈ N, y por tanto existe f ∈ F tal quen0∑n=1

|2−nxn − f |2 < ε2

Entonces

‖(xn

2n

)n− f‖22 =

n0∑n=1

∣∣∣xn2n− fn

∣∣∣2 +∞∑

n=n0+1

∣∣∣xn2n

∣∣∣2 < ε2 + ε2 = 2ε2

Ejemplo 7.10. Sea A = (ai,j)i,j∈N una matriz infinita y sea 1 ≤p ≤ ∞.

Si p = 1, supongamos que γ(j) =∑∞

i=1 |ai,j| < ∞ para todo j ∈ Ny que γ(j)→ 0 cuando j →∞.

Si p = ∞ supongamos que δ(i) =∑∞

j=1 |ai,j| < ∞ para todo i ∈ Ny que δ(i)→ 0 cuando i→∞.

Si 1 < p <∞ y 1p

+ 1q

= 1, supongamos que

βp =

∞∑i=1

(∞∑j=1

|ai,j|q) p

q

1p

<∞.

Entonces el operador

TA : `p −→ `p

dado por

TA(x) =

(∞∑j=1

ai,jxj

)i

(está bien definido y) es compacto.

Comencemos viendo el caso p = 1. Veamos en primer lugar que TAestá bien definido y es continuo. Notemos que si γ(j)→ 0 en particularse tiene que supj γ(j) = C <∞. Entonces

‖TA(x)‖1 =

∥∥∥∥∥∥(∞∑j=1

ai,jxj

)i

∥∥∥∥∥∥1

=∞∑i=1

∣∣∣∣∣∞∑j=1

ai,jxj

∣∣∣∣∣ ≤∑i

∑j

|ai,jxj| =

=∑j

∑i

|ai,j||xj| ≤∑j

|xj|∑i

|ai,j| =∑j

|xj|γ(j) ≤M‖x‖1

146 7. OPERADORES COMPACTOS

Veamos ahora que T es compacto. Sea An la matriz doblementeinfinita definida que se obtiene al mantener las primeras n columnasde A sin cambios y colocar ceros en las restantes columnas. El operadorTn asociado a la matriz An, dado por

Tn(x) =

(n∑j=1

ai,jxj

)i

actúa igual que T , salvo que previamente “trunca” x y se queda sólocon sus n primeras coordenadas. Es claro que Tn = T πn donde πnvienen definidas como en el Ejemplo 7.8. Es claro entonces que paracada n ∈ N el operador Tn es continuo y tiene rango finito . Lo únicoque tenemos que probar es que Tn tiende a T . Pero

‖Tn − T‖ = supx∈B`1

‖(Tn − T )(x)‖ = supx∈B`1

∥∥∥∥∥∥(

∞∑j=n+1

ai,jxj

)i

∥∥∥∥∥∥1

=

= supx∈B`1

∞∑i=1

∣∣∣∣∣∞∑

j=n+1

ai,jxj

∣∣∣∣∣ ≤ supx∈B`1

∞∑i=1

∞∑j=n+1

|ai,jxj| =

= supx∈B`1

∞∑j=n+1

∑i

|ai,j||xj| ≤ supx∈B`1

∞∑j=n+1

|xj|∑i

|ai,j| =

= supx∈B`1

∞∑j=n+1

|xj|γ(j) ≤ supx∈B`1

‖x‖ supj>n

γ(j) = supj>n

γ(j)→ 0.

Veamos ahora el caso p = ∞. Sea At la matriz traspuesta de A.Por el caso p = 1, At define un operador compacto TAt : `1 −→ `1. Ex-tendiendo los razonamientos hechos para espacios finito dimensionalesen el Ejercicio 5.1 es fácil ver que A = (At)t es la matriz asociada aloperador traspuesto de TAt, es decir T = (TAt)

∗. Entonces el Teoremade Schauder nos garantiza que T es compacto.

Veamos ahora el caso 1 < p < ∞. Veamos en primer lugar queTA : `p −→ `p (está bien definido y) es continuo. Nótese el uso de ladesigualdad de Hölder.

‖TA(x)‖p =

∥∥∥∥∥∥(∞∑j=1

ai,jxj

)i

∥∥∥∥∥∥p

∥∥∥∥∥∥(∞∑j=1

|ai,jxj|

)i

∥∥∥∥∥∥p

7. OPERADORES COMPACTOS 147

∥∥∥∥∥∥( ∞∑

j=1

|ai,j|q) 1

q(∞∑j=1

|xj|p) 1

p

i

∥∥∥∥∥∥p

=

= ‖x‖p

∥∥∥∥∥∥( ∞∑

j=1

|ai,j|q) 1

q

i

∥∥∥∥∥∥p

= ‖x‖pβp.

Ya hemos visto que TA es continuo. Veamos que es incluso compac-to. Podemos de nuevo considerar las matrices An y sus operadores derango finito asociados Tn = T πn. De nuevo sólo necesitamos compro-bar que Tn tiende a T en la norma de operadores.

‖Tn − TA‖ = supx∈B`p

‖(Tn − TA)(x)‖p = supx∈B`p

∥∥∥∥∥∥(

∞∑j=n+1

ai,jxj

)i

∥∥∥∥∥∥p

≤ supx∈B`p

∥∥∥∥∥∥(

∞∑j=n+1

|ai,jxj|

)i

∥∥∥∥∥∥p

≤ supx∈B`p

∥∥∥∥∥∥( ∞∑

j=n+1

|ai,j|q) 1

q(

∞∑j=n+1

|xj|p) 1

p

i

∥∥∥∥∥∥p

=

= supx∈B`p

‖x‖p

∥∥∥∥∥∥( ∞∑

j=n+1

|ai,j|q) 1

q

i

∥∥∥∥∥∥p

→ 0.

También proponemos como ejercicio demostrar que si una de lassucesiones γ(j) y δ(i) definidas más arriba es acotada y la otra tiendea 0 entonces T : `p −→ `p es compacto.

Veamos el análogo continuo del ejemplo de arriba, lo que se conocecomo operadores integrales de Fredholm.

Ejemplo 7.11. Sea k(·, ·) : [0, 1] × [0, 1] −→ K una función a laque de ahora en adelante nos referiremos como núcleo de Fredholm. Elnúcleo k nos permite definir una aplicación entre espacios funcionales(de momento por precisar)

x 7→ Tk(x)(s) =

∫ 1

0

k(s, t)x(t)dt

148 7. OPERADORES COMPACTOS

Estudiemos las características de este operador en función del núcleo ky del espacio en que lo definamos.

Supongamos inicialmente que k : [0, 1] × [0, 1] −→ K es continua.Sea x : [0, 1] −→ K una función integrable. Si sn → s ∈ [0, 1] entoncesel Teorema de la Convergencia Dominada nos garantiza que

Tk(x)(sn)→ Tk(x)(s),

es decir, T (x) : [0, 1] −→ K es continua.Supongamos ahora que (xn)n es una sucesión de funciones integra-

bles uniformemente acotadas en norma 1, es decir, existe α > 0 tal que‖xn‖1 ≤ α para todo n ∈ N. Veamos que la sucesión (Tk(xn))n tieneuna subsucesión que converge uniformemente (es decir, en ‖ · ‖∞) en[0, 1].

Por ser k continuo, existe β > 0 tal que ‖k‖∞ ≤ β. Entonces esfácil ver que

‖Tk(xn)‖∞ ≤ αβ

para todo n ∈ N. Es decir, (Tk(xn))n está acotada en norma infinito.Además la sucesión es equicontinua en [0, 1]. Veámoslo. k es uniforme-mente continua en [0, 1] × [0, 1] (por la compacidad de [0, 1] × [0, 1]).Entonces para todo ε > 0 existe δ > 0 tal que si |s−u| < δ y |t−v| < δentonces

|k(s, t)− k(u, v)| < ε.

Por lo tanto, para todo n ∈ N y para todos s, u ∈ [0, 1] con |s−u| < δse tiene

|Tk(xn)(s)− Tk(xn)(u)| =∫ 1

0

(k(s, t)− k(u, t))xn(t)dt ≤

≤∫ 1

0

|k(s, t)− k(u, t)||xn(t)|dt < εα.

Ahora, el Teorema de Ascoli-Arzela nos garantiza que la sucesión(Tk(xn))n tiene una subsucesión uniformemente convergente (es decir,convergente en ‖ · ‖∞.

Sean entonces X e Y dos cualesquiera de los espacios C[0, 1] oLp[0, 1] (1 ≤ p ≤ ∞). Recordemos que para todo 1 ≤ p ≤ ∞ se tieneque

‖ · ‖1 ≤ ‖ · ‖p ≤ ‖ · ‖∞y

C[0, 1] ⊂ L∞[0, 1] ⊂ Lp[0, 1] ⊂ L1[0, 1]

7. OPERADORES COMPACTOS 149

Por tanto, si x ∈ X entonces x es integrable y (es decir, x ∈L1[0, 1]) y si (xn) ⊂ X es una sucesión acotada, entonces (xn) estáacotada en ‖ · ‖1.

Además, si y ∈ C[0, 1] entonces y ∈ Y , y si (yn) es una sucesiónuniformemente convergente entonces (yn) converge en la norma de Y .

Por tanto, de los razonamientos anteriores se sigue que el operador

Tk : X −→ Y

(está bien definido y) es compacto.

Veamos que otras situaciones en las que podemos probar con facili-dad la compacidad de Tk : X −→ Y . Sea 1 < p ≤ ∞, sea X = Lp[0, 1],sea Y = Lq[0, 1] con 1

p+ 1

q= 1 y supongamos que k ∈ Lq([0, 1]× [0, 1]).

Entonces, para todo x ∈ X y s ∈ [0, 1] usando la desigualdad de Hölderanálogamente a como lo hicimos en el Ejemplo 7.10 tenemos

|Tk(x)(s)| ≤∫ 1

0

|k(s, t)||x(t)|dt ≤ ‖x‖p(∫ 1

0

|k(s, t)|qdt) 1

q

y por lo tanto

‖Tk(x)‖q =

(∫ 1

0

|Tk(x)(s)|qds) 1

q

≤ ‖x‖p(∫ 1

0

∫ 1

0

|k(s, t)|qdtds) 1

q

= ‖x‖p‖k‖q

de donde se sigue la continuidad de Tk.

Para ver la compacidad de Tk, puesto que C([0, 1]× [0, 1]) es densoen Lq([0, 1] × [0, 1]) (esto se prueba análogamente a la densidad deC[0, 1] en Lq[0, 1]), sea (kn) ⊂ C([0, 1] × [0, 1]) una sucesión tal que‖kn − k‖q → 0 y sea Tn : Lp[0, 1] −→ Lq[0, 1] el operador de Fredholmde núcleo kn. Entonces

‖Tk − Tn‖L(Lp;Lq) = supx∈BLp[0,1]

‖(Tk − Tn)(x)‖q =

= supx∈BLp[0,1]

(∫ 1

0

|(Tk − Tn)(x)(s)|qds) 1

q

≤ supx∈BLp[0,1]

‖x‖p(∫ 1

0

∫ 1

0

|k(s, t)− kn(s, t)|qdtds) 1

q

= ‖k − kn‖q → 0.

150 7. OPERADORES COMPACTOS

A menudo el interés de los operadores compactos radica en su ca-pacidad de “mejorar la convergencia”. Para estudiar esto necesitamospreviamente una definición.

Definición 7.12. Sean X, Y espacios de Banach. Un operador T :X −→ Y se dice completamente continuo si transforma sucesionesdébilmente convergentes en sucesiones convergentes en norma, es decir,si para todo sucesión (xn)n ⊂ X tal que xn tiende débilmente a x ∈ Xse tiene que T (xn) converge en norma a T (x).

Teorema 7.13. Sean X, Y espacios de Banach. Entonces si T escompacto T es completamente continuo. Recíprocamente, si X es refle-xivo y T : X −→ Y es completamente continuo entonces T es compacto(de hecho basta pedir X 6⊃ `1, pero esto se sigue de un resultado muyprofundo de Rosenthal).

Demostración. Supongamos que T es compacto y xn tiende dé-bilmente a x. (xn) ⊂ X es débilmente acotada, y por tanto acotadapor el Teorema 4.9. Si T (xn) 6→ T (x) podemos suponer, pasando a unasubsucesión, que existe ε > 0 tal que

(10) ‖T (xn)− T (x)‖ ≥ ε

para todo n ∈ N. Por ser T compacto y (xn)n acotada, existe unasubsucesión (xnj) tal que T (xnj) converge a y ∈ Y . Entonces, de (10)se sigue que

‖y − T (x)‖ ≥ ε

de forma que y 6= T (x). Sin embargo, para todo y∗ ∈ Y ∗ se tiene quey∗ T ∈ X∗ y por tanto de la hipótesis sobre (xn) se sigue que

(y∗ T )(x) = lımj

(y∗ T )(xnj) = y∗(

lımjT (xnj)

)= y∗(y)

y por tanto x = y y hemos alcanzado una contradicción.

Para probar la otra implicación necesitamos el Teorema de Eberlein,que no es seguro que incluyamos en el programa. Si lo hemos dado, lademostración es sencilla. Supongamos queX es reflexivo y T : X −→ Yes completamente continuo. Si (xn) ⊂ BX , por el Teorema de Eberlein(xn) admite una subsucesión (xnk) débilmente convergente a un ciertox ∈ BX (por el Teorema de Mazur, las clausuras en norma y débil deun convexo coinciden). Al ser T completamente continuo, la sucesión(T (xnk))k converge en norma, lo que termina la demostración.

7. OPERADORES COMPACTOS 151

Prácticas sugeridas

Ejercicio 7.1. Sea X un espacio de Banach y sea T ∈ K(X) \F (X). Demostrar que 0 ∈ T (SX). Sugerencia: Utilizar el Teorema dela Aplicación Abierta.

Ejercicio 7.2. Sea C(1)[0, 1] el espacio de las funciones con deri-vada primera continua con la norma ‖f‖ = ‖f‖∞ + ‖f ′‖∞. Demostrarque la inclusión formal

i : C(1)[0, 1] −→ C[0, 1]

es un operador compacto. Sugerencia: Utilizar el Teorema de Ascoli-Arzela.

Ejercicio 7.3. Sea 1 < p < ∞ y sea T : c0 −→ `p un operadorcontinuo. Demostrar que T es compacto.

Capítulo 8

Teoría espectral de operadores compactos

Comenzamos en este capítulo el estudio de uno de los grandes te-mas del Análisis Funcional, la Teoría Espectral. Un enfoque posiblees comenzar estudiando álgebras de Banach, demostrar en ese marcogeneral los resultados que se van a necesitar y posteriormente observarque los operadores de un espacio en sí mismo es un álgebra de Banachy obtener los resultados de la Teoría Espectral prácticamente como co-rolario. Sin embargo, pensamos que ese enfoque es algo arduo, puestoque le exige al alumno el estudio abstracto inicial de las álgebras deBanach sin haber trabajado previamente en un modelo intuitivo en elque apoyarse. Preferimos empezar enunciando y demostrando los re-sultados para el caso de operadores en este capítulo y dejar para másadelante (y no en esta asignatura) la generalización de estos resultadosal contexto de álgebras de Banach.

Empezamos estudiando operadores inversibles y perturbaciones in-versibles de la identidad, para a continuación definir el espectro de unoperador y sus autovalores. Probamos que el espectro es compacto yprobamos el Teorema de Gelfand, utilizando variable compleja. Trasello se puede probar la Fórmula del Radio Espectral, aunque no lanecesitamos. A continuación desarrollamos la Teoría Espectral de Ope-radores Compactos en Espacios de Banach, conocida como Teoría deRiesz-Schauder. Como corolario de esta teoría se obtiene la Alternativade Fredholm, de gran utilidad en las aplicaciones.

Hemos seguido principalmente [31] y [24] en la preparación de laprimera parte del capítulo y [33] y [31] en la presentación de la Teoríade Riesz-Schauder.

Teoría espectral de operadores compactos

Empezamos definiendo operadores inversibles, y estudiando algunasde sus propiedades básicas.

Definición 8.1. Dados dos espacios de Banach X, Y , un operadorT : X −→ Y es inversible si es un isomorfismo biyectivo.

153

154 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

Observación 8.2. T ∈ L(X;Y ) es inversible si y sólo si existeT−1 ∈ L(Y ;X) tal que T−1T = IX y TT−1 = IY

Se sigue del Teorema de la Aplicación Abierta que T es inversiblesi y sólo si T es biyectivo.

Es fácil ver que si T ∈ L(X;Y ) y S ∈ L(Y ;Z) son inversiblesentonces ST es inversible y

(ST )−1 = T−1S−1

De forma análoga si T, S ∈ L(X), es fácil ver que S y T son inver-sibles si y sólo si ST y TS lo son.

Proposición 8.3. T : X −→ Y es inversible si y sólo si T ∗ :Y ∗ −→ X∗ es inversible, y en ese caso (T ∗)−1 = (T−1)∗.

Demostración. Si T es inversible tenemos que

T ∗(T−1)∗ = (T−1T )∗ = (IX)∗ = IX∗

y(T−1)∗T ∗ = (TT−1)∗ = (IY )∗ = IY ∗ .

Recíprocamente, si T ∗ es inversible, también lo es T ∗∗. Si definimosS = (T ∗∗)−1|Y es fácil ver que S es un operador inyectivo de Y en X (paraver que S toma valores en Y , notemos que para todo y ∈ Y existe x ∈ Xtal que T (x) = y. Por lo tanto T ∗∗(x) = y y S(y) = x ∈ X). Ademásclaramente ST = IX y TS = IY , de forma que T es inversible.

Lema 8.4. Sea X un espacio de Banach y T ∈ L(X) un operadortal que

‖T‖ < 1.

Entonces el operador (I − T ) ∈ L(X) es inversible y además

(I − T )−1 =∞∑n=0

T n,

donde la convergencia es en la norma de operadores, y

‖(I − T )−1‖ ≤ 1

1− ‖T‖.

Demostración. Nótese en primer lugar que∞∑n=0

‖T n‖ ≤∞∑n=0

‖T‖n =1

1− ‖T‖.

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 155

Es decir, la serie∑∞

n=0 Tn es absolutamente convergente en el espacio

de Banach L(X) y por tanto la serie∑∞

n=0 Tn converge en L(X). Por

tanto

(I − T )∞∑n=0

T n = (I − T ) + (T − T 2) + (T 2 − T 3) + · · · = I

y (∞∑n=0

T n

)(I − T ) = (I − T ) + (T − T 2) + (T 2 − T 3) + · · · = I

Lema 8.5. Sea X un espacio de Banach y T ∈ L(X) un operadortal que existe p ∈ N de manera que

‖T p‖ < 1.

Entonces el operador (I − T ) ∈ L(X) es inversible y además

(I − T )−1 =∞∑n=0

T n,

donde la convergencia es en la norma de operadores, y

‖(I − T )−1‖ ≤ 1 + ‖T‖+ · · ·+ ‖T p−1‖1− ‖T p‖

.

Demostración. Puesto que

‖T pn+j‖ ≤ ‖T p‖n‖T j‖y que

‖T p‖ < 1

se tiene que∞∑n=0

‖T n‖ =∞∑n=0

‖T pn‖+∞∑n=0

‖T pn+1‖+ · · ·+∞∑n=0

‖T pn+p−1‖ ≤

≤∞∑n=0

‖T p‖n(1 + ‖T‖+ · · · ‖T p−1‖) =1 + ‖T‖+ · · ·+ ‖T p−1‖

1− ‖T p‖Ahora la demostración sigue muy similar a la del lema anterior.

Lema 8.6. Sea X un espacio de Banach y S, T ∈ L(X). Si T esinversible y

‖T−1(S − T )‖ < 1

156 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

entonces S es inversible y

S−1 = T−1∞∑n=0

((S − T )T−1

)n,

‖S−1‖ ≤ ‖T−1‖1− ‖(S − T )T−1‖

y

‖S−1 − T−1‖ ≤ ‖T−1‖2‖S − T‖1− ‖(S − T )T−1‖

Demostración. Si ‖(T − S)T−1‖ < 1, el Lema 8.4 nos dice que

I − (T − S)T−1 = I − I + ST−1 = ST−1

es inversible y

(ST−1)−1 =∞∑n=0

((T − S)T−1

)n.

Como T es inversible, se sigue que

(ST−1)T = S

es inversible y

S−1 = T−1(ST−1)−1 = T−1∞∑n=0

(T − S)T−1)n.

Por hipótesis, ‖(T − S)T−1‖ < 1 y por tanto

‖S−1 ≤ ‖T−1‖∞∑n=0

‖(T − S)T−1‖n =‖T−1‖

1− ‖(T − S)T−1‖.

Además, como

(S−1 − T−1) = S−1TT−1 − S−1ST−1 = S−1(T − S)T−1

tenemos que

‖S−1 − T−1‖ ≤ ‖S−1‖‖(T − S)T−1‖ ≤ ‖T−1‖2‖S − T‖1− ‖(S − T )T−1‖

.

Corolario 8.7. Sea X un espacio de Banach. Entonces el conjun-to C de operadores inversibles en X es un conjunto abierto de L(X) yla aplicación T 7→ T−1 es un homeomorfismo de C en sí mismo.

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 157

Demostración. Si T es inversible, consideremos la bola de centroT y radio 1

‖T−1‖ . Entonces, para todo S en esa bola, se tiene que

‖S − T‖ < 1

‖T−1‖y por tanto

‖T−1(S − T )‖ ≤ ‖T−1‖‖S − T‖ < 1

y el lema anterior nos dice que S es inversible. Por tanto C es abierto.Sea ahora (Tn)n ⊂ C una sucesión de operadores inversibles tales

que Tn → T ∈ C. Entonces a partir de cierto n0 se tiene que

‖Tn − T‖ <1

‖T−1‖y de nuevo por el lema anterior tenemos que

‖T−1n − T−1‖ ≤‖T−1‖2‖Tn − T‖

1− ‖(Tn − T )T−1‖lo que implica que ‖T−1n −T−1‖ → 0, es decir, la inversión es continua,y esto es todo lo que hace falta probar.

La idea básica de la teoría espectral es estudiar los valores de k ∈ Kpara los que T − kI es, o no, inversible. Recordemos que esa es lapregunta básica a la que nos lleva la teoría de diagonalización.

Tenemos entonces la siguiente definición:

Definición 8.8. Sea T : X −→ X. El espectro de T es el conjunto

σ(T ) = k ∈ K tales que T − kI no es inversible .

El conjunto ρ(T ) := K \ σ(T ) se denomina resolvente de T .

Y la pregunta será cómo calcular los valores espectrales k ∈ σ(T ).Veremos que nos interesará destacar dos conjuntos dentro del es-

pectro.

Definición 8.9. Sea T : X −→ X. El conjunto de autovalores deT es el conjunto

σe(T ) = k ∈ K tales que T − kI no es inyectivo .

El conjunto de autovalores aproximados de T es el conjunto

σa(T ) = k ∈ K tales que T − kI no está acotado inferiormente .

Notemos que k ∈ σe(T ) si y sólo si existe 0 6= x ∈ X tal que

T (x) = kx

158 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

En ese caso k es un autovalor y x es un autovector asociado a k. Elsubespacio

ker(T − kI)

es el autoespacio asociado a k.

Notemos también que k ∈ σa(T ) si y sólo si existe una sucesión(xn)n ⊂ SX tal que

‖T (xn)− kxn‖ → 0

En ese caso k es un autovalor aproximado de T . Si k ∈ σe(T ) es unautovalor y x es uno de sus autovectores haciendo xn = x

‖x‖ para todon se ve que k es un autovalor aproximado. Por tanto se tiene

σe(T ) ⊂ σa(T ) ⊂ σ(T )

Veamos que de hecho para los operadores de rango finito los tresconjuntos son el mismo.

Teorema 8.10. Sea X un espacio normado y T ∈ F(X). Entonces

σe(T ) = σa(T ) = σ(T )

Demostración. Puesto que σe(T ) ⊂ σa(T ) ⊂ σ(T ), basta ver queσ(T ) ⊂ σe(T ), equivalentemente que (σe(T ))c ⊂ (σ(T ))c. Sea entoncesk 6∈ σe(T ), de forma que T − kI es inyectivo. Veamos que entoncesT − kI es inversible, es decir k 6∈ σ(T ).

Consideramos primero el caso en que dimX = n <∞. En ese casoel resultado es elemental y se estudia en Álgebra Lineal: Puesto que

dim ker(T − kI) + dim Im(T − kI) = n,

si T−kI es inyectivo entonces ker(T−kI) = 0 y por tanto dim Im(T−kI) = n, es decir T − kI es sobreyectiva y por tanto inversible.

Consideramos ahora el caso en que X tiene dimensión infinita. En-tonces k 6= 0, ya que si T tiene rango finito no puede ser inyectivo (porejemplo, si xn;n ∈ N es un sistema linealmente independiente, enton-ces T (xn);n ∈ N sería un sistema infinito linealmente independientecontenido en un espacio de dimensión finita).

SeaS = (T − kI)|Im(T )

: Im(T ) −→ Im(T )

(para ver que S toma efectivamente valores en Im(T ), nótese que

(T − kI)(T (x)) = T (T (x))− kI(T (x)) = T (T − kI)(x) ∈ Im(T ).)

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 159

Como T − kI es inyectivo, también lo es S. Por el caso anterior, S essobreyectiva. Sea ahora y ∈ X. Entonces T (y) ∈ Im(T ) y por tantoexiste u ∈ Im(T ) tal que S(u) = T (y). Es decir,

(T − kI)(u) = T (y), equivalentemente T (u− y) = ku.

Sea x = u−yk. Entonces

T (x) = T

(u− yk

)=ku

k= u = kx+ y,

es decir(T − kI)(x) = y

y por tanto T −kI es sobreyectiva, y ahora terminamos con el Teoremade la Aplicación Abierta.

En cambio no es difícil dar ejemplos de operadores para los queσe(T ) 6= σa(T ) y σa(T ) 6= σ(T ) ([31, 12.7]).

Empecemos a estudiar el espectro de un operador

Teorema 8.11. Sea X un espacio de Banach y T ∈ L(X). Enton-ces

1. Sea k ∈ K tal que |k|m > ‖Tm‖ para algún m ∈ N. Entoncesk 6∈ σ(T ) y

(T − kI)−1 = −∞∑n=0

T n

kn+1.

Por tanto, para todo k ∈ σ(T ) se tiene que

|k| ≤ ınfn‖T n‖

1n ≤ ‖T‖.

2. σ(T ) ⊂ K es un conjunto compacto3. Si X tiene dimensión infinita y T ∈ K(X) entonces 0 ∈ σ(T ).

Demostración. 1. Notemos que k 6= 0 y que

T − kI = −k(I − T

k

).

El Lema 8.5 nos dice que T − kI es inversible y que

(T − kI)−1 = −1

k

(I − T

k

)−1= −1

k

∞∑n=0

T n

kn= −

∞∑n=0

T n

kn+1

El resto es fácil

160 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

2. De lo anterior se sigue que σ(T ) ⊂ k ∈ K; |k| ≤ ‖T‖, y portanto está acotado. Sólo tenemos que ver que es cerrado. Sea (kn)n ⊂σ(T ) una sucesión tal que kn → k. Entonces es trivial que

T − knI → T − kI

Puesto que los operadores inversibles formaban un conjunto abierto C,se sigue que su complementario, los no inversibles, forman un conjuntocerrado. Puesto que, para todo n ∈ N T −knI no es inversible, se sigueque T − kI tampoco lo es, es decir k ∈ σ(T ).

3. Un operador inversible T define una norma ‖|·|‖ enX equivalentea la norma original de X dada por

‖|x|‖ = ‖T (x)‖.

Por tanto si T fuera inversible definiría en X una norma equivalentecuya bola unidad T (BX) es un compacto, lo que implicaría que X esde dimensión finita.

Ejemplo 8.12. Sea k : [0, 1]× [0, 1] −→ K una función continua ysea T : C[0, 1] −→ C[0, 1] el operador definido como

T (f)(s) =

∫ 1

0

k(s, t)f(t)dt para todo s ∈ [0, 1].

En el Ejemplo 7.11 ya vimos que T está bien definido y es compacto.Además

‖T (f)‖ = sups|T (f)(s)| ≤ sup

s,t|k(s, t)|‖f‖ = ‖k‖∞‖f‖∞,

luego‖T‖ ≤ ‖k‖∞.

En ese caso decimos que T es un operador integral de Fredholm connúcleo continuo k(·, ·).

Si S es otro operador integral de Fredholm con núcleo continuoh(·, ·), es fácil ver que TS es también un operador integral de Fred-holm con núcleo continuo k ∗ h, donde para todos 0 ≤ s, t ≤ 1,

k ∗ h(s, t) =

∫ 1

0

k(s, u)h(u, t)du

y‖TS‖ ≤ ‖k‖∞‖h‖∞.

Haciendo T = S (es decir, h = k) y aplicando inducción tenemos quepara todo n ∈ N T n es un operador integral de Fredholm con núcleo

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 161

continuo

k(n)(s, t) =

∫ 1

0

· · ·∫ 1

0

k(s, u1)k(u1, u2) · · · k(un−1, t)du1 · · · dun−1.

Sea k un núcleo continuo tal que ‖k‖∞ ≤ 1. Entonces ‖T‖ < 1 y porel Lema 8.4 se tiene que I − T es inversible e

(11) (I − T )−1(f)(s) =∞∑n=0

T n(f)(s) = f(s) +∞∑n=1

∫ 1

0

k(n)(s, t)f(t)dt

Observemos que la serie∑∞

n=1 k(n)(s, t) converge uniforme y absolu-

tamente en (s, t) ∈ [0, 1]×[0, 1] (ya que para todo n ∈ N ‖k(n)‖ ≤ ‖k‖n)y por tanto

h(s, t) :=∞∑n=0

k(n)(s, t)

es una función continua en [0, 1]× [0, 1]. Además, por el Teorema de laConvergencia Acotada podemos intercambiar el sumatorio y la integralen (11) y tenemos que

(I − T )−1(f)(s) = f(s) +

∫ 1

0

h(s, t)f(t)dt,

es decir(I − T )−1 = I +B,

donde B es otro operador integral de Fredholm con núcleo continuo.

Si x es un autovector del autovalor k de T entonces se tiene queT (span[x]) ⊂ span[x]. Decimos entonces que span[x] es invariante porT . En general un subespacio V ⊂ X se dice invariante si por T siT (V ) ⊂ V . Claramente 0 y X son subespacios invariantes para todoT ∈ L(X). Durante un largo tiempo no se supo si existía algún espaciode Banach X y algún operador definido en él T que no tuviera ningúnsubespacio invariante no trivial (esto es, distinto de 0 y X); reciente-mente P. Enflo ([18]) encontró tales X y T . Aún no se sabe si dado unespacio de Hilbert H existe T ∈ L(H) sin subespacios invariantes notriviales. En cambio, recientemente Lomonosov ha probado que todooperador compacto entre espacios de Hilbert admite subespacios inva-riantes no triviales. Una exposición de estos problemas se puede ver en[20] y la bibliografía allí citada.

En relación a esto, veamos a continuación un ejemplo de un opera-dor entre espacios de Hilbert sin autovalores.

162 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

Ejemplo 8.13. Sea T : L2[0, 1] −→ L2[0, 1] (sobre los númeroscomplejos) dado por

T (f(t)) = tf(t)

para todo t ∈ [0, 1].Para ver que no tiene autovalores, si k ∈ C fuera un autovalor,

existiría f(t) ∈ L2[0, 1] tal que, para casi todo t ∈ [0, 1]

tf(t) = kf(t), es decir (k − t)f(t) = 0,

de donde, tomando t 6= k, tenemos que f(t) = 0 para casi todo t ∈ [0, 1],es decir f(t) = 0.

En cambio, veamos que todo k ∈ [0, 1] pertenece al espectro de T .Sea λ ∈ [0, 1] y sea ε > 0 tal que [λ, λ + ε] ⊂ [0, 1] o [λ− ε, λ] ⊂ [0, 1].Supongamos por ejemplo que [λ, λ+ ε] ⊂ [0, 1]. Sea

fε =

1√ε

, si t ∈ [λ, λ+ ε]

0 , si t 6∈ [λ, λ+ ε]

Claramente ‖fε‖2 = 1. Además

(T − λI)(fε)(t) = T (fε)(t)− λfε(t) = tfε(t)− λfε(t) = fε(t− λ)

y por tanto

‖(T − λI)(fε)‖22 =

∫ 1

0

1

ε(λ− t)2dt = · · · = ε2

3

y por tanto (T − λI)(fε) → 0 cuando ε tiende a 0. En consecuenciaT−λI no está acotado inferiormente y por ello no puede ser inversible.

Observemos finalmente que T tiene una gran abundancia de subes-pacios invariantes no triviales. En particular, es fácil ver que para todor ∈ (0, 1), L2[0, r] es invariante por T .

Uno de los resultados fundamentales de la Teoría Espectral es elTeorema de Gelfand-Mazur que enunciamos a continuación. Su demos-tración es una bonita aplicación de la Teoría de Variable Compleja.

Teorema 8.14 (Gelfand). Si X es un espacio de Banach complejoy T ∈ L(X) entonces σ(T ) 6= ∅.

Demostración. Sea f ∈ L(X)∗. Recordemos que ρ(T ) = σ(T )c

es la resolvente de T . Definimos la función

wf : ρ(T ) −→ C

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 163

comowf (z) = f((T − zI)−1).

Sabemos que ρ(T ) ⊂ C es un abierto (porque σ(T ) es cerrado). Veamosque wf es analítica en ρ(T ): sea z0 ∈ ρ(T ). Entonces

(T − z0I)− (T − zI) = (z − z0)Iy por tanto, componiendo por la derecha con (T − zI)−1 y por laizquierda con (T − z0I)−1 tenemos

(T − zI)−1 − (T − z0I)−1 = (z − z0)(T − z0I)−1(T − zI)−1

y por lo tanto

lımz→z0

wf (z)− wf (z0)z − z0

= lımz→z0

f

((T − zI)−1 − (T − z0I)−1

z − z0

)=

= lımz→z0

f((T − z0I)−1(T − zI)−1

)= f((T − z0I)−1)

por la continuidad de f y por la continuidad de la inversión probadaen el Corolario 8.7.

Supongamos ahora que σ(T ) = ∅. Entonces ρ(T ) = C por lo que wfes analítica en C, es decir, es una función entera. Además, si |z| > ‖T‖,usando el Lema 8.4 se tiene que

(12) ‖(T − zI)−1‖ =

∥∥∥∥∥1

z

(T

z− I)−1∥∥∥∥∥ ≤

≤ 1

|z| − ‖T‖→ 0 cuando |z| → ∞.

Como f es lineal y continua,

wf (z) = f((T − zI)−1)→ 0 cuando |z| → ∞y por tanto wf está acotada en C.

Por tanto el Teorema de Liouville nos dice que wf , siendo enteray acotada debe de ser constante. De (12) se sigue que wf debe de sersiempre 0. En particular

0 = wf (0) = f(T−1).

Como esto ocurre para todo f ∈ L(X)∗ se sigue que T−1 = 0, lo cuales imposible. Por tanto σ(T ) 6= 0.

Si se desea, y en función del tiempo disponible, en relación con estose puede definir el radio espectral de un operador T : X −→ X como

rσ(T ) = supk∈σ(T )

|k|

y a continuación demostrar la

164 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

Proposición 8.15 (Fórmula del Radio Espectral). Si X es un es-pacio de Banach complejo y T ∈ L(X) entonces

rσ(T ) = ınfn∈N‖T n‖

1n = lım

n→∞‖T n‖

1n .

Demostración. Una demostración adecuada para este curso sepuede ver en [31, 12.8 b].

Pasamos a estudiar la llamada Teoría de Riesz-Schauder. Necesita-mos unos cuantos resultados previos, interesantes en sí mismos, antesde llegar a los resultados principales de la teoría. Hemos seguido paraesta sección [33] principalmente.

Lema 8.16. Sea X un espacio de Banach, T ∈ K(X). Entoncesker(I − T ) tiene dimensión finita.

Demostración. Sea U la bola unidad cerrada de ker(I − T ). En-tonces T (U) = U . Puesto que T es compacto y U ⊂ BX , se tiene queU = T (U) es relativamente compacto, y por tanto compacto (puestoque es cerrado). Por tanto, si la bola unidad es compacta el espaciodebe de ser de dimensión finita.

Lema 8.17. Sea X un espacio de Banach, T ∈ K(X). Si (xn)n ⊂ Xes una sucesión acotada tal que xn − T (xn)→ y ∈ X entonces existenx ∈ X y una subsucesión (xnj)j ⊂ (xn)n tales que xnj → x ∈ X y

x− T (x) = y.

Demostración. Por la compacidad de T , existe una subsucesión(xnj)j ⊂ (xn)n tal que T (xnj) converge a z ∈ X. Entonces

xnj = xnj − T (xnj) + T (xnj)→ y + z

Llamamos x = y + z y, puesto que T es continuo, se tiene(I − T )(x) = lım

jxnj − T (xnj) = y + z − z = y.

Lema 8.18. Sea X un espacio de Banach, T ∈ K(X). EntoncesIm(I − T ) es cerrado y tiene codimensión finita.

Demostración. Veamos en primer lugar que Im(I − T ) es ce-rrado. Sea q : X −→ X/ ker(I − T ) la aplicación cociente. Entoncessabemos que I − T factoriza como

I − T = (I − T ) qdonde

I − T : X/ ker(I − T ) −→ X

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 165

es la aplicación canónica dada por

I − T ([x]) = (I − T )(x).

Es un ejercicio comprobar que I − T está bien definida, es lineal ycontinua, con ‖I − T‖ = ‖I − T‖.

Veamos que existe c > 0 tal que, para todo x ∈ X

(13) ‖x− T (x)‖ = ‖(I − T )([x])‖ ≥ c‖[x]‖

Si no fuera así, existiría una sucesión (xn) ⊂ X tal que

(14) lımn‖xn − T (xn)‖ = 0 y ‖[xn]‖ = 1 para todo n ∈ N.

Por la definición de la norma cociente podemos suponer que, paratodo n ∈ N,

1 ≤ ‖xn‖ ≤ 2.

Puesto que T es compacto, existen y ∈ X y una subsucesión (xnj)j ⊂(xn)n tal que T (xnj)→ y ∈ X. Por (14) sabemos que

lımjxnj = y

y por tanto

y − T (y) = lımjxnj − T (xnj) = y − y = 0,

es decir y ∈ ker(I−T ). Pero ahora usando la otra mitad de (14) tenemosuna contradicción puesto que

1 = ‖[xnj ]‖ ≤ ‖xnj − y‖ → 0

Por tanto sabemos que (13) es cierto. De (13) se sigue que (I − T )

es un isomorfismo sobre su imagen y en particular Im(I − T ) ⊂ X escerrado. Puesto que

Im(I − T ) = Im(I − T ),

se sigue que Im(I − T ) es cerrado.

Veamos ahora que Im(I − T ) tiene codimensión finita. Puesto queIm(I−T ) ⊂ X es un subespacio cerrado, podemos considerar el espaciocociente X/Im(I − T ) y sabemos que

(X/Im(I − T ))∗ = (Im(I − T ))⊥

166 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

y por otro lado es un ejercicio ver que (Im(I −T ))⊥ = ker((I −T )∗) =ker(I∗ − T ∗) = ker(IX∗ − T ∗). Puesto que T es compacto, el Teoremade Schauder nos dice que T ∗ es compacto. Ahora el Lema 8.16 nos diceque ker(IX∗ − T ∗) tiene dimensión finita, y de

ker(IX∗ − T ∗) = (X/Im(I − T ))∗

se sigue que X/Im(I − T ) tiene dimensión finita, es decir Im(I − T )tiene codimensión finita.

Observemos que si X es un espacio de Banach y T ∈ L(X), por lafórmula del binomio de Newton, para todo n ∈ N se tiene

(I − T )n = I −n∑j=1

(n

j

)(−1)j−1T j =: I − Tn

Si además T es compacto, puesto que los operadores compactos formanun subespacio vectorial, se sigue que cada uno de los Tn así definidoses compacto. Por tanto, para todo n ∈ N:

ker(I − T )n tiene dimensión finita, y claramente ker(I − T )n ⊂ker(I − T )n+1.Im(I−T )n tiene codimensión finita, es cerrado y Im(I−T )n ⊃Im(I − T )n+1.

Veamos que los núcleos ker(I − T )n no pueden crecer indefinida-mente, sino que a partir de cierto n0 se estabilizan.

Proposición 8.19. Sea X un espacio de Banach y T ∈ K(X).Entonces existe n0 ∈ N tal que, para todo n ≥ n0,

ker(I − T )n0 = ker(I − T )n.

Demostración. Si no fuera así, podemos suponer ker(I − T )n ker(I − T )n+1 para todo n ∈ N (si no, razonamos análogamente to-mando subsucesiones); en ese caso existiría una sucesión (xn)n ⊂ X talque, para todo n ∈ N

xn ∈ ker(I − T )n+1 \ ker(I − T )n

y

(15) 1 = ınfy∈ker(I−T )n

‖xn − y‖ ≤ ‖xn‖ ≤ 2

(donde hemos usado el Lema de Riesz para la segunda afirmación).Entonces, si m < n, se tiene

(I − T )n((I − T )(xn) + xm − (I − T )(xm)) = 0

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 167

por lo que

(I − T )(xn) + xm − (I − T )(xm) ∈ ker(I − T )n

y por tanto

‖T (xn)− T (xm)‖ = ‖xn − ((I − T )(xn) + xm − (I − T )(xm)‖ ≥ 1

por (15).Por tanto la sucesión (T (xn))n no puede tener subsucesiones con-

vergentes, en contradicción con el hecho de que T sea compacto.

Lema 8.20. Sea X un espacio de Banach y T ∈ K(X). Entoncesexiste n ∈ N tal que los subespacios cerrados N := ker(I − T )n yR := Im(I − T )n verifican

1. codimR <∞2. N ⊕R = X3. (I − T )(N) ⊂ N4. (I − T )(R) ⊂ R5. (I − T )R := (I − T )|R ∈ L(R) es invertible6. (I − T )N := (I − T )|N ∈ L(N) es nilpotente, en concreto (I −T )nN = 0

Demostración. Aplicando el Lema 8.19 a (I − T ), a (I − T )∗ =I − T ∗ y a (I − T )∗∗ = I − T ∗∗ tenemos que existe n ∈ N tal que, paratodo m ≥ n,

ker(I − T )n = ker(I − T )m, ker(I − T ∗)n = ker(I − T ∗)m, y

ker(I − T ∗∗)n = ker(I − T ∗∗)m.Usando que Im(I − T )m es cerrado para todo m ∈ N, ya hemos

visto en la demostración del Lema 8.18 que

Im(I − T )m = (ker(I − T ∗)m)⊥.

Por tanto, para todo m ≥ n se tiene

Im(I − T )n = (ker(I − T ∗)n)⊥ = (ker(I − T ∗)m)⊥ = Im(I − T )m.

Sean entonces N y R como en el enunciado. Ambos son cerrados ydimN < ∞ y codimR < ∞ (esto ya está probado en el Lema 8.18).Además

(I − T )(N) = (I − T )(ker(I − T )n+1) ⊂ ker(I − T )n = N

y

168 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

(I − T )(R) = (I − T )(Im(I − T )n) = Im(I − T )n+1 = R.

Por la elección de n, (I − T )nN = 0. Acabamos de ver que (I − T )Res sobre. Veamos que también es inyectivo: Si

(I − T )R(x) = 0,

entonces se tiene que x ∈ ker(I − T )n+1 = ker(I − T )n, es decir,

(I − T )n(x) = 0.

Es decir, (I − T )R es inyectiva y por tanto biyectiva. De aquí sesigue que N ∩ R = 0 -en efecto, si x ∈ N entonces (I − T )n(x) = 0;además, si x ∈ R, por ser (I − T )n biyectiva sobre R se tiene que(I − T )n(x) = 0 si y sólo si x = 0- y por tanto

dimN ≤ codimR.

Aplicando un razonamiento análogo a T ∗ en lugar de T , se sigueque

dim ker(I − T ∗)n ≤ codim(I − T ∗)n(X).

Como en la prueba del Lema 8.18 podemos ver que

ker(I − T ∗)n = X/Im(I − T )n

y por tanto

codimR = dim(X/Im(I − T )n) = dim ker(I − T ∗)n

y puesto que Im(I − T ∗)n es cerrado, de nuevo razonando como en elLema 8.18 tenemos que

(ker(I − T )n)∗ = X∗/(ker(I − T )n)⊥ =

= X∗/((I − T )n)∗(X) = X∗/(I − T ∗)n(X)

y por tanto

dimN = dim ker(I − T )n = dim(ker(I − T )n)∗ = codim(I − T ∗)n(X)

y juntando todo se tiene que

dimN = codim(I − T ∗)n(X) ≥ dim ker(I − T ∗)n = codimR

Así pues se tiene quedimN = codimR

de donde se sigue que X = N ⊕R

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 169

Proposición 8.21. Sea X un espacio de Banach de dimensión in-finita y sea T ∈ K(X). Entonces, para todo k ∈ σ(T ) \ 0 existen dossubespacios de X topológicamente complementarios Nk y Rk invarian-tes por kI − T y que verifican

1. (kI − T )|Rk es un isomorfismo de Rk en sí mismo.2. Existe nk ∈ N tal que

(kI − T )nk|Nk≡ 0,

es decir, (kI − T )nk|Nkes nilpotente.

3. 0 6= ker(kI − T ) ⊂ Nk y dimNk <∞.

Demostración. Puesto que 1kT es compacto para todo k 6= 0, po-

demos aplicar la Proposición 8.20 a (I− 1kT ) = 1

k(kI−T ) para obtener

nk, Nk, Rk, (I − T )Nk e (I − T )Rk con las propiedades allí establecidas.Entonces Rk y Nk son topológicamente complementarios y (1) y (2)quedan probados.

Puesto que (kI − T )|Rk es un isomorfismo (esto es (1)) y dado queX = Nk⊕Rk, si Nk fuera 0, tendríamos que (kI−T ) sería inversible,en contradicción con que k ∈ σ(T ). Por tanto Nk 6= 0. Ahora, dadoque (kI − T )|Nk es nilpotente, no puede ser inyectivo, por lo que existe0 6= x0 ∈ Nk tal que (kI − T )(x0) = 0, es decir

x0 ∈ ker(kI − T )

lo que prueba que ker(kI − T ) 6= 0.Puesto que Nk = ker(kI − T )nk (ver Lema 8.20), está claro que

ker(kI − T ) ⊂ ker(kI − T )nk , y que

dimNk <∞se sigue del Lema 8.20.

Finalmente podemos probar el resultado principal de la Teoría deRiesz-Schauder del espectro de operadores compactos.

Teorema 8.22. Sea X un espacio de Banach de dimensión infinita,y T ∈ K(X). Entonces

(i) 0 ∈ σ(T )(ii) Todo k ∈ σ(T ) \ 0 es un autovalor, y el autoespacio corres-

pondiente Ek tiene dimensión finita.(iii) Existe una sucesión convergente a cero (kn)n ∈ N (quizás even-

tualmente constante) tal que σ(T ) = 0 ∪ kn;n ∈ N.(iv) Para todo k ∈ K \ 0 se tiene

dim ker(kI − T ) = codim(kI − T )(X).

170 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

Demostración. (i) y (ii) ya han sido probados en la Proposición8.21.

Para probar (iii), probemos en primer lugar el siguiente

Aserto: Para todo k ∈ K\0 existe un entorno abierto Uk de k talque kI − T es un isomorfismo de X para todo z ∈ Uk \ k.

Demostración del Aserto: Puesto que σ(T ) es cerrado, su comple-mentario es abierto, por lo que dado k ∈ K \ σ(T ) existe un entornoUk de k totalmente contenido en K \ σ(T ).

Ahora, si k ∈ σ(T ) \ 0 y Rk y Nk son como en la Proposición8.21, entonces

(kI − T )|Rk = kIRk − T|Rkes inversible, es decir k 6∈ σ(T|Rk ). Puesto que T|Rk es compacto, denuevo σ(T|Rk ) es compacto y K\σ(T|Rk ) es un abierto. Por tanto, existeUk \K un entorno de k tal que (zI−T ) es inversible para todo z ∈ Uk.Como (kI−T )|Nk es nilpotente, se tiene que σ((kI−T )|Nk ) = 0 (estoes un ejercicio), es decir, para todo z 6= 0 se verifica que (zI − T )|Nk esinversible (como elemento de L(Nk)).

Juntando ambas cosas tenemos que para todo z ∈ Uk (zI −T )|Nk y(zI − T )|Rk son inversibles. Como X = Nk ⊕Rk tenemos que (zI − T )

es inversible (esto es un ejercicio) lo que prueba el aserto.

Ahora, puesto que σ(T ) es compacto, para todo ε > 0 el conjunto

Mε = k ∈ σ(T ); |k| ≥ ε = σ(T ) ∩ k ∈ K; ε ≤ |k| ≤ ‖T‖

es compacto. Del Aserto se sigue que ningún punto de Mε es de acu-mulación, por lo que Mε ha de ser finito. De aquí se sigue que σ(T ) es(a lo sumo) numerable.

Finalmente probemos (iv). Si k 6∈ σ(T ) entonces kI−T es inversible,ker(kI − T ) = 0 y Im(kI − T ) = X y (iv) es trivial.

Si k ∈ σ(T ) \ 0 entonces (kI − T )|Rk es inversible y dimNk <∞.Entonces

dim ker(kI − T ) = dim ker(kI − T )|Nk =

= codimIm(kI − T )|Nk = codimIm(kI − T ).

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 171

Como corolario resaltamos de forma explícita la llamada Alterna-tiva de Fredholm, que enunciamos más abajo. Antes de enunciarla,intentaremos motivarla brevemente.

Pensemos en el sistema de n ecuaciones lineales con n incógnitas

Ax = y

y sea At la matriz traspuesta de A. Ya hemos visto que si pensamos en Acomo un operador TA : Kn −→ Kn entonces At es la matriz asociada aloperador (TA)∗. Con esta notación, los siguientes resultados del ÁlgebraLineal son bien conocidos

1. El sistema Ax = y tiene una única solución para todo y ∈ Kn

si y sólo si el sistema homogéneo asociado Ax = 0 tiene x =(0, . . . , 0) como única solución.

2. El sistema homogéneo Ax = 0 tiene una solución distinta de(0, . . . , 0) si y sólo si el sistema traspuesto Atx = 0 tiene unasolución distinta de (0, . . . , 0). Además, en ese caso el máxi-mo número de soluciones linealmente independientes de ambossistemas es el mismo.

Es fácil ver que este resultado no se puede extender al caso de unacolección numerable de ecuaciones lineales con una cantidad numerablede incógnitas. Por ejemplo, considérese el sistema infinito con matrizasociada dada por

A = (ai,j)i,j∈N con aj+1,j =1

jpara todo j y ai,j = 0 si i 6= j + 1.

No es difícil ver que el sistema homogéneo asociado Ax = 0 sólo admitela solución x1 = x2 = · · · = 0. En cambio, si y = (1, 0, 0, . . .) elsistema Ax = y no tiene solución. Además, el sistema traspuesto Atx =0 admite la solución (1, 0, 0, . . .). El resultado probado por Fredholmnos muestra precisamente que el resultado del Álgebra Lineal arribamencionado sí se mantiene si el operador A es de la forma I − T , conT un operador compacto. En concreto tenemos

Teorema 8.23 (Alternativa de Fredholm). Sea X un espacio deBanach y sea T ∈ K(X). Entonces

1. Se verifica una y sólo una de las siguientes posibilidadesa) Para todo y ∈ X existe un único x ∈ X tal que (I−T )(x) =

y.b) Existe 0 6= x ∈ X tal que (I − T )(x) = 0. Además, en

este caso el máximo número de soluciones linealmente in-dependientes de la ecuación homogénea (I − T )(x) = 0 esfinito.

172 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

2. La ecuación homogénea (I−T )(x) = 0 tiene una solución distin-ta de 0 en X si y sólo si la ecuación traspuesta (I−T ∗)(x∗) = 0tiene una solución distinta de 0 en X∗. Además el máximo nú-mero de soluciones linealmente independientes de ambas ecua-ciones es el mismo.

Observación 8.24. Sean X y T como en el Teorema y para todok ∈ K consideremos el operador kT . Este operador es compacto, porserlo T . Por lo tanto, para la ecuación

(I − kT )(x) = y

se tienen las dos posibilidades enunciadas en el Apartado 1 del Teore-ma. Nótese que la segunda posibilidad se tiene precisamente cuando 1

kes un autovalor de T , y que sabemos que el conjunto de autovalores esa lo sumo numerable.

Veamos cómo se puede aplicar la Alternativa de Fredholm a la re-solución de sistemas numerables de ecuaciones lineales y a la resoluciónde ecuaciones integrales, el problema al que se enfrentaba Fredholm yque motivó el desarrollo de la teoría.

Teorema 8.25. Sea A = (ai,j)i,j∈N una matriz infinita y sea 1 ≤p < ∞. Si p = 1, supongamos que γ(j) =

∑∞i=1 |ai,j| < ∞ para todo

j ∈ N y que γ(j) → 0 cuando j → ∞. Si 1 < p < ∞ y 1p

+ 1q

= 1,supongamos que

∞∑i=1

(∞∑j=1

|ai,j|q)p

q<∞.

Entonces1. Se tiene una de las dos alternativas siguientes

a) O bien para todo y ∈ `p existe un único x ∈ `p tal que

(1− a1,1)x1 − a1,2x2 − a1,3x3 − · · · = y1

−a2,1x1 + (1− a2,2)x2 − a2,3x3 − · · · = y2

−a3,1x1 − a3,2x2 + (1− a3,3)x3 − · · · = y3...

......

b) O bien existe 0 6= x ∈ `p tal que

(1− a1,1)x1 = a1,2x2 + a1,3x3 + · · ·(16)(1− a2,2)x2 = a2,1x1 + a2,3x3 + · · ·(17)(1− a3,3)x3 = a3,1x1 + a3,2x2 + · · ·(18)

......

...(19)

8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS 173

En este caso no pueden existir un número infinito de vec-tores x ∈ `p linealmente independientes que verifiquen (16)

2. El máximo número de vectores x ∈ `p linealmente independien-tes que verifiquen (16) es igual al máximo número de vectoresx ∈ `q linealmente independientes que verifiquen el sistema tras-puesto

(1− a1,1)x1 = a2,1x2 + a3,1x3 + · · ·(1− a2,2)x2 = a1,2x1 + a3,2x3 + · · ·(1− a3,3)x3 = a1,3x1 + a2,3x2 + · · ·

......

...

Demostración. Ya hemos visto en el Ejemplo 7.10 que la matrizA define un operador compacto T : `p −→ `p. Es un ejercicio comprobarque At define precisamente el operador traspuesto T ∗ : `q −→ `q. Porlo tanto no hay más que aplicar la alternativa de Fredholm.

Veamos el análogo continuo del ejemplo de arriba, lo que se conocecomo ecuación integral de Fredholm de segunda clase.

Teorema 8.26. Sea k(·, ·) ∈ L2([0, 1]× [0, 1]). Entonces1. Se tiene una y sólo una de las dos siguientes alternativas

a) O bien para todo y ∈ L2[0, 1] existe un único x ∈ L2[0, 1]tal que para casi todo s ∈ [0, 1]

x(s)−∫ 1

0

k(s, t)x(t)dt = y(s)

b) O bien existe 0 6= y ∈ L2[0, 1] tal que para casi todo s ∈ [0, 1]

(20) x(s) =

∫ 1

0

k(s, t)x(t)dy

Además, en este caso el máximo número de x ∈ L2[0, 1]linealmente independientes que verifican (20) es finito.

2. La ecuación (20) tiene una solución distinta de 0 si y sólo si laecuación traspuesta

z(s) =

∫ 1

0

k(t, s)z(t)dt

tiene una solución distinta de 0 en L2[0, 1]

174 8. TEORíA ESPECTRAL DE OPERADORES COMPACTOS

Demostración. Ya hemos visto en el Ejemplo 7.11 que el opera-dor T : L2[0, 1] −→ [0, 1] dado por

T (x)(s) =

∫ 1

0

k(s, t)x(t)dt

es compacto. Una vez que identifiquemos adecuadamente su operadortraspuesto, bastará con aplicar de nuevo la alternativa de Fredholm.

Prácticas sugeridas

Ejercicio 8.1. Sea X un espacio de Banach y T ∈ L(X). De-mostrar que el operador exp(T ) :=

∑∞n=0

Tn

n!(está bien definido y) es

inversible. Sugerencia: (exp(T ))−1 = exp(−T ).Demostrar además que

σ(exp(T )) = exp(σ(T ))

Ejercicio 8.2 (Lomonosov). Sea X un espacio de Banach de di-mensión infinita y sea T ∈ K(X). Demostrar que X posee un subespa-cio invariante no trivial. [24, Ej. 18 p. 143].

Ejercicio 8.3. Sea X un espacio de Banach y sea T ∈ L(X).Sean λ1, . . . , λn autovalores distintos de T y sea ei un autovector de λi(1 ≤ i ≤ n). Demostrar que los vectores e1, . . . , en son linealmenteindependientes.

Capítulo 9

Espacios de Hilbert

Los espacios hoy conocidos como espacios de Hilbert estuvieron his-tóricamente entre los primeros espacios de Banach estudiados y prontose comprendió que ocupan un lugar destacado entre todos ellos. Ladiferencia radical entre un espacio de Hilbert y un espacio de Banachcualquiera es que en un espacio de Hilbert tenemos un gran conoci-miento de la “geometría” del espacio, y además esta geometría coincidecon nuestra intuición geométrica finito dimensional. Esto se traduce enuna serie de teoremas como el Teorema de Representación de Riesz,el Teorema de la Proyección Ortogonal y otros que permiten que tra-bajar en un espacio de Hilbert sea en general mucho más cómodo quetrabajar en otro espacio de Banach. Una de las consecuencias de estafacilidad en el estudio de los espacios de Hilbert es que muchos de los“grandes” teoremas del Análisis Funcional se pueden probar de maneramucho más sencilla en el caso de los espacios de Hilbert. Hemos in-cluido algún ejemplo de esta situación en el desarrollo del capítulo yplanteamos otros ejemplos de esto como ejercicios.

Comenzamos estudiando el producto escalar, a continuación la De-sigualdad de Schwartz y la definición de norma asociada a un productoescalar, lo que nos lleva a la definición de espacio de Hilbert. Seguida-mente vemos la Identidad de Polarización, que nos muestra como lanorma caracteriza al producto escalar, la crucial noción de ortogonali-dad y el Teorema de Pitágoras y la Ley del Paralelogramo, todas ellasherramientas sencillas de probar pero imprescindibles en la Teoría deespacios de Hilbert.

A continuación probamos el primero de los resultados “grandes” delcapítulo, probando que la distancia de un punto a un convexo cerradoen un espacio de Hilbert se alcanza en un único punto. De ahí deducimosel Teorema de la Proyección Ortogonal, lo que nos lleva a estudiar lacomplementación en espacios de Hilbert.

Seguidamente comenzamos el estudio de los conjuntos ortogonales,lo que nos lleva a probar la Desigualdad de Bessel y el Teorema deRiesz-Fischer, a definir Bases Hilbertianas y a presentar seguidamente

175

176 9. ESPACIOS DE HILBERT

el desarrollo en serie de Fourier en espacios de Hilbert y la Fórmulade Parseval.

No hemos visto necesario definir explícitamente familias sumablesen todo este desarrollo, sino que comprobamos que ciertos sumatoriosformales que aparecen indexados por conjuntos quizás no numerablestienen a lo sumo una cantidad numerable de términos no nulos, porlo que los podemos reducir a series. Creemos que este enfoque es algomás sencillo, pero no descartamos definir familias sumables si con laexperiencia nos pareciera mejor alternativa. Otra opción desde luegoes limitarse a espacios de Hilbert separables.

A continuación se puede, aunque no es fundamental para la asigna-tura, definir dimensión hilbertiana y probar que todo espacio de Hilbertes (isométrico a) un espacio `2(I) para algún conjunto de índices I.

Terminamos el capítulo con el fundamental Teorema de Riesz yalgunas aplicaciones de la Teoría de espacios de Hilbert.

Como ya hemos dicho, los espacios de Hilbert son centrales en la teo-ría de espacios de Banach, y muchos conceptos definidos y estudiadosen esta memoria en el contexto general de los espacios normados resul-tan mucho más sencillos si nos restringimos a los espacios de Hilbert.Resulta por ello una opción didáctica a tener en cuenta el comenzar elestudio de la asignatura con este capítulo (adecuadamente modificado,claro está, para no presuponer resultados no conocidos) y proceder acontinuación con el estudio de los espacios de Banach generales. Estees el esquema seguido en, por ejemplo, [13], donde el autor dice queel número de demostraciones que deben aparecer casi duplicadas porseguir este esquema es mucho menor de lo que él esperaba.

No nos hemos decidido a seguir ese esquema, pero tampoco descar-taríamos experimentarlo en alguna ocasión finalmente impartiéramosla asignatura desarrollada en esta memoria.

Hemos seguido en la presentación de este Capítulo los libros [13] y[31].

Espacios de Hilbert

Definición 9.1. Sea H un espacio vectorial sobre K. Un productoescalar en H es una función

〈·, ·〉 : H ×H −→ K

que verifica

9. ESPACIOS DE HILBERT 177

1. Es definida positiva, es decir, para todo x ∈ H〈x, x〉 ≥ 0

y〈x, x〉 = 0 si y sólo si x = 0

2. Linealidad en la primera variable, es decir, para todos x, y, z ∈H, α, β ∈ K,

〈αx+ βy, z〉 = α〈x, z〉+ β〈y, z〉3. Es antisimétrica, es decir, para todos x, y ∈ H

〈x, y〉 = 〈y, x〉4. Como consecuencia de 2 y 3 se tiene que un producto escalar

siempre es conjugado-lineal en la segunda variable, es decir,para todos x, y, z ∈ H, α, β ∈ K,

〈x, αy + βz〉 = α〈x, y〉+ β〈x, z〉

Nótese que si estamos trabajando sobre el cuerpo de los reales, unproducto escalar es una forma bilineal, simétrica y definida positiva.

Ejemplo 9.2. Enumeramos a continuación algunos ejemplos sen-cillos de espacios con un producto escalar.

El ejemplo más elemental es precisamente el producto escalaren Rn que nuestros alumnos ya conocen. La versión complejade este ejemplo es el producto escalar en Cn que viene dado por

〈(zi), (wi)〉 =n∑i=1

ziwi.

Usando la desigualdad de Hölder se comprueba que la función

〈·, ·〉 : `2 × `2 −→ K

dada por

〈(zi), (wi)〉 =∞∑i=1

ziwi

está bien definida y es un producto escalar en `2.Si nuestros alumnos ya conocen la medida de Lebesgue, usandola desigualdad de Hölder para integrales se comprueba que laaplicación

〈·, ·〉 : L2[0, 1]× L2[0, 1] −→ K

178 9. ESPACIOS DE HILBERT

dada por

〈f, g〉 =

∫ 1

0

f(t)g(t)dt

está bien definida y es un producto escalar en L2[0, 1].Sea H el conjunto de las funciones f : [0, 1] −→ K absoluta-mente continuas en [0, 1] tales que f(0) = 0 y f ′ ∈ L2[0, 1]. Sidefinimos

〈f, g〉 =

∫ 1

0

f ′(t)g′(t)dt

para todo f, g ∈ H entonces H es un espacio de Hilbert.

Si bien nuestros alumnos probablemente ya conocerán la desigual-dad de Schwarz, probablemente no esté de más recordarles brevementesu enunciado y demostración.

Proposición 9.3 (Desigualdad de Schwarz). Si 〈·, ·〉 es un productoescalar en H entonces para todo x, y ∈ H se tiene que

|〈x, y〉|2 ≤ 〈x, x〉〈y, y〉y se tiene la igualdad si y sólo si x e y son linealmente dependientes.

Demostración. Sean x, y ∈ H y sea z = 〈y, y〉x−〈x, y〉y. Enton-ces

0 ≤ 〈z, z〉 =

= 〈y, y〉2〈x, x〉−〈y, y〉〈x, y〉〈x, y〉−〈x, y〉〈y, y〉〈y, x〉+〈x, y〉〈x, y〉〈y, y〉 =

= 〈y, y〉(〈x, x〉〈y, y〉 − |〈x, y〉|2

)Entonces si y = 0 el resultado se sigue trivialmente. Si y 6= 0, entonces,puesto que 〈y, y〉 > 0, se tiene que

〈x, x〉〈y, y〉 − |〈x, y〉|2 ≥ 0

y de aquí se sigue la desigualdad.Si x e y son linealmente dependientes, si uno de ellos es 0, la igualdad

se sigue trivialmente. Si no, existe α ∈ K tal que x = αy, y se vefácilmente que se da la igualdad. Recíprocamente, si se da la igualdad,tenemos que, con las notaciones anteriores,

〈z, z〉 = 0

de forma que z = 0 y por tanto 〈y, y〉x = 〈x, y〉y, de donde se sigue quex e y son linealmente dependientes.

A partir de la desigualdad de Schwarz se ve fácilmente que el pro-ducto escalar permite definir una norma asociada a él

9. ESPACIOS DE HILBERT 179

Corolario 9.4. Sea H un espacio vectorial en el que está definidoun producto escalar 〈·, ·〉. Entonces la función

‖ · ‖ : H −→ [0,∞)

definida como‖x‖ = (〈x, x〉)

12

es una norma en H.

Demostración. La única dificultad reside en la desigualdad trian-gular. Observemos que para todos x, y ∈ H,

‖x+ y‖2 = 〈x+ y, x+ y〉 = ‖x‖2 + ‖y‖2 + 2<〈x, y〉.Por otro lado, de la desigualdad de Schwarz se sigue que

<〈x, y〉 ≤ |〈x, y〉| ≤ ‖x‖‖y‖y por tanto

‖x+ y‖2 ≤ ‖x‖2 + ‖y‖2 + 2‖x‖‖y‖ = (‖x‖+ ‖y‖)2

de donde se sigue la desigualdad triangular.

Probamos a continuación la Identidad de Polarización para el pro-ducto escalar. Dicha identidad es cierta en el contexto más general delas formas sesquilineales si los espacios son complejos y en de las for-mas bilineales simétricas si los espacios son reales, y así lo podemosmencionar a los alumnos, pero puesto que no la usaremos más que enel producto escalar, sólo la probamos en ese caso.

Lema 9.5 (Identidad de Polarización). Sea H un espacio vectorialcomplejo con un producto escalar definido en él. Entonces

〈x, y〉 =1

4

(‖x+ y‖2 − ‖x− y‖2 + ı‖x+ ıy‖2 − ı‖x− ıy‖2

)y

<〈x, y〉 =1

2

(‖x+ y‖2 − ‖x‖2 − ‖y‖2

)por lo que en el caso real

〈x, y〉 =1

2

(‖x+ y‖2 − ‖x‖2 − ‖y‖2

)Demostración. Inmediata.

Obsérvese que 〈x, y〉 = 0 para todo y ∈ H si y sólo si x = 0; clara-mente, si x = 0 entonces 〈x, y〉 = 0 para todo y ∈ H. Recíprocamente,si 〈x, y〉 = 0 para todo y ∈ H en particular 〈x, x〉 = 0 lo que implicaque x = 0.

180 9. ESPACIOS DE HILBERT

Al igual que ocurría en el caso de dimensión finita, la gran ventaja dela geometría de los espacios de Hilbert es que la existencia de productoescalar nos permite definir el concepto de ortogonalidad.

Definición 9.6. Sea H un espacio de Hilbert, x, y ∈ H. Decimosque x e y son ortogonales, y lo escribimos

x⊥y,

si〈x, y〉 = 0.

Decimos que dos subconjuntos A,B ⊂ H son ortogonales, A⊥B si paratodo a ∈ A, b ∈ B se tiene que a⊥b.

Los alumnos ya saben del caso finito-dimensional que esta noción secorresponde precisamente con la noción geométrica de ortogonalidad.

Proposición 9.7 (Pitágoras). Sea H un espacio de Hilbert. Six1, . . . , xn ∈ H son dos a dos ortogonales (es decir xi⊥xj para todoi 6= j) entonces ∥∥∥∥∥

n∑i=1

xi

∥∥∥∥∥2

=n∑i=1

‖xi‖2

Demostración. Aplicando inducción, es fácil ver que sólo es ne-cesario probar el caso n = 2. Supongamos que x1⊥x2. Entonces

‖x1+x2‖2 = 〈x1+x2, x1+x2〉 = 〈x1, x1〉+〈x2, x2〉+〈x1, x2〉+〈x2, x1〉 =

〈x1, x1〉+ 〈x2, x2〉 = ‖x1‖2 + ‖x2‖2.

Proposición 9.8 (Ley del Paralelogramo). Sea H un espacio deHilbert, x, y ∈ H. Entonces

‖x+ y‖2 + ‖x− y‖2 = 2(‖x‖2 + ‖y‖2

)Demostración. Dados x, y se sigue de la identidad de polariza-

ción que‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2<〈x, y〉

y‖x− y‖2 = ‖x‖2 + ‖y‖2 − 2<〈x, y〉.

Ahora se suman las dos ecuaciones.

9. ESPACIOS DE HILBERT 181

La Ley del Paralelogramo caracteriza de hecho a los espacios deHilbert, y proponemos esto como ejercicio.

Los dos siguientes resultados son fundamentales en la Teoría deespacios de Hilbert, y son los que permiten que trabajar en un Hilbertsea cómodo, en el sentido de que nuestra intuición geométrica finitodimensional se mantiene razonablemente intacta.

Teorema 9.9. Sea H un espacio de Hilbert, K ⊂ H un conjuntocerrado convexo no vacío y x ∈ H. Entonces existe un único k0 ∈ Ktal que

‖x− k0‖ = dist(x,K) := ınfk∈K‖x− k‖.

Demostración. Supongamos inicialmente x = 0. Buscamos pro-bar la existencia y unicidad de un k0 ∈ K tal que

‖k0‖ = dist(0, K) = ınfk∈K‖k‖.

Sea d = dist(0, K). Por definición existe una sucesión (kn) ⊂ K talque ‖kn‖ → d. De la Ley del Paralelogramo se sigue que

(21)∥∥∥∥kn − km2

∥∥∥∥2 =1

2(‖kn‖2 + ‖km‖2)−

∥∥∥∥kn + km2

∥∥∥∥2 .Puesto que K es convexo, kn+km

2∈ K y por tanto∥∥∥∥kn + km

2

∥∥∥∥2 ≥ d2.

Sea ε > 0. Entonces existe N ∈ N tal que para todo n ≥ N ‖kn‖2 <d2 + 1

4ε2. Por tanto, para todos m,n ≥ N se sigue de (21) que∥∥∥∥kn − km2

∥∥∥∥2 < 1

2(2d2 +

1

2ε2)− d2 =

1

4ε2.

Por tanto (kn)n es una sucesión de Cauchy y puesto que H es com-pleto y K es cerrado sabemos que existe k0 ∈ K tal que kn → k0.Además

d ≤ ‖k0‖ = ‖k0 − kn + kn‖ ≤ ‖k0 − kn‖+ ‖kn‖ → d

y por tanto‖k0‖ = d.

182 9. ESPACIOS DE HILBERT

Ya hemos probado la existencia de k0, veamos la unicidad. Supon-gamos que existe k1 ∈ K tal que ‖k1‖ = d. Por convexidad k0+k1

2∈ K

y por tanto

d ≤∥∥∥∥k0 + k1

2

∥∥∥∥ ≤ 1

2(‖k0‖+ ‖k1‖) = d

de forma que

d =

∥∥∥∥k0 + k12

∥∥∥∥ .Pero la Ley del Paralelogramo implica que

d2 =

∥∥∥∥k0 + k12

∥∥∥∥2 = d2 −∥∥∥∥k0 − k12

∥∥∥∥2de donde k0 = k1.

Si x 6= 0, basta aplicar lo anterior a 0 = x− x y el cerrado convexono vacío x−K para obtener un único x−k0 que cumple las condicionespedidas. Entonces es un ejercicio ver que k0 es el único elemento de Ken el que se alcanza la distancia.

Los subespacios son siempre trivialmente convexos, por lo que po-demos aplicar el teorema anterior al caso de un subespacio cerrado.Pero en ese caso podemos decir aún más.

Teorema 9.10 (Proyección ortogonal). Sea H un espacio de Hil-bert y M ⊂ H un subespacio cerrado. Sea x ∈ H y sea y0 ∈M el únicoelemento de M tal que ‖x− y0‖ = dist(x,M). Entonces

x− y0⊥M.

Recíprocamente, si y0 ∈M es tal que x− y0⊥M entonces

‖x− y0‖ = dist(x,M).

Demostración. Hacemos la demostración en el caso complejo.El caso real es esencialmente igual aunque algo más sencillo y quedacomo ejercicio para los alumnos. Supongamos que y0 ∈ M verifica‖x − y0‖ = dist(x,M). Si y ∈ M , entonces y + y0 ∈ M y por tanto,usando la identidad de polarización,

‖x− y0‖2 ≤ ‖x− (y0 + y)‖2 = ‖(x− y0)− y‖2 =

= ‖x− y0‖2 − 2<〈x− y0, y〉+ ‖y‖2.Por lo tanto

(22) 2<〈x− y0, y〉 ≤ ‖y‖2

9. ESPACIOS DE HILBERT 183

para todo y ∈M .Queremos probar que 〈x − y0, y〉 = 0. Fijemos y ∈ M y llamemos

〈x − y0, y〉 = reıθ, con r ≥ 0, θ ∈ [0, 2π). Consideremos para cadat ∈ R+ el vector teıθy ∈M . La ecuación (22) aplicada a este vector nosdice que

2<(te−ıθreıθ) ≤ t2‖y‖2

es decir

2tr ≤ t2‖y‖2.Puesto que esto ocurre para todo t ∈ R+ se sigue que r = 0, de

donde〈x− y0, y〉 = 0

como queríamos probar.

Recíprocamente, sea y0 ∈ M tal que x − y0⊥M . Entonces, paratodo y ∈M , también y − y0 ∈M y por tanto

x− y0⊥y − y0y de ahí se sigue, por el Teorema de Pitágoras, que

‖x− y‖2 = ‖(x− y0) + (y0 − y)‖2 =

= ‖x− y0‖2 + ‖y0 − y‖2 ≥ ‖x− y0‖2

y por tanto‖x− y0‖ = dist(y,M).

El Teorema anterior no es el fin de la historia. Vemos que dado unsubespacio vectorial M de H existe una aplicación bien definida

P : H −→M

que lleva x a y0, donde y0 es el único elemento deM tal que ‖x−y0‖ =dist(x,M) y simultáneamente es el único elemento de M tal que

x− y0⊥M.

Por supuesto, dado que estamos trabajando con espacios norma-dos, nos gustaría que esta aplicación fuera lineal y continua. Este es elcontenido principal del siguiente teorema, que en realidad es una con-tinuación del anterior. Necesitamos previamente un concepto nuevo.

184 9. ESPACIOS DE HILBERT

Definición 9.11. Sea A ⊂ H un subconjunto. Se define el ortogo-nal de A, y lo llamamos A⊥, como

A⊥ := x ∈ H tales que x⊥a para todo a ∈ A.

Más adelante, cuando veamos el Teorema de Representación deRiesz veremos que esta notación es coherente con el A⊥ ⊂ H∗ defi-nido anteriormente.

Teorema 9.12 (Proyección ortogonal). Sea H un espacio de Hil-bert y M ⊂ H un subespacio vectorial cerrado. Sea P : H −→M → Hla aplicación definida en el párrafo anterior. Entonces

1. P es lineal y continua, y ‖P‖ = 1 si M 6= 0.2. P 2 = P (pensando P como aplicación de H en H, para que P 2

tenga sentido).3. kerP = M⊥ e Im(P ) = M

Demostración. 1. Sean x1, x2 ∈ H, α, β ∈ K. Entonces, paratodo y ∈M se tiene que

〈αx1 + βx2 − (αP (x1) + βP (x2)), y〉 =

= α〈x1 − P (x1), y〉+ β〈x2 − P (x2), y〉 = 0 + 0 = 0.

Puesto que P (αx1 + βx2) es el único elemento de M que verifica lacondición de ortogonalidad, se tiene que

P (αx1 + βx2) = αP (x1) + βP (x2).

Para ver que P es continua y de norma 1, sea x ∈ H. Entonces

x = (x− P (x)) + P (x)

donde P (x) ∈M y x− P (x) ∈M⊥. Por tanto P (x)⊥(x− P (x)) y delTeorema de Pitágoras se sigue que

‖x‖2 = ‖x− P (x)‖2 + ‖P (x)‖2 ≥ ‖P (x)‖2,es decir

‖P (x)‖ ≤ ‖x‖y por tanto ‖P‖ ≤ 1. Por otro lado, considerando 0 6= x ∈M , P (x) = x(esto es trivial) y por tanto ‖P‖ ≥ 1.

2. Como P (y) = y para todo y ∈ M , tomando x ∈ H tenemos queP (x) ∈M y por tanto

P 2(x) = P (P (x)) = P (x)

lo que prueba lo pedido.

9. ESPACIOS DE HILBERT 185

3. Si P (x) = 0 entonces x = x − P (x) ∈ M⊥. Recíprocamente, six ∈M⊥, sea P (x) = y ∈M el único vector de M tal que x− y ∈M⊥.Esto implica en particular que

0 = 〈x− y, y〉 = 〈x, y〉 − 〈y, y〉 = 0− ‖y‖2

de donde y = 0.

Para ver que Im(P ) = M , puesto que Im(P ) ⊂M , sólo es necesarioobservar que P (y) = y para todo y ∈M .

Definición 9.13. Si M ⊂ H es un subespacio vectorial cerrado,a la proyección P anteriormente se le denomina Proyección Ortogonalsobre M .

Corolario 9.14. Sea H un espacio de Hilbert, M ⊂ H un subes-pacio vectorial. Entonces M está complementado en H. De hecho uncomplementario de M en H es precisamente M⊥.

El Teorema de la Proyección Ortogonal es uno de los resultados másutilizados en espacios de Hilbert, y uno de los motivos de que dichosespacios sean mucho más “cómodos” que otros espacios de Banach ala hora de trabajar con ellos. De hecho, el último corolario enunciadocaracteriza a los Hilbert, en el sentido de que cualquier espacio deBanach X en el que todo subespacio cerrado esté complementado esisomorfo a un espacio de Hilbert [32]

Podemos obtener como fácil corolario una versión débil en espaciosde Hilbert del Teorema Bipolar

Corolario 9.15. Si M ⊂ H es un subespacio vectorial cerrado,entonces (M⊥)⊥ = M .

Demostración. Si P es la proyección ortogonal sobre M , enton-ces es fácil ver que I − P es la proyección ortogonal sobre M⊥. Portanto, del apartado 3 del Teorema de la Proyección ortogonal se sigueque

(M⊥)⊥ = ker I − P.Pero x ∈ ker I − P si y sólo si P (x) = x, es decir, x ∈M .

Aplicación: Como aplicación de la proyección ortogonal podemosmostrar una construcción “elemental” de la esperanza condicional.

Sea (Ω,F , P ) un espacio de probabilidad (es decir un espacio Ω conuna σ-álgebra F definida en él y una probabilidad P : F −→ [0, 1]).Supongamos para fijar ideas que Ω = [0, 1], F = B, la σ-álgebra deBorel y P = λ es la medida de Lebesgue.

186 9. ESPACIOS DE HILBERT

Para todo 1 ≤ p ≤ ∞ sea Lp([0, 1],B, λ) el espacio de Lebesguehabitual.

Consideremos una sub-σ-álgebra G ⊂ B. Tiene entonces sentido ha-blar de Lp([0, 1],G, λ), como el espacio de las funciones G-medibles con‖ · ‖p finita. Es fácil ver que Lp([0, 1],G, λ) es un subespacio cerrado deLp([0, 1],B, λ). Se puede ver que de hecho Lp([0, 1],G, λ) está comple-mentado en Lp([0, 1],B, λ), y que podemos una definir una proyección

E(·|G) : Lp([0, 1],B, λ) −→ Lp([0, 1],G, λ)

que denominaremos esperanza condicional con propiedades especialesque lo hacen muy importante en la Teoría de Probabilidad y Esta-dística. Las propiedades interesantes de la esperanza condicional sonconsecuencia de ser una proyección que verifica que para todo G ∈ Gy para todo f ∈ Lp([0, 1],B, λ)

(23)∫G

E(f |G) =

∫G

fdλ

La interpretación probabilística que se suele hacer de esto es lasiguiente. La σ-álgebra G (o más bien las funciones G-medibles) repre-senta “lo que sabemos”, o más correctamente los observables en unascircunstancias dadas, o un instante dado. Entonces E(f |G) representa“lo mejor que podemos decir” acerca de una función f con los conoci-mientos representados en G.

La construcción de la Esperanza Condicional se hace habitualmenteutilizando el Teorema de Radon-Nikodym. Vamos a ver una construc-ción “elemental”.

Consideramos primeramente el caso p = 2. En ese caso, es un ejer-cicio ver que la proyección ortogonal es una proyección que verifica(23).

Recordemos que si p ≥ q, Lp[0, 1] ⊂ Lq[0, 1]. Por tanto para todop > 2 podemos definir el operador esperanza condicional simplementerestringiendo la esperanza condicional en L2. De nuevo es fácil ver queel operador así definido termina en Lp([0, 1],G, λ) y verifica (23).

El problema viene cuando tratamos de extender la esperanza con-dicional a todo L1. No incluimos todos los detalles, que requieren deun uso más o menos cuidadoso de técnicas estandar de Teoría de laMedida. El lector interesado puede consultar por ejemplo [35].

Quizás sea interesante mencionar que siguiendo en esta dirección sepuede, a partir de esta definición de esperanza condicional y utilizandoun teorema de convergencia de martingalas, demostrar el Teorema de

9. ESPACIOS DE HILBERT 187

Radon-Nikodym, cerrando así el círculo de ideas. Los detalles se puedenver por ejemplo en [28].

Conjuntos ortogonales

Buscamos ahora ver la versión infinito-dimensional de la noción, yaconocida por los alumnos en dimensión finita, de base ortonormal de unespacio de Hilbert. Puesto que previsiblemente no trataremos bases deSchauder en el programa de la asignatura, damos aquí una presentaciónautocontenida. Si hubiéramos visto bases de Schauder en espacios deBanach, entonces relacionaríamos esta sección con aquellas.

Definición 9.16. Un subconjunto E ⊂ H se dice ortogonal si paratodo x, y ∈ E, x 6= y, se tiene que

x⊥y.Si además ‖x‖ = 1 para todo x ∈ X decimos que X es ortonormal.

Proposición 9.17. Sea E ⊂ H un subconjunto ortogonal. Si 0 6∈ Eentonces E es linealmente independiente. Si además E es ortonormalentonces

‖x− y‖ =√

2

para todo x, y ∈ E con x 6= y.

Demostración. Sean x1, . . . , xn ∈ E y sean α1, . . . , αn ∈ K talesque

n∑i=1

αixi = 0.

Entonces, para todo 1 ≤ j ≤ n se tiene

0 = 〈0, xj〉 = 〈n∑i=1

αixi, xj〉 =n∑i=1

αi〈xi, xj〉 = αj〈xj, xj〉.

Por tanto, puesto que xj 6= 0 se tiene que αj = 0 para todo 1 ≤ j ≤n y E es linealmente independiente. Si E es ortonormal entonces paratodo x 6= y ∈ E

‖x− y‖2 = 〈x− y, x− y〉 = 〈x, x〉+ 〈y, y〉 = 2.

Puesto que los sistemas ortonormales son linealmente independien-tes, dado un sistema ortonormal podemos, utilizando el Álgebra Lineal,

188 9. ESPACIOS DE HILBERT

extender dicho sistema a una base de Hamel de H. Sin embargo habi-tualmente las bases de Hamel no son un objeto de trabajo interesanteen la Teoría de Espacios Normados, y en particular en la Teoría deEspacios de Hilbert, puesto que no sacan partido de la estructura to-pológica y esto las hace ser demasiado grandes: ya vimos en el Ejercicio4.5 que los espacios de Banach infinito dimensionales no pueden tenerbases de Hamel numerables.

En la Teoría de Espacios Normados de dimensión Infinita el obje-to interesante son las bases de Schauder, y en la Teoría de Espaciosde Hilbert son las bases ortonormales que iremos construyendo en losresultados siguientes.

Vamos a empezar viendo el proceso de ortogonalización de Gram-Schmidt que nos dice que, dado un conjunto contable linealmente in-dependiente de H podemos construir inductivamente un conjunto or-tonormal que genera el mismo subespacio vectorial en cada paso.

Teorema 9.18 (Proceso de Ortonormalización de Gram-Schmidt).Sea H un espacio de Hilbert y xn;n ∈ N ⊂ H un subconjunto lineal-mente independiente. Entonces existe un conjunto ortonormal en;n ∈N tal que, para todo n ∈ N,

span[e1, . . . , en] = span[x1, . . . , xn]

Demostración. Definimos inductivamente la sucesión (en)n. Enrealidad vamos definiendo una sucesión ortogonal (yn) y a continuaciónla normalizamos. En primer lugar,

y1 = x1

ye1 =

y1‖y1‖

.

Obviamente span[e1] = span[x1]Supongamos que ya hemos definido los n− 1 primeros términos de

la sucesión. Definimos entonces

yn = xn − 〈xn, e1〉e1 − · · · − 〈xn, en−1〉en−1y

en =yn‖yn‖

.

Todo es como en el caso finito dimensional que ya conocen así quedejamos como ejercicio la conclusión de la demostración.

Ejemplo 9.19. 1. En `2, la base canónica (en) es ortonormal.

9. ESPACIOS DE HILBERT 189

2. Si en `2 ortonormalizamos la “base sumante” (xn)n con xn =

(1, (n), 1, 0, 0, . . .) obtenemos la base canónica.3. Si ortonormalizamos la sucesión 1, x, x2, . . . , en L2[0, 1] obtene-

mos la sucesión

en =

√2n+ 1

2Pn(x)

donde los polinomios

Pn(x) =1

2nn!

dn

dxn(x2 − 1)

son los Polinomios de Legendre.

Enunciamos y probamos a continuación la desigualdad de Bessel ensu forma habitual, es decir para conjuntos ortonormales numerables.Más adelante vemos como corolario que la desigualdad también es ciertapara conjuntos ortonormales arbitrarios.

Teorema 9.20 (Desigualdad de Bessel). Sea H un espacio de Hil-bert, en;n ∈ N ⊂ H un conjunto ortonormal y x ∈ H. Entonces

∞∑n=1

|〈x, en〉|2 ≤ ‖x‖2.

Además se tiene la igualdad si y sólo si

x =∞∑n=1

〈x, en〉en.

Demostración. Fijemos n ∈ N y sea xn = x−∑n

k=1〈x, ek〉ek. Dela ortogonalidad de los (en) se sigue que para todo n ∈ N y para todo1 ≤ k ≤ n,

xn⊥ek.Puesto que x = xn +

∑nk=1〈x, ek〉ek, del teorema de Pitágoras se

tiene que

‖x‖2 = ‖xn‖2 +n∑k=1

‖〈x, ek〉ek‖2 = ‖xn‖2 +n∑k=1

|〈x, ek〉|2

de lo que se sigue quen∑k=1

|〈x, ek〉|2 ≤ ‖x‖2.

Puesto que esto es cierto para un n ∈ N arbitrario, se tiene ladesigualdad buscada.

190 9. ESPACIOS DE HILBERT

Si se tiene la igualdad, esto implica que

‖xn‖2 → 0

y de aquí se sigue que

x = lımn→∞

n∑k=1

〈x, ek〉ek =∞∑k=1

〈x, ek〉ek

Recíprocamente, si x =∑∞

k=1〈x, ek〉ek entonces ‖xn‖ → 0 y se siguela igualdad buscada.

Corolario 9.21. Si E ⊂ H es un conjunto ortonormal y x ∈ Hentonces 〈x, e〉 = 0 excepto en a lo sumo una cantidad numerable deelementos e ∈ E.

Demostración. Para todo n ∈ N, sea

En := e ∈ E tales que 〈x, e〉 ≥ 1

n

Por la desigualdad de Bessel En es finito para cada n, y

∪n∈NEn = e ∈ E tales que 〈x, e〉 6= 0.

Corolario 9.22 (Desigualdad de Bessel). Sea H un espacio deHilbert, E ⊂ H un conjunto ortonormal y x ∈ H. Entonces∑

e∈E

|〈x, e〉|2 ≤ ‖x‖2.

Estudiamos ahora la convergencia de las series∑

n knen donde loskn son escalares y en;n ∈ N forman un sistema ortonormal.

Teorema 9.23 (Riesz-Fischer). Sea H un espacio de Hilbert, seaen;n ∈ N ⊂ H un sistema ortonormal y sea (kn)n∈N ⊂ K. Si

∑n knen

converge a x ∈ H entonces, para todo n ∈ N,〈x, en〉 = kn

y ∑n

|kn|2 <∞.

Recíprocamente, si∑

n |kn|2 <∞ entonces∑n

knen

converge en H.

9. ESPACIOS DE HILBERT 191

Demostración. Si x =∑

n knen entonces de la ortogonalidad delos (en) se sigue que 〈x, en〉 = kn para todo n ∈ N y la desigualdad deBessel implica que ∑

n

|kn|2 <∞.

Recíprocamente, para todo m ∈ N sea

xm =m∑n=1

knen.

Entonces para todo 1 ≤ j ≤ m se tiene que

xm − xj =m∑

n=j+1

knen

y de nuevo la ortonormalidad de los (en) implica que

‖xm − xj‖2 = 〈xm − xj, xm − xj〉 =m∑

n=j+1

|kn|2.

Por tanto, si∑∞

n=1 |kn|2 < ∞ se sigue que la sucesión (xm)m es deCauchy y por tanto convergente.

Con la desigualdad de Bessel y el Teorema de Riesz-Fischer estamosya bastante cerca de la noción de base Hilbertiana o base ortonormal.

Definición 9.24. Un sistema ortonormal E ⊂ H es una base orto-normal, o base Hilbertiana, si es un sistema ortonormal maximal parael orden dado por la inclusión. Es decir, si existe un sistema ortonormalE ′ tal que E ⊂ E ′ entonces E = E ′.

Podemos garantizar la existencia de bases ortonormales medianteel Lema de Zorn (3.3).

Proposición 9.25. Sea H 6= 0 un espacio de Hilbert. Entoncesexiste una base ortonormal en H. De hecho, dado un sistema ortonor-mal E ′ ⊂ H, E ′ se puede ampliar a una base ortonormal E.

Demostración. Notemos en primer lugar que si 0 6= x ∈ H, elsistema x

‖x‖ es trivialmente ortonormal. Veamos que un sistema orto-normal E ′ se puede extender a una base ortonormal. Sea E el conjuntode todos los sistemas ortonormales de H que contienen a E ′. Este esun conjunto dirigido por la inclusión conjuntista. Si consideramos unsubconjunto totalmente ordenado (una cadena) es fácil ver que la uniónde todos los elementos de la cadena es una cota superior de esta. Por

192 9. ESPACIOS DE HILBERT

tanto el Lema de Zorn nos dice que existe un elemento maximal de Eal que llamamos E. Claramente E ′ ⊂ E y E es base ortonormal.

Necesitaremos ahora un lema que nos permite reducir las sumasque aparecen en los sistemas ortonormales a series.

Lema 9.26. Sea E = eα;α ∈ A ⊂ H un sistema ortonormal yx ∈ H. Sea

Ex := eα ∈ E tales que 〈x, eα〉 6= 0.Entonces Ex es un conjunto numerable y llamando Ex = en;n ∈ Nse tiene

lımn〈x, en〉 = 0.

Además ∑n

〈x, en〉en

converge a un elemento y ∈ H tal que

x− y⊥eα para todo α ∈ A.

Demostración. Si x = 0 no hay nada que demostrar. Sea en-tonces x 6= 0. Que Ex es contable es el Corolario 9.21. LlamandoEx = en;n ∈ N de la desigualdad de Bessel se sigue que∑

n

|〈x, en〉|2 ≤ ‖x‖2 <∞

y por tanto |〈x, en〉|2 → 0.

Puesto que ya hemos visto que∑

n |〈x, en〉|2 <∞, del Teorema deRiesz-Fischer (9.23) se sigue que∑

n

〈x, en〉en

converge a un elemento y ∈ H. Además, para todo α ∈ A,

〈y, eα〉 =

⟨∑n

〈x, en〉en, eα

⟩=∑n

〈x, en〉〈en, eα〉 = 〈x, eα〉

y de ahí se sigue fácilmente quex− y⊥eα para todo α ∈ A.

Teorema 9.27. Sea E = eα;α ∈ A ⊂ H un sistema ortonormal.Entonces son equivalentes

(1) E es una base ortonormal de H

9. ESPACIOS DE HILBERT 193

(2) (Desarrollo en serie de Fourier) Para todo x ∈ H

x =∑α∈A

〈x, eα〉eα

entendiendo este sumatorio como una serie, puesto que a losumo una cantidad numerable de términos son no nulos, es decir

x =∑n

〈x, en〉en

donde en;n ∈ N = eα ∈ E tales que 〈x, eα〉 6= 0.(3) (Fórmula de Parseval) Para todo x ∈ H

‖x‖2 =∑α∈A

|〈x, eα〉|2

entendiendo este sumatorio igual que en el apartado anterior.(4) span[E] es denso en H(5) Si x ∈ H es tal que 〈x, eα〉 = 0 para todo α ∈ A entonces x = 0.

Demostración. Supongamos que (1) es cierto, es decir E es unabase ortonormal, es decir un sistema ortonormal maximal. Sea x ∈ H.Por el Lema 9.26 existe y ∈ H tal que∑

α

〈x, eα〉eα = y

y ademásx− y⊥E.

Si y 6= x, sea

e =x− y‖x− y‖

.

Entonces ‖e‖ = 1 y e⊥E por lo que E ∪e es un sistema ortonormal,en contradicción con que E sea maximal. Por tanto

x = y =∑α

〈x, eα〉eα

y (2) es cierto.La equivalencia de (2) y (3) se sigue de la condición descrita para

la igualdad en la desigualdad de Bessel (Teorema 9.20).

Fácilmente (2) implica (4), ya que∑m

n=1〈x, en〉en ∈ span[E].

194 9. ESPACIOS DE HILBERT

Para ver que (4) implica (5), sea x ∈ H tal que 〈x, eα〉 = 0 paratodo α ∈ A, y sea (xn)n∈N ⊂ span[E] una sucesión tal que xn → x.Entonces 〈xn, x〉 = 0 para todo n y por tanto

0 = 〈xn, x〉 → 〈x, x〉

de donde se sigue que x = 0

Finalmente, para ver que (5) implica (1), sea E ′ ⊂ H un sistemaortonormal tal que E ⊂ E ′. Sea e ∈ E ′ \ E. De la ortogonalidad de E ′se sigue que 〈e, eα〉 = 0 para todo α ∈ A. De (5) se sigue que e = 0, unacontradicción puesto que si E ′ es ortonormal y por tanto ‖e‖ = 1.

Podemos ahora definir un concepto de dimensión Hilbertiana, deforma análoga a la definición de la dimensión algebraica.

Proposición 9.28. Si H es un espacio de Hilbert, todas sus basesortonormales tienen el mismo cardinal.

Demostración. Sean E y F dos bases ortonormales de H, seanε = card(E), η = card(F ). Si ε o η son finitos, entonces ε = η, usandorazonamientos totalmente análogos a los finito-dimensionales. Supon-gamos entonces que ambos son infinitos. Dado e ∈ E, sea

Fe := f ∈ F tales que 〈e, f〉 6= 0.

Ya hemos visto que Fe es contable. Además todo f ∈ F debe de perte-necer al menos a uno de los Fe, puesto que si no 〈e, f〉 = 0 para todoe ∈ E y de la condición (5) del Teorema 9.27 se seguiría que f = 0.Por tanto

F = ∪e∈EFey por tanto

η ≤ εℵ0 = ε

Análogamente se puede ver que

ε ≤ ηℵ0 = η

de donde se sigue que ε = η.

Ya podemos definir la dimensión hilbertiana.

Definición 9.29. Sea H un espacio de Hilbert. Se define su di-mensión hilbertiana como el cardinal de una cualquiera de sus basesortonormales.

Proposición 9.30. Sea H un espacio de Hilbert. Entonces H esseparable si y sólo si dimH = ℵ0.

9. ESPACIOS DE HILBERT 195

Demostración. Si dimH = ℵ0, y E = en;n ∈ N, es un ejerciciover que el conjunto numerable

m∑n=1

qnen; qn ∈ Q+ ıQ,m ∈ N

es denso en H.

Recíprocamente, sea E una base ortonormal de H. Ya vimos quepara todo e1, e2 ∈ E

‖e1 − e2‖2 = ‖e1‖2 + ‖e2‖2 = 2.

Por tanto, el conjuntoBe, 1√

2; e ∈ E

es un conjunto de bolas abiertas de H disjuntas dos a dos. De aquí sesigue que este conjunto, y por tanto E, deben de ser numerables. Elrazonamiento es el siguiente:

Si (X, d) es un espacio métrico separable y Bi = Bxi,ri ; i ∈ I esun conjunto de bolas abiertas disjuntas dos a dos, entonces I tiene queser contable. En efecto, sea D ⊂ X un subconjunto contable denso.Entonces para todo i ∈ I,

Bi ∩D 6= ∅

y por tanto existe yi ∈ Bi ∩D. Por tanto yi; i ∈ I es un subconjuntode D con el cardinal de I. De aquí se sigue que

cardI ≤ cardD = ℵ0.

Ejemplo 9.31. Sea H = `2 y sea E = en;n ∈ N ⊂ `2 la basecanónica. X es un sistema ortonormal, y dado x ∈ `2, si

〈x, en〉 = 0

para todo n ∈ N se sigue que x = 0. Por tanto E es una base ortonor-mal, y queda justificado el nombre de base canónica, y tenemos que `2es separable.

En la categoría de espacios de Hilbert, el concepto natural de iso-morfismo es aquel que preserva el producto escalar junto con la es-tructura lineal. Es decir, una aplicación lineal que preserve productosescalares. Veamos que los isomorfismos en este sentido son exactamentelas isometrías.

196 9. ESPACIOS DE HILBERT

Proposición 9.32. Sean H,K espacios de Hilbert y T : H −→ Kuna aplicación lineal. Entonces T es una isometría si y sólo si paratodo x, y ∈ H

〈T (x), T (y)〉 = 〈x, y〉.

Demostración. Si 〈T (x), T (y)〉 = 〈x, y〉 entonces‖T (x)‖2 = 〈T (x), T (x)〉 = 〈x, x〉 = ‖x‖2

y T es una isometría.

Recíprocamente, si T es una isometría, se sigue de la identidad depolarización que se conserva el producto escalar.

Decimos que dos espacios de Hilbert H,K son isomorfos como es-pacios de Hilbert si son isométricos como espacios de Banach, es decir,si existe una isometría T : H −→ K sobreyectiva.

Teorema 9.33. Dos espacios de Hilbert H,K son isomorfos comoespacios de Hilbert si y sólo si tienen la misma dimensión.

Demostración. Si T : H −→ K es una isometría sobre y E es unabase de H, entonces T (E) = T (e); e ∈ E es un sistema ortonormalde K. Además, dado y ∈ K, sea x ∈ H el único elemento de H talque T (x) = y. Si 〈T (e), y〉 = 0 para todo T (e) ∈ T (E) tenemos que〈T (e), T (x)〉 = 〈e, x〉 = 0 para todo e ∈ E. Puesto que E es una baseortonormal, esto implica que x = 0 y por tanto y = 0 y se tiene queT (E) es una base ortonormal por el Teorema 9.27. De ahí se sigue quedimH = dimK.

Recíprocamente, sea H es un espacio de Hilbert y E ⊂ H una baseortonormal. Consideramos el espacio

`2(E) = (ae)e∈E tales que∑e

|ae|2 <∞

De manera totalmente análoga a como vimos que `2 es un espaciode Hilbert, se comprueba que `2(E) es un espacio de Hilbert con elproducto escalar obvio. (En algún momento de la demostración hay queobservar, como ya hemos hecho anteriormente en más de una ocasión,que si

∑e |ae|2 < ∞ entonces a lo sumo una cantidad numerable de

“coordenadas” ae son distintas de 0.)Definimos entonces la aplicación

T : H −→ `2(E)

comoT (x) = (〈x, e〉)e∈E

9. ESPACIOS DE HILBERT 197

La linealidad de T está clara. De la desigualdad de Bessel, o del Teore-ma de Parseval, se sigue que T está bien definido y que es una isometría.Para ver que es sobre, si (ae)e∈E ∈ `2(E), entonces del Teorema de deRiez-Fischer (9.23) se sigue que la serie∑

e∈E

aee

(serie porque sólo una cantidad numerable de términos son no nulos)converge en H a un elemento x. Es claro entonces que T (x) = (ae).

Luego hemos probado que todo espacio de Hilbert es isomorfo a`2(I) donde I es un conjunto tal que card(I) = dimH, y de ahí sesigue lo pedido.

Observación 9.34. Nótese que hemos probado algo más que loanunciado; hemos probado que de hecho todo espacio de Hilbert es (iso-morfo a) un espacio `2(I), y que tiene sentido hablar de las coordenadasde un vector de forma al menos similar a las coordenadas de los espa-cios vectoriales finito dimensionales.

Corolario 9.35. Dos espacios de Hilbert separables son isomorfos(e isomorfos a `2)

Ahora podemos estudiar al Análisis de Fourier dentro del marcoteórico que hemos preparado.

Tenemos el siguiente teorema, que se puede probar directamentedesde la Variable Compleja, aunque nosotros lo probamos aquí comoconsecuencia del Teorema de Stone-Weierstrass.

Teorema 9.36. Sea T = z ∈ C tales que |z| = 1 y sea

f : T −→ Cuna función continua. Entonces existe una sucesión (Pn(z, z))n∈N depolinomios en z y z tales que Pn(z, z) tiende a f uniformemente en T.

Demostración. T es un espacio compacto. Consideramos el es-pacio de Banach C(T) que además tiene estructura de álgebra. SeaA ⊂ C(T) el álgebra de los polinomios en z y z. Es un ejercicio verifi-car que A cumple las hipótesis del Teorema de Stone-Weierstrass y portanto A = C(T).

Observemos que para todo z ∈ T, z = z−1 y z = eıθ y por tantotodo polinomio P (z, z) se puede escribir como una función de z = eıθ

dada por

P (z) =n∑

k=−n

αkeıkθ

198 9. ESPACIOS DE HILBERT

Por este motivo a estos polinomios se les llama polinomios trigonomé-tricos. Veamos ahora que el conjunto

eınθ√2π

;n ∈ Z⊂ L2[0, 2π]

es una base ortonormal de L2[0, 2π].Es un ejercicio elemental de variable compleja verificar que dicho

sistema es ortonormal.Para verificar que es una base hay al menos dos posibilidades, ambas

no triviales. Una es seguir por ejemplo [13, Theorem 5.7] y probarloutilizando que C[0, 2π] es denso en L2[0, 2π] y a continuación utilizarla caracterización, no probada pero fácilmente probable como ejercicioque dice que un sistema ortonormal E ⊂ H es una base ortonormalsi y sólo si la clausura topológica de span[E] = H. La otra opción esseguir [31, p. 392], pero para esto es necesario utilizar el Teorema deFejer, lo cual quizá nos lleve demasiado lejos.

Una vez que sabemos queeınθ√2π

;n ∈ Z

es una base ortonormalpodemos asignar a cada función f ∈ L2[0, 2π] sus coordenadas respectode dicha base.

Definición 9.37. Sea f ∈ L2[0, 2π]. Definimos su n-simo coefi-ciente de Fourier como

f(n) = 〈f, eınθ

√2π〉 =

1√2π

∫ 2π

0

f(t)e−ıntdt.

Por los resultados anteriores, lo que hemos probado es que

f =1√2π

+∞∑n=−∞

f(n)eınθ,

es decir que toda función f ∈ L2[0, 2π] admite un desarrollo en serie deFourier que converge a f en norma 2. Queda probado como corolariotambién la Identidad de Parseval clásica. La cuestión de la convergenciaen casi todo punto de la serie de Fourier de f a f es más fina y semete más en el Análisis Armónico. Es un resultado profundo que si1 < p ≤ ∞ y f ∈ Lp[0, 2π] entonces el desarrollo en serie de Fourierde f (que existe) converge a f en casi todo punto. Ya hemos visto queexisten funciones f ∈ L1[0, 2π] tal que su desarrollo en serie de Fourieren casi todo punto no converge a f .

Queda también probada como corolario de los resultados anterio-res la versión en L2 del lema de Riemann-Lebesgue: Si f ∈ L2[0, 2π]entonces sus coeficientes de Fourier convergen a 0.

9. ESPACIOS DE HILBERT 199

También como corolario queda probado no sólo que L2[0, 2π] esseparable, sino que la transformada de Fourier define una isometríasobreyectiva entre L2[0, 2π] y `2.

Teorema de Riesz

El Teorema de Representación de Riesz es otro de los resultadosfundamentales de la Teoría de Espacios de Hilbert. Nos dice que losespacios de Hilbert no sólo son reflexivos, sino que de hecho podemosidentificar de manera natural H y H∗. Como forma de fijar la intuiciónaquí, podemos recordar al alumno que ya hemos visto que `∗2 = `2, yacabamos de ver que todo espacio de Hilbert es un `2(I) para algúnconjunto de índices I. Recordemos que hay otro Teorema de Represen-tación de Riesz, con el que no nos debemos confundir, el que representael dual de C[0, 1].

Teorema 9.38 (de Representación de Riesz). Sea H un espacio deHilbert y f ∈ H∗. Entonces existe un único y ∈ H tal que

f(x) = 〈x, y〉

para todo x ∈ H. Además ‖f‖ = ‖y‖. De hecho, si 0 6= z ∈ H es unelemento ortogonal a ker f entonces

y =f(z)z

〈z, z〉.

Demostración. Lo demostraremos utilizando el Teorema de laProyección Ortogonal, siguiendo [31, 24.3] o [13, 3.4]. Existe otra de-mostración posible utilizando bases ortonormales

Si f = 0 entonces y = 0 cumple lo pedido. Sea entonces f 6= 0.Puesto que f es continuo, M := ker f es un subespacio cerrado deH. Al ser f 6= 0, M 6= H y por tanto M⊥ 6= 0. Por tanto, existe0 6= z ∈M⊥. Sea x ∈ H. Por ser M un hiperplano, x se puede escribircomo

x = w + kz,

donde w ∈M y k ∈ K.Entonces

〈x, z〉 = 〈w, z〉+ k〈z, z〉 = k〈z, z〉de forma que

k =〈x, z〉〈z, z〉

200 9. ESPACIOS DE HILBERT

y por tanto

f(x) = f(w) + kf(z) = kf(z) =〈x, z〉〈z, z〉

f(z) =

⟨x,

f(z)

〈z, z〉z

⟩y por tanto

y =f(z)

〈z, z〉z

cumple lo pedido.Para ver la unicidad de y, sea y′ ∈ H otro vector de H tal que

f(x) = 〈x, y′〉.Entonces considerando x = y − y′ tenemos que

〈y − y′, y〉 = f(y − y′) = 〈y − y′, y′〉y por tanto

〈y − y′, y − y′〉 = 0,

es decir, y = y′.

El Teorema de Representación de Riesz nos proporciona de hechouna isometría sobre y conjugada-lineal de H en H∗ y nos permite dotara H∗ de estructura de espacio de Hilbert.

Teorema 9.39. Sea H un espacio de Hilbert y sea θ : H∗ −→ Hla aplicación que a todo f ∈ H∗ le asigna el único yf ∈ H que verificaque

f(x) = 〈x, yf〉para todo x ∈ H. Entonces θ es una isometría sobreyectiva y conjugada-lineal.

Demostración. Dados f, g ∈ H∗, para todo x ∈ H se tiene que

(f + g)(x) = f(x) + g(x) = 〈x, yf〉+ 〈x, yg〉 = 〈x, yf + yg〉y por tanto

θ(f + g) = yf + yg = θ(f) + θ(g).

Análogamente, dados f ∈ H∗ y k ∈ K para todo x ∈ H se tieneque

kf(x) = kf(x) = k〈x, yf〉 = 〈x, kyf〉y por tanto

θ(kf) = kyf = kθ(f).

Por tanto θ es conjugado-lineal. Para ver que es sobre, sea y ∈ H ysea f : H −→ K la función definida como

f(x) = 〈x, y〉

9. ESPACIOS DE HILBERT 201

para todo x ∈ H. Entonces f ∈ H∗ y θ(f) = y. Para ver que es unaisometría,

‖f‖ = supx∈BH

|f(x)| = supx∈BH

|〈yf , x〉| =⟨yf ,

yf‖yf‖

⟩=

=〈yf , yf〉‖yf‖

=‖yf‖2

‖yf‖= ‖yf‖.

Por tanto podemos definir en H∗ un producto escalar simplementetransportando el producto escalar de H de manera que H∗ también esun espacio de Hilbert.

Teorema 9.40. Con la notación del teorema anterior, sean f, g ∈H∗. Definimos

〈f, g〉 = 〈θ(f), θ(g)〉.Entonces así definida, 〈·, ·〉 es un producto escalar en H∗ tal que ‖f‖2 =〈f, f〉 para todo f ∈ H∗ y por tanto H es un espacio de Hilbert.

Demostración. Trivial.

Veamos finalmente que todo espacio de Hilbert es reflexivo.

Corolario 9.41. Todo espacio de Hilbert es reflexivo.

Demostración. Sea J : H −→ H∗∗ la aplicación canónica dadapor

J(x)(f) = f(x).

Sea θ : H∗ −→ H la isometría sobre descrita más arriba y θ′ : H∗∗ −→H∗ la isometría respectiva construida sobre los duales. Tenemos simple-mente que ver que J es sobre. Sea x∗∗ ∈ H. Consideramos el elementox = θ(θ′(x∗∗) ∈ H. Veamos que J(x) = x∗∗. Para todo f ∈ H∗

x∗∗(f) = 〈f, θ′(x∗∗)〉 = 〈θ(θ′(x∗∗), θ(f)〉 = 〈x, θ(f)〉 = f(x) = J(x)(f)

de donde se sigue lo pedido.

Para terminar este capítulo, podemos ver cómo en el caso particularde espacios de Hilbert tanto el Teorema de Hahn-Banach como la con-secuencia del Principio de Acotación Uniforme que dice que débilmenteacotado implica acotado se pueden probar de una manera más sencilla,incluso diciendo más que en al caso general. En el camino estudiaremosla convergencia débil de sucesiones en espacios de Hilbert, uno de losproblemas que justificaron la introducción de estos espacios por Hil-bert. Hemos incluido el resultado de extensión en el cuerpo del textoy los otros resultados en los ejercicios, pero todo ello es susceptible demodificación.

202 9. ESPACIOS DE HILBERT

Teorema 9.42 (Extensión de Hahn-Banach con unicidad). Sea Hun espacio de Hilbert, G ⊂ H un subespacio (no necesariamente cerra-do) y g : G −→ K una forma lineal y continua. Entonces existe unaúnica extensión f : H −→ K de g tal que

f|G = g y ‖f‖ = ‖g‖.

Demostración. SeaM = G. Entonces g se extiende por continui-dad de forma única a una función que seguimos llamando g : M −→ Kque sigue siendo lineal y continua. Esto es un ejercicio. Puesto que Mes un espacio de Hilbert, sabemos que existe yg ∈M tal que, para todox ∈M

g(x) = 〈x, yg〉Sea entonces f : H −→ K el elemento de H∗ dado por

f(x) = 〈x, y − g〉 para todo x ∈ H

Entonces f extiende a g y ‖f‖ = ‖yg‖ = ‖g‖.Para probar la unicidad, sea h ∈ H∗ otra extensión de g con la

misma norma. Sea yh el elemento de H representante de h. Entonces

‖yh‖ = ‖h‖ = ‖g‖ = ‖yg‖

y〈yg, yh〉 = h(yg) = g(yg) = 〈yg, yg〉 = ‖yg‖2

Por lo tanto, la Identidad de Polarización nos dice que

‖yg − yh‖2 = ‖yg‖2 − 2<〈yg, yh〉+ ‖yh‖2 = 2‖yg‖2 − 2<〈yg, yh〉 = 0

y por tanto yg = yh y de ahí f = h.

Aplicaciones.

Teorema Isoperimétrico: Como consecuencia de la Fórmula deParseval para el sistema trigonométrico real se tiene

Teorema 9.43. De todas las curvas simples, cerradas y diferen-ciables a trozos de longitud L en el plano, el círculo es la que encierramayor área.

Una demostración de este resultado se puede ver en [22, p. 178].

Teorema de Müntz: En [22, p. 181] se puede ver una demostra-ción del siguiente hecho

9. ESPACIOS DE HILBERT 203

Teorema 9.44. Sea 1 ≤ n1 < n2 < · · · una sucesión de númerosnaturales y sea A = tn1 , tn2 , . . . ⊂ L2[0, 1]. Entonces span[A] es densoen L2 si y sólo si

∞∑i=1

1

ni=∞.

Prácticas sugeridas.

Ejercicio 9.1. Si queremos enfatizar la relación entre el AnálisisFuncional y la Variable compleja podemos proponer el siguiente ejerci-cio [13, Prop. 1.13, p. 6].

Sea G ⊂ C un abierto y sea L2a(G) el espacio de las funciones

analíticas f : G −→ C tales que∫ ∫G

|f(x+ ıy)|2dxdy <∞

Verificar que es un espacio de Hilbert con el producto escalar hereda-do. La única dificultad reside en verificar que L2

a(G) es un subespaciocerrado de L2(G, µ) donde µ es la medida de Lebesgue en C.

Ejercicio 9.2. Demostrar que la Ley del Paralelogramo caracterizaa los espacios de Hilbert, es decir, probar que si ‖ · ‖ es una norma enun espacio de Banach X que satisface la identidad del paralelogramo,esto es, para todos x, y ∈ X

‖x+ y‖2 + ‖x− y‖2 = 2(‖x‖2 + ‖y‖2

)entonces dicha norma proviene de un producto escalar, y por tanto Xes un espacio de Hilbert. Sugerencia. Definir

〈x, y〉 =1

4(‖x+ y‖2 − ‖x− y‖2 + ı‖x+ ıy‖2 − ı‖x− ıy‖2).

Aún es necesario dar alguna sugerencia más para acabar el ejercicio.

Ejercicio 9.3. Utilizando la Ley del paralelogramo, probar que `po Lp es un espacio de Hilbert si y sólo si p = 2.

Ejercicio 9.4. Sea e1, . . . , en ⊂ H un sistema ortonormal y seaM = span[e1, . . . , en]. Si P : H −→ M es la proyección ortogonalentonces para todo h ∈ H

P (h) =n∑k=1

〈h, ek〉ek.

Ejercicio 9.5. Sea f ∈ L2[0, 1] y sea n ∈ N. Demostrar que exis-te un único polinomio de grado menor o igual que n que es la mejoraproximación polinómica de orden n en el sentido de L2.

204 9. ESPACIOS DE HILBERT

Ejercicio 9.6. Sea H un espacio de Hilbert, sea x1, . . . , xn ⊂ Hun conjunto ortonormal y sea x ∈ H. Demostrar que de todas las sumasde la forma ∑

i

aixi

la distancia‖x−

∑i

aixi‖2

es mínima precisamente cuando los ai son los coeficientes de Fourierde x con respecto a x1, . . . , xn.

Pueden ser ejercicios interesantes (con suficientes sugerencias) com-probar que ciertos resultados profundos y necesitados de herramientamás o menos sofisticada en el contexto de espacios de Banach se puedenprobar de manera elemental, aunque laboriosa, en el contexto de losespacios de Hilbert. En este sentido se pueden proponer.

Ejercicio 9.7. Sea (xn) ⊂ H una sucesión en un espacio de Hil-bert. Entonces xn → x en norma si y sólo si xn → x en la topologíadébil y

lım supn→∞

‖xn‖ ≤ ‖x‖

Ejercicio 9.8. Se puede probar el Teorema de Eberlein para espa-cios de Hilbert: Sea (xn) ⊂ H una sucesión en un espacio de Hilbert.Entonces (xn) tiene una subsucesión débilmente convergente.

Ejercicio 9.9. También se puede probar directamente una de lasconsecuencias del PAU: Sea H un espacio de Hilbert y B ⊂ H. Enton-ces B es acotado si y sólo si B es débilmente acotado, es decir, si paratodo x∗ ∈ H∗, x∗(B) está acotado.

Capítulo 10

Teoría espectral en espacios de Hilbert: Operadorescompactos normales

La Teoría Espectral alcanza su máxima perfección en los operadoresdefinidos en espacios de Hilbert. En particular los operadores norma-les, aquellos que conmutan con su traspuesto, son “diagonalizables” enun sentido amplio gracias al Teorema Espectral. Nosotros no llegamosa desarrollar en este programa el Teorema Espectral para operadoresnormales, ya que eso requiere más tiempo y conocimientos de los quedisponemos en esta asignatura. En cambio, sí desarrollamos en estecapítulo el Teorema Espectral para operadores normales y compactos.En presencia de la compacidad el espectro del operador se reduce auna cantidad a lo sumo numerable de puntos, todos ellos excepto qui-zás el 0 autovalores, y eso permite que lo que en el Teorema Espectralsea una integral respecto de una medida vectorial, la medida espectral,se convierta en una serie mucho más fácil de construir con técnicas“elementales”. Es frecuente en muchos libros de Análisis Funcional co-menzar demostrando el Teorema Espectral para operadores compactosautoadjuntos de una manera razonablemente sencilla y a continuacióndemostrar el Teorema Espectral para operadores compactos normalesusando razonamientos sensiblemente más delicados.

Nosotros hemos preferido seguir [39], con algunas modificaciones,donde el autor demuestra de manera bastante sencilla directamente elresultado para operadores compactos normales, y de ahí es fácil luegoobtener la versión para operadores autoadjuntos como corolario.

Hemos incluido también para terminar el capítulo el Teorema es-pectral para operadores compactos no necesariamente normales, queno es otra cosa que la versión para operadores compactos en espaciosinfinito dimensionales del resultado de álgebra lineal que nos dice quetoda forma bilineal (entre espacios finito dimensionales) admite unarepresentación diagonal como forma bilineal (es decir, permitiendo ele-gir dos bases diferentes, una en cada espacio). La demostración de esteresultado la hemos obtenido de [16].

Antes de obtener los Teoremas Espectrales que forman el puntoprincipal del capítulo necesitamos definir el adjunto de un operador

205

206 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

(y lo relacionamos con el traspuesto que hemos venido utilizando has-ta ahora. También hacemos un estudio de los operadores normales yautoadjuntos, y sus espectros.

Al final del capítulo se puede estudiar como aplicación uno de losproblemas que motivaron el comienzo del desarrollo de la Teoría Es-pectral, los llamados problemas de Sturm-Liouville, aunque su estudiorequiere un cierto tiempo.

Operadores normales y autoadjuntos

Definición 10.1. Sean H,K dos espacios de Hilbert y sea T :H −→ K un operador. Se define su adjunto en el sentido de espacio deHilbert, al que llamaremos T ∗, como el único operador T ∗ : K −→ Hque verifica que para todos x ∈ H, y ∈ K,

〈x, T ∗(y)〉 = 〈T (x), y〉.Es necesario ver que T ∗ está bien definido y es lineal y continuo.

Para ver que está bien definido nótese que, dado y ∈ K, la aplicaciónx∗ : X −→ K dada por

x∗ = 〈T (x), y〉está bien definida, es lineal y continua. Por tanto x∗ ∈ H∗. Por elTeorema de Representación de Riesz sabemos que existe z ∈ H tal quex∗(x) = 〈x, z〉 para todo x ∈ H. Definimos entonces T ∗(y) = z. Ahoraes un ejercicio ver que T ∗ es lineal y continuo y que es único. Tambiénes un ejercicio comprobar que para todos x, y ∈ H se tiene

〈y, T (x)〉 = 〈T ∗(y), x〉.Se puede sugerir como ejercicio clarificar la relación entre este tras-

puesto en el sentido de operador hilbertiano y el traspuesto habitualque habíamos definido anteriormente. No hay más que utilizar el teore-ma de Representación de Riesz y dibujar un diagrama para comprobarque ambos traspuestos son (esencialmente) el mismo.

Ejercicio 10.1. Sean K,H espacios de Hilbert, T : H −→ K unoperador. Sea TB : K∗ −→ H∗ su traspuesto en el sentido de espaciosde Banach y sea T ∗ : K −→ H su adjunto en el sentido de espacios deHilbert. Sean además RH : H −→ H∗ y RK : K −→ K∗ las isometríasdadas por el Teorema de Representación de Riesz. Comprobar que TB RK = RH T ∗.

En todo este capítulo entenderemos por T ∗ el adjunto en el sentidode espacios de Hilbert.

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 207

Además, de ahora en adelante consideraremos exclusivamente ope-radores T : H −→ H.

Ejercicio 10.2. Sea H un espacio de Hilbert, sean S, T ∈ L(H),α ∈ K. Entonces

1. (S + T )∗ = S∗ + T ∗

2. (αT )∗ = αT ∗

3. (ST )∗ = T ∗S∗

4. (T ∗)∗ = T5. T es inversible si y sólo si T ∗ es inversible, y en ese caso

(T ∗)−1 = (T−1)∗

Todo es fácil de probar, y además son esencialmente las mismas cuen-tas que ya hemos hecho para los adjuntos en el sentido anterior. Otraposibilidad es considerar los resultados conocidos para los adjuntos an-teriores y hacer el diagrama conmutativo. Nótese que la aparición delconjugado de α en el punto 2 está relacionada con el hecho de que laisometría que aparece en el Teorema de Representación de Riesz no eslineal sino conjugada-lineal.

Proposición 10.2. Si T ∈ L(H) entonces

‖T ∗‖ = ‖T‖ y ‖T ∗T‖ = ‖TT ∗‖ = (‖T‖)2.

Demostración. Se deja como ejercicio probar que ‖T ∗‖ = ‖T‖.Para todos x, y ∈ H se tiene

‖T (x)‖2 = 〈T (x), T (x)〉 = 〈x, T ∗T (x)〉 ≤ ‖T ∗T‖‖x‖2.

Tomando supremos en x ∈ BH se tiene

‖T‖2 ≤ ‖T ∗T‖.

Como además‖T ∗T‖ ≤ ‖T ∗‖‖T‖ = ‖T‖2

se tiene la igualdad ‖T‖2 = ‖T ∗T‖. La otra igualdad se prueba análo-gamente.

Veamos algunos ejemplos de operadores adjuntos.

Ejemplo 10.3. Si Tk : L2[0, 1] −→ L2[0, 1] un operador integral deFredholm con núcleo k(·, ·) : [0, 1] × [0, 1] −→ K como en el Ejemplo7.11. Entonces (Tk)

∗ es un operador integral de Fredholm con núcleok∗(x, y) = k(y, x). De nuevo nótese la necesidad de tomar el conjugadocomplejo.

208 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Ejemplo 10.4. Si S : `2 −→ `2 es el desplazamiento a la derechadado por

S(x1, x2, . . .) = (0, x1, x2, . . .)

entonces S∗ es el desplazamiento a la izquierda dado por

S∗(x1, x2, . . .) = (x2, x3, . . .)

Ejercicio 10.3. Si T ∈ L(H) entonces

ker(T ) = (Im(T ∗))⊥ y ker(T ∗) = (Im(T ))⊥

donde M⊥ es el ortogonal de M en el sentido hilbertiano.

En general la composición de operadores no es conmutativa. Vea-mos que los operadores con cierto grado de conmutatividad van a serprecisamente aquellos para los que podemos dar una descomposiciónespectral.

Definición 10.5. Sea T ∈ L(H). Entonces1. T se dice normal si T ∗T = TT ∗.2. T se dice unitario si T ∗T = TT ∗ = I, es decir, si T ∗ = T−1

3. T se dice autoadjunto si T ∗ = T .

Claramente los operadores autoadjuntos o unitarios son normales.En cambio un operador normal no tiene por qué ser unitario ni auto-adjunto. Por ejemplo, sea H = C2 y sea

T (x) = (x1 − x2, x1 + x2)

EntoncesT ∗(x) = (x1 + x2,−x1 + x2)

y es un ejercicio ver que T no es unitario ni autoadjunto.

Observación 10.6. Si T es normal y S es tal que S∗S = I (paraesto S no tiene por qué ser necesariamente unitario, piénsese en eloperador desplazamiento a la derecha del Ejemplo 10.4) entonces U =STS∗ es normal. En efecto, en ese caso U∗ = ST ∗S∗ y por tanto

UU∗ = STS∗ST ∗S∗ = STT ∗S∗ = ST ∗TS∗ = ST ∗S∗STS∗ = U∗U.

Proposición 10.7. Sea T ∈ L(H). Entonces1. T es normal si y sólo si para todos x, y ∈ H

〈T (x), T (y)〉 = 〈T ∗(x), T ∗(y)〉2. T es unitario si y sólo si para todos x, y ∈ H

〈T (x), T (y)〉 = 〈x, y〉 = 〈T ∗(x), T ∗(y)〉

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 209

3. T es autoadjunto si y sólo si para todos x, y ∈ H

〈T (x), y〉 = 〈x, T (y)〉

Demostración. Si T es normal entonces para todos x, y ∈ H

〈T (x), T (y)〉 = 〈x, T ∗T (y)〉 = 〈x, TT ∗(y)〉 = 〈T ∗(x), T ∗(y)〉

Recíprocamente, si para todos x, y ∈ H

〈T (x), T (y)〉 = 〈T ∗(x), T ∗(y)〉

entonces

〈x, T ∗T (y)〉 = 〈T (x), T (y)〉 = 〈T ∗(x), T ∗(y)〉 = 〈x, TT ∗(y)〉

de donde se sigue que TT ∗(y) = T ∗T (y) para todo y ∈ H, es decirT es normal. Los otros dos apartados se prueban análogamente y lademostración se deja como ejercicio.

Ejemplo 10.8. Sea H = L2[0, 1], sea f ∈ L∞[0, 1] y sea

T : L2[0, 1] −→ L2[0, 1]

el operador definido como

T (g) = fg.

T está bien definido y es lineal y continuo, ya que para todo g ∈ H

‖T (g)‖2 =

(∫ 1

0

|fg|2) 1

2

≤ ‖f‖∞‖g‖2.

Además para todos g, h ∈ H

〈g, T ∗(h)〉 = 〈T (g), h〉 =

∫ 1

0

fgh =

∫ 1

0

g(fh) = 〈g, fh〉,

y por lo tantoT ∗(g) = fg para todo g ∈ H.

EntoncesT ∗T (g) = |f |2g = TT ∗(g)

y por tanto T es normal. En cierto sentido, todo operador normal esasí (factorizándolo vía una isometría adecuada), aunque esto no esnada obvio y es una consecuencia (o más bien una reformulación) delTeorema Espectral. El lector interesado en este resultado y en generalen el Teorema Espectral debería consultar [25].

210 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Sea H un espacio de Hilbert separable. Ya hemos visto que en esecaso H es (isométrico a ) `2. Como consecuencia de los resultados queprobamos en el capítulo anterior referidos a bases hilbertianas, quedaclaro que todo operador T : `2 −→ `2 queda completamente determina-do si conocemos la matriz doblemente infinita A = (ai,j)i,j∈N definidacomo

ai,j = 〈T (ej), ei〉ya que en ese caso sabemos que para todo x ∈ `2

T (x) =∞∑i=1

(∞∑j=1

ai,jxj

)ei.

Análogamente a lo visto en el Ejercicio 5.1 se puede probar confacilidad que el operador T ∗ lleva asociado la matriz A

t, la matrizconjugada y traspuesta de A de manera que para todo x ∈ `2

T ∗(x) =∞∑i=1

(∞∑j=1

aj,ixj

)ei.

(De nuevo la razón de que aparezca el conjugado complejo es que esta-mos considerando el adjunto hilbertiano de T ).

Entonces resulta claro que T es autoadjunto si y sólo si A = At, es

decir, si A es conjugada-simétrica.Además T ∗T viene representado por

AtA =

∑n

kn,ikn,j

y TT ∗ viene representado por

AAt

=∑n

ki,nkj,n.

Así pues T es unitario si y sólo si AtA = AAt

= I, es decir, si

(24)∑n

kn,ikn,j =∑n

ki,nkj,n = δi,j.

Nótese que, en ese caso, si consideramos el vector ki ∈ `2 definidocomo ki(n) = kn,i entonces (24) nos dice que

〈ki, kj〉 = δi,j,

es decir, T es unitario si y sólo si las columnas (y análogamente lasfilas) de la matriz A forman una base ortonormal de `2.

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 211

Veremos más adelante que si T es compacto, entonces T es normal siy sólo si A es diagonalizable. De momento, observando que T es normalsi y sólo si AtA = AA

t, queda claro que si A es diagonal entonces T esnormal.

Veamos ahora algunas caracterizaciones de los operadores normales,unitarios y autoadjuntos que nos serán útiles más adelante.

Proposición 10.9. Sea H un espacio de Hilbert complejo y seaT ∈ L(H). Entonces T es autoadjunto si y sólo si 〈T (x), x〉 ∈ R paratodo x ∈ H.

Demostración. Si T = T ∗ entonces, para todo x ∈ H,

〈T (x), x〉 = 〈x, T ∗(x)〉) = 〈x, T (x)〉 = 〈T (x), x〉y por tanto 〈T (x), x〉 ∈ R.

Recíprocamente, supongamos que 〈T (x), x〉 ∈ R para todo x ∈ H.Entonces para todo α ∈ C y para todos x, y ∈ H se tiene

〈T (x+ αy), x+ αy〉 = 〈T (x), x〉+ α〈T (x), y〉+

+α〈T (y), x〉+ |α|2〈T (y), y〉 ∈ RPor lo tanto, como 〈T (x), x〉 ∈ R y |α|2〈T (y), y〉 ∈ R, se sigue que

α〈T (x), y〉+ α〈T (y), x〉 ∈ R,es decir

α〈T (x), y〉+ α〈T (y), x〉 = α〈T (x), y〉+ α〈T (y), x〉 =

= α〈y, T (x)〉+ α〈x, T (y)〉 = α〈T ∗(x), y〉+ α〈T ∗(y), x〉.Puesto que esto es cierto para todo α ∈ C, se sigue con facilidad (porejemplo tomando α = 1 y α = ı y operando) que para todo x, y ∈ H

〈T (x), y〉 = 〈T ∗(x), y〉,de donde T = T ∗.

Observación 10.10. Obviamente el resultado anterior es falso siH es un espacio de Hilbert real, ya que en ese caso 〈T (x), y〉 ∈ R paratodos x, y ∈ H y obviamente hay operadores no autoadjuntos (consi-dérese cualquier matriz cuadrada no simétrica de por ejemplo orden2).

Proposición 10.11. Sea T ∈ L(H). Si T es autoadjunto entonces

‖T‖ = supx∈BH

|〈T (x), x〉|.

212 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Demostración. Sea M = supx∈BH |〈T (x), x〉|. Claramente M ≤‖T‖. Para la otra desigualdad observemos que para todos x, y ∈ H setiene

〈T (x+ y), x+ y〉 − 〈T (x− y), x− y〉 = 2〈T (x), y〉+ 2〈T (y), x〉 =

= 2〈T (x), y〉+ 2〈y, T ∗(x)〉 = 2〈T (x), y〉+ 2〈y, T (x)〉 =

= 2〈T (x), y〉+ 2〈T (x), y〉 = 4<〈T (x), y〉.Por lo tanto

4<〈T (x), y〉 = 〈T (x+ y), x+ y〉 − 〈T (x− y), x− y〉 ≤≤M(‖x+ y‖2 − ‖x− y‖2) = 2M(‖x‖2 + ‖y‖2),

donde en la última igualdad hemos usado la Ley del Paralelogramo.Por tanto, si ‖x‖ = ‖y‖ = 1 tenemos

4<〈T (x), y〉 ≤ 4M.

Finalmente, si 〈T (x), y〉 = |〈T (x), y〉|eıθ, sustituyendo x por xe−ıθobtenemos que para todo x, y ∈ H

|〈T (x), y〉| ≤M

de donde ‖T‖ ≤M.

Nótese que, en particular, si T es autoadjunto y 〈T (x), x〉 = 0 paratodo x ∈ H entonces T = 0.

Proposición 10.12. Sea T ∈ L(H). Entonces T es normal si ysólo si para todo x ∈ H

‖T (x)‖ = ‖T ∗(x)‖.Además en ese caso

‖T 2‖ = ‖T ∗T‖ = ‖T‖2

Demostración. Si x ∈ H, se tiene

‖T (x)‖2 − ‖T ∗(x)‖2 = 〈T (x), T (x)〉 − 〈T ∗(x), T ∗(x)〉 =

= 〈T ∗T (x), x〉 − 〈TT ∗(x), x〉 = 〈(T ∗T − TT ∗)(x), x〉.Como S = T ∗T − TT ∗ es autoadjunto (esto se ve muy fácil), de laProposición 10.11 nos dice que S = 0 si y sólo si

〈S(x), x〉 = 0 para todo x ∈ H,es decir, si y sólo si

〈(T ∗T − TT ∗)(x), x〉 = ‖T (x)‖2 − ‖T ∗(x)‖2 = 0 para todo x ∈ H,es decir si y sólo si

‖T (x)‖ = ‖T ∗(x)‖ para todo x ∈ H.

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 213

Además en ese caso

‖T 2(x)‖ = ‖T (T (x))‖ = ‖T ∗(T (x))‖ para todo x ∈ Hy por tanto

‖T 2‖ = ‖T ∗T‖ = ‖T‖2,donde la segunda igualdad se sigue de 10.2

Proposición 10.13. Sea T ∈ L(H). Entonces T es unitario si ysólo si T es sobre y ‖T (x)‖ = ‖x‖ para todo x ∈ H. Además en esecaso ‖T−1(x)‖ = ‖x‖ para todo x ∈ H y

‖T‖ = ‖T−1‖ = 1.

Demostración. Para todo x ∈ H se tiene

‖T (x)‖2 − ‖x‖2 = 〈T (x), T (x)〉 − 〈x, x〉 =

= 〈T ∗T (x), x〉 − 〈x, x〉 = 〈(T ∗T − I)(x), x〉.Como S = T ∗T − I es autoadjunto se tiene que S = 0 si y sólo si

‖T (x)‖ = ‖x‖ para todo x ∈ H.Por tanto, si ‖T (x)‖ = ‖x‖ para todo x ∈ H y T es sobreyectiva,

entonces T ∗T = I y T es biyectivo, de forma que

TT ∗ = (TT ∗)(TT−1) = T (T ∗T )T−1 = TT−1 = I

y por tanto T es unitario.

Recíprocamente, si T es unitario entonces T ∗T = I y T−1 = T ∗ deforma que ‖T (x)‖ = ‖x‖ para todo x ∈ H y T es sobreyectiva.

En ese caso además

‖T−1(x)‖ = ‖T ∗(x)‖ = ‖x‖y tomando supremos en x ∈ BH se tiene

‖T‖ = ‖T−1‖ = 1.

Como quizás ya se haya podido apreciar en este momento puedehaber una cierta analogía entre los operadores en L(H) y los númeroscomplejos, donde el conjugado de un complejo se asocia al adjunto deun operador. En esta analogía los operadores autoadjuntos se corres-ponderían con los números reales (coinciden con su conjugado). Esomotiva el siguiente

214 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Teorema 10.14. Sea H un espacio de Hilbert complejo y T ∈L(H). Entonces existen dos únicos operadores autoadjuntos R, S ∈L(H) tales que

T = R + ıS.

Además T es normal si y sólo si RS = SR, T es unitario si y sólo siRS = SR y R2 + S2 = I y T es autoadjunto si y sólo si S = 0.

También tendremos ocasión de usar más adelante que T es compac-to si y sólo si R y S son compactos.

Demostración. Sean

R =T + T ∗

2y S =

T − T ∗

2ı.

Es fácil ver que R y S son autoadjuntos y T = R + ıS.Si T = R′ + ıS ′ con R′ y S ′ autoadjuntos, entonces

T ∗ = (R′ + ıS ′)∗ = R′∗ − ıS ′∗ = R′ − ıS ′

y por tanto

R′ =T + T ∗

2= R y S ′ =

T − T ∗

2ı= S.

El resto de la demostración se deja como ejercicio.

Con estos conocimientos previos acerca de operadores autoadjun-tos y normales a nuestra disposición, podemos desarrollar la TeoríaEspectral de operadores normales compactos.

Lema 10.15. Sea H un espacio de Hilbert complejo y sea T ∈ L(H).Entonces λ ∈ σ(T ) si y sólo si λ ∈ σ(T ∗).

Si además T es normal, entonces para todo λ ∈ C se tiene que

ker(T − λI) = ker(T − λI)∗ = ker(T ∗ − λI)

Demostración. La Proposición 8.3 nos dice que un operador esinversible si y sólo si su adjunto lo es. Por lo tanto T −λI es inversiblesi y sólo si (T − λI)∗ = T ∗− λI es inversible. A partir de ahí el primerenunciado se sigue inmediatamente.

Supongamos ahora que T es normal. Entonces es fácil ver que T−λItambién es normal. Por lo tanto, la Proposición 10.12 nos dice que paratodo x ∈ H

‖(T − λI)(x)‖ = ‖(T − λI)∗(x)‖,y de ahí se sigue que ker(T − λI) = ker(T − λI)∗

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 215

Teorema 10.16. Sea H un espacio de Hilbert y sea 0 6= T ∈ L(H)un operador compacto y autoadjunto. Entonces al menos uno de losnúmeros ‖T‖ o −‖T‖ es un autovalor de T .

Demostración. Sea T como en la hipótesis. De la Proposición10.11 se sigue que existe una sucesión (xn) ⊂ BH tal que

|〈T (xn), xn〉| → ‖T‖.

Puesto que 〈T (x), x〉 ∈ R para todo x ∈ H, tomando una subsucesión sifuera necesario podemos suponer que 〈T (xn), xn〉 → λ, donde λ = ‖T‖o λ = −‖T‖. Como |λ| = ‖T‖, se tiene

0 ≤ ‖(T − λI)(xn)‖2 = ‖T (xn)‖2 − 2λ〈T (xn), xn〉+ λ2‖xn‖2 ≤

≤ ‖T‖2‖xn‖2 + λ2‖xn‖2 − 2λ〈T (xn), xn〉 ≤

≤ 2λ2 − 2λ〈T (xn), xn〉 → 0

de donde se obtiene que ‖(T − λI)(xn)‖ → 0.

Como además T es compacto, existe una subsucesión (xnk)k ⊂ (xn)y un elemento y ∈ H tales que T (xnk)→ y, y por tanto, como T (xnk)−λxnk → 0, se sigue que xnk →

yλy

T (y) = λy

lo que termina la demostración.

Vamos a ver ahora que, usando el resultado anterior, podemos deciralgo similar de los operadores compactos normales.

Teorema 10.17. Sea H un espacio de Hilbert complejo y sea 0 6=T ∈ L(H) un operador normal y compacto. Entonces T admite al me-nos un autovalor distinto de 0.

Demostración. Sea T = R + ıS con R, S compactos y autoad-juntos y SR = RS (véase el Teorema 10.14). Supongamos inicialmenteque R 6= 0. Entonces, el Teorema 10.16 nos dice que R tiene al me-nos un autovalor α 6= 0. Sea M = ker(R − αI). El subespacio M esinvariante por S ya que para todo x ∈ M , puesto que SR = RS, setiene

RS(x) = SR(x) = S(αx) = αS(x)

luego S(x) ∈ ker(R− αI) = M.Entonces S|M : M −→ M es un operador compacto y autoadjunto

del espacio de Hilbert M en sí mismo. Aplicando de nuevo el Teorema

216 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

10.16 tenemos que existe β ∈ σe(S|M ). Sea ahora 0 6= x ∈ M tal queS(x) = βx. Entonces

T (x) = (R + ıS)(x) = (α + ıβ)(x)

luego α + ıβ ∈ σe(T )

Finalmente, si R = 0, entonces S 6= 0 y por tanto el Teorema 10.16nos dice que S tiene un autovalor β 6= 0. Entonces ıβ es autovalor deT = ıS.

Ya vimos en la Proposición 8.19 que si T es compacto entonces paratodo λ ∈ K existe n0 ∈ N tal que para todo n ≥ n0

ker(T − λI)n = ker(T − λI)n0 .

Dado un autovalor λ definimos entonces su índice ν(λ) como elprimer n0 ∈ N para el que ocurre eso, es decir ν(λ) es el único naturaltal que

ker(T − λI)n ( ker(T − λI)n+1 para todo 0 ≤ n < ν(λ)

yker(T − λI)n = ker(T − λI)n+1 para todo n ≥ ν(λ)

Proposición 10.18. Si T ∈ L(H) es normal entonces para todoλ ∈ σe(T ) se tiene que ν(λ) = 1.

Demostración. Sea λ ∈ σe(T ) y sea x ∈ ker(T − λI)2. Sólo hayque ver que x ∈ ker(T − λI).

Puesto que T − λI es normal, aplicando la Proposición 10.12 setiene que

‖(T ∗ − λI)(T − λI)(x)‖ = ‖(T − λI)(T − λI)(x)‖ = 0.

Por lo tanto

‖(T − λI)(x)‖2 = 〈(T − λI)(x), (T − λI)(x)〉 =

= 〈(T ∗ − λI)(T − λI)(x), x〉 = 0

lo que implica que x ∈ ker(T − λI) y termina la demostración.

Definición 10.19. Sea T ∈ L(H) un operador normal. Dado λ ∈σe(T ) definimos su multiplicidad como la dimensión de ker(T − λI).

Observación 10.20. En realidad se define la multiplicidad alge-braica como dim ker(T − λI)ν(λ) y la multiplicidad geométrica comodim ker(T −λI). En el caso de que T sea normal (el único que estudia-remos en esta memoria), la Proposición 10.18 nos garantiza que ambosnúmeros coinciden, y los denominamos multiplicidad simplemente.

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 217

Proposición 10.21. Si T ∈ L(H) es normal y λ, µ ∈ σe(T ) en-tonces

ker(T − λI)⊥ ker(T − µI)

Demostración. En efecto, para todos x ∈ ker(T − λI), y ∈ker(T − µI), usando que λ ∈ σe(T ∗) (Lema 10.15), se tiene

λ〈y, x〉 = 〈y, λx〉 = 〈y, T ∗(x)〉 = 〈T (y), x〉 = 〈µy, x〉 = µ〈y, x〉.Puesto que λ 6= µ, se sigue que 〈y, x〉 = 0.

Necesitamos un lema más antes de enunciar y demostrar el TeoremaEspectral para operadores compactos normales.

Lema 10.22. SeaM ⊂ H un subespacio cerrado y sea P : H −→Mla proyección ortogonal. Entonces P ∗ = P

Demostración. Para todo x ∈ H, P (x) y x − P (x) son ortogo-nales, es decir

〈P (x), x− P (x)〉 = 0

y por tanto〈P (x), x〉 = 〈P (x), P (x)〉 = ‖P (x)‖2.

Ahora la Proposición 10.9 nos garantiza que P es autoadjunto.

Teoremas Espectrales para Operadores Compactos

Teorema 10.23. (Teorema espectral para operadores compactosnormales) Sea H un espacio de Hilbert complejo y T ∈ L(H) un opera-dor compacto normal. Sea (λn)n ⊂ C la sucesión (finita o infinita) deautovalores, ordenados por módulos decrecientes y contado cada uno deellos tantas veces como su multiplicidad. Entonces existe una sucesión(en)n ⊂ H con tantos elementos como la sucesión (λn)n, de maneraque para cada n se tiene que T (en) = λnen, es decir, en es un autovalorde λn. Además la sucesión (en)n es un sistema ortonormal y se verificaque para todo x ∈ H

(25) T (x) =∑n

λn〈x, en〉en

Demostración. Sea H y T como en la hipótesis. Por el Teorema10.17 sabemos que σe(T ) 6= ∅, y por el Teorema 8.22 sabemos queσe(T ) es a lo sumo numerable. Sea (µn)n la sucesión (finita o infinita)de autovalores. De nuevo por el Teorema 8.22 sabemos que si (µn) es

218 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

infinita entonces µn → 0. Por tanto, siempre tiene podemos elegir lasucesión (µn) ordenada de tal forma que

|µ1| ≥ |µ2| ≥ |µ3| ≥ · · · ,

bien entendido que esta ordenación no tiene por qué ser única ya quepueden existir autovalores distintos con el mismo módulo. Para todo n,seam(n) la multiplicidad (algebraica o geométrica) de µn. Sea entonces(λn) la sucesión (finita o infinita) formada por m(1) copias de µ1, acontinuación m(2) copias de µ2, etc. Está claro que (λn) es infinita si ysólo si (µn) es infinita, y que en ese caso también λn → 0. Para todo nsea N(n) = ker(T − µnI). Por definición de multiplicidad dimN(n) =m(n). Para cada n, sea

en,1, en,2, . . . , en,m(n) ⊂ H

una base ortonormal de N(n). Sea entonces (en) ⊂ H la sucesión (finitao infinita) formada por

(e1,1, e1,2, . . . , e1,m(1), e2,1, e2,2, . . . , e2,m(2), · · ·

Por la construcción de (en) y (λn) queda claro que para todo n

T (en) = λnen.

Además, puesto que para todo j 6= i se tiene que N(j)⊥N(i) (Propo-sición 10.21) se sigue que la familia (en) es ortonormal.

Consideramos ahora el operador T0 : H −→ H dado por

T0(x) =∑n

λn〈x, en〉en para todo x ∈ H.

Aserto: T0 está bien definido y es continuo.

Demostración del Aserto: Para todo x ∈ H, utilizando la desigual-dad de Bessel se tiene∑

n

|〈λn〈x, en〉|2 ≤ |λ1|2∑n

|〈x, en〉|2 ≤≤ |λ1|‖x‖2,

y por el Teorema de Riesz-Fischer se sigue el Aserto.

De hecho se sigue de la implicación fácil del Teorema 10.24, quepodríamos haber probado previamente, que T0 es compacto y normal,aunque no lo necesitamos.

Veamos que T = T0.

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 219

Sea M = span[(en)], el subespacio vectorial cerrado generado porlos (en). Por el Teorema de la Proyección Ortogonal, M está comple-mentado en H. Sea P : H −→ M la proyección ortogonal de H sobreM . Es claro que para todo n

T0(en) = λnen = T (en).

Por tanto, por linealidad y continuidad se sigue que T|M = T0|M , esdecir

T0P = TP

Además, usando que P ∗ = P (Lema 10.22), se tiene que para todox ∈ H

T0(x) =∑n

λn〈x, en〉en =∑n

λn〈x, P (en)〉en =

=∑n

λn〈P (x), en〉en = T0P (x).

Por lo tanto T0 = T0P y de ahí TP = T0.Además, como PT (x) ∈ M para todo x ∈ H y como (en) es una

base ortonormal de M (entendiéndola como base hilbertiana si es unacolección infinita), se tiene

PT (x) =∑n

〈PT (x), en〉en =∑n

〈x, T ∗P (en)〉en.

Además, por el Lema 10.15 se tiene que

T ∗P (en) = T ∗(en) = λnen

y por tanto

PT (x) =∑n

λn〈x, en〉en = T0(x)

Así pues TP = PT = T0 y, tomando adjuntos,

PT ∗ = T ∗P.

Por lo tanto, dos cualesquiera de T , T ∗ y P conmutan entre si y deaquí se deduce fácilmente que T − T0 = T − TP es normal.

Finalmente, supongamos que T 6= T0. Como T − T0 es normal,compacto y distinto de 0, el Teorema 10.17 nos dice que T − T0 tieneal menos un autovalor µ 6= 0. Sea 0 6= e ∈ H un autovector de µ.

Como (T − T0)(en) = 0 para todo n y (T − T0)e = µe, se tiene quee⊥en para todo n. En efecto,

µ〈en, e〉 = 〈en, µe〉 = 〈en, (T − T0)∗e〉 = 〈(T − T0)en, e〉 = 〈0, e〉 = 0

220 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Por lo tanto,T0(e) =

∑n

λn〈e, en〉en = 0

y de ahíT (e) = (T − T0)e = µe.

De forma que µ es un autovalor de T . Puesto que la sucesión λn estabaformada por todos los los autovalores µn (contados con su multiplici-dad), se tiene que µ = µj para algún j, y por tanto e ∈ N(j). Peroentonces es imposible que e sea distinto de 0 y simultáneamente seaortogonal a todos los elementos de una base ortogonal de N(j).

De esta contradicción se sigue que T = T0

En el caso especial de operadores compactos autoadjuntos, el Teo-rema anterior queda igual, con la salvedad de que ahora todos los au-tovalores (µn) (y por tanto también los (λn)) son reales.

Es fácil ver, y se puede proponer como ejercicio, que el Teorema10.23 (y su correspondiente versión para operadores compactos au-toadjuntos) son caracterizaciones, de manera que dado un operadorT : H −→ H, T es compacto y normal si y sólo si T se puede escribiren la forma 25, y T es compacto y autoadjunto si y sólo si T se puedeescribir en la forma 25, con (λn) ⊂ R.

Veamos para acabar este capítulo qué se puede decir si T es unoperador compacto, no necesariamente normal. Sugerimos para ello lademostración de [16]. Se puede dar otra demostración, como en [39],utilizando el Teorema 10.23 y la descomposición polar de un operador.

Teorema 10.24. Sea H un espacio de Hilbert. Entonces un ope-rador T ∈ L(H) es compacto si y sólo si existen sucesiones (finitaso infinitas) (λn) ⊂ C, (en) ⊂ H y (fn) ⊂ H con el mismo númerode índices tales que λn → 0 si es infinita y (en) y (fn) son familiasortonormales de forma que T se puede escribir en la forma

(26) T (x) =∑n

λn〈x, en〉fn

Aplicaciones

Una aplicación clásica de la Teoría espectral de operadores compac-tos en espacios de Hilbert es la resolución de los llamados Problemasde Sturm-Liouville. En los libros de nuestra bibliografía, se pueden ver

10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT 221

presentaciones de esta aplicación en [31, Apendix C] o en [13, SectionII.6].

Prácticas sugeridas.

Ejercicio 10.4. 1. Si S, T son autoadjuntos entonces S + Tes autoadjunto. Además ST es autoadjunto si y sólo si S y Tconmutan.

2. Si S, T son unitarios entonces ST es unitario. Buscar algunacondición necesaria y suficiente sobre S y T para que S+T seaunitario.

3. Si S y T son normales y además S conmuta con T ∗ y T conmutacon S∗ entonces S + T y ST son normales.

Ejercicio 10.5. Si (Tn) ⊂ L(H) es una sucesión de operadoresautoadjuntos (resp. unitarios, normales) tal que Tn → T entonces T esautoadjunto (resp. unitario, normal). Sugerencia: Si Tn → T entoncesT ∗n → T ∗.

Ejercicio 10.6 (Operador de Volterra). Sea k : [0, 1]× [0, 1] −→ Rla función característica del conjunto (x, y) ∈ [0, 1]×[0, 1] tales que y <x. Sea V : L2 −→ L2 el operador integral dado por

V (f)(s) =

∫ 1

0

f(t)k(s, t)dt.

Nótese que V (f)(s) =∫ s0f(t)dt. Se pide

1. Calcular V ∗2. Demostrar que V no tiene autovalores.3. Demostrar que V es compacto.

Ejercicio 10.7. Si S : `2 −→ `2 calcular S∗, SS∗ y S∗S. Ademásdemostrar

1. σe(S∗) = z ∈ C; |z| < 12. σe(S) = ∅3. σ(S) = σ(S∗) = z ∈ C; |z| ≤ 1

Ejercicio 10.8. Sea D : `2 −→ `2 el operador diagonal dado por

D(a) = (dnan)n

con dn = 2−n, y sea S : `2 −→ `2 el desplazamiento a la derecha. SeaT = SD. Demostrar que T es compacto, σe(T ) = ∅ y σ(T ) = 0.

Ejercicio 10.9 (Teorema de Hellinger-Töplitz). Sea H un espa-cio de Hilbert y sea T : H −→ H un operador lineal y autoadjunto.Entonces T es continuo.

222 10. TEORíA ESPECTRAL EN ESPACIOS DE HILBERT

Ejercicio 10.10. Sea H un espacio de Hilbert complejo y sea T ∈L(H) un operador compacto normal no nulo. Entonces existe λ ∈ σe(T )tal que |λ| = ‖T‖.

Bibliografía

[1] C. D. Aliprantis and K. C. Border, Infinite Dimensional Analysis. A Hitch-hiker guide, Springer 1999.

[2] T. M. Apostol, Análisis Matemático Reverté 1991.[3] K. Arrow and G. Debreu, Existence of an equilibrium for a competitive eco-

nomy, Econometrica 22 (1954), 265–290.[4] P. Artzner, F. Delbaen, J.M. Eber, D. Heath, Coherent measures of risk,

Math. Finance 9 (1999), 203–228.[5] G. Bachman y L. Narichi, Functional Analysis, Academic Press, 1966.[6] S. Banach, Sur les opérations dans les ensembles abstraits et leurs applications

aux équations intégrales, Fundamenta Math., 3 (1922) 131-181.[7] S. Banach, Theorie des opérations linéaires, Warszawa, 1932.[8] B. Beauzamy, Introduction to Banach spaces and their geometry, North-

Holland, 1985.[9] F. Black and M. Scholes, The valuation of option contracts and a test of

market efficiency, J. Finance 27 (1972), 399–417.[10] F. Black and M. Scholes, The pricing of options and corporate liability, J.

Political Economy, 81 (1973), 637–659.[11] F. Bombal, Análisis Funcional: una perspectiva histórica, Proceedings of the

Seminar of Mathematical Analysis 2002-2003, Secretariado de Publicaciones,Universidad de Sevilla (2993) 81–117.

[12] G. Choquet, Cours d’Analyse. Tome II. Topologie., Masson et Cie, Paris,1964.

[13] J. B. Conway, A Course in Functional Analysis Springer 1990.[14] F. Delbaen y W. Schachermayer, The fundamental theorem of asset pricing

for unbounded stochastic processes, Math. Ann. 312 (1998) 215–250.[15] J. Diestel, Sequences and series in Banach Spaces, Springer-Verlag 1984.[16] J. Diestel, H. Jarchow and A. Tonge, Absolutely Summing Operators, Cam-

bridge Stud. Adv. Math. 43, Cambridge Univ. Press, Cambridge 1995.[17] D. Duffie, Security Markets. Stochastic models Academic Press 1988.[18] P. Enflo, On the invariant subspace problem for Banach spaces, Acta Math

158 (1987) 213–313.[19] P. Enflo, A counterexample to the Approximation problem for Banach spaces,

Acta Math 130 (1973) 309–317.[20] P. Enflo y V. Lomonosov, Some aspects of the invariant subspace problem.

Handbook of the geometry of Banach spaces, Vol. I, 533–559, North-Holland,Amsterdam, 2001.

[21] M. Fabian, P. Habala, P. Hajek, V. Montesinos Santalucia, J. Pelant, V. Zizler,Functional Analysis and infinite dimensional geometry, Springer, 2001.

223

224 Bibliografía

[22] C. Goffman and G. Pedrick, First Course in Functional Analysis, Prentice-Hall 1965.

[23] A. Grothendieck, Résumé de la théorie métrique des produits tensoriels to-pologiques, Bol. Soc. Mat. São Paulo 8 (1953) 1–79.

[24] P. Habala, P. Hajek, V. Zizler, Introduction to Banach Spaces I, MatfyzpressUniverzity Karlovy, Prague, 1996.

[25] P. R. Halmos, What does the spectral theorem say?, Amer. Math. Monthly70 (1963) 241–247.

[26] J. Horvath, Topological Vector Spaces and Distributions, Addison-Wesley Pu-blishing Company 1966.

[27] R. C. James, A non-reflexive Banach space isometric with its second conjugatespace, Proc. Nat. Acad. Sci. USA, 37 (1951) 174–177.

[28] P. E. Kopp, Martingales and stochastic integrals, Cambridge University Press1984.

[29] S. Lang, Real and Functional Analysis, Springer-Verlag 1993.[30] R. Larsen, Functional Analysis: An Introduction, Marcel Dekker, New York

1973.[31] B. V. Limaye, Functional Analysis, Wiley Eastern Ltd., 1981.[32] J. Lindenstrauss y L. Tzafriri, On the complemented subspace problem, Israel

J. Math 9 (1971) 263–269.[33] R. Meise y D. Vogt, Introduction to Functional Analysis, Oxford Science Pu-

blications, 1997.[34] R. Merton, The theory of rational option pricing, Bell. J. Econ. Manage. Sci.,

4 (1973), 141–183.[35] J. Neveu, Discrete parameter martingales, North-Holland 1975.[36] R. I. Ovsepian y A. Pełczyński, On the existence of a fundamental total and

bounded biorthogonal sequence in every separable Banach space, and relatedconstructions of uniformly bounded orthonormal systems in L2, Studia Math.54 (1975), no. 2, 149–159.

[37] G. K. Pedersen, Analysis Now, Springer-Verlag 1989.[38] A. M. Plichko y D. Yost, Complemented and uncomplemented subspaces of

Banach spaces. III Congress on Banach Spaces (Jarandilla de la Vera, 1998).Extracta Math. 15 (2000), 335–371.

[39] J. R. Ringrose, Compact Non-Self-Adjoint Operators Van Nostrand ReinholdCompany, London, 1971.

[40] W. Rudin, Principios de Análisis Matemático, McGraw-Hill 1978.[41] W. Rudin, Functional Analysis, McGraw-Hill 1973.[42] W. Rudin, Real and Complex Analysis, McGraw-Hill 1966.[43] W. Shachermayer, A Hilbert space proof of the fundamental theorem of asset

pricing in finite discrete time, Insurance Math. Econ. 11 (1992) 249–257.[44] H. H. Schaefer, Topological Vector Spaces, Springer-Verlag 1971.