Documente Academic
Documente Profesional
Documente Cultură
Questa breve monografia si propone di presentare in modo piano e sintetico, ma con dimo-
strazioni rigorose e generalmente complete, i principali temi e metodi dell’Analisi funzionale. Si
è cercato di selezionare e proporre percorsi che siano quanto piú possibile “naturali”, partendo
da nozioni elementari e procedendo verso argomenti classici piú avanzati, quali i teoremi fon-
damentali dell’Analisi funzionale, le topologie deboli e deboli*, gli operatori duali e il teorema
dell’immagine chiusa, le questioni di compattezza e compattezza sequenziale. Si sono voluti
inserire brevemente temi non frequenti in monografie di questo tipo, quali risultati di punto
fisso (Brouwer, Schuauder) e di punti di equilibrio (Nash, Ky Fan, Aubin), teoria dei giochi o
gamma-convergenza (DeGiorgi), accanto a temi tradizionali quali elementi di teoria spettrale,
problemi ellittici in dimensione 1, serie di Fourier e risultati fondamentali sulle funzioni continue
(Baire, Stone-Weierstrass). Spesso si è avuto cura di presentare significativi controesempi per
illuminare a fondo i concetti essenziali.
Il testo che presentiamo nasce da una lunga riflessione sui principi fondamentali, riduzione
all’essenziale, rielaborazione, completamento ed estensione di parte degli appunti di un corso
di Istituzioni di Analisi superiore tenuto per molti anni per il Corso di laurea in Matematica
della Facoltà di Scienze M.F.N. dell’Università di Torino. Ha tuttavia l’ambizione di non essere
semplicemente un’opera didattica, ma di fornire un supporto direttamente utile per l’attivià di
ricerca, anzi di sollecitare interrogativi sui fondamenti che potrebbero suggeririre nuove indagini.
Il corso di Istituzioni di Analisi superiore del vecchio ordinamento era diviso in due moduli.
Il primo modulo, rivolto a tutti gli studenti del secondo biennio, oltre a primi elementi di ana-
lisi funzionale e di teoria delle funzioni olomorfe, proponeva le basi della teoria della misura e
dell’integrazione e svolgeva inoltre essenzialmente il contenuto dei Capitoli 1 e 3 e presentando
una sintesi dei risultati dei Capitoli 4 e 5 di questo testo. Il materiale degli altri capitoli era
utilizzato, parzialmente, nel secondo modulo, che aveva un carattere più avanzato e presentava,
oltre a complementi di teoria della misura, temi concernenti i fondamenti dell’analisi funzionale,
alcuni metodi di compattezza, elementi di teoria spettrale e di analisi armonica.
Con il nuovo ordinamento, la teoria delle funzioni olomorfe e i primi elementi di analisi funziona-
le sono presentati in Analisi IV (laurea triennale e laurea specialistica), mentre le questioni piú
avanzate di analisi funzionale e di teoria generale della misura e dell’integrazione sono trattate
nel corso di Istituzioni di Analisi (laurea specialistica). Molti temi presenti in questa monografia
potrebbero essere utili per un corso base di Analisi per il Dottorato.
1 Spazi normati 5
1.1 Spazi metrici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Spazi normati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Seminorme e spazi localmente convessi . . . . . . . . . . . . . . . . . . . . 12
1.4 Insiemi ordinati e spazi di Riesz . . . . . . . . . . . . . . . . . . . . . . . . 14
3
5.5 L’ideale degli operatori compatti. . . . . . . . . . . . . . . . . . . . . . . . . 86
5.6 Compattezza di operatori integrali. . . . . . . . . . . . . . . . . . . . . . . 87
5.7 Problemi ellittici in dimensione 1. Minorazione degli autovalori . . . . 92
5.8 La funzione di Green e l’equazione integrale equivalente. . . . . . . . . 94
5.9 Autovalori ed autofunzioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Bibliografia 147
Capitolo 1
Spazi normati
d : S × S → R+
si dice distanza in S se e solo se, per elementi arbitrari x, y, z ∈ S, sono soddisfatte le seguenti
tre proprietà:
1) d(x, y) = 0 ⇔ x = y ,
2) d(x, y) = d(y, x) (simmetria),
3) d(x, y) ≤ d(x, z) + d(z, y) (disuguaglianza triangolare).
(S, d), cioè S munito della particolare metrica d, si dice spazio metrico.
È noto ed è immediato verificare che in ogni spazio metrico tutte le successioni {xn }n∈N
convergenti, cioè tali che, detto l il loro limite, si abbia
Definizione. Se in (S, d) tutte le successioni di Cauchy sono convergenti si dice che (S, d)
è uno spazio metrico completo .
5
6 Capitolo 1. Spazi normati
* * *
Lo spazio Lp (Ω) delle (classi di) funzioni reali definite q.o. nell’aperto Ω di Rn e di potenza
p-esima (p ≥ 1) integrabile rispetto alla misura di Lebesgue è uno spazio metrico completo
rispetto alla distanza
d(u, v) = ( |u(x) − v(x)|p dx)1/p .
Ω
Se si considerassero soltanto funzioni integrabili nel senso di Cauchy-Riemann non si otterrebbe
uno spazio completo.
Un sottoinsieme chiuso C di S, dove (S, d) è completo, munito delle metrica indotta che
indicheremo ancora con d, dà luogo ad uno spazio metrico completo (C, d).
p=3
y S2
2
S1
0 1 2 3 4
x
Poniamo
ap−1 ap/q bq−1
x= = , dunque = x−q/p ,
b b a
x x−q/p
f (x) = 1 − − .
p q
Risulta
1 1 q 1
f (1) = 0 , f (x) = − + x−q/p−1 , f (1) = 0 , f (x) = (− − 1) x−q/p−2 ≤ 0 .
p p p p
Dunque f (x) è concava, assume il valore massimo 0 per x = 1 e per ogni x positivo si ha
f (x) ≤ 0, q.e.d.
n
n
n
|xi yi | ≤ ( |xi |p )1/p ( |yi |q )1/q ,
i=1 i=1 i=1
|ui |p |vi |q
|ui ||vi | ≤ +
p q
Possiamo ora controllare che ·p è una norma. Mentre le prime due proprietà caratteristiche
delle norme sono evidenti, la verifica della disuguaglianza triangolare (detta in questo caso
anche disuguaglianza di Minkowski) si può ottenere ricorrendo alla disuguaglianza di Hölder.
Supporremo p > 1 ; in caso contrario il risultato è immediato. Supporremo inoltre x + y = 0 .
n
n
n
|xk + yk |p ≤ |xk + yk |p−1 |xk | + |xk + yk |p−1 |yk | ≤
k=1 k=1 k=1
n
n
n
≤( |xk + yk |q(p−1) )1/q (( |xk |p )1/p + ( |yk |p )1/p ) .
k=1 k=1 k=1
n
n
n
( |xk + yk |p )1−1/q ≤ ( |xk |p )1/p + ( |yk |p )1/p ) . q.e.d.
k=1 k=1 k=1
lim xp = x∞ ,
p→+∞
infatti, per x = 0
|xk |
xp = ( |xk |p )1/p = x∞ ( ( )p )1/p ,
x∞
k k
|xk | p
1≤ ( ) ≤n
x∞
k
e
lim 11/p = lim n1/p = 1 .
p→+∞ p→+∞
Anche negli spazi Lp (Ω) (e più generalmente negli spazi Lp (X, A, µ) ) valgono le disugua-
glianze di Hölder e di Minkowski:
|f (x)g(x)|dx ≤ ( |f (x)| ) ( |g(x)|q )1/q ,
p 1/p
Ω Ω Ω
( |f (x) + g(x)|p )1/p ≤ ( |f (x)|p )1/p + ( |g(x)|p )1/p .
Ω Ω Ω
Le dimostrazioni sono analoghe, sostituendo integrali a somme e facendo riferimento alla di-
suguaglianza di Young. In questi casi sarebbe però necessario controllare, come si può fare
agevolmente, che f ∈ Lp , g ∈ Lq implica f g ∈ L1 e che f, g ∈ Lp implica f + g ∈ Lp , ovvero
che esistono gli integrali che appaiono nelle formule precedenti.
risulta
ψ (x) = p(1 + x)p−1 − 2p−1 pxp−1
che si annulla soltanto per x = 1 . Inoltre
Anche (C(K), · ∞ ), spazio delle funzioni continue (ad esempio a valori complessi) sul
compatto K , munito della norma
f ∞ = max |f (t)| ,
t∈K
è uno spazio di Banach. Infatti si verifica subito che f ∞ è una norma e vale il seguente
Dimostrazione. Sia {fn } una successione di Cauchy in C(K). Allora per ogni t ∈ K {fn (t)}
è una successione di Cauchy in C , che è completo. Dunque fn (t) converge ad un limite in C
dipendente da t, che indicheremo con f (t).
Inoltre, la convergenza delle fn ad f non è soltanto puntuale, ma anche uniforme, in quanto,
per ogni ε, per n sufficientemente grande si ha per ogni t:
|fn (t) − f (t)| = lim |fn (t) − fn+q (t)| ≤ ε ,
q→+∞
perchè
fn − fn+q ∞ ≤ ε ,
essendo fn di Cauchy per · ∞ .
La funzione f ∈ C(K) : infatti, fissato s, per ogni ε esiste un indice N ed esiste un intorno
VN (s) tali che
|f (t) − f (s)| ≤ |f (t) − fN (t)| +|fN (t) − fN (s)| +|fN (s) − f (s)|
≤ε ≤ε ≤ε
∀t ∈ K ∀t ∈ VN (s) ∀s ∈ K .
Allora la convergenza uniforme delle fn ad f si esprime scrivendo
lim fn − f ∞ = 0 q.e.d.
n→+∞
Si dice che due norme · a e · b in uno spazio vettoriale V sono equivalenti se e solo se
esistono due costanti c, C tali che
∀x ∈ V cxa ≤ xb ≤ Cxa .
C = maxk ek , si ha
∀x x = xk ek ≤ |xk |ek ≤ Cx1 .
k k
| x − y | ≤ x − y ≤ Cx − y1 .
a) ∀x ∈ X p(x) ≥ 0,
b) ∀x, y ∈ X p(x + y) ≤ p(x) + p(y),
c) ∀x ∈ X ∀λ ∈ K p(λx) = |λ|p(x).
Ovviamente segue da c) che p(0) = 0. Ma può essere p(x) = 0 anche se x = 0. Una norma è
una seminorma per la quale p(x) = 0 ⇒ x = 0.
Definizione. Sia X uno spazio vettoriale su R o su C e sia S = {pa (x); a ∈ A} una famiglia
di seminorme in X soddisfacenti l’assioma di separazione:
∀x ∈ X ∃a ∈ A pa (x) = 0 .
V = x0 + U ,
dove
U = { x ∈ X | paj (x) ≤ εj , j = 1, 2, ...n} ,
con n intero arbitrario, aj , indici arbitrari e εj , numeri positivi arbitrari.
Gli insiemi U sono ovviamente un sistema fondamentale di intorni di 0 e generano per traslazione
un sistema fondamentale di intorni di ogni altro punto.
La dizione “localmente convesso è dovuta al fatto che gli insiemi U sono convessi, e dunque ogni
punto ammette un sistema fondamentale di intorni convessi, come risulta dalla proposizione
seguente.
Proposizione. Sia p(x) una seminorma su X . Allora, per ogni c > 0 , l’insieme W = { x ∈
X | p(x) ≤ c } ha le proprietà seguenti:
1) 0∈W ;
2) W è convesso : λ ∈ [0, 1] e x, y ∈ W implicano (1 − λ)x + λy ∈ W ;
3) W è equilibrato : |λ| ≤ 1 e x ∈ W implicano λx ∈ W ;
4) W è assorbente : per ogni x ∈ X , esiste ρ > 0 tale che x ∈ ρW ;
5) la seminorma p è univocamente individuata da W , mediante la formula
p(x) = inf ρc .
ρ>0,x∈ρW
La dimostrazione comporta soltanto verifiche immediate. Per il punto 5) basta osservare che
p(x) ≤ ρc equivale a p(x/ρ) ≤ c, cioè x/ρ ∈ W ovvero x ∈ ρW . Si controlla anche che, se W
è un qualunque sottoinsieme di X convesso, equilibrato ed assorbente, la formula del punto 5)
definisce una seminorma in X. Come vedremo nel capitolo 2, p è il funzionale di Minkowski
del convesso assorbente W ; essendo W equilibrato il funzionale di Minkowski di W soddisfa la
condizione p(λx) = |λ|p(x).
Esempio 1. Sia Ω un aperto del piano complesso. In C(Ω), spazio delle funzioni contine in
Ω a valori complessi, la topologia della convergenza uniforme sui compatti è localmente covessa
ed è definita dalla famiglia di seminorme
{ pK (f ) = max |f (x)| } , K ⊂ Ω ,
x∈K
K1 ⊂ K2 ⊂ ... , ∪j Kj = Ω
* * *
Esempio 2. Sia E uno spazio di Banach ed E ∗ il suo duale topologico. La convergenza debole
in E è indotta da una topologia debole, più debole della topologia iniziale indotta dalla norma.
Tale topologia debole è localmente convesse e generata, per esempio, dalle seminorme
f ≤g ↔ ∀x ∈ K f (x) ≤ g(x)
x+ = x ∨ 0 , x− = −(x ∧ 0) , |x| = x+ + x−
e quindi ogni elemento x si può presentare come differenza di due elementi positivi, essendo
canonica la presentazione:
x = x+ − x− , x+ ≥ 0 , x− ≥ 0 .
Per un primo approfondimento si può vedere Bourbaki[3].
∃!z ∈ S z = Az .
Si osservi che A è una applicazione uniformemente continua, in quanto Lipschitziana (con co-
stante di Lipschitz L < 1 ).
Osservazione. Si potrebbero dire contrazioni le applicazioni A per le quali d(Ax, Ay) ≤ d(x, y)
e contrazioni strette quelle per le quali d(Ax, Ay) < d(x, y). Per queste tuttavia l’esistenza di
un punto fisso non è garantita.
che risulta palesemente assurdo. Per quanto concerne l’esistenza si può utilizzare il metodo
“costruttivo delle approssimazioni successive :
dato x0 ∈ S arbitrario
sia xn+1 = Axn , n ≥ 1 .
17
18 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max
Allora:
a) xn è una successione di Cauchy in quanto
n+p−1
n+p−1
d(xn+p , xn ) ≤ d(xk+1 , xk ) = d(Axk , Axk−1 ) =
k=n k=n
n+p−1
n+p−1
p−1
Ln
= d(Ak x1 , Ak x0 ) ≤ Lk d(x1 , x0 ) = Ln d(x1 , x0 ) Li ≤ d(x1 , x0 ) ,
i=0
1−L
k=n k=n
lim xn = z ;
n→+∞
maggiorazioni dell’errore
Ln
d(xn , z) = lim d(xn , xn+p ) ≤ d(x1 , x0 ) ,
p→+∞ 1−L
p−1
d(xn , z) = lim d(xn , xn+p ) ≤ lim sup d(xn+i , xn+i+1 ) ≤
p p
i=0
p−1
L
≤ lim sup d(xn−1 , xn ) Li+1 ≤ d(xn−1 , xn ) .
p
i=0
1−L
La prima di queste permette, noti x0 e L , di progettare a priori un numero di passi n sufficiente
(ma in genere non necessario) per ottenere con certezza un’approssimazione con una tolleranza
ε prescritta: si determina x1 , poi si calcola d(x1 , x0 ) e infine si prende
(1 − L)ε
n > ln / ln L .
d(x1 , x0 )
La seconda disuguaglianza permette di controllare il processo di approssimazione in corso d’ope-
ra. Calcolando ad ogni passo d(xk , xk−1 ) , se questo valore risulta inferiore a ε(1 − L)/L allora
xk approssima z con un errore inferiore alla tolleranza ε prescritta. Può succedere che k sia
inferiore al valore n fornito dalla prima maggiorazione.
Il teorema del punto fisso ammette una semplice generalizzazione al caso di un’applicazione
una cui iterata sia una contrazione. Scriveremo come al solito An = A ◦ A ◦ ... ◦ A per indicare
perché il metodo delle approssimazioni successive per B fornisce il punto fisso z, indipendente-
mente dal dato iniziale.
Talvolta si deve considerare una famiglia di problemi di punto fisso, dipendenti da un pa-
rametro t . Se t ∈ T , dove T è uno spazio topologico, è interessante studiare l’eventuale
dipendenza continua del punto fisso dal parametro. A tal fine si ha il seguente
Teorema. Sia (S, d) uno spazio metrico completo e T uno spazio topologico. Sia
f : S × T → S tale che
1) ∀x ∈ S t
→ f (x, t) è continua da T → S ,
2) Esiste L < 1 tale che
∀t ∈ T d(f (x, t), f (y, t)) ≤ Ld(x, y) ,
cioè esiste una costante di Lipschitz L < 1 indipendente da t .
Allora, se x(t) = f (x(t), t) è l’unico punto fisso della contrazione f (·, t) , l’applicazione t
→ x(t)
è continua da T → S.
Dimostrazione. Fissato s ∈ T :
≤ d(f (x(t), t), f (x(s), t)) + d(f (x(s), t), f (x(s), s)) ≤
≤ Ld(x(t), x(s)) + ε ,
cioè (1 − L)d(x(t), x(s)) ≤ ε, se t ∈ V (s) , con V (s) intorno sufficientemente piccolo di s
(dipendente dal valore arbitrario ε > 0). q.e.d.
A = ∩S∈A S
∀x ∈ A a ≤ x .
Per vedere che A è totalmente ordinato basta vedere che per ogni coppia di elementi z, x ∈ A si
ha z ≤ x ∨ z ≥ f (x), perché allora o z ≤ x o z ≥ x, perché z ≥ f (x) ≥ x. Fissato allora x ∈ A,
consideriamo l’insieme
B(x) = {z ∈ A|z ≤ x ∨ z ≥ f (x)}
e ci proponiamo di controllare che B(x) = A. Essendo B(x) ⊆ A e A è minimale, basta
dimostrare che B(x) è ammissibile:
1) a ≤ x e dunque a ∈ B(x);
2) f (z) ∈ A e:
se z ≥ f (x) allora f (z) ≥ z ≥ f (x) e dunque f (z) ∈ B,
se z = x, ovviamente f (z) ≥ f (x) e f (z) ∈ B,
se z < x implicasse f (z) ≤ x, allora avremmo f (z) ∈ B.
Dunque, almeno per le
x ∈ C = {x ∈ A | ∀y ∈ A y < x ⇒ f (y) ≤ x} ,
risulta f (B(x)) ⊆ B;
3) indipendentemente dall’essere x ∈ C, se T è un sottoinsieme totalmente ordinato di B(x),
sup T ∈ A e:
o per ogni t ∈ T si ha t ≤ x, allora sup T ≤ x e sup T ∈ B(x),
∀t ∈ T y ≤ t ∨ y ≥ f (t) ≥ t ,
perché ogni t ∈ C e dunque B(t) = A. Allora esiste un t ∈ T tale che non vale y ≥ f (t)
(altrimenti per tutti i t ∈ T si avrebbe y ≥ t e allora y ≥ τ ), cioè tale che y ≤ t; ma se y < t si
ha f (y) ≤ t ≤ τ (t ∈ C), se invece y = t, non essendo y = τ , esiste un s ∈ T ⊆ C tale che y < s
e pertanto f (y) ≤ s ≤ τ ; in ogni caso
A y < τ ⇒ f (y) ≤ τ ,
cioè τ ∈ C.
Dunque C ⊆ A è ammissibile ed essendo A minimale C = A. q.e.d.
Dal teorema precedente si possono dedurre quasi immediatamente, con l’ausilio dell’Assioma
della Scelta , i teoremi di Hausdorff e di Zorn.
Teorema (Lemma di Zorn). Ogni insieme parzialmente ordinato (I, ≤) per il quale esista
un maggiorante in I di ogni catena (cioè di ogni suo sottoinsieme totalmente ordinato) ammette
almeno un elemento massimale.
Dimostrazione. Sia C una catena massimale di I, la cui esistenza è assicurata dal Teorema di
Hausdorff, e sia x un suo maggiorante. L’elemento x è massimale. Infatti, se y ∈ C si ha y ≤ x,
/ C, allora l’insieme C ∗ = C ∪ {y} è una catena tale che C < C ∗ e C non può
e se x ≤ y con y ∈
essere massimale. q.e.d.
Sia V uno spazio vettoriale reale (cioè su R). Un sottoinsieme C di V si dice convesso se e
solo se
∀x, y ∈ V ∀λ ∈ [0, 1] (1 − λ)x + λy ∈ C .
3) Sia V uno spazio normato, allora per ogni x ∈ V ed r > 0 si ha Br (x) ∈ CO.
4) Si indica con co(A), detto inviluppo convesso di A, il più piccolo insieme convesso contenente
A ⊆ V , dunque
co(A) = ∩A⊆C∈CO C .
Allora risulta
p
p
+
co(A) = { λk xk | p ∈ N , xk ∈ A, λk ≥ 0, λk = 1 } .
k=1 k=1
m
m
||w − z|| = || µj (xj − z)|| ≤ µj ||xj − z|| ≤ d .
j=1 j=1
Per quanto visto al punto 4) precedente, il simplesso generato dai punti x0 ...xn è l’insieme delle
combinazioni convesse di tali punti:
n
n
S = S(x0 , x1 ...xn ) = { λ k xk | λ ≥ 0 e λk = 1 } .
k=0 k=0
Ogni x ∈ S si scrive in modo unico come combinazione convessa delle xk (per l’indipendenza
delle xk − x0 ) e i coefficienti λk (x) si dicono le sue coordinate baricentriche. I punti xk sono
i vertici del simplesso.
Con λk = 1/(n + 1) per ogni k si ottiene il baricentro di S: bn = k xk /(n + 1).
Il diametro di S = S(x0 , x1 ...xn ) è, per quanto visto al punto 6), uguale al maxi,j ||xj − xi ||.
cioè tale che se z appartiene ad una faccia k-dimensionale del simplesso iniziale S allora la sua
etichetta ν(z) appartiene all’insieme degli indici dei vertici della faccia.
Definita l’etichetta ν(Si ) di un simplesso della suddivisione come
Se una faccia segnata non è contenuta in S(x0 , x1 , ...xn−1 ), essa è comune a due divesi simplessi
Sk della suddivisione e quindi contribuisce con 2 unità ad N . Se N è il numero di tali facce,
N = N − 2N è il numero di facce segnate contenute in S(x0 , x1 , ...xn−1 ), che è dispari per
ipotesi induttiva. Dunque N e di conseguenza N ∗ sono dispari. q.e.d.
Teorema di Brouwer per i simplessi (o teorema di Bohl). Sia Sia S = S(x0 , x1 , ...xn )
un simplesso n-dimensionale ed f : S → S una funzione continua. Allora esisite almeno un
punto fisso z di f : z ∈ S e z = f (z).
Dimostrazione. Siano λ(x) = (λ0 (x), λ1 (x), ...λn (x)) le coordinate baricentriche di x ∈ S:
n
x= λk (x)xk , λk (x) ≥ 0 , λk (x) = 1 ,
k=0 k
essendo unica tale rappresentazione di x come combinazione convessa delle xk . Viceversa dato
µ = (µ0 , µ1 , ...µn ), con µk ≥ 0 e k µk = 1 esiste un unico elemento x(µ) ∈ S con coordinate
baricentriche µ.
Le funzioni λ(·) e x(·) sono continue e ciascuna è l’inversa dell’altra. (La continuità di x(·) è
evidente. Inoltre i vettori xj − x0 formano una base per ipotesi, quindi è univocamente indi-
viduata la basen duale: fk ∈ V e fk (xj − x0 ) = δkj ; dunque λk (x) = fk (x − x0 ) per k ≥ 1 e
λ0 (x) = 1 − k=1 λk (x)).
Le funzioni fj (µ) = λj (f (x(µ)), che rappresentano la trasformazione f in coordinate baricentri-
che, sono allora continue.
Poniamo
Fj = { x ∈ S | λj (x) ≥ fj (λ(x))} .
Essi sono ovviamente insiemi chiusi e soddisfano le ipotesi del teorema KKM: infatti se fosse
allora si avrebbe λji (x) < fji (λ(x)) per i = 0, 1, ..k, e dunque
n
k
k
n
1= λl (x) = λji (x) < fji (λ(x)) ≤ fl (λ(x)) = 1 ,
l=0 i=0 i=0 l=0
n
n
λj (z) ≥ fj (λ(z)) , j = 0, 1, ...n , 1 = λj (z) ≥ fj (λ(z)) = 1 .
j j
Per dimostrare che un simplesso è omeomorfo ad una sfera di ugual dimensione, conviene far
uso del funzionale di Minkowski di un corpo convesso, del quale si è già fatto cenno nel Capitolo
1, quando si è introdotto il concetto di seminorma. Premettiamo allora qualche definizione.
L’insieme dei punti di C che hanno questa proprietà si chiama il nucleo del convesso e si indica
con J(C).
In dimensione n finita se x ∈ J(C) allora x è un punto interno a C. Infatti, se {ek } è una base
ortonormale, poniamo θ = mink min(tek , t−ek ). Allora
θ
{x + v | v ∈ V | ||v||∞ ≤ } ⊆ x + co({θek , −θek }k ) = {y | ||y − x||1 ≤ θ} ⊆ C .
n
Definizione. sia V uno spazio lineare su R. Una funzione p(x) definita su V a valori reali
si dice convessa e positivamente omogenea, se e solo se
1) p(x) ≥ 0 ∀x ∈ V ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = λp(x) ∀(x, λ) ∈ V × R+ .
(Più in generale si potrebbero considerare funzioni a valori reali estesi, ottenendo nella Propo-
sizione successiva risultati meno precisi.)
Proposizione. Sia p(x) una funzione convessa e positivamente omogenea su V . Allora, per
ogni c > 0 , l’insieme C = { x ∈ V | p(x) ≤ c } ha le proprietà seguenti:
1) 0 ∈ C ;
2) C è convesso ;
3) l’insieme { x ∈ V | p(x) < c } coincide con J(C);
4) C è assorbente : per ogni x ∈ V , esiste ρ > 0 tale che x ∈ ρC ;
5) la funzione p è univocamente individuata da C , mediante la formula
p(x) = inf ρc .
ρ>0,x∈ρC
6) vale la disuguaglianza
Dimostrazione.
1) per t > 0 si ha p(tx) = tp(x), perché tx ∈ ρC equivale a x ∈ ρ/tC;
2) sia p(xk ) < ρk < p(xk ) + ε, k = 1, 2, dunque xk /ρk ∈ C, e poniamo ρ = ρ1 + ρ2 , allora
x1 + x 2 ρ 1 x1 ρ 2 x2
= + ∈C .
ρ ρ ρ1 ρ ρ2
Pertanto p(x1 + x2 ) ≤ ρ < p(x1 ) + p(x2 ) + 2ε. Per l’arbitrarietà di ε > 0 si conclude la dimo-
strazione.
Teorema. Ogni (corpo) convesso chiuso, limitato e con interno non vuoto C in uno spazio
normato reale V è omeomorfo alla sfera unitaria chiusa B = B1∗ (0) = {x | ||x|| ≤ 1}.
Dimostrazione. Non è restrittivo supporre 0 ∈ J(C), B ⊆ C e C ⊆ BR , dove BR è la sfera
chiusa di centro l’origine e raggio R. Sia p = pC il funzionale di Minkowski di C, per ogni x ∈ V
non nullo si ha
x x
∈ C ⇒ p( ) ≤ 1 ⇒ p(x) ≤ ||x|| ,
||x|| ||x||
dunque anche |p(x) − p(y)| ≤ ||x − y|| e p è continua. Inoltre C = {x | p(x) ≤ 1}: infatti per
l’Osservazione relativa alla proposizione precedente basta controllare che p(x) = 1 = infx∈ρC ρ ←
x ∈ C; ma poiché esiste ρn → 1 tale che x/ρn ∈ C e x/ρn → x, la chiusura di C garantisce il
controllo. Infine
Rx 1
p( ) ≥ 1 ⇒ ||x|| ≤ p(x) .
||x|| R
Definiamo ora la trasformazione T mediante le formule
p(x)
T (0) = 0 e T (x) = x per x = 0 .
||x||
e quindi
||x|| ||y||2 ||y||
x= y= y , cioè T −1 (y) = y.
p(x) p(y)||y|| p(y)
T e T −1 sono continue: ovviamente, per x e y diversi da 0, vista la continuità di p. Inoltre
È molto interessante un risultato enunciato già da Poincaré nel 1883, solo con un rapido
cenno ad un possibile percorso di dimostrazione, che generalizza il noto ed elementare teorema
di esistenza degli zeri delle funzioni continue e risulta equivalente al teorema di Brouwer.
Teorema (di Poincarè-Miranda). Siano F1 , F2 ...Fn n funzioni delle variabili reali x1 , x2 ...xn
continue nell’ipercubo Q = [−L, L]n , tali che, per ogni j sulle facce Q±
j = {xj = ±L} valgano
le disuguaglianze
Fj (x1 ...xj−1 , −L, xj+1 ...xn ≥ 0 ∧ Fj (x1 ...xj−1 , +L, xj+1 ...xn ≤ 0 .
A+ − − + ±
j = {x ∈ Q | Fj > 0} ⊃ Qj , Aj = {x ∈ Q | Fj < 0} ⊃ Qj . Siano d le distanze (positive)
di A± ±
j da Qj , mj e Mj il minimo (negativo) e il massimo (positivo) di Fj in Q, e
d− d+
0 < εj < min( , ).
−mj Mj
Posto
f = (f1 , f2 ...fn ) , fj (x) = xj + εj Fj (x) ,
si controlla facilmente che f : Q → Q, cioè |fj | ≤ L per ogni j:
se Fj (x) ≤ 0 ⇒ fj (x) ≤ xj ≤ L,
se invece x ∈ A+ + +
j , cioè Fj (x) > 0 ⇒ xj ≤ L − d ⇒ fj (x) < xj + d Fj (x)/Mj ≤ L;
e in modo analogo si vede che fj (x) ≥ −L.
Allora il sistema di equazioni equivale al problema di punto fisso x = f (x), che ammette almeno
una soluzione grazie al teorema di Brouwer, essendo Q un corpo convesso compatto.
2) Se non si può garantire che sulle facce Q± j valgano ovunque le disuguaglianze strette, si
ricorre ad un metodo di approssimazione. Per ogni intero p le disuguaglianze strette valgono
per le Fjp = Fj − xj /p e quindi esiste xp ∈ Q tale che Fjp (xp ) = 0, j = 1, ...n. Sia xq una
sottosuccessione convergente a x ∈ Q, allora:
xq
0 = Fj (xq ) − → Fj (x) = 0
q
Una importante estensione del teorema di Brouwer a spazi di Banach di dimensione infinita
è il seguente
Un’ulteriore estensione di questo risultato a spazi più generali, e precisamente agli spazi lo-
calmente convessi è nota come Teorema di Tychonov.
Dimostrazione che questo teorema implica il teorema di Schauder nella versione iniziale. Sia
C compatto, T continua e L un sottoinsieme di C. Allora L è necessariamente limitato, L è
compatto e T (L) è relativamente compatto in quanto sottoinsieme di T (L), che è compatto.
Dunque T è compatta e ammette un punto fisso. q.e.d.
Prima di dimostrare il teorema sui punti fissi di operatori compatti, ricordiamo alcuni risul-
tati sulla compattezza negli spazi metrici e poi dimostriamo un risultato di approssimazione
di operatori compatti mediante operatori con immagine in dimensione finita.
(Si dice che R è un ε-reticolo finito per K). Si vede facilmente che non è restrittivo supporre
R ⊆ K.
∀f ∈ C ||T (f ) − Tε (f )|| ≤ ε .
Dimostrazione. Poiché coT (C) ⊆ C è compatto, sia R = {g1 , g2 ...gq } un suo ε-reticolo finito,
che non è restrittivo supporre ⊂ coT (C). Introduciamo poi il corrispondente proiettore di
Se ora si pone Tε = Pε ◦ T , si ha
Dimostrazione del Teorema di Schauder (nella seconda versione). Sia ε una successione
convergente a 0 e Tε l’approsimazione di T sopra definita. Tε (C) ⊆ Sε ⊆ C. Ma, essendo Sε un
compatto e convesso nel sottospazio di dimensione finita Mε e
Θε = Tε |sε : Sε → Sε ,
continua, per il Teorema di Brouwer, esiste un punto fisso fε = Θε fε ∈ coT (C). Per la
compattezza di questo insieme esiste una sottosuccessione fa convergente ad un limite f . Allora
Definizione. Siano f1 , f2 , ...fn n funzioni reali di n variabili x1 , x2 ...xn , che variano rispet-
tivamente negli insiemi A1 , A2 , ...An . Dunque
fk : A1 × A2 ... × An → R , k = 1, 2...n .
∀k ∈ {1, 2...n} fk (c1 , ...ck−1 , ck , ck+1 , ...cn ) = max fk (c1 , ...ck−1 , xk , ck+1 , ...cn ) .
xk ∈Ak
Consideriamo qualche proprietà immediata dei punti sella di una funzione f (x, y) delle va-
riabili x ∈ A e y ∈ B.
Ripetiamo che, se f : A × B → R, (x∗ , y ∗ ) è punto sella se e solo se
Dimostrazione.
∀x ∈ A ∀y ∈ B inf f (x, y) ≤ f (x, y) ,
y∈B
dunque
∀y ∈ B sup inf f (x, y) ≤ sup f (x, y) .
x∈A y∈B x∈A
Basta allora applicare l’operatore inf y∈B ad entrambi i membri per ottenere il risultato. q.e.d.
Dimostrazione.
i) Supponiamo che valga l’uguaglianza e sia V il valore comune dei due membri. Sia x∗ un punto
di massimo e y ∗ un punto di minimo:
V = max inf f (x, y) = inf f (x∗ , y) ≤ f (x∗ , y ∗ ) ≤ sup f (x, y ∗ ) = min sup f (x, y) = V ,
x y y x y x
allora
V = inf f (x∗ , y) = f (x∗ , y ∗ ) = sup f (x, y ∗ ) ,
y x
∗ ∗ ∗
cioè f (x, y∗) ≤ f (x , y ) ≤ f (x , y), per x ed y arbitrari.
quindi
inf sup f (x, y) ≤ f (x∗ , y ∗ ) ≤ sup inf f (x, y) .
y∈B x∈A x∈A y∈B
∗ ∗
(Si osservi che con x o y fissati si ha inf = min o sup = max, ma per altri valori x o y min o
max potrebbero non esistere.)
Tenendo conto del lemma precedente si trova il risultato. q.e.d.
∀y V ≤ f (x1 , y) ∧ ∀x f (x, y2 ) ≤ V ,
Teorema di Nash (1950). Siano g1 , g2 ...gn funzioni reali multilineari delle variabili
s1 , s2 ...sn definite in Σ = Σ1 × Σ2 ...Σn , dove ciascun Σk è un simplesso νk dimensionale. Allora
esiste almeno un punto di equilibrio di Nash per le gk :
Dimostrazione. Siano σkα , α = 1, 2...µk = νk + 1 i vertici del simplesso Σk e pkα = pkα (sk )
le coordinate baricentriche di sk :
µk
µk
sk = σkα pkα , pkα ≥ 0 , pkα = 1 .
α=1 α=1
Sia pk (sk ) il vettore di componenti pkα (sk ), α = 1, ...µk e p(s) = (p1 (s1 )...pn (sn )), cioè p(s)k =
pk (sk ).
Per la linearità di gk (s) in sk ed essendo sk combinazione convessa delle σkα , si ha
Dunque s è punto di equilibrio se e solo se, posto gkα (s) = gk (< s; σkα ; k >), risulta
(In ogni caso gk (s) è combinazione convessa delle gkα (s), dunque si ha sempre gk (s) ≤ maxα gkα (s).)
Osserviamo che, dicendo che sk dipende da σkα se e solo se pkα > 0, s è punto di equilibrio
se e solo se, per ogni k, vale l’implicazione
Per quanto visto sopra, l’essere s punto di equilibrio di Nash si può esprimere con le equazioni
∀k ∀α ϕkα (s) = 0 .
L’applicazione T è continua e Σ è un corpo convesso in dimensione k νk , e quindi, per il teo-
rema di Brouwer, T ammette almeno un punto fisso.
Verifichiamo che s (o p(s)) è un punto fisso di T se e solo se è un punto di equilibrio di Nash
per le gk .
µk
pkα ≥ 0 , pkα = 1 , gk (s) = gkα (s)pkα ,
α=1 α
Il Teorema precedente è stato dimostrato da Nash[16] nell’ambito del suo studio sui giochi
non-cooperativi, dove ci si muove nell’ambito della formulazione matematica della teoria dei
Per l’indipendenza, la probabilità di un sistema assegnato di strategie pure è data dalla formula
P (s1 = σ1α , s2 = σ2β ...) = P (s1 = σ1α )P (s2 = σ1β )... = p1α p2β ... = p(s)(σ) ,
se σ = (σ1α σ2β ...) e s = (s1 , s2 ...).
Le variabili aleatorie Vk (s) = Vk (s1 ...sn ) assumo quindi i valori Vk (σ) = Vk (σ1α σ2β ...) con
probabilità p(s)(σ) e ne possiamo considerare il valor medio o guadagno atteso
gk (s) = E(Vk (s)) = Vk (σ)p(s)(σ) .
σ
Il teorema di Nash si può allora formulare dicendo che ogni gioco finito ammette un punto
di equilibrio.
Teorema del minimax di von Neumann (1928). Sia f (x, y) una funzione bilineare
definita in A × B, dove A e B sono due simplessi, rispettivamente M e N dimensionali. Allora
esiste un punto sella (x∗ , y ∗ ) per f su A × B:
∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .
e quindi vale l’uguaglianza di minimax:
max min f (x, y) = min max f (x, y) .
x∈A y∈B y∈B x∈A
∗
Infine, se x = p∗i
i xi
∗
ey = ∗
k yk qk ,
dove xi e yk sono i vertici dei simplessi A e B, mentre
p∗i , qk∗ ≥ 0 e i pi = q
k k = 1, si ha
min p∗i f (xi , yk ) = max qk∗ f (xi , yk ) .
k i
i k
Dimostrazione. Possiamo ottenere questo risultato fondamentale come corollario del Teorema
di Nash. Infatti, come abbiamo già osservato, i punti sella sono un caso particolare di punti di
equilibrio di Nash. Basta porre
g1 (x, y) = f (x, y) , g2 (x, y) = −f (x, y) , s1 = x, s2 = y , Σ1 = A , Σ2 = B ,
Ricordiamo che una funzione f : T → R, dove T è uno spazio topologico, si dice semicon-
tinua inferiormente (s.c.i.) in x ∈ T se e solo se, indicando con V (x) un generico intorno di
x, risulta
∀ε > 0 ∃V (x) ∀z ∈ V (x) f (x) − ε < f (z) .
Se f è s.c.i. in x e xn → x allora lim inf n f (xn ) ≥ f (x) (infatti per ogni ε > 0 si ha, per n
sufficientemente grande, f (xn ) > f (x) − ε e quindi lim inf n f (xn ) ≥ f (x) − ε). Analogamente
se f è s.c.s. in x e xn → x allora lim supn f (xn ) ≤ f (x). Negli spazi metrici queste condizio-
ni sono anche sufficienti affinché f sia s.c.i. o s.c.s. (ad esempio nel primo caso, se esistesse
ε > 0 tale che in nessun intorno di x si avesse sempre f (z) > f (x) − ε, per ogni n potremmo
trovare xn tale che d(xn , x) < 1/n e f (xn ) ≤ f (x) − ε, ma allora si avrebbe il risultato assurdo
lim inf n f (xn ) < f (x)).
Ricordiamo ancora che il clasico teorema di Weierstrass sui massimi e minimi può
essere precisato affermando che una funzione f s.c.i. su un compatto K ammette minimo e che
una funzione f s.c.s. su un compatto K ammette massimo. (Ad esempio nel primo caso, posto
m = inf x∈K f (x), se Fn = {x | m ≤ f (x) ≤ m+1/n}, Fn è chiuso per la s.c.i. di f ; l’intersezione
di un numero finito arbitrario di insiemi Fn non è vuota, quindi per la compattezza di K esiste
x ∈ ∩n Fn ⊆ K; allora f (x) = m).
Osservazione. Se y
→ f (x, y) è s.c.i. per ogni x, la funzione g(y) = supx f (x, y) è ancora s.c.i.
Infatti, se x0 è tale che f (x0 , y) > g(y) − ε e per ogni z ∈ V (y) si ha f (x0 , z) > f (x0 , y) − ε,
allora
g(z) = sup f (x, z) ≥ f (x0 , z) > g(y) − 2ε .
x
Similmente se f (x, y) è s.c.s. per ogni y, la funzione h(x) = inf y f (x, y) è ancora s.c.s.
Essendo la funzione g(y) = maxx∈A f (x, y) s.c.i., ha senso considerare miny∈B g(y). In modo
analogo la funzione h(x) = miny∈B f (x, y) è s.c.s. e ammette massimo in B.
Possiamo ottenere questo risultato come corollario della successiva generalizzazione del Teo-
rema di Nash oppure di un teorema di Ky Fan (K.Fan[10]) del 1952. Definiamo prima le nozioni
di funzione convexlike o concavelike, cioè di tipo convesso o concavo.
Definizione. Sia f una funzione a valori reali definita sul prodotto X × Y di due insiemi
arbitrari.
1) f è convexlike su Y se e solo se
2) f è concavelike su X se e solo se
Dimostrazione.
La condizione è ovviamente necessaria: sia
min max f (x, y) = max f (x, y0 ) e max min f (x, y) = min f (x0 , y),
y x x x y y
Quindi per ogni reale ρ vale una almeno delle seguenti disuguaglianze:
Poniamo
L(x, ρ) = {y ∈ Y | f (x, y) ≤ ρ} , U (y, ρ) = {x ∈ X | ρ ≤ f (x, y)} ,
insiemi chiusi in virtù delle proprietà di semicontinuità di f .
Allora per ogni reale ρ e per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X
e Y , le due intersezioni
∩ni=1 L(xi , ρ) e ∩mk=1 U (yk , ρ)
non sono entrambe vuote, in quanto caratterizzano gli insiemi nei quali rispettivamente maxi f (xi , y) ≤
ρ e ρ ≤ mink f (x, yk ). Ne segue, vista la compattezza di X e Y , che le intersezioni
non sono entrambe vuote. Infatti, se per esempio la seconda intersezione fosse vuota, per
la compattezza di Y , esisterebbe almeno un sottoinsieme finito {y1 , y2 ...ym } di Y tale che
∩y∈Y U (y, ρ) = ∅. Ma allora, per ogni sottoinsieme finito {x1 , x2 ...xn } di X si avrebbe ∩ni=1 L(xi , ρ) =
∅ e quindi, per la compattezza di X, dovrebbe essere ∩x∈X L(x, ρ) = ∅.
Dunque o esiste x0 ∈ X tale che per ogni y ∈ Y risulta ρ ≤ f (x0 , y), oppure esiste y0 ∈ Y tale
che per ogni x ∈ X risulta f (x, y0 ) ≤ ρ.
Allora, per ogni ρ, deve essere soddisfatta almeno una delle disuguaglianze
Per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y , per il teorema
∗ ∗ ∗ ∗ ∗ ∗
di
minmax
∗
von∗ Neumann esistono due vettori (p1 , ...pn ) e (q1 ...qm ), con pi ≥ 0, qk ≥ 0 ,
di
i pi = 1 e k qk = 1, tali che
V = max qk∗ f (xi , yk ) = min p∗i f (xi , yk ) .
i k
k i
e pertanto
∀i∀k f (xi , y0 ) ≤ V ≤ f (x0 , yk ) ,
quindi la condizione necessaria e sufficiente per l’uguaglianza di minmax è soddisfatta. q.e.d.
Definizione. Sia f una funzione a valori reali definita in uno spazio vettoriale V .
a) f è quasicovessa su V se e solo se
∀l { v | f (v) ≤ l } è convesso .
b) f è quasiconcava su V se e solo se
∀l { v | f (v) ≥ l } è convesso .
Siamo ora in grado di enunciare un risultato di M.Sion del 1957[23], la cui dimostrazione
venne derivata direttamente dal Teorema KKM, senza ricorrere al teorema di Brouwer.
Teorema di Sion (1957). Siano X e Y due insiemi compatti e covessi, ed f una funzione
a valori reali definita su X × Y .
Sia f (x, y) s.c.s e quasiconcava su X per ogni y, e s.c.i. e quasiconvessa su Y per ogni x.
Allora vale l’uguaglianza di minmax:
I risultati precedenti sui punti di equilibrio e sui punti di infsup possono essere generalizzati
in varie direzioni.
Risultano strumenti essenziali, non solo per le generalizzazioni sopra menzionate, i seguenti
Teoremi del minsup e di Ky Fan. Per un più facile confronto con la letteratura corrente, scam-
bieremo il ruolo delle variabili x e y: nel senso che cercheremo il minimo in x e il massimo in y.
Data una funzione f (x, y) definita su X × Y , introduciamo i valori (il primo e il terzo già
considerati in precedenza)
v− = sup inf f (x, y) ≤ v ∗ = sup inf sup f (x, y) ≤ v + = inf sup f (x, y) ,
y∈Y x∈X F ∈F x∈X y∈F x∈X y∈Y
Premettendo che una funzione g(x) si dice inferiormente semi-compatta in X se e solo se per
ogli livello l risulta x ∈ X | g(x) ≤ l è compatto su X, possiamo ora enunciare il
e quindi
v∗ = v+ .
Dimostrazione. Gli insiemi C(y) = {x | f (x, y) ≤ v ∗ } sono chiusi per la s.c.i. Basta dimostrare
che C = ∩y∈Y C(y) = ∅ e prendere x∗ ∈ C. Per la compattezza di C(y0 ) basta dimostrare che
per ogni F = {y1 , y2 ...yn } ∈ F si ha CF = C(y0 ) ∩ ∩y∈F C(y) = ∅. Ma maxk f (x, yj ) è s.c.i. in
x e dunque esiste xF tale che
v + ≤ sup f (x∗ , y) ≤ v ∗ ≤ v +
y
Dimostrazione. Poniamo M = supy∈X f (y, y). Poiché le ipotesi del Teorema del minsup sono
soddisfatte e quindi esiste x∗ tale che supy f (x∗ , y) = v + = v ∗ , basta dimostrare che v ∗ ≤ M .
Sia F = {y1 , y2 ...yn } un sottoinsieme finito arbitrario; controlliamo che
Infatti, posto
g(λ, y) = f ( λj yj , y) , Fj = {λ | g(λ, yj ) ≤ M } ,
j
), λj ≥ 0,
dove λ = (λ1 , ...λn j λj = 1, vediamo che per il Teorema KKM esiste λF ∈ ∩j Fj e
quindi, con xF = j (λF )j yj risulta maxj f (xF , yj ) ≤ M , dimostrando cosı́ la tesi.
Gli insiemi Fj soddisfano le ipotesi del Teorema KKM. Infatti sono chiusi per la s.c.i. Inoltre se
J(λ) = {j | λj = 0} allora λ ∈ ∪j∈J(λ) Fj , altrimenti esisterebbe µ tale che
∀j ∈ J(µ) g(µ, yj ) = f ( µi yi , yj ) > M .
i
Usiamo ora il Teorema di Ky Fan per dimostrare una notevole generalizzazione del Teorema
di Nash.
n f1 , f2 , ...fn n funzioni reali della variabile x = (x1 , x2 ...xn ), che varia in un sottoinsieme
Siano
A di j=1 Aj , essendo Aj l’insieme dei valori ammissibili per xj . Dunque
fk : A ⊆ A1 × A2 ... × An → R , k = 1, 2...n .
sup g(x, y) ≤ 0 ,
y∈A
Dimostrazione. Per il lemma precedente basta vedere che esiste x ∈ A tale che supy∈A g(x, y) ≤
0. Ma le ipotesi del Teorema di Ky Fan sono soddisfatte: A è convesso e compatto per ipotesi;
g è s.c.i in x, con y arbitrario, per la continuità delle fj ; g è concava in y, con x arbitrario, per
la convessità delle fj e infine per ogni y si ha ovviamente g(y, y) = 0. q.e.d.
Corollario (sui punti sella). Nen caso particolare di due sole variabili (due giocatori)
x = (x1 , x2 ) e con
f1 (x1 , x2 ) = f (x1 , x2 ) = −f2 (x1 , x2 )
(gioco a somma zero), basta chiedere che f (·, x2 ) sia s.c.i. per ogni x2 e f (x1 , ·) sia s.c.s. per
ogni x1 , invece di chiedere la continuità di f (·, ·). Si deve ovviamente chiedere che f sia convessa
in x1 e concava in x2 . In tal caso il punto di equilibrio del quale si garantisce l’esistenza (x∗1 , x∗2 )
è ovviamente un punto sella:
e dunque g è s.c.i. in y sotto le ipotesi di semicontinuità alle quali f soddisfa. Si osservi che f
è concava in x2 essendo −f convessa. Il resto della deduzione non cambia. q.e.d.
e dei massimi, come dei punti di minimo e di massimo, in un contesto estremamente generale.
Proponiamo in questa sezione alcuni cenni, rinviando per una trattazione dettagliata al lavoro
di De Giorgi - Franzoni[6].
Sia X uno spazio topologico, τ la sua topologia, fn una successione di funzioni definite in X
a valori relai estesi.
che indicheremo brevemente con γi− (x). Vτ (x) è la famiglia degli intorni di x per la topologia τ .
Definizione. Si dice che la successione fn Γ− -converge se γi− (x) = γs− (x). Il valore comune
è il Γ− -limite delle fn e verrà indicato con γ − (x).
per ogni z ∈ W (x) e dunque γi− (x) è s.c.i. Per γs− (x) si procede nello stesso modo. q.e.d.
γi− (x) ≤ lim inf fn (x) , γs− (x) ≤ lim sup fn (x) .
n n
Se le funzioni fn sono equisemicontinue in x, cioè se per ogni ε > 0 esiste un intorno V (x)
tale che per ogni n e per ogni y ∈ V (x) si abbia fn (y) > fn (x) − ε, allora valgono le relazioni
precedenti con il segno di uguaglianza.
Dimostrazione. Dato ε > 0 arbitrario e considerato un intorno V (x) con le proprietá sopra dette
si trova ∈y∈V (x) fn (y) ≥ fn (x) − ε e dunque si ha γi− (x) ≥ lim inf n fn (x) − ε. q.e.d.
fp (x) = 0 : quindi lim inf n fn = 0 e lim supn fn = 1, mentre la successione fp non converge in
nessun punto.
Se ora fissiamo un intorno arbitrario V di un punto x, per n sufficientemente grande vi saranno
in V punti z per i quali fn (z) = 0 e dunque inf y∈V fn (y) = 0. Ne segue che γi− (x) = γs− (x) = 0
e la successione Γ− -converge alla funzione nulla.
1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − k
, rk + k [ .
2 2
An è un aperto denso di misura di Lebesgue ≤ 4/n, An+1 ⊂ An e l’insieme A è un Gδ , denso,
di misura di Lebesgue 0. Mentre il complementare C = Ac = ∪n Cn , con Cn = Acn , ha misura
di Lebesgue 1 e Cn ⊂ Cn+1 . Sia fn la funzione caratteristica di Cn , complementare di An . La
successione fn dunque converge q.o. e in ogni Lp alla funzione costante uguale a 1. Ma fissato
un intorno arbitrario V di un punto x in V vi sono sempre punti di An e quindi inf y∈V fn (y) = 0.
Si conclude allora che la successione Γ− -converge alla funzione nulla.
∀x ∈ A γi− (x) = sup lim inf inf fn (x) ≥ lim inf inf fn (x) .
V (x) n y∈V (x) n y∈A
Dimostrazione. Indichiamo con l il secondo membro della disuguaglianza precedente. Sia fn
una sottosuccessione di fn e xn una successione di punti di K tali che
Sia poi xnj una sottosuccessione convergente in K e chiamiamo x il suo limite. Ricordando
che ovviamente il liminf lungo una successione è minore o uguale al liminf lungo una qualunque
sottosuccessione, si trova:
γi− (x) ≤ Γ− lim inf fn (x) ≤ Γ− lim inf fn j (x) ≤ lim inf fn j (xnj ) = lim fn j (xnj ) = l ,
n j j j
min γ − (x) = min γ − (x) = lim inf fn (x) = lim inf fn (x) .
x∈A x∈K n x∈K n x∈A
Dimostrazione. Per la prima tesi, osservando che γ − (x) è s.c.i., usando la Proposizione K e
quindi la Proposizione A, si ottiene
min γ − (x) ≤ lim inf inf fn (x) ≤ lim sup inf fn (x) ≤ inf γ − (x) .
x∈K n x∈K n x∈A x∈A
Un operatore lineare può non essere definito su tutto X e può, diversamente da quanto av-
viene in dimensione finita, non essere continuo. Ad esempio, se X = Y = C([0, 1]), l’operatore
di derivazione d/dx ha per dominio l’insieme C 1 ([0, 1]) delle funzioni derivabili con derivata
continua, che è un sottospazio proprio di C([0, 1]), e non è continuo, perché successioni unifor-
memente convergenti di funzioni derivabili non hanno necessariamente derivate uniformemente
convergenti:
1 1
sin (2πnx) − 0∞ = → 0 , ma 2π cos (2πnx)∞ = 2π .
n n
(Se cos (2πnx) → g(x) uniformemente, g dovrebbe essere la derivata della funzione nulla, cioè
g ≡ 0.)
47
48 Capitolo 3. Operatori lineari. Equazioni integrali
Per gli operatori lineari ovunque definiti continuità e limitazione sono equivalenti. Più pre-
cisamente vale la
4) implica 2):
Af − Ag ≤ M f − g ,
cioè A è Lipschitziana e pertanto continua. q.e.d.
Le disuguaglianze della tesi seguono immediatamente dalle proprietà degli estremi inferiore e
superiore e dalla positiva omogeneità delle norme (il rapporto Af /f resta costante sulle
semirette uscenti da 0 e sup f =r Af /f è indipendente da r).
Teorema. Sia Y uno spazio di Banach. Allora L(X, Y ) con la norma AL(X,Y ) è uno
spazio di Banach.
Dimostrazione. Sia An ∈ L(X, Y ) una successione di Cauchy:
An+p ≤ An + ε
e dunque
Af = lim An+p f ≤ (An + ε)f ,
p→+∞
An f − Af = lim An f − An+p f ≤ εf ,
p→+∞
Prima di studiare alcune proprietà di GL(X, Y ), consideriamo il caso particolare, molto im-
portante, in cui X = Y . In tal caso si scrive brevemente L(X) in luogo di L(X, X) e GL(X) in
luogo di GL(X, X) .
∀f ∈ X (A · B)f = A(Bf ) .
In generale AB = BA . Inoltre:
AB ≤ AB .
La dimostrazione è immediata (ABf ≤ ABf ≤ ABf ).
(In ogni spazio di Banach, per il criterio di Cauchy, la convergenza di una serie con termini ck
è implicata dalla convergenza della serie delle loro norme ck . Come per le serie numeriche, in
questo caso la convergenza è indipendente dall’ordine dei termini ck .)
Inoltre si ha
n n
(I − A) Ak = ( Ak )(I − A) = I − An+1 → I ,
0 0
+∞
e pertanto (I − A)−1 = k=0 A
k
. q.e.d.
dove M è definito da
M φ = −A−1 Hφ + A−1 g .
Dunque
M φ − M ψ ≤ A−1 Hφ − ψ
e M è una contrazione stretta se H < A−1 −1 . Allora per ogni g esiste una e una sola
soluzione f dell’equazione (A + H)f = g e A + H è bijettivo.
Si può anche, e forse con vantaggio, ricorrere alla serie di Neumann, osservando che, se I è
l’operatore identità in L(Y ),
+∞
(A + H)−1 = [(I + HA−1 )A]−1 = A−1 (I + HA−1 )−1 = A−1 (−HA−1 )k ,
k=0
A−1 2
≤ (A + H)−1 HA−1 ≤ H
1 − HA−1
Nel caso di un operatore limitato A ∈ L(X) si possono definire altri operatori che sono sue
funzioni, mediante serie convergenti. Se f (z) è una serie convergente: f (z) = +∞ c
n=0 n z n
, con
raggio di convergenza ρ e ||A|| < ρ si può definire:
+∞
f (A) = cn An ∈ L(X) .
n=0
Tale serie converge “assolutamente in L(X) perchè i suoi termini sono maggiorati in norma da
|cn |An , che per ipotesi sono termini di una serie convergente.
La serie è “assolutamente convergente perchè le norme dei suoi termini sono maggiorate dai
numeri |t|n An /n! che sono i termini di una ordinaria serie esponenziale.
La funzione
t
→ etA ∈ L(X)
ha proprietà analoghe a quelle della funzione esponenziale et :
1) Per t ed s arbitrari
e(t+s)A = etA esA .
Infatti
+∞
ti A i s j A j
etA esA = =
n=0 i+j=n
i! j!
+∞
n
An n
= sj tn−j .
n! j
n=0 j=0
Infatti se |t| ≤ M
+∞
M j Aj+1
etA − I ≤ |t| .
j=0
(j + 1)!
3) È una funzione derivabile rispetto al parametro t per t = 0 (e quindi ovunque per la prima
proprietà):
def etA − I
Dt etA |t=0 = lim =
t→0 t
+∞ j
tA2 t ||A||j+2
= lim (A + + ...) = A + lim t =A,
t→0 2! t→0
j=0
(j + 2)!
e dunque
Ad esempio se X = C([a, b]), K ∈ C([a, b]2 ) e ϕ ∈ C([a, b]) , introducendo l’operatore, che
verificheremo nei paragrafi successivi essere limitato:
b
Af (y) = K(x, y)f (y)dy , A ∈ L(X) ,
a
l’equazione integro-differenziale
b
∂u(t, x) = K(x, y)u(t, y)dy
∂t a
u(0, x) = ϕ(x)
è lineare e continuo da C([a, b]) in sè stesso: A ∈ L(C([a, b])) (e si dice che K è il nucleo
(kernel) di A).
Infatti, per ogni funzione continua f :
b
|Af (x) − Af (x0 )| ≤ |K(x, y) − K(x0 , y)||f (y)|dy ≤
a
b
≤ f ∞ |K(x, y) − K(x0 , y)|dy < εf ∞ ,
a
***
Si può dimostrare che nella relazione precedente vale il segno di uguaglianza: sia x∗ tale che
b b
|K(x∗ , y)|dy = C = max |K(x, y)|dy
a x∈[a,b] a
F+ε ⊆ A+ ⊆ O+
ε ε
, λ(O+ − F+ε ) < ε ,
F−ε ⊆ A− ⊆ O−
ε ε
, λ(O− − F−ε ) < ε ,
dove F+ε , F−ε sono chiusi e O+
ε ε
, O− aperti. I due insiemi A+ , A− sono disgiunti e a maggior ragione
sono disgiunti F+ε , F−ε . Poiché A è uno spazio topologico compatto e quindi normale, esistono
due aperti disgiunti V+ε , V−ε che contengono rispettivamente F+ , F− . Allora, introducendo gli
aperti W±ε = O± ε
∩ V±ε si ha
W+ε ∩ W−ε = ∅ e F±ε ⊆ W±ε .
Poniamo allora
d(x, X − W±ε )
φε± (x) = , φε (x) = φε+ (x) − φε− (x) .
d(x, F±ε ) + d(x, X − W±ε )
Teorema. Sia f ∈ C([a, b]) e |µ|K̂ < 1 , allora esiste un’unica funzione continua u(x) tale
che b
u(x) = µ K(x, y)u(y)dy + f (x) .
a
Dimostrazione. L’applicazione
A : g
→ Ag = µK̂g + f
opera dallo spazio di Banach (quindi metrico e completo) C([a, b]) in sè stesso e nell’ipotesi fatte
è una contrazione:
Si osservi che con la stessa tecnica si possono trattare equazioni integrali non lineari del
tipo
b
u(x) = µ F (x, y, u(y))dy ,
a
2
ad esempio nelle ipotesi F ∈ C([a, b] × R) tale che
cioè F soddisfa una condizione di Lipschitz rispetto alla terza variabile, uniformemente per
(x, y) ∈ [a, b]2 , e µ è sufficientemente piccolo.
Infatti in tali ipotesi l’applicazione
b
(Au)(x) = µ F (x, y, u(y))dy
a
è una contrazione:
Au − Av = max |Au(x) − Av(x)| ≤
x
b
≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M |(b − a)u − v .
a
dove l’ntervallo di integrazione è variabile con x . In effetti le equazioni di questo tipo si possono
considerare come un caso particolare di quelle viste precedentemente. Basta porre
K(x, y) se y ≤ x
L(x, y) =
0 se y > x
per poter riscrivere l’equazione nella forma
b
u(x) = µ L(x, y)u(y)dy + f (x)
a
Teorema. Sia K(x, y) continua (per y ≤ x ), M = maxy≤x |K(x, y)| e f (x) continua in [a, b],
allora per ogni valore di µ = 0 esiste un’unica funzione continua u(x) soluzione dell’equazione
x
u(x) = µ K(x, y)u(y)dy + f (x) ,
a
e studiamo il problema di punto fisso u = Au. Dimostriamo che una iterata di A di ordine
sufficientemente elevato è una contrazione:
x
|Au(x) − Av(x)| ≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M (x − a)u − v ,
a
(x − a)2
≤ (|µ|M )2 u − v ,
2
dunque A2 u − A2 v ≤ (|µ|M (b − a))2 /2u − v . Iterando si trova facilmente
Ap u − Ap v ≤ (|µ|M (b − a))p /p! u − v .
Poiché (|µ|M (b − a))p /p! → 0 per p → +∞, per p sufficientemente grande Ap è una contrazione.
Dunque, per il teorema sui punti fissi delle applicazioni con un’iterata che sia una contrazione,
l’equazione integrale ammette una soluzione unica limite delle approssimazioni
u0 arbitraria in C([a, b])
x
un+1 (x) = µ a K(x, y)un (y)dy + f (x) .
q.e.d.
N
KN (x, y) = αi (x)βi (y) .
i=1
Per continuare lo studio delle equazioni integrali nel contesto dello spazio C([a, b]) supporremo
che le funzioni αi (x) siano continue e che le funzioni βi (x) siano integrabili (o addirittura con-
tinue).
Se u è soluzione dell’equazione
b
u(x) = µ KN (x, y)u(y)dy + f (x) , x ∈ [a, b] ,
a
N b
u(x) − f (x) = µ αi (x) βi (y)u(y)dy ,
i=1 a
ovvero
N b
u(x) − f (x) = µ ci αi (x) , ci = βi (y)u(y)dy .
i=1 a
(I − µW )c = d ,
q.e.d.
approssimare il nucleo K con nuclei separabili KN che riducono il problema alla soluzione di un
ordinario sistema di equazioni algebriche lineari.
Osservazione. Ovviamente:
b
K̂u − K̂n u ≤ sup |K(x, y) − Kn (x, y)||u(y)|dy ≤
x a
b
≤ u sup |K(x, y) − Kn (x, y)|dy = K̂ − K̂n u .
x a
Allora la convergenza in norma (o uniforme sui limitati) degli operatori: K̂ − K̂n → 0 , implica
la loro convergenza puntuale, o come si dice forte : ∀u K̂n u → K̂u.
per le proprietà del gruppo GL(C([a, b])) risulta I − µK̂n ∈ GL(C([a, b])) per n sufficientemente
grande e
(I − µK̂n )−1 → (I − µK̂)−1 in L(C([a, b])) .
Dunque, in virtù dell’osservazione precedente
(I − µK̂)−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ|K̂n − K̂ ,
1 − |µ|(I − µK̂)−1 K̂n − K̂
(I − µK̂n )−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ|K̂n − K̂ ,
1 − |µ|(I − µK̂n )−1 K̂n − K̂
(I − µK̂n )−1 2
un − u ≤ |µ|K̂n − K̂f .
1 − |µ|(I − µK̂n )−1 K̂n − K̂
Si osservi che può essere più facile disporre di buone maggiorazioni di (I − µK̂n )−1 , piuttosto
che maggiorazioni di (I − µK̂)−1 .
(I − µK̂)−1
≤ |µ|K̂n u − K̂u ,
1 − |µ|(I − µK̂)−1 K̂n − K̂
un − u = (I − µK̂)−1 f − (I − µK̂n )−1 f = (I − µK̂)−1 µ(K̂ − K̂n )(I − µK̂n )−1 f ≤
(I − µK̂n )−1
≤ |µ|K̂n un − K̂un .
1 − |µ|(I − µK̂n )−1 K̂n − K̂
Ad esempio informazioni sull’ordine di convergenza di Kn u a Ku , che può dipendere dalla
conoscenza a priori di qualche proprietà di “regolarità della soluzione u , permettono di stimare
l’ordine di convergenza delle soluzioni approssimate un alla soluzione esatta u.
Spazi di Hilbert
m
n
m
n
B( λ i xi , µj yj ) = λi µj B(xi , yj ) .
i=1 j=1 i=1 j=1
B(y, x) = B(x, y) .
63
64 Capitolo 4. Spazi di Hilbert
dunque la conoscenza della forma quadratica determina quella della forma sesquilineare.
La dimostrazione della proposizione è immediata (basta sviluppare le espressioni quadratiche a
secondo membro).
Dimostrazione.
1) Se B(x, x) = B(y, y) = 0, allora, essendo B(x + ty, x + ty) ≥ 0 per ogni t, si ha tB(x, y) +
tB(x, y) ≥ 0 . Posto t = −B(x, y) , si trova −2|B(x, y)|2 ≥ 0 , cioè B(x, y) = 0 e la disugua-
glianza è soddisfatta.
2) Altrimenti, se uno almeno dei valori B(x, x) e B(y, y) non è nullo e sia ad esempio B(y, y) = 0,
allora per ogni t
≤ (B(x, x) + B(y, y) + 2B(x, x)1/2 B(y, y)1/2 )1/2 = B(x, x)1/2 + B(y, y)1/2 .
Definizione. Uno spazio vettoriale H su C (su R), munito di una forma B sesquilinea-
re (bilineare) Hermitiana (simmetrica) definita positiva si dice spazio pre-Hilbertiano. H è
normato in modo canonico dalla norma x = B(x, x)1/2 . Se rispetto a tale norma H risulta
completo allora si dice che H è uno spazio di Hilbert .
La forma prescelta per strutturare H quale spazio pre-Hilbertiano si dice prodotto scalare e
3) Sia Ω un aperto limitato di Rn e K la sua chiusura. Allora lo spazio C(K; C) delle funzioni
continue su K a valori complessi, munito del prodotto scalare
(f, g) = f (x)g(x)dx ,
K
Identità della mediana. Se x, y sono due elementi arbitrari di uno spazio pre-Hilbertiano,
allora
x+y 2 x−y 2 x2 + y2
+ = .
2 2 2
Si verifica immediatamente osservando che
x + y2 + x − y2 = 2x2 + 2y2 + 2(x, y) − 2(x, y) .
4(x, y) = x + y2 − x − y2 + ix + iy2 − ix − iy2 .
L’identità della mediana permette di dimostrare che il secondo membro è lineare in x ed antili-
neare in y.
Limitandoci al caso reale abbiamo il
Teorema. Sia H uno spazio normato su R nel quale vale l’identità della mediana:
x+y 2 x−y 2 x2 + y2
+ = .
2 2 2
Ponendo
4(x, y) = x + y2 − x − y2 ,
(x, y) è un prodotto scalare in H che induce la norma iniziale.
Dimostrazione. Ovviamente
k k
( x, y) = p (x, y) .
2p 2
Ogni numero reale λ è limite di razionali del tipo k/2p e in ogni spazio normato λx ± y è
continua in λ. Dunque per ogni λ si ha (λx, y) = λ(x, y). q.e.d.
∀x ∈ H ∃!y ∈ A x − y = min x − z .
z∈A
PA (x) − PA (x∗ ) ≤ x − x∗ .
Lemma. Sia E un convesso contenuto nella regione compresa tra due sfere concentriche
(per esempio di centro il vettore 0) di raggi ρ e ρ + δ :
∗
E ⊂ Bρ+δ (0) − Bρ (0) .
(Con B ∗ indichiamo la chiusura della sfera aperta B e, solo per maggiore generalità, prendiamo
la sfera di raggio maggiore chiusa e quella di raggio minore aperta.)
Allora se δ ≤ ρ risulta
diam(E) = sup x − y ≤ 12ρδ .
x,y∈E
Dimostrazione del teorema delle proiezioni. Essendo il problema invariante per traslazioni,
possiamo per semplicità supporre x = 0 .
y = ρ = min z .
z∈A
y + y∗ 2 y2 + y ∗ 2 y − y∗ 2
= − < ρ2 ,
2 2 2
che sarebbe assurdo, perchè (y+y ∗ )/2 ∈ A . Dunque abbiamo esistenza e unicità della proiezione.
3) Essendo A convesso, per ogni λ ∈]0, 1[ e per ogni z ∈ A risulta y + λ(z − y) ∈ A. Pertanto,
poiché y è il punto di minimo :
y + λ(z − y)2 ≥ y2 ,
2λ(y, z − y) + λ2 z − y2 ≥ 0 ,
ovvero
(y, z − y) ≥ −λ/2z − y2 .
Facendo tendere λ a 0 si ottiene (0 − y, z − y) ≤ 0.
Viceversa, se per ogni z ∈ A si ha (y , z − y ) ≥ 0 , allora
z2 = y + z − y 2 = y 2 + z − y 2 + 2(y , z − y ) ≥ y 2 .
∀y ∈ A (x − P (x), y) = 0 .
Infatti
(x − P (x), y) = (x − P (x), (y + P (x)) − P (x)) ≤ 0 ,
perché y + P (x) ∈ A e
Indichiamo con la notazione M ⊥ l’insieme di tutti gli elementi di uno spazio di Hilbert H
ortogonali a tutti gli elementi di un sottoinsieme M :
M ⊥ = {x ∈ H | ∀y ∈ M (x, y) = 0} .
È evidente che (M ⊥ )⊥ ⊇ M .
Per la linearità del prodotto scalare rispetto alla prima variabile, M ⊥ è un sottospazio
vettoriale:
x, x ∈ M ⊥ ∧ λ ∈ C ⇒ ∀y ∈ M (λx + x , y) = 0 ⇒ λx + x ∈ M ⊥ .
H = M ⊕ M⊥ ,
x = PM x + PM ⊥ x .
∀x ∈ H ∀y ∈ M (x − PM x, y) = 0 ,
∀y ∈ M (x − m, y) = 0 e ∀z ∈ M ⊥ (x − m , z) = 0 .
Pertanto m = PM x e m = PM ⊥ x . q.e.d.
0 = (x, PM ⊥ x) = (PM ⊥ x, PM ⊥ x) .
PM ∈ L(H) e PM x ≤ x ,
PM (x + y) = m + n = PM x + PM y e PM (λx) = λPM x .
Inoltre
x2 = (m + m , m + m ) = m2 + m 2 = PM x2 + PM ⊥ x2 .
Infine le ultime equazioni della proposizione sono una semplice traduzione in termini di operatori
di risultati già dimostrati o impliciti nelle definizioni.
Più in generale si può pensare ad una decomposizione di uno spazio di Hilbert H in somma
(finita o infinita) diretta di sottospazi chiusi:
H = H1 ⊕ H2 ⊕ H3 ⊕ ...
Se l’insieme degli indici A è numerabile, la somma precedente si dice serie di Fourier gene-
ralizzata .
∀x, y ∈ S x = y ⇒ (x, y) = 0 .
Per semplicità, nel seguito supporremo che A sia numerabile e quindi non è restrittivo sup-
porre che A = N∗ , insieme degli interi positivi (in qualche caso potrà essere utile assumere
A = Z) . Se A fosse finito le dimostrazioni si semplificherebbero ulteriormente, non essendovi
problemi di convergenza.
è isomorfo ad H. Quinti tutti gli spazi di Hilbert che ammettono una base numerabile sono
isomofi tra loro e
+∞
(f, g) = fn g n .
n=1
Dimostrazione
del teorema.
1) Sia y = p=n cp xp (somma finita). Allora,come si vede subito sviluppando il quadrato,
y2 = |cp |2 .
p
Ne segue che
xn − y2 = 1 + |cp |2 ≥ 1 ,
p
cioè xn ha distanza almeno 1 da tutti gli elementi del sottospazio generato dalle altre xp e non
è quindi ad esso aderente. Pertanto S è una famiglia topologicamente libera.
2) Sia M il sottospazio (di dimensione p ) generato dalle xn1 , xn2 , ..., xnp e P l’operatore di
proiezione ortogonale su M . Si ha, in virtù delle uguaglianze variazionali
p
g= fnk xnk = P f ;
k=1
infatti
∀nk (f − g, xnk ) = 0 , k = 1, 2, ...p ,
essendo le xnk ortonormali. Ma ogni elemento di M è combinazione lineare delle xnk e per la
sesquilinearità del prodotto scalare
∀z ∈ M (f − g, z) = 0 .
Allora g = P f è l’unico elemento di M a distanza minima da f e la proprietà di minimo dei
coefficienti di Fourier è dimostrata.
Inoltre, poiché P ha norma = 1 , si ha P f ≤ f . In particolare, se xnk = xk , si vede che
per ogni p
p
|fk |2 ≤ f 2 ,
k=1
da cui segue la convergenza della serie dei moduli a quadrato dei coefficienti di Fourier e la
disuguaglianza di Bessel.
3) La successione delle ridotte nk=1 fk xk è di Cauchy in H , infatti, essendo le xk ortonormali:
n+p
n+p
fk xk 2 = |fk |2 → 0
k=n+1 k=n+1
p
p
p
f 2 = lim fn xn 2 = lim fn xn 2 = lim |fn |2
p p p
n=1 n=1 n=1
e quindi S è completo.
5) Si verifica immediatamente che l’applicazione f → {fn }n∈N∗ è biunivoca, lineare, bicontinua
e che conserva le norme (quindi i prodotti scalari). q.e.d.
rispetto alla quale risulta completo, cioè anch’esso uno spazio di Banach.
Nel caso degli spazi di Hilbert vale il seguente fondamentale teorema di rappresentazione degli
elementi del duale.
∀x ∈ H f (x) = (x, yf ) .
z f (x)
(x, )= z .
z f (z)
Posto dunque
f (z)
yf = z risulta (x, yf ) = f (x) .
z2
È evidente che l’applicazione R : f → yf è antilineare. Verifichiamo che è una isometria:
|f (x)| |(x, yf )|
f H = sup = sup ≤ yf H ,
0=x∈H xH x=0 xH
yf 2 = (yf , yf ) = f (yf ) ≤ f H yf H
e dunque f H = yf H . Ne segue in particolare che R è iniettiva. La suriettività è immediata,
perché per ogni z ∈ H la funzione f (x) = (x, z) è lineare e continua, cioè in H e necessariamente
yf = z .
Infine, poiché la norma in H soddisfa l’identità della mediana, tale identità vale anche per la
norma in H . Allora la norma di H è indotta da un prodotto scalare, che può facilmente essere
recuperato dalla norma:
4(f, g)H = f + g2H − f − g2H + if + ig2H − if − ig2H =
∀g ∈ H lim(fn , g) = (f, g) .
n
Si scrive allora fn f .
||fn − f ||2 = ||fn ||2 + ||f ||2 − 2(fn , f ) → 2||f ||2 − 2(f, f ) = 0. q.e.d.
(T f, f ) = (f, T f ) = (T f, f ) .
T f = λf (f = 0) ⇒ (T f, f ) = λ||f ||2
3) Autovettori associati ad autovalori diversi sono tra loro ortogonali. Infatti sia:
T f = λf , T g = µg , f, g = 0 , λ = µ .
Allora
(T f, g) = λ(f, g) = (f, T g) = µ(f, g) ,
77
78 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1
|(T f, f )|
NT = sup .
f =0 (f, f )
Ovviamente
NT ≤ ||T ||L(H) .
2
Infatti |(T f, f )| ≤ ||T ||||f || .
Se T è autoaggiunto allora
NT = ||T ||L(H) .
Infatti, con λ > 0 :
1 1 1 1 1
||T f ||2 = (T f, T f ) = [(T [λf + T f ], λf + T f ) − (T [λf − T f ], λf − T f )] ≤
4 λ λ λ λ
1 1 1 NT 2 1
≤ NT [||λf + T f ||2 + ||λf − T f ||2 ] = (λ ||f ||2 + 2 ||T f ||2 ) .
4 λ λ 2 λ
Se T f = 0 l’ultima espressione è minima per λ2 = ||T f ||/||f || e quindi
NT = ||T ||L(H) .
Autofunzioni approssimate.
Se T è autoaggiunto, ricordando le proprietà di omogeneità del prodotto scalare e della norma,
si ha
||T || = sup ||T f || = sup |(T f, f )| .
||f ||=1 ||f ||=1
Allora
0 ≤ ||T fν − λ1 fν ||2 = ||T fν ||2 − 2λ1 (T fν , fν ) + λ1 2 ||fν ||2 = cν ,
ma lim supν cν ≤ 0 e quindi
lim T fν − λ1 fν = 0 .
ν
Le fν sono quindi “soluzioni approssimate dell’equazione T f = λ1 f . Se l’equazione fosse sod-
disfatta esattamente λ1 sarebbe un autovalore di T .
Osservazione. In uno spazio di Hilbert un operatore limitato autoaggiunto può non ammet-
tere alcun autovalore.
Ad esempio in H = L2 (a, b) sia T ∈ L(H) definito da (T f )(x) = xf (x) q.o. Se per un nume-
ro λ e per un rappresentante f (x) di un elemento di H fosse xf (x) = λf (x) q.o., si avrebbe
(x − λ)f (x) = 0 q.o e quindi f (x) = 0 q.o. sarebbe un rappresentante dell’elemento nullo di H.
T ϕ = λ1 ϕ , |λ1 | = ||T || .
q.e.d.
Procededendo ricorsivamente si possono ottenere tutti gli altri autovalori non nulli di T .
H1 = { f ∈ H | (f, ϕ1 ) = 0} .
T (H1 ) ⊆ H1 .
Infatti se f ∈ H1
(T f, ϕ1 ) = (f, T ϕ1 ) = (f, λ1 ϕ1 ) = λ1 (f, ϕ1 ) = 0 .
T ϕn+1 = λn+1 ϕn+1 |λn+1 | = ||Tn ||L(Hn ) = |(T ϕn+1 , ϕn+1 )| = max |(T ϕ, ϕ)| .
ϕ∈Hn , ||ϕ||=1
lim λn = 0 .
n
Altrimenti {ϕn /λn } sarebbe limitata e {T ϕn /λn } = {ϕn }, per la compattezza di T , ammette-
rebbe una sottosuccessione convergente. Ma ciò è assurdo, essendo ||ϕj − ϕk ||2 = 2 .
per n → +∞ . Dunque
+∞
+∞
Tf = (f, ϕk )T ϕk = λk (f, ϕk )ϕk =
k=1 k=1
+∞
+∞
+∞
(f, λk ϕk )ϕk = (f, T ϕk )ϕk = (T f, ϕk )ϕk .
k=1 k=1 k=1
Proposizione 7. Ogni autovalore non nullo è di molteplicità finita, cioè l’autospazio asso-
ciato ha dimensione finita.
Altrimenti non potrebbe essere λn → 0 .
∀f ∈ H 0 = (g, T f ) = (T g, f )
e quindi T g = 0 , cioè g ∈ N .
la somma della sua serie di Fourier rispetto al sistema ϕj . Allora per la proposizione 5
+∞
+∞
Tg = (T g, ϕj )ϕj = λj (g, ϕj )ϕj ,
j=1 j=1
ma per la continuità di T
+∞
T g∗ = λj (g, ϕj )ϕj
j=1
e dunque
T (g − g ∗ ) = 0 ovvero g − g ∗ = h ∈ N .
Pertanto
+∞
g = h + g∗ = h + (g, ϕj )ϕj .
j=1
Infine ovviamente g ∗ ∈ A (perchè limite di combinazioni lineari finite delle ϕj , che ovviamente
appartengono ad A: ϕj = T (ϕj /λj )) e quindi h è unico.
g = g ∗ + h , g ∗ ∈ Im(T ) , h ∈ Ker(T ) ⇒ T g = T g ∗
dimostra la suriettività e
dimostra l’iniettività.
Per la chiusura Im(T ) sarebbe uno spazio di Hilbert (completo) e dunque TI−1 ∈ L(Im(T )) .
Ma TI è compatto e allora, per quanto si vedrà nella sezione 5, I = TI · TI−1 ∈ K(Im(T )) . Ciò
è possibile solo se Im(T ) ha dimensione finita.
+∞
(T f, f ) = λk |(f, ϕk )|2 ,
k=1
con convergenza assoluta della serie in virtù della disuguaglianza di Bessel e della limitazione
degli autovalori λk . Dunque separando gli autovalori positivi λ+ −
k da quelli negativi λk , tutti
ordinati in modo non crescente:
λ+ + − −
1 ≥ λ2 ≥ ... > 0 , λ1 ≤ λ2 ≤ ... < 0 ,
si ottiene
(T f, f ) = λ+ + 2
k |(f, ϕk )| + λ− − 2
k |(f, ϕk )| .
k k
Hn± = { f ∈ H | (f, ϕ±
i ) = 0 i = 1, 2...n} :
λ+
n+1 = +
max (T f, f ) , λ−
n+1 = −
min (T f, f ) .
f ∈Hn , ||f ||=1 f ∈Hn , ||f ||=1
q.e.d.
Questa caratterizzazione variazionale degli autovaori è di grande importanza dal punto di vi-
sta teorico, ma non si presta facilmente alla costruzione di algoritmi per la loro approssimazione,
perchè ad ogni passo richiede la conoscenza esatta delle autofunzioni precedenti. La caratteriz-
zazione degli autovalori fornita dal teorema seguente è invece fondamentale per le tecniche di
approssimazione numerica, oltre che di grande rilievo teorico.
Allora risulta
λ+
n+1 = min max (T f, f ) ,
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1
λ−
n+1 = max min (T f, f ) .
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1
Dimostrazione (per λ+
n+1 ). Sia
* * *
Si può dimostrare che il massimo indicato esiste: sia per il momento M (g1 , g2 , ...gn ) l’estremo
superiore. Per la compattezza di T e per la compattezza sequenziale debole della sfera unitaria
(||f || ≤ 1) si può trovare una successione massimizante fj tale che
fj → f debolmente , T fj → T f fortemente
e dunque
(T fj , fj ) → (T f, f ) = M (g1 , g2 , ...gn ) .
La convergenza debole implica ovviamente che f ∈ H(g1 , g2 ...gn ) e che ||f || ≤ 1. Se fosse
||f || = a < 1 si avrebbe f ∗ = f /a ∈ H(g1 , g2 ...gn ) , ||f ∗ || = 1 e (T f ∗ , f ∗ ) = (T f, f )/a2 >
M (g1 , g2 , ...gn ) , in contrasto con la definizione di M . Dunque f è punto di massimo.
Sappiamo che
M (ϕ+ + + +
1 , ϕ2 ...ϕn ) = λn+1 .
Per g1 , g2 ...gn arbitrari selezioniamo una soluzione non nulla del sistema omogeneo
n+1
xi (ϕ+
i , gk ) = 0 , k = 1, 2, ..n .
i=1
Una soluzione
non nulla esiste perchè il sistema ha n equazioni e n + 1 incognite. Normalizziamo
le xi : i |xi |2 = 1 e poniamo
n+1
f= xi ϕ +
i .
i=1
n+1
M (g1 , g2 ...gn ) ≥ (T f, f ) = λ+ 2 +
i |xi | ≥ λn+1 .
i=1
q.e.d.
(Al solo fine di visualizzare piuù semplicemente i risultati, il lettore può supporre che T abbia
esclusivamente autovalori non positivi:
λ1 ≤ λ2 ≤ ...λn ≤ ... ≤ 0 .)
Dunque E(λ) è una famiglia di proiettori (su S(λ)) con le proprietà seguenti, che la qualificano
per definizione come risoluzione dell’identità :
1) monotonia : i sottospazi corrispondenti sono nondecrescenti al crescere di λ, dunque
E(λ)E(λ∗ ) = E(min(λ, λ∗ ) ;
3) continuità a destra :
E(λ + 0) = E(λ) .
Nel caso in esame (anche per operatori compatti generici) si ha E(λ) = 0 e E(λ) = I, rispet-
tivamente a sinistra e a destra di qualsiasi intervallo finito comprendente tutti gli autovalori, e la
funzione E(λ) è costante a tratti, assumendo il valore E(λk ) per λk ≤ λ < λk+1 , e ovviamente
P (λk ) = E(λk ) − E(λk+1 ).
dove (a, b) è un qualunque intervallo aperto contenente tutti gli autovalori e l’integrale è un
integrale di Stieltjes (rispetto ad una misura vettoriale).
Possiamo scrivere +∞
Tf = λd(E(λ)f ) ,
−∞
Già nel 1906 Hilbert ha dimostrato che per qualunque operatore limitato T autoaggiunto,
e non solo per gli operatori compatti, esiste un’unica risoluzione dell’identità E(λ) che consente
di rappresentarlo mediante un integrale di Stieltjes.
Se l’operatore non è compatto la funzione monotona E(λ) può avere un comportamento molto
più complesso, in particolare non è necessariamente costante a tratti e ad esempio può crescere
con continuità tra due salti consecutivi. I valori λ per i quali ciò avviene fanno parte dello
spettro continuo di T .
Se nell’intorno di λ0 E(λ) non è costante, a λ0 si possono associare autofunzioni approssimate:
per ogni ε > 0 sia
P (λ0 , ε) = E(λ0 + ε) − E(λ0 )
il proiettore sul sottospazio S(λ0 , ε), al quale appartenga f . Allora
λ0 +ε
T f − λ0 f = (λ − λ0 )dE(λ)f e quindi ||T f − λ0 f || ≤ ε .
λ0
Questi risultati sono stati estesi, anche sull’onda della loro rilevanza in meccanica quanti-
stica, nel 1928 da von Neumann al caso di operatori autoaggiunti non limitati e sono stati
oggetto di studio da parte di molti autori.
Per una prima presentazione dettagliata si vedano ad esempio Riesz-Nagy[20] o Hudson-Pymm[13].
Pertanto A + λB è compatto.
3) Sia
An ∈ K(E) e ||An − A||L(E) → 0
e sia ||xn || ≤ M . Allora {A1 xn } è precompatta: sia A1 x1n → y1 , dove x1n è una sottosuccessione
di xn . Allora {A2 x1n } è precompatta: sia A2 x2n → y2 , dove x2n è una sottosuccessione di x1n .
Allora ...
Sia zn = xnn la sottosuccessione diagonale. Dato ε > 0, sia p sufficientemente grande perché
||A − Ap || < ε. Qualunque sia p la successione Ap zn converge e dunque è di Cauchy: per n, m
sufficientemente grandi ||Ap (zn − zm )|| < ε. Pertanto
≤ Mε + ε + Mε .
Cioè Azn è di Cauchy e convergente, essendo E di Banach. Dunque per ogni successione limitata
xn , la successione trasformata Axn ammette una sottosuccessione Azn convergente e A ∈ K(E).
q.e.d.
Osservazione. Ricorrendo alla caratterizzazione, in uno spazio metrico, dei precompatti come
insiemi totalmente limitati, il terzo punto si potrebbe anche dimostrare nel modo seguente.
Essendo L(E) uno spazio di Banach A ∈ L(E) e per vedere che è compatto, in virtù della
linearità, basta verificare che A(B) è precompatto, dove B = B1 (0) è la sfera unitaria di centro
0 . Fissato arbitrariamente ε > 0 sia ||An − A|| < ε. An (B) è precompatto ed ammette dunque
un ε-reticolo finito {y1 , y2 , ...yN }, il quale risulta un 2ε-reticolo finito per A(B) : se z ∈ B
di una struttura compatibile di spazio di misura finita. (L’ipotesi di compattezza serve solo per
lo studio delle funzioni continue).
è compatto.
è un algebra in C2 che contiene le costanti e separa i punti di [a, b]2 (bastano i due monomi x e
y per operare la separazione) e dunque, per il teorema di Stone-Weierstrass è densa in C2. Dato
ε > 0 sia P (x, y) tale che
Ricordando che b
||K̂||L(C) = max |K(x, y)|dy ≤ (b − a)||K||∞
x∈[a,b] a
si vede che K̂ è limite nella norma di L(C) di operatori P̂ con nucleo separabile (somma di
prodotti di funzioni della sola x per funzioni della sola y), quindi con immagine in dimensione
finita:
b
L(x, y) = fj (x)gj (y) ⇒ L̂ϕ(x) = ( gj (y)ϕ(y)dy)fj (x) ,
j j a
cioè Im(L̂) coincide con il sottospazio generato dalle fj . Ma un operatore continuo con immagine
in dimensione finita è ovviamente compatto e quindi K̂, quale limite di tali operatori è compatto.
2) Sia L2 = L2 ([a, b]) e K ∈ L2 = L2 ([a, b]2 ). Allora l’operatore integrale K̂ definito come al
solito da b
(K̂f ) = K(x, y)f (y)dy
a
è compatto.
dove gli Aj sono misurabili. Per ogni Aj esiste un insieme Bj , unione finita di rettangoli, tale
che, indicando con µ la misura di Lebesgue:
ε
µ(Aj ∆Bj ) ≤ N .
N 1 |cj |2
Sia allora
N
Ln (x, y) = cj χBj .
j=1
Si ha
b b
N b b
N
N
||Kn − Ln ||2L2 ≤ ( 2
|cj |χAJ ∆Bj ) dxdy ≤ ( |cj |2 χ2AJ ∆Bj )dxdy ≤
a a 1 a a 1 1
N N b
b
N
ε
≤ |cj |2 χAJ ∆Bj dxdy ≤ |cj |2 N N =ε.
1 1 a a 1 N 1 |cj |2
La funzione caratteristica di un rettangolo con i lati paralleli agli assi è prodotto di due funzioni
caratteristiche (una della sola x, l’altra della sola y) e quindi Ln , come combinazione lineare
finita di tali funzioni, è separabile e ha immagine in dimensione finita. Si conclude allora come
nel caso precedente per garantire la compattezza di K̂ .
Se K ∈ L2 e K(x, y) = K(y, x)
b b b b
( K(x, y)f (y)dy)g(x)dx = f (y)( K(y, x)g(x)dx)dy
a a a a
e quindi
+∞
M (x, y) = λj ϕj (x)ϕj (y) .
j=1
Infatti, posto
+∞
n
f= (g, ϕj )ϕj e fn = (g, ϕj )ϕj ,
j=1 j=1
si ha
n
|K̂g(x) − λj (g, ϕj )ϕj (x)|2 = |K̂f (x) − K̂fn (x)|2 =
j=1
b b b
2 2
=| K(x, y)(f (y) − fn (y))dy| ≤ |K(x, y)| dy |f − fn |2 (y)dy ≤ C 2 ||f − fn ||2
a a a
e la convergenza uniforme deriva dalla convergenza in norma.
Inoltre b
n
n
n
|λj (g, ϕj )ϕj (x)| ≤ ( |(g, ϕj )|2 )1/2 ( | K(x, y)ϕj (y)dy|2 )1/2 ≤
1 1 1 a
Notiamo che se f è continua allora y ∈ C 2 e l’equazione è soddisfatta in tutto ]a, b[. Infatti
se in x0 il termine noto f è continuo e l’equazione è soddisfatta allora y è continua. Se in x0 il
termine noto f fosse continuo, ma l’equazione non fosse soddisfatta, si avrebbe
Ma allora y− e y+ esisterebbero e sarebbero uguali, dunque esisterebbe y , l’equazione sarebbe
soddisfatta e y sarebbe continua.
Più in generale se f, q ∈ C k si vede che ogni soluzione y dell’equazione è di classe C 2+k .
Nel seguito per semplicità supporremo f almeno continua e l’equazione ovunque soddisfatta.
Il caso più generale considerato nella formulazione del problema si tratta facilmente consideran-
do i successivi intervalli di continuità di f .
equivale a
(P y ) + Qy = f perché eA y + aeA y = (eA y ) .
Sia allora
dx 1
= P (x) , p = , t = p(x) , x = p−1 (t) ,
dt P
dz 1
z(t) = y(x) = y(p−1 (t)) , = y = y P.
dt p
Dunque
d(y P ) d2 z 1
= 2
dx dt P (x)
e finalmente
d2 z
+ P Q(p−1 (t))z = P f .
dt2
L[y] = −y + qy
con dominio lo spazio lineare delle funzioni C 2 che soddisfano alle condizioni ai limiti.
Teorema. Gli eventuali autovalori di L sono reali e inferiormente limitati, cioè esiste λ0
tale che per λ ≤ λ0 l’unica soluzione di −y + qy = λy, con y soddisfacente alle condizioni ai
limiti, è la soluzione nulla.
e quindi
2 1 2
|y(a)|2 + |y(b)|2 ≤ 2||y|| ||y || + ||y||2 ≤ ε||y ||2 + ( + )||y||2 .
b−a ε b−a
q.e.d.
Dimostrazione del teorema. Sia y soluzione di L[y] = λy. Moltiplicando entrambi i membri
per y e integrando su (a, b) e poi integrando per parti, si trova
b b
0= (−y y + q|y|2 − λ|y|2 ) = [−y y]ba + (|y |2 + (q − λ)|y|2 ) =
a a
b
B|y(b)|2 + A|y(a)|2 + (|y |2 + (q − λ)|y|2 ,
a
si ottiene
λ||y||2 ≥ m||y||2 + ||y ||2 − M (|y(a)|2 + |y(b)|2 ) ≥ λ0 ||y||2 ,
se si prende
εM < 1 e λ0 = m − M Cε .
Ne segue che per y ≡ 0 deve essere λ > λ0 . q.e.d.
Sia I = [a, b] e per ogni t ∈]a, b[ cerchiamo una funzione Kt (x) tale che
1) Kt ∈ C(I) ∩ C 2 (I − {t}) ,
2) Kt (t+ ) − Kt (t− ) = −1 ,
3) −Kt + qKt = 0 in I − {t} ,
4) Kt soddisfa alle condizioni ai limiti.
Teorema. Per ogni t esiste un’unica funzione Kt che soddisfa le condizioni 1), 2), 3) e 4).
La funzione K(x, t) = Kt (x) è detta la funzione di Green del problema di Sturm-Liouville.
Dimostrazione. Per le note proprietà sui problemi di Cauchy per le equazioni lineari, esistono
due funzioni reali non nulle u1 e u2 soddisfacenti le condizioni:
entrambe individuate a meno di una costante moltiplicativa. Esse sono linearmente indipendenti,
perché se fossero proporzionali esisterebbe una soluzione y non nulla dell’equazione −y +qy = 0
soddisfacente ad entrambe le condizioni ai limiti e λ = 0 sarebbe un autovalore dell’operatore
L. Esse costituiscono dunque un sistema fondamentale di soluzioni dell’equazione omogenea
−y + qy = 0, nel solito senso che la soluzione generale di tale equazione è della forma
y = c1 u1 + c2 y2 ,
W = u1 u2 − u1 u2 = 0
è costante, in quanto
u u2 u1 u2 u1 u2
D 1 = = q =0.
u1 u2 u1
u2 u1 u2
Dunque una funzione di Green esiste, ed essa è unica perché u1 , u2 sono individuate da costanti
moltiplicative, esattamente compensate dal Wroskiano a denominatore. q.e.d.
Osservazione. La funzione di Green K(x, t) può ovviamente essere prolungata per conti-
nuità al quadrato chiuso [a, b]2 , è reale e dalla sua espressione esplicita si controlla che risulta
simmetrica K(x, t) = K(t, x) .
Allora
u2 (x) x
u1 (x) b
u1 (x)u2 (x)
y (x) = − u1 f − u2 f ∓ − f (x) .
W a W x W
e successivamente
u2 (x) x
u1 (x) b
u1 (x)u2 (x) − u1 (x)u2 (x)
y (x) = − u1 f − u2 f − f (x) .
W a W x W
Dunque, essendo ui = qui :
y (x) = q(x)y(x) − f (x) .
Anche le condizioni ai limiti sono soddisfatte, perché in a y, y sono proporzionali a u1 , u1 e
analogamente in b .
2) sia y soluzione del problema di Sturm-Liouville. Consideriamo le equazioni
Integrando su [a, x] e su [x, b] e ricorrendo alla formula di integrazione per parti, si trova
x
(Kx (t)y (t) − y(t)Kx (t))dt = [y Kx ]xa − [yKx ]xa = y (x)Kx (x) − y(x)Kx (x− ) ,
a
perché
y(a) Kx (a)
=0.
y (a) Kx (a)
Analogamente
b
(Kx (t)y (t) − y(t)Kx (t))dt = [y Kx ]bx − [yKx ]bx = −y (x)Kx (x) + y(x)Kx (x+ ) .
x
q.e.d.
Segue immediatamente il
dove b
g(x) = K(x, t)f (t)dt .
a
è compatto e autoaggiunto in L2 (a, b). Inoltre si vede facilmente, per la continuità uniforme di
K che esso trasforma funzioni di L2 in funzioni continue.
Se y è una sua autofunzione associata all’autovalore (necessariamente reale) µ = 0
K̂y = µy ,
allora y è continua e, per quanto visto nella sezione precedente, soluzione del problema di
Sturm-Liouville
−y (x) + q(x)y(x) = 1 y(x)
µ .
h y(a) + k1 y (a) = 0
1
h2 y(b) + k2 y (b) = 0
Allora deve essere µ > 0 e λ = µ1 è un autovalore dell’operatore differenziale L (o come si dice
del problema di Sturm-Liouville) e y è una autofunzione di L associata a λ .
Da quanto sappiamo sui nuclei di classe L2 segue immediatamente il primo punto del seguente
Teorema.
1) Il problema di Sturm-Liouville ammette una successione di autovalori λn tali che
+∞
b b
1
lim λn = +∞ , 2
= |K(x, t)|2 dxdt < +∞ .
n
n=1
λ n a a
È noto che le funzioni del tipo suddetto formano un sottoinsieme denso il L2 e dunque deve
essere f = 0 .
(*Si potrebbe dire che la convergenza di yj a 0 in L2 implica la convergenza di yj a 0 nel senso
delle distribuzioni e quindi quella di yj a 0 sempre nel senso delle distribuzioni. Ma yj converge
ad f in L2 e quindi ad f nel senso delle distribuzioni. Per l’unicità del limite f = 0 .*)
4) Se f ∈ C 2 e soddisfa alle condizioni ai limiti, si ha
f = K̂g con g = −f + qf
e il risultato segue dalle note proprietà delle autofunzioni degli operatori integrali con nucleo
tale che b
∀x |K(x, y)|2 dy ≤ C 2 ,
a
affermazione certamente vera per la funzione di Green, che è ovunque continua. q.e.d.
6.1 Equicontinuità.
Le ipotesi seguenti si possono notevolmente generalizzare (si veda ad esempio L.Schwartz[22]),
ma per semplificare la presentazione delle idee fondamentali e per garantire la maggior parte
delle applicazioni le restrizioni assunte sembrano adeguate.
Sia (K, d) uno spazio metrico compatto e F uno spazio di Banach. Indichiamo, analogamente
al caso di funzioni a valori reali o complessi, con C(K; F ) lo spazio delle funzioni definite e
continue da K in F , normato da
||f || = max ||f (x)||F .
x∈K
99
100 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità
0 < ε ≤ ||fnj (xnj ) − fnj (ynj )|| ≤ ||fnj (xnj ) − fnj (z)|| + ||fnj (z) − fnj (ynj )|| → 0
Esempio. Se le funzioni di F sono tutte Hölderiane con uno stesso esponente α ∈]0, 1] e
con una stessa costante L :
||f (x) − f (y)||F ≤ Ld(x, y)α ,
allora sono equicontinue.
n−1
||f (y) − f (x)|| ≤ ||f (yk+1
n
) − f (ykn )|| ≤ L |yk+1
n
− ykn |α ≤
k=0 k
|y − x| n
≤L ( )α ≤ L|y − x| α → 0
n n
k
per n → +∞ .
Teorema (Versione parziale del primo teorema di Ascoli). Sia fn una successione di
funzioni equicontinue in a e convergenti semplicemente ad una funzione limite f in un intorno
A di a. Allora f è continua in a.
Dimostrazione. Dato ε > 0 sia U (a) ⊂ A un intorno di a tale che
dunque
d(f (x), f (a)) ≤ d(f (x), fn (x)) + d(fn (x), fn (a)) + d(fn (a), f (a)) ≤ 3ε ,
q.e.d.
Teorema (Versione semplificata del secondo teorema di Ascoli). Sia (K, d) uno spazio
metrico compatto. Sia fn , n ≥ 1 una successione di funzioni equicontinue in K convergente
semplicemente in K ad una funzione limite f0 , necessariamente continua. Allora fn converge
uniformemente a f0 in K.
Dimostrazione. La successione fn , n ≥ 0 è ancora equicontinua. Dato ε > 0 , per ogni x ∈ K
sia U (x) un intorno aperto di x nel quale
||fn (z) − f0 (z)|| ≤ ||fn (z) − fn (xj )|| + ||fn (xj ) − f0 (xj )|| + ||f0 (xj ) − f0 (z)|| ≤ 3ε .
q.e.d.
Si può dimostrare il seguente teorema, del quale omettiamo, per il momento, la dimostrazione.
Teorema. Sia (K, d) uno spazio metrico (si considera ovviamente la topologia indotta dalla
distanza d). Allora K è compatto ⇔ K è numerabilmente compatto ⇔ K è sequenzialmente
compatto.
b) Un insieme K in uno spazio metrico (X, d) si dice totalmente limitato se e solo se per ogni
ε > 0 esiste un numero finito Nε di sfere Bk di diametro ε la cui unione ricopre K. I centri
ck di tali sfere, o qualunque insieme di punti xk (uno in ciascuna Bk ) costituiscono un insieme
finito di elementi in grado di approssimare ogni elemento di K a meno di ε o come si dice un
ε-reticolo finito per K.
Teorema. Uno spazio metrico (K, d) è compatto se e solo se è totalmente limitato e com-
pleto.
A = ∪Bn,j ⊆A Bn,j ,
perché se x ∈ A esiste r tale che Br (x) ⊆ A ed esistono zn , j tali che d(zn , x) < 1/j < r/2 ,
dunque Bn,j ⊆ Br (x) ⊆ A. q.e.d.
Si noti che con questo teorema, accettando l’equivalenza di compattezza numerabile e com-
pattezza sequenziale negli spazi metrici, è immediato controllare che, sempre negli spazi metrici,
la compattezza sequenziale implica la compattezza, seguendo lo schema seguente:
e allora da ogni ricoprimento aperto di K se ne può estrarre uno numerabile, dal quale succes-
sivamente se ne può estrarre uno finito.
Viceversa la compattezza implica la compattezza sequenziale, perchè implica la compattezza
numerabile.
È bene tener presente che le seguenti affermazioni a) e b), nelle quali X è un generico spazio
topologico, sono equivalenti.
a) Da ogni ricoprimento aperto [da ogni ricoprimento aperto numerabile] di X si puiò estrarre
un sottoricoprimento finito;
b) Ogni famiglia [ogni famiglia numerabile] di chiusi di X centrata ha intersezione non vuota,
dove centrata significa che l’intersezione di un numero finito arbitrario di elementi della famiglia
xn ∈ ∩n1 Ck e xnj → x .
Allora
∀N xnj ∈ CN definitivamente ⇒ x ∈ CN ⇒ x ∈ ∩∞
1 Ck = ∅ .
q.e.d.
* * *
dove V (x) indica un intorno di x, che non è restrittivo supporre aperto. Essendo K compatto
possiamo trovare un numero finito di tali intorni aperti
Y ⊆ ∪M
k=1 Bε (ak ) ,
dove le ak sono un ε-reticolo (finito) per Y . Osserviamo che per ogni f ∈ F esiste una
applicazione
ϕ : {1, 2, ...n} → {1, 2, ...M }
||f (x) − g(x)|| ≤ ||f (x) − f (xi )|| + ||f (xi ) − aϕ(i) ||+
Teorema. Sia Ω limitato. Sia F una famiglia fi funzioni di Lp (Ω) tale che:
1) F è limitata in norma: supf ∈F ||f ||p < +∞,
2) per ogni ε > 0 esiste δ tale che per ogni vettore h ∈ Rn e per ogni f ∈ F risulta
||h|| < δ ⇒ ||f (· + h) − f (·)||p = ( (|f (x + h) − f (x)|p dx)1/p < ε .
Ω
Teorema (di Peano). Sia (t0 , y0 ) ∈ R × RN ed f (t, y) una funzione continua in un intorno
di (t0 , y0 ), a valori in RN . Allora esistono T > 0 e una funzione y : I = [t0 − T, t0 + T ] → RN
tali che
y (t) = f (t, y(t)) t∈I
y(t0 ) = y0
Per semplicità svolgiamo la dimostrazione nel caso N = 1. Non è restrittivo supporre che
l’intorno in cui f è supposta continua sia per esempio un disco chiuso D di centro (t0 , y0 ) e
raggio r > 0, quindi compatto. La funzione continua |f | è allora limitata in D e sia |f (t, y)| ≤ M
. Consideriamo un cono chiuso C definito da
C = { (t, y) | ||y − y0 || ≤ M |t − t0 | , t ∈ [t0 − T, t0 + T ] } ,
dove T è scelto in modo tale che C ⊂ D . Essendo N = 1 in effetti ||y|| = |y| e C è formato
da due triangoli. Limitiamo le considerazioni successive a valori t ≥ t0 e quindi al triangolo
∆ a destra di t0 . Per semplicità supporremo t0 = 0. Costruiamo delle approssimazioni della
soluzione dell’equazione integrale nel modo seguente: per ogni n > 0 definiamo yn mediante le
relazioni
y0 0 ≤ t ≤ Tn ,
yn (t) = t−T /n
y0 + 0 f (s, yn (s))ds t ≥ Tn .
Ogni funzione yn è ben definita: è assegnata, costante, sul primo intervallo [0, T /n] ed è calcolabi-
le sull’intervallo [kT /n, (k + 1)T /n] mediante un’integrazione che richiede soltanto la conoscenza
di yn su [0, kT /n] . Si può allora operare iterativamente sui successivi intervalli di ampiezza T /n
, controllando che il grafico di yn progressivamente ottenuto non esce dal triangolo ∆ :
t−T /n
|yn (t) − y0 | ≤ |f (s, yn (s))|ds ≤ M |t − 0| = M t
0
Infatti la condizione 1) è già stata verificata in fase di costruzione delle yn e la 2) risulta subito
dalle maggiorazioni
t −T /n
|yn (t) − yn (t )| ≤ |f (s, yn (s))|ds ≤ M (t − t) ,
t−T /n
perchè f (s, ynk (s)) → f (s, y(s)) uniformemente per la continuità uniforme di f sul compatto ∆.
q.e.d.
Osservazione. Si osservi che il fatto che l’unicità della soluzione del problema di Cauchy
non sia garantita è coerente con la possibilità che diverse sottosuccessioni convergenti abbiano
funzioni limite diverse, tutte soluzione del problema.
I teoremi fondamentali
dell’Analisi funzionale
Gli insiemi che si possono rappresentare come unione numerabile di insiemi rari, cioè gli
insiemi magri, si dicono anche insiemi di prima categoria. Gli insiemi che non sono di prima
categoria si dicono di seconda categoria.
Esempi.
1) Sia S = { 1, 1/2, 1/3, ... }, munito della distanza d(s, t) = |s − t| indotta da R. Per ogni
s ∈ S, { s } è chiuso (se t = s e r = |t − s|/2, si ha Br (t) ∩ { s } = ∅) e aperto (esiste r tale che
Br (s) = { s }) non vuoto. Dunque { s } non è raro. Ogni sottoinsieme chiuso contiene un { s }
e dunque S non è magro.
2) Sia Q, munito della metrica usuale. Se r ∈ Q, allora { r } è chiuso ed ha interno vuoto.
Dunque { r } è raro e Q è magro. Si osservi che, in R, Q è magro, ma non raro: Q = R e il
suo interno non è vuoto.
3) Una superficie regolare Σ di dimensione ≤ n−1 in Rn (ad esempio una superficie di equazione
f (x1 , x2 , ..., xn ) = 0, con f regolare) è un insieme raro in Rn . Cosı́ l’insieme S delle matrici
109
110 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale
2
quadrate A, n × n, singolari, pensate come elementi di Rn , è un insieme raro (è caratterizzato
dalla relazione algebrica tra i coefficienti det A = 0).
Definizione. Uno spazio topologico X si dice spazio di Baire se e solo è soddisfatta una
delle seguenti condizioni equivalenti:
a) ogni successione Cn di chiusi con interno vuoto ha un’unione ∪n Cn ancora con interno vuoto,
dunque ogni sottoinsieme magro è privo di punti interni ( v. punto c) );
b) ogni successione di aperti An densi in X ha un’intersezione ∩n An ancora densa in X
(il complementare di An è un chiuso Cn privo di punti interni);
c) ogni aperto non vuoto di X non è magro
(se un aperto A fosse unione numerabile insiemi rari Rk , si avrebbe Rk chiuso con interno vuoto
e, per a), ∪k Rk dovrebbe avere interno ancora vuoto e non potrebbe contenere A; viceversa,
se al punto a) si avesse (∪n Cn )◦ = A = ∅, allora l’aperto A sarebbe unione numerabile degli
insiemi rari A ∩ Cn ).
Si può dimostrare che ogni spazio localmente compatto ed ogni spazio metrico completo sono
spazi di Baire. Vediamo la dimostrazione nel caso degli spazi metrici.
Teorema (di Baire). Sia (X, d) uno spazio metrico completo. Allora X è uno spazio di Baire.
In uno spazio di Baire X una proposizione P (x) è genericamente vera se essa vale per tutti
i punti di X tranne quelli di un insieme magro, ovvero se esiste un insieme E ⊆ X intersezione
numerabile di aperti denso, o come si dice se esiste un insieme Gδ , denso, tale che P (x) è vera
per ogni x ∈ E. Si dice anche che P (x) è vera B-quasi ovunque (B per Baire).
Si osservi che, se lo spazio topologico X ha anche una struttuta di spazio misurabile, con
misura µ , le affermazioni “P(x) vale µ-q.o. e “P(x) vale B-q.o. non hanno in generale alcuna
relazione tra di loro.
1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − , rk + k [ .
2k 2
Teorema di Baire sui limiti di funzioni continue. Sia T uno spazio topologico, fn una
successione di funzioni da T in R ovunque continue e convergenti in ogni punto di t ∈ T ad un
limite f (t). Allora f è continua B-quasi ovunque (cioè l’insieme dei punti di T dove f non è
continua è magro).
Dimostrazione. Poniamo:
◦
Ank = {t ∈ T | |fk (t) − f (t)| ≤ 1/n} , B n = ∪k Ank , C = ∩n B n .
1) Sia t ∈ C: indicando con V (t), W (t)... intorni di t, abbiamo che per ogni n
∀z ∈ V (t) ∩ W (t) |f (z) − f (t)| ≤ |f (z) − fk (z)| + |fk (z) − fk (t)| + |fk (t) − f (t)| ≤ 3/n
e f risulta continua in t.
2) Sia f continua in t, poiché fj (t) → f (t): ∀n∃k |fk (t) − f (t)| ≤ 1/3n. Inoltre per la
continuità di f e fk in t esiste U (t) tale che per ogni z ∈ U (t) si ha |f (z) − f (t)|, |fk (z) − fk (t)| ≤
1/3n. Allora
∀n∃k∃U (t)∀z ∈ U (t)|fk (t) − f (t)| ≤ 1/n ,
cioè t ∈ C.
Poniamo ora Fkn = {t ∈ T | ∀p |fk (t) − fk+p (t)| ≤ 1/n} ⊆ Ank . Visto che le fk sono continue
e che l’intersezione di chiusi è un chiuso, Fkn è chiuso.
Ma, poiché fj (t) → f (t) ovunque, si ha T = ∪+∞ n
k=1 Fk . Allora
◦ ◦ ◦ ◦
Fkn ⊆ Ank , ∪k Fkn ⊆ B n , T − B n ⊆ ∪k (Fkn − Fkn ) .
◦
Per la chiusura di Fkn gli insiemi (Fkn − Fkn ) sono rari e T − B n come T − C = ∪n (T − B n ) è
magro. q.e.d.
Per la continuità di Tα e della norma l’insieme Cnα = { x ∈ E | ||Tα x|| ≤ n } è chiuso e dunque
Cn = ∩α Cnα è chiuso. Per l’ipotesi 2) ogni x ∈ E appartiene a qualche Cn , dunque E = ∪n Cn .
Lo spazio E è di Banach, dunque metrico completo e dunque di Baire, cioè non può essere unione
numerabile di chiusi a interno vuoto. Sia CN provvisto di punti interni e sia Br (u) ⊂ CN . Allora
∀α ∈ A e ∀v tale che ||v|| < 1 risulta ||Tα (u + rv)|| ≤ N ,
ma ||Tα (rv)|| − ||Tα u|| ≤ ||Tα (u + rv)|| ≤ N e quindi
r||Tα ||L(E,F ) = r sup ||Tα v|| ≤ N + ||Tα u|| ≤ 2N .
||v||<1 , v=0
q.e.d.
Allora T , che ovviamente è lineare, risulta limitato e vale la maggiorazione della sua norma
prevista dalla tesi del corollario. q.e.d.
(Il duale E ∗ è un sottospazio del duale algebrico E , costituito da tutte le applicazioni lineari,
non necessariamente continue, da E in K. Molti autori indicano il duale topologico con E ed
il duale algebrico con E ∗ ).
È talvolta possibile fornire rappresentazioni significative del duale di uno spazio di Banach.
Ad esempio si dimostra che il duale topologico di Lp (X, A, µ; R), dove µ è una misura finita o
σ-finita e p > 1, è isomorfo a Lq (X, A, µ; R), dove q è l’esponente coniugato di p : 1/p + 1/q = 1,
nel senso che ogni funzionale G lineare e continuo è della forma
G(f ) = f (x)g(x)dµ(x)
X
con g ∈ L .
q
Il duale E ∗∗ del duale E ∗ , cioè il biduale, nel caso di Lp si può identificare con Lp stesso e,
come si dice, lo spazio Lp è riflessivo.
Gli spazi lp sono casi particolari degli spazi Lp ora considerati e quindi il duale di lp è iso-
morfo ad lq , con p > 1 e q esponente coniugato di p.
Per p = 2 si ha che L2 è isomorfo al proprio duale, e ciò in accordo con il fatto che L2 ha una
struttura Hilbertiana e per gli spazi di Hilbert vale il teorema di rappresentazione di Riesz.
Osservazione. Nel caso particolare dei funzionali lineari e continui si usa una terminologia
per la convergenza in norma e puntuale ovunque, diversa rispetto a quella adottata per operatori
lineari e continui generali.
Nel caso degli spazi riflessivi ovviamente la convergenza debole e quella debole* coincidono.
Non sempre in uno spazio di Banach la convergenza debole è strettamente più debole di quel-
la forte, cioè della convergenza in norma. Ovviamente esse coincidono in spazi di dimensione
finita, ma ad esempio anche in l1 xn → x fortemente se e solo se xn → x debolmente.
Le convergenze deboli e deboli* sono indotte da corrispondenti topologie, che, come si vede
direttamente dalla definizione, rendono gli spazi E o E ∗ locammente convessi.
Definizione. Sia E uno s.v.t. La topologia debole* (weak*, faible σ(E ∗ , E)) su E ∗ è la
topologia che ammette come sistema fondamentale di intorni di ogni g ∈ E ∗ gli insiemi
V (x1 , x2 , ...xN ; ε)(g) = {f ∈ E ∗ | | < xk , f − g > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, x1 , x2 ...xN sono elementi di E e ε > 0.
Osservazione. È immediato verificare che E ∗ munito della topologia debole* è uno spazio
vettoriali topologico, cioè le operazioni di somma e di prodotto per uno scalare sono continue.
Gli intorni di ogni elemento g si ottengono come traslazioni degli intorni di 0. Dunque basta più
semplicemente indicare come sistema fondamentale di intorni di 0 gli insiemi
V (x1 , x2 , ...XN ; ε) = {f ∈ E ∗ | sup | < xk , f > | < ε} .
1≤k≤N
Analogamente
Definizione. Sia E uno s.v.t. La topologia debole (weak, affaiblie σ(E, E ∗ )) su E è la
topologia che ammette come sistema fondamentale di intorni di ogni y ∈ E gli insiemi
V (f1 , f2 , ...fN ; ε) = {x ∈ E | | < x − y, fk > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, f1 , f2 ...fN sono elementi di E ∗ e ε > 0.
Osservazione. In E ∗ si possono considerare sia la topologia debole* (σ(E ∗ , E)) che la topo-
logia debole (σ(E ∗ , E ∗∗, )), più forte della prima, essendo E ⊆ E ∗∗ , o meglio E isomorfo ad un
sottospazio di E ∗∗ .
Esempio (von Neumann). Una successione di l2 (N) che ammette 0 quale punto limite,
ma tale che nessuna sua sottosuccessione è convergente a 0: siano p e q > p due interi positivi
e xpq = (0, 0...1, ...p, 0...) la successione (ovviamente in l2 e di norma (1 + p2 )1/2 ) con tutte le
componenti nulle, tranne la p-esima uguale a 1 e la q-esima uguale a p (xpq p = 1, x
pq
q = p).
Infatti, ricordando che l2 , insieme di tutte le successioni a valori reali zk tali che k zk2 < +∞,
è uno spazio di Hilbert isomorfo al suo duale (Teorema di Riesz) e quindi riflessivo, si ha
1) Date f j ∈ l2 , j = 1, ...N arbitrarie e ε > 0
| < xpq , f j > | = |(xpq , f j )| = |fpj + pfqj | ≤ |fpj | + p|fqj | < ε
per p sufficientemente grande perché maxj |fpj | < ε/2 e q ulteriormente sufficientemente gran-
de affinché maxj |fqj | < ε/2p. Dunque in ogni intorno V (f 1 , f 2 ...f N ; ε) di 0 esiste almeno un
elemento xpq della successione e 0 è un suo punto di accumulazione (0 non è un elemento della
successione).
2) I punti del tipo ep∗ = (0, 0, 0, ...1, 0...), con 1 è in posizione p∗ , sono altri punti limite. Infatti
∗
la sottosuccessione xp q per q → +∞ converge debolmente a ep∗ . Si osservi che per p → +∞ si
ha en → 0.
3) Qualunque sottosuccessione non converge a 0. Sia X n = xpn qn una sottosuccessione conver-
gente. Se pn ≤ P per ogni n allora, presa g = (1, 1...1, 0, 0...) con esattamente P componenti
1 nelle prime posizioni, si ha (X n , g) ≥ 1 e X n non converge a 0. Se invece vi sono infiniti
indici pn distinti, diciamo nelle posizioni pν , potendo supporre, eventualmento effettuando una
ulteriore selezione, che anche le qν siano distinte tra di loro e crescenti,prendiamo g tale che
gqν = 1/pν e gj = 0 per j = qν . Abbiamo allora g ∈ l2 e (X ν , g) ≥ 1 e come prima non vi può
essere convergenza a 0.
L’esempio è completamente giustificato.
Consideriamo qualche caso, connesso a questioni che hanno in modo autonomo un grande
interesse, di convergenza forte o debole*.
Ricordiamo che il supporto di una funzione è la chiusura dell’insieme dei punti nei quali non si
annulla.
Ad esempio si può prendere αε = ρε , dove
c exp(|x|2 − 1)−1 |x| < 1 ,
ρ(x) =
0 |x| ≥ 1 ,
con c = 1/ exp(|x|2 − 1)−1 dx , e ρε (x) = ρ(x/ε)/εn .
L’operazione ∗ si dice convoluzione tra le due funzioni (in questo caso f e αε ). Gli operatori
Tε sono lineari e continui da Lp (Ω) in sé stesso e convergono fortemente all’identità I :
La funzione fε ∈ C ∞ (Ω) .
Gli operatori Tε , in quanto operatori integrali con nucleo regolare, sono compatti e quindi non
possono convergere in norma ad I, che non è compatto, non essendo Lp di dimensione finita.
Approssimando prima f con funzioni in Lp a supporto compatto in Ω , ad esempio ponendo
2) Sia E = L1 (a, b), con la misura standard di Lebesgue dx. Siano α e β due costanti reali
diverse e, per ogni n ≥ 1 , posto xnk = a + nk (b − a) , si considerino le funzioni limitate
α xnk ≤ x < xnk + θ(b−a) n ,
gn (x) =
β xnk + θ(b−a)n ≤ x < xn
k+1 ,
dove 0 < θ < 1 . Dunque l’intervallo (a, b) è suddiviso in n intervallini di eguale ampiezza,
ciascuno dei quali è a sua volta diviso in due intervallini consecutivi di ampiezza proporzionale
rispettivamente a θ e 1 − θ , sui quali gn è costante, rispettivamente uguale prima ad α e poi β
(gn è periodica di periodo (b − a)/n).
Poniamo b
Gn (f ) = f (x)gn (x)dx .
a
come si verifica facilmente, prima considerando funzioni f continue o costanti a tratti e poi
ragionando per densità. Dunque gn → g , o più precisamente Gn → G debole*. Tuttavia non
si ha convergenza in norma. Sia infatti fn uguale a 1 o 0 sugli stessi intervalli parziali di gn ,
allora
b−a
||fn || = n θ = θ(b − a)
n
e fn è limitata, ma
b
||gn − g||∞ ||fn || ≥ | (gn (x) − g(x))fn (x)dx| = θ(1 − θ)|α − β|(b − a)
a
non tende a 0.
Osserviamo che C è chiuso, per definizione, convesso, per la convessità di B1 (0) e la linearità di
T e tale che C = −C. Sia Cn = nC = T (Bn (0)) , allora per a suriettività di T si ha F = ∪n Cn .
Ma F è uno spazio di Banach, dunque metrico completo e dunque di Baire. Pertanto esiste p
tale che Cp ha interno non vuoto e di conseguenza C ha interno non vuoto. Siano allora y ∈ C
e r > 0 tali che B4r (y) ⊂ C . Poiché −y ∈ −C = C , si trova
Se ne deduce che
r 1
∀y ∈ F ||y|| < ⇒ ∀ε > 0 ∃x ∈ E ||x|| < e ||y − T x|| < ε .
2n−1 2n
Infatti, se ||y|| < r/2n−1 , ||2n y|| < 2r ed esiste x∗ tale che ||x∗ || < 1 e ||2n y − T x∗ || < 2n ε .
Allora possiamo prendere x = x∗ /2n .
In secondo luogo verifichiamo che, con lo stesso r precedente, si ha effettivamente Br (0) ⊆
T (B1 (0)). Sia y un generico elemento di Br (0), cioè ||y|| < r. Ricorriamo all’ultima osservazione
per trovare, preso ε = r/2 , x1 tale che
1 r
||x1 || < e ||y − T x1 || < .
2 2
Poi, preso ε = r/22 , x2 tale che
1 r
||x2 || < e ||(y − T x1 ) − T x2 || < 2 .
22 2
1 n
r
||xn || < n
e ||y − T ( xk )|| < n .
2 1
2
+∞
Essendo E uno spazio di Banach, dunque completo, la serie 1 xk è convergente ad un
elemento x ∈ E tale che
||x|| < 1 e risulta y − T x = 0
per la contiuità di T . q.e.d.
Corollario 3. Siano || · ||1 e || · ||2 due norme nello spazio lineare E , rispetto a ciascuna
delle quali E risulta di Banach. Se esiste una costante C1 tale che
∀x ∈ E ||x||2 ≤ C1 ||x||1 ,
allora esiste una costante C2 tale che
∀x ∈ E ||x||1 ≤ C2 ||x||2 ,
ovvero le due norme sono equivalenti.
Dimostrazione. Se indichiamo con E1 ed E2 gli spazi di Banach ottenuti munendo E rispetti-
vamente delle norme || · ||1 e || · ||2 e consideriamo l’operatore identico I da E1 in E2 , la prima
disuguaglianza dice che I ∈ L(E1 , E2 ) . Essendo I = I −1 , per il corollario 1 si ha I ∈ L(E2 , E1 )
e quindi deve valere la secoda disuguaglianza con una opportona costante C2 . q.e.d.
Consideriamo ora opertatori lineari tra due spazi di Banach E ed F , non necessariamente
ovunque definiti e non necessariamente continui. Indicheremo con D(T ) il dominio di definizione
dell’operatore T . D(T ) è un sottospazio vettoriale di E .
È equivalente affermare che il grafico G(T ) di T è un sottospazio lineare chiuso dello spazio
prodotto E × F .
sottospazio proprio delle funzioni continue con derivata prima continua. T non è continuo, per-
ché fn ∈ D(T ) e fn → f uniformemente non implicano né f ∈ D(T ), né, qualora f esista,
fn → f uniformemente. Si considerino i seguenti controesempi:
a1) f continua in [a, b] , ma non derivabile ovunque. Per il teorema di Weierstrass esiste una
successioni di polinomi pn uniformemente convergenti ad f . Mentre pn ∈ D(T ) , non si ha
f ∈ D(T ) ;
a2) Sia fn (x) = |x|1+1/n . Si ha fn ∈ C 1 ([−1, 1]) e fn (x) → |x| uniformemente in [−1, 1] (perché
le fn convergono puntualmente in modo monotono ad una funzione continua). Ma |x| non è
derivabile nell’origine;
b1) Sia fn (x) = (sin(nx))/n in [0, 2π] . Allora fn → f ≡ 0 uniformemente, ma fn (x) = cos(nx)
non converge, neppure semplicemente, a f ≡ 0 ;
b2) Sia fn , n = 2, 3, ... continua in [0, 1] , nulla in [0, 1/(n + 1)] e in [1/(n − 1), 1] , lineare
[1/(n+1), 1/n] e in [1/n, 1/(n−1)], tale che fn (1/n) = 1 . Se fn (0) = 0, allora |fn | ≤ 1/(n2 −1) e
dunque fn → f ≡ 0 uniformemente, mentre fn → f ≡ 0 semplicemente ma non uniformemente.
Teorema del grafico chiuso. Siano E ed F due spazi di Banach e T un operatore lineare
da E in F chiuso e ovunque definito. Allora T ∈ L(E, F ).
Dimostrazione. Consideriamo in E , oltre alla norma || · ||E iniziale, anche la norma
detta norma del grafico. Se xn è una successione di Cauchy per la norma del grafico, allora xn e
T xn sono successioni di Cauchy per le norme || · ||E e || · ||F . Per la completezza di E ed F si ha
xn → x ∈ E , T x n → y ∈ F ,
e, per la chiusura di T , y = T x . Dunque ||xn − x||G → 0 e lo spazio E munito della norma del
grafico, che indicheremo con EG , risulta uno spazio di Banach. Inoltre, essendo ||x||E ≤ ||x||G ,
per il precedente corollario 2 esiste una costante C tale che
Ricordiamo la
Definizione. sia E uno spazio lineare, sul campo K ( R oppure C ). Una funzione p(x)
definita su E a valori reali si dice seminorma su E, se e solo se
1) p(x) ≥ 0 ∀x ∈ E ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = |λ|p(x) ∀(x, λ) ∈ E × K .
Teorema di Hahn-Banach. Sia p una seminorma sullo spazio lineare reale E . Sia L un
sottospazio lineare di E ed f una funzione lineare su L, tale che
∀x ∈ L f (x) ≤ p(x) .
Allora esiste una funzione lineare F su E che prolunga f , maggiorata ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E F (x) ≤ p(x) .
Osservazione. Non è necessario che p sia una seminorma. Basta che che soddisfi la condizione
2) nella definizione di seminorma (subadditività) e la condizione 3) solo per λ ≥ 0 (positiva
omogeneità).
Dimostrazione. Siano L = E , z ∈ E − L ed M il sottospazio generato da L e z.
M = { y = x + tz | x ∈ L , t ∈ R } .
Estendiamo f a M ponendo
F (x + tz) = f (x) + tc
e scegliendo la costante c = F (z) in modo che sia sempre F (y) ≤ p(y) . Ciò è possibile: basta
che per ogni x ∈ L si abbia
f (x/t) + c ≤ p(x/t + z) per t > 0
f (x/(−t)) − c ≤ p(x/(−t) − z) per t < 0 .
O, equivalentemente, che si abbia, per arbitrari x , x ∈ L ,
f (x ) − p(x − z) ≤ c ≤ p(x + z) − f (x ) .
Effettivamente, tutti i numeri a sinistra e rispetivamente a destra nelle disuguaglianze precedenti
formano due classi separate, in quanto
f (x ) + f (x ) = f (x + x ) ≤ p(x + x ) ≤ p(x − z) + p(x + z) ,
per la subadditività di p .
Qualunque valore di c compreso tra
sup (f (x ) − p(x − z)) e inf (p(x + z) − f (x ))
x ∈L x ∈L
è accettabile.
Sia ora G l’insieme di tutti i prolungamenti lineari G di f a sottospazi N tali che L ⊆ N e
G ≤ p su N . Ordiniamo parzialmente G ponendo: G ≤ H se e solo se D(G) ⊆ D(H) e H
prolunga G. Ogni sottoinsieme C di G totalmente ordinato possiede in G un maggiorante: il
funzionale lineare naturalmente definito sull’unione dei domini dei G ∈ C. In virtù del lemma
di Zorn esiste allora un funzionale F massimale in G. F è maggiorato da p sul suo dominio,
che deve coincidere con tutto E, altrimenti F potrebbe essere prolungato in modo ammissibile
e non sarebbe massimale. q.e.d.
Corollario. Nelle ipotesi precedenti, con p seminorma, risulta |F (x)| ≤ p(x). Infatti
−F (x) = F (−x) ≤ p(−x) = p(x) .
Se E è localmente convesso e p è una seminorma della famiglia che ne definisce la topologia,
allora F è continua.
Teorema. Sia p una seminorma sullo spazio lineare complesso E . Sia L un sottospazio
lineare complesso di E ed f una funzione lineare su L a valori complessi, tale che
∀x ∈ L |f (x)| ≤ p(x) .
Allora esiste una funzione lineare complessa F su E che prolunga f , in modulo maggiorata
ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E |F (x)| ≤ p(x) .
Dimostrazione. Considerando soltanto la moltiplicazione per scalari reali, si vede che E , L , ...
sono anche spazi lineari reali. f e f sono funzioni lineari reali su L , tali che
f (x) = −f (ix) , |f (x)| ≤ |f (x)| ≤ p(x) .
Per il teorema precedente possiamo estendere f ad un funzionale reale R definito su tutto E
e tale che |R| ≤ p. Poniamo allora
F (x) = R(x) − iR(ix) ,
da cui segue F (ix) = iF (x) ed F è un funzionale lineare complesso, che si verifica immediata-
mente essere un prolungamento di f . Inoltre se F (x) = ρ exp(iγ) , allora
|F (x)| = exp(−iγ)F (x) = F (exp(−iγ)x) = R(exp(−iγ)x) ≤
Dimostrazione. Basta applicare il teorema di Hahn-Banach, nel caso reale, o il teorema prece-
dente, nel caso complesso, con
p(x) = ||f ||L∗ · ||x|| .
q.e.d.
Corollario 2. sia E uno spazio normato. Per ogni x ∈ E esiste un funzionale F ∈ E ∗ tale
che
||F ||E ∗ = ||x||E e F (x) = ||x||2E .
Equivalentemente esiste un funzionale G = F/||x||E tale che
L = { λx | λ ∈ C } e f (λx) = λ||x||2 .
f (λx0 + m) = λd0 /d .
Teorema. Siano X uno spazio vettoriale topologico (su R), A un suo sottoinsieme convesso,
aperto e non vuoto, e V una varietà lineare in X. Allora esiste un iperpiano (codimensione 1)
H chiuso che contiene V e non incontra A.
Definizione. In uno spazio vettoriale topologico si dice che gli insiemi A e B sono separati
dall’iperpiano H se A è contenuto in uno dei due semispazi chiusi individuati da H e B nell’altro.
Equivalentemente, se H = {x | f (x) = c}, con f lineare e continuo e H − = {x | f (x) ≤ c},
H + = {x | f (x) ≥ c}: A ⊆ H − , B ⊂ H + o vicecersa. Se A e B sono contenuti nei due semispazi
aperti (interno di H ± ) allora si dice che H separa strettamente A e B.
Teorema. Siano X uno s.v.t., A un convesso aperto non vuoto e C un convesso non vuoto.
Se A ∩ C = ∅ allora esiste un iperpiano chiuso H che separa A e C. Piú precisamente esiste un
funzionale lineare e continuo f ed una costante c tali che f (x) < c in A e f (x) ≥ c in C.
Dimostrazione. C − A è un convesso aperto e per ipotesi la varietà lineare V = {0} non incontra
C − A. Basta dunque applicare il teorema precedente per avere il risultato di separazione. Non
è poi restrittivo supporre A ⊆ H − = {x | f (x) ≤ c}, ma essendo A aperto in tutti i suoi punti
f (x) < c. q.e.d.
Sia T un operatore lineare tra due spazi normati X e Y , di dominio D(T ), e siano X ∗ e Y ∗
i loro duali (topologici). Per ogni y ∗ ∈ Y ∗ consideriamo l’applicazione lineare
Se è continua, cioè ∈ L(D(T ), K), dove K è il campo base, allora in virtú del Teorema di
Hahn-Banach puó essere estesa ad un funzionale lineare e continuo x∗ ∈ X ∗ e
||T ∗ y ∗ || = sup | < x, T ∗ y ∗ > | = sup | < T x, y ∗ > | ≤ ||y ∗ || · sup |||T x|| ≤ ||T || · ||x|| ,
||x||=1 ||x||=1 ||x||=1
||T x|| =< T x, y ∗ >=< x, T ∗ y ∗ >≤ ||x|| · ||T ∗ || · ||y ∗ || = ||T ∗ || · ||x|| .
V (y1∗ , ...yN
∗
; ε)(T x0 ) = {y ∈ Y | | < y − T x0 , yk∗ > | ≤ ε, K = 1, ..N } ,
ricordando che gli intorni di questo tipo formano un sistema fondamentale di intorni.
Essendo < T x − T x0 , yk∗ >=< x − x0 , T ∗ yk∗ > |, èvidente che se x appartiene all’intorno debole
di x0 in X
W (T ∗ y1∗ , ...T ∗ yN
∗
; ε)(x0 ) = {x ∈ X | | < x − x0 , T ∗ yk∗ > | ≤ ε, K = 1, ..N } ,
allora T x ∈ V . q.e.d.
e dunque T xn T x.
Corollario. Se in Y la topologia debole e quella forte coincidono, come nel caso del campo
base, allora è equivalente dire che un operatore T ∈ L(X, Y ) è debolmente o fortemente conti-
nuo. In particolare il duale topologico di uno spazio normato X nunito della topologia forte o
debole è sempre lo stesso spazio X ∗ .
Da questi risultati si puó dedurre una proprietà molto importante dei convessi negli spazi
localmente convessi.
Teorema. In uno spazio localmente convesso X è equivalente dire che un convesso è debol-
mente o fortemente chiuso.
Dimostrazione. In ordine: 1) Ogni semispazio fortemente chiuso è debolmente chiuso (e ovvia-
mente vicecersa). Infatti continuità forte e debole di funzionali lineari sono equivalenti.
2) Ogni convesso chiuso C è l’intersezione I dei semispazi chiusi che lo contengono. Infatti I è
convesso e chiuso, contiene C e se vi fosse un punto x ∈ I non appartenente a C, potremmo
trovare un suo intorno aperto e convesso A, che potremmo separare da C mediante un iperpiano
H. Assurdo, perchè uno dei due semispazi individuati da H dovrebbe contenere C e ovviamente
I. q.e.d.
Indichiamo con Im(T ) e Ker(T ) l’immagine e il nucleo di un operatore lineare T (spesso nella
letteratura si trovano le notazioni R(T ) e N (T ), da range e null space).
Per una dimostrazione completa rinviamo per esempio a Yosida[24]. La riduzione del caso
generale al caso di un operatore limitato è relativamente semplice. Alcune delle implicazioni
precedenti sono più utilizzate delle altre. Presentiamo allora un risultato parziale con la sua
dimostrazione (Hutson-Pymm[13]).
Teorema. Siano X e Y due spazi di Banach e sia T ∈ L(X, Y ) (dunque T ∗ ∈ L(Y ∗ , X ∗ )).
Allora
Im(T ) = Ker(T ∗ )⊥∗ .
e inoltre
Im(T ) chiusa ⇔ Im(T ∗ ) = Ker(T )⊥ .
Dimostrazione. La prima uguaglianza si ottiene verificando due inclusioni.
Indichiamo per brevità con U e V del primo e secondo membro della prima uguaglianza.
1)Se y = T x allora
Supponiamo ora che Im(T ) sia chiusa e dimostriamo la seconda uguaglianza della tesi,
indicando con U ∗ e V ∗ il primo e il secondo membro.
1) Se x∗ ∈ Im(T ∗ ), cioè x∗ = T ∗ y ∗ , e x ∈ Ker(T ), cioè T x = 0, allora
Operando con la topologia debole*, si possono ottenere risultati non validi in generale per
la topologia debole. Ad esempio:
Non esiste alcuna sottosuccessione di Fnk di Fn , convergente debole*. Infatti, data la succes-
sione di indici nk , basta prendere g = j (−1)j χ[nj ,nj +1[ per avere Fnk (g) = (−1)k , successione
numerica oscillante e non convergente.
2) Tale sfera a maggior ragione non puo’ essere sequenzialmente debolmente compatta, dun-
que (Eberlein-Smulyan) non puo’ essere debolmente compatta.
3) Pertanto in alcuni spazi di Banach (non riflessivi) esistono insiemi limitati in norma ma
non relativamente debolmente compatti.
Per quanto riguarda la compattezza sequenziale debole* vale un risultato particolare, molto
importante per le numerore applicazioni, negli spazi separabili, quelli cioè che ammettono un
sottoinsieme numerabile denso.
Teorema. Sia X uno spazio di Banach separabile e X ∗ , il suo duale. Allora la sfera chiusa
unitaria di X ∗ è sequenzialmente compatta per la topologia debole*.
Dimostrazione. Sia D = {xk } un sottoinsieme separabile denso in X e fn una successione limi-
tata in X ∗ : ||fn ||∗ ≤ C.
(1)
Dalla successione numerica fn (x1 ) si puó estrarre una sottosuccessione convergente fn (x1 ) →
y1 .
(1) (2)
Dalla successione numerica fn (x2 ) si puó estrarre una sottosuccessione convergente fn (x2 ) →
(2)
y2 , valendo ancora fn (x1 ) → y1 .
...
(k−1) (k)
Dalla successione numerica fn (xk ) si puó estrarre una sottosuccessione convergente fn (xk ) →
(k) (k)
yk , valendo ancora fn (xk−1 ) → yk−1 ... fn (x1 ) → y1 .
(n)
... La successione diagonale gn = fn converge in tutti i punti di D ed è limitata in norma:
||gn ||∗ ≤ C, dunque, come si verifica immediatamente, converge in tutti i punti di X:
||x−xj || < ε ⇒ |gn+p (x)−gn (x)| ≤ |gn+p (x)−gn+p (xj )|+|gn+p (xj )−gn (xj )|+|gn (xj )−gn (x)| ≤ (2C+1)ε ,
quindi g(xn ) = 0 e
0 < a ≤ |fn (xn )| ≤ |fn (xn ) − g(xn )| + |g(xn )| ≤ ||xn || · ||fn − g||∗ = ||fn − g||∗
Compattezza debole e compattezza sequenziale negli spazi di Banach sono strettamente cor-
relate alla riflessività dello spazio.
Teorema. Uno spazio di Banach X è riflessivo se e solo se la sua sfera unitaria chiusa è
debolmente compatta.
Osserviamo infine che si può facilmente dimostrare che, se X è uno spazio di Bnach, allora
X è riflessivo se e solo se X ∗ è riflessivo.
C(K; R), tranne il caso particolare di K ridotto un solo punto, non è uno spazio di Hilbert
per la norma ||f ||K,∞ . Infatti uno spazio compatto è normale (allora esistono due loro intorni
aperti A e A disgiunti) e in esso vale quindi il teorema di Urysohn (se C e C sono chiusi
disgiunti di K esiste una funzione continua da K in [0, 1] tale che f (x) = 0 per x ∈ C e f (x) = 1
per x ∈ C ). Dunque, se vi sono due punti distinti x e y in K, è possibile trovare una funzione
g continua in K tale che, detta f la funzione costante uguale a 1 ,
∀z ∈ K 0 ≤ g(z) ≤ 1 , g(x) = 0 , g(y) = f (y) = 1 ,
allora
||f + g||2 + ||f − g||2 = (1 + 1)2 + 12 > 2(12 + 12 ) = 2(||f ||2 + ||g||2 )
e non è soddisfatta la disuguaglianza della mediana.
Talvolta è però conveniente introdurre in questi spazi di funzioni continue un prodotto sca-
lare e munirli della corrispondente struttura di spazi pre-Hilbertiani.
131
132 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie
Teorema. Sia K compatto e siano f, fn ∈ C(K; R). Supponiamo che fn converga sempli-
cemente in modo monotono, ad esempio non crescendo, ad f :
Allora fn → f uniformemente in K :
Dimostrazione.
∀ε > 0 ∀x ∈ K ∃nx f (x) ≤ fnx (x) < f (x) + ε
Ma per la monotonia e per la permanenza delle disuguaglianze strette tra funzioni continue,
indicando con V (x) un intorno, che per convenienza supporremo aperto, di x :
cioè
∀ε > 0 ∃ν ∀n ≥ ν ||fn − f ||K,∞ < ε .
q.e.d.
z2 = x , 0 ≤ z ≤ 1 .
y = 1 − z , (0 ≤ y ≤ 1) , t = 1 − x , (0 ≤ t ≤ 1) ,
si trova
(1 − y)2 = 1 + y 2 − 2y = 1 − t , cioè y = 1/2(t + y 2 ) .
Costruiamo la successione yn = Qn (t) secondo lo schema iterativo
y0 = 0
,
yn+1 = 1/2(t + yn2 )
zn = 1 − yn = 1 − Qn (t) = 1 − Qn (1 − x) = Pn (x) .
È chiaro che
1) per ogni n si ha yn ≥ 0 ;
2) per ogni n si ha yn ≤ yn+1 , per induzione, essendo:
yn + yn−1
y0 ≤ y1 , yn+1 − yn = (yn − yn−1 ) ;
2
3) per ogni n si ha yn ≤ 1 , per induzione, essendo
y0 ≤ 1 , yn ≤ 1 ⇒ yn+1 ≤ 1 .
Pertanto
√
z(x) = 1 − y(t) = x e z(x) = lim Pn (x) .
n
√
Ma x è continua e la successione Pn è noncrescente e convergente semplicemente sul compatto
[0, 1]. Per il teorema precedente la convergenza è anche uniforme. q.e.d.
* * *
Il metodo iterativo precedente puoò essere applicato con successo anche per ottenere la radice
quadrata di un operatore autoaggiunto positivo. Premettiamo alcune definizioni. Sia A ∈ "(H)
una trasformazione autoaggiunta in uno spazio di Hilbert H (∀f ∈ H(Af, f ) = (f, Af )):
1)si dice che A è positiva se e solo se la forma quadratica associata (Af, f ) è positiva.
cioè B − A è positiva.
∀f ∈ H lim An f = Af .
n
Ovviamente O ≤ A ≤ I.
Ovviamente |B(f, g)| ≤ ||f ||||g|| e quindi B(f, ·) ∈ H . Per il Teorema di Riesz esiste Af tale
che
Dimostrazione. (Per semplicità sia R il campo base). Basta usare il metodo del Lemma
precedente:
1
Y = I − X , B = I − A , Y0 = O , Yn+1 = (B + Yn2 )
2
per ottenere una succesione monotona. Osserviamo infatti che se B ≥ O allora per ogni p si ha
B p ≥ O ((B 2k f, f ) = ||B k f ||2 , (B 2k+1 f, f ) = (BB k f, B k f )), e che le Yn e le Yn − Yn−1 sono
polinomi in B a coefficienti positivi, come si verifica per induzione, essendo
1 1 1
Yn+1 = (B + Yn2 ) , Yn+1 − Yn = (Yn2 − Yn−1
2
) = (Yn − Yn−1 )(Yn + Yn−1 ) .
2 2 2
Allora O ≤ Yn−1 ≤ Yn ≤ I e per il Teorema precedente Yn converge debolmente a Y . Infine
X = I − Y è tale che X 2 = A.
0 = ((X 2 −Y 2 )f, (X−Y )f ) = ((X+Y )(X−Y )f, (X−Y )f ) = ||X 1/2 (X−Y )f ||2 +||Y 1/2 (X−Y )f ||2 .
(ABf, f ) = (B 1/2 AB 1/2 f, f ) = (AB 1/2 f, B 1/2 f ) ≥ 0 , (A2 f, f ) = (AA1/2 f, A1/2 f ) ≤ (BA1/2 f, A1/2 f ) = (BAf, f ) .
e dunque ||An f || → ||Af ||, che insieme alla convergenza debole An f Af garantisce la
convergenza forte. q.e.d.
& & &
Lemma. In ogni intervallo finito, per semplicità [−L, L] , la funzione |x| si può approssimare
uniformemente mediante una successione
noncrescente di polinomi.
Dimostrazione. Basta scrivere |x| = L (x/L)2 ed usare il lemma precedente:
|x| = lim LPn ((x/L)2 ) e Pn+1 ≤ Pn .
n
Nel seguito indicheremo brevemente con C(K) lo spazio di Banach delle funzioni continue sul
compatto K , munito della norma del massimo: le funzioni saranno a valori in C o in R (quale
dei due casi si consideri risulterà chiaro dal contesto).
f, g ∈ B implica f ∧ g, f ∨ g ∈ B.
b) Data F ∈ C(K) e x, y ∈ K esiste fxy ∈ B tale che fxy (x) = F (x) e fxy (y) = F (y).
Infatti, se x = y basta prendere come fxy la funzione costante uguale a F (x), altrimenti se x = y
esiste g ∈ B tale che g(x) = g(y) e allora basta prendere fxy = ag + b, con le costanti a e b
univocamente individuate dal sistema
ag(x) + b = F (x)
ag(y) + b = F (y)
Per ogni z ∈ K esiste k tale che z ∈ U (xk ) e pertanto fy (z) ≥ fxk y (z) > F (z) − ε. Dunque
Per la continuità delle funzioni esiste un intorno aperto V (y) di y tale che
Allora f eredita dalle fyi la proprietà che per ogni z ∈ K si ha F (z) − ε < f (z). Ma per ogni
z ∈ K esiste j tale che z ∈ V (yj ) . Dunque
essendo A un’algebra. Se allora f ∈ B, dato n ≥ ||f ||+1 e considerata g ∈ A tale che ||f −g|| < n1
, si ha
2
|||f | − Pn (g)|| ≤ |||f | − |g||| + |||g| − Pn (g)|| < .
n
Dunque |f | è aderente a A , cioè |f | ∈ B. Basta ora applicare il teorema precedente a B, che
risulta denso in C(K) (essendo chiuso B coincide con C(K) ) e pertanto A è denso in C(K) . q.e.d.
g1 , g2 ∈ F e λ1 , λ2 ∈ R ⇒ λ1 g1 + λ2 g2 = (λ1 g1 + λ2 g2 ), g1 g2 = (g1 g2 ) ∈ F ;
2) la funzione costante 1 ∈ F ;
3) separa i punti di K perché per x, y ∈ K
Per quanto già dimostrato nel caso reale, la chiusura F di F coincide con C(K; R) . Allora la
chiusura A = F + iF di A coincide con C(K; C) . q.e.d.
n p
Pn (x) = f ( )xp (1 − x)n−p
p n
p=0
convergono uniformemente a f .
Si osservi che i i polinomi Pn non costituiscono le ridotte di una serie.
Dimostrazione. Introduciamo i polinomi
n
ρp (x) = xp (1 − x)n−p ,
p
cosicché Pn (x) = p f (p/n)ρp (x). Risulta per ogni x ∈ [0, 1]
n
ρp (x) = 1 ,
p=0
n
pρp (x) = nx ,
p=0
n
p(p − 1)ρp (x) = n(n − 1)x2 .
p=0
n
(x + y)n = xp y n−p ,
p
p=0
Sia M tale che per ogni x si abbia |f (x)| ≤ M (f è limitata) e per ogni ε > 0 sia δ > 0 tale che
|f (x) − f (x )| < ε se |x − x | < δ (f è uniformemente continua). Allora
n
n
|f (x) − f (p/n)ρp (x)| = | (f (x) − f (p/n))ρp (x)| ≤
p=0 p=0
≤| (f (x) − f (p/n))ρp (x)| + | (f (x) − f (p/n))ρp (x)| ≤
|p−nx|<nδ |p−nx|≥nδ
2M
n
≤ ε + 2M ρp (x) ≤ ε + 2 2 (p − nx)2 ρp (x) .
n δ p=0
|p−nx|≥nδ
Ma il secondo addendo tende a 0 per n → +∞ e dunque per ogni ε > 0, purché n sia
sufficientemente grande
∀x ∈ [0, 1] |f (x) − Pn (x)| < 2ε .
q.e.d.
O ancora C2π (R) si può identificare con C(K), dove K è il compatto ottenuto da [0, 2π] identi-
¯
ficando gli estremi 0 e 2π.
La famiglia
T = {einx | n ∈ Z}
è totale in Cp ([0, 2π]).
Dimostrazione. Sia A l’insieme delle combinazioni lineari finite degli elementi di T . È evidente
che A costituisce un’algebra autoaggiunta in Cp , contiene le funzioni costanti (Cei0x ) e il singolo
elemento eix ∈ T separa tutti i punti del compatto K .
Osservazione 1. T non può essere totale in C([0, 2π]), essendo tutti i suoi elementi funzioni
periodiche.
Osservazione 2. Si è considerato l’intervallo [0, 2π] soltanto per comodità. La famiglia
2πin(x − a)
Ta,b = {exp | n ∈ Z}
b−a
è totale in Cp ([a, b]). Infatti, se y = 2π(x − a)/(b − a) e f ∗ (y) = f (x) = f (a + (b − a)y/2π) ,
f ∗ si può approssimare mediante combinazioni lineari finite di funzioni della forma exp iny =
exp 2πin(x − a)/(b − a) .
Dimostrazione.
1) Abbiamo dimostrato che le combinazioni lineari finite di elementi di T , e dunque di F , sono
dense in Cp ([0, 2π]) per la norma del massimo.
2) La convergenza uniforme, cioè per la norma del massimo, implica quella in media quadratica,
cioè per la norma L2 , in quanto
b
||f ||2 = ( |f (x)|2 dx)1/2 ≤ (b − a)1/2 ||f ||∞ .
a
3) Cp ([a, b]) è denso in C[a, b] per la norma L2 : sia infatti f continua in [a, b] e si consideri
= f (x) , a + 1/n ≤ x ≤ b
fn (x) = .
= f (a + 1/n) + f (a+1/n)−f
1/n
(b)
(x − a − 1/n) , a ≤ x ≤ a + 1/n
Allora fn ∈ Cp [a, b] e
b a+1/n
(2||f ||∞ )2
||f − fn ||22 = |f (x) − fn (x)|2 dx = |f (x) − fn (x)|2 dx ≤ →0,
a a n
per n → +∞ .
4) È noto che C[a, b] è denso in L2 ([0, 2π], dx) per la norma L2 .
Dunque il sottospazio vettoriale generato da F è denso in L2 ([0, 2π], dx) e quindi F è completo
e costituisce una base ortonormale. q.e.d.
einx
{en = √ }n∈Z .
2π
I coefficienti di Fourier di f rispetto a questo sono
π
1
fn = (f, en ) = √ f (x)e−inx dx =
2π −π
π
1
=√ f (x)(cos nx − i sin nx)dx .
2π −π
Posto π
1 1
cn = f (x)e−inx dx = √ fn n ∈ Z ,
2π −π 2π
π
1
an = f (x) cos nxdx n ≥ 0 ,
π −π
1 π
bn = f (x) sin nxdx n ≥ 1 ,
π −π
si vede immediatamente che valgono le relazioni
f (x) ∼ cn einx ,
n∈Z
a0
f (x) ∼ + (an cos nx + bn sin nx) .
2
n≥1
N
einx a0
N
SN (f )(x) = fn √ = + (an cos nx + bn sin nx) =
2π 2 0
−N
π
N
1
= f (t)( ein(x−t) )dt
2π π −N
1 sin(N + 1/2)z
DN (z) = :
2π sin z/2
π
SN (f )(x) = DN (x − t)f (t)dt .
π
In effetti
N 2N
ei(2N +1)z − 1
einz = e−iN z einz = e−iN z =
0
eiz − 1
−N
Prolungando per periodicità f fuori dell’intervallo [−ππ] e osservando che DN (−z) = DN (z),
si può scrivere con il cambiamento di variabile t − x = z
π
SN (f )(x) = DN (z)f (x + z)dz .
−π
e quindi π
SN (f )(x) − f (x) = DN (z)(f (x + z) − f (x))dz .
−π
Dimostrazione.
Premettiamo una osservazione: se f ∈ L2 e λ ∈ N il risultato segue immediatamente dalla con-
vergenza a 0 dei coefficienti di Fourier rispetto a qualunque sistema ortonormale (disuguaglianza
di Bessel). Ma L2 è denso in L1 e sin(λx) è limitata, dunque se
La densità di L2 in L1 si può dedurre ad esempio dal fatto che le funzioni caratteristiche degli
intervalli χ[r,s] costituiscono un insieme totale in L1 .
Il lemma si può dedurre, senza ricorrere ai risultati sui sistemi ortogonali in L2 e per λ arbitrario,
utilizzando solo alla totalità delle funzioni caratteristiche degli intervalli, dall’osservazione che
b s
1 iλs
χ[r,s] (x)eiλx dx = eiλx dx = (e − eiλr ) → 0 .
a r iλ
Osservazione. La condizione di Dini può essere sostituita da altre condizioni, ma non sem-
plicemente omessa. Vi sono infatti funzioni anche continue la cui serie di Fourier non converge
in certi punti. Esistono funzioni in L1 la cui serie di Fourier risulta ovunque non convergente
(risultato di A.N.Kolmogorov, indicato in Kolmogorov-Fomin[15]).
Allora
f (x + 0) + f (x − 0)
lim SN (f )(x) − =0.
N 2
Basta ripetere la dimostrazione precedente, operando però separatamente a sinistra e a destra
di x, tenendo conto che il nucleo di Dirichlet è una funzione pari.
risulta totalmente convergente. Sia g la sua somma. Le funzioni f e g sono continue e hanno
gli stessi coefficienti di Fourier. Ma Ogni funzione continua è univocamente individuata dalla
sua serie di Fourier. Infatti se due funzioni f e g hanno gli stessi coefficienti, allora la differenza
f − g ha coefficienti di Fourier tutti nulli ed essendo in L2 è q.o. nulla; ma f − g è continua e
dunque nulla ovunque.
Derivando poi la serie termine a termine si trova ovviamente la serie di Fourier di f , con-
vergente il media quadratica. q.e.d.
Osservazione. Se f è derivabile ovunque con derivata integrabile nel senso di Riemann (quin-
di limitata), le condizioni del teorema sono soddisfatte.
Per ricostruire la funzione f dalla sua serie di Fourier si può ricorrere (Fejér, 1905) alle
somme di Cesaro
N −1
1
CN (f )(x) = Sk (f )(x) ,
N
k=0
1 sin N z/2 2
FN (z) = ( ) :
2πN sin z/2
π
CN (f )(x) = FN (z)f (x + z)dz .
−π
Infatti
N −1 −1
1
N
1 1
FN (z) = DN (z) = sin(2k + 1)z/2 .
N 2πN sin z/2
k=0 k=0
Ma
ei(k+1/2)z − e−i(k+1/2)z
sin(2k + 1)z/2 = ,
2i
N −1
eiN z − 1 eiN z − 1
eiz/2 (eiz )k = eiz/2 = ,
eiz − 1 eiz/2 − e−iz/2
k=0
1 e −1
iN z
e−iN z − 1 1
( iz/2 −iz/2
− −iz/2
)= 2
(eiN z/2 − e−iN z/2 )2
2i e −e e −e iz/2 (2i) sin z/2
e dunque i nuclei di Fejér hanno la forma indicata.
Infatti, per δ/2 < x < π/2 , la funzione (sin x)/x è decrescente e quindi per δ < z < π