Legendre
Legendre
Legendre
Marcello Seri
20 marzo 2008
1 Definizione
Sia f : Rn → R una funzione convessa, cioè ∇2 f > 0 dove ∇2 rappresenta la
matrice Hessiana.
Si definisce Trasformata di Legendre di f la funzione
1
Figura 1: Costruzione della trasformata di Legendre per f (x) = x4 ed un
certo p fissato. Se x(p) è l’ascissa del punto di distanza massima ed F (p, x) =
px − f (x), possiamo dire che f ∗ (p) = F (p, x(p))
α pβ
Esempio 1.3. Sia f (x) = xα con α > 1 pari, allora f ∗ (p) = β
con α e β
coniugati tra loro α1 + β1 = 1 .
La Trasformata di Legendre è, in modo simile ad altre trasformate, un’in-
voluzione. La dimostrazione richiede due lemmi preliminari.
Lemma 1.1. ∇f ∗ (p) = x(p), dove x(p) è la soluzione di p = (∇f )(x).
Dimostrazione. È noto che f ∗ (p) = p · x(p) − f (x(p)), dove x(p) è tale che
p = (∇f )(x(p)). Quindi
∇f ∗ (p) = p · (∇x)(p) + x(p) − (∇f )(x(p)) · (∇x)(p) = x(p).
2
Teorema 1.3. La trasformata di Legendre è un’involuzione, cioè L(L(f ))(x) =
f (x).
Dimostrazione. La dimostrazione che viene data in [Arn89] si basa sul ragio-
namento geometrico per cui, per definizione di trasformata di Legendre, la
retta y = xp − f ∗ (p) è la tangente di pendenza p alla curva y = f (x). Poiché
f (x) è convessa, tutte le linee di tangenza sono sotto al grafico e, fissato
x = x0 , il valore massimale di x0 p − f ∗ (p) come funzione di p è proprio f (x0 ).
Il che implica che L(f ∗ )(x) = maxp (x0 p − f ∗ (p)) = f (x0 ).
Il calcolo può essere fatto algebricamente sfruttando il Lemma 1.2. Si ha
che L(L(f ))(x) = L(f ∗ )(x) e
L(f ∗ )(x) = x · p(x) − f ∗ (p(x)),
dove p(x) è definito da x = (∇f ∗ )(p(x)) in modo analogo a quanto fatto in
precedenza. Ora, è anche vero che f ∗ (p) = p · y(p) − f (y(p)), dove y(p) è
definito da p = (∇f )(y(p)). Quindi, per il Lemma 1.1, si ha (∇f ∗ )(p) = y(p),
con y(p) come sopra. Ricapitolando, si è ottenuto che
x = (∇f ∗ )(p(x)) = y(p(x))
e che
L(f ∗ )(x) = x · p(x) − f ∗ (p(x))
= y(p(x)) · p(x) − [p(x) · y(p(x)) − f (y(p(x)))]
= f (x)
in quanto il prodotto scalare euclideo (·) è simmetrico.
2 Disuguaglianza di Young
Due funzioni f e g si dicono duali nel senso di Young se g(p) = L(f )(p), e,
per il Teorema 1.3, f (p) = L(g)(p).
Teorema 2.1 (Disuguaglianza di Young). Se f e g sono funzioni convesse
duali nel senso di Young, allora p · x ≤ f (x) + g(p).
Dimostrazione. Dalla definizione,
g(p) = L(f )(p) = maxx (p · x − f (x)) ≥ p · x − f (x)
per ogni p ed x. Quindi
g(p) + f (x) ≥ p · x.
3
Questo risultato generale si può sfruttare per mostrare parecchie stime
interessanti.
x2
Esempio 2.1. Se f (x) = 2
, dall’esempio 1.2 (con m = 1) si osserva che
2 2
x2
f ∗ (p) = p2 . Dunque px ≤ 2
+ p2 .
p
f (x) = a · g(x) =⇒ f ∗ (p) = a · g ∗ (2)
a
∗ ∗ p
f (x) = g(ax) =⇒ f (p) = g (3)
a
−1 ∗ 1 ∗
f (x) = g (x) =⇒ f (p) = −p · g (6)
p
4
3.4 Trasformazioni Lineari e Trasformate di Legendre
Infine, se A : Rm → Rn è una trasformazione lineare, per ogni funzione
convessa f : Rn → R, si ha
(Af )∗ = f ∗ A∗ , (7)
Riferimenti bibliografici
[Arn89] V. I. Arnold. Mathematical Methods Of Classical Mechanics.
Springer, 1989.