Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per...

23
Giulio Cesare Barozzi Ortogonalit` a Il percorso di un’idea da Pitagora a oggi Queste note traggono origine dalle lezioni tenute in Acri (CS) dal 28 giugno al 2 luglio 2004 nell’ambito del corso Didattica con le Nuove Tecnologie, organizzato dall’Universit` a della Calabria. [Revisione: agosto 2004]

Transcript of Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per...

Page 1: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

Giulio Cesare Barozzi

Ortogonalita

Il percorso di un’idea da Pitagora a oggi

Queste note traggono origine dalle lezioni tenute in Acri (CS) dal 28 giugno al 2luglio 2004 nell’ambito del corso Didattica con le Nuove Tecnologie, organizzatodall’Universita della Calabria. [Revisione: agosto 2004]

Page 2: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

The life so short, the craft so long to learn

G. Chaucer, ca. 1380

Indice

1. Il teorema di Pitagora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12. Il prodotto scalare nel piano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53. Spazi vettoriali con prodotto scalare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84. Proiezioni ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215. Il metodo dei minimi quadrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346. Filtraggio numerico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407. Serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478. Polinomi ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 569. Elaborazione di immagini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Grafo delle dipendenze tra i capitoli

1

2

3

4

5

6

7 8 9

Avvertenza. Le presenti note, in formato PDF, sono reperibili all’indirizzo

www.ciram.unibo.it/∼barozzi/Ortounitamente ad altri materiali relativi allo stesso argomento. Nell’ambito delle note sifa riferimento ai volumi dell’Autore

Primo Corso di Analisi Matematica, Zanichelli (1998)

Matematica per l’Ingegneria dell’Informazione, Zanichelli (2001)

citati con le sigle PCAM e MI2 rispettivamente.

In copertina: H. Holbein il Giovane (1533), Gli ambasciatori [particolare], NationalGallery, London.

Page 3: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

Introduzione

Il filo conduttore delle note che seguono e il concetto di ortogonalita, a partire dallasua formulazione classica nell’ambito della geometria euclidea piana, fino ad alcuneapplicazioni recenti nel quadro dell’elaborazione di immagini.

Il concetto di prodotto scalare che viene generato in modo naturale quando sivoglia estendere il teorema di Pitagora ai triangoli non rettangoli, viene tradottoin una relazione algebrica tra le componenti dei vettori che rappresentano i lati deltriangolo, una volta che sia stato introdotto nel piano un sistema di riferimento.

Si ottiene cosı il prodotto scalare cosiddetto canonico nello spazio R2; questo e il

trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi

vettoriali piu astratti, i cui elementi sono funzioni, successioni, ecc.La teoria delle serie di Fourier si inserisce in modo naturale in questo contesto,

cosı come il metodo dei minimi quadrati; un ruolo essenziale gioca il teorema dellaproiezione ortogonale, cioe quello che ci insegna come proiettare ortogonalmente unelemento di uno spazio munito di un prodotto scalare su un sottospazio finito dimen-sionale dello spazio stesso. La conoscenza di una base ortogonale per tale sottospaziosemplifica drasticamente la soluzione del problema.

La tematica e viva anche ai giorni nostri ed ammette sviluppi assai interessanti(la teoria delle ondine) di cui non si tratta in questo testo. Cosı come non sonotrattati gli aspetti computazionali relativi ai calcoli che sono implicati nelle elabo-razioni di immagini trattate nell’ultimo capitolo. Il lettore avvertito non fa fatica acogliere che, dietro le scene, c’e la Trasformata Discreta di Fourier (DFT), e ci sonole problematiche relative al suo computo “rapido”, vale a dire computazionalmenteefficiente.

Queste note hanno uno scopo essenzialmente didattico e sono dedicate ai docentidi matematica; per questo si e puntato principalmente sugli aspetti concettuali, senzache cio significhi una mancata considerazione degli altri aspetti a cui si e rinunciato.

Page 4: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

1. Il teorema di Pitagora

Il problema di tracciare angoli retti sul terreno ha interessato gli uomini fin dall’anti-chita. Gia gli antichi egiziani sapevano che se si creano su una fune 13 nodi equidi-stanti, e poi si tende la fune, unendo l’ultimo nodo con il primo, in modo da formareun triangolo i cui lati siano rispettivamente di 3, 4 e 5 unita (qui l’unita e la distanzatra due nodi consecutivi), allora l’angolo opposto al lato lungo 5 unita e retto.

Figura 1.1. La terna (3, 4, 5) e pitagorica: 32 + 42 = 52.

La terna (3, 4, 5) e una cosiddetta terna pitagorica: 32 + 42 = 52. Noi oggisappiamo che esistono infinite terne pitagoriche e sappiamo come costruirle: si trattadelle terne di numeri interi positivi (a, b, c) per cui a2 + b2 = c2.

Ci interessa il fatto che il nome dato a queste terne si riferisce al greco Pitagorail teorema di Pitagora(nato a Samo intorno al 570 a.C. e vissuto nella Magna Grecia) a cui si attribuisce il

teorema che da lui prende il nome:

In un triangolo rettangolo, la somma dei quadrati costruiti sui cateti e uguale alquadrato costruito sull’ipotenusa.

A B

C

Figura 1.2. Il teorema di Pitagora e il suo inverso caratterizzano i triangoli rettangoli.

... e il suo inversoMa vale anche il viceversa:

Se in un triangolo il quadrato costruito su un lato e uguale alla somma dei quadraticostruiti sui due restanti, l’angolo formato da questi e retto.

Questi due teoremi chiudono il primo Libro degli Elementi di Euclide (c. 300 a.C.).Esistono molte dimostrazioni del teorema di Pitagora. Una di esse e basata sul fattoche se si altera un parallelogramma facendo scorrere un suo lato sulla retta a cui essoappartiene, si ottiene un parallelogramma equivalente, cioe avente la stessa area. In

Page 5: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

2 G.C. Barozzi: Ortogonalita

effetti basta dimostrare che un rettangolo e equiscomponibile (e dunque equivalente)al parallelogramma che si ottiene facendo scorrere uno dei suoi lati sulla retta diappartenenza; dopodiche si osserva che l’equivalenza tra parallelogrammi gode dellaproprieta transitiva.

Se si sfrutta questa proprieta, ecco che il teorema di Pitagora si puo dimostrarefacendo vedere che il quadrato costruito sul lato AC e equivalente al rettangoloAHKD, il quadrato costruito sul lato BC e equivalente al rettangolo BEKH.

A

D

H

K

B

E

C

Figura 1.3. La dimostrazione del teorema di Pitagora puo essere basata sul fatto che un

parallelogramma si muta in uno equivalente se un suo lato viene fatto scorrere sulla retta di

appartenenza.

E abbastanza naturale chiedersi che cosa accade se il triangolo che stiamo esami-nando non e rettangolo. Ad esempio e chiaro che se ABC e un triangolo acutangolo(tutti gli angoli sono acuti) il quadrato costruito su AB sara minore, anziche uguale,alla somma dei quadrati costruiti su BC e CA; che cosa dovremo sottrarre alla sommadi tali quadrati per ottenere il quadrato costruito su AB?

Un suggerimento ci viene dalla figura precedente: abbiamo condotto dal punto Bl’altezza relativa all’ipotenusa, mentre le due restanti altezze coincidono con i cateti:dunque C e anche l’ortocentro del triangolo ABC, cioe il punto d’incontro delle trealtezze.

Se conduciamo le tre altezze in un triangolo acutangolo e le prolunghiamo fino adintersecare i quadrati costruiti su ciascuno dei lati, otteniamo la figura 1.4.

Non e difficile dimostrare che i rettangoli AC ′C ′′D e AB′B′′K sono equivalenti,e lo stesso vale per le coppie di rettangoli

BC ′C ′′E e BA′A′′F, CA′A′′G e CB′B′′H.

In effetti basta osservare che i triangoli rettangoli ACC ′ e ABB′ sono simili inquanto hanno in comune l’angolo BAC. Dunque in questi due triangoli il rapportotra il cateto adiacente all’angolo comune e l’ipotenusa e lo stesso:

AC ′

AC=

AB′

AB⇐⇒ AC ′ · AB = AB′ · AC,

ma l’ultima uguaglianza si scrive anche

AC ′ · AD = AB′ · AK,

e questo e quanto dovevamo dimostrare.

Page 6: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

1. Il Teorema di Pitagora 3

A

A′

A′′

B

B′

B′′ C

C ′

C ′′D E

F

G

H

K

Figura 1.4. Le tre altezze di un triangolo acutangolo suddividono i quadrati costruiti sui

lati in tre coppie di rettangoli a due a due equivalenti.

Abbiamo dunque trovato la risposta alla nostra precedente domanda: per avere ilquadrato costruito sul lato AB, dobbiamo sottrarre dalla somma dei quadrati costruitisui due restanti lati i rettangoli CA′A′′G e CB′B′′H, o, se si preferisce, il doppio diuno qualunque di questi due rettangoli, dato che essi sono equivalenti.

Con un diverso linguaggio, quanto abbiamo detto corrisponde alla Proposizione13 del secondo Libro degli Elementi.

E utile rileggere la costruzione delle coppie di rettangoli che ci interessano trac-ciando soltanto i segmenti uscenti dal punto A: si proietta ortogonalmente ciascunsegmento sulla retta contenente l’altro, poi si costruisce il rettangolo che ha come latila proiezione ottenuta e il segmento su cui si e proiettato.

A B

C

Figura 1.5. Due segmenti con un estremo in comune generano due rettangoli equivalenti

proiettando ciascuno sulla retta contenente l’altro.

In definitiva ad ogni coppia di segmenti uscenti da un punto vengono ad essereassociati due rettangoli equivalenti.

Osserviamo che cosa accade se l’angolo tra i due segmenti e ottuso: questa voltale proiezioni cadono sulle semirette opposte a quelle che contengono i segmenti dati.Se si ritorna al problema originario relativo al triangolo, e chiaro che questa voltaoccorre sommare, anziche sottrarre, alla somma dei quadrati costruiti su BC e CA irettangoli CA′A′′G e CB′B′′H.

Page 7: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

4 G.C. Barozzi: Ortogonalita

A

A′

A′′

B

B′

B′′

C

C ′

C ′′D E

F

G

H

K

Figura 1.6. La situazione analoga a quella illustrata dalla figura 1.4, nel caso di un triangolo

ottusangolo.

Se potessimo attribuire un segno ai rettangoli piu volte considerati, nel sensodi cosiderarli negativamente quando l’angolo tra i segmenti di partenza e ottuso,avremmo un enunciato semplice di quello che possiamo chiamare il teorema di Pitagorageneralizzato:

Per avere il quadrato costruito sul lato AB occorre sottrarre dalla somma deiquadrati costruiti su BC e CA i due rettangoli che si ottengono proiettando ortogo-nalmente CB su CA e CA su CB, con la convenzione di considerare negativamentetali rettangoli se l’angolo in C e ottuso.

E appena il caso di osservare che se l’angolo in C e retto allora (e solo allora) siricade nell’enuncianto classico del teorema di Pitagora.

E chiaro che non ha molto senso attribuire un segno ad un rettangolo, ma ha moltosenso attribuire un segno alla sua area, che e la misura della superficie del rettangolostesso. Per fare cio dobbiamo introdurre un’unita di misura per le lunghezze e per learee.

E quanto faremo nel prossimo capitolo. Introdotto un sistema di coordinate carte-siane, monometrico e ortogonale, vedremo come calcolare, a partire dalle coordinatedei punti A, B e C, l’area comune ai due rettangoli ottenuti proiettando ortogonal-mente AB su AC e AC su AB. Considerando AB e AC come segmenti orientati,dunque come vettori, il numero ottenuto sara il prodotto scalare dei vettori stessi.

Page 8: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

2. Il prodotto scalare nel piano

Vogliamo risolvere con l’aiuto della geometria analitica il problema posto al ter-mine del capitolo precedente. Operiamo un piccolo cambiamento di simboli: sianodati nel piano tre punti P0, P1 e P2. Scelto un sistema di riferimento cartesiano, siano(xk, yk), per k = 0, 1, 2, le coordinate del punto Pk rispetto a tale riferimento.

Proiettiamo ortogonalmente il punto P2 sulla retta P0P1, che consideriamo orien-tata da P0 a P1. Sia H il piede della proiezione.

HH

P0

P0P1

P1

P2P2

Figura 2.1. Proiezione di un vertice sulla retta contenente il lato opposto.

Indichiamo con un soprassegno le misure dei segmenti. Se h e la misura delsegmento orientato P0H, abbiamo

HP1 = P0P1 − h.

Questo e vero tanto se l’angolo di vertice P0 e acuto (e dunque H appartienealla semiretta di origine P0 contenente P1), quanto se l’angolo in questione e ottuso(e allora H apparterra alla semiretta opposta), a patto che h sia un misura consegno. In altri termini h e la coordinata di H in un sistema di riferimento sulla rettaP0P1, orientata da P0 verso P1, che abbia l’origine in P0: in tale riferimento hannocoordinata positiva i punti della semiretta di origine P0 contenente P1, mentre quellidella semiretta opposta hanno coordinata negativa.

A noi interessa calcolare il prodotto h ·P0P1. Applichiamo il teorema di Pitagoraai triangoli rettangoli P0HP2 e P1HP2. Abbiamo

HP22

= P0P22 − h2 = P1P2

2 − (P0P1 − h)2 =

= P1P22 − P0P1

2 − h2 + 2h · P0P1.

Ne deduciamo

2h · P0P1 = P0P12

+ P0P22 − P1P2

2.

Per alleggerire le notazioni, indichiamo con X1, Y1 le componenti del vettore (seg-mento orientato) P0P1 e con X2, Y2 le componenti del vettore P0P2:

X1 := x1 − x0, Y1 := y1 − y0, X2 := x2 − x0, Y2 := y2 − y0.

Le componenti del vettore P1P2 saranno dunque X2 − X1 e Y2 − Y1. L’ultimauguaglianza diventa allora

Page 9: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

6 G.C. Barozzi: Ortogonalita

2h · P0P1 = X21 + Y 2

1 + X22 + Y 2

2 − (X21 + Y 2

1 − 2X1Y1 + X22 + Y 2

2 − 2X2Y2),

da cui finalmente

h · P0P1 = X1Y1 + X2Y2.

Abbiamo ottenuto un risultato importante; se indichiamo con le lettere v1 e v2 ivettori P0P1 e P0P2, possiamo dire:

Dati i vettori v1 = (X1, Y1) e v2 = (X2, Y2), il prodotto della lunghezza di v1 per laproiezione ortogonale di v2 su v1 (oppure: della lunghezza di v2 per la proiezioneortogonale di v1 su v2) e dato da X1Y1 + X2Y2.

prodotto scalare In definitiva abbiamo costruito una corrispondenza che ad ogni coppia di vettoridel piano associa un numero reale; scriveremo

v1 • v2 := X1Y1 + X2Y2

e parleremo di prodotto scalare dei vettori dati. Piu oltre, quando avremo esteso ilconcetto di prodotto scalare, diremo che si tratta del prodotto scalare canonico di v1

e v2. I vettori v1 e v2 sono ortogonali se e solo se

v1 • v2 = 0.

Il problema geometrico che ci ha condotto al prodotto scalare rende ragione delfatto che tale prodotto e simmetrico (o, se si preferisce, gode della proprieta commu-tativa):

v1 • v2 = v2 • v1.

Se calcoliamo il prodotto scalare di un vettore v = (X, Y ) per se stesso, otteniamoil quadrato della lunghezza, o come anche si dice della norma, del vettore dato:

v • v = X2 + Y 2 = ‖v‖2.

Abbiamo usato il simbolo ‖v‖ per la norma di v:

‖v‖ :=√

X2 + Y 2.

Osserviamo ancora che la condizione v · v = 0 e verificata se (e soltanto se) v e ilvettore nullo, cioe il vettore (0, 0):

v • v = 0 =⇒ v = (0, 0).

Se si riflette sul calcolo che abbiamo effettuato, ci si rende conto del fatto che ilprodotto scalare costruito a partire da due segmenti orientati dipende, ovviamente,dalla scelta dell’unita di misura utilizzata nel sistema di riferimento cartesiano, manon dipende dall’orientamento degli assi. In altri termini, se si effettua una rotazionedegli assi (e con cio cambiano le componenti dei vettori considerati) il prodotto scalarenon cambia.

La verifica di questa proprieta costituisce un esercizio di geometria analitica. Seil sistema originario viene ruotato di un angolo ϕ, le nuove componenti dei vettori v1

e v2 diventano (v. fig. 2.2)

X ′1 = X1 cos ϕ + Y1 sinϕ, Y ′

1 = −X1 sinϕ + Y1 cos ϕ,

X ′2 = X2 cos ϕ + Y2 sinϕ, Y ′

2 = −X2 sinϕ + Y2 cos ϕ.

Ne segue

X ′1X

′2 + Y ′

1Y ′2 = X1X2(cos2 ϕ + sin2 ϕ) + Y1Y2(cos2 ϕ + sin2 ϕ) =

= X1X2 + Y1Y2.

Se indichiamo con α l’angolo tra i vettori v1 e v2, allora la proiezione di v1 sullaretta contenente v2 e data da p = ‖v1‖ cos α; ne segue che il prodotto scalare eesprimibile anche come

v1 • v2 = ‖v1‖ ‖v2‖ cos α,

Page 10: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

2. Il prodotto scalare nel piano 7

(1, 0)

(0, 1)

(X, Y )

X ′

Y ′

ϕ

ϕ

(cos ϕ, sinϕ)

(− sinϕ, cos ϕ)

Figura 2.2. Rotazione del sistema di riferimento.

da cui

cos α =v1 • v2

‖v1‖ ‖v2‖=

X1Y1 + X2Y2√X2

1 + Y 21

√X2

2 + Y 22

.

Il rapporto appena calcolato e dunque compreso tra −1 e 1; esso vale 1 se l’angolotra i due vettori e nullo, dunque essi sono tra loro proporzionali secondo una costantedi proporzionalita positiva, mentre vale −1 se l’angolo in questione e piatto, dunque ivettori sono tra loro proporzionali secondo una costante di proporzionalita negativa.

Una volta che avremo esteso la nozione di prodotto scalare, vedremo come ilrapporto in esame, cioe il rapporto tra il prodotto scalare tra due vettori (non nulli) eil prodotto delle loro norme, puo essere assunto come coefficiente di correlazione trai vettori stessi, cioe un numero che misura il “grado di somiglianza” tra i due vettori.

Questo coefficiente puo essere positivo oppure negativo, ed e nullo quando (e soloquando) i due vettori sono tra loro ortogonali.

Page 11: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare

Nel capitolo precedente abbiamo costruito una corrispondenza che ad ogni coppia dielementi di R

2 (tale coppia rappresenta un vettore in un sistema cartesiano di riferi-mento) associa un numero reale: il prodotto scalare. In definitiva abbiamo costruitouna funzione da R

2 × R2 ad R che gode di certe proprieta che passiamo ad elencare.

Modifichiamo leggermente i simboli del capitolo precedente. Indichiamo con v == (x, y) un generico vettore del piano; quando avremo necessita di considerare due opiu vettori utilizzeremo i simboli vk = (xk, yk), con k naturale.

Il prodotto scalare e definito ponendo

v1 • v2 := x1y1 + x2y2.

Abbiamo

v • v = x2 + y2 ≥ 0, v • v = 0 ⇐⇒ v = 0 = (0, 0);

v1 • v2 = v2 • v1;

per ogni numero reale t

t v1 • v2 = t (v1 • v2)

v1 • (v2 + v3) = v1 • v2 + v1 • v3.

Si tratta di proprieta di dimostrazione immediata. Segnaliamo ancora la disugua-glianza

|v1 • v2| ≤ ‖v1‖ ‖v2‖,dove il segno di uguaglianza vale se, e solo se, i due vettori sono proporzionali.

Vogliamo estendere le idee precedenti al caso degli spazi vettoriali astratti. Nondaremo una definizione formale, ma ci limiteremo ad introdurre i concetti medianteesempi.

Uno spazio vettoriale (abbreviato s.v.) e un insieme di oggetti chiamati vettori;e possibile sommare tra loro due vettori, ottenendo ancora un vettore, ed e possibilemoltiplicare uno scalare (cioe per un numero) per un vettore, ottenendo ancora unvettore. Sono valide tutte le regole che abbiamo visto nel caso in cui i vettori sianorappresentati mediante coppie di numeri reali.

Esempio 3.1. L’insieme Rn (n ≥ 1) costituito dalle n-ple ordinate di numeri reali,

x = (x1, x2, . . . , xn), e uno s.v. se si introducono le operazioni

(x1, x2, . . . , xn) + (y1, y2, . . . , yn) := (x1 + y1, x2 + y2, . . . , xn + yn)

t (x1, x2, . . . , xn) := (tx1, tx2, . . . , txn).

Si tratta di uno s.v. reale in quanto gli scalari che si considerano sono numerireali. Il vettore nullo e 0 = (0, 0, . . . , 0), l’opposto del vettore x = (x1, x2, . . . , xn) e−x = (−x1,−x2, . . . ,−xn), che coincide col prodotto di −1 per x.

Possiamo introdurre un prodotto scalare in questo spazio ponendo

x • y := x1y1 + x2y2 + . . . + xnyn,

Page 12: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 9

con evidente significato dei simboli. Lo chiameremo prodotto scalare canonico perdistinguerlo da altri prodotti scalari che e possibile introdurre in R

n. Per n = 2 e ilprodotto scalare che gia conosciamo.

Se in un negozio si vendono n articoli, e i prezzi unitari sono p1, p2, . . . , pn, allorail prodotto scalare tra un vettore x = (x1, x2, . . . , xn), che rappresenta gli acquistifatti da un cliente, e il vettore dei prezzi p = (p1, p2, . . . , pn), cioe

p • x = p1x1 + p2x2 + . . . + pnxn

rappresenta il valore complessivo degli acquisti effettuati. In questo caso i numeri xk

saranno ≥ 0.Due vettori per cui si abbia (x • y) = 0 sono ortogonali rispetto al prodotto scalare

considerato. Ad esempio sono a due a due ortogonali i vettori

ek := (0, 0, . . . , 0︸ ︷︷ ︸k−1 zeri

, 1, 0, . . . , 0), k = 1, 2, 3, . . . , n.

Per tali vettori si ha

eh • ek = δhk ={

1, se h = k,0, altrimenti.

Tali relazioni si esprimono dicendo che i vettori e1, . . . ,en costituiscono una famigliaortonormale (o ortonormata). Piu precisamente, essi costituiscono una base ortonor-male, in quanto ogni vettore x = (x1, x2, . . . , xn) si puo esprimere come combinazionelineare dei vettori in esame:

x = x1 e1 + x2 e2 + . . . + xn en.

Esempio 3.2. Abbiamo concluso l’esempio precedente mostrando una famiglia divettori a due a due ortogonali. In vista di alcune applicazioni che studieremo inseguito, ci chiediamo se sia possibile costruire una tale famiglia utilizzando soltantovettori con componenti uguali a 1 oppure −1, la prima componente essendo 1.

Nello spazio R2 la risposta e immediata: i vettori (1, 1) e (1,−1) soddisfano la

condizione posta.

1

1

Figura 3.1. Una base ortogonale nello spazio R2.

D’altra parte non e difficile convincersi che, se n e dispari, non esistono in Rn due

vettori del tipo considerato che siano ortogonali tra loro: il prodotto scalare si riducealla somma di un numero dispari di addendi del tipo ±1, che non puo essere 0.

Vogliamo mostrare come sia possibile costruire una base ortogonale costituita davettori con componenti del tipo ±1 in ogni spazio R

2n

, dunque in R2, R

4, R8, R

16,. . . , a partire dalla coppia (1, 1) e (1,−1) che risolve il nostro problema in R

2.Se v e un assegnato vettore, indichiamo col simbolo [v,v] il vettore di dimensione

doppia che si ottiene concatenando la lista delle componenti di v con se stessa, colsimbolo [v,−v] il vettore che si ottiene concatenando la lista delle componenti di vcon la lista delle componenti di −v. Ad esempio:

v = (1, 1) =⇒{

[v,v] = (1, 1, 1, 1),[v,−v] = (1, 1,−1,−1).

Page 13: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

10 G.C. Barozzi: Ortogonalita

Chiaramente, se v e un vettore con componenti ±1, tali sono anche i vettori “figli”generati con la procedura descritta; inoltre [v,v] e [v,−v] sono ortogonali tra loro, inquanto il loro prodotto scalare si riduce a v • v + v • (−v) = 0.

Ma c’e di piu: se v1 e v2 sono ortogonali in Rn, allora i quattro vettori

[v1,v1], [v1,−v1], [v2,v2], [v2,−v2]

sono mutuamente ortogonali in R2n. La verifica e immediata.

Basta allora applicare alla coppia (1, 1) e (1,−1) il procedimento descritto, peravere quattro vettori a due a due ortogonali in R

4, che scriviamo in forma di matrice:

W2 =

1 1 1 11 1 −1 −11 −1 −1 11 −1 1 −1

Abbiamo ordinato i vettori dall’alto al basso in modo che il numero di cambiamenti

di segno che si contano in ogni riga sia crescente. In un vettore a componenti ±1 siverifica un cambiamento di segno ogni volta che un numero e seguito dal suo opposto.

Le righe della matrice W2 possono essere rappresentate mediante istogrammi.

Figura 3.2. Le righe della matrice W2 rappresentate mediante istogrammi.

Il procedimento puo essere iterato: ogni riga della matrice W2 genera due vettoria 8 componenti, e possiamo organizzare gli 8 vettori ottenuti come matrice W3, le cuirighe sono ordinate secondo il criterio del valore crescente di cambiamenti di segno:

W3 =

1 1 1 1 1 1 1 11 1 1 1 −1 −1 −1 −11 1 −1 −1 −1 −1 1 11 1 −1 −1 1 1 −1 −11 −1 −1 1 1 −1 −1 11 −1 −1 1 −1 1 1 −11 −1 1 −1 −1 1 −1 11 −1 1 −1 1 −1 1 −1

Possiamo ancora utilizzare istogrammi per rappresentare le righe della matrice W3.

Figura 3.3. Le righe della matrice W3 rappresentate mediante istogrammi.

Page 14: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 11

Possiamo anche rappresentare le matrici Wn con una scacchiera 2n×2n utilizzandoil codice −1 = bianco, 1 = nero. Questa rappresentazione mette in evidenza il fattoche le matrici Wn sono simmetriche.

Figura 3.4. La matrice W5 e simmetrica.

In generale possiamo indicare con Wn la matrice quadrata di ordine 2n le cuirighe costituiscono un sistema di 2n vettori a due a due ortogonali, con componentiuguali a ±1, costruita a partire da

W1 =[

1 11 −1

]in base al procedimento ricorsivo che abbiamo appena indicato.

Esempio 3.3. Si puo generalizzare l’esempio 1 considerando le successioni di numerireali: x = (x1, x2, . . . , xn, . . .). Non e difficile introdurre in tale insieme una strutturadi s.v.; tuttavia, avendo in vista l’introduzione di uno s.v. con prodotto scalare, cilimitiamo a considerare le successioni per cui e convergente la serie costituita daiquadrati dei termini∑

n≥1

x2n < ∞.

Dunque la successione (1, 1, 1, . . . , ) non e accettabile, mentre lo e la successione(1, 1/2, 1/3, 1/4, . . .). Appartengono al nostro spazio anche tutte le successioni defini-tivamente nulle, cioe nulle da un certo termine in poi.

Le operazioni in questo insieme sono definite in analogia con quanto abbiamo fattonell’esempio 1:

x + y = (x1, x2, . . . , xn, . . .) + (y1, y2, . . . , yn, . . .) :=: = (x1 + y1, x2 + y2, . . . , xn + yn, . . .)

t x = t (x1, x2, . . . , xn, . . .) := (tx1, tx2, . . . , txn, . . .).

Possiamo poi definire un prodotto scalare tra due vettori (si tratta di due succes-sioni) ponendo

x • y :=∑n≥1

xnyn.

Per convincersi che la serie a secondo membro e convergente (anzi: assolutamenteconvergente) basta osservare che

|xnyn| ≤x2

n + y2n

2,

e le due serie∑

n≥1 x2n e

∑n≥1 y2

n sono convergenti per ipotesi. Abbiamo ottenutouno s.v. con prodotto scalare che e indicato in letteratura col simbolo �2.

Per il prodotto scalare considerato si possono usare altri simboli, come ad esempio(x, y), oppure, per evitare confusione con la coppia ordinata, (x|y).

Page 15: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

12 G.C. Barozzi: Ortogonalita

Due vettori per cui si abbia (x|y) = 0 sono ortogonali. Ad esempio sono a due adue ortogonali i vettori

ek := (0, 0, . . . , 0︸ ︷︷ ︸k−1 zeri

, 1, 0, . . .), k = 1, 2, 3, . . .

Per tali vettori si ha

(eh|ek) = δhk ={

1, se h = k,0, altrimenti.

Esempio 3.4. Consideriamo l’insieme delle funzioni reali continue su un intervallo[a, b], C[a, b], con le consuete operazioni di somma tra funzioni e moltiplicazione di unacostante per una funzione. Possiamo introdurre un prodotto scalare tra le funzioni fe g ponendo

(f |g) :=∫ b

a

f(x) g(x) dx.

Due funzioni saranno ortogonali se (f |g) = 0, cioe se l’integrale del loro prodotto enullo.

Un esempio notevolissimo di famiglia ortogonale, cioe un insieme di funzioni a duea due ortogonali nello spazio delle funzioni C[−π, π], fu trovato da J. Fourier all’iniziodel diciannovesimo secolo; si tratta delle funzioni:

cos nx, n = 0, 1, 2, . . . , sinnx, n = 1, 2, . . . .

Le relazioni∫ π

−π

sinnx cos mx dx = 0

sono ovvie, poiche la funzione integranda e dispari (in quanto prodotto di una funzionedispari per una funzione pari). Meno ovvie, per n �= m, le relazioni∫ π

−π

sinnx sinmx dx = 0,

∫ π

−π

cos nx cos mx dx = 0.

Per la loro verifica si puo ricorrere alle identita (formule di Werner)

sin α sinβ = −12[cos(α + β) − cos(α − β)],

cos α cos β =12[cos(α + β) + cos(α − β)].

La famiglia in esame e ortogonale ma non ortonormale, cioe il prodotto scalare diciascun elemento per se stesso non vale 1. Abbiamo infatti le relazioni

(cos nx| cos nx) =∫ π

−π

cos2 nx ={

2π, se n = 0,π, altrimenti,

(sinnx| sinnx) =∫ π

−π

sin2 nx = π.

-3 -2 -1 1 2 3

-1

1

-3 -2 -1 1 2 3

-1

1

Figura 3.5. Le funzioni sin x e sin 2x (a sinistra) e il loro prodotto (a destra).

Page 16: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 13

Non e facile tradurre in termini intuitivi l’ortogonalita tra due funzioni quali sinxe sin 2x. Se facciamo i grafici di tali funzioni ed anche quello del loro prodotto (v.figura 3.5, a destra) ci rendiamo conto del fatto che quest’ultima funzione ha integralenullo.

Esempio 3.5. La scelta dello spazio C[a, b] nell’esempio precedente e in qualchemodo artificiale. Se vogliamo introdurre un prodotto scalare del tipo

(f |g) :=∫ b

a

f(x) g(x) dx,

o, piu in generale

(f |g) :=∫ b

a

f(x) g(x) dx

quando si vogliono considerare funzioni a valori complessi, la scelta naturale e lospazio L2[a, b] costituito dalle funzioni di quadrato sommabile, cioe le funzioni per cuisi ha ∫ b

a

|f(x)|2 dx < +∞,

l’integrale essendo inteso nel senso di Lebesgue.Le famiglie di vettori a componenti ±1 che abbiamo studiato nell’esempio 2 ci

suggeriscono di considerare famiglie ortogonali di funzioni nello spazio L2[0, 2n], co-stituite da funzioni costanti a tratti che assumono soltanto i valori −1 e 1.

Gli istogrammi che abbiamo mostrato nelle figure 3.2 e 3.3 ci suggeriscono comefare. Se indichiamo con wn,k la k-esima riga della matrice Wn, e con wn,k[j], j == 1, 2, . . . , 2n, le sue componenti, cioe

wn,k =(wn,k[1], wn,k[2], . . . , wn,k[2n]

)possiamo definire la funzione wn,k(x) sull’intervallo [0, 2n] ponendo

wn,k(x) := wn,k[j], per j − 1 < x < j, j = 1, 2, . . . , 2n

e attribuendo valori arbitrari (ad esempio nulli) alla funzione stessa nei punti di ascissaintera.

Il grafico di wn,k(x) non e diverso dall’istogramma che rappresenta wn,k a pattodi interpretare in modo opportuno i valori sull’asse delle ascisse. Inoltre

(wn,k|wn,h) =∫ 2n

0

wn,k(x) wn,h(x) dx = wn,k • wn,h ={

2n, se h = k,0, altrimenti.

L’ultima uguaglianza puo essere sintetizzata scrivendo

WnW Tn = 2nI,

dove W Tn e la trasposta della matrice Wn e I e la matrice unita di ordine 2n.

Abbiamo dunque costruito una famiglia ortogonale nello spazio L2[0, 2n]; le fun-zioni che la costituiscono sono note come funzioni di Walsh, dal nome dell’americanoJ.L. Walsh (1895-1973) che le introdusse nel 1923.

Se f e una funzione di L2[a, b] il suo prodotto scalare con una funzione wn,k ericondotto al calcolo degli integrali di f sugli intervalli [j − 1, j] per j da 1 a 2n.Infatti

(f |wn,k) =∫ 2n

0

f(x)wn,k(x) dx =2n∑

j=1

∫ j

j−1

f(x) wn,k(x) dx =

=2n∑

k=1

wn,k[j]∫ j

j−1

f(x) dx.

Page 17: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

14 G.C. Barozzi: Ortogonalita

In definitiva il prodotto scalare in questione si riduce ad una combinazione linearecon coefficienti ±1 degli integrali

∫ j

j−1f(x) dx .

Le funzioni wn,k possono essere prolungate su tutto R come funzioni periodichedi periodo 2n. Formalmente: se x ∈ R, possiamo scrivere

x = q · 2n + r,

con q ∈ Z e 0 ≤ r < 2n. Il numero q e il quoziente intero di x diviso per 2n, o megliol’approssimazione intera per difetto del rapporto x/2n:

q = x/2n� := max{z ∈ Z | z ≤ x/2n}.Il resto r viene indicato spesso col simbolo Mod(x, 2n). La funzione wn,k viene pro-lungata a tutta la retta reale ponendo

wn,k(x) := wn,k(r).

Le funzioni cosı ottenute hanno una certa somiglianza con le funzioni trigono-metriche dell’esempio precedente. La funzione wn,k e pari oppure dispari a secondache l’ultima componente del vettore wn,k valga 1 oppure −1. Le funzioni di Walshpari vengono indicate col simbolo cal (cosine Walsh function), mentre quelle disparivengono indicate col simbolo sal (sine Walsh function).

Piu precisamente si pone

caln,k(x) := wn,2k+1(x), k = 0, 1, . . . , 2n−1 − 1,

saln,k(x) := wn,2k(x), k = 1, 2, . . . , 2n−1.

T = 8

Figura 3.6. Grafici delle funzioni cal3,1, cal3,2 e cal3,3.

Nella figura 3.6 sono rappresentate, dall’alto al basso, le funzioni cal3,1, cal3,2 ecal3,3. Nella figura 3.7 sono rappresentate le funzioni sal3,1, sal3,2, sal3,3 e sal3,4. �

L’esempio precedente ha mostrato come esista una corrispondenza naturale tra lefunzioni costanti a tratti su un intervallo [a, b] e i vettori costituiti dai valori che esseassumono su ciascun intervallo parziale. Piu precisamente, se [a, b] viene suddiviso inn parti uguali mediante i punti

xj := a + jb − a

n, j = 1, 2, . . . , n,

e la funzione f assume il valore yj sull’intervallo ]xj−1, xj [ (e valori arbitrari neipunti xj stessi), allora la corrispondenza f �→ y = (y1, y2, . . . , yn) associa ad ogni

Page 18: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 15

T = 8

Figura 3.7. Grafici delle funzioni sal3,1, sal3,2, sal3,3 e sal3,4. Le funzioni sal3,1, sal3,2 e

sal3,4 sono onde quadre di periodo rispettivamente 8, 4 e 2.

funzione costante a tratti un vettore di Rn. Questa corrispondenza conserva i prodotti

scalari a meno di una costante di proporzionalita; vale a dire se g e una secondafunzione costante a tratti (relativamente alla scomposizione considerata) e g �→ z =(z1, z2, . . . , zn), allora

(f |g) =∫ b

a

f(x) g(x) dx =b − a

n

n∑j=1

yj zj =b − a

ny • z.

In particolare due funzioni costanti a tratti sono tra loro ortogonali se e solo setali sono i corrispondenti vettori.

Queste considerazioni ci suggeriscono un’idea per generare famiglie ortogonali inR

n. Partiamo da una famiglia di funzioni ortogonali, poi approssimiamo ciascuna fun-zione con una funzione costante a tratti, cosı come si fa quando si definisce l’integraledi Riemann. Se queste funzioni approssimate sono scelte opportunamente e verosimileche anch’esse costituiscano una famiglia ortogonale: a questo punto i vettori corrispon-denti sono ortogonali in R

n.

Esempio 3.6. Le funzioni cos kx, k ∈ N, non sono soltanto ortogonali sull’intervallo[−π, π] ma anche sull’intervallo [0, π]; si veda al riguardo l’esercizio 3.2 al termine delcapitolo. Si verificano senza difficolta e relazioni

(cos hx| cos kx) =∫ π

0

cos hx cos kx dx =

{π, se h = k = 0,π/2, se h = k > 0,0 se h �= k.

Dividiamo l’intervallo [0, π] in n parti uguali mediante i punti xj := jπ/n, econsideriamo la funzione costante a tratti che si ottiene campionando la funzionecos kx nei punti ξj , dove ξj ∈ [xj−1, xj ].

Per k = 0 si ha la funzione costante 1, quindi comunque vengano scelti i puntiξj si ha, come vettore corrispondente, il vettore (1, 1, . . . , 1). Per k = 1, si ottiene ilvettore

Page 19: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

16 G.C. Barozzi: Ortogonalita

(cos ξ1, cos ξ2, . . . , cos ξn

)e questo deve essere ortogonale al precedente, dunque deve essere

n∑j=1

cos ξj = 0.

La somma appena scritta, se moltiplicata per π/n, non e altro che una sommadi Riemann relativa all’integrale

∫ π

0cos x dx che vale 0. Poiche la funzione coseno e

decrescente sull’intervallo [0, π], la scelta ξj = xj−1 ci condurrebbe ad una stima pereccesso dell’integrale considerato, dunque ad un numero > 0, mentre la scelta ξj = xj

ci condurrebbe ad un numero < 0.La scelta corretta e il punto medio

ξj =xj−1 + xj

2=

2j − 12n

π.

Questa scelta e valida non solo per k = 1, ma per tutti i k interi fino al valore n − 1.In altri termini, i vettori

cn,k :=(

cos kπ

2n, cos k

2n, . . . , cos k

(2n − 1)π2n

)per k = 0, 1, . . . , n−1 costituiscono una famiglia ortogonale in R

n. Una dimostrazionerigorosa di questo fatto e laboriosa, ma elementare. Una traccia di tale dimostrazioneviene fornita negli esercizi al termine del capitolo.

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

1 2 3

-1

1

Figura 3.8. In alto: le funzioni cos kx, k = 0, 1, . . . , 7, campionate in 8 punti; sotto:

rappresentazione dei corrispondenti vettori c8,k mediante istogrammi.

Abbiamo le relazioni di ortogonalita, corrispondenti a quelle che abbiamo vistoper le funzioni cos kx,

cn,h • cn,k =

{n, se h = k = 0,n/2, se 0 < h = k ≤ n − 1,0 se h �= k, 0 ≤ h, k ≤ n − 1.

Page 20: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 17

Se Cn e la matrice che ha come righe i vettori cn,k, tali relazioni possono esseresintetizzate mediante l’uguaglianza

CnCTn =

n 0 0 . . . 00 n/2 0 . . . 0

0. . . . . .

......

. . . 00 0 . . . 0 n/2

.

Figura 3.9. Rappresentazione della matrice C8; i livelli di grigio vanno da −1 = bianco, a

1 = nero.

prodotto scalareSia ora V uno s.v. qualsivoglia, i cui elementi (= vettori) verranno indicati consimboli come x, y ecc. Una funzione che ad ogni coppia di vettori x,y associa unnumero reale indicato (x|y) si dira un prodotto scalare (o prodotto interno) su V sesono verificate le proprieta seguenti:

(αx + βy|z) = α(x|z) + β(y|z) (1)

(x|y) = (y|x), (2)

x �= 0 =⇒ (x|x) > 0. (3)

S’intende che x, y e z sono vettori ad arbitrio, α e β sono scalari ad arbitrio. La(3) richiede che il prodotto scalare di un vettore non nullo per se stesso sia un numero> 0. Dalla (1), ponendo α = β = 0, segue che il vettore nullo e ortogonale ad ognialtro vettore, ed e anche l’unico che goda di tale proprieta, ancora in virtu della (3).

Un prodotto scalare su V e dunque una funzione da V × V a R. Possiamo ugual-mente considerare s.v. sul campo complesso; in tal caso un prodotto scalare e unafunzione da V × V a C per cui sono verificate le proprieta (1) e (3) e, al posto della(2), la

(x|y) = (y|x), (2′)

dove il soprassegno indica il complesso coniugato.normaPossiamo introdurre una norma in V ponendo

‖x‖ :=√

(x|x). (4)

Nel caso dello s.v. R2, che gia conosciamo, si tratta dell’ordinaria lunghezza del vettore

x, intesa in senso euclideo. Per la norma valgono le seguenti proprieta

x �= 0 =⇒ ‖x‖ > 0. (5)

‖αx‖ = |α|‖x‖, (5)

‖x + y‖ ≤ ‖x‖ + ‖y‖. (7)

Page 21: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

18 G.C. Barozzi: Ortogonalita

La (5) segue subito dalla (3), mentre la (6) segue direttamente dalla definizionediseguaglianza di norma. Alla dimostrazione della (7), nota come diseguaglianza triangolare, e op-

di Cauchy-Schwarz portuno premettere la diseguaglianza

|(x|y)| ≤ ‖x‖ ‖y‖, (8)

nota come diseguaglianza di Cauchy-Schwarz (dai nomi del francese A.-L. Cauchy,1789-1857, e del tedesco H.A. Schwarz, 1843-1921). Nel caso dello spazio R

2 talediseguaglianza e gia stata segnalata.

Dimostriamo la (8), limitatamente agli s.v. reali. Osserviamo innanzitutto che essae ovvia se uno dei due vettori in gioco e nullo, riducendosi in tal caso all’uguaglianza0 = 0. Supposti x e y non nulli, osserviamo che per ogni reale t si ha

0 ≤ ‖tx + y‖2 = (tx + y|tx + y) = t2‖x‖2 + 2t (x|y) + ‖y‖2.

Il discriminante del trinomio nella variabile t che abbiamo appena ottenuto deveessere ≤ 0, cioe

(x|y)2 − ‖x‖2 ‖y‖2 ≤ 0 ⇐⇒ (x|y)2 ≤ ‖x‖2 ‖y‖2,

e questo e quanto dovevamo dimostrare, salvo estrarre le radici quadrate,Si osservi che vale il segno di uguaglianza se e solo se esiste un valore di t per cui

tx + y = 0, dunque se e solo se i due vettori in esame sono tra loro proporzionali, o(che e lo stesso) linearmente dipendenti.

Dalla (8) segue che, se x e y sono vettori non nulli, il rapporto(x|y)

‖x‖ ‖y‖e compreso tra −1 e 1, dove i valori estremi sono raggiunti se (e solo se) i due vettorisono proporzionali.

diseguaglianza A questo punto possiamo dimostrare la diseguaglianza triangolare (7). Trattandositriangolare di una diseguaglianza tra numeri non negativi, possiamo confrontare i quadrati. Ora

si ha‖x + y‖2 = (x + y|x + y) =

= ‖x‖2 + 2(x|y) + ‖y‖2 ≤ ‖x‖2 + 2|(x|y)| + ‖y‖2 ≤≤ ‖x‖2 + 2‖x‖ ‖y‖ + ‖y‖2 = (‖x‖ + ‖y‖)2.

Abbiamo sfruttato il fatto che ogni numero reale e minore o uguale al propriovalore assoluto e la diseguaglianza di Cauchy-Schwarz.

Si osservi che perche valga il segno di uguale nella diseguaglianza appena stabilitaoccorre che x e y siano tra loro proporzionali (affinche valga il segno di uguaglianzanella diseguaglianza di Cauchy-Schwarz) ed inoltre il coefficiente di proporzionalitadeve essere positivo affinche il prodotto scalare (x|y) sia positivo e pertanto coincidacol proprio valore assoluto.

teorema di Pitagora Due vettori per cui risulti (x|y) = 0 si dicono ortogonali tra loro e si scrive spessox ⊥ y. Possiamo dare una versione astratta del teorema di Pitagora:

x ⊥ y =⇒ ‖x + y‖2 = ‖x‖2 + ‖y‖2. (9)

Per la dimostrazione basta calcolare‖x + y‖2 = (x + y|x + y) = (x|x) + (x|y) + (y|x) + (y|y) =

= ‖x‖2 + ‖y‖2.

Il risultato si estende subito ad un numero qualsivoglia di vettori a due a dueortogonali: se i vettori x1,x2, . . . ,xn sono mutuamente ortogonali, allora

‖x1 + x2 + . . . + xn‖2 = ‖x1‖2 + ‖x2‖2 + . . . + ‖xn‖2. (9′)

Mostriamo come l’ortogonalita implichi la lineare indipendenza, cioe se i vettorix1,x2, . . . ,xn sono (non nulli e) mutuamente ortogonali, essi sono linearmente in-dipendenti. Sia infatti c1, c2, . . . , cn una n-pla di costanti per cui

Page 22: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

3. Spazi vettoriali con prodotto scalare 19

c1x1 + c2x2 + . . . + cnxn = 0.

Moltiplicando scalarmente entrambi i membri per xk otteniamo

ck(xk|xk) = 0,

da cui ck = 0, e quindi la tesi, per l’arbitrarieta di k.Prima di concludere vogliamo nuovamente richiamare l’attenzione del lettore sul

rapporto

(x|y)‖x‖ ‖y‖

che gia abbiamo incontrato al termine del capitolo precedente. Lo abbiamo chiamatocoefficiente di correlazione, in quanto si tratta di un indice, compreso tra −1 e 1, chemisura il grado di somiglianza tra i vettori non nulli x e y.

1 2 3 4 5 6

-1

1

1 2 3 4 5 6

-1

1

1 2 3 4 5 6

-1

1

1 2 3 4 5 6

-1

1

1 2 3 4 5 6

-1

1

1 2 3 4 5 6

-1

1

Figura 3.10. Dall’altro al basso, da sinistra a destra: il coefficiente di correlazione tra le

funzioni f(x) = 0.5 sin x e gλ(x) = sin(λx) per λ = 1 + k/3, k = 0, 1, . . . , 5.

Esempio 3.7. Si consideri lo spazio L2[0, 2π], e le funzioni f(x) = 0.5 sinx, gλ(x) == sin(λx), con λ ≥ 1. Sappiamo che se λ e intero, le funzioni f e gλ sono tra loroortogonali, dunque il coefficiente di correlazione e nullo. Nella figura 3.8 la barra asinistra dei grafici mostra il valore del coefficiente di correlazione tra f e gλ, per λ cheassume i valori 1 + k/3, k = 0, 1, . . . , 5.Il segno del coefficiente di correlazione coincide col segno dell’integrale∫ 2π

0

f(x) gλ(x) dx. �

Page 23: Dipartimento di Matematica - Ortogonalit`abarozzi/Orto/Orto-Cap.1-3.pdf · trampolino di lancio per estendere il concetto agli spazi Rn e successivamente a spazi vettoriali pi`u astratti,

20 G.C. Barozzi: Ortogonalita

Esercizi

3.1. Sia w = (w1, w2, . . . , wn) un vettore a componenti > 0; verificare che

(x|y)w :=n∑

k=1

wk xk yk

e un prodotto scalare in Rn.

3.2. Verificare che le due successioni cos nx, n = 0, 1, . . . e sinnx, n = 1, 2, . . ., sonoortogonali nello spazio L2[0, π], ma non e tale la loro unione (ad esempio sin 2x e cos xnon sono tra loro ortogonali in tale spazio).

3.3. Sia Pn lo spazio vettoriale dei polinomi di grado ≤ n. Scelti n + 1 punti distintisulla retta reale xk, k = 0, 1, . . . , n, verificare che

(p1|p2) :=n∑

k=0

p1(xk) p2(xk)

dove p1, p2 ∈ Pn, e un prodotto scalare.

3.4. Per h e k numeri naturali compresi tra 0 e n − 1, diversi tra loro, vogliamoverificare la relazione di ortogonalita

n∑j=1

cos(h

2j − 12n

π)

cos(k

2j − 12n

π)

= 0.

Possiamo supporre h > k. In base alle formule di Werner si tratta di dimostrare che

12

n∑j=1

cos((h + k)

2j − 12n

π)

+12

n∑j=1

cos((h − k)

2j − 12n

π)

= 0,

dove tanto h + k quanto h− k sono numeri compresi 1 e 2n− 3. Se dimostriamo che,per ogni h intero compreso 1 e 2n − 3, si ha

n∑j=1

cos(h

2j − 12n

π)

= 0

la tesi e dimostrata. Ora la quantita a primo membro e la parte reale din∑

j=1

exp[i(h

2j − 12n

π)]

=

= ei 12n hπ + ei 3

2n hπ + . . . + ei 2n−12n hπ =

= ei 12n hπ

(1 + ei 1

n hπ + ei 2n hπ + . . . + ei n−1

n hπ)

=

= ei 12n hπ 1 − eihπ

1 − ei hπn

=1 − (−1)n

e−i hπ2n − ei hπ

2n

.

L’ultima quantita e nulla per h pari, puramente immaginaria per h dispari. Abbiamoutilizzato l’identita

1 + z + . . . + zn−1 =1 − zn

1 − z,

valida per ogni z �= 1.