Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a....
Transcript of Corso di Statistica per la Ricerca Sperimentalesquarcia/DIDATTICA/SRS/24_Simulazioni.pdfSMID a.a....
SMIDa.a. 2005/2006
8/3/2006
Tecniche di simulazione
Corso di Statistica per la Ricerca
Sperimentale
Metodo di Monte CarloRisoluzione di problemi numericideterminazione parametro F di una popolazione di cui una sequenza di numeri a caso è utilizzata per costruirne un campione significativo
• Perché utilizzare il metodo MC?
• Esistono sequenze di numeri casuali?
• Cosa si può ottenere mediante questa tecnica?
- Verifica aspettazioni teoriche- Controllo risultati sperimentali- …….
Problemi risolubiliTipo A: problemi statistico-probabilistici
• fluttuazioni casuali• esempio: probabilità del decadimento di Λ0 dopo due vite medie
Tipo B: problemi analitici, esatti, classici(conoscendo la legge di decadimento)
• risolvibili col calcolo • esempio: determinazione dell’area di un cerchio di raggio R
(A = π R2)
Soluzioni
probabilitàdecadimento
Λ0
calcolo area del cerchio
Tipo A
Tipo B
problemi statistico-probabilistici
simulazione diretta
numeri casuali
espansione in serie
calcolo analitico
Monte
Carl
oStatistica classicageometria
approssimata (convergenza
lenta
numerica convergenza
rapida
analitica calcolo esatto problemi analitici, esatti, classici
Decadimento Λ0
Soluzione analitica per vita media per λ > 2
fluttuazioni di una distribuzione binomialePiccoli intervalli dt
numero di particelle che decadono
occorre scegliere λNdt << 1probabilità numero a caso sia minore di λNdt
è proprio λNdtCon MC si ottiene la probabilità e la fluttuazione
Area cerchioSoluzione analitica
area di un cerchio unitario vale esattamente π
numero considerato esatto
Determinato con desiderato grado di accuratezza data le serie a segni alterni
Rapporto tra l’area del cerchioe quella del quadrato
vale proprio π/4M.C.: punti a caso nel quadrato
Simulazione diretta
fino a quando abbiamo esaurito tutte le N0 particelle Λ0 iniziali
Ripetiamo il procedimento per ciascun intervallo
Due chiari svantaggi
• N0 particelle Λ0 nel primo intervallo di tempo• Estrazione numero a caso N tra 0 ed 1• Se N > λN0dt: nessun decadimento è avvenuto• Se N < λN0dt, decadimento: N attuale = N0-1
• compromesso accuratezza e velocità calcolo• fluttuazioni statistiche intrinseche ~ 1/√N
VantaggiFluttuazioni statistiche simili a quelle sperimentali
si vogliono studiare proprio queste fluttuazioni
Simulando direttamente il processo fisicostudiare assieme differenti aspetti del fenomenotrattazione di tipo analitico richiederebbecalcolo separato per ciascun risultato richiesto
Possibile introdurre dopo effetti più complicatipartire da una simulazione più rozzarendendola via via sempre più sofisticataper meglio rispecchiare la realtà da descrivere
Calcolo integraliDenominatore comune dei due problemi proposti
soluzione di un problema di integrazione
Metodo Monte Carlo: procedimento integrazionesi vuole determinare un numero Futilizzando numeri casuali r1, r2, r3, ..., rN
(per semplicità distribuiti tra 0 e 1)
determinazione di F dal valore dell’integrale
Numeri casualiSequenze assai lunghe di numeri a caso
veri numeri casuali (truly random number)
- numeri quasi-casuali (quasi-random number)
- numeri pseudo-casuali (pseudo-random number)
processo fisico (radiattività,……)numeri casuali generati artificialmente
numeri generati con τ lungo
numeri generati con τ cortoma con migliori proprietà asintotiche
Ricerca di algoritmi di analisi numerica
Numeri pseudo casualiCostruire un generatore di numeri aleatori
utilizzando elaboratori elettronicialgoritmi con formule matematiche
riproducibili e matematicamente non casualiripetute dopo un certo periodo (pseudo-casuali)
Von Neumann: metodo della metà quadratanumero di partenza di r cifreprimo numero casuale sono gli r/2 bit centralinumero elevato al quadrato: numero di r cifrer/2 bit centrali formano il secondo numero
Nuovi algoritmiCalcolatore con t bit (numeri da 0 a 2t-1)ri è ricavato tramite la formula ricorsiva
m = 2t
distribuzione di numeri pseudo-randomperiodo di generazione pari a 2t-2
b scelto dall’utilizzatore
Elaboratore a 32 bitperiodo di generazione pari a 230 ~ 109
Uniformità (equiprobabilità)?sequenze brevi ma uniformi.
Richiami matematiciDistribuzione di densità di probabilità
funzione di distribuzione integrata G(u)
Due variabili u e v statisticamente indipendenti
Aspettazione matematica
Legge dei grandi numeriLegge uniforme
Per N sufficientemente grande
quando sequenza numeri a caso diviene grandeMetodo Monte Carlo converge al valore corretto
stima Monte Carlo valore intergrale
Limite centrale
la somma di un numero N di variabili casuali indipendenti, non importa come distribuite
è sempre distribuita in modo normale
Il teorema del limite centrale afferma che
con valore medio μ, varianza σ2 finita (N >>1)
Convergenza alla distribuzione gaussiana rapida!
Ottenere un generatore gaussiano di numeri a casoprendendo la somma di numeri casuali qualsiasi
Lancio di un dado
dado “onesto” (p = 1/6)
R1 distribuzione di un numero a caso tra 0 e 1
2 ≤ p ≤ 12, pmax = 7
R2 distribuzione triangolaresomma delle facce di due dadi:
Per N che aumenta …R3: due flessi in ±1 e ±2
forma a campana
R12: buona approssimazione della gaussiana
GaussianaPer ottenere una gaussiana normalizzata
con media μ = 0 e varianza σ2 = 1 occorre
che proprio nel caso di N = 12 da varianza 1
t = RN - 6
ConclusioneDeterminazione del valore di una funzione F
dal calcolo di un integrale ISe varianza finita,
corretta ( anche se imprecisa) per ogni Ncongruente ossia converge, all’aumentare di N
normale, asintoticamente, distribuita,
la stima ottenuta con MC è:
Deviazione standard metodo MC
L’errore diminuisce ~ 1/√N
Efficienza
su una regione specificata bidimensionale
L’efficienza di una simulazionedipende dagli algoritmi utilizzati
Calcolo di un integrale bidimensionale su una regione triangolare
1 x0
y
1
y = x
Il calcolo analitico èquello di integrare una funzione g(x, y)
Metodo banale(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < xi
(c) calcolare il valore g(xi,yi)(d) ricavare l’integrale sommando i vari g(xi,yi) ripetendo i passi (a), (b) e (c)
Valutazione scorrettapunti solo nella regione permessapiù addensati nella parte di sinistra (x bassi)piuttosto che nella parte destra (x alti)
Metodo del rigetto(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < 1
(d) calcolare il valore g(xi,yi)(e) sommare i vari g(xi,yi) iterando
Punti equidistribuitiutilizza solo la metà dei punti generatiintegra sul quadrato ma non considera l’area del triangolo superiore
(c) se yi > xi rigettare il punto e ritornare ad (a)
Non cambia se da (c) si va in (b) invece che in (a)
Metodo del ripiegamento(a) scegliere un numero a caso 0 < ri < 1(b) scegliere un altro numero a caso 0 < rj < 1
(d) porre yi = min(ri,rj)(c) porre xi = max(ri,rj)
(e) calcolare il valore g(xi,yi)(f) sommare i vari g(xi,yi) iterando
Prende i punti sull’intero quadratoripiega il quadrato lungo la diagonaletutti i punti cadono nel triangolo inferiorepunti uniformemente distribuiti senza rigetto
Metodo pesato(a) scegliere un numero a caso 0 < xi < 1(b) scegliere un altro numero a caso 0 < yi < xi(c) calcolare il valore g(xi,yi) pesandolo con 2xi
(d) sommare i vari g(xi,yi) iterandoPunti scelti in modo scorrettopesati tramite una funzione opportuna
più o meno efficiente,comparato con quello del ripiegamento,
a seconda del valore della funzione g
nel caso in esame, proporzionale ad x
Metodi alternativi
combinazione lineare di differenti valori
Metodo di Monte Carloformula di quadratura
con pesi unitaripunti scelti uniformemente
ma casualmente!
Formula della quadraturaapprossima il valore dell’integrale
TrapezioidaleDividere l’intervallo totale in N sottointervalliapprossimare l’integrale in ciascun sottointervallo
tramite l’area del trapezoide iscrittosopra o sotto la curva da integrare
media di N+1 valori di funzionemoltiplicati per la larghezza d’intervallo
due valori estremi che partecipano solo con un termine 1/2
Espansioni in serie
convergenza del metodo è molto rapida
N punti egualmente spaziatierrore sull’integrale risulta ~ 1/N2
Per grandi valori di Nfunzione può essere espressa con espansioni in serie di Taylor intorno a ciascuno degli N punti
termine costante e il primo termine (lineare) correttamente integrati dalla regola trapezoidale
errore = termini di ordine superiorevia via sempre meno importanti
Polinomiali
integra i polinomi di grado 2m - 1
Formula di quadratura di Gaussutilizza m punti (ed m pesi associati)
Possibilità integrare polinomi di grado superioremaggiore rapidità di convergenza
Regola di Simpsontre punti per ogni intervallo
integra tutti i polinomi di terzo grado
…….
numero di punti (regola di Gauss)
dim
ensi
onal
itàd’
inte
graz
ione
ConvergenzaMa allora perché utilizzare il metodo di Monte Carlo?
indipendente dalla dimensionalità dello
spazio di integrazione
dimensionalità D per cui converge più velocemente di un metodo di
quadratura
MC piùveloce
Gauss più veloce
Gauss non applicabile