Incertezzadimisura sinal-scarti-rapillo

53
2 Gli scarti .... “tipi”… facili f ( x)= 1 2 ( x x ) 2 e 2 dove si narra dell’utilizzo di excel per il calcolo della ripetibilità e dell’incertezza delle misure variabili con la concentrazione Michele Rapillo

Transcript of Incertezzadimisura sinal-scarti-rapillo

Page 1: Incertezzadimisura sinal-scarti-rapillo

2

Gli scarti .... “tipi”… facili

f (x) =1

2

(x x )2

e 2

dove si narra dell’utilizzo di excelper il calcolo della ripetibilità e

dell’incertezza delle misurevariabili

con la concentrazione

Michele Rapillo

Page 2: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 2 di 52

© 2008Proprietà letteraria riservata.

SINALSistema Nazionale per l’Accreditamento di LaboratoriPiazza Mincio 2, 00198 RomaTel. 06 8440991Fax 06 8841199www.sinal.it

Questa pubblicazione può essere liberamente riprodotta, citando la fonte.Ne è vietata la riproduzione a fini commerciali.

Edizione luglio 2008.

Page 3: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 3 di 52

a Teresaper aver dimostrato che la certezza esiste.

Page 4: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 4 di 52

Ringrazio

Nicola Bottazziniper i preziosi suggerimenti, per l’utilissimomateriale messo a disposizione e per larevisione generale del presente documento;

Fabrizio Francia e il gruppo Francia Latticiniper aver consentito la pubblicazione di importantie riservati dati aziendali;

Luis Vizcarra,spalla impagabile,“per essersi prestato al gioco”;

Emma Angelini Biancoper il contributo da lettore che è passatodall’incertezza alla certezza;

Paolo Biancoper l’attenta revisione del testoed il supporto alla pubblicazione.

Michele Rapillo

Page 5: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 5 di 52

Presentazione

Nel lungo e talvolta tortuoso itinerario della valutazione dell’incertezza di misura non a tutti èdato di procedere speditamente. Certamente ci riesce Michele Rapillo che può avvalersi di unalunga e diversificata esperienza operativa per fare da “Guida” a tutti coloro che in Laboratorio,alle prese con un determinato test analitico, debbono necessariamente produrre un risultatocompleto.Come in un’escursione lungo un aspro sentiero di montagna, in due si procede meglio e Rapilloha appunto scelto di procedere assieme ad un compagno di escursione, simpatico ma, comespesso capita nella vita, alquanto arrugginito per quanto riguarda i ricordi universitari relativi aderrori, scarti, gaussiane eccetera, che vengono opportunamente sintetizzati..L’ing. Rapillo, forte anche della sua attuale posizione di autorevole membro del Comitato diAccreditamento del SINAL che assai spesso si trova alle prese con Laboratori di Prova che delladeterminazione dell’incertezza di misura farebbero volentieri a meno, con pazienza e periziaincoraggia e spinge sulla buona strada non solo il suo interlocutore, ma anche tutti coloro chevorranno intraprendere la lettura di questa “Guida” che si rivela preziosissima bussola per entrarein confidenza con una componente essenziale della misura di laboratorio.Pertanto a tutti coloro che operano in Laboratori di Prova ed in particolare a quelli che sonoimpegnati nelle operazioni relative all’accreditamento, consigliamo fortemente la lettura diqueste pagine: una lettura che sarà di grande giovamento per il loro lavoro e che per di più li faràspesso sorridere.

Antonio PaolettiPresidente SINAL

Page 6: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 6 di 52

Introduzione

Che cosa ci può essere di facile nel concetto di scarto tipo, varianza, chi-quadro? La domandasorgerà spontanea nella mente di alcuni fra coloro che, nei loro laboratori, si sono trovati qualchevolta a contatto con problematiche di validazione di metodi di prova e quindi con ladeterminazione di ripetibilità ed incertezza delle misure. Per quelli che hanno frequentato corsispecifici sull’incertezza di misura, lo scarto tipo non risulterà così misterioso ed a maggiorragione non lo sarà per gli appassionati lettori delle numerose pubblicazioni sull’argomento:dalla GUM (o UNI ENV 13005) con le sue appendici (centinaia di pagine) in emissione, allaguida EURACHEM (anzi adesso 3 guide), alla guida EUROLAB, e alla documentazione variache si può trovare in rete.D’altronde chi solo saltuariamente ha occasione d’incontrare questa problematica ne fa spesso laconoscenza in modo disorganico e confuso, tra approccio top-down e bottom-up, olistico edHorwitz, tra scarto tipo giustappunto e scarto tipo della media, oscuri contributi ottenuti convalutazioni di tipo A e B, e finisce per considerarla piena, non già di risvolti interessanti, mapiuttosto di noia e fastidio, come accade per gli argomenti ostici che si è costretti ad imparare piùo meno a memoria perché non sembrano avere un’essenza da cogliere. Tra l’altro le guidesparano questi riferimenti al lettore come se questi avesse appena terminato con profitto un corsoavanzato di statistica, gettandolo nel panico alla ricerca di vecchi testi di scuola, tabelle di dati,solo citate e mai riportate nei documenti (come se il lettore fosse seduto su una pila di testi distatistica).Inoltre, anche se Bertolt Brecht afferma che: “Di tutte le cose sicure la più certa è il dubbio”,un’approfondita riflessione sul concetto di incertezza può generare inquietudine.Questo testo molto ricorda per la sua tipicità i dialoghi di Platone, che si contrapponevano agliscritti retorici circolanti all’epoca ad Atene, ed ha il grande pregio di presentare in formacolloquiale ma rigorosa il calcolo dell’incertezza e della ripetibilità delle misure.Analogamente a Sisifo, discepolo di Socrate, Luis viene guidato, dopo un esaustivo elenco didocumenti relativi all’incertezza di misura, attraverso le definizioni di scarto tipo, varianza,distribuzione di probabilità, normal probability plot, ecc., che costituiscono le basi teoriche delcalcolo. Entrano a questo punto in scena i dati sperimentali sui quali viene effettuato il calcolocon l’indicazione delle relative funzioni del software utilizzato (niente tabelle!).Rispetto ai testi a disposizione degli operatori del settore, questo documento fornisce una guidarapida che suggerisce però diversi livelli di approfondimento privilegiando comunquel’approccio relativo a “come si fanno le cose” rispetto all’approccio “cosa bisogna fare”.Poiché, come recita un proverbio cinese “ L'uomo che ha troppe parole, spesso non ha alcunacertezza”, termino questa breve presentazione esprimendo la convinzione che questo documentocontribuirà a sfatare alcuni miti: che l’incertezza di misura sia impossibile da comprendere, chesi traduca in una inquietante serie di equazioni da imparare a memoria, che le persone che sioccupano di queste tematiche siano umanamente aride e fredde e prive del sensodell’umorismo.Mi auguro pertanto che questa promessa di sradicamento di convinzioni diffuse risulti stimolanteper tutte le persone che per ragioni di lavoro o per mera curiosità vengano a trovarsi a contattocon le problematiche di ripetibilità ed incertezza delle misure.

Paolo BiancoDirettore SINAL

Page 7: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 7 di 52

INDICE

IL FATTO............................................................................................................................. ............8

IL LAVORO ............................................................................... .....................................................10

LUIS E I DUBBI SULLA DISTRIBUZIONE DEI DATI SPERIMENTALI ....................................................18

LUIS E LA DISTRIBUZIONE NORMALE ............................................................................................20

LUIS E I DATI ANOMALI ................................................................................................................ .23

LUIS E LO SCARTO TIPO.................................................................................................................24

LUIS E LA VERIFICA DELLA MEDIA ............................................................................................... .25

LUIS E LA VERIFICA DELLO SCARTO TIPO......................................................................................26

LUIS E IL CALCOLO DELLO SCARTO TIPO VARIABILE CON LA CONCENTRAZIONE .........................27

L’INCERTEZZA DI LUIS .................................................................................................................36

LUIS E L’APPROCCIO METROLOGICO .....................................................................................................................................38LUIS E HORWITZ ....................................................................................................................................................................41LUIS E IL CRITERIO OLISTICO .................................................................................................................................................42L’INCERTEZZA DI LUIS VARIABILE CON LA CONCENTRAZIONE ...........................................................................................42

LA DECISIONE FINALE DI LUIS ..................................................................................................... .51

Page 8: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 8 di 52

Il FattoIl mio amico Luis, un microbiologo sudamericano che dirige il laboratorio di una importanteazienda lattiero casearia1, dovendo affrontare il calcolo della ripetibilità e dell’incertezza dimisura mi ha chiesto di indicargli qualche riferimento bibliografico che lo aiutasse ad affrontaretali temi in modo rigoroso, ma al tempo stesso pratico. Gli ho consigliato di consultare il sito delSINAL2 che considero il punto di riferimento nazionale più completo sulla tematica.Luis ha seguito il mio consiglio e si è ritrovato davanti un elenco molto ampio; dopo una rapidaanalisi ha focalizzato l’attenzione su quei documenti che già nel titolo avevano il terminechimica o microbiologia e contemporaneamente anche incertezza o ripetibilità, e quelli che,indipendentemente dalla disciplina (chimica, meccanica, ecc.) trattassero il tema dell’incertezza,ottenendo il sottoinsieme riportato di seguito ed evidenziato in giallo.

Sigla Titolo Rev.DT-0002 Guida per la valutazione e la espressione dell'incertezza nelle misurazioni 1DT-0004 Linee guida per la taratura di strumenti nel settore della compatibilità

elettromagnetica e dei campi elettromagnetici ambientali0

DT-0002/1 Esempi applicativi di valutazione dell'incertezza nelle misurazioni elettriche 1DT-0002/2 Esempi applicativi di valutazione dell'incertezza nelle misurazioni

meccaniche0

DT-0002/3 Avvertenze per la valutazione dell'incertezza nel campo dell'analisi chimica 0DT-0002/4 Esempi applicativi di valutazione dell'incertezza nelle misurazioni chimiche 0DT-0002/5 Esempio applicativo per misurazioni su materiali strutturali 1DT-0002/63 Guida al calcolo della ripetibilità di un metodo di prova ed alla sua verifica

nel tempo0

EA-4/02 Expression of the uncertainty of measurement in calibration 00EA-4/09 Accreditation for sensory testing laboratories 01EA-4/10 Accreditation for Laboratories Performing Microbiological Testing 02EA-4/15 Accreditation for Bodies Performing non-Destructive Testing 00EA-4/16 EA guidelines on the expression of uncertainty in quantitative testing 00EA-4/18 Guidance on the Application of EN 45001 and ISO/IEC Guide 25 to

Electromagnetic Compatability (EMC) Testing (Già EAL-G27)1 Ed

QUAM:2000.1 EURACHEM-CITAC Guide CG4 - Quantifying Uncertainty in AnalyticalMeasurement (*)

2 Ed

SIT Doc-519 Introduzione ai criteri di valutazione della incertezza di misura nelle tarature 5Presentazione SINAL e requisiti della UNI CEI EN ISO/IEC 17025 (P. Bianco)

• ISO/IEC 17025: requisiti tecnici - Incertezza di misura: approccio GUM• ISO/IEC 17025: requisiti tecnici - Incertezza di misura: altri approcci• ISO/IEC 17025: requisiti tecnici - Incertezza di misura: decisioni

Incertezza di misura e prove valutative (S. Pepa e M. Scognamiglio)

www.measurementuncertainty.orgSito dedicato alla guida EURACHEM-CITAC.E' disponibile la guida in linea, con numerosiesempi di chimica analitica.

1Francia Latticini S.p.A.

2 Sistema Nazionale di Accreditamento dei Laboratori di Prova – www.sinal.it.3 Documento emesso durante la revisione del presente lavoro

Page 9: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 9 di 52

MATERIALE DEI CORSI DI AGGIORNAMENTO 2006• Incertezza di misura in chimica e qualità dei dati. P. AnichiniMateriale dei corsi sull'incertezza di misura nelle prove chimiche tenuti con la collaborazionedi UNICHIM:• Introduzione al corso. C. Divo• Esempio microbiologico. N. Bottazzini• Verifiche della qualità dei risultati. C. Divo

Interventi al Convegno L'ACCREDITAMENTO DEI LABORATORI PER LA SICUREZZAALIMENTARE, 25-26 ottobre 2005, organizzato da ISS ORL, SINAL, SIT· Criteri generali per la valutazione dell'incertezza di misura. F. Pennecchi, M. Mosca· Incertezza di misura: dalla GUM alla linea guida EURACHEM-CITAC. A. Menditto , M. Plassa· Esempi pratici per la valutazione dell'incertezza di misura in ambito chimico. P. Anichini, G.

Bonacchi· Esempi pratici per la valutazione dell'incertezza di misura in ambito microbiologico. A. Maiello,

A. Viti· Valutazione dell'incertezza di misura: esperienza di un laboratorio accreditato per gli OGM. S.

De Martin

A questo punto Luis, che tra l’altro esegue direttamente, e supervisiona, circa 1000 determinazionigiornaliere, ha iniziato una prima ricognizione su tutti questi documenti, e dopo circa una settimana,completamente demoralizzato, e in forte crisi di identità, mi ha chiamato e mi ha detto testualmente:“i pochi concetti che credevo di avere chiari sull’incertezza e sulla statistica si sono trasformati inuna informe massa di dubbi e di perplessità, che posso fare?”Gli ho consigliato di seguire un corso sul tema dell’incertezza allo scopo di rinfrescare i concettibase di statistica e di acquisire un approccio sistematico per poter poi meglio utilizzare anche idocumenti proposti dal SINAL.

Un mese ed un corso dopo Luis mi ha richiamato, confessandomi che il corso era stato molto utile,gli aveva fornito molte informazioni, gli aveva sciolto molti dubbi, ma principalmente gli aveva datouna certezza, la certezza che l’incertezza era una cosa da iniziati, tanto che alla fine del corso unodei partecipanti, un chimico, aveva detto:

ma alla fine, come si calcolano la ripetibilità e l’incertezza? io questo solo volevo sapere e ancoranon lo so!

Era chiaro, anche questa volta, come nella maggior parte dei corsi era stato insegnato al più, “cosabisogna fare” piuttosto che “come si fanno le cose”.Ormai ero incastrato, dovevo dare una mano a Luis.

Il mio dubbio fu se partire dai concetti base di statistica descrittiva e di inferenza statistica, oppuredalle necessità pratiche di Luis; la mia certezza era la consapevolezza di dovergli fornire sia leinformazioni teoriche indispensabili a “capire il perché” che gli elementi pratici per “sapere come”,miscelandoli e definendone le priorità in relazione alle necessità.Decisi di partire dalle necessità pratiche del mio amico.

Page 10: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 10 di 52

Il lavoro

M4Qual è il tuo problema?

L5 Devo validare un metodo interno. In realtà non si tratta di un metodo ideato dal laboratorio: contutto quello che ho da fare ci mancherebbe che mi mettessi a sviluppare dei metodi di prova!Il metodo, che prevede l’utilizzo di un’apparecchiatura complessa, il FOSSOMATIC MINOR, èstato elaborato da una multinazionale del settore, la FOSS Analytical A/S e non riporta dati divalidazione. Il parametro da determinare è il numero di cellule somatiche/ml nel latte vaccino. Ilimiti operativi del metodo prevedono la determinazione delle cellule somatiche nel campo dimisura 100.000 – 2.000.000 cellule/ml.Ai fini della validazione devo determinare, tra l’altro, la ripetibilità e l’incertezza.

M Mi puoi spiegare meglio come è fatta e come funziona questa apparecchiatura?

L Il Fossomatic Minor, evidenzia il DNA cellulare con un colorante (Propidium iodide), lofotografa e quindi elabora l’immagine elettronicamente restituendo il valore di cellule somaticheattraverso il collegamento ad un PC.

M Quali sono le specifiche tecniche del Fossomatic Minor? In particolare cosa riporta la FOSS inrelazione ai parametri che devi determinare?

L La FOSS nelle sue specifiche tecniche riporta la ripetibilità espressa in termini di coefficiente divariazione CV a tre livelli e una valutazione dell’accuratezza come rapporto con un metodo diconta diretta al microscopio, come puoi ben vedere.

Repeatability**: CV < 7 % at 100.000 cells/ml (** coefficient of variance)CV < 5 % at 300.000 cells/mlCV < 4 % at 500.000 cells/ml

Accuracy: < 10 % relative mean diff. from Direct Microscopic Somatic Cell Count(DMSCC)

Carry-over: < 1.5%

*

M Bene, ecco il nostro primo problemino: esprimere il CV secondo parametri che conosciamomeglio e che possiamo determinare: la formula del CV è la seguente

CV =s

100x

dove s è lo scarto tipo di ripetibilità e x la media dei risultati di un numero elevato di prove(>30) eseguite con il metodo in esame.

4M = Michele

5 L = Luis

Page 11: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 11 di 52

L Mi ricordi cosa è lo scarto tipo?

M Lo scarto tipo è la radice quadrata positiva della varianza, - ho risposto in modo per me chiaro,preciso e inequivocabile -.

L Cosa è la varianza?

M La varianza è una misura della dispersione dei risultati, ed è data dalla somma dei quadrati delledifferenze rispetto alla loro media divisa per il numero dei risultati meno uno, che in terminimatematici (quando si riferisce ad un campione di dati) si esprime come riportato di seguito.

varianza( x1, x2,...........xn ) =

Mentre se ci riferiamo all’intera popolazione di dati, il termine n-1 viene sostituito da n.

L Quelle che mi hai dato sono definizioni, io voglio sapere che cosa è in pratica lo scarto tipo,inoltre nei miei ricordi, non ritrovo lo scarto tipo, che se ho ben capito è probabilmente un altromodo di chiamare la deviazione standard. Tale termine non si trova neanche nelle funzionistatistiche di excel, allora me lo spieghi?

M Per quanto riguarda la seconda parte della tua domanda ti dico subito che sono sinonimi, anchese, volendo, si possono trovare giustificazioni semantiche e interpretazioni interessanti deldiverso nome dato a due parametri identici. In ogni caso nel nostro lavoro, è bene chiarirlosubito, parleremo sempre di scarto tipo.E veniamo alla prima parte della domanda, e cioè cosa è, o meglio cosa rappresenta in pratica, lo“scarto tipo”.In primo luogo ti devo ricordare che molti fenomeni naturali da quelli biologici a quelli fisici sidistribuiscono generalmente secondo una curva detta “curva di Gauss”, e da tale curvapartiremo.

L Ferma la musica! Anche al corso che ho frequentato hanno iniziato da qui, ma poi sai come èfinita.

M Abbi fede e ascolta quello che ti dico!Intanto, prima di parlare di Gauss devo darti un’altra definizione, quella di ripetibilità. Lanorma UNI-CEI-ENV 130056 del 2000, dà la seguente definizione:

Ripetibilità(dei risultati dimisurazione)

Grado di concordanza tra i risultati di successive misurazioni dello stessomisurando effettuate nelle stesse condizioni di misura.

Nota 1 queste condizioni sono denominate condizioni diripetibilitàNota 2 Le condizioni di ripetibilità comprendono:

Page 12: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 12 di 52

• lostesso

procedimento di misurazione,• lo stesso osservatore,

6UNI-CEI-ENV 13005 Guida all’espressione dell’incertezza di misura

Page 13: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 13 di 52

• lo stesso strumento di misura utilizzato nelle stessecondizioni

• lo stesso luogo• ripetizione entro un breve periodo di tempo

Nota 3 La ripetibilità può essere espressa quantitativamente intermini delle caratteristiche di dispersione dei risultati

Il Manuale Unichim 179/17 distingue invece tra ripetibilità stretta e ripetibilità intermedia eriporta:

Condizioni diripetibilitàstretta:

Condizioni nelle quali i risultati mutuamente indipendenti vengono ottenuticon lo stesso metodo su uno stesso materiale, nello stesso laboratorio, dallostesso operatore, utilizzando la stessa strumentazione, in un intervallo ditempo breve (senza ritaratura).Nota - Queste condizioni rappresentano la costanza di tutti i fattori

riguardanti la realizzazione delle prove. La variazione di una o più ditali condizioni, tenendo però fisso il laboratorio, il materiale daesaminare e il metodo, porta a considerare una ripetibilitàintermedia8. Se intervengono diversi laboratori con lo stesso metodonell’esame dello stesso campione si determinano le condizioni pervalutare la riproducibilità.

Tornando alla distribuzione normale, lo stesso manuale 179/1 dell’UNICHIM, riporta che nellamaggior parte dei casi i risultati di analisi chimico fisiche condotte in condizioni di ripetibilitàstretta si distribuiscono secondo la classica curva a campana o di Gauss.Nel nostro caso, la variabile in gioco, il conteggio delle cellule somatiche, è una tipica variabilediscreta che per sua natura non si distribuisce secondo la curva di Gauss, ma secondo quella diPoisson. Tuttavia ai conteggi elevati, come quelli relativi alle cellule somatiche, la distribuzionedi Gauss ed i suoi parametri rappresentano un’ottima approssimazione di quella di Poisson.

L Mi ricordi le caratteristiche e le proprietà delle gaussiana?

M Si supponga di eseguire, in condizioni di ripetibilità stretta, un gran numero di misurazioni di uncerto misurando, e di riportare in un grafico (istogramma) le frequenze relative9 dei valoriottenuti (xi) con le prime 20, 40, ...1000 misure. All'aumentare del numero di misure, i valoritendono ad accentrarsi attorno alla loro media e l'istogramma assume una forma a campanasempre più regolare, che può essere approssimata con una funzione reale nota come funzione diGauss o funzione normale.

7Manuale Unichim 179/1 Linee guida per la validazione di metodi analitici nei laboratori chimici - valutazione della precisione (ripetibilità

stretta) di un metodo analitico eseguito in un unico laboratorio da un solo operatore su di un unico strumento in un breve intervallo di tempo.8 La definizione e i diversi casi sono riportati nella ISO 5725-39 Le frequenze relative sono date dal rapporto tra le frequenze assolute ed il numero delle osservazioni.

Page 14: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 14 di 52

La funzione di GaussDistribuzione di Gauss

dove:f(x) è la densità di probabilità o frequenza con cui

il valore x può essere riscontratoè lo scarto tipo della totalità delle misure;

μ è la media della totalità delle misure;e base dei logaritmi naturali ( e = 2.71828...). μ

= 3.14159...

La variabilità aumentaall’aumentare di

μ = μ1 = μ2Al variare dello scarto tipo la curva modifica lasua forma

= 1 = 2Al variare della media aritmetica (a parità di scarto tipo)la curva trasla sull’asse delle x

Le caratteristiche delladistribuzione normale

1. è simmetrica rispetto al valore medio2. il valore di x = μ oltre che alla media aritmetica

coincide con la moda e la mediana3. è asintotica all'asse delle x da entrambi i lati4. è crescente per x<μ e decrescente per x>μ5. possiede due punti di flesso per x = μ±6. l’area sotto la curva è = 1 (rappresentando tale

area la probabilità che si ottenga un qualsiasivalore di x)

L OK, mi hai ricordato una serie di cose che ho studiato durante il mio corso di studi, ma avendoleabbandonate da tempo, quasi non ricordavo più. In effetti avevo proprio bisogno di questirichiami. Però ….. ora che ci penso, il fatto che l’area sotto la curva di Gauss sia uguale ad 1 miserve a poco, in quanto le mie necessità sono in genere altre; ad esempio, se io voglio conoscerela probabilità che un dato valore sia compreso in un intervallo definito, delimitato ad esempio dadue valori x1 e x2, come devo fare?

Page 15: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 15 di 52

M Ovviamente tale probabilità è data dall’area della curva compresa tra x1 ed x2 e quindi bastasemplicemente calcolare tale area, calcolando l’integrale della funzione di Gauss tra questi duevalori.Il vero problema è che questa funzione non è facilmente integrabile.

L E i computer a che servono?

M In effetti puoi usare le funzioni di excel, e ti dirò dopo come, ma intanto è utile che tu acquisiscale ultime informazioni sulla curva di Gauss ed in particolare su come si opera per il calcolo delsuo integrale.

riferimento 10 INTERVALLI DI PROBABILITÀ

Per ovviare alle difficoltà di calcolodell’integrale della funzione di Gauss, si puòtrasformare una generica funzione gaussianaf(x) con media μ e varianza 2, in unafunzione gaussiana standard con media 0 evarianza 1. Ponendo:

1(z)2Z = x μ

si ottiene f (z) = 1 e 22

riferimento11

il simbolo Z viene generalmente in moltilaboratori sostituito da kp

Per la funzione standardizzata sono statepredisposte delle tabelle in funzione di Z.

Le tabelle se pur ancora largamente usatestanno sempre più cedendo il campo ai PC

10Sito SINAL Paolo Bianco ISO/IEC 17025: requisiti tecnici

11 www.biostatistica.unich.it/.../

Page 16: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 16 di 52

L Fermo! Finora abbiamo parlato di popolazioni, quindi di un numero infinito di dati, ma io ho ache fare invece sempre con un numero limitato di dati, come la mettiamo? Come ci può aiutareGauss?

M Questo stesso problema se lo è posto circa un secolo fa un tuo collega (nel senso che, come te inpassato, anche lui lavorava in una fabbrica di birra) di nome W.S. Gosset, più noto sotto lopseudonimo di “Student”.Proviamo a definire meglio il rapporto che lega i piccoli campioni e le popolazioni:supponiamo di conoscere il valore medio μ di una popolazione, se operiamo con un certo numerom di piccoli campioni (costituito ognuno da n elementi o unità statistiche), rappresentativi dellapopolazione, ci possiamo aspettare che la media di ogni campione abbia una certa distribuzionecentrata intorno a μ e ci possiamo anche aspettare che la dispersione di tale distribuzione intornoalla media della popolazione dipenda dalla dimensione del campione (più grande il campione,migliore la stima di μ). In termini matematici si può dimostrare che lo scarto tipo delle medie chechiameremo s è uguale a

s =n

con n uguale al numero di elementi del campione. Questo riflette il fatto che la media tende adessere meno variabile, ed in effetti se ci riferiamo alle medie invece che alle osservazioni singolel’espressione

Z =x μ

diventa Z =x μ

./ n

Le formule precedenti presuppongono che sia nota, cosa che per quanto riguarda i metodi diprova, non sempre è vera, come giustamente hai puntualizzato. Per ovviare a tale problema,

Student propose di sostituire alla Z della relazione precedente, Z =x μ

, il parametro/ n

t =x μs / n dove x e s rappresentano rispettivamente la media e lo scarto tipo del campione in

esame, che sostituiti nella funzione di Gauss, restituiscono le stesse informazioni, ma su uncampione limitato della popolazione.La distribuzione di Student è ancora simmetrica rispetto a μ ed è funzione dei gradi di libertà.

E si può affermare che la distribuzione diStudent ha fianchi più larghi, code più alte evarianza maggiore: in altri termini, facendo unparagone con le “curve femminili” è, come sidice a Roma, un po’ più tracagnotta delladistribuzione normale.

All’aumentare dei gradi di libertàla distribuzione di Student approssima

=124

la gaussiana.

L Fermati, non ti lascio proseguire se non mi dici cosa sono i gradi di libertà.

Page 17: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 17 di 52

M In generale si può dire che i gradi di libertà sono dati dal numero delle variabili meno il numerodi vincoli.

L Mi sembra di parlare con un secondino, gradi di libertà, vincoli; tra poco mi parlerai di sbarre esole a scacchi, fammi un esempio.

M Ti faccio un esempio tratto dal Perry’s12: quattro numeri in una tabella che deve avere la sommadelle righe e delle colonne uguali a zero ha solo 1 grado di libertà (4 numeri e tre vincoli, inquanto il quarto è ridondante). Nelle situazioni più semplici (quasi sempre nel nostro caso) i gradidi libertà, generalmente indicati con , sono dati dal numero delle osservazioni meno uno.

L Perfetto! Ora sì.

M Tornando al discorso relativo aipiccoli campioni, invece di calcolarela media di ogni gruppo, possiamocalcolare lo scarto tipo di ognuno diessi: ci dobbiamo aspettare che talistime di abbiano una qualchedistribuzione caratteristica.In particolare viene definita unadistribuzione di (s2/ 2)* con =gradi di libertà = n-1. Taledistribuzione è chiamata distribuzionechi-quadro ( 2) la cui forma dipendedalla numerosità del campione. Nelgrafico sono mostrate le variedistribuzioni al variare di v.

L E a che serve?

= 1234

M Serve a verificare la bontà dell’accordo tra dati sperimentali e dati teoriciIl 2 può servire per valutare se la varianza 2 di una popolazione, dalla quale sia stato estratto uncampione con varianza s2, sia uguale o diversa da un valore predeterminato 0

2 di unapopolazione.

L Ma quante distribuzioni ci sono?

M Calmati, ancora una e abbiamo finito!Sempre proseguendo con lo stesso tema dei campioni con distribuzione normale, comerappresentativi di una popolazione, dobbiamo fare un’ultima considerazione. Invece diconsiderare la distribuzione delle singole varianze s2 dei campioni, possiamo considerare unaltro tipo di distribuzione, che ancora coinvolge la stima della varianza della popolazione 2.Riferendoci ai nostri m campioni, possiamo calcolare di ognuno la s2

i e quindi calcolare ilrapporto tra quelli consecutivi (s2

1/ s22, s2 / s2 , s2 / s2 … ecc.3 4 5 6

12Perry’s Chemical Engineers’ Handbook McGraw Hill 1997

Page 18: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 18 di 52

Distribuzione Simbolo Parametri Variabile

Gauss zSingole osservazioni di una

popolazione* Z =x μ

z Medie Z =x μ/ n

Student t Medie con incognita* t =x μs / n

Chi -quadro 2 Varianze* 2 = s2/ 2

Fisher FRapporto delle varianze di due

campioni indipendenti*F( 1, 2) = s2

1 /s22

* provenienti da una distribuzione normale

Ancora ci dobbiamo aspettare che questi rapporti abbiano una certa distribuzione di frequenza.Anche questa distribuzione dipende dalle dimensioni del campione. È da notare che i campionipossono non essere della stessa numerosità, in questo caso la forma della distribuzione dipendedalla numerosità dei campioni n1, n2, ... Tale distribuzione è definita come distribuzione di FischerF( 1, 2).

(n1, n2) = (20, 2)(20, 4)(20, 8)(20, 16)

Distribuzione F

Più precisamente, se due variabili sono indipendenti e distribuite come 2, allora il rapporto fra ledue variabili, ciascuna divisa per il proprio numero di gradi di libertà, è distribuito secondo unadistribuzione simile a quella in figura. Questa distribuzione è utile per determinare se due serie didati, provenienti da una distribuzione normale, hanno la stessa dispersione (stessa varianza).Ovviamente anche per questa distribuzione esistono sia delle tabelle che delle funzioni di excel.

M In sintesi, se non l’hai ancora capito, testone, queste distribuzioni servono a determinare qualedifferenza ci si può aspettare tra varie quantità dovuta ad effetti casuali, o in altri termini perdeterminare se gruppi di dati differiscono da altri gruppi o da valori/valore ipotizzati. Ad esempio,se fissata una certa probabilità, la varianza del campione in esame può essere assunta come unastima dello varianza della popolazione (o se vuoi leggi scarti tipo invece di varianze).Ti riporto il riepilogo delle distribuzioni di cui abbiamo parlato

Riferimento12

M Ti ricordo che alla base di tutti questi discorsi ci sono due ipotesi: la prima è che stiamo operandoin condizioni di ripetibilità stretta (in altri termini le variazioni sono dovute unicamente al caso),la seconda è che la distribuzione dei dati è normale.

Page 19: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 19 di 52

L Ferma la musica! Adesso si va aprendere il caffé, anzi, mentreandiamo ti voglio mostrare cosa hotrovato su una bancarella aFlohmarkt l’ultima volta che sonoandato a Berlino.

M Ebbene? Cosa ha di strano questabanconota da meritare tantointeresse? A me sembra unanormalissima banconota nondissimile da tutte le altre, diqualunque paese del mondo.

L E qui casca l’asino, perché se guardil’altra faccia (forse) puoi capire ilperché del mio interessamento!

M Grazie per il complimento e fammi guardare meglio la banconota.…. Ah! Ora capisco è una banconota dedicata a Gauss.

Unica formula matematicariportata su unabanconota:i 10 marchi tedeschi emessinel 1991.

Luis e i dubbi sulla distribuzione dei dati sperimentali

L Ora che abbiamo preso il caffé e ci siamo ristorati, mi viene in mente una cosa che non mi haiancora detto. Come faccio a sapere se i dati di un campione sono distribuiti secondo unagaussiana?

M Mi aspettavo questa domanda e la risposta è semplice: il metodo migliore per piccoli e medicampioni è ritenuto il test di Shapiro-Wilk, che potrai trovare ben descritto nel Manuale 179/1dell’Unichim7 . Io ti parlerò invece del “normal probability plot”, un metodo grafico e “per purosadismo” del test di Kolmogorov-Smirnov, applicabili praticamente a tutte le situazioni.La logica del probability plot è molto semplice: si tratta di porre in un sistema di assi cartesiani iquantili sperimentali normalizzati in relazione ai quantili teorici di una distribuzione gaussiana edisegnare la curva di correlazione. Se i dati di partenza sono distribuiti normalmente, la curva

Page 20: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 20 di 52

interpolatrice si avvicinerà ad una retta. Se i dati non si posizionano approssimativamente su unaretta dobbiamo dedurre che la distribuzione non è normale.

Esempio: campioni da una distribuzione normale

normal probability plot 13

Per quanto riguarda il test di Kolmogorov-Smirnov si verifica se la differenza massima tra lefrequenze cumulate attese e sperimentali è inferiore ad un valore critico, per poter concludereche la distribuzione è normale.

L Chiaro e semplice, ottimo, mi piace, anche se spero che mi dirai cosa sono i quantili e lefrequenze cumulate!Ma se i dati, normali o no, presentano dei dati anomali, come me ne accorgo, come mi devocomportare?

M Intanto chiariamo che un dato anomalo, o outlier, è un dato che giace fuori dal modello didistribuzione, un punto che non è ben interpolato dal modello stimato, ed è indice di qualche sortadi problema quale un risultato estremo, un errore di misura, un errore di trascrizione, ecc..Il Normal Probability plot ci può ancora aiutare nell’individuare i dati anomali, in quanto se ladistribuzione non è ben interpolata con una retta, ma si notano alcuni punti non allineati, moltoprobabilmente quei punti rappresentano dei dati anomali; sempre da tale diagramma è possibilecapire se vi sono dati anomali anche se tutti i dati sono ben allineati: è questo il caso di dati moltolontani dalla maggior parte di dati accentrati in prossimità della media.Per quanto riguarda il cosa fare dei dati anomali, in genere si tende ad eliminarli o a correggerli inrelazione alle cause che li hanno determinati, ma non sono rari i casi in cui si accettano tal quali:in ogni caso ogni scelta deve essere ben argomentata e giustificata.Vi sono sistemi specifici per l’individuazione dei dati anomali: uno si basa sull’uso di particolariquantili, i ”quartili”, con tale metodo sono individuati come outliers i dati minori del primoquartile meno 1,5 volte il range interquartile o i dati maggiori del terzo quartile più 1,5 volte ilrange interquartile. Comunque il test più semplice ed al tempo stesso tra i più efficaci perl’individuazione dei dati anomali (o outlier) è il test di Huber.Come al solito su molti testi puoi trovare altri criteri sia della verifica di normalità (es. test diShapiro Wilk) che della presenza di dati anomali (es. test di Dixon, test di Grubbs etc.)7

M Per tua comodità e per facilitarti il lavoro ti mostrerò dopo come verificare la normalità dei dati ecome individuare i dati anomali con i criteri che ti ho appena descritto, utilizzando diversisemplici comandi di Excel.

13Guido Masarotto - Facoltà di scienze statistiche Università di Padova lezioni di inferenza statistica a.a. 2005-2006

Page 21: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

15Masarotto Facoltà di scienze statistiche Università di Padova lezioni statistica descrittiva a.a 2001-2002

Pag. 20 di 52

Luis e la distribuzione normale

L Ti ringrazio in anticipo per quanto mi metterai a disposizione, ma ora basta con le chiacchiere,anche se molto interessanti, e fammi capire con qualche esempio pratico.

M Ti propongo di utilizzare per gli esempi dei dati reali, così contemporaneamente potremoraggiungere il primo dei nostri obiettivi, che è il calcolo dello scarto tipo che ti interessa.

L OK, Partiamo dai dati.

M In primo luogo i dati da analizzare devono essere ottenuti in condizione di ripetibilità stretta.Quindi facciamo così: prendiamo un latte da analizzare ed invece di una sola determinazionechiediamo a Valentina di effettuare dieci repliche una dopo l’altra, senza modificare nessuna dellecondizioni operative.

V14E ti pareva, loro fanno gli scienziati e Valentina produce i dati, o meglio Valentina li ha giàprodotti.Mentre voi elaboravate le vostre teorie io ho effettuato 10 analisi in condizione di ripetibilitàstretta su un latte con circa 150.000 cellule/ml: eccoli, tutti per voi, espressi in migliaia dicellule/ml:

143 131 120 135 149 128 133 131 135 136

L Sei un tesoro, adesso questi dati me li lavoro io. Innanzi tutto voglio verificare se sono distribuitinormalmente, usando il normal probability plot.A proposito, ma se non mi dici cosa sono i quantili non sono in grado di disegnarlo, e quindi dattiuna mossa!

M Ti riporto la definizione più semplice che ho letto:“L'idea alla base di un quantile-p (dove p è compreso tra 0 e 1) è di cercare un numero che siapiù grande del 100 x p% dei dati osservati e più piccolo del restante 100 x (1 - p)%. Ad esempio,un quantile 0,1 deve essere un valore che lascia a sinistra il 10% delle osservazioni ed a destrail restante 90%.I quantili con p uguale a 0,25 - 0,50 e 0,75 vengono chiamati rispettivamente il primo, il secondoe il terzo quartile. Dividono la popolazione in quattro parti uguali. Si osservi che il 2° quartilecoincide con la mediana. I quantili con p = 0,01;… ; 0,99 si chiamano percentili.”15

Capirai meglio i quantili mentre costruiamo il normal probability plot:Dato un insieme di n valori sperimentali,

1. si ordinano i dati in senso crescente2. si numerano i dati ordinati da 1 a n3. si calcola lo scarto tipo e la media dei valori sperimentali,4. si calcola per ogni valore sperimentale xi il corrispondente valore standardizzato della

distribuzione normale Zi

Zi =xi μ

14V = Valentina

Page 22: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 21 di 52

A B C D E F

datiquantili

sperimentalirango frequenze

cumulate quantiliordinati z (kp) relative teorici

1 120 -1,78 1 0,05 -1,64

2 128 -0,77 2 0,15 -1,04

3 131 -0,39 3 0,25 -0,67

4 131 -0,39 3 0,25 -0,67

5 133 -0,14 5 0,45 -0,136 135 0,11 6 0,55 0,13

7 135 0,11 6 0,55 0,138 136 0,24 8 0,75 0,67

5. si calcola il rango di ogni dato ordinato in senso crescente (rango: brutta traduzioneitaliana dell'inglese rank, che significa posizione in graduatoria/classifica/ordinecrescente)

6. si calcolano le frequenze cumulate relative per ogni rango da 1 a n (la FrequenzaCumulata Relativa è uguale a (Rango(i) - 0,5)/n )

7. si calcolano i valori della Z teorica relativa (quantili) ad ognuna delle frequenze cumulaterelative,

8. si riportano in un diagramma cartesiano i valori delle Zi (quantili) teoriche sull’asse delle x9. si riportano i corrispondenti valori delle Zi sperimentali sull’asse delle y10. si costruisce la retta che interpola i dati11. si valuta la bontà della correlazione lineare.

Ovviamente tutto ciò può essere fatto con excel in particolare per ricavare i quantili e percostruire la retta interpolatrice in quanto excel restituisce oltre all’equazione della retta anche ilcoefficiente di correlazione r2 che è l’indice della bontà della correlazione (più r2 si avvicina a 1,migliore è la correlazione lineare).

L Scusa: perché hai usato per il calcolo della frequenza cumulata (Rango(i) - 0,5)/n invece diRango(i) /n?

M Perché se avessimo usato Rango(i) /n, la frequenza cumulata massima sarebbe stata uguale ad 1 equindi la relativa Z sarebbe stata uguale a (riferimento)13.

L Perfetto guarda cosa è venuto fuori dalle tue elucubrazioni, considera che ho seguito passo-passoogni tua parola.

quan

tili

sper

imen

tali

quantili teorici y = 0,9768x+ 0,05362

R = 0,948

9 143 1,13 9 0,85 1,04

10149

1,8810

0,95 1,64

Media 134,1

Scarto tipo 7,91

FORMULE EXCEL UTILIZZATEZ = ((Bi-media(Bi))/(dev.st(Bi))Freq. Cum. Rel = [Di-0,5]/(totale dati)Quant. Teor = INV.NORM.ST(Ei)Rango = Rango ( )Scarto tipo = dev.st( )

In prima istanza i dati mi sembrano abbastanza ben interpolati da una retta, per cui deduco, perora, che la distribuzione è normale. Tu che pensi?

M Ho verificato l’ipotesi di normalità dei dati con un software ad hoc, il software dell’UNICHIM16

che utilizza il test di Shapiro-Wilk, ebbene, il test conferma la distribuzione normale. Ti ricordocomunque che il test di Shapiro Wilk può essere utilizzato per un campione fino a 40 dati.

16Software applicativo per l’elaborazione dei risultati analitici Milano 2006

Page 23: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 22 di 52

A B C D E F

indice datiordinati

IzIfrequenza

rango

frequenza

I Icumulata cumulata

sperimentale teorica(FCR) (FCT)

1 120 1,78 0,037 1 0,1 0,0632 128 0,77 0,220 2 0,2 0,0203 131 0,39 0,348 3 0,3 0,0484 131 0,39 0,348 3 0,3 0,0485 133 0,14 0,445 5 0,5 0,0556 135 0,11 0,545 6 0,6 0,0557 135 0,11 0,545 6 0,6 0,0558 136 0,24 0,595 8 0,8 0,2059 143 1,13 0,870 9 0,9 0,03010 149 1,88 0,970 10 1 0,030

Z= [(Bi-media(Bi))/dev.st(Bi) 0,4

FCR= Distrib.Norm(Bi;media;dev.st;VERO) 0,2

FCT= rango/(n. dati) 0

= ass(FCT-FCR) 0 2 4 6 8 10 12

Scarto tipo = Dev.st.

La stessa cosa ci dovremmo aspettare dal test di Kolmogorov Smirnov (che può essere utilizzatoper campioni che hanno anche più di 40 dati).Per quanto riguarda tale test si opera come di seguito: si calcolano le frequenze cumulatesperimentali dei dati da analizzare (ipotizzando una distribuzione normale), si determinano quindile frequenze cumulate relative teoriche per la distribuzione in questione e quindi se ne fa ladifferenza (punto per punto); se il valore della differenza massima è inferiore ad un valore criticotabulato, si conclude che la distribuzione è normale.Eccoti i risultati serviti caldi caldi.

Media 134,10

Varianza 62,54Scarto tipo 7,91

Differenza Critica 95% 0,409Massima differenza Max 0,205

Essendo la differenza massima = 0,2 < della differenzacritica dc = 0,409 (ricavata dalla tabella) si deduce che ladistribuzione è normale

1,2

frequenza teorica frequenza s perimentale

1

0,8

FORMULE EXCEL UTILIZZATE0,6

L Ho la sensazione che tu manipoli i dati a tuo piacimento secondo le tue necessità: mi dai l’ideadegli analisti politici, che riescono sempre ad ottenere le proiezioni di voto utili ai loro“mandanti”. Perché questa volta nel calcolo delle frequenze cumulate teoriche non hai sottratto ilvalore 0,5 come hai fatto in precedenza?

M Mi lusinghi, paragonandomi con gli esperti statistici dei nostri litigiosi esponenti politici, ma nonho fatto alcuna manipolazione. Non ho sottratto lo 0,5 in quanto in questo caso non eranecessario.

L Da dove hai tirato fuori il valore critico?

M non è stato semplice, ma a seguito di una lunga ricerca su Internet, mi sono imbattuto in un sitoche riportava la tabella seguente.

Page 24: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 23 di 52

Tabella valori critici di Kolmogorov Smirnov p=95%

n dc n dc n dc n dc n dc

1 0,975 21 0,287 41 0,208 61 0,171 81 0,149

2 0,842 22 0,281 42 0,205 62 0,170 82 0,148

3 0,708 23 0,275 43 0,203 63 0,168 83 0,147

4 0,624 24 0,269 44 0,201 64 0,167 84 0,146

5 0,563 25 0,264 45 0,198 65 0,166 85 0,145

6 0,519 26 0,259 46 0,196 66 0,164 86 0,144

7 0,483 27 0,254 47 0,194 67 0,163 87 0,144

8 0,454 28 0,250 48 0,192 68 0,162 88 0,143

9 0,430 29 0,246 49 0,190 69 0,161 89 0,142

0,450

0,4000,350

0,300

0,250

0,200

0,150

0,100

0,050

0,000

0 10 20 30 40 50 60 70 80 90 100 110-0,487

10 0,409 30 0,242 50 0,188 70 0,160 90 0,141 Serie1 Potenza (Serie1)y = 1,2649x

2

11 0,391 31 0,238 51 0,187 71 0,159 91 0,140

12 0,375 32 0,234 52 0,185 72 0,158 92 0,140

13 0,361 33 0,231 53 0,183 73 0,156 93 0,139

R = 1

14 0,349 34 0,227 54 0,181 74 0,155 94 0,138

15 0,338 35 0,224 55 0,180 75 0,154 95 0,137

16 0,327 36 0,221 56 0,178 76 0,153 96 0,137

17 0,318 37 0,218 57 0,177 77 0,152 97 0,136

18 0,309 38 0,215 58 0,175 78 0,151 98 0,135

19 0,301 39 0,213 59 0,174 79 0,151 99 0,135

20 0,294 40 0,210 60 0,172 80 0,150 100 0,134

Per i dati da 10 a 100 ho anche calcolatoper te la relazione che lega il numero didati al valore critico; l'equazione è

dn= 1,2649*n(-0,487)

che per n > 100 diventa:(-0,5)

Fonte17 dn =1,358*n

Luis e i dati anomali

L Va bene, mi hai convinto. Adesso dobbiamo vedere se ci sono dei dati anomali.Da una prima occhiata al normal probability plot credo che potrebbero essere anomali il primo el’ultimo dato in quanto piuttosto lontani dagli altri dati, ma dimmi come è possibile in modo piùrigoroso individuare gli outliers?

M Per individuare eventuali dati anomali possiamo utilizzare il test di Huber, che passo subito adescriverti:

Si ordinano i dati dati ordinati 120, 128, 131, 131, 133, 135,135, 136, 143, 149Si calcola la mediana dei dati mediana = 134Si calcola la differenza tra ogni dato e la mediana (Di) Di = 14, 6, 3, 3, 1, 1, 1, 2, 9, 15Si calcola la mediana delle differenze (Dm) Dm = 3Si calcola il prodotto Dm x 4,5 Dm x 4,5 = 3x4,5 = 13,5I valori per cui Di > Dm x 4,5 sono anomali Valori anomali 120, 149

Il procedimento può essere velocizzato ed automatizzato utilizzando semplici formule excel,come riportato di seguito.

I dati ordinati sono ottenuti selezionando la colonna dei dati e quindi cliccando su “DATI” esuccessivamente scegliendo l’opzione “ORDINA”, le mediane sono calcolate con la formulaMEDIANA(….) i residui sono calcolati con la formula = Ass (B(i)-D(i)), i dati anomali sonoevidenziati con la formula = SE(Ci-Di>0;Ci;"")

17http://everything2.net/index.pl?node_id=1540620

Page 25: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 24 di 52

A B C D E1 dati dati ordinati residui Test Dm x 4,5 dati anomali2 143 120 14 13,5 1203 131 128 6 13,54 120 131 3 13,55 135 131 3 13,56 149 133 1 13,57 128 135 1 13,58 133 135 1 13,59 131 136 2 13,510 135 143 9 13,511 136 149 15 13,5 14912

mediana134 3

13 Di Dm

Inoltre ho fatto una verifica con il software16 che ho utilizzato prima e ho avuto la conferma diquesti dati anomali.

L Adesso, mi è tutto chiaro e devo riconoscere che finora hai mantenuto la parola, in quanto non haimai fatto ricorso alle tabelle ma solo alle funzioni di excel, e quando sei stato costretto adutilizzare la tabella di Kolmogorov-Smirnov, sei riuscito a trasformarla in una funzione.

Luis e lo scarto tipo

Se ho ben capito quindi, a questo punto possiamo calcolare lo scarto tipo di ripetibilità con i datidi partenza!

M E no, i dati di partenza non vanno bene, in quanto, avendo individuato alcuni dati anomali,dobbiamo decidere se tenerli o se eliminarli. Io, considerato che i dati sono molto vicini al limitedi accettabilità li terrei, anzi, ti propongo di calcolare lo scarto tipo, sia con tutti i dati senzaquindi eliminare gli outliers, e quindi di calcolare lo scarto tipo eliminandoli.Il calcolo dello scarto tipo utilizzando tutti i dati è banale, basta utilizzare la formula di excel=dev.st(143;131;120;135;149;128;133;131;135;136) che dà come risultato sr=7,91

L Allora nell’altro caso basta utilizzare la stessa formula, dopo aver eliminato gli outliers!

M In genere si, ma è sempre opportuno verificare, se in assenza di tali dati la distribuzione è ancoranormale. Nel nostro caso lo è, come si può facilmente arguire dalla tabella precedente, dove,essendo outliers i due dati estremi, i valori di Di e Dm non cambiano.Eliminando i due dati, si ottiene una sr=4,50. Considerato che se i dati eliminati fossero statiappena diversi es. 121 al posto di 120 e 147 al posto di 149, gli stessi dati non sarebbero risultatianomali. Alla luce di tali considerazioni, io accetterei i dati anomali nel calcolo dello scarto tipo,anche in virtù del fatto che i dati considerati sono delle misure affette da una incertezza ancorchéincognita.Una conferma della accettabilità dei dati anomali è data dal fatto che la funzione delladistribuzione cumulata assume per il dato 120 il valore di 0,037 e per il dato 149 il valore 0,97; inaltri termini i due dati sono rispettivamente in zone della curva di Gauss > dell’ 1% e < 99%,ambiti nei quali gli outliers possono essere accettati.

Page 26: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 25 di 52

x

Luis e la verifica della media

L A questo punto mi chiedo: ma la media calcolata attraverso il nostro campione di 10 proveripetute in condizione di ripetibilità stretta, è una stima credibile della media di una popolazionecon le stesse caratteristiche?

M La risposta la dobbiamo cercare o dandoci un riferimento opportuno, che al momento non può cheessere la specifica tecnica della FOSS, oppure ricorrendo a qualche considerazione statistica.

M Avendo appurato che i dati in nostro possesso hanno distribuzione normale, assumendo come loscarto tipo ricavato per interpolazione dai dati della specifica tecnica della FOSS, chiamiamo lanostra media calcolata x , il problema che ci poniamo è con quanta precisione x può stimare μ, oin altri termini quale è il range dei valori che include, con una specificata probabilità, il valorevero μ. Dalla relazione +Z =

x μ si ottiene con facili trasformazioni

μ = x + Z μ = x + Z

ovvero μ = x ± Zn

, ponendo x =n

Quindi, scegliendo un determinato livello di probabilità o di confidenza che determina il valore diZ, si ottiene :

x Zn

< μ < x + Zn

Nel nostro caso avendo ottenuto da 10 misure il valore medio x = 134,1 e lo scarto tipo diripetibilità s = 7,91 , utilizzando per il valore 8,57 (valore ricavato per interpolazione dai datidella FOSS), quale è l’intervallo nel quale ci dobbiamo aspettare di trovare la media vera μ dellapopolazione con una probabilità del 95%? In altri termini, essendo la distribuzione simmetricarispetto a μ, qual è l’intervallo di confidenza tale per cui il solo il 2,5% dei valori è minore dellimite inferiore di tale intervallo e il 2,5% dei valori è maggiore del limite massimo di taleintervallo? La soluzione del problema è banale, in quanto dalla formula di excel =INV.NORM.ST(0,975) si ottiene 1,96 (analogamente INV.NORM.ST(0,025), dà come risultato -1,96) che sostituiti nella precedente dà

134,11,96 8,57

< μ < 134,1 +1,96 8,57

10 10128,8 < μ < 139,4

In realtà è anche possibile calcolare direttamente l’intervallo di confidenza; in questo caso lasintassi è: =CONFIDENZA(alfa;dev_standard;dimens), con alfa = nel nostro caso = 0,05 siottiene il valore di 5,31, che aggiunto e sottratto a 134,1, restituisce gli stessi risultati calcolatiprecedentemente (128,8 e 139,4).

Page 27: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 26 di 52

s

L Il tuo esempio non mi convince del tutto, in quanto nel suo sviluppo non hai mai menzionato ilbirraio (Student), pur operando su un campione di solo dieci dati e non su una popolazioneinfinita.

M Non l’ho chiamato in causa in quanto non serviva, dato che abbiamo assunto come scarto tipo ilvalore 8,57 derivandolo dai dati della FOSS, e assumendolo come proveniente da unapopolazione infinita, cosa che ci ha consentito di utilizzare la funzione di Gauss e le formule adessa relative.Se supponiamo, invece sempre nello stesso esempio, di non conoscere in quanto nonutilizziamo i dati della FOSS, allora dobbiamo far ricorso allo scarto tipo di ripetibilità s calcolatodal laboratorio dai risultati delle 10 ripetizioni e alla distribuzione di Student. In questo caso illimite di confidenza sarà espresso da

x ts

n< μ < x + t

s

nLa soluzione del problema è praticamente uguale alla precedente, con l’unica differenza di dovercalcolare la t e di utilizzare la formula di excel =INV.T(0,05; 9) = 2,26 (la formula si riferisce aduna distribuzione di Student a due code) che sostituito nella precedente dà:

134,12,26 7,91

< μ < 134,1 +2,26 7,91

10 10

128,4 < μ < 139,8

Da cui, come vedi, risulta un intervallo leggermente maggiore.In excel 2003 non è disponibile la formula per il calcolo diretto dell’intervallo di confidenza.

Luis e la verifica dello scarto tipo

L Scusa, ma se invece voglio sapere se lo scarto tipo da me calcolato è una stima credibile delloscarto tipo vero (nel caso questo sia riportato ad esempio in un metodo di prova), cosa faccio?

M È questo il caso in cui ricorriamo alla distribuzione del 2.Supponiamo nel nostro caso di accettare come vero il valore di 8,57 della Foss.Dalla relazione 2

lo scarto tipo s(p, ) = s2/ 2 = (n-1)* s2/ 2, si ricava l’intervallo in cui deve essere compreso

2/ 2; =n 1

(n 1) s 2

22(1 / 2); =n 1 ovvero

2 2/ 2; =n 1

n 1 2

2(1 / 2); =n 1

n 1In questa relazione sono noti tutti i termini tranne 2, che possiamo calcolare da tabelle ad hoc, outilizzando le formule di excel. Noi utilizziamo, ovviamente, excel.Scegliendo un livello di probabilità p = 95% e ricorrendo alla solita convenzione di indicare p =1- , p1 = /2 e p2 =1- /2, si calcolano i due valori di 2, per p1 e p2 con le formuleINV.CHI(0,025;9) e INV.CHI(0,975;9), che danno rispettivamente per il 2 i valori 2,70 e 19,02.Con semplici trasformazioni si ottiene che deve risultare s/ > [ 2

( /2; 9)/ ]1/2 e s/ < [ 2(1- /2;

9)/ ]1/2.E sostituendo i valori numerici si ha che:

Page 28: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 27 di 52

1 / 2; =n 1 ) e > 2,70 (

2s 2

(n 1)2

7,91= 9

8,57= 7,67

Pertanto, essendo tale valore < 19,02 ( 2

calcolato è compatibile con quello della FOSS.

2/ 2; =n 1 ), il valore dello scarto tipo

L Vedo che hai mantenuto la tua parola, adesso però andiamo a prendere un bel caffé.

Luis e il calcolo dello scarto tipo variabile con la concentrazione

M Buono quel caffé!Prima di andare avanti, facciamo il punto della situazione. Ti faccio notare che finora abbiamodeterminato lo scarto tipo di ripetibilità solo per un tenore di cellule uguale a 134.000 cellule/ml eche la Foss dà tre valori diversi a 100.000, a 300.000 e a 500.000 cellule/ml. In altri termini loscarto tipo di ripetibilità è funzione della concentrazione di cellule.

L Va bene, ma questo significa che dovremmo calcolare lo scarto tipo a tutti i livelli e quindialmeno da 100.000 cell/ml a 1.500.000 cell/ml.

M È esattamente quello che dobbiamo fare per poter determinare una relazione che leghi lo scartotipo del laboratorio alla concentrazione di cellule somatiche.Chiediamo a Valentina di effettuare 10 determinazioni su campioni di latte che coprano il campoda 100.000 a 1.500.000 cellule/ml.

L Glielo chiedo subito. Ma noi ci rivediamo tra una settimana, perché devo anche lavorare, tuintanto leggiti questo sonetto e medita sulla statistica:

Page 29: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 28 di 52

LA STATISTICA

Sai ched'è la statistica? È na' cosache serve pe fà un conto in generalede la gente che nasce, che sta male,

che more, che va in carcere e che spósa.

Ma pè me la statistica curiosaè dove c'entra la percentuale,

pè via che, lì, la media è sempre egualepuro co' la persona bisognosa.

Me spiego: da li conti che se fannoseconno le statistiche d'adesso

risurta che te tocca un pollo all'anno:

e, se nun entra nelle spese tue,t'entra ne la statistica lo stesso

perch'è c'è un antro che ne magna due

Trilussa

Page 30: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 29 di 52

r1 r 2 r3 rn

s

s

M Ciao Luis, Valentina è riuscita a fare le analisi come avevamo concordato?

L Sì ecco i dati già in ordine crescente

serie 1 2 3 4 5 6 7 8 9 10 11

Val

ori

180 297 720 127 650 435 493 198 530 1022 1413

186 300 733 128 655 445 530 200 541 1025 1421

187 306 740 131 655 449 551 201 545 1031 1423

187 309 745 132 659 449 552 214 548 1034 1424

188 312 750 133 665 456 552 216 556 1047 1428

190 318 759 135 670 460 554 216 559 1051 1432

194 320 764 135 683 460 555 217 561 1055 1441

197 323 765 136 684 462 561 221 562 1056 1454

197 323 775 140 688 464 567 221 568 1067 1479

200 324 780 145 700 480 571 221 572 1070 1487

M Molto bene.Ognuna di queste 11 serie dovrebbe essere sottoposta allo stesso procedimento che abbiamo usatoprima e cioè:

• verificare che siano normali,• individuare i valori anomali• decidere cosa fare dei valori anomali• calcolare la media di ogni serie• calcolare lo scarto tipo di ogni serie

e quindi calcolare la relazione che lega gli scarti tipo ai vari livelli.

Supponiamo per un istante di avere fatto tutto questo e chiamiamo sr il generico scarto tipo e xr

le medie corrispondenti.Possono verificarsi due casi:

a) sr non varia sensibilmente al variare di xr

b) sr varia al variare di xr

Nel caso a) è sufficiente calcolare la media quadratica pesata sr

modo

degli scarti tipo nel seguente

sr =(n1 =1)s2 + (n2 =1)s2 + (n3 =1)s2 + .......(nn =1)s2

(n1 =1) + (n2 =1) + ........(nn =1)

Nel caso b) si ricerca la relazione funzionale che lega sr a x r

Il criterio che determina la validità del caso a) o del caso b) si basa sul seguente test di Fisher

2r (max)

2r (min)

Fp=1 ; max, min

Page 31: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 30 di 52

s sedove 2r (max)

2r (min) sono rispettivamente la varianza massima e minima ed Fp; max, min è la

variabile di Fisher, il cui valore è riportato in tabelle (ma vedremo anche in excel) in funzione die di max = min = ni-1 essendo n il numero delle prove valide eseguite ad ogni livello. Il test

può ancora essere utilizzato se il numero ni non è lo stesso per tutte le prove ma varia rispetto alvalore medio di poco es. + 1.Un altro test utilizzabile (meno restrittivo, ma più complesso) è il test di Bartlett7

A questo punto, se siamo nel primo caso, il problema non si pone, se siamo nel secondo caso,excel ci consente di calcolare la relazione che lega lo scarto tipo alla media.

L Bene, quindi applicando la tua teoria adesso io determino, utilizzando il normal probability plot,se i dati di Valentina sono tutti distribuiti normalmente e se vi sono dati anomali, mentre tu faiquattro chiacchiere con Fabrizio che prima ti ha cercato.

M Ciao Luis, come siamo messi?

L Ho riportato tutti i dati sul normal probability plot, ho tracciato con excel le 11 rette dicorrelazione ed ho determinato, sempre con excel il coefficiente di correlazione r2 di ogni retta. Irisultati sono stati i seguenti:

serie 1 2 3 4 5 6 7 8 9 10 11r2 0,94 0,89 0,96 0,95 0,93 0,96 0,73 0,77 0,95 0,95 0,89

Ho quindi deciso di ritenere non accettabili i dati con un coefficiente di correlazione minore di0,89 e quindi ho scartato le serie 7 e 8.

Per quanto riguarda infine i dati anomali, da una prima occhiata al probability plot, l’unica serieche mi dato l’impressione di avere dati anomali è stata la 11, ed a questa ho applicato il test diHuber, che ha evidenziato come dati anomali il 1479 e il 1487; prima di eliminarli però hocalcolato la media e lo scarto tipo di ogni serie, e poiché l’eliminazione di entrambi i dati miavrebbe evidenziato anche il 1454 come dato anomalo, e mi avrebbe restituito uno scarto tipo di8,86, cosa ovviamente improbabile se paragonata alle altre s, ho deciso di eliminare solo 1487,cosa che mi ha portato alla seguente situazione.

serie 1 2 3 4 5 6 9 10 11

Val

ori

180 297 720 127 650 435 530 1022 1413186 300 733 128 655 445 541 1025 1421187 306 740 131 655 449 545 1031 1423187 309 745 132 659 449 548 1034 1424188 312 750 133 665 456 556 1047 1428190 318 759 135 670 460 559 1051 1432194 320 764 135 683 460 561 1055 1441197 323 765 136 684 462 562 1056 1454197 323 775 140 688 464 568 1067 1479200 324 780 145 700 480 572 1070

media 190,6 313,2 753,1 134,2 670,9 456 554,2 1045,8 1440,2sr 6,22 9,92 18,99 5,39 16,926 12,33 13,01 17,023 20,42

Page 32: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 31 di 52

A questo punto dobbiamo applicare il test di Fisher, per poter affermare con sicurezza quello chea prima vista sembra evidente, cioè se lo scarto tipo varia sensibilmente al variare della media.Come si fa?

M Dobbiamo ricorrere alla relazione

2

2sr (max)

2sr (min)

Fp=1 ; max, min

22

s r (max)Nel nostro caso essendo s r (max) = (20,42)2 = 417 e s r (min) = (5,39)2 = 29,1 si ha che 2s r (min)

= 14,35

per il calcolo di F ricorriamo ancora una volta ad excel operando come segue:2

• fissata una probabilità del 5%, poiché il numero di dati relativi a2

s r (max) è 9 e il numero di dati

relativi a s r (min) è 10, si ha che (max) = 8 e (min) = 9.

• Dalla funzione excel INV.F(0,05;8;9) si ottiene F = 3,23.2

s r (max)Essendo 2

s r (min)

= 14,35 > 3,23 si deduce che le varianze, come ci aspettavamo, sono

significativamente diverse al variare della media del campione da cui derivano.

Questa situazione ci impone di ricercare la funzione che meglio interpola le s in funzione dellemedie, ricorrendo ancora una volta ad excel.Dal comando “inserisci grafico” si sceglie la “dispersione xy” e si inseriscono come x i valoridelle medie e come y i valori degli scarti tipo, quindi si clicca sul comando “inserisci linea ditendenza”.Excel consente di disegnare diverse linee di tendenza restituendone anche l’equazione e ilcoefficiente di correlazione r2, noi abbiamo considerato le seguenti:

Tipo di regressione Equazione r2

Regressione lineare che passa per lo 0 s = 0,0187x 0,3873Regressione lineare con intercetta s = 0,016x + 6,1768 0,8134

Regressione esponenziale s = 6,6689e0,001x 0,7314Regressione di potenza s = 0,2934x0,6023 0,9435Regressione logaritmica s = 6,7758Ln(x) - 28,569 0,9376

La relazione da scegliere è ovviamente quella che presenta il valore di r2 più prossimo ad 1 equindi la regressione di potenza.

L Va bene, tu sai quanto ti stimo, ma a questo punto sarei molto più tranquillo se potessimoeffettuare una verifica indipendente dei nostri calcoli.

M Conoscendoti, ho portato con me uno strumento molto interessante, che può aiutarci allo scopo, ilprezioso software dell’UNICHIM16

L E che aspettiamo ad usarlo?

M Guarda, che finora l’ho già usato diverse volte. Lo usiamo anche adesso.

Page 33: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 32 di 52

Il procedimento è semplice:

• inseriamo i dati, premiamo il tasto calcoli e premiamo il tasto “test di normalità” ed ecco ilrisultato dove sono evidenziati in rosso i dati anomali

La settima e l’ottava serie non hanno una distribuzione normale, per cui le dobbiamo eliminare erifare il calcolo.

Dal nuovo calcolo non emergono serie non normali, ma è evidenziato un dato anomalo cheeliminiamo e, rifacendo il calcolo otteniamo:

Page 34: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 33 di 52

M A questo punto dobbiamo decidere cosa fare dell’ulteriore dato anomalo. Se lo eliminiamootteniamo uno scarto tipo pari a 12,9, che è molto più basso di quello per una media di 1000cellule.Inoltre se eliminiamo anche questo dato anomalo ci troveremo in una condizione estremamentefavorevole, nel senso che, eliminandolo, ci dobbiamo aspettare un CV% molto basso che quindipotrebbe non rispecchiare la variabilità vera delle risposte analitiche. D’altro canto tu mi insegniche la conta delle cellule somatiche può dipendere anche dalle altre caratteristiche del latte(grasso, proteine, indice crioscopico, ecc.). Fatte queste considerazioni ti propongo di noneliminare il valore 1479.

A questo punto continuiamo con il nostro calcolo, sfruttando le ulteriori caratteristiche delsoftware UNICHIM16 ed effettuando quindi un confronto tra le varianze, che risultano nonomogenee tra di loro.In particolare, leggi cosa riporta il manuale che accompagna il software:

La disomogeneità delle varianze che si evidenzia è una conseguenza diretta della situazione percui la variabilità delle misure aumenta col crescere della concentrazione, il cui livello è espressodalla media: si deve allora studiare una possibile relazione funzionale fra scarto tipo e mediadelle diverse serie (colonne) di dati, che consenta di calcolare lo scarto tipo, e quindi laripetibilità, anche per concentrazioni diverse da quelle dei campioni sottoposti alle misurereplicate.Viene allora effettuata un'ulteriore elaborazione, che sul foglio DATI2 mostra oltre ai datiordinati e alle statistiche base già rilevate in precedenza – i risultati del calcolo delle regressionifra scarto tipo e media secondo tre diversi modelli:- regressione lineare che passa per lo 0 ( y = bx )- regressione lineare con intercetta ( y = a + b x )- regressione doppio-logaritmica ( logy = c + d logx )

La riga inferiore di ciascuna sezione contiene gli scarti tipo calcolati in base all'equazione diregressione in funzione dei valori delle relative medie (riga 14). Secondo il criterio suggerito, èda preferire quel modello (equazione) per cui la somma dei quadrati delle differenze fra lo

Page 35: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 34 di 52

scarto tipo calcolato e misurato (riga 15) risulta minimo. Questa SQ (somma dei quadrati)minima viene evidenziata sul foglio.

I risultati di tale elaborazione sono i seguenti:

M La relazione è quindi:y = 0,6023x - 0,5325

dove, avendo posto y = log(s) e x = log(x), si ha che lo scarto tipo di ripetibilità è espresso dallarelazione

Che con i dati ottenutiS = 10(c+d*log(x))

diventac = -0,5323 - d = 0,6023 - x = tenore di cellule

s = 10 (0,6023logx -0,5325)

ricordando alcune elementari proprietà dei logaritmi e delle potenze, con semplici manipolazionisi ottiene

s = 0,2934x0,6023

che è esattamente uguale a quella da noi calcolata per altra via utilizzando la correlazione dipotenza in excel.Ad un’analisi più attenta, si rileva che le altre equazioni presentano una certa differenza, ma lacosa è praticamente irrilevante in quanto, la retta di correlazione passante per l’origine ha un r2 =0,39 e quindi indica una mancanza di correlazione, mentre quella con intercetta ha un r2 = 0,81,indice di una correlazione quasi accettabile, differisce da quella dell’UNICHIM in quanto dàrisultati in alcuni casi migliori in altri peggiori, come si può vedere dalla tabella seguente.

Page 36: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 35 di 52

media 190,60 313,20 753,10 134,20 670,90 456,00 554,20 1045,80 1435,00

scarto tipo vero 6,22 9,92 18,99 5,39 16,92 12,33 13,01 17,03 20,42

Scarto tipo calcolato UNICHIM: 6,79 8,57 14,94 5,98 13,75 10,64 12,06 19,18 24,82

Scarto tipo calcolato con excel 8,39 9,81 14,91 7,73 13,96 11,47 12,61 18,31 22,82

differenza % UNICHIM 9,17% -13,62% -21,32% 10,84% -18,75% -13,73% -7,32% 12,63% 21,52%

differenza % EXCEL 23,48% 14,49% -0,18% 29,42% 1,53% 7,80% 4,54% -4,54% -8,03%

Ti basta questa verifica?

L Si, molto bene, poi mi dici come posso fare per acquisire il software dell’UNICHIM16.

M Questo te lo dico subito: basta che tu telefoni all’UNICHIM allo 02/76004450 o ti colleghi al sitohttp://www.unichim.it.

Ma continuando con i nostri calcoli; a questo punto, per completare la prima parte del nostrolavoro dobbiamo calcolare il limite di ripetibilità e il CV% che al 95% di probabilità è espressocome:

r = t1 0,95;n 1 Sr 2

Dove t al 95% con n-1 = = 8 gradi di libertà (n = numero di dati della serie con minor numero didati) può essere calcolato da excel con la formula =INV.T(0,05;9) e quindi sostituendo il valoretrovato nella precedente si ha

r = 2,306 Sr 2Dove Sr si ricava dalla formula precedentemente determinata

Sr = 0,2934x0,6023

A questo punto possiamo determinare il CV.Con semplici passaggi si ha che

CV= s/x = 0,2934 *x(-1)x0,6023 = 0,2934*x

(-0,3977)

E con questo la prima parte del nostro lavoro si può considerare completata in quanto abbiamocalcolato tutti i parametri che ci interessavano.

L E no! Come sai bene uno dei criteri per il controllo della qualità di un risultato di prova èl’effettuazione di una prova in doppio, e con quello che abbiamo detto, la situazione èabbastanza complicata, come possiamo fare?

M Per le prove in doppio, nel nostro caso e con un livello di confidenza del 95%, vale la relazione18

18N. Bottazzini e L. Cavalli Guida al calcolo della ripetibilità di un metodo di prova ed alla sua verifica nel tempo Seminario SINAL, settembre 2007

Page 37: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 36 di 52

r= 0,

sr= 0,

50

10

x1 x2 t0,95;8 Sr 2 oppure l’equivalente x1 x2 r0,95;8

x1 x2 r0,95;8 0,9567 x 0,6023

Per semplificare i calcoli possiamo riportare in un diagramma le funzioni precedentemente trovateper sr, r, e CV% in funzione di x.

90

80

70

60

0,60239568x

40

0,602330 2934x

20

-0,3977CV% = 29,34x

0

0 200 400 600 800 1000 1200 1400 1600

scarto tipo sr limite di ripetibilità r CV%

Con questo sistema, la prova è accettabile se il valore assoluto della differenza dei risultati delledue prove è al di sotto della curva della r.

L Adesso passiamo ad affrontare l’incertezza di misura!

L’incertezza di Luis

M Intanto ti informo che oltre ai documenti di riferimento consigliati dal SINAL2 di cui tu benconosci, forse, almeno i titoli, utilizzeremo per il nostro scopo anche i seguenti:

UNI CEI ENV 13005 - 2000 Guida all’espressione dell’incertezza di misuraManuale UNICHIM 179/1 Linee guida per la valutazione dei metodi

analitici nei laboratori chimiciARPA Agenzia Regionale Linee guida per la validazione dei metodiPrevenzione e Ambiente analitici e per il calcolo dell’incertezza didell’Emilia-Romagna misuraFogli di calcoloUNICHIM Software per il calcolo, il trattamento statistico

e la valutazione dei dati ottenuti nelle prove dilaboratorio (ed. 2006)

L Alla faccia, ed io mi dovrei studiare tutta questa roba? E il laboratorio chi lo porta avanti? E leanalisi sui prodotti chi le fa? E a Fabrizio cosa gli racconto quando mi chiede se i prodotti sonostati deliberati?

M Non fare la lagna, anche perché li abbiamo già utilizzati! Cerchiamo di capire, prima dilamentarci, e veniamo ai fatti.

Page 38: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 37 di 52

Intanto partiamo dalle definizioni di incertezza e dei principali termini collegati, riportati nella UNICEI ENV 13005.

Incertezza dimisura

Parametro, associato al risultato di una misurazione, che caratterizza ladispersione dei valori ragionevolmente attribuibili al misurando.Nota 1 il parametro può essere, per esempio, uno scarto tipo (o un suomultiplo dato), o la semiampiezza di un intervallo avente un livello difiducia stabilito.Nota 2 L’incertezza di misura, in genere, comprende più componenti.

Talune di queste possono essere valutate dalla distribuzionestatistica dei risultati di serie di misurazioni e possono dunque esserecaratterizzate mediante scarti tipo sperimentali. Le altre componenti,anch’esse caratterizzabili mediante scarti tipo, sono valutate dadistribuzioni di probabilità ipotizzate sulla base dell’esperienza o diinformazioni d’altro tipo.

Nota 3 S’intende che il risultato della misurazione è la migliorestima del valore del misurando, e che tutte le componentidell’incertezza, comprese quelle derivanti da effetti sistematici, qualiquelle associate a correzioni e campioni di riferimento, contribuisconoalla dispersione.

Incertezza tipo Incertezza del risultato di una misurazione espressa come scarto tipo.

Incertezza tipocomposta

Incertezza tipo del risultato di una misurazione allorquando il risultato èottenuto mediante i valori di un certo numero di altre grandezze; essa èuguale alla radice quadrata positiva di una somma di termini, che sono levarianze e le covarianze di quelle grandezze, pesate secondo lavariazione del risultato della misurazione al variare di esse.

Incertezzaestesa

Grandezza che definisce, intorno al risultato di una misurazione, unintervallo che ci si aspetta comprendere una frazione rilevante delladistribuzione dei valori ragionevolmente attribuibili al misurando.

Nota 1 La frazione può essere interpretata come la probabilitàdi copertura o livello di fiducia dell’intervallo.Nota 2 Per poter associare uno specifico livello di fiduciaall’intervallo definito dall’incertezza estesa è necessario fareipotesi, esplicite o implicite, sulla distribuzione di probabilitàcaratterizzata dal risultato della misurazione e dalla suaincertezza tipo composta. Il livello di fiducia che può essereattribuito a questo intervallo può essere conosciuto solo nei limiti

entro i quali quelle ipotesi siano giustificate.

L “Maestro, il senso lor m’è duro”, come dice il Poeta.Leggendo queste definizioni, ho la certezza che sia aumentata la mia incertezza sul significatodell’incertezza di misura, perché non provi ad essere più chiaro?

M Lascia in pace Virgilio, Dante, il terzo canto dell’Inferno e i giochi di parole; e cerca di esserepiù serio!

Page 39: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 38 di 52

Provo a darti qualche ulteriore chiarimento ricavato dalla UNI CEI ENV 13005. L’incertezza dimisura può essere intesa come la stima dell'intervallo dei valori entro cui cade il valore delmisurando, dove per misurando si intende una particolare grandezza sottoposta a misurazione.Questa definizione deriva dal fatto che ogni misura è caratterizzata da una certa variabilità. Tra ipossibili fattori che possono determinare la variabilità e quindi l’incertezza di una misura, sonoindividuati lo Scarto Aleatorio che nelle misurazioni ripetute varia in modo non prevedibile e loScarto Sistematico che, nelle misure ripetute, resta costante o varia in modo prevedibile.L’insieme combinato di queste due componenti dà luogo all’incertezza tipo composta. Per capireil rapporto che intercorre tra incertezza composta ed incertezza estesa, basta che tu ti rifaccia aquanto abbiamo detto a proposito della distribuzione di Gauss: ricorderai che in unadistribuzione normale il 68% dei dati si trova nell’intervallo centrato sul valore medio μ e aventecome semi intervallo lo scarto tipo s della distribuzione stessa, e il 95% dei dati nell’intervallocentrato sul valore medio μ e avente come semi intervallo circa due volte lo scarto tipo.Il primo intervallo rappresenta l’incertezza composta, mentre il secondo l’incertezza estesa, percui si ha che, con una probabilità del 95%:

Incertezza estesa = 2* incertezza composta

L OK, ma ora fammi vedere i fatti pratici, i numeri, le formule, in altri termini i criteri di calcolodell’incertezza.

M Prima di parlare del calcolo dell’incertezza è bene puntualizzare che l’incertezza di misuraassociata al risultato deve essere espressa con le stesse unità del risultato ed essere indicata comesemi intervallo di fiducia del risultato della misurazione, ossia come incertezza estesa.L’incertezza può essere calcolata con diversi approcci o criteri (metrologico, olistico e Horwitz).

Luis e l’approccio metrologico

L’approccio metrologico è considerato il più rigoroso. Relativamente a questo criterio, la guidaSINAL DT 000219 dice (riporto testualmente in corsivo):

“in generale, il misurando Y dipende da un certo numero di grandezze d’ingresso X1, X2, ..., Xi,..., Xn, secondo una funzione del tipo:

Y= f (X1, X2, ..., Xi, ..., Xn) (1)

usualmente chiamata modello della misurazione.Tipiche grandezze di ingresso sono quelle che derivano dal processo di misurazione, quelleriportate nei certificati di taratura dei campioni e degli strumenti impiegati, nonché le grandezzedi influenza, che sono sostanzialmente, ma non esclusivamente, le variabili ambientali come latemperatura, la pressione, l’umidità, ecc.La stima y del misurando Y viene ottenuta dalla (1) sostituendo ai valori delle grandezze Xi lecorrispondenti stime di ingresso xi:

y = f (x1, x2, ..., xi, ..., xn) (2)

Come i valori delle grandezze d’ingresso Xi, anche le dispersioni sono stimate attraversoopportune valutazioni, in base alle informazioni disponibili.

19SINAL DT-0002 Guida per la valutazione e la espressione dell'incertezza nelle misurazioni

Page 40: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 39 di 52

n

Le incertezze di ingresso possono essere determinate attraverso due categorie di valutazione,contraddistinte con le lettere A e B.Si sottolinea che tutte le incertezze hanno la stessa natura per cui la distinzione in base allecategorie di valutazione (A e B) riguarda unicamente il modo con il quale le incertezze vengonostimate.” .

In primo luogo devi considerare che ai nostri fini l’incertezza, sia di categoria A che di categoriaB deve essere espressa in termini di scarto tipo. I criteri suggeriti dalla stessa guida SINAL19 peril calcolo delle componenti A e B dell’incertezza in termini di scarto tipo, sono i seguenti:

Incertezze di categoria A

Le incertezze di categoria A sono quelle che possono essere valutate direttamente dallaboratorio attraverso la ripetizione di un processo di misurazione, in condizioni controllate. Sitratta, ai fini pratici, di applicare i concetti di cui abbiamo parlato in precedenza a proposito delcalcolo dello scarto tipo.Il valore dello scarto tipo così calcolato costituisce il parametro statistico che vienetradizionalmente indicato come scarto tipo della serie di misurazioni.L’incertezza associata ad una serie di misure si determina con la formula seguente:

u(x i) =si

i

Incertezze di categoria B

Le valutazioni di incertezza effettuate in modo diverso da quello basato su serie di osservazioniripetute, si definiscono di categoria B.Per la loro determinazione possiamo ancora utilizzare la norma UNI CEI ENV 13005:20006 e laguida SINAL19

La situazione di minima informazione è rappresentata da un intervallo, individuato da due valoriximax e ximin, al di fuori del quale si esclude possa trovarsi il valore della grandezza, mentreall’interno tutti i valori hanno la stessa probabilità. In questo caso si assume una distribuzioneuniforme di probabilità, detta anche rettangolare, di ampiezza pari ad ximax - ximin, che porta alseguenti risultato:

Esempio purezza di un sale

Se il valore centrale è più probabile di quello agli estremi si assume una distribuzione diprobabilità detta triangolare di ampiezza pari ad ximax - ximin

Page 41: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 40 di 52

x

Esempio vetreria di classe A

L La cosa comincia ad interessarmi, continua.M Una volta determinate le singole componenti delle incertezze, dobbiamo calcolare l’incertezza

composta, che, come riportato dalla UNI CEI ENV 13005 è data dalla seguente formula

2n y

u(y) = •u2 (xi )

i=1 i

Dove y è la funzione che esprime la stima del misurando dipendente da una serie di parametri x1,x2, ….., xn. (vedi equazione 2 SINAL DT 0002 riportata in precedenza)

L Radici quadrate, derivate parziali, sommatorie, stima del misurando …….. ci risiamo con lecomplicazioni.

M Calmati, che la situazione è molto più semplice di quanto sembra!Si dà il caso che per i nostri scopi l’equazione da te definita complicata si semplificanotevolmente per i casi da noi generalmente trattati. È ancora il SINAL19 che ci facilita ilcompito con una utilissima tabella di riepilogo che ti riporto.

Page 42: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 41 di 52

Formu e per a valu az one de ncer ezza po compos a S NAL DT0002 Tabe la 3)

Nota h e n ono cos ant note con nce ezza am

ente

orea

que lade

gl acom

ponent

- F lll p ll val ttt zii d llll’iii tt ttiip p tt ((SIINAL DT0002 Tab lll 3)

Not :h

s no tt ntii not iii rttt lll rgggaaa nt iiinnnffferii quelll deglii lllttt rii ponentiii .

E qua ci fermiamo. Svilupperemo l’esempio pratico solo se sarà necessario, nel corso del nostrolavoro. Se vuoi, comunque informazioni più dettagliate e complete sul criterio metrologico lepuoi trovare nelle guide SINAL20 e nel documento del suo direttore21 relativo alla norma UNICEI EN ISO_IEC 1702522 oltre che nella norma UNI CEI ENV 130056.

Luis e Horwitz

L’approccio di Horwitz, si basa sull’elaborazione statistica di una grossa mole di dati ricavati daconfronti interlaboratori. Tale criterio è utile, in fase di primo approccio, nella valutazionedell’incertezza.Il criterio di Horwitz si riassume in una formula

20DT 0002, DT 0002/3, DT 0002/4

21 Paolo Bianco ISO/IEC 17025: requisiti tecnici - Incertezza di misura: approccio GUM22 Requisiti generali per la competenza dei laboratori di prova e di taratura

Page 43: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 42 di 52

R = 0,02*c0,8495

Che può assumere anche la forma

Dove:

RSDR = 2[1 0,5 log c]

R scarto tipo di riproducibilitàRSDR scarto tipo relativo di riproducibilitàC concentrazione dell’analita espresso in unità (m/m)

Tale approccio, applicabile fondamentalmente all’analisi degli alimenti ed alle acque, certamentenon è applicabile al nostro caso, non fosse altro che per il fatto che le nostre misure sonoespresse in cellule/ml e non come massa/massa.

Luis e il criterio olistico

Per quanto riguarda l’approccio olistico o “top down”, il metodo si basa sull’utilizzo dei risultatidi una stessa prova, eseguita in laboratori diversi ed è in genere quello più usato nel campochimico e microbiologico.Alcuni esempio pratici di tale approccio li puoi trovare chiaramente sviluppati nei documenti divalidazione del software dell’UNICHIM16 che prendono in considerazione i seguenti casi:

• Uso di una norma che reca i valori di scarto tipo di ripetibilità, r e diriproducibilità, R

• Uso di un metodo interno simile ad una norma che reca i valori di r e di R

• Uso dei parametri di precisione ricavati da prove interlaboratorio• Uso di materiali di riferimento certificati (CRM) che riportano in modo completo i

parametri di precisione.

Anche di tale metodo svilupperemo l’esempio pratico, solo se sarà necessario, nel corso delnostro lavoro.In altri termini ti dico, per tranquillizzarti, che non svilupperemo tutti i metodi di calcolodell’incertezza, ma focalizzeremo l’attenzione solo su quello che risulterà il più adatto oltre chepiù pratico per il nostro scopo, tralasciando tutti gli altri.

L Grazie per le informazioni, ma soprattutto grazie ……. per lo sconto.

L’incertezza di Luis variabile con la concentrazione

M E torniamo al nostro caso specifico.Nella determinazione delle cellule somatiche nel latte vaccino, con il metodo in oggetto, l’entitàdelle componenti dell’incertezza varia con la concentrazione dell’analita (ricordati dello scartotipo!).In questi casi, come riportato dalla Guida EURACHEM23, è importante prendere inconsiderazione le variazioni dell’incertezza tipo composta con la concentrazione dell’analita.

23Rapporti ISTISAN 03/30 - Quantificazione dell’incertezza nelle misure analitiche Seconda edizione (2000) della Guida EURACHEM / CITACCG 4

Page 44: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 43 di 52

0 1

Gli approcci possibili, riporta la guida, includono:

• restringere il campo di applicazione della procedura specificata o la stima dell’incertezza adun piccolo intervallo di concentrazioni di analita;

• fornire una stima dell’incertezza in termini di Scarto Tipo Relativo (STR);• stabilire esplicitamente la relazione tra l’incertezza e la concentrazione e quindi, in base ad

essa, determinare di nuovo l’incertezza di un dato risultato.

Noi optiamo per la terza soluzione, in quanto quella che più compiutamente interpreta lenecessità del Laboratorio e dei suoi clienti.

L E ti pareva, altrimenti sarebbe stato troppo facile.

M La Guida EURACHEM23 al paragrafo E.4.2 riporta:Per tener conto sia della proporzionalità dell’incertezza sia della possibilità di un valoreessenzialmente costante con il livello, si usa la seguente espressione generale:

dove

u(x) = s2 + (x s )2

u(x) è l’incertezza tipo composta del risultato x (cioè l’incertezza espressa come unoscarto tipo)

s0 rappresenta un contributo costante all’incertezza globales1 è una costante di proporzionalità.

L’equazione si basa sul metodo normale della combinazione dei due contributi all’incertezzaglobale, assumendo che un contributo (s0) sia costante ed uno (xs1) proporzionale al risultato.La Figura E.4.1 illustra la forma di questa funzione.

E.4.4.3. Dipendenza intermedia

Page 45: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 44 di 52

i

In casi intermedi, ed in particolare quando la situazione corrisponde alla zona B nella FiguraE.4.1, possono essere adottati due approcci.

a) Applicare una dipendenza variabileL’approccio più generale è determinare, registrare e usare sia s0 sia s1. Le stime dell’incertezza,quando necessario, possono essere effettuate sulla base del risultato riportato. Questo èl’approccio raccomandato qualora fattibile.NOTA: Si veda la nota del paragrafo E.4.2. (NOTA: L’approccio precedente si dimostra praticosolo quando è possibile calcolare un numero grande di valori. ….)

b) Applicare un’approssimazione fissaPer analisi generiche e nei casi in cui

• la dipendenza non è molto forte (ossia, vi è scarsa evidenza di proporzionalità) oppure• l’intervallo dei risultati previsti non è molto grandequalora in entrambi i casi le incertezze non differiscano di più del 15% circa da una stimadell’incertezza media, spesso sarà ragionevole calcolare e stabilire un valore fissodell’incertezza per un uso generale, basandosi su un valore medio dei risultati attesi. Quindi o• si usa un valore medio o tipico di x per calcolare un’unica stima dell’incertezza e la si usa in

alternativa a stime calcolate singolarmente o• si è ottenuto un unico valore dello scarto tipo, in base a studi su materiali che ricoprono

l’intero intervallo dei livelli di analita ammessi (entro il campo di applicazione per la stimadell’incertezza) e c’è scarsa evidenza che giustifichi un’ipotesi di proporzionalità. Questocaso dovrebbe essere generalmente trattato come un caso di dipendenza nulla e lo scarto tipoin oggetto riportato come s0.

E.4.5. Determinare s0 ed s1

E.4.5.1. Nei casi particolari nei quali un termine è dominante, sarà normalmente sufficienteusare l’incertezza espressa come scarto tipo o scarto tipo relativo rispettivamente come valore dis0 o di s1. Quando la dipendenza è meno ovvia, potrebbe tuttavia essere necessario determinare s0

ed s1 indirettamente da una serie di stime dell’incertezza a differenti livelli di analita.

E.4.5.2. Dato un calcolo d’incertezza composta da varie componenti, alcune delle qualidipendono dal livello di analita mentre altre no, sarà generalmente possibile indagare sulladipendenza dell’incertezza globale dal livello di analita mediante una simulazione con ilprocedimento seguente:

1. calcolare (o ottenere sperimentalmente) le incertezze u(xi) per almeno dieci livelli xi dianalita, che coprono l’intero intervallo ammesso2. riportare in grafico u(xi)

2 in funzione di x 2

3. mediante regressione lineare, ottenere stime di m e di c per la curva u(x)2 = mx2 + c4. calcolare s0 e s1 da s0 = c, s1 = m5. registrare s0 e s1

Da quanto riportato sopra è chiaro che la prima cosa da fare è il calcolo dell’incertezza almeno adieci livelli, cosa che potremmo fare col metodo olistico o con il sistema cosiddetto metrologico,ma che comunque ci richiede un lungo lavoro, a meno di non essere in possesso dei dati

Page 46: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 45 di 52

valo

ride

lla

bora

tori

o

necessari, quali ad esempio risultati di circuiti interlaboratorio, serie di dati con materialicertificati, et similia, cosa di cui dubito molto.

L E ti pareva che lui avesse qualche fiducia in quello che facciamo!Aspetta a sputare sentenze con il tuo latinorum, e ascolta quello che ho da dire!

M Ho capito, se ricordo bene tu hai partecipato a qualche circuito interlaboratorio per la provarelativa alla ricerca delle cellule somatiche, o ricordo male?

L Ricordi male perché intanto è Valentina che vi partecipa, e non solo qualche volta, macostantemente con cinque campioni a livelli diversi 4 volte l’anno, per cui penso che potremmodisporre di molti dati.

M Non dire quattro se non ce l’hai nel sacco e raccogli i dati di cui disponi.

L Ecco i dati, ma come possiamo da questi dati calcolare la relativa incertezza?

M Nell’applicazione di questo criterio, qualcuno dice che i laboratori devono utilizzare lo stessometodo di prova, altri considerano ancora accettabile il criterio anche se il laboratorio utilizza unmetodo di prova diverso purché:

• i laboratori partecipanti siano in numero elevato (>40)• siano laboratori stimati per competenza tecnica;• i risultati del circuito e i risultati del laboratorio siano tra loro paragonabili, e che siano

compatibili gli scarti tipo di ripetibilità.

Prima di utilizzare questo criterio verifichiamo se i risultati del nostro laboratorio sono coerenticon i risultati dei laboratori partecipanti al ring test, attraverso la relativa correlazione.Dalla correlazione, come puoi ben vedere, si evince un’ottima concordanza tra i dati, cheassieme al fatto che i laboratori partecipanti sono stati in genere > 50 e tutti di chiaracompetenza, conferma l’applicabilità del metodo di calcolo dell’incertezza.

retta di corre laz ione laboratori o/laboratori y = 0,9231x + 15,113

R2

= 0,99381500

1000

500

00 500 1000 1500

valori di riferim ento

Page 47: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 46 di 52

s

2

Il documento UNICHM24, ai fini del calcolo dell’incertezza mediante l’uso di parametri diprecisione derivanti da circuiti interlaboratorio riporta quanto segue:

2 2La formula da utilizzare è U = k L + sr / m con 2 = 2 2 .L R r

Le condizioni che permettono questo impiego sono le seguenti:a) il laboratorio ha partecipato alle prove con risultati non anomali;b) il laboratorio può dimostrare di aver ottenuto da n (intorno a 10) ripetizioni, eseguite con ilmetodo considerato nella prova interlaboratorio, risultati accettabili il cui scarto tipo ècompatibile con quello di ripetibilità ricavato dalla prova interlaboratorio.

Seguendo tale indirizzo, in primo luogo dobbiamo valutare per ogni risultato del circuito lacompatibilità dello scarto tipo s ottenuto dal laboratorio con lo scarto tipo di ripetibilità delcircuito e quindi calcolare l’incertezza.Per valutare se lo scarto tipo ottenuto dal laboratorio sia compatibile con quello del circuitoricorriamo alla distribuzione del 2.Considerando i dati del primo circuito abbiamo per R il valore di 9,59, per r il valore di 5,644,mentre il valore dello scarto tipo s del laboratorio deve essere calcolato con la formula cheabbiamo determinato precedentemente e che riporto

Sr = 0,2934x0,6023

sostituendo in tale formula x con 158 (tenore di cellule del circuito), si ha che Sr = 6,19.Per la verifica di compatibilità tra gli scarti tipo, utilizziamo la formula ormai nota

2 2/ 2; =n 1

2(1 / 2); =n 1

n 1 2 n 1ricorrendo ad excel, con un livello di probabilità p = 95% e sapendo che per ogni livello sonostate fatte dal laboratorio 10 prove per il calcolo della ripetibilità, si calcolano i due valori di 2

con le formule INV.CHI(0,025;9) e INV.CHI(0,975;9) che danno rispettivamente per il 2 i valori2,70 e 19,02.

Sostituendo i valori calcolati nelle formule precedenti si ricava che 0,30s

2= 1,2 2,11

Successivamente, per il calcolo dell’incertezza applichiamo la formula

2 2U = k L + sr / m con 2 = 2 2L R r

e sostituendo i valori del circuito otteniamo il risultato cercato dell’incertezza composta che peruna prova in doppio risulta 17,8 e per una prova singola 19,8.

L È molto chiaro quello che dici, ma il lavoro diventa piuttosto lungo e noioso.

M Hai perfettamente ragione, ma noi possiamo automatizzare il tutto con un semplicissimo foglioexcel, dove possiamo riportare tutti i nostri dati e inserire le formule già utilizzate. Ecco ilfoglio:

24Software applicativo per l’elaborazione dei risultati analitici Convalida con il calcolo manuale (UNICHIM)

Page 48: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 47 di 52

mediacircuito r R sr lab

s2

2

compatibilitàscarto tipo

incertezza1 prova

incertezza2 prove

2(0,975;9)

mar

-06

158 5,644 9,59 6,19 1,20 OK 19,84 17,81 2,70

686 15,938 34,285 14,99 0,88 OK 67,71 64,30

1102 24,596 58,537 19,94 0,66 OK 113,48 109,922(0,975;9)/9

592 11,986 27,906 13,72 1,31 OK 57,38 54,01 0,30

275 10,093 15,192 8,64 0,73 OK 28,54 25,79

mag

-06 116 5,62 11,46 5,14 0,84 OK 22,46 21,26 2

(0,025;9)

773 15,97 39,13 16,11 1,02 OK 78,37 74,99 19,02

340 9,81 19,45 9,82 1,00 OK 38,91 36,35

lug-

06

633 15,16 36,27 14,28 0,89 OK 71,82 68,92 2 /9(0,025;9)

1138 22,43 62,57 20,33 0,82 OK 123,70 120,31 2,11

748 17,78 35,62 15,79 0,79 OK 69,34 65,65

256 9,34 16,32 8,28 0,79 OK 31,47 29,21

35 3,29 6,48 2,50 0,58 OK 12,23 11,71

set-

06

259 10,54 16,26 8,34 0,63 OK 29,85 27,43

758 14,5 36,2 15,92 1,21 OK 73,58 70,05

311 8,97 15,64 9,31 1,08 OK 31,67 28,81

nov-

06

109 4,864 9,081 4,95 1,04 OK 18,25 16,86

330 11,411 18,657 9,65 0,71 OK 35,27 32,52

mar

-07 215,3 6,802 13,207 7,46 1,20 OK 27,11 24,98

119,1 6,891 15,453 5,22 0,57 OK 29,57 28,63

462,5 10,487 27,301 11,82 1,27 OK 55,68 53,11

mag

-07

264,9 7,921 13,386 8,45 1,14 OK 27,41 24,67

706,7 15,431 35,009 15,26 0,98 OK 69,87 66,45

31,1 3,378 4,784 2,33 0,47 OK 8,22 7,53

142,1 6,323 11,944 5,81 0,84 OK 23,36 21,87

354,6 8,723 20,273 10,07 1,33 OK 41,78 39,28

lug-

07

130 5,64 10,44 5,50 0,95 OK 20,73 19,22

658 12,88 33,93 14,62 1,29 OK 69,25 66,10

461 8,95 20,09 11,80 1,74 OK 43,02 39,65

215 6,98 13,88 7,45 1,14 OK 28,25 26,21

505 12,34 31,17 12,46 1,02 OK 62,44 59,90

L Come al solito vorrei avere una conferma di questo lavoro, per essere più sicuro.

M Grazie per l’ormai nota fiducia nelle cose che ti dico; comunque ti ricordo che abbiamo sempre adisposizione il solito ottimo software dell’UNICHIM16, che tra le altre cose consente di calcolarel’incertezza in vari modi tra cui utilizzando i risultati di circuiti interlaboratori.

E veniamo a noi, come puoi vedere dalla maschera seguente, per poter applicare il foglio dicalcolo dell’UNICHIM è necessario conoscere 4 parametri fondamentali.

Page 49: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 48 di 52

Una volta inseriti i dati, si cliccasul tasto

E compare la richiesta“numerosità della media”.Imputando il numero di dati per iquali si vuole calcolarel’incertezza solitamente 1 o, perle prove in doppio 2, si ottienel’incertezza richiesta. Al terminedi queste semplici operazioni lamaschera si presenta così:

L Bene questo software, mi piace sempre dipiù, nonostante sia servito anche aconfermare i tuoi calcoli.

M OK sono d’accordo sulla bontà del softwaredi cui non hai sperimentato che una piccolaparte.

Page 50: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 49 di 52

i

incertezza estesa calcolata conil software UNICHIM

Media Mediasr SR sr lab

Provesingole

provein doppiolaboratorio riferimento

mar

-06

164 158 5,644 9,59 6,19 19,843 17,807750 686 15,938 34,285 14,99 67,709 64,305

1256 1102 24,596 58,537 19,94 113,478 109,917649 592 11,986 27,906 13,72 57,383 54,005274 275 10,093 15,192 8,64 28,540 25,790

mag

-06 113 116 5,62 11,46 5,14 22,464 21,256

810 773 15,97 39,13 16,11 78,372 74,989329 340 9,81 19,45 9,82 38,911 36,348

lug-

06

660 633 15,16 36,27 14,28 71,823 68,9251211 1138 22,43 62,57 20,33 123,698 120,309777 748 17,78 35,62 15,79 69,340 65,646237 256 9,34 16,32 8,28 31,473 29,21535 35 3,29 6,48 2,50 12,231 11,711

set-

06 275,5 259 10,54 16,26 8,34 29,853 27,426754,5 758 14,5 36,2 15,92 73,582 70,054315 311 8,97 15,64 9,31 31,672 28,807

nov-

06 103 109 4,864 9,081 4,95 18,255 16,859364 330 11,411 18,657 9,65 35,266 32,521

mar

-07 223 215,3 6,802 13,207 7,46 27,114 24,978

152 119,1 6,891 15,453 5,22 29,568 28,631463 462,5 10,487 27,301 11,82 55,681 53,113

mag

-07

262 264,9 7,921 13,386 8,45 27,412 24,670737 706,7 15,431 35,009 15,26 69,868 66,45136 31,1 3,378 4,784 2,33 8,218 7,531

135 142,1 6,323 11,944 5,81 23,358 21,867370 354,6 8,723 20,273 10,07 41,779 39,275

lug-

07

152 130 5,64 10,44 5,50 20,734 19,218667 658 12,88 33,93 14,62 69,254 66,097470 461 8,95 20,09 11,80 43,021 39,654223 215 6,98 13,88 7,45 28,247 26,207483 505 12,34 31,17 12,46 62,438 59,899

L A questo punto, se permetti, continuo io.Considerato quanto riportato al punto E.4.5.2. precedente della Guida Eurachem23, avendodeterminato l’incertezza a vari livelli, bisogna:

riportare in grafico u(xi)2 in funzione di x 2

mediante regressione lineare, ottenere stime di m e di c per la curva u(x)2 = mx2 + ccalcolare s0 e s1 da s0 = c, s1 = m

Andiamo per ordine e costruiamo una matrice nelle cui prime tre colonne riportiamo i dati notiquali la media di riferimento, l’incertezza per la singola prova, l’incertezza per le prove indoppio e nelle colonne 4, 5 e 6 i quadrati di questi parametri. Facciamo un’interpolazionelineare mediante excel dei quadrati delle incertezze composte delle prove singole in funzione delquadrato delle medie relative e determiniamo l’equazione della retta. Se il coefficiente di

Page 51: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 50 di 52

Med

iaL

abor

ator

io

ince

rtez

zaes

tesa

pro

vasi

ngo

la

ince

rtez

zaes

tesa

pro

vein

dop

pio

med

ia2

quad

rato

ince

rtez

zaco

mpo

sta

pro

vasi

ngo

la

quad

rato

ince

rtez

zaco

mpo

sta

pro

vein

dop

pio

PROVESINGOLE y = 0,0027x + 39,507R2 = 0,9774

5000

4000

3000

2000

1000

00 200000 400000 600000 800000 1000000 1200000 1400000

I coefficienti della curva u(x)2 = mx2 + csono: m= 0,0027e c = 39,507da cui s0 = 6,28 e s1 = 0,052

E la formula per il calcolo dell’incertezza composta2 2u(x) = s0 + (s1 x) diventa:

u(x) = 39,507 + 0,0027 x2

164 20 18 24964 98 79750 68 64 470596 1146 1034

1256 113 110 1214404 3219 3020649 57 54 350464 823 729274 29 26 75625 204 166113 22 21 13456 126 113810 78 75 597529 1536 1406329 39 36 115600 379 330660 72 69 400689 1290 1188

1211 124 120 1295044 3825 3619777 69 66 559504 1202 1077237 31 29 65536 248 21335 12 12 1225 37 34 PROVE IN DOPPIO y = 0,0025x + 15,896

R2 = 0,9728

4000350030002500200015001000500

00 200000 400000 600000 800000 1000000 1200000 1400000

275,5 30 27 67081 223 188754,5 74 70 574564 1354 1227315 32 29 96721 251 207103 18 17 11881 83 71364 35 33 108900 311 264223 27 25 46354 184 156152 30 29 14185 219 205463 56 53 213906 775 705262 27 25 70172 188 152737 70 66 499425 1220 1104

I coefficienti della curva u(x)2 = mx2 + csono: m= 0,0025 e c = 15,896

da cui s0 = 3,99 e s1 = 0,05E la formula per il calcolo dell’incertezza composta

2 2u(x) = s0 + (s1 x) diventa:

u(x) = 15,896 + 0,0025 x2

36 8 8 967 17 14135 23 22 20192 136 120370 42 39 125741 436 386152 21 19 16900 107 92667 69 66 432964 1199 1092470 43 40 212521 463 393223 28 26 46225 199 172483 62 60 255025 975 897

correlazione r2 è prossimo ad 1, utilizzeremo l’equazione della retta per il calcolo dello scartotipo, altrimenti, dovremo percorrere una delle altre strade consigliate dalla Guida Eurachem23.Successivamente faremo lo stesso percorso per le prove in doppio.

Tenendo presente che abbiamo calcolato l’incertezza estesa, mentre noi abbiamo bisognodell’incertezza composta, dovremo dividere i valori ottenuti precedentemente per 2.

Ed ecco i risultati:

Page 52: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 51 di 52

Dai risultati precedenti possiamo quindi concludere che l’incertezza estesa con un grado dicopertura del 95% è data

per le prove singole da U (x) = 2 39,507 + 0,0027 x 2

e per le prove in doppio da U (x) = 2 15,896 + 0,0025 x 2

M Ottimo risultato, vedo che sei diventato un asso con excel!

La decisione finale di Luis

L Ti devo dire un’ultima cosa: avendo letto da qualche parte che l’unica cosa certa di una misuraè la sua incertezza, ho maturato una certezza: parteciperò al prossimo corso sull’incertezzatenuta da un ente riconosciuto per competenza e professionalità!

Page 53: Incertezzadimisura sinal-scarti-rapillo

Michele Rapillo Gli scarti... “tipi”... facili

Pag. 52 di 52

Michele Rapilloingegnere chimico, ricercatore tecnologo ENEA, opera da oltre 20anni nell’ambito della qualità e dell’accreditamento dei laboratori diprova.Già membro di comitati di certificazione di prestigiosi organismi dicertificazione italiani (IIP, ICIM, CERSA, AGROQUALITÀ) e delcomitato di accreditamento di FIDEA, attualmente è membro deicomitati di accreditamento di SINCERT (dal 1999) e di SINAL (dal2001).

Il calcolo dell’incertezza è guardato da molti con sospetto, un sospetto che questo volumettointende fugare proponendo un approccio al problema che coniuga un linguaggio chiaro edaccessibile a tutti con il rigore della trattazione. Lo svolgimento dell’argomento che utilizzaformule di fogli di calcolo o software dedicati consente al lettore di comprendere le nozionifondamentali ed anche l’applicazione pratica.