Introdução à Análise de Dados nas medidas de grandezas físicas · • Calcule-se o valor...

20
Introdução à Análise de Dados nas medidas de grandezas físicas www.chem.wits.ac.za/chem201/ http://uregina.ca/~peresnep/ www.ph.ed.ac.uk/~td/P3lab/Analysis/ Notas baseadas nos apontamentos ‘Análise de Dados’ do Prof. Dr. Nuno Ayres de Campos

Transcript of Introdução à Análise de Dados nas medidas de grandezas físicas · • Calcule-se o valor...

Introdução à Análise de Dados nas medidas de

grandezas físicas

• www.chem.wits.ac.za/chem201/

• http://uregina.ca/~peresnep/

• www.ph.ed.ac.uk/~td/P3lab/Analysis/

• Notas baseadas nos apontamentos ‘Análise de Dados’do Prof. Dr. Nuno Ayres de Campos

PRECISÃO e EXACTIDÃOPRECISÃOPRECISÃO – Reprodutibilidade dos resultados

EXACTIDÃOEXACTIDÃO – Proximidade do valor médiorelativamente ao «verdadeiro» valor

grande precisãogrande exactidão

grande precisãopequena exactidão

pequena precisãopequena exactidão

ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO SISTEMÁTICOSSISTEMÁTICOS

• Reprodutíveis, quando se realiza a mesmaexperiência nas mesmas condições• Se detectados, podem ser corrigidos• Têm sempre o mesmo sinal algébrico

ExemplosExemplos• equipamento defeituoso (e.g., mola permanentementedeformada)• sistema de medida mal calibrado (e.g., o factor de conversão de uma tensão numa medida está errado)• esquecimento da correcção da tara de uma balança

ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO ALEATÓRIOS OU ACIDENTAISALEATÓRIOS OU ACIDENTAIS

• São diferentes (independentes) em cadarealização da experiência• Tanto podem ser positivos como negativos• Não são susceptíveis de correcção• Podem ser sujeitos a um tratamento estatístico

ExemplosExemplos• flutuações aleatórias no equipamento electrónico• erros na estimativa da divisão da escala maispróxima do valor a medir• atrasos ou antecipações na utilização de um cronómetro

Estatística de baseDada uma série de N medições (amostra) da

grandeza física x, podemos definir :

• Média da amostra:

• Desvio da leitura i:

• Desvio padrão da amostra:

• Variância da amostra:

∑=

=N

iix

Nx

1

1

xxd ii −=

( )

11

2

−=

∑=

N

xxs

N

ii

( )

11

2

2

−=

∑=

N

xxs

N

ii

Com Com frequênciafrequência, e , e devidodevido aosaos erroserros aleatóriosaleatórios inerentesinerentes, , um um conjuntoconjunto de N de N leiturasleituras dada variávelvariável x x numanuma dada dada experiênciaexperiência apresentaapresenta umauma distribuiçãodistribuição GaussianaGaussiana: :

• Calcule-se o valor médio do conjunto das N leituras

• Verifique-se se os desvios das várias leiturasrelativamente à média seguem uma distribuição de probabilidades Gaussiana (curva em forma de sinocentrada no valor médio

EmEm muitosmuitos casoscasos de de experiênciasexperiências, , osos resultadosresultadosdistribuemdistribuem--se de se de acordoacordo com com umauma curvacurva suave ideal suave ideal chamadachamada GAUSSIANA GAUSSIANA ouou CURVA DE DISTRIBUIÇÃO CURVA DE DISTRIBUIÇÃO NORMALNORMAL

Caracterizada por:

Valor Valor médiomédio –– xx

corresponde ao centroda distribuição

DesvioDesvio padrãopadrão –– ss

mede o ‘espalhamento’ da distribuição

População de dados

Para um conjunto infinito (hipotético) de dados,

N N ?? 88 x x ?? µµ e s s ?? ss

média da população desvio padrão da população

O resultado é tanto mais preciso quanto menor o desvio padrão.

No entanto… uma grande precisão nãoimplica uma grande exactidão…

Os resultados experimentais exprimem-se normalmente na forma:

média ± desvio padrão sx_

±

A incerteza associada à determinação damédia decresce com N1/

22 /2)(xe21

y sµ

ps−−=

Equação da curva Gaussiana:

ps 21

= factor de normalização

Fica garantido que a área abaixoda curva é igual a 1

Probabilidade de medir um valor num certointervalo de variação [x1, x2] = área situadaentre a curva e o segmento x1x2 .

Intervalo Percentagem de observações

µ ± 1s 68.3

µ ± 2s 95.5

µ ± 3s 99.7

O desvio padrão mede a largura da curvaGaussiana.

(quanto maior s, mais larga a curva)

No caso de uma só mediçãoexperimental

No caso da medição directa de uma grandeza física numa montagemexperimental simples, como a medição do comprimento de um objecto com uma régua, da temperatura de um gás com um termómetro, da massa de um corpo com uma balança, um só valor experimental será suficiente. Basta paraisso que os erros sistemáticos tenham sido eliminados e a leitura da escala do instrumento tenha sido feita com cuidado.

Nesse caso, o erro associado será o erro devido à precisão (finita) do instrumento. No caso da régua ou do termómetro de mercúrio, essaprecisão é limitada pelo espaçamento entre as marcas mais próximas daescala. No caso de um termómetro digital ou de uma balança, essaprecisão é fornecida com as características do instrumento.

Tipicamente, o erro da medição de um valor numa escala como a darégua ou do termómetro de mercúrio é igual a ½ da subdivisão maispequena da escala. É esse valor que se utiliza como desvio padrãoassociado ao valor medido. Como exemplo, se se mediu um comprimentode 1,003 m com uma régua que tem como subdivisão mais pequena o intervalo de 1 mm, o resultado a apresentar é 1,003 ± 0,0005 m.

Propagação de errosSuponhamos que se pretende determinar uma quantidadeZ, a partir da medida directa das grandezas A, B, C,…, com as quais se relaciona através de Z = f(A,B,C,…).

Se os erros associados a A, B, C, ... forem independentes(não houver correlação entre eles) então:• melhor estimativa para Z é :

• melhor estimativa para o erro em Z é : ,...),,( CBAfZ =

( ) ( ) ( ) ( ) ...2222 +

∂∂

+

∂∂

+

∂∂

= CA

BA

AA

Z sCZ

sBZ

sAZ

siii

2 2 2

Ajuste de uma recta a dados experimentais (regressão linear)

Ajuste de um modelo linear aos dados: ordenada

na origemdeclive resíduo

iii bxay ε++=

ei = yi - yi

y

xxi

yi

yi

bxay ii +=ˆ

valor previsto

Pressupostos de uma regressão linear

1. A relação funcional entre as variáveis x e y é linear.

2. Os erros associados à medição de x sãodesprezáveis.

3. Se fizermos várias observações de y paracada valor de x, obtemos uma distribuiçãonormal dos desvios.

y

xxi

2si

barra de erro

A probabilidade do verdadeiro valor da grandeza y para o correspondente valor xi da grandeza x estar dentro do intervalodefinido pela barra de erro é de 68%.

= y, valor previsto

e

e = erro residual= y i , valor observado

valor previsto

bxay ii +=ˆ• Os «melhores» valores para os coeficientesa e b são tais que

• Método dos Mínimos Quadrados: o critério para definir «a melhor»recta é que seja mínima a soma dos quadrados dos desvios entre osdados yi e os correspondentes pontos da recta, i,.e., yi

( )[ ]2

1∑

=

+−=N

iii baxyD

0

0

=∂∂

=∂∂

bDaD

Caso mais simples: Os desvios padrão si(yi) são todos iguais

Seja

Após alguma álgebra chegamos a

yNNiiii yyy e yx σσσσσσ ====<< )()()()()( 2211 K

( )

( )

( )

( )( )22

22

22

22

222

22

2

22

21 ∑

∑ ∑

∑ ∑∑

∑ ∑∑ ∑ ∑ ∑

∑ ∑∑ ∑ ∑

−−−

=

−=

−=

−=

−=

baxyN

xxN

N

xxN

x

xxN

yxxyxb

xxN

yxyxNa

iiy

ii

ya

ii

iyb

ii

iiiii

ii

iiii

σ

σσ

σσ

Teste diagnóstico para a regressão linearDistribuição dos resíduos no caso do modelolinear ser o mais adequado para traduzir a dependência funcional y=f(x)

x

e

0

Distribuição dos resíduos no caso de um modelo não linear traduzir melhor a dependência funcional y=f(x) (exemplos)

x

e

0

x

e

0

Algarismos significativos e arredondamentos

Um observador deve apresentar o seu resultado com o número de algarismos significativos apropriados à incerteza no valor obtido. Nãofaz sentido apresentar algarismos significativos para lá do algarismoem que se espera que ocorra o erro, como por exemplo no casox = 2,36 ± 0,1. O resultado deve antes apresentar-se x = 2,4 ± 0,1.

É prática corrente trabalhar-se com mais algarismos significativos nos cálculos intermédios e fazer os arredondamentos necessários apenas no resultado final.