Introdução à Análise de Dados nas medidas de grandezas físicas · • Calcule-se o valor...
Transcript of Introdução à Análise de Dados nas medidas de grandezas físicas · • Calcule-se o valor...
Introdução à Análise de Dados nas medidas de
grandezas físicas
• www.chem.wits.ac.za/chem201/
• http://uregina.ca/~peresnep/
• www.ph.ed.ac.uk/~td/P3lab/Analysis/
• Notas baseadas nos apontamentos ‘Análise de Dados’do Prof. Dr. Nuno Ayres de Campos
PRECISÃO e EXACTIDÃOPRECISÃOPRECISÃO – Reprodutibilidade dos resultados
EXACTIDÃOEXACTIDÃO – Proximidade do valor médiorelativamente ao «verdadeiro» valor
grande precisãogrande exactidão
grande precisãopequena exactidão
pequena precisãopequena exactidão
ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO SISTEMÁTICOSSISTEMÁTICOS
• Reprodutíveis, quando se realiza a mesmaexperiência nas mesmas condições• Se detectados, podem ser corrigidos• Têm sempre o mesmo sinal algébrico
ExemplosExemplos• equipamento defeituoso (e.g., mola permanentementedeformada)• sistema de medida mal calibrado (e.g., o factor de conversão de uma tensão numa medida está errado)• esquecimento da correcção da tara de uma balança
ERROS DE OBSERVAÇÃO ERROS DE OBSERVAÇÃO ALEATÓRIOS OU ACIDENTAISALEATÓRIOS OU ACIDENTAIS
• São diferentes (independentes) em cadarealização da experiência• Tanto podem ser positivos como negativos• Não são susceptíveis de correcção• Podem ser sujeitos a um tratamento estatístico
ExemplosExemplos• flutuações aleatórias no equipamento electrónico• erros na estimativa da divisão da escala maispróxima do valor a medir• atrasos ou antecipações na utilização de um cronómetro
Estatística de baseDada uma série de N medições (amostra) da
grandeza física x, podemos definir :
• Média da amostra:
• Desvio da leitura i:
• Desvio padrão da amostra:
• Variância da amostra:
∑=
=N
iix
Nx
1
1
xxd ii −=
( )
11
2
−
−=
∑=
N
xxs
N
ii
( )
11
2
2
−
−=
∑=
N
xxs
N
ii
Com Com frequênciafrequência, e , e devidodevido aosaos erroserros aleatóriosaleatórios inerentesinerentes, , um um conjuntoconjunto de N de N leiturasleituras dada variávelvariável x x numanuma dada dada experiênciaexperiência apresentaapresenta umauma distribuiçãodistribuição GaussianaGaussiana: :
• Calcule-se o valor médio do conjunto das N leituras
• Verifique-se se os desvios das várias leiturasrelativamente à média seguem uma distribuição de probabilidades Gaussiana (curva em forma de sinocentrada no valor médio
EmEm muitosmuitos casoscasos de de experiênciasexperiências, , osos resultadosresultadosdistribuemdistribuem--se de se de acordoacordo com com umauma curvacurva suave ideal suave ideal chamadachamada GAUSSIANA GAUSSIANA ouou CURVA DE DISTRIBUIÇÃO CURVA DE DISTRIBUIÇÃO NORMALNORMAL
Caracterizada por:
Valor Valor médiomédio –– xx
corresponde ao centroda distribuição
DesvioDesvio padrãopadrão –– ss
mede o ‘espalhamento’ da distribuição
População de dados
Para um conjunto infinito (hipotético) de dados,
N N ?? 88 x x ?? µµ e s s ?? ss
média da população desvio padrão da população
O resultado é tanto mais preciso quanto menor o desvio padrão.
No entanto… uma grande precisão nãoimplica uma grande exactidão…
Os resultados experimentais exprimem-se normalmente na forma:
média ± desvio padrão sx_
±
A incerteza associada à determinação damédia decresce com N1/
22 /2)(xe21
y sµ
ps−−=
Equação da curva Gaussiana:
ps 21
= factor de normalização
Fica garantido que a área abaixoda curva é igual a 1
Probabilidade de medir um valor num certointervalo de variação [x1, x2] = área situadaentre a curva e o segmento x1x2 .
Intervalo Percentagem de observações
µ ± 1s 68.3
µ ± 2s 95.5
µ ± 3s 99.7
O desvio padrão mede a largura da curvaGaussiana.
(quanto maior s, mais larga a curva)
No caso de uma só mediçãoexperimental
No caso da medição directa de uma grandeza física numa montagemexperimental simples, como a medição do comprimento de um objecto com uma régua, da temperatura de um gás com um termómetro, da massa de um corpo com uma balança, um só valor experimental será suficiente. Basta paraisso que os erros sistemáticos tenham sido eliminados e a leitura da escala do instrumento tenha sido feita com cuidado.
Nesse caso, o erro associado será o erro devido à precisão (finita) do instrumento. No caso da régua ou do termómetro de mercúrio, essaprecisão é limitada pelo espaçamento entre as marcas mais próximas daescala. No caso de um termómetro digital ou de uma balança, essaprecisão é fornecida com as características do instrumento.
Tipicamente, o erro da medição de um valor numa escala como a darégua ou do termómetro de mercúrio é igual a ½ da subdivisão maispequena da escala. É esse valor que se utiliza como desvio padrãoassociado ao valor medido. Como exemplo, se se mediu um comprimentode 1,003 m com uma régua que tem como subdivisão mais pequena o intervalo de 1 mm, o resultado a apresentar é 1,003 ± 0,0005 m.
Propagação de errosSuponhamos que se pretende determinar uma quantidadeZ, a partir da medida directa das grandezas A, B, C,…, com as quais se relaciona através de Z = f(A,B,C,…).
Se os erros associados a A, B, C, ... forem independentes(não houver correlação entre eles) então:• melhor estimativa para Z é :
• melhor estimativa para o erro em Z é : ,...),,( CBAfZ =
( ) ( ) ( ) ( ) ...2222 +
∂∂
+
∂∂
+
∂∂
= CA
BA
AA
Z sCZ
sBZ
sAZ
siii
2 2 2
Ajuste de uma recta a dados experimentais (regressão linear)
Ajuste de um modelo linear aos dados: ordenada
na origemdeclive resíduo
iii bxay ε++=
ei = yi - yi
y
xxi
yi
yi
bxay ii +=ˆ
valor previsto
Pressupostos de uma regressão linear
1. A relação funcional entre as variáveis x e y é linear.
2. Os erros associados à medição de x sãodesprezáveis.
3. Se fizermos várias observações de y paracada valor de x, obtemos uma distribuiçãonormal dos desvios.
y
xxi
2si
barra de erro
A probabilidade do verdadeiro valor da grandeza y para o correspondente valor xi da grandeza x estar dentro do intervalodefinido pela barra de erro é de 68%.
= y, valor previsto
e
e = erro residual= y i , valor observado
valor previsto
bxay ii +=ˆ• Os «melhores» valores para os coeficientesa e b são tais que
• Método dos Mínimos Quadrados: o critério para definir «a melhor»recta é que seja mínima a soma dos quadrados dos desvios entre osdados yi e os correspondentes pontos da recta, i,.e., yi
( )[ ]2
1∑
=
+−=N
iii baxyD
0
0
=∂∂
=∂∂
bDaD
Caso mais simples: Os desvios padrão si(yi) são todos iguais
Seja
Após alguma álgebra chegamos a
yNNiiii yyy e yx σσσσσσ ====<< )()()()()( 2211 K
( )
( )
( )
( )( )22
22
22
22
222
22
2
22
21 ∑
∑ ∑
∑ ∑∑
∑ ∑∑ ∑ ∑ ∑
∑ ∑∑ ∑ ∑
−−−
=
−=
−=
−
−=
−
−=
baxyN
xxN
N
xxN
x
xxN
yxxyxb
xxN
yxyxNa
iiy
ii
ya
ii
iyb
ii
iiiii
ii
iiii
σ
σσ
σσ
Teste diagnóstico para a regressão linearDistribuição dos resíduos no caso do modelolinear ser o mais adequado para traduzir a dependência funcional y=f(x)
x
e
0
Distribuição dos resíduos no caso de um modelo não linear traduzir melhor a dependência funcional y=f(x) (exemplos)
x
e
0
x
e
0
Algarismos significativos e arredondamentos
Um observador deve apresentar o seu resultado com o número de algarismos significativos apropriados à incerteza no valor obtido. Nãofaz sentido apresentar algarismos significativos para lá do algarismoem que se espera que ocorra o erro, como por exemplo no casox = 2,36 ± 0,1. O resultado deve antes apresentar-se x = 2,4 ± 0,1.
É prática corrente trabalhar-se com mais algarismos significativos nos cálculos intermédios e fazer os arredondamentos necessários apenas no resultado final.