5/20/2018 Slides aula coment rios.pdf
1/133
1
Instrues:
Caros Alunos, estou disponibilizando os slides e
informaes importantes sobre a nossadisciplina (vejam os slides 8 e 9). No
necessrio imprimir estes slides, entretanto
iremos precisar de computadores (lap tops) emtodos os dias do curso. Desta forma, vcs podem
acompanhar os slides no prprio computador.
Iremos precisar tambm de alguns programas
computacionais que eu irei fornecer e ajudarei
vcs na instalao durante a disciplina.
Abraos a todos e at o dia 02/07, Edenir.
5/20/2018 Slides aula coment rios.pdf
2/133
Edenir Rodrigues Pereira FilhoProfessor Adjunto
DQ-UFSCar
Contatos
e-mail: [email protected] ou [email protected] page: http://www.ufscar.br/dq-gaia
Disciplina: Tpicos Especiais -
Quimiometria
02/07/12 a 04/07/12
http://lavoisier.dq.ufscar.br/PPG-Q5/20/2018 Slides aula coment rios.pdf
3/133
3
EXPERINCIA PROFISSIONAL
2006... Professor Adjunto (DQ CCET - UFSCar)
37 cursos degraduao
So Carlos
6 cursos degraduao
Araras Sorocaba
14 cursos degraduao
31 cursos de mestrado acadmico, 2 demestrado profissional e 23 de doutorado
5/20/2018 Slides aula coment rios.pdf
4/133
4
EXPERINCIA PROFISSIONAL
(1) Espectroanlise e Preparo de Amostras e(2) Grupo de Anlise Instrumental Aplicada
Ana Rita de Arajo Nogueira (Embrapa)Edenir Rodrigues Pereira Filho
Joaquim de Arajo Nbrega
25 alunos: mestrandos, doutorandos e de iniciao cientfica
Home Page: http://www.ufscar.br/dq-gaia
5/20/2018 Slides aula coment rios.pdf
5/133
5
Grupo GAIA
5/20/2018 Slides aula coment rios.pdf
6/133
6
Tpicos
Planejamento Fatorial: Completo e
fracionrio.
Proposio de modelos de regresso com
planejamento fatorial (Composto central,
Doehlert, Box-Behnken). Exemplos
5/20/2018 Slides aula coment rios.pdf
7/1337
Anlise multivariada:
Anlise exploratria de dados (Anlise de
Componentes Principais PCA e Anlise
Hierrquica de Agrupamentos HCA)
Construo de modelos de calibrao
(Regresso por mnimos quadrados parciais
PLS e Regresso por componentes
principais PCR)
Construo de modelos de classificao
Tpicos
5/20/2018 Slides aula coment rios.pdf
8/1338
ProgramaoDia Atividade
02/07
(segundafeira)
Parte da manh:Apresentao da disciplina, tpicos que sero abordados, introduode alguns conceitos bsicos, Anlise de Componentes Principais
(PCA) e Anlise Hierrquica de Agrupamentos (HCA).
Parte da tarde:Instalao dos programas computacionais nos computadores dos
alunos e exemplo com o uso do Pirouette.
03/07
(tera feira)
Parte da manh:Reviso das atividades dadas em sala de aula. Instalao do
programa computacional Octave, uso das rotinas computacionais e
apresentao de um exemplo.
Parte da tarde:
Exerccios utilizando o Octave.04/07
(quarta
feira)
Parte da manh:Diviso da turma em cerca de 6 grupos onde cada um ter um
conjunto de dados para aplicar as ferramentas vistas em sala de aula.
Parte da tarde:Apresentao dos resultados de cada grupo, avaliao e balano final
das atividades.
5/20/2018 Slides aula coment rios.pdf
9/1339
Avaliao
Ser observado o desempenho
dos alunos durante o tratamento
dos dados (atividade do dia
04/07) e apresentao dos
resultados.
5/20/2018 Slides aula coment rios.pdf
10/13310
Quimiometria
Extrair o mximo deinformao de um conjunto dedados qumicos
Disciplina que usa mtodosmatemticos e estatsticospara planejar ou selecionar
procedimentos timos demedidas e experimentos
5/20/2018 Slides aula coment rios.pdf
11/13311
Bibliografia1 Martens, H., Naes, T., Multivariate Calibration,Chichester: John Wiley & Sons, 1989.
2 Sharaf, M., Illman, D. L., Kowalski, B. R., Chemometrics,New York: John Wiley & Sons, 1986.
3 Otto, M., Chemometrics, Weinheim: Wiley-VCH, 1999.
4 Massart, D. L., Vandeginste, B. G. M., Deming, S. M., Michotte, Y.,Kaufman, L., Chemometrics: a textbook, Amsterdam: Elsevier, 1988.
5 Kramer, R., Chemometric techniques for quantitative analysis,New York: Marcel Dekker, Inc., 1998.
6 Beebe, K. R., Pell, R. J., Seasholtz, M. B., Chemometrics a practicalguide, New York: John Wiley & Sons, 1998.
7 Breretron, R. G., Applied chemometrics for scientists,Chichester: John Wiley & Sons, 2007.
5/20/2018 Slides aula coment rios.pdf
12/13312
Sobre PCA - artigos
Geladi, P.; Kowalski, B. R..Anal. Chim. Acta, 1986, 185,1. Wold, S.; Esbensen, K.; Geladi, P.. Chemometr. Intell.
Lab., 1987, 2, 37. DelValls, T. A.; Forja, J. M.; Gonzles-Mazo, E.; Gmez-
Parra, A.; Blasco, J.. Trends Anal. Chem., 1998, 14,181.
Wise, B. M.; Gallagher, N. B.. Crit. Rev. Anal. Chem.,1998, 28, 1.
Sobre lgebra Linear - livros Boldrini, J. L.; Costa, S. I. R.; Figueiredo, V. L.; Wetzler,
H. G..lgebra Linear. Editora Harbra Ltda: So Paulo,1986.
Noble, B.; Daniel, J. W..lgebra Linear Aplicada.Editora Prentice-Hall do Brasil Ltda: Rio de Janeiro,1986.
Bibliografia
5/20/2018 Slides aula coment rios.pdf
13/13313
Revistas especializadas
Journal of Chemometrics WileyInterScience
Chemometrics and IntelligentLaboratory Systems (Chemolab)
Elsevier
Analytical Chemistry AmericanChemical Society (ACS)
Analytica Chimica Acta Elsevier
Applied Spectroscopy Society ofApplied Spectroscopy (SAS)
5/20/2018 Slides aula coment rios.pdf
14/13314
Sites interessantes
http://ull.chemistry.uakron.edu/chemometrics/
http://www.chemometrics.se/
http://laqqa.iqm.unicamp.br/
http://www.models.kvl.dk/
5/20/2018 Slides aula coment rios.pdf
15/13315
Programas computacionais
Octave (Livre)
5/20/2018 Slides aula coment rios.pdf
16/13316
Definies de quimiometriaQuimiometria uma cincia relacionada com a compreenso demedidas efetuadas em um sistema ou processo qumico com autilizao de mtodos matemticos ou estatsticos (InternationalChemometrics Society)
Quimiometria todo o processo onde os dados (tabela de
dados) so transformados em informaes que so utilizadaspara a tomada de decises (K. R. Beebe)
Quimiometria uma disciplina qumica que utiliza matemtica,estatstica e lgica para: (a) desenhar ou selecionar condies
timas de experimentao; (b) fornecer o mximo deinformao relevante pela anlise de dados qumicos; e (c)obter conhecimento sobre um sistema qumico (D. L. Massart)
Subdisciplinas similares: biometria, psicometria, econometria...
5/20/2018 Slides aula coment rios.pdf
17/13317
Processo analtico
Amostragem
Preparo da amostra
Medida analtica
Anlise do dados
Obteno de informao til
5/20/2018 Slides aula coment rios.pdf
18/13318
Estatstica descritiva
1 Mdia: o valor onde
se concentram os dados deuma distribuio
n
i
ijj xnx 1
1
2 Mediana: o valor queest no meio de umadistribuio
3 Moda: o valor quemais se repete em umadistribuio
4 Desvio padro: Estarelacionado com adisperso dos dados deuma distribuio
1
)( 21
N
xxSD
i
N
i
5/20/2018 Slides aula coment rios.pdf
19/13319
Jundia Mirim river
4715W
4700W
4645W
4630W
2300 S
2315 S
N
1013
Itupeva
8 e 9
Jundia Rio Jundia
Cidades
Pontos de amostragem
Rio Tiet
1,26
e 7Salto
Classe 2
Classe 4
Classe 3
Interpretao dos dadosexperimentais - estudo de caso
5/20/2018 Slides aula coment rios.pdf
20/13320
Mdia SD Mdia SD
1 1,70 0,11 13,6 0,9
2 1,36 0,19 8,67 0,94
3 1,62 0,15 9,06 0,71
4 1,53 0,07 9,04 1,22
5 1,49 0,26 10,1 0,56 1,40 0,22 9,06 0,66
7 0,84 0,11 9,28 1,22
8 0,84 0,05 6,93 0,44
9 0,62 0,04 5,99 0,71
10 0,08 0,01 6,54 0,4811 0,08 0,01 7,17 0,58
12 0,09 0,01 8,68 0,31
13 0,09 0,01 7,68 0,43
Cd (mg/kg) Pb (mg/kg)
Concentraes biodisponveis de Cd e Pb em sedimentos (n = 3)
LocalAmostra
Ribeiro
Pira
RioJu
ndia
5/20/2018 Slides aula coment rios.pdf
21/133
0 2 4 6 8 10 12 140,0
0,5
1,0
1,5
2,0
[Cd]m
g/kg
Amostras
Rio JundiaRibeiro Pira
5/20/2018 Slides aula coment rios.pdf
22/133
Jundia Pira0,0
0,5
1,0
1,5
2,0
[Cd]m
g/kg
Conjunto de amostras
Rio JundiaRibeiro Pira
5/20/2018 Slides aula coment rios.pdf
23/133
0 2 4 6 8 10 12 140
5
10
15
[Pb]
mg/kg
Amostras
Rio JundiaRibeiro Pira
5/20/2018 Slides aula coment rios.pdf
24/133
Jundia Pira-2
0
2
4
6
8
10
12
14
16
[Pb]mg/kg
Conjunto de amostras
Rio JundiaRibeiro Pira
5/20/2018 Slides aula coment rios.pdf
25/133
25
Jundia Mirim river
4715W
4700W
4645W
4630W
2300 S
2315 S
N
Itupeva
Jundia Rio Jundia
Cidades
Pontos de amostragem
Rio Tiet
Salto
Classe 2
Classe 4
Classe 3
Cd1,27
mg/kgPb
9,08
mg/kg
Pb
7,52mg/kg
Cd
0,09
mg/kg
5/20/2018 Slides aula coment rios.pdf
26/133
26
lgebra matricial bsicaMatriz (X): Tabela de dados com uma ou mais linhas e
uma ou mais colunas (letras em negrito maisculas: X)
Cd Cu Pb Zn
1 1,93 6,95 11,2 34,5
2 2,16 6,52 11,6 32,1
3 2,02 7,23 10,9 34,2
4 1,37 13,7 1,90 83,5
5 1,46 3,91 2,68 73,5
6 1,43 7,66 2,32 77,5
7 1,01 10,8 4,81 54,98 1,12 13,6 7,29 52,0
9 1,08 11,6 5,92 52,5
10 0,100 11,2 31,3 36,0
11 0,200 10,9 21,4 36,9
12 2,40 12,8 36,9 41,9
Metais (mg/kg)Solo
X
12:4
12 linhas e4 colunas
5/20/2018 Slides aula coment rios.pdf
27/133
27
Cd Cu Pb Zn1 1,93 6,95 11,2 34,5
2 2,16 6,52 11,6 32,1
3 2,02 7,23 10,9 34,2
4 1,37 13,7 1,90 83,5
5 1,46 3,91 2,68 73,5
6 1,43 7,66 2,32 77,57 1,01 10,8 4,81 54,9
8 1,12 13,6 7,29 52,0
9 1,08 11,6 5,92 52,5
10 0,100 11,2 31,3 36,0
11 0,200 10,9 21,4 36,9
12 2,40 12,8 36,9 41,9
Solo Metais (mg/kg)
Objetos: Amostras, compostos qumicos
Linhas da matriz
Variveis: Caractersticas medidas das amostras
(espectros, cromatogramas, propriedades fsicas,concentrao de espcies qumicas...)
Colunas da matriz
LinhaAmostra
ColunaVarivel
5/20/2018 Slides aula coment rios.pdf
28/133
28
Matriz Transposta (X
): Troca de linhas por colunas
1 2 3 4 5 6 7 8 9 10 11 12Cd 1,93 2,16 2,02 1,37 1,46 1,43 1,01 1,12 1,08 0,100 0,200 2,40
Cu 6,95 6,52 7,23 13,7 3,91 7,66 10,8 13,6 11,6 11,2 10,9 12,8Pb 11,2 11,6 10,9 1,90 2,68 2,32 4,81 7,29 5,92 31,3 21,4 36,9Zn 34,5 32,1 34,2 83,5 73,5 77,5 54,9 52,0 52,5 36,0 36,9 41,9
SolosMetais (mg/kg)
X
4:12
4 linhas e 12 colunas
V t ( ) M t i t li h l
5/20/2018 Slides aula coment rios.pdf
29/133
29
Vetor (x): Matriz com somente uma linha ou coluna
1,461,372,022,161,93x
1,46
1,37
2,02
2,16
1,93
x'
1 2 3 4 5Cd 1,93 2,16 2,02 1,37 1,46
Metais (mg/kg) Solos
i li d d d
5/20/2018 Slides aula coment rios.pdf
30/133
30
Visualizao dos dados
0 1 2 30
5
10
15
12
3
4
5
6
7
8
91011
12
Cu(mg/kg)
Cd (mg/kg)0 1 2 3
0
5
10
15
20
25
30
35
40
1 23
456
7
89
10
11
12
Pb(mg/kg)
Cd (mg/kg)
0 1 2 30
15
30
45
60
75
90
123
4
56
789
101112
Zn(mg/k
g)
Cd (mg/kg)0 1 2 30
5
10
15
12
3
4
5
6
7
8
91011
12
Pb(mg/k
g)
Cu (mg/kg)
i li d d d
5/20/2018 Slides aula coment rios.pdf
31/133
31
1 2 3 4 5 6 7 8 9 10 11 120
30
60
90
Concentrao(mg/kg)
Solo
Cd CuPb Zn
Visualizao dos dados
Vi li d d d
5/20/2018 Slides aula coment rios.pdf
32/133
32
0,84 1,02 1,2 1,38 ... 40,44 40,62 40,8 40,92C1R1 0,002 0,003 0,003 0,003 ... 0,000 0,000 0,000 0,001
C1R2 0,004 0,005 0,006 0,005 ... 0,001 0,001 0,001 0,001C1R3 0,003 0,004 0,004 0,004 ... 0,001 0,001 0,001 0,000C2R1 0,002 0,003 0,002 0,003 ... 0,000 0,000 0,000 0,001C2R2 0,002 0,003 0,002 0,003 ... 0,000 0,000 0,000 0,000C2R3 0,002 0,003 0,003 0,004 ... 0,001 0,000 0,000 0,000
Variveis - Espectro de XRF (Energia keV) com n = 224Amostras (n = 6)
Visualizao dos dadosForma de uma matriz
Forma de um espectro
0 6 12 18 24 30 36 42
0,000
0,030
0,060
0,090
0,120
0,150
0,180
Contage
ns/segundos
Energia (keV)
5/20/2018 Slides aula coment rios.pdf
33/133
33
lgebra matricial bsicaAdio de dois vetores de mesmo tamanho:
nn ba
baba
ba
.
.
.
22
11
Adio de dois vetores de mesmo tamanho comutativa e associativa:
)()( cbacba
abba
5/20/2018 Slides aula coment rios.pdf
34/133
34
Multiplicao por um escalar:
nn ka
ka
ka
a
a
a
kak
.
.
.
.
.
.
2
1
2
1
Tamanho de um vetor (ou norma de um vetor):
222
21 ... naaaa
5/20/2018 Slides aula coment rios.pdf
35/133
35
Produto escalar de dois vetores coluna:
iiN
inn
n
n
T babababa
b
b
b
aaaba1
2211
2
1
21 ...
.
.
....
Matriz: A(dimenso mxn)
amnamam
naaa
naaa
A
...21
.
.
.
.
.
.
2...2221
1...1211
Multiplicao de Matrizes: A (mxp) e B (pxn) produz
5/20/2018 Slides aula coment rios.pdf
36/133
36
Multiplicao de Matrizes: A(mxp) e B (pxn), produzuma matriz C (mxn)
)32(
425
312
A
A
)43(
5423
12311132
B
B
)42(
27252924
18161514)33()11()22(
C
C
5/20/2018 Slides aula coment rios.pdf
37/133
37
Anlise de dados multivariados
Definio do problema
Organizao dos dados
Validao dos dados
Visualizao dos dados originais
Transformao/Pr-processamento
dos dados
Anlise exploratria dos dados
5/20/2018 Slides aula coment rios.pdf
38/133
38
Anlise de dados multivariados
Construo de modelos
Calibrao/ClassificaoValidao dos modelos
Previses
5/20/2018 Slides aula coment rios.pdf
39/133
39
Definio do problemaQual ou quais informaes devero ser
extradas do problema (sistema) em questo?
Tempo
Definir oproblema a
serresolvido
Tcnicas
experimentais emtodos
Escolhacorreta daferramenta
analtica
Coleta de
informaes
Garantia deque as
informaesdesejadas
foramcoletadas
5/20/2018 Slides aula coment rios.pdf
40/133
40
Fatores a serem consideradosOrigem do problema:
Como os dados foram gerados;Que tcnicas analticas foram utilizadas;
O nvel de exatido relacionado a cada
varivel;Quando os dados foram coletados
J foi efetuada uma anlise anterior;
Existem informaes anteriores que sejampertinentes;
...
5/20/2018 Slides aula coment rios.pdf
41/133
41
Colocar osdados emum nicoarquivo
Organizao dos dados
Os dados sode um nicoinstrumento?
H mais deum
instrumentoou tipo?
Qual apreciso dos
mtodos?
H dadosfaltantes?
Complete ouexclua linhasou colunascom dadosfaltantes
5/20/2018 Slides aula coment rios.pdf
42/133
42
Quais dados podem ser estudados?
Variveis:
Instrumento multicanal: espectros
Instrumentao de separao:
cromatogramasDeterminaes mltiplas de instrumentosespecficos: testes fsicos, qumicos ebiolgicos.
Resposta de anlise sensorial
...
5/20/2018 Slides aula coment rios.pdf
43/133
43
Exemplo 1
1 2 3 4 5 6 7 8 9 10 11Nmero Ordem ID Creat. Fof. Alc. Asp. Ala. Bil. Bil2 Bil3 Glut. Bilia Hip. Cresol
1 1 GN 1,07 36,51 14,60 18,00 0,68 0,13 0,55 25,30 7,50 2,02 0,422 2 LMF 1,78 32,85 24,50 21,20 0,78 0,24 0,54 28,70 7,33 0,59 0,12
3 3 RCN 0,95 57,19 15,00 16,40 0,98 0,40 0,58 24,00 6,03 0,05 0,054 4 GAM 1,94 47,91 21,60 10,20 0,53 0,17 0,36 31,90 4,89 1,02 0,315 5 DM 1,56 31,18 11,00 11,70 0,55 0,22 0,33 16,00 1,80 0,54 0,14... ... ... ... ... ... ... ... ... ... ... ... ... ...
104 53 OPD 1,57 44,39 21,40 31,60 0,52 0,20 0,32 49,20 17,44 0,15 0,00105 55 MS 0,82 34,83 19,40 36,40 0,41 0,16 0,25 31,70 4,17 0,57 0,00106 56 MAS 1,02 38,06 10,90 15,40 0,56 0,21 0,35 36,80 2,08 0,32 0,00107 57 DB 1,24 25,03 9,40 16,90 0,51 0,17 0,34 31,40 7,55 0,07 0,00108 58 HSC 2,27 54,58 17,40 40,10 0,62 0,19 0,43 52,30 14,84 1,60 0,00
Identificao
Investigao de alguns parmetros clnicos em
funileiros (Matriz: 108 x 11)
5/20/2018 Slides aula coment rios.pdf
44/133
44
Exemplo 1
Classes: caractersticas dos indivduos
Nmero Ordem ID Idade Funilaria EPI Tempo lcool Cigarro Ac. Bem.1 1 GN 2 1 1 3 1 0 02 2 LMF 1 1 1 2 3 3 03 3 RCN 0 1 1 0 0 0 1
4 4 GAM 0 1 1 1 4 3 15 5 DM 1 1 0 2 0 2 0... ... ... ... ... ... ... ... ... ...
104 53 OPD 2 0 - - 2 0 1105 55 MS 3 0 - - 0 0 1106 56 MAS 3 0 - - 0 0 1107 57 DB 0 0 - - 1 0 1108 58 HSC 2 0 - - 0 0 0
ClassesIdentificao
5/20/2018 Slides aula coment rios.pdf
45/133
45
Exemplo 1 - ClassesIdade: 20 a 30 = 0; 31 a 40 = 1; 41 a 50 = 2; > 51 = 3
Funilaria: No = 0; Sim = 1EPI: No = 0; Sim = 1
Tempo: 1 a 100 meses = 0; 101 a 200 = 1; 201 a 300 = 2;
301 a 400 = 3 e > 400 = 4
lcool: 0 a 30 g/dia = 0; 31 a 60 = 1; 61 a 90 = 2; 91 a 120
= 3 e > 120 = 4
Cigarro: 0 a 5 cigarros/dia = 0; 6 a 10 = 1; 11 a 15 = 2 e >
15 = 3
c. Benzico: No = 0; Sim = 1
l
5/20/2018 Slides aula coment rios.pdf
46/133
46
Exemplo 2Anlise sensorial de amostras de sucos(Matriz: 120 x 4)
D S A a
1 4 0 0 0
2 3 2 0 0
... ... ... ... ...
23 8 3 6 9
24 9 4 6 10
25 0 0 0 0
26 1 0 8 7
... ... ... ... ...
47 8 2 8 7
48 9 2 10 8
49 0 0 0 0
50 0 0 0 0
... ... ... ... ...
71 9 4 8 5
72 10 7 10 6
73 0 0 0 074 2 0 0 0
... ... ... ... ...
95 10 2 6 0
96 10 2 7 6
97 0 0 0 0
98 2 0 0 0
... ... ... ... ...
119 8 0 9 6120 9 3 10 7
Provadores Classe
Manga
Tangerina
Variveis
Pssego
Maracuj
Laranja
l 3
5/20/2018 Slides aula coment rios.pdf
47/133
47
Exemplo 3
4 5 6 7 8 9
0
2
4
6
Cu (K)
Ni (K)
Fe (K)Cr (K)
Cr (K)
V (K)
C
ontagens/seg
undo
Energia (keV)
Ti (K)
Anlise tubos atomizadores metlicos (espectros defluorescncia de raios-X XRF): Matriz: 128 x 501
Vi li d d d
5/20/2018 Slides aula coment rios.pdf
48/133
48
Visualizao dos dados
350 400 450 500 550
0,000
0,300
0,600
0,900
1,200
Absorbnc
ia
Comprimento de onda (nm)
Corantes alimentcios de amarelo tartrazina e amarelocrepsculo (matriz: 54 x 1001)
C l t i i
5/20/2018 Slides aula coment rios.pdf
49/133
49
0,000 0,050 0,100 0,150 0,200 0,250 0,300
0,000
0,100
0,200
0,300
0,400
Absorbncia
em3
60nm
Absorbncia em 350 nm
y = -0,00111 + 1,406x
r = 0,9991
Correlao entre as variveis
C l t i i
5/20/2018 Slides aula coment rios.pdf
50/133
50
0,000 0,200 0,400 0,600 0,800 1,000
0,000
0,300
0,600
0,900
1,200y = -0,0698 + 1,068x
r = 0,9444
Absorbncia
em4
50nm
Absorbncia em 400 nm
Correlao entre as variveis
Vi li d d d
5/20/2018 Slides aula coment rios.pdf
51/133
51
K Mg Ca Zn Fe Mn1 21531 2620 3709 18 78 127
2 20646 1818 4357 17 345 127
3 20298 2131 4243 19 280 98
4 14476 1291 3144 12 197 72
5 24311 3117 5599 24 161 706 22519 2712 7500 25 1000 70
7 6630,9 523,3 3125 9 60 72
8 29585 3856 6931 62 540 118
9 9317,7 773,7 1034 7 60 53
10 8431,8 869,9 3069 10 155 11111 14848 3237 7348 23 175 330
12 9752,9 2776 9717 21 207 82
13 11193 2250 9692 14 239 101
14 19966 1872 3832 17 366 149
15 13053 2281 4767 22 293 1258
Metais (mg/kg)
Chs
Visualizao dos dadosConcentrao de alguns metais em chs (matriz: 15 x 6)
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
52/133
52
Correlao entre as variveis
5000 10000 15000 20000 25000 30000
500
1000
1500
2000
2500
3000
3500
4000
Mg
K
5000 10000 15000 20000 25000 30000
0
2000
4000
6000
8000
10000
Ca
K
500 1000 1500 2000 2500 3000 3500 4000
0
2000
4000
6000
8000
10000
Ca
Mg
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
53/133
53
Correlao entre as variveis
5000 10000 15000 20000 25000 30000
0
200
400
600
800
1000
Fe
K
5000 10000 15000 20000 25000 30000
0
10
20
30
40
50
60
70
Zn
K
500 1000 1500 2000 2500 3000 3500 4000
0
10
20
30
40
50
60
70
Zn
Mg
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
54/133
54
Correlao entre as variveis
5000 10000 15000 20000 25000 30000
0
200
400
600
800
1000
1200
1400
Mn
K
500 1000 1500 2000 2500 3000 3500 4000
0
200
400
600
800
1000
Fe
Mg
0 2000 4000 6000 8000 10000
0
10
20
30
40
50
60
70
Zn
Ca
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
55/133
55
Correlao entre as variveis
500 1000 1500 2000 2500 3000 3500 4000
0
200
400
600
800
1000
1200
1400
Mn
Mg
0 2000 4000 6000 8000 10000
0
200
400
600
800
1000
Fe
Ca
0 2000 4000 6000 8000 10000
0
200
400
600
800
1000
1200
1400
Mn
Ca
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
56/133
56
Correlao entre as variveis
0 10 20 30 40 50 60 70
0
200
400
600
800
1000
Fe
Zn
0 10 20 30 40 50 60 70
0
200
400
600
800
1000
1200
1400
Mn
Zn
0 200 400 600 800 1000
0
200
400
600
800
1000
1200
1400
Mn
Fe
Correlao entre as variveis
5/20/2018 Slides aula coment rios.pdf
57/133
57
Mg 0,6995
Ca 0,1480 0,6925Zn 0,7270 0,7920 0,4209Fe 0,5370 0,4106 0,3855 0,4893Mn -0,1166 0,1211 0,0016 0,0767 0,0006
K Mg Ca Zn Fe
Correlao entre as variveis
5000 10000 15000 20000 25000 300000
10
20
30
40
50
60
70
K (mg/kg)
Zn(mg/kg
)
Pr tratamento dos dados
5/20/2018 Slides aula coment rios.pdf
58/133
58
Pr-tratamento dos dadosRemoo de fontes de variao indesejveis: utilizarecursos matemticos
Transformao
Aplicado s amostras(linhas da matriz X)
Pr-processamentoAplicado s variveis(colunas da matriz X)
Transformao dos dados
Sinal Analtico = Sinal Verdadeiro + Rudo aleatrio
Transformao dos dados
5/20/2018 Slides aula coment rios.pdf
59/133
59
Transformao dos dados
Aplicao de tcnicas matemticas s amostras visando a
remoo de variaes aleatrias ou sistemticasindesejveis que podem informaes relevantes.
Variaes aleatrias(rudo experimental)
Tratadas por meio detcnicas de alisamento
(smoothing)
Variaes sistemticasReduzidas ou eliminadaspor meio de correes
da linha de base
Tcnicas de alisamento
5/20/2018 Slides aula coment rios.pdf
60/133
60
Tcnicas de alisamentoAumentar a razo sinal-rudo;
Utilizam uma janela;Todos os pontos da janela so usados para determinara resposta no centro da mesma;
Esta janela percorre todo o espectro.
1 Alisamento pela mdia
Utilizado para diminuir o nmero de variveis (J).
Seleciona-se uma janela de abertura = n+1, com n par.Calcula-se a mdia das respostas, que ser a primeiravarivel do espectro alisado. O comprimento de ondaser igual ao do centro da janela.
1 Alisamento pela mdia
5/20/2018 Slides aula coment rios.pdf
61/133
61
p
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
Matriz 1 x 3420
1 2 3 4 5 6 7 8 9 10 110,000 0,017 0,033 0,050 0,067 0,083 0,100 0,117 0,133 0,150 0,1670,001 -0,001 -0,003 -0,001 0,010 -0,003 0,000 -0,003 0,002 -0,004 -0,001
Alisamento com uma janela de abertura
de n + 1 = 11 (onde n = 10)
1 Alisamento pela mdia
5/20/2018 Slides aula coment rios.pdf
62/133
62
p
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
Original
Matriz 1 x 3420
Janela n + 1 = 11
Matriz 1 x 311
Janela n + 1 = 31
Matriz 1 x 110
Janela n + 1 = 61
Matriz 1 x 56
2 Alisamento pela mdia mvel
5/20/2018 Slides aula coment rios.pdf
63/133
63
p
A janela movimentada de elemento em elemento. Osdados so alisados contm basicamente o mesmo
nmero de variveis que o original.
1 2 3 ... 58 59 60 61 62 63Tempo 0,000 0,017 0,033 ... 0,950 0,967 0,984 1,000 1,017 1,034
Abs 0,001 -0,001 -0,003 ... 0,001 0,000 -0,001 -0,003 0,003 -0,003
1 a 602 a 61
3 a 624 a 63
0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)0 10 20 30 40 50 60
0,000
0,040
0,080
0,120
Absorbncia
Tempo (s)
Original
Matriz 1 x 3420
Alisado
Matriz 1 x 3420
Correes da linha de base
5/20/2018 Slides aula coment rios.pdf
64/133
64
Correes da linha de base
Espectro noinfravermelho
Primeira derivada
400 1000 1600 2200 2800 3400 40000,560
0,600
0,640
0,680
Absorbncia
Nmero de onda (cm)
400 1000 1600 2200 2800 3400 4000-0,0008
-0,0004
0,0000
0,0004
0,0008
Primeirade
rivada
Nmero de onda (cm)
Pr-processamento C l
5/20/2018 Slides aula coment rios.pdf
65/133
65
Pr processamento
Linhas
Colunas
Dias antes Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.do vencimento (mg/100g)(mg/100g) % % % % %
M1 papel 21 a 90 dias 298 7,3 6,86 1,07 10,78 0,32 80,96
M2 papel > 91 dias 258 9,3 6,34 1,06 11,36 0,37 80,86M3 papel 21 a 90 dias 339 10,9 6,42 0,97 11,16 0,31 81,13M4 papel 21 a 90 dias 272 8,7 6,43 0,83 9,72 0,27 82,74M5 papel 21 a 90 dias 307 9,3 6,60 0,73 11,64 0,29 80,73M6 papel > 91 dias 340 6,6 6,65 2,50 11,69 0,47 78,69M7 papel 21 a 90 dias 289 8,4 6,70 2,58 11,95 0,68 78,08M8 papel > 91 dias 488 7,1 6,77 3,08 11,95 0,75 77,45M9 papel 21 a 90 dias 306 7,7 6,77 2,81 11,87 0,64 77,91M10 papel > 91 dias 322 7,0 6,60 3,23 11,71 0,80 77,65M11 papel < 20 dias 285 8,3 6,16 2,50 11,72 0,53 79,78
M12 papel < 20 dias 325 7,5 6,16 2,58 11,71 0,42 80,27M13 papel > 91 dias 313 9,1 6,78 3,08 12,20 0,43 78,63M14 papel 21 a 90 dias 317 7,6 6,95 2,81 11,81 0,41 79,25M15 papel > 91 dias 398 8,3 6,69 3,23 12,16 0,35 82,16T1 plastico < 20 dias 183 7,6 10,35 1,21 12,94 0,63 74,28T2 Papel < 20 dias 176 7,1 9,92 1,17 12,99 0,61 75,31T3 Papel < 20 dias 206 7,2 10,27 1,29 13,22 0,59 74,64T4 Papel < 20 dias 75 4,4 10,27 1,49 12,58 0,62 75,04T5 Papel < 20 dias 118 6,8 10,32 1,43 13,23 0,62 74,39T6 Papel < 20 dias 207 8,8 10,86 1,21 11,05 0,59 76,29T7 Papel < 20 dias 189 7,6 10,25 1,17 11,69 0,66 76,22T8 Papel 21 a 90 dias 223 8,0 10,25 1,29 12,54 0,43 75,49T9 Papel < 20 dias 180 7,1 10,44 1,18 12,46 0,59 75,33T10 Papel < 20 dias 174 8,7 10,39 1,17 12,34 0,61 75,49T11 Papel < 20 dias 107 6,3 11,38 1,49 12,72 0,55 73,86T12 Papel < 20 dias 97 5,6 10,45 1,48 12,66 0,55 74,85T13 Papel 21 a 90 dias 152 7,4 10,53 1,45 12,57 0,60 74,85T14 Papel 21 a 90 dias 141 7,8 10,09 1,58 11,82 0,64 75,87T15 Papel 21 a 90 dias 140 8,7 10,49 1,15 12,65 0,51 75,20
Amostras
Classes VariveisID Emb.
Visualizao dos dados
5/20/2018 Slides aula coment rios.pdf
66/133
66
Visualizao dos dados
M2 M4 M6 M8 M10 M12 M14 T1 T3 T5 T7 T9 T11 T13 T15
0
250
500
Valores
Amostras
AFFe
Prot.Lip.Um.Cin.Carb.
Questes
5/20/2018 Slides aula coment rios.pdf
67/133
67
Questes
Como todas as variveis se comportam?
O que mais influencia determinada amostra?
O que caracteriza um determinado grupo de amostras?
?4 6 8 10 12
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
M1
M2
M3M4
M5
M6
M7
M8
M9
M10
M11
M12 M13M14
M15
T1T2T3
T4 T5T6
T7
T8
T9 T10
T11T12
T13T14
T15Cinzas
Fe
Dados originais
5/20/2018 Slides aula coment rios.pdf
68/133
68
Dados originais
AF Fe Prot. Lip. Um. Cin. Carb.
0
100
200
300
400
500
Valoressemp
r-p
rocessamento
Variveis
Mdia
Mediana
Mdia + SD
Mdia - SD
95% dos dados
> valor
< valor
95% dos dados
Dados centrados na mdia
5/20/2018 Slides aula coment rios.pdf
69/133
69
Dados centrados na mdia
AF Fe Prot. Lip. Um. Cin. Carb.-200
-100
0
100
200
300
Valo
rescentradosnamdia
Variveis
Dados autoescalados
5/20/2018 Slides aula coment rios.pdf
70/133
70
Dados autoescalados
AF Fe Prot. Lip. Um. Cin. Carb.-4
-3
-2
-1
0
1
2
3
Valoresautoe
scalados
Variveis
Tipos de pr-processamento
5/20/2018 Slides aula coment rios.pdf
71/133
71
Tipos de pr processamentoCentrado na mdiaaplicado em
espectros
n
i
ijj xn
x1
1
jijcmij
xxx )(
Mdia da varivel j ( )jx
Varivel j centrada na mdia ( ))(cmijx
Dados centrados na mdia
5/20/2018 Slides aula coment rios.pdf
72/133
72
Dados centrados na mdia
350 400 450 500 550
0,000
0,200
0,400
0,600
0,800
1,000Amarelo Tartrazina
Abs
Comprimento de onda (nm)
350 400 450 500 550-0,600
-0,300
0,000
0,300
0,600
Valorescentradosnamdia
Comprimento de onda (nm)
Espectros (Vis) de Amarelo Tartrazina (Corante alimentcio)
Espectros originais Espectros centrado na mdia
Exemplo centrados na mdia
5/20/2018 Slides aula coment rios.pdf
73/133
73
Exemplo centrados na mdia
400 401 402 403 404 405
AmT1 0,139 0,139 0,140 0,141 0,142 0,144AmT2 0,236 0,237 0,238 0,241 0,243 0,245AmT3 0,352 0,354 0,357 0,360 0,364 0,367AmT4 0,481 0,485 0,488 0,493 0,498 0,503AmT5 0,603 0,608 0,613 0,619 0,625 0,630
Mdia 0,362 0,365 0,367 0,371 0,374 0,378
400 401 402 403 404 405AmT1 -0,223 -0,225 -0,228 -0,230 -0,232 -0,234
AmT2 -0,126 -0,127 -0,129 -0,130 -0,131 -0,132AmT3 -0,010 -0,010 -0,011 -0,011 -0,011 -0,011AmT4 0,119 0,120 0,121 0,123 0,124 0,125AmT5 0,241 0,243 0,246 0,248 0,250 0,252Mdia 0,000 0,000 0,000 0,000 0,000 0,000
Dados originais
Dados centrados na mdia
Tipos de pr-processamento
5/20/2018 Slides aula coment rios.pdf
74/133
74
Autoescalamentoaplicado quando se quer
dar a mesma importncia a todas as variveis(dados de concentrao)
Tipos de pr processamento
n
i
jijj xxn
s1
22 )(1
1
Varincia da varivel j ( )2
js
Dados autoescalados
5/20/2018 Slides aula coment rios.pdf
75/133
75
Dados autoescalados
2
jj ss
Desvio padro da varivel j ( )
j
jij
asijsxxx )(
js
Varivel j autoescalada ( ))(asijx
Exemplo autoescalados
5/20/2018 Slides aula coment rios.pdf
76/133
76
Exemplo autoescalados
Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.
(m
g/100g) (mg/100g) % % % % %
Am1 298 7,3 6,86 1,07 10,8 0,32 81,0Am2 258 9,3 6,34 1,06 11,4 0,37 80,9Am3 339 10,9 6,42 0,97 11,2 0,31 81,1Am4 272 8,7 6,43 0,83 9,7 0,27 82,7Am5 307 9,3 6,60 0,73 11,6 0,29 80,7Mdia 294 9,1 6,53 0,93 10,9 0,31 81,3
Varincia 1001 1,7 0,04 0,02 0,6 0,00 0,7Desvio padro 31,6 1,3 0,21 0,15 0,7 0,04 0,8
Ac. Fol. Fe Prot. Lip. Um. Cin. Carb.Am1 0,10 -1,38 1,59 0,93 -0,20 0,16 -0,39Am2 -1,17 0,15 -0,93 0,86 0,57 1,56 -0,51
Am3 1,40 1,41 -0,52 0,26 0,31 -0,02 -0,19Am4 -0,72 -0,31 -0,48 -0,69 -1,63 -1,09 1,76Am5 0,39 0,12 0,34 -1,36 0,95 -0,60 -0,67Mdia 0,00 0,00 0,00 0,00 0,00 0,00 0,00
Varincia 1,00 1,00 1,00 1,00 1,00 1,00 1,00Desvio padro 1,00 1,00 1,00 1,00 1,00 1,00 1,00
Dados originais
Dados autoescalados
Pr-processamento - Detalhes
5/20/2018 Slides aula coment rios.pdf
77/133
77
Pr processamento Detalhes
Escolha do pr-tratamento dos dados: essencial
para o xito de qualquer anlise.
Deteco de amostras anmalas (outliers): Estes
pr-tratamentos permitem a identificao de amostrasoutliers.
Modelos de calibrao: Centrar os dados na mdia
Medidas de espectroscopia: Possuem alta correlao
entre as variveis (centradas na mdia).
Reflexes
5/20/2018 Slides aula coment rios.pdf
78/133
78
Que tipo de pr-processamento deve ser aplicado
em espectros de massa?
Que tipo de pr-processamento deve ser aplicado
para dados cromatogrficos obtidos com uma arranjo
de diodos?
Anlise exploratria dos dados
5/20/2018 Slides aula coment rios.pdf
79/133
79
Anlise exploratria dos dados
Permite extrair o mximo de informao de um
conjunto de dados.
Tcnicas:
Anlise de Componentes Principais
(PCA, Principal Component Analysis)
Anlise de Agrupamentos Hierrquicos
(HCA, Hierarchical Cluster Analysis)
PCA
5/20/2018 Slides aula coment rios.pdf
80/133
80
PCAA Anlise de Componentes Principais
uma ferramenta quimiomtrica quereduz as dimenses originais de umdeterminado conjunto de dadosnumricos.
Fundamentao da PCA
5/20/2018 Slides aula coment rios.pdf
81/133
81
Varivel 1
Varivel 2
PC1
PC2 PC3
Componentes Principais (PC)
5/20/2018 Slides aula coment rios.pdf
82/133
82
Componentes Principais (PC)
Os novos eixos (PC) so ortogonais
entre si (completamente nocorrelacionados)
So construdos em ordemdecrescente da quantidade devarincia que descrevem (primeirofator descreve maior varincia nos
dados que o segundo...)
Determinao da dimensionalidadeintrnseca do conjunto de dados
Componentes Principais (PC)
5/20/2018 Slides aula coment rios.pdf
83/133
83
Co po e es c pa s ( C)
PC: Nmero menor que as
variveis originais (Reduo devariveis)
Direo que melhor explica osdados: 1PC
Base da PCA: Calcular autovalorese autovetores de uma matriz de
varincia-covarincia
Posto de matriz, autovalores e
5/20/2018 Slides aula coment rios.pdf
84/133
84
autovetoresPosto de uma matriz
Nmero de linhas ou colunas linearmenteindependentes.
Autovalores e Autovetores Clculo de sub-sistemas muito menores para
dados que apresentam muitas variveis(dimenses)
A = x Autovetor
AutovalorVarincia e Covarincia
5/20/2018 Slides aula coment rios.pdf
85/133
85
AF Fe AF Fe
297,7 7,3 0,6 -0,4257,5 9,3 0,2 1,3
338,7 10,9 1,0 2,6
271,6 8,7 0,3 0,8
306,7 9,3 0,7 1,2
... ... ... ...
107,5 6,3 -1,4 -1,2
97,0 5,6 -1,5 -1,7
151,7 7,4 -0,9 -0,3
141,2 7,8 -1,0 0,0139,9 8,7 -1,0 0,8
Mdia 241 8 0 0
SD 98 1 1 1
Variveis Auto. Varincia (s2):
Espalhamento dos dados aoredor do seu valor mdiopara uma nica varivel
Covarincia (Cov):Distribuio dos dados
multivariados e suasrelaes
onde
1
2
2
n
xds )( xxxd i
1
)()(
n
FexxAFxxCOV
ii
Clculos
5/20/2018 Slides aula coment rios.pdf
86/133
86
AF Fe AF Fe
297,7 7,3 0,6 -0,4 0,6 -0,4 -0,2257,5 9,3 0,2 1,3 0,2 1,3 0,2338,7 10,9 1,0 2,6 1,0 2,6 2,6271,6 8,7 0,3 0,8 0,3 0,8 0,2306,7 9,3 0,7 1,2 0,7 1,2 0,8
...
...
...
...
...
...
...
107,5 6,3 -1,4 -1,2 -1,4 -1,2 1,697,0 5,6 -1,5 -1,7 -1,5 -1,7 2,5
151,7 7,4 -0,9 -0,3 -0,9 -0,3 0,3141,2 7,8 -1,0 0,0 -1,0 0,0 -0,1139,9 8,7 -1,0 0,8 -1,0 0,8 -0,8
Mdia 241 8 0 0 Soma 11,8SD 98 1 1 1
1 1
Variveis Auto.
Varincia (s2)
AFxxi Fexxi ))(( FexxAFxx ii
Matriz varincia e covarincia
5/20/2018 Slides aula coment rios.pdf
87/133
87
COV = 11,829 = 0,4
AF Fe
AF 1,0 0,4Fe 0,4 1,0COVAFFe
Matriz varincia e covarincia
5/20/2018 Slides aula coment rios.pdf
88/133
88
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
S2
Fe
S2AF
Graficamente
Cov AFFe
Cov FeAF
Matriz varincia e covarincia
5/20/2018 Slides aula coment rios.pdf
89/133
89
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4S2
Fe
S2AF
Projeo de umaelipse
eAutovalores
5/20/2018 Slides aula coment rios.pdf
90/133
90
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,40,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4S2
Fe
S2AF
PC1
PC2 Autovalorda PC1Autovalor
da PC2
Autovetores
5/20/2018 Slides aula coment rios.pdf
91/133
91
0,0 0,2 0,4 0,6 0,8 1,00,0
0,2
0,4
0,6
0,8
1,0
0,86
0,92
Sen = 0,921,26
= 0,73
Cos =0,86
1,26= 0,68
Sen = 0,68Cos = -0,73
PC2
PC1
Varincia explicada
5/20/2018 Slides aula coment rios.pdf
92/133
92
1,26
0,
65
PC2
PC1
Varincia PC1 =1,26
1,26 + 0,65x 100 = 66%
Varincia PC2 =0,65
1,26 + 0,65x 100 = 34%
Matriz de Scores
5/20/2018 Slides aula coment rios.pdf
93/133
93
PC1 = 0,68AFi+ 0,73Fei
PC2 = -0,73AFi+ 0,68Fei
PC1 = Cos AFi+ Sen Fei
PC2 = Cos AFi+ Sen Fei
AF Fe PC1 PC20,6 -0,4 0,1 -0,7
0,2 1,3 1,0 0,7
1,0 2,6 2,6 1,0
0,3 0,8 0,8 0,30,7 1,2 1,4 0,4
...
...
...
...
-1,4 -1,2 -1,8 0,2
-1,5 -1,7 -2,3 -0,1-0,9 -0,3 -0,8 0,5
-1,0 0,0 -0,7 0,8
-1,0 0,8 -0,1 1,3
ScoresAuto.
Matriz de Loadings (Pesos)
5/20/2018 Slides aula coment rios.pdf
94/133
94
PC1 PC2
AF 0,68 0,73Fe -0,73 0,68
Matriz de Scores: 30 linhas(amostras) e 2 colunas (PC1 ePC2)
Matriz de Loadings: 2 linhas(variveis AF e Fe) e 2 colunas(PC1 e PC2)
Visualizao dos dados - Scores
5/20/2018 Slides aula coment rios.pdf
95/133
95
-4 -3 -2 -1 0 1 2 3-2,5
-2,0
-1,5
-1,0-0,5
0,0
0,5
1,0
1,5
M1
M2
M3
M4 M5
M6
M7
M8
M9
M10
M11
M12
M13
M14M15
T1T2
T3
T4
T5
T6
T7 T8T9
T10
T11
T12
T13T14
T15Scores
PC2(3
4%)
PC1 (66%)
Visualizao dos dados - Loadings
5/20/2018 Slides aula coment rios.pdf
96/133
96
-0,80 -0,60 -0,40 -0,20 0,00 0,20 0,40 0,60 0,800,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
AF
Fe
Loadings
PC2(34%)
PC1 (66%)
Scores e Loadings
5/20/2018 Slides aula coment rios.pdf
97/133
97
-4 -3 -2 -1 0 1 2 3-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
M1
M2
M3
M4M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
T1
T2
T3
T4
T5
T6
T7 T8T9
T10
T11
T12
T13
T14
T15Scores
PC2(3
4%)
PC1 (66%)
-0,80 -0,40 0,00 0,40 0,800,67
0,68
0,69
0,70
0,71
0,72
0,73
0,74
AF
Fe
Loadings
PC2
(34%)
PC1 (66%)
g
Dados originaisID AF Fe
5/20/2018 Slides aula coment rios.pdf
98/133
98
ID AF Fe
M1 298 7,3
M2 258 9,3
M3 339 10,9
M4 272 8,7
M5 307 9,3M6 340 6,6
M7 289 8,4
M8 488 7,1
M9 306 7,7
M10 322 7,0
M11 285 8,3
M12 325 7,5
M13 313 9,1
M14 317 7,6
M15 398 8,3
T1 183 7,6
T2 176 7,1
T3 206 7,2
T4 75 4,4
T5 118 6,8
T6 207 8,8
T7 189 7,6T8 223 8,0
T9 180 7,1
T10 174 8,7
T11 107 6,3
T12 97 5,6
T13 152 7,4
T14 141 7,8
T15 140 8,7
Amostras
-4 -3 -2 -1 0 1 2 3-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
M1
M2
M3
M4M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
T1
T2
T3
T4
T5
T6
T7 T8T9
T10
T11
T12
T13
T14
T15Scores
PC2(34%)
PC1 (66%)
AF
Fe
> AF
< AF
Representao
5/20/2018 Slides aula coment rios.pdf
99/133
99
X
N
K
t = scoresp = loadings
p1 p2
= t1 + t2 + ... E
ETPX
Clculo dosscorese loadingsviaSVD
5/20/2018 Slides aula coment rios.pdf
100/133
100
SVD
SVD = Singular Value Decomposition
Decomposio de valores singulares
X VTSU= xx
V= Loadings
UxS= Scores
Exemplo numrico (SVD)
5/20/2018 Slides aula coment rios.pdf
101/133
101
400 401 402 403 404 405
AmT1 0,139 0,139 0,140 0,141 0,142 0,144AmT2 0,236 0,237 0,238 0,241 0,243 0,245AmT3 0,352 0,354 0,357 0,360 0,364 0,367AmT4 0,481 0,485 0,488 0,493 0,498 0,503AmT5 0,603 0,608 0,613 0,619 0,625 0,630
Mdia 0,362 0,365 0,367 0,371 0,374 0,378
400 401 402 403 404 405AmT1 -0,223 -0,225 -0,228 -0,230 -0,232 -0,234AmT2 -0,126 -0,127 -0,129 -0,130 -0,131 -0,132AmT3 -0,010 -0,010 -0,011 -0,011 -0,011 -0,011AmT4 0,119 0,120 0,121 0,123 0,124 0,125AmT5 0,241 0,243 0,246 0,248 0,250 0,252Mdia 0,000 0,000 0,000 0,000 0,000 0,000
Matriz X (Espectros de 400 a 405 nm)
Matriz X centrada na mdia
Matrizes U, S e VU
5/20/2018 Slides aula coment rios.pdf
102/133
102
UxS= Scores0,601 0,011 -0,410 0,521 0,447
0,340 -0,131 0,805 -0,141 0,447
0,028 -0,234 -0,429 -0,749 0,447
-0,320 0,835 0,020 -0,017 0,447
-0,648 -0,481 0,015 0,385 0,447
U
0,933 0,000 0,000 0,000 0,000
0,000 0,001 0,000 0,000 0,0000,000 0,000 0,001 0,000 0,000
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
S
-0,398 -0,085 0,185 -0,263 0,771
-0,403 0,285 0,315 0,247 -0,463
-0,406 -0,506 -0,690 0,271 -0,080
-0,410 -0,280 0,502 0,456 0,050
-0,415 -0,168 0,065 -0,764 -0,403
-0,418 0,741 -0,367 0,060 0,139
V (transposta)
Scores (UxS)
5/20/2018 Slides aula coment rios.pdf
103/133
103
A PC1 contm 100% da informao original
As demais PCs contm rudos
0,560 0,000 0,000 0,000 0,000
0,317 0,000 0,001 0,000 0,000
0,026 0,000 0,000 0,000 0,000
-0,298 0,001 0,000 0,000 0,000
-0,605 0,000 0,000 0,000 0,000Varincia 0,217 0,000 0,000 0,000 0,000
Total 0,217
99,9998 0,000 0,000 0,000 0,000
Scores (UxS)
Reconstrundo a matriz X
5/20/2018 Slides aula coment rios.pdf
104/133
104
0,601 0,000 0,000 0,000 0,000
0,340 0,000 0,000 0,000 0,000
0,028 0,000 0,000 0,000 0,000-0,320 0,000 0,000 0,000 0,000
-0,648 0,000 0,000 0,000 0,000
0,933 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,0000,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
0,000 0,000 0,000 0,000 0,000
-0,398 0,000 0,000 0,000 0,000-0,403 0,000 0,000 0,000 0,000
-0,406 0,000 0,000 0,000 0,000
-0,410 0,000 0,000 0,000 0,000
-0,415 0,000 0,000 0,000 0,000
-0,418 0,000 0,000 0,000 0,000
S
V (transposta)
U
Reconstrundo a matriz X
5/20/2018 Slides aula coment rios.pdf
105/133
105
-0,223 -0,225 -0,228 -0,230 -0,232 -0,234-0,126 -0,127 -0,129 -0,130 -0,131 -0,132-0,010 -0,010 -0,011 -0,011 -0,011 -0,0110,119 0,120 0,121 0,123 0,124 0,1250,240 0,243 0,246 0,248 0,250 0,253
0,139 0,139 0,139 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,245
0,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,607 0,613 0,619 0,625 0,630
Matriz X centrada na mdia - Reconstruda
Matriz X - Reconstruda
Reconstrundo a matriz XMatriz X Original
5/20/2018 Slides aula coment rios.pdf
106/133
106
0,139 0,139 0,140 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,245
0,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,608 0,613 0,619 0,625 0,630
Matriz X - Original
0,139 0,139 0,139 0,141 0,142 0,1440,236 0,237 0,238 0,241 0,243 0,2450,352 0,354 0,357 0,360 0,364 0,3670,481 0,485 0,488 0,493 0,498 0,5030,603 0,607 0,613 0,619 0,625 0,630
Matriz X - Reconstruda
-0,000027 -0,000020 -0,000105 -0,000045 0,000006 0,000014-0,000042 -0,000012 0,000074 0,000008 -0,000016 -0,0000070,000011 -0,000038 -0,000072 0,000024 0,000005 -0,0000120,000166 0,000080 0,000174 -0,000031 -0,000117 -0,000132-0,000108 -0,000010 -0,000072 0,000045 0,000122 0,000137
Matriz de erros
Escolha do nmero decomponentes principais
5/20/2018 Slides aula coment rios.pdf
107/133
107
componentes principaisEspectros (Vis) de Amarelo Tartrazina e Amarelo
Crepsculo (Corantes alimentcios)
350 400 450 500 550
0,000
0,200
0,400
0,600
0,800
1,000
1,200
Comprimento de onda (nm)
Abs
Matriz: 54 linhas e1001 variveis
(350 a 550 nm)
Escolha do nmero decomponentes principais
5/20/2018 Slides aula coment rios.pdf
108/133
108
componentes principais
PC1 = 81,5%PC2 = 18,4%Demais PC < 0,1%
PC1 + PC2 100%
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10
0
30
60
90
V
arinciaexplicada(%)
PC
Anlise Hierrquica de Agrupamentos
5/20/2018 Slides aula coment rios.pdf
109/133
109
HCA: Hierarchical Cluster Analysis
Agrupa dados comcaractersticas semelhantes
em agrupamentos
Objetivos
Amostras prximas
(pequenas distncias) so
semelhantes
Medidas de distncia e SimilaridadeDi i b d
5/20/2018 Slides aula coment rios.pdf
110/133
110
Distncia entre a e b: dab
Mm
j
M
bjajab xxd
1
1
)(
Distncia Euclideana
Similaridade
max
1d
ds abab
AgrupamentosO bj t t d d d i il id d
5/20/2018 Slides aula coment rios.pdf
111/133
111
Os objetos so conectados por ordem de similaridade.
importante definir a distncia de um objeto a um
grupo ou entre grupos
Tipos de conexes:
-Conexo simples
-Conexo completa
-Conexo por meio de medianas
-Conexo por meio de centrides
-Conexo incremental-Conexo por meio de mdias de grupo
-Conexo flexvel
Exemplos de conexes
5/20/2018 Slides aula coment rios.pdf
112/133
112
Conexo simples
Conexocompleta
Conexo
centride
Formao do dendograma
5/20/2018 Slides aula coment rios.pdf
113/133
113
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
114/133
114
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
115/133
115
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
116/133
116
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
117/133
117
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
118/133
118
1
2
3
6
5
4
7
5/20/2018 Slides aula coment rios.pdf
119/133
119
1
2
3
6
5
4
7
Dendograma
5/20/2018 Slides aula coment rios.pdf
120/133
120
4
5
6
2
3
1
7 MaiorSimilaridade
MenorSimilaridade
MenorDistncia
MaiorDistncia
5/20/2018 Slides aula coment rios.pdf
121/133
121
Exemplos de
aplicao deHCA
f C
5/20/2018 Slides aula coment rios.pdf
122/133
122
Artigo cientfico: Caractersticas desedimentos provenientes do Rio Betari no
Parque Estadual Turstico do Alto Ribeira -Petar
rea deestudo
5/20/2018 Slides aula coment rios.pdf
123/133
123
estudo
Pontos de
coleta(1 a 6)
Os dadosP t H C O U T M O N T K P A Sil A P d
Variveis
5/20/2018 Slides aula coment rios.pdf
124/133
124
Pontos pH C. O. Um. T. M. O. N. T. K. P Arg. Sil. Are. Ped.1 6,99 5,65 20 2,99 0,60 1,33 0,0 11,5 66,5 122 6,02 2,78 22 4,34 0,30 0,84 2,0 9,0 70,0 133 7,30 8,07 33 3,88 0,30 0,80 2,5 52,5 45,0 0
4 6,21 21,27 34 6,04 0,75 1,17 4,0 20,0 76,0 05 6,21 3,14 39 6,74 0,45 0,71 6,0 22,5 42,5 116 6,94 34,77 14 5,05 0,45 1,19 4,0 64,0 24,0 1
Pontos Agreg. CTC e. Zn pT. Cu pT. Cr pT. Mn pT. Fe pT. Ni pT. Cd pT. Pb pT.1 10 19,0 5497 104 64 2785 53841 41,31 10 75702 6 9,9 1412 133 37 1206 48231 31,98 2 18243 0 7,5 417 27 29 449 23591 0,00 0 2054 0 12,4 1033 95 43 421 33778 27,32 0 117
5 18 2,9 330 109 30 1160 54725 28,00 0 1166 7 10,6 640 48 35 731 32325 24,66 0 636
Pontos Al pT. Zn bD. Cu bD. Mn bD. Fe bD. Ni bD. Cd bD. Pb bD. Al bD.1 7990 5247 9 356 479 0,00 4,50 5281 9272 14090 802 7 205 864 1,83 1,25 556 6413 13788 180 5 286 538 0,00 0,00 101 5014 25723 69 17 301 2587 3,08 0,00 43 10345 25223 15 4 178 559 0,00 0,00 22 7266 18262 516 15 624 827 4,41 0,00 371 752
6 pontos e 29 variveis (Tabela de dados)
6 linhas e 29 colunas (Matriz de dados)
Nmero de PCs
5/20/2018 Slides aula coment rios.pdf
125/133
125
PC1 PC2 PC3 PC4 PC50
10
20
30
40
50
V
arinciaexplicad
a(%)
PC
3 PCs so mais
que suficientes!!!Por qu???
5/20/2018 Slides aula coment rios.pdf
126/133
126
-5 -4 -3 -2 -1 0 1 2 3-2
-1
0
1
2
3
1 2 3
4
5
6
PC2
PC1
-0,3 0,0 0,3
-0,4
-0,2
0,0
0,2
0,4
pH
C. O.
Um.
T. M. O.
N. T. K.
P
Arg.
Sil.
Are.
Ped.
Agreg.
CTC e.
Zn pT.
Cu pT.
Cr pT.
Mn pT.
Fe pT.
Ni pT.
Cd pT.
Pb pT.
Al pT.
Zn bD.
Cu bD.Mn bD.
Fe bD.
Ni bD.
Cd bD.
Pb bD.
Al bD.
PC2
PC1
Scores Loadings
5/20/2018 Slides aula coment rios.pdf
127/133
127
Scores Loadings
-5 -4 -3 -2 -1 0 1 2 3
-2
-1
0
1
1
2 3
4
5
6
PC3
PC1
-0,3 0,0 0,3
-0,4
-0,3
-0,2
-0,1
0,0
0,1
0,2
0,3
0,4
pH
C. O.Um.
T. M. O.
N. T. K.
PArg.
Sil.
Are.
Ped. Agreg.CTC e.
Zn pT.
Cu pT.
Cr pT.
Mn pT.
Fe pT.
Ni pT.
Cd pT.Pb pT.
Al pT.
Zn bD.
Cu bD.
Mn bD.
Fe bD.
Ni bD.
Cd bD.Pb bD.
Al bD.
PC3
PC1
5/20/2018 Slides aula coment rios.pdf
128/133
128
Scores Loadings
-2 -1 0 1 2 3-1,0
-0,5
0,0
0,5
1,0
1
23
4
5
6
PC3
PC2-0,4 -0,2 0,0 0,2 0,4
-0,4
-0,3
-0,2
-0,1
0,0
0,1
0,2
0,3
0,4
pH
C. O.Um.
T. M. O.
N. T. K.
PArg.
Sil.
Are.
Ped.Agreg.
CTC e.
Zn pT.
Cu pT.
Cr pT.
Mn pT.
Fe pT.
Ni pT.
Cd pT.Pb pT.
Al pT.
Zn bD.
Cu bD.
Mn bD.
Fe bD.
Ni bD.
Cd bD.Pb bD.
Al bD.
PC3
PC2
Dendograma (Amostras)6
5/20/2018 Slides aula coment rios.pdf
129/133
129
3
4
5
2
1
Dendograma (Variveis)
5/20/2018 Slides aula coment rios.pdf
130/133
130
Artigo cientfico: Caractersticas de amostras
5/20/2018 Slides aula coment rios.pdf
131/133
131
Artigo cientfico: Caractersticas de amostrasde chs com fluorescncia de raios-X
Dendograma (Amostras)Verde
5/20/2018 Slides aula coment rios.pdf
132/133
132
Maa com canela
Maa com canela
Maa vermelha
Lima limo
Hortel
Melissa com flor de laranjeira
Morango
BoldoBoldo
Preto
Camomila
Cidreira
Cidreira
Cidreira
Dendograma (Variveis)Mn
5/20/2018 Slides aula coment rios.pdf
133/133
Fe
Ca
Zn
Mg
Top Related