ANÁLISE DE DADOS NA AGROPECUÁRIA - fepagro.rs.gov.br - Análise de Dados na... · NA...
Transcript of ANÁLISE DE DADOS NA AGROPECUÁRIA - fepagro.rs.gov.br - Análise de Dados na... · NA...
ANÁLISE DE DADOSANÁLISE DE DADOSNA AGROPECUÁRIANA AGROPECUÁRIA
Dra. Carolina BremmDra. Carolina BremmFepagroFepagro Sede Sede
Fisher (1930): Introduz o conceito de delineamentoexperimental e compara tratamentospelo “valor p”
Neyman – Pearson (1935):Juntamente com Fisher definem o “testede Hipóteses”
ESTATÍSTICAESTATÍSTICA
�� éé umum conjuntoconjunto dede técnicastécnicas ee métodosmétodosdede pesquisapesquisa queque envolveenvolve ooplanejamentoplanejamento dodo experimentoexperimento aa serserrealizado,realizado, aa coletacoleta qualificadaqualificada dosdosdados,dados, oo processamento,processamento, aa análiseanálise ee aadivulgaçãodivulgação dasdas informaçõesinformações..
PlanejamentoPlanejamento do experimento a do experimento a ser realizadoser realizado
�� reduçãoredução dodo númeronúmero dede ensaiosensaios semsem prejuízoprejuízo dadaqualidadequalidade dada informaçãoinformação;;
�� estudoestudo simultâneosimultâneo dede diversasdiversas variáveis,variáveis, separandoseparandoseusseus efeitosefeitos;;
�� realizaçãorealização dada pesquisapesquisa emem etapas,etapas, numnum processoprocessoiterativoiterativo dede acréscimoacréscimo dede novasnovas hipóteses/ensaioshipóteses/ensaios;;
HipóteseHipótese
�� ConceitualConceitual�� DistintasDistintas alturasalturas dede manejomanejo dada
pastagempastagem modificammodificam asas respostasrespostas dosdosanimaisanimais emem pastejopastejo..
�� EstatísticaEstatística�� HH00:: µµ11 == µµ22 == µµ33�� HH11:: µµ11 ## µµ22 ## µµ33
�� QualQual aa perguntapergunta aa serser respondidarespondida?? QualQual aavariávelvariável centralcentral dodo estudoestudo??
�� QuaisQuais serãoserão osos tratamentostratamentos testadostestados??
�� QualQual tipotipo dede dadodado éé necessárionecessário parapara utilizarutilizarasas ferramentasferramentas desejadasdesejadas ee responderresponder aapergunta?pergunta?
�� ComoComo coletarcoletar essesesses dadosdados comcom oo mínimomínimo dedeesforçoesforço ee erro?erro? QualQual oo períodoperíodo emem queque ososdadosdados serãoserão coletados?coletados?
�� ConsumoConsumo porpor bovinosbovinos (g MS/min)(g MS/min)�� PastagemPastagem de de AveiaAveia ((AvenaAvena strigosastrigosa))�� DistintasDistintas alturasalturas de de manejomanejo da da pastagempastagem::
15, 20, 25, 30, 35, 40, 45 e 50 cm15, 20, 25, 30, 35, 40, 45 e 50 cm
Uma definição importante (para a escolha datécnica estatística e das interpretações dosresultados) é a classificação dos dados.
AnimaisAnimais 4 4 novilhasnovilhas
UnidadeUnidade experimentalexperimental
2 rep de 2 rep de áreaárea e 2 rep no tempoe 2 rep no tempoPermitePermite obterobter umauma estimativaestimativa dede comocomo oo erroerro experimentalexperimental
afetaafeta osos resultadosresultados dosdos ensaiosensaios ee sese essesesses resultadosresultados sãosão
estatisticamenteestatisticamente diferentesdiferentes..
DelineamentoDelineamento experimental experimental
BlocosBlocos casualizadoscasualizados
PeríodoPeríodo de de avaliaçõesavaliações
18 18 diasdias
Uma das exigências do uso da metodologiaestatística para o planejamento experimental e para aanálise dos resultados é que as variáveis estudadas e oserros experimentais observados apresentem um caráteraleatório, o que é conseguido pelo emprego daaleatoridade.
50
150
250
350
450
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140
tamanho da amostra
Suficiência Amostral
Importante!!!
-Construir uma metodologia para nos certificarde que todas as informações estão definidas;
-Coletar os dados de forma consistente ehonesta;
-Certificar-se de que existe tempo suficientepara a coleta de dados;
- Definir quais informações adicionais serãonecessárias para estudos futuros, referências oureconhecimento.
Coleta qualificada dos dadosColeta qualificada dos dados
�� NãoNão sese devedeve coletarcoletar dadosdados semsem queque antesantes sese tenhatenhadefinidodefinido claramenteclaramente oo problemaproblema ouou situaçãosituação aa serserenfrentada,enfrentada, bembem comocomo osos objetivosobjetivos comcom relaçãorelaçãoaosaos mesmosmesmos;;
�� OsOs sistemassistemas dede mediçãomedição (instrumento,(instrumento, operadores,operadores,método,método, meio)meio) queque serãoserão utilizadosutilizados devemdevem serseravaliadosavaliados ee terter capacidadecapacidade dede mediçãomedição suficientesuficiente;;
�� OsOs cálculoscálculos ee leiturasleituras devemdevem serser feitosfeitos comcom muitamuitaatençãoatenção parapara evitarevitar distorçõesdistorções;;
�� DevemDevem serser utilizadosutilizados métodosmétodos adequadosadequados paraparacoletacoleta dede dadosdados dede acordoacordo comcom oo problemaproblemaestudadoestudado..
Antes da exposição dos dados coletados é necessárioque se faça um trabalho de revisão e correção nosdados coletados na tentativa de eliminar possíveisenganos (outliers).
Processamento dos dadosProcessamento dos dados
Erro amostral
Não pode ser eliminado, porém, frequentemente podeser reduzido. Se um erro sistemático se origina de umresultado de medição e pode ser quantificado, umacorreção ou fator de correção pode ser aplicado paracompensar o efeito.
Erro sistemático
As amostras coletadas são utilizados para ajustar asestimativas visuais em cada avaliação, utilizando regressão linear(y = a + bx) entre a massa de forragem atribuída pelo avaliador(x) e a massa de forragem colhida (y) na amostra.
AnáliseAnálise de de covariânciacovariância
�� Forma de Forma de ajustarajustar osos dados dados parapara umaumavariávelvariável nãonão bembem controladacontrolada
�� Ex. Alturas Ex. Alturas iniciaisiniciais distintasdistintas, peso vivo , peso vivo inicialinicialdistintodistinto
Análise dos dadosAnálise dos dados
�� determinardeterminar quaisquais variáveisvariáveis sãosão maismaisinfluentesinfluentes nosnos resultadosresultados;;
�� atribuiratribuir valoresvalores àsàs variáveisvariáveis influentesinfluentes dedemodomodo aa minimizarminimizar aa variabilidadevariabilidade dosdosresultadosresultados;;
�� atribuiratribuir valoresvalores àsàs variáveisvariáveis influentesinfluentes dedemodomodo aa minimizarminimizar aa influênciainfluência dede variáveisvariáveisincontroláveisincontroláveis..
Medidas RepetidasMedidas Repetidas
�� ObjetivoObjetivo: : Verificar o comportamento de um Verificar o comportamento de um determinado indivíduo ao longo do tempo.determinado indivíduo ao longo do tempo.
�� É usado para designar medidas feitas ou na É usado para designar medidas feitas ou na mesma unidade experimental ou no mesmo mesma unidade experimental ou no mesmo indivíduo em mais de uma ocasião, ou indivíduo em mais de uma ocasião, ou seja, períodos de tempo distintos seja, períodos de tempo distintos ((DiggleDiggle, 1988 e , 1988 e CrowderCrowder & & HandHand, 1990). , 1990).
ModelosModelos mistosmistos
�� Distingue Distingue osos efeitosefeitos fixosfixos e e aleatóriosaleatórios
�� ComponentesComponentes de de variânciavariância
ParâmetrosParâmetros de de covariânciacovariância
�� ReduzReduz o o erroerro experimentalexperimental
Num DenEffect DF DF F Value Pr > F
Trat 7 11 30.96 <.0001Bloco 1 11 2.74 0.0614
Standard LetterTrat Estimate Error Group
15 33.3620 1.7823 D20 39.8631 1.2832 CD25 44.6210 1.7823 BC30 54.8515 1.2832 A35 51.0379 1.2832 AB40 51.5527 1.7823 AB45 42.2818 1.7823 C50 42.8686 1.7823 C
AnáliseAnálise de de VariânciaVariânciaComparaçãoComparação de de médiasmédias
Matriz de Correlação
O coeficiente de correlação não mede a relaçãocausa-efeito entre as variáveis, apesar de que essa relaçãopossa estar presente.
Regressão Múltipla
� Uma das mais importantes aplicações daanálise de regressão múltipla é a escolha,entre diversas variáveis independentes,daquelas mais úteis na previsão de Y;
� A variância total de Y é em parte explicadapelas diversas variáveis x's e o restante pelavariabilidade devido ao erro (ε).
Stepwise
� As variáveis são incluídas uma a uma;
� Após cada etapa de incorporação de umavariável, temos uma etapa em que uma dasvariáveis já selecionadas pode serdescartada;
� O procedimento chega ao final quandonenhuma outra variável é incluída oudescartada.
�� ConfundimentoConfundimento entre entre relaçõesrelações diretasdiretase e indiretasindiretas
�� NãoNão consideraconsidera respostasrespostas biológicasbiológicas
Regressão múltipla Stepwise
Path AnalysisPath AnalysisAnáliseAnálise de de trilhatrilha
� Proporciona a criação de um modeloonde todas as variáveis estãorelacionadas (diretamente ouindiretamente)
EfeitosEfeitos diretosdiretos e e indiretosindiretos
�� A A variávelvariável independenteindependente (x) (x) podepodeafetarafetar a a variávelvariável respostaresposta (y) de (y) de duasduasformasformas::
�� EfeitoEfeito diretodireto de xde x11 em yem y–– Ex., xEx., x11 →→ yy
�� EfeitoEfeito indiretoindireto de xde x11 em y em y atravésatravés de de outraoutra variávelvariável correlacionadacorrelacionada (x(x22) )
TI
Altura do pasto (cm)
TB
Altura do pasto (cm)
Busca
Altura do pasto (cm)
Colh
eita
Altura do pasto (cm)
Mastigaçã
o
Altura do pasto (cm)
MB
Altura do pasto (cm)
PB
Altura do pasto (cm)
AB
Altura do pasto (cm)
Biomassa: disponibilidade, densidade, acessibilidade
Modelo Conceitual
ModeloModelo GeralGeral
U
Yj ZXi
p7
p8
p9
p14
p11
p15
p16
MB
TB
TI
p10
p12
p13
ML
MC
DensL
DensC
MF
Dens
Altura
p1
p2
p3
p4
p5
p6
MB
TB
MF
ML
MC
Dens
C
Dens
L
Dens
Alt
0.96***
0.51*
0.71***
0.87***
0.91***
0.84***
0.90***
0.66**
0.43*
0.96***
0.61**
0.54**
-0.35ns
0.60**
0.48**
0.72
0.99***
-0.25ns
TI
0.55
0.78***
0.26ns
0.64***
0.81
ModeloModelo CompletoCompleto
MB
TB
Dens
Alt
0.51*
0.74
0.99***
-0.25ns
TI
0.55
0.78***
0.49*
0.67***
0.86
MF
0.71***
0.96***
ModeloModelo SimplificadoSimplificado
Pressuposições do modelo
� Todos os efeitos causais devem serdevidamente incluídos no modelo
� Se determinada variável causal é excluídaé porque ela é independente das outrasvariáveis que foram incluídas no modelo
� Todos os efeitos devem ser lineares eaditivos
0,66*MB
TI
MB
NSAltura
y = 33,41x + 6,241R² = 0,733
0
5
10
15
20
25
30
35
40
45
50
0,0 0,2 0,4 0,6 0,8 1,0 1,2
Tax
a de
inges
tão (
g/m
in)
Massa do bocado (g)
0,4
0,6
0,8
1,0
1,2
1,4
1,6M
assa
dobo
cado
(g)
5 10 15 20 25 30 35 40 45 50
Altura do pasto (cm)
Importante:
Definir quais variáveis X influenciam Y
Considerar que X e Y são mutualmenteinfluenciadas por outras variáveis, quandotodas são medidas ao mesmo tempo
Modelo conceitual
O uso da Path Analysis permite relações dedependência e independência entre variáveis
Pressuposição
A distribuição conjunta das variáveisdeve ser a mesma para cada caso.
Análise Multivariada Componentes Principais
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-5.00 -2.50 0.00 2.50 5.00
CP 1 (53.4%)
-5.00
-2.50
0.00
2.50
5.00
CP
2 (24.3
%)
Alt
TI MB
TB
MF
ML
MC
DL
DC
DT
Alt
TI MB
TB
MF
ML
MC
DL
DC
DT
Avena
Análise Multivariada Componentes Principais
Explicação da variação total: 77,7%
�� ÉÉ utilizadoutilizado comocomo métodométodo exploratórioexploratório dededadosdados comcom aa finalidadefinalidade dede obterobter maiormaiorconhecimentoconhecimento sobresobre aa estruturaestrutura dasdasobservaçõesobservações//variáveisvariáveis emem estudoestudo..
�� SeSe usausa umauma matrizmatriz dede distânciadistância ((p*p)p*p) entreentreparespares dede variáveisvariáveis ii ee jj parapara i,ji,j==11,,......,p,p..
�� ÉÉ precisopreciso sempresempre padronizarpadronizar asas variáveisvariáveisantesantes dede procederproceder aa análiseanálise..
Análise MultivariadaAnálise de AgrupamentoAnálise de Agrupamento
Análise de AgrupamentoAnálise de AgrupamentoMétodoMétodo: : LigaçãoLigação MédiaMédiaA distância entre dois grupos i e j é dada pela
média das distâncias entre os elementos dos doisgrupos.
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version
Student version Student version Student version Student version Student version
Student version Student version Student version Student version0.00 1.73 3.45 5.18 6.91
15.00
20.00
25.00
30.00
35.00
40.00
45.00
50.00
Average linkage
Distance: (Euclidean)
Trat
amen
tos
(altu
ra, cm
)
Cophenetic correlation= 0.910
Análise de AgrupamentoAnálise de AgrupamentoLigaçãoLigação MédiaMédia