Uso de Excel
description
Transcript of Uso de Excel
Sumário Uso de Excel
–Produzindo tabelas
–Produzindo gráficos
–Análise de dados
–Testes Estatísticos Teste-T
ANOVA
Regressão
Uso de Excel Programa usado para:
Organizar dados
Produzir tabelas
Realizar cálculos
Fazer gráficos
Realizar testes estatísticos
Organizando dados em tabelas Permite colocar os dados na melhor
forma para análise
Fazendo Cálculos Permite fazer vários cálculos
Soma, Média, Variância, Desvio Padrão
Subtração, adição, multiplicação
Formulas mais complexas
Gráficos de
Barras >
Gráficos de
dispersão >
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1 2 3
-1
0
1
2
3
4
5
6
7
8
9
0 0.2 0.4 0.6 0.8 1 1.2
Fazendo Gráficos
Gráficos de
Barras >
Gráficos de
dispersão >
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1 2 3
-1
0
1
2
3
4
5
6
7
8
9
0 0.2 0.4 0.6 0.8 1 1.2
Fazendo Gráficos
Analise de Dados por Excel Podemos fazer testes estatísticos para:
Determinar se existe uma diferencia
significante entre dois conjuntos de
dados (teste t de Student)
Determinar se existe uma diferencia
significativa entre mais de dois
conjuntos de dados (ANOVA)
Determinar se existe uma relação
significante entre dois variáveis (Analise
de regressão)
Analise de Dados com Excel Os passos seguintes precisam ser seguidos:
1. Escolher um teste estatístico apropriado
2. Afirmar a H0 e a HA
3. Fazer teste para produzir a estatística do teste
4. Examinar o valor de P
5. Decidir aceitar ou rejeitar a H0
Geralmente precisa calcular o valor crítico e consultar o valor P numa tabela
Todo teste realizado com Excel proporciona o valor de P
O valor de P é usado para determinar a significância dos resultados estatísticos
O valor de P precisa ser comparado a um valor
O valor é geralmente 0.05 ou menor (como 0.01)
Menos de 5% de probabilidade do que a hipótese nula é verdadeira
Quanto menor o valor de α mais certeza tem para rejeitar a Hipótese Nula
Mas primeiro precisa escolher o teste estatístico que vai usar
Analise de Dados com Excel
Testes t Usados para comparar as médias de duas populações e responder a
pergunta seguinte:
Existe uma diferencia significativa entre as duas populações?
Exemplo: Existe uma diferencia significativa entre os tratamentos da simulação do efeito de El Niño?
Não pode usar o teste para comparar dois tipos de dados diferentes (como profundidade de água e solo).
Pode somente comparar dois conjuntos de dados com o mesmo tipo de dados (como profundidade de água de dois locais diferentes)
Os dois conjuntos de dados comparados têm as mesmas unidades. (por exemplo pode comparar dois conjuntos de dados se ambos são registrados em dias. Não pode comparar dados registrados em unidades de dias com dados registrados em unidades de meses)
Sua Hipótese Nula é sempre:
Não há diferencia significativa entre as duas populações comparadas (μ1= μ2)
Sua Hipótese Alternativa é sempre:
Há diferencia entre as duas populações comparadas (μ1 ≠ μ2)
Testes t
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
Testes t •Após fazer o teste, consulte o valor de p
•Se p > 0.05 não descarte a Hipótese Nula e afirme
que “não existe uma diferencia significativa entre as
duas populações comparadas”
•Se p < 0.05 descarte a Hipótese Nula e afirme que
“existe uma diferencia significativa entre as duas
populações comparadas”
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
Testes t •Ao fazer o teste, examine o valor de P
•O resultado: P = 0.09903
•Por isso, P > 0.05 (O que implica que existe uma
probabilidade maior de 5% que a hipótese nula é
verdadeira)
•Precisamos não rejeitar a
Hipótese Nula de que
“não existe diferencia significativa
entre as duas populações comparadas”
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
ANOVA Usada para comparar as médias de mais de duas populações e
responder a pergunta:
Existe uma diferencia significante entre as populações?
Exemplo: Existe uma diferencia significante entre a altura média de uma espécie de árvore em quatro locais do Pantanal?
Para comparar um atributo de duas ou mais populações, use
um ANOVA de um fator solitário
Para comparar um atributo de duas ou mais populações,
subdividida em dois grupos use uma ANOVA de dois
fatores
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er
of
Dail
y B
eers
MicroEcoBuisinessStatistics
A Hipótese Nula é sempre:
Não há diferencia significativa entre as populações comparadas (μ1 = μ2 = μ3 = μ4 …..)
A hipótese alternativa é sempre:
Há ma diferencia entre as populações comparadas (μ1 ≠ μ2 ≠ μ3 ≠ μ4 …..)
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0 ANOVA
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
•Ao fazer o teste, examine o valor de p
•Se p > 0.05 não rejeite a Hipótese Nula e afirme que
“não existe diferença significante entre as populações
comparadas”
•Se p < 0.05 rejeite a Hipótese Nula e afirme que
“existe uma diferença significante entre pelo menos
duas das populações comparadas”
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er
of
Dail
y B
eers
MicroEcoBuisinessStatistics
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0 ANOVA
•Ao fazer o teste, examine o valor de p
•Os resultados demonstram P = 0.002197
•Por isso, P < 0.05 (Implica que existe menos de uma
probabilidade de menos de 5% de que a Hipótese Nula é
verdadeira)
•Precisa rejeitar a Hipótese Nula e afirmar que “existe uma
diferença significante entre pelo
menos duas das populações
comparadas”
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er
of
Dail
y B
eers
MicroEcoBuisinessStatistics
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0 ANOVA
Lembre:
O resultado da ANOVA somente indica que
i) Nenhum conjunto de dados se difere significativamente entre eles
OU
ii) Pelo menos dois dos conjuntos dos dados entre todos comparados são diferentes significativamente
Se existe uma diferencia significativa entre pelo menos dois dos conjuntos dos dados, não informa qual dois conjuntos
ANOVA
ANOVA de duas vias
Usada para comparar as médias de mais de duas populações que são subdividas em dois ou mais grupos e responder a pergunta:
Existe uma diferencia significante entre as populações?
Exemplo: Existe uma diferencia significativa entre a altura média de uma espécie de árvores em quatro locais do Pantanal durante o inverno e verão?
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er
of
Dail
y B
eers
MicroEcoBuisinessStatistics
•Ao realizar o teste, examine o valor de P de interação
•Se p > 0.05 não pode rejeitar a Hipótese Nula e afirmar
que “não existe uma diferencia significativa entre as
populações comparadas”
•Se p < 0.05 precisa rejeitar a Hipótese Nula e afirmar que
“existe uma diferencia significativa em pelo menos duas das
populações comparadas”
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er
of
Dail
y B
eers
MicroEcoBuisinessStatistics
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
ANOVA de duas vias
ANOVA de duas vias
•O resultado: P = 0.2888
•Por isso P > 0.05 (Isso
significa que existe uma
probabilidade maior do que
5% que a hipótese nula é
verdadeira)
•Assim precisa rejeitar a
Hipótese Nula e afirmar que
“não existe uma diferencia
significativa entre as duas
populações”
0
10
20
30
40
50
60
70
80
90
100
Number of Students
Nu
mb
er o
f D
ail
y B
eers
MicroEcoBuisinessStatistics
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
Usada para determinar se existe uma relação linear entre dois variáveis e responder a pergunta:
Existe uma relação linear significante entre dois variáveis?
Exemplo: Existe uma relação significativa entre a altura de uma espécie de árvore e a profundidade de solo no pantanal?
A analise cria uma equação (ou linha) que prevê os valores de
Y baseada nos valores de X.
Não pode usar esse teste para comparar as. Somente compare
os variáveis.
Analisamos dois variáveis diferentes (como a profundidade da
água (cm) e a abundância de plantas (número de
indivíduos), de modo que os conjuntos de dados não precisam
ter as mesmas unidades de medição
0.00
10.00
20.00
30.00
40.00
50.00
60.00
0 1 2 3 4 5 6
Price of Whiskey ($)
Mo
ney S
pen
t b
y T
A (
$)Análise de
Regressão
A hipótese nula é sempre:
Não há relação linear significante entre os dois variáveis
A hipótese alternativa é sempre:
Existe uma relação linear significante entre os dois variáveis
Análise de Regressão
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
Exemplo: R quadrado = 0.04
A linha de regressão não se ajusta bem aos dados!
Muitos pontos ficam longe da linha, o que implica que não existe uma relação linear definida entre os dois variáveis
“x” não prevê “y”
Exemplo: R quadrado = 0.94
A linha de regressão ajusta bem os dados
Ao pontos ficam próximos a linha, então existe uma relação linear definida entre os dois variáveis
“x” prevê “y”
0
0.2
0.4
0.6
0.8
1
1.2
0 0.2 0.4 0.6 0.8 1 1.2
Price of Whiskey ($)
Mo
ney S
pen
t b
y T
A (
$)
0.00
10.00
20.00
30.00
40.00
50.00
60.00
0 1 2 3 4 5 6
Price of Whiskey ($)
Mo
ney S
pen
t b
y T
A (
$)
• R quadrado: o grau de previsão de “y” por “x”, ou seja, a força da regressão linear entre os dois variáveis.
• Quanto mais próximo o valor de R a 0, pior o ajuste dos dados.
• Quanto mais próximo o valor de R quadrado a 1, melhor o ajuste dos dados.
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
•Ao fazer o teste, examine a significância do valor de F
ou d p da amostra
•Se p > 0.05 rejeite a Hipótese Nula e afirme que “Não
existe uma relação linear significante entre os dois
variáveis”
•Se p < 0.05 rejeite a Hipótese Nula e afirme que
“Existe uma relação linear significante entre os dois
variáveis”
0.00
10.00
20.00
30.00
40.00
50.00
60.00
0 1 2 3 4 5 6
Price of Whiskey ($)
Mo
ney S
pen
t b
y T
A (
$)
Análise de Regressão
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
1. Escolhe um teste estatístico apropriado
2. Formule H0 e HA
3. Faz o teste
4. Examine o valor de P
5. Decide aceitar ou rejeitar H0
• Ao fazer o teste, examine os valores de p
• Os resultados dão uma Significância de F ou valores p da amostra =
1.65E08 = 0.0000000165
• Por isso P < 0.05, o que implica que temos menos de uma
probabilidade de 5% de que a hipótese nula é verdadeira
• Precisamos rejeitar a Hipótese Nula e afirmar que “existe uma relação
linear significante entre os dois variáveis”
• Examine o valor de R quadrado
• O resultado: R quadrado = 0.975
• Assim, a linha ajusta bem aos dados
• “x” pode ser usado para prever “y”
Análise de Regressão
0.00
10.00
20.00
30.00
40.00
50.00
60.00
0 1 2 3 4 5 6
Price of Whiskey ($)
Mo
ney S
pen
t b
y T
A (
$)