Variáveis categóricas: 2 grupos

14
Variáveis categóricas: 2 Variáveis categóricas: 2 grupos grupos Com duas amostras independentes / relacionadas de indivíduos queremos saber se na população as proporções de indivíduos com determinada característica em cada grupo são iguais.

description

Variáveis categóricas: 2 grupos. Com duas amostras independentes / relacionadas de indivíduos queremos saber se na população as proporções de indivíduos com determinada característica em cada grupo são iguais. Teste de Qui-quadrado. Amostras independentes. Teste de Qui-quadrado. - PowerPoint PPT Presentation

Transcript of Variáveis categóricas: 2 grupos

Page 1: Variáveis categóricas: 2 grupos

Variáveis categóricas: 2 Variáveis categóricas: 2 gruposgrupos

Com duas amostras independentes / relacionadas de indivíduos queremos saber se na população as proporções de indivíduos com determinada característica em cada grupo são iguais.

Page 2: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

Grupo1Grupo1 Grupo2Grupo2 TotalTotal

ComCom aa bb a+ba+b

SemSem cc dd c+dc+d

TotalTotal n1=a+cn1=a+c n2=b+dn2=b+d nn

Amostras independentes

Page 3: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

HomossexuaisHomossexuais HeterossexuaiHeterossexuaiss

HHV-8 +HHV-8 + 14 14 36 36

HHV-8 -HHV-8 - 29 29 192 192

TotalTotal 43 43 228 228

Amostras independentes:Com um objectivo de comparar a prevalência de seropositivos para o HHV-8 entre os homens homossexuais e os heterossexuais analisaram-se 271 homens, obtendo-se os seguintes resultados:

HomossexuaisHomossexuais HeterossexuaiHeterossexuaiss

HHV-8 +HHV-8 + 14 14 (33%)(33%) 36 36 (16%)(16%)

HHV-8 -HHV-8 - 29 (67%)29 (67%) 192 (84%)192 (84%)

TotalTotal 43 (100%)43 (100%) 228 (100%)228 (100%)

Page 4: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

Definimos a HipóteseDefinimos a HipóteseH0: H0: 1=1=2 2 H1: H1: 1122

Obtemos a estatística do teste com os dados de uma Obtemos a estatística do teste com os dados de uma amostraamostra2 = 2 = (|O-E|-1/2)(|O-E|-1/2)22/E /E segue uma distribuição de qui-quadrado com 1 grau de segue uma distribuição de qui-quadrado com 1 grau de liberdadeliberdadeO – valores observadoO – valores observadoE – velores esperadosE – velores esperados

Obtemos o valor de pObtemos o valor de pDefinimos o nível se significanciaDefinimos o nível se significanciaInterpretamos o valor de pInterpretamos o valor de p

Page 5: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

HHV8 * coluna Crosstabulation

14 36 50

7.9 42.1 50.0

29 192 221

35.1 185.9 221.0

43 228 271

43.0 228.0 271.0

Count

Expected Count

Count

Expected Count

Count

Expected Count

+

-

HHV8

Total

Homossexuais Heterossexuais Total

H0: Na população a proporção de HHV8 + entre os homossexuais é igual à H0: Na população a proporção de HHV8 + entre os homossexuais é igual à proporção de HHV8 + entre os heterossexuais proporção de HHV8 + entre os heterossexuais

2 = 2 = (|O-E|-1/2)2/E segue (|O-E|-1/2)2/E segue uma distribuição de qui-uma distribuição de qui-quadrado com 1 grau de quadrado com 1 grau de liberdadeliberdadeO – valores observadoO – valores observadoE – valores esperadosE – valores esperados

(43x50)/271=7.9 Chi-Square Tests

6.761b 1 .009

5.692 1 .017

6.002 1 .014

.017 .011

6.736 1 .009

271

Pearson Chi-Square

Continuity Correctiona

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

Computed only for a 2x2 tablea.

0 cells (.0%) have expected count less than 5. The minimum expected count is 7.93.

b.

2 =2 = 6.761p =p = 0.009

Page 6: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

HHV8 * coluna Crosstabulation

14 36 50

7.9 42.1 50.0

28.0% 72.0% 100.0%

32.6% 15.8% 18.5%

29 192 221

35.1 185.9 221.0

13.1% 86.9% 100.0%

67.4% 84.2% 81.5%

43 228 271

43.0 228.0 271.0

15.9% 84.1% 100.0%

100.0% 100.0% 100.0%

Count

Expected Count

% within HHV8

% within coluna

Count

Expected Count

% within HHV8

% within coluna

Count

Expected Count

% within HHV8

% within coluna

+

-

HHV8

Total

Homossexuais Heterossexuais Total

Page 7: Variáveis categóricas: 2 grupos

Teste de Qui-quadradoTeste de Qui-quadrado

Assumpções:Todos os valores esperados são maiores ou iguais a 5.

Se algum valor esperado <5 – Teste exacto de Fisher

Page 8: Variáveis categóricas: 2 grupos

Teste de McNemarTeste de McNemar

A – s/cefaleiasA – s/cefaleias A – c/cefaleiasA – c/cefaleias

B - B - s/cefaleiass/cefaleias

45 (w)45 (w) 4 (x)4 (x)

B - B - c/cefaleiasc/cefaleias

17 (y)17 (y) 34 (z) 34 (z)

TotalTotal 62 62 38 38

Amostras emparelhadas:Foram avaliados 100 doentes com cefaleias frequentes. Os mesmos 100 dentes tomaram durante um mês um determinado medicamento A e no mês seguinte o medicamento B. Pediu-se aos doentes que registassem se durante cada mês tiveram ou não dores de cabeça.

Page 9: Variáveis categóricas: 2 grupos

Teste de McNemarTeste de McNemar

Definimos a HipóteseDefinimos a HipóteseH0: Na população a proporção com uma H0: Na população a proporção com uma determinada característica é igual nos dois gruposdeterminada característica é igual nos dois grupos

Obtemos a estatística do teste com os dados de uma Obtemos a estatística do teste com os dados de uma amostraamostra2 = 2 = (|x-y|-1)(|x-y|-1)22/x+y /x+y segue uma distribuição de qui-quadrado com 1 grau de segue uma distribuição de qui-quadrado com 1 grau de liberdadeliberdade

Obtemos o valor de pObtemos o valor de pDefinimos o nível se significanciaDefinimos o nível se significanciaInterpretamos o valor de pInterpretamos o valor de p

Page 10: Variáveis categóricas: 2 grupos

Teste de McNemarTeste de McNemar

visual * RX Crosstabulation

45 4 49

30.4 18.6 49.0

91.8% 8.2% 100.0%

72.6% 10.5% 49.0%

17 34 51

31.6 19.4 51.0

33.3% 66.7% 100.0%

27.4% 89.5% 51.0%

62 38 100

62.0 38.0 100.0

62.0% 38.0% 100.0%

100.0% 100.0% 100.0%

Count

Expected Count

% within visual

% within RX

Count

Expected Count

% within visual

% within RX

Count

Expected Count

% within visual

% within RX

sem

com

visual

Total

sem com

RX

Total

Qual a % de dentes com cefaleias com o medicamento B?

E usando o A?

Chi-Square Tests

.007a

100

McNemar Test

N of Valid Cases

ValueExact Sig.(2-sided)

Binomial distribution used.a.

H0: A percentagem de doentes com cefaleias usando o medicamento A é igual a percentagem de doentes com cefaleias usando o medicamento B

51%

38%

Rejeito H0

B

A

Page 11: Variáveis categóricas: 2 grupos

Variáveis categóricas: Variáveis categóricas: mais de 2 categoriasmais de 2 categorias

Os indivíduos podem ser Os indivíduos podem ser classificados por dois factores.classificados por dois factores. Por exemplo, quanto à severidade da Por exemplo, quanto à severidade da doença e quanto ao grupo sanguíneo.doença e quanto ao grupo sanguíneo.

Cada factor pode ter mais que duas Cada factor pode ter mais que duas categorias.categorias. Por exemplo, Por exemplo, a severidade: baixa, moderada e alta;a severidade: baixa, moderada e alta;o grupo sanguíneo: A, B, O, AB.o grupo sanguíneo: A, B, O, AB.

Page 12: Variáveis categóricas: 2 grupos

Variáveis categóricas: Variáveis categóricas: mais de 2 categoriasmais de 2 categorias

Definimos a HipóteseDefinimos a HipóteseH0: Não há associação entre as categorias de um H0: Não há associação entre as categorias de um factor e as categorias do outro factorfactor e as categorias do outro factor

Obtemos a estatística do teste com os dados de uma Obtemos a estatística do teste com os dados de uma amostraamostra

2 = 2 = (O-E)(O-E)22/E segue uma distribuição de qui-quadrado com (r-1)(c-1) grau de liberdade/E segue uma distribuição de qui-quadrado com (r-1)(c-1) grau de liberdadeO – valores observadoO – valores observado E – velores esperadosE – velores esperados r e c – nº de categorias de cada uma dos factor r e c – nº de categorias de cada uma dos factor

respectivamenterespectivamente

Obtemos o valor de pObtemos o valor de pDefinimos o nível se significanciaDefinimos o nível se significanciaInterpretamos o valor de pInterpretamos o valor de p

Page 13: Variáveis categóricas: 2 grupos

Variáveis categóricas: Variáveis categóricas: mais de 2 categoriasmais de 2 categorias

Assumpções:Não mais de 20% das células da tabela de contingência têm valores esperados menores que 5.

Se algum valor esperado <5 – Teste exacto de Fisher

Page 14: Variáveis categóricas: 2 grupos

Variáveis categóricas: Variáveis categóricas: mais de 2 categoriasmais de 2 categorias

Por vezes investigamos relações entre variáveis categóricas (factores) em que uma das variáveis é dicotómica (por exemplo sim/não) e a outras ordinal.

Podemos testar não só se há uma associação (teste de qui-quadrado) mas também se existe uma tendência (crescente ou decrescente) da proporção de sins (teste de qui-quadrado para tendências).