Teste do qui quadrado para independência (duas amostras)

A utilização do presente teste em pesquisa visa verificar se as distribuições de duas ou mais amostras não relacionadas diferem significativamente em relação à determinada variável.

Condições para a execução do teste

Exclusivamente para variáveis nominais e ordinais;

Preferencialmente para amostras grandes, <30;

Observações independentes;

Não se aplica se 20% das observações forem inferiores a 5

Não pode haver frequências inferiores a 1;

Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo um critério em específico.

Procedimento para a execução do teste

Determinar H0. As variáveis são independentes, ou as variáveis não estão associadas;

Estabelecer o nível de significância (µ );

Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo φ = (L – 1) (C – 1), onde L = números de linhas da tabela e C = ao número de colunas.. Encontrar portanto, o valor do Qui-quadrado tabelado;

Calcular o Qui Quadrado, através da fórmula:

Para encontrar o valor esperado (E), utilizar a fórmula a seguir:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.

Há dependência ou as variáveis não estão associadas.

Exemplo

Um pesquisador deseja identificar se há dependência no consumo de seus chocolates e as cidades de sua região.

 

Cidades do Vale do Taquari

 

Sabor do chocolate

Lajeado

Santa Cruz

Estrela

Taquari

Chocolate com caju

60

30

20

40

150

Chocolate com amendoim

45

35

20

10

110

Chocolate com flocos

55

25

47

13

140

Chocolate com passas

70

35

25

20

150

230

125

112

83

550

H0: A preferência pelos sabores independe da cidade

H1: A preferência pelos sabores depende da cidade.

µ = 0,05

φ = (4 – 1) (3 – 1) = 6, onde Qui quadrado tabelado é igual a 12,6.

Calculo dos valores esperados (E).

Cidades do Vale do Taquari

Sabor do chocolate

Lajeado

Santa Cruz

Estrela

Taquari

Chocolate com caju

62,7

34,1

30,5

22,6

Chocolate com amendoim

46,0

25,0

22,4

16,6

Chocolate com flocos

58,5

31,8

28,5

21,1

Chocolate com passas

62,7

34,1

30,5

22,6

Χ2 = (60 – 62,7)2/62,7 + [(30 – 34,1) 2/34,1 ...[(20 – 22,6) 2/22,6 =

0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29 = 43,72

Conclui-se que o Qui quadrado calculado (43,72) é maior do que o tabelado (12,6), rejeita-se H0  em prol de H1.

Portanto há diferença significativa, ao nível de 0,05, para as cidades.

Coeficiente de contingência (CC)

O CC é um indicador do grau de associação entre duas variáveis analisadas pelo Qui quadrado.

Quanto mais próximo de 1, melhor o coeficiente de contingência, que varia de 0 a 1.

No exemplo dado acima o coeficiente seria 0,3442.

Como referenciar: "Teste do qui quadrado para independência (duas amostras)" em Só Matemática. Virtuous Tecnologia da Informação, 1998-2018. Consultado em 23/01/2018 às 12:13. Disponível na Internet em https://www.somatematica.com.br/estat/ap28.php