ANOVA: Análise de Variância de dois fatores com várias mostras por grupo
Suponha que você tenha um restaurante mexicano e que tenha criado um novo molho para as enchiladas. Por alguma razão, parece que os homens gostam mais do molho do que as mulheres. Então você decide fazer um pequeno estudo com um grupo de 10 mulheres e 10 homens para verificar a opinião deles sobre os dois molhos. As opiniões deles são medidas numa escala de 100 pontos. Existe alguma relação significativa entre os homens e as mulheres e entre o molho anterior e o molho novo?
Estudo: Resultado sobre o sabor do molho novo |
||
|
Homens |
Mulheres |
Opinião do molho da receita anterior |
85 |
69 |
74 |
65 |
|
96 |
63 |
|
62 |
70 |
|
80 |
72 |
|
78 |
59 |
|
90 |
64 |
|
79 |
70 |
|
85 |
68 |
|
80 |
73 |
|
Opinião do molho da receita nova |
68 |
85 |
64 |
75 |
|
62 |
97 |
|
69 |
80 |
|
73 |
88 |
|
61 |
81 |
|
64 |
91 |
|
72 |
83 |
|
70 |
84 |
|
71 |
82 |
Essa função faz uma Análise de Variância de dois fatores com várias mostras por grupo. Geralmente essa ANOVA é uma análise estatística que se utiliza para determinar se as médias de duas mostras ou mais vêm da mesma população. A função de ANOVA de várias fatores pede que se inclua a seguinte informação.
· Input Range: Faixa de entrada. Escreva a referência correspondente à faixa de dados da planilha que deseje analisar. A faixa de entrada deve incluir pelo menos duas faixas juntas, organizadas em colunas (como se vê a seguir) ou em filas.
· Output Range: Faixa de saída. Escreva a referência correspondente à célula superior esquerda da faixa onde deseja que os resultados apareçam.
Para utilizar as ferramentas de análise, selecione Análise de Dados do menu de Ferramentas. Dentro da opção de ferramenta de análise, escolha, "ANOVA: Two-factor With Replication". Depois, marque a Faixa de Entrada e a Faixa de Saída, indicando as células necessárias. Quando você utiliza a ferramenta de análise, o EXCEL cria uma tabela de resultados. Se você incluir títulos na faixa de entrada, o EXCEL os utiliza para os dados da tabela de saída. A seguir se vê a tabela dos dados desse exemplo.
Anova: |
|
|
|
Dois fatores com várias mostras por grupo |
|||
Resumo |
Homens |
Mulheres |
Total |
Receita Anterior |
|
|
|
Conta |
10 |
10 |
20 |
Soma |
809 |
673 |
1482 |
Média |
80.9 |
67.3 |
74.1 |
Variância |
84.77 |
19.57 |
98.09 |
Receita Nova |
|
|
|
Conta |
10 |
10 |
20 |
Soma |
674 |
846 |
1520 |
Média |
67.4 |
84.6 |
76 |
Variância |
18.71 |
38.04 |
104.7 |
Total |
|
|
|
Conta |
20 |
20 |
|
Soma |
1483 |
1519 |
|
Média |
74.15 |
75.95 |
|
Variância |
96.98 |
106.1 |
|
ANOVA |
|
|
|
|
|
|
Origem de Variações |
Soma de Quadrados |
Graus de Liberdade |
Média Quadrada |
F |
Prob. |
Valor Crítico |
Mostra |
36.1 |
1 |
36.1 |
0.896 |
0.35 |
4.11 |
Colunas |
32.4 |
1 |
32.4 |
0.805 |
0.376 |
4.11 |
Interação |
2372 |
1 |
2372 |
58.89 |
4E-09 |
4.11 |
Dentro |
1450 |
36 |
40.27 |
|
|
|
Total |
3890 |
39 |
|
|
|
|
O resultado de uma ANOVA lhe dá o valor estatístico de "F." Nesse caso, o valor de "F" da mostra (receita anterior e receita nova) é 0.896. Para saber se esses resultados são significativos (ou seja, se a probabilidade "P" tem um valor inferior a 0.05), o valor de "F" precisa chegar pelo menos ao 4.11 (o que é o valor crítico de "F"). Então, já que o valor de nosso "F" é de 0.896 e ele não é mais do que o valor crítico de "F", não podemos dizer que exista uma diferença significativa. Ao mesmo tempo, porém, é preciso interpretar o valor de "F" que está relacionado ao efeito de uma interação. O efeito de uma interação nega, de certa forma, o efeito principal. Nesse exemplo existe um efeito de interação muito grande (o valor de "F"=58.89). Em outras palavras, é verdade que existe uma diferença significativa entre a opinião dos homens e as mulheres sobre o molho anterior e o molho novo. A probablidade mostra a que nível os resultados são estatísticamente significativos.
Imagine que a companhia Nossa Esfirra, S.A. precise distibuir massa
recém-feita diariamente e que é importante verificar o número de pacotes que
sobram no final do dia. Nossa
Esfirra, S.A. fez um pequeno estudo para verificar o número de pacotes que
sobraram em várias lojas em quatro cidades diferentes (Novo Hamburgo, Nova
Petrópolis, Bento Gonçalves, e Farropilha). De acordo com o resultado desse estudo,
a companhia mudou alguns de seus procedimentos de distribuição. Depois de algum tempo, fizeram outro
estudo para contar o número de pacotes que sobraram outra vez. Existe alguma diferença significativa
em relação às mudanças de distribuição? Será que essas mudanças se aplicam para
todas as cidades?
Número de pacotes
excedentes de massa |
|
|||
|
|
(Em 10 lojas por cada cidade) |
||
|
N. Hamburgo |
N. Petrópolis |
B. Gonçalves |
Farropilha |
Antes |
20 |
15 |
25 |
26 |
|
36 |
20 |
37 |
36 |
|
45 |
40 |
44 |
45 |
|
27 |
35 |
25 |
21 |
|
45 |
30 |
46 |
48 |
|
33 |
21 |
34 |
32 |
|
21 |
20 |
25 |
24 |
|
22 |
30 |
25 |
26 |
|
15 |
12 |
17 |
18 |
|
34 |
10 |
33 |
32 |
Depois |
15 |
14 |
14 |
25 |
|
20 |
21 |
21 |
33 |
|
20 |
39 |
22 |
44 |
|
21 |
30 |
20 |
20 |
|
33 |
31 |
34 |
47 |
|
20 |
20 |
21 |
34 |
|
15 |
19 |
14 |
20 |
|
14 |
32 |
13 |
24 |
|
10 |
15 |
9 |
15 |
|
25 |
9 |
26 |
29 |
Anova: |
|
|
|
|
|
|
Dois fatores com várias mostras por grupo |
|
|||||
Resumo |
Novo Hamburgo |
Nova Petrópolis |
Bento Gonçalves |
Farropilha |
Total |
|
Antes da Mudança |
|
|
|
|
|
|
Conta |
10 |
10 |
10 |
10 |
40 |
|
Soma |
298 |
233 |
311 |
308 |
1150 |
|
Média |
29.8 |
23.3 |
31.1 |
30.8 |
28.75 |
|
Variância |
109.96 |
100.67 |
86.98 |
97.33 |
101.62 |
|
Depois de Mudança |
|
|
|
|
|
|
Conta |
10 |
10 |
10 |
10 |
40 |
|
Soma |
193 |
230 |
194 |
291 |
908 |
|
Média |
19.3 |
23.0 |
19.4 |
29.1 |
22.7 |
|
Variância |
41.79 |
91.11 |
52.93 |
109.87 |
84.52 |
|
Total |
|
|
|
|
|
|
Conta |
20 |
20 |
20 |
20 |
|
|
Soma |
491 |
463 |
505 |
599 |
|
|
Média |
24.55 |
23.15 |
25.25 |
29.95 |
|
|
Variância |
100.89 |
90.87 |
102.30 |
99.10 |
|
|
ANOVA |
|
|
|
|
|
|
Origem de Variações |
Soma de Quadrados |
Graus de Liberdade |
Média Quadrada |
F |
Prob. |
Valor Crítico |
Mostra |
732.05 |
1 |
732.05 |
8.474 |
0.0047 |
3.973 |
Colunas |
521.75 |
3 |
173.91 |
2.013 |
0.1196 |
2.731 |
Interação |
518.55 |
3 |
172.85 |
2.001 |
0.1214 |
2.731 |
Dentro |
6219.6 |
72 |
86.38 |
|
|
|
Total |
7991.95 |
|
|
|
|
|
Note-se: O valor significativo de "F" para as mostras (i.e., antes e depois da mudança) nos indica que exite uma diferença significativa na mudança do número de pacotes que sobraram. O valor não significativo de "F" para as colunas (i.e., as quatro cidades) nos indica que a mudança teve o mesmo efeito em todas as cidades, não existe diferença entre as cidades. O valor não significativo de "F" para a interação nos indica que não existe um efeito de interação nas variáveis. (Isso é bom, porque muitas vezes uma interação nega a validez dos outros valores de "F").