Ferramenta para Análise de Dados:

ANOVA: Análise de Variância de dois fatores com várias mostras por grupo

Problema exemplo:

Suponha que você tenha um restaurante mexicano e que tenha criado um novo molho para as enchiladas.  Por alguma razão, parece que os homens gostam mais do molho do que as mulheres.  Então você decide fazer um pequeno estudo com um grupo de 10 mulheres e 10 homens para verificar a opinião deles sobre os dois molhos.  As opiniões deles são medidas numa escala de 100 pontos.  Existe alguma relação significativa entre os homens e as mulheres e entre o molho anterior e o molho novo?

Estudo: Resultado sobre o sabor do molho novo
 
Homens
Mulheres
 
 
 
Opinião do molho da receita anterior
85
69
74
65
96
63
62
70
80
72
78
59
90
64
79
70
85
68
80
73
 
 
 
Opinião do molho da receita nova
68
85
64
75
62
97
69
80
73
88
61
81
64
91
72
83
70
84
71
82
 

Observações

Essa função faz uma Análise de Variância de dois fatores com várias mostras por grupo. Geralmente essa ANOVA é uma análise estatística que se utiliza para determinar se as médias de duas mostras ou mais vêm da mesma população.  A função de ANOVA de várias fatores pede que se inclua a seguinte informação.

·       Input Range: Faixa de entrada.  Escreva a referência correspondente à faixa de dados da planilha que deseje analisar.  A faixa de entrada deve incluir pelo menos duas faixas juntas, organizadas em colunas (como se vê a seguir) ou em filas.

·       Output Range: Faixa de saída.  Escreva a referência correspondente à célula superior esquerda da faixa onde deseja que os resultados apareçam.

Para utilizar as ferramentas de análise, selecione Análise de Dados do menu de Ferramentas. Dentro da opção de ferramenta de análise, escolha, "ANOVA: Two-factor With Replication". Depois, marque a Faixa de Entrada e a Faixa de Saída, indicando as células necessárias.  Quando você utiliza a ferramenta de análise, o EXCEL cria uma tabela de resultados.  Se você incluir títulos na faixa de entrada, o EXCEL os utiliza para os dados da tabela de saída.  A seguir se vê a tabela dos dados desse exemplo.

Anova:
 
 
 
Dois fatores com várias mostras por grupo
Resumo
Homens
Mulheres
Total
Receita Anterior
 
 
 
Conta
10
10
20
Soma
809
673
1482
Média
80.9
67.3
74.1
Variância
84.77
19.57
98.09
Receita Nova
 
 
 
Conta
10
10
20
Soma
674
846
1520
Média
67.4
84.6
76
Variância
18.71
38.04
104.7
Total
 
 
 
Conta
20
20
 
Soma
1483
1519
 
Média
74.15
75.95
 
Variância
96.98
106.1
 
 
 
 
ANOVA
 
 
 
 
 
 
Origem de Variações
Soma de Quadrados
Graus de Liberdade
Média Quadrada
F
Prob.
Valor Crítico
Mostra
36.1
1
36.1
0.896
0.35
4.11
Colunas
32.4
1
32.4
0.805
0.376
4.11
Interação
2372
1
2372
58.89
4E-09
4.11
Dentro
1450
36
40.27
 
 
 
Total
3890
39
 
 
 
 
 

O resultado de uma ANOVA lhe dá o valor estatístico de "F." Nesse caso, o valor de "F" da mostra (receita anterior e receita nova) é 0.896. Para saber se esses resultados são significativos (ou seja, se a probabilidade "P" tem um valor inferior a 0.05), o valor de "F" precisa chegar pelo menos ao 4.11 (o que é o valor crítico de "F"). Então, já que o valor de nosso "F" é de 0.896 e ele não é mais do que o valor crítico de "F", não podemos dizer que exista uma diferença significativa.  Ao mesmo tempo, porém, é preciso interpretar o valor de "F" que está relacionado ao efeito de uma interação.  O efeito de uma interação nega, de certa forma, o efeito principal.  Nesse exemplo existe um efeito de interação muito grande (o valor de "F"=58.89).  Em outras palavras, é verdade que existe uma diferença significativa entre a opinião dos homens e as mulheres sobre o molho anterior e o molho novo.  A probablidade mostra a que nível os resultados são estatísticamente significativos.



Problema para o aluno:

Imagine que a companhia Nossa Esfirra, S.A. precise distibuir massa recém-feita diariamente e que é importante verificar o número de pacotes que sobram no final do dia.  Nossa Esfirra, S.A. fez um pequeno estudo para verificar o número de pacotes que sobraram em várias lojas em quatro cidades diferentes (Novo Hamburgo, Nova Petrópolis, Bento Gonçalves, e Farropilha). De acordo com o resultado desse estudo, a companhia mudou alguns de seus procedimentos de distribuição.  Depois de algum tempo, fizeram outro estudo para contar o número de pacotes que sobraram outra vez.  Existe alguma diferença significativa em relação às mudanças de distribuição? Será que essas mudanças se aplicam para todas as cidades?

Número de pacotes excedentes de massa

 

 

 

(Em 10 lojas por cada cidade)

 

N. Hamburgo

N. Petrópolis

B. Gonçalves

Farropilha

Antes

20

15

25

26

 

36

20

37

36

 

45

40

44

45

 

27

35

25

21

 

45

30

46

48

 

33

21

34

32

 

21

20

25

24

 

22

30

25

26

 

15

12

17

18

 

34

10

33

32

Depois

15

14

14

25

 

20

21

21

33

 

20

39

22

44

 

21

30

20

20

 

33

31

34

47

 

20

20

21

34

 

15

19

14

20

 

14

32

13

24

 

10

15

9

15

 

25

9

26

29

 


 

 
Anova:
 
 
 
 
 
Dois fatores com várias mostras por grupo

 

Resumo
Novo Hamburgo
Nova Petrópolis
Bento Gonçalves
Farropilha
Total
Antes da Mudança
 
 
 
 
 
Conta
10
10
10
10
40
Soma
298
233
311
308
1150
Média
29.8
23.3
31.1
30.8
28.75
Variância
109.96
100.67
86.98
97.33
101.62
Depois de Mudança
 
 
 
 
 
Conta
10
10
10
10
40
Soma
193
230
194
291
908
Média
19.3
23.0
19.4
29.1
22.7
Variância
41.79
91.11
52.93
109.87
84.52
Total
 
 
 
 
 
Conta
20
20
20
20
 
Soma
491
463
505
599
 
Média
24.55
23.15
25.25
29.95
 
Variância
100.89
90.87
102.30
99.10
 
 
 
ANOVA
 
 
 
 
 
 
Origem de Variações
Soma de Quadrados
Graus de Liberdade
Média Quadrada
F
Prob.
Valor Crítico
Mostra
732.05
1
732.05
8.474
0.0047
3.973
Colunas
521.75
3
173.91
2.013
0.1196
2.731
Interação
518.55
3
172.85
2.001
0.1214
2.731
Dentro
6219.6
72
86.38
 
 
 
Total
7991.95
 
 
 
 
 
 

Note-se:  O valor significativo de "F" para as mostras (i.e., antes e depois da mudança) nos indica que exite uma diferença significativa na mudança do número de pacotes que sobraram.  O valor não significativo de "F" para as colunas (i.e., as quatro cidades) nos indica que a mudança teve o mesmo efeito em todas as cidades, não existe diferença entre as cidades.  O valor não significativo de "F" para a interação nos indica que não existe um efeito de interação nas variáveis.  (Isso é bom, porque muitas vezes uma interação nega a validez dos outros valores de "F").