Ferramenta para Análise de Dados:

ANOVA: Análise de Variância de dois fatores com somente uma mostra por grupo

Problema exemplo:

Suponha que você tenha experimentado com um fermento diferente para uma receita de pão doce.  Parece que a quantidade de açúcar e a temperatura da água afetam o tamanho dos pães.  Por isso, você faz um pequeno estudo e realiza uma Análise de Variância para verificar o que mais afeta sua receita.

Fermento: Tamanho dos Pães Doces
 
Água Fria
Água Morna
Água Quente
Pouco Açúcar
75
87
60
Açúcar Normal
74
82
55
Muito Açúcar
70
79
53

Observações:

Esta função permite realizar uma Análise de Variância de dois fatores com somente uma mostra por grupo.  Geralmente a análise é um processo estatístico que se utiliza para determinar se as médias de duas mostras ou mais vêm da mesma população.  A função de ANOVA de dois fatores com somente uma mostra por grupo pede que se inclua a seguinte informação:

·       Input Range: Faixa de entrada.  Escreva a referência correspondente à faixa de dados da planilha que você deseje analisar.  A faixa de entrada deve incluir pelo menos duas faixas juntas, organizadas em colunas (como se vê a seguir) ou em filas.

·       Output Range: Faixa de saída.  Escreva a referência correspondente à célula superior esquerda da faixa onde deseja que os resultados apareçam.

Para utilizar as ferramentas de análise, selecione Análise de Dade do menu de Ferramentas. Dentro da opção de ferramenta de análise, escolha, "ANOVA: Two-Factor Without Replication". Depois, marque a Faixa de Entrada e a Faixa de Saída, indicando as células necessárias.  Quando você utiliza a ferramenta de análise, o EXCEL cria uma tabela de resultados.  Se você incluir títulos na faixa de entrada, o EXCEL os utiliza para os dados da tabela de saída.  A seguir se vê a tabela dos dados desse exemplo.


 
Anova: Dois fatores com somente 1 mostra
Resumo
Conta
Soma
Média
Variância
Pouco Açúcar
3
222
74
183
Açúcar Normal
3
211
70.33
192.33
Muito Açúcar
3
202
67.33
174.33
 
 
 
 
 
Água Fria
3
219
73
7
Água Morna
3
248
82.67
16.33
Água Quente
3
168
56
13
 
 
ANOVA
 
 
 
 
 
 
Origem de Variações
Soma de Quadrados
Graus de Liberdade
Média Quadrada
F
Prob.
Valor Crítico
Filas
66.89
2
33.44
23.15
0.0063
6.94
Colunas
1093.56
2
546.78
378.53
2.7E-05
6.94
Erro
5.78
4
1.44
 
 
 
 
 
 
 
 
 
 
Total
1166.22
8
 
 
 
 
 

O resultado da ANOVA indica o valor estatístico de "F." Nesse caso o valor de "F" pelas filas (quantidade de açúcar) é 23.15.  Para saber se esses resultados são significativos (quer dizer, se a probabilidade "P" tiver um valor menos de 0.05), o valor de "F" precisa ser pelo menos 6.94 (quer dizer, o valor crítico de "F").  Então, já que o valor observado de "F" é de 23.15 e é muito mais do que o valor crítico de "F" (6.94), estamos seguros de que os resultados são significativos.  O valor de "F" para as colunas (temperatura da água) é igual a 378.53.  Esse também é significativo porque o valor crítico de "F" é somente 6.94.  Em outras palavras, existe uma relação significativa na quantidade de açúcar, a temperatura da água e o tamanho dos pães doces.  A probabilidade mostra a que nível os resultados são estatisticamente significativos.



Problema para o aluno:

Imagine que a companhia Nossa Esfirra, S.A. tenha investigado o número de clientes que entram  na loja principal.  Cada hora eles contaram o número médio de fregueses que entraram.  Esses números foram tabulados por hora e trimestre.  Existe alguma relação signficativa entre o número de fregueses que entram na loja por meio das variáveis que são a hora do dia e o trimestre do ano?

Média de Fregueses na Loja

Hora

Trim 1

Trim 2

Trim 3

Trim 4

8:00 hrs

7

4

5

9

9:00 hrs

10

7

8

20

10:00 hrs

25

15

17

35

11:00 hrs

50

20

25

67

12:00 hrs

75

35

40

85

13:00 hrs

79

40

46

103

14:00 hrs

74

43

49

96

15:00 hrs

68

38

38

85

16:00 hrs

52

34

38

80

17:00 hrs

54

30

35

86

18:00 hrs

45

25

30

85

19:00 hrs

69

27

35

75

20:00 hrs

50

20

33

70

21:00 hrs

40

17

29

62

 
Anova: Dois fatores com 1 mostra
Resumo
Conta
Soma
Média
Variância

8:00 hrs

4
25
6.25
4.916

9:00 hrs

4
45
23
35.58

10:00 hrs

4
92
23
82.67

11:00 hrs

4
162
40.5
484.33

12:00 hrs

4
235
58.75
622.92

13:00 hrs

4
268
67
870

14:00 hrs

4
262
65.5
593.67

15:00 hrs

4
229
57.25
542.25

16:00 hrs

4
204
51
433.33

17:00 hrs

4
205
51.25
643.58

18:00 hrs

4
185
46.25
739.58

19:00 hrs

4
206
51.5
577

20:00 hrs

4
173
43.25
468.92

21:00 hrs

4
148
37
366
 
 
 
 
 
Trim 1
14
698
49.85
534.29
Trim 2
14
355
25.35
146.55
Trim 3
14
428
30.57
169.49
Trim 4
14
958
68.42
792.73
 
 
 
 
 
ANOVA
 
 
 
 
 
 
Origem de Variações
Soma de Quadrados
Graus de Liberdade
Média Quadrada
F
Prob.
Valor Crítico
Filas
18179.58
13
1398.42
17.149
3.19E-12
1.98
Colunas
16214.05
3
5404.68
66.28
2.27E-15
2.84
Erro
3180.19
39
81.54
 
 
 
 
 
 
 
 
 
 
Total
37573.83
8
 
 
 
 
 

Note-se:  O valor significativo de "F" para as filas (i.e., a hora do dia) nos indica que de acordo com a hora do dia, existe uma diferença significativa no número de fregueses que entram na loja.  O valor significativo para as colunas (i.e., trimestre) nos indica que, de acordo com o trimestre do ano, também existe uma diferença significativa no número de fregueses que entram na loja.