Herramienta para Análisis de Datos:

ANOVA: Análisis de varianza de dos factores con una sola muestra por grupo

Problema ejemplo:

Suponga que usted haya experimentado con levadura para una receta de panes dulces.  Parece ser que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes.  Basándose en los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de estas recetas.

Levadura: Tamaño de los panes dulces
 
Agua Fría
Agua Tibia
Agua Caliente
Poco Azúcar
75
87
60
Azúcar Normal
74
82
55
Mucho Azúcar
70
79
53

Observaciones:

Esta función permite realizar un análisis de varianza de dos factores con una sola muestra por grupo. En general, el análisis de varianza es un procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras han sido extraídas de poblaciones con la misma media. La función de ANOVA: dos factores con una sola muestra por grupo le pide que provee la siguiente información.

Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación.

Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados.

Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la caja de herramienta de análisis, escoja "ANOVA: Two-factor Without Replication." En seguida, registre el Rango de entrada y el Rango de Salida, refiriéndose a la dirección de las celdas requeridas. Cuando utilize una herramienta de análisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.

 
Anova: Dos factores con una sola muestra
Resumen
Cuenta
Suma
Promedio
Varianza
Poco Azúcar
3
222
74
183
Azucar Normal
3
211
70.33
192.33
Mucho Azúcar
3
202
67.33
174.33
 
 
 
 
 
Agua Fría
3
219
73
7
Agua Tibia
3
248
82.67
16.33
Agua Caliente
3
168
56
13
 
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Filas
66.89
2
33.44
23.15
0.0063
6.94
Columnas
1093.56
2
546.78
378.53
2.7E-05
6.94
Error
5.78
4
1.44
 
 
 
 
 
 
 
 
 
 
Total
1166.22
8
 
 
 
 
 

El resultado del ANOVA (Análisis de varianza) indica el valor estadístico de la "F." En este caso el valor de la "F" por las filas (cantidad de azúcar) es 23.15. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" observado necesita ser al menos 6.94 (o sea, el valor crítico de la F). Entonces, como el valor de "F" observado es de 23.15 y es mucho mayor que el valor crítico de la F (6.94), estamos seguros que los resultados de nuestras pruebas son significativas. El valor de la "F" para las columnas (temperatura del agua) es igual a 378.53. Esto es también significativo, porque el valor de "F" crítico es solamente 6.94. En otras palabras, existe una relación significativa en la cantidad de azúcar, la temperatura del agua y el tamaño de los panes dulces. La probabilidad muestra a qué nivel los resultados son estadísticamente significativos.


Problema para el estudiante:

Imagine que la compañía Tortillas Familiares, S.A. haya analizado el número de clientes que entra a la tienda principal. Cada hora, ellos han contado el número promedio de clientes que entra a la tienda. Estos números están resumidos por hora y por trimestre. ¿Existe alguna relación significativa en el número de clientes que entra a la tienda por medio de las variables que son la hora y el trimestre del año?

Promedio de clientes en la tienda

Hora

Trim 1

Trim 2

Trim 3

Trim 4

8:00AM

7

4

5

9

9:00AM

10

7

8

20

10:00AM

25

15

17

35

11:00AM

50

20

25

67

12:00PM

75

35

40

85

1:00PM

79

40

46

103

2:00PM

74

43

49

96

3:00PM

68

38

38

85

4:00PM

52

34

38

80

5:00PM

54

30

35

86

6:00PM

45

25

30

85

7:00PM

69

27

35

75

8:00PM

50

20

33

70

9:00PM

40

17

29

62

 
Anova: Dos factores con una sola muestra
Resumen
Cuenta
Suma
Promedio
Varianza
8:00 AM
4
25
6.25
4.916
9:00 AM
4
45
23
35.58
10:00 AM
4
92
23
82.67
11:00 AM
4
162
40.5
484.33
12:00 PM
4
235
58.75
622.92
1:00 PM
4
268
67
870
2:00 PM
4
262
65.5
593.67
3:00 PM
4
229
57.25
542.25
4:00 PM
4
204
51
433.33
5:00 PM
4
205
51.25
643.58
6:00 PM
4
185
46.25
739.58
7:00 PM
4
206
51.5
577
8:00 PM
4
173
43.25
468.92
9:00 PM
4
148
37
366
 
 
 
 
 
Trim 1
14
698
49.85
534.29
Trim 2
14
355
25.35
146.55
Trim 3
14
428
30.57
169.49
Trim 4
14
958
68.42
792.73
 
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Filas
18179.58
13
1398.42
17.149
3.19E-12
1.98
Columnas
16214.05
3
5404.68
66.28
2.27E-15
2.84
Error
3180.19
39
81.54
 
 
 
 
 
 
 
 
 
 
Total
37573.83
8
 
 
 
 
 

Nótese: El valor de F significativo para las filas (i.e., la hora del día) nos indica que de acuerdo con la hora del día, hay una diferencia significativa en el número de clientes que pasa por la tienda.  El valor significativo para las columnas (i.e., trimestre) nos indica que de acuerdo con el trimestre del año, hay una diferencia significativa en el número de clientes que pasa por la tienda.