ANOVA: Análisis de varianza de dos factores con una sola muestra por grupo
Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes. Basándose en los siguientes datos, usted realiza un análisis de varianza para averiguar lo que es significativo de estas recetas.
Levadura: Tamaño de los panes dulces |
|||
Agua Fría |
Agua Tibia |
Agua Caliente |
|
Poco Azúcar |
75 |
87 |
60 |
Azúcar Normal |
74 |
82 |
55 |
Mucho Azúcar |
70 |
79 |
53 |
Esta función permite realizar un análisis de varianza de dos factores con una sola muestra por grupo. En general, el análisis de varianza es un procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras han sido extraídas de poblaciones con la misma media. La función de ANOVA: dos factores con una sola muestra por grupo le pide que provee la siguiente información.
Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación.
Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados.
Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la caja de herramienta de análisis, escoja "ANOVA: Two-factor Without Replication." En seguida, registre el Rango de entrada y el Rango de Salida, refiriéndose a la dirección de las celdas requeridas. Cuando utilize una herramienta de análisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.
Anova: Dos factores con una sola muestra |
||||
Resumen |
Cuenta |
Suma |
Promedio |
Varianza |
Poco Azúcar |
3 |
222 |
74 |
183 |
Azucar Normal |
3 |
211 |
70.33 |
192.33 |
Mucho Azúcar |
3 |
202 |
67.33 |
174.33 |
Agua Fría |
3 |
219 |
73 |
7 |
Agua Tibia |
3 |
248 |
82.67 |
16.33 |
Agua Caliente |
3 |
168 |
56 |
13 |
ANOVA |
||||||
Origen de Variaciones |
Suma de Cuadrados |
Grados Libertad |
Promedio Cuadrados |
F |
Prob. |
Valor Crítico |
Filas |
66.89 |
2 |
33.44 |
23.15 |
0.0063 |
6.94 |
Columnas |
1093.56 |
2 |
546.78 |
378.53 |
2.7E-05 |
6.94 |
Error |
5.78 |
4 |
1.44 |
|||
Total |
1166.22 |
8 |
El resultado del ANOVA (Análisis de varianza) indica el valor estadístico de la "F." En este caso el valor de la "F" por las filas (cantidad de azúcar) es 23.15. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" observado necesita ser al menos 6.94 (o sea, el valor crítico de la F). Entonces, como el valor de "F" observado es de 23.15 y es mucho mayor que el valor crítico de la F (6.94), estamos seguros que los resultados de nuestras pruebas son significativas. El valor de la "F" para las columnas (temperatura del agua) es igual a 378.53. Esto es también significativo, porque el valor de "F" crítico es solamente 6.94. En otras palabras, existe una relación significativa en la cantidad de azúcar, la temperatura del agua y el tamaño de los panes dulces. La probabilidad muestra a qué nivel los resultados son estadísticamente significativos.
Imagine que la compañía Tortillas Familiares, S.A. haya analizado el
número de clientes que entra a la tienda principal. Cada hora, ellos han contado
el número promedio de clientes que entra a la tienda. Estos números están
resumidos por hora y por trimestre. ¿Existe alguna relación significativa en el
número de clientes que entra a la tienda por medio de las variables que son la
hora y el trimestre del año?
Promedio de clientes
en la tienda |
||||
Hora |
Trim 1 |
Trim 2 |
Trim 3 |
Trim 4 |
8:00AM |
7 |
4 |
5 |
9 |
9:00AM |
10 |
7 |
8 |
20 |
10:00AM |
25 |
15 |
17 |
35 |
11:00AM |
50 |
20 |
25 |
67 |
12:00PM |
75 |
35 |
40 |
85 |
1:00PM |
79 |
40 |
46 |
103 |
2:00PM |
74 |
43 |
49 |
96 |
3:00PM |
68 |
38 |
38 |
85 |
4:00PM |
52 |
34 |
38 |
80 |
5:00PM |
54 |
30 |
35 |
86 |
6:00PM |
45 |
25 |
30 |
85 |
7:00PM |
69 |
27 |
35 |
75 |
8:00PM |
50 |
20 |
33 |
70 |
9:00PM |
40 |
17 |
29 |
62 |
Anova: Dos factores con una sola muestra |
||||
Resumen |
Cuenta |
Suma |
Promedio |
Varianza |
8:00 AM |
4 |
25 |
6.25 |
4.916 |
9:00 AM |
4 |
45 |
23 |
35.58 |
10:00 AM |
4 |
92 |
23 |
82.67 |
11:00 AM |
4 |
162 |
40.5 |
484.33 |
12:00 PM |
4 |
235 |
58.75 |
622.92 |
1:00 PM |
4 |
268 |
67 |
870 |
2:00 PM |
4 |
262 |
65.5 |
593.67 |
3:00 PM |
4 |
229 |
57.25 |
542.25 |
4:00 PM |
4 |
204 |
51 |
433.33 |
5:00 PM |
4 |
205 |
51.25 |
643.58 |
6:00 PM |
4 |
185 |
46.25 |
739.58 |
7:00 PM |
4 |
206 |
51.5 |
577 |
8:00 PM |
4 |
173 |
43.25 |
468.92 |
9:00 PM |
4 |
148 |
37 |
366 |
Trim 1 |
14 |
698 |
49.85 |
534.29 |
Trim 2 |
14 |
355 |
25.35 |
146.55 |
Trim 3 |
14 |
428 |
30.57 |
169.49 |
Trim 4 |
14 |
958 |
68.42 |
792.73 |
ANOVA |
||||||
Origen de Variaciones |
Suma de Cuadrados |
Grados Libertad |
Promedio Cuadrados |
F |
Prob. |
Valor Crítico |
Filas |
18179.58 |
13 |
1398.42 |
17.149 |
3.19E-12 |
1.98 |
Columnas |
16214.05 |
3 |
5404.68 |
66.28 |
2.27E-15 |
2.84 |
Error |
3180.19 |
39 |
81.54 |
|||
Total |
37573.83 |
8 |
Nótese: El valor de F significativo para las filas (i.e., la hora del día) nos indica que de acuerdo con la hora del día, hay una diferencia significativa en el número de clientes que pasa por la tienda. El valor significativo para las columnas (i.e., trimestre) nos indica que de acuerdo con el trimestre del año, hay una diferencia significativa en el número de clientes que pasa por la tienda.