ANOVA: Análisis de varianza de dos factores con varias muestras por grupo
Suponga que usted tenga un restaurante y haya creado una nueva receta de salsa para las enchiladas. Por alguna razón parece ser que a sus clientes varones les gusta más la salsa anterior que la nueva. Pero también parece ser que a sus clientes femeninas prefieren la nueva salsa que la anterior. Usted decide realizar una prueba con un grupo de 10 mujeres y 10 varones dándole a probar las dos salsas, basándose en una escala de 100 puntos para el sabor de las dos salsas. ¿Existe alguna relación significativa desde el punto de vista de los clientes varones y clientes femeninas y cómo ven la nueva y la anterior salsa para las enchiladas?
Encuesta: Resultado sobre el sabor de la nueva salsa |
||
Hombres |
Mujeres |
|
Opinión de la salsa de la receta anterior |
85 |
69 |
74 |
65 |
|
96 |
63 |
|
62 |
70 |
|
80 |
72 |
|
78 |
59 |
|
90 |
64 |
|
79 |
70 |
|
85 |
68 |
|
80 |
73 |
|
Opinión de la salsa de la receta nueva |
68 |
85 |
64 |
75 |
|
62 |
97 |
|
69 |
80 |
|
73 |
88 |
|
61 |
81 |
|
64 |
91 |
|
72 |
83 |
|
70 |
84 |
|
71 |
82 |
Esta función permite realizar un análisis de varianza de dos factores con varias muestras por grupo. En general, el análisis de varianza es un procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras han sido extraídas de poblaciones con la misma media. La función de ANOVA: dos factores con varias muestras por grupo le pide que provee la siguiente información.
Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación
Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados.
Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la caja de herramienta de análisis, escoja "ANOVA: Two-factor With Replication." En seguida, registre el Rango de entrada y el Rango de salida, refiriéndose a la dirección de las celdas requeridas. Cuando utilize una herramienta de analisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.
Anova: |
|||
Dos factores con varias muestras por grupo |
|||
Resumen |
Hombres |
Mujeres |
Total |
Receta Anterior |
|||
Cuenta |
10 |
10 |
20 |
Suma |
809 |
673 |
1482 |
Promedio |
80.9 |
67.3 |
74.1 |
Varianza |
84.77 |
19.57 |
98.09 |
Receta Nueva |
|||
Cuenta |
10 |
10 |
20 |
Suma |
674 |
846 |
1520 |
Promedio |
67.4 |
84.6 |
76 |
Varianza |
18.71 |
38.04 |
104.7 |
Total |
|||
Cuenta |
20 |
20 |
|
Suma |
1483 |
1519 |
|
Promedio |
74.15 |
75.95 |
|
Varianza |
96.98 |
106.1 |
ANOVA |
||||||
Origen de Variaciones |
Suma de Cuadrados |
Grados Libertad |
Promedio Cuadrados |
F |
Prob. |
Valor Crítico |
Muestra |
36.1 |
1 |
36.1 |
0.896 |
0.35 |
4.11 |
Columnas |
32.4 |
1 |
32.4 |
0.805 |
0.376 |
4.11 |
Interacción |
2372 |
1 |
2372 |
58.89 |
4E-09 |
4.11 |
Dentro |
1450 |
36 |
40.27 |
|||
Total |
3890 |
39 |
El resultado del ANOVA (Análisis de varianza) indica el valor estadístico de la "F." En este caso el valor de la "F" de la muestra (receta anterior y receta nueva) es 0.896. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" necesita ser al menos 4.11 (o sea, el valor crítico de la F). Entonces, como el valor de nuestra "F" es de 0.896 y es no es mayor que el valor crítico de la F, no podemos decir que existe alguna diferencia significativa. Sin embargo, a la vez necesitamos interpretar qué significa el valor de F que está relacionado al efecto de una interacción. Siempre un efecto de interación sobrepasa el efecto principal. En este caso tenemos un gran efecto de interacción (el valor de la "F"=58.89). En otras palabras, sí existe una diferencia significativa entre la opinión de los hombres y de las mujeresa relacionada a la receta anterior y a la nueva. La probabilidad demuestra a qué nivel los resultados son estadísticamente significativos.
Imagine que la compañía Tortillas Familiares, S.A. necesite distribuir
tortillas recién hechas diariamente y que sea importante reportar el número mínimo
de paquetes sobrantes diariamente. La compañía Tortillas Familiares ha checado
el número de paquetes sobrantes en las tiendas en cuatro diferentes localidades
(Chihuahua, Monclova, Saltillo, y Monterrey). Basándose en estos números, la
compañía cambió algunos de sus procedimientos de distribución. Después checaron otra vez para ver si
hubo menos paquetes sobrantes.
¿Existe alguna diferencia significativa en el número de paquetes
sobrantes en relación con los cambios de distribución? ¿Estos cambios se
aplican para todas las localidades?
Número de paquetes sobrantes de tortillas |
|
|||
|
|
(En 10 tiendas por ciudad) |
||
|
Chihuahua |
Monclova |
Saltillo |
Monterrey |
Pre-Modificación |
20 |
15 |
25 |
26 |
|
36 |
20 |
37 |
36 |
|
45 |
40 |
44 |
45 |
|
27 |
35 |
25 |
21 |
|
45 |
30 |
46 |
48 |
|
33 |
21 |
34 |
32 |
|
21 |
20 |
25 |
24 |
|
22 |
30 |
25 |
26 |
|
15 |
12 |
17 |
18 |
|
34 |
10 |
33 |
32 |
Pos-Modificación |
15 |
14 |
14 |
25 |
|
20 |
21 |
21 |
33 |
|
20 |
39 |
22 |
44 |
|
21 |
30 |
20 |
20 |
|
33 |
31 |
34 |
47 |
|
20 |
20 |
21 |
34 |
|
15 |
19 |
14 |
20 |
|
14 |
32 |
13 |
24 |
|
10 |
15 |
9 |
15 |
|
25 |
9 |
26 |
29 |
Anova: |
||||||
Dos factores con varias muestras por grupo |
|
|||||
Resumen |
Chihuahua |
Monclova |
Saltillo |
Monterrey |
Total |
|
Pré-Modificación |
||||||
Cuenta |
10 |
10 |
10 |
10 |
40 |
|
Suma |
298 |
233 |
311 |
308 |
1150 |
|
Promedio |
29.8 |
23.3 |
31.1 |
30.8 |
28.75 |
|
Varianza |
109.96 |
100.67 |
86.98 |
97.33 |
101.62 |
|
Pós-Modificación |
||||||
Cuenta |
10 |
10 |
10 |
10 |
40 |
|
Suma |
193 |
230 |
194 |
291 |
908 |
|
Promedio |
19.3 |
23.0 |
19.4 |
29.1 |
22.7 |
|
Varianza |
41.79 |
91.11 |
52.93 |
109.87 |
84.52 |
|
Total |
||||||
Cuenta |
20 |
20 |
20 |
20 |
||
Suma |
491 |
463 |
505 |
599 |
||
Promedio |
24.55 |
23.15 |
25.25 |
29.95 |
||
Varianza |
100.89 |
90.87 |
102.30 |
99.10 |
||
ANOVA |
||||||
Origen de Variaciones |
Suma de Cuadrados |
Grados Libertad |
Promedio Cuadrados |
F |
Prob. |
Valor Crítico |
Muestra |
732.05 |
1 |
732.05 |
8.474 |
0.0047 |
3.973 |
Columnas |
521.75 |
3 |
173.91 |
2.013 |
0.1196 |
2.731 |
Interacción |
518.55 |
3 |
172.85 |
2.001 |
0.1214 |
2.731 |
Dentro |
6219.6 |
72 |
86.38 |
|||
Total |
7991.95 |
Nótese: El valor de F signficativo para las muestras (i.e., pre- y pos-modificación nos indica que hay una diferencia significativa en el cambio en el número de paquetes sobrantes. El valor de F no significativo para las columnas (i.e., las cuatro ciudades) nos indica que los cambios tenían el mismo efecto en todas las ciudades, no hubo diferencia entre las ciudades. El valor de F no significativo para la interacción nos indica que no hay un efecto de interacción entre las variables (eso es bueno, pues una interacción muchas veces neiga la validez de los otros valores de F.)