Herramienta para Análisis de Datos:

ANOVA: Análisis de varianza de dos factores con varias muestras por grupo

Problema ejemplo:

Suponga que usted tenga un restaurante y haya creado una nueva receta de salsa para las enchiladas. Por alguna razón parece ser que a sus clientes varones les gusta más la salsa anterior que la nueva. Pero también parece ser que a sus clientes femeninas prefieren la nueva salsa que la anterior. Usted decide realizar una prueba con un grupo de 10 mujeres y 10 varones dándole a probar las dos salsas, basándose en una escala de 100 puntos para el sabor de las dos salsas.  ¿Existe alguna relación significativa desde el punto de vista de los clientes varones y clientes femeninas y cómo ven la nueva y la anterior salsa para las enchiladas?

Encuesta: Resultado sobre el sabor de la nueva salsa
 
Hombres
Mujeres
 
 
 
Opinión de la salsa de la receta anterior
85
69
74
65
96
63
62
70
80
72
78
59
90
64
79
70
85
68
80
73
 
 
 
Opinión de la salsa de la receta nueva
68
85
64
75
62
97
69
80
73
88
61
81
64
91
72
83
70
84
71
82
 

Observaciones

Esta función permite realizar un análisis de varianza de dos factores con varias muestras por grupo. En general, el análisis de varianza es un procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras han sido extraídas de poblaciones con la misma media. La función de ANOVA: dos factores con varias muestras por grupo le pide que provee la siguiente información.

Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación

Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados.

Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la caja de herramienta de análisis, escoja "ANOVA: Two-factor With Replication." En seguida, registre el Rango de entrada y el Rango de salida, refiriéndose a la dirección de las celdas requeridas. Cuando utilize una herramienta de analisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.

 
Anova:
 
 
 
Dos factores con varias muestras por grupo
Resumen
Hombres
Mujeres
Total
Receta Anterior
 
 
 
Cuenta
10
10
20
Suma
809
673
1482
Promedio
80.9
67.3
74.1
Varianza
84.77
19.57
98.09
Receta Nueva
 
 
 
Cuenta
10
10
20
Suma
674
846
1520
Promedio
67.4
84.6
76
Varianza
18.71
38.04
104.7
Total
 
 
 
Cuenta
20
20
 
Suma
1483
1519
 
Promedio
74.15
75.95
 
Varianza
96.98
106.1
 
 
 
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Muestra
36.1
1
36.1
0.896
0.35
4.11
Columnas
32.4
1
32.4
0.805
0.376
4.11
Interacción
2372
1
2372
58.89
4E-09
4.11
Dentro
1450
36
40.27
 
 
 
Total
3890
39
 
 
 
 
 

El resultado del ANOVA (Análisis de varianza) indica el valor estadístico de la "F." En este caso el valor de la "F" de la muestra (receta anterior y receta nueva) es 0.896. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" necesita ser al menos 4.11 (o sea, el valor crítico de la F). Entonces, como el valor de nuestra "F" es de 0.896 y es no es mayor que el valor crítico de la F, no podemos decir que existe alguna diferencia significativa. Sin embargo, a la vez necesitamos interpretar qué significa el valor de F que está relacionado al efecto de una interacción. Siempre un efecto de interación sobrepasa el efecto principal. En este caso tenemos un gran efecto de interacción (el valor de la "F"=58.89). En otras palabras, sí existe una diferencia significativa entre la opinión de los hombres y de las mujeresa relacionada a la receta anterior y a la nueva. La probabilidad demuestra a qué nivel los resultados son estadísticamente significativos.


Problema para el estudiante:

Imagine que la compañía Tortillas Familiares, S.A. necesite distribuir tortillas recién hechas diariamente y que sea importante reportar el número mínimo de paquetes sobrantes diariamente. La compañía Tortillas Familiares ha checado el número de paquetes sobrantes en las tiendas en cuatro diferentes localidades (Chihuahua, Monclova, Saltillo, y Monterrey). Basándose en estos números, la compañía cambió algunos de sus procedimientos de distribución.  Después checaron otra vez para ver si hubo menos paquetes sobrantes.  ¿Existe alguna diferencia significativa en el número de paquetes sobrantes en relación con los cambios de distribución? ¿Estos cambios se aplican para todas las localidades?

Número de paquetes sobrantes de tortillas

 

 

 

(En 10 tiendas por ciudad)

 

Chihuahua

Monclova

Saltillo

Monterrey

Pre-Modificación

20

15

25

26

 

36

20

37

36

 

45

40

44

45

 

27

35

25

21

 

45

30

46

48

 

33

21

34

32

 

21

20

25

24

 

22

30

25

26

 

15

12

17

18

 

34

10

33

32

Pos-Modificación

15

14

14

25

 

20

21

21

33

 

20

39

22

44

 

21

30

20

20

 

33

31

34

47

 

20

20

21

34

 

15

19

14

20

 

14

32

13

24

 

10

15

9

15

 

25

9

26

29

 

 
Anova:
 
 
 
 
 
Dos factores con varias muestras por grupo

 

Resumen
Chihuahua
Monclova
Saltillo
Monterrey
Total
Pré-Modificación
 
 
 
 
 
Cuenta
10
10
10
10
40
Suma
298
233
311
308
1150
Promedio
29.8
23.3
31.1
30.8
28.75
Varianza
109.96
100.67
86.98
97.33
101.62
Pós-Modificación
 
 
 
 
 
Cuenta
10
10
10
10
40
Suma
193
230
194
291
908
Promedio
19.3
23.0
19.4
29.1
22.7
Varianza
41.79
91.11
52.93
109.87
84.52
Total
 
 
 
 
 
Cuenta
20
20
20
20
 
Suma
491
463
505
599
 
Promedio
24.55
23.15
25.25
29.95
 
Varianza
100.89
90.87
102.30
99.10
 
 
 
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Muestra
732.05
1
732.05
8.474
0.0047
3.973
Columnas
521.75
3
173.91
2.013
0.1196
2.731
Interacción
518.55
3
172.85
2.001
0.1214
2.731
Dentro
6219.6
72
86.38
 
 
 
Total
7991.95
 
 
 
 
 
 

Nótese:  El valor de F signficativo para las muestras (i.e., pre- y pos-modificación nos indica que hay una diferencia significativa en el cambio en el número de paquetes sobrantes.  El valor de F no significativo para las columnas (i.e., las cuatro ciudades) nos indica que los cambios tenían el mismo efecto en todas las ciudades, no hubo diferencia entre las ciudades.  El valor de F no significativo para la interacción nos indica que no hay un efecto de interacción entre las variables (eso es bueno, pues una interacción muchas veces neiga la validez de los otros valores de F.)