Herramienta para Análisis de Datos:

ANOVA: Análisis de varianza de un solo factor

Problema ejemplo:

Suponga que usted sea dueño de un restaurante mexicano y que ofrezca una salsa especial que acompaña las enchiladas. Usted cuenta con clientes regulares que vienen todos los días. La mayoría de sus clientes son estudiantes, obreros o unos empleados de oficina. Algunos de ellos casi siempre piden la salsa especial, pero usted tiene la impresión de que a los estudiantes y a los obreros les gusta más esta salsa que a los empleados. Basándose en 10 días representativos para cada grupo, ¿existe en este caso alguna relación significativa?

Número de veces que los clientes
piden la salsa especial
Día
Estudiantes
Empleados
Obreros
1
25
15
25
2
10
18
29
3
14
13
28
4
14
15
27
5
20
14
25
6
27
9
28
7
19
9
29
8
22
10
27
9
19
11
26
10
14
13
28

Observaciones:

La función Análisis de Varianza de un solo factor realiza un análisis de varianza sencillo, que somete a prueba la hipótesis según la cual las medias de varias muestras son iguales. Generalmente, el análisis de varianza, es un procedimiento estadístico que se utiliza para determinar si las medias de dos o más muestras fueron extraídas de la misma población. La función de ANOVA de un solo factor le pide que provee la siguiente información.

Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de cálculo que desee analizar. El rango de entrada deberá contener dos o más rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene títulos de fila o de columna, deberá seleccionar la casilla de verificación.

Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezca los resultados.

Para utilizar las herramientas de análisis, seleccione Data Analysis del menú de Tools. Dentro de la opción de herramienta de análisis, escoja "ANOVA: Single Factor". En seguida, registre el Rango de entrada y el Rango de Salida, refiriéndose a la dirección de las celdas requeridas. Cuando utilize una herramienta de análisis, Excel crea una tabla de resultados. Si usted incluye títulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.

Anova: De un solo factor
Resumen
 
 
 
 
Grupos
Cuenta
Suma
Promedio
Varianza
Estudiantes
10
184
18.4
29.16
Empleados
10
127
12.7
8.678
Obreros
10
272
27.2
2.178
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Entre Grupos
1067.27
2
533.6
40.01
8.42E-09
3.354
Dentro de los Grupos
360.1
27
13.34
 
 
 
Total
1427.37
29
 
 
 
 
 

El resultado de una ANOVA le da el valor estadístico de la "F." En este caso el valor de la "F" o la variación entre los tres grupos es 40.01. Para saber si los resultados en este ejemplo son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" necesita ser al menos 3.354 (o sea, el valor crítico para F). Entonces, como el valor de nuestra "F" es de 40.01 y es mucho mayor que el valor crítico para F (3.354) estamos seguros que los resultados de nuestras pruebas son significativos. En otras palabras, sí existe una relación significativa entre cuanto que cada grupo pide la salsa especial. La probabilidad demuestra a qué nivel los resultados son estadísticamente significativos.


Problema para el estudiante

Imagine que la compañía Tortillas Familiares, S.A. haya lanzado una nueva marca de tostaditas que vienen con nuevos colores. Basándose de una encuesta que la compañía condujo enfocándose a los colores de la tostadita, la textura y los sabores, tenemos unos datos de las opiniones de diferentes clientes acerca de nuestro producto. Hemos tenido algunas discusiones que indican que las opiniones de los colores de las tostaditas dependen de las diferentes edades de los clientes. Los resultados de las encuestas se dividieron entre diferentes rangos de edades. Los resultados están tabulados a una escala de 100 puntos (el punto más alto, significa que le gustan más las tostaditas). Basándose en estos resultados, ¿existe alguna diferencia estadística entre las opiniones de las tostaditas y la edad de los clientes?

Tostaditas de nuevos colores

 

Encuesta: Resultados por Edad

 

Informante

< 20

21-40

> 40

 

1

89

85

64

 

2

95

67

66

 

3

94

90

68

 

4

81

73

63

 

5

82

83

59

 

6

86

73

75

 

7

87

86

80

 

8

92

61

60

 

9

90

89

59

 

10

93

75

73

 

 
Anova: De un solo factor
Resumen
 
 
 
 
Grupos
Cuenta
Suma
Promedio
Varianza
< 20 años
10
889
88.9
23.6556
21 – 40 años
10
782
78.2
96.8444
> 40 años
10
667
66.7
52.4556
 
ANOVA
 
 
 
 
 
 
Origen de Variaciones
Suma de Cuadrados
Grados Libertad
Promedio Cuadrados
F
Prob.
Valor Crítico
Entre Grupos
2465.26
2
1232.63
21.38
2.72E-06
3.354
Dentro de los Grupos
1556.6
27
57.65
 
 
 
Total
4021.86
29
 
 
 
 

Nótese:  Para ser significativo, el valor de F tiene que ser mayor de 3.35 y el valor de F observado en este caso llega a ser 21.38.  Como resultado, el ANOVA indica que sí existe una diferencia significativa entre los tres grupos encuanto a su opinión sobre las tostaditas de nuevos colores.