Menú Cerrar

Guía básica para entender el Análisis de la Varianza

Anova SPSS

¿Qué es  y para qué sirve?

 

Si  un tesista o investigador novel me preguntara cuál es el concepto estadístico que hay que tener bien claro antes de adentrarse en el análisis de datos para investigación,

Mi respuesta sin titubeos es Análisis de la Varianza

El Análisis de Varianza (ANOVA)  es una técnica estadística paramétrica utilizada para comparar grupos de datos

Esta técnica fue ideada por R. A.  Fisher y, por lo tanto, a menudo se la denomina ANOVA de Fisher.

Es absolutamente indispensable para analizar los resultados de cualquier diseño experimental

Es similar en su aplicación a técnicas como t-test y z-test, ya que se usa para comparar medias

Sin embargo, el Análisis de la Varianza (ANOVA) se aplica mejor cuando se comparan más de 2 poblaciones o muestras

Por cierto, antes de pasar a otros temas, ANOVA proviene de las primeras letras de la frase en inglés Analysis Of Variance

Cosas a tener en cuenta antes de llevar a cabo un Análisis de la Varianza

El uso de esta técnica estadística paramétrica implica ciertos supuestos clave, entre los que se incluyen los siguientes:

  • La muestra de la variable dependiente debe proceder de una distribución normal con varianza constante
  • Los residuos de la varianza no explicada por el modelo deben ser aleatorios, es decir, no evidenciar pautas de comportamiento típicas

La prueba de Kolmogorov-Smirnov o Shapiro-Wilk se pueden usar para confirmar el supuesto de normalidad

La prueba de Levene se utiliza para probar la homogeneidad entre los grupos

Para comprobar la aleatoriedad de los residuos puede utilizarse el gráfico de los mismos

Si los datos particulares siguen los supuestos anteriores,

entonces el análisis de varianza (ANOVA) es la mejor técnica para comparar las medias de dos o más poblaciones.

Tipos de Análisis de la Varianza

El análisis de varianza (ANOVA) tiene tres tipos:

Análisis unidireccional: cuando estamos comparando más de tres grupos basados ​​en los niveles una variable factor,

se dice que se trata de un ONE-WAY ANOVA

Por ejemplo, si queremos comparar si la producción media de tres trabajadores,

es o no la misma en función de las horas trabajadas por cada uno de ellos

Análisis bidireccional: cuando las variables factoriales son más de dos,

se dice que es un análisis de varianza bidireccional (ANOVA).

Por ejemplo, según las condiciones de trabajo y las horas laboradas, podemos comparar si la producción media de tres trabajadores es la misma o no.

Análisis en k direcciones: cuando las variables factores son k,

entonces se dice que el análisis de varianza es un K-WAY ANOVA

Lo más habitual es que se consideren hasta 3 factores (k=3)

 

Análisis de la Varianza: TWO WAY ANOVA Análisis de la Varianza: TWO WAY ANOVA

 

Extendiendo el concepto

Se pueden dar relaciones de mayor complejidad entre los factores (variables independientes) y la(s) variables dependientes (respuestas)

Tales son los casos conocidos como MANOVA y ANCOVA

¿Qué es MANOVA?

El Análisis de la Varianza (ANOVA) se utiliza cuando tenemos una variable dependiente métrica (de intervalo o de razón),

y una variable independiente categórica (nominal u ordinal)

MANOVA es sólo un ANOVA con varias variables dependientes

En términos básicos, un MANOVA es un ANOVA con dos o más variables de respuesta continuas

Al igual que ANOVA, MANOVA tiene un sabor unidireccional y otro bidireccional.

El número de variables factoriales involucradas distingue un MANOVA de una vía de un MANOVA de dos vías.

Análisis de la Varianza: TWO WAY MANOVA Análisis de la Varianza: TWO WAY MANOVA

 

Es similar a muchas otras pruebas y experimentos, ya que su propósito es averiguar si las variable de respuesta,

es decir, las variable dependientes se modifican por la manipulación de la(s) variable(s) independientes

La prueba ayuda a responder muchas preguntas de investigación, incluyendo:

  • ¿Los cambios en las variables independientes tienen efectos estadísticamente significativos en las variables dependientes?
  • ¿Cuáles son las interacciones entre las variables dependientes?
  • ¿Cuáles son las interacciones entre variables independientes?

Por tanto, cuando tenemos más de una variable dependiente y una o más variables independientes,

usaremos el Análisis de Varianza multivariado (MANOVA)

¿Qué es ANCOVA?

La diferencia obvia entre ANOVA y ANCOVA es la letra “C”, que viene de  “covarianza”

Al igual que ANOVA, el Análisis de la Covarianza” (ANCOVA) tiene una única variable de respuesta métrica

A diferencia de ANOVA, ANCOVA compara una variable de respuesta con un factor y una variable independiente continua

Por ejemplo, comparando el puntaje en una prueba tanto con el nivel educativo (factor),

como con el número de horas dedicadas a estudiar (covariable)

El término para la variable independiente continua  utilizada en ANCOVA como puedes ver arriba es  covariable

 

ANCOVA
ANCOVA

 

ANCOVA compara una variable de respuesta continua (por ejemplo, puntaje en una prueba) por niveles de una variable factor

Por ejemplo, nivel educativo, controlando por una covariable continua,

como puede ser, número de horas dedicadas a estudiar

ANCOVA también se usa comúnmente para describir análisis con una sola variable de respuesta y sin factores.

Tal análisis también se conoce como Análisis de Regresión

De hecho, puedes obtener resultados casi idénticos en SPSS al realizar este análisis,

haciendo clic en las entradas de menú Analizar > Regresión > Lineal

o en los menús Analizar > Modelo lineal general (GLM) > Univariante

 

¿Qué es MANCOVA?

Al igual que entre ANOVA y ANCOVA, la principal diferencia entre MANOVA y MANCOVA es la “C”, que de nuevo proviene de “covarianza”.

Tanto MANOVA como MANCOVA presentan dos o más variables de respuesta,

pero la diferencia clave entre ambas es la naturaleza de las variables independientes

Mientras que un MANOVA puede incluir solo factores,

un análisis evoluciona de MANOVA a MANCOVA cuando se agregan una o más covariables a la mezcla

MANCOVA compara dos o más variables de respuesta métricas (por ejemplo, puntajes en una prueba e ingreso anual) por niveles de una variable de factor,

por ejemplo, nivel educativo, controlando por una covariable (por ejemplo, número de horas dedicadas a estudiar)

 

Análisis de la Varianza: MANCOVA Análisis de la Varianza: MANCOVA

 

ANOVA SPSS ejemplos

En el estudio de caso “Sesgo en contra de los acompañados por obesos“,

los investigadores estaban interesados  en saber si el peso de un acompañante de un solicitante de empleo,

afectaría los juicios de los evaluadores de un candidato masculino para ese trabajo

Dos variables independientes se investigaron:

(1) si el acompañante era obeso o de peso típico y

(2) si el acompañante era su novia o simplemente un amigo

Hay tres efectos de interés en este experimento:

  1. Peso: ¿Se juzga a los solicitantes de manera diferente según el peso de su acompañante?
  2. Relación: ¿Se juzga a los solicitantes de manera diferente dependiendo de su relación con el acompañante?
  3. Interacción PesoXRelación: ¿El efecto del peso difiere según la relación con acompañante?

 

Análisis de la Varianza: dataset 1
Análisis de la Varianza: dataset 1

Pruebas de significación

Las preguntas importantes no son si hay efectos principales e interaccion en los datos de la muestra

En cambio, lo verdaderamente importante es lo que los datos de la muestra te permiten concluir acerca de la población

Aquí es donde entra en juego el Análisis de la Varianza

ANOVA prueba los efectos principal y las interacciones para determinar su importancia

EN SPSS tenemos que hacer clics sucesivos en Analizar > modelo general > Univariante

para llegar al cuadro de diálogo que se muestra a continuación:

 

Análisis de la Varianza: Cuadro dialogo 1 Análisis de la Varianza: Cuadro dialogo 1

 

En los cuadros siguientes se muestra el resumen de ANOVA para estos datos

Análisis de la Varianza: Resultados 1 Análisis de la Varianza: Resultados 1

 

Consideremos primero el efecto del  Peso

Los grados de libertad (df) para Peso son 1.

Los grados de libertad para un efecto principal son siempre iguales al número de niveles del factor menos uno

Como hay dos niveles de la variable Peso (normal y obeso), el df es 2 – 1 = 1

Nos saltamos el cálculo de la suma de cuadrados (SSQ) no porque sea difícil,

sino porque es mucho más fácil confiar en los paquetes estadísticos para determinarlo

El cuadrado medio (MS) es la suma de cuadrados dividida por los df

La relación de F se calcula dividiendo la MS para el efecto por la MS para err (MSE).

Para el efecto de Peso  F = 10.4673 / 1.6844 = 6.214

La última columna,  p, el conocido p-valor es la probabilidad de obtener una F de 6.214 o más,

dado que no hay ningún efecto del factor Peso en la población.

El valor p-valor es casi 0

¿Qué tenemos claro hasta aquí?

Se rechaza la hipótesis nula de que no hay efecto principal del  factor Peso,

sobre la valoración de los candidatos por los entrevistadores

Se acepta, en consecuencia, la hipótesis alternativa la cual afirma que el Peso si influye sobre el juicio de los evaluadores del candidato

La conclusión es que estar acompañado por una persona obesa disminuye las valoraciones obtenidas por los candidatos

El efecto Relación se interpreta de manera similar

La conclusión es que estar acompañado por una novia conduce a calificaciones más bajas que estar acompañado por un amigo

El df para una interacción es el producto de los df de las variables en la interacción.

Para la interacción Peso x Relación, df = 1, ya que tanto el Peso como la Relación tienen un df: 1 x 1 = 1.

El p-valor para la interacción es 0.8043, que es la probabilidad de obtener una interacción grande o más grande que la obtenida en el experimento,

si no hubiera en lo absoluto interacción en la población

Por lo tanto, estos datos no proporcionan evidencia de que haya tal interacción.

 

Siempre tenga en cuenta que la falta de evidencia a favor de un efecto, no justifica la conclusión de que el efecto no existe

 

¿Qué indican estos cálculos?

En otras palabras, se acepta la hipótesis nula simplemente porque no hay suficiente evidencia en su contra, lo que no implica afirmar que H0 es  verdadera,

Puede darse el caso de aceptar una hipótesis nula que en realidad es falsa, esta situación se conoce como Error Tipo I

Para la fila  Error, los grados de libertad son iguales al número total de observaciones menos el número total de grupos.

El número total de observaciones es 40 + 42 + 40 + 54 = 176.

Dado que hay cuatro grupos, dfe = 176 – 4 = 172

La última fila en la tabla de resumen de ANOVA es Total

El total de grados de libertad es igual a la suma de todos los grados de libertad.

También es igual al número de observaciones menos 1, o 176 – 1 = 175

Cuando hay tamaños de muestra iguales, la suma de cuadrados total sera igual a la suma de todas las demás sumas de cuadrados.

Sin embargo, cuando hay tamaños de muestra desiguales, como aquí,

esto generalmente no será cierto.

Las razones para esto son complejas y no se analizan en éste post

 MANOVA ejemplos

A continuación te muestro un ejemplo de Análisis de Varianza multivariable MANOVA  en SPSS,

muy simplificado en favor de la claridad de la explicación

Los datos utilizados en este ejemplo son del siguiente experimento

Un investigador asigna al azar 33 sujetos a uno de tres grupos

El primer grupo recibe información técnica sobre dietas de forma interactiva desde un sitio web en línea

El grupo 2 recibe la misma información de una enfermera practicante,

mientras que el grupo 3 recibe la información de un vídeo hecho por la misma enfermera practicante.

Cada sujeto realizó tres evaluaciones acerca de:

DIFICULTAD (DIFFICULTY), UTILIDAD (USEFUL) e IMPORTANCIA (IMPORTANCE) de la información en la presentación.

El investigador observa tres valoraciones diferentes de la presentación (dificultad, utilidad e importancia),

para determinar si hay una diferencia en los modos de presentación.

En particular, el investigador está interesado en saber si el sitio web interactivo es superior porque es la forma más rentable de entregar la información.

En el conjunto de datos, las valoraciones se presentan en las variables UTILIDAD, DIFICULTAD e IMPORTANCIA.

El variable GRUPO indica el grupo al que se asignó un determinado modo de presentación

Desarrollo paso a paso

 

Análisis de la Varianza: dataset 2 Análisis de la Varianza: dataset 2

Estamos interesados  en cómo la variabilidad en las tres valoraciones puede ser explicada por el grupo de pertenencia de un sujeto.

El grupo es una variable categórica con tres valores posibles: 1, 2 o 3.

Dado que tenemos múltiples variables dependientes que no se pueden combinar, elegiremos usar MANOVA

Nuestra hipótesis nula en este análisis es que el grupo de un sujeto no tiene efecto sobre ninguna de las tres valoraciones (variables dependientes),

y podemos probar esta hipótesis en el conjunto de datos que se muestra arriba

EN SPSS tenemos que hacer clics sucesivos en Analizar > modelo general > Multivariante

para llegar al cuadro de diálogo que se muestra a continuación:

Luego de hacer clic en el botón Aceptar, obtenemos los siguientes resultados:

Análisis de la Varianza: Resultados 3 Análisis de la Varianza: Resultados 3

La última columna encuadrada en rojo  es el p-valor asociado con el estadístico F

La hipótesis nula de que un predictor determinado no tiene efecto en ninguno de los resultados se evalúa con respecto a este p-valor

Para un nivel alfa dado (0,05), si el p-valor es menor que alfa, la hipótesis nula se rechaza.

Si no, entonces no podemos rechazar la hipótesis nula.

Y tendríamos que aceptar en su defecto la hipótesis alternativa,

la cual indica en éste caso que los grupos si tienen un efecto sobre las valoraciones

En este ejemplo, rechazamos la hipótesis nula de que el grupo no tiene efecto en las tres valoraciones diferentes en el nivel alfa .05

porque todos los p-valor son menores que 0,05

 

ANCOVA ejemplos

Un grupo conformado por 8 alumnos de un centro académico,

se les aplica a un test antes y después de ser sometidos a tres (3) métodos de enseñanza diferentes A, B, C.

Los datos recogidos se indican en la tabla a continuación

 

Métodos A B C
Alumnos Antes Después Antes Después Antes Después
1 5 6 4 4 6 7
2 7 8 3 4 7 7
3 8 9 7 7 7 6
4 3 4 2 2 3 2
5 4 4 3 2 3 3
6 5 5 5 5 5 4
7 6 7 6 5 6 7
8 5 6 5 5 5 5

 

Queremos verificar si las puntuaciones obtenidas son sensibles a los métodos de enseñanza A, B, C

tomando como covariante las puntuaciones antes de aplicarlos

 

Análisis de la Varianza: dataset 4 Análisis de la Varianza: dataset 4

EN SPSS tenemos que hacer clics sucesivos en Analizar > modelo general > Univariante

para llegar al cuadro de diálogo que se muestra a continuación:

Análisis de la Varianza: Cuadro dialogo 4
Análisis de la Varianza: Cuadro dialogo 4

 

Los resultados obtenidos los puedes ver a continuación, indican que el factor Método

y la covariable Notas_antes tienen un efecto significativo sobre la variable dependiente  N_despues

 

Análisis de la Varianza: Resultados 4
Análisis de la Varianza: Resultados 4

Si te hace falta refrescar algunos conceptos previos, puedes darle un vistazo a:

Guía básica para Análisis estadístico de datos

 

Recapitulando…

Hemos hablado acerca de ANOVA, ANCOVA, MANOVA y MANCOVA

Un Análisis de la Varianza (ANOVA) prueba tres o más grupos para diferencias de medias,

basadas en una variable de respuesta métrica

Es decir, de razón o intervalo, también conocida como variable dependiente

ANCOVA compara una variable de respuesta por un factor y una variable independiente continua

Por ejemplo, comparando el puntaje en una prueba tanto por el nivel educativo,

como por el número de horas dedicadas al estudio

En términos básicos, un MANOVA es un ANOVA con dos o más variables de respuesta continuas

MANCOVA compara dos o más variables de respuesta métricas, por ejemplo,

puntajes de prueba e ingreso anual,  por niveles de una variable de factor (por ejemplo, nivel educativo),

controlando por una covariable (por ejemplo, número de horas dedicadas a estudiar).

¿Qué te ha parecido esta guía sobre Análisis  de la Varianza?

Tienes algún comentario

Te gustaría que sigamos publicando artículos de éste tipo acerca de Análisis de datos para investigación

Deseas publicar alguna corrección

Estaré pendiente para leer tus aportaciones…

 

 

Fuentes consultadas

  1. Online Stat Book
  2. Stats make me cry

Please follow and like us:
Facebook
Twitter
Visit Us
LinkedIn
Pinterest
Pinterest

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies