Menú Cerrar

Lo que no sabías sobre Validez y Confiabilidad de un instrumento

Validez y confiabilidad - destacada

La validez y la confiabilidad de un instrumento para la recogida de datos son dos propiedades técnicas que indican la calidad y utilidad del mismo

Estas son sus dos características más importantes.

Debes examinarlas al evaluar la idoneidad del instrumento o test que pretendes utilizar.

Este artículo proporciona una explicación simplificada de estas dos ideas complejas.

Las  explicaciones te ayudarán a comprender la información de validez  y confiabilidad reportada para un instrumento, y a usar esa información para evaluar la idoneidad de una prueba antes de usarla

 

¿Qué es la validez?


La validez es el aspecto más importante al seleccionar un instrumento o prueba.

Se refiere a qué característica mide la prueba y qué tan bien mide esa característica.

Indica si la característica que se mide mediante un instrumento, está relacionada con las dimensiones de esa característica o concepto.

La validez da sentido a los puntajes obtenidos por la aplicación de la prueba.

La evidencia de validez indica que existe un vínculo entre el desempeño en una prueba y el concepto o habilidad evaluada

Si se ha demostrado que una prueba es un predictor válido de desempeño en un trabajo específico, puedes concluir que las personas que obtienen un puntaje alto en esa prueba,

Tienen más probabilidades de tener un buen desempeño en el trabajo, que las personas que obtienen un puntaje bajo, cuando todo lo demás permanece igual.

La validez también describe el grado en que puedes sacar conclusiones o predicciones específicas sobre las personas, en función de los puntajes de sus exámenes.

En otras palabras, indica la utilidad de la prueba o instrumento de medición

 

Tipos de Validez


Los tipos de validez principales son tres: validez de contenido, de constructo y validez de criterio

 

Validez de Contenido

La primera categoría es la validez de contenido.

Esta categoría analiza si el instrumento cubre adecuadamente todo los contenidos que debería con respecto a la variable.

En otras palabras, ¿cubre el instrumento todo el dominio relacionado con la variable, o constructo  que pretende medir?

Un subconjunto de la validez de contenido es la validez aparente, donde a los expertos se les pregunta su opinión sobre si un instrumento mide el concepto deseado.

Por ejemplo, una prueba de mecanografía sería un soporte de alta validación para un puesto de secretaria, suponiendo que se requiera transcribir grandes cantidades de texto cada día.

Sin embargo, si el trabajo requiriere una mecanografía mínima, entonces la misma prueba tendría poca validez de contenido.

 

Validez de Constructo

La validez de constructo se refiere a si puedes hacer inferencias con base en los puntajes de las pruebas relacionadas con el concepto que se está analizando.

Por ejemplo, si una persona tiene un puntaje alto en un test que mide la ansiedad, ¿realmente significa que tiene un alto grado de ansiedad?

En el otro extremo, una prueba de conocimientos sobre  medicamentos que requiere cálculos de dosis, ¿puede realmente probar los conocimientos en matemática?

Este método a menudo se refiere a pruebas que pueden medir rasgos abstractos de una persona.

Por ejemplo, la validez de constructo se puede usar cuando un banco desea evaluar a candidatos para cubrir una vacante en el rubro  “aptitud numérica”.

En este caso, una aptitud no es un comportamiento observable, sino un concepto creado para explicar posibles comportamientos futuros.

Existen tres tipos de evidencia que pueden usarse para demostrar que un instrumento de recogida de datos tiene validez de constructo:

1 Homogeneidad: lo que significa que el instrumento mide un solo constructo.

2 Convergencia: esto ocurre cuando el instrumento mide conceptos similares a los de otros instrumentos.

Aunque si no hay instrumentos similares disponibles, la convergencia no tiene sentido.

3 Evidencia teórica: se manifiesta cuando el comportamiento es similar a las proposiciones teóricas del constructo medido en el instrumento.

Por ejemplo, cuando un instrumento mide la ansiedad, uno esperaría ver que los participantes que obtienen un puntaje alto en el instrumento, también demuestren síntomas de ansiedad en su vida cotidiana.

 

Validez de Criterio

La tipo final de validez es la validez de criterio.

Un criterio es cualquier otro instrumento que mida la misma variable.

Se pueden calcular correlaciones para determinar en qué medida los diferentes instrumentos miden la misma variable.

Los puntajes de los empleados (predictores) en una prueba diseñada para medir la habilidad mecánica, podrían correlacionarse con su desempeño en las máquinas de servicio (criterio) en la fábrica.

Si la correlación es alta, se puede decir que la prueba tiene un alto grado de soporte de validación, y su uso como herramienta de selección sería apropiado.

La validez de criterio de una prueba se mide por el Coeficiente de Validez.

Se reporta  como un número comprendido entre 0 y 1.00 que indica la magnitud de la relación, “r”, entre la prueba y una medida que sirve como criterio.

Cuanto mayor sea el coeficiente de validez, más confianza puedes tener en las predicciones hechas a partir de los puntajes de ese instrumento

Sin embargo, una sola prueba nunca puede predecir completamente el desempeño, por ejemplo, en un trabajo,  dado que el éxito en el trabajo depende de muchos factores distintos.

Por lo tanto, los coeficientes de validez, a diferencia de los coeficientes de confiabilidad, rara vez exceden r = .40.

 

¿Cómo interpretar el coeficiente de validez?

Como regla general, cuanto mayor sea el coeficiente de validez, más beneficioso será usar la prueba.

Los coeficientes de validez de r = .21 a r = .35 son típicos para instrumentos usados en investigación

 

Valor del Coeficiente de ValidezInterpretación
Por encima de 0.35Muy beneficioso
0.21 – 0.35Aceptable
0.11 – 0.20Depende de las circunstancias
Debajo de 0.11Improbable que sea útil

 

Confiabilidad


La confiabilidad se relaciona con la consistencia de una medida.

Un participante que complete un instrumento destinado a medir la motivación, debe tener aproximadamente las mismas respuestas cada vez que rellene el mismo cuestionario.

Aunque no es posible dar un cálculo exacto de la confiabilidad, se puede lograr una estimación de la misma a través de diferentes medidas.

La confiabilidad de una prueba está indicada por el Coeficiente de Confiabilidad.

Se denota con la letra “r”, y se expresa como un número que varía entre 0 y 1.00, con r = 0 que indica que no hay confiabilidad, y r = 1.00 que indica confiabilidad perfecta.

No esperes encontrar una prueba con una confiabilidad perfecta.

En general, verá la confiabilidad de una prueba como un valor decimal, por ejemplo, r = .80 o r = .93.

Cuanto mayor sea el coeficiente de confiabilidad, más repetibles o confiables serán los puntajes de las pruebas.

La Tabla siguiente sirve como una guía general para interpretar la confiabilidad de la prueba.

Sin embargo, no seleccionar o rechazar una prueba únicamente en función del tamaño de su coeficiente de confiabilidad no sería adecuado

Para evaluar la confiabilidad de una prueba, debes considerar el tipo de prueba, el tipo de estimación de confiabilidad reportada y el contexto en el que se utilizará la prueba.

 

Valor del Coeficiente de ConfiabilidadInterpretación
0.90 y másExcelente
0.80 – 0.89Bueno
0.70 – 0.79Adecuado
Debajo de 0.70Puede tener aplicabilidad limitada

 

 

¿Cómo se determina la confiabilidad de un instrumento?


Existen varios tipos de estimaciones de confiabilidad, cada una influenciada por diferentes fuentes de error de medición.

Los desarrolladores de pruebas tienen la responsabilidad de informar las estimaciones de confiabilidad que son relevantes para una prueba en particular.

Antes de decidir usar una prueba, lea el manual de la prueba y cualquier revisión independiente para determinar si su confiabilidad es aceptable.

El nivel aceptable de confiabilidad diferirá según el tipo de prueba y la estimación de confiabilidad utilizada.

 

La confiabilidad test-retest

Indica la repetibilidad de los puntajes de las pruebas con el paso del tiempo.

Esta estimación también refleja la estabilidad de la característica o constructo que se mide con la prueba.

Algunas constructos son más estables que otros.

Por ejemplo, la capacidad de lectura de un individuo es más estable durante un período de tiempo particular, que el nivel de ansiedad de ese individuo.

Por lo tanto, esperaría un coeficiente de confiabilidad test-retest más alto en una prueba de lectura que en una prueba que mide la ansiedad.

Para constructos que se espera que varíen con el tiempo, un coeficiente de confiabilidad aceptable de test-retest puede ser más bajo que lo sugerido en la Tabla anterior

 

La confiabilidad de formas alternativas o paralelas

Indica cuán consistentes serán los puntajes de las pruebas si una persona toma dos o más formas de esa prueba.

Un alto coeficiente de confiabilidad de forma paralela indica que las diferentes instrumentos son muy similares, lo que significa que prácticamente no importa qué versión de la prueba tome una persona.

Por otro lado, un bajo coeficiente de confiabilidad de formas paralelas sugiere que las diferentes versiones probablemente no sean comparables;

Pueden estar midiendo cosas diferentes y, por lo tanto, no pueden usarse indistintamente.

 

Métodos de las dos mitades

El método de la mitad dividida evalúa la consistencia interna de una prueba, como las pruebas psicométricas y los cuestionarios.

Allí, mide hasta qué punto todas las partes de la prueba contribuyen igualmente a lo que se está midiendo.

Esto se hace comparando los resultados de la mitad de una prueba, con los resultados de la otra mitad.

Una prueba se puede dividir por la mitad de varias maneras, por ejemplo, la primera mitad y la segunda mitad, o por números pares e impares.

Si las dos mitades de la prueba proporcionan resultados similares, esto sugeriría que la prueba tiene estabilidad interna.

La confiabilidad de una prueba podría mejorarse mediante el uso de este método.

Por ejemplo, cualquier elemento en mitades separadas de una prueba que tenga una baja correlación (por ejemplo, r = .25) debe eliminarse o reescribirse.

El método de la mitad dividida es una forma rápida y fácil de establecer la confiabilidad.

Sin embargo, solo puede ser eficaz con cuestionarios grandes en los que todas las preguntas miden el mismo constructo.

Esto significa que no sería apropiado para pruebas que miden diferentes conceptos.

Por ejemplo, el Inventario Multifásico de Personalidad  de Minnesota tiene subescalas que miden comportamientos diferentes como depresión, esquizofrenia, introversión social.

Por lo tanto, el método de la mitad dividida no es un método apropiado para evaluar la confiabilidad de esta prueba de personalidad.

A continuación, puedes darle un vistazo al vídeo en el canal Tesis de Cero a 100 – TV que contiene material relacionado:

 

 

Conclusión


Cuando se aplica correctamente, el uso de instrumentos de evaluación válidos y confiables te ayudará a tomar mejores decisiones.

Determinar cuán rigurosamente se han abordado los problemas de validez  y confiabilidad  en un estudio, es un componente esencial en las críticas que se puedan hacer a un trabajo,

Así como influir en la decisión sobre si implementar los hallazgos del estudio en la práctica de cualquier disciplina

En estudios cuantitativos, el rigor se determina a través de una evaluación de la validez y confiabilidad de las herramientas o instrumentos utilizados durante la investigación.

Please follow and like us:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies
Hola! ¿Te gustaría completar con éxito tu Tesis o Proyecto de Investigación? Clic AquíClose