Menú Cerrar

Guía básica para Análisis Estadístico de datos

Análisis Estadístico de datos

Hoy nos vamos apartar un poco de la fase de diseño de un proyecto de investigación o tesis, para dar un salto hacia delante y ubicarnos ya en la fase de ejecución

Supongamos que hemos diseñado sin problemas nuestro instrumento de recogida de datos

Lo aplicamos a un grupo reducido de sujetos (prueba piloto)

Detectamos algunas pequeñas inconsistencias, las cuales subsanamos de inmediato

Seleccionamos como es debida la muestra, aplicamos el instrumento y obtuvimos una gran cantidad de datos

Los organizamos, tabulamos, graficamos,… Todo marcha sobre ruedas

Pero, y ahora qué hacemos con toda esa información

De lo que vamos hacer a continuación, del análisis estadístico de datos, hablamos en éste artículo

Pero, ¡Ojo! como se indica en el título, el artículo está dirigido a lectores con mínimos conocimientos de estadística

De manera que te lo vamos a poner lo más sencillo posible, sin complicadas expresiones matemáticas

¡Vamos a por ello!

¿Qué es el análisis de datos?

El análisis de datos es el proceso de examinarlos sistemáticamente con el propósito de resaltar aquella información que sea más útil.

El análisis estadístico de datos es la base de la investigación científica.

Realizar un análisis de datos completo con la información que has recopilado durante tu investigación te permitirá:

  • Determina el impacto de tu trabajo.
  • Evaluar la calidad de tu investigación.
  • Comunicar los resultados a grupos de interés.

¿Qué tipos de datos puedes recoger: cuantitativos o cualitativos?

El tipo de datos que recopiles depende de la pregunta que deseas  responder y de los  recursos que dispongas

En términos muy sencillos, hay dos tipos de datos que puedes recabar durante el proceso de elaboración de tu tesis o trabajo de investigación: cualitativos y cuantitativos.

Ambos tipos de datos tienen ventajas y limitaciones, y pueden ser apropiados para diferentes entornos, diseños y preguntas de investigación.

Los datos cuantitativos son información numérica, cuyo análisis involucra técnicas estadísticas.

Por eso quizás sea más apropiado referirnos a análisis estadístico de datos, y éste  será el tema central del post

En el otro extremo, los datos cualitativos consisten en palabras y narraciones.

El análisis de los datos cualitativos puede venir en muchas formas, incluyendo resaltar palabras clave, extraer ideas principales y elaborar conceptos

Un ejemplo de datos cuantitativos sería cuando administramos un cuestionario de satisfacción, pidiéndoles a los participantes que califiquen su experiencia en una escala del 1 al 5.

En este caso, los datos serían numéricos  y tendríamos que utilizar  técnicas estadísticas para derivar  conclusiones sobre la satisfacción de los participantes.

Un ejemplo de datos cualitativos sería si dirigieras un grupo de enfoque con los padres que participan en un programa educativo para comprender las percepciones de sus representados.

En este caso, los datos que recopilaste  fueron probablemente los audios que grabaste con las opiniones de los representantes acerca del curso que acaban de tomar,

por lo que utilizarías técnicas cualitativas para analizar las transcripciones en busca de contenidos e ideas relevantes para mejorar el programa

¿Qué es el análisis estadístico de datos?

Ahora que hemos revisado los diferentes tipos de datos, necesitamos saber cómo usamos las respuestas numéricas que hemos obtenido.

El análisis de la información numérica produce resultados a partir de datos.

La interpretación de los datos a través del análisis es clave para comunicar los resultados a las  partes interesadas.

El tipo de análisis que utilices depende del diseño de la investigación, el tipo de variables que tienes y la distribución de los datos.

En esta sección nos centraremos en los dos tipos de análisis estadístico de datos más utilizados: descriptivo e inferencial.

Análisis descriptivo de datos

El análisis descriptivo nos informa acerca de las cualidades básicas de los datos.

El análisis descriptivo incluye estadígrafos  (o estadísticos) como el rango, el mínimo, el máximo y la frecuencia.

También incluye medidas de tendencia central como la media, mediana, moda, desviación estándar, y algunos otros que nos dicen acerca de la forma que tienen nuestros datos.

Hay muchas maneras de describir los datos, y podemos usar el análisis descriptivo para que nos diga cómo son esos datos.

A continuación se presentan algunas maneras comunes de describir los datos.

Utilizando el conjunto de puntuaciones a continuación, el siguiente diagrama enumera los estadígrafos (o estadísticos)  descriptivos más sencillos.

 

Muestra de datos: 7, 7, 7, 7, 10, 10, 20, 20, 20, 23

 

Rango, mínimo, máximo, frecuencia - análisis estadístico de datos
Rango, mínimo, máximo, frecuencia – análisis estadístico de datos

 

Medidas de Tendencia Central

Las medidas de tendencia central pueden dar una idea general de cómo responden los participantes en un instrumento de recogida de datos, digamos por ejemplo, un cuestionario

Estas medidas incluyen la Media, la Mediana y el Modo.

 

Media, mediana y modo - análisis estadístico de datos
Media, mediana y modo – análisis estadístico de datos

 

Medidas de Dispersión

Cuando pensamos en cómo realizar un análisis estadístico de datos, además de las medidas de tendencia central, también debemos considerar qué tan alejadas o cercanas están las respuestas respecto de una de estas medidas

Por tanto, para comprender más sobre la naturaleza de los datos, hay que  considerar también las llamadas Medidas de Dispersión

De estas, las que se utilizan más comúnmente son: la desviación estándar o típica, la varianza y el coeficiente de variación

Varianza

La varianza muestral puede pensarse como el “promedio” de las distancias a la media elevado al cuadrado.

Sin embargo, precisamente por el hecho de elevar al cuadro, la varianza no tiene las mismas unidades que los datos.

Si los datos originales estaban expresados en m (metros), caso de las estaturas de un grupo de individuos, la varianza estaría expresada en m2 (metros cuadrados)

Para salvar este inconveniente, definimos la desviación estándar como la raíz cuadrada positiva de la varianza

Desviación Estándar

Es una medida de qué tan cerca o alejadas están las puntuaciones con respecto a su media.

La desviación estándar nos dice qué tan bien la media representa a todos los datos.

Dicho de otra forma, la  desviación estándar representa la cantidad promedio que una puntuación dada se desvía de la puntuación media.

Coeficiente de Variación

Se trata simplemente de dividir la desviación estándar entre la media, y multiplicar este cociente por 100

Expresa el grado de dispersión de los datos como un porcentaje

Útil para comparar la homogeneidad entre varios conjuntos de datos

Análisis inferencial de datos

Acabamos de revisar el análisis descriptivo, que incluye estadígrafos  como rango, mínimo, máximo y frecuencia.

También incluye medidas de tendencia central como la media, mediana, moda, desviación estándar, y nos dice lo que nuestros datos parecen ser.

Una vez que hayas descrito adecuadamente tus datos, puedes pasar a hacer inferencias basadas en ellos.

El análisis estadístico de datos inferencial utiliza pruebas estadísticas para ver si un patrón que observamos, se debe al azar o a los efectos de una intervención.

La investigación a menudo utiliza el análisis inferencial para determinar si existe una relación entre una intervención y un resultado, así como la fuerza de esa relación.

Esta sección proporciona una descripción general de las cosas a considerar antes de comenzar el análisis inferencial,

ejemplos de pruebas estadísticas comunes y el grado de significación estadística de esas pruebas.

El primer paso en el análisis inferencial

Uno de los primeros pasos en el análisis inferencial es responder a la pregunta:  ¿cómo se ve la distribución de datos?

El tipo de prueba que elijas se guiará por la distribución de los datos.

Las distribuciones se dividen en dos categorías, normal y no normal.

Siempre debes verificar la distribución de tus datos antes de comenzar el análisis inferencial.

Distribución normal

Este tipo de distribución se parece a la muy conocida Campana de Gauss.

La siguiente gráfica es un ejemplo de cómo se ve una distribución normal.

 

Curva normal - análisis estadístico de datos
Curva normal – análisis estadístico de datos

 

Si observas tu distribución, puedes dibujar una curva sobre ella  que se ajuste a tus datos.

Si tu distribución se parece a la de la imagen de arriba (o cercana de ella), tu distribución es normal.

Este tipo de distribución nos muestra que la mayoría de los datos se agrupan alrededor de un número o valor central.

Por lo general, si los datos son normales, elegimos para llevar a cabo nuestro análisis estadístico de datos, entre las pruebas estadísticas llamadas pruebas paramétricas.

Distribuciones no normales

Hay varias formas en que una distribución puede ser no normal.

Un pequeño tamaño de muestra o conjuntos de respuestas inusuales, son razones comunes por las que los datos pueden no estar distribuidos normalmente.

Generalmente, si los datos no son normales, elegimos de un conjunto de pruebas estadísticas llamadas pruebas no paramétricas.

Revisaremos los dos tipos de distribuciones no normales que se enumeran a continuación.

Sesgada a la derecha o a la izquierda

Este tipo de distribución no toma la forma de campana que nos es familiar, sino que presenta cierto sesgo (asimetría), bien hacia la derecha (positiva) o a hacia la izquierda (negativa).

El siguiente gráfico muestra un ejemplo de distribución sesgada negativamente

En este caso, la mayoría de las puntuaciones están en el extremo más bajo.

 

Asimetría a la derecha y a la izquierda - análisis estadístico de datos
Asimetría a la derecha y a la izquierda – análisis estadístico de datos

 

Al contrario, el gráfico contiguo muestra datos sesgados positivamente;

la mayoría de las puntuaciones se encuentran en el extremo superior.

Curtosis

Este concepto se refiere al grado de agudeza que presenta la distribución de los datos

En palabras sencillas, que tan puntiaguda o achatada (plana) es la curva que representa a la distribución de los datos.

Se distinguen tres casos: leptocúrticas (las más agudas), mesocúrticas (curvas normales) y platicúrtica (las más planas o achatadas)

 

Curtosis - análisis estadístico de datos
Curtosis – análisis estadístico de datos

 

Análisis estadísticos de datos más comunes

Ahora que has analizado la distribución de tus datos y quizás hayas calculado algunos estadígrafos   para averiguar la media, la mediana o el modo,

es  hora de hacer algunas inferencias sobre los datos.

Como se mencionó anteriormente, la estadística inferencial es  el conjunto de pruebas estadísticas que usamos para hacer inferencias a partir de una muestra.

Estas pruebas estadísticas nos permiten afirmar  si el patrón que estamos observando es real o sólo debido a la casualidad

¿Cómo sabes qué tipo de prueba usar?

Existe una amplia gama de pruebas estadísticas.

La decisión acerca de cuál usar depende del diseño de la investigación, la distribución de los datos y el tipo de variable.

En general, si los datos se distribuyen normalmente, elegirás entre las pruebas paramétricas.

Si los datos no son normales, elegirás del conjunto de pruebas no paramétricas.

A continuación se muestra una tabla con algunas pruebas estadísticas comunes y sus usos más frecuentes.

 

Tipo de prueba En qué  casos se usa
Correlacional Cuando se busca establecer una asociación entre variables
Correlación de Pearson Para determinar la fuerza de la asociación entre dos variables continuas (métricas)
Correlación de Spearman Para determinar la fuerza de la asociación entre dos variables ordinales
Chi-cuadrado Para determinar la fuerza de la asociación entre dos variables categóricas (nominales)
Comparación de medias: busca la diferencia entre las medias de las variables
Prueba T pareada Para dilucidar diferencias entre dos medias de grupos relacionados
Prueba T para muestras independientes Para dilucidar diferencias entre dos medias de grupos no relacionados
ANOVA Para dilucidar diferencias entre las medias de dos o más grupos
Regresión: evaluar si el cambio en una variable predice el cambio en otra variable
Regresión simple Prueba cómo el cambio en la variable predictor  anticipa el nivel de cambio en la variable de resultado
Regresión múltiple Prueba cómo el cambio en la combinación de dos o más variables predictores anticipa el nivel de cambio en la variable de resultado
No paramétrico: se usa cuando los datos no cumplen con los supuestos requeridos para las pruebas paramétricas
Prueba de suma de rangos de Wilcoxon Contrasta la diferencia entre dos variables relacionadas: tiene en cuenta la magnitud y la dirección de la diferencia
Prueba de signos Comprueba si dos variables relacionadas son diferentes: ignora la magnitud del cambio, sólo toma en cuenta la dirección
Prueba de rango de signos de Wilcoxon Verifica la diferencia entre dos variables relacionadas: tiene en cuenta la magnitud y la dirección de la diferencia
   

 

¿Cómo elegir un tipo de análisis estadístico de datos específico?

La tabla anterior proporcionó un resumen de los diferentes tipos de pruebas estadísticas.

¿Cómo elegir  la prueba correcta según el diseño de investigación, el tipo de variable y la distribución?

El  siguiente diagrama proporciona un resumen de las preguntas que debes responder antes de que puedas elegir la prueba adecuada.

 

Seleccionar un análisis estadístico de datos
Seleccionar un análisis estadístico de datos

 

Ejemplos concretos de análisis estadístico de datos

Ahora que estás familiarizado con las preguntas que debes responder para seleccionar una prueba estadística,

Pongamos manos a la obra.

La siguiente tabla ilustra cómo podrías seleccionar un análisis estadístico de datos que sea el más pertinente.

La siguiente tabla también muestra que,

según el diseño del estudio y la distribución de los datos, la prueba estadística más adecuada para el análisis puede cambiar.

 

Diseño de investigación Grupos Momentos Distribución de datos Tipo de variable Análisis estadístico de datos
Test/Pretest:

Estudio del impacto de un componente de tutoría de ocho semanas en un programa extracurricular. Evaluación de la satisfacción de los 40 participantes. Se comparará la satisfacción de los estudiantes utilizando una prueba previa, antes de que comience la tutoría y una prueba posterior después de que finalice

Uno Dos Normal Ordinal:

1 = Muy satisfecho,

2 = Satisfecho,

3 = Nada satisfecho

Prueba t pareada
Lo mismo que arriba. Uno Dos No normal Lo mismo que arriba Prueba de rangos de signos de Wilcoxon
Test/PreTest  y grupo de control: comparación de la satisfacción de dos grupos de estudiantes en diferentes programas después de la escuela. Cada grupo tiene 25 participantes. Comparación de las puntuaciones de satisfacción mediante una prueba previa, antes de la intervención y una prueba posterior, después de la intervención. Dos Dos No Normal Lo mismo que arriba Prueba de suma de rangos de Wilcoxon
Test/Pretest: evaluación de la pérdida de peso después de una intervención nutricional entre un grupo de 50 estudiantes que reciben la intervención. Quisiera determinar si existe una relación entre la participación en la intervención y la pérdida de peso. El peso se mide antes y después de la intervención. Uno Dos Normal Continua (razón):

Peso en libras

Prueba T pareada

 

Para ver la otra cara de la moneda, la investigación cualitativa, revisa éste artículo:

Investigación cualitativa: cuando la estadística se queda corta

Si te sientes cómodo con los conceptos estadísticos y con el manejo de Excel, dale un vistazo a éste post de Jordi Ollé:

Cómo hacer un análisis estadístico con Excel

 

En resumen…

Estas estadísticas nos pueden decir si los resultados / relaciones que observamos son reales o sólo son fruto del azar.

Asociado con cada prueba estadística hay un p-valor  que nos dice si el resultado es estadísticamente significativo.

Si alguien dice que determinado análisis estadístico de datos fue, valga la redundancia,  estadísticamente significativo,

sugiere que es probable que los resultados no se deban al azar.

Para muchas pruebas estadísticas, los resultados se consideran significativos si el p-valor es .05 o menos.

Esto se basa en un nivel de confianza del 95%.

Este límite o criterio de .05 se estableció durante el desarrollo temprano de los métodos estadísticos y es algo bien conocido.

Es importante comprender también que un resultado que sea estadísticamente significativo no implica que el efecto sea realmente importante.

A veces, los efectos pequeños pueden ser estadísticamente significativos, simplemente, porque un gran número de personas han participado en la investigación.

¿Qué te ha parecido este resumen acerca del análisis estadístico de datos?

¿Crees que te será de utilidad cuando tengas que enfrentarte a la gran cantidad de información que has recabado para tu tesis, y no sepas por dónde empezar a analizarla?

¿Crees que te ayudará a derivar conclusiones relevantes que avalen tus hipótesis iniciales?

Si te apetece, déjame tus comentarios por aquí abajo, estaré pendiente de leerte

 

Please follow and like us:
Facebook
Twitter
Visit Us
LinkedIn
Pinterest
Pinterest

4 Comentarios

    • cgodoyr

      Buen día Silvana,

      Gracias por tu interés en lo que publicamos en Tesis de Cero a 100

      En relación a tu solicitud, te detallo a continuación los pasos a seguir para que obtengas por ti misma el pdf del más reciente o cualquiera de los artículos del blog (y también de cualquier otro blog o página Web):

      1. Copia la dirección del artículo que está arriba en la barra del navegador con Ctrl+C
      2. Ve http://www.printfriendly.com y pega la dirección copiada en el paso anterior en la caja en blanco que aparece ahí, con ctrl+v
      3. Haz clic en el botón Preview que aparece a la derecha
      4. Luego que se genere la vista previa, haz clic en el botón PDF que está arriba
      5. Dale clic en el botón verde que aparece para descargar el PDF del artículo, eso es todo

      Espero que te sea útil el material

      Saludos Cordiales,

      Dr. Carlos Godoy Rodríguez, MSc.

  1. Azucena

    Hola es un gusto leer este tipo de información tan clara, me gustaría que añadiera a sus publicaciones los datos para referenciar… gracias

    • cgodoyr

      Buen día Azucena,

      Gracias por tus comentarios positivos hacia los artículos de Tesis de Cero a 100

      Vamos a tomar en cuenta tu sugerencia de colocar los datos de referencia en los próximos post

      Saludos Cordiales,

      Dr. Carlos Godoy Rodríguez

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies