Hoy nos vamos apartar un poco de la fase de diseño de un proyecto de investigación o tesis, para dar un salto hacia delante y ubicarnos ya en la fase de ejecución
Supongamos que hemos diseñado sin problemas nuestro instrumento de recogida de datos
Lo aplicamos a un grupo reducido de sujetos (prueba piloto)
Detectamos algunas pequeñas inconsistencias, las cuales subsanamos de inmediato
Seleccionamos como es debida la muestra, aplicamos el instrumento y obtuvimos una gran cantidad de datos
Los organizamos, tabulamos, graficamos,… Todo marcha sobre ruedas
Pero, y ahora qué hacemos con toda esa información
De lo que vamos hacer a continuación, del análisis estadístico de datos, hablamos en éste artículo
Pero, ¡Ojo! como se indica en el título, el artículo está dirigido a lectores con mínimos conocimientos de estadística
De manera que te lo vamos a poner lo más sencillo posible, sin complicadas expresiones matemáticas
¡Vamos a por ello!
¿Qué es el análisis de datos?
El análisis de datos es el proceso de examinarlos sistemáticamente con el propósito de resaltar aquella información que sea más útil.
El análisis estadístico de datos es la base de la investigación científica.
Realizar un análisis de datos completo con la información que has recopilado durante tu investigación te permitirá:
- Determina el impacto de tu trabajo.
- Evaluar la calidad de tu investigación.
- Comunicar los resultados a grupos de interés.
¿Qué tipos de datos puedes recoger: cuantitativos o cualitativos?
El tipo de datos que recopiles depende de la pregunta que deseas responder y de los recursos que dispongas
En términos muy sencillos, hay dos tipos de datos que puedes recabar durante el proceso de elaboración de tu tesis o trabajo de investigación: cualitativos y cuantitativos.
Ambos tipos de datos tienen ventajas y limitaciones, y pueden ser apropiados para diferentes entornos, diseños y preguntas de investigación.
Los datos cuantitativos son información numérica, cuyo análisis involucra técnicas estadísticas.
Por eso quizás sea más apropiado referirnos a análisis estadístico de datos, y éste será el tema central del post
En el otro extremo, los datos cualitativos consisten en palabras y narraciones.
El análisis de los datos cualitativos puede venir en muchas formas, incluyendo resaltar palabras clave, extraer ideas principales y elaborar conceptos
Un ejemplo de datos cuantitativos sería cuando administramos un cuestionario de satisfacción, pidiéndoles a los participantes que califiquen su experiencia en una escala del 1 al 5.
En este caso, los datos serían numéricos y tendríamos que utilizar técnicas estadísticas para derivar conclusiones sobre la satisfacción de los participantes.
Un ejemplo de datos cualitativos sería si dirigieras un grupo de enfoque con los padres que participan en un programa educativo para comprender las percepciones de sus representados.
En este caso, los datos que recopilaste fueron probablemente los audios que grabaste con las opiniones de los representantes acerca del curso que acaban de tomar,
por lo que utilizarías técnicas cualitativas para analizar las transcripciones en busca de contenidos e ideas relevantes para mejorar el programa
¿Qué es el análisis estadístico de datos?
Ahora que hemos revisado los diferentes tipos de datos, necesitamos saber cómo usamos las respuestas numéricas que hemos obtenido.
El análisis de la información numérica produce resultados a partir de datos.
La interpretación de los datos a través del análisis es clave para comunicar los resultados a las partes interesadas.
El tipo de análisis que utilices depende del diseño de la investigación, el tipo de variables que tienes y la distribución de los datos.
En esta sección nos centraremos en los dos tipos de análisis estadístico de datos más utilizados: descriptivo e inferencial.
Análisis descriptivo de datos
El análisis descriptivo nos informa acerca de las cualidades básicas de los datos.
El análisis descriptivo incluye estadígrafos (o estadísticos) como el rango, el mínimo, el máximo y la frecuencia.
También incluye medidas de tendencia central como la media, mediana, moda, desviación estándar, y algunos otros que nos dicen acerca de la forma que tienen nuestros datos.
Hay muchas maneras de describir los datos, y podemos usar el análisis descriptivo para que nos diga cómo son esos datos.
A continuación se presentan algunas maneras comunes de describir los datos.
Utilizando el conjunto de puntuaciones a continuación, el siguiente diagrama enumera los estadígrafos (o estadísticos) descriptivos más sencillos.
Muestra de datos: 7, 7, 7, 7, 10, 10, 20, 20, 20, 23

Medidas de Tendencia Central
Las medidas de tendencia central pueden dar una idea general de cómo responden los participantes en un instrumento de recogida de datos, digamos por ejemplo, un cuestionario
Estas medidas incluyen la Media, la Mediana y el Modo.

Medidas de Dispersión
Cuando pensamos en cómo realizar un análisis estadístico de datos, además de las medidas de tendencia central, también debemos considerar qué tan alejadas o cercanas están las respuestas respecto de una de estas medidas
Por tanto, para comprender más sobre la naturaleza de los datos, hay que considerar también las llamadas Medidas de Dispersión
De estas, las que se utilizan más comúnmente son: la desviación estándar o típica, la varianza y el coeficiente de variación
Varianza
La varianza muestral puede pensarse como el “promedio” de las distancias a la media elevado al cuadrado.
Sin embargo, precisamente por el hecho de elevar al cuadro, la varianza no tiene las mismas unidades que los datos.
Si los datos originales estaban expresados en m (metros), caso de las estaturas de un grupo de individuos, la varianza estaría expresada en m2 (metros cuadrados)
Para salvar este inconveniente, definimos la desviación estándar como la raíz cuadrada positiva de la varianza
Desviación Estándar
Es una medida de qué tan cerca o alejadas están las puntuaciones con respecto a su media.
La desviación estándar nos dice qué tan bien la media representa a todos los datos.
Dicho de otra forma, la desviación estándar representa la cantidad promedio que una puntuación dada se desvía de la puntuación media.
Coeficiente de Variación
Se trata simplemente de dividir la desviación estándar entre la media, y multiplicar este cociente por 100
Expresa el grado de dispersión de los datos como un porcentaje
Útil para comparar la homogeneidad entre varios conjuntos de datos
Análisis inferencial de datos
Acabamos de revisar el análisis descriptivo, que incluye estadígrafos como rango, mínimo, máximo y frecuencia.
También incluye medidas de tendencia central como la media, mediana, moda, desviación estándar, y nos dice lo que nuestros datos parecen ser.
Una vez que hayas descrito adecuadamente tus datos, puedes pasar a hacer inferencias basadas en ellos.
El análisis estadístico de datos inferencial utiliza pruebas estadísticas para ver si un patrón que observamos, se debe al azar o a los efectos de una intervención.
La investigación a menudo utiliza el análisis inferencial para determinar si existe una relación entre una intervención y un resultado, así como la fuerza de esa relación.
Esta sección proporciona una descripción general de las cosas a considerar antes de comenzar el análisis inferencial,
ejemplos de pruebas estadísticas comunes y el grado de significación estadística de esas pruebas.
El primer paso en el análisis inferencial
Uno de los primeros pasos en el análisis inferencial es responder a la pregunta: ¿cómo se ve la distribución de datos?
El tipo de prueba que elijas se guiará por la distribución de los datos.
Las distribuciones se dividen en dos categorías, normal y no normal.
Siempre debes verificar la distribución de tus datos antes de comenzar el análisis inferencial.
Distribución normal
Este tipo de distribución se parece a la muy conocida Campana de Gauss.
La siguiente gráfica es un ejemplo de cómo se ve una distribución normal.

Si observas tu distribución, puedes dibujar una curva sobre ella que se ajuste a tus datos.
Si tu distribución se parece a la de la imagen de arriba (o cercana de ella), tu distribución es normal.
Este tipo de distribución nos muestra que la mayoría de los datos se agrupan alrededor de un número o valor central.
Por lo general, si los datos son normales, elegimos para llevar a cabo nuestro análisis estadístico de datos, entre las pruebas estadísticas llamadas pruebas paramétricas.
Distribuciones no normales
Hay varias formas en que una distribución puede ser no normal.
Un pequeño tamaño de muestra o conjuntos de respuestas inusuales, son razones comunes por las que los datos pueden no estar distribuidos normalmente.
Generalmente, si los datos no son normales, elegimos de un conjunto de pruebas estadísticas llamadas pruebas no paramétricas.
Revisaremos los dos tipos de distribuciones no normales que se enumeran a continuación.
Sesgada a la derecha o a la izquierda
Este tipo de distribución no toma la forma de campana que nos es familiar, sino que presenta cierto sesgo (asimetría), bien hacia la derecha (positiva) o a hacia la izquierda (negativa).
El siguiente gráfico muestra un ejemplo de distribución sesgada negativamente
En este caso, la mayoría de las puntuaciones están en el extremo más bajo.

Al contrario, el gráfico contiguo muestra datos sesgados positivamente;
la mayoría de las puntuaciones se encuentran en el extremo superior.
Curtosis
Este concepto se refiere al grado de agudeza que presenta la distribución de los datos
En palabras sencillas, que tan puntiaguda o achatada (plana) es la curva que representa a la distribución de los datos.
Se distinguen tres casos: leptocúrticas (las más agudas), mesocúrticas (curvas normales) y platicúrtica (las más planas o achatadas)

Análisis estadísticos de datos más comunes
Ahora que has analizado la distribución de tus datos y quizás hayas calculado algunos estadígrafos para averiguar la media, la mediana o el modo,
es hora de hacer algunas inferencias sobre los datos.
Como se mencionó anteriormente, la estadística inferencial es el conjunto de pruebas estadísticas que usamos para hacer inferencias a partir de una muestra.
Estas pruebas estadísticas nos permiten afirmar si el patrón que estamos observando es real o sólo debido a la casualidad
¿Cómo sabes qué tipo de prueba usar?
Existe una amplia gama de pruebas estadísticas.
La decisión acerca de cuál usar depende del diseño de la investigación, la distribución de los datos y el tipo de variable.
En general, si los datos se distribuyen normalmente, elegirás entre las pruebas paramétricas.
Si los datos no son normales, elegirás del conjunto de pruebas no paramétricas.
A continuación se muestra una tabla con algunas pruebas estadísticas comunes y sus usos más frecuentes.
Tipo de prueba | En qué casos se usa |
Correlacional | Cuando se busca establecer una asociación entre variables |
Correlación de Pearson | Para determinar la fuerza de la asociación entre dos variables continuas (métricas) |
Correlación de Spearman | Para determinar la fuerza de la asociación entre dos variables ordinales |
Chi-cuadrado | Para determinar la fuerza de la asociación entre dos variables categóricas (nominales) |
Comparación de medias: busca la diferencia entre las medias de las variables | |
Prueba T pareada | Para dilucidar diferencias entre dos medias de grupos relacionados |
Prueba T para muestras independientes | Para dilucidar diferencias entre dos medias de grupos no relacionados |
ANOVA | Para dilucidar diferencias entre las medias de dos o más grupos |
Regresión: evaluar si el cambio en una variable predice el cambio en otra variable | |
Regresión simple | Prueba cómo el cambio en la variable predictor anticipa el nivel de cambio en la variable de resultado |
Regresión múltiple | Prueba cómo el cambio en la combinación de dos o más variables predictores anticipa el nivel de cambio en la variable de resultado |
No paramétrico: se usa cuando los datos no cumplen con los supuestos requeridos para las pruebas paramétricas | |
Prueba de suma de rangos de Wilcoxon | Contrasta la diferencia entre dos variables relacionadas: tiene en cuenta la magnitud y la dirección de la diferencia |
Prueba de signos | Comprueba si dos variables relacionadas son diferentes: ignora la magnitud del cambio, sólo toma en cuenta la dirección |
Prueba de rango de signos de Wilcoxon | Verifica la diferencia entre dos variables relacionadas: tiene en cuenta la magnitud y la dirección de la diferencia |
¿Cómo elegir un tipo de análisis estadístico de datos específico?
La tabla anterior proporcionó un resumen de los diferentes tipos de pruebas estadísticas.
¿Cómo elegir la prueba correcta según el diseño de investigación, el tipo de variable y la distribución?
El siguiente diagrama proporciona un resumen de las preguntas que debes responder antes de que puedas elegir la prueba adecuada.

Ejemplos concretos de análisis estadístico de datos
Ahora que estás familiarizado con las preguntas que debes responder para seleccionar una prueba estadística,
Pongamos manos a la obra.
La siguiente tabla ilustra cómo podrías seleccionar un análisis estadístico de datos que sea el más pertinente.
La siguiente tabla también muestra que,
según el diseño del estudio y la distribución de los datos, la prueba estadística más adecuada para el análisis puede cambiar.
Diseño de investigación | Grupos | Momentos | Distribución de datos | Tipo de variable | Análisis estadístico de datos |
Test/Pretest: Estudio del impacto de un componente de tutoría de ocho semanas en un programa extracurricular. Evaluación de la satisfacción de los 40 participantes. Se comparará la satisfacción de los estudiantes utilizando una prueba previa, antes de que comience la tutoría y una prueba posterior después de que finalice | Uno | Dos | Normal | Ordinal: 1 = Muy satisfecho, 2 = Satisfecho, 3 = Nada satisfecho | Prueba t pareada |
Lo mismo que arriba. | Uno | Dos | No normal | Lo mismo que arriba | Prueba de rangos de signos de Wilcoxon |
Test/PreTest y grupo de control: comparación de la satisfacción de dos grupos de estudiantes en diferentes programas después de la escuela. Cada grupo tiene 25 participantes. Comparación de las puntuaciones de satisfacción mediante una prueba previa, antes de la intervención y una prueba posterior, después de la intervención. | Dos | Dos | No Normal | Lo mismo que arriba | Prueba de suma de rangos de Wilcoxon |
Test/Pretest: evaluación de la pérdida de peso después de una intervención nutricional entre un grupo de 50 estudiantes que reciben la intervención. Quisiera determinar si existe una relación entre la participación en la intervención y la pérdida de peso. El peso se mide antes y después de la intervención. | Uno | Dos | Normal | Continua (razón): Peso en libras | Prueba T pareada |
Para ver la otra cara de la moneda, la investigación cualitativa, revisa éste artículo:
Investigación cualitativa: cuando la estadística se queda corta
Si te sientes cómodo con los conceptos estadísticos y con el manejo de Excel, dale un vistazo a éste post de Jordi Ollé:
Cómo hacer un análisis estadístico con Excel
Vídeo resumen 1
En resumen…
Estas estadísticas nos pueden decir si los resultados / relaciones que observamos son reales o sólo son fruto del azar.
Asociado con cada prueba estadística hay un p-valor que nos dice si el resultado es estadísticamente significativo.
Si alguien dice que determinado análisis estadístico de datos fue, valga la redundancia, estadísticamente significativo,
sugiere que es probable que los resultados no se deban al azar.
Para muchas pruebas estadísticas, los resultados se consideran significativos si el p-valor es .05 o menos.
Esto se basa en un nivel de confianza del 95%.
Este límite o criterio de .05 se estableció durante el desarrollo temprano de los métodos estadísticos y es algo bien conocido.
Es importante comprender también que un resultado que sea estadísticamente significativo no implica que el efecto sea realmente importante.
A veces, los efectos pequeños pueden ser estadísticamente significativos, simplemente, porque un gran número de personas han participado en la investigación.
¿Qué te ha parecido este resumen acerca del análisis estadístico de datos?
¿Crees que te será de utilidad cuando tengas que enfrentarte a la gran cantidad de información que has recabado para tu tesis, y no sepas por dónde empezar a analizarla?
¿Crees que te ayudará a derivar conclusiones relevantes que avalen tus hipótesis iniciales?
Si te apetece, déjame tus comentarios por aquí abajo, estaré pendiente de leerte
Quisiera el artículo en pdf o Word… para imprimirlo. Esta muy bueno.
Buen día Silvana,
Gracias por tu interés en lo que publicamos en Tesis de Cero a 100
En relación a tu solicitud, te detallo a continuación los pasos a seguir para que obtengas por ti misma el pdf del más reciente o cualquiera de los artículos del blog (y también de cualquier otro blog o página Web):
1. Copia la dirección del artículo que está arriba en la barra del navegador con Ctrl+C
2. Ve http://www.printfriendly.com y pega la dirección copiada en el paso anterior en la caja en blanco que aparece ahí, con ctrl+v
3. Haz clic en el botón Preview que aparece a la derecha
4. Luego que se genere la vista previa, haz clic en el botón PDF que está arriba
5. Dale clic en el botón verde que aparece para descargar el PDF del artículo, eso es todo
Espero que te sea útil el material
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.
Hola es un gusto leer este tipo de información tan clara, me gustaría que añadiera a sus publicaciones los datos para referenciar… gracias
Buen día Azucena,
Gracias por tus comentarios positivos hacia los artículos de Tesis de Cero a 100
Vamos a tomar en cuenta tu sugerencia de colocar los datos de referencia en los próximos post
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez
ESTIMADO DR. MUY ILUSTRATIVO Y PRACTICO SU ARTICULO, Y DISCULPE MI IGNORANCIA PERO QUISIERA SABER A QUE SE REFIERE EL TÉRMINO “MOMENTOS” QUE UD. CITA EN LA TABLA PARA SELECCIONAR EL ANÁLISIS ESTADÍSTICO DE DATOS. GRACIAS POR SU ATENCIÓN.
Buen día Edwin,
Gracias por interactuar con los contenidos de Tesis de Cero a 100
Con relación a tu duda, decirte que el término momentos se utiliza en el artículo para referirme a las veces en que el investigador o tesis hace mediciones o aplica un instrumento a su muestra.
En el ejemplo en concreto al que te refieres, hay un pretest antes de aplicar el tratamiento (1er. momento) y un test después de aplicar el programa extracurricular (2do. momento)
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.
Gracias por la claridad, ordenó mi pensamiento para abordar mis análisis. Utilizaré pruebas No paramétricas, aunque serán otras a las acá sugeridas, llegué a estas gracias a su claridad para que reacomodara mi conocimiento y retomara su perspectiva en la toma de decisiones.
Buen día Jorge Alejandro,
Gracias por tu interés en las publicaciones de Tesis de Cero a 100
Me complace que te hayan servido para aclarar ideas respecto del análisis de datos que es más pertinente utilizar en cada caso.
Estamos a tus órdenes desde este espacio virtual
Adicionalmente, te recomiendo darle un vistazo a nuestro curso online en el siguiente enlace Cómo elaborar un proyecto de tesis, para profundizar más en el proceso de elaboración de un trabajo de investigación
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.
Muy interesante, no tengo claro este tema de las estadísticas, me gustaría saber más.
Hola Mercedes,
Gracias por visitar el blog Tesis de Cero a 100 e interesarte por los temas relacionados con la Estadística
En mi canal de Youtube, puedes encontrar información adicional al respecto
Te invito a que visites el siguiente vídeo y a que te suscribas para mantenerte informada sobre este y otros temas relacionados:
Curso de Estadística Básica para tesistas | Lección 1
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.
Dr. Carlos:
Mis felicitaciones y agradecimiento por su aportación tan significativa a la red. Siempre es difícil encontrar páginas con contenido tan bien logrado: claridad, sencillez, objetividad, ritmo… Simplemente gracias.
Hola Omar,
Muchas Gracias a ti por tan positiva opinión acerca de lo que publicamos cada domingo en el blog Tesis de Cero a 100
Comentarios como el tuyo son los que nos animan a seguir adelante aportando información que pueda ayudar a las personas interesadas en investigación, a culminar sus tesis y proyectos
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.
Muchas gracias Dr. Carlos Godoy, muy ilustrativo y de alto nivel de interés, comparto a mis estudiantes,
saludos cordiales
Gracias a Usted, Dr. Tomás Franco por seguir los artículos que publicamos en el blog de Tesis de Cero a 100 y que bueno que el material le sea de utilidad para sus estudiantes
Ya sabe que por aquí estamos a la orden y esperamos que siga visitando esta página Web
Saludos Cordiales,
Dr. Carlos Godoy Rodríguez, MSc.