TUTORIAL ESTADÍSTICO CANAL INVESTIGACIÓN
¡Descubre cuál es la mejor prueba estadística para tu investigación!
?
Es un hecho que los datos de un estudio tienen una distribución normal cuando sus valores presentan una curva en forma de campana, simétrica alrededor de la media, lo que se denomina curva normal o de Gauss. La curva normal se aproxima indefinidamente al eje de abscisas sin, sin embargo, alcanzarlo. Como la curva es simétrica alrededor de la media, la probabilidad de que ocurra un valor mayor que la media es igual a la probabilidad de que ocurra un valor menor que la media, es decir, ambas probabilidades son iguales al 50%. En la distribución normal, la media, la mediana y la moda están en el mismo punto de la curva, o muy cerca.
Básicamente, hay 3 formas de verificar si la distribución de datos cuantitativos es normal o no normal. El primero es verificar si la media, la moda y la mediana tienen valores idénticos o muy similares. Diferencias muy grandes en los valores de las 3 principales medidas de tendencia central indican que la distribución no puede considerarse normal. Otra forma empírica de probar el patrón de distribución de los datos es construir un histograma de frecuencia de los datos en la curva de distribución normal (curva de Gauss). Varios programas informáticos específicos realizan este tipo de comparación de datos de muestra con los datos característicos de la curva normal. Si el histograma está muy sesgado, la distribución se considera no normal. La tercera forma es aplicar pruebas estadísticas específicas para verificar la hipótesis de normalidad. Algunos ejemplos son la prueba de Kolgomorov-Smirnov (KS) y la prueba de Shapiro-Wilks (W).
Si la distribución de datos de una variable cuantitativa no puede considerarse normal, debemos utilizar las pruebas no paramétricas utilizadas para variables cualitativas con escala ordinal.
Asumiendo que la distribución de datos es normal o aproximadamente normal, las pruebas paramétricas están indicadas para la comparación entre grupos. Estas pruebas basan su decisión en la comparación de parámetros (media, desviación estándar), esta comparación solo tendrá sentido si los parámetros son representativos de las distribuciones que se comparan.