¿Qué es la t de Student y para qué sirve?

La t de Student es una distribución de probabilidad utilizada en estadística y probabilidad para aproximar el momento de primer orden de una población normalmente distribuida. Fue descubierta por William Sealy Gosset, un matemático inglés que trabajó para la cervecería Guinness en Dublín.

¿Cómo funciona la t de Student?

La t de Student se utiliza cuando se tiene una muestra pequeña o una muestra cuya desviación estándar es desconocida. Como resultado, no se puede utilizar la distribución normal para aproximar el promedio de la población. En cambio, se utiliza la distribución t de Student.

La distribución t de Student se utiliza para calcular el valor de la media de una muestra pequeña extraída de una población normal, de la cual no se conoce la desviación típica. La distribución t puede aproximarse a una distribución normal cuando se añaden más grados de libertad.

Los grados de libertad controlan la distribución de la distribución t y solo dependen del tamaño de la muestra. En general, se utiliza la distribución t cuando el tamaño de la muestra es menor a 30 elementos.

¿Qué es una prueba t?

Una prueba t es una herramienta utilizada en estadística para evaluar las medias de uno o dos grupos mediante pruebas de hipótesis. Se utiliza para determinar si un grupo difiere de un valor conocido, si dos grupos difieren entre sí, o si hay una diferencia significativa en medidas pareadas.

Primero se define la hipótesis que se quiere comprobar y se determina un riesgo asumible de llegar a conclusiones erróneas. Luego, se deben tener en cuenta las asunciones de la prueba, como que los datos son continuos, se han tomado aleatoriamente de la población, hay homogeneidad en la varianza y la distribución es aproximadamente normal.

Hay tres tipos de prueba t para comparar medias: la prueba t de una muestra, la prueba t de dos muestras y la prueba t pareada. En caso de tener más de dos grupos, se deben utilizar métodos de comparación múltiple como el análisis de varianza (ANOVA).

También se puede utilizar una prueba t para comparar la correlación entre dos variables. Es importante definir si la prueba es unilateral o bilateral antes de realizar cualquier cálculo.

Historia de la t de Student

William Sealy Gosset descubrió la distribución de la t de Student mientras trabajaba como químico y estadístico en la cervecería Guinness de Dublín, Irlanda en el siglo XX. En su trabajo, se encontró que usar la desviación muestral (también conocida como error estándar) era más precisa que usar la desviación estándar estimada (s) para estimar la incertidumbre de una media en una muestra pequeña.

Gosset publicó su trabajo bajo el pseudónimo “Student” para evitar conflictos con su empresa. En sus experimentos utilizó la distribución t de Student para comparar dos medios de fertilización sobre las condiciones de crecimiento de las hojas de una planta, demostrando que el nuevo medio resultó en hojas más grandes.

Ejemplo de uso de la t de Student

Imaginemos que Manuel Molina Arias, un pediatra español del Servicio de Gastroenterología del Hospital Infantil Universitario La Paz en Madrid, está probando dos tratamientos diferentes para una enfermedad en niños. Molina quiere saber si hay una diferencia significativa entre los dos tratamientos en términos de su eficacia.

Molina selecciona aleatoriamente a 20 niños para recibir el tratamiento 1 y a otros 20 niños para recibir el tratamiento 2. Después de un mes, Molina analiza los resultados y obtiene una media de 2.8 en el tratamiento 1 y una media de 3.5 en el tratamiento 2.

Para determinar si hay una diferencia significativa entre los tratamientos, Molina utiliza una prueba t de dos muestras. Primero establece la hipótesis nula (H0) de que no hay diferencia significativa entre los dos tratamientos y la hipótesis alternativa (H1) de que hay una diferencia significativa. El valor de alfa de Molina es de 0.05 en este caso.

Molina encuentra que la prueba t de dos muestras da como resultado un valor t de -2.06 y un valor p de 0.046. Este valor p es menor que el valor de alfa de Molina, lo que indica que hay una diferencia significativa entre los dos tratamientos en términos de su eficacia en el tratamiento de la enfermedad.

Conclusión

La t de Student es una herramienta invaluable en estadística y probabilidad, permitiendo a los investigadores trabajar con muestras pequeñas y desconocer la varianza poblacional. Las pruebas t son una forma de evaluar estas muestras y determinar posibles diferencias. Tener una buena comprensión de estas herramientas puede proporcionar una gran cantidad de información útil en investigaciones y experimentos.