top of page
M pata larga-min.jpeg

MISCELÁNEA

Desviación estándar y error estándar

Autora: Ana Royuela Vicente (responsable de al Unidad de Bioestadística del Instituto de investigación sanitaria Puerta de Hierro Majadahonda. CIBERESP)

Fecha de publicación: 16/02/2022

Categoría: Recordar

2 minutos

Los estudios de investigación rara vez se realizan sobre el conjunto de la población. Por ejemplo, es inalcanzable conocer el nivel de colesterol en la totalidad de la población española. Por ello se selecciona aleatoriamente una muestra representativa de la población, de manera que muestra y población presenten características similares, más aún cuanto mayor sea el tamaño muestral.


Antes de definir y explicar la desviación y el error estándar, debemos saber que en la literatura se usan indistintamente los términos típica y estándar, es decir, podemos ver desviación típica/desviación estándar y error típico/error estándar.


Si queremos conocer cómo se agrupan los datos de una variable en nuestra muestra, tenemos que usar la desviación estándar, que se define como una medida de la dispersión de los datos de una muestra alrededor de la media: cuanto mayor sea la dispersión, mayor es la desviación estándar. Por tanto, si mis datos no presentan ninguna variación, es decir, si fueran todos iguales, entonces mi desviación estándar seria cero.


Hay una regla que podemos aplicar al utilizar la desviación estándar, siempre que la variable a analizar presente una distribución normal o gaussiana. El intervalo comprendido entre la media - 1 desviación estándar y la media + 1 desviación estándar incluirá el 68% de los datos de una muestra, mientras que la media + 1,96 (es decir, casi 2 veces la desviación estándar) veces la desviación estándar y la media – 1,96 veces la desviación estándar incluirá el 95% de la muestra. Se considera que lo más frecuente es que las variables biológicas presenten una distribución normal, y podamos aplicar la regla, pero no siempre es así.


Hay otra regla menos conocida, que nos permite cuantificar la dispersión de los datos sin importarnos el tipo de distribución que tiene la variable a analizar. Está basada en la desigualdad de Chebyshev, y dice que el intervalo comprendido entre la media - k veces la desviación estándar y la media + k veces la desviación estándar incluye al menos al (1-1/ k2) parte central de los datos. Por tanto, si k = 2, entonces (1 – 1/4) = 3/4, es decir, el 75% de los datos centrales están entre la media - 2 veces la desviación estándar y la media + 2 veces la desviación estándar.


Pero ¿es lo mismo la desviación estándar de la media que el error estándar de la media? NO. A veces, en la literatura médica se citan ambos índices como si fueran lo mismo, pero no es correcto.


Para entender la diferencia, debemos recordar lo comentado previamente en este post: una muestra presenta similares características a la de la población de la que se extrae. Ahora bien, no siempre sucede así, y la muestra puede no ser representativa de la población, presentando diferencias.


El error estándar de la media es el índice que cuantifica cuánto se apartan los valores en la muestra de sus correspondientes valores en la población. Es decir, el error estándar de la media cuantifica las oscilaciones de la media muestral (media obtenida en los datos)

alrededor de la media poblacional (verdadero valor de la media). Puede parecer un galimatías, pero lo importante es entender que no es lo mismo el error estándar de la media que la desviación estándar de la media, y que el error estándar no es un índice de variabilidad, sino una medida del error que se comete al tomar la media calculada a partir de una muestra poblacional como estimación de la verdadera media de la población.


Por cierto, no solo existe el error estándar de la media, sino de cualquier medida que se pueda obtener en una muestra. Por ejemplo, existe el error estándar de una proporción, de una desviación estándar, de una varianza o de un riesgo relativo. Siempre nos indicará el error cometido al estimar la verdadera medida de una población a partir de su valor extraído de la muestra poblacional.


También aprovechamos para recordar que partiendo del error estándar se construyen los famosos intervalos de confianza de una medida determinada. Pero eso ya, para otro post.



Logo_fondoBlanco4-3.jpeg

Ilustración 1. Error estándar y desviación estándar

Referencias

AGRADECIMIENTOS

Al Dr. Víctor Abraira, por sus valiosas enseñanzas y por hacer fácil lo difícil.



Desviación estándar y error estándar. V. Abraira. SEMERGEN, 28 (2002), pp. 84-85

bottom of page