¿Cuál medida de tendencia central es más adecuada?
MEDIA
Conveniencias:
•Su cálculo es muy sencillo y en él intervienen
todos los datos.
•Su valor es único para una serie de datos dada.
•Se usa con frecuencia para comparar poblaciones,
aunque es más apropiado acompañarla de una medida de dispersión.
•Se interpreta como "punto de equilibrio "
o " centro de masas " del conjunto de datos, ya que tiene la
propiedad de equilibrar las desviaciones de los datos respecto de su propio
valor.
Inconveniencias:
• Es una medida a cuyo significado afecta
sobremanera la dispersión, de modo que cuanto menos homogéneos sean los datos,
menos información proporciona. Dicho de otro modo, poblaciones muy distintas en
su composición pueden tener la misma media.
Por ejemplo, un equipo de baloncesto con cinco
jugadores de igual estatura, 1,95 m, evidentemente, tendría una estatura media
de 1,95 m, valor que representa fielmente a esta población homogénea. Sin
embargo, un equipo de jugadores de estaturas más heterogéneas, 2,20 m, 2,15 m,
1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también, como puede comprobarse, una
estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes.
•En el cálculo de la media no todos los valores
contribuyen de la misma manera. Los valores altos tienen más peso que los
valores cercanos a cero. Por ejemplo, en el cálculo del salario medio de un
empresa, el salario de un alto directivo que gane $1.000.000 tiene tanto peso como
el de diez empleados "normales" que ganen $1.000. En otras palabras,
se ve muy afectada por valores extremos
MEDIANA
Las principales propiedades de la mediana son:
• Es menos sensible que la media a oscilaciones de
los valores de la variable. Un error de transcripción en la serie del ejemplo
anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
• Como se ha comentado, puede calcularse para datos
agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
• No se ve afectada por la dispersión. De hecho, es
más representativa que la media aritmética cuando la población es bastante
heterogénea. Suele darse esta circunstancia cuando se resume la información
sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos
que elevan la media aritmética haciendo que pierda representatividad respecto
al grueso de la población. Sin embargo, alguien con el salario
"mediano" sabría que hay tanta gente que gana más dinero que él, como
que gana menos.
Sus principales inconvenientes
•Son que en el caso de datos agrupados en
intervalos, su valor varía en función de la amplitud de estos. Por otra parte,
no se presta a cálculos algebraicos tan bien como la media aritmética.
MODA
Propiedades
• Cálculo sencillo.
• Interpretación muy clara.
• Al depender sólo de las frecuencias, puede
calcularse para variables cualitativas. Es por ello el parámetro más utilizado
cuando al resumir una población no es posible realizar otros cálculos, por
ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes
de determinado sector social.
Inconvenientes
• Su valor es independiente de la mayor parte de
los datos, lo que la hace muy sensible a variaciones muestrales. Por otra
parte, en variables agrupadas en intervalos, su valor depende excesivamente del
número de intervalos y de su amplitud.
• Usa muy pocas observaciones, de tal modo que
grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a
su valor.
• No siempre se sitúa hacia el centro de la
distribución.
• Puede haber más de una moda en el caso en que dos
o más valores de la variable presenten la misma frecuencia (distribuciones
bimodales o multimodales).
¿Cuándo usar la media, la mediana o la moda?
Estas son formas de destacar la respuesta típica en
datos a nivel de intervalo. El uso de la media o el promedio (calculándose al
sumar todas las respuestas y dividiendo este resultado entre el número de
elementos), puede llevar a malinterpretar los datos, si estos se inclinan hacia
uno lado u otro, i.e. si están “desviados” estadísticamente. Por ejemplo, si se
pregunta a un grupo de personas cuántas parejas sexuales tienen o han tenido,
normalmente responderán con un número relativamente reducido, como 1 ó un
número entre 5 y 10. Solamente unas cuantas personas responderán con números
mayores, como 50 ó más. En este caso, la distribución de las respuestas está
desviada (o tiende hacia) los números bajos. Si se reporta el promedio y se
tiene una persona que reportó un alto número de parejas, el promedio no será
típico. En estos casos, sería mejor reportar la mediana (que es el valor en
medio de un juego de datos, con la mitad de los valores por arriba, y la mitad abajo).
La mediana proporciona el valor típico aun cuando el grupo de datos esté
desviado hacia un lado u otro. Cuando los datos no estén desviados (cuando
están distribuidos normalmente) la media y la mediana serán esencialmente el
mismo número. También puede utilizar la moda – los valores
más comunes en un juego de datos. Esto puede ser
útil, por ejemplo si hay una encuesta que mide el aumento de conocimiento
después de una capacitación y se quiere saber el puntaje más común de los
participantes
No hay comentarios:
Publicar un comentario