jueves, 5 de octubre de 2017

MEDIA VS MEDIANA VS MODA

¿Cuál medida de tendencia central es más adecuada?

MEDIA
Conveniencias:
•Su cálculo es muy sencillo y en él intervienen todos los datos.
•Su valor es único para una serie de datos dada.
•Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de una medida de dispersión.
•Se interpreta como "punto de equilibrio " o " centro de masas " del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor.

Inconveniencias:
• Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo, poblaciones muy distintas en su composición pueden tener la misma media.

Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendría una estatura media de 1,95 m, valor que representa fielmente a esta población homogénea. Sin embargo, un equipo de jugadores de estaturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi  ninguno de sus componentes.

•En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un alto directivo que gane $1.000.000 tiene tanto peso como el de diez empleados "normales" que ganen $1.000. En otras palabras, se ve muy afectada por valores extremos

MEDIANA
Las principales propiedades de la mediana son:
• Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
• Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
• No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

 Sus principales inconvenientes
•Son que en el caso de datos agrupados en intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la media aritmética.

MODA
Propiedades
• Cálculo sencillo.
• Interpretación muy clara.
• Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social.

Inconvenientes
• Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del número de intervalos y de su amplitud.
• Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.
• No siempre se sitúa hacia el centro de la distribución.
• Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

¿Cuándo usar la media, la mediana o la moda?
Estas son formas de destacar la respuesta típica en datos a nivel de intervalo. El uso de la media o el promedio (calculándose al sumar todas las respuestas y dividiendo este resultado entre el número de elementos), puede llevar a malinterpretar los datos, si estos se inclinan hacia uno lado u otro, i.e. si están “desviados” estadísticamente. Por ejemplo, si se pregunta a un grupo de personas cuántas parejas sexuales tienen o han tenido, normalmente responderán con un número relativamente reducido, como 1 ó un número entre 5 y 10. Solamente unas cuantas personas responderán con números mayores, como 50 ó más. En este caso, la distribución de las respuestas está desviada (o tiende hacia) los números bajos. Si se reporta el promedio y se tiene una persona que reportó un alto número de parejas, el promedio no será típico. En estos casos, sería mejor reportar la mediana (que es el valor en medio de un juego de datos, con la mitad de los valores por arriba, y la mitad abajo). La mediana proporciona el valor típico aun cuando el grupo de datos esté desviado hacia un lado u otro. Cuando los datos no estén desviados (cuando están distribuidos normalmente) la media y la mediana serán esencialmente el mismo número. También puede utilizar la moda – los valores
más comunes en un juego de datos. Esto puede ser útil, por ejemplo si hay una encuesta que mide el aumento de conocimiento después de una capacitación y se quiere saber el puntaje más común de los participantes

No hay comentarios:

Publicar un comentario