Saltar a contenido

Conceptos (para dummys)

Estas ideas te ayudan a escoger la estadistica correcta sin entrar en teoria pesada.

Media vs mediana vs Huber

Piensa en 6 mediciones y un error grande:

[10, 12, 11, 15, 10, 1000]
  • Media: sube mucho por el 1000.
  • Mediana: se queda en el centro real.
  • Huber: se parece a la media cuando todo esta limpio, pero "frena" outliers.

Regla simple: - Usa media si los datos son limpios. - Usa mediana o Huber si hay outliers.

MAD e IQR

  • MAD (Median Absolute Deviation) mide dispersion alrededor de la mediana.
  • IQR (Interquartile Range) mide el rango entre el 25% y 75%.

Si el MAD o el IQR son altos, hay mucho ruido o colas largas.

Cuantiles de R

R define 9 formas de calcular cuantiles. StatGuard implementa todas.

  • Tipo 7: default de R. Buen equilibrio.
  • Tipos 1-3: mas discretos (menos interpolacion).
  • Tipos 8-9: ajustes de sesgo para ciertas distribuciones.

Si no sabes cual usar, empieza por tipo 7.