Skip to content

Latest commit

 

History

History
78 lines (52 loc) · 2.42 KB

til-bigdata.md

File metadata and controls

78 lines (52 loc) · 2.42 KB

Como perder datos a lo big data

(... y noSQL)

Tips Generales

  • Heartbeat & GC

    • Stop the world implica no ❤️
    • 👍 G1GC (aunque a veces no alcanza)
  • Espacio libre en disco

    • 👎 Mongo y Cassandra
  • 👎 Discos de red

    • Picos de latencia & IO Queue
    • A menos que tenga enlace dedicado
  • Perdida de un nodo y replicación

    • O cómo la solución puede ser peor que el problema....
  • Backup: no hay

    • Otro cluster....
  • Monitoreo fino


Zookeper

Usos:

  • Configuración global a múltiples nodos, consistente.
  • Lider elecction/lock soft (correr un batch una sola vez)
  • 👎 NO usar para lock intensivo
  • ProTip: usar chroot

Admin

Referencias Generales


Hadoop

  • 👎 Complejo de instalar y mantener
  • 👍 Al menos usar una distro

Hbase/Cassandra


Hive?


Kafka