DEV Community

Rodrigo Espinoza
Rodrigo Espinoza

Posted on

BigData para devs

Si es mucha información, debe tener altos flujos.
De donde la podemos sacar:

  • Redes sociales.
  • Videos.
  • Geolocalizacion de usuarios.
  • Datos no estructurados (si pueden venir registros como en json)
  • tambien aplica para cvs masivos.

Donde almacenamos estos:

  • Buckets/Datalake/storage: Un google drive pero mas interesante.
  • Datawarehouse

Para que sirve:
Tomar decisiones con información descriptiva, al mezclarse con técnicas de bussines inteligence como lo es la clusterizacion de clientes.

Intentar predecir posibles eventos o generar recomendadores, basado en técnicas de aprendizaje automático.

El problema de la calidad del dato.
Mucha informacion, no siempre significa una buena calidad y veracidad de la informacion.

Horarios de procesamiento también puede ser un problema o oportunidad, dependiendo de la volatilidad de la información.

Top comments (0)