Si es mucha información, debe tener altos flujos.
De donde la podemos sacar:
- Redes sociales.
- Videos.
- Geolocalizacion de usuarios.
- Datos no estructurados (si pueden venir registros como en json)
- tambien aplica para cvs masivos.
Donde almacenamos estos:
- Buckets/Datalake/storage: Un google drive pero mas interesante.
- Datawarehouse
Para que sirve:
Tomar decisiones con información descriptiva, al mezclarse con técnicas de bussines inteligence como lo es la clusterizacion de clientes.
Intentar predecir posibles eventos o generar recomendadores, basado en técnicas de aprendizaje automático.
El problema de la calidad del dato.
Mucha informacion, no siempre significa una buena calidad y veracidad de la informacion.
Horarios de procesamiento también puede ser un problema o oportunidad, dependiendo de la volatilidad de la información.
Top comments (0)