DEV Community

Cover image for ¿Qué es Databricks - AWS?
Andres
Andres

Posted on • Edited on

¿Qué es Databricks - AWS?

Databricks es una plataforma poderosa para el procesamiento de grandes datos volumenes de datos y ML, brinda un entorno unificado que se para todos los profesionales de datos, te muestros algunos pros y contras de la herramienta:

Image description

Ventajas:

  1. Escalabilidad: Proporciona una alta escalabilidad, permitiendo manejar grandes volumnes de datos.

  2. Colaboración: Permite integracion colaborativa (GIT), de esta forma científicos de datos, ingenieros de datos y analistas, pueden apoyarse colaborativamente sin problemas.

Image description

  1. Integración: Se integra a los principales providers Cloud como Azure, AWS y Google Cloud, haciéndolo versátil para diferentes entornos.

Image description

  1. Rendimiento: Es una herramienta que esta optimizada para el funcionamiento de apache Spark..

  2. Delta Lake: Incorpora DeltaLake para proporcionar transacciones ACID en todos los datos y adicionalmente tiene Unity Catalog, con el cual tendremos governanza en los datos.

Image description

Contras:

  1. Costo alto: Puede ser costoso para pequeñas empresas o o de
    presupuestos limitados.

  2. Dependencia del proveedor: Al basarse en la nube tiene alta dependencia de proveedores cloud.

Para finalizar, Databricks es una plataforma poderosa y versátil para análisis de grandes datos y ML, ofrece numerosos beneficios en de escalabilidad, rendimiento y colaboración.
Sin embargo, los usuarios potenciales deben considerar los costos asociados, la complejidad de aprendizaje.

Pero no te preocupes para eso esta la comunidad, en este post te doy una guia de como tener tu primer acreditacion, total mente gratis!! 🤑

https://dev.to/andresguecha/como-obtener-la-acreditacion-databricks-lakehouse-fundamentals-30cb

Hasta la proxima!

-GuechaTech

Top comments (0)