DEV Community

No le temas a AWS LakeFormation

Al momento de diseñar una solución en AWS, es sumamente importante prestar atención a la "Seguridad" y más aún cuando en la solución se involucra el acceso a datos.

En esta publicación hablaré sobre una alternativa que nos ofrece el Servicio AWS LakeFormation para resguardar el acceso a los datos.

Si bien existen algunas alternativas, la aqui trataremos el control de acceso se gestiona mediante LF-Tags.

Image description

A continuación, se desglosan los componentes y su funcionamiento:

1. Servicios Claves Utilizados

  • AWS Lake Formation: Administra permisos a nivel de base de datos y tablas utilizando LF-Tags.
  • AWS Glue Data Catalog: Almacena metadatos de los datos en S3.
  • Bases de Datos en AWS Glue: -- Glue DB#1 (SALES): Contiene tablas con datos de ventas. -- Glue DB#2 (MKT): Contiene tablas de datos de marketing. -- Glue DB#3 (PRIVATE): Contiene datos privados/sensibles.
  • Athena: Permite consultas SQL sobre los datos.
  • Amazon QuickSight: Se usa para análisis y visualización de datos.
  • Amazon SageMaker: Se utiliza para Machine Learning y analítica predictiva.

2. Control de Acceso con LF-Tags (Etiquetas)
La arquitectura emplea LF-Tags para definir permisos a nivel de base de datos, tabla y columna. Como se puede ver en la arquitectura, Se han asignado LF-Tags específicos a cada unidad de negocio:

  • Etiquetas Verdes → Datos de Ventas (SALES)
  • Etiquetas Azules → Datos de Marketing (MKT)
  • Etiquetas Rojas → Datos Privados/Restringidos

Al setear etiquetas a las distintas bases de datos podemos permitir/no permitir el acceso a los datos de una manera mas práctica logrando asi que:

  • Los usuarios con acceso solo a “Sales” LF-Tags pueden consultar datos en Glue DB#1, pero no pueden ver datos de Marketing o Privados.
  • Los usuarios con acceso a “Marketing” LF-Tags solo pueden consultar Glue DB#2.
  • Los datos Privados (PRIVATE) tienen acceso restringido y requieren permisos especiales.

3. Flujo de Datos

  • Los datos son registrados en AWS Lake Formation.
  • AWS Glue Data Catalog almacena los metadatos de bases de datos y tablas.
  • Se asignan LF-Tags a bases de datos y tablas.
  • IAM Roles + LF-Tags controlan el acceso para usuarios, servicios o grupos.
  • Athena, QuickSight y SageMaker acceden de forma segura respetando las restricciones de LF-Tags.

4. Beneficios Claves

✅ Seguridad de Datos con LF-Tags → Garantiza que solo usuarios autorizados accedan a conjuntos de datos específicos.
✅ Segmentación por Unidad de Negocio → Se separan los datos de Ventas, Marketing y Privados mediante control basado en etiquetas.
✅ Integración con Servicios de Análisis AWS → Athena, QuickSight y SageMaker acceden a los datos de manera controlada.
✅ Uso de un Rol IAM Centralizado → Facilita la gestión de permisos a nivel de servicio.

Heroku

This site is built on Heroku

Join the ranks of developers at Salesforce, Airbase, DEV, and more who deploy their mission critical applications on Heroku. Sign up today and launch your first app!

Get Started

Top comments (0)

Best Practices for Running  Container WordPress on AWS (ECS, EFS, RDS, ELB) using CDK cover image

Best Practices for Running Container WordPress on AWS (ECS, EFS, RDS, ELB) using CDK

This post discusses the process of migrating a growing WordPress eShop business to AWS using AWS CDK for an easily scalable, high availability architecture. The detailed structure encompasses several pillars: Compute, Storage, Database, Cache, CDN, DNS, Security, and Backup.

Read full post