DEV Community

Cover image for Los datos se cocinan entre muchas manos: descubre cuál es la tuya
Mirina-Gonzales
Mirina-Gonzales

Posted on

Los datos se cocinan entre muchas manos: descubre cuál es la tuya

Introducción

El objetivo de este blog es compartir los diferentes roles que existen en el mundo de los datos. Si eres nueva en este mundo puede ser complicado entender cómo se relacionan entre ellos y sobre todo cómo se diferencian, es por eso que elegí la metáfora de la cocina, donde podemos identificar las diferencias de una forma más cercana y fácil de entender.

¿Por qué existen tantos roles en datos?

Cuando una empresa es pequeña y está incursionando en el mundo de los datos, puede que una sola persona asuma diferentes roles. Pero mientras la empresa va creciendo, las necesidades se vuelven más específicas y es ahí donde se necesitan manos más especializadas. Es diferente tener 4 requerimientos a tener 30 requerimientos que son necesarios para la operatividad del negocio.

Antes de elegir un rol - Como viajan los datos

Para entender los roles es útil entender primero cómo viajan los datos dentro de una empresa, igual que en una cocina donde cada persona tiene una función en el proceso:

  • Los ingredientes llegan → ingesta de datos
  • Se limpian y organizan → transformación y limpieza
  • Se guardan en su lugar → almacenamiento en bases de datos o data warehouses
  • Se cocinan → procesamiento y análisis
  • Se sirven → visualización y reportes
  • Se crean nuevas recetas → modelos de ML y ciencia de datos

Cada rol vive en una parte distinta de este recorrido. Ninguno es más importante que otro: si falla uno, el proceso completo se ve afectado. Como en una cocina, de que serviría tener el mejor chef si no se tiene un buen almacenamiento de alimentos.

Los roles

A continuación, presentamos los roles más comunes en un equipo de datos. Ten en cuenta que, a medida que el equipo crece, las funciones tienden a especializarse cada vez más y nuevo roles aparecen.

Flujo de roles de datos

- Analista de datos
Explora los datos disponibles para responder preguntas de negocio. Tiene la capacidad de traducir los datos en información que otros equipos pueden entender y usar para decidir. Algunas de sus actividades son: identificar patrones y tendencias en los datos, construir reportes y visualizaciones, y consultar bases de datos para responder preguntas concretas.
- Ingeniera de datos
Construye y mantiene los flujos de datos desde un origen hacia un destino. Sin ella, los datos no llegan a tiempo ni en buen estado a quienes los necesitan. Algunas de sus actividades son: conectar diferentes fuentes de datos, limpiar y estandarizar la información, y garantizar que los pipelines funcionen correctamente.
- Científica de datos
Usa estadística y algoritmos para encontrar patrones ocultos y predecir comportamientos futuros. Algunas de sus actividades son: construir modelos predictivos, aplicar estadística para validar hipótesis, y extraer insights donde el análisis tradicional no logra llegar.
- Ingeniería de ML
Toma los modelos creados por la científica de datos y los hace funcionar dentro de un sistema real, de forma estable y a escala. No inventa el algoritmo, lo convierte en algo que puede correr en producción todos los días sin fallar.

Ojito: Los roles de científica de datos e ingeniera de Machine Learning pueden ser confusos porque dependiendo de la empresa las actividades varían o se solapan. En empresas pequeñas una sola persona puede asumir los dos roles. La separación aparece cuando el volumen de trabajo lo justifica.

Siempre lee la descripción:

Recomiendo revisar los requisitos de cada oferta laboral, si bien buscamos identificar las diferencia algunas empresas pueden poner el nombre de un rol y buscar habilidades de otros o herramientas qiue no concoes, entonces es bueno asegurarse, los titulos aveces dicen la verdad a medias.
Una oferta que dice "Data Scientist" en una empresa puede ser trabajo de análisis puro con SQL y Excel, sin ningún modelo de Machine Learning. En otra empresa ese mismo título puede requerir conocimientos profundos de estadística, Python y redes neuronales. El título es el mismo, el trabajo es completamente distinto.

Que herramientas necesitas

Python:
https://www.w3schools.com/python/default.asp
https://www.kaggle.com/learn/python

Pandas:
https://www.w3schools.com/python/pandas/default.asp
https://www.kaggle.com/learn/pandas

SQL:
https://sqlbolt.com/
https://www.kaggle.com/learn/intro-to-sql
https://www.w3schools.com/sql/default.asp

Conclusión

El mundo de los datos puede parecer infinito cuando lo ves desde afuera, pero una vez que entiendes cómo se divide el trabajo todo empieza a tener sentido. Como en cualquier cocina, no necesitas saber hacer todo: necesitas encontrar el rol donde tus habilidades y tu curiosidad se encuentran.

La buena noticia es que todos los caminos comparten un punto de partida: SQL es la herramienta que atraviesa todos los roles, y Python te abre las puertas de casi cualquier rol que tú elijas. Y recuerda, siempre se puede cambiar.

Top comments (0)