<aside> ✅ Resumen una Data Engineer se encarga de saber dónde está la información valiosa para el negocio, entender las herramientas con las cuales se debe hacer el transporte de los datos y hacer las conexiones para abastecer de información al resto del equipo de Data.

</aside>

👨🏻‍💻Que hace un Data Engineer?

<aside> ✅ Datos Crudos → Data Engineer → Datos limpios para el análisis

</aside>

Es el encargado de tomar los datos crudos, pero de valor, para transformarlos, organizarlos y almacenarlos en las bases de datos, por medio de la producción de  pipelines ETL, que tienen como objetivo abastecer de materia prima o datos a los demás roles, para que ejecuten su trabajo.

🚶🏻‍♂️¿Cómo empezar el camino de un Data Engineer?

Si quieres empezar con pie derecho tu camino hacia Data Engineer, no dudes en seguir los siguientes pasos:

  1. Aprender a programar en Python y bases sólidas de ingeniería de software
  2. Saber cómo automatizar procesos
  3. Entender y aplicar librerías como: Pandas y Apache Spark
  4. Conocer bases de datos  SQL y NoSQL

🗓️ El día a día de un Data Engineer

🧰 Herramientas y tecnologías


Untitled

Proceso ETL

Extract, Transorm and Load o Extraer, Transformar y Cargar, es uno de los procesos más utilizados para la transformación de los datos, es como el proceso de tomar un diamante en bruto y convertirlo en uno procesado y listo para vender.

Extract o extracción

Importar datos de diversas fuentes, ya sea internas como externas, mientras sean de valor para la organización. Estos puede venir con distintas estructuras y formatos.

Transform o transformación

Todos los datos ya recopilados deben de situarse en una estructura común y limpia que facilite su análisis.

Load o carga

Luego de que los datos se encuentren limpios, estos deben almacenarse en bases de datos OLAP que faciliten la consulta y análisis de los mismos.


Roles relacionados

Dentro del mundo de la Data hay ciertas variaciones en el rol de Data Engineer, que se enfocan o especializan en ciertas actividades clave para el flujo de datos, como por ejemplo:

Data Architect

Se encarga de plantear estrategias de datos dentro de la organización, mediante la revisión de estándares de calidad, tratamiento de flujo de los datos y seguridad de estos.

Big Data Architect

Trabaja con Big Data, las 5V’s de los datos.


🌱 Otros Aportes Platzi

Mis aportes a la comunidad de Platzi

Glosario de Data Science (2)

Roles en Data Science (2)

Data Engineer

Data Scientist

Machine Learning Engineer

Roles de Data Science

Base de datos sin título

About:

Santiago Ismael Flores

Santiago Ismael Flores

@ismaSantiagoFL


Hola, Soy Santiago Ismael, actualmente estoy aprendiendo Data Science. Me gustaría invitarte a hacer networking conmigo, puedes escribirme por Telegram o en mis demas redes sociales buscandome como @ismaSantiagoFL

Puedes leer mas sobre mi en este enlace.