Repositorio con el contenido del taller "Construyendo pipelines de datos a escala" impartido en la conferencia Pulpocon 2022.
doc
: contenidos teóricos y prácticos que iremos discutiendo a lo largo del taller.dbt
: proyecto dbt que nos servirá como ejemplo práctico de todo lo discutido. No se requiere tener instalado el cliente dbt en el equipo.config
: configuración de credenciales necesaria para la ejecución de los casos prácticos a lo largo del taller.docker
: definición de contenedores auxiliares sobre los que desarrollaremos.Makefile
: ditintas tareas para simplificar el uso del repositorio.
Taller meramente práctico, trabajaremos sobre un caso de uso real (aunque simplificado) construyendo modelos de datos que ejecutaremos contra Snowflake.
Lo único necesario será un PC con docker y un cliente de git instalado, además del editor de texto que prefieras.
La sección principal de la documentación te servirá de introducción al taller y te irá llevando por las distintas secciones, tanto teóricas como prácticas.
Pulpocon · 2022
Construyendo pipelines de datos a escala