Monitorización de la disponibilidad de la información y control de almacenamiento en Google Cloud Storage.
Orquestación de pipelines de ingesta y transformación de datos sobre Google Composer. Supervisión de la ejecución de las cargas diarias y control de la ingesta.
Gestión de repositorios Git asociados a Google Composer, Google Dataproc y Google Dataform
Supervisión de ramas Git para el registro de cambios y administración de las versiones de los archivos de código de Composer, Dataproc y Dataform para los proyectos de DATA con diferentes equipos.
Gestión de archivos en Storage e implementación de reglas de calidad técnica con Google Dataproc.
Mantener y supervisar buenas prácticas de desarrollo y despliegue de los distintos proyectos de DATA en el Lakehouse de Google BigQuery
Mantenimiento y control de la plataforma de DATA en Google, uso de recursos y control de consumos.Grado universitario en Informática, Matemáticas, Estadística o Ingeniería Superior.
Experiencia previa de al menos 5 años desarrollando proyectos de DATA.
Conocimientos específicos en herramientas GCP o análogas ( BigQuery, Composer/Apache Airflow, Dataproc/Databricks, Dataform/DBT). Valorable certificación en GCP
Experiencia en programación Python y manejo de grandes volúmenes de datos con librerías Pandas y Pyspark. Valorable experiencia como DEVOps (este punto es secundario, pero a valorar)
El stack tecnológico se puede ver ampliado aquí en el apartado de productos (en la barra de arriba).
Nunca envíes tu información personal (DNI, foto,...), datos bancarios ni realices ningún pago para solicitar un empleo