Senior Databricks Data Engineer
Greenminds
- Warszawa, mazowieckie
- Stała
- Pełny etat
- Unity Catalog - zarządzanie dostępem, konfiguracja, lineage tracking).
- projektowanie i optymalizacja pipeline’ów w PySpark i Delta Lake.
- wdrażanie Spark tuning (AQE, broadcast joins, partition pruning).
- integracja z narzędziami CI/CD (np. Azure DevOps).
- projektowanie i wdrażanie skalowalnej architektury danych typu lakehouse, z naciskiem na: przetwarzanie danych w czasie rzeczywistym i wsadowym & automatyzacja i standaryzacja procesów ETL/ELT.
- współpraca z zespołami biznesowymi i technicznymi, przekładanie wymagania na rozwiązania techniczne.
- prowadzenie dokumentacji technicznej i architektonicznej.
- wsparcie zespołów w analizie danych i optymalizacji procesów.
- minimum 8 lat doświadczenia w pracy z danymi.
- bardzo dobra znajomość Azure Databricks.
- praktyczna znajomość PySpark, Delta Lake i architektury Lakehouse.
- doświadczenie z konfiguracją i zarządzaniem Unity Catalog.
- znajomość zagadnień optymalizacji Spark.
- doświadczenie z procesami ETL / ELT.
- doświadczenie w pracy z narzędziami CI/CD (Azure DevOps, Git).
- Microsoft Certified: Azure Data Engineer Associate.
- Databricks Certified (np. Data Engineer, ML Professional).
- Znajomość Microsoft Fabric.
- doświadczenie z GCP lub innymi chmurami.
- znajomość Microsoft Fabric.
- doświadczenie w projektach międzynarodowych (np. USA).
- umiejętność prowadzenia rozmów technicznych z klientem.