Data & lakehouse — Farid Gurbanov

Analytics en AI zijn alleen zo goed als het platform dat ze voedt. Ik bouw de cloud-native data-ruggengraat — raw naar bronze naar silver naar gold — met de contracten en kwaliteitscontroles die het betrouwbaar houden naarmate het groeit.

Wat ik doe

Medallion-lakehouses. Raw → bronze → silver → gold op Snowflake, Databricks/Delta en AWS (EMR, Glue, S3), met de modellering die elke laag zijn plaats laat verdienen.
Contracten op de bronnaad. Datacontracten daar waar operationele systemen het lakehouse ontmoeten — bijvoorbeeld SAP Finance-grootboeken die in Snowflake landen — zodat wijzigingen bovenstrooms worden opgevangen en niet stilletjes worden geabsorbeerd.
Betrouwbare ingestie. Change-data-capture en delta-pipelines afgestemd op bijna-realtime synchronisatie, met lineage en kwaliteitsmonitoring in plaats van hoop.

Aangetoond door

SAP S/4HANA Finance → Snowflake — GL/AR/AP/CO/AA over ~30+ bedrijfscodes, een multi-terabyte backfill plus 10–30 GB dagelijkse delta, met contracten op de SAP↔lakehouse-naad.
Kafka-dataproductplatform op Cloudera — geproductiseerde streams met Hive LLAP en Spark 3 query-acceleratie.
Contrail-avoidance — een Polars/Pandas + Databricks-achtige pipeline over een Parquet/Delta-lakehouse, die bepaalt welke vluchten worden omgeleid op een afweging van klimaat versus brandstof.

Achtergrond: Databricks Certified Data Engineer Professional; Snowflake Core; Spark/PySpark, Delta Lake, PostgreSQL, Oracle.