Confluent Kafka dataproductplatform
Een grote Britse telecomoperator. Klant geabstraheerd voor vertrouwelijkheid; technische scope zoals geleverd.
Context
De organisatie moest streamingdata over 30+ bronsystemen omzetten in betrouwbare, herbruikbare dataproducten waarop analytics-teams konden vertrouwen — met duidelijk eigenaarschap en schema-evolutie die consumers downstream niet zou breken.
Wat ik bouwde
Een Confluent Kafka dataproductplatform:
- 20+ geproductiseerde datastreams, elk domeineigendom in plaats van centraal opgestopt.
- Schema-governance via Schema Registry, zodat producers en consumers onafhankelijk evolueren.
- Hive LLAP en Spark 3 voor query-acceleratie over de gestreamde data.
- Een cross-team-eigenaarschapsmodel zodat domeinen, en niet een centrale queue, hun producten bezaten.
Impact
- 20+ dataproducten operationeel door de hele business heen.
- 30+ bronsystemen geïntegreerd onder één gegoverneerd model.
- Domeingeoriënteerd eigenaarschap dat opschaalde zonder centrale poortwachter.
Rol & stack
Data engineer en technology architect (Accenture CTA-groep) — ontwierp het platform en begeleidde grensoverschrijdende deliveryteams.
Stack: Apache Kafka (Confluent Cloud), Schema Registry, Hive LLAP, Spark 3, NiFi, Hadoop, Elastic Stack.
→ Zie ook Event-driven & streaming en Data & lakehouse.