Saltar a contenido

Arquitectura Medallion

La arquitectura medallion es un patrón popularizado por Databricks para organizar datos en un lakehouse. Define tres capas progresivas de refinamiento:

Bronze (raw)

  • Datos en su forma original, append-only.
  • Schema-on-read.
  • Columnas de auditoría (_ingested_at, _source_file).
  • Retention típica: 30-90 días.
  • Owner: data platform team.

Silver (cleaned)

  • Datos deduplicados, validados y conformados.
  • Tipos correctos, PII redactada.
  • Tests dbt + Great Expectations.
  • Slowly Changing Dimensions tracking.
  • Owner: domain team.

Gold (business-ready)

  • Modelado dimensional (star/snowflake).
  • Métricas agregadas y KPIs.
  • Contratos de datos versionados con SLAs.
  • Consumido por BI, ML y APIs.
  • Owner: domain team.

El paso entre capas se realiza típicamente con dbt en SQL declarativo, ejecutándose sobre motores como Spark, Trino, Snowflake o Databricks SQL.