Guía 01 — Stack Tecnológico 2026¶

Selección por capa¶

Object storage: S3 (AWS), GCS (GCP), ADLS Gen2 (Azure), MinIO (local/on-prem). Cloudflare R2 si egress cero es prioridad.
Formato archivo: Parquet con compresión Zstd (balance óptimo) o Snappy (CPU mínimo).
Formato tabla: Apache Iceberg v3. Delta solo si Databricks lo requiere (con UniForm). Hudi si CDC streaming masivo con upserts continuos.

Técnico (Iceberg REST): Polaris (Snowflake/ASF), Unity Catalog (Databricks), Nessie (Dremio), Glue, Hive Metastore (legacy).
Activo: Atlan, Collibra, Alation, Informatica EDC (enterprise); DataHub, OpenMetadata, Amundsen (OSS).
Calidad: Great Expectations, Soda, dbt tests, Elementary, Deequ.
Observabilidad: Monte Carlo, Acceldata, Bigeye, Sifflet, Anomalo, Soda Cloud.
Contratos: Data Contract CLI, OpenMetadata DataContract spec, PayPal template.

Lifecycle: MLflow (Tracking, Registry, Serving).
Serving: BentoML, NVIDIA Triton, TensorFlow Serving.
Feature store: Feast (OSS), Tecton, Hopsworks, Databricks Feature Store.
Vector DB: pgvector + pgvectorscale (Postgres), Qdrant, Weaviate, Milvus/Zilliz, Pinecone, Chroma.
LLM frameworks: LangChain, LlamaIndex, Haystack, DSPy, semantic-kernel.
Evaluación RAG: RAGAS, MLflow Evaluation, Snorkel, Promptfoo, DeepEval.
Agentes: MCP (Model Context Protocol), Llama Stack, Agent2Agent.

Hightouch, Census, Polytomic.
CDPs: Salesforce Data Cloud, Adobe RT-CDP, Segment, mParticle, Treasure Data.

IaC: Terraform, Pulumi.
K8s: EKS, GKE, AKS; ArgoCD para GitOps; Helm.
CI/CD: GitHub Actions, GitLab CI, CircleCI, Buildkite.
Secret management: AWS Secrets Manager, GCP Secret Manager, HashiCorp Vault.

Necesidad	Recomendación 2026
Lakehouse abierto multi-engine	Iceberg + Polaris/Unity
OLAP <100GB, costo bajo	DuckDB / MotherDuck
OLAP TB-scale, multi-tenant	ClickHouse Cloud o Snowflake
ML/AI heavy workload	Databricks
100% GCP, cost-conscious	BigQuery + BigLake/Iceberg
Streaming <30s SLA	Kafka + Flink + Iceberg
RAG enterprise con citas	LangChain/DSPy + Qdrant + RAGAS
Catálogo OSS	DataHub
Catálogo enterprise managed	Atlan
Calidad OSS suficiente	Soda + Elementary
Calidad enterprise SLA	Monte Carlo