dbt Labs lance dbt Fusion : Un virage majeur pour la communauté data ?

Les annonces de dbt Labs

Les annonces de dbt Labs

dbt Labs vient d'annoncer plusieurs nouveautés majeures :

  • dbt Fusion : Un nouveau moteur dbt associé à une extension VS Code
  • De nouvelles fonctionnalités dans dbt Cloud Entreprise dont les outils :
    • dbt Canvas : Développement graphique avec assistant Copilot
    • dbt Insights : Exploration des données et requêtage assisté
    • dbt Catalog : Catalogue de données amélioré
    • Cost Management : Suivi des coûts de plateforme data
  • dbt MCP server : Exposition de la couche sémantique et des modèles aux LLMs et agents IA

Le changement le plus significatif de mon point de vue est l'annonce de dbt Fusion.

Le logiciel a été développé initialement par SDF Labs, société rachetée par dbt Labs en début d'année.

Les nouveautés de dbt Fusion

dbt Fusion introduit plusieurs changement de paradigmes :

La licence accorde le droit gratuit d'utiliser, de modifier, de créer des œuvres dérivées et de redistribuer, sous réserve de trois simples limitations :

  • Vous ne pouvez pas fournir les produits à d'autres en tant que service infogéré (managed service)
  • Vous ne pouvez pas contourner la fonctionnalité de la clé de licence ou supprimer/masquer les fonctionnalités protégées par des clés de licence
  • Vous ne pouvez pas supprimer ou masquer toute mention de licence, de droits d'auteur ou d'autres mentions
  • Une extension VS Code pour fournir un environnement de développement en dehors de dbt Cloud
  • Des connecteurs arrow basés sur Apache 2 Arrow Database Connector (ADBC)
  • Une amélioration du temps de parsing et de compilation des modèles
  • L'intégration native du data linéage au niveau colonne
  • Un compilateur SQL qui prend en compte le typage des colonnes
  • Pour dbt CLoud, la gestion de l'état des modèles et des données pour l'orchestration des modèles (state aware orchestration)
  • La possibilité d'exécuter localement les modèles sur des échantillons de données serait également en cours de développement
  • Une aide à la gestion des PII (Personnaly Identifiable Information) qui est en cours de développement également

Pour le moment dbt Fusion n'est disponible que pour Snowflake en beta avec des limitations mais les autres plateformes seront progressivement intégrées.

L'objectif annoncé est celui de protéger dbt Labs de la concurrence, de garantir la pérennité de son business model avec dbt Cloud et de faire évoluer l'outil pour prendre en compte les besoins qui n'existaient pas il y a 10 ans.

Ce qui ne change pas en revanche pour dbt Core :

  • dbt Core reste en license Apache 2.0
  • Le code des 2 outils est complètement séparé
  • dbt Labs continue de développer et supporter dbt Core

Conclusion

dbt Labs a toujours été très transparent sur son business model, très respectueux de la communauté open source et les annonces faites au dbt Launch Showcase 2025 ne dérogent pas à ces règles.

Les évolutions annoncées sont intéressantes et vont dans le sens de l'évolution de la plateforme data.

La fourniture de services et fonctionnalités propriétaires en plus de dbt Core dans dbt Cloud est une pratique courante dans le monde open source et dbt Labs n'est pas la première à le faire.

En revanche, dbt Fusion est un virage majeur pour la communauté dbt qui va devoir choisir si le passage d'un outil totalement open source à un outil dont le noyau a un code propriétaire est acceptable pour elle.

C'est un sujet majeur qui va être discuté dans les prochains jours et semaines et que je suivrais avec attention.

Sur le même sujet

dbtopen source

retourner aux articles