Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

DataWatch

Technology News

Activity Overview

Episode publication activity over the past year

Episodes

Décathlon déploie Polars en prod !

23 Dec 2025

Contributed by Lukas

☝️ Dans cet épisode, Bertrand et Axel discutent de l'utilisation de Polars chez Decathlon, de la comparaison entre Polars et Spark, de Lance...

Python 3.14, vraiment mieux ?

18 Nov 2025

Contributed by Lukas

☝️ Dans cet épisode, Bertrand et Axel explorent les nouveautés de Python 3.14, notamment le T-String, les améliorations de débogage, et les im...

MCP, une sécurité en danger ?

04 Nov 2025

Contributed by Lukas

☝️ Dans cet épisode, Bertrand Fabre, Axel Mauroy et leur invité Baptiste Vlodarczyk (AI Engineer chez SFEIR, en mission chez L’Oréal) discut...

Les différences entre SQLMesh et dbt 💪

23 Sep 2025

Contributed by Lukas

Dans cet épisode, Bertrand Fabre explore les différences entre SQLMesh et dbt, deux outils de transformation de données. Il met en avant les foncti...

L’architecture médaillon du marketing ?!

16 Sep 2025

Contributed by Lukas

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent les nuances de l'architecture médaillon, un concept popularisé par Databricks...

Data Virtualisation : plus besoin de Data Warehouse ?

02 Sep 2025

Contributed by Lukas

Dans cet épisode, Bertrand Fabre explore le concept de data virtualisation, un mécanisme qui permet aux organisations de partager et d'exploiter...

Snowflake MCP : la fin des Data Engineers SQL ?!

26 Aug 2025

Contributed by Lukas

Dans cet épisode, Bertrand Fabre explore un article sur le protocole MCP de Snowflake, qui permet d'exécuter des requêtes SQL en langage nature...

Disponibilité des CTEs Récursives dans Databricks !

19 Aug 2025

Contributed by Lukas

Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore les nouveautés des CTEs récursives sur Databricks, en les comparant avec d...

Modélisation avancée DBT : optimisez votre pipeline analytique

12 Aug 2025

Contributed by Lukas

Dans cet épisode de "Lecture à chaud", Bertrand Fabre explore un article de Clarisse Véron sur la modélisation avancée avec dbt, un out...

Identification des causes racines en Data Engineering

05 Aug 2025

Contributed by Lukas

Dans cet épisode de DataWatch, Bertrand Fabre explore un article sur Monte Carlo, un outil de data quality et d'observabilité. Il partage ses ré...

Des bases de données fiables pour les banques françaises

28 Jul 2025

Contributed by Lukas

Dans cet épisode de DataWatch, Bertrand Fabre inaugure un nouveau format plus spontané et interactif. Il explore un article récent de Decideo sur l...

Airbyte et son MCP dans Cursor !

22 Jul 2025

Contributed by Lukas

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent divers sujets liés au Data Engineering, notamment les nouvelles fonctionnalités d...

OVH sort sa Data Platform !

08 Jul 2025

Contributed by Lukas

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre explorent les dernières tendances en Data Engineering et en intelligence artificielle, en met...

70% de coûts en moins en utilisant Rust ?!

24 Jun 2025

Contributed by Lukas

☝️ Dans cet épisode, Axel Mauroy et Bertrand Fabre abordent des sujets clés de la Data Engineering, notamment Cloud Run, l'essor de Rust dan...

dbt fait sa Fusion !

10 Jun 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons du rachat de la société Informatica par Salesforce, de Google Cloud’s s'ouvrant au Lakehouse, des nouve...

Airflow 3.0 !

07 May 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la présentation du serveur MCP pour DBT, de la version 3 d'Apache Airflow, des pistes pour devenir un «...

Shift Left, la data change de responsable !

01 Apr 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l'annonce de la prise en charge de Git dans BigQuery, du lancement de dbt copilot pour améliorer l’ef...

Data Engineer, ça craint ou pas ?

24 Mar 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des nouveautés de Databricks SQL de février 2025, du rachat de DataStax par IBM pour renforcer watsonx et l&#...

La disparition des Data Engineers !

01 Mar 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l'acquisition de Voyage AI par MongoDB, de l'exécution des LLM open-source sur BigQuery ML, de l&#3...

Les outils essentiels du Data Engineer ! 500Mds$ dans la data 💰

04 Feb 2025

Contributed by Lukas

☝️ Dans cet épisode, nous parlons du rachat de SDF par dbt, du plan de Donald Trump de 500 milliards de $ pour l'IA, des outils essentiels en...

575K$ comme Staff Data Enginneer chez Airbnb ! Ses conseils pour décrocher ce poste

06 Dec 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de Microsoft Drasi, de la bascule de l’ELT vers l’esprit Graphe, de la tendance à utiliser les outils Apac...

De l’incrémental au Data Product en passant par l'IA : ce qui redéfinit le Data Engineering

29 Nov 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la montée des traitements incrémentaux et l’impact sur la Data Quality, des Data Products pour améliore...

Les stratégies data de Netflix, Meta, Spotify, Airbnb et Uber révélées !

22 Nov 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des données synthétiques pour des données sécurisées avec l’IA, des règles de base et des règles méti...

Data Engineer 2.0 : clustering, IA, et plan pour 2025

15 Nov 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des clés de clustering sur Snowflake, du rôle de l’AI Data Engineer, de la disponibilité des vues matéria...

Le premier Data Engineer IA et la surveillance des pipelines : décryptage

08 Nov 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l’organisation des équipes logiciel et data, des trois composants d’une stack de données non structuré...

Data Mesh, Data Owner et la fin des clés primaires : ce que vous devez savoir

01 Nov 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la mort des clés primaires et étrangères, de l’implémentation du Data Mesh chez Roche, du Github Actio...

BigQuery, dbt v1.9 et Data Quality : les stratégies qui transforment la donnée

25 Oct 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des stratégies innovantes en Data Engineering, de la preview des datasets externes entre BigQuery et Spanner, ...

MongoDB 8.0, Python 3.13 et Lakehouse : les annonces phares du moment

18 Oct 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la sortie de la version 3.13.0 de Python, de la mort du Data Warehouse au profit du Data Lake House, de la P...

Presto, Rust et Data Lineage : les tendances qui transforment la Data Engineering

11 Oct 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l’importance de Presto et de son framework d’optimisation basé sur l’historique, de l’utilisation d...

SQL automatisé, BigQuery Jobs Explorer et PostgreSQL 17 : les nouveautés à connaître

05 Oct 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la génération automatisée de requêtes SQL, de la présentation de BigQuery jobs explorer, de l’intégr...

Pipe Syntax en SQL, Apache Iceberg et IA générative : vers une Data Engineering plus simple ?

27 Sep 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l’importance de la Data Engineering dans l’IA générative, de la Pipe Syntax en SQL, de Data Observabil...

Uber dans le cloud, DuckDB 1.1.0 et Pandas sur Snowflake : les annonces marquantes

21 Sep 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la migration de Uber vers le cloud, de la sortie de DuckDB 1.1.0, de la sortie de Airbyte 1.0, de la classif...

Uber, IA et Data Governance : les enjeux critiques de la data d'aujourd’hui

15 Sep 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons du retour d'Elasticsearch en Open Source, des risques des décisions basées uniquement sur la Data, de l'utili...

BigQuery Vector Search et Ray chez Amazon : les clés du changement ?

09 Sep 2024

Contributed by Lukas

☝️ Dans cet épisode, je parle de ScaNN sur BigQuery Vector Search, des nouveautés de Databricks Workflows, de InstantDB, de tables de faits et d...

SQL avec Python, Airflow 2.10.0 et Vector Search : les tendances data du moment

01 Sep 2024

Contributed by Lukas

☝️ Dans cet épisode, je parle de l’utilisation de SQL avec python, de Apache Iceberg vs Apache Hudi, la preview du Vector Search sur MariaDB, l...

BigQuery Continuous Queries et Cloud SQL Studio : toujours plus de nouveautés !

19 Aug 2024

Contributed by Lukas

☝️ Dans cet épisode, je parle de Data Engineering vs Software Engineering, de Cloud SQL Studio, des fonctions d’agrégat personnaliées en pyth...

Kafka 3.8 et Data Lake CDC : ce que les Data Engineers doivent savoir

11 Aug 2024

Contributed by Lukas

☝️ Dans cet épisode, je parle de la sortie d’Apache Kafka 3.8.0, de menaces cachées dans un Data Warehouse, de l’avenir des hyperscalers et ...

Cycle de vie du stockage : pourquoi cela peut transformer vos coûts data ?

04 Aug 2024

Contributed by Lukas

☝️ Dans cet épisode, je parle de 5 erreurs en Data Engineering, des bénéfices économiques dans la mise en place d’une politique de cycle de ...

Data Centers, souveraineté et qualité : les défis de la gestion des données

27 Jul 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de souveraineté des données, de Exadata Exascale de Oracle, de Data Timeliness, de 3 étapes pour la mise en ...

Polars vs PySpark et quand l'OLTP et l'OLAP convergent enfin avec Snowflake !

20 Jul 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de Polars vs PySpark, de la création d’une couche sémantique des données, de conseils pour leader une équ...

Julien Hurault sur les Slowly Changing Dimensions et les Snowflake Native Apps

13 Jul 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des Slowly Changing Dimensions en compagnie de Julien Hurault, de Data Validation, du script bq2dbt, de BigQuer...

Polars 1.0 et Data Vaults sur Snowflake : vers une gestion optimale des données

07 Jul 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la sortie de la version 1.0 de Polars, de Smart Data, de la gestion du cycle de vie des données avec les Da...

Data Reliability et BigQuery Datasream : les clés pour vos données !

29 Jun 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de Data Reliability, de CI/CD pour les Data Engineers, de l'utilisation du mode "append-only" de Datasream sur ...

LakeFlow et Unity Catalog Open Source : les nouveautés de Databricks

23 Jun 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de la disponibilité de LakeFlow sur Databricks, du package python Daft, de la mise en Open Source de Unity Cat...

Gaël Lemaux sur les Snowflake Dynamic Tables et DuckDB 1.0 : la Data Engineering continue d'évoluer

16 Jun 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de Dynamics Tables sur Snowflake vs ETL/ELT, la sortie de la version 1.0.0 de DuckDB, l'intégration d’Amazon...

Florent Jakubowski sur ETL vs ELT et l’évolution des rôles en Data Engineering

07 Jun 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons de l'ETL vs ELT, du rôle d'Analytics Engineer, de l'interpréteur RustPython, du package python SQLFrame et de...

50 ans de SQL et Liquid Clustering : les nouveautés et réflexions en Data Engineering

31 May 2024

Contributed by Lukas

☝️ Dans cet épisode, nous parlons des différents types de stockage, de Data Quality Management, de la disponibilité générale du Liquid Cluste...

dbt 1.8, Pandas vs Polars et réduction des coûts sur Snowflake : décryptage

31 May 2024

Contributed by Lukas

☝️ Pour ce premier épisode, nous parlons de la version 1.8 de dbt, de réduction des coûts sur Snowflake, de Pandas vs Polars et de Python sur S...