In der Welt der Daten sind Geschwindigkeit und Vertrauen entscheidend. Unternehmen können es sich nicht leisten, Stunden oder Tage zu warten, bis ihre Daten nutzbar sind. Sie benötigen Transformationspipelines, die mit dem Geschäftsbetrieb Schritt halten, konsistente Ergebnisse liefern und gleichzeitig Transparenz gewährleisten. Seit Jahren unterstützt dbt (Data Build Tool) Teams dabei, Struktur, Tests und Klarheit in SQL-basierte Transformationen zu bringen. Doch selbst mit dbt basiert der Transformationsprozess oft auf einer einschränkenden Annahme: dass Ihre Daten bereits ordentlich in einem Data Warehouse gespeichert sind. In der Realität ist dies fast nie der Fall.
In den meisten Unternehmen sind Daten über Cloud-Plattformen, Legacy-Systeme, relationale Datenbanken und Anwendungen verteilt, die nicht in Echtzeit synchronisiert werden können oder wollen. Um dbt in diesen Umgebungen nutzen zu können, mussten Teams bisher auf traditionelle ETL-Pipelines zurückgreifen, um alles zusammenzuführen. Dies führt zu höherer Komplexität, langsameren Iterationen und einer zunehmenden Trennung zwischen Quellsystemen und den darauf basierenden Modellen.
Dieses Problem soll durch die Integration von Avrio und dbt gelöst werden.
Avrio bietet eine leistungsstarke Alternative zum „Extrahieren-Transformieren-Laden“-Modell. Anstatt Ihre Daten an einen zentralen Ort zu verschieben, ermöglicht Avrio die virtuelle Abfrage von Daten systemübergreifend und ohne Replikation . Das bedeutet, dass die Daten dort bleiben, wo sie bereits vorhanden sind – ob in Snowflake, PostgreSQL oder SQL Server – und dennoch in Echtzeit modelliert, untersucht und analysiert werden können. Weitere Informationen zu verschiedenen Datenverarbeitungsansätzen für die Integration und Synchronisierung moderner Datenprodukte finden Sie in unserem Blog.
Mit der dbt-Integration wird dieses Konzept nun auch auf Transformationen ausgeweitet. Anstatt nur die Daten Ihres Data Warehouses zu transformieren, können Sie dbt-Modelle nun direkt über die Avrio-Plattform auf Ihren Quelldatenbanken ausführen. Diese Modelle erstellen nicht nur schreibgeschützte Ansichten oder Abstraktionen, sondern führen auch DML-Operationen (INSERT, UPDATE, DELETE) auf den zugrunde liegenden Daten aus. Dies ermöglicht die Erstellung wiederverwendbarer, testbarer Transformationslogik, die direkt an der Quelle arbeitet – ohne Duplizierung, Verzögerungen oder Umwege.
Sehen wir uns die allgemeinen Herausforderungen an, mit denen Datenteams konfrontiert werden, wenn sie versuchen, ihre Datentransformationsbemühungen zu skalieren.
Zunächst einmal gibt es das Problem des Pipeline-Overheads . Teams verbringen oft mehr Zeit mit dem Erstellen und Warten von ETL-Jobs als mit der eigentlichen Datenanalyse. Wenn Daten aus fünf Quellen mit dbt transformiert werden müssen, müssen sie zunächst in ein zentrales Warehouse kopiert werden – was Verzögerungen, Risiken und Betriebskosten mit sich bringt.
Zweitens besteht auch nach der Zentralisierung der Daten immer noch eine Lücke in der Transparenz . Wie lässt sich nachvollziehen, woher eine Kennzahl stammt? Woher weiß man, welche Transformation eine Inkonsistenz verursacht hat? Die meisten Teams verlassen sich entweder auf undokumentiertes Wissen oder pflegen eine umständliche Dokumentation außerhalb ihrer Tools.
Hier zeigt sich die wahre Stärke der Avrio-dbt-Integration. Da Sie Daten nun direkt transformieren können, sind Sie nicht mehr von kostspieligen und anfälligen ETL-Prozessen abhängig. Da Avrio die Metadaten jeder Transformation automatisch erfasst , sind diese Änderungen in der Lineage-Funktion von Avrio vollständig sichtbar und bieten eine prüfbare Echtzeitansicht jedes Schritts Ihres Datenflusses.
Einer der leistungsstärksten Aspekte dieser Integration ist die Zusammenführung von Transformationslogik und Governance an einem Ort. Jedes Mal, wenn ein dbt-Modell auf Avrio ausgeführt wird, sei es bei der Aktualisierung einer Produktionstabelle oder der Anreicherung einer Ansicht für die Analyse, erfasst Avrio den vollständigen Kontext dieser Operation.
Hierzu gehören Angaben wie:
Diese Informationen werden anschließend in der interaktiven Lineage-Oberfläche von Avrio visualisiert. Dies vermittelt allen Beteiligten im gesamten Unternehmen ein klares und präzises Verständnis des Datenflusses und der Datenentwicklung. Für viele Unternehmen, insbesondere in regulierten Branchen, ist dies eine Grundvoraussetzung für Compliance, Datenqualität und Vertrauen.
Die Integration ermöglicht zudem schnellere Iterationszyklen für Analyse- und Entwicklungsteams. Da Sie Daten vor der Arbeit nicht mehr verschieben müssen, können Sie dbt-Modelle direkt vor Ort mit realen Daten in Echtzeit entwickeln und testen.
Wenn Sie beispielsweise ein Kundensegmentierungsmodell basierend auf dem in mehreren Datenbanken gespeicherten Nutzerverhalten erstellen, beginnt der Prozess typischerweise mit der Datenaufnahme in das Warehouse, gefolgt von der Erstellung und Bereitstellung von dbt-Modellen zur Transformation. Nach der Validierung werden die verfeinerten Daten in die Zielsysteme zurückgeschrieben. Dieser Prozess kann leicht mehrere Tage dauern. Dank der Zusammenarbeit von Avrio und dbt können Sie dieses Modell einmalig erstellen, direkt auf die relevanten Quelltabellen anwenden – unabhängig vom Speicherort – und die Ergebnisse sofort einsehen. Da Avrio jede dieser Transformationen in seiner Lineage Engine verfolgt, hat Ihr gesamtes Team Einblick in die Ableitung dieser Segmente.
Diese Art der Live-Modellierung, gepaart mit starker Governance und Beobachtbarkeit, macht Ihre Datenoperationen agiler, zuverlässiger und leichter skalierbar.
Viele der spannendsten Innovationen im heutigen Datenbereich zielen darauf ab, Reibungsverluste zu reduzieren – also Komplexitätsebenen zu beseitigen, die Erkenntnisse verlangsamen und Risiken erhöhen. Die Avrio-dbt-Integration ist ein hervorragendes Beispiel für dieses Prinzip in der Praxis.
Sie nutzen weiterhin die Tools, die Ihr Team kennt – SQL, dbt, versionskontrollierte Modelle –, aber auf einer Plattform, die traditionelle Barrieren beseitigt. Kein ETL. Keine Round-Trip-Synchronisierung. Keine unklare Herkunft. Vertrauensvolle Datentransformation dort, wo sie hingehören.
Die Avrio-dbt-Integration steigert den Wert in einer Vielzahl von Anwendungsfällen, in denen Agilität, Präzision und Governance entscheidend sind.
In Finanzteams sind Geschwindigkeit und Genauigkeit unverzichtbar. Mit der Avrio-dbt-Integration können Unternehmen mithilfe von dbt-Modellen die Umsatzrealisierungslogik direkt in Transaktionsdatenbanken implementieren. Diese Transformationen können Finanzzahlen basierend auf aktualisierten Zahlungsstatus, Vertragsbedingungen oder Nutzungsgrenzen anpassen – ganz ohne nächtliche Batch-Jobs. Jede Anpassung ist in der Herkunftsansicht von Avrio sichtbar, wodurch Audits und Abstimmungen einfacher, schneller und vollständig nachvollziehbar werden.
Marketing- und Produktanalyseteams können Benutzerverhaltensmuster systemübergreifend modellieren – beispielsweise Webanalysen in BigQuery und Transaktionsprotokolle in PostgreSQL – ohne alles in ein Warehouse zu übertragen. Mithilfe von dbt über Avrio können sie eine einheitliche Kundensegmentierungslogik erstellen, die nativ auf jedem System läuft und an Echtzeit-Personalisierungs-Engines zurückmeldet. Dank der integrierten Lineage können Geschäftsinteressenten nachvollziehen, wie Segmente abgeleitet werden, sogar systemübergreifend.
In einer Welt, in der Datenmengen explodieren und die Erwartungen höher denn je sind, benötigen Datenteams nicht nur leistungsstarke Tools, sondern auch vernetzte, kohärente Workflows , die mitwachsen können. Die Integration von Avrio und dbt erfüllt dieses Versprechen, indem sie Teams intelligenter und nicht härter arbeiten lässt. Durch die Aktivierung DML-basierter Transformationen direkt in Ihren Datenbanken mithilfe der Avrio-Plattform und die Darstellung dieser Änderungen im Lineage-System bietet diese Integration etwas Einzigartiges: ein einheitliches Transformationserlebnis, das Flexibilität, Transparenz und Governance an einem Ort vereint.
Dadurch wird die Transformation nicht nur schneller, sondern auch intelligenter.
Um zu sehen, wie es funktioniert – buchen Sie noch heute eine Demo