In Datenmanagement Letztes Updateated:
Teilen:
Jira-Software ist das Projektmanagement-Tool Nr. 1, das von agilen Teams zum Planen, Verfolgen, Freigeben und Unterstützen großartiger Software verwendet wird.

Als Unternehmen genate Da immer mehr Daten vorhanden sind, wird der traditionelle Ansatz des Data Warehousing immer schwieriger und kostspieliger in der Wartung. Die Daten Vault, ein relativ neuer Ansatz für Data Warehousing, bietet eine Lösung für dieses Problem, indem er eine skalierbare, agile und kostengünstige Möglichkeit zur Verwaltung großer Datenmengen bietet. 

In diesem Beitrag werden wir untersuchen, wie Daten Vaults sind die Zukunft des Data Warehousing und warum immer mehr Unternehmen diesen Ansatz übernehmen. Wir stellen auch Lernressourcen für diejenigen bereit, die tiefer in das Thema eintauchen möchten!

Was sind Daten? Vault?

Datum Vault ist eine Data-Warehouse-Modellierungstechnik, die sich besonders für agile Data-Warehouses eignet. Es bietet ein hohes Maß an Flexibilität für Erweiterungen, eine vollständige einheitenzeitliche Historisierung der Daten und ermöglicht eine starke Parallelisierung des Datenladens processes. Dan Linstedt hat Data entwickelt Vault Modeln in den 1990er Jahren.

Nach der Erstveröffentlichung im Jahr 2000 erlangte sie Greater Aufmerksamkeit im Jahr 2002 durch eine Reihe von Artikeln. Im Jahr 2007 gewann Linstedt die Unterstützung von Bill Inmon, der es als „optimale Wahl“ für seine Daten bezeichnete Vault 2.0-Architektur.

Wer sich mit dem Begriff agiles Data Warehouse beschäftigt, landet schnell bei Data Vault. Das Besondere an der Technologie ist, dass sie auf die Bedürfnisse von Unternehmen ausgerichtet ist, denn sie ermöglicht flexible, kostengünstigeeffort Anpassungen an einem Data Warehouse.

Datum Vault 2.0 betrachtet die gesamte Entwicklung process und der Architektur und besteht aus den Komponenten Methode (Implementierung), Architektur und Modell. Der Vorteil besteht darin, dass dieser Ansatz bei der Entwicklung alle Aspekte der Business Intelligence mit dem zugrunde liegenden Data Warehouse berücksichtigt.

Die Fakten Vault model bietet eine moderne Lösung zur Überwindung der Einschränkungen traditioneller Datenmodellierungsansätze. Mit seiner Skalierbarkeit, Flexibilität und Agilität bietet es eine solide Grundlage für den Aufbau von Daten platForm, die Platz bietetate die Komplexität und Vielfalt moderner Datenumgebungen.

Die Fakten VaultDie Hub-and-Spoke-Architektur und die Trennung von Entitäten und Attributen ermöglichen die Datenintegration und -harmonisierung über mehrere Systeme und Domänen hinweg und erleichtern so eine inkrementelle und agile Entwicklung.

Eine entscheidende Rolle spielen die Daten Vault beim Aufbau von Daten platForm besteht darin, eine einzige Quelle der Wahrheit für alle Daten zu schaffen. Seine einheitliche Datenansicht und Unterstützung für die Erfassung und Verfolgung historischer Datenänderungen durch satellite-Tabellen ermöglichen Compliance, Audit, behördliche Anforderungen sowie umfassende Analysen und Berichte.

Die Fakten Vault's Datenintegrationsfunktionen nahezu in Echtzeit über delta Lademöglichkeitates verarbeitet große Datenmengen in sich schnell verändernden Umgebungen wie Big Data und IoT-Anwendungen.

Datum Vault im Vergleich zu herkömmlichen Data-Warehouse-Modellen

Third-Normalform (3NF) ist eines der bekanntesten traditionellen Data-Warehouse-Modelle und wird in vielen großen Implementierungen oft bevorzugt. VorfallallyDies entspricht den Vorstellungen von Bill Inmon, einem der „Urväter“ des Data-Warehouse-Konzepts.

Die Inmon-Architektur basiert auf dem relationalen Datenbankmodell und Eliminates Datenredundanz durch Aufteilung der Datenquellen in kleinere Tabellen, die in Data Marts gespeichert und über Primär- und Fremdschlüssel miteinander verbunden sind. Es stellt sicher, dass die Daten konsistent und korrekt sindate durch Durchsetzung referenzieller Integritätsregeln.

Das Ziel der Normalform war es, ein umfassendes, unternehmensweites Datenmodell für das Core Data Warehouse aufzubauen; es hat jedoch Skalierbarkeits- und Flexibilitätsprobleme aufgrund stark gekoppelter Data Marts, Ladeschwierigkeiten im Fast-Echtzeitmodus, mühsamen Anfragen und Top-Down-Design und -Implementierung.

Kimbal-Modell, verwendet für OLAP (Online-Analyse). processing) und Data Marts ist ein weiteres bekanntes Data-Warehouse-Modell, in dem Faktentabellen Aggreg enthaltenated Daten- und Dimensionstabellen beschreiben gespeicherte Daten in a Sternschema- oder Schneeflockenschema-Design. In dieser Architektur werden Daten in Fakten- und Dimensionstabellen organisiert, die denormalisiert werden, um Abfragen und Analysen zu vereinfachen.

Kimbal basiert auf einem Dimensionsmodell, das für Abfragen und Berichte optimiert ist und sich daher ideal für Business-Intelligence-Anwendungen eignet. Es gab jedoch Probleme mit der Isolierung subjektorientierter Informationen, Datenredundanz, inkompatiblen Abfragestrukturen, Skalierbarkeitsschwierigkeiten, der inkonsistenten Granularität von Faktentabellen usw. syncHronisierungsprobleme und die Notwendigkeit eines Top-Down-Designs mit Bottom-Up-Implementierung. 

Im Gegensatz dazu Daten vault Architektur ist ein hybrider Ansatz, der Aspekte der 3NF- und Kimball-Architekturen kombiniert. Es handelt sich um ein Modell, das auf relationalen Prinzipien, Datennormalisierung und Redundanzma basiertthematics, das Beziehungen zwischen Entitäten unterschiedlich darstellt und Tabellenfelder und Zeitstempel unterschiedlich strukturiert.

In dieser Architektur werden alle Daten in Rohdaten gespeichert vault oder Data Lake, während die häufig verwendeten Daten in einem Unternehmen in einem normalisierten Format gespeichert werden vault das historische und kontextspezifische Daten enthält, die für die Berichterstellung verwendet werden können.

Datum Vault Behebt die Probleme traditioneller Modelle, indem es effizienter, skalierbarer und flexibler ist. Es ermöglicht das Laden nahezu in Echtzeit, eine bessere Datenintegrität und eine einfache Erweiterung, ohne bestehende Strukturen zu beeinträchtigen. Das Modell kann auch ohne Migration der bestehenden Tabellen erweitert werden.

ModellierungsansatzDatenstrukturDesignansatz
3NF-ModellierungTabellen in 3NFProst
Kimbal-ModellierungSternschema oder SchneeflockenschemaVon oben nach unten
Datum VaultHub-and-SpokeProst

Architektur der Daten Vault

Datum Vault verfügt über eine Hub-and-Spoke-Architektur und Essentially besteht aus drei Schichten:

Staging-Schicht: Sammelt die Rohdaten aus den Quellsystemen wie CRM oder ERP

Data Warehouse-Schicht: Bei Modellierung als Daten Vault Modell umfasst diese Ebene:

  • Raw Data Vault: speichert die Rohdaten.
  • Geschäftsdaten Vault: Enthält harmonisierte und transformierte Daten basierend auf Geschäftsregeln (optional).
  • Metrik Vault: speichert Laufzeitinformationen (optional).
  • Operatives Vault: Speichert die Daten, die direkt von Betriebssystemen in das Data Warehouse fließen (optional).

DataMart Layer: Diese Schicht modelliert Daten als Sternschema und/oder andere Modellierungstechniken. Es stellt Informationen für Analysen und Berichte zur Verfügung.

Datum Vault erfordert keine Neuarchitektur. Neue Funktionen können parallel direkt mit den Konzepten und Methoden von Data erstellt werden Vault, und vorhandene Komponenten gehen nicht verloren. Frameworks können die Arbeit erheblich erleichtern: Sie erstellenate eine Schicht zwischen dem Data Warehouse und dem Entwickler und reduzieren so die Komplexität der Implementierung. 

Komponenten von Daten Vault

Während der Modellierung werden Daten Vault teilt alle zum Objekt gehörenden Informationen in drei categories – im Gegensatz zum Klassiker third Normalformmodellierung. Diese Informationen werden dann streng getrennt gespeichertated voneinander. Die Funktionsbereiche können in Data abgebildet werden Vault in sogenannten Hubs, Links und sateLiteraten:

# 1. Naben

Hubs sind das Herzstück des Kerngeschäftskonzepts, wie z. B. Kunde, Verkäufer, Verkauf oder Produkt. Die Hub-Tabelle wird um den Geschäftsschlüssel (Geschäftsname oder Standort) gebildet, wenn eine neue Instanz dieses Geschäftsschlüssels zum ersten Mal in das Data Warehouse eingeführt wird.

Der Hub enthält Nr descriptLive-Informationen und keine FKs. Es besteht nur aus dem Geschäftsschlüssel mit einem Warehouse-Generatorated Sequenz von ID- oder Hash-Schlüsseln, laden date/Zeitstempel und Aufnahmequelle.

# 2. Links

Links stellen Beziehungen zwischen den Geschäftsschlüsseln her. Jeder Eintrag in einem Link modelliert nm-Beziehungen einer beliebigen Anzahl von Hubs. Es ermöglicht die Daten vault flexibel auf Veränderungen in der Geschäftslogik der Quellsysteme zu reagieren, etwa Veränderungen in der Freundlichkeit von Beziehungen. Genau wie der Hub enthält der Link keine descriptLive-Informationen. Es besteht aus den Sequenz-IDs der Hubs, auf die es verweist, einem Warehouse-Generated Sequenz-ID, laden date/Zeitstempel und Aufnahmequelle.

# 3. Satellites

Satellites enthalten die descriptLive-Informationen (Kontext) für einen in einem Hub gespeicherten Geschäftsschlüssel oder eine in einem Link gespeicherte Beziehung. Satellites funktionieren „nur einfügen“, was bedeutet, dass der gesamte Datenverlauf im s gespeichert wirdatellite. Mehrere sateLites können einen einzelnen Geschäftsschlüssel (oder eine einzelne Beziehung) beschreiben. Allerdings daatellite kann nur einen Schlüssel (Hub oder Link) beschreiben.

So erstellen Sie ein Data Vault Modell

Daten erstellen Vault Das Modell umfasst mehrere Schritte, von denen jeder entscheidend ist, um sicherzustellen, dass das Modell skalierbar und flexibel ist und die Anforderungen des Unternehmens erfüllen kann:

# 1. Identifizieren Sie Entitäten und Attribute

Identifizieren Sie die Geschäftseinheiten und ihre entsprechenden Attribute. Dabei geht es darum, eng mit den Geschäftsinteressenten zusammenzuarbeiten, um deren Anforderungen und die zu erfassenden Daten zu verstehen. Sobald diese Entitäten und Attribute identifiziert wurden, trennen Sie sieate sie in Hubs, Links und satellites.

# 2. Definieren Sie Entitätsbeziehungen und Create Links

Sobald Sie die Entitäten und Attribute identifiziert haben, werden die Beziehungen zwischen den Entitäten definiert und die Verknüpfungen erstelltated, um diese Beziehungen darzustellen. Jedem Link wird ein Geschäftsschlüssel zugewiesen, der die Beziehung zwischen den Entitäten identifiziert. Die sateAnschließend werden Liteten hinzugefügt, um die Attribute und Beziehungen der Entitäten zu erfassen.

# 3. Regeln und Standards festlegen

Nach dem Erstellen von Links werden eine Reihe von Regeln und Daten erstellt vault Es sollten Modellierungsstandards festgelegt werden, um sicherzustellen, dass das Modell flexibel ist und Änderungen im Laufe der Zeit verarbeiten kann. Diese Regeln und Standards sollten gelten revangeschaut und aktualisiertateRegelmäßig überprüfen, um sicherzustellen, dass sie relevant und auf die Geschäftsanforderungen ausgerichtet bleiben.

# 4. Bevölkerungate das Model

Sobald das Modell erstellt wurdeated, es sollte popul seinated mit Daten unter Verwendung eines inkrementellen Ladeansatzes. Dabei werden die Daten in die Hubs, Links und s geladenatellites verwenden delta Ladungen. Die delta lädt, um sicherzustellen, dass nur die an den Daten vorgenommenen Änderungen geladen werden, wodurch der Zeit- und Ressourcenaufwand für die Datenintegration reduziert wird.

# 5. Test und gültigate das Model

Finally, das Modell sollte getestet und gültig seinated um sicherzustellen, dass es den Geschäftsanforderungen entspricht und skalierbar und flexibel genug ist, um zukünftige Änderungen zu bewältigen. Regelmäßige Wartung und Aktualisierungates sollten durchgeführt werden, um sicherzustellen, dass das Modell weiterhin an den Geschäftsanforderungen ausgerichtet ist und weiterhin eine einheitliche Sicht auf die Daten bietet.

Datum Vault Lernmittel

Daten beherrschen Vault kann wertvolle Fähigkeiten und Kenntnisse vermitteln, die in den heutigen datengesteuerten Branchen sehr gefragt sind. Hier finden Sie eine umfassende Liste von Ressourcen, einschließlich Kursen und Büchern, die Ihnen beim Erlernen der Feinheiten von Daten helfen können Vault:

# 1. Modellierung eines Data Warehouse mit Daten Vault 2.0

Dieser Udemy-Kurs ist eine umfassende Einführung in die Daten Vault 2.0-Modellierungsansatz, agiles Projektmanagement und Big-Data-Integration. Der Kurs behandelt die Grundlagen und Grundlagen von Daten Vault 2.0, einschließlich seiner Architektur und Schichten, Geschäft und Information vaults und fortgeschrittene Modellierungstechniken.

Es zeigt Ihnen, wie Sie Daten entwerfen Vault Modellieren Sie von Grund auf, konvertieren Sie traditionelle Modelle wie 3NF und dimensionale Modelle in Daten Vaultund verstehen Sie die Prinzipien der dimensionalen Modellierung in Daten Vault. Der Kurs setzt Grundkenntnisse in Datenbanken und SQL-Grundlagen voraus.

Mit einer hohen Bewertung von 4.4 von 5 und über 1,700 revMeiner Meinung nach ist dieser meistverkaufte Kurs für alle geeignet, die eine solide Grundlage im Bereich Daten aufbauen möchten Vault 2.0 und Big-Data-Integration.

# 2. Datum Vault Modellierung anhand eines Anwendungsfalls erklärt

Dieser Udemy-Kurs soll Sie beim Aufbau einer Datenbasis unterstützen Vault Modell anhand eines praktischen Geschäftsbeispiels. Es dient als Leitfaden für Einsteiger in das Thema Daten Vault Modellierung, die Schlüsselkonzepte wie das Appropri abdecktate Szenarien zur Verwendung von Daten Vault Modelle, die Einschränkungen der herkömmlichen OLAP-Modellierung und ein systematischer Ansatz zur Erstellung von Daten Vault Modell. Der Kurs ist für Personen mit minimalen Datenbankkenntnissen zugänglich.

# 3. Die Fakten Vault Guru: ein pragmatischer Leitfaden

Die Fakten Vault Guru von Herrn Patrick Cuba ist ein umfassender Leitfaden zu den Daten vault Methodik, die eine einzigartige Möglichkeit bietet, das Unternehmen zu modellierenrise Data Warehouse unter Verwendung von Automatisierungsprinzipien, die denen ähneln, die in verwendet werden Softwarelieferung.

Das Buch bietet einen Überblick über moderne Architektur und bietet anschließend eine ausführliche Anleitung zur Bereitstellung eines flexiblen Datenmodells, das sich an Änderungen im Unternehmen anpasstrise, die Daten vault.

Zusatzally, das Buch erweitert die Daten vault Methodik durch Bereitstellung automated Zeitachsenkorrektur, Audit-Trails, Metadatenkontrolle und Integration mit agilen Bereitstellungstools.

# 4. Aufbau eines skalierbaren Data Warehouse mit Daten Vault 2.0

Dieses Buch bietet den Lesern eine umfassende Anleitung zum Erstellen eines skalierbaren Data Warehouse vom Anfang bis zum Ende unter Verwendung der Daten Vault 2.0-Methodik.

Dieses Buch behandelt alle wesentlichen Aspekte des Aufbaus eines skalierbaren Data Warehouse, einschließlich der Daten Vault Modellierungstechnik, die darauf ausgelegt ist, prevent typischen Data Warehousing-Fehlern.

Das Buch enthält zahlreiche Beispiele, die den Lesern helfen, die Konzepte klar zu verstehen. Mit seinen praktischen Einblicken und Beispielen aus der Praxis ist dieses Buch eine unverzichtbare Ressource für alle, die sich für Data Warehousing interessieren.

# 5. Der Elefant im Kühlschrank: Geführte Schritte zu Daten Vault Erfolge

„The Elephant in the Fridge“ von John Giles ist ein praktischer Ratgeber, der den Lesern dabei helfen soll, Daten zu erlangen Vault Erfolg, indem man mit dem Geschäft beginnt und mit dem Geschäft endet.

Das Buch konzentriert sich auf die Bedeutung von Unternehmenrise Ontologie und Geschäftskonzeptmodellierung und bietet Schritt-für-Schritt-Anleitungen zur Anwendung dieser Konzepte auf Create ein solides Datenmodell.

Durch praktische Ratschläge und Beispielmuster bietet der Autor eine klare und unkomplizierte Anleitungated Erklärung der Komplizenated Themen, was das Buch zu einem hervorragenden Leitfaden für diejenigen macht, die mit den Daten noch nicht vertraut sind Vault.

Zusammenfassung

Datum Vault stellt die Zukunft des Data Warehousing dar und bietet Unternehmen erhebliche Vorteile in Bezug auf Agilität, Skalierbarkeit und Effizienz. Es eignet sich besonders gut für Unternehmen, die große Datenmengen schnell laden müssen und ihre Business-Intelligence-Anwendungen agil entwickeln möchten.

Darüber hinaus können Unternehmen, die über eine bestehende Silo-Architektur verfügen, von der Implementierung eines vorgelagerten Core Data Warehouse mithilfe von Data stark profitieren Vault.

Sie könnten auch daran interessiert sein, etwas über die zu erfahren Datenherkunft.

Teilen:
  • Talha Khalid
    Autor
    Ein freiberuflicher Webentwickler und eine Leidenschaftate writer. Sie können mir auf Medium folgen: @Talhakhalid101

Danke an unsere Sponsoren

Weitere großartige Lektüre zum Thema Datenmanagement

Treiben Sie Ihr Geschäft an

Einige der Tools und Services, die Ihrem Unternehmen helfen grow.