Spiegeln von Azure Cosmos DB (Vorschau)
Die Spiegelung in Microsoft Fabric bietet eine nahtlose Erfahrung ohne ETL, um Ihre bestehenden Azure Cosmos DB-Daten mit dem Rest Ihrer Daten in Microsoft Fabric zu integrieren. Ihre Azure Cosmos DB-Daten werden kontinuierlich direkt in Fabric OneLake in Quasi-Echtzeit repliziert, ohne dass sich dies auf Ihre Transaktionsworkloads auswirkt oder Anforderungseinheiten (Request Units, RUs) verbraucht.
Die Daten in OneLake werden im Open-Source-Delta-Format gespeichert und automatisch allen Analyseprogrammen auf Fabric zur Verfügung gestellt.
Sie können integrierte Power BI-Funktionen nutzen, um in OneLake im DirectLake-Modus auf Daten zuzugreifen. Mit den Copilot-Erweiterungen in Fabric können Sie die Stärken der generativen KI nutzen, um wichtige Einblicke in Ihre Geschäftsdaten zu erhalten. Zusätzlich zu Power BI können Sie T-SQL verwenden, um komplexe Aggregatabfragen auszuführen oder Spark für die Datensuche zu verwenden. Sie können nahtlos auf die Daten in Notizbüchern zugreifen und Data Science verwenden, um Machine Learning-Modelle zu erstellen.
Wichtig
Die Spiegelung für Azure Cosmos DB befindet sich derzeit in der Vorschau. Produktionsworkloads werden in der Vorschauversion nicht unterstützt. Derzeit werden nur Azure Cosmos DB for NoSQL-Konten unterstützt.
Warum eine Spiegelung in Fabric?
Mit der Spiegelung in Fabric vermeiden Sie, verschiedene Dienste von mehreren Anbietern kombinieren zu müssen. Stattdessen können Sie ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt nutzen, das Ihre Analyseanforderungen vereinfacht und auf Offenheit ausgelegt ist.
Wenn Sie nach BI-Berichten oder Analysen zu Ihren Betriebsdaten in Azure Cosmos DB suchen, bietet die Spiegelung folgende Möglichkeiten:
- Nicht ETL-basierter, kosteneffizienter Zugriff in Quasi-Echtzeit auf Azure Cosmos DB-Daten ohne Auswirkung auf Ihre Nutzung von Anforderungseinheiten
- Einfaches Zusammenführen von Daten aus verschiedenen Quellen in Fabric OneLake
- Delta-Tabellenoptimierungen mit v-Reihenfolge für blitzschnelle Lesevorgänge
- Ein-Klick-Integration in Power BI mit Direct Lake und Copilot
- Reichhaltige Geschäftseinblicke durch Zusammenführung von Daten aus verschiedenen Quellen
- Umfangreichere App-Integration für den Zugriff auf Abfragen und Ansichten
OneLake-Daten werden im quelloffenen Delta Lake-Format gespeichert, so dass Sie sie mit verschiedenen Lösungen innerhalb und außerhalb von Microsoft nutzen können. Dieses Datenformat erleichtert den Aufbau eines einzigen Datenbestands für Ihre analytischen Anforderungen.
Welche Analyseerfahrungen sind integriert?
Gespiegelte Datenbanken sind ein Element in Fabric-Datenspeicherung, die sich von Warehouse- und SQL-Analyseendpunkten unterscheiden.
Jede gespiegelte Azure Cosmos DB-Datenbank hat drei Elemente, mit denen Sie in Ihrem Fabric-Arbeitsbereich interagieren können:
- Das gespiegelte Datenbankelement. Die Spiegelung verwaltet die Replikation von Daten in OneLake und die Konvertierung in Parquet in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und noch vieles mehr.
- SQL-Analyseendpunkt, der automatisch generiert wird
- Standardsemantikmodell, das automatisch generiert wird
Gespiegelte Datenbanken
Die gespiegelte Datenbank zeigt den Replikationsstatus und die Steuerelemente zum Stoppen oder Starten der Replikation in Fabric OneLake an. Sie können Ihre Quelldatenbank auch im Lesemodus mit dem Azure Cosmos DB-Datenexplorer anzeigen. Mit dem Datenexplorer können Sie Ihre Container in Ihrer Azure Cosmos DB-Quelldatenbank anzeigen und abfragen. Diese Vorgänge verbrauchen Anforderungseinheiten (Request Units, RUs) aus Ihrem Azure Cosmos DB-Konto. Alle Änderungen an der Quelldatenbank werden sofort in der Quelldatenbankansicht von Fabric angezeigt. Das Schreiben in die Quelldatenbank ist von Fabric aus nicht erlaubt, da Sie die Daten nur anzeigen können.
SQL-Analyseendpunkt
Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analyseendpunkt, der über die OneLake Delta-Tabellen verfügt, die vom Spiegelungsprozess erstellt wurden. Sie haben Zugriff auf vertraute T-SQL-Befehle, mit denen Sie Datenobjekte definieren und abfragen können, die Daten des SQL Analytics-Endpunkts jedoch nicht manipulieren können, da es sich um eine schreibgeschützte Kopie handelt.
Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:
- Erkunden von Delta Lake-Tabellen mit T-SQL. Jede Tabelle wird einem Container aus Ihrer Azure Cosmos DB-Datenbank zugeordnet.
- Erstellen Sie Abfragen und Ansichten ohne Code und erkunden Sie sie visuell, ohne eine Codezeile zu schreiben.
- Verbinden und fragen Sie Daten in anderen gespiegelten Datenbanken, Warehouses und Lakehouses im selben Arbeitsbereich ab.
- Sie können BI-Berichte ganz einfach basierend auf SQL-Abfragen oder Sichten visualisieren und erstellen.
Neben dem SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools. Zu diesen Tools gehören die mssql-Erweiterung mit Visual Studio Code, SQL Server Management Studio (SSMS) und sogar GitHub Copilot. Sie können die Analyse und die Gewinnung von Erkenntnissen mit dem Tool Ihrer Wahl verbessern.
Semantikmodell
Das Standardsemantikmodell ist ein automatisch bereitgestelltes Power BI-Semantikmodell. Mit diesem Feature können Geschäftsmetriken erstellt, freigegeben und wiederverwendet werden. Weitere Informationen finden Sie unter Verbindung mit semantischen Modellen herstellen.
Wie funktioniert die Quasi-Echtzeit-Replikationsarbeit?
Wenn Sie die Spiegelung auf Ihrer Azure Cosmos DB-Datenbank aktivieren, werden Einfüge-, Aktualisierungs- und Löschvorgänge auf Ihren Onlinetransaktionsverarbeitung-Daten (Online Transaction Processing, OLTP) kontinuierlich in Fabric OneLake repliziert und für Analysen genutzt.
Das Feature für die kontinuierliche Sicherung ist eine Voraussetzung für die Spiegelung. Sie können für Ihr Azure Cosmos DB-Konto entweder eine 7- oder 30-tägige fortlaufende Sicherung aktivieren. Wenn Sie eine fortlaufende Sicherung speziell für die Spiegelung aktivieren, wird eine fortlaufende Sicherung von 7 Tagen empfohlen, da sie kostenlos ist.
Hinweis
Die Spiegelung verwendet den Analytischen Speicher oder den Feed von Azure Cosmos DB nicht als Änderungsdaten-Erfassungsquelle. Sie können diese Funktionalitäten weiterhin unabhängig nutzen, zusammen mit Spiegelung.
Es kann einige Minuten dauern, bis Ihre Azure Cosmos DB-Daten in Fabric OneLake repliziert werden. Je nach der anfänglichen Momentaufnahme oder der Häufigkeit von Aktualisierungen/Löschvorgängen kann die Replikation in einigen Fällen auch länger dauern. Die Replikation wirkt sich nicht auf die Anforderungseinheiten (Request Units, RUs) aus, die Sie für Ihre Transaktionsworkloads zugewiesen haben.
Was Sie von der Spiegelung erwarten können
Es gibt einige Überlegungen und unterstützte Szenarien, die Sie vor der Spiegelung anstellen bzw. berücksichtigen sollten.
Überlegungen zum Setup
Um eine Datenbank zu spiegeln, sollte diese bereits in Azure bereitgestellt werden. Als Voraussetzung dafür müssen Sie die fortlaufende Sicherung für das Konto aktivieren.
- Sie können jede Datenbank jeweils nur einzeln spiegeln. Sie können auswählen, welche Datenbank gespiegelt werden soll.
- Sie können dieselbe Datenbank mehrmals innerhalb desselben Arbeitsbereichs spiegeln. Es empfiehlt sich, eine einzige Kopie der Datenbank in verschiedenen Lakeshouses, Warehouses oder anderen gespiegelten Datenbanken wiederzuverwenden. Sie sollten nicht mehrere Spiegelungen für dieselbe Datenbank einrichten müssen.
- Sie können dieselbe Datenbank auch in verschiedenen Fabric-Arbeitsbereichen oder Mandanten spiegeln.
- Änderungen an Azure Cosmos DB-Containern, wie das Hinzufügen neuer Container und das Löschen bestehender Container, werden nahtlos in Fabric repliziert. Sie können z. B. mit der Spiegelung einer leeren Datenbank ohne Container beginnen und die Spiegelung nimmt die zu einem späteren Zeitpunkt hinzugefügten Container nahtlos auf.
Unterstützung für geschachtelte Daten
Geschachtelte Daten werden in SQL Analytics-Endpunkttabellen als JSON-Zeichenkette angezeigt. Sie können OPENJSON
, CROSS APPLY
und OUTER APPLY
in T-SQL-Abfragen oder Ansichten verwenden, um diese Daten selektiv zu erweitern. Wenn Sie Power Query verwenden, können Sie auch die ToJson
-Funktion anwenden, um diese Daten zu erweitern.
Hinweis
Fabric hat eine Einschränkung für Zeichenkettenspalten mit einer Größe von 8 KB. Weitere Informationen finden Sie unter Einschränkungen des Data Warehouse.
Behandeln von Schemenänderungen
Die Spiegelung repliziert automatisch Eigenschaften in Azure Cosmos DB-Elementen mit Schemenänderungen. Alle in einem Element ermittelten neuen Eigenschaften werden als neue Spalten angezeigt, und falls vorhanden, werden die fehlenden Eigenschaften in Fabric als NULL dargestellt.
Wenn Sie eine Eigenschaft in einem Element umbenennen, behalten Fabric-Tabellen sowohl die alten als auch die neuen Spalten bei. In der alten Spalte wird NULL angezeigt, und die neue Spalte zeigt den neuesten Wert für alle Elemente an, die nach dem Umbenennungsvorgang repliziert werden.
Wenn Sie den Datentyp einer Eigenschaft in Azure Cosmos DB-Elementen ändern, werden die Änderungen für kompatible Datentypen unterstützt, die konvertiert werden können. Wenn die Datentypen nicht für die Konvertierung in Delta kompatibel sind, werden sie als NULL-Werte dargestellt.
SQL Analytics-Endpunkttabellen konvertieren Delta-Datentypen in T-SQL-Datentypen.
Doppelte Spaltennamen
Azure Cosmos DB unterstützt Spaltennamen ohne Berücksichtigung der Groß- und Kleinschreibung, basierend auf dem JSON-Standard. Die Spiegelung unterstützt diese doppelten Spaltennamen durch Hinzufügen von _n
zum Spaltennamen, wobei es sich bei n
um einen numerischen Wert handelt.
Wenn beispielsweise das Azure Cosmos DB-Element über addressName
und AddressName
als eindeutige Eigenschaften verfügt, verfügen Fabric-Tabellen über entsprechende addressName
- und AddressName_1
-Spalten. Weitere Informationen finden Sie unter Einschränkungen der Replikation.
Sicherheit
Die Verbindungen zu Ihrer Quelldatenbank basieren auf den Kontoschlüsseln für Ihre Azure Cosmos DB-Konten. Wenn Sie die Schlüssel drehen oder neu generieren, müssen Sie die Verbindungen aktualisieren, um sicherzustellen, dass die Replikation funktioniert. Weitere Informationen finden Sie unter Verbindungen.
Kontoschlüssel sind nicht direkt für andere Fabric-Benutzer sichtbar, nachdem die Verbindung eingerichtet wurde. Sie können einschränken, wer Zugriff auf die in Fabric erstellten Verbindungen hat. Schreibzugriffe auf die Azure Cosmos DB-Datenbank sind weder vom Datenexplorer noch vom Analyse-Endpunkt in Ihrer gespiegelten Datenbank aus zulässig.
Mirroring unterstützt derzeit keine Authentifizierung mit schreibgeschützten Kontoschlüsseln, Single-Sign-On (SSO) mit Microsoft Entra IDs und rollenbasierter Zugriffssteuerung oder verwalteten Identitäten.
Sobald die Daten in Fabric OneLake repliziert wurden, müssen Sie den Zugriff auf diese Daten sichern.
Datenschutzfunktionen
Granulare Sicherheit kann in der gespiegelten Datenbank in Microsoft Fabric konfiguriert werden. Weitere Informationen finden Sie unter Granulare Berechtigungen in Microsoft Fabric.
Sie können Spaltenfilter und prädikatbasierte Zeilenfilter für Tabellen für Rollen und Benutzer in Microsoft Fabric sichern:
- Sicherheit auf Zeilenebene in Fabric Data Warehousing
- Sicherheit auf Spaltenebene in Fabric Data Warehousing
Sie können außerdem vertrauliche Daten von Nicht-Administratoren-Benutzer mithilfe der dynamischen Datenmaskierung maskieren:
Netzwerksicherheit
Derzeit unterstützt die Spiegelung bei OneLake keine privaten Endpunkte oder kundenseitig verwaltete Schlüssel (Customer Managed Keys, CMK). Die Spiegelung wird nicht unterstützt für Azure Cosmos DB-Konten mit Netzwerksicherheitskonfigurationen, die weniger permissiv sind als alle Netzwerke, mit Service-Endpunkten, mit privaten Endpunkten, mit IP-Adressen oder mit anderen Einstellungen, die den öffentlichen Netzwerkzugriff auf das Konto beschränken könnten. Azure Cosmos DB-Konten sollten für alle Netzwerke offen sein, um mit der Spiegelung zu arbeiten.
Notfallwiederherstellung und Replikationslatenz
In Fabric können Sie Inhalte in Rechenzentren in anderen Regionen als der Heimatregion des Fabric-Mandanten bereitstellen. Weitere Informationen finden Sie unter Multi-Geo-Unterstützung.
Bei einem Azure Cosmos DB-Konto mit einer primären Schreibregion und mehreren Leseregionen wählt die Spiegelung die Azure Cosmos DB-Leseregion, die der Region am nächsten liegt, in der die Fabric-Kapazität konfiguriert ist. Diese Auswahl sorgt für eine Replikation mit niedriger Latenz bei der Spiegelung.
Wenn Sie Ihr Azure Cosmos DB-Konto in eine Wiederherstellungsregion wechseln, wählt die Spiegelung automatisch wieder die nächstgelegene Azure Cosmos DB-Region aus.
Hinweis
Die Spiegelung unterstützt keine Konten mit mehreren Schreibregionen.
Ihre Cosmos DB-Daten, die zu OneLake repliziert werden, müssen so konfiguriert werden, dass sie mit regionsweiten Ausfällen umgehen können. Weitere Informationen finden Sie unter Notfallwiederherstellung in OneLake.
Erkunden Sie Ihre Daten mithilfe von Spiegelung
Sie können gespiegelte Daten direkt in OneLake anzeigen und darauf zugreifen. Sie können auch nahtlos auf gespiegelte Daten zugreifen, ohne weitere Datenbewegungen.
Erfahren Sie mehr über den Zugriff auf OneLake mit ADLS Gen2-APIs oder SDK, dem OneLake-Datei-Explorer und dem Azure Storage-Explorer.
Sie können eine Verbindung zum SQL-Analyse-Endpunkt über Tools wie SQL Server Management Studio (SSMS) oder über Treiber wie Microsoft Open Database Connectivity (ODBC) und Java Database Connectivity (JDBC) herstellen. Weitere Informationen finden Sie unter SQL-Analyseendpunkt-Konnektivität.
Sie können auch auf gespiegelte Daten mit Diensten wie z. B.:
- Azure Services wie Azure Databricks, Azure HDInsight oder Azure Synapse Analytics zugreifen
- Fabric Lakehouse mit Verknüpfungen für Data Engineering- und Data Science-Szenarien
- Andere gespiegelte Datenbanken oder Warehouses im Fabric-Arbeitsbereich
Sie können auch Medallion-Architekturlösungen erstellen, die Daten bereinigen und umwandeln, die in einer gespiegelten Datenbank als Bronzeschicht landen. Weitere Informationen finden Sie in Unterstützung der Medaillon-Architektur in Fabric.
Preise
Eine Spiegelung ist kostenlos für die Compute, die zum Replizieren Ihrer Cosmos DB-Daten in Fabric OneLake verwendet wird. Die Speicherung in OneLake ist auf Grundlage bestimmter Bedingungen kostenlos. Weitere Informationen finden Sie unter OneLake-Preise für die Spiegelung. Die Compute zum Abfragen von Daten über SQL, Power BI oder Spark wird basierend auf der Fabric-Kapazität weiterhin berechnet.
Wenn Sie den Datenexplorer in der Fabric-Spiegelung verwenden, fallen typische Kosten auf der Grundlage der Nutzung von Anforderungseinheiten (Request Units, RUs) an, um die Container zu erkunden und die Elemente in der Azure Cosmos DB-Quelldatenbank abzufragen. Die kontinuierliche Backup-Funktion von Azure Cosmos DB ist eine Voraussetzung für die Spiegelung: Es gelten die Standardgebühren für fortlaufende Datensicherungen. Bei der Abrechnung der fortlaufenden Datensicherung fallen keine zusätzlichen Kosten für die Spiegelung an. Weitere Informationen finden Sie unter Azure Cosmos DB – Preise.