Erweiterungen (Datenshards)
Gilt für: ✅Microsoft Fabric✅Azure Data Explorer
Tabellen werden in Ausmaße oder Datenshardien partitioniert. Jedes Ausmaß ist ein horizontales Segment der Tabelle, das Daten und Metadaten enthält, z. B. die Erstellungszeit und optionale Tags. Die Vereinigung all dieser Ausmaße enthält das gesamte Dataset der Tabelle. Erweiterungen werden gleichmäßig über Knoten im Cluster verteilt, und sie werden sowohl in lokaler SSD als auch im Speicher für eine optimierte Leistung zwischengespeichert.
Ausmaße sind unveränderlich, d. h. sie können abgefragt, einem anderen Knoten neu zugewiesen oder aus der Tabelle entfernt, aber nie geändert werden. Die Datenänderung erfolgt, indem neue Erweiterungen erstellt und transaktionsweise alte Erweiterungen mit den neuen ausgetauscht werden. Die Unveränderlichkeit von Ausmaßen bietet Vorteile wie erhöhte Robustheit und einfache Umversion zu früheren Momentaufnahmen.
Soweit eine Sammlung von Datensätzen aufbewahrt wird, die physisch in Spalten angeordnet sind und eine effiziente Codierung und Komprimierung der Daten ermöglichen. Um die Abfrageeffizienz aufrechtzuerhalten, werden kleinere Ausmaße entsprechend der konfigurierten Zusammenführungsrichtlinie und der Sharding-Richtlinie in größerem Umfang zusammengeführt. Das Zusammenführen von Ausmaßen reduziert den Verwaltungsaufwand und führt zu Indexoptimierung und verbesserter Komprimierung.
Der allgemeine Lebenszyklus ist wie folgt:
- Der Umfang wird durch einen Aufnahmevorgang erstellt.
- Der Umfang wird mit anderen Ausmaßen zusammengeführt.
- Der zusammengeführte Umfang (möglicherweise eine, die seine Linie in anderen Ausmaßen verfolgt) wird aufgrund einer Aufbewahrungsrichtlinie schließlich gelöscht.
Umfang der Erstellungszeit
Zwei Datetime-Werte werden pro Umfang nachverfolgt: MinCreatedOn
und MaxCreatedOn
. Diese Werte sind anfänglich identisch, können sich aber ändern, wenn der Umfang mit anderen Ausmaßen zusammengeführt wird. Wenn der Umfang mit anderen Ausmaßen zusammengeführt wird, entsprechen die neuen Werte den ursprünglichen Mindest- und Höchstwerten der zusammengeführten Ausmaße.
Die Erstellungszeit eines Umfangs wird für die folgenden Zwecke verwendet:
- Aufbewahrung: Zuvor erstellte Erweiterungen werden gelöscht.
- Zwischenspeichern: Zuletzt erstellte Erweiterungen werden im heißen Cache gespeichert.
- Sampling: Aktuelle Erweiterungen werden bevorzugt, wenn Abfragevorgänge wie "Take" verwendet werden.
Um die Erstellungszeit eines Umfangs zu überschreiben, stellen Sie eine Alternative creationTime
in den Datenaufnahmeeigenschaften bereit. Dies kann für Aufbewahrungszwecke nützlich sein, z. B. wenn Sie Daten erneut aufnehmen möchten, sie aber nicht so aussehen möchten, als ob sie verspätet eingegangen ist.
Hinweis
Die Berechnung zum Entfernen eines Umfangs basierend auf der Zeit verwendet die Erstellungszeit des neuesten Umfangs innerhalb des zusammengeführten Umfangs.