Freigeben über


Tabellengröße schätzen

Gilt für: ✅Microsoft FabricAzure Data Explorer

Das Verständnis der Größe einer Tabelle kann hilfreich sein, um eine effiziente Ressourcenverwaltung und eine optimierte Abfrageleistung zu erzielen. In diesem Artikel lernen Sie verschiedene Methoden zum Schätzen von Tabellengrößen und deren effektive Verwendung kennen.

Originalgröße der aufgenommenen Daten

Verwenden Sie die .show table details, um die ursprüngliche Datengröße einer Tabelle zu schätzen. Ein Beispiel finden Sie unter Verwenden von TABELLENdetails.

Dieser Befehl bietet eine Schätzung der nicht komprimierten Datengröße, die in die Tabelle aufgenommen wurde, basierend auf der Annahme, dass die Daten im CSV-Format übertragen wurden. Die Schätzung basiert auf ungefähren Längen numerischer Werte, z. B. ganze Zahlen, Longs, Datetimes und GUIDs, indem sie ihre Zeichenfolgendarstellungen in Betracht ziehen.

Beispielanwendungsfall: Nachverfolgen der Größe eingehender Daten im Laufe der Zeit, um fundierte Entscheidungen zur Kapazitätsplanung zu treffen.

Tabellengröße in Bezug auf Zugriffsbytes

Verwenden Sie die estimate_data_size() zusammen mit der Summe() Aggregationsfunktion, um die Tabellengröße basierend auf Datentypen und den jeweiligen Bytegrößen zu schätzen. Ein Beispiel finden Sie unter Verwenden von estimate_data_size().

Diese Methode bietet eine genauere Schätzung, indem die Bytegrößen numerischer Werte berücksichtigt werden, ohne sie als Zeichenfolgen zu formatieren. Ganzzahlwerte erfordern beispielsweise 4 Bytes, während lange und Datumstimewerte 8 Byte erfordern. Mit diesem Ansatz können Sie die Datengröße genau schätzen, die in den Arbeitsspeicher passt.

Beispielanwendungsfall: Ermitteln der Kosten einer Abfrage in Bezug auf zu scannende Bytes.

Kombinierte Größe mehrerer Tabellen

Sie können den Union--Operator zusammen mit dem estimate_data_size() und sum() Funktionen verwenden, um die kombinierte Größe mehrerer Tabellen in Bezug auf Zugriffsbytes zu schätzen. Ein Beispiel finden Sie unter Verwenden einer Vereinigung mit estimate_data_size().

Beispielanwendungsfall: Bewerten der Speicheranforderungen zum Konsolidieren von Daten aus mehreren Tabellen in einem einzelnen Dataset.

Anmerkung

Dieser Ansatz kann die geschätzte Datengröße aufgrund leerer Spalten vergrößern, da union alle Spalten aus den angegebenen Tabellen kombiniert und estimate_data_size() beim Berechnen der Datengröße leere Spalten berücksichtigt.

Beispiele

Verwenden von ".show"-Tabellendetails

Die folgende Abfrage schätzt die ursprüngliche Datengröße der StormEvents Tabelle.

.show table StormEvents details
| project TotalOriginalSize

Ausgabe-

TotalOriginalSize
60192011

Trinkgeld

Um das Byteergebnis auf MB, GBoder eine andere Einheit zu formatieren, verwenden Sie format_bytes().

Verwenden von estimate_data_size()

Die folgende Abfrage schätzt die ursprüngliche Datengröße der StormEvents Tabelle in Byte.

StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)

Ausgabe-

totalSize
58608932

Anmerkung

Die Ausgabe ist kleiner, obwohl die Berechnung über dieselbe Tabelle erfolgt. Dies liegt daran, dass diese Methode eine genauere Schätzung bietet, indem die Bytegrößen numerischer Werte berücksichtigt werden, ohne sie als Zeichenfolgen zu formatieren.

Vereinigung mit estimate_data_size() verwenden

Die folgende Abfrage schätzt die Datengröße basierend auf allen Tabellen in der Samples-Datenbank.

union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize sizeGB
1761782453926 1640,79 GB