Tabellengröße schätzen
Gilt für: ✅Microsoft Fabric✅Azure Data Explorer
Das Verständnis der Größe einer Tabelle kann hilfreich sein, um eine effiziente Ressourcenverwaltung und eine optimierte Abfrageleistung zu erzielen. In diesem Artikel lernen Sie verschiedene Methoden zum Schätzen von Tabellengrößen und deren effektive Verwendung kennen.
Originalgröße der aufgenommenen Daten
Verwenden Sie die .show table details, um die ursprüngliche Datengröße einer Tabelle zu schätzen. Ein Beispiel finden Sie unter Verwenden von TABELLENdetails.
Dieser Befehl bietet eine Schätzung der nicht komprimierten Datengröße, die in die Tabelle aufgenommen wurde, basierend auf der Annahme, dass die Daten im CSV-Format übertragen wurden. Die Schätzung basiert auf ungefähren Längen numerischer Werte, z. B. ganze Zahlen, Longs, Datetimes und GUIDs, indem sie ihre Zeichenfolgendarstellungen in Betracht ziehen.
Beispielanwendungsfall: Nachverfolgen der Größe eingehender Daten im Laufe der Zeit, um fundierte Entscheidungen zur Kapazitätsplanung zu treffen.
Tabellengröße in Bezug auf Zugriffsbytes
Verwenden Sie die estimate_data_size() zusammen mit der Summe() Aggregationsfunktion, um die Tabellengröße basierend auf Datentypen und den jeweiligen Bytegrößen zu schätzen. Ein Beispiel finden Sie unter Verwenden von estimate_data_size().
Diese Methode bietet eine genauere Schätzung, indem die Bytegrößen numerischer Werte berücksichtigt werden, ohne sie als Zeichenfolgen zu formatieren. Ganzzahlwerte erfordern beispielsweise 4 Bytes, während lange und Datumstimewerte 8 Byte erfordern. Mit diesem Ansatz können Sie die Datengröße genau schätzen, die in den Arbeitsspeicher passt.
Beispielanwendungsfall: Ermitteln der Kosten einer Abfrage in Bezug auf zu scannende Bytes.
Kombinierte Größe mehrerer Tabellen
Sie können den Union--Operator zusammen mit dem estimate_data_size() und sum() Funktionen verwenden, um die kombinierte Größe mehrerer Tabellen in Bezug auf Zugriffsbytes zu schätzen. Ein Beispiel finden Sie unter Verwenden einer Vereinigung mit estimate_data_size().
Beispielanwendungsfall: Bewerten der Speicheranforderungen zum Konsolidieren von Daten aus mehreren Tabellen in einem einzelnen Dataset.
Anmerkung
Dieser Ansatz kann die geschätzte Datengröße aufgrund leerer Spalten vergrößern, da union
alle Spalten aus den angegebenen Tabellen kombiniert und estimate_data_size()
beim Berechnen der Datengröße leere Spalten berücksichtigt.
Beispiele
Verwenden von ".show"-Tabellendetails
Die folgende Abfrage schätzt die ursprüngliche Datengröße der StormEvents
Tabelle.
.show table StormEvents details
| project TotalOriginalSize
Ausgabe-
TotalOriginalSize |
---|
60192011 |
Trinkgeld
Um das Byteergebnis auf MB
, GB
oder eine andere Einheit zu formatieren, verwenden Sie format_bytes().
Verwenden von estimate_data_size()
Die folgende Abfrage schätzt die ursprüngliche Datengröße der StormEvents
Tabelle in Byte.
StormEvents
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
Ausgabe-
totalSize |
---|
58608932 |
Anmerkung
Die Ausgabe ist kleiner, obwohl die Berechnung über dieselbe Tabelle erfolgt. Dies liegt daran, dass diese Methode eine genauere Schätzung bietet, indem die Bytegrößen numerischer Werte berücksichtigt werden, ohne sie als Zeichenfolgen zu formatieren.
Vereinigung mit estimate_data_size() verwenden
Die folgende Abfrage schätzt die Datengröße basierend auf allen Tabellen in der Samples
-Datenbank.
union withsource=_TableName *
| extend sizeEstimateOfColumn = estimate_data_size(*)
| summarize totalSize=sum(sizeEstimateOfColumn)
| extend sizeGB = format_bytes(totalSize,2,"GB")
totalSize | sizeGB |
---|---|
1761782453926 | 1640,79 GB |