Implementierung von Zeilenkomprimierung
In diesem Thema wird zusammengefasst, wie Database Engine (Datenbankmodul) Zeilenkomprimierung implementiert. Diese Zusammenfassung enthält grundlegende Informationen, die Ihnen bei der Planung des Speicherplatzes helfen, den Sie für Ihre Daten benötigten.
Durch die Aktivierung der Komprimierung wird nur das physische Speicherformat der Daten eines bestimmten Datentyps geändert, jedoch nicht deren Syntax oder Semantik. Änderungen der Anwendung sind nicht erforderlich, wenn eine oder mehrere Tabellen für die Komprimierung aktiviert werden. Das neue Datensatzspeicherformat bewirkt die folgenden wichtigen Änderungen:
Es verringert den mit dem Datensatz verbundenen Metadaten-Overhead. Diese Metadaten umfassen Informationen zu Spalten, deren Längen und Offsets. In einigen Fällen ist der Metadaten-Overhead möglicherweise größer als das alte Speicherformat.
Es verwendet ein Speicherformat variabler Länge für numerische Datentypen (z. B. integer, decimal und float) und die Datentypen, die auf numerischen Werten basieren (z. B. datetime und money).
Es speichert feste Zeichenfolgen in einem Format variabler Länge, ohne die Leerzeichen zu speichern.
Hinweis |
---|
NULL- und 0-Werte werden für alle Datentypen optimiert und beanspruchen keine Bytes. |
Wie Zeilenkomprimierung den Speicherplatz beeinflusst
Die folgende Tabelle beschreibt, wie Zeilenkomprimierung die vorhandenen Typen in SQL Server beeinflusst. Die Tabelle schließt nicht die Speicherplatzersparnis ein, die mit Seitenkomprimierung erreicht werden kann.
Datentyp |
Wird der Speicherplatz beeinflusst? |
Beschreibung |
---|---|---|
tinyint |
Nein |
1 Byte ist der minimal benötigte Speicherplatz. |
smallint |
Ja |
Wenn 1 Byte für den Wert ausreicht, wird nur 1 Byte verwendet. |
int |
Ja |
Verwendet nur so viele Bytes wie nötig. Wenn ein Wert z. B. in 1 Byte gespeichert werden kann, wird nur 1 Byte Speicherplatz belegt. |
bigint |
Ja |
Verwendet nur so viele Bytes wie nötig. Wenn ein Wert z. B. in 1 Byte gespeichert werden kann, wird nur 1 Byte Speicherplatz belegt. |
decimal |
Ja |
Dieser Speicherplatz entspricht genau dem vardecimal-Speicherformat. Weitere Informationen finden Sie unter Speichern von Dezimaldaten als Daten variabler Länge. |
numeric |
Ja |
Dieser Speicherplatz entspricht genau dem vardecimal-Speicherformat. Weitere Informationen finden Sie unter Speichern von Dezimaldaten als Daten variabler Länge. |
bit |
Ja |
Der Metadaten-Overhead benötigt 4 Bits. |
smallmoney |
Ja |
Verwendet die Datendarstellung mit ganzen Zahlen mit einer 4 Bytes langen ganzen Zahl. Der Währungswert wird mit 10000 multipliziert, und nachdem alle Stellen nach dem Dezimalkomma entfernt wurden, wird der resultierende ganzzahlige Wert gespeichert. Die Speicheroptimierung dieses Typs ähnelt der für ganzzahlige Typen. |
money |
Ja |
Verwendet die Datendarstellung mit ganzen Zahlen mit einer 8 Bytes langen ganzen Zahl. Der Währungswert wird mit 10000 multipliziert und nachdem alle Stellen nach dem Dezimalkomma entfernt wurden, wird der resultierende ganzzahlige Wert gespeichert. Dieser Typ hat einen größeren Bereich als smallmoney. Die Speicheroptimierung dieses Typs ähnelt der für ganzzahlige Typen. |
float |
Ja |
Geringwertige Bytes mit Nullen werden nicht gespeichert. Die float-Komprimierung eignet sich hauptsächlich für nicht gebrochene Werte in Mantissen. |
real |
Ja |
Geringwertige Bytes mit Nullen werden nicht gespeichert. Die real-Komprimierung eignet sich hauptsächlich für nicht gebrochene Werte in Mantissen. |
smalldatetime |
Nein |
Verwendet die Datendarstellung mit ganzen Zahlen mit 2 Bytes langen ganzen Zahlen. Das Datum benötigt 2 Bytes. Das Datum ist die Anzahl der Tage seit dem 1.1.1901. Es benötigt 2 Bytes ab 1902. Deshalb gibt es keine Speicherplatzersparnis nach diesem Punkt. Die Zeit ist die Anzahl von Minuten seit Mitternacht. Zeitwerte, die geringfügig nach 4:00 Uhr liegen, verwenden das zweite Byte. Wenn ein smalldatetime nur für die Darstellung eines Datums verwendet wird (geschieht häufig), ist die Zeit 0.0. Mit der Komprimierung werden 2 Bytes gespart, indem die Zeit im höchstwertigen Byteformat für Zeilenkomprimierung gespeichert wird. |
datetime |
Ja |
Verwendet die Datendarstellung mit ganzen Zahlen mit 4 Bytes langen ganzen Zahlen. Der ganzzahlige Wert stellt die Anzahl von Tagen mit dem Basisdatum 1.1.1900 dar. Die ersten 2 Bytes können die Jahre bis 2079 darstellen. Mit der Komprimierung können hier bis zu diesem Punkt immer 2 Bytes gespart werden. Jeder ganzzahlige Wert stellt 3,33 Millisekunden dar. Die Komprimierung schöpft die ersten 2 Bytes in den ersten fünf Minuten aus und benötigt das vierte Byte nach 16:00 Uhr. Deshalb wird mit der Komprimierung nach 16:00 Uhr nur 1 Byte gespart. Wenn datetime wie jede andere ganze Zahl komprimiert wird, werden mit der Komprimierung 2 Bytes beim Datum gespart. |
date |
Nein |
Verwendet die Datendarstellung mit ganzen Zahlen mit 3 Bytes. Dies stellt das Datum ab 1.1.0001 dar. Für heutige Datumsangaben verwendet die Zeilenkomprimierung alle 3 Bytes. Dadurch wird keine Speicherplatzersparnis erreicht. |
time |
Nein |
Verwendet die Datendarstellung mit ganzen Zahlen mit 3 bis 6 Bytes. Es gibt verschiedene Genauigkeiten, die mit 0 bis 9 beginnen, die 3 bis 6 Bytes benötigen können. Komprimierter Speicherplatz wird folgendermaßen verwendet:
Bei der Zeilenkomprimierung ergibt sich keine Änderung des Speicherplatzes. Allgemein ist bei der Komprimierung des time-Datentyps keine große Speicherplatzersparnis zu erwarten. |
datetime2 |
Ja |
Verwendet die Datendarstellung mit ganzen Zahlen mit 6 bis 9 Bytes. Die ersten 4 Bytes stellen das Datum dar. Die Anzahl der von der Zeit in Anspruch genommenen Bytes hängt von der Genauigkeit der Zeit ab, die angegeben wird. Der ganzzahlige Wert stellt die Anzahl von Tagen ab dem 1.1.0001 mit der Obergrenze 31.12.9999 dar. Die Komprimierung nimmt 3 Bytes ein, um ein Datum im Jahr 2005 darzustellen. Bei der Zeit gibt es keine Speicherplatzersparnis, da hier 2 bis 4 Bytes für verschiedene Zeitgenauigkeiten zulässig sind. Deshalb verwendet die Komprimierung für eine Zeitgenauigkeit von einer Sekunde 2 Bytes für die Zeit, wobei das zweite Byte nach 255 Sekunden genommen wird. |
datetimeoffset |
Ja |
Ähnelt datetime2 mit Ausnahme der vorhandenen 2 Bytes für die Zeitzone mit dem Format (HH:MM). Wie bei datetime2 können mit der Komprimierung 2 Bytes gespart werden. Für Zeitzonenwerte ist der MM-Wert in den meisten Fällen möglicherweise 0. Deshalb kann mit der Komprimierung möglicherweise 1 Byte gespart werden. Bei der Zeilenkomprimierung ändert sich der Speicherplatz nicht. |
char |
Ja |
Nachfolgende Leerstellenzeichen werden entfernt. Beachten Sie, dass Database Engine (Datenbankmodul) unabhängig von der verwendeten Sortierung immer dasselbe Leerstellenzeichen einfügt. |
varchar |
Nein |
Keine Auswirkung. |
text |
Nein |
Keine Auswirkung. |
nchar |
Ja |
Nachfolgende Leerstellenzeichen werden entfernt. Beachten Sie, dass Database Engine (Datenbankmodul) unabhängig von der verwendeten Sortierung immer dasselbe Leerstellenzeichen einfügt. |
nvarchar |
Nein |
Keine Auswirkung. |
ntext |
Nein |
Keine Auswirkung. |
binary |
Ja |
Nachfolgende Nullen werden entfernt. |
varbinary |
Nein |
Keine Auswirkung. |
image |
Nein |
Keine Auswirkung. |
cursor |
Nein |
Keine Auswirkung. |
timestamp / rowversion |
Ja |
Verwendet die Datendarstellung mit ganzen Zahlen mit 8 Bytes. Es gibt für jede Datenbank einen Zeitstempelzähler, dessen Wert bei 0 beginnt. Dieser Wert kann wie jeder andere ganzzahlige Wert komprimiert werden. |
sql_variant |
Nein |
Keine Auswirkung. |
uniqueidentifier |
Nein |
Keine Auswirkung. |
table |
Nein |
Keine Auswirkung. |
xml |
Nein |
Keine Auswirkung. |
Benutzerdefinierte Typen |
Nein |
Dies wird intern als varbinary dargestellt. |
FILESTREAM |
Nein |
Dies wird intern als varbinary dargestellt. |
Siehe auch