Obsługa wariantów w usłudze Delta Lake
Ważne
Ta funkcja jest dostępna w publicznej wersji zapoznawczej.
Możesz użyć VARIANT
typu danych do przechowywania częściowo ustrukturyzowanych danych w usłudze Delta Lake. Przykłady pracy z usługą VARIANT
można znaleźć w temacie Query variant data (Wykonywanie zapytań dotyczących danych wariantów).
Aby odczytywać i zapisywać tabele z obsługą wariantów, należy użyć środowiska Databricks Runtime w wersji 15.3 lub nowszej.
Włączanie wariantu w tabeli delty
Aby włączyć wariant, utwórz nową tabelę z kolumną VARIANT
typu, na przykład:
CREATE TABLE table_name (variant_column VARIANT)
Obsługę istniejącej tabeli można również włączyć VARIANT
przy użyciu następującej składni:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Ostrzeżenie
Po włączeniu typu danych VARIANT protokół tabeli zostanie uaktualniony. Po uaktualnieniu tabela nie będzie czytelna dla klientów usługi Delta Lake, którzy nie obsługują typu danych VARIANT. Zobacz artykuł Jak usługa Azure Databricks zarządza zgodnością funkcji usługi Delta Lake?.
Ograniczenia
Istnieją następujące ograniczenia:
- Nie można używać kolumn wariantów do partycjonowania tabeli.
- Kolumna wariantu nie może być kluczem klastrowania dla tabeli.
- Nie można używać kolumn wariantów z klauzulami
GROUP BY
aniORDER BY
. - Nie można wywołać
DISTINCT
w kolumnie typu wariantowego. - Nie można używać operatorów zestawu SQL (
INTERSECT
,UNION
,EXCEPT
) z kolumnami wariantów. - Nie można użyć generowania kolumn, aby utworzyć kolumnę wariantu.
- Funkcja Delta nie zbiera
minValues
animaxValues
statystyk dla kolumn wariantów.