Förstå funktioner och användningsfall för Azure Synapse-serverlösa SQL-pooler

Slutförd

Azure Synapse Analytics är en integrerad analystjänst som samlar en mängd olika tekniker som används ofta för att bearbeta och analysera data i stor skala. En av de vanligaste teknikerna som används i datalösningar är SQL – ett branschstandardspråk för att fråga och manipulera data.

Serverlösa SQL-pooler i Azure Synapse Analytics

Azure Synapse SQL är ett distribuerat frågesystem i Azure Synapse Analytics som erbjuder två typer av körningsmiljöer:

  • Serverlös SQL-pool: SQL-frågebearbetning på begäran, som främst används för att arbeta med data i en datasjö.
  • Dedikerad SQL-pool: Relationsdatabasinstanser i företagsskala som används som värd för informationslager där data lagras i relationstabeller.

I den här modulen fokuserar vi på en serverlös SQL-pool, som tillhandahåller en pay-per-query-slutpunkt för att köra frågor mot data i datasjön. Fördelarna med att använda en serverlös SQL-pool är:

  • En välbekant Transact-SQL-syntax för att köra frågor mot data på plats utan att behöva kopiera eller läsa in data i ett specialiserat lager.
  • Integrerad anslutning från en mängd olika business intelligence- och ad hoc-frågeverktyg, inklusive de mest populära drivrutinerna.
  • Distribuerad frågebearbetning som är byggd för storskaliga data och beräkningsfunktioner , vilket resulterar i snabba frågeprestanda.
  • Inbyggd feltolerans för frågekörning, vilket resulterar i hög tillförlitlighet och framgång även för långvariga frågor som involverar stora datamängder.
  • Ingen infrastruktur att konfigurera eller kluster att underhålla. En inbyggd slutpunkt för den här tjänsten tillhandahålls i varje Azure Synapse-arbetsyta, så att du kan börja köra frågor mot data så snart arbetsytan har skapats.
  • Utan kostnad för reserverade resurser debiteras du endast för de data som bearbetas av frågor som du kör.

När du ska använda serverlösa SQL-pooler

Serverlös SQL-pool är skräddarsydd för att köra frågor mot data som finns i datasjön, så förutom att eliminera hanteringsbelastningen eliminerar den behovet av att oroa sig för att mata in data i systemet. Du pekar bara frågan på de data som redan finns i sjön och kör den.

Synapse SQL serverlös resursmodell är perfekt för oplanerade eller "bursty"-arbetsbelastningar som kan bearbetas med hjälp av den serverlösa SQL-slutpunkten i Azure Synapse Analytics-arbetsytan. Att använda den serverlösa poolen hjälper dig när du behöver veta den exakta kostnaden för varje fråga som körs för att övervaka och tillskriva kostnader.

Kommentar

Serverlös SQL-pool är ett analyssystem och rekommenderas inte för OLTP-arbetsbelastningar, till exempel databaser som används av program för att lagra transaktionsdata. Arbetsbelastningar som kräver svarstider på millisekunder och som vill hitta en enskild rad i en datauppsättning passar inte för serverlös SQL-pool.

Vanliga användningsfall för serverlösa SQL-pooler är:

  • Datautforskning: Datautforskning innebär att bläddra i datasjön för att få inledande insikter om data och är enkelt att uppnå med Azure Synapse Studio. Du kan bläddra igenom filerna i din länkade datasjölagring och använda den inbyggda serverlösa SQL-poolen för att automatiskt generera ett SQL-skript för att välja DE 100 översta raderna från en fil eller mapp precis som med en tabell i SQL Server. Därifrån kan du använda projektioner, filtrering, gruppering och merparten av åtgärden över data som om data fanns i en vanlig SQL Server-tabell.
  • Datatransformering: Även om Azure Synapse Analytics tillhandahåller fantastiska funktioner för datatransformering med Synapse Spark, kan vissa datatekniker tycka att datatransformeringen är enklare att uppnå med hjälp av SQL. Med en serverlös SQL-pool kan du utföra SQL-baserade datatransformeringar. antingen interaktivt eller som en del av en automatiserad datapipeline.
  • Logiskt informationslager: När du har utforskat data i datasjön kan du definiera externa objekt som tabeller och vyer i en serverlös SQL-databas. Data lagras fortfarande i data lake-filerna, men abstraheras av ett relationsschema som kan användas av klientprogram och analysverktyg för att fråga efter data som de skulle göra i en relationsdatabas som finns i SQL Server.