서버리스 SQL 풀을 사용하여 데이터 분석
이 자습서에서는 서버리스 SQL 풀로 데이터를 분석하는 방법을 알아봅니다.
기본 제공 서버리스 SQL 풀
서버리스 SQL 풀을 사용하면 용량을 예약하지 않고도 SQL을 사용할 수 있습니다. 서버리스 SQL 풀에 대한 요금 청구는 쿼리를 실행하는 데 사용된 노드 수가 아니라 쿼리를 실행하는 데 처리된 데이터 양을 기준으로 합니다.
모든 작업 영역에는 기본 제공이라는 미리 구성된 서버리스 SQL 풀이 제공됩니다.
서버리스 SQL 풀을 사용하여 NYC Taxi 데이터 분석
참고 항목
샘플 데이터를 기본 스토리지 계정에 배치했는지 확인합니다.
Synapse Studio에서 개발 허브로 이동합니다.
새 SQL 스크립트를 만듭니다.
다음 코드를 스크립트에 붙여 넣습니다. (
contosolake
를 스토리지 계정 이름으로,users
를 컨테이너 이름으로 업데이트합니다.)SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
실행을 선택합니다.
데이터 탐색은 데이터의 기본 특성을 이해할 수 있는 간단한 시나리오일 뿐입니다. 이 자습서에서 데이터 탐색 및 분석에 대해 자세히 알아보세요.
데이터 탐색 데이터베이스 만들기
master
데이터베이스를 통해 직접 파일의 내용을 찾아볼 수 있습니다 . 몇 가지 간단한 데이터 탐색 시나리오에서는 별도의 데이터베이스를 만들 필요가 없습니다.
그러나 데이터 탐색을 계속하면서 다음과 같은 몇 가지 유틸리티 개체를 만들 수 있습니다.
- 스토리지 계정에 대한 명명된 참조를 나타내는 외부 데이터 원본입니다.
- 외부 데이터 원본에 인증하는 방법을 지정할 수 있는 데이터베이스 범위 자격 증명입니다.
- 일부 데이터 원본 또는 데이터베이스 개체에 액세스할 권한이 있는 데이터베이스 사용자입니다.
- 쿼리에서 사용할 수 있는 유틸리티 뷰, 프로시저 및 함수입니다.
master
데이터베이스를 사용하여 사용자 지정 데이터베이스 개체에 대한 별도의 데이터베이스를 만듭니다.master
데이터베이스에서 사용자 지정 데이터베이스 개체를 만들 수 없습니다.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
Important
_UTF8
접미사를 포함하는 데이터 정렬을 사용하여 UTF-8 텍스트가VARCHAR
열로 올바르게 변환되도록 합니다.Latin1_General_100_BIN2_UTF8
은 Parquet 파일 및 Azure Cosmos DB 컨테이너에서 데이터를 읽는 쿼리에 최상의 성능을 제공합니다. 정렬 변경에 대한 자세한 내용은 Synapse SQL에 지원되는 정렬 형식을 참조하세요.다음 명령을 사용하여
master
에서DataExplorationDB
로 데이터베이스 컨텍스트를 전환합니다. UI 컨트롤 use database를 사용하여 현재 데이터베이스를 전환할 수도 있습니다.USE DataExplorationDB
DataExplorationDB
에서 자격 증명 및 데이터 원본과 같은 유틸리티 개체를 만듭니다.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
참고 항목
외부 데이터 원본은 자격 증명 없이 만들 수 있습니다. 자격 증명이 없는 경우 호출자의 ID는 외부 데이터 원본에 액세스하는 데 사용됩니다.
필요에 따라 새로 만든
DataExplorationDB
데이터베이스를 사용하여 외부 데이터에 액세스하는DataExplorationDB
의 사용자에 대한 로그인을 만듭니다.CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
그런 다음, 위의 로그인을 위해
DataExplorationDB
에 데이터베이스 사용자를 만들고ADMINISTER DATABASE BULK OPERATIONS
권한을 부여합니다.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
상대 경로 및 데이터 원본을 사용하여 파일의 내용을 탐색합니다.
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
작업 영역에 변경 내용을 게시합니다.
데이터 탐색 데이터베이스는 유틸리티 개체를 저장할 수 있는 간단한 자리 표시자일 뿐입니다. Synapse SQL 풀을 사용하면 훨씬 더 많은 작업을 수행하고, Azure 데이터 원본을 기반으로 구축된 관계형 계층인 Logical Data Warehouse를 만들 수 있습니다. 이 자습서에서 Logical Data Warehouse 구축에 대해 자세히 알아보세요.