다음을 통해 공유


SQL Server 2022용 Azure Synapse Link 시작

이 문서는 SQL Server 2022용 Azure Synapse Link를 시작하기 위한 단계별 가이드입니다. 개요는 Azure Synapse Link for SQL Server 2022를 참조하세요.

필수 조건

  • 시작하기 전에 새 Azure Synapse 작업 영역을 만들기를 참조해 SQL용 Azure Synapse Link를 가져옵니다. 이 자습서는 공용 네트워크에서 SQL용 Azure Synapse Link를 만들기 위한 것입니다. 이 문서에서는 Azure Synapse 작업 영역을 만들 때 관리형 가상 네트워크 사용 안 함모든 IP 주소에서 연결 허용을 선택한 것으로 가정합니다. 네트워크 보안을 사용해 Azure Synapse Link for SQL Server 2022를 구성하려면 네트워크 보안을 사용하여 Azure Synapse Link for SQL Server 2022 구성을 참조하세요.

  • Azure Synapse Analytics 작업 영역을 사용하여 만든 계정과 다른 Azure Data Lake Storage Gen2 계정을 만듭니다. 이 계정을 랜딩 존으로 사용하여 SQL Server 2022가 제출한 데이터를 준비합니다. 자세한 내용은 Azure Data Lake Storage Gen2 계정 만들기를 참조하세요.

  • SQL Server 2022 데이터베이스에 마스터 키가 만들어져 있어야 합니다.

    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<a new password>'
    

대상 Azure Synapse SQL 전용 풀 만들기

  1. Synapse Studio를 엽니다.

  2. 관리 허브를 열고, SQL 풀로 이동한 다음 새로 만들기를 선택합니다.

    Synapse Studio에서 Azure Synapse SQL 전용 풀을 새로 만드는 방법을 보여주는 스크린샷

  3. 고유한 풀 이름을 입력하고, 기본 설정을 사용하고, 전용 풀을 만듭니다.

  4. 데이터 허브의 작업 영역에서 데이터베이스 아래에 새 Azure Synapse SQL 데이터베이스가 나열되어야 합니다. 새 Azure Synapse SQL 데이터베이스에서 새 SQL 스크립트를 선택한 다음 빈 스크립트를 선택합니다.

    Synapse Studio에서 비어 있는 새 SQL 스크립트를 만드는 방법을 보여주는 스크린샷

  5. 대상 Azure Synapse SQL 데이터베이스용 마스터 키를 만들려면 다음 스크립트를 붙여넣은 다음 을 선택합니다.

    CREATE MASTER KEY
    

원본 SQL Server 2022 데이터베이스에 연결된 서비스 만들기

  1. 관리 허브 단추를 선택한 다음, 연결된 서비스를 선택합니다.

    Synapse Studio에서 연결된 서비스로 이동합니다.

  2. 새로 만들기를 누르고, SQL Server를 선택한 다음, 계속을 선택합니다.

    SQL Server 연결된 서비스를 만드는 방법을 보여주는 스크린샷

  3. 이름 상자에 SQL Server 2022의 연결된 서비스 이름을 입력합니다.

    연결할 서버 및 데이터베이스 이름을 입력할 위치를 보여주는 스크린샷

    참고 항목

    레거시 버전의 연결된 서비스만 지원됩니다.

  4. 통합 런타임을 선택할 때 자체 호스팅 통합 런타임을 선택합니다. Azure Synapse 작업 영역에 사용 가능한 자체 호스팅 통합 런타임이 없는 경우 새로 만듭니다.

  5. (선택 사항) 자체 호스팅 통합 런타임을 만들어 원본 SQL Server 2022에 연결하려면 다음과 같이 합니다.

    a. 새로 만들기를 선택합니다.

    새 자체 호스팅 통합 런타임을 만드는 방법을 보여주는 스크린샷

    b. 자체 호스팅을 선택한 다음, 계속을 선택합니다.

    c. 이름 상자에 자체 호스팅 통합 런타임의 이름을 입력한 다음, , 만들기를 선택합니다.

    자체 호스팅 통합 런타임의 이름을 입력할 위치를 보여주는 스크린샷

    이제 Azure Synapse 작업 영역에서 자체 호스팅 통합 런타임을 사용할 수 있습니다.

    d. 프롬프트에 따라 키를 다운로드하고, 설치한 후, 키를 사용해 SQL Server 2022 인스턴스에 직접 액세스할 수 있는 Windows 머신에 통합 런타임 에이전트를 등록합니다. 자세한 내용은 자체 호스팅 통합 런타임 만들기 - Azure Data Factory 및 Azure Synapse를 참조하세요.

    통합 런타임을 다운로드, 설치 및 등록할 위치를 보여주는 스크린샷

    e. 닫기를 선택합니다.

    통합 런타임의 상태를 가져옵니다.

    f. 통합 런타임의 최신 상태를 가져오려면 모니터링 페이지로 가서 새로 고침을 선택하여 자체 호스팅 통합 런타임이 실행 중인지 확인합니다.

  6. SQL Server 이름, 데이터베이스 이름, 인증 형식, 사용자 이름암호를 포함해 연결된 서비스에 대한 나머지 정보를 계속 입력하여 SQL Server 2022 인스턴스에 연결합니다.

    참고 항목

    이 연결에서 암호화를 사용하도록 설정하는 것이 좋습니다. 이렇게 하려면 true 값을 가진 Encrypt 속성을 추가 연결 속성으로 추가합니다. 또한 서버 구성에 따라 Trust Server Certificate 속성을 true 또는 false로 설정합니다. 자세한 내용은 데이터베이스 엔진에 대해 암호화 연결 사용을 참조하세요.

  7. 자체 호스팅 통합 런타임이 SQL Server 인스턴스에 액세스할 수 있는지 확인하려면 연결 테스트를 선택합니다.

  8. 만들기를 실행합니다.

    새 연결된 서비스가 작업 영역에서 사용할 수 있는 SQL Server 2022 인스턴스에 연결됩니다.

    연결된 서비스 연결을 볼 위치를 보여주는 스크린샷

    참고 항목

    여기서 만드는 연결된 서비스는 SQL용 Azure Synapse Link 전용이 아닙니다. 적절한 권한이 있는 작업 영역 사용자는 누구나 사용할 수 있습니다. 시간을 갖고 이 연결된 서비스 및 해당 자격 증명에 액세스할 수 있는 사용자의 범위를 숙지하세요. Azure Synapse 작업 영역의 권한에 대한 자세한 내용은 Azure Synapse 작업 영역 액세스 제어 개요 - Azure Synapse Analytics를 참조하세요.

Azure Data Lake Storage Gen2의 랜딩 존에 연결하기 위한 연결된 서비스 만들기

  1. 새로 만든 Azure Data Lake Storage Gen2 계정으로 이동하고 액세스 제어(IAM)를 선택하고, 추가를 선택한 다음, 역할 할당 추가를 선택합니다.

    Data Lake Storage Gen2 계정의 'Access Control(IAM)' 창 스크린샷

  2. 선택한 역할에 대해 Storage Blob 데이터 기여자를 선택하고, 관리 ID를 선택한 다음, 구성원 아래에서 Azure Synapse 작업 영역을 선택합니다. 이 역할 할당을 추가하는 데 몇 분 걸릴 수 있습니다.

    역할 할당을 완료하는 방법을 보여주는 스크린샷

    참고 항목

    랜딩 존으로 사용되는 Azure Data Lake Storage Gen2 스토리지 계정에 Azure Synapse 작업 영역 관리 ID 권한을 부여해야 합니다. 자세한 내용은 Azure Synapse 작업 영역에서 관리 ID에 권한 부여 - Azure Synapse Analytics를 참조하세요.

  3. Azure Synapse 작업 영역에서 관리 허브를 열고, 연결된 서비스로 이동합니다.

    연결된 서비스로 이동하는 방법을 보여주는 스크린샷

  4. 새로 만들기를 선택한 다음, Azure Data Lake Storage Gen2를 선택합니다.

  5. 다음을 수행합니다.

    a. 이름 상자에 랜딩 존에 해당하는 연결된 서비스의 이름을 입력합니다.

    b. 인증 방법관리 ID를 입력합니다.

    c. 이미 만들어진 스토리지 계정 이름을 선택합니다.

  6. 연결 테스트를 선택하여 Azure Data Lake Storage Gen2 계정에 액세스할 수 있는지 확인합니다.

  7. 만들기를 실행합니다.

    새 연결된 서비스가 Azure Data Lake Storage Gen2 계정에 연결됩니다.

    Azure Data Lake Storage Gen2 연결된 새 서비스를 보여주는 스크린샷

    참고 항목

    여기서 만드는 연결된 서비스는 SQL용 Azure Synapse Link 전용이 아닙니다. 적절한 권한이 있는 작업 영역 사용자는 누구나 사용할 수 있습니다. 시간을 갖고 이 연결된 서비스 및 해당 자격 증명에 액세스할 수 있는 사용자의 범위를 숙지하세요. Azure Synapse 작업 영역의 권한에 대한 자세한 내용은 Azure Synapse 작업 영역 액세스 제어 개요 - Azure Synapse Analytics를 참조하세요.

  1. Synapse Studio에서 허브 통합을 엽니다.

  2. 통합 창에서 더하기 기호(+)를 선택한 다음 링크 연결을 선택합니다.

    ‘링크 연결’ 단추를 보여주는 스크린샷

  3. 다음과 같이 원본 데이터베이스를 입력합니다.

    a. 원본 유형SQL Server를 선택합니다.

    b, 원본 연결된 서비스로 SQL Server 2022 인스턴스에 연결하는 서비스를 선택합니다.

    c. 테이블 이름은 Azure Synapse SQL 풀에 복제할 SQL Server 인스턴스의 이름을 선택합니다.

    d. 계속을 선택합니다.

    원본 데이터베이스 세부 정보를 입력할 위치를 보여주는 스크린샷

  4. Synapse SQL 전용 풀에서 대상 데이터베이스 이름을 선택합니다.

  5. 계속을 선택합니다.

  6. 다음과 같이 링크 연결 설정을 입력합니다.

    a. 링크 연결 이름에 이름을 입력합니다.

    b. 링크 연결 컴퓨팅코어 수에 코어 수를 입력합니다. 이러한 코어는 원본에서 대상으로 데이터를 이동하는 데 사용됩니다. 적은 수로 시작하고 필요에 따라 수를 늘리는 것이 좋습니다.

    c. 연결된 서비스는 랜딩 존에 연결할 서비스를 선택합니다.

    d. 데이터 스테이징을 위한 랜딩 존 폴더 경로로 Azure Data Lake Storage Gen2 컨테이너 이름 또는 컨테이너/폴더 이름을 입력합니다. 컨테이너를 먼저 만들어야 합니다.

    e. Azure Data Lake Storage Gen2 공유 액세스 서명 토큰을 입력합니다. SQL 변경 피드가 랜딩 존에 액세스하려면 이 토큰이 필요합니다. Azure Data Lake Storage Gen2 계정에 공유 액세스 서명 토큰이 없는 경우 토큰 생성을 선택하여 만들면 됩니다.

    f. 확인을 선택합니다.

    링크 연결 설정을 입력할 위치를 보여주는 스크린샷

    참고 항목

    여기서 선택하는 코어 수가 데이터 로드 및 변경 내용을 처리하기 위한 수집 서비스에 할당됩니다. 대상 전용 SQL 풀 구성에는 영향을 주지 않습니다. 스토리지의 제한으로 인해 생성된 SAS 토큰을 사용하여 랜딩 존에 연결할 수 없는 경우 위임 SAS 토큰을 사용하여 랜딩 존에 연결할 수도 있습니다.

  7. 새로운 Azure Synapse Link 연결이 열려 있으므로 이제 대상 테이블 이름, 배포 형식 및 구조 형식을 업데이트할 수 있습니다.

    참고 항목

    • 데이터에 varchar(max), nvarchar(max) 및 varbinary(max)가 포함된 경우 구조 형식에 힙 테이블을 사용해볼 것을 고려해보세요.
    • 링크 연결을 시작하기 전에 Azure Synapse SQL 전용 풀에 스키마가 만들어져 있는지 확인합니다. SQL용 Azure Synapse Link는 Azure Synapse SQL 풀의 스키마 아래에 자동으로 테이블을 만듭니다.
  8. 기존 대상 테이블에 대한 작업 드롭다운 목록에서 테이블이 대상에 이미 있는 경우 시나리오에 가장 적합한 옵션을 선택합니다.

    • 테이블 삭제 및 다시 만들기: 기존 대상 테이블이 삭제되고 다시 만들어집니다.
    • 비어 있지 않은 테이블에서 실패: 대상 테이블에 데이터가 포함되어 있는 경우 지정된 테이블의 링크 연결이 실패합니다.
    • 기존 데이터와 병합: 기존 테이블로 데이터가 병합됩니다.

    참고 항목

    "기존 데이터와 병합”을 선택하여 여러 원본을 동일한 대상으로 병합하려는 경우, 충돌 및 예기치 않은 결과를 피하려면 원본에 서로 다른 데이터가 포함되어 있는지 확인합니다.

  9. 테이블 간에 트랜잭션 일관성 유지를 사용할지 여부를 지정합니다.

    • 이 옵션을 사용하도록 설정하면 원본 데이터베이스의 여러 테이블에 걸쳐 있는 트랜잭션이 항상 단일 트랜잭션에서 대상 데이터베이스에 복제됩니다. 그러나 이렇게 하면 전체 복제 처리량에 오버헤드가 발생합니다.
    • 옵션을 사용하지 않도록 설정하면 각 테이블은 자체 트랜잭션 경계의 변경 내용을 병렬 연결로 대상에 복제하므로 전반적인 복제 처리량이 향상됩니다.

    참고 항목

    테이블 간에 트랜잭션 일관성을 사용하도록 설정하려면 Synapse 전용 SQL 풀의 트랜잭션 격리 수준이 READ COMMITTED SNAPSHOT ISOLATION인지도 확인합니다.

  10. 서비스에 대한 새 링크 연결을 저장하려면 모두 게시를 선택합니다.

시작을 선택한 다음, 데이터가 복제될 때까지 몇 분 기다립니다.

참고 항목

링크 연결은 원본 데이터베이스의 전체 초기 로드에서 시작한 다음, SQL Server 2022의 변경 피드 기능을 통한 증분 변경 피드에서 시작됩니다. 자세한 내용은 SQL 변경 피드용 Azure Synapse Link를 참조하세요.

Azure Synapse Link 연결 상태를 모니터링하고, 처음에 복사되는 테이블(스냅샷 생성)을 확인하고, 연속 복제 모드(복제)에 있는 테이블을 확인할 수 있습니다.

  1. Azure Synapse 작업 영역의 모니터 허브로 이동한 다음 링크 연결을 선택합니다.

  2. 시작한 링크 연결을 열고 각 테이블의 상태를 봅니다.

  3. 연결에 대한 모니터링 보기에서 새로 고침을 선택하여 상태 업데이트를 관찰합니다.

    링크된 연결을 모니터링합니다.

복제된 데이터 쿼리

몇 분 기다린 후에, 대상 데이터베이스에 예상 테이블과 데이터가 있는지 확인합니다. Azure Synapse SQL 전용 풀 대상 저장소에서 사용 가능한 데이터를 확인합니다. 이제 대상 Azure Synapse SQL 전용 풀에서 복제된 테이블을 탐색할 수도 있습니다.

  1. 데이터 허브의 작업 영역에서 대상 데이터베이스를 엽니다.

  2. 테이블 아래에서 대상 테이블 중 하나를 마우스 오른쪽 단추로 클릭합니다.

  3. 새 SQL 스크립트를 선택한 다음, 상위 100개 행 선택을 선택합니다.

  4. 대상 Azure Synapse SQL 전용 풀에서 복제된 데이터를 보려면 이 쿼리를 실행합니다.

  5. Microsoft SQL Server Management Studio(SSMS) 또는 기타 도구를 사용하여 대상 데이터베이스를 쿼리할 수도 있습니다. 작업 영역의 SQL 전용 엔드포인트를 서버 이름으로 사용합니다. 이 이름은 보통 <workspacename>.sql.azuresynapse.net입니다. SSMS 또는 다른 도구를 통해 연결할 때 추가 연결 문자열 매개 변수로 Database=databasename@poolname을 추가합니다.

Synapse Studio에서 테이블을 추가하거나 제거하려면 다음을 수행합니다.

  1. Azure Synapse 작업 영역에서 통합 허브를 엽니다.

  2. 편집하려는 링크 연결을 선택하고 엽니다.

  3. 다음 중 하나를 수행합니다.

    • 테이블을 추가하려면 새 테이블을 선택합니다.
    • 테이블을 제거하려면 그 옆에 있는 휴지통 아이콘을 선택합니다.

    테이블을 추가하거나 제거하기 위한 링크 연결 창의 스크린샷

    참고 항목

    링크 연결이 실행 중일 때 테이블을 직접 추가하거나 제거할 수 있습니다.

Synapse Studio에서 Azure Synapse Link 연결을 중지하려면 다음과 같이 합니다.

  1. Azure Synapse 작업 영역에서 통합 허브를 엽니다.

  2. 편집하려는 링크 연결을 선택하고 엽니다.

  3. 중지를 선택하여 링크 연결을 중지하면 데이터 복제가 중지됩니다.

    링크 연결을 중지하기 위한 창의 스크린샷

    참고 항목

    • 링크 연결을 중지한 후 다시 시작하면 원본 데이터베이스의 전체 초기 로드에서 시작하고 이후 증분 변경 피드가 이어집니다.
    • 기존 대상 테이블에 대한 작업으로 "기존 데이터와 병합"을 선택한 경우, 링크 연결을 중지했다가 다시 시작하면 해당 기간 동안 원본에서 삭제된 레코드는 대상에서 삭제되지 않습니다. 이러한 경우 데이터 일관성을 보장하려면 중지/시작 대신 일시 중지/재시작을 사용하거나 링크 연결을 다시 시작하기 전에 대상 테이블을 정리하는 것이 좋습니다.

랜딩 존에 대한 공유 액세스 서명 토큰 회전

SQL 변경 피드가 랜딩 존에 액세스하여 데이터를 푸시하려면 공유 액세스 서명 토큰이 필요합니다. 만료일이 있으므로 만료일 전에 토큰을 회전해야 합니다. 안 그러면 Azure Synapse Link가 SQL Server 인스턴스에서 Azure Synapse SQL 전용 풀로 데이터를 복제하지 못합니다.

  1. Azure Synapse 작업 영역에서 통합 허브를 엽니다.

  2. 편집하려는 링크 연결을 선택하고 엽니다.

  3. 토큰 회전을 선택합니다.

    공유 액세스 서명 토큰을 회전할 위치를 보여주는 스크린샷

  4. 새 공유 액세스 서명 토큰을 얻으려면 자동으로 생성 또는 수동으로 입력을 선택한 다음 확인을 선택합니다.

    새 공유 액세스 서명 토큰을 가져오는 방법을 보여주는 스크린샷

    참고 항목

    스토리지의 제한으로 인해 생성된 SAS 토큰을 사용하여 랜딩 존에 연결할 수 없는 경우 위임 SAS 토큰을 사용하여 랜딩 존에 연결할 수도 있습니다.

다음 단계

SQL Server 2022 이외의 데이터베이스를 사용하는 경우는 다음을 참조하세요.