다음을 통해 공유


Snowflake 데이터의 데이터 품질

Snowflake 데이터 원본을 검사할 때 Microsoft Purview는 다음을 지원합니다.

다음을 포함한 기술 메타데이터 추출:

  • 열, 열, 외장 키 및 고유 제약 조건을 포함한 뷰를 포함하는 서버, 데이터베이스, 스키마 및 테이블
  • 매개 변수 데이터 세트 및 결과 집합을 포함한 저장 프로시저
  • 매개 변수 데이터 세트를 포함한 함수
  • 열을 포함한 파이프, 스테이지 및 스트림
  • 작업 및 시퀀스

Microsoft Purview에서 Snowflake 데이터를 카탈로그화하도록 데이터 맵 검사 구성

Snowflake 원본 등록

통합 카탈로그 새 Snowflake 소스를 등록하려면 다음 단계를 수행합니다.

  • Microsoft Purview 거버넌스 포털에서 Microsoft Purview 계정으로 이동합니다.
  • 왼쪽 탐색 영역에서 데이터 맵을 선택합니다.
  • 등록 선택
  • 원본 등록에서 Snowflake를 선택합니다.

데이터 맵 검사 설정

  • 등록된 Snowflake 소스를 선택합니다.
  • + 새 검사를 선택합니다.
  • 아래 세부 정보를 제공합니다.
    • 이름: 검사의 이름
    • 통합 런타임을 통해 연결: 시나리오에 따라 Azure 자동 해결 통합 런타임, 관리형 VNet IR 또는 SHIR을 선택합니다.
    • 연결 호스트: 스캔하는 동안 Snowflake에 대한 연결을 설정하는 데 사용되는 엔드포인트를 선택합니다. 서버 URL 또는 데이터 원본에서 구성한 다른 호스트 중에서 선택할 수 있습니다.
    • 자격 증명: 자격 증명을 선택하여 데이터 원본에 연결합니다. 다음을 수행해야 합니다.
      • 자격 증명을 만드는 동안 기본 인증을 선택합니다.
      • 사용자 이름 입력 필드에서 Snowflake에 연결하는 데 사용되는 사용자 이름을 제공합니다.
      • Snowflake에 연결하는 데 사용되는 사용자 암호를 비밀 키에 저장합니다.
    • 웨어하우스: 대문자에서 검사를 강화하는 데 사용되는 instance 웨어하우스의 이름을 지정합니다. 자격 증명에 지정된 사용자에게 할당된 기본 역할에는 이 웨어하우스에 대한 USAGE 권한이 있어야 합니다.
    • 데이터베이스: 대문자로 가져올 데이터베이스 instance 이름을 하나 이상 지정합니다. 목록의 이름을 세미콜론(;))으로 구분합니다. 예를 들어 DB1; DB2. 자격 증명에 지정된 사용자에게 할당된 기본 역할은 데이터베이스 개체에 대한 적절한 권한이 있어야 합니다.
    • 스키마: 세미콜론으로 구분된 목록으로 표현되는 가져올 스키마의 하위 집합을 나열합니다.
  • 연결 테스트를 선택하여 설정의 유효성을 검사합니다(Azure Integration Runtime 사용할 때 사용 가능).
  • 계속을 선택합니다.
  • 분류에 대한 검사 규칙 집합을 선택합니다. 시스템 기본값, 기존 사용자 지정 규칙 집합 중에서 선택하거나 인라인으로 새 규칙 집합을 만들 수 있습니다.
  • 검사를 검토하고 저장 및 실행을 선택합니다.

스캔한 후 Snowflake의 데이터 자산은 통합 카탈로그 검색에서 사용할 수 있습니다. Microsoft Purview에서 Snowflake를 연결하고 관리하는 방법에 대한 자세한 내용은 이 문서를 참조하세요.

중요

개체가 데이터 원본에서 삭제되면 현재 후속 검사에서 Microsoft Purview에서 해당 자산을 자동으로 제거하지 않습니다.

데이터 품질 검사를 위해 Snowflake 데이터 원본에 대한 연결 설정

이 시점에서 검사된 자산은 카탈로그화 및 거버넌스에 사용할 준비가 되어 있습니다. 검사된 자산을 거버넌스 도메인 Sele의 데이터 제품에 연결합니다. 데이터 품질 탭에서 새 Azure SQL 데이터베이스 연결: 수동으로 입력한 데이터베이스 이름 가져오기를 추가합니다.

  1. 데이터 품질 > 거버넌스 도메인 > 관리 탭을 선택하여 연결을 만듭니다.

    연결 페이지 탐색을 보여 주는 스크린샷

  2. 연결 페이지에서 연결을 구성합니다.

    • 연결 이름 및 설명 추가
    • 원본 유형 Snowflake 선택
    • 서버 이름, 웨어하우스 이름, 데이터베이스 이름, 스키마 이름 및 테이블 이름 추가
    • 인증 방법 선택 - 기본 인증
    • 사용자 이름 추가
    • 자격 증명 추가
      • Azure 구독 추가
      • 키 자격 증명 모음 연결
      • 비밀 이름
      • 비밀 버전
  3. 연결을 테스트하여 구성된 연결이 성공적으로 설정되었는지 확인합니다.

    snowflake 연결을 설정하는 방법을 보여 주는 스크린샷

    Snowflake 연결 토큰을 구성하는 방법을 보여 주는 스크린샷

중요

  • 데이터 품질 관리자는 데이터 품질 연결을 설정하기 위해 Snowflake에 대한 읽기 전용 액세스 권한이 필요합니다.
  • vNet은 Snowflake 데이터 원본에 대해 아직 지원되지 않습니다.
  • Snowflake 커넥터는 https:// 허용하지 않습니다. 데이터 원본 연결을 구성하기 위해 서버 이름을 추가할 때 https:// 제거합니다.

Snowflake의 데이터에 대한 프로파일링 및 데이터 품질 검사

연결 설정이 성공적으로 완료되면 Snowflake에서 데이터를 프로파일하고, 만들고, 적용하고, 데이터의 DQ 검사를 실행할 수 있습니다. 아래 문서에 설명된 단계별 지침을 따릅니다.

참조 문서