Lakehouse 배포 파이프라인 및 git 통합(미리 보기)
Lakehouse는 Microsoft Fabric의 수명 주기 관리 기능과 통합되어 제품 수명 동안 모든 개발 팀 구성원 간에 표준화된 협업을 제공합니다. 수명 주기 관리는 기능 및 버그 수정을 여러 환경에 지속적으로 제공하여 효과적인 제품 버전 관리 및 릴리스 프로세스를 용이하게 합니다. 자세한 내용은 Microsoft Fabric에서 수명 주기 관리란?을 참조하세요.
Important
이 기능은 미리 보기로 제공됩니다.
Lakehouse git 통합
Lakehouse는 작업 영역의 여러 개체에서 참조되는 메타데이터와 데이터를 모두 포함하는 항목입니다. Lakehouse에는 테이블, 폴더 및 바로 가기가 관리 가능한 기본 데이터 컨테이너 항목으로 포함됩니다. 개발 워크플로 관점에서 다음 종속 개체는 Lakehouse를 참조할 수 있습니다.
- 데이터 흐름 및 데이터 파이프라인
- Spark 작업 정의
- Notebooks
- 의미 체계 모델 및 Power BI
기본 의미 체계 모델 및 SQL 분석 엔드포인트 메타데이터는 Lakehouse와 관련이 있으며 기본적으로 git 업데이트 프로세스에서 관리됩니다. 원칙 데이터는 git에서 추적되지 않으므로 메타데이터만 추적됩니다.
Git 표현
다음 Lakehouse 정보는 git 연결된 작업 영역에서 직렬화되고 추적됩니다.
- 표시 이름
- 설명
- 논리적 GUID
참고 항목
추적된 논리 GUID는 항목과 해당 소스 제어 표현을 나타내는 자동으로 생성된 작업 영역 간 식별자입니다.
Important
현재 환경에서는 Lakehouse 컨테이너 아티팩트만 git에서 추적됩니다. 테이블, 폴더, 바로 가기 및 기타 메타데이터 변경 내용은 git에서 추적 및 버전 관리되지 않습니다.
Lakehouse git 통합 기능
다음과 같은 기능을 사용할 수 있습니다.
- Lakehouse 개체 메타데이터를 git JSON 표현으로 직렬화합니다.
- 변경 내용을 직접 적용하거나 끌어오기 요청을 사용하여 업스트림 또는 다운스트림 작업 영역 및 분기에 대한 변경 내용을 제어합니다.
- Lakehouse 이름 바꾸기는 git에서 추적됩니다. 이름이 바뀐 Lakehouse를 업데이트하면 기본 의미 체계 데이터 모델 및 SQL Analytics 엔드포인트의 이름도 바뀝니다.
- 테이블, 폴더 및 바로 가기, 메타데이터 및 해당 항목의 데이터에는 작업이 항상 적용되지 않습니다.
배포 파이프라인의 Lakehouse
Lakehouse는 Microsoft Fabric 수명 주기 관리 배포 파이프라인에서 지원됩니다. 이를 통해 환경 세분화 모범 사례를 사용할 수 있습니다.
Lakehouse 배포 파이프라인 통합 기능.
개발, 테스트 및 프로덕션 작업 영역에서 배포합니다.
Lakehouse는 배포 시 종속 개체로 제거할 수 있습니다. 배포 파이프라인 컨텍스트 내에서 다른 Lakehouse 매핑도 지원됩니다.
배포 파이프라인 구성 중에 아무것도 지정하지 않으면 동일한 이름의 빈 Lakehouse 개체가 대상 작업 영역에 만들어집니다. Notebook 및 Spark 작업 정의는 새 작업 영역의 새 Lakehouse 개체를 참조하도록 다시 매핑됩니다.
업스트림 Lakehouse와 같이 배포 파이프라인 구성 시간 동안 다른 Lakehouse를 참조하도록 Lakehouse 종속성이 구성된 경우 동일한 이름의 새 빈 Lakehouse 개체가 대상 작업 영역에 계속 만들어지지만 Notebook 및 Spark 작업 정의 참조는 요청에 따라 다른 Lakehouse에 유지됩니다.
SQL Analytics 엔드포인트 및 의미 체계 모델은 Lakehouse 배포의 일부로 프로비전됩니다.
Lakehouse 내부에는 개체를 덮어쓰지 않습니다.
Lakehouse 이름에 대한 업데이트는 배포 파이프라인 컨텍스트의 작업 영역에서 동기화할 수 있습니다.