작업에 대한 Python 스크립트 태스크
Python 스크립트 태스크를 사용하여 Python 파일을 실행합니다.
Python 스크립트 작업 구성
시작하기 전에 작업을 구성하는 사용자가 액세스할 수 있는 위치에 Python 스크립트를 업로드해야 합니다. Databricks는 Python 스크립트에 작업 영역 파일을 사용하는 것이 좋습니다. 작업 영역 파일이란?을 참조하세요.
참고 항목
작업 UI는 구성된 다른 설정에 따라 옵션을 동적으로 표시합니다.
Databricks는 DBFS 루트 또는 탑재를 사용하여 코드 또는 데이터를 저장하지 않도록 권장합니다. 대신 Python 스크립트를 작업 영역 파일로 마이그레이션하거나 volumes URI를 사용하여 클라우드 개체 스토리지에 액세스할 수 있습니다.
Python script
작업을 구성하는 흐름을 시작하려면 다음을 수행합니다.
- 작업 UI의 작업 탭으로 이동합니다.
-
형식 드롭다운 메뉴에서 select
Python script
.
원본 구성
원본 드롭다운 메뉴에서 다음 옵션 중 하나를 사용하여 Python 스크립트의 위치를 지정하십시오 select.
작업 영역
작업 영역을 사용하여 작업 영역 파일을 사용하여 저장된 Python 스크립트를 구성합니다.
- 경로 필드를 클릭합니다. Select Python 파일 대화 상자가 나타납니다.
- Python 스크립트로 이동하고 파일을 강조 표시하려면 클릭한 다음 확인을 클릭합니다.
참고 항목
이 옵션을 사용하여 Databricks Git 폴더에 저장된 Python 스크립트에서 작업을 구성할 수 있습니다. Databricks는 Git 공급자 옵션 및 원격 Git 리포지토리를 사용하여 작업으로 예약된 자산의 버전을 지정하는 것이 좋습니다.
DBFS/ADLS
DBFS/ADLS를 사용하여 볼륨, 클라우드 개체 스토리지 위치 또는 DBFS 루트에 저장된 Python 스크립트를 구성합니다.
Databricks는 Unity Catalogvolumes 또는 클라우드 개체 스토리지에 Python 스크립트를 저장하는 것이 좋습니다.
경로 필드에 Python 스크립트에 대한 URI를 입력합니다. 예를 들어 /Volumes/path/to/script.py
또는 abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py
입니다.
Git 공급자
Git 공급자를 사용하여 원격 Git 리포지토리에 저장된 Python 스크립트를 구성합니다.
UI에서 표시하는 옵션은 다른 곳에서 Git 공급자를 이미 구성했는지 여부에 따라 달라집니다. 하나의 원격 Git 리포지토리만 작업의 모든 작업에 사용할 수 있습니다. 작업에서 Git 사용을 참조하세요.
Git 참조를 구성한 후에 경로 필드가 나타납니다.
Python 스크립트의 상대 경로(예: etl/bronze/ingest.py
)를 입력합니다.
Important
상대 경로를 입력할 때 /
또는 ./
로 시작하지 마세요. 예를 들어 액세스하려는 Python 코드의 절대 경로가 /etl/bronze/ingest.py
인 경우 etl/bronze/ingest.py
필드에 을 입력합니다.
컴퓨팅 및 종속 라이브러리 구성
- Compute을 사용하거나 스크립트의 논리를 지원하는 클러스터를 select으로 구성하십시오.
-
Serverless
컴퓨팅을 사용하는 경우 환경 및 라이브러리 필드를 사용하여 새 환경을 select편집하거나 추가합니다. Notebook 종속성 설치를 참조하세요. - 다른 모든 컴퓨팅 구성의 경우 종속 라이브러리에서 + 추가를 클릭합니다.
종속 라이브러리 추가 대화 상자가 나타납니다.
- 기존 라이브러리를 select하거나 새 라이브러리를 업로드할 수 있습니다.
- 컴퓨팅 구성에서 지원하는 위치에 저장된 라이브러리만 사용할 수 있습니다. Python 라이브러리 지원을 참조하세요.
- 각 라이브러리 원본에는 라이브러리를 선택하거나 업로드하기 위한 다른 흐름이 있습니다. 라이브러리를 참조하세요.
작업 구성 완료
- (선택 사항) Python 스크립트에 CLI 인수로 전달되는 문자열의 list로 Parameters을 구성합니다. 작업 parameters구성을 참조하세요.
- 작업 저장을 클릭합니다.