AutoML 기능 저장소 통합
AutoML은 기능 테이블에서 Unity 카탈로그 또는 레거시 작업 영역 기능 저장소의 기능으로 원래 입력 데이터 세트를 보강할 수 있습니다.
요구 사항
- 분류 및 회귀 실험에는 Databricks Runtime 11.3 LTS ML 이상이 필요합니다.
- 실험을 예측하려면 Databricks Runtime 12.2 LTS ML 이상이 필요합니다.
AutoML UI를 사용하여 기능 테이블 선택
AutoML 실험을 구성한 후 다음 단계에 따라 기능 테이블을 선택할 수 있습니다.
기능 조인(선택 사항)을 클릭합니다.
추가 기능 조인 페이지의 기능 테이블 필드에서 기능 테이블을 선택합니다.
각 기능 테이블 기본 키에 대해 해당 조회 키를 선택합니다. 조회 키는 AutoML 실험을 위해 제공한 학습 데이터 세트의 열이어야 합니다.
시계열 기능 테이블의 경우 해당 타임스탬프 조회 키를 선택합니다. 마찬가지로 타임스탬프 조회 키는 AutoML 실험을 위해 제공한 학습 데이터 세트의 열이어야 합니다.
기능 테이블을 더 추가하려면 다른 기능 테이블 추가를 클릭하고 위의 단계를 반복합니다.
AutoML API와 함께 기능 테이블 사용
기존 기능 테이블을 사용하려면 AutoML 실행 사양feature_store_lookups
설정합니다.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
다음 Notebook에서는 AutoML에서 사용하기 위해 기능 테이블을 학습 데이터 세트에 조인하는 방법을 보여 줍니다.