다음을 통해 공유


작업 영역 기능 저장소(레거시)

참고 항목

이 설명서에서는 작업 영역 기능 저장소에 대해 설명합니다. 작업 영역 기능 저장소는 2024년 8월 19일 오후 4:00:00(UTC) 이전에 만든 작업 영역에만 사용할 수 있습니다.

Databricks는 Unity 카탈로그에서 기능 엔지니어링을 사용하는 것을 권장합니다. 작업 영역 기능 저장소는 나중에 더 이상 사용되지 않습니다.

작업 영역 기능 저장소를 사용하는 이유

작업 영역 기능 저장소는 Azure Databricks의 다른 구성 요소와 완전히 통합됩니다.

  • 검색 기능. Databricks 작업 영역에서 액세스할 수 있는 기능 저장소 UI를 사용하면 기존 기능을 찾아보고 검색할 수 있습니다.
  • 계보. Azure Databricks에서 기능 테이블을 만들면 기능 테이블을 만드는 데 사용된 데이터 소스가 저장되고 액세스할 수 있습니다. 기능 테이블의 각 기능에 대해 해당 기능을 사용하는 모델, Notebook, 작업 및 엔드포인트에 액세스할 수도 있습니다.
  • 모델 점수 매기기 및 서비스와의 통합. 기능 저장소의 기능을 사용하여 모델을 학습하는 경우 모델은 기능 메타데이터로 패키지됩니다. 일괄 처리 채점 또는 온라인 유추에 모델을 사용하면 기능 저장소에서 기능이 자동으로 검색됩니다. 호출자는 해당 기능에 대해 알 필요가 없으며, 기능을 조회하거나 조인하여 새 데이터의 점수를 매기는 논리를 포함할 필요가 없습니다. 이렇게 하면 모델 배포 및 업데이트가 훨씬 쉬워집니다.
  • 특정 시점 조회. 기능 저장소는 특정 시점의 정확성이 필요한 시계열 및 이벤트 기반 사용 사례를 지원합니다.

작업 영역 기능 저장소는 어떻게 작동하나요?

기능 저장소를 사용하는 일반적인 기계 학습 워크플로는 다음 경로를 따릅니다.

  1. 원시 데이터를 기능으로 변환하고 원하는 기능이 포함된 Spark DataFrame을 만드는 코드를 씁니다.
  2. 작업 영역 기능 저장소데이터 프레임을 기능 테이블로 작성합니다.
  3. 기능 저장소의 기능을 사용하여 모델을 학습합니다. 이렇게 하면 모델은 학습에 사용되는 기능의 사양을 저장합니다. 모델이 유추에 사용되는 경우 해당 기능 테이블의 기능을 자동으로 조인합니다.
  4. 모델 레지스트리에 모델을 등록합니다.

이제 모델을 사용하여 새 데이터에서 예측을 수행할 수 있습니다. 일괄 처리 사용 사례의 경우 모델은 기능 저장소에서 필요한 기능을 자동으로 검색합니다.

일괄 처리 기계 학습 사용 사례에 대한 기능 저장소 워크플로.

실시간 서비스 사용 사례의 경우 온라인 스토어에 기능을 게시합니다. 타사 온라인 스토어를 참조하세요.

유추 시 모델은 온라인 저장소에서 미리 계산된 기능을 읽고 클라이언트 요청에 제공된 데이터와 엔드포인트를 제공하는 모델에 조인합니다.

제공되는 기계 학습 모델에 대한 기능 저장소 흐름.

작업 영역 기능 저장소 사용 시작

시작하려면 다음 예제 Notebook을 사용해 보세요. 기본 Notebook은 기능 저장소 테이블을 만들고 이를 사용하여 모델을 학습한 다음 자동 기능 조회를 사용하여 일괄 처리 채점을 수행하는 방법을 안내합니다. 또한 기능 엔지니어링 UI를 소개하고 이를 사용하여 기능을 검색하고 기능을 만들고 사용하는 방법을 이해하는 데 사용할 수 있는 방법을 보여 줍니다.

기본 작업 영역 기능 저장소 예제 Notebook

Notebook 가져오기

택시 예제 Notebook에서는 기능을 만들고, 업데이트하며, 모델 학습 및 일괄 처리 유추에 사용하는 프로세스를 보여 줍니다.

작업 영역 기능 저장소 택시 예제 Notebook

Notebook 가져오기

지원되는 데이터 유형

지원되는 데이터 형식은 지원되는 데이터 형식을 참조하세요.