다음을 통해 공유


AutoML을 사용하여 서버리스 예측

중요하다

이 기능은 공개 프리뷰입니다.

이 문서에서는 Mosaic AI 모델 학습 UI를 사용하여 서버리스 예측 실험을 실행하는 방법을 보여줍니다.

모자이크 AI 모델 학습 - 예측은 완전 관리형 컴퓨팅 리소스에서 실행되는 동안 최상의 알고리즘 및 하이퍼 매개 변수를 자동으로 선택하여 시계열 데이터 예측을 간소화합니다.

서버리스 예측과 클래식 컴퓨팅 예측의 차이점을 이해하려면 서버리스 예측과 클래식 컴퓨팅 예측참조하세요.

요구 사항

  • Unity 카탈로그 테이블로 저장된 시계열 열을 사용하여 데이터를 학습합니다.

  • 작업 영역에 SEG(Secure Egress Gateway)가 설정된 경우 pypi.org허용 도메인 목록에 추가해야 합니다. 서버리스 환경에서 트래픽 출구 제어에 대한 네트워크 정책 관리 를 참조하세요.

UI를 사용하여 예측 실험 만들기

Azure Databricks 랜딩 페이지로 이동하여 사이드바에서 실험을 클릭합니다.

  1. 예측 타일에서 학습 시작을 선택합니다.

  2. 액세스할 수 있는 Unity 카탈로그 테이블 목록에서 학습 데이터을 선택하세요.

    • 시간 열: 시계열의 기간이 포함된 열을 선택합니다. 열은 timestamp 또는 date형식이어야 합니다.
    • 예측 빈도: 입력 데이터의 빈도를 나타내는 시간 단위를 선택합니다. 예를 들어, 분, 시간, 일, 월. 이것이 시계열의 세분성을 결정합니다.
    • 예측 수평선: 앞으로 예측할 선택한 빈도의 단위 수를 지정합니다. 예측 빈도와 함께 예측할 시간 단위와 시간 단위 수를 모두 정의합니다.

    메모

    Auto-ARIMA 알고리즘을 사용하려면 시계열에 두 점 사이의 간격이 시계열 전체에서 동일해야 하는 일반 빈도가 있어야 합니다. AutoML은 이전 값으로 해당 값을 입력하여 누락된 시간 단계를 처리합니다.

  3. 모델이 예측하도록 원하는 예측 대상 열을 선택합니다.

  4. 필요에 따라 Unity 카탈로그 테이블 예측 데이터 경로를 지정하여 출력 예측을 저장합니다.

    서버리스 예측 UI 스크린샷

  5. Unity 카탈로그 위치 및 이름을 모델 등록을 선택합니다.

  6. 필요에 따라 고급 옵션설정합니다.

    • 실험 이름: MLflow 실험 이름을 제공합니다.
    • 시계열 식별자 열 - 다중 시리즈 예측의 경우 개별 시계열을 식별하는 열을 선택합니다. Databricks는 이러한 열을 기준으로 데이터를 서로 다른 시계열로 그룹화하고 각 계열에 대한 모델을 독립적으로 학습시킵니다.
    • 기본 메트릭: 가장 적합한 모델을 평가하고 선택하는 데 사용되는 기본 메트릭을 선택합니다.
    • 학습 프레임워크: AutoML에서 탐색할 프레임워크를 선택합니다.
    • 열 분할: 사용자 지정 데이터 분할이 포함된 열을 선택합니다. 값은 "훈련", "검증", "테스트"여야 합니다.
    • 가중치 열: 시계열 가중치에 사용할 열을 지정합니다. 지정된 시계열의 모든 샘플은 동일한 가중치를 가져야 합니다. 가중치는 [0, 10000] 범위에 있어야 합니다.
    • 휴일 지역: 모델 학습에서 공변으로 사용할 휴일 지역을 선택합니다.
    • 제한 시간: AutoML 실험의 최대 기간을 설정합니다.

실험을 실행하고 결과를 모니터링합니다.

AutoML 실험을 시작하려면 학습 시작을 클릭하세요. 실험 학습 페이지에서 다음을 수행할 수 있습니다.

  • 언제든지 실험을 중지합니다.
  • 실행을 모니터링합니다.
  • 모든 실행에 대한 실행 페이지로 이동합니다.

결과 보기 또는 최상의 모델 사용

학습이 완료되면 예측 결과가 지정된 델타 테이블에 저장되고 최상의 모델이 Unity 카탈로그에 등록됩니다.

실험 페이지에서 다음 단계 중에서 선택합니다.

  • 보기를 선택하여 예측 결과 테이블을 확인합니다.
  • Batch 추론 Notebook을 선택하여 최상의 모델을 사용한 일괄 처리를 위한 자동 생성된 Notebook을 엽니다.
  • 서비스 엔드포인트 만들기를 선택하여 모델 서비스 엔드포인트에 최상의 모델을 배포합니다.

서버리스 예측 및 클래식 컴퓨팅 예측

다음 표에서는 클래식 컴퓨팅 사용하여 서버리스 예측과 예측 간의 차이점을 요약합니다.

특징 서버리스 예측 고전적인 컴퓨트 예측
컴퓨팅 인프라 Azure Databricks는 컴퓨팅 구성을 관리하고 비용 및 성능에 대해 자동으로 최적화합니다. 사용자가 구성한 컴퓨팅
거버넌스 Unity 카탈로그에 등록된 모델 및 아티팩트 사용자가 구성한 작업 영역 파일 저장소
알고리즘 선택 통계 모델 심층 학습 신경망 알고리즘 DeepAR 통계 모델
기능 저장소 통합 지원되지 않음 지원되는
자동 생성된 노트북 일괄 처리 추론 노트북 모든 평가판에 대한 소스 코드
배포를 제공하는 원클릭 모델 지원됨 지원 되지 않는
맞춤형 훈련/검증/테스트 구분 지원 지원되지 않음
개별 시계열에 대한 사용자 지정 가중치 호환됨 지원되지 않음