다음을 통해 공유


Foundation Model 미세 조정 UI를 사용하여 학습 실행 만들기

Important

이 기능은 centralus, eastus, eastus2, northcentralus, westus 지역에서 공개 미리 보기로 제공됩니다.

이 문서에서는 기본 모델 미세 조정(현재 Mosaic AI 모델 학습의 일부) UI를 사용하여 학습 실행을 만들고 구성하는 방법을 설명합니다. API를 사용하여 실행을 만들 수도 있습니다. 자세한 내용은 Foundation Model 미세 조정 API를 사용하여 학습 실행 만들기를 참조하세요.

요구 사항

요구 사항을 참조하세요.

UI를 사용하여 학습 실행 만들기

다음 단계에 따라 UI를 사용하여 학습 실행을 만듭니다.

  1. 왼쪽 사이드바에서 실험을 클릭합니다.

  2. 파운데이션 모델 미세 조정 카드에서 모자이크 AI 모델 실험 만들기를 클릭합니다.

    기본 모델 실험 양식

  3. 파운데이션 모델 미세 조정 양식이 열립니다. 별표(*)로 표시된 항목은 필수 항목입니다. 선택한 다음, 학습 시작을 클릭합니다.

    유형: 수행할 작업을 선택합니다.

    Task 설명
    지침 미세 조정 프롬프트 및 응답 입력을 사용하여 기본 모델을 지속적으로 학습하여 특정 작업에 대해 모델을 최적화합니다.
    지속적 사전 학습 분야별 지식을 제공하기 위해 기본 모델을 지속적으로 학습합니다.
    채팅 완료 채팅 로그를 통해 기본 모델을 지속적으로 학습하여 Q&A 또는 대화 애플리케이션에 최적화합니다.

    기본 모델 선택: 조정하거나 학습할 모델을 선택합니다. 지원되는 모델 목록은 지원되는 모델을 참조하세요.

    학습 데이터: 찾아보기를 클릭하여 Unity Catalog에서 테이블을 선택하거나 Hugging Face 데이터 세트의 전체 URL을 입력합니다. 데이터 크기 권장 사항은 모델 학습에 권장되는 데이터 크기를 참조하세요.

    Unity Catalog에서 테이블을 선택하는 경우 테이블을 읽는 데 사용할 컴퓨팅도 선택해야 합니다.

    위치에 등록: 드롭다운 메뉴에서 Unity Catalog 카탈로그 및 스키마를 선택합니다. 학습된 모델은 이 위치에 저장됩니다.

    모델 이름: 모델은 사용자가 지정한 카탈로그 및 스키마에 이 이름으로 저장됩니다. 기본 이름이 이 필드에 나타나며, 원하는 경우 변경할 수 있습니다.

    고급 옵션: 더 많은 사용자 지정을 위해 평가, 하이퍼 매개 변수 조정에 대한 선택적 설정을 구성하거나 기존 독점 모델에서 학습할 수 있습니다.

    설정 설명
    학습 기간 epoch(예: 10ep) 또는 토큰(예: 1000000tok)에 지정된 학습 실행 기간. 기본값은 1ep입니다.
    학습 속도 모델 학습의 학습 속도. 기본값은 5e-7입니다. 최적화 도구는 DecoupledLionW로, 베타가 0.99 및 0.95이고 가중치가 감소하지 않습니다. 학습 속도 스케줄러는 LinearWithWarmupSchedule로, 전체 학습 기간의 2%가 준비 기간이고 최종 학습 속도 승수가 0입니다.
    컨텍스트 길이 데이터 샘플의 최대 시퀀스 길이. 이 설정보다 긴 데이터는 잘립니다. 기본값은 선택한 모델에 따라 달라집니다.
    평가 데이터 찾아보기를 클릭하여 Unity Catalog에서 테이블을 선택하거나 Hugging Face 데이터 세트의 전체 URL을 입력합니다. 이 필드를 비워 두면 평가가 수행되지 않습니다.
    모델 평가 프롬프트 모델을 평가하는 데 사용할 선택적 프롬프트를 입력합니다.
    실험 이름 기본값으로 자동으로 생성된 새 이름이 각 실행에 대해 할당됩니다. 선택적으로 사용자 지정 이름을 입력하거나 드롭다운 목록에서 기존 실험을 선택할 수 있습니다.
    사용자 지정 가중치 기본값으로 학습은 선택한 모델의 원래 가중치를 사용하여 시작됩니다. 작성기 검사점에서 사용자 지정 가중치로 시작하려면 검사점 값이 포함된 Unity Catalog 테이블에 대한 경로를 입력합니다.

다음 단계

학습 실행이 완료되면 MLflow에서 메트릭을 검토하고 유추를 위해 모델을 배포할 수 있습니다. 자습서의 5~7단계: 파운데이션 모델 미세 조정 실행 만들기 및 배포를 참조하세요.

데이터 준비, 학습 실행 구성 및 배포를 미세 조정하는 지침 미세 조정 예제는 지침 미세 조정: 명명된 엔터티 인식 데모 Notebook을 참조하세요.