다음을 통해 공유


배포된 Machine Learning Studio(클래식) 웹 서비스에 대한 엔드포인트 만들기

적용 대상: 적용 대상Machine Learning Studio(클래식) 미적용 대상Azure Machine Learning

Important

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

웹 서비스가 배포된 후 해당 서비스에 대한 기본 엔드포인트가 만들어집니다. 기본 엔드포인트는 API 키를 사용하여 호출할 수 있습니다. 웹 서비스 포털에서 자체 키를 사용하여 엔드포인트를 더 추가할 수 있습니다. 웹 서비스의 각 엔드포인트는 독립적으로 주소 지정, 제한 및 관리됩니다. 각 엔드포인트에는 고객에게 배포할 수 있는 권한 부여 키가 있는 고유한 URL이 있습니다.

웹 서비스에 엔드포인트 추가

Machine Learning 웹 서비스 포털을 사용하여 웹 서비스에 엔드포인트를 추가할 수 있습니다. 엔드포인트가 만들어지면 동기 API, 일괄 처리 API 및 Excel 워크시트를 통해 사용할 수 있습니다.

참고 항목

웹 서비스에 추가 엔드포인트를 추가한 경우 기본 엔드포인트를 삭제할 수 없습니다.

  1. Machine Learning Studio(클래식)의 왼쪽 탐색 열에서 웹 서비스를 클릭합니다.
  2. 웹 서비스 대시보드 아래쪽에서 엔드포인트 관리를 클릭합니다. Machine Learning 웹 서비스 포털이 웹 서비스의 엔드포인트 페이지로 열립니다.
  3. 새로 만들기를 클릭합니다.
  4. 새 엔드포인트의 이름과 설명을 입력합니다. 엔드포인트 이름은 길이가 24자 이하여야 하며 소문자 알파벳 또는 숫자로 구성되어야 합니다. 로깅 수준 및 샘플 데이터 사용 여부를 선택합니다. 자세한 내용은 Machine Learning 웹 서비스에 대해 로깅 사용을 참조하세요.

추가 엔드포인트를 추가하여 웹 서비스 크기 조정

기본적으로 게시된 각 웹 서비스는 20개의 동시 요청을 지원하도록 구성되며 최대 200개의 동시 요청일 수 있습니다. Machine Learning Studio(클래식)는 웹 서비스에 대한 최상의 성능을 제공하기 위해 설정을 자동으로 최적화하고 포털 값은 무시됩니다.

최대 동시 호출 값 200보다 높은 부하로 API를 호출하려는 경우 동일한 웹 서비스에 여러 엔드포인트를 만들어야 합니다. 그런 다음 부하를 모든 부하에 임의로 분산할 수 있습니다.

웹 서비스의 크기 조정은 일반적인 작업입니다. 크기를 조정하는 몇 가지 이유는 200개 이상의 동시 요청을 지원하거나, 여러 엔드포인트를 통해 가용성을 높이거나, 웹 서비스에 대해 별도의 엔드포인트를 제공하기 위해서입니다. Machine Learning 웹 서비스 포털을 통해 동일한 웹 서비스에 대한 엔드포인트를 추가하여 규모를 늘릴 수 있습니다.

해당하는 높은 속도로 API를 호출하지 않을 경우 매우 높은 동시성 개수를 사용하는 것은 바람직하지 않습니다. 높은 부하에 대해 구성된 API에 상대적으로 낮은 부하를 배치하는 경우 산발적인 시간 제한 및/또는 대기 시간 급증이 표시될 수 있습니다.

동기 API는 일반적으로 짧은 대기 시간이 필요한 경우에 사용됩니다. 여기서 대기 시간은 API가 하나의 요청을 완료하는 데 걸리는 시간을 의미하며 네트워크 지연을 고려하지 않습니다. 대기 시간이 50ms인 API가 있다고 가정해 보겠습니다. 높음 제한 수준 및 최대 동시 호출 = 20으로 사용 가능한 용량을 완전히 사용하려면 이 API를 초당 20 * 1000 / 50 = 400회 호출해야 합니다. 이를 추가로 확장하면 최대 동시 호출 200을 사용하면 50ms 대기 시간을 가정하여 API를 초당 4000번 호출할 수 있습니다.

다음 단계

Machine Learning 웹 서비스를 사용하는 방법