Batch 풀에서 Linux 컴퓨팅 노드 프로비전
Azure Batch를 사용하여 Linux 및 Windows 가상 머신에서 병렬 컴퓨팅 워크로드를 실행할 수 있습니다. 이 문서에서는 Batch Python 및 Batch .NET 클라이언트 라이브러리를 모두 사용하여 Batch 서비스에서 Linux 컴퓨팅 노드 풀을 만드는 방법에 대해 자세히 설명합니다.
가상 머신 구성
Batch에서 컴퓨팅 노드 풀을 만드는 경우 노드 크기와 운영 체제를 선택할 수 있는 두 가지 옵션인 Cloud Service 구성 및 Virtual Machine 구성이 있습니다. Virtual Machine 구성 풀은 Linux 또는 Windows 이미지에서 만들 수 있는 Azure VM으로 구성됩니다. Virtual Machine 구성을 사용하여 풀을 만들 때 사용 가능한 컴퓨팅 노드 크기, 노드에 설치할 가상 머신 이미지 참조, Batch 노드 에이전트 SKU(각 노드에서 실행되고 노드와 Batch 서비스 간의 인터페이스를 제공하는 프로그램)를 지정합니다.
가상 머신 이미지 참조
Batch 서비스는 가상 머신 확장 집합을 사용하여 가상 머신 구성에서 컴퓨팅 노드를 제공합니다. Azure Marketplace 이미지를 지정하거나 Azure Compute Gallery를 사용하여 사용자 지정 이미지를 준비할 수 있습니다.
가상 머신 이미지 참조를 만들 때 다음 속성을 지정해야 합니다.
이미지 참조 속성 | 예제 |
---|---|
게시자 | canonical |
제안 | 0001-com-ubuntu-server-focal |
SKU | 20_04-lts |
버전 | latest |
팁
Azure CLI를 사용하여 Azure Marketplace Linux VM 이미지 찾기에서 이러한 속성에 대해, 그리고 Marketplace 이미지를 지정하는 방법에 대해 자세히 알아볼 수 있습니다. 일부 Marketplace 이미지는 현재 Batch와 호환되지 않습니다.
가상 머신 이미지 목록
일부 Marketplace 이미지는 현재 제공되는 Batch 노드 에이전트와 호환되지 않습니다. Batch 서비스와 해당 노드 에이전트 SKU에 대해 지원되는 모든 Marketplace 가상 머신 이미지의 목록을 확인하려면 list_supported_images(Python), ListSupportedImages(Batch .NET) 또는 선택한 언어 SDK의 해당 API를 사용하세요.
노드 에이전트 SKU
Batch 노드 에이전트는 풀의 각 노드에서 실행되고 노드와 Batch 서비스 간의 명령 및 컨트롤 인터페이스를 제공하는 프로그램입니다. SKU라고 하는 노드 에이전트의 구현은 서로 다른 운영 체제에 대해 여러 가지가 있습니다. 기본적으로 Virtual Machine 구성을 만들 때 먼저 가상 머신 이미지 참조를 지정한 다음 이미지에 설치할 노드 에이전트를 지정합니다. 일반적으로 각 노드 에이전트 SKU는 여러 가상 머신 이미지와 호환됩니다. 지원되는 노드 에이전트 SKU 및 가상 머신 이미지 호환성을 보려면 Azure Batch CLI 명령을 사용할 수 있습니다.
az batch pool supported-images list
자세한 내용은 계정 - 지원되는 이미지 나열 - REST API(Azure Batch Service) | Microsoft Docs를 참조할 수 있습니다.
Linux 풀 만들기: Batch Python
다음 코드 조각은 Python용 Microsoft Azure Batch 클라이언트 라이브러리를 사용하여 Ubuntu Server 컴퓨팅 노드의 풀을 만드는 방법의 예를 보여 줍니다. Batch Python 모듈에 대한 자세한 내용은 참조 설명서를 확인하세요.
이 코드 조각은 명시적으로 ImageReference를 만들고 각 속성(게시자, 제품, SKU, 버전)을 지정합니다. 그러나 프로덕션 코드에서는 list_supported_images를 사용하여 런타임 시 사용 가능한 이미지 및 노드 에이전트 SKU 조합을 선택하는 것이 좋습니다.
# Import the required modules from the
# Azure Batch Client Library for Python
import azure.batch.batch_service_client as batch
import azure.batch.batch_auth as batchauth
import azure.batch.models as batchmodels
# Specify Batch account credentials
account = "<batch-account-name>"
key = "<batch-account-key>"
batch_url = "<batch-account-url>"
# Pool settings
pool_id = "LinuxNodesSamplePoolPython"
vm_size = "STANDARD_D2_V3"
node_count = 1
# Initialize the Batch client
creds = batchauth.SharedKeyCredentials(account, key)
config = batch.BatchServiceClientConfiguration(creds, batch_url)
client = batch.BatchServiceClient(creds, batch_url)
# Create the unbound pool
new_pool = batchmodels.PoolAddParameter(id=pool_id, vm_size=vm_size)
new_pool.target_dedicated = node_count
# Configure the start task for the pool
start_task = batchmodels.StartTask()
start_task.run_elevated = True
start_task.command_line = "printenv AZ_BATCH_NODE_STARTUP_DIR"
new_pool.start_task = start_task
# Create an ImageReference which specifies the Marketplace
# virtual machine image to install on the nodes
ir = batchmodels.ImageReference(
publisher="canonical",
offer="0001-com-ubuntu-server-focal",
sku="20_04-lts",
version="latest")
# Create the VirtualMachineConfiguration, specifying
# the VM image reference and the Batch node agent
# to install on the node
vmc = batchmodels.VirtualMachineConfiguration(
image_reference=ir,
node_agent_sku_id="batch.node.ubuntu 20.04")
# Assign the virtual machine configuration to the pool
new_pool.virtual_machine_configuration = vmc
# Create pool in the Batch service
client.pool.add(new_pool)
앞서 언급했듯이 list_supported_images 메서드를 사용하여 ImageReference를 명시적으로 만드는 대신 현재 지원되는 노드 에이전트/Marketplace 이미지 조합에서 동적으로 선택하는 것이 좋습니다. 다음 Python 코드 조각에서는 이 메서드의 사용 방법을 보여 줍니다.
# Get the list of supported images from the Batch service
images = client.account.list_supported_images()
# Obtain the desired image reference
image = None
for img in images:
if (img.image_reference.publisher.lower() == "canonical" and
img.image_reference.offer.lower() == "0001-com-ubuntu-server-focal" and
img.image_reference.sku.lower() == "20_04-lts"):
image = img
break
if image is None:
raise RuntimeError('invalid image reference for desired configuration')
# Create the VirtualMachineConfiguration, specifying the VM image
# reference and the Batch node agent to be installed on the node
vmc = batchmodels.VirtualMachineConfiguration(
image_reference=image.image_reference,
node_agent_sku_id=image.node_agent_sku_id)
Linux 풀 만들기: Batch .NET
다음 코드 조각은 Batch .NET 클라이언트 라이브러리를 사용하여 Ubuntu Server 컴퓨팅 노드의 풀을 만드는 방법의 예를 보여 줍니다. Batch .NET에 대한 자세한 내용은 참조 설명서를 확인하세요.
다음 코드 조각에서는 PoolOperations.ListSupportedImages 메서드를 사용하여 현재 지원되는 Marketplace 이미지 및 노드 에이전트 SKU 조합의 목록에서 선택합니다. 지원되는 조합 목록이 언제든지 바뀔 수 있으므로 이 기법이 권장됩니다. 가장 일반적으로 지원되는 조합을 추가합니다.
// Pool settings
const string poolId = "LinuxNodesSamplePoolDotNet";
const string vmSize = "STANDARD_D2_V3";
const int nodeCount = 1;
// Obtain a collection of all available node agent SKUs.
// This allows us to select from a list of supported
// VM image/node agent combinations.
List<ImageInformation> images =
batchClient.PoolOperations.ListSupportedImages().ToList();
// Find the appropriate image information
ImageInformation image = null;
foreach (var img in images)
{
if (img.ImageReference.Publisher == "canonical" &&
img.ImageReference.Offer == "0001-com-ubuntu-server-focal" &&
img.ImageReference.Sku == "20_04-lts")
{
image = img;
break;
}
}
// Create the VirtualMachineConfiguration for use when actually
// creating the pool
VirtualMachineConfiguration virtualMachineConfiguration =
new VirtualMachineConfiguration(image.ImageReference, image.NodeAgentSkuId);
// Create the unbound pool object using the VirtualMachineConfiguration
// created above
CloudPool pool = batchClient.PoolOperations.CreatePool(
poolId: poolId,
virtualMachineSize: vmSize,
virtualMachineConfiguration: virtualMachineConfiguration,
targetDedicatedComputeNodes: nodeCount);
// Commit the pool to the Batch service
await pool.CommitAsync();
이전의 코드 조각은 PoolOperations.istSupportedImages 메서드를 사용하여 동적으로 나열하고 지원되는 이미지와 노드 에이전트 SKU 조합에서 선택(권장)하지만, ImageReference를 명시적으로 구성할 수도 있습니다.
ImageReference imageReference = new ImageReference(
publisher: "canonical",
offer: "0001-com-ubuntu-server-focal",
sku: "20_04-lts",
version: "latest");
SSH를 사용하여 Linux 노드에 연결
개발 또는 문제 해결 동안 풀의 노드에 로그인할 필요가 있을 수 있습니다. Windows 컴퓨팅 노드와 달리 Linux 노드에 연결하기 위해 RDP(원격 데스크톱 프로토콜)를 사용할 수 없습니다. 대신, Batch 서비스는 원격 연결을 위해 각 노드에서 SSH 액세스를 사용하도록 설정합니다.
다음 Python 코드 조각에서는 풀의 각 노드에서 사용자를 만들며 이는 원격 연결에 필요합니다. 그런 다음 각 노드에 대한 SSH(secure shell) 연결 정보를 인쇄합니다.
import datetime
import getpass
import azure.batch.batch_service_client as batch
import azure.batch.batch_auth as batchauth
import azure.batch.models as batchmodels
# Specify your own account credentials
batch_account_name = ''
batch_account_key = ''
batch_account_url = ''
# Specify the ID of an existing pool containing Linux nodes
# currently in the 'idle' state
pool_id = ''
# Specify the username and prompt for a password
username = 'linuxuser'
password = getpass.getpass()
# Create a BatchClient
credentials = batchauth.SharedKeyCredentials(
batch_account_name,
batch_account_key
)
batch_client = batch.BatchServiceClient(
credentials,
base_url=batch_account_url
)
# Create the user that will be added to each node in the pool
user = batchmodels.ComputeNodeUser(username)
user.password = password
user.is_admin = True
user.expiry_time = \
(datetime.datetime.today() + datetime.timedelta(days=30)).isoformat()
# Get the list of nodes in the pool
nodes = batch_client.compute_node.list(pool_id)
# Add the user to each node in the pool and print
# the connection information for the node
for node in nodes:
# Add the user to the node
batch_client.compute_node.add_user(pool_id, node.id, user)
# Obtain SSH login information for the node
login = batch_client.compute_node.get_remote_login_settings(pool_id,
node.id)
# Print the connection info for the node
print("{0} | {1} | {2} | {3}".format(node.id,
node.state,
login.remote_login_ip_address,
login.remote_login_port))
이 코드는 다음 예제와 유사한 출력을 제공합니다. 이 경우 풀에 4개의 Linux 노드가 포함됩니다.
Password:
tvm-1219235766_1-20160414t192511z | ComputeNodeState.idle | 13.91.7.57 | 50000
tvm-1219235766_2-20160414t192511z | ComputeNodeState.idle | 13.91.7.57 | 50003
tvm-1219235766_3-20160414t192511z | ComputeNodeState.idle | 13.91.7.57 | 50002
tvm-1219235766_4-20160414t192511z | ComputeNodeState.idle | 13.91.7.57 | 50001
노드에 사용자를 만들 때 암호 대신 SSH 공개 키를 지정할 수 있습니다.
Python SDK에서는 ComputeNodeUser에 ssh_public_key 매개 변수를 사용합니다.
.NET에서는 ComputeNodeUser.SshPublicKey 속성을 사용합니다.
가격 책정
Azure Batch는 Azure Cloud Services 및 Azure Virtual Machines 기술을 기반으로 빌드됩니다. Batch 서비스 자체는 무료로 제공됩니다. 즉, Batch 솔루션에서 사용하는 컴퓨팅 리소스(및 이에 따른 관련 비용)에 대해서만 요금이 청구됩니다. Virtual Machine 구성을 선택하는 경우 Virtual Machines 가격 구조에 따라 요금이 청구됩니다.
애플리케이션 패키지를 사용하여 Batch 노드에 애플리케이션을 배포하는 경우에도 애플리케이션 패키지에서 사용하는 Azure Storage 리소스에 대한 요금이 청구됩니다.
다음 단계
- azure-batch-samples GitHub 리포지토리에서 Python 코드 샘플을 탐색하여 풀, 작업, 태스크 만들기와 같은 일반적인 Batch 작업을 수행하는 방법을 확인합니다. Python 샘플과 함께 제공되는 추가 정보에는 필요한 패키지를 설치하는 방법에 대한 세부 정보가 있습니다.
- Batch에서 Azure 스폿 VM을 사용하는 방법 알아보기