Compartilhar via


Solucionar problemas de falha na instalação do agente de nó de computação do Linux

Este artigo discute como solucionar problemas de um cenário no qual a extensão do agente de nó do Linux do HPC Pack não é instalada com êxito em um nó em um cluster de HPC (computação de alto desempenho).

Lista de verificação de solução de problemas

Para solucionar problemas de uma falha na instalação da extensão Microsoft.HpcPack.LinuxNodeAgent2016U1 em um nó de computação do Linux, examine o arquivo de log de extensão e instale um novo nó de computação do Linux em uma VM (máquina virtual) de IaaS (infraestrutura como serviço).

Etapa 1: examinar o log de extensão

O arquivo de log de extensão pode ajudá-lo a determinar por que o agente do nó não foi instalado com êxito. Para localizar e exibir o arquivo de log de extensão, siga estas etapas:

  1. Abra um console administrativo do PowerShell.

  2. Execute os seguintes comandos para ativar o recurso de conexão Secure Shell (SSH) no nó principal:

    dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0
    Start-Service sshd
    Set-Service -Name sshd -StartupType 'Automatic'
    Set-Service -Name ssh-agent -StartupType 'Automatic'
    Start-Service ssh-agent
    
  3. No nó principal, execute o seguinte comando para entrar no nó de computação do Linux:

    ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
    
  4. Digite a senha da conta do administrador do domínio.

  5. Execute o seguinte comando para verificar se o arquivo de log de extensão existe no nó:

    sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
    
  6. Execute ou abra seu visualizador ou editor de texto preferido e exiba o conteúdo do arquivo de log de extensão.

Etapa 2: Fazer um teste local para intermitência em uma VM de IaaS

Para testar localmente como fazer intermitência para uma VM IaaS, siga estas etapas:

  1. Siga as etapas para criar um modelo de nó de IaaS do Azure. Quando você acessar a seção Especificar Imagem de VM do assistente de criação de modelo, especifique as configurações a seguir antes de concluir a criação do modelo de nó.

    Nome do campo Valor
    Tipo de imagem Imagem do mercado
    Tipo de sistema operacional Linux
    Rótulo de imagem Red Hat Enterprise Linux 7.8
  2. Siga as etapas para criar os nós de computação IaaS e gerenciá-los. Quando você chegar à seção Especificar novos nós do assistente Adicionar nó, especifique as configurações a seguir antes de concluir a adição do nó.

    Nome do campo Valor
    Modelo de nó O nome do modelo de nó que você criou anteriormente.
    Número de nós 1
    Tamanho da VM dos nós A1 (1 núcleo, 1,75 GB de memória)
  3. Siga as etapas para criar um novo trabalho no HPC Cluster Manager. Quando você chegar à seção Seleção de Recursos , selecione LinuxNodes na lista Grupos de nós disponíveis e, em seguida, selecione o botão Adicionar para mover o item para a lista Grupos de nós selecionados. Depois de enviar o novo trabalho, o nó do Linux será provisionado corretamente.

Entre em contato conosco para obter ajuda

Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.