Início Rápido: Configurar a Máquina Virtual de Ciência de Dados para Linux (Ubuntu)
Comece a usar a Máquina Virtual de Ciência de Dados (DSVM) do Ubuntu 20.04 e a DSVM do Azure para PyTorch.
Pré-requisitos
Você precisa de uma assinatura do Azure para criar uma Máquina Virtual de Ciência de Dados do Ubuntu 20.04 ou uma DSVM do Azure para PyTorch. Experimentar o Azure gratuitamente.
As contas gratuitas do Azure não dão suporte a SKUs de máquina virtual (VM) habilitada para GPU.
Criar sua Máquina Virtual de Ciência de Dados para Linux
Para criar uma instância da DSVM do Ubuntu 20.04 ou da DSVM do Azure para PyTorch:
Acesse o portal do Azure. Você poderá receber uma solicitação para entrar na sua conta do Azure, caso ainda não tenha entrado.
Encontre a listagem de VMs inserindo máquina virtual de ciência de dados. Em seguida, selecione Máquina Virtual de Ciência de Dados– Ubuntu 20.04 ou DSVM do Azure para PyTorch.
Selecione Criar.
No painel Criar uma máquina virtual, preencha a guia Informações básicas:
Assinatura: se você tiver mais de uma assinatura, selecione aquela em que o computador será criado e cobrado. Você deve ter privilégios de criação de recurso nessa assinatura.
Grupo de recursos: crie um novo grupo ou use um existente.
Nome da máquina virtual: insira o nome da VM. Esse nome é usado no portal do Azure.
Região: selecione o datacenter mais apropriado. Para você ter um acesso mais rápido à rede, o datacenter que hospeda a maior parte dos seus dados ou que está mais perto da sua localização física é a melhor opção. Para obter mais informações, visite Regiões do Azure.
Imagem: não altere o valor padrão.
Tamanho: essa opção deve ser preenchida automaticamente com um tamanho apropriado para cargas de trabalho gerais. Para obter mais informações, visite Tamanhos da VM do Linux no Azure.
Tipo de Autenticação: para uma configuração mais rápida, selecione Senha.
Observação
Caso queira usar o JupyterHub, certifique-se de selecionar Senha porque o JupyterHub não está configurado para usar as chaves públicas do Protocolo SSH (Secure Shell).
Nome de usuário: Insira o nome de usuário do administrador. Use esse nome de usuário para entrar na sua VM. Ele não precisa corresponder ao nome de usuário do Azure. Não use letras maiúsculas.
Importante
Se você usar letras maiúsculas no seu nome de usuário, o JupyterHub não funcionará e você encontrará um erro de 500 servidores internos.
Senha: insira a senha que você quer usar para entrar na sua VM.
Selecione Examinar + criar.
No painel Revisar + criar:
- Verifique se todas as informações inseridas estão corretas.
- Selecione Criar.
O processo de provisionamento leva cerca de 5 minutos. Você pode exibir o status da sua VM no portal do Azure.
Acessar a Máquina Virtual de Ciência de Dados do Ubuntu
É possível acessar a DSVM do Ubuntu usando um de três métodos:
- SSH para sessões de terminal
- xrdp para sessões gráficas
- X2Go para sessões gráficas
- JupyterHub e JupyterLab para notebooks Jupyter
SSH
Se você configurou sua VM com a autenticação SSH, poderá entrar com as credenciais da conta que criou na seção Informações Básicas da Etapa 4 da interface do shell de texto. Para obter mais informações, visite Saiba mais sobre como se conectar a uma VM do Linux.
xrdp
A ferramenta padrão para acessar sessões gráficas do Linux é xrdp. Embora a distribuição não inclua essa ferramenta por padrão, essas instruções explicam como instalá-la.
X2Go
Observação
No teste, o cliente X2Go teve um desempenho melhor que o encaminhamento X11. Recomendamos o uso do cliente X2Go para uma interface gráfica de área de trabalho.
A VM do Linux já está provisionada com o X2Go Server e está pronta para aceitar conexões de cliente. Para se conectar à área de trabalho gráfica da VM do Linux, realize os seguintes procedimentos em seu cliente:
Baixe e instale o cliente X2Go para sua plataforma de cliente X2Go.
Anote o Endereço IP público da VM. No portal do Azure, abra a VM que você criou para encontrar essas informações.
Execute o cliente X2Go. Se o painel Nova Sessão não abrir automaticamente, selecione Sessão>Nova Sessão.
No painel de configuração resultante, insira estes parâmetros de configuração:
- Session:
- Host: Insira o endereço IP da VM que foi anotado anteriormente.
- Logon: Insira o nome de usuário na VM Linux.
- Porta SSH: deixe-a no valor padrão 22.
- Tipo de sessão: Altere o valor para XFCE. No momento, a VM Linux dá suporte apenas à área de trabalho XFCE.
- Media: você pode desativar o suporte de som e a impressão do cliente se não precisar usá-los.
- Pastas compartilhadas: use esta guia para adicionar o diretório do computador cliente que você quer montar na VM.
- Session:
Selecione OK.
Para abrir o painel de entrada da VM, selecione a caixa no painel direito do painel X2Go.
Insira a senha de sua VM.
Selecione OK.
Pode ser necessário dar permissão X2Go para ignorar o firewall e concluir o processo de conexão.
Agora você deve ver a interface gráfica para sua DSVM do Ubuntu.
JupyterHub e JupyterLab
A DSVM do Ubuntu é executada JupyterHub, que é um servidor Jupyter multiusuário. Para se conectar, siga essas etapas:
Anote o endereço IP público da sua VM. Para localizar esse valor, pesquise e selecione sua VM no portal do Azure, conforme mostrado nesta captura de tela:
No computador local, abra um navegador da Web e acesse
https://your-vm-ip:8000
. Substitua seu vm-ip pelo endereço de IP que você anotou anteriormente.Seu navegador provavelmente impedirá que você abra o painel diretamente. Ele poderá dizer que há um erro de certificado. A DSVM fornece segurança com um certificado autoassinado. A maioria dos navegadores permitirá que você selecione após este aviso. Muitos navegadores continuarão a fornecer algum tipo de aviso visual sobre o certificado durante toda a sua sessão na Web.
Se você vir a mensagem de erro
ERR_EMPTY_RESPONSE
em seu navegador, certifique-se de acessar o computador usando explicitamente o protocolo HTTPS. HTTP ou apenas o endereço da Web não funciona para esta etapa. Caso insira o endereço da Web semhttps://
na linha de endereço, a maioria dos navegadores usará como padrão parahttp
e o erro será exibido.Insira o nome de usuário e a senha que você usou para criar a VM e entre, conforme mostrado nesta captura de tela
Caso receba um erro 500 nessa etapa, provavelmente usou letras maiúsculas no seu nome de usuário. Esse problema é uma interação conhecida entre o JupyterHub e o autenticador PAM que ele usa.
Caso receba um erro Não é possível acessar esta página, é provável que as permissões do grupo de segurança de rede (NSG) precisem de ajuste. No portal do Azure, localize o recurso NSG no seu grupo de recursos. Para acessar o JupyterHub da Internet pública, você deve ter a porta 8000 aberta. (A imagem mostra que essa VM está configurada para acesso just-in-time, o que é altamente recomendável. Para obter mais informações, visite Proteger suas portas de gerenciamento com acesso just-in-time.)
Navegue pelos notebooks de exemplo disponíveis.
O JupyterLab, a próxima geração de notebooks Jupyter e JupyterHub, também está disponível. Para acessá-lo, entre no JupyterHub. Em seguida, navegue até a URL https://your-vm-ip:8000/user/your-username/lab
. Substitua seu-nome de usuário pelo nome de usuário que você escolheu quando configurou a VM. Novamente, possíveis erros de certificado podem inicialmente impedir que você acesse o site.
Para definir o JupyterLab como o servidor de notebook padrão, adicione essa linha a /etc/jupyterhub/jupyterhub_config.py
:
c.Spawner.default_url = '/lab'
Próximas etapas
- Acesse passo a passo da Ciência de Dados na Máquina Virtual de Ciência de Dados para Linux para saber como realizar várias tarefas comuns da ciência de dados com a DSVM do Linux provisionada aqui.
- Experimente as ferramentas que este artigo descreve para explorar as várias ferramentas de ciência de dados na DSVM. Você também pode executar
dsvm-more-info
no shell na VM para obter uma introdução básica e ponteiros para obter mais informações sobre as ferramentas instaladas na VM. - Saiba como criar soluções analíticas sistematicamente com o Processo de Ciência de Dados em Equipe.
- Acesse a documentação de referência apropriada desta VM.