Configurar o ambiente interativo do PySpark para o Visual Studio Code
As etapas a seguir mostram como configurar o ambiente interativo do PySpark no VS Code. Esta etapa é apenas para usuários que não têm o Windows.
Usamos comando python/pip para criar o ambiente virtual em seu caminho de Página Inicial. Se você deseja usar outra versão, precisa alterar a versão padrão do comando python/pip manualmente. Para obter mais detalhes, confira update-alternatives.
-
Instale o Python a partir de https://www.python.org/downloads/.
Instale o pip do https://pip.pypa.io/en/stable/installing (se ele não estiver na instalação do Python).
Como opção, verifique se o Python e o pip estão instalados corretamente usando os comandos
python --version
epip --version
, respectivamente.Observação
É recomendável instalar o Python manualmente em vez de usar a versão padrão do macOS.
Instale virtualenv executando o comando a seguir.
pip install virtualenv
Outros pacotes
No Linux, se você encontrar a mensagem de erro abaixo, instale os pacotes necessários executando os dois comandos a seguir.
sudo apt-get install libkrb5-dev
sudo apt-get install python-dev
Reinicie o VSCode, depois volte para o editor do VS Code e execute o comando do Spark: PySPark Interactive.
Próximas etapas
Demonstração
- HDInsight para VS Code: Vídeo