Configurar o ambiente interativo do PySpark para o Visual Studio Code
As etapas a seguir mostram como configurar o ambiente interativo PySpark no VS Code. Esta etapa é apenas para usuários que não são do Windows.
Usamos o comando python/pip para construir um ambiente virtual no seu caminho Home. Se você quiser usar outra versão, você precisa alterar a versão padrão do comando python/pip manualmente. Mais detalhes, consulte alternativas de atualização.
-
Instale o Python a partir do https://www.python.org/downloads/.
Instale pip from https://pip.pypa.io/en/stable/installing (se não estiver instalado a partir da instalação do Python).
Opcionalmente, valide se Python e pip foram instalados com êxito usando os comandos
python --version
, epip --version
, respectivamente.Nota
Recomenda-se instalar manualmente o Python em vez de usar a versão padrão do macOS.
Instale virtualenv executando o comando abaixo.
pip install virtualenv
Outros pacotes
No Linux, se você se deparar com a mensagem de erro abaixo, instale os pacotes necessários executando os dois comandos a seguir.
sudo apt-get install libkrb5-dev
sudo apt-get install python-dev
Reinicie o VS Code e, em seguida, volte para o editor de código VS e execute o comando Spark: PySPark Interactive .
Próximos passos
Demonstração
- HDInsight para VS Code: Vídeo