Compartilhar via


Gerenciamento de biblioteca no Spark

Observação

Desativaremos o Microsoft Azure HDInsight no AKS em 31 de janeiro de 2025. Para evitar o encerramento abrupto das suas cargas de trabalho, você precisará migrá-las para o Microsoft Fabric ou para um produto equivalente do Azure antes de 31 de janeiro de 2025. Os clusters restantes em sua assinatura serão interrompidos e removidos do host.

Somente o suporte básico estará disponível até a data de desativação.

Importante

Esse recurso está atualmente na visualização. Os Termos de uso complementares para versões prévias do Microsoft Azure incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, confira Informações sobre a versão prévia do Azure HDInsight no AKS. No caso de perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para ver mais atualizações sobre a Comunidade do Azure HDInsight.

O propósito do Gerenciamento de Bibliotecas é disponibilizar código aberto ou código personalizado para notebooks e trabalhos em execução em seus clusters. Você pode carregar bibliotecas do Python de repositórios PyPI. Esse artigo se concentra no gerenciamento de bibliotecas na interface do usuário do cluster. O Azure HDInsight no AKS já inclui muitas bibliotecas comuns no cluster. Para ver quais bibliotecas estão incluídas no HDI no cluster do AKS, consulte a página de gerenciamento de bibliotecas.

Instalar bibliotecas

Você pode instalar as bibliotecas de duas maneiras:

  • Instalada no cluster
  • No escopo do notebook

Instalada no cluster

Todos os notebooks em execução em um cluster podem usar bibliotecas de cluster. Você pode instalar uma biblioteca de cluster diretamente de um repositório público, como o PyPI. Faça upload de repositórios Maven, faça upload de bibliotecas personalizadas do armazenamento em nuvem no roteiro.

Captura de tela mostrando a página do gerenciador de bibliotecas instalada pelo cluster.

No escopo do notebook

As bibliotecas no escopo do notebook, disponíveis para Python e Scala, permitem que você instale bibliotecas e crie um ambiente com escopo para uma sessão de notebook. Essas bibliotecas não afetam outros notebooks em execução no mesmo cluster. As bibliotecas no escopo do notebook não são mantidas e precisam ser reinstaladas para cada sessão.

Observação

Use bibliotecas no escopo do notebook quando precisar de um ambiente personalizado para um notebook específico.

Modos de instalação de biblioteca

PyPI: buscar bibliotecas do repositório PyPI de código aberto mencionando o nome da biblioteca e a versão na interface do usuário da instalação.

Exibir as bibliotecas instaladas

  1. Na página de visão geral, navegue até o Gerenciador de Bibliotecas.

    Captura de tela mostrando a página do gerenciador de biblioteca.

  2. No Gerenciador de Cluster do Spark, clique em Gerenciador de Bibliotecas.

  3. Você pode exibir a lista de bibliotecas instaladas a partir daqui.

    Captura de tela mostrando como exibir as bibliotecas instaladas.

Adicionar widget de biblioteca

PyPI

  1. Na guia PyPI, insira o Nome do Pacote e a versão do pacote..

  2. Clique em Instalar.

    Captura de tela mostrando como instalar PyPI.

Desinstalar bibliotecas

Se você decidir não usar mais as bibliotecas, poderá excluir facilmente os pacotes de bibliotecas por meio do botão de desinstalação na página de gerenciamento da biblioteca.

  1. Selecione e clique no nome da biblioteca

    Captura de tela mostrando como selecionar a biblioteca.

  2. Clique em Desinstalar no widget

    Captura de tela mostrando como desinstalar a biblioteca.

    Observação

    • Os pacotes instalados do Jupyter Notebook só podem ser excluídos a partir do Jupyter Notebook.
    • Os pacotes instalados a partir do gerenciador de bibliotecas só podem ser desinstalados no gerenciador de bibliotecas.
    • Para atualizar uma biblioteca/pacote, desinstale a versão atual da biblioteca e reinstale a versão necessária da biblioteca.
    • A instalação de bibliotecas do Jupyter Notebook é específica para a sessão. Não é persistente.
    • A instalação de pacotes pesados pode demorar devido ao seu tamanho e complexidade.