Partilhar via


Bibliotecas de espaços de trabalho (legado)

Importante

Esta documentação foi desativada e pode não ser atualizada. Os produtos, serviços ou tecnologias mencionados neste conteúdo não são mais suportados. Veja Bibliotecas de cluster.

Nota

As bibliotecas de espaço de trabalho foram preteridas e não devem ser usadas. No entanto, o armazenamento de bibliotecas como arquivos de espaço de trabalho é distinto das bibliotecas de espaço de trabalho e ainda é totalmente suportado. Você pode instalar bibliotecas armazenadas como arquivos de espaço de trabalho diretamente para tarefas de computação ou trabalho.

As bibliotecas de área de trabalho servem de repositório local a partir do qual pode criar bibliotecas instaladas no cluster. Uma biblioteca de área de trabalho pode ser um código personalizado criado pela sua organização, ou pode ser uma versão particular de uma biblioteca open-source que a sua organização implementou como padrão.

Você deve instalar uma biblioteca de espaço de trabalho em um cluster antes que ela possa ser usada em um bloco de anotações ou trabalho. Consulte Instalar uma biblioteca de espaços de trabalho em um cluster.

As bibliotecas de espaço de trabalho na pasta Compartilhada estão disponíveis para todos os usuários em um espaço de trabalho, enquanto as bibliotecas de espaço de trabalho em uma pasta de usuário estão disponíveis apenas para esse usuário.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas em um espaço de trabalho do Azure Databricks, o armazenamento de arquivos de biblioteca na raiz DBFS é preterido e desabilitado por padrão no Databricks Runtime 15.1 e superior. Consulte O armazenamento de bibliotecas na raiz DBFS foi preterido e desativado por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, arquivos JAR e conectores Spark, para arquivos de espaço de trabalho ou volumes do Catálogo Unity, ou usar repositórios de pacotes de biblioteca. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

Como as bibliotecas de espaço de trabalho diferem das bibliotecas armazenadas com arquivos de espaço de trabalho?

O termo "bibliotecas de espaço de trabalho" refere-se a qualquer biblioteca registada num espaço de trabalho. As bibliotecas de espaço de trabalho aparecem ao lado de blocos de anotações e arquivos de espaço de trabalho e seguem as regras da ACL para seu diretório de contenção.

O termo "arquivos de espaço de trabalho" refere-se a qualquer arquivo arbitrário armazenado no espaço de trabalho. Você pode armazenar pacotes .whl Python como arquivos de espaço de trabalho e, em seguida, registrá-los como bibliotecas de espaço de trabalho. Consulte O que são arquivos de espaço de trabalho?.

Você pode carregar bibliotecas como arquivos de espaço de trabalho. Consulte Uso básico de arquivos de espaço de trabalho.

Embora você possa carregar muitos tipos de arquivo para arquivos de espaço de trabalho, apenas arquivos .whl Python podem ser instalados usando arquivos de espaço de trabalho. Consulte Bibliotecas com escopo de cluster.

No Databricks Runtime 13.3 LTS e superior, você pode usar %pip para instalar arquivos de roda Python armazenados como arquivos de espaço de trabalho. Consulte Instalar um pacote armazenado como um arquivo de espaço de trabalho com %pip.

Criar uma biblioteca de espaços de trabalho

Aviso

Esta funcionalidade já não está disponível. Consulte Criação e instalação de bibliotecas de espaço de trabalho não está mais disponível.

  1. Clique com o botão direito do rato na pasta da área de trabalho onde pretende armazenar a biblioteca.
  2. Selecione Criar > biblioteca. A caixa de diálogo Criar biblioteca é exibida.
  3. Selecione a fonte da biblioteca e siga o procedimento apropriado:

Carregue um arquivo Jar, Python egg ou Python wheel

Nota

A instalação de arquivos de ovo Python foi preterida e será removida em uma versão futura do Databricks Runtime.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas em um espaço de trabalho do Azure Databricks, o armazenamento de arquivos de biblioteca na raiz DBFS é preterido e desabilitado por padrão no Databricks Runtime 15.1 e superior. Consulte O armazenamento de bibliotecas na raiz DBFS foi preterido e desativado por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, arquivos JAR e conectores Spark, para arquivos de espaço de trabalho ou volumes do Catálogo Unity, ou usar repositórios de pacotes de biblioteca. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

  1. Na lista Fonte da biblioteca, selecione Carregar.
  2. Selecione Jar, Python Egg ou Python Whl.
  3. Opcionalmente, insira um nome de biblioteca.
  4. Arraste seu Jar, Ovo ou Whl para a caixa de depósito ou clique na caixa de depósito e navegue até um arquivo. O ficheiro é carregado para dbfs:/FileStore/jars.
  5. Clique em Criar. A tela de status da biblioteca é exibida.

Fazer referência a um arquivo de roda JAR, Python egg ou Python carregado

Você pode criar uma nova biblioteca de espaço de trabalho fazendo referência a arquivos JAR, Python egg ou Python wheel armazenados na raiz DBFS, no armazenamento de objetos ou com arquivos de espaço de trabalho. Seguir esse fluxo de trabalho registra um ponteiro para uma biblioteca sem carregar ou mover arquivos.

Com o Databricks Runtime 13.2 e superior, você também pode fazer referência a um volume no Unity Catalog. Esse recurso está em Visualização Pública.

Para o allowlistmodo de acesso compartilhado, você deve adicionar JARs ao . Consulte Bibliotecas Allowlist e scripts init em computação compartilhada.

  1. Selecione Caminho do arquivo/ADLS na lista de botões Código-fonte da biblioteca.
  2. Selecione Jar, Python Egg ou Python Whl.
  3. Opcionalmente, insira um nome de biblioteca.
  4. Especifique o caminho para a biblioteca, como os seguintes exemplos:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Clique em Criar. A tela de status da biblioteca é exibida.

Para obter mais informações sobre como trabalhar com bibliotecas no armazenamento de objetos, consulte Instalar bibliotecas do armazenamento de objetos.

Para obter mais informações sobre arquivos de espaço de trabalho, consulte Trabalhar com arquivos no Azure Databricks.

Instalar uma biblioteca de espaços de trabalho em um cluster

Nota

O Azure Databricks processa todas as bibliotecas de espaço de trabalho na ordem em que foram instaladas no cluster. Talvez seja necessário prestar atenção à ordem de instalação no cluster se houver dependências entre bibliotecas.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas em um espaço de trabalho do Azure Databricks, o armazenamento de arquivos de biblioteca na raiz DBFS é preterido e desabilitado por padrão no Databricks Runtime 15.1 e superior. Consulte O armazenamento de bibliotecas na raiz DBFS foi preterido e desativado por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, arquivos JAR e conectores Spark, para arquivos de espaço de trabalho ou volumes do Catálogo Unity, ou usar repositórios de pacotes de biblioteca. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

No modo de acesso de usuário único, a identidade da entidade atribuída (um usuário ou entidade de serviço) é usada. No modo de acesso compartilhado, as bibliotecas usam a identidade do usuário que instalou a biblioteca. O modo de acesso compartilhado sem isolamento não oferece suporte a volumes, mas usa a mesma atribuição de identidade que o modo de acesso compartilhado.

Para ver todas as opções de instalação de bibliotecas em clusters, consulte Bibliotecas de cluster.

Para instalar uma biblioteca que já existe no espaço de trabalho, você pode iniciar a partir da interface do usuário do cluster ou da interface do usuário da biblioteca:

Cluster

  1. Na barra lateral, clique em ícone de computação Computar.
  2. Clique num nome de cluster.
  3. Clique na guia Bibliotecas .
  4. Clique em Instalar novo.
  5. Na lista de botões Origem da Biblioteca, selecione Biblioteca de Espaço de Trabalho.
  6. Selecione uma biblioteca de espaço de trabalho.
  7. Clique em Install (Instalar).

Biblioteca

  1. Vá para a pasta que contém a biblioteca.
  2. Clique no nome da biblioteca.
  3. Marque a caixa de seleção ao lado do cluster no qual você deseja instalar a biblioteca e clique em Instalar. Apenas os clusters em execução aparecem na lista.

Exibir detalhes da biblioteca do espaço de trabalho

Nota

As pastas de espaço de trabalho oferecem conveniência para descobrir bibliotecas de espaço de trabalho e gerenciar ACLs.

  1. Vá para a pasta de espaço de trabalho que contém a biblioteca.
  2. Clique no nome da biblioteca.

A página de detalhes da biblioteca mostra os clusters em execução e o status de instalação da biblioteca. Se a biblioteca estiver instalada, a página conterá um link para o host do pacote. Se a biblioteca foi carregada, a página exibe um link para o arquivo de pacote carregado.

Mover uma biblioteca de espaços de trabalho

Nota

As pastas de espaço de trabalho oferecem conveniência para descobrir bibliotecas de espaço de trabalho e gerenciar ACLs. Mover uma biblioteca de espaço de trabalho não move arquivos, mas pode modificar quais usuários têm acesso à biblioteca de espaço de trabalho.

  1. Vá para a pasta de espaço de trabalho que contém a biblioteca.
  2. Clique com o botão direito do mouse no nome da biblioteca e selecione Mover. Um navegador de pastas é exibido.
  3. Clique na pasta de destino.
  4. Clique em Mover.

Excluir uma biblioteca de espaço de trabalho

Importante

Antes de excluir uma biblioteca de espaço de trabalho, você deve desinstalá-la de todos os clusters.

Para excluir uma biblioteca de espaços de trabalho:

  1. Mova a biblioteca para a pasta Lixeira.
  2. Exclua permanentemente a biblioteca na pasta Lixo ou esvazie a pasta Lixeira.