Partilhar via


Gerir o formato do bloco de notas

Este artigo descreve o formato de bloco de notas predefinido no Azure Databricks, como alterar o formato do bloco de notas e como gerir confirmações se o bloco de notas estiver numa pasta controlada pelo código-fonte.

Por padrão, os blocos de anotações no Databricks são criados no formato .ipynb (IPython ou Jupyter). Você também pode optar por usar o formato de origem.

Você ainda pode importar e exportar blocos de anotações em vários formatos. Consulte Exportar e importar blocos de anotações Databricks.

Formatos de portátil

O Databricks suporta a criação e edição de blocos de anotações em dois formatos: IPYNB (padrão) e source.

Você pode gerir arquivos de origem, incluindo blocos de notas, usando pastas Git. Apenas determinados tipos de ativos Databricks são suportados nas pastas Git. O formato do notebook tem implicações sobre quais saídas são enviadas para o repositório remoto, conforme descrito na secção table abaixo.

Formato de origem do bloco de notas Detalhes
fonte Um formato básico que captura apenas o código-fonte, com um sufixo que sinaliza a linguagem de código, como .py, .scala, .r e .sql.
IPYNB (Jupyter) Um formato avançado que captura código-fonte, ambiente de bloco de anotações, definições de visualização, widgets de bloco de anotações e saídas opcionais. Um notebook IPYNB pode conter código em qualquer idioma suportado pelos notebooks Databricks (apesar da parte py do .ipynb). O formato IPYNB (Jupyter) permite que o usuário opcionalmente confirme saídas. O IPYNB também suporta uma melhor experiência de visualização para notebooks Databricks em repositórios Git remotos.

Para distinguir os blocos de anotações Databricks dos arquivos Python, Scala e SQL comuns, o Azure Databricks adiciona o comentário "Databricks notebook source" à parte superior dos blocos de anotações Python, Scala e SQL. Esse comentário garante que o Azure Databricks analise corretamente o arquivo como um bloco de anotações, em vez de um arquivo de script.

Observação

O que são "saídas"?

As saídas são os resultados da execução de um notebook na plataforma Databricks, incluindo apresentações e visualizações table.

Alterar a configuração de formato padrão do notebook

Os blocos de anotações IPYNB são o formato padrão ao criar um novo bloco de anotações no Azure Databricks.

Para alterar o formato padrão para Azure Databricks, inicie sessão no seu espaço de trabalho do Azure Databricks, clique no seu perfil no canto superior direito da página, clique em Configurações e navegue até Programador. Altere o formato padrão do notebook nas definições de Editor sob o cabeçalho .

Alterar o formato padrão do bloco de anotações nas configurações do desenvolvedor do seu perfil

Converter formato de bloco de notas

Você pode converter um bloco de anotações existente em outro formato por meio da interface do usuário do Azure Databricks.

Para converter um bloco de notas existente para outro formato:

  1. Abra o bloco de notas na sua área de trabalho.

  2. Select Arquivo no menu do espaço de trabalho, depois selectformato de Bloco de Anotaçõese, em seguida, escolha o formato desejado. Você pode escolher Jupyter (.ipynb) (Recomendado) ou Source (.scala, .py, .sql, .r). O formato atual do bloco de notas está a cinzento e tem uma marca de verificação ao lado.

    O menu do ficheiro do espaço de trabalho, expandido, mostrando a opção de formato do notebook.

Para obter mais informações sobre os tipos de notebooks suportados no Azure Databricks, leia Exportar e importar notebooks Databricks.

Gerenciar confirmações de saída de notebook IPYNB

Para notebooks IPYNB em pastas controladas por controlo de versão, pode gerir como os resultados do notebook são enviados para o repositório remoto.

Permitir confirmação .ipynb saída do notebook

As saídas só podem ser confirmadas se um administrador de espaço de trabalho tiver ativado esse recurso. Por padrão, a configuração administrativa para pastas Git não permite que a saída do bloco de anotações .ipynb seja comitada. Se você tiver privilégios de administrador para o espaço de trabalho, poderá alterar esta configuração:

  1. Vá para Definições de administrador>Definições de espaço de trabalho na consola do administrador do Azure Databricks.

  2. Em pastas Git, escolha Permitir que as pastas Git exportem saídas IPYNB e, em seguida, selectPermitir: as saídas IPYNB podem ser alternadas no.

    Admin Console: permita que as pastas Git exportem saídas IPYNB.

Importante

Quando as saídas são incluídas, as configurações de visualização e de painel são integradas nos cadernos.ipynb que cria.

Gerir os artefatos gerados de saída dos commits do notebook IPYNB

Quando você confirma um arquivo .ipynb, o Databricks cria um arquivo de configuração que permite controlar como você confirma saídas: .databricks/commit_outputs.

  1. Se tiver um ficheiro de bloco de anotações .ipynb, mas nenhum ficheiro de configuração no seu repositório remoto, vá para a caixa de diálogo Status do Git.

  2. Na caixa de diálogo de notificação, selectCriar arquivo commit_outputs.

    interface do usuário de confirmação do Bloco de Anotações: botão Criar arquivo commit_outputs.

Você também pode generate arquivos de configuração no menu File. O menu File tem um controlo para update automaticamente o ficheiro de configuração where. Você pode especificar a inclusão ou exclusão de saídas de dados para um notebook IPYNB específico.

  1. No menu Arquivo, confirmar os resultados dos blocos de notasselect.

    Editor de blocos de anotações: confirme o status e o controle das saídas dos blocos de anotações.

  2. Na caixa de diálogo, confirme sua opção de confirmar as saídas do bloco de anotações.

    caixa de diálogo de registo das saídas dos cadernos.