Criar um bloco de anotações parametrizado usando o Papermill
Importante
O Azure Data Studio será desativado em 28 de fevereiro de 2026. Recomendamos que você use Visual Studio Code. Para obter mais informações sobre como migrar para o Visual Studio Code, visite O que está acontecendo com o Azure Data Studio?
A parametrização no Azure Data Studio está executando o mesmo bloco de anotações com um conjunto diferente de parâmetros.
Este artigo mostra como criar e executar um bloco de anotações parametrizado no Azure Data Studio usando o kernel do Python.
Nota
Atualmente, você pode usar a parametrização com kernels Python, PySpark, PowerShell e .NET Interactive.
Pré-requisitos
Instalar e configurar o Papermill no Azure Data Studio
Todas as etapas nesta seção são executadas dentro de um bloco de anotações do Azure Data Studio.
Crie um novo bloco de notas. Altere o kernel para Python 3:
Se você for solicitado a atualizar seus pacotes Python quando os pacotes precisarem de atualização, selecione Sim:
Instale o Moinho de Papel:
import sys !{sys.executable} -m pip install papermill --no-cache-dir --upgrade
Verifique se o Papermill está instalado:
import sys !{sys.executable} -m pip list
Para verificar se o Papermill foi instalado corretamente, verifique a versão do Papermill:
import papermill papermill
Exemplo de parametrização
Você pode usar um arquivo de bloco de anotações de exemplo para percorrer as etapas neste artigo:
- Vá para o arquivo do bloco de anotações no GitHub. Selecione Raw.
- Selecione Ctrl+S ou clique com o botão direito do mouse e salve o arquivo com a extensão .ipynb.
- Abra o arquivo no Azure Data Studio.
Configurar um bloco de notas parametrizado
Você pode começar com o bloco de anotações de exemplo aberto no Azure Data Studio ou concluir as etapas a seguir para criar um bloco de anotações. Em seguida, tente usar parâmetros diferentes. Todas as etapas são executadas dentro de um bloco de anotações do Azure Data Studio.
Verifique se o Kernel está definido como Python 3:
Crie uma nova célula de código. Selecione Parâmetros para marcar a célula como uma célula de parâmetros.
x = 2.0 y = 5.0
Adicione outras células para testar parâmetros diferentes:
addition = x + y multiply = x * y
print("Addition: " + str(addition)) print("Multiplication: " + str(multiply))
Depois que todas as células forem executadas, a saída será semelhante a este exemplo:
Salve o bloco de anotações como Input.ipynb:
Executar um caderno Papermill
Você pode executar o Papermill de duas maneiras:
- Interface de Linha de Comandos (CLI)
- API Python
Execução parametrizada da CLI
Para executar um bloco de anotações usando a CLI, no terminal, digite o papermill
comando com o bloco de anotações de entrada, o local do bloco de anotações de saída e as opções.
Nota
Para saber mais, consulte a documentação da CLI da Papermill.
Execute o bloco de notas de entrada com novos parâmetros:
papermill Input.ipynb Output.ipynb -p x 10 -p y 20
Este comando executa o bloco de notas de entrada com novos valores para os parâmetros x e y.
Uma nova célula rotulada
# Injected-Parameters
contém os novos valores de parâmetro que foram passados através da CLI. Os novos# Injected-Parameters
valores são usados para a nova saída mostrada na última célula:
Execução parametrizada da API Python
Nota
Para saber mais, consulte a documentação do Papermill Python.
Crie um novo bloco de notas. Altere o kernel para Python 3:
Adicione uma nova célula de código. Em seguida, use a API Python do Papermill para executar e gerar o bloco de anotações parametrizado de saída:
import papermill as pm pm.execute_notebook( '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Input.ipynb', '/Users/vasubhog/GitProjects/AzureDataStudio-Notebooks/Demo_Parameterization/Output.ipynb', parameters = dict(x = 10, y = 20) )
Uma nova célula rotulada
# Injected-Parameters
contém os novos valores de parâmetro que foram passados. Os novos# Injected-Parameters
valores são usados para a nova saída mostrada na última célula:
Próximos passos
Saiba mais sobre notebooks e parametrização: