Conectar-se ao Labelbox
O Labelbox é uma plataforma de dados de treinamento usada para criar dados de treinamento com base em imagens, vídeo, áudio, texto, e imagens em blocos. Usando o Labelbox, as equipes de IA podem personalizar um fluxo de trabalho para operar, gerenciar e aprimorar o rotulamento de dados, a catalogação de dados e a depuração de modelo em uma plataforma unificada. O Labelbox foi projetado para ajudar as equipes de IA a criar e operar sistemas de machine learning de nível de produção.
Você pode conectar seus clusters do Azure Databricks que têm a versão do Machine Learning do Databricks Runtime ao Labelbox.
Conectar-se ao Labelbox usando o Partner Connect
Esta seção descreve como conectar um cluster em seu workspace do Azure Databricks ao Labelbox usando o Partner Connect.
Diferenças entre conexões padrão e Labelbox
Para se conectar ao Labelbox usando o Partner Connect, siga as etapas em Conectar-se a parceiros de ML usando o Partner Connect. A conexão do Labelbox é diferente das conexões de machine learning padrão das seguintes maneiras:
- Além de um cluster, uma entidade de serviço e um token de acesso pessoal, o Partner Connect criará um notebook chamado
labelbox_databricks_example.ipynb
na pasta Workspace/Shared/labelbox_demo em sua conta do Labelbox, caso ainda não exista.
Etapas para se conectar
Para se conectar ao Labelbox usando o Partner Connect, faça o seguinte:
- Conectar-se a parceiros de ML usando o Partner Connect.
- Crie uma chave de API do Labelbox para sua conta do Labelbox, caso não tenha uma. Copie a chave de API e salve-a em um local seguro, pois a chave será ocultada, e você precisará dela mais tarde.
- Configurar o cluster de ML e o notebook inicial do Labelbox.
Conectar-se ao Labelbox manualmente
As etapas nesta seção descrevem como conectar o Labelbox a um cluster do Azure Databricks.
Observação
Para se conectar mais rapidamente, use o Partner Connect.
Requisitos
Você precisa ter um cluster disponível executando o Databricks Runtime para Machine Learning. Para verificar isso em um cluster existente, procure ML na coluna Runtime ao ver o cluster no seu workspace. Se você não tiver um cluster de ML do Databricks Runtime disponível, crie um e, em Versão do Databricks Runtime, escolha uma versão na lista ML.
Etapas para se conectar
Para se conectar ao Labelbox manualmente, faça o seguinte:
- Acesse a página do Labelbox para se inscrever em uma nova conta do Labelbox ou para fazer logon na sua conta existente do Labelbox.
- Crie uma chave de API do Labelbox para sua conta do Labelbox, caso não tenha uma. Copie a chave de API e salve-a em um local seguro, pois a chave será ocultada, e você precisará dela mais tarde.
- Verifique se há um notebook inicial do Labelbox no seu workspace:
- Na barra lateral, clique em Workspace > Compartilhado.
- Se uma pasta chamada labelbox_demo ainda não existir, crie-a: i. Clique na seta para baixo ao lado de Compartilhado.
ii. Clique em Criar > Pasta.
III. Insira
labelbox_demo
, iv. Clique em Criar Pasta. - Clique na pasta labelbox_demo. Se um notebook inicial chamado labelbox_databricks_example.ipynb não existir na pasta, importe-o: i. Clique na seta para baixo ao lado de labelbox_demo.
ii. Clique em Importar.
III. Clique em URL.
iv. Insira
https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb
e clique em Importar.
- Continue a configurar o cluster de ML e o notebook inicial do Labelbox.
Configurar o cluster de ML e o notebook inicial do Labelbox
- Verifique se as bibliotecas do Labelbox necessárias estão instaladas no cluster de ML:
Na barra lateral, clique em Computação.
Clique no cluster de ML. Use a caixa Filtro para encontrá-lo, se necessário.
Observação
Se você usou o Partner Connect para se conectar ao Labelbox, o nome do cluster de ML deverá ser LABELBOX_CLUSTER.
Clique na guia Bibliotecas.
Se o pacote labelbox não estiver listado, instale-o: i. Clique em Instalar Novo. ii. Clique em PyPI. III. Em Pacote, insira labelbox. iv. Clique em Instalar.
Se o pacote labelspark não estiver listado, instale-o: i. Clique em Instalar Novo. ii. Clique em PyPI. III. Em Pacote, insira labelspark. iv. Clique em Instalar.
- Anexe o cluster de ML ao notebook inicial:
- Na barra lateral, clique em Workspace > Compartilhado > labelbox_demo > labelbox_databricks_example.ipynb.
- Anexe o cluster de ML ao notebook.
- Navegue pelo notebook para saber como automatizar o Labelbox.
Recursos adicionais
- README no GitHub para o notebook inicial
- Documentos do Labelbox
- Suporte