Partager via


Se connecter à Labelbox

Labelbox est une plateforme de données de formation qui est utilisée pour créer des données de formation à partir d’images, de vidéos, de fichiers audio, de texte et de vignettes. À l’aide de Labelbox, les équipes d’IA peuvent personnaliser un workflow pour qu’il utilise, gère et améliore l’étiquetage des données, le catalogage des données et le débogage des modèles au sein d’une même plateforme unifiée. Labelbox est conçu pour aider les équipes d’IA à créer et à utiliser des systèmes de machine learning de production.

Vous pouvez connecter à Labelbox les clusters Azure Databricks qui disposent de Databricks Runtime version Machine Learning.

Se connecter à Labelbox à l’aide de Partner Connect

Cette section explique comment connecter un cluster dans votre espace de travail Azure Databricks à Labelbox à l’aide de Partner Connect.

Différences entre les connexions standard et Labelbox

Pour vous connecter à Labelbox à l’aide de Partner Connect, suivez les étapes décrites dans l’article Se connecter à des partenaires ML à l’aide de Partner Connect. La connexion Labelbox est différente des connexions Machine Learning standard des manières suivantes :

  • En plus d’un cluster, d’un principal de service et d’un jeton d’accès personnel, Partner Connect crée un notebook nommé labelbox_databricks_example.ipynb dans le dossier Workspace/Shared/labelbox_demo de votre compte Labelbox, s’il n’existe pas déjà.

Étapes de connexion

Pour vous connecter à Labelbox à l’aide de Partner Connect, effectuez les actions suivantes :

  1. Connectez-vous à des partenaires ML à l’aide de Partner Connect.
  2. Créez une clé API Labelbox pour votre compte Labelbox, si vous n’en avez pas déjà une. Copiez la clé API et enregistrez-la dans un emplacement sécurisé, parce que la clé sera masquée et que vous en aurez besoin plus tard.
  3. Configurer le cluster ML et le notebook de démarrage Labelbox.

Se connecter à Labelbox manuellement

Les étapes de cette section expliquent comment connecter Labelbox à un cluster Azure Databricks.

Notes

Pour vous connecter plus rapidement, utilisez Partner Connect.

Exigences

Vous devez disposer d’un cluster disponible exécutant Databricks Runtime pour Machine Learning. Pour vérifier cela sur un cluster existant, recherchez ML dans la colonne Runtime lorsque vous affichez le cluster dans votre espace de travail. Si vous n’avez pas de cluster ML Databricks Runtime disponible, créez un cluster et, pour Databricks Runtime Version (Version de Databricks Runtime), choisissez une version dans la liste ML.

Étapes de connexion

Pour établir une connexion à Labelbox manuellement, procédez comme suit :

  1. Accédez à la page Labelbox afin de vous inscrire pour obtenir un nouveau compte Labelbox ou pour vous connecter à votre compte Labelbox existant.
  2. Créez une clé API Labelbox pour votre compte Labelbox, si vous n’en avez pas déjà une. Copiez la clé API et enregistrez-la dans un emplacement sécurisé, parce que la clé sera masquée et que vous en aurez besoin plus tard.
  3. Recherchez un notebook de démarrage Labelbox dans votre espace de travail :
    1. Dans la barre latérale, cliquez sur Workspace > Shared (Espace de travail > Partagé).
    2. Si le dossier labelbox_demo n’existe pas encore, créez-le : i. Cliquez sur la flèche bas en regard de Shared (Partagé). ii. Cliquez sur Create > Folder (Créer > Dossier). iii. Entrez labelbox_demo, iv. Cliquez sur Create Folder (Créer un dossier).
    3. Cliquez sur le dossier labelbox_demo. Si un notebook de démarrage nommé labelbox_databricks_example.ipynb ne se trouve pas dans le dossier, importez-le : i. Cliquez sur la flèche bas en regard de labelbox_demo. ii. Cliquez sur Importer. iii. Cliquez sur URL. iv. Entrez https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb et cliquez sur Import.
  4. Continuez pour configurer le cluster ML et le notebook de démarrage Labelbox.

Configurer le cluster ML et le notebook de démarrage Labelbox

  1. Vérifiez que les bibliothèques Labelbox nécessaires sont installées dans votre cluster ML :
    1. Dans la barre latérale, cliquez sur Compute (Calcul).

    2. Cliquez sur votre cluster ML. Utilisez la zone Filter (Filtrer) pour le trouver, si nécessaire.

      Notes

      Si vous avez utilisé Partner Connect pour vous connecter à Labelbox, le nom du cluster ML doit être LABELBOX_CLUSTER.

    3. Cliquez sur l’onglet Bibliothèques.

    4. Si le package labelbox n’est pas listé, installez-le : i. Cliquez sur Installer. ii. Cliquez sur PyPI. iii. Pour Package, entrez labelbox. iv. Cliquez sur Installer.

    5. Si le package labelspark n’est pas listé, installez-le : i. Cliquez sur Installer. ii. Cliquez sur PyPI. iii. Pour Package, entrez labelspark. iv. Cliquez sur Installer.

  2. Attachez votre cluster ML au notebook de démarrage :
    1. Dans la barre latérale, cliquez sur Espace de travail > Partagé > labelbox_demo > labelbox_databricks_example.ipynb.
    2. Attachez votre cluster ML au notebook.
  3. Parcourez le notebook pour découvrir comment automatiser Labelbox.

Ressources supplémentaires