SuperAnnotate に接続する
SuperAnnotate の Python SDK は Azure Databricks と統合され、Azure Databricks の包括的なデータ管理、分散コンピューティング、機械学習機能を使用して、最高品質のトレーニング データへの注釈、デバッグ、管理、バージョン管理に役立つオールインワンの AI データ インフラストラクチャ プラットフォームを提供します。
SuperAnnotate コネクタは、注釈データを Apache Spark データフレームに変換して、このプロセスを簡略化します。これにより、ML チームはデータ ラングリングから機械学習モデルのトレーニングに焦点を移すことができます。 このコラボレーションには、信頼度の低い予測が SuperAnnotate プラットフォームに自動的にルーティングされるアクティブ ラーニング ワークフローを設定する機能が含まれています。
要件
SuperAnnotate と統合する前に、次のものが必要です。
Azure Databricks ワークスペース内の Databricks SQL ウェアハウス。
Azure Databricks 個人用アクセス トークン。
Note
セキュリティのベスト プラクティスとして、自動化ツール、システム、スクリプト、アプリを使用して認証する場合、Databricks では、ワークスペース ユーザーではなくサービス プリンシパルに属する個人用アクセス トークンを使用することを推奨しています。 サービス プリンシパルのトークンを作成するには、「サービス プリンシパルのトークンを管理する」をご覧ください。
Partner Connect を使用して SuperAnnotate に接続する
Note
Partner Connect では、SuperAnnotate に対して SQL ウェアハウスのみがサポートされています。
Partner Connect を使用して Azure Databricks ワークスペースを SuperAnnotate に接続するには、次の操作を行います。
- サイド バーで、 [Partner Connect] をクリックします。
- パートナー タイルをクリックします。
- 提供された情報を確認し、[次へ] をクリックします。
SuperAnnotate にリダイレクトされ、サインアップするか、既にアカウントをお持ちの場合はログインできます。
これらの手順の後、My Team という名前の最初のチームと共に組織が作成されます。 また、組織は、手順 3 で指定した値と Databricks を自動的に統合し、既定でチームに追加されます。
次のステップ
Partner Connect を使用して組織とチームを設定したら、LLM と GenAI プロジェクトを作成する必要があります。 インポートするデータに従ってフォームを設定し、Databricks 統合を使用して項目を追加します。
その他のリソース
次の SuperAnnotate リソースについて調べます。