连接到 SuperAnnotate
SuperAnnotate 的 Python SDK 与 Azure Databricks 集成,提供一个一体化的 AI 数据基础结构平台,可帮助使用 Azure Databricks 的详尽数据管理、分布式计算和机器学习功能对高质量训练数据进行批注、调试、管理和版本化。
SuperAnnotate 连接器通过将批注数据转换为 Apache Spark 数据帧来简化此过程,使 ML 团队能够将注意力从数据整理转移到训练机器学习模型。 此协作能够设置主动学习工作流,其中低置信度预测会自动路由到 SuperAnnotate 平台。
要求
与 SuperAnnotate 集成之前,必须具备以下各项:
使用 Partner Connect 连接到 SuperAnnotate
注意
对于 SuperAnnotate,Partner Connect 仅支持 SQL 仓库。
要使用 Partner Connect 将 Azure Databricks 工作区连接到 SuperAnnotate,请执行以下操作:
- 在边栏中单击 “Partner Connect”。
- 单击合作伙伴磁贴。
- 检查提供的信息,然后单击“下一步”。
你将重定向到 SuperAnnotate,在其中可以注册或登录(如果已有帐户)。
执行这些步骤后,将为你创建一个组织,以及名为“我的团队”的第一个团队。 你的组织还将自动拥有一个 Databricks 集成(值如步骤 3 中所提供),其在默认情况下将会添加到团队中。
后续步骤
通过 Partner Connect 设置组织和团队后,需要创建 LLM 和 GenAI 项目。 根据要导入的数据设置窗体,并添加具有 Databricks 集成的项。
其他资源
浏览以下 SuperAnnotate 资源: