连接到 John Snow Labs

John Snow Labs 通过以下产品在自然语言处理 (NLP) 中提供生产级、可缩放、可训练版本的最新研究成果:

  • Spark NLP:适用于 Python、Java 或 Scala 的一流 NLP。
  • Spark NLP for Healthcare:一流的临床和生物医学 NLP。
  • Spark OCR:可缩放、专用且高度准确的 OCR 和去标识化库。

可将 Azure Databricks 群集与 John Snow Labs 集成。

注意

John Snow Labs 不与 Databricks SQL 仓库(以前称为 Databricks SQL 终结点)集成。

使用 Partner Connect 连接到 John Snow Labs

Partner Connect 的步骤涵盖最常用的 NLP 和 OCR 任务:

  • 在 Azure Databricks 工作区中新建群集。
  • 在新群集上自动安装 John Snow Labs NLP 和 OCR 库。
  • 为 John Snow Labs NLP 和 OCR 库创建和部署 30 天的试用版许可证。
  • 将 20 多个随时可用的 Python 笔记本复制到新群集中。

标准连接和 John Snow Labs 的区别

若要使用 Partner Connect 连接到 John Snow Labs,请按照使用 Partner Connect 连接到 ML 合作伙伴中的步骤操作。 John Snow Labs 连接与标准机器学习连接的不同之处在于:

  • 要完成 Partner Connect 步骤,需要一张有效的信用卡。 信用卡需支付试用结束后开始产生的即用即付费用。
  • 按照屏幕上的说明启动 John Snow Labs NLP 试用版后,请检查电子邮件收件箱中是否有来自 John Snow Labs 的邮件,其中包含有关如何开始使用的说明,然后按照邮件中的说明进行操作。 可能需要最多半小时后才能收到此邮件。

连接步骤

若要使用 Partner Connect 将 Azure Databricks 工作区连接到 John Snow Labs,请参阅使用 Partner Connect 连接到 ML 合作伙伴

手动连接到 John Snow Labs

按照这些说明在群集上自动安装 John Snow Labs NLP 和 OCR 库以及笔记本,并激活试用版 John Snow Labs(如果你还没有 John Snow Labs 帐户)。

要求

在与 John Snow Labs 集成之前,必须做好以下准备:

  • Azure Databricks 工作区中的 Azure Databricks 群集

  • 一个 Azure Databricks 个人访问令牌

    注意

    作为安全最佳做法,在使用自动化工具、系统、脚本和应用进行身份验证时,Databricks 建议使用属于服务主体(而不是工作区用户)的个人访问令牌。 若要为服务主体创建令牌,请参阅管理服务主体的令牌

过程

要与 John Snow Labs 集成,请完成以下步骤:

注意

要更快地完成 John Snow Labs 集成,请参阅使用 Partner Connect 连接到 John Snow Labs

  1. 确保满足 John Snow Labs 的要求

  2. 转到 Databricks 上的 John Snow Labs NLP 网页。

  3. 单击“在我的 Databricks 帐户中安装”。

  4. 在“请自我介绍”对话框中,输入你的名字、姓氏和公司电子邮件地址。

  5. 对于“Databricks 实例 URL”,请输入你的 Azure Databricks 工作区 URL,例如 https://adb-1234567890123456.7.azuredatabricks.net/?o=1234567890123456

  6. 对于“Databricks 访问令牌”,请输入本文要求部分中所述的令牌值。

  7. 单击“测试连接”。

  8. 连接成功后,对于“选择要安装到的群集”,请选择本文要求部分中所述的群集。

  9. 单击“获取试用许可证”。

  10. 检查电子邮件收件箱中是否收到了来自 John Snow Labs 的邮件,其中包含验证电子邮件地址的请求。

  11. 在该邮件中,单击“验证我的电子邮件”。

  12. 几分钟后,再次检查电子邮件收件箱中是否收到了来自 John Snow Labs 的另一封邮件,其中包含有关如何开始使用的说明。 请注意,在某些情况下,可能需要在长达半小时之后才能收到此邮件。

  13. 按照消息中的说明进行操作。

    注意

    若要在群集上手动安装 John Snow Labs 库和笔记本,请参阅 John Snow Labs 网站上的以下资源:

  14. 要升级试用版 John Snow Labs,请在 https://my.johnsnowlabs.com/login 上登录到你的 John Snow Labs 帐户。

  15. 继续执行后续步骤。

后续步骤

在 John Snow Labs 网站上浏览以下一个或多个资源: