Conectar a John Snow Labs
John Snow Labs proporciona versiones de producción, escalables y entrenables de la investigación más reciente en procesamiento de lenguaje natural (NLP) a través de los siguientes productos:
- Spark NLP: NLP de última generación para Python, Java o Scala.
- Spark NLP for Healthcare: NLP clínico y biomédico de última generación.
- OCR de Spark: una biblioteca OCR escalable, privada y altamente precisa.
Puede integrar los clústeres de Azure Databricks con John Snow Labs.
Nota:
John Snow Labs no se integra con los almacenes de Databricks SQL (anteriormente conocidos como puntos de conexión de Databricks SQL).
Conexión a John Snow Labs con Partner Connect
En los pasos de Partner Connect se tratan las tareas de NLP y OCR más populares:
- Cree un nuevo clúster en el área de trabajo de Azure Databricks.
- Instale automáticamente las bibliotecas NLP y OCR de John Snow Labs en el nuevo clúster.
- Cree e implemente una licencia de prueba de 30 días para las bibliotecas NLP y OCR de John Snow Labs.
- Copie cuadernos de Python listos para usar más de 20 en el nuevo clúster.
Diferencias entre las conexiones estándar y John Snow Labs
Para conectarse a John Snow Labs con Partner Connect, siga los pasos descritos en el artículo Conexión a partners de ML con Partner Connect. La conexión John Snow Labs se diferencia de las conexiones estándar de aprendizaje automático en los siguientes aspectos:
- Para completar los pasos de Partner Connect, necesita una tarjeta de crédito válida. La tarjeta de crédito está sujeta a cargos de pago por uso que comienzan después de que finalice la prueba.
- Después de seguir las instrucciones en pantalla para iniciar la prueba de NLP de John Snow Labs, compruebe la bandeja de entrada de correo electrónico para ver un mensaje de John Snow Labs que contiene instrucciones sobre cómo empezar. A continuación, siga las instrucciones del mensaje. Este mensaje puede tardar hasta media hora en llegar.
Pasos para establecer la conexión
Para conectar el área de trabajo de Azure Databricks con John Snow Labs con Partner Connect, consulte el artículo Conexión a partners de Machine Learning mediante Partner Connect.
Conexión manual a John Snow Labs
Siga estas instrucciones para instalar automáticamente las bibliotecas y cuadernos de OCR de John Snow Labs en el clúster y para activar la evaluación gratuita, si no tiene aún una cuenta de John Snow Labs.
Requisitos
Antes de integrar con John Snow Labs, debe tener lo siguiente:
Un clúster de Azure Databricks en el área de trabajo de Azure Databricks.
Un token de acceso personal de Azure Databricks.
Nota:
Como procedimiento recomendado de seguridad, cuando se autentique con herramientas, sistemas, scripts y aplicaciones automatizados, Databricks recomienda usar los tokens de acceso personal pertenecientes a las entidades de servicio en lugar de a los usuarios del área de trabajo. Para crear tókenes para entidades de servicio, consulte Administración de tokens de acceso para una entidad de servicio.
Procedimiento
Para realizar la integración con John Snow Labs, complete estos pasos:
Nota:
Para completar la integración de John Snow Labs más rápido, consulte Conectar a John Snow Labs mediante Partner Connect.
Asegúrese de cumplir los requisitos de John Snow Labs.
Vaya a la página web de NLP de John Snow Labs en Databricks.
Haga clic en Instalar en mi cuenta de Databricks.
En el cuadro de diálogo Háganoslo saber, escriba su nombre, apellidos y dirección de correo electrónico de la empresa.
En Dirección URL de la instancia de Databricks, escriba la dirección URL del área de trabajo de Azure Databricks, por ejemplo
https://adb-1234567890123456.7.azuredatabricks.net/?o=1234567890123456
.En Token de acceso de Databricks, escriba el valor del token de los requisitos en este artículo.
Haga clic en Test connection (Probar conexión).
Una vez que la conexión se haya realizado correctamente, en Elegir clúster en el que se va a instalar, seleccione el clúster a partir de los requisitos en este artículo.
Haga clic en Obtener licencia de prueba.
Compruebe la bandeja de entrada de correo electrónico para ver el mensaje de John Snow Labs que contiene una solicitud para validar su dirección de correo electrónico.
En el mensaje, haga clic en Validar mi correo electrónico.
Después de unos minutos, vuelva a comprobar la bandeja de entrada de correo electrónico para ver el otro mensaje de John Snow Labs que contiene instrucciones sobre cómo empezar. Tenga en cuenta que, en algunos casos, este mensaje puede tardar hasta media hora en llegar.
Siga las instrucciones del mensaje.
Nota:
Para instalar manualmente las bibliotecas y cuadernos de John Snow Labs en el clúster, consulte lo siguiente en el sitio web de John Snow Labs:
Para actualizar la evaluación gratuita de 30 días de John Snow Labs, inicie sesión en su cuenta de John Snow Labs, en https://my.johnsnowlabs.com/login.
Continúe con los pasos siguientes.
Pasos siguientes
Explore uno o varios de los siguientes recursos en el sitio web de John Snow Labs: