microsoftml (paquete de Python en SQL Server Machine Learning Services)
Se aplica a: SQL Server 2017 (14.x) y versiones posteriores
microsoftml es un paquete de Python de Microsoft que proporciona algoritmos de aprendizaje automático de alto rendimiento. Incluye funciones para el entrenamiento y las transformaciones, la puntuación, el análisis de texto y de imágenes, y la extracción de características para derivar valores a partir de datos existentes. El paquete se incluye en SQL Server Machine Learning Services y admite un alto rendimiento en macrodatos, mediante el procesamiento de varios núcleos y un flujo de datos rápido.
Detalles del paquete | Information |
---|---|
Versión actual: | 9,4 |
Fecha de compilación: | Distribución Anaconda 4.2 de Python 3.7.1 |
Distribución de paquetes: | SQL Server Machine Learning Services versión 2017 o 2019. |
Cómo usar microsoftml
El módulo microsoftml se instala como parte de SQL Server Machine Learning Services cuando se agrega Python a la instalación. El usuario obtiene la colección completa de paquetes de su propiedad más una distribución de Python con sus módulos e intérpretes. Puede usar cualquier IDE de Python para escribir funciones de llamada de script de Python en microsoftml, pero el script debe ejecutarse en un equipo que tenga SQL Server Machine Learning Services con Python.
Microsoftml y revoscalepy están estrechamente ligados; así, los orígenes de datos usados en microsoftml se definen como objetos de revoscalepy. Las limitaciones de contexto de proceso de revoscalepy se trasladan a microsoftml; es decir, todas las funciones están disponibles para las operaciones locales, pero cambiar a un contexto de proceso remoto requiere RxSpark o RxInSQLServer.
Versiones y plataformas
El módulo microsoftml solo está disponible cuando se instala uno de los siguientes productos o descargas de Microsoft:
- SQL Server Machine Learning Services
- Bibliotecas de cliente de Python para un cliente de ciencia de datos
Nota:
En SQL Server 2017, las versiones completas del producto son solo para Windows. Para microsoftml en SQL Server 2019, se admiten tanto Windows como Linux.
Dependencias de paquetes
Los algoritmos de microsoftml dependen de revoscalepy para:
- Objetos de origen de datos: los datos consumidos por las funciones de microsoftml se crean mediante las funciones de revoscalepy.
- Informática remota (desplazamiento de la ejecución de funciones a una instancia remota de SQL Server): el paquete revoscalepy proporciona funciones para crear y activar un contexto de proceso remoto para SQL Server.
En la mayoría de los casos, los paquetes se cargarán juntos siempre que se use microsoftml.
Funciones por categoría
En esta sección se enumeran las funciones por categoría, para darle una idea del uso de cada una de ellas. También puede usar la tabla de contenido para ver las funciones en orden alfabético.
1- Funciones de aprendizaje
Función | Descripción |
---|---|
microsoftml.rx_ensemble | Entrena un conjunto de modelos. |
microsoftml.rx_fast_forest | Bosque aleatorio. |
microsoftml.rx_fast_linear | Modelo lineal. con el ascenso estocástico dual de coordenadas. |
microsoftml.rx_fast_trees | Árboles impulsados. |
microsoftml.rx_logistic_regression | Regresión logística. |
microsoftml.rx_neural_network | Red neuronal. |
microsoftml.rx_oneclass_svm | Detección de anomalías. |
2-Funciones de transformación
Control de variables de categorías
Función | Descripción |
---|---|
microsoftml.categorical | Convierte una columna de texto en categorías. |
microsoftml.categorical_hash | Aplica y convierte una columna de texto en categorías. |
Manipulación de esquemas
Función | Descripción |
---|---|
microsoftml.concat | Concatena varias columnas en un único vector. |
microsoftml.drop_columns | Quita columnas de un conjunto de datos. |
microsoftml.select_columns | Conserva las columnas de un conjunto de datos. |
Selección de variables
Función | Descripción |
---|---|
microsoftml.count_select | Selecciona características basadas en recuentos. |
microsoftml.mutualinformation_select | Selecciona características basadas en la información mutua. |
Análisis de texto
Función | Descripción |
---|---|
microsoftml.featurize_text | Convierte las columnas de texto en características numéricas. |
microsoftml.get_sentiment | Análisis de sentimiento. |
Análisis de imagen
Función | Descripción |
---|---|
microsoftml.load_image | Carga una imagen. |
microsoftml.resize_image | Ajusta el tamaño de una imagen. |
microsoftml.extract_pixels | Extrae píxeles de una imagen. |
microsoftml.featurize_image | Convierte una imagen en características. |
Funciones de características
Función | Descripción |
---|---|
microsoftml.rx_featurize | Transformación de datos para orígenes de datos |
Funciones de puntuación
Función | Descripción |
---|---|
microsoftml.rx_predict | Puntuaciones mediante un modelo de aprendizaje automático de Microsoft |
Cómo llamar a microsoftml
Las funciones de microsoftml se pueden llamar en código Python encapsulado en procedimientos almacenados. La mayoría de los desarrolladores compilan soluciones de microsoftml localmente y, después, migran el código Python final a los procedimientos almacenados como un ejercicio de implementación.
El paquete microsoftml para Python está instalado de forma predeterminada, pero a diferencia de revoscalepy, no se carga de forma predeterminada cuando se inicia una sesión de Python con los ejecutables de Python instalados con SQL Server.
Como primer paso, importe el paquete de microsoftml e importe revoscalepy si necesita usar contextos de cálculo remotos o conectividad u objetos de origen de datos relacionados. Después, haga referencia a las funciones individuales que necesite.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource