Máquina del punto de Bayes de dos clases
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Crea un modelo de clasificación binaria de la máquina del punto de Bayes
Categoría: Machine Learning/ Inicializar modelo/Clasificación
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo De máquina de punto Bayes de dos clases en Machine Learning Studio (clásico) para crear un modelo de clasificación binaria sin entrenar.
El algoritmo de este módulo usa un enfoque bayesiano para la clasificación lineal denominada "Bayes Point Machine". Este algoritmo se aproxima eficazmente al promedio bayesiano teóricamente óptimo de clasificadores lineales (en términos de rendimiento de generalización) mediante la elección de un clasificador "promedio", el punto bayes. Dado que la máquina del punto de Bayes es un modelo de clasificación bayesiano, no tiende a sobreajustar los datos de entrenamiento.
Para obtener más información, vea la entrada de Chris Seging en el blog de Microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference (Adopción de la incertidumbre: inferencia probabilística).
Configuración de una Two-Class de punto bayes
En Machine Learning Studio (clásico), agregue el módulo Máquina de punto Bayes de dos clases al experimento. Puede encontrar el módulo en Machine Learning,Inicializar modelo, Clasificación.
En Número de iteraciones de entrenamiento, escriba un número para especificar la frecuencia con la que el algoritmo de paso de mensajes recorre en iteración los datos de entrenamiento. Normalmente, el número de iteraciones debe configurarse con un valor comprendido entre 5 y 100.
Cuanto mayor sea el número de iteraciones de entrenamiento, más precisas serán las predicciones; sin embargo, el aprendizaje será más lento.
Con la mayoría de los conjuntos de datos, el valor predeterminado de 30 iteraciones de entrenamiento es suficiente para que el algoritmo realice predicciones precisas. Algunas veces, se pueden realizar predicciones precisas con menos iteraciones. Para los conjuntos de datos con características muy correlacionadas, puede resultarle útil emplear más iteraciones de entrenamiento.
Seleccione la opción Include bias (Incluir sesgo) si desea que se agregó una característica o sesgo constante a cada instancia en el entrenamiento y la predicción.
Es necesario incluir un sesgo cuando los datos no contienen una característica de constante.
Seleccione la opción Permitir valores desconocidos en características categóricas para crear un grupo para valores desconocidos.
Si desactiva esta opción, el modelo puede aceptar únicamente los valores que se encuentran en los datos de entrenamiento.
Si selecciona esta opción y permite valores desconocidos, el modelo puede ser menos preciso para los valores conocidos, pero puede proporcionar mejores predicciones para los nuevos valores (desconocidos).
Agregue una instancia del módulo Entrenar modelo y los datos de entrenamiento.
Conectar los datos de entrenamiento y la salida del módulo De máquina de punto Bayes de dos clases al módulo Entrenar modelo y elija la columna de etiqueta.
Ejecute el experimento.
Results
Una vez completado el entrenamiento, haga clic con el botón derecho en la salida del módulo Entrenar modelo para ver los resultados:
Para ver un resumen de los parámetros del modelo, junto con los pesos de características aprendidos en el entrenamiento, seleccione Visualizar.
Para guardar el modelo para su uso posterior, haga clic con el botón derecho en la salida de Train MOdel (Entrenar MOdel) y seleccione Save as Trained Model (Guardar como modelo entrenado).
Para realizar predicciones, use el modelo entrenado como entrada para el módulo Puntuar modelo.
El modelo no entrenado también se puede pasar a Cross-Validate Model para la validación cruzada en un conjunto de datos etiquetado.
Ejemplos
Para ver cómo se Two-Class la máquina de punto bayes en el aprendizaje automático, consulte estos experimentos de ejemplo en el Azure AI Gallery:
- Comparar clasificadores binarios: en este ejemplo se muestra el uso de varios clasificadores de dos clases.
Notas técnicas
Esta sección contiene detalles de implementación y preguntas más frecuentes sobre este algoritmo.
Los detalles de la investigación original y la teoría subyacente están disponibles en este documento (PDF): Bayes Point Machines, de Darwin, Graepe y Darwin.
Sin embargo, esta implementación mejora el algoritmo original de varias maneras:
Usa el algoritmo de paso de mensajes de propagación de la expectativa. Para más información, consulte A family of algorithms for approximate Bayesian inference (Una familia de algoritmos para la inferencia bayesiana aproximada).
No se requiere un barrido de parámetros.
Este método no requiere que se normalizan los datos.
Estas mejoras hacen que el modelo de clasificación de la máquina del punto de Bayes sea más sólido y fácil de usar, y puede omitir el tedioso paso de optimización de parámetros.
Parámetros del módulo
Nombre | Intervalo | Tipo | Valor predeterminado | Descripción |
---|---|---|---|---|
Número de iteraciones de entrenamiento | >=1 | Entero | 30 | Especificar el número de iteraciones que se usarán al entrenar |
Incluir sesgo | Any | Boolean | True | Indicar si se debe agregar una característica de constante o sesgo a cada instancia |
Permitir valores desconocidos en características de categorías | Any | Boolean | True | Si es True, crea un nivel adicional para cada columna de categoría. Los niveles del conjunto de datos de prueba que no están disponibles en el conjunto de datos de entrenamiento se asignan a este nivel adicional. |
Output
Nombre | Tipo | Descripción |
---|---|---|
Modelo no entrenado | Interfaz ILearner | Un modelo de clasificación binaria no entrenado |