Entrenamiento del modelo de agrupación en clústeres
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Entrena un modelo de agrupación en clústeres y asigna datos desde el conjunto de entrenamiento a los clústeres
Categoría: Machine Learning/ Entrenar
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Entrenar modelo de agrupación en clústeres en Machine Learning Studio (clásico) para entrenar un modelo de agrupación en clústeres.
El módulo toma un modelo de agrupación en clústeres no entrenado que ya ha configurado mediante el módulo Agrupación en clústeres k-means y entrena el modelo utilizando un conjunto de datos sin etiqueta o con etiqueta. El módulo crea un modelo entrenado que puede usar para la predicción y un conjunto de asignaciones de clúster para cada caso de los datos de entrenamiento.
Nota:
Un modelo de agrupación en clústeres no se puede entrenar mediante el módulo Entrenar modelo, que es el módulo genérico para crear modelos de aprendizaje automático. Es debido a que Entrenar modelo solo funciona con algoritmos de aprendizaje supervisado. K-means y otros algoritmos de agrupación en clústeres permiten el aprendizaje no supervisado, lo que significa que el algoritmo puede aprender de los datos sin etiqueta.
Procedimiento para usar el modelo de entrenamiento de almacenamiento en clúster
Agregue el módulo Train Clustering Model (Entrenar modelo de agrupación en clústeres) al experimento en Studio (clásico). Puede encontrar el módulo en Módulos de Machine Learning de la categoría Entrenar.
Agregue el módulo Agrupación en clústeres k-means u otro módulo personalizado que cree un modelo de agrupación en clústeres compatible y establezca los parámetros del modelo de agrupación en clústeres.
Adjunte un conjunto de datos de entrenamiento a la entrada de la derecha de Entrenamiento del modelo de agrupación en clústeres.
En Conjunto de columnas, seleccione las columnas del conjunto de datos que desea utilizar para compilar clústeres. Asegúrese de seleccionar columnas que sean buenas características: por ejemplo, evite utilizar id. u otras columnas que tengan valores únicos o columnas que tengan todos los mismos valores.
Si hay una etiqueta, puede usarla como una característica u omitirla.
Seleccione la opción Comprobar anexar o Desactivar solo resultados si desea generar los datos de entrenamiento junto con la nueva etiqueta de clúster.
Si anula la selección de esta opción, la salida solo contiene las asignaciones de clúster.
Ejecute el experimento, o haga clic en el módulo Entrenamiento del modelo de agrupación en clústeres y seleccione Ejecutar seleccionados.
Results
Una vez completado el entrenamiento:
Para ver el clúster y su separación en un gráfico, haga clic con el botón derecho en la salida del conjunto de datos Resultados y seleccione Visualizar.
El gráfico representa los componentes principales del clúster, en lugar de los valores reales. Vea Análisis de componentes principales para obtener más información.
Para ver los valores del conjunto de datos, agregue una instancia del módulo Convertir en conjunto de datos y conéctela a la salida del conjunto de datos Resultados . Ejecute el módulo Convertir en conjunto de datos para obtener una copia de los datos que puede ver o descargar.
Para guardar el modelo entrenado a fin de volver a usarlo más adelante, haga clic con el botón derecho en el módulo, seleccione Modelo formado y haga clic en Save As Trained Model (Guardar como modelo entrenado).
Para generar puntuaciones a partir del modelo, utilice Asignación de datos a clústeres.
Ejemplos
Para obtener un ejemplo de cómo se usa la agrupación en clústeres en el aprendizaje automático, consulte el Azure AI Gallery:
Agrupación en clústeres: buscar compañías similares: muestra cómo usar la agrupación en clústeres en atributos derivados de texto no estructurado.
Agrupación en clústeres: cuantificación de colores: muestra cómo usar la agrupación en clústeres para buscar colores relacionados y reducir el número de bits usados en las imágenes.
Agrupación en clústeres: agrupar datos de iris: proporciona un ejemplo sencillo de agrupación en clústeres basado en el conjunto de datos iris.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Modelo no entrenado | Interfaz ICluster | Modelo de agrupación en clústeres no entrenado |
Dataset | Tabla de datos | Origen de datos de entrada |
Parámetros del módulo
Nombre | Intervalo | Tipo | Valor predeterminado | Descripción |
---|---|---|---|---|
Conjunto de columnas | cualquiera | ColumnSelection | Patrón de selección de columnas | |
Activar para anexar o desactivar solo para resultado | cualquiera | Boolean | true | Si el conjunto de datos de salida debe contener un conjunto de datos de entrada anexado por columna de asignaciones (activado) o solo una columna de asignaciones (desactivado) |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Modelo entrenado | Interfaz ICluster | Modelo de agrupación en clústeres entrenado |
Conjunto de datos de resultados | Tabla de datos | Conjunto de datos de entrada anexado por columna de datos de asignaciones o solo columna de asignaciones |
Excepciones
Excepción | Descripción |
---|---|
Error 0003 | Se produce una excepción si una o varias de las entradas son NULL o están vacías. |
Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.
Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.
Consulte también
Lista de módulos A-Z
Entrenar
Assign Data to Clusters (asignar datos a los clústeres)
Agrupación en clústeres K-Means