Modificación de parámetros de tabla de recuento
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Modifica los parámetros usados para crear características a partir de recuentos.
Categoría: Learning con recuentos
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Modificar parámetros de tabla de recuento en Machine Learning Studio (clásico) para cambiar la forma en que se generan las características a partir de una tabla de recuento.
En general, para crear características basadas en recuento, se usa la transformación Recuento de compilaciones para procesar un conjunto de datos y crear una tabla de recuento, y a partir de esa tabla de recuento se genera un nuevo conjunto de características.
Sin embargo, si ya ha creado una tabla de recuento, puede usar el módulo Modificar parámetros de tabla de recuento para editar la definición de cómo se procesan los datos de recuento. Esto le permite crear un conjunto diferente de estadísticas basadas en recuento basadas en los datos existentes, sin tener que volver a analizar el conjunto de datos.
Cómo configurar Modificar parámetros de recuento
Busque la transformación que desea modificar, en el grupo Transformaciones , y agrégréla al experimento.
Debe haber ejecutado previamente un experimento que creó una transformación de recuento.
Para modificar una transformación guardada: busque la transformación en el grupo Transformaciones y agrégréla al experimento.
Para modificar una transformación de recuento creada dentro del mismo experimento: si la transformación no se ha guardado, pero está disponible como salida en el experimento actual (por ejemplo, compruebe la salida del módulo Build Counting Transform), puede usarla directamente conectando los módulos.
Agregue el módulo Modificar parámetros de tabla de recuento y conecte la transformación como entrada.
En el panel Propiedades del módulo Modify Count Table Parameters (Modificar parámetros de tabla de recuento), escriba un valor para usarlo como umbral de bin deGarbage.
Este valor especifica el número mínimo de repeticiones que se deben encontrar para cada valor de característica, para que se utilicen recuentos. Si la frecuencia del valor es menor que el umbral del cubo de elementos no utilizados, el par valor-etiqueta no se cuenta como un elemento discreto; en su lugar, todos los elementos con recuentos inferiores al valor de umbral se colocan en un único "cubo de elementos no utilizados".
Si usa un conjunto de datos pequeño y está contando y entrenando con los mismos datos, un buen valor inicial es 1.
En Ejemplos pseudo adicionales anteriores, escriba un número que indique el número de pseudo ejemplos adicionales que se incluirán. No es necesario proporcionar estos ejemplos; los pseudo ejemplos se generan en función de la distribución anterior.
En Escala de ruido laplaciano, escriba un valor de punto flotante positivo que represente la escala usada para introducir el ruido muestreado de una distribución laplaciana. Cuando se establece un valor de escala, se incorpora algún nivel aceptable de ruido al modelo, por lo que es menos probable que el modelo se vean afectados por valores no vistos en los datos.
En Incluir características de salida, elija el método que se usará al crear características basadas en recuento para su inclusión en la transformación.
CountsOnly: cree características mediante recuentos.
LogOddsOnly: cree características con el registro de la proporción de probabilidades.
BothCountsAndLogOdds: cree características con recuentos y probabilidades de registro.
Seleccione la opción Omitir columna atrás si desea
IsBackOff
invalidar la marca en la salida al crear características. Al seleccionar esta opción, se crean características basadas en recuento incluso si la columna no tiene valores de recuento significativos.Ejecute el experimento. A continuación, puede guardar la salida de Modificar parámetros de tabla de recuento como una nueva transformación, si lo desea.
Ejemplos
Para obtener ejemplos de cómo este módulo, vea el Azure AI Gallery:
Learning con recuentos: clasificación binaria: muestra cómo usar el aprendizaje con módulos de recuentos para generar características a partir de columnas de valores categóricos para un modelo de clasificación binaria.
Learning con recuentos: clasificación multiclase con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación multiclase en el conjunto de datos de taxis de Nueva York disponible públicamente. El ejemplo usa un aprendiz de regresión logística multiclase para modelar este problema.
Learning con recuentos: clasificación binaria con datos de taxis de Nueva York: muestra cómo usar el aprendizaje con módulos de recuentos para realizar la clasificación binaria en el conjunto de datos de taxis de Nueva York disponible públicamente. El ejemplo usa un aprendiz de regresión logística de dos clases para modelar este problema.
Notas técnicas
Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.
Es estadísticamente seguro contar y entrenar en el mismo conjunto de datos si establece el parámetro de escala de ruido laplaciano.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Transformación de recuento | Interfaz ITransform | Transformación de recuento que se aplicará |
Parámetros del módulo
Nombre | Tipo | Intervalo | Opcional | Valor predeterminado | Descripción |
---|---|---|---|---|---|
Umbral de papelera | Float | >=0,0f | Obligatorio | 10.0f | Umbral bajo el que se caracterizará un valor de columna en el cubo de elementos no utilizados |
Pseudoejemplos anteriores adicionales | Float | >=0,0f | Obligatorio | 42.0f | Los pseudo ejemplos adicionales que se muestran a continuación de las distribuciones anteriores que se incluirán |
Escala de ruido laplaciano | Float | >=0,0f | Obligatorio | 0,0f | Escala de la distribución laplaciana de la que se muestrea el ruido |
Inclusión de características de salida | OutputFeatureType | Obligatorio | BothCountsAndLogOdds | Características que se pueden generar | |
Omitir columna de interrupción | Boolean | Obligatorio | false | Si se debe omitir la columna IsBackOff en la salida |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Transformación modificada | Interfaz ITransform | Transformación modificada |
Excepciones
Excepción | Descripción |
---|---|
Error 0003 | Se produce una excepción si una o varias de las entradas son NULL o están vacías. |
Error 0086 | Se produce una excepción cuando una transformación de recuento no es válida. |
Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.
Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.