Tabla de datos
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Clase de tabla de datos
Un conjunto de datos son los datos que se han cargado en Machine Learning Studio (clásico) para utilizarse en el proceso de modelado. Aunque cargue los datos en otro formato, o especifique un formato de almacenamiento como CSV, ARFF o TSV, los datos se convierten implícitamente en un objeto DataTable
cada vez que los utiliza un módulo en un experimento.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
El conjunto de datos se basa en la tabla de datos de .NET
Tipos de columna
Un DataTable
está formado por una colección de columnas con metadatos asociados. Estas columnas implementan la interfaz IArray
. Las columnas de datos de Machine Learning Studio (clásico) se entienden como matrices unidimensionales, es decir, vectores.
La clase .NET Array implementa estas interfaces genéricas: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
y System.Collections.Generic.IEnumerable<T>
.
Las columnas de tipos int
, double
y se Boolean
representan normalmente como matrices numéricas densas. Si una columna densa contiene valores que faltan, se controlará como una matriz de valores que faltan o como una matriz densa de objetos que acepta valores NULL.
Las columnas que contienen cadenas se administran como matrices densas de objetos. Si faltan valores, los valores que faltan se representan como valores NULL o como el tipo MissingValuesObjectArray<string>
.
Para obtener más información, vea Array Class (MSDN Library).
Obtención de columnas en datatable
Puede obtener una columna llamando al método GetColumn
en DataTable. El GetColumn
método tiene dos sobrecargas:
GetColumn(<Int64>)
obtiene una columna por su índice.GetColumn(<string>)
obtiene una columna por su nombre.
Otras interfaces en Studio (clásico)
En esta sección también se describen las siguientes interfaces para Machine Learning Studio (clásico):
Tipo | Descripción |
---|---|
Interfaz ICluster | La interfaz ICluster define la estructura de los modelos de agrupación en clústeres. |
Interfaz IFilter | La interfaz IFilter define la estructura de los filtros de procesamiento de señales digitales aplicados a una serie completa de valores numéricos. Los filtros se pueden crear y, a continuación, guardar y aplicar a una nueva serie. |
Interfaz ILearner | La interfaz ILearner proporciona una estructura genérica para definir y guardar modelos analíticos, excepto algunos tipos especiales, como los modelos de agrupación en clústeres. |
Interfaz ITransform | La interfaz ITransform proporciona una estructura genérica para definir y guardar transformaciones. Puede crear un iTransform mediante Machine Learning Studio (clásico) y, a continuación, aplicar la transformación a nuevos conjuntos de datos. |