Tabela de Dados
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Classe de Tabela de Dados
Um conjunto de dados é dados que foram enviados para Machine Learning Studio (clássico) para que possa ser usado no processo de modelação. Mesmo que faça o upload de dados noutro formato, ou especifique um formato de armazenamento como CSV, ARFF ou TSV, os dados são implicitamente convertidos para um DataTable
objeto sempre que usado por um módulo numa experiência.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
O conjunto de dados baseia-se na Tabela de Dados .NET
Tipos de colunas
A DataTable
consiste numa coleção de colunas com metadados associados. Estas colunas implementam a IArray
interface. Colunas de dados em Machine Learning Studio (clássico) são entendidas como matrizes unidimensionais - isto é, vetores.
A classe .NET Array implementa estas interfaces genéricas: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
e System.Collections.Generic.IEnumerable<T>
.
Colunas de tipos int
, double
e Boolean
são tipicamente representadas como matrizes numéricas densas. Se uma coluna densa contiver valores em falta, será manuseada quer como matriz de valores em falta, quer como uma matriz densa de objetos nupáveis.
As colunas que contêm cordas são manuseadas como matrizes densas de objetos. Se não houver valores em falta, os valores em falta são representados quer como nulos, quer como o tipo MissingValuesObjectArray<string>
.
Para mais informações, consulte a Classe Array (Biblioteca MSDN).
Obter colunas numa DataTable
Pode obter uma coluna chamando o GetColumn
método na DataTable. O GetColumn
método tem duas sobrecargas:
GetColumn(<Int64>)
recebe uma coluna pelo seu índice.GetColumn(<string>)
recebe uma coluna pelo seu nome.
Outras interfaces em Studio (clássico)
Esta secção também descreve as seguintes interfaces para Machine Learning Studio (clássico):
Tipo | Description |
---|---|
Interface ICluster | A interface ICluster define a estrutura dos modelos de agrupamento. |
Interface IFilter | A interface IFilter define a estrutura dos filtros digitais de processamento de sinais aplicados a uma série inteira de valores numéricos. Os filtros podem ser criados e depois guardados e aplicados a uma nova série. |
Interface ILearner | A interface ILearner fornece uma estrutura genérica para definir e salvar modelos analíticos, excluindo alguns tipos especiais, como modelos de clustering. |
Interface ITransform | A interface ITransform fornece uma estrutura genérica para definir e salvar transformações. Pode criar um iTransform usando Machine Learning Studio (clássico) e, em seguida, aplicar a transformação em novos conjuntos de dados. |