Conversões de formato de dados
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Este artigo lista os módulos fornecidos no Machine Learning Studio (clássico) para converter dados entre vários formatos de ficheiros utilizados na aprendizagem automática.
Os formatos suportados incluem:
- O formato de conjunto de dados que é usado ao longo de Machine Learning.
- O formato ARFF que é usado por Weka. Weka é um conjunto de algoritmos de aprendizagem automática baseados em Java.
- O formato SVMLight . O formato SVMLight foi desenvolvido para a estrutura SVMlight para machine learning. Também pode ser usado pela Vowpal Wabbit.
- Os formatos de ficheiro plano separados por separados por separadospor separados por vírgulas (CSV) que são suportados pela maioria das bases de dados relacionais. Estes formatos também são amplamente suportados por R e Python.
Ao converter dados para estes formatos, pode mover mais facilmente resultados e dados entre diferentes estruturas de aprendizagem automática ou mecanismos de armazenamento.
Nota
Estes módulos de conversão de dados apenas convertem o conjunto de dados completo num formato especificado. Se precisar de fazer qualquer casting, truncação, conversão de formatos de data-hora, ou outra manipulação dos valores, utilize os módulos na Transformação de Dados ou consulte a lista de tarefas relacionadas.
Cenários comuns de conversão de dados
Normalmente, utiliza-se os módulos de conversão de dados se precisar de transferir dados de uma experiência de Machine Learning para outra ferramenta ou plataforma de machine learning. Também pode utilizar os módulos para exportar dados de Machine Learning num formato que possa ser utilizado por uma base de dados ou outras ferramentas. Por exemplo:
Tarefa | Use isto |
---|---|
É necessário guardar um conjunto de dados intermédio para utilizar em Excel ou para importar para uma base de dados. | Utilize o módulo CSV ou o módulo TSV para preparar os dados no formato correto. Em seguida, faça o download dos dados ou guarde-os para a Azure Armazenamento. |
Pretende reutilizar dados da sua experiência no código R ou Python. | Utilize o módulo CSV ou o módulo TSV para preparar os dados. Em seguida, clique com o conjunto de dados convertido para obter o código Python de que precisa para aceder ao conjunto de dados. |
Estás a analisar a tua experiência e dados entre a Weka e a Machine Learning. | Utilize o módulo ARFF para preparar os dados. Então, descarregue os resultados. |
É necessário preparar dados na estrutura SVMlight. | Utilize o módulo Converte para SVMLight para preparar os dados. Em seguida, faça o download dos dados resultantes. |
Crie dados para utilizar com o Vowpal Wabbit. | Utilize o formato SVMLight . Em seguida, modifique os ficheiros conforme descrito no artigo. Guarde o ficheiro no armazenamento Azure Blob para utilizar com um módulo Vowpal Wabbit em Machine Learning. |
Os dados não estão num formato tabular. | Coagi-lo a um formato de conjunto de dados utilizando o módulo Converte-se para Conjunto de Dados . |
Tarefas relacionadas
Se precisar de importar dados em Machine Learning ou transformar dados em colunas individuais, utilize estes módulos antes de efetuar a conversão de dados:
Tarefa | Use isto |
---|---|
Importar dados do meu computador para Machine Learning. | Faça upload de conjuntos de dados em formato CSV como descrito na Importação dos seus dados de formação para Machine Learning Studio (clássico). |
Importar dados de uma fonte de dados em nuvem, incluindo Hadoop ou Azure. | Utilize o módulo de Dados de Importação . |
Guarde conjuntos de dados de aprendizagem automática para o armazenamento de Azure Blob, um cluster Hadoop ou outro armazenamento baseado em nuvem. | Utilize o módulo de Dados de Exportação . |
Altere o tipo de dados de colunas ou colunas de funções para um formato ou tipo diferente. | Em Machine Learning, utilize os metadados de edição ou aplique SQL módulos de transformação. Se você é proficiente com R ou Python, experimente o Script Execute Python ou executar os módulos de script R . |
Redondo, grupo ou normalizar dados numéricos. | Utilize a operação de matemática,os dados de grupo em caixas ou normalize os módulos de dados . |
Lista de módulos
A categoria de Conversões de Formato de Dados inclui estes módulos:
- Converta-se em ARFF: Converte a entrada de dados no formato de ficheiro de relação de atributos que é utilizado pelo conjunto de ferramentas Weka.
- Converter em CSV: Converte um conjunto de dados num formato de valores separados por vírgula.
- Converta-se em Conjunto de Dados: Converte a entrada de dados no formato interno do conjunto de dados que é utilizado por Machine Learning.
- Converta-se em SVMLight: Converte a entrada de dados no formato utilizado pela estrutura SVMlight.
- Converter para TSV: Converte a entrada de dados para o formato delimitado por separador.