Converter em TSV
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Converte a entrada de dados para um formato delimitado por tabulação
Categoria: conversões de formato de dados
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descreve como usar o módulo converter para TSV no Machine Learning studio (clássico), para converter qualquer conjunto de todos os conjuntos de todos os módulos do formato interno que são usados por todos os módulo do Machine Learning Studio (clássico), em um arquivo simples no formato separado por tabulações.
Os arquivos de valor separado por tabulações (TSV) são compatíveis com muitas ferramentas externas, incluindo:
R e Python
Excel e PowerPivot
Todos os bancos de dados relacionais
Por exemplo, se o experimento tiver um conjunto de um DataSet intermediário que você gostaria de salvar para reutilizar em outra ferramenta ou desejar chamar do código, converta-o no formato TSV e clique com o botão direito do mouse no conjunto de ferramentas convertido para obter o código Python necessário para acessar o conjunto de um.
Como usar Convert para TSV
Use o módulo converter para TSV sempre que precisar baixar um conjunto de um DataSet em formato delimitado por tabulação.
Adicione converter em TSV ao seu experimento. você pode encontrar esse módulo na categoria de conversões de formato de dados no Machine Learning Studio (clássico).
Conexão o módulo para outro conjunto, ou para um módulo que gera um conjunto de resultados de tabela.
Execute o experimento ou clique com o botão direito do mouse apenas no módulo converter para TSV e selecione executar selecionado.
Resultados
Quando a conversão for concluída, você poderá abrir o conjunto de um, chamá-lo do código R ou Python, usá-lo em um notebook Jupyter ou salvá-lo em um arquivo local.
Se você quiser baixar o conjunto de resultados, clique duas vezes na saída do módulo e indique se deseja abrir ou salvar o conjunto.
Se você selecionar abrir, o conjunto de os é carregado usando qualquer ferramenta que seu computador usa por padrão para abrir. Arquivos TSV. Normalmente, isso é Microsoft Excel.
Se você selecionar baixar conjuntode trabalho, por padrão, o arquivo será salvo com o nome do módulo, além de um GUID que representa a ID do Workspace. No entanto, você pode selecionar a opção salvar como durante o download e alterar o nome ou o local do arquivo.
Exemplos
Embora não haja nenhum exemplo específico para esse formato, você pode ver exemplos de como a conversão de formato é usada explorando esses experimentos de exemplo no Galeria de ia do Azure:
Validação cruzada para exemplo de classificação binária: exporta os resultados da validação cruzada para o formato CSV (valores separados por vírgula) para que os resultados de vários modelos possam ser comparados usando uma ferramenta como Excel.
Quantização de compactação de imagem baseada em cor: exporta os conjuntos de os que são usados para cada parte da análise para arquivos CSV, para que você possa executar facilmente um modelo semelhante em qualquer ferramenta que dê suporte ao formato CSV.
Observações técnicas
Esta seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.
Requisitos de formato TSV
Os valores separados por tabulações (TSV) é um formato de texto que é usado para armazenar dados em uma estrutura tabular. É semelhate ao formato CSV, mas o delimitador é uma tabulação em vez de uma vírgula.
O formato TSV é uma alternativa útil para o formato CSV, se seus dados contiverem vírgulas. Vírgulas são muito comuns nos dados de texto e são usados em formatos de número europeu.
Um problema com o formato delimitado por tabulação é que estas paradas de tabulação com frequência são consideradas como espaços em branco no texto não estruturado. No entanto, o padrão IANA para TSV promove análise limpa e precisa dos arquivos TSV ao desabilitar tabulações dentro dos campos.
observe os seguintes requisitos para arquivos TSV no Machine Learning Studio (clássico):
O módulo Converter para TSV suporta a saída de uma linha de cabeçalho único, se o conjunto de dados contém nomes de coluna.
O provedor TSV oferece suporte somente à codificação de caracteres UTF-8.
Ao ler de ou gravar para arquivos TSV, o desempenho pode ser mais lento do que com outros formatos (como CSV).
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Dataset | Tabela de Dados | Conjunto de dados de entrada |
Saída
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | GenericTsv | Conjunto de dados de saída |