Converter em TSV
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Converte a entrada de dados num formato delimitado por separadores
Categoria: Conversões de formato de dados
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como utilizar o módulo Converte para TSV em Machine Learning Studio (clássico), para converter qualquer conjunto de dados do formato interno que é usado por todos os módulos Machine Learning Studio (clássico) para um ficheiro plano em formato separado de separado por separados.
Os ficheiros de valor separados por separados por separados (TSV) são compatíveis com muitas ferramentas externas, incluindo:
R e Python
Excel e PowerPivot
Todas as bases de dados relacionais
Por exemplo, se a sua experiência tiver um conjunto de dados intermédio que gostaria de guardar para reutilização noutra ferramenta ou quiser ligar a partir de código, converta-o no formato TSV e, em seguida, clique com o conjunto de dados convertido para obter o código Python necessário para aceder ao conjunto de dados.
Como utilizar Converter em TSV
Utilize o módulo Converte para TSV sempre que precisar de descarregar um conjunto de dados em formato delimitado por separadores.
Adicione o Convert em TSV à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Machine Learning Studio (clássico).
Ligação o módulo a outro datset, ou a um módulo que produz um conjunto de dados tabular.
Executar a experiência, ou clique com o botão direito apenas o módulo Converter para TSV , e selecione Executar selecionado.
Resultados
Quando a conversão estiver concluída, pode abrir o conjunto de dados, chamá-lo a partir do código R ou Python, usá-lo num caderno Jupyter ou guardá-lo para um ficheiro local.
Se pretender descarregar o conjunto de dados, clique duas vezes na saída do módulo e indique se pretende abrir ou guardar o datset.
Se selecionar Open, o conjunto de dados é carregado utilizando qualquer ferramenta que o computador utilize por defeito para abrir . Ficheiros TSV. Normalmente isto é Microsoft Excel.
Se selecionar Baixar conjunto de dados, por predefinição, o ficheiro é guardado com o nome do módulo mais um GUIADO que representa o ID do espaço de trabalho. No entanto, pode selecionar a opção Guardar como durante o download e alterar o nome ou localização do ficheiro.
Exemplos
Embora não existam exemplos específicos deste formato, pode ver exemplos de como a conversão de formatos é usada explorando estas experiências de amostra na Galeria Azure AI:
Validação cruzada para a amostra de classificação binária: Exporta os resultados da validação cruzada para o formato de valor separado de vírgula (CSV) para que os resultados de vários modelos possam ser comparados utilizando uma ferramenta como Excel.
Quantificação de Compressão de Imagem Baseada em Cor: Exporta os conjuntos de dados utilizados para cada parte da análise para ficheiros CSV, para que possa executar facilmente um modelo semelhante em qualquer ferramenta que suporte o formato CSV.
Notas técnicas
Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.
Requisitos de formato TSV
Valores separados por separados por separados por separados (TSV) é um formato de texto que é usado para armazenar dados numa estrutura tabular. É muito semelhante ao formato CSV, mas olimiter é um separador em vez de uma vírgula.
O formato TSV é uma alternativa útil ao formato CSV se os seus dados contiverem vírgulas. As vírgulas são muito comuns nos dados de texto e são utilizadas em formatos de número europeu.
Um problema com o formato delimitado é que as paragens do separador são frequentemente consideradas como espaço branco em texto não estruturado. No entanto, a norma IANA para a TSV promove uma análise limpa e precisa dos ficheiros de TSV, desafetando separadores dentro dos campos.
Note os seguintes requisitos para ficheiros TSV em Machine Learning Studio (clássico):
O módulo Converte para TSV suporta a saída de uma única linha de posição, se o conjunto de dados contiver nomes de colunas.
O fornecedor TSV suporta apenas a codificação de caracteres UTF-8.
Ao ler ou escrever para ficheiros de TSV, o desempenho pode ser mais lento do que com outros formatos (como o CSV).
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados | Tabela de Dados | Conjunto de dados de entrada |
Saída
Nome | Tipo | Description |
---|---|---|
Conjunto de dados de resultados | Genéricos | Conjunto de dados de saída |