Converter em ARFF
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Converte a entrada de dados no formato de ficheiro de relação de atributos utilizado pelo conjunto de ferramentas Weka
Categoria: Conversões de formato de dados
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como utilizar o módulo Converte para ARFF em Machine Learning Studio (clássico), para converter conjuntos de dados e resultar no formato de ficheiro de relação de atributos utilizado pelo conjunto de ferramentas Weka. Este formato é conhecido como ARFF.
A especificação de dados ARFF para Weka suporta múltiplas tarefas de aprendizagem automática, incluindo pré-processamento de dados, classificação e seleção de recursos. Neste formato, os dados são organizados por títulos e seus atributos, e estão contidos num único ficheiro de texto. Pode encontrar detalhes do formato de ficheiro Weka na secção Notas Técnicas .
Em geral, a conversão para o formato de ficheiro Weka só é necessária se quiser utilizar tanto Machine Learning como weka, e pretende mover os seus dados de treino para trás e para a frente entre eles.
Para obter mais informações sobre o instrumento Weka, consulte este artigo da Wikipédia: Weka (machine learning)
Aviso
Não é possível substituir um ficheiro ARFF existente no Armazenamento Azure.
Como utilizar Converter em ARFF
Adicione o módulo Convertendo-o em ARFF à sua experiência. Pode encontrar este módulo na categoria De Conversão de Formato de Dados no Machine Learning Studio (clássico).
Ligação-o a qualquer módulo que produza um conjunto de dados.
Executar a experiência, ou clicar no módulo Converter para ARFF , e clique em Executar selecionado.
Resultados
Para criar uma cópia dos dados numa pasta local, clique duas vezes na saída de Converter para ARFF e selecione a opção Descarregar .
Se não especificar uma pasta, é aplicado um nome de ficheiro predefinido e o ficheiro é guardado na biblioteca local de Downloads .
Nota
Este módulo não suporta a exportação para o código Python ou R.
Exemplos
Não existem exemplos específicos deste formato na Galeria Azure AI. No entanto, estas experiências demonstram outros tipos de conversão de formato:
Compressão de imagem baseada em cores: Exporta os conjuntos de dados utilizados para cada parte da análise para ficheiros de reprodutibilidade e utilização noutras plataformas de análise.
Validação cruzada para a amostra de classificação binária: Exporta os resultados da validação cruzada para ficheiros para que os resultados de vários modelos possam ser comparados utilizando uma ferramenta como Excel.
Notas técnicas
Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.
Exemplo do formato ARFF
Esta secção fornece um exemplo de como um conjunto de dados típico ficaria quando convertido em ARFF.
Normalmente, um ficheiro de dados ARFF é composto por duas secções: um cabeçalho que define a fonte de dados e o esquema, e a secção de dados , que contém as entidades reais e os seus atributos.
Cabeçalho ARFF
O cabeçalho de um ficheiro ARFF define a lista dos atributos (em colunas) e os seus tipos de dados. O cabeçalho também pode conter várias linhas de comentário que descrevem a fonte de dados ou quaisquer outras notas.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Dica
Se o conjunto de dados que está a converter não tiver nomes de colunas, utilize o módulo editar metadados para adicionar nomes de colunas antes de utilizar a conversão para ARFF.
Dados arff
A secção de dados consiste em valores separados por vírgulas, e parece muito com um ficheiro CSV sem títulos de coluna.
@DATA 5.1,3.5,1.4,0.2,0
Para obter informações adicionais sobre este formato de ficheiro, consulte a página Weka Wiki: ARFF (versão do programador).
Versão ATUAL ARFF
Machine Learning Studio (clássico) salva ficheiros ARFF utilizando o formato ARFF 3.0.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados | Tabela de Dados | Conjunto de dados de entrada |
Saídas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados de resultados | Rio Arff | Conjunto de dados de saída |