Importar tabela de contagem
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Importa uma tabela de contagens criada anteriormente
categoria: Learning com contagens
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
este artigo descreve como usar o módulo importar tabela de contagem no Machine Learning Studio (clássico).
a finalidade do módulo tabela de contagem de importação é permitir que os clientes que criaram uma tabela de estatísticas baseadas em contagem usem uma versão anterior do Machine Learning para atualizar o experimento. Esse módulo mescla as tabelas de contagem existentes com novos dados.
para obter informações gerais sobre tabelas de contagem e como elas são usadas para criar recursos, consulte Learning com contagens.
Importante
Esse módulo é fornecido unicamente para compatibilidade com versões anteriores com experimentos que usam a tabela de contagem de compilação preterida e módulos de Featurizer de contagem preteridos. Recomendamos que você atualize seu experimento para usar os módulos mais recentes, para aproveitar os novos recursos.
Para todos os novos experimentos, recomendamos que você use os seguintes módulos:
- Criar transformação de contagem
- Modificar parâmetros da tabela de contagem
- Mesclar transformação de contagem
Como configurar a tabela de contagem de importação
no Machine Learning Studio (clássico), abra um experimento que contenha uma tabela de contagem criada usando o módulo de tabela de contagem de compilação preterida.
Adicione o módulo importar tabela de contagem ao experimento.
Conexão as duas saídas do módulo tabela de contagem de compilação (preterido) para as portas de entrada correspondentes da tabela de contagem de importações.
Se você tiver outro conjunto de dados de contagens que deseja mesclar com a tabela de contagem importada, conecte-o à entrada mais à direita para o módulo importar tabela de contagem .
Use a opção tipo de contagem para especificar onde e como a tabela de contagem é armazenada:
Dataset: os dados usados para compilar contagens são salvos como um Dataset no Machine Learning Studio (clássico).
Blob: os dados usados para criar contagens são armazenados como um Blob de blocos no armazenamento Windows Azure.
MapReduce: os dados usados para criar contagens são armazenados como um blob no armazenamento Windows Azure.
Normalmente, essa opção é preferida para conjuntos de grandes volumes de DataSet. Para acessar as contagens, você deve ativar o cluster HDInsight. um trabalho de MapReduce é iniciado para executar a contagem. Essas duas atividades podem incorrer em custos de armazenamento e computação.
Para obter mais informações, consulte HDInsight no Azure.
Depois de especificar o modo de armazenamento de dados, talvez seja necessário fornecer informações de conexão adicionais para os dados, mesmo que você tenha usado anteriormente um módulo importar dados no experimento para acessar dados. Isso ocorre porque o módulo Count Featurizer (preterido) acessa o armazenamento de dados separadamente para ler os dados e criar as tabelas necessárias.
Use a opção de tipo de tabela Count para especificar o formato e o modo de armazenamento da tabela usada para armazenar contagens.
Dicionário: usa uma tabela de contagem de dicionários.
Todos os valores de coluna nas colunas selecionadas são tratados como cadeias de caracteres e são transformados em hash usando uma matriz de bits de até 31 bits de tamanho. Portanto, todos os valores de coluna são representados por um inteiro de 32 bits não negativo.
CMSketch: usa uma tabela salva na tabela de esboço de contagem mínima.
Com esse formato, várias funções de hash independentes com um intervalo menor são usadas para melhorar a eficiência da memória e reduzir a chance de colisões de hash.
Em geral, você deve usar a opção de dicionário para conjuntos de dados menores ( < 1 GB) e usar a opção CMSketch para conjuntos de dados maiores.
Execute o experimento.
Ao concluir, clique com o botão direito do mouse na saída do módulo tabela de contagem de importações , selecione salvar como transformaçãoe digite um nome para a transformação. Quando você faz isso, as tabelas de contagem mescladas e os parâmetros personalização que você pode ter aplicado são salvos em um formato que pode ser aplicado a um novo conjunto de um.
Exemplos
Explore exemplos de personalização com base em contagem usando esses experimentos de exemplo no Galeria de ia do Azure:
Previsão de atraso de voo: mostra como o personalização baseado em contagem pode ser útil em um conjunto de grandes conjuntos de um.
Learning com contagens: classificação multiclasse com dados de táxi de NYC: demonstra o uso de recursos baseados em contagem em uma tarefa de previsão de multiclasse.
Learning com contagens: classificação binária com dados de táxi de NYC: usa recursos baseados em contagem em uma tarefa de classificação binária.
Observação
esses experimentos da galeria foram todos criados usando a versão anterior, e agora preterida, da Learning com módulos de contagens. Quando você abre o experimento no Studio (clássico), o experimento é atualizado automaticamente para usar os módulos mais recentes.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Contagem de metadados | Tabela de Dados | Os metadados das contagens |
Tabela de contagem | Tabela de Dados | A tabela de contagem |
Conjunto de dados contado | Tabela de Dados | O conjunto de dados usado para contagem |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Padrão | Descrição |
---|---|---|---|---|---|
Tipo de contagem | CountingType | Obrigatório | O tipo de contagem |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Transformação de contagem | Interface ITransform | A transformação contagem |
Exceções
Exceção | Descrição |
---|---|
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia. |
Erro 0018 | Ocorrerá uma exceção se o conjunto de dados de entrada não for válido. |
Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.
Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.