Importa tabella conteggio
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Importa una tabella di conteggi creata in precedenza
Categoria: Learning con conteggi
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Importa tabella conteggio in Machine Learning Studio (versione classica).
Lo scopo del modulo Importa tabella conteggio è consentire ai clienti che hanno creato una tabella di statistiche basate sul conteggio usando una versione precedente di Machine Learning aggiornare l'esperimento. Questo modulo unisce le tabelle di conteggio esistenti con i nuovi dati.
Per informazioni generali sulle tabelle di conteggio e sul modo in cui vengono usate per creare funzionalità, vedere Learning con conteggi.
Importante
Questo modulo viene fornito esclusivamente per la compatibilità con le versioni precedenti con esperimenti che usano i moduli deprecati Build Count Table e Deprecated Count Featurizer. È consigliabile aggiornare l'esperimento per usare i moduli più nuovi, per sfruttare i vantaggi delle nuove funzionalità.
Per tutti i nuovi esperimenti, è consigliabile usare i moduli seguenti:
- Trasformazione Conteggio compilazioni
- Modificare i parametri della tabella Count
- Trasformazione Conteggio unione
Come configurare la tabella import count
In Machine Learning Studio (versione classica) aprire un esperimento che contiene una tabella count creata usando il modulo Build Count Table deprecato.
Aggiungere il modulo Importa tabella conteggio all'esperimento.
Connessione due output del modulo Build Count Table (deprecato) alle porte di input corrispondenti della tabella Import Count.
Se si dispone di un altro set di dati di conteggi da unire con la tabella di conteggio importata, connetterlo all'input più a destra per il modulo Importa tabella conteggio .
Usare l'opzione Tipo di conteggio per specificare dove e come viene archiviata la tabella count:
Set di dati: i dati usati per compilare i conteggi vengono salvati come set di dati in Machine Learning Studio (versione classica).
BLOB: i dati usati per compilare i conteggi vengono archiviati come BLOB in blocchi Windows archiviazione di Azure.
MapReduce: i dati usati per compilare i conteggi vengono archiviati come BLOB in Windows di Azure.
Questa opzione è in genere preferibile per set di dati molto grandi. Per accedere ai conteggi, è necessario attivare il cluster HDInsight. Viene avviato MapReduce processo per eseguire il conteggio. Entrambe queste attività possono sostenere costi di archiviazione e calcolo.
Per altre informazioni, vedere HDInsight in Azure.
Dopo aver specificato la modalità di archiviazione dati, potrebbe essere necessario fornire informazioni di connessione aggiuntive per i dati, anche se in precedenza è stato usato un modulo Importa dati nell'esperimento per accedere ai dati. Questo perché il modulo Count Featurizer (deprecato) accede all'archivio dati separatamente per leggere i dati e compilare le tabelle necessarie.
Usare l'opzione Tipo tabella conteggio per specificare il formato e la modalità di archiviazione della tabella usata per archiviare i conteggi.
Dizionario: usa una tabella di conteggio dei dizionari.
Tutti i valori di colonna nelle colonne selezionate vengono considerati come stringhe e vengono sottoposti ad hashing usando una matrice di bit con dimensioni massime pari a 31 bit. Pertanto, tutti i valori di colonna sono rappresentati da un numero intero non negativo a 32 bit.
CMSketch: usa una tabella salvata nella tabella di sketch minima del conteggio.
Con questo formato, vengono usate più funzioni hash indipendenti con un intervallo più piccolo per migliorare l'efficienza della memoria e ridurre la probabilità di conflitti di hash.
In generale, è consigliabile usare l'opzione Dizionario per set di dati più piccoli (<1 GB) e l'opzione CMSketch per set di dati più grandi.
Eseguire l'esperimento.
Al termine, fare clic con il pulsante destro del mouse sull'output del modulo Importa tabella conteggio, scegliere Salva come trasformazione e digitare un nome per la trasformazione. In questo caso, le tabelle di conteggio unite e tutti i parametri di featurization applicati vengono salvati in un formato che può essere applicato a un nuovo set di dati.
Esempio
Esplorare esempi di funzionalità basate sul conteggio usando questi esperimenti di esempio nel Azure AI Gallery:
Stima del ritardo dei voli: mostra come la funzionalità basata sul conteggio può essere utile in un set di dati molto grande.
Learning con Conteggi: classificazione multiclasse con dati dei taxi di New York: illustra l'uso di funzionalità basate sul conteggio in un'attività di stima multiclasse.
Learning con Conteggi: classificazione binaria con i dati dei taxi di New York: usa le funzionalità basate sul conteggio in un'attività di classificazione binaria.
Nota
Questi esperimenti di Gallery sono stati tutti creati usando la versione precedente e ora deprecata del Learning con i moduli Counts. Quando si apre l'esperimento in Studio (versione classica), l'esperimento viene aggiornato automaticamente per usare i moduli più nuovi.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Count metadata | Tabella dati | Metadati dei conteggi |
Count table | Tabella dati | Tabella count |
Set di dati con conteggio | Tabella dati | Set di dati usato per il conteggio |
Parametri del modulo
Nome | Tipo | Intervallo | Facoltativo | Predefinito | Descrizione |
---|---|---|---|---|---|
Tipo di conteggio | CountingType | Necessario | Tipo di conteggio |
Output
Nome | Tipo | Descrizione |
---|---|---|
Trasformazione conteggio | Interfaccia ITransform | Trasformazione di conteggio |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0003 | L'eccezione si verifica se uno o più input sono null o vuoti. |
Errore 0018 | L'eccezione si verifica se il set di dati di input non è valido. |
Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.