Condividi tramite


Importa tabella conteggio

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Importa una tabella di conteggi creata in precedenza

Categoria: Learning con conteggi

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Panoramica del modulo

Questo articolo descrive come usare il modulo Importa tabella conteggio in Machine Learning Studio (versione classica).

Lo scopo del modulo Importa tabella conteggio è consentire ai clienti che hanno creato una tabella di statistiche basate sul conteggio usando una versione precedente di Machine Learning aggiornare l'esperimento. Questo modulo unisce le tabelle di conteggio esistenti con i nuovi dati.

Per informazioni generali sulle tabelle di conteggio e sul modo in cui vengono usate per creare funzionalità, vedere Learning con conteggi.

Importante

Questo modulo viene fornito esclusivamente per la compatibilità con le versioni precedenti con esperimenti che usano i moduli deprecati Build Count Table e Deprecated Count Featurizer. È consigliabile aggiornare l'esperimento per usare i moduli più nuovi, per sfruttare i vantaggi delle nuove funzionalità.

Per tutti i nuovi esperimenti, è consigliabile usare i moduli seguenti:

Come configurare la tabella import count

  1. In Machine Learning Studio (versione classica) aprire un esperimento che contiene una tabella count creata usando il modulo Build Count Table deprecato.

  2. Aggiungere il modulo Importa tabella conteggio all'esperimento.

  3. Connessione due output del modulo Build Count Table (deprecato) alle porte di input corrispondenti della tabella Import Count.

    Se si dispone di un altro set di dati di conteggi da unire con la tabella di conteggio importata, connetterlo all'input più a destra per il modulo Importa tabella conteggio .

  4. Usare l'opzione Tipo di conteggio per specificare dove e come viene archiviata la tabella count:

    • Set di dati: i dati usati per compilare i conteggi vengono salvati come set di dati in Machine Learning Studio (versione classica).

    • BLOB: i dati usati per compilare i conteggi vengono archiviati come BLOB in blocchi Windows archiviazione di Azure.

    • MapReduce: i dati usati per compilare i conteggi vengono archiviati come BLOB in Windows di Azure.

      Questa opzione è in genere preferibile per set di dati molto grandi. Per accedere ai conteggi, è necessario attivare il cluster HDInsight. Viene avviato MapReduce processo per eseguire il conteggio. Entrambe queste attività possono sostenere costi di archiviazione e calcolo.

      Per altre informazioni, vedere HDInsight in Azure.

    Dopo aver specificato la modalità di archiviazione dati, potrebbe essere necessario fornire informazioni di connessione aggiuntive per i dati, anche se in precedenza è stato usato un modulo Importa dati nell'esperimento per accedere ai dati. Questo perché il modulo Count Featurizer (deprecato) accede all'archivio dati separatamente per leggere i dati e compilare le tabelle necessarie.

  5. Usare l'opzione Tipo tabella conteggio per specificare il formato e la modalità di archiviazione della tabella usata per archiviare i conteggi.

    • Dizionario: usa una tabella di conteggio dei dizionari.

      Tutti i valori di colonna nelle colonne selezionate vengono considerati come stringhe e vengono sottoposti ad hashing usando una matrice di bit con dimensioni massime pari a 31 bit. Pertanto, tutti i valori di colonna sono rappresentati da un numero intero non negativo a 32 bit.

    • CMSketch: usa una tabella salvata nella tabella di sketch minima del conteggio.

      Con questo formato, vengono usate più funzioni hash indipendenti con un intervallo più piccolo per migliorare l'efficienza della memoria e ridurre la probabilità di conflitti di hash.

    In generale, è consigliabile usare l'opzione Dizionario per set di dati più piccoli (<1 GB) e l'opzione CMSketch per set di dati più grandi.

  6. Eseguire l'esperimento.

  7. Al termine, fare clic con il pulsante destro del mouse sull'output del modulo Importa tabella conteggio, scegliere Salva come trasformazione e digitare un nome per la trasformazione. In questo caso, le tabelle di conteggio unite e tutti i parametri di featurization applicati vengono salvati in un formato che può essere applicato a un nuovo set di dati.

Esempio

Esplorare esempi di funzionalità basate sul conteggio usando questi esperimenti di esempio nel Azure AI Gallery:

Nota

Questi esperimenti di Gallery sono stati tutti creati usando la versione precedente e ora deprecata del Learning con i moduli Counts. Quando si apre l'esperimento in Studio (versione classica), l'esperimento viene aggiornato automaticamente per usare i moduli più nuovi.

Input previsti

Nome Tipo Descrizione
Count metadata Tabella dati Metadati dei conteggi
Count table Tabella dati Tabella count
Set di dati con conteggio Tabella dati Set di dati usato per il conteggio

Parametri del modulo

Nome Tipo Intervallo Facoltativo Predefinito Descrizione
Tipo di conteggio CountingType Necessario Tipo di conteggio

Output

Nome Tipo Descrizione
Trasformazione conteggio Interfaccia ITransform Trasformazione di conteggio

Eccezioni

Eccezione Descrizione
Errore 0003 L'eccezione si verifica se uno o più input sono null o vuoti.
Errore 0018 L'eccezione si verifica se il set di dati di input non è valido.

Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.

Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.

Vedi anche

Learning with Counts