Condividi tramite


Ottenere dati di Archiviazione di Azure

L'inserimento dati è il processo usato per caricare dati da una o più origini in una tabella in Azure Esplora dati. Una volta inseriti, i dati diventano disponibili per le query. Questo articolo illustra come ottenere dati dall'archiviazione di Azure (contenitore ADLS Gen2, contenitore BLOB o singoli BLOB) in una tabella nuova o esistente.

L'inserimento da un account di archiviazione di Azure è un'operazione una tantum. Per inserire dati in modo continuo, vedere Configurare l'inserimento in streaming.

Per informazioni generali sull'inserimento dati, vedere Panoramica dell'inserimento di dati in Azure Esplora dati.

Prerequisiti

  • Un account Microsoft o un'identità utente di Microsoft Entra. Non è necessaria una sottoscrizione di Azure.
  • Accedere all'interfaccia utente Web di Azure Esplora dati.
  • Un cluster e un database di Esplora dati di Azure. Creare un cluster e un database.
  • Un account di archiviazione.

Ottenere dati

  1. Scegliere Query dal menu a sinistra.

  2. Fare clic con il pulsante destro del mouse sul database in cui si desidera inserire i dati. Seleziona Estrai dati.

    Screenshot della scheda query, con il pulsante destro del mouse su un database e la finestra di dialogo Ottieni opzioni aperta.

Origine

Nella finestra Ottieni dati è selezionata la scheda Origine.

Selezionare l'origine dati dall'elenco disponibile. In questo esempio sati inserendo dati da Azure storage.

Screenshot della finestra Ottieni dati con la scheda origine selezionata.

Configurare

  1. Selezionare un database e una tabella di destinazione. Per inserire dati in una nuova tabella, selezionare + Nuova tabella e immettere un nome tabella.

    Nota

    I nomi delle tabelle possono avere un massimo di 1.024 caratteri, inclusi spazi, caratteri alfanumerici, trattini e trattini bassi. I caratteri speciali non sono supportati.

  2. Per aggiungere l'origine, selezionare Seleziona contenitore o Aggiungi URI.

    1. Se è stata selezionata l'opzione Seleziona contenitore, compilare i campi seguenti:

      Screenshot della scheda configurazione con la nuova tabella immessa e un file di dati di esempio selezionato.

      Impostazione Descrizione campo
      Abbonamento ID sottoscrizione in cui si trova l'account di archiviazione.
      Account di archiviazione Nome che identifica l'account di archiviazione.
      Contenitore Contenitore di archiviazione da inserire.
      Gestisci filtri file (facoltativo)
      Percorso cartella Filtra i dati per inserire file con un percorso di cartella specifico.
      Estensione di file Filtra i dati per inserire file solo con un'estensione di file specifica.
    2. Se è stata selezionata Aggiungi URI, dal account di archiviazione, devi generare un URL SAS per il contenitore o i singoli blob da inserire. Impostare le autorizzazioni per lettura e elenco per contenitori o lettura per singoli BLOB. Per ulteriori informazioni, vedere Generare un token SAS.

      1. Incollare l'URL nel campo URI e quindi selezionare il pulsante più (+). È possibile aggiungere più URI per singoli BLOB o un singolo URI per un contenitore.

      Screenshot della scheda di configurazione con il stringa di connessione incollato nel campo URI.

      Nota

      • È possibile aggiungere fino a 10 SINGOLI BLOB. Ogni BLOB può essere un massimo di 1 GB non compresso.
      • È possibile inserire fino a 5000 BLOB da un singolo contenitore.
      • Non è possibile inserire singoli blob e contenitori nella stessa procedura di ingestion.
  3. Selezionare Avanti

Controllare

La scheda Ispezione si apre con un'anteprima dei dati.

Selezionare Fine per completare il processo di inserimento.

Screenshot della scheda Ispeziona.

Facoltativo:

  • Selezionare Command viewer per visualizzare e copiare i comandi automatici generati dagli input.
  • Usare il menù a discesa File di definizione dello schema per modificare il file da cui viene dedotto lo schema.
  • Modificare il formato dei dati dedotti automaticamente selezionando il formato desiderato dal menu a tendina. Per l'inserimento, vedere Formati di dati supportati da Azure Esplora dati.
  • Modifica colonne.
  • Esplorare le Opzioni avanzate in base al tipo di dati.

Modifica colonne

Nota

  • Per i formati tabulari (CSV, TSV, PSV), non è possibile eseguire il mapping di una colonna due volte. Per eseguire il mapping a una colonna esistente, eliminare prima quella nuova.
  • Non è possibile modificare un tipo di colonna esistente. Se si tenta di eseguire il mapping su una colonna con un formato diverso, è possibile che appaiano colonne vuote.

Le modifiche che è possibile apportare in una tabella dipendono dai parametri seguenti:

  • Il tipo di tabella è nuovo o esistente
  • Il tipo di mapping è nuovo o esistente
Tipo di tabella Tipo di mapping Modifiche disponibili
Nuova tabella Nuovo mapping Rinominare la colonna, modificare il tipo di dati, modificare l'origine dati, eseguire la Trasformazione del mapping, aggiungere una colonna, eliminare una colonna
Tabella esistente Nuovo mapping Aggiungi colonna (per cui è poi possibile cambiare il tipo di dati, rinominare e aggiornare)
Tabella esistente Mapping esistente Nessuno

Screenshot delle colonne aperte per la modifica.

Trasformazioni del mapping

Alcuni mapping del formato dati (Parquet, JSON e Avro) supportano semplici trasformazioni in fase di inserimento. Per applicare le trasformazioni del mapping, creare o aggiornare una colonna nella finestra Modifica colonne.

Le trasformazioni del mapping possono essere eseguite su una colonna di tipo string o date/time, con l'origine che ha un tipo di dati int o long. Le trasformazioni del mapping supportate sono:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Opzioni avanzate in base al tipo di dati

Tabulare (CSV, TSV, PSV):

  • Se si inseriscono formati tabulari in una tabella esistente, è possibile selezionare >Mantieni lo schema della tabella corrente. I dati tabulari non comprendono necessariamente i nomi di colonna usati per eseguire il mapping dei dati di origine sulle colonne esistenti. Quando questa opzione è selezionata, il mapping viene eseguito in base all'ordine e lo schema della tabella rimane invariato. Se questa opzione è deselezionata, vengono create nuove colonne per i dati in ingresso, indipendentemente dalla struttura dei dati.

  • Per usare la prima riga come nomi di colonna, selezionare Avanzate>Prima riga è intestazione di colonna.

    Screenshot delle opzioni CSV avanzate.

JSON:

  • Per determinare la divisione delle colonne dei dati JSON, selezionare Avanzate>Livelli annidati, da 1 a 100.

  • Se si seleziona Ignora errori di formato dati avanzati>, i dati vengono inseriti in formato JSON. Se si lascia deselezionata questa casella di controllo, i dati vengono inseriti in formato multijson.

    Screenshot delle opzioni JSON avanzate.

Riepilogo

Nella finestra Preparazione dei dati, tutti e tre i passaggi sono contrassegnati con segni di spunta verdi quando l'inserimento dati si conclude con successo. È possibile visualizzare i comandi usati per ogni passaggio oppure selezionare una scheda per eseguire query, visualizzare o eliminare i dati inseriti.

Screenshot della pagina di riepilogo con completamento dell'inserimento riuscito.