Caricare dati usando una posizione esterna di Unity Catalog

Articolo
03/11/2025

Importante

Questa funzionalità è disponibile in anteprima pubblica.

Questo articolo descrive come usare l'interfaccia utente per aggiungere dati per creare una tabella gestita dai dati in Azure Data Lake Storage Gen2 usando una posizione esterna del catalogo Unity. Una posizione esterna è un oggetto che combina un percorso di archiviazione cloud con credenziali di archiviazione che autorizza l'accesso al percorso di archiviazione cloud.

Operazioni preliminari

Prima di iniziare, devi avere il seguente:

Un'area di lavoro con il catalogo Unity abilitato. Per altre informazioni, vedere Configurare e gestire Il catalogo Unity.
Privilegio READ FILES nella posizione esterna. Per ulteriori informazioni, vedere Creare una posizione esterna per connettere la memorizzazione cloud ad Azure Databricks.
Il privilegio CREATE TABLE per lo schema in cui si desidera creare la tabella gestita, il privilegio USE SCHEMA per lo schema e il privilegio USE CATALOG nel catalogo padre. Per altre informazioni, vedere i privilegi del Catalogo Unity e gli oggetti proteggibili.

Tipi di file

I seguenti tipi di file non sono supportati:

CSV
TSV
JSON
XML
AVRO
Pavimento in parquet

Passaggio 1: confermare l'accesso alla posizione esterna

Per confermare l'accesso alla posizione esterna, eseguire le operazioni seguenti:

Nella barra laterale dell'area di lavoro di Azure Databricks fare clic su Catalog.
In Catalog Explorer, fare clic su Dati esterni>Posizioni esterne.

Passaggio 2: Creare la tabella gestita

Per creare la tabella gestita, eseguire le operazioni seguenti:

Nella barra laterale dell'area di lavoro fare clic su + Nuovo>Aggiungi dati.
Nell'interfaccia utente aggiungi dati fare clic su Azure Data Lake Storage.
Selezionare una posizione esterna dall'elenco a discesa.
Selezionare le cartelle e i file da caricare in Azure Databricks e quindi fare clic su tabella di anteprima.
Selezionare un catalogo e uno schema negli elenchi a discesa.
(Facoltativo) Modificare il nome della tabella.
(Facoltativo) Per impostare le opzioni di formato avanzate in base al tipo di file, fare clic su Attributi avanzati, disattivare Rileva automaticamente il tipo di filee quindi selezionare un tipo di file.

Per un elenco delle opzioni di formato, vedere la sezione seguente.
(Facoltativo) Per modificare il nome della colonna, fare clic sulla casella di input nella parte superiore della colonna.

I nomi di colonna non supportano virgole, barra inversa o caratteri Unicode, ad esempio emoji.
(Facoltativo) Per modificare i tipi di colonna, fare clic sull'icona con il tipo .
Fare clic su Crea tabella.

Opzioni di formato del tipo di file

Sono disponibili le opzioni di formato seguenti, a seconda del tipo di file:

Opzione di formato	Descrizione	Tipi di file supportati
`Column delimiter`	Il carattere di separazione tra le colonne. È consentito un solo carattere e la barra rovesciata non è supportata. Il valore predefinito è una virgola.	CSV
`Escape character`	Carattere di escape da utilizzare durante l'analisi dei dati. Il valore predefinito è costituito dalle virgolette.	CSV
`First row contains the header`	Questa opzione specifica se il file contiene un'intestazione. Abilitato per impostazione predefinita.	CSV
`Automatically detect file type`	Rilevare automaticamente il tipo di file. Il valore predefinito è `true`.	XML
`Automatically detect column types`	Rilevare automaticamente i tipi di colonna dal contenuto del file. È possibile modificare i tipi nella tabella di anteprima. Se è impostato su false, tutti i tipi di colonna vengono dedotti come STRING. Abilitato per impostazione predefinita.	CSV JSON XML
`Rows span multiple lines`	Indica se il valore di una colonna può estendersi su più righe nel file. Disabilitato per impostazione predefinita.	CSV JSON
`Merge the schema across multiple files`	Indica se dedurre lo schema tra più file e unire lo schema di ogni file. Abilitato per impostazione predefinita.	CSV
`Allow comments`	Indica se i commenti sono consentiti nel file. Abilitato per impostazione predefinita.	JSON
`Allow single quotes`	Indica se nel file sono consentite virgolette singole. Abilitato per impostazione predefinita.	JSON
`Infer timestamp`	Indica se provare a dedurre stringhe di timestamp come `TimestampType`. Abilitato per impostazione predefinita.	JSON
`Rescued data column`	Se salvare colonne che non corrispondono allo schema. Per altre informazioni, vedere Qual è la colonna di dati salvata?. Abilitato per impostazione predefinita.	CSV JSON Avro Parquet
`Exclude attribute`	Indica se escludere gli attributi negli elementi. Il valore predefinito è `false`.	XML
`Attribute prefix`	Prefisso per gli attributi per distinguere attributi ed elementi. Il valore predefinito è `_`.	XML

tipi di dati della colonna

Sono supportati i tipi di dati di colonna seguenti. Per altre informazioni sui tipi di dati individuali, vedere Tipi di dati SQL.

Tipo di dati	Descrizione
`BIGINT`	Numeri interi con segno a 8 byte.
`BOOLEAN`	Valori booleani (`true`, `false`).
`DATE`	e giorno, senza considerare il fuso orario.
`DECIMAL (P,S)`	Numeri con precisione massima `P` e scala fissa `S`.
`DOUBLE`	Numeri in virgola mobile a doppia precisione da 8 byte.
`STRING`	Valori di stringhe di caratteri.
`TIMESTAMP`	Valori che comprendono i valori di campi anno, mese, giorno, ora, minuto e secondo, con il fuso orario locale della sessione.

Problemi noti

Potresti riscontrare problemi con i caratteri speciali in tipi di dati complessi, come un oggetto JSON con una chiave contenente un accento grave o due punti.
Per alcuni file JSON potrebbe essere necessario selezionare manualmente JSON per il tipo di file. Per selezionare manualmente un tipo di file dopo aver selezionato i file, fare clic su Attributi avanzati, disattivare Rileva automaticamente il tipo di filee quindi selezionare JSON.
Potrebbero verificarsi problemi con i timestamp annidati e i decimali all'interno di tipi complessi.

Condividi tramite