Läsa in data med hjälp av COPY INTO med tjänstens huvudnamn

Artikel
03/22/2025

Den här artikeln beskriver hur du använder kommandot COPY INTO för att läsa in data från en Azure Data Lake Storage-container (ADLS) i ditt Azure-konto till en tabell i Databricks SQL.

Stegen i den här artikeln förutsätter att administratören har konfigurerat ett SQL-lager för att använda tjänstens huvudnamn för Azure Databricks så att du kan komma åt dina källfiler i ADLS. Om administratören har konfigurerat en extern plats i Unity Catalog med ett lagringsautentiseringsuppgifter, se Ladda in data med COPY INTO med Unity Catalog-volymer eller externa platser i stället. Om administratören gav dig tillfälliga autentiseringsuppgifter (en Blob SAS-token) följer du stegen i Läs in data med COPY INTO med tillfälliga autentiseringsuppgifter i stället.

Databricks rekommenderar att du använder kommandot COPY INTO för inkrementell och massinläsning av data med Databricks SQL.

Anteckning

COPY INTO fungerar bra för datakällor som innehåller tusentals filer. Databricks rekommenderar att du använder Automatisk inläsning för inläsning av miljontals filer, vilket inte stöds i Databricks SQL.

Innan du börjar

Kontrollera att du har följande innan du läser in data i Azure Databricks:

Åtkomst till data i ADLS. Administratören måste först slutföra stegen i Konfigurera dataåtkomst för inmatning så att ditt Databricks SQL-lager kan läsa källfilerna.
Ett Databricks SQL-lager.
Behörigheten Kan hantera i SQL-lagret.
Sökvägen till dina data i en ADLS-container.
Kunskaper om Databricks SQL-användargränssnittet.

Steg 1: Bekräfta åtkomst till data i molnlagring

Gör följande för att bekräfta att du har åtkomst till rätt data i molnobjektlagringen:

I sidofältet klickar du på Skapa > fråga.
I SQL-redigerarens menyfält väljer du ett SQL-lager.
I SQL-redigeraren klistrar du in följande kod:
```
select * from csv.<path>
```
Ersätt <path> med den ADLS-containersökväg som du fick från administratören. Till exempel abfss://<container>@<storage-account>.dfs.core.windows.net/<folder>.
Klicka på Kör.

Steg 2: Skapa en tabell

Det här steget beskriver hur du skapar en tabell i din Azure Databricks-arbetsyta för att lagra inkommande data.

I SQL-redigeraren klistrar du in följande kod:

CREATE TABLE <catalog_name>.<schema_name>.<table_name> (
  tpep_pickup_datetime  TIMESTAMP,
  tpep_dropoff_datetime TIMESTAMP,
  trip_distance DOUBLE,
  fare_amount DOUBLE,
  pickup_zip INT,
  dropoff_zip INT
);

Klicka på Kör.

Steg 3: Läsa in data från molnlagring i tabellen

Det här steget beskriver hur du läser in data från en ADLS-container till tabellen på din Azure Databricks-arbetsyta.

I sidofältet klickar du på Skapa > fråga.
I SQL-redigerarens menyfält väljer du ett SQL-lager och kontrollerar att SQL-lagret körs.
I SQL-redigeraren klistrar du in följande kod. I den här koden ersätter du:
- <container> med namnet på din ADLS-container i ditt lagringskonto.
- <storage-account> med namnet på ditt ADLS-lagringskonto.
- <folder> med namnet på den mapp som innehåller dina data.
- <blob-sas-token> med värdet för blob-SAS-token som du fick från din administratör.
```
COPY INTO <catalog-name>.<schema-name>.<table-name>
FROM 'abfss://<container>@<storage-account>.dfs.core.windows.net/<folder>'
FILEFORMAT = CSV
FORMAT_OPTIONS (
  'header' = 'true',
  'inferSchema' = 'true'
);

SELECT * FROM <catalog-name>.<schema-name>.<table-name>;
```
Kommentar

FORMAT_OPTIONS skiljer sig åt med FILEFORMAT. I det här fallet header instruerar alternativet Azure Databricks att behandla den första raden i CSV-filen som en rubrik, och inferSchema alternativen instruerar Azure Databricks att automatiskt fastställa datatypen för varje fält i CSV-filen.
Klicka på Kör.

Anteckning

Om du klickar på Kör igen läses inga nya data in i tabellen. Det beror på att COPY INTO kommandot endast bearbetar det som anses vara nya data.

Rensa

Du kan rensa de associerade resurserna på arbetsytan om du inte längre vill behålla dem.

Ta bort tabellerna

I sidofältet klickar du på Skapa > fråga.
Välj ett SQL-lager och kontrollera att SQL-lagret körs.

Klistra in följande kod:

DROP TABLE <catalog-name>.<schema-name>.<table-name>;

Klicka på Kör.
Hovra över fliken för den här frågan och klicka sedan på X-ikonen .

Ta bort frågorna i SQL-redigeraren

I sidofältet klickar du på SQL-redigeraren.
Hovra över fliken för varje fråga som du skapade för den här självstudien i SQL-redigerarens menyfält och klicka sedan på X-ikonen .

Ytterligare resurser

Referensartikeln för COPY INTO

Dela via

Läsa in data med hjälp av COPY INTO med tjänstens huvudnamn

Innan du börjar

Steg 1: Bekräfta åtkomst till data i molnlagring

Steg 2: Skapa en tabell

Steg 3: Läsa in data från molnlagring i tabellen

Rensa

Ta bort tabellerna

Ta bort frågorna i SQL-redigeraren

Ytterligare resurser

Feedback

Ytterligare resurser