Mata in data i Azure Data Lake Storage Gen2

Artikel
12/11/2024

I den här artikeln får du lära dig hur du matar in data från en plats till en annan i ett Azure Data Lake Gen 2-lagringskonto (Azure Data Lake Gen 2) med hjälp av Azure Synapse Analytics.

Förutsättningar

Azure-prenumeration: Om du inte har en Azure-prenumeration skapar du ett kostnadsfritt Azure-konto innan du börjar.
Azure Storage-konto: Du använder Azure Data Lake Gen 2 som källdatalager . Om du inte har något lagringskonto kan du läsa Mer information om hur du skapar ett i Skapa ett Azure Storage-konto .

Skapa länkade tjänster

I Azure Synapse Analytics är en länkad tjänst där du definierar anslutningsinformationen till andra tjänster. I det här avsnittet lägger du till Azure Synapse Analytics och Azure Data Lake Gen 2 som länkade tjänster.

Öppna Azure Synapse Analytics UX och gå till fliken Hantera.
Under Externa anslutningar väljer du Länkade tjänster.
Om du vill lägga till en länkad tjänst väljer du Ny.
Välj panelen Azure Data Lake Storage Gen2 i listan och välj Fortsätt.
Ange dina autentiseringsuppgifter. Kontonyckel, tjänstens huvudnamn och hanterade identitet stöds för närvarande av autentiseringstyper. Välj testanslutning för att kontrollera att dina autentiseringsuppgifter är korrekta.
Välj Skapa när du är klar.

Skapa pipeline

En pipeline innehåller det logiska flödet för en körning av en uppsättning aktiviteter. I det här avsnittet skapar du en pipeline som innehåller en kopieringsaktivitet som matar in data från Azure Data Lake Gen 2 till en dedikerad SQL-pool.

Gå till fliken Orkestrera . Välj plusikonen bredvid pipelinehuvudet och välj Pipeline.
Under Flytta och transformera i aktivitetsfönstret drar du Kopiera data till pipelinearbetsytan.
Välj på kopieringsaktiviteten och gå till fliken Källa . Välj Ny för att skapa en ny källdatauppsättning.
Välj Azure Data Lake Storage Gen2 som datalager och välj Fortsätt.
Välj AvgränsadText som format och välj Fortsätt.
I fönstret Ange egenskaper väljer du den ADLS-länkade tjänst som du skapade. Ange filsökvägen för dina källdata och ange om den första raden har en rubrik. Du kan importera schemat från filarkivet eller en exempelfil. Välj OK när du är klar.
Gå till fliken Mottagare . Välj Ny för att skapa en ny datauppsättning för mottagare.
Välj Azure Data Lake Storage gen2 som datalager och välj Fortsätt.
Välj AvgränsadText som format och välj Fortsätt.
I fönstret Ange egenskaper väljer du den ADLS-länkade tjänst som du skapade. Ange sökvägen till den mapp där du vill skriva data. Välj OK när du är klar.

Felsöka och publicera pipeline

När du har konfigurerat pipelinen kan du köra en felsökningskörning innan du publicerar artefakterna för att kontrollera att allt är korrekt.

Välj Felsöka i verktygsfält för att felsöka pipelinen. Du ser status för pipelinekörningen på fliken Utdata längst ned i fönstret.
När pipelinen kan köras väljer du Publicera alla i det översta verktygsfältet. Den här åtgärden publicerar entiteter (datauppsättningar och pipelines) som du har skapat till Synapse Analytics-tjänsten.
Vänta tills du ser meddelandet om att entiteterna har publicerats. Om du vill se meddelanden väljer du klockknappen längst upp till höger.

Utlösa och övervaka pipelinen

I det här steget utlöser du manuellt pipelinen som publicerades i föregående steg.

Välj Lägg till utlösare i verktygsfältet och välj sedan Utlös nu. På sidan Pipeline Run (Pipelinekörning) väljer du Slutför.
Gå till fliken Övervaka i det vänstra sidofältet. Du ser en pipelinekörning som är utlöst av en manuell utlösare. Du kan använda länkar i kolumnen Åtgärder för att visa aktivitetsinformation och köra pipelinen igen.
Om du vill se aktivitetskörningar som är associerade med pipelinekörningen, väljer du länken View Activity Runs (Visa aktivitetskörningar) i kolumnen Actions (Åtgärder). I det här exemplet finns det bara en aktivitet, så du ser bara en post i listan. Om du vill se mer information om kopieringsåtgärden väljer du länken för detaljer (glasögonikonen) i kolumnen Actions (Åtgärder). Välj Pipelinekörningar längst upp för att gå tillbaka till vyn Pipelinekörningar. Välj Uppdatera för att uppdatera vyn.
Kontrollera att dina data är korrekt skrivna i den dedikerade SQL-poolen.

Nästa steg

Mer information om dataintegrering för Azure Synapse Analytics finns i artikeln Mata in data i en dedikerad SQL-pool.

Dela via