Mata in data i en dedikerad SQL-pool

Artikel
12/11/2024

I den här artikeln får du lära dig hur du matar in data från ett Azure Data Lake Gen 2-lagringskonto till en dedikerad SQL-pool i Azure Synapse Analytics.

Förutsättningar

Azure-prenumeration: Om du inte har en Azure-prenumeration skapar du ett kostnadsfritt Azure-konto innan du börjar.
Azure Storage-konto: Du använder Azure Data Lake Storage Gen 2 som källdatalager. Om du inte har något lagringskonto kan du läsa Skapa ett Azure Storage-konto för steg för att skapa ett.
Azure Synapse Analytics: Du använder en dedikerad SQL-pool som ett mottagardatalager.
- Om du inte har någon befintlig Synapse-arbetsyta kan du läsa Skapa en Synapse-arbetsyta
- Om du inte har någon befintlig dedikerad SQL-pool. se Skapa en dedikerad SQL-pool.

Skapa länkade tjänster

I Azure Synapse Analytics är en länkad tjänst där du definierar din anslutningsinformation till andra tjänster. I det här avsnittet lägger du till en Azure Synapse Analytics och Azure Data Lake Storage Gen2 länkad tjänst.

Öppna Azure Synapse Analytics UX och gå till fliken Hantera.
Under Externa anslutningar väljer du Länkade tjänster.
Om du vill lägga till en länkad tjänst väljer du Ny.
Välj den Azure Data Lake Storage Gen2 panelen i listan och välj Fortsätt.
Ange dina autentiseringsuppgifter. Kontonyckel, tjänstens huvudnamn och hanterade identitet stöds för närvarande autentiseringstyper. Välj testanslutning för att kontrollera att dina autentiseringsuppgifter är korrekta. Välj Skapa när du är klar.
Upprepa steg 3–5, men i stället för att Azure Data Lake Storage Gen2 väljer du panelen Azure Synapse Analytics och anger motsvarande autentiseringsuppgifter för anslutningen. För Azure Synapse Analytics stöds för närvarande SQL-autentisering, hanterad identitet och tjänstens huvudnamn.

Skapa pipeline

En pipeline innehåller det logiska flödet för en körning av en uppsättning aktiviteter. I det här avsnittet skapar du en pipeline som innehåller en kopieringsaktivitet som matar in data från ADLS Gen2 till en dedikerad SQL-pool.

Gå till fliken Integrera . Välj på plusikonen bredvid pipelinehuvudet och välj Pipeline.
Under Flytta och transformera i aktivitetsfönstret drar du Kopiera data till pipelinearbetsytan.
Välj på kopieringsaktiviteten och gå till fliken Källa . Välj Ny för att skapa en ny källdatauppsättning.
Välj Azure Data Lake Storage gen2 som datalager och välj fortsätt.
Välj AvgränsadText som format och välj Fortsätt.
I fönstret Ange egenskaper väljer du den länkade ADLS-tjänst som du skapade. Ange filsökvägen för dina källdata och ange om den första raden har ett huvud. Du kan importera schemat från filarkivet eller en exempelfil. Välj OK när du är klar.
Gå till fliken Mottagare . Välj Ny för att skapa en ny datauppsättning för mottagare.
Välj Azure Synapse Analytics som datalager och välj Fortsätt.
I fönstret Ange egenskaper väljer du den länkade tjänsten Azure Synapse Analytics som du skapade. Om du skriver till en befintlig tabell väljer du den i listrutan. Annars markerar du Redigera och anger i det nya tabellnamnet. Välj OK när du är klar
Om du skapar en tabell aktiverar du Skapa tabell automatiskt i tabellalternativfältet.

Felsöka och publicera pipeline

När du har konfigurerat pipelinen kan du köra en felsökningskörning innan du publicerar artefakterna för att kontrollera att allt är korrekt.

Välj Felsöka i verktygsfält för att felsöka pipelinen. Du ser status för pipelinekörningen på fliken Utdata längst ned i fönstret.
När pipelinen kan köras väljer du Publicera alla i det översta verktygsfältet. Den här åtgärden publicerar entiteter (datauppsättningar och pipelines) som du har skapat till Synapse Analytics-tjänsten.
Vänta tills du ser meddelandet om att entiteterna har publicerats. Om du vill se meddelanden väljer du klockknappen längst upp till höger.

Utlösa och övervaka pipelinen

I det här steget utlöser du pipelinen som publicerades i föregående steg manuellt.

Välj Lägg till utlösare i verktygsfältet och välj sedan Utlösa nu. På sidan Pipeline Run (Pipelinekörning) väljer du Slutför.
Gå till fliken Övervaka i det vänstra sidofältet. Du ser en pipelinekörning som är utlöst av en manuell utlösare. Du kan använda länkar i kolumnen Åtgärder för att visa aktivitetsinformation och köra pipelinen igen.
Om du vill se aktivitetskörningar som är associerade med pipelinekörningen, väljer du länken View Activity Runs (Visa aktivitetskörningar) i kolumnen Actions (Åtgärder). I det här exemplet finns det bara en aktivitet, så du ser bara en post i listan. Om du vill se mer information om kopieringsåtgärden väljer du länken för detaljer (glasögonikonen) i kolumnen Actions (Åtgärder). Välj Pipelinekörningar längst upp för att gå tillbaka till vyn Pipelinekörningar. Välj Uppdatera för att uppdatera vyn.
Kontrollera att dina data är korrekt skrivna i den dedikerade SQL-poolen.

Nästa steg

Mer information om dataintegrering för Azure Synapse Analytics finns i artikeln Mata in data i Azure Data Lake Storage Gen2.

Dela via