Dela via


Ladda in data i en dedikerad SQL-pool i Azure Synapse Analytics med SQL Server Integration Services (SSIS)

gäller för:Azure Synapse Analytics

Skapa ett SSIS-paket (SQL Server Integration Services) för att läsa in data till en dedikerad SQL-pool i Azure Synapse Analytics-. Du kan också omstrukturera, transformera och rensa data när de passerar genom SSIS-dataflödet.

Den här artikeln visar hur du gör följande:

  • Skapa ett nytt Integration Services-projekt i Visual Studio.
  • Utforma ett SSIS-paket som läser in data från källan till målet.
  • Kör SSIS-paketet för att läsa in data.

Grundläggande begrepp

Paketet är den grundläggande arbetsenheten i SSIS. Relaterade paket grupperas i projekt. Du skapar projekt och designpaket i Visual Studio med SQL Server Data Tools. Designprocessen är en visuell process där du drar och släpper komponenter från verktygslådan till designytan, ansluter dem och anger deras egenskaper. När du har slutfört paketet kan du köra det och du kan även distribuera det till SQL Server eller SQL Database för omfattande hantering, övervakning och säkerhet.

En detaljerad introduktion till SSIS ligger utanför den här artikelns omfattning. Mer information finns i följande artiklar:

Alternativ för att läsa in data i Azure Synapse Analytics med SSIS

SQL Server Integration Services (SSIS) är en flexibel uppsättning verktyg som tillhandahåller olika alternativ för att ansluta till och läsa in data i Azure Synapse Analytics.

  1. Den bästa metoden, som ger bästa prestanda, är att skapa ett paket som använder Azure SQL DW Upload Task för att läsa in data. Den här uppgiften kapslar in både käll- och målinformation. Det förutsätter att dina källdata lagras lokalt i avgränsade textfiler.

  2. Alternativt kan du skapa ett paket som använder en dataflödesaktivitet som innehåller en källa och ett mål. Den här metoden stöder en mängd olika datakällor, inklusive SQL Server och Azure Synapse Analytics.

Förutsättningar

För att gå igenom den här självstudien behöver du följande:

  1. SQL Server Integration Services (SSIS). SSIS är en komponent i SQL Server och kräver en licensierad version, eller utvecklar- eller utvärderingsversionen, av SQL Server. Information om hur du hämtar en utvärderingsversion av SQL Server finns i Utvärdera SQL Server-.

  2. Visual Studio (valfritt). Information om hur du hämtar den kostnadsfria Visual Studio Community Edition finns i Visual Studio Community. Om du inte vill installera Visual Studio kan du endast installera SQL Server Data Tools (SSDT). SSDT installerar en version av Visual Studio med begränsad funktionalitet.

  3. SQL Server Data Tools for Visual Studio (SSDT). För att ladda ner SQL Server Data Tools för Visual Studio, se Ladda ned SQL Server Data Tools (SSDT).

  4. En Azure Synapse Analytics-databas och behörigheter. Den här guiden kopplar till en dedikerad SQL-pool i en Azure Synapse Analytics-instans och laddar in data i den. Du måste ha behörighet att ansluta, skapa en tabell och läsa in data.

Skapa ett nytt Integration Services-projekt

  1. Starta Visual Studio.

  2. På menyn Arkiv väljer du Ny | Projekt.

  3. Gå till Installerat | Mallar | Business Intelligence | Integration Services projekttyper.

  4. Välj Integration Services Project. Ange värden för Namn och Platsoch välj sedan OK.

Visual Studio öppnar och skapar ett nytt SSIS-projekt (Integration Services). Sedan öppnar Visual Studio designern för det nya SSIS-paketet (Package.dtsx) i projektet. Du ser följande skärmområden:

  • Till vänster Toolbox- för SSIS-komponenter.

  • I mitten finns designytan med flera flikar. Du använder vanligtvis åtminstone Control Flow- och flikarna Data Flow.

  • Till höger finns Solution Explorer och fönstret Egenskaper.

    Skärmbild av Visual Studio som visar fönstret Verktygslåda, designfönstret, fönstret Solution Explorer och fönstret Egenskaper.

Alternativ 1 – Använd SQL DW-uppladdningsaktiviteten

Den första metoden är ett paket som använder SQL DW Upload-uppgiften. Den här uppgiften kapslar in både käll- och målinformation. Det förutsätter att dina källdata lagras i avgränsade textfiler, antingen lokalt eller i Azure Blob Storage.

Förutsättningar för alternativ 1

Om du vill fortsätta självstudien med det här alternativet behöver du följande:

  • Funktionspaketet Microsoft SQL Server Integration Services för Azure. SQL DW-uppladdningsaktiviteten är en komponent i funktionspaketet.

  • Ett Azure Blob Storage- konto. SQL DW Upload-uppgiften läser in data från Azure Blob Storage till Azure Synapse Analytics. Du kan läsa in filer som redan finns i Blob Storage eller läsa in filer från datorn. Om du väljer filer på datorn laddar SQL DW Upload-uppgiften upp dem till Blob Storage först för mellanlagring och läser sedan in dem i din dedikerade SQL-pool.

Lägga till och konfigurera SQL DW-uppladdningsaktiviteten

  1. Dra en SQL DW-uppladdningsuppgift från verktygslådan till mitten av designytan (på fliken Kontrollflöde).

  2. Dubbelklicka på uppgiften för att öppna SQL DW Upload Task Editor.

    Skärmbild av sidan Allmänt i SQL DW Upload Task Editor.

  3. Konfigurera uppgiften med hjälp av vägledningen i artikeln Azure SQL DW Upload Task. Eftersom den här uppgiften kapslar in både käll- och målinformation och mappningarna mellan käll- och måltabeller har uppgiftsredigeraren flera sidor med inställningar att konfigurera.

Skapa en liknande lösning manuellt

Om du vill ha mer kontroll kan du manuellt skapa ett paket som emulerar det arbete som utförs av SQL DW Upload-uppgiften.

  1. Använd Azure Blobuppladdningsaktiviteten för att mellanlagra data på Azure Blob Storage. För att få tillgång till Azure Blob-överföringsuppgift, hämta funktionspaketet Microsoft SQL Server Integration Services för Azure.

  2. Använd sedan SSIS Execute SQL-uppgiften för att starta ett PolyBase-skript som läser in data i din dedikerade SQL-pool. Ett exempel som läser in data från Azure Blob Storage till en dedikerad SQL-pool (men inte med SSIS) finns i Självstudie: Läsa in data till Azure Synapse Analytics.

Alternativ 2 – Använd en källa och ett mål

Den andra metoden är ett typiskt paket som använder en dataflödesaktivitet som innehåller en källa och ett mål. Den här metoden stöder en mängd olika datakällor, inklusive SQL Server och Azure Synapse Analytics.

I den här handledningen används SQL Server som datakälla. SQL Server körs lokalt eller på en virtuell Azure-dator.

Om du vill ansluta till SQL Server och till en dedikerad SQL-pool kan du använda en ADO.NET anslutningshanterare och källa och mål, eller en OLE DB-anslutningshanterare och källa och mål. Den här självstudien använder ADO.NET eftersom den har minst konfigurationsalternativ. OLE DB kan ge något bättre prestanda än ADO.NET.

Som en genväg kan du använda guiden Importera och exportera SQL Server för att skapa det grundläggande paketet. Spara sedan paketet och öppna det i Visual Studio eller SSDT för att visa och anpassa det. Mer information finns i Importera och exportera data med guiden för import och export i SQL Server.

Förutsättningar för alternativ 2

Om du vill fortsätta självstudien med det här alternativet behöver du följande:

  1. Exempeldata. I den här självstudien används exempeldata som lagras i SQL Server i AdventureWorks-exempeldatabasen som källdata som ska läsas in i en dedikerad SQL-pool. Information om hur du hämtar AdventureWorks-exempeldatabasen finns i AdventureWorks Sample Databases.

  2. En brandväggsregel. Du måste skapa en brandväggsregel i din dedikerade SQL-pool med IP-adressen för den lokala datorn innan du kan ladda upp data till den dedikerade SQL-poolen.

Skapa det grundläggande dataflödet

  1. Dra en dataflödesaktivitet från verktygslådan till mitten av designytan (på fliken Kontrollflöde).

    Skärmbild av Visual Studio som visar en dataflödesaktivitet som dras till fliken Kontrollflöde i designfönstret.

  2. Dubbelklicka på dataflödesuppgiften för att växla till fliken Dataflöde.

  3. Dra en ADO.NET Källa till designytan från listan Andra källor i verktygslådan. När källadaptern fortfarande är markerad ändrar du namnet till SQL Server-källa i fönstret Egenskaper.

  4. Dra en ADO.NET-destination till designytan under ADO.NET-källan från listan Andra destinationer i verktygslådan. När måladapter fortfarande är markerad, ändrar du namnet till SQL DW destination i fönstret Egenskaper.

    Skärmbild av en mottagaradapter som dras till en plats direkt under källadaptern.

Konfigurera källkortet

  1. Dubbelklicka på källadaptern för att öppna ADO.NET-källredigeraren.

    Skärmbild av ADO.NET-källredigeraren. Fliken Anslutningshanteraren visas och kontroller är tillgängliga för att konfigurera dataflödesegenskaper.

  2. På fliken Anslutningshanteraren i ADO.NET-källredigerarenväljer du knappen Ny bredvid listan ADO.NET anslutningshanteraren för att öppna dialogrutan Konfigurera ADO.NET Anslutningshanteraren och skapa anslutningsinställningar för SQL Server-databasen där den här självstudien läser in data.

    Skärmbild av dialogrutan Konfigurera ADO.NET Anslutningshanterare. Det finns kontroller för att konfigurera anslutningshanterare.

  3. I dialogrutan Konfigurera ADO.NET Anslutningshanteraren väljer du knappen Ny för att öppna dialogrutan Anslutningshanteraren och skapa en ny dataanslutning.

    Skärmbild av dialogrutan Anslutningshanteraren. Kontroller är tillgängliga för att konfigurera en dataanslutning.

  4. Gör följande i dialogrutan Anslutningshanteraren.

    1. För Providerväljer du SqlClient-dataprovidern.

    2. För Servernamnanger du SQL Server-namnet.

    3. I avsnittet Logga in på servern väljer eller anger du autentiseringsinformation.

    4. I avsnittet Anslut till en databas väljer du exempeldatabasen AdventureWorks.

    5. Välj Testanslutning.

      Skärmbild av en dialogruta som visar en OK-knapp och text som anger att testanslutningen lyckades.

    6. I dialogrutan som rapporterar resultatet av anslutningstestet väljer du OK för att återgå till dialogrutan Anslutningshanteraren.

    7. I dialogrutan Anslutningshanteraren väljer du OK för att återgå till dialogrutan Konfigurera ADO.NET Anslutningshanteraren.

  5. I dialogrutan Konfigurera ADO.NET Anslutningshanteraren väljer du OK för att återgå till ADO.NET Källredigeraren.

  6. I ADO.NET Källredigeraren, i listan Namn på tabellen eller vyn, välj tabellen Sales.SalesOrderDetail.

    Skärmbild av ADO.NET-källredigeraren. I tabellens namn eller vylista är tabellen Sales.SalesOrderDetail markerad.

  7. Välj Förhandsgranska för att se de första 200 raderna med data i källtabellen i dialogrutan Förhandsgranska frågeresultat.

    Skärmbild av dialogrutan Förhandsgranska frågeresultat. Flera rader med försäljningsdata från källtabellen visas.

  8. I dialogrutan Förhandsgranska frågeresultat väljer du Stäng för att återgå till ADO.NET Källredigeraren.

  9. I ADO.NET Källredigerarenväljer du OK för att slutföra konfigurationen av datakällan.

Ansluta källkortet till målkortet

  1. Välj källadaptern på designytan.

  2. Välj den blå pil som sträcker sig från källkortet och dra den till målredigeraren tills den fästs på plats.

    Skärmbild som visar käll- och målkorten. En blå pil pekar från källkortet till målkortet.

    I ett typiskt SSIS-paket använder du flera andra komponenter från SSIS-verktygslådan mellan källan och målet för att omstrukturera, transformera och rensa dina data när de passerar genom SSIS-dataflödet. För att hålla det här exemplet så enkelt som möjligt ansluter vi källan direkt till målet.

Konfigurera destinationadaptern

  1. Dubbelklicka på destinationsadaptern för att öppna ADO.NET Destinationsredigeraren.

    Skärmbild av ADO.NET målredigeraren. Fliken Anslutningshanteraren är synlig och innehåller kontroller för att konfigurera dataflödesegenskaper.

  2. På fliken Anslutningshanteraren i ADO.NET Destination Editorväljer du knappen Ny bredvid listan Anslutningshanteraren för att öppna dialogrutan Konfigurera ADO.NET Anslutningshanteraren och skapa anslutningsinställningar för Azure Synapse Analytics-databasen där denna självstudie laddar data.

  3. I dialogrutan Konfigurera ADO.NET Anslutningshanteraren väljer du knappen Ny för att öppna dialogrutan Anslutningshanteraren och skapa en ny dataanslutning.

  4. Gör följande i dialogrutan Anslutningshanteraren.

    1. För Providerväljer du SqlClient-dataprovidern.

    2. För Servernamnanger du det dedikerade SQL-poolnamnet.

    3. I avsnittet Logga in på servern väljer du Använd SQL Server-autentisering och anger autentiseringsinformation.

    4. I avsnittet Anslut till en databas väljer du en befintlig dedikerad SQL-pooldatabas.

    5. Välj Testanslutning.

    6. I dialogrutan som rapporterar resultatet av anslutningstestet väljer du OK för att återgå till dialogrutan Anslutningshanteraren.

    7. I dialogrutan Anslutningshanteraren väljer du OK för att återgå till dialogrutan Konfigurera ADO.NET Anslutningshanteraren.

  5. I dialogrutan Konfigurera ADO.NET Anslutningshanteraren väljer du OK för att återgå till ADO.NET Målredigeraren.

  6. I ADO.NET målredigerarenväljer du Ny bredvid listan Använd en tabell eller vy för att öppna dialogrutan Skapa tabell för att skapa en ny måltabell med en kolumnlista som matchar källtabellen.

    Skärmbild av dialogrutan Skapa tabell. S Q L-kod för att skapa en måltabell visas.

  7. Gör följande i dialogrutan Skapa tabell.

    1. Ändra namnet på måltabellen till SalesOrderDetail.

    2. Ta bort kolumnen rowguid. Den unika identifierare-datatyp stöds inte i en dedikerad SQL-pool.

    3. Ändra datatypen för kolumnen LineTotal till pengar. Datatypen decimal stöds inte i en dedikerad SQL-pool. Information om datatyper som stöds finns i CREATE TABLE (Azure Synapse Analytics, Parallel Data Warehouse).

      Skärmbild av dialogrutan Skapa tabell med kod för att skapa en tabell med namnet SalesOrderDetail med LineTotal som en pengakolumn och ingen rowguid-kolumn.

    4. Välj OK för att skapa tabellen och gå tillbaka till ADO.NET målredigeraren.

  8. I ADO.NET målredigerarenväljer du fliken Mappningar för att se hur kolumner i källan mappas till kolumner i målet.

    Skärmbild av fliken Mappningar i ADO.NET målredigeraren. Rader ansluter kolumner med identiska namn i käll- och måltabellerna.

  9. Välj OK för att slutföra konfigurationen av målet.

Kör paketet för att läsa in data

Kör paketet genom att välja knappen Starta i verktygsfältet eller genom att välja något av alternativen Kör på menyn Felsöka.

Följande stycken beskriver vad du ser om du skapade paketet med det andra alternativet som beskrivs i den här artikeln, dvs. med ett dataflöde som innehåller en källa och ett mål.

När paketet börjar köras ser du gula snurrande hjul som visar aktivitet och antalet rader som bearbetats hittills.

Skärmbild som visar käll- och måladaptrar med gula, snurrande hjul över varje adapter och texten

När paketet har slutförts visas gröna bockmarkeringar som visar att det har lyckats och det totala antalet rader med data som lästs in från källan till målet.

Skärmbild som visar käll- och måladaptrarna. Gröna bockmarkeringar finns över varje adapter och texten

Grattis, du har använt SQL Server Integration Services för att läsa in data i Azure Synapse Analytics.