Dela via


Snabbstart: Massinläsning med Synapse Studio

Det är enkelt att läsa in data med guiden Massinläsning i Synapse Studio. Synapse Studio är en funktion i Azure Synapse Analytics. Guiden Massinläsning vägleder dig genom att skapa ett T-SQL-skript med COPY-instruktionen för att massinläsa data i en dedikerad SQL-pool.

Startpunkter till guiden Massinläsning

Du kan massinläsa data genom att högerklicka på följande område i Synapse Studio: en fil eller mapp från ett Azure-lagringskonto som är kopplat till din arbetsyta.

Screenshot that shows right-clicking a file or folder from a storage account.

Förutsättningar

  • Guiden genererar en COPY-instruktion som använder Microsoft Entra-direkt för autentisering. Din Microsoft Entra-användare måste ha åtkomst till arbetsytan med minst Azure-rollen Storage Blob Data Contributor för Azure Data Lake Storage Gen2-kontot.

  • Du måste ha de behörigheter som krävs för att använda COPY-instruktionen och skapa tabellbehörigheter om du skapar en ny tabell att läsa in till.

  • Den länkade tjänsten som är associerad med Data Lake Storage Gen2-kontot måste ha åtkomst till filen eller mappen för att kunna läsas in. Om autentiseringsmekanismen för den länkade tjänsten till exempel är en hanterad identitet måste arbetsytans hanterade identitet ha minst behörigheten Storage Blob Data Reader för lagringskontot.

  • Om ett virtuellt nätverk är aktiverat på din arbetsyta kontrollerar du att den integrerade körning som är associerad med Data Lake Storage Gen2-kontots länkade tjänster för källdata och felfilens plats har interaktiv redigering aktiverat. Interaktiv redigering krävs för autoschemaidentifiering, förhandsgranskning av källfilinnehållet och surfning av Data Lake Storage Gen2-lagringskonton i guiden.

Steg

  1. På panelen Källlagringsplats väljer du lagringskontot och den fil eller mapp som du läser in från. Guiden försöker automatiskt identifiera Parquet-filer och avgränsade textfiler (CSV), inklusive mappning av källfälten från filen till lämpliga SQL-måldatatyper.

    Screenshot that shows selecting a source location.

  2. Välj inställningarna för filformat, inklusive dina felinställningar för när det finns avvisade rader under massinläsningsprocessen. Du kan också välja Förhandsgranska data för att se hur COPY-instruktionen parsar filen så att du kan konfigurera inställningarna för filformatet. Välj Förhandsgranska data varje gång du ändrar en inställning för filformat för att se hur COPY-instruktionen parsar filen med den uppdaterade inställningen.

    Screenshot that shows previewing data.

    Kommentar

    • Guiden Massinläsning stöder inte förhandsgranskning av data med fältavgränsare med flera tecken. När du anger ett fältavgränsare med flera tecken förhandsgranskas data i en enda kolumn i guiden.
    • När du väljer Härled kolumnnamn parsar guiden Massinläsning kolumnnamnen från den första raden som anges av fältet Första raden . Guiden Massinläsning ökar FIRSTROW automatiskt värdet i COPY-instruktionen med 1 för att ignorera den här rubrikraden.
    • Det finns stöd för att ange radavgränsare med flera tecken i COPY-instruktionen. Guiden Massinläsning stöder det dock inte och genererar ett fel.
  3. Välj den dedikerade SQL-pool som du använder för att läsa in, inklusive om belastningen ska vara för en befintlig tabell eller en ny tabell. Screenshot that shows selecting a target location.

  4. Välj Konfigurera kolumnmappning för att se till att du har rätt kolumnmappning. Namn på anteckningskolumner identifieras automatiskt om du har aktiverat Infer-kolumnnamn. För nya tabeller är det viktigt att konfigurera kolumnmappningen för att uppdatera målkolumndatatyperna.

    Screenshot that shows configuring column mapping.

  5. Välj Öppna skript. Ett T-SQL-skript genereras med COPY-instruktionen som ska läsas in från datasjön. Screenshot that shows opening the SQL script.

Nästa steg

  • Mer information om KOPIERingsfunktioner finns i copy-instruktionsartikeln .
  • I översiktsartikeln för datainläsning finns information om hur du använder en ETL-process (extrahering, transformering och inläsning).