Avancerede konfigurationsindstillinger i Azure Synapse Link
Azure Synapse Link tilbyder flere måder, du kan skrive og læse dine data på, så de passer til forskellige analytiske scenarier. Afhængigt af dit analytiske scenarie kan du vælge en bestemt konfiguration blandt nedenstående muligheder.
Scenarie | Gælder for: | Tilgængelige konfigurationsindstillinger |
---|---|---|
Driftsrapportering | Dataverse-tabeller, finans- og driftstabeller og enheder | Synapse Analytics med Delta Lake-indstillingen giver bedre svartider for forespørgsler, hvilket er særligt anvendeligt til forespørgsler om store mængder data. Flere oplysninger: Synapse Link med Deltasøens mulighed |
Driftsrapportering | Dataverse Kun tabeller | Synapse Link med konfigurationsindstillingen "Opdatering på plads" indeholder CSV-filer i din datasø, der opdateres næsten i realtid Dette er en ældre indstilling, der er tilgængelig for Dataverse tabeller. Denne indstilling understøttes ikke for tabeller fra programmer til finans og drift |
Dataintegration | Dataverse-tabeller, finans- og driftstabeller og enheder | "Indstillingen Tilføj kun giver CSV-filer, der indeholder inkrementelle data. Du kan bygge pipelines, der forbruger inkrementelle data og fylde downstream-systemer op Brugerspecificeret datapartitionsfunktion gør det muligt at vælge en brugerdefineret datapartitioneringsstrategi specifikt for Dataverse tabeller. Tabeldata for finans og drift partitioneres af systemet baseret på en passende partitionsstrategi. Denne indstilling er ikke tilgængelig for programmer til finans og drift |
Bemærk
Azure Synapse Link for Dataverse var tidligere kendt som Eksportér til data lake. Tjenesten blev omdøbt til maj 2021 og vil fortsat eksportere data til både Azure Data Lake Storage og Azure Synapse Analytics. Fra september 2023 giver Azure Synapse Link dig også mulighed for at vælge data fra Dynamics 365 finans- og driftsprogrammer. Ikke alle integrationsmønstre understøttes med programmer til finans og drift. Du kan finde vejledning i overgangen fra funktionen 'eksport til datasø' i Finance and Operations-apps til Synapse Link i overgangsvejledning.
I denne artikel beskrives avancerede konfigurationsindstillinger, der er tilgængelige for Dataverse tabeller. Disse indstillinger er ikke tilgængelige for programmer til finans og drift.
- Direkte opdateringer vs. Skrive kun tilføjelser.
- Brugerdefineret datapartitionering.
Direkte opdateringer vs. Skrive kun tilføjelser
Når du skriver Dataverse-tabeldata til Azure-datasøen, afhængigt af createdOn
-værdien, som er den dato og det klokkeslæt, hvor posten blev oprettet, kan du vælge mellem to forskellige indstillinger. De er Direkte opdatering og Tilføj kun.
Standardindstillingen (for tabeller, hvor createdOn
er tilgængelig) er at udføre en direkte opdatering eller upsert (opdatering eller indsættelse) af de trinvise data i destinationen. Hvis ændringen er ny, og den tilsvarende række ikke findes i området, er destinationsfilerne i tilfælde af oprettelse, og ændringerne indsættes i den tilsvarende filpartition i felten. Hvis ændringen er en opdatering, og der findes en række i søen, opdateres den tilknyttede fil i søen, i stedet for at blive indsat, med de trinvise data. Standardindstillingen for alle CUD-ændringer (opret, opdater, slet) i Dataverse-tabeller, hvor createdOn
er tilgængelig, er med andre ord at foretage en direkte opdatering på destinationen i Azure-datasøen.
Du kan ændre standardfunktionsmåden for en direkte opdatering ved hjælp af en valgfri indstilling, der kaldes Tilføj kun. I stedet for en direkte opdatering føjes trinvise data fra Dataverse-tabeller til den tilsvarende filpartition i søen i tilstanden Tilføj kun. Dette er en indstilling for de enkelte tabeller, og den er tilgængelig som et afkrydsningsfelt under Avanceret>Vis avancerede konfigurationsindstillinger. I forbindelse med Dataverse-tabeller, hvor Tilføj kun er slået til, føjes alle CUD-ændringer trinvist til de tilsvarende destinationsfiler i søen. Når du vælger denne indstilling, angives partitionsstrategien som standard til År, og når der skrives data til dataene, opdeles de efter år. Kun Tilføj er også standardindstillingen for Dataverse-tabeller, der ikke har createdOn
-værdi.
I tabellen nedenfor beskrives, hvordan rækker håndteres i søen i forhold til CUD-hændelser for hver enkelt dataskrivningsindstilling.
Hændelse | Direkte opdatering | Tilføj kun |
---|---|---|
Opret | Rækken indsættes i partitionsfilen og er baseret på createdOn -værdien i rækken. |
Rækken føjes til slutningen af partitionsfilen og er baseret på createdOn -værdien i posten. |
Opdater | Hvis rækken findes i partitionsfilen, erstattes eller opdateres den med opdaterede data. Hvis den ikke findes, indsættes den i filen. | Rækken tilføjes sammen med den opdaterede version i slutningen af partitionsfilen. |
Delete | Hvis rækken findes i partitionsfilen, fjernes den fra filen. | Rækken tilføjes i slutningen af partitionsfilen med IsDelete column = True . |
Bemærk
I forbindelse med Dataverse-tabeller, hvor Tilføj kun er aktiveret, slettes eller fjernes rækken ikke i søen, hvis du sletter en række i kilden. Den slettede række tilføjes i stedet som en ny række i søen, og kolonnen isDeleted
angives til Sand.
Læsning af ubekræftede data (ALLOW_INCONSISTENT_READS) for serveruafhængig er aktiveret for tilstanden Tilføj kun. ALLOW_INCONSISTENT_READS betyder, at brugeren kan læse de filer, der hele tiden kan ændres, mens SELECT
-forespørgslen kører. Resultaterne er konsistente og svarer til at læse et snapshot af filen. Det svarer ikke til isolering af databasesnapshots på grund af tidsforskellen for oprettelse af snapshots.
Ikke alle CUD-ændringer registreres i tilføj kun: Synapse Link behandler ændringer i data i grupper eller "batches", før de udgives i datasøen. Hvis brugeren foretager ændringer inden for et kort tidsinterval, registreres det derfor ikke alle CUD-ændringer i datasøen.
Her er nogle flere oplysninger om, hvornår du skal bruge en af indstillingerne.
- Opret opdatering: Denne indstilling er standardindstillingen og anbefales kun, hvis du vil oprette direkte forbindelse til dataene i området og har brug for den aktuelle tilstand (ikke historik eller trinvise ændringer). Filen indeholder det fulde datasæt og kan bruges via Power BI eller ved at kopiere hele datasæt til ETL-pipelines (Extract, Transfer, Load).
- Tilføj kun: Vælg denne indstilling, hvis du ikke direkte opretter forbindelse til data i søen og ønsker at kopiere data trinvist til et andet mål ved hjælp af ETL-pipelines. Denne indstilling indeholder en oversigt over ændringer, der muliggør scenarier med AI og ML.
Du kan skifte Vis avancerede konfigurationsindstillinger under Avanceret i Azure Synapse Link for Dataverse for at tilpasse din strategi for datapartitioner og vælge indstillinger for skrivning til Azure Data Lake.
Datapartitioner
Når du skriver Dataverse-tabeldata til Azure Data Lake Storage vha. Azure Synapse Link, opdeles tabellerne (i stedet for en enkelt fil) i søen baseret på createdOn
-værdien i hver række i kilden. Standardpartitionsstrategien er efter måned, og data opdeles i Azure-datasø på månedsbasis.
Afhængigt af Dataverse-tabelmængden og datadistributionen kan du vælge at partitionere dataene efter år. Når der skrives Dataverse-tabeldata til Azure-datasø, opdeles indstillingen årligt på baggrund af createdOn
-værdien i hver række i kilden. Hvis der er tabeller uden kolonnen createdOn
, partitioneres rækkerne med data i en ny fil for hver 5.000.000 poster. Dette er en indstilling for de enkelte tabeller, og den er tilgængelig som et afkrydsningsfelt under Avanceret>Vis avancerede konfigurationsindstillinger.
Flere detaljer med eksempler på, hvordan data håndteres i området med en årligt eller månedligt partitionsstrategi: