Dela via


Uppdatering av dataflöde

Med dataflöden kan du ansluta till, transformera, kombinera och läsa in data till lagring för nedströmsförbrukning. Ett nyckelelement i dataflöden är uppdateringsprocessen, som tillämpar de transformeringssteg som definierades under redigeringen för att extrahera, transformera och läsa in data till mållagringen.

Skärmbild som visar ett exempeldataflöde.

En dataflödesuppdatering kan utlösas på något av två sätt, antingen på begäran eller genom att konfigurera ett uppdateringsschema. En schemalagd uppdatering körs baserat på de specifika dagar och tider som du anger.

Förutsättningar

Här är förutsättningarna för att uppdatera ett dataflöde:

Uppdatering på begäran

Om du vill uppdatera ett dataflöde på begäran väljer du Ikonen Uppdatera som finns i arbetsytans lista eller ursprungsvyer.

Skärmbild som visar var du väljer uppdatering i listvyn för arbetsytor.

Det finns andra sätt att utlösa en dataflödesuppdatering på begäran. När en dataflödespublicering har slutförts startas en uppdatering på begäran. Uppdatering på begäran kan också utlösas via en pipeline som innehåller en dataflödesaktivitet.

Schemalagd uppdatering

Om du vill uppdatera ett dataflöde automatiskt enligt ett schema väljer du ikonen Schemalagd uppdatering som finns i arbetsytans listvy:

Skärmbild som visar var du väljer schemalagd uppdatering i listvyn för arbetsytan.

I uppdateringsavsnittet kan du definiera frekvensen och tidsintervallen för att uppdatera ett dataflöde, upp till 48 gånger per dag. Följande skärmbild visar ett dagligt uppdateringsschema med ett intervall på 12 timmar.

Skärmbild som visar ett exempel på en uppdateringsinställning på 12 timmar per dag.

Avbryt uppdatering

Avbryt dataflödesuppdateringen är användbar när du vill stoppa en uppdatering under hög belastning, om en kapacitet närmar sig sina gränser eller om uppdateringen tar längre tid än förväntat. Använd funktionen för att avbryta uppdateringen för att sluta uppdatera dataflöden.

Om du vill avbryta en dataflödesuppdatering väljer du Avbryt-ikonen som finns i arbetsytelistan eller ursprungsvyer för ett dataflöde med pågående uppdatering.

Skärmbild som visar var du konfigurerar dataflödesuppdateringsschemat på sidan för dataflödesinställningar.

När en dataflödesuppdatering har avbrutits uppdateras dataflödets status för uppdateringshistorik för att återspegla avbruten status:

Skärmbild som visar vyn uppdateringshistorik för dataflöden för en avbruten dataflödesuppdatering.

Uppdateringsbegränsningar

För dataflödesuppdateringar finns det några begränsningar:

  1. Per dataflöde får du bara ha 150 uppdateringar per 24 timmar (rullande fönster). När du överskrider den här gränsen får du ett fel i uppdateringshistoriken och uppdateringarna återupptas när du är under gränsen.
  2. Om den schemalagda dataflödesuppdateringen misslyckas i följd pausar vi uppdateringsschemat för dataflödet och skickar ett e-postmeddelande till dataflödets ägare. Följande regler gäller i det här fallet:
    • 72 timmar (3 dagar)
      • 100 % felfrekvens över 72 timmar
      • Minst 6 uppdateringar (2 uppdateringar om dagen)
    • 168 timmar (1 vecka)
      • 100 % felfrekvens över 168 timmar
      • Minst 5 uppdateringar (1 uppdatering om dagen)
  3. En enskild utvärdering av en fråga har en gräns på 8 timmar.
  4. Den totala uppdateringstiden för en enskild uppdatering av ett dataflöde är begränsad till högst 24 timmar.
  5. Per dataflöde kan du ha högst 50 mellanlagrade frågor eller frågor med utdatamål eller kombination av båda.

Uppdateringsreduceringskonsekvenser för utdata

En dataflödesuppdatering kan stoppas via funktionen Avbryt uppdatering eller om ett fel uppstod under bearbetningen av dataflödets frågor. Olika resultat kan observeras beroende på typ av mål och när uppdateringen stoppades. Här är de möjliga resultaten för de två typerna av datamål för en fråga:

  • Frågan läser in data till mellanlagring: Data från den senaste lyckade uppdateringen är tillgängliga.
  • Frågan läser in data till ett datamål: Data som skrivits fram till avbokningspunkten är tillgängliga.

Alla frågor i ett dataflöde bearbetas inte samtidigt, till exempel om ett dataflöde innehåller många frågor eller om vissa frågor är beroende av andra. Om en uppdatering avbryts innan utvärderingen av en fråga som läser in data till ett mål påbörjas ändras inga data i frågans mål.