Apache Flink-konfigurationshantering® i HDInsight på AKS
Viktig
Azure HDInsight på AKS drogs tillbaka den 31 januari 2025. Lär dig mer genom den här tillkännagivelsen.
Du måste migrera dina arbetsbelastningar till Microsoft Fabric- eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar.
Viktig
Den här funktionen är för närvarande i förhandsversion. De kompletterande användningsvillkoren för förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. För frågor eller funktionsförslag, skicka en begäran på AskHDInsight med detaljerna och följ oss för fler uppdateringar på Azure HDInsight Community.
HDInsight på AKS innehåller en uppsättning standardkonfigurationer av Apache Flink för de flesta egenskaper och några baserat på vanliga programprofiler. Men om du måste justera Flink-konfigurationsegenskaper för att förbättra prestanda för vissa program med tillståndsanvändning, parallellitet eller minnesinställningar kan du ändra Flink-jobbkonfigurationen med hjälp av avsnittet Flink-jobb i HDInsight i AKS-kluster.
Gå till Inställningar > Flinkjobb > Klicka på Uppdatera.
Klicka på + Lägg till en rad för att redigera konfigurationen.
Här ändras kontrollpunktsintervallet på klusternivå.
Uppdatera ändringarna genom att klicka på OK och sedan Spara.
När de nya konfigurationerna har sparats uppdateras de om några minuter (~5 minuter).
Konfigurationer som kan uppdateras med konfigurationshanteringsinställningar.
processMemory size:
Standardinställningarna för processminnets storlek eller jobbhanteraren och Aktivitetshanteraren är det minne som konfigurerades av användaren när klustret skapades.
Den här storleken kan konfigureras med hjälp av konfigurationsegenskapen nedan. Använd den här konfigurationen för att ändra processminnet för Aktivitetshanteraren.
taskmanager.memory.process.size : <value>
Exempel:
taskmanager.memory.process.size : 2000mb
För jobbhanterare
jobmanager.memory.process.size : <value>
Obs
Det maximala konfigurerbara processminnet är lika med det minne som konfigurerats för
jobmanager/taskmanager
.
Kontrollpunktsintervall
Kontrollpunktsintervallet avgör hur ofta Flink utlöser en kontrollpunkt. Definieras i millisekunder och kan anges med hjälp av följande konfigurationsegenskap
execution.checkpoint.interval: <value>
Standardinställningen är 60 000 millisekunder (1 min), det här värdet kan ändras efter behov.
Tillståndsserverdel
Tillståndsserverdelen avgör hur Flink hanterar och bevarar programmets tillstånd. Det påverkar hur kontrollpunkter lagras. Du kan konfigurera "state backend" med hjälp av följande egenskap:
state.backend: <value>
Som standard använder Apache Flink-kluster i HDInsight på AKS Rocks DB.
Sökväg för kontrollpunktslagring
Vi tillåter beständiga kontrollpunkter som standard genom att lagra kontrollpunkterna i abfs
lagring enligt användarens konfiguration. Även om arbetet misslyckas, eftersom kontrollpunkterna sparas, kan det enkelt återupptas med den senaste kontrollpunkten.
state.checkpoints.dir: <path>
Ersätt <path>
med önskad sökväg där kontrollpunkterna lagras.
Som standard lagras det i lagringskontot (ABFS), som konfigurerats av användaren. Det här värdet kan ändras till valfri sökväg så länge Flink-poddarna kan komma åt det.
Maximalt antal samtidiga kontrollpunkter
Du kan begränsa det maximala antalet samtidiga kontrollpunkter genom att ange följande egenskap: checkpoint.max-concurrent-checkpoints: <value>
Ersätt <value>
med önskat maximalt antal samtidiga kontrollpunkter. Till exempel 1 för att endast tillåta en kontrollpunkt i taget.
Maximalt antal bevarade kontrollpunkter
Du kan begränsa det maximala antalet kontrollpunkter som ska behållas genom att ange följande egenskap:
state.checkpoints.num-retained: <value>
Ersätt <value>
med önskat maximalt antal. Som standard behåller vi högst fem kontrollpunkter.
Sökväg till Savepoint Storage
Vi tillåter beständiga sparanden som standard genom att lagra sparanden i abfs
lagring (enligt användarens konfiguration). Om användaren vill stoppa jobbet och senare starta det med en viss sparpunkt, kan de konfigurera denna plats.
state.checkpoints.dir: <path>
Ersätt <path>
med önskad sökväg där sparandepunkterna lagras.
Lagras som standard i lagringskontot, konfigurerat av användaren. (Vi stöder ABFS). Det här värdet kan ändras till valfri sökväg så länge Flink-poddarna kan komma åt det.
Hög tillgänglighet för Jobbhanteraren
I HDInsight på AKS använder Flink Kubernetes som serverdel. Även om Job Manager misslyckas emellanåt på grund av ett känt eller okänt problem, startas podden om inom några sekunder. Även om jobbet startas om på grund av det här problemet återställs jobbet därför tillbaka från senaste kontrollpunkten.
FAQ
Varför misslyckas jobbet däremellan? Även om jobben misslyckas plötsligt, om kontrollpunkterna sker kontinuerligt, startas jobbet som standard om från den senaste kontrollpunkten.
Vill du ändra jobbstrategin däremellan? Det finns användningsfall där jobbet måste ändras i produktion på grund av en bugg på jobbnivå. Under den tiden kan användaren stoppa jobbet, vilket automatiskt skulle ta en sparpunkt och spara den på sparpunktens plats.
Klicka på
savepoint
och vänta tillssavepoint
har slutförts.När savepoint har slutförts klickar du på Start och fliken Starta jobb visas. Välj savepoint-namnet i listrutan. Redigera eventuella konfigurationer om det behövs. Och klicka på OK.
Eftersom savepoint tillhandahålls i det specifika jobbet vet Flink var bearbetningen av data ska börja.
Hänvisning
- Apache Flink-konfigurationer
- Apache, Apache Kafka, Kafka, Apache Flink, Flink och associerade projektnamn med öppen källkod är varumärken av Apache Software Foundation (ASF).