Důležité informace o provozu pro úlohy Azure VMware Solution
Tento článek popisuje oblast návrhu operací pro Azure VMware Solution. Cílem tohoto článku je vytvořit provozní model pro Azure VMware Solution a aplikace v softwarově definovaném datacentru VMware (SDDC). Standardní provozní postupy (SOPs) jsou zdokumentované procesy správy úloh. Každá úloha řešení Azure VMware by měla mít ip adresy pro řízení operací. Abyste zůstali v souladu s obchodními cíli a zabránili odchylkám od osvědčených postupů, využijte sops v nepřetržitém cyklu hodnocení a kontrol stavu, které spouštíte v úloze řešení Azure VMware.
Sledování závislostí aplikací
Dopad: Efektivita provozu
IT týmy nepřetržitě hledají optimalizaci nasazení, správy a údržby aplikací, webů a služeb. Tento postup pomáhá zajistit vysoký výkon, spolehlivost, škálovatelnost a zabezpečení. Optimalizace zahrnuje pochopení toku aplikací v rámci platformy Azure VMware Solution. Zahrnuje také zkoumání externích závislostí a relací, které jsou mimo privátní cloud. Mapa závislostí je cenný nástroj pro vývojáře, architekty aplikací a IT týmy, kteří se snaží porozumět struktuře a chování aplikací. Přehled o komponentách aplikací, jako je software a infrastruktura, služby a externí závislosti, nabízí vizuální způsob, jak porozumět tokům dat, funkcím a voláním rozhraní API.
Doporučení
- Application Insights slouží ke sledování závislostí, jako jsou databáze, volání rozhraní API a externí služby.
- Pomocí funkce mapy služeb Azure Monitoru můžete automaticky zjišťovat a vizualizovat různé komponenty aplikací a infrastruktury.
- Pomocí nástrojů třetích stran, jako jsou New Relic a Datadog, můžete zjišťovat a mapovat závislosti.
- Používejte vlastní skripty nebo nástroje pro správu konfigurace třetích stran, které sledují automatizaci a nasazení závislostí.
Použití automatizace, systémů správy verzí a blue-green nasazení
Dopad: Efektivita provozu
Organizace můžou zkrátit dobu uvedení na trh a těžit z lepší spolupráce a kvality softwaru díky postupům DevOps. Automatizace může například urychlit nasazení a údržbu aplikací.
Pokud k uspořádání nasazení infrastruktury používáte infrastrukturu jako kód (IaC), můžete využít lepší efektivity při zřizování infrastruktury. IaC může také usnadnit přijetí principů DevOps při správě infrastruktury.
- IaC můžete použít k vytvoření několika prostředků v Azure VMware Solution. Mezi příklady patří celý privátní cloud nebo jednotlivé komponenty, jako jsou clustery, síťová zařízení a úložiště. Nástroje, jako jsou Azure Resource Manager, Bicep, Terraform, Azure CLI a PowerShell, automatizují zřizování a konfiguraci prostředků v Azure VMware Solution.
- Když používáte IaC, můžete aktualizovat infrastrukturu úpravou kódu. Tento přístup zkracuje čas a úsilí potřebné pro ruční konfiguraci a zřizování.
- Výstup vrácený z nasazení IaC může sloužit jako dokumentace, která pomáhá udržovat a poskytovat větší přehled o stavu a konfiguraci zřízených prostředků.
Systémy správy verzí poskytují způsob, jak spravovat kód a používat správu verzí ke sledování a vrácení změn zpět podle potřeby.
Když potřebujete aktualizovat kód aplikace napříč servery, můžou být nasazení modrá-zelená užitečné mnoha způsoby:
- Pomáhají při správě životního cyklu aplikace od vývoje po produkční prostředí.
- Pomáhají zákazníkům zajistit konzistentní webové prostředí při použití aktualizací a oprav.
- Používají vážené algoritmy k distribuci provozu pouze na servery, které jsou v pořádku během údržby.
Azure VMware Solution nenabízí metody, které nabízí nativní cloudová aplikace pro dosažení nasazení s modrou zelenou barvou. Ve službě Azure VMware Solution jsou ale stále možná tato nasazení:
- Než provedete změny konfigurace aplikace, pořiďte snímky prostředí.
- Pomocí správy verzí se ujistěte, že se můžete vrátit do posledního známého dobrého stavu.
- Než přejdete do provozu, zvažte vytvoření přípravného prostředí, které zrcadlí produkční prostředí a nasadí aktualizace.
- Z přípravného prostředí proveďte kumulativní aktualizace podmnožině serverů a otestujte aplikaci.
Ruční úsilí můžete snížit, minimalizovat chyby a zlepšit využití prostředků automatizací rutinních úloh, jako je zřizování, škálování a opravy. Metodologie DevOps jsou důležitým prvkem dobře navrženého řešení pro zjednodušení provozu, úsporu času a pomáhá týmům soustředit se na aktivity přidané hodnoty.
Doporučení
- Pomocí IaC nasaďte a zřiďte infrastrukturu způsobem, který je opakovatelný, auditovatelný a konzistentní.
- Automatizujte rozšíření a stahování pomocí IaC.
- Pomocí systémů správy verzí můžete podle potřeby sledovat změny, spolupracovat a vracet kód zpět do předchozích verzí.
- Využijte modrozelenou koncepci vytvořením přípravného prostředí, které před zahájením provozu zrcadlí produkční a testovací prostředí.
- Udržujte poslední dobrý stav aplikace pomocí snímků, klonování disků a s kódem řízeným verzí.
Definování rolí a procesů
Dopad: Efektivita provozu
Dobře definované role a odpovědnosti pomáhají zajistit srozumitelnost, odpovědnost a efektivní správu dobře navrženou úlohu Azure VMware Solution. Definování sady standardů a strukturovaných procesů a znalost, kdo je spouští, vede k efektivnímu provozu a pomáhá IT organizacím v souladu s technickými nabídkami s obchodními cíli a strategiemi. S tím, jak se prostředí Azure VMware Solution rozrůstá a vyvíjí, dobře definované role a zodpovědnosti vedou k jednoduššímu delegování úkolů a potenciálu škálování řešení bez přerušení. Výsledkem je lepší prostředí pro uživatele aplikace.
Je důležité mít kulturu neustálého zlepšování, která se zaměřuje na efektivní každodenní operace pro aplikace v privátním cloudu. Mezi příklady operací patří udržování smluv o úrovni služeb (SLA), udržování dostupnosti, minimalizace přerušení služeb a bezproblémové doručování. Azure VMware Solution například umožňuje rozšířit prostředí s minimálním uživatelským vstupem. Pokud smlouvu ručně rozbalíte, měli byste zdokumentovat, kdo provádí přidružené aktivity a jak je provést. Operátoři Azure VMware Solution by měli zajistit, aby rezervace uzlů byla k dispozici pro rozšíření prostředí podle potřeby. Určete například jednotlivce, kteří jsou zodpovědní za identifikaci nevyužitých nebo nečinných prostředků. Poskytněte těmto jednotlivcům proces pro správné určení velikosti virtuálních počítačů, aby se snížily zbytečné náklady.
Aplikační týmy a vývojáři by měli definovat pokyny pro kódování pro strukturu kódu, výjimky a zpracování chyb. Měli byste mít také metody pro sledování změn, jako jsou pravidelné kontroly kódu, dokumentace k rozhraní API a běžné refaktoringy kódu. Pokud používáte správu verzí, vynucujte osvědčené postupy, jako je větvení, potvrzení zpráv a schvalovací pracovní postupy. Tyto postupy vám můžou pomoct zajistit konzistentní, snadnou a udržovatelnou konzistenci kódu.
Doporučení
- Spolupracujte s týmem CCoE (Cloud Center of Excellence) a seznamte se se standardy a pokyny pro dodržování předpisů, zabezpečení, aplikační architekturu a provozní procesy.
- Tým pro zabezpečení a dodržování předpisů se zaměřuje na zásady zabezpečení, které jsou specifické pro Azure VMware Solution. Tým také provádí posouzení rizik a zajišťuje dodržování zákonných požadavků.
- Přijmout architekturu, jako je knihovna ITIL (Information Technology Infrastructure Library). Nebo použijte postupy mezinárodní organizace pro standardizaci (ISO) k mapování každodenních operací, procesů a aktivit. Tyto postupy můžou vést k rychlejším přenosům znalostí, průběžným vylepšením a lepší správě změn.
- Definujte standardy kódování a implementujte postupy zabezpečení během vývoje aplikací.
Použití strategií označování a osvědčených postupů
Dopad: Efektivita provozu
Můžete použít strategii označování pro vracení peněz a sledování prostředků. Značky jsou hodnoty páru klíčů, které definujete na úrovni prostředku a použijí se během zřizování. Pomocí IaC můžete vytvářet, aktualizovat a zničit hostující virtuální počítače. Značky a IaC spolupracují s nástroji pro správu konfigurace. Značky můžete použít v následujících oblastech:
- Prostředí. K identifikaci prostředků můžete použít značky, jako je produkční, qa nebo vývojový test .
- Nákladová centra pro sledování nákladů na prostředky a výdajů.
- Smlouvy SLA pro stanovení priority požadavků smlouvy SLA pro prostředky.
- Životní cyklus. Aplikace můžete označovat jako aktivní, archivované nebo vyřazené.
- Důležitost– označováním prostředků na základě jejich obchodního dopadu a významu
V rámci strategie zásad správného řízení a dodržování předpisů by měla být skupina zodpovědná za identifikaci prostředků bez značek. Tato skupina může kombinovat automatizaci, auditování a procesy, které pomáhají identifikovat a napravit prostředky, které nesplňují zásady dodržování předpisů pro označování.
Tyto aspekty označování jsou obecné. Je důležité, aby strategie označování podporovala efektivní kategorizaci prostředků, správu životního cyklu prostředků a vytváření sestav v rámci řešení Azure VMware.
Doporučení
- Použijte značky pro správu prostředků pomocí organizační taxonomie k identifikaci úloh a infrastruktury. Taxonomie by měla zahrnovat hostitele, firmu, vlastníka a prostředí.
- Pomocí vhodných nástrojů můžete během zřizování udržovat a používat značky prostřednictvím kódu programu.
- Používejte značky, které odpovídají iniciativám vaší organizace v oblasti dodržování předpisů a zásad správného řízení, jako jsou smlouvy SLA, zásady vracení peněz a postupy správy životního cyklu.
- Musí být zavedeny procesy pro identifikaci a nápravu prostředků, které nevyhovují požadavkům na označování.
Vytvoření týmů reakce na incidenty
Dopad: Efektivita provozu
Pokud chcete sledovat stav úloh v privátním cloudu, je důležité monitorovat metriky, jako jsou využití procesoru, protokoly operačního systému a výstrahy zabezpečení. Abyste zajistili efektivitu systému výstrah, musíte vyhodnotit několik klíčových provozních aspektů. Konkrétně zkontrolujte, že:
- Identifikují se všechny důležité komponenty, jako jsou databáze, síťová zařízení a úložiště.
- Prahové hodnoty jsou správně nastaveny.
- Výstrahy jsou specifické a použitelné.
- Ti, kteří mají správné lidi, dostanou upozornění.
- Neexistuje značné množství šumu a falešně pozitivních výsledků.
- Jsou zavedeny odpovídající postupy eskalace.
Před incidentem nebo výpadkem je důležité vytvořit dobře definovaný proces oznámení, který zajistí včasnou komunikaci. Identifikace příslušných pracovníků zodpovědných za řešení je zásadní. Vyhrazený tým pro nápravu může zahrnovat provozní pracovníky, vlastníky aplikací a odborníky na DevOps, kteří mají odborné znalosti potřebné k rychlému řešení problémů. Provozní tým si musí být vědom vhodných jednotlivců, aby se zapojil do třídění jednotlivých problémů.
Tým reakce na incidenty může efektivně koordinovat odpovědi udržováním komplexního distribučního seznamu. Tento seznam by měl zahrnovat klíčové zúčastněné strany z důležitých obchodních oddělení a určených kontaktů pro eskalaci. Obchodní zúčastněné strany musí být informovány o jakémkoli potenciálním dopadu na provoz, který je výsledkem incidentu. Přiřazené eskalační kontakty by měly být jednotlivci, kteří můžou dělat rozhodnutí nebo eskalovat problémy na vyšší úrovni, aby vám mohly pomoct.
Pravidelná kontrola distribučního seznamu je nezbytná k zajištění přesnosti a souladu s aktuálními rolemi a zodpovědnostmi. Kontroly zajišťují, aby klíčové zúčastněné strany byly neprodleně informovány o významných událostech, ke kterým dochází v řešení Azure VMware.
Řešení správy IT služeb (ITSM) může mapovat události na úlohy. Například nativní ITSM Azure může ke správě úloh použít Azure DevOps. Může použít Azure Automation k automatizaci IT procesů a Azure Logic Apps pro vytváření pracovních postupů. Výsledkem je přizpůsobené řešení pro správu problémů ve službě Azure VMware Solution.
Doporučení
- Definujte vhodné příjemce pro výstrahy a incidenty řešení Azure VMware.
- Jasně definujte eskalační kontakty, které by měly být dostupné a autorizované k rozhodování nebo eskalaci problémů.
- Identifikujte klíčové obchodní účastníky nebo zástupce, abyste zajistili viditelnost potenciálního dopadu a poskytli pokyny.
- Mít zavedený tým pro nápravu, který se skládá ze správců, inženýrů infrastruktury a pracovníků, kteří mají odborné znalosti potřebné k řešení a řešení problémů.
- Integrace upozornění s ITSM, jako je Azure DevOps, JIRA nebo ServiceNow
Postupy dokumentu
Dopad: Spolehlivost
Je důležité mít jasné znalosti o infrastruktuře zálohování a obnovení, která ve vašem prostředí existuje. Pokud chcete nakonfigurovat řešení zálohování, musíte nejprve definovat cíle zálohování pro vaši infrastrukturu. Aplikace, databáze a prostředky byste měli zálohovat v úložišti objektů blob nebo ve službě Azure Backup Vault. Měli byste také určit vlastníky, kteří zodpovídají za zálohování a obnovení aplikace.
Doporučení
- Jasně zdokumentujte svou infrastrukturu zálohování a obnovení.
- Jasně zdokumentujte postupy zálohování a obnovení.
Implementace řešení zálohování a obnovení
Dopad: Spolehlivost
Privátní cloud by měl chránit před ztrátou dat, minimalizovat výpadky a udržovat kontinuitu operací v případě neočekávaných přerušení nebo havárií.
Pro zajištění kontinuity podnikových procesů je potřeba implementovat robustní ochranu dat, která vám pomůžou zajistit dostupnost, integritu a obnovitelnost virtuálních počítačů a důležitých dat v prostředí Azure VMware Solution. Zálohovací nástroje musí být zavedené a musíte také potvrdit, že fungují. Klíčovým principem azure VMware Solution je poskytování technické podpory nezávislého dodavatele softwaru (ISV), která je ověřená pomocí řešení Azure VMware. Porozumění partnerům a možnostem, které máte k dispozici, je pro úspěch zálohování velmi důležité.
Doporučení
- Použijte řešení zálohování, která Microsoft podporuje, například Microsoft Azure Backup Server nebo schválené dodavatele třetích stran.
Upozornění
Ujistěte se, že virtuální počítače ve vašem prostředí zálohování používají operační systémy s podporou. Seznamte se s podporovanými operačními systémy.
Použití Azure Site Recovery
Dopad: Spolehlivost
Azure Site Recovery je řešení zotavení po havárii navržené tak, aby minimalizovalo výpadky virtuálních počítačů v prostředí Azure VMware Solution v případě havárie. Azure Site Recovery automatizuje a orchestruje převzetí služeb při selhání a navrácení služeb po obnovení. Integrované nedisruptivní testování pomáhá zajistit splnění cílů doby obnovení (RTO). Azure Site Recovery zjednodušuje správu prostřednictvím automatizace a pomáhá zajistit rychlou a vysoce předvídatelnou dobu obnovení.
Doporučení
- V prodlouženém regionálním výpadku chraňte své úlohy tím, že je replikujete do alternativní oblasti Azure.
- Nakonfigurujte Azure Site Recovery tak, aby odesílala zálohy do alternativní oblasti.
Obměna tajných kódů
Dopad: Zabezpečení
Je náročnější, aby útočníci měli přístup k šifrovaným datům nebo je zneužívali, pokud nemají přístup k šifrovacím klíčům. Klíče, tajné kódy a certifikáty byste měli bezpečně ukládat a často je otáčet. Mezi komplexní kroky zabezpečení a údržby integrity dat patří:
- Šifrování dat
- Bezpečné ukládání klíčů.
- Šifrování dat na úrovni aplikace před přenosem dat
Doporučení
- K ukládání šifrovacích klíčů použijte Azure Key Vault.
Další kroky
Teď, když jste se podívali na postupy provozní správy, se dozvíte, jak integrovat úlohu Azure VMware Solution s cílovými zónami Azure.
Pomocí nástroje pro posouzení vyhodnoťte volby návrhu.