Jaa


Hätätilannetoimenpiteitä koskevan strategian suunnittelua koskevat suositukset

Koskee tätä Power Platform Well-Architected- ratkaisun toiminnan korkean laadun tarkistusluetteloa koskevaa suositusta:

OE:07 Kehitä tehokas hätätilannetoimenpiteiden käytäntö. Varmista, että työmääräsi lähettää merkityksellisiä kuntosignaaleja. Kerää tuloksena olevat tiedot ja luo niiden avulla toiminnallisia hälytyksiä, jotka toteuttavat hätätilannevastauksia koontinäyttöjen ja kyselyjen avulla. Määritä ihmisten vastuualueet, kuten päivystyskierrot, tapausten hallinta, hätätilanneresurssien käyttö ja jälkiselvittelyjen suorittaminen, selkeästi.

Tässä oppaassa kuvataan hätätilannetoimenpiteitä koskevan strategian suunnittelua koskevat suositukset. Osa työkuormistasi saattaa olla kriittisiä, ja työkuorman elinkaaren aikana ilmenevät ongelmat voivat olla niin vakavia, että ne on syytä julistaa hätätilanteiksi. Voit ottaa käyttöön tiukasti hallittuja ja kohdistettuja prosesseja ja toimintatapoja, joita ryhmäsi voi noudattaa, millä varmistetaan, että ongelmat käsitellään rauhallisesti ja järjestelmällisesti. Hätätilanteet lisäävät luonnollisesti kaikkien stressitasoja ja voivat johtaa kaoottiseen ympäristöön, jos tiimisi ei ole valmistautunut hyvin. Jotta stressiä ja sekaannusta olisi mahdollisimman vähän, suunnittele vastausstrategia, jaa vastausstrategia organisaatiollesi ja järjestä säännöllistä hätätilannetoimenpiteitä koskevia koulutuksia.

Tärkeimmät suunnittelustrategiat

Hätätilannetoimenpiteitä koskevan strategian pitäisi olla hyvin määritetty prosessien ja toimintatapojen joukko. Jokaisella prosessilla ja menettelyllä olisi oltava komentosarjoja, joilla varmistetaan, että jokainen vaihe vie tiimiäsi kohti ongelman nopeaa ja turvallista ratkaisemista. Ota seuraava yleiskatsaus huomioon hätätilannetoimenpiteitä koskevan strategian luomisessa:

  • Edellytykset
    • Luo seurantajärjestelmä
    • Luo tapauksiin reagoinnin suunnitelma
  • Tapausvaiheet
    • Tunnistaminen ja leviämisen estäminen
    • Luokitteleminen
  • Tapauksen jälkeiset vaiheet
    • Juurisyyanalyysi (RCA)
    • Jälkiselvittely
  • Käynnissä oleva aktiviteetti
    • Hätätilannetoimenpiteiden harjoitukset

Seuraavissa osissa annetaan suosituksia kuhunkin näistä vaiheista.

Seurantajärjestelmä

Jotta sinulla olisi vankka hätätilannevastausstrategia, sinulla on oltava käytössä vankka seurantajärjestelmä tai tunnistusympäristö. Näkyvyysympäristöllä olisi oltava seuraavat ominaisuudet:

  • Kokonaisvaltainen seuranta: Varmista, että seuraat työmäärääsi perusteellisesti määrityksen ja soveltamisen näkökulmasta, ja lisää infrastruktuurin valvontaa, jos työmääräsi komponentteja isännöidään pilvessä tai paikallisesti. Varmista, että seurantastrategiasi kattaa kaikki työkuormasi komponentit. Jos työkuormasi on esimerkiksi vuorovaikutuksessa Azure-resurssien tai paikallisen järjestelmän kanssa, sisällytä kyseiset komponentit seurantaan.

  • Yksityiskohtainen lokiin kirjaaminen: Ota komponenttien yksityiskohtainen lokiin kirjaaminen käyttöön avuksi tutkimuksiin, kun ongelma luokitellaan. Jäsentele lokit siten, että niitä on helppo hallita. Lähetä lokit automaattisesti datanieluihin, jotta ne ovat valmiita analyysiä varten.

  • Hyödyllisiä koontinäyttöjä: Luo kuntomalliin perustuvia koontinäyttöjä, jotka on räätälöity organisaation jokaiselle tiimille. Eri tiimit vastaavat työmäärän kunnon eri näkökohdista.

  • Toiminnalliset hälytykset: Luo hälytyksiä, jotka ovat hyödyllisiä työmäärätiimeillesi. Vältä hälytyksiä, jotka eivät edellytä toimia tiimeiltäsi. Jos tällaisia hälytyksiä on liian paljon, ihmiset alkavat jättää huomiotta tai estää hälytysilmoituksia.

  • Automaattiset ilmoitukset: Varmista, että asianmukaiset tiimit saavat automaattisesti hälytykset, jotka edellyttävät niiltä toimia. Tason 1 tukitiimin pitäisi esimerkiksi saada ilmoitukset kaikista hälytyksistä, kun taas tietoturva-asiantuntijoiden pitäisi saada vain suojaustapahtumia koskevia hälytyksiä.

Lisätietoja on kohdassa Valvontaympäristön suunnittelemiseen ja luomiseen liittyvät suositukset.

Tapauksiin reagoinnin suunnitelma

Hätätilannetoimenpiteitä koskevan strategian perustana on tapauksiin reagoinnin suunnitelma. Kuten järjestelmän palautussuunnitelmassa, määrittele selkeästi ja perusteellisesti roolit, vastuut ja menettelyt vaaratilanteeseen reagoimiseksi. Suunnitelman pitäisi olla versioltaan hallittu asiakirja, jota tarkistetaan säännöllisesti sen ajantasaisuuden varmistamiseksi.

Määritä suunnitelmassasi selkeästi seuraavat komponentit.

Roolit

Määritä tapauksiin reagoinnin johtaja. Tämä henkilö omistaa tapauksen sen alkamisesta ja korjaamisesta aina juurisyyanalyysiin asti. Häiriötilanteiden vastauspäällikkö varmistaa, että prosesseja noudatetaan ja asiaankuuluville osapuolille tiedotetaan, kun vastausryhmä suorittaa työtään.

Määritä jälkiselvittelyn johtaja. Tämä henkilö varmistaa, että jälkiselvittely suoritetaan pian tapauksen ratkaisemisen jälkeen. Hän laatii raportin, joka auttaa toteuttamaan tapauksesta saadut löydökset.

Prosessit ja toimintatavat

Työmäärätiimin olisi määritettävä ja ymmärrettävä hätätilannekriteerit. Kun tiimisi katsoo tapauksen olevan vakava, voit julistaa sen hätätilanteeksi ja aloittaa järjestelmänpalautussuunnitelman täytäntöönpanon. Lievemmissä tapauksissa ongelma ei välttämättä täytä katastrofin kriteerejä, mutta ongelma kannattaa silti katsoa hätätilanteeksi, joka edellyttää hätävastaussuunnitelman aloittamista. Hätätilanteet voivat olla joko työmäärän sisäisiä (kuten virheitä sovelluksen koodissa) tai tulosta ongelmasta, joka on riippuvainen työmäärästä (kuten se, ettei ohjelmointirajapinta tai tietokanta ole käytettävissä). Hätätilanteen syynä voi olla myös toimittajan häiriö (kuten Microsoft Entra ID:hen tai Power Platformiin liittyvä ongelma). Tukitiimin on pystyttävä määrittämään, täyttääkö ongelma hätätilanteen kriteerit, vaikka tiimillä ei olisi näkyvyyttä taustalla olevaan ongelmaan.

Määritä viestintä- ja eskalointisuunnitelmat tarkasti. Varmista saadun hälytysilmoituksen tyypin perusteella, että tason 1 tukitiimisi jäsenet voivat helposti ottaa yhteyttä asianmukaisiin tiimeihin eskaloituvien ongelmien ratkaisemiseksi.

Muut sisällytettävät asiat

Dokumentoi kaikki vakiotyökalut, joita käytetään tapausten aikana sisäiseen viestintään (esimerkiksi Microsoft Teams) ja tapauksen aktiviteettien seurantaan (kuten lipputyökalut ja keskeneräisten tehtävien suunnittelutyökalut).

Dokumentoi hätätilannetunnistetietosi, jotka tunnetaan myös riko lasi -tileinä. Sisällytä vaiheittainen opas, jossa kuvaillaan niiden käyttö.

Luo hätätilanneharjoituksen ohjeet ja pidä kirjaa siitä, milloin harjoituksia suoritetaan.

Dokumentoi tarvittavat oikeudelliset tai säädökselliset toimenpiteet, kuten tietoturvaloukkauksista ilmoittaminen.

Häiriöiden tunnistaminen ja leviämisen estäminen

Kun käytössä on hyvin suunniteltu seurantajärjestelmä, joka suorittaa seurantaa poikkeavuuksien varalta ja ilmoittaa niistä automaattisesti, voit havaita ongelmat nopeasti ja määrittää niiden vakavuuden. Jos ongelma katsotaan hätätilanteeksi, suunnitelman täytäntöönpano voidaan aloittaa. Joissakin tapauksissa tukitiimille ei ilmoiteta seurantajärjestelmän kautta. Käyttäjät saattavat ilmoittaa ongelmista tuelle käyttämällä tukitiimin viestintäkanavia. He voivat myös ottaa yhteyttä henkilöihin, joiden kanssa he työskentelevät säännöllisesti tai joiden he tietävät käyttävän Power Platformia, kuten Power Platform -palvelun järjestelmänvalvojat ja osaamiskeskuksen tiimi. Riippumatta siitä, miten tukitiimi saa ilmoituksen, sen on aina noudatettava samoja vaiheita ongelman vahvistamisessa ja sen vakavuuden määrittämisessä. Poikkeaminen toimenpiteitä koskevasta suunnitelmasta voi lisätä stressiä ja sekaannusta.

Luokitteleminen

Ongelman korjaamisen ensimmäinen vaihe on ongelman aiheuttavan työmäärän komponentin tunnistaminen. Luokittelemisen vaiheet määräytyvät ongelman tyypin mukaan. Työmäärän tuen tietyn alueen tiimin tulee luoda menettelytavat tapauksille, jotka liittyvät tiimin työhön. Esimerkiksi suojaustiimien pitäisi luokitella suojausongelmia, ja niiden pitäisi noudattaa itse kehittämiään komentosarjoja. On tärkeää, että tiimit noudattavat hyvin määritettyjä komentosarjoja, kun he työskentelevät luokittelemisen parissa. Näiden komentosarjojen olisi oltava vaiheittaisia ohjeita, jotka sisältävät palautusprosessit sellaisten muutosten kumoamiseksi, jotka ovat tehottomia tai voivat aiheuttaa muita ongelmia. Kun ongelma on ratkennut, voit tuoda asianomaisen komponentin turvallisesti työmäärän työnkulkupolkuihin, jos noudatat hyvin määritettyjä prosesseja.

Juurisyyanalyysistä raportointi

Häiriön omistajan tai hänen kanssaan läheisessä yhteistyössä työskennelleen henkilön olisi luotava juurisyyanalyysin (RCA) raportit. Tällä strategialla varmistetaan, että tapauksesta saadaan tarkka selostus. Yleensä organisaatioilla on määritetty RCA-malli, joka sisältää ohjeita tietojen esittämiseen ja siihen, millaisia tietoja voidaan jakaa ja millaisia ei. Jos sinun on luotava oma mallisi ja ohjeet, varmista, että sidosryhmät tarkastavat ja hyväksyvät ne.

Tapausten jälkiselvittely

Puolueettoman henkilön pitäisi johtaa syyllistämättömiä jälkiselvittelyjä. Jälkiselvittelyistunnoissa kaikki jakavat tapauksesta saamansa löydökset. Jokaisen tapauksen vastaukseen osallistuneen tiimin tulee sisältää henkilöitä, jotka ovat käsitelleet tapausta. Näiden henkilöiden tulee esitellä istunnossa esimerkkejä onnistuneista toiminnoista ja parannusalueista. Istunto ei ole foorumi, jossa osoitetaan syyllisyys häiriöstä tai ongelmista, joita voi aiheutua siihen vastaamisen yhteydessä. Jälkiselvittelyjohtajalla pitäisi istunnon jälkeen olla selkeä luettelo toimista, jotka keskittyvät parannuksiin, kuten:

  • Parannuksia toimenpiteitä koskevaan suunnitelmaan. Prosesseja tai toimintatapoja saattaa olla tarpeen arvioida ja kirjoittaa uudelleen, jotta ne vastaavat paremmin asianmukaisia toimia.
  • Parannuksia seurantajärjestelmään. Raja-arvoja voi olla arpeen arvioida uudelleen, jotta kyseessä olevan tyypin tapaukset havaitaan aiemmin, tai uutta seurantaa voi olla tarpeen ottaa käyttöön sellaisen toiminnan havaitsemiseksi, jota ei ennen otettu huomioon.
  • Parannuksia työmäärään. Tapaus saattaa paljastaa työmäärän haavoittuvuuden, joka on käsiteltävä pysyvän korjauksen muodossa.

Huomioitavia seikkoja

Hätätilannetoimenpiteitä koskevan strategian olisi oltava läheisesti linjassa yleisen Power Platformin tukistrategian kanssa. Power Platform -järjestelmänvalvojien ja osaamiskeskuksen tiimin kanssa voidaan keskustella tuesta ja hätätilannesuunnitelmavaihtoehdoista sekä prosesseista, jotka on ehkä jo määritetty.

Kun määrität tukiprosessin ja eskalaatiopolun, on tärkeää luokitella luodut ratkaisut kriittisyyden perusteella. Tämän käytännön avulla voit luoda prosesseja, jotka varmistavat, että kriittisillä sovelluksilla on tarvittavat varmistuksen niiden tueksi, mutta eivät kuitenkaan tukahduta tuottavuusskenaarioiden innovointia tai ylikuormita tapauksiin vastaavia tiimejäsi. Kun määrität tukimalleja, mieti myös valmistumispolkua. Ratkaisu saattaa aluksi vaatia vain tuottavuustason tukea, mutta sen toiminnallisuus tai käyttäjäkunta saattaa kasvaa niin, että se vaatii korkeampaa tukitasoa. Määritä, miten päättäjät voivat pyytää muodollista tukea ja siirtyä ratkaisusta tuettuihin ympäristöihin.

Power Platform – avustaminen

Power Platform integroidaan Application Insightsiin, joka on osa Azure Monitor -ekojärjestelmää. Käytä tätä integraatiota seuraavaan:

  • Vastaanota Dataverse-ympäristön Application Insightsissa sieppaamia diagnostiikan ja suorituskyvyn telemetriatietoja. Sovellusten Dataverse-tietokannassa ja mallipohjaisissa sovelluksissa suorittamien toimintojen telemetria voidaan tilata. Telemetriassa on tietoja, joiden avulla voi diagnosoida virheisiin ja suorituksiin liittyviä ongelmia sekä tehdä niissä vianmäärityksiä.

  • Yhdistä pohjaan perustuvat sovelluksesi Application Insightsiin. Tämän analytiikan avulla voit diagnosoida ongelmia ja ymmärtää, mitä käyttäjät tekevät sovelluksillasi. Kerättyjen tietojen avulla voidaan tehdä parempia päätöksiä liiketoiminnassa ja parantaa sovellusten laatua.

  • Määritä Power Automate -telemetria siirtymään Application Insightsiin esimerkiksi pilvityönkulun suoritusten valvontaa ja pilvityönkulun suoritusvirheiden aiheuttamien hälytysten luomista varten.

  • Sieppaa telemetriatiedot Microsoft Copilot Studion agentilta Azure Application Insightsissa käytettäväksi. Tämän telemetrian avulla voit seurata agentille lähetettyjä kirjattuja viestejä ja tapahtumia ja agentin lähettämiä vastaavia kohteita, käyttäjien keskusteluiden aikana käynnistettyjä aiheita ja mukautettuja telemetriatapahtumia, jotka voidaan lähettää aiheista.

Application Insights on kattava ratkaisu pilvi- ja paikallisten ympäristöjen seurantatietojen keräämiseen, analysoimiseen ja niihin vastaamiseen. Se sisältää vankan hälytysympäristön, jonka voi määrittää automaattisia ilmoituksia ja muita toimintoja varten.

Power Platformin automaatiopaketti on joukko työkaluja, jotka nopeuttavat Power Automate -työpöytäversion käyttöä ja tukea automaatioprojekteissa. Paketti tarjoaa työkaluja, jotka auttavat sinua automaatioprojektien hallinnassa ja valvonnassa sekä toteutuneiden säästöjen ja sijoitetun pääoman tuoton (ROI) arvioimisessa. Hallintakeskus on automaatiopaketin osa, ja se täydentää olemassa olevaa Valvo työpöytätyönkulkujen suorituksia -ominaisuutta. Hallintakeskuksen pääpainopisteenä on orkestrointinäkymä, jonka avulla tukianalyytikot ja organisaatiot voivat tarvittaessa harjoittaa seurantaa, suorittaa toimintoja ja antaa hälytyksiä.

Seuraavat vaiheet