Luotettavan seuranta- ja ilmoitusstrategian suunnittelusuositukset
Koskee tätä Power Platform hyvin suunnitellun luotettavuuden tarkistuslistan suositusta:
RE:08 | Ratkaisun kuntoilmaisimien mittaaminen ja julkaiseminen. Tallenna käyttöastetta koskevia ja muita luotettavuustietoja koko työmäärästä ja myös yksittäisistä komponenteista ja keskeisistä työnkuluista. |
---|
Tässä oppaassa käsitellään luotettavan seuranta- ja ilmoitusstrategian suunnittelusuosituksia. Tämän strategian toteuttaminen pitää toimintotiimit ajan tasalla ympäristön kunnon tilasta ja varmistaa, että työkuormalle muodostetut luotettavuustavoitteet toteutuvat.
Määritelmät
Termi | Määritelmä |
---|---|
Metrics | Säännöllisin väliajoin kerättävät numeeriset arvot. Mittarit ilmaisevat järjestelmän jonkin seikan tiettynä ajankohtana. |
Resurssilokit | Tiedot, jotka järjestelmä luo järjestelmän tilasta. |
Jäljitykset | Tiedoissa käsitellään polkua, jonka pyyntö kulkee palvelujen ja komponenttien kautta. |
Tärkeimmät suunnittelustrategiat
Ennen seuranta- ja ilmoitusstrategian luontia työkuormassa on suoritettava seuraavat tehtävät luotettavuussuunnittelun osana:
Kriittisten ja muiden työnkulkujen tunnistaminen.
Virhetila-analyysin (FMA) suorittaminen työnkuluille.
Luotettavuustavoitteiden määrittäminen.
Vankan testausstrategian suunnitteleminen.
Seuranta- ja ilmoitusstrategia luodaan antamaan toimintotiimeille tietoisuutta siten, että heille ilmoitetaan työkuorman tilassa tapahtumista muutoksista ja että voivat korjata ongelmat nopeasti. Tärkeiden työnkulkujen ja tärkeitä työnkulkuja sisältävien työkuormien työmallin on määritettävä hyvä, heikentynyt ja huono tila. Seurantataso on suunniteltava havaitsemaan muutokset näissä tiloissa heti. Kun kunnon tila muuttuu hyvästä heikentyneeksi tai huonoksi, ilmoitusmekanismin on käynnistettävä automaattiset palautustoimet ja ilmoitukset vastuutiimeille.
Seuraavia suosituksia on syytä käyttää liiketoiminnan tarpeita vastaavan seuranta- ja ilmoitusstrategian suunnittelussa.
Yleiset ohjeet
Mittareiden, lokien ja jäljityksen erot on ymmärrettävä.
Lokiin kirjaaminen on otettava käyttöön kaikissa pilviresursseissa. Diagnostiikan kirjaaminen koko ympäristössä edellyttää automaation ja hallinnon käyttämistä käyttöönotoissa.
Kaikki diagnostiikkalokit on välitettävä keskitettyyn tietojen keräys-, tallennus- ja analytiikkaympäristöön, kuten Log Analytics -työtilaan. Jos tiedoilla on alueellisia sijainnin hallintavaatimuksia, niillä alueilla, joita nämä vaatimukset koskevat, on käytettävä paikallisia tietojen keräys- ja tallennustoimintoja.
Kompromissi: Lokien tallentamisella ja kyselyillä on kustannusvaikutuksia. Lokien analysoinnin ja säilyttämisen vaikutuksia budjettiin on tarkkailtava ja päätettävä sitten, miten käytetty aika tasapainotetaan parhaiten tarpeiden kannalta.
Jos työkuormissa on otettava huomioon ainakin yksi vaatimustenmukaisuuskehys, kyseiset kehykset koskevat myös niitä komponenttilokeja, joissa käsitellään arkaluonteisia tietoja. Lähetä tarvittavat komponenttilokit SIEM (Security Information and tapahtumien hallinta) -järjestelmään, kuten Microsoft Sentineliin.
Luotavaan lokien säilytyskäytäntöön on sisällytettävä pitkäaikaiset säilytysvaatimukset, joita vaatimustenmukaisuus kehitys edellyttää työkuormalta.
Lokitietokyselyt voidaan optimoida käyttämällä jäsennettyä lokiin kirjausta kaikissa lokisanomissa.
Ilmoitukset on määritettävä käynnistymään, kun arvot ohittavat tärkeät raja-arvot, jotka korreloituvat kuntomallin tilamuutokseen, kuten vihreän muuttuminen keltaiseksi ja keltaisen punaiseksi. Raja-arvomääritykset on jatkuvan parantamisen käytäntö. Työkuorman kehittyessä määritetyt raha-arvot voivat muuttua.
Ilmoitusten käyttöä kannattaa harkita myös tilojen parantuessa esimerkiksi punaisesta keltaiseen tai punaisesta vihreään, sillä toimintotiimi voi seurata näitä tapahtumia tällä tavoin tulevaa tarvetta varten.
Ympäristön reaaliaikainen kunto voidaan visualisoida mukautettujen koontinäyttöjen avulla.
Tapausten aikana kerättyjä tietoja voidaan käyttää kuntomallien jatkuvaan parantamiseen.
Pilviympäristön seuranta- ja ilmoituspalvelut kannattaa sisällyttää ympäristötason kunnon seurantaa.
Pilvipalvelun tarjoamat tätä tarkoitusta varten muodostettu edistynyt seuranta ja analytiikka, kuten Azure Monitorin merkityksellisten tietojen työkalut, kannattaa sisällyttää.
Varmuuskopiointi ja palautus kannattaa toteuttaa sieppaamaan
- tietojen replikoinnin tila, sillä sen avulla voidaan varmistaa, että työkuorman palautuu onnistuu palautuspistetavoitteen (RPO) mukaisesti
- onnistuneet ja epäonnistuneet varmuuskopioinnit ja palautukset
- palautuksen kesto ilmoitetaan järjestelmäpalautuksen suunnitteluun.
Valvo sovelluksia ja copiloteja
Kirjaa tiedot, kun sovellusta tai copilotia suoritetaan tuotantoympäristössä. Ongelmien syyn diagnosointiin tuotantotilassa tarvitaan riittävästi tietoja.
Tapahtumat kirjataan lokiin palvelujen rajoilla. Sisällytettävän korrelaatiotunnuksen käyttö ylittää palvelurajat. Jos tapahtuu siirtyy useiden palvelujen kautta ja yksi niistä vikaantuu, korrelaatiotunnus auttaa seuraamaan pyyntöjä sovelluksessa ja paikantamaan, miksi tapahtuma epäonnistui.
Erillinen sovellus- ja copilot-kirjaus auditoinnista. Seurantatietueita säilytetään yleisesti vaatimustenmukaisuuden tai lakisääteisten vaatimusten vuoksi, ja niiden on oltava täydellisiä. Tapahtumien pois jääminen voidaan välttää ylläpitämällä valvontalokeja erillään diagnostiikkalokeista.
Käytä valkoisen laatikon valvontaa sovelluksen tai ohjaajan instrumentointiin semanttisten lokien ja mittareiden avulla. Kerää sovelluksesta tai copilotista sovellus- ja copilot-tason mittareita ja lokeja, kuten muistin kulutus tai pyyntöviive, kuntomallin tueksi sekä ongelmien havaitsemiseksi ja ennustamiseksi.
Ulkoisen seurannan avulla voidaan mitata ympäristön palveluja ja tuloksena olevaa asiakaskokemusta. Mustan laatikon valvonta testaa ulkoisesti näkyvää sovelluksen tai perämiehen käyttäytymistä tuntematta järjestelmän sisäosia. Tämä on yleinen tapa mitata asiakaskeskeisiä palvelutasoilmaisimia (SLI), palvelutasotavoitteita (SLO) ja palvelutasosopimuksia (SLA).
Tietojen ja tallennustilan seuranta
Seuranta koskee tallennussäilöjen käytettävyysmittareita. Kun tämä mittausarvo alittaa 100 %, se ilmaisee kirjoitusten epäonnistuneen. Käytettävyyden tilapäiset pudotukset ovat mahdollisia, kun pilvipalvelu hallitsee kuormaa. Käytettävyystrendejä seuraamalla voidaan päätellä, onko työkuormassa ongelma. Joissakin tapauksissa pudotus tallennussäilön käytettävyysmittareissa ilmaisee, että tallennussäilöön liitetyssä laskentakerroksessa on pullonkaula.
Tietokantojen seurantaan on useita mittareita. Luotettavuuden kannalta esimerkiksi seuraavat ovat tärkeitä seurattavia mittareita:
- Kyselyn kesto
- Aikakatkaisut
- Odotusajat
- Muistipaine
- Lukitukset
Power Platform – avustaminen
Power Platform integroidaan Application Insightsiin, joka on osa Azure Monitor -ekojärjestelmää. Tämän integroinnin on mahdollista tehdä seuraavaa:
Tilaa telemetria, jonka Application Insightsin Dataverse-ympäristö kerää diagnostiikasta, suorituskyvystä ja toiminnoista, jotka sovellukset suorittavat Dataverse-tietokannassa ja mallipohjaisissa sovelluksissa. Telemetriassa on tietoja, joiden avulla voi diagnosoida virheisiin ja suorituksiin liittyviä ongelmia sekä tehdä niissä vianmäärityksiä.
Yhdistä pohjaan perustuvan sovellukset Application Insightsiin, jotta tätä analytiikkaa voidaan käyttää ongelmien diagnoinnissa, tietojen hankkimisessa tavasta, jolla käyttäjät käyttävät sovelluksia, aiempaa parempien liiketoimintapäätösten tekemisessä ja sovellusten laadun parantamisessa.
Määritä Power Automate -telemetria niin, että se siirtyy Application Insightsiin. Tämän telemetrian avulla on mahdollista valvoa pilvityönkulkujen suoritusta ja luoda hälytyksiä pilvityönkulkujen suoritusvirheille.
Sieppaa telemetriatietoja copilotista Microsoft Copilot Studio käytettäväksi Azuressa Application Insights. Tämän telemetrian avulla voit seurata lokiin kirjattuja viestejä ja tapahtumia, jotka lähetetään copilotiin ja copilotista, käyttäjän keskustelujen aikana käynnistettäviä aiheita ja mukautettuja telemetriatapahtumia, jotka voidaan lähettää aiheistasi.
Power Platform resurssilokitoiminnot Purview-yhteensopivuusportaalissa Microsoft . Useimmat tapahtumat ovat käytettävissä 24 tunnin kuluttua aktiviteetista. Älä käytä näitä tietoja reaaliaikaisessa valvonnassa. Lisätietoja aktiviteettien kirjaamisesta lokiin Power Platformissa on seuraavissa aiheissa:
- Power Apps
- Power Automate
- Copilot Studio
- Power Pages
- Power Platform Liittimet
- Tietojen menetyksen estäminen
- Power Platform Hallinnolliset lokit
- Dataverse Valvonta
Power Platform -työkuorma voi sisältää Azure-resursseja. Lisätietoja Azure-resurssien seurantasuosituksista on kohdassa Seurantajärjestelmän suunnittelu- ja luontisuositukset.
Power Platform CoE -aloituspakkaus on viitetoteutus, joka sisältää kokoelma komponentteja ja työkaluja. Ne on suunniteltu auttamaan strategian kehittämisessä Power Platformin käyttöönottoa ja tukea varten. Paketissa sisältää automatisointitoimintoja ja työkaluja, joiden avulla tiimit voivat muodostaa CoE:tä tukevaa seurantaa ja automatisointia.
Liittyvät tiedot
Miten tarkistan verkkopalveluni kunnon?
Luotettavuuden tarkistusluettelo
Katso lisätietoja suositusten kokoelmasta.