Luotettavan seuranta- ja ilmoitusstrategian suunnittelusuositukset
Koskee tätä Power Platform Well-Architected -ratkaisun luotettavuuden tarkistusluetteloa koskevaa suositusta:
RE:08 | Ratkaisun kuntoilmaisimien mittaaminen ja julkaiseminen. Tallenna käyttöastetta koskevia ja muita luotettavuustietoja koko työmäärästä ja myös yksittäisistä komponenteista ja keskeisistä työnkuluista. |
---|
Tässä oppaassa käsitellään luotettavan seuranta- ja ilmoitusstrategian suunnittelusuosituksia. Tämän strategian toteuttaminen pitää toimintotiimit ajan tasalla ympäristön kunnon tilasta ja varmistaa, että työkuormalle muodostetut luotettavuustavoitteet toteutuvat.
Määritelmät
Termi | Määritelmä |
---|---|
Metrics | Säännöllisin väliajoin kerättävät numeeriset arvot. Mittarit ilmaisevat järjestelmän jonkin seikan tiettynä ajankohtana. |
Resurssilokit | Tiedot, jotka järjestelmä luo järjestelmän tilasta. |
Jäljitykset | Tiedoissa käsitellään polkua, jonka pyyntö kulkee palvelujen ja komponenttien kautta. |
Tärkeimmät suunnittelustrategiat
Ennen seuranta- ja ilmoitusstrategian luontia työkuormassa on suoritettava seuraavat tehtävät luotettavuussuunnittelun osana:
Kriittisten ja muiden työnkulkujen tunnistaminen.
Virhetila-analyysin (FMA) suorittaminen työnkuluille.
Luotettavuustavoitteiden määrittäminen.
Vankan testausstrategian suunnitteleminen.
Seuranta- ja ilmoitusstrategia luodaan antamaan toimintotiimeille tietoisuutta siten, että heille ilmoitetaan työkuorman tilassa tapahtumista muutoksista ja että voivat korjata ongelmat nopeasti. Tärkeiden työnkulkujen ja tärkeitä työnkulkuja sisältävien työkuormien työmallin on määritettävä hyvä, heikentynyt ja huono tila. Seurantataso on suunniteltava havaitsemaan muutokset näissä tiloissa heti. Kun kunnon tila muuttuu hyvästä heikentyneeksi tai huonoksi, ilmoitusmekanismin on käynnistettävä automaattiset palautustoimet ja ilmoitukset vastuutiimeille.
Seuraavia suosituksia on syytä käyttää liiketoiminnan tarpeita vastaavan seuranta- ja ilmoitusstrategian suunnittelussa.
Yleiset ohjeet
Mittareiden, lokien ja jäljityksen erot on ymmärrettävä.
Lokiin kirjaaminen on otettava käyttöön kaikissa pilviresursseissa. Diagnostiikan kirjaaminen koko ympäristössä edellyttää automaation ja hallinnon käyttämistä käyttöönotoissa.
Kaikki diagnostiikkalokit on välitettävä keskitettyyn tietojen keräys-, tallennus- ja analytiikkaympäristöön, kuten Log Analytics -työtilaan. Jos tiedoilla on alueellisia sijainnin hallintavaatimuksia, niillä alueilla, joita nämä vaatimukset koskevat, on käytettävä paikallisia tietojen keräys- ja tallennustoimintoja.
Kompromissi: Lokien tallentaminen ja kyselyjen tekeminen lokeista aiheuttaa kustannuksia. Lokien analysoinnin ja säilyttämisen vaikutuksia budjettiin on tarkkailtava ja päätettävä sitten, miten käytetty aika tasapainotetaan parhaiten tarpeiden kannalta.
Jos työkuormissa on otettava huomioon ainakin yksi vaatimustenmukaisuuskehys, kyseiset kehykset koskevat myös niitä komponenttilokeja, joissa käsitellään arkaluonteisia tietoja. Kyseiset komponentti lokit kannattaa lähettää SIEM (tietoturvatietojen ja tapahtumien hallinnan) -järjestelmään, kuten Microsoft Sentinel.
Luotavaan lokien säilytyskäytäntöön on sisällytettävä pitkäaikaiset säilytysvaatimukset, joita vaatimustenmukaisuus kehitys edellyttää työkuormalta.
Lokitietokyselyt voidaan optimoida käyttämällä jäsennettyä lokiin kirjausta kaikissa lokisanomissa.
Ilmoitukset on määritettävä käynnistymään, kun arvot ohittavat tärkeät raja-arvot, jotka korreloituvat kuntomallin tilamuutokseen, kuten vihreän muuttuminen keltaiseksi ja keltaisen punaiseksi. Raja-arvomääritykset on jatkuvan parantamisen käytäntö. Työkuorman kehittyessä määritetyt raha-arvot voivat muuttua.
Ilmoitusten käyttöä kannattaa harkita myös tilojen parantuessa esimerkiksi punaisesta keltaiseen tai punaisesta vihreään, sillä toimintotiimi voi seurata näitä tapahtumia tällä tavoin tulevaa tarvetta varten.
Ympäristön reaaliaikainen kunto voidaan visualisoida mukautettujen koontinäyttöjen avulla.
Tapausten aikana kerättyjä tietoja voidaan käyttää kuntomallien jatkuvaan parantamiseen.
Pilviympäristön seuranta- ja ilmoituspalvelut kannattaa sisällyttää ympäristötason kunnon seurantaa.
Pilvipalvelun tarjoamat tätä tarkoitusta varten muodostettu edistynyt seuranta ja analytiikka, kuten Azure Monitorin merkityksellisten tietojen työkalut, kannattaa sisällyttää.
Varmuuskopiointi ja palautus kannattaa toteuttaa sieppaamaan
- tietojen replikoinnin tila, sillä sen avulla voidaan varmistaa, että työkuorman palautuu onnistuu palautuspistetavoitteen (RPO) mukaisesti
- onnistuneet ja epäonnistuneet varmuuskopioinnit ja palautukset
- palautuksen kesto ilmoitetaan järjestelmäpalautuksen suunnitteluun.
Sovellusten ja agenttien valvominen
Kirjaa tiedot, kun sovellus tai agentti suoritetaan tuotantoympäristössä. Ongelmien syyn diagnosointiin tuotantotilassa tarvitaan riittävästi tietoja.
Tapahtumat kirjataan lokiin palvelujen rajoilla. Sisällytettävän korrelaatiotunnuksen käyttö ylittää palvelurajat. Jos tapahtuu siirtyy useiden palvelujen kautta ja yksi niistä vikaantuu, korrelaatiotunnus auttaa seuraamaan pyyntöjä sovelluksessa ja paikantamaan, miksi tapahtuma epäonnistui.
Erottele sovelluksen ja agentin kirjaaminen lokiin tarkastuksesta. Seurantatietueita säilytetään yleisesti vaatimustenmukaisuuden tai lakisääteisten vaatimusten vuoksi, ja niiden on oltava täydellisiä. Tapahtumien pois jääminen voidaan välttää ylläpitämällä valvontalokeja erillään diagnostiikkalokeista.
Käytä valkoisen laatikon valvontaa sovelluksen ja agentin varustamisessa semanttisilla lokeilla ja mittareilla. Kerää sovellus- ja agenttitason mittareita ja lokeja, kuten muistin kulutus tai pyyntöviive, sovelluksesta tai agentista kuntomallin taustatiedoiksi sekä ongelmien havaitsemista ja ennustamista varten.
Ulkoisen seurannan avulla voidaan mitata ympäristön palveluja ja tuloksena olevaa asiakaskokemusta. Mustan laatikon valvonta testaa sovelluksen ja agentin ulkoisesti näkyvää sovellusta ilman, että tunnetaan järjestelmän sisäistä rakennetta. Tämä on yleinen tapa mitata asiakaskeskeisiä palvelutasoilmaisimia (SLI), palvelutasotavoitteita (SLO) ja palvelutasosopimuksia (SLA).
Tietojen ja tallennustilan seuranta
Seuranta koskee tallennussäilöjen käytettävyysmittareita. Kun tämä mittausarvo alittaa 100 %, se ilmaisee kirjoitusten epäonnistuneen. Käytettävyyden tilapäiset pudotukset ovat mahdollisia, kun pilvipalvelu hallitsee kuormaa. Käytettävyystrendejä seuraamalla voidaan päätellä, onko työkuormassa ongelma. Joissakin tapauksissa pudotus tallennussäilön käytettävyysmittareissa ilmaisee, että tallennussäilöön liitetyssä laskentakerroksessa on pullonkaula.
Tietokantojen seurantaan on useita mittareita. Luotettavuuden kannalta esimerkiksi seuraavat ovat tärkeitä seurattavia mittareita:
- Kyselyn kesto
- Aikakatkaisut
- Odotusajat
- Muistipaine
- Lukitukset
Power Platform – avustaminen
Power Platform integroidaan Application Insightsiin, joka on osa Azure Monitor -ekojärjestelmää. Tämän integroinnin on mahdollista tehdä seuraavaa:
Tilaa telemetria, jonka Application Insightsin Dataverse-ympäristö kerää diagnostiikasta, suorituskyvystä ja toiminnoista, jotka sovellukset suorittavat Dataverse-tietokannassa ja mallipohjaisissa sovelluksissa. Telemetriassa on tietoja, joiden avulla voi diagnosoida virheisiin ja suorituksiin liittyviä ongelmia sekä tehdä niissä vianmäärityksiä.
Yhdistä pohjaan perustuvan sovellukset Application Insightsiin, jotta tätä analytiikkaa voidaan käyttää ongelmien diagnoinnissa, tietojen hankkimisessa tavasta, jolla käyttäjät käyttävät sovelluksia, aiempaa parempien liiketoimintapäätösten tekemisessä ja sovellusten laadun parantamisessa.
Määritä Power Automate -telemetria niin, että se siirtyy Application Insightsiin. Tämän telemetrian avulla on mahdollista valvoa pilvityönkulkujen suoritusta ja luoda hälytyksiä pilvityönkulkujen suoritusvirheille.
Sieppaa telemetriatiedot Microsoft Copilot Studion agentilta Azure Application Insightsissa käytettäväksi. Tämän telemetrian avulla voit seurata agentille lähetettyjä kirjattuja viestejä ja tapahtumia ja agentin lähettämiä vastaavia kohteita, käyttäjien keskusteluiden aikana käynnistettyjä aiheita ja mukautettuja telemetriatapahtumia, jotka voidaan lähettää aiheista.
Power Platform -resurssit kirjaavat aktiviteetit lokiin Microsoft Purview -yhteensopivuusportaalissa. Useimmat tapahtumat ovat käytettävissä 24 tunnin kuluttua aktiviteetista. Älä käytä näitä tietoja reaaliaikaisessa valvonnassa. Lisätietoja aktiviteettien kirjaamisesta lokiin Power Platformissa on seuraavissa aiheissa:
- Power Apps
- Power Automate
- Copilot Studio
- Power Pages
- Power Platform ‑yhdistimet
- Tietojen menetyksen estäminen
- Power Platform -hallintalokit
- Dataverse -valvonta
Power Platform -työkuorma voi sisältää Azure-resursseja. Lisätietoja Azure-resurssien seurantasuosituksista on kohdassa Seurantajärjestelmän suunnittelu- ja luontisuositukset.
Power Platform CoE -aloituspakkaus on viitetoteutus, joka sisältää kokoelma komponentteja ja työkaluja. Ne on suunniteltu auttamaan strategian kehittämisessä Power Platformin käyttöönottoa ja tukea varten. Paketissa sisältää automatisointitoimintoja ja työkaluja, joiden avulla tiimit voivat muodostaa CoE:tä tukevaa seurantaa ja automatisointia.
Liittyvät tiedot
Miten tarkistetaan online-palvelun kunto?
Luotettavuuden tarkistusluettelo
Katso lisätietoja suositusten kokoelmasta.