Popis možností klasifikace dat služby Microsoft Purview Information Protection

6 min

Organizace potřebují znát svá data, aby identifikovaly důležité informace v rámci majetku a zajistily, že se data zpracovávají v souladu s požadavky na dodržování předpisů. Správci můžou své organizaci umožnit, aby data znala prostřednictvím funkcí klasifikace dat a průzkumníka dostupných na portálu Microsoft Purview.

Typy citlivých informací

Typy citlivých informací (SIT) jsou klasifikátory založené na vzorech. Mají nastavené vzory, které je možné použít k jejich identifikaci. Například identifikační číslo v zemi nebo oblasti může být založeno na konkrétním vzoru, například takto:

123-456-789-ABC

Microsoft Purview obsahuje mnoho předdefinovaných typů citlivých informací na základě vzorů definovaných regulárním výrazem (regex) nebo funkcí.

Příkladem může být:

Čísla platebních karet
Pas nebo identifikační čísla
Čísla bankovních účtů
Čísla služby Health Service

Seznam dostupných předdefinovaných typů citlivých informací najdete v definicích entit typu Citlivé informace.

Klasifikace dat v Microsoft Purview také podporuje možnost vytvářet vlastní typy citlivých informací pro řešení požadavků specifických pro organizaci. Organizace může například potřebovat vytvořit typy citlivých informací pro reprezentaci ID zaměstnanců nebo čísel projektů.

Podporuje se také přesná klasifikace dat (EDM). Klasifikace založená na EDM umožňuje vytvářet vlastní typy citlivých informací, které odkazují na přesné hodnoty v databázi citlivých informací. Typy citlivých informací na portálu Microsoft Purview se označují jako klasifikátory EDM.

Typy citlivých informací se dají používat s popisky citlivosti, popisky uchovávání informací a v mnoha řešeních Microsoft Purview a Microsoft Priva.

Trénovatelné klasifikátory

Vytrénovatelné klasifikátory používají umělou inteligenci a strojové učení k inteligentní klasifikaci dat. Nejužitečnější jsou klasifikace dat jedinečných pro organizaci, jako jsou konkrétní typy kontraktů, faktur nebo záznamů zákazníků. Tato metoda klasifikace je více o trénování klasifikátoru pro identifikaci položky na základě toho, co položka je, nikoli prvky, které jsou v položce (porovnávání vzorů). K dispozici jsou dva typy klasifikátoru:

Předem vytrénované klasifikátory – Microsoft vytvořil a předem natrénoval mnoho klasifikátorů, které můžete začít používat bez trénování. Tyto klasifikátory se zobrazí se stavem Připraveno k použití. Microsoft Purview se dodává s pěti předem natrénovanými klasifikátory, které detekují a klasifikují věci, jako jsou životopisy, zdrojový kód, obtěžování, vulgární výraz a hrozba (souvisí s tím, že páchá násilí nebo dělá fyzické škody).
Vlastní trénovatelné klasifikátory – Microsoft podporuje možnost vytvářet a trénovat vlastní klasifikátory. Nejužitečnější jsou při klasifikaci dat jedinečných pro organizaci, jako jsou konkrétní typy kontraktů, faktur nebo záznamů zákazníků.

Pokud chcete získat vlastní vytrénovatelný klasifikátor, který přesně identifikuje položku jako v určité kategorii obsahu, musí být nejprve prezentován s mnoha vzorky typu obsahu v kategorii. Toto podávání pozitivních vzorků se označuje jako seeding a slouží k vytvoření prediktivního modelu pro klasifikátor.

Model se otestuje a určí, jestli klasifikátor dokáže správně rozlišovat mezi položkami, které odpovídají kategorii a položkám, které ne. Výsledek každé předpovědi je ručně ověřen, který slouží jako vstup ke zlepšení přesnosti prediktivního modelu.

Po stabilizaci skóre přesnosti modelu lze klasifikátor publikovat. Vytrénovatelné klasifikátory pak můžou řadit položky v umístěních, jako je SharePoint Online, Exchange a OneDrive, a klasifikovat obsah.

Poznámka:

V tuto chvíli klasifikátory pracují jenom s položkami, které nejsou šifrované.

Vysvětlení a prozkoumání dat

Klasifikace dat může zahrnovat velký počet dokumentů a e-mailů. Aby správci mohli získat přehledy a porozumění, poskytuje uzel Průzkumníků na portálu Microsoft Purview na portálu Microsoft Purview nástroje, jako je průzkumník aktivit a průzkumník obsahu, které poskytují podrobnosti na první pohled, včetně:

Počet položek klasifikovaných jako citlivé informace a jejich klasifikace.
Podrobnosti o umístěních dat na základě citlivosti
Shrnutí akcí, které uživatelé provádějí s citlivým obsahem v celé organizaci

Správci mohou také použít informace získané z těchto nástrojů k vedení svých akcí.

Průzkumník obsahu: Průzkumník obsahu poskytuje aktuální snímek položek, které mají popisek citlivosti, popisek uchovávání informací nebo byl klasifikován jako typ citlivých informací ve vaší organizaci. Umožňuje správcům s příslušnými oprávněními role přejít k podrobnostem o položkách tím, že jim umožní přístup k naskenovanému zdrojovému obsahu uloženému v různých typech umístění, jako je Exchange, SharePoint a OneDrive.

Přístup k průzkumníku obsahu je vysoce omezený, protože umožňuje číst obsah naskenovaných souborů. Uživatel, který vyžaduje přístup k Průzkumníku obsahu, musí mít účet v jedné nebo více skupinách rolí Průzkumníka obsahu.
Průzkumník aktivit: Průzkumník aktivit poskytuje přehled o tom, jaký obsah byl zjištěn a označen a kde je daný obsah. Umožňuje monitorovat, co se dělá s označeným obsahem v celé organizaci. Správci získají přehled o aktivitách na úrovni dokumentu, jako jsou změny popisků a downgrady (například když někdo změní popisek z důvěrných na veřejný) nebo když se soubory zkopírují na vyměnitelné médium nebo sdílenou síťovou složku.

Správci používají filtry k zobrazení všech podrobností určitého popisku, včetně typů souborů, uživatelů a aktivit. Průzkumník aktivit vám pomůže pochopit, co se dělá s označeným obsahem v průběhu času. Správci používají Průzkumníka aktivit k vyhodnocení, jestli už jsou ovládací prvky platné.

Průzkumník aktivit
Průzkumník obsahu

Popis možností klasifikace dat služby Microsoft Purview Information Protection

Typy citlivých informací

Trénovatelné klasifikátory

Vysvětlení a prozkoumání dat

Váš názor