Co je rozpoznávání vlastních pojmenovaných entit?
Vlastní NER je jednou z vlastních funkcí nabízených jazykem Azure AI. Jedná se o cloudovou službu API, která používá inteligentní funkce strojového učení, která umožňuje vytvářet vlastní modely pro úlohy rozpoznávání vlastních pojmenovaných entit.
Vlastní NER umožňuje uživatelům vytvářet vlastní modely AI pro extrakci entit specifických pro doménu z nestrukturovaného textu, jako jsou kontrakty nebo finanční dokumenty. Vytvořením vlastního projektu NER můžou vývojáři iterativní označování dat, trénování, vyhodnocování a zlepšování výkonu modelu před tím, než je zpřístupní ke spotřebě. Kvalita označených dat výrazně ovlivňuje výkon modelu. Kvůli zjednodušení sestavování a přizpůsobení modelu nabízí služba vlastní webový portál, ke kterému je možné přistupovat prostřednictvím jazykového studia. Můžete snadno začít se službou pomocí kroků v tomto rychlém startu.
Tato dokumentace obsahuje následující typy článků:
- Rychlé starty jsou úvodní pokyny, které vás provedou prováděním požadavků na službu.
- Koncepty poskytují vysvětlení funkcí a funkcí služby.
- Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.
Příklady scénářů použití
Rozpoznávání vlastních pojmenovaných entit se dá použít ve více scénářích v různých odvětvích:
Extrakce informací
Mnoho finančních a právních organizací denně extrahuje a normalizuje data z tisíců složitých nestrukturovaných textových zdrojů. Mezi tyto zdroje patří bankovní výpisy, právní smlouvy nebo bankovní formuláře. Například extrakce údajů o aplikaci hypoték provedených ručně lidskými kontrolory může trvat několik dní, než je extrahuje. Automatizace těchto kroků vytvořením vlastního modelu NER zjednodušuje proces a šetří náklady, čas a úsilí.
Dolování znalostí k vylepšení nebo obohacení sémantického vyhledávání
Vyhledávání je základní pro libovolnou aplikaci, která uživatelům zobrazí textový obsah. Mezi běžné scénáře patří vyhledávání katalogů nebo dokumentů, vyhledávání maloobchodních produktů nebo dolování znalostí pro datové vědy. Mnoho podniků v různých odvětvích chce vytvořit bohaté vyhledávací prostředí nad soukromým, heterogenním obsahem, který zahrnuje strukturované i nestrukturované dokumenty. Jako součást svého kanálu můžou vývojáři použít vlastní NER k extrakci entit z textu, který je relevantní pro jejich odvětví. Tyto entity se dají použít k obohacení indexování souboru, aby bylo možné ho přizpůsobit.
Audit a dodržování předpisů
Místo ruční kontroly výrazně dlouhých textových souborů pro audit a použití zásad můžou IT oddělení ve finančních nebo právních podnicích používat vlastní NER k vytváření automatizovaných řešení. Tato řešení můžou být užitečná k vynucení zásad dodržování předpisů a nastavení nezbytných obchodních pravidel na základě kanálů dolování znalostí, které zpracovávají strukturovaný a nestrukturovaný obsah.
Životní cyklus vývoje projektu
Použití vlastního NER obvykle zahrnuje několik různých kroků.
Definujte schéma: Znát data a identifikovat entity , které chcete extrahovat. Vyhněte se nejednoznačnosti.
Označení dat: Popisování dat je klíčovým faktorem při určování výkonu modelu. Označit přesně, konzistentně a zcela.
- Popisek přesně: Vždy označte každou entitu správným typem. Uveďte jenom to, co chcete extrahovat, vyhněte se zbytečným datům v popiscích.
- Popisek konzistentně: Stejná entita by měla mít stejný popisek ve všech souborech.
- Popisek zcela: Všechny instance entity ve všech souborech označte.
Trénování modelu: Váš model se začíná učit z označených dat.
Prohlédněte si výkon modelu: Po dokončení trénování si prohlédněte podrobnosti o vyhodnocení modelu, jeho výkon a pokyny, jak ho vylepšit.
Nasazení modelu: Nasazení modelu zpřístupňuje použití prostřednictvím rozhraní API pro analýzu.
Extrakce entit: Použití vlastních modelů pro úlohy extrakce entit
Referenční dokumentace a ukázky kódu
Při používání vlastního NER si projděte následující referenční dokumentaci a ukázky jazyka Azure AI:
Možnost vývoje / jazyk | Referenční dokumentace | Ukázky |
---|---|---|
Rozhraní REST API (vytváření) | Dokumentace k rozhraní REST API | |
Rozhraní REST API (modul runtime) | Dokumentace k rozhraní REST API | |
C# (runtime) | Dokumentace k jazyku C# | Ukázky jazyka C# |
Java (runtime) | Dokumentace k Javě | Ukázky v Javě |
JavaScript (modul runtime) | Dokumentace k JavaScriptu | Ukázky JavaScriptu |
Python (runtime) | Dokumentace k Pythonu | Ukázky Pythonu |
Zodpovědná AI
Systém AI zahrnuje nejen technologii, ale také lidi, kteří ji budou používat, osoby, které ho budou ovlivněny, a prostředí, ve kterém je nasazené. Přečtěte si poznámku transparentnosti pro vlastní NER a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech. Další informace najdete také v následujících článcích:
- Poznámka k transparentnosti pro jazyk Azure AI
- Integrace a zodpovědné použití
- Data, ochrana osobních údajů a zabezpečení
Další kroky
Pomocí článku rychlý start můžete začít používat rozpoznávání vlastních pojmenovaných entit.
Při procházení životního cyklu vývoje projektu si projděte glosář , kde najdete další informace o termínech používaných v dokumentaci k této funkci.
Nezapomeňte zobrazit limity služeb pro informace, jako je regionální dostupnost.