Sdílet prostřednictvím


Co je rozpoznávání vlastních pojmenovaných entit?

Vlastní NER je jednou z vlastních funkcí nabízených jazykem Azure AI. Jedná se o cloudovou službu API, která používá inteligentní funkce strojového učení, která umožňuje vytvářet vlastní modely pro úlohy rozpoznávání vlastních pojmenovaných entit.

Vlastní NER umožňuje uživatelům vytvářet vlastní modely AI pro extrakci entit specifických pro doménu z nestrukturovaného textu, jako jsou kontrakty nebo finanční dokumenty. Vytvořením vlastního projektu NER můžou vývojáři iterativní označování dat, trénování, vyhodnocování a zlepšování výkonu modelu před tím, než je zpřístupní ke spotřebě. Kvalita označených dat výrazně ovlivňuje výkon modelu. Kvůli zjednodušení sestavování a přizpůsobení modelu nabízí služba vlastní webový portál, ke kterému je možné přistupovat prostřednictvím jazykového studia. Můžete snadno začít se službou pomocí kroků v tomto rychlém startu.

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou úvodní pokyny, které vás provedou prováděním požadavků na službu.
  • Koncepty poskytují vysvětlení funkcí a funkcí služby.
  • Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.

Příklady scénářů použití

Rozpoznávání vlastních pojmenovaných entit se dá použít ve více scénářích v různých odvětvích:

Extrakce informací

Mnoho finančních a právních organizací denně extrahuje a normalizuje data z tisíců složitých nestrukturovaných textových zdrojů. Mezi tyto zdroje patří bankovní výpisy, právní smlouvy nebo bankovní formuláře. Například extrakce údajů o aplikaci hypoték provedených ručně lidskými kontrolory může trvat několik dní, než je extrahuje. Automatizace těchto kroků vytvořením vlastního modelu NER zjednodušuje proces a šetří náklady, čas a úsilí.

Vyhledávání je základní pro libovolnou aplikaci, která uživatelům zobrazí textový obsah. Mezi běžné scénáře patří vyhledávání katalogů nebo dokumentů, vyhledávání maloobchodních produktů nebo dolování znalostí pro datové vědy. Mnoho podniků v různých odvětvích chce vytvořit bohaté vyhledávací prostředí nad soukromým, heterogenním obsahem, který zahrnuje strukturované i nestrukturované dokumenty. Jako součást svého kanálu můžou vývojáři použít vlastní NER k extrakci entit z textu, který je relevantní pro jejich odvětví. Tyto entity se dají použít k obohacení indexování souboru, aby bylo možné ho přizpůsobit.

Audit a dodržování předpisů

Místo ruční kontroly výrazně dlouhých textových souborů pro audit a použití zásad můžou IT oddělení ve finančních nebo právních podnicích používat vlastní NER k vytváření automatizovaných řešení. Tato řešení můžou být užitečná k vynucení zásad dodržování předpisů a nastavení nezbytných obchodních pravidel na základě kanálů dolování znalostí, které zpracovávají strukturovaný a nestrukturovaný obsah.

Životní cyklus vývoje projektu

Použití vlastního NER obvykle zahrnuje několik různých kroků.

Životní cyklus vývoje

  1. Definujte schéma: Znát data a identifikovat entity , které chcete extrahovat. Vyhněte se nejednoznačnosti.

  2. Označení dat: Popisování dat je klíčovým faktorem při určování výkonu modelu. Označit přesně, konzistentně a zcela.

    1. Popisek přesně: Vždy označte každou entitu správným typem. Uveďte jenom to, co chcete extrahovat, vyhněte se zbytečným datům v popiscích.
    2. Popisek konzistentně: Stejná entita by měla mít stejný popisek ve všech souborech.
    3. Popisek zcela: Všechny instance entity ve všech souborech označte.
  3. Trénování modelu: Váš model se začíná učit z označených dat.

  4. Prohlédněte si výkon modelu: Po dokončení trénování si prohlédněte podrobnosti o vyhodnocení modelu, jeho výkon a pokyny, jak ho vylepšit.

  5. Nasazení modelu: Nasazení modelu zpřístupňuje použití prostřednictvím rozhraní API pro analýzu.

  6. Extrakce entit: Použití vlastních modelů pro úlohy extrakce entit

Referenční dokumentace a ukázky kódu

Při používání vlastního NER si projděte následující referenční dokumentaci a ukázky jazyka Azure AI:

Možnost vývoje / jazyk Referenční dokumentace Ukázky
Rozhraní REST API (vytváření) Dokumentace k rozhraní REST API
Rozhraní REST API (modul runtime) Dokumentace k rozhraní REST API
C# (runtime) Dokumentace k jazyku C# Ukázky jazyka C#
Java (runtime) Dokumentace k Javě Ukázky v Javě
JavaScript (modul runtime) Dokumentace k JavaScriptu Ukázky JavaScriptu
Python (runtime) Dokumentace k Pythonu Ukázky Pythonu

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také lidi, kteří ji budou používat, osoby, které ho budou ovlivněny, a prostředí, ve kterém je nasazené. Přečtěte si poznámku transparentnosti pro vlastní NER a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech. Další informace najdete také v následujících článcích:

Další kroky