Volba technologie zpracování jazyka cílená na Azure AI
Služby Azure AI pomáhají vývojářům a organizacím rychle vytvářet inteligentní, špičkové, připravené a zodpovědné aplikace s předem připravenými a předem připravenými a přizpůsobitelnými rozhraními API a modely.
Tento článek se zabývá službami Azure AI, které nabízejí cílené možnosti zpracování jazyka, jako je zpracování přirozeného jazyka (NLP), analýza textu, porozumění jazyku, překlad a extrakce dat dokumentů. Jazyk Azure AI je jednou z nejširších kategorií ve službách Azure AI. Pomocí rozhraní API ve vaší úloze můžete začlenit jazykové funkce, jako je rozpoznávání pojmenovaných entit, analýza mínění, rozpoznávání jazyka a shrnutí textu.
Služby
Následující služby poskytují možnosti cíleného zpracování jazyka pro služby Azure AI:
Azure AI Language poskytuje zpracování přirozeného jazyka pro analýzu textu.
- Službu Azure AI Language použijte , když potřebujete pracovat se strukturovanými nebo nestrukturovanými dokumenty pro širokou škálu popsaných úloh souvisejících s jazykem.
- Pokud potřebujete prohledat dokumenty pomocí chatu, zkontrolovat bezpečnost obsahu nebo je přeložit, nepoužívejte službu Jazyk.
Azure AI Translator je služba strojového překladu. Může provádět překlad textu v reálném čase, dávkové a jednosložkové překlady dokumentů a vlastní překlady, které umožňují začlenit specializovanou terminologii nebo jazyk specifický pro konkrétní odvětví pro váš scénář. Podporuje mnoho jazyků.
- Službu Translator použijte , když potřebujete provést překlad konkrétně. I když byste mohli k provádění překladu použít jiné základní jazykové modely pro obecné účely, použití překladače pro jeho specializovaný účel může být spolehlivě efektivnější a může být nákladově efektivnější pomocí cílových modelů překladu.
- Službu Translator nepoužívejte, pokud potřebujete komunikovat s chatem, analyzovat obsah zabarvení nebo kon režim stanu ration. Pro analýzu mínění použijte místo toho službu Language. Ke kon režim stanu ration použijte službu Content Safety.
Azure AI Document Intelligence je služba, která dokáže převádět obrázky přímo do elektronických formulářů. Můžete zadat očekávaná pole a pak prohledávat obrázky, které zadáte k zachycení těchto polí bez zásahu člověka. Služba hostuje mnoho předem připravených modelů a umožňuje také vytvářet vlastní modely formulářů.
- Službu Document Intelligence použijte , když přesně víte, která pole potřebujete extrahovat z naskenovaných dokumentů, aby se elektronické formuláře vyplnily odpovídajícím způsobem.
- Pomocí funkce Document Intelligence můžete identifikovat klíčové struktury (záhlaví, zápatí, konce kapitol atd.) v různorodých korpusech dokumentů k další programové interakci s dokumentem, například při implementaci rozšířené generace načítání (RAG).
- Nepoužívejte službu Document Intelligence jako rozhraní API pro vyhledávání v reálném čase.
Azure AI Jazyk
Azure AI Language je cloudová služba, která poskytuje funkce NLP (Natural Language Processing) pro pochopení a analýzu textu. Pomocí této služby můžete vytvářet inteligentní aplikace pomocí webové sady Language Studio, rozhraní REST API a klientských knihoven.
Možnosti
Následující tabulka obsahuje seznam funkcí dostupných ve službě Azure AI Language.
Schopnost | Popis |
---|---|
Vlastní odpověď na otázky | Najde nejvhodnější odpověď pro vstupy od uživatelů a běžně se používá k vytváření konverzačních klientských aplikací, jako jsou aplikace sociálních médií, chatovací roboti a desktopové aplikace s podporou řeči. |
Vlastní klasifikace textu | Slouží k vytváření vlastních modelů AI ke klasifikaci nestrukturovaných textových dokumentů do vlastních tříd, které definujete. |
Porozumění konverzačnímu jazyku (CLU) | Slouží k vytváření vlastních modelů pro porozumění přirozenému jazyku k predikci celkového záměru příchozí promluvy a extrakci důležitých informací z ní. |
Spojování entit | Nejednoznačnost entit (slov nebo frází) nalezených v nestrukturovaném textu a vrací odkazy na Wikipedii. |
Detekce jazyka | Rozpozná jazyk, ve kterém je dokument napsaný, a vrátí kód jazyka pro širokou škálu jazyků, variant, dialektů a některých regionálních/kulturních jazyků. |
Extrakce klíčových frází | Vyhodnotí a vrátí hlavní koncepty v nestrukturovaném textu a vrátí je jako seznam. |
Rozpoznávání pojmenovaných entit (NER) | Kategorizuje entity (slova nebo fráze) v nestrukturovaném textu v několika předdefinovaných skupinách kategorií. Například: lidé, události, místa, kalendářní data a další. |
Pracovní postup orchestrace | Slouží k propojení konverzační funkce CLU (Conversational Language Understanding). |
Identifikace osobních údajů (PII) a zjišťování stavu (PHI) | Identifikuje, kategorizuje a rediguje citlivé informace v nestrukturovaných textových dokumentech a přepisech konverzací. Například: telefonní čísla, e-mailové adresy, formuláře identifikace a další. |
Analýza mínění a dolování názorů | Pomůže vám zjistit, co lidé myslí o vaší značce nebo tématu tím, že dolováním textu získáte povědomí o pozitivním nebo negativním mínění a mohou je přidružit ke konkrétním aspektům textu. |
Sumarizace | Používá extrakci shrnutí textu k vytvoření souhrnu dokumentů a přepisů konverzací. Extrahuje věty, které souhrnně představují nejdůležitější nebo relevantní informace v původním obsahu. |
Analýza textu pro stav | Extrahuje a označí relevantní lékařské informace z nestrukturovaných textů, jako jsou poznámky lékaře, souhrny udělení, klinické dokumenty a elektronické zdravotní záznamy. Při navrhování úloh vyhodnoťte umístění zpracování a rezidenci dat této funkce hostované v cloudu, abyste zajistili, že bude v souladu s očekáváními dodržování předpisů. Některé úlohy můžou být ve své kapacitě omezené tak, aby odesílaly zdravotnická data do platformy hostované v cloudu. Toto rozhraní API můžete použít jako kontejner Dockeru k hostování ve vlastním výpočetním prostředí v cloudu nebo místně, což může pomoct vyřešit problémy související s dodržováním předpisů, které se týkají PaaS. Další informace najdete v tématu Použití Analýza textu pro kontejnery stavu. |
Případy použití
Následující tabulka obsahuje seznam možných případů použití služby Azure AI Language.
*Pokud je funkce přizpůsobitelná, můžete model AI vytrénovat pomocí našich nástrojů tak, aby vyhovovala vašim datům konkrétně. Jinak je funkce předem nakonfigurovaná, což znamená, že modely AI, které používá, nelze změnit. Stačí odeslat data a použít výstup funkce ve vašich aplikacích.
Azure AI Translator
Azure AI Translator je služba strojového překladu, která je součástí řady služeb Azure AI. Translator využívá mnoho produktů a služeb Microsoftu.
Možnosti
Následující tabulka obsahuje seznam funkcí dostupných ve službě Azure AI Translator.
Schopnost | Popis |
---|---|
Překlad textu | Spusťte překlad textu mezi podporovanými zdrojovými a cílovými jazyky v reálném čase. Vytvořte dynamický slovník a zjistěte, jak zabránit překladům pomocí služby Translator API. |
Překlad dokumentů | Asynchronní dávkové překlady: Při zachování struktury a formátu původních dokumentů můžete přeložit dávkové a složité soubory. Proces dávkového překladu vyžaduje účet služby Azure Blob Storage s kontejnery pro váš zdrojový a přeložený dokument. Synchronní jediný překlad souborů: Při zachování struktury a formátu původního dokumentu přeložíte samostatný soubor dokumentu nebo s glosářem. Proces překladu souborů nevyžaduje účet služby Azure Blob Storage. Konečná odpověď obsahuje přeložený dokument a vrátí se přímo volajícímu klientovi. |
Custom Translator | Vytvářejte přizpůsobené modely pro překlad jazyka, terminologie a stylu specifického pro doménu a odvětví. Vytvořte slovník (frázi nebo větu) pro vlastní překlady. |
Případy použití
Následující tabulka obsahuje seznam možných případů použití služby Azure AI Translator.
Případ použití | Dokumentace |
---|---|
Přeložit text specifický pro konkrétní odvětví | Vlastní překladač AI Services |
Přeloží obecný text, který není specifický pro odvětví. | Co je překlad textu Azure |
Azure AI Inteligentní Dokumenty
Azure AI Language je cloudová služba, která poskytuje funkce NLP (Natural Language Processing) pro pochopení a analýzu textu. Pomocí této služby můžete vytvářet inteligentní aplikace pomocí webové sady Language Studio, rozhraní REST API a klientských knihoven.
Možnosti
Následující tabulka obsahuje seznam některých funkcí dostupných ve službě AI Document Intelligence.
Schopnost | Popis |
---|---|
Extrakce vizitek | Model vizitek Document Intelligence kombinuje funkce optického rozpoznávání znaků (OCR) s modely hloubkového učení k analýze a extrakci dat z obrázků vizitek. Rozhraní API analyzuje vytištěné vizitky; extrahuje klíčové informace, jako je jméno, příjmení, název společnosti, e-mailová adresa a telefonní číslo; a vrátí strukturovanou reprezentaci dat JSON. |
Extrakce modelu kontraktů | Model kontraktu Document Intelligence používá funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny důležitých entit kontraktu. Kontrakty můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako jsou strany, jurisdikce, ID smlouvy a titul; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině. |
Extrahování platebních karet | Model kreditní/debetní karty Document Intelligence používá funkce optického rozpoznávání znaků (OCR) k analýze a extrahování klíčových polí z kreditních a debetních karet. Kreditní karty a debetní karty mohou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako je číslo karty, vydávající banka a datum vypršení platnosti; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině. |
Extrahování zdravotních pojištění | Model karty pojištění Document Intelligence kombinuje funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení k analýze a extrahování klíčových informací z amerických zdravotních pojištění. Karta zdravotní pojištění je klíčovým dokumentem pro zpracování péče a může být digitálně analyzován pro registraci pacientů, informace o finančním pokrytí, platby bez hotovosti a zpracování žádostí o pojištění. Model zdravotní karty analyzuje obrázky zdravotních karet; extrahuje klíčové informace, jako je pojištění, člen, předpis a číslo skupiny; a vrátí strukturovanou reprezentaci JSON. Zdravotní pojištění lze prezentovat v různých formátech a kvalitě, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. |
Extrakce daňových dokumentů USA | Model kontraktu Document Intelligence používá funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny daňových dokladů. Daňové dokumenty můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako je jméno zákazníka, fakturační adresa, termín splatnosti a splatnost částky; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje určité formáty anglického daňového dokladu. |
Mnoho dalších... | Azure AI Document Intelligence podporuje širokou škálu modelů, které umožňují přidat inteligentní zpracování dokumentů do aplikací a toků. Můžete použít předem vytvořený model specifický pro doménu nebo vytrénovat vlastní model přizpůsobený konkrétním obchodním potřebám a případům použití. Funkce Document Intelligence se dá použít s rozhraním REST API nebo pythonem, C#, Javou a javascriptovými klientskými knihovnami. |
Další informace o tom, jak zvolit model, který funguje pro váš scénář, najdete v tématu Který model mám zvolit?
Další kroky
- Co je jazyk Azure AI?
- Studijní program: Vývoj řešení pro zpracování přirozeného jazyka pomocí azure AI Services
- Studijní program: Začínáme se službami Azure AI