Dela via


Välj en Azure AI-riktad språkbearbetningsteknik

Azure AI-tjänster hjälper utvecklare och organisationer att snabbt skapa intelligenta, banbrytande, marknadsklara och ansvarsfulla program med färdiga och fördefinierade och anpassningsbara API:er och modeller.

Den här artikeln beskriver Azure AI-tjänster som erbjuder målinriktade språkbearbetningsfunktioner som bearbetning av naturligt språk (NLP), textanalys, språktolkning, översättning och extrahering av dokumentdata. Azure AI Language är en av de bredaste kategorierna i Azure AI-tjänster. Du kan använda API:erna i din arbetsbelastning för att införliva språkfunktioner som namngiven entitetsigenkänning, attitydanalys, språkidentifiering och textsammanfattning.

Tjänster

Följande tjänster tillhandahåller målfunktioner för språkbearbetning för Azure AI-tjänster:

  • Azure AI Language tillhandahåller bearbetning av naturligt språk för textanalys.

    • Använd Azure AI Language-tjänsten när du behöver arbeta med strukturerade eller ostrukturerade dokument för de många olika språkrelaterade uppgifter som beskrivs.
    • Använd inte Language-tjänsten om du behöver söka i dokument med chatt, kontrollera innehållets säkerhet eller översätta dem.
  • Azure AI Translator är en maskinöversättningstjänst. Den kan utföra textöversättning i realtid, batch- och enkelfilsdokumentöversättning och anpassade översättningar som gör att du kan använda specialiserad terminologi eller branschspecifikt språk för ditt scenario. Det stöder många språk.

    • Använd Translator-tjänsten när du behöver utföra översättning specifikt. Även om du kan använda andra grundläggande språkmodeller för generell användning för att utföra översättning, kan det vara mer tillförlitligt och mer kostnadseffektivt att använda översättningsmodeller med hjälp av översättningsmodeller.
    • Använd inte Translator-tjänsten om du behöver interagera med chatten, för att analysera innehåll för sentiment eller för con tältläge ration. Använd språktjänsten i stället för attitydanalys. För con tältläge ration använder du tjänsten Content Safety.
  • Azure AI Document Intelligence är en tjänst som kan konvertera bilder direkt till elektroniska formulär. Du kan ange förväntade fält och sedan söka i bilder som du anger för att avbilda dessa fält utan mänsklig inblandning. Tjänsten är värd för många fördefinierade modeller och du kan också skapa egna anpassade formulärmodeller.

    • Använd Document Intelligence Service när du vet exakt vilka fält du behöver extrahera från skannade dokument för att fylla i elektroniska formulär på rätt sätt.
    • Använd Dokumentinformation för att identifiera nyckelstrukturer (sidhuvuden, sidfötter, kapitelbrytningar och så vidare) i olika dokumentkorusus för att ytterligare programmatiskt interagera med dokumentet, till exempel i en rag-implementering (hämtningsförhöjd generation).
    • Använd inte Document Intelligence-tjänsten som ett API för realtidssökning.

Azure AI-språk

Azure AI Language är en molnbaserad tjänst som tillhandahåller NLP-funktioner (Natural Language Processing) för att förstå och analysera text. Använd den här tjänsten för att skapa intelligenta program med hjälp av webbaserade Language Studio-, REST-API:er och klientbibliotek.

Funktioner

Följande tabell innehåller en lista över funktioner som är tillgängliga i Azure AI Language-tjänsten.

Kapacitet beskrivning
Svar på anpassad fråga Hittar det lämpligaste svaret för indata från dina användare och används ofta för att skapa konversationsklientprogram, till exempel program för sociala medier, chattrobotar och talaktiverade skrivbordsprogram.
Klassificering av anpassad text Använd för att skapa anpassade AI-modeller för att klassificera ostrukturerade textdokument i anpassade klasser som du definierar.
Förståelse för konversationsspråk (CLU) Använd för att skapa anpassade modeller för förståelse av naturligt språk för att förutsäga den övergripande avsikten med ett inkommande yttrande och extrahera viktig information från den.
Entitetslänkning Särskiljer identiteten för entiteter (ord eller fraser) som finns i ostrukturerad text och returnerar länkar till Wikipedia.
Språkidentifiering Identifierar språket som ett dokument är skrivet i och returnerar en språkkod för en mängd olika språk, varianter, dialekter och vissa regionala/kulturella språk.
Extrahering av diskussionsämne Utvärderar och returnerar huvudbegreppen i ostrukturerad text och returnerar dem som en lista.
Namngiven entitetsigenkänning (NER) Kategoriserar entiteter (ord eller fraser) i ostrukturerad text i flera fördefinierade kategorigrupper. Till exempel: personer, händelser, platser, datum med mera.
Arbetsflöde för orkestrering Använd för att ansluta TILL CLU (Conversational Language Understanding).
Identifiering av personligt identifierad information (PII) och hälsoinformation (PHI) Identifierar, kategoriserar och redigerar känslig information i både ostrukturerade textdokument och konversationsavskrifter. Till exempel telefonnummer, e-postadresser, former av identifiering med mera.
Sentimentanalys och åsiktsutvinning Hjälp dig att ta reda på vad folk tycker om ditt varumärke eller ämne genom att bryta text för ledtrådar om positiva eller negativa känslor, och kan associera dem med specifika aspekter av texten.
Sammanfattas Använder sammanfattning av extraherande text för att skapa en sammanfattning av dokument och konversationstranskriptioner. Den extraherar meningar som tillsammans representerar den viktigaste eller mest relevanta informationen i det ursprungliga innehållet.
Textanalys för hälsa Extraherar och etiketterar relevant medicinsk information från ostrukturerade texter som läkaranteckningar, sammanfattningar av ansvarsfrihet, kliniska dokument och elektroniska hälsojournaler. När du utformar din arbetsbelastning utvärderar du bearbetningsplatsen och datahemvisheten för den här molnbaserade funktionen för att säkerställa att den överensstämmer med dina efterlevnadsförväntningar. Vissa arbetsbelastningar kan begränsas i sin kapacitet för att skicka sjukvårdsdata till en molnbaserad plattform. Du kan använda det här API:et som en Docker-container som värd i din egen beräkning i molnet eller lokalt, vilket kan hjälpa dig att åtgärda efterlevnadsproblem som rör PaaS. Mer information finns i Använda Textanalys för hälsocontainrar

Användningsfall

Följande tabell innehåller en lista över möjliga användningsfall för Azure AI Language-tjänsten.

Användningsfall Anpassningsbara*
Förutse avsikten med användarindata och extrahera information från dem. Ja
Identifiera och/eller redigera känslig information, till exempel PII.
Identifiera språket som en text har skrivits i.
Extrahera medicinsk information från kliniska/medicinska dokument, utan att skapa en modell
Extrahera medicinsk information från kliniska/medicinska dokument med hjälp av en modell som är tränad på dina data. Ja
Extrahera informationskategorier utan att skapa en anpassad modell.
Extrahera informationskategorier med hjälp av en modell som är specifik för dina data. Ja
Extrahera huvudämnen och viktiga fraser.
Sammanfatta ett dokument
Klassificera text med hjälp av attitydanalys. Ja
Klassificera text med hjälp av anpassade klasser. Ja
Klassificera objekt i kategorier som tillhandahålls vid inferens.
Länka en entitet med kunskapsbas artiklar.
Förstå frågor och svar (generiska). Ja
Skapa ett konversationsprogram som svarar på användarindata.
Anslut appar från konversationsspråksförståning och frågesvar. Ja

*Om en funktion är anpassningsbar kan du träna en AI-modell med hjälp av våra verktyg för att passa dina data specifikt. Annars är en funktion förkonfigurerad, vilket innebär att DE AI-modeller som den använder inte kan ändras. Du skickar bara dina data och använder funktionens utdata i dina program.

Azure AI Translator

Azure AI Translator är en maskinöversättningstjänst som ingår i Azure AI-tjänstefamiljen. Translator driver många Microsoft-produkter och -tjänster.

Funktioner

Följande tabell innehåller en lista över funktioner som är tillgängliga i Azure AI Translator-tjänsten.

Kapacitet beskrivning
Textöversättning Kör textöversättning mellan käll- och målspråk som stöds i realtid. Skapa en dynamisk ordlista och lär dig hur du förhindrar översättningar med hjälp av Translator API.
Dokumentöversättning Asynkron batchöversättning: Översätt batchfiler och komplexa filer samtidigt som de ursprungliga dokumentens struktur och format bevaras. Batchöversättningsprocessen kräver ett Azure Blob Storage-konto med containrar för källan och översatta dokument.
Synkron enkel filöversättning: Översätt en enskild dokumentfil ensam eller med en ordlista samtidigt som strukturen och formatet för det ursprungliga dokumentet bevaras. Filöversättningsprocessen kräver inget Azure Blob Storage-konto. Det slutliga svaret innehåller det översatta dokumentet och returneras direkt till den anropande klienten.
Anpassad translator Skapa anpassade modeller för att översätta domän- och branschspecifikt språk, terminologi och stil. Skapa en ordlista (fras eller mening) för anpassade översättningar.

Användningsfall

Följande tabell innehåller en lista över möjliga användningsfall för Azure AI Translator-tjänsten.

Användningsfall Dokumentation
Översätt branschspecifik text. Anpassad Translator för AI Services
Översätt allmän text som inte är specifik för en bransch. Vad är Azure Text Translation?

Azure AI Document Intelligence

Azure AI Language är en molnbaserad tjänst som tillhandahåller NLP-funktioner (Natural Language Processing) för att förstå och analysera text. Använd den här tjänsten för att skapa intelligenta program med hjälp av webbaserade Language Studio-, REST-API:er och klientbibliotek.

Funktioner

Följande tabell innehåller en lista över några av de funktioner som är tillgängliga i AI Document Intelligence Service.

Kapacitet beskrivning
Extrahering av visitkort Visitkortsmodellen för Document Intelligence kombinerar OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera data från visitkortsbilder. API:et analyserar tryckta visitkort; extraherar viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer. och returnerar en strukturerad JSON-datarepresentation.
Extrahering av kontraktsmodell Kontraktsmodellen för dokumentinformation använder ocr-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med viktiga kontraktentiteter. Kontrakt kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information såsom parter, jurisdiktioner, kontrakts-ID och titel; och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.
Extrahering av kreditkort Dokumentinformationens kredit-/debetkortsmodell använder OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält från kredit- och betalkort. Kreditkort och betalkort kan ha olika format och kvalitet, inklusive telefontagna bilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information, till exempel kortnummer, utfärdande bank och förfallodatum. och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.
Extrahering av sjukförsäkringskort Dokumentinformationens sjukförsäkringskortmodell kombinerar OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera viktig information från amerikanska sjukförsäkringskort. Ett sjukförsäkringskort är ett nyckeldokument för vårdbearbetning och kan analyseras digitalt för patient onboarding, finansiell täckningsinformation, kontantlösa betalningar och bearbetning av försäkringsanspråk. Modellen för sjukförsäkringskort analyserar bilder på hälsokort; extraherar viktig information såsom försäkringsgivare, medlem, recept och gruppnummer; och returnerar en strukturerad JSON-representation. Sjukförsäkringskort kan presenteras i olika format och kvalitet, inklusive telefontagna bilder, skannade dokument och digitala PDF-filer.
Extrahering av amerikanska skattedokument Avtalsmodellen för dokumentinformation använder ocr-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med skattedokument. Skattedokument kan ha olika format och kvalitet, inklusive telefontagna bilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information som kundnamn, faktureringsadress, förfallodatum och förfallodatum. och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande vissa format för engelska skattedokument.
Många fler... Azure AI Document Intelligence stöder en mängd olika modeller som gör att du kan lägga till intelligent dokumentbearbetning i dina appar och flöden. Du kan använda en fördefinierad domänspecifik modell eller träna en anpassad modell som är anpassad efter dina specifika affärsbehov och användningsfall. Dokumentinformation kan användas med REST-API:et eller Python-, C#-, Java- och JavaScript-klientbiblioteken.

Mer information om hur du väljer en modell som fungerar för ditt scenario finns i Vilken modell ska jag välja?

Nästa steg