Delen via


Een op Azure AI gerichte taalverwerkingstechnologie kiezen

Azure AI-services helpen ontwikkelaars en organisaties snel intelligente, geavanceerde, marktklare en verantwoordelijke toepassingen te maken met kant-en-klare en vooraf samengestelde en aanpasbare API's en modellen.

In dit artikel worden Azure AI-services behandeld die gerichte taalverwerkingsmogelijkheden bieden, zoals NLP (Natural Language Processing), text analytics, language understanding, translation en documentgegevensextractie. Azure AI Language is een van de breedste categorieën in Azure AI-services. U kunt de API's in uw workload gebruiken om taalfuncties zoals herkenning van benoemde entiteiten, sentimentanalyse, taaldetectie en samenvatting van tekst op te nemen.

Services

De volgende services bieden mogelijkheden voor gerichte taalverwerking voor Azure AI-services:

  • Azure AI Language biedt verwerking van natuurlijke taal voor tekstanalyse.

    • Gebruik de Azure AI Language-service wanneer u moet werken met gestructureerde of ongestructureerde documenten voor de breed scala aan taalgerelateerde taken die worden beschreven.
    • Gebruik de taalservice niet als u documenten met chat wilt doorzoeken, ze wilt controleren op inhoudsveiligheid of ze wilt vertalen.
  • Azure AI Translator is een service voor automatisch vertalen. Hiermee kunt u realtime tekstomzetting, batch- en één documentomzetting uitvoeren en aangepaste vertalingen waarmee u gespecialiseerde terminologie of branchespecifieke taal voor uw scenario kunt opnemen. Het ondersteunt veel talen.

    • Gebruik de Translator-service wanneer u een vertaling specifiek moet uitvoeren. Hoewel u andere algemene basistaalmodellen kunt gebruiken om vertaling uit te voeren, kan het gebruik van de vertaler voor het gespecialiseerde doel betrouwbaarder zijn en rendabeler zijn met behulp van gerichte vertaalmodellen.
    • Gebruik de Translator-service niet als u contact wilt opnemen met chatten, inhoud wilt analyseren op gevoel of voor con tentmodus ration. Gebruik in plaats daarvan de Language-service voor sentimentanalyse. Voor con tentmodus ration gebruikt u de Content Safety-service.
  • Azure AI Document Intelligence is een service waarmee afbeeldingen rechtstreeks kunnen worden geconverteerd naar elektronische formulieren. U kunt verwachte velden opgeven en vervolgens zoeken in afbeeldingen die u opgeeft om deze velden vast te leggen zonder menselijke tussenkomst. De service fungeert als host voor veel vooraf samengestelde modellen en stelt u ook in staat om zelf aangepaste formuliermodellen te maken.

    • Gebruik de Document Intelligence-service wanneer u precies weet welke velden u moet extraheren uit gescande documenten om elektronische formulieren op de juiste manier in te vullen.
    • Gebruik Document Intelligence om belangrijke structuren (kopteksten, voetteksten, hoofdstukeinden, enzovoort) te identificeren in diverse documentteksten om het document programmatisch te communiceren, zoals in een implementatie van een uitgebreide generatie (RAG).
    • Gebruik de Document Intelligence-service niet als een realtime zoek-API.

Azure AI Taal

Azure AI Language is een cloudservice die NLP-functies (Natural Language Processing) biedt voor het begrijpen en analyseren van tekst. Gebruik deze service om intelligente toepassingen te bouwen met behulp van de webgebaseerde Language Studio, REST API's en clientbibliotheken.

Functies

De volgende tabel bevat een lijst met mogelijkheden die beschikbaar zijn in de Azure AI Language-service.

Mogelijkheid Beschrijving
Aangepaste vraag beantwoorden Hiermee vindt u het meest geschikte antwoord voor invoer van uw gebruikers en wordt vaak gebruikt voor het bouwen van gespreksclienttoepassingen, zoals toepassingen voor sociale media, chatbots en desktoptoepassingen met spraak.
Aangepaste tekstclassificatie Hiermee kunt u aangepaste AI-modellen maken om ongestructureerde tekstdocumenten te classificeren in aangepaste klassen die u definieert.
Conversational Language Understanding (CLU) Gebruik deze functie om aangepaste modellen voor natuurlijke taalbegrip te bouwen om de algehele intentie van een binnenkomende uiting te voorspellen en belangrijke informatie uit deze te extraheren.
Entiteiten koppelen De identiteit van entiteiten (woorden of woordgroepen) die in ongestructureerde tekst zijn gevonden, is niet eenduidig en retourneert koppelingen naar Wikipedia.
Taaldetectie Detecteert de taal waarin een document is geschreven en retourneert een taalcode voor een breed scala aan talen, varianten, dialecten en enkele regionale/culturele talen.
Sleuteltermextractie Evalueert en retourneert de belangrijkste concepten in ongestructureerde tekst en retourneert deze als een lijst.
NER (Named Entity Recognition) Categoriseert entiteiten (woorden of woordgroepen) in ongestructureerde tekst in verschillende vooraf gedefinieerde categoriegroepen. Bijvoorbeeld: personen, gebeurtenissen, plaatsen, datums en meer.
Indelingswerkstroom Gebruik dit om Conversational Language Understanding (CLU) te verbinden.
Persoonlijke identificatie (PII) en gezondheidsinformatiedetectie (PHI) Identificeert, categoriseert en redacteert gevoelige informatie in zowel ongestructureerde tekstdocumenten als gesprektranscripties. Bijvoorbeeld: telefoonnummers, e-mailadressen, vormen van identificatie en meer.
Sentimentanalyse en meninganalyse Help u erachter te komen wat mensen van uw merk of onderwerp vinden door tekst te analyseren op aanwijzingen over positieve of negatieve gevoelens en deze te koppelen aan specifieke aspecten van de tekst.
Samenvatting Maakt gebruik van samenvatting van extraherende tekst om een samenvatting van documenten en gesprektranscripties te maken. Het extraheert zinnen die gezamenlijk de belangrijkste of relevante informatie in de oorspronkelijke inhoud vertegenwoordigen.
Tekstanalyse voor status Haalt relevante medische informatie op uit ongestructureerde teksten, zoals doktersnotities, kwijtingsoverzichten, klinische documenten en elektronische gezondheidsdossiers. Evalueer bij het ontwerpen van uw workload de verwerkingslocatie en gegevenslocatie van deze in de cloud gehoste functie om ervoor te zorgen dat deze overeenkomt met uw nalevingsverwachtingen. Sommige workloads zijn mogelijk beperkt in hun capaciteit om gezondheidszorggegevens te verzenden naar een platform dat in de cloud wordt gehost. U kunt deze API gebruiken als een Docker-container om te hosten in uw eigen rekenproces in de cloud of on-premises, wat kan helpen bij het oplossen van nalevingsproblemen met PaaS. Zie Text Analytics gebruiken voor statuscontainers voor meer informatie

Gebruiksgevallen

De volgende tabel bevat een lijst met mogelijke gebruiksvoorbeelden voor de Azure AI-taalservice.

Gebruiksscenario Aanpasbare*
Voorspel de bedoeling van gebruikersinvoer en extraheer gegevens uit deze invoer. Ja
Gevoelige informatie, zoals PII, identificeren en/of redacteren.
Identificeer de taal waarin een tekst is geschreven.
Medische informatie extraheren uit klinische/medische documenten, zonder een model te bouwen
Extraheer medische informatie uit klinische/medische documenten met behulp van een model dat is getraind op uw gegevens. Ja
Gegevenscategorieën extraheren zonder een aangepast model te maken.
Gegevenscategorieën extraheren met behulp van een model dat specifiek is voor uw gegevens. Ja
Hoofdonderwerpen en belangrijke zinnen extraheren.
Een document samenvatten
Tekst classificeren met behulp van sentimentanalyse. Ja
Tekst classificeren met behulp van aangepaste klassen. Ja
Items classificeren in categorieën die tijdens deductietijd zijn opgegeven.
Een entiteit koppelen aan knowledge base-artikelen.
Vragen en antwoorden (algemeen) begrijpen. Ja
Bouw een gesprekstoepassing die reageert op gebruikersinvoer.
Verbinding maken met apps vanuit het begrip van gesprekstaal en het beantwoorden van vragen. Ja

*Als een functie aanpasbaar is, kunt u een AI-model trainen met behulp van onze hulpprogramma's om uw gegevens specifiek aan te passen. Anders is een functie vooraf geconfigureerd, wat betekent dat de AI-modellen die worden gebruikt, niet kunnen worden gewijzigd. U verzendt alleen uw gegevens en gebruikt de uitvoer van de functie in uw toepassingen.

Azure AI Translator

Azure AI Translator is een service voor automatisch vertalen die deel uitmaakt van de Azure AI-servicesfamilie. Translator maakt veel Microsoft-producten en -services mogelijk.

Functies

De volgende tabel bevat een lijst met mogelijkheden die beschikbaar zijn in de Azure AI Translator-service.

Mogelijkheid Beschrijving
Vertalen van tekst Tekstomzetting uitvoeren tussen ondersteunde bron- en doeltalen in realtime. Maak een dynamische woordenlijst en leer hoe u vertalingen kunt voorkomen met behulp van de Translator-API.
Documentvertaling Asynchrone batchvertaling: Batch- en complexe bestanden vertalen met behoud van de structuur en opmaak van de oorspronkelijke documenten. Voor het batchvertalingsproces is een Azure Blob Storage-account met containers vereist voor uw bron- en vertaalde documenten.
Synchrone vertaling van één bestand: vertaal één documentbestand alleen of met een woordenlijstbestand, met behoud van de structuur en opmaak van het oorspronkelijke document. Voor het proces voor bestandsvertaling is geen Azure Blob Storage-account vereist. Het uiteindelijke antwoord bevat het vertaalde document en wordt rechtstreeks naar de aanroepende client geretourneerd.
Custom Translator Bouw aangepaste modellen om domein- en branchespecifieke taal, terminologie en stijl te vertalen. Maak een woordenlijst (woordgroep of zin) voor aangepaste vertalingen.

Gebruiksgevallen

De volgende tabel bevat een lijst met mogelijke gebruiksvoorbeelden voor de Azure AI Translator-service.

Gebruiksscenario Documentatie
Branchespecifieke tekst vertalen. AI Services Custom Translator
Algemene tekst vertalen die niet specifiek is voor een branche. Wat is Azure Text Translation?

Azure AI documentanalyse

Azure AI Language is een cloudservice die NLP-functies (Natural Language Processing) biedt voor het begrijpen en analyseren van tekst. Gebruik deze service om intelligente toepassingen te bouwen met behulp van de webgebaseerde Language Studio, REST API's en clientbibliotheken.

Functies

De volgende tabel bevat een lijst met enkele van de mogelijkheden die beschikbaar zijn in de AI Document Intelligence-service.

Mogelijkheid Beschrijving
Visitekaartjesextractie Het Document Intelligence-visitekaartjesmodel combineert OCR-mogelijkheden (Optical Character Recognition) met deep learning-modellen om gegevens te analyseren en te extraheren uit visitekaartjesafbeeldingen. De API analyseert afgedrukte visitekaartjes; haalt belangrijke informatie op, zoals voornaam, achternaam, bedrijfsnaam, e-mailadres en telefoonnummer; en retourneert een gestructureerde JSON-gegevensweergave.
Contractmodelextractie Het Document Intelligence-contractmodel maakt gebruik van OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems uit een bepaalde groep belangrijke contractentiteiten te analyseren en te extraheren. Contracten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals partijen, jurisdicties, contract-id en titel; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel engelse documentindelingen.
Creditcardextractie Het Document Intelligence-creditcardmodel maakt gebruik van OCR-mogelijkheden (Optical Character Recognition) voor het analyseren en extraheren van sleutelvelden uit creditcards en debitcards. Creditcards en betaalkaarten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals kaartnummer, uitgiftebank en vervaldatum; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel engelse documentindelingen.
Extractie van gezondheidsverzekeringskaarten Het document intelligence-verzekeringskaartmodel combineert ocr-mogelijkheden (Optical Character Recognition) met deep learning-modellen om belangrijke informatie uit amerikaanse gezondheidsverzekeringskaarten te analyseren en te extraheren. Een zorgverzekeringskaart is een belangrijk document voor de verwerking van zorg en kan digitaal worden geanalyseerd voor onboarding van patiënten, informatie over financiële dekking, cashless betalingen en de verwerking van verzekeringsclaims. Het model van de zorgverzekeringskaart analyseert afbeeldingen van gezondheidskaarten; haalt belangrijke informatie op, zoals verzekeraar, lid, recept en groepsnummer; en retourneert een gestructureerde JSON-weergave. Zorgverzekeringskaarten kunnen worden gepresenteerd in verschillende indelingen en kwaliteit, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden.
Amerikaanse belastingdocumentextractie Het Document Intelligence-contractmodel maakt gebruik van OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems uit een bepaalde groep belastingdocumenten te analyseren en te extraheren. Belastingdocumenten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals klantnaam, factuuradres, vervaldatum en verschuldigd bedrag; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel bepaalde Indelingen voor Engelse belastingdocumenten.
Nog veel meer... Azure AI Document Intelligence ondersteunt een groot aantal modellen waarmee u intelligente documentverwerking kunt toevoegen aan uw apps en stromen. U kunt een vooraf samengesteld domeinspecifiek model gebruiken of een aangepast model trainen dat is afgestemd op uw specifieke bedrijfsbehoefte en gebruiksvoorbeelden. Document Intelligence kan worden gebruikt met de REST API of Python-, C#-, Java- en JavaScript-clientbibliotheken.

Zie welk model moet ik kiezen voor meer informatie over het kiezen van een model dat geschikt is voor uw scenario?

Volgende stappen