Wat is aangepaste entiteitsherkenning?

Artikel
10/21/2024

Aangepaste NER is een van de aangepaste functies van Azure AI Language. Het is een cloud-API-service die machine learning-intelligentie toepast om aangepaste modellen te bouwen voor aangepaste entiteitsherkenningstaken.

Met aangepaste NER kunnen gebruikers aangepaste AI-modellen bouwen om domeinspecifieke entiteiten te extraheren uit ongestructureerde tekst, zoals contracten of financiële documenten. Door een aangepast NER-project te maken, kunnen ontwikkelaars iteratief gegevens labelen, modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de gelabelde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via de Language Studio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.

Deze documentatie bevat de volgende artikeltypen:

Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
Concepten bieden uitleg over de servicefunctionaliteit en -functies.
Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.

Voorbeeld van gebruiksscenario's

Aangepaste herkenning van benoemde entiteiten kan in meerdere scenario's in verschillende branches worden gebruikt:

Informatie-extractie

Veel financiële en juridische organisaties extraheren en normaliseren gegevens uit duizenden complexe, ongestructureerde tekstbronnen per dag. Dergelijke bronnen omvatten bankafschriften, juridische overeenkomsten of bankformulieren. Het kan bijvoorbeeld enkele dagen duren voordat gegevens uit de hypotheekaanvraag handmatig worden geëxtraheerd door menselijke revisoren. Door deze stappen te automatiseren door een aangepast NER-model te bouwen, wordt het proces vereenvoudigd en bespaart u kosten, tijd en moeite.

Kennisanalyse om semantische zoekopdrachten te verbeteren/verrijken

Zoeken is fundamenteel voor elke app die tekstinhoud aan gebruikers weer geeft. Veelvoorkomende scenario's zijn catalogus- of documentzoekopdrachten, retailproductzoekopdrachten of kennisanalyses voor gegevenswetenschap. Veel ondernemingen in verschillende branches willen een rijke zoekervaring creëren ten opzichte van privé- en heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten omvat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste NER gebruiken voor het extraheren van entiteiten uit de tekst die relevant zijn voor hun branche. Deze entiteiten kunnen worden gebruikt om het indexeren van het bestand te verrijken voor een meer aangepaste zoekervaring.

Controle en naleving

In plaats van handmatig lange tekstbestanden te controleren en toe te passen, kunnen IT-afdelingen in financiële of juridische ondernemingen aangepaste NER gebruiken om geautomatiseerde oplossingen te bouwen. Deze oplossingen kunnen handig zijn om nalevingsbeleid af te dwingen en noodzakelijke bedrijfsregels in te stellen op basis van kennisanalysepijplijnen die gestructureerde en ongestructureerde inhoud verwerken.

Levenscyclus van projectontwikkeling

Het gebruik van aangepaste NER omvat doorgaans verschillende stappen.

Definieer uw schema: ken uw gegevens en identificeer de entiteiten die u wilt ophalen. Vermijd dubbelzinnigheid.
Label uw gegevens: het labelen van gegevens is een belangrijke factor bij het bepalen van modelprestaties. Label precies, consistent en volledig.
1. Label precies: Label elke entiteit altijd aan het juiste type. Neem alleen op wat u wilt uitgepakt, vermijd onnodige gegevens in uw labels.
2. Label consistent: dezelfde entiteit moet hetzelfde label hebben voor alle bestanden.
3. Label volledig: Label alle exemplaren van de entiteit in al uw bestanden.
Het model trainen: uw model begint met leren op basis van uw gelabelde gegevens.
Bekijk de prestaties van het model: Nadat de training is voltooid, bekijkt u de evaluatiedetails van het model, de prestaties en richtlijnen voor het verbeteren ervan.
Het model implementeren: door een model te implementeren, is het beschikbaar voor gebruik via de Analyze-API.
Entiteiten extraheren: gebruik uw aangepaste modellen voor entiteitextractietaken.

Referentiedocumentatie en codevoorbeelden

Als u aangepaste NER gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:

Ontwikkelingsoptie/taal	Referentiedocumentatie	Voorbeelden
REST API's (ontwerpen)	REST API-documentatie
REST API's (runtime)	REST API-documentatie
C# (runtime)	C#-documentatie	C#-voorbeelden
Java (runtime)	Java-documentatie	Java-voorbeelden
JavaScript (runtime)	Documentatie over JavaScript	JavaScript-voorbeelden
Python (runtime)	Python-documentatie	Python-voorbeelden

Verantwoorde AI

Een AI-systeem omvat niet alleen de technologie, maar ook de mensen die het gebruiken, de personen die worden beïnvloed door het systeem en de omgeving waarin het wordt geïmplementeerd. Lees de transparantienotitie voor aangepaste NER voor meer informatie over verantwoord AI-gebruik en -implementatie in uw systemen. U kunt ook de volgende artikelen voor meer informatie bekijken:

Volgende stappen

Gebruik het quickstart-artikel om aangepaste herkenning van benoemde entiteiten te gebruiken.
Bekijk tijdens het doorlopen van de levenscyclus van projectontwikkeling de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.
Vergeet niet om de servicelimieten weer te geven voor informatie zoals regionale beschikbaarheid.

Delen via