Delen via


Aangepaste definities en termen voor entiteitsherkenning

Gebruik dit artikel voor meer informatie over enkele definities en termen die u kunt tegenkomen bij het gebruik van aangepaste NER.

Entity

Een entiteit is een reeks tekst die een bepaald type informatie aangeeft. De tekstspanne kan bestaan uit een of meer woorden. In het bereik van aangepaste NER vertegenwoordigen entiteiten de informatie die de gebruiker uit de tekst wil extraheren. Ontwikkelaars taggen entiteiten in hun gegevens met de benodigde entiteiten voordat ze deze doorgeven aan het model voor training. Bijvoorbeeld 'Factuurnummer', 'Begindatum', 'Verzendnummer', 'Geboorteplaats', 'Plaats van oorsprong', 'Naam leverancier' of 'Klantadres'.

In de zin 'John geleend 25.000 USD van Fred.' kunnen de entiteiten zijn:

Naam/type entiteit Entity
Naam van de kredietnemer John
Naam van kredietgever Fred
Leningbedrag 25.000 USD

F1-score

De F1-score is een functie van Precisie en Relevante overeenkomsten. Het is nodig wanneer u een balans zoekt tussen precisie en relevante overeenkomsten.

Modelleren

Een model is een object dat is getraind om een bepaalde taak uit te voeren, in dit geval aangepaste entiteitsherkenning. Modellen worden getraind door gelabelde gegevens op te geven waaruit ze kunnen leren, zodat ze later kunnen worden gebruikt voor herkenningstaken.

  • Modeltraining is het proces van het leren van uw model wat moet worden geëxtraheerd op basis van uw gelabelde gegevens.
  • Modelevaluatie is het proces dat direct na de training plaatsvindt om te weten hoe goed uw model presteert.
  • Implementatie is het proces van het toewijzen van uw model aan een implementatie om het beschikbaar te maken voor gebruik via de voorspellings-API.

Precisie

Meet hoe nauwkeurig/nauwkeurig uw model is. Dit is de verhouding tussen de correct geïdentificeerde positieven (terecht-positieven) en alle geïdentificeerde positieven. De precisiemetrie geeft aan hoeveel van de voorspelde klassen correct zijn gelabeld.

Project

Een project is een werkgebied voor het bouwen van uw aangepaste ML-modellen op basis van uw gegevens. Uw project kan alleen worden geopend door u en anderen die toegang hebben tot de Azure-resource die wordt gebruikt. Als vereiste voor het maken van een aangepast entiteitextractieproject moet u uw resource verbinden met een opslagaccount met uw gegevensset wanneer u een nieuw project maakt. Uw project bevat automatisch alle .txt bestanden die beschikbaar zijn in uw container.

Binnen uw project kunt u de volgende acties uitvoeren:

  • Uw gegevens labelen: het proces van het labelen van uw gegevens, zodat wanneer u uw model traint, het leert wat u wilt extraheren.
  • Bouw en train uw model: de belangrijkste stap van uw project, waar uw model begint met leren van uw gelabelde gegevens.
  • Bekijk de details van de modelevaluatie: controleer de prestaties van uw model om te bepalen of er ruimte is voor verbetering of als u tevreden bent met de resultaten.
  • Implementatie: Nadat u de prestaties van het model hebt gecontroleerd en hebt besloten dat het kan worden gebruikt in uw omgeving, moet u het toewijzen aan een implementatie om het te gebruiken. Als u het model toewijst aan een implementatie, is het beschikbaar voor gebruik via de voorspellings-API.
  • Testmodel: Na het implementeren van uw model test u uw implementatie in Language Studio om te zien hoe het in productie zou presteren.

Intrekken

Meet het vermogen van het model om werkelijke positieve klassen te voorspellen. Het is de verhouding tussen de voorspelde terecht-positieven en wat daadwerkelijk is getagd. De relevante metrische gegevens geven aan hoeveel van de voorspelde klassen juist zijn.

Volgende stappen