Wat is aangepaste tekstclassificatie?
Aangepaste tekstclassificatie is een van de aangepaste functies van Azure AI Language. Het is een cloud-API-service die machine learning-intelligentie toepast om aangepaste modellen te maken voor tekstclassificatietaken.
Met aangepaste tekstclassificatie kunnen gebruikers aangepaste AI-modellen bouwen om tekst te classificeren in aangepaste klassen die vooraf door de gebruiker zijn gedefinieerd. Door een aangepast tekstclassificatieproject te maken, kunnen ontwikkelaars iteratief gegevens labelen, modelprestaties trainen, evalueren en verbeteren voordat ze deze beschikbaar maken voor gebruik. De kwaliteit van de gelabelde gegevens heeft een grote invloed op de modelprestaties. Om het bouwen en aanpassen van uw model te vereenvoudigen, biedt de service een aangepaste webportal die toegankelijk is via de Language Studio. U kunt eenvoudig aan de slag met de service door de stappen in deze quickstart te volgen.
Aangepaste tekstclassificatie ondersteunt twee soorten projecten:
- Classificatie van één label: u kunt één klasse toewijzen voor elk document in uw gegevensset. Een filmscript kan bijvoorbeeld alleen worden geclassificeerd als 'Romantiek' of 'Komedie'.
- Classificatie met meerdere labels: u kunt meerdere klassen toewijzen voor elk document in uw gegevensset. Een filmscript kan bijvoorbeeld worden geclassificeerd als 'Komedie' of 'Romantiek' en 'Komedie'.
Deze documentatie bevat de volgende artikeltypen:
- Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
- Concepten bieden uitleg over de servicefunctionaliteit en -functies.
- Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
Voorbeeld van gebruiksscenario's
Aangepaste tekstclassificatie kan in meerdere scenario's in verschillende branches worden gebruikt:
Automatische e-mailberichten of ticketsorage
Ondersteuningscentra van alle typen ontvangen een groot aantal e-mailberichten of tickets met ongestructureerde, vrije vorm en bijlagen. Tijdig beoordelen, bevestigen en doorsturen naar deskundigen binnen interne teams is essentieel. E-mail triage op deze schaal vereist dat mensen de juiste afdelingen controleren en routeren, wat tijd en resources kost. Aangepaste tekstclassificatie kan worden gebruikt voor het analyseren van binnenkomende tekst en het classificeren en categoriseren van de inhoud die automatisch naar de relevante afdelingen moet worden gerouteerd voor verdere actie.
Kennisanalyse om semantische zoekopdrachten te verbeteren/verrijken
Zoeken is fundamenteel voor elke app die tekstinhoud aan gebruikers weer geeft. Veelvoorkomende scenario's zijn catalogus- of documentzoekopdrachten, zoekopdrachten in retailproduct of kennisanalyse voor gegevenswetenschap. Veel ondernemingen in verschillende branches zijn op zoek naar een rijke zoekervaring ten opzichte van privé, heterogene inhoud, die zowel gestructureerde als ongestructureerde documenten omvat. Als onderdeel van hun pijplijn kunnen ontwikkelaars aangepaste tekstclassificatie gebruiken om hun tekst te categoriseren in klassen die relevant zijn voor hun branche. De voorspelde klassen kunnen worden gebruikt om de indexering van het bestand te verrijken voor een meer aangepaste zoekervaring.
Levenscyclus van projectontwikkeling
Het maken van een aangepast tekstclassificatieproject omvat doorgaans verschillende stappen.
Volg deze stappen om optimaal gebruik te maken van uw model:
Definieer uw schema: ken uw gegevens en identificeer de klassen die u wilt onderscheiden, om dubbelzinnigheid te voorkomen.
Uw gegevens labelen: de kwaliteit van gegevenslabels is een belangrijke factor bij het bepalen van modelprestaties. Documenten die deel uitmaken van dezelfde klasse moeten altijd dezelfde klasse hebben, als u een document hebt dat in twee klassen kan vallen, gebruikt u projecten voor classificatie van meerdere labels. Vermijd dubbelzinnigheid van klassen, zorg ervoor dat uw klassen duidelijk van elkaar kunnen worden gescheiden, met name met projecten voor classificatie van één label.
Het model trainen: uw model begint met leren op basis van uw gelabelde gegevens.
Bekijk de prestaties van het model: bekijk de evaluatiedetails voor uw model om te bepalen hoe goed het presteert wanneer er nieuwe gegevens worden geïntroduceerd.
Het model implementeren: door een model te implementeren, is het beschikbaar voor gebruik via de Analyze-API.
Tekst classificeren: gebruik uw aangepaste model voor aangepaste tekstclassificatietaken.
Referentiedocumentatie en codevoorbeelden
Als u aangepaste tekstclassificatie gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:
Ontwikkelingsoptie/taal | Referentiedocumentatie | Voorbeelden |
---|---|---|
REST API's (ontwerpen) | REST API-documentatie | |
REST API's (runtime) | REST API-documentatie | |
C# (runtime) | C#-documentatie | C#-voorbeelden - C#-voorbeelden met één label - Classificatie met meerdere labels |
Java (runtime) | Java-documentatie | Java-voorbeelden - Java-voorbeelden met één label - Classificatie met meerdere labels |
JavaScript (runtime) | Documentatie over JavaScript | JavaScript-voorbeelden - JavaScript-voorbeelden met één labelclassificatie - Classificatie met meerdere labels |
Python (runtime) | Python-documentatie | Python-voorbeelden - Python-voorbeelden met één label - Classificatie met meerdere labels |
Verantwoorde AI
Een AI-systeem omvat niet alleen de technologie, maar ook de mensen die het gebruiken, de personen die worden beïnvloed door het systeem en de omgeving waarin het wordt geïmplementeerd. Lees de transparantienotitie voor aangepaste tekstclassificatie voor meer informatie over verantwoord AI-gebruik en -implementatie in uw systemen. U kunt ook de volgende artikelen voor meer informatie bekijken:
- Transparantienotitie voor Azure AI-taal
- Integratie en verantwoordelijk gebruik
- Gegevens, privacy en beveiliging
Volgende stappen
Gebruik het quickstart-artikel om aangepaste tekstclassificatie te gebruiken.
Bekijk tijdens het doorlopen van de levenscyclus van projectontwikkeling de woordenlijst voor meer informatie over de termen die in de documentatie voor deze functie worden gebruikt.
Vergeet niet om de servicelimieten weer te geven voor informatie zoals regionale beschikbaarheid.