formrecognizer Pakket
Pakketten
aio |
Klassen
AccountProperties |
Samenvatting van alle aangepaste modellen in het account. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
AddressValue |
Een adresveldwaarde. Nieuw in versie 2023-07-31: De eenheden, city_district, state_district, voorsteden, huizen en niveau-eigenschappen . |
AnalyzeResult |
Resultaat van documentanalyse. |
AnalyzedDocument |
Een object dat de locatie en semantische inhoud van een document beschrijft. |
BlobFileListSource |
Inhoudsbron voor een lijst met bestanden in Azure Blob Storage. |
BlobSource |
Inhoudsbron voor Azure Blob Storage. |
BoundingRegion |
Het begrenzingsgebied dat overeenkomt met een pagina. |
ClassifierDocumentTypeDetails |
Gegevensbron voor training. |
CurrencyValue |
Een valutawaardeelement. Nieuw in versie 2023-07-31: de code-eigenschap . |
CustomDocumentModelsDetails |
Details met betrekking tot de aangepaste modellen onder de Form Recognizer resource. |
CustomFormModel |
Vertegenwoordigt een getraind model. Nieuw in versie v2.1: de eigenschappen van de model_name en eigenschappen , ondersteuning voor to_dict - en from_dict methoden |
CustomFormModelField |
Een veld dat door het model wordt geëxtraheerd uit de formulieren die het analyseert. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
CustomFormModelInfo |
Aangepaste modelgegevens. Nieuw in versie v2.1: de eigenschappen van de model_name en eigenschappen , ondersteuning voor to_dict - en from_dict methoden |
CustomFormModelProperties |
Optionele modeleigenschappen. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
CustomFormSubmodel |
Vertegenwoordigt een submodel waarmee velden worden geëxtraheerd uit een specifiek type formulier. Nieuw in versie v2.1: de eigenschap model_id, ondersteuning voor to_dict- en from_dict-methoden |
DocumentAnalysisClient |
DocumentAnalysisClient analyseert informatie uit documenten en afbeeldingen en classificeert documenten. Het is de interface die moet worden gebruikt voor het analyseren van vooraf samengestelde modellen (onder andere bonnen, visitekaartjes, facturen, identiteitsdocumenten), het analyseren van de indeling van documenten, het analyseren van algemene documenttypen en het analyseren van aangepaste documenten met ingebouwde modellen (zie voor een volledige lijst met modellen die door de service worden ondersteund: https://aka.ms/azsdk/formrecognizer/models). Het biedt verschillende methoden op basis van invoer van een URL en invoer uit een stream. Notitie DocumentAnalysisClient moet worden gebruikt met API-versies 2022-08-31 en hoger. Als u API-versies <=v2.1 wilt gebruiken, instantiëert u een FormRecognizerClient. Nieuw in versie 2022-08-31: De DocumentAnalysisClient en de bijbehorende clientmethoden. |
DocumentAnalysisError |
DocumentAnalysisError bevat de details van de fout die door de service wordt geretourneerd. |
DocumentAnalysisInnerError |
Interne foutdetails voor de DocumentAnalysisError. |
DocumentBarcode |
Een streepjescodeobject. |
DocumentClassifierDetails |
Informatie over documentclassificatie. Bevat de documenttypen die door het model kunnen worden geclassificeerd. |
DocumentField |
Een object dat de inhoud en locatie van een documentveldwaarde vertegenwoordigt. Nieuw in versie 2023-07-31: De booleaanse value_type- en boolwaarde |
DocumentFormula |
Een formuleobject. |
DocumentKeyValueElement |
Een object dat de veldsleutel of -waarde in een sleutel-waardepaar vertegenwoordigt. |
DocumentKeyValuePair |
Een object dat een documentveld vertegenwoordigt met een uniek veldlabel (sleutel) en veldwaarde (kan leeg zijn). |
DocumentLanguage |
Een object dat de gedetecteerde taal voor een bepaald tekstbereik vertegenwoordigt. |
DocumentLine |
Een inhoudsregelobject dat de inhoud vertegenwoordigt die op één regel van het document wordt gevonden. |
DocumentModelAdministrationClient |
DocumentModelAdministrationClient is de Form Recognizer interface die kan worden gebruikt voor het bouwen en beheren van modellen. Het biedt methoden voor het bouwen van modellen en classificaties, evenals methoden voor het weergeven en verwijderen van modellen en classificaties, het bekijken van model- en classificatiebewerkingen, het openen van accountgegevens, het kopiëren van modellen naar een andere Form Recognizer resource en het opstellen van een nieuw model uit een verzameling bestaande modellen. Notitie DocumentModelAdministrationClient moet worden gebruikt met API-versies 2022-08-31 en hoger. Als u API-versies <=v2.1 wilt gebruiken, maakt u een FormTrainingClient. Nieuw in versie 2022-08-31: De DocumentModelAdministrationClient en de bijbehorende clientmethoden. |
DocumentModelAdministrationLROPoller |
Implementeert een protocol gevolgd door geretourneerde poller-objecten. |
DocumentModelDetails |
Documentmodelgegevens. Bevat de documenttypen die het model kan analyseren. Nieuw in versie 2023-07-31: de eigenschap expires_on . |
DocumentModelSummary |
Een samenvatting van documentmodelgegevens, inclusief de model-id, de beschrijving en wanneer het model is gemaakt. Nieuw in versie 2023-07-31: de eigenschap expires_on . |
DocumentPage |
Inhouds- en indelingselementen geëxtraheerd uit een pagina van de invoer. Nieuw in versie 2023-07-31: de eigenschappen van streepjescodes en formules . |
DocumentParagraph |
Een alineaobject dat doorgaans bestaat uit aaneengesloten lijnen met gemeenschappelijke uitlijning en afstand. Nieuw in versie 2023-07-31: de rol formulaBlock . |
DocumentSelectionMark |
Een selectiemarkeringsobject dat selectievakjes, keuzerondjes en andere elementen vertegenwoordigt waarmee een selectie wordt aangegeven. |
DocumentSpan |
Aaneengesloten gebied van de inhoud van de eigenschap, opgegeven als een verschuiving en lengte. |
DocumentStyle |
Een object dat geobserveerde tekststijlen vertegenwoordigt. Nieuw in versie 31-07-2023: de eigenschappen similar_font_family, font_style, font_weight, kleur en background_color . |
DocumentTable |
Een tabelobject dat bestaat uit tabelcellen die zijn gerangschikt in een rechthoekige indeling. |
DocumentTableCell |
Een object dat de locatie en inhoud van een tabelcel vertegenwoordigt. |
DocumentTypeDetails |
DocumentTypeDetails vertegenwoordigt een documenttype dat een model kan herkennen, inclusief de velden en typen, en de betrouwbaarheid voor deze velden. |
DocumentWord |
Een woordobject dat bestaat uit een aaneengesloten reeks tekens. Voor niet-spaties gescheiden talen, zoals Chinees, Japans en Koreaans, wordt elk teken weergegeven als een eigen woord. |
FieldData |
Bevat de gegevens voor het formulierveld. Dit omvat de tekst, de locatie van de tekst op het formulier en een verzameling elementen waaruit de tekst bestaat. Nieuw in versie v2.1: FormSelectionMark wordt toegevoegd aan de typen die worden geretourneerd in de lijst met field_elements, ondersteuning voor to_dict- en from_dict-methoden |
FormElement |
Basistype dat eigenschappen voor een formulierelement bevat. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
FormField |
Vertegenwoordigt een veld dat wordt herkend in een invoerformulier. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
FormLine |
Een object dat een geëxtraheerde tekstregel vertegenwoordigt. Nieuw in versie v2.1: eigenschap appearance, ondersteuning voor to_dict en from_dict-methoden |
FormPage |
Vertegenwoordigt een pagina die wordt herkend uit het invoerdocument. Bevat regels, woorden, selectiemarkeringen, tabellen en metagegevens van pagina's. Nieuw in versie v2.1: selection_marks eigenschap, ondersteuning voor to_dict - en from_dict methoden |
FormPageRange |
Het paginabereik op basis van 1 van het formulier. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
FormRecognizerClient |
FormRecognizerClient extraheert informatie uit formulieren en afbeeldingen in gestructureerde gegevens. Het is de interface die kan worden gebruikt voor het analyseren van vooraf samengestelde modellen (ontvangstbewijzen, visitekaartjes, facturen, identiteitsdocumenten), het herkennen van inhoud/indeling in formulieren en het analyseren van aangepaste formulieren van getrainde modellen. Het biedt verschillende methoden op basis van invoer van een URL en invoer uit een stream. Notitie FormRecognizerClient moet worden gebruikt met API-versies <=v2.1. Als u API-versies 2022-08-31 en hoger wilt gebruiken, instantiëert u een DocumentAnalysisClient. |
FormRecognizerError |
Vertegenwoordigt een fout die is opgetreden tijdens het trainen. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
FormSelectionMark |
Informatie over de geëxtraheerde selectiemarkering. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
FormTable |
Informatie over de geëxtraheerde tabel op een pagina. Nieuw in versie v2.1: de eigenschap bounding_box, ondersteuning voor to_dict- en from_dict-methoden |
FormTableCell |
Vertegenwoordigt een cel in een tabel die wordt herkend uit het invoerdocument. Nieuw in versie v2.1: FormSelectionMark wordt toegevoegd aan de typen die worden geretourneerd in de lijst met field_elements, ondersteuning voor to_dict- en from_dict-methoden |
FormTrainingClient |
FormTrainingClient is de Form Recognizer interface die kan worden gebruikt voor het maken en beheren van aangepaste modellen. Het biedt methoden voor het trainen van modellen op de formulieren die u opgeeft, evenals methoden voor het weergeven en verwijderen van modellen, het openen van accounteigenschappen, het kopiëren van modellen naar een andere Form Recognizer resource en het opstellen van modellen uit een verzameling bestaande modellen die zijn getraind met labels. Notitie FormTrainingClient moet worden gebruikt met API-versies <=v2.1. Als u API-versies 2022-08-31 en hoger wilt gebruiken, instantiëert u een DocumentModelAdministrationClient. |
FormWord |
Vertegenwoordigt een woord dat wordt herkend uit het invoerdocument. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
OperationDetails |
OperationDetails bestaat uit informatie over de modelbewerking, inclusief het resultaat of de fout van de bewerking als deze is voltooid. Houd er rekening mee dat bewerkingsgegevens slechts 24 uur behouden blijven. Als de bewerking is geslaagd, kan het model ook worden geopend met behulp van de <xref:azure.ai.formrecognizer.get_document_model>API's , <xref:azure.ai.formrecognizer.list_document_models>, <xref:azure.ai.formrecognizer.get_document_classifier>, <xref:azure.ai.formrecognizer.list_document_classifiers> . Nieuw in versie 2023-07-31: Het documentClassifierBuild-type en het resultaat DocumentClassifierDetails . |
OperationSummary |
Modelbewerkingsgegevens, waaronder het type en de status van de bewerking, het moment waarop deze is gemaakt en meer. Houd er rekening mee dat bewerkingsgegevens slechts 24 uur behouden blijven. Als de bewerking is geslaagd, kan het model worden geopend met behulp van de <xref:azure.ai.formrecognizer.get_document_model>API's , <xref:azure.ai.formrecognizer.list_document_models>, <xref:azure.ai.formrecognizer.get_document_classifier>, <xref:azure.ai.formrecognizer.list_document_classifiers> . Als u wilt weten waarom een bewerking is mislukt, gebruikt <xref:azure.ai.formrecognizer.get_operation> u de operation_id en geeft u deze op. Nieuw in versie 2023-07-31: Het type documentClassifierBuild . |
Point |
De x,y-coördinaat van een punt op een begrenzingsvak of veelhoek. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
QuotaDetails |
Quotum gebruikt, limiet en volgende resetdatum/-tijd. |
RecognizedForm |
Vertegenwoordigt een formulier dat is herkend door een getraind of vooraf samengesteld model. De eigenschap velden bevat de formuliervelden die uit het formulier zijn geëxtraheerd. Tabellen, tekstlijnen/woorden en selectiemarkeringen worden per pagina geëxtraheerd en gevonden in de eigenschap pagina's . Nieuw in versie v2.1: de eigenschappen van form_type_confidence en model_id, ondersteuning voor to_dict- en from_dict-methoden |
ResourceDetails |
Details met betrekking tot de Form Recognizer resource. Nieuw in versie 31-07-2023: de eigenschap neural_document_model_quota . |
TextAppearance |
Een object dat het uiterlijk van de tekstregel vertegenwoordigt. Nieuw in versie v2.1: ondersteuning voor to_dict- en from_dict-methoden |
TrainingDocumentInfo |
Rapport voor een afzonderlijk document dat wordt gebruikt voor het trainen van een aangepast model. Nieuw in versie v2.1: de eigenschap model_id, ondersteuning voor to_dict- en from_dict-methoden |
Enums
AnalysisFeature |
Functies voor documentanalyse die moeten worden ingeschakeld. |
CustomFormModelStatus |
Status die de gereedheid van het model voor gebruik aangeeft. |
DocumentAnalysisApiVersion |
Form Recognizer API-versies die worden ondersteund door DocumentAnalysisClient en DocumentModelAdministrationClient. |
FieldValueType |
Semantisch gegevenstype van de veldwaarde. Nieuw in versie v2.1: de waarden selectionMark en countryRegion |
FormContentType |
Inhoudstype voor uploaden. Nieuw in versie v2.1: ondersteuning voor image/bmp |
FormRecognizerApiVersion |
Form Recognizer API-versies die worden ondersteund door FormRecognizerClient en FormTrainingClient. |
LengthUnit |
De eenheid die wordt gebruikt voor de eigenschappen van het breedte-, hoogte- en begrenzingsvak. Voor afbeeldingen is de eenheid 'pixel'. Voor PDF is de eenheid "inch". |
ModelBuildMode |
De modus die wordt gebruikt bij het bouwen van aangepaste modellen. Voor meer informatie raadpleegt u https://aka.ms/azsdk/formrecognizer/buildmode. |
TrainingStatus |
Status van de trainingsbewerking. |
Azure SDK for Python