Vaardigheid documentindeling

Artikel
11/23/2024

Notitie

Deze functie is momenteel beschikbaar als openbare preview-versie. Deze preview wordt aangeboden zonder service level agreement en wordt niet aanbevolen voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.

De vaardigheid Documentindeling analyseert een document om interessegebieden en hun onderlinge relaties te extraheren om een syntactische weergave van het document te produceren in Markdown-indeling. Deze vaardigheid maakt gebruik van het Document Intelligence-indelingsmodel dat is opgegeven in Azure AI Document Intelligence.

Dit artikel is de referentiedocumentatie voor de vaardigheid Documentindeling. Zie Structuurbewust segmenteren en vectoriseren voor gebruiksinformatie.

De vaardigheid Documentindeling roept de openbare preview-versie van Document Intelligence 2024-07-31-preview aan. Deze is momenteel alleen beschikbaar in de volgende Azure-regio's:

VS - oost
VS - west 2
Europa -west
VS - noord-centraal

Ondersteunde bestandsindelingen zijn onder andere:

PDF
. JPEG
.JPG
.PNG
.BMP
. TIFF
.DOCX
. XLSX
.PPTX
.HTML

Notitie

Deze vaardigheid is gebonden aan Azure AI-services en vereist een factureerbare resource voor transacties die groter zijn dan 20 documenten per indexeerfunctie per dag. Voor de uitvoering van ingebouwde vaardigheden worden kosten in rekening gebracht voor de bestaande betalen per gebruik-prijs van Azure AI-services.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Gegevenslimieten

Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een gratis abonnement worden alleen de eerste twee pagina's verwerkt).
Zelfs als de bestandsgrootte voor het analyseren van documenten 500 MB is voor de betaalde laag S0 (Azure AI Document Intelligence) en 4 MB voor de gratis laag van Azure AI Document Intelligence (F0), is indexering onderhevig aan de indexeerfuncties van uw zoekservicelaag.
De afmetingen van de afbeelding moeten tussen 50 pixels x 50 pixels of 10.000 pixels x 10.000 pixels zijn.
Als uw PDF-bestanden zijn vergrendeld met een wachtwoord, verwijdert u de vergrendeling voordat u de indexeerfunctie uitvoert.

Ondersteunde talen

Raadpleeg de ondersteunde talen van het Azure AI Document Intelligence-indelingsmodel voor afgedrukte tekst.

Beperkingen

Tijdens de openbare preview heeft deze vaardigheid de volgende beperkingen:

De vaardigheid kan geen afbeeldingen extraheren die zijn ingesloten in documenten.
Paginanummers worden niet opgenomen in de gegenereerde uitvoer.
De vaardigheid is niet geschikt voor grote documenten waarvoor meer dan 5 minuten verwerking nodig is in het AI Document Intelligence-indelingsmodel. Er treedt een time-out op voor de vaardigheid, maar de kosten zijn nog steeds van toepassing op de resource voor meerdere services van AI Services als deze is gekoppeld aan de vaardighedenset voor factureringsdoeleinden. Zorg ervoor dat documenten zijn geoptimaliseerd om binnen de verwerkingslimieten te blijven om onnodige kosten te voorkomen.

Vaardigheidsparameters

Parameters zijn hoofdlettergevoelig.

Parameternaam	Toegestane waarden	Beschrijving
`outputMode`	`oneToMany`	Bepaalt de kardinaliteit van de uitvoer die door de vaardigheid wordt geproduceerd.
`markdownHeaderDepth`	`h1`, , `h2h3`, `h4`, , , `h5h6(default)`	Deze parameter beschrijft het diepste nestniveau dat moet worden overwogen. Als de markdownHeaderDepth bijvoorbeeld wordt aangeduid als 'h3' als een markdown-sectie die dieper is dan h3 (dat wil gezegd #### en dieper) wordt beschouwd als 'inhoud' die moet worden toegevoegd aan het bovenliggende niveau.

Invoer van vaardigheden

Invoernaam	Beschrijving
`file_data`	Het bestand waaruit inhoud moet worden geëxtraheerd.

De invoer 'file_data' moet een object zijn dat is gedefinieerd als:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

U kunt deze ook definiëren als:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Het bestandsverwijzingsobject kan op een van de volgende manieren worden gegenereerd:

Stel de parameter in de definitie van de allowSkillsetToReadFileData indexeerfunctie in op waar. Met deze instelling maakt u een pad /document/file_data dat een object is dat de oorspronkelijke bestandsgegevens vertegenwoordigt die zijn gedownload uit uw blobgegevensbron. Deze parameter is alleen van toepassing op bestanden in Azure Blob Storage.
Een aangepaste vaardigheid die een JSON-object retourneert dat voorziet $typein , dataof url en sastoken. De $type parameter moet worden ingesteld op file, en data moet de base 64-gecodeerde bytematrix van de bestandsinhoud zijn. De url parameter moet een geldige URL zijn met toegang voor het downloaden van het bestand op die locatie.

Uitvoer van vaardigheden

Uitvoernaam	Beschrijving
`markdown_document`	Een verzameling 'secties'-objecten, die elke afzonderlijke sectie in het Markdown-document vertegenwoordigen.

Voorbeelddefinitie

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentLayoutAnalysisSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Voorbeelduitvoer

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

De waarde van de markdownHeaderDepth besturingselementen bepaalt het aantal sleutels in de woordenlijst 'secties'. In de voorbeelddefinitie van de vaardigheid, omdat het markdownHeaderDepth 'h3' is, zijn er drie sleutels in de woordenlijst 'secties': h1, h2, h3.

Delen via