Umiejętność układu dokumentu

Artykuł
02/13/2025

Uwaga

Ta funkcja jest obecnie w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie jest zalecana w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.

Umiejętność układu dokumentu analizuje dokument w celu wyodrębnienia interesujących regionów i relacji między nimi w celu utworzenia składniowej reprezentacji dokumentu w formacie Markdown. Ta umiejętność korzysta z modelu układu analizy dokumentów udostępnionego w usłudze Azure AI Document Intelligence.

Ten artykuł zawiera dokumentację referencyjną umiejętności układu dokumentu. Aby uzyskać informacje o użyciu, zobacz Fragmentowanie i wektoryzacja z obsługą struktury.

Umiejętność układu dokumentu wywołuje publiczną wersję zapoznawczą analizy dokumentów w wersji 2024-07-31-preview. Jest ona obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:

Wschodnie stany USA
Zachodnie stany USA 2
West Europe
Północno-środkowe stany USA

Obsługiwane formaty plików obejmują:

.PDF
. JPEG
.JPG
.PNG
.BMP
. TIFF
.DOCX
. XLSX
.PPTX
HTML

Uwaga

Ta umiejętność jest powiązana z usługami azure AI i wymaga rozliczanego zasobu dla transakcji, które przekraczają 20 dokumentów na indeksator dziennie. Wykonanie wbudowanych umiejętności jest naliczane za istniejące usługi Azure AI z płatnością zgodnie z rzeczywistym użyciem.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Limity danych

W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Nawet jeśli rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej analizy dokumentów sztucznej inteligencji (S0) platformy Azure i 4 MB dla warstwy Bezpłatna analiza dokumentów usługi Azure AI (F0), indeksowanie podlega limitom indeksatora warstwy usługi wyszukiwania.
Wymiary obrazu muszą mieć długość od 50 pikseli x 50 pikseli lub 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, usuń blokadę przed uruchomieniem indeksatora.

Obsługiwane języki

Zapoznaj się z modelem układu analizy dokumentów usługi Azure AI obsługiwanymi językami dla tekstu drukowanego.

Ograniczenia

W publicznej wersji zapoznawczej ta umiejętność ma następujące ograniczenia:

Umiejętności nie mogą wyodrębniać obrazów osadzonych w dokumentach.
Numery stron nie są uwzględniane w wygenerowanych danych wyjściowych.
Umiejętność nie jest odpowiednia dla dużych dokumentów wymagających więcej niż 5 minut przetwarzania w modelu układu analizy dokumentów sztucznej inteligencji. Upłynął limit czasu umiejętności, ale opłaty będą nadal stosowane do zasobu usług wielosługowych usług sztucznej inteligencji, jeśli jest on dołączony do zestawu umiejętności na potrzeby rozliczeń. Upewnij się, że dokumenty są zoptymalizowane pod kątem pozostania w granicach przetwarzania, aby uniknąć niepotrzebnych kosztów.

Parametry umiejętności

W parametrach jest rozróżniana wielkość liter.

Nazwa parametru	Dozwolone wartości	opis
`outputMode`	`oneToMany`	Steruje kardynalnością danych wyjściowych generowanych przez umiejętności.
`markdownHeaderDepth`	`h1`, , `h2`, `h3`, `h4`, , `h5h6(default)`	Ten parametr opisuje najgłębszy poziom zagnieżdżania, który należy wziąć pod uwagę. Jeśli na przykład znacznik markdownHeaderDepth jest wskazywany jako "h3" każda sekcja języka Markdown, która jest głębsza niż h3 (czyli #### i głębsza) jest uważana za "zawartość", która musi zostać dodana do dowolnego poziomu, na jakim znajduje się jego element nadrzędny.

Dane wejściowe umiejętności

Nazwa danych wejściowych	opis
`file_data`	Plik, z którego należy wyodrębnić zawartość.

Dane wejściowe "file_data" muszą być obiektem zdefiniowanym jako:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Alternatywnie można go zdefiniować jako:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Obiekt odwołania do pliku można wygenerować na jeden z następujących sposobów:

Ustawienie parametru allowSkillsetToReadFileData w definicji indeksatora na wartość true. To ustawienie tworzy ścieżkę /document/file_data , która jest obiektem reprezentującym oryginalne dane pliku pobrane ze źródła danych obiektu blob. Ten parametr dotyczy tylko plików w usłudze Azure Blob Storage.
Posiadanie niestandardowej umiejętności zwracającej zdefiniowany obiekt JSON, który udostępnia $type, datalub url i sastoken. Parametr $type musi być ustawiony na file, i data musi być podstawową tablicą bajtów zakodowaną w formacie 64 zawartości pliku. Parametr url musi być prawidłowym adresem URL z dostępem do pobierania pliku w tej lokalizacji.

Dane wyjściowe umiejętności

Nazwa danych wyjściowych	opis
`markdown_document`	Kolekcja obiektów "sekcje", które reprezentują poszczególne sekcje w dokumencie Markdown.

Przykładowa definicja

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Przykładowe dane wyjściowe

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Wartość kontrolki markdownHeaderDepth określa liczbę kluczy w słowniku "sekcje". W przykładowej definicji umiejętności, ponieważ markdownHeaderDepth jest to "h3", w słowniku "sekcje" znajdują się trzy klucze: h1, h2, h3.

Udostępnij za pośrednictwem