Document Models - Analyze Batch Documents
Analizuje dokumenty wsadowe przy użyciu modelu dokumentów.
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-11-30
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-11-30&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}&output={output}
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
endpoint
|
path | True |
string uri |
Punkt końcowy usługi Analizy dokumentów. |
model
|
path | True |
string |
Unikatowa nazwa modelu dokumentu. Wzorzec wyrażenia regularnego: |
api-version
|
query | True |
string |
Wersja interfejsu API do użycia dla tej operacji. |
features
|
query |
Lista opcjonalnych funkcji analizy. |
||
locale
|
query |
string |
Wskazówka ustawień regionalnych na potrzeby rozpoznawania tekstu i analizy dokumentów. Wartość może zawierać tylko kod języka (np. "en", "fr") lub tag języka BCP 47 (np. "en-US"). |
|
output
|
query |
Dodatkowe dane wyjściowe do wygenerowania podczas analizy. |
||
output
|
query |
Format zawartości najwyższego poziomu wyników analizy. |
||
pages
|
query |
string |
1 numery stron do przeanalizowania. Ex. "1-3,5,7-9" Wzorzec wyrażenia regularnego: |
|
query
|
query |
string[] |
Lista dodatkowych pól do wyodrębnienia. Ex. "NumberOfGuests,StoreNumber" |
|
string
|
query |
Metoda używana do obliczania przesunięcia i długości ciągu. |
Treść żądania
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
resultContainerUrl | True |
string |
Adres URL kontenera usługi Azure Blob Storage, w którym będą przechowywane pliki wyników analizy. |
azureBlobFileListSource |
Lista plików usługi Azure Blob Storage określająca dokumenty wsadowe. Należy określić element azureBlobSource lub azureBlobFileListSource. |
||
azureBlobSource |
Lokalizacja usługi Azure Blob Storage zawierająca dokumenty wsadowe. Należy określić element azureBlobSource lub azureBlobFileListSource. |
||
overwriteExisting |
boolean |
Czy zastąpić istniejące pliki wyników analizy? |
|
resultPrefix |
string |
Prefiks nazwy obiektu blob plików wynikowych. |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
202 Accepted |
Żądanie zostało zaakceptowane do przetwarzania, ale przetwarzanie nie zostało jeszcze ukończone. Nagłówki
|
|
Other Status Codes |
Nieoczekiwana odpowiedź na błąd. |
Zabezpieczenia
Ocp-Apim-Subscription-Key
Typ:
apiKey
W:
header
OAuth2Auth
Typ:
oauth2
Flow:
accessCode
Adres URL autoryzacji:
https://login.microsoftonline.com/common/oauth2/authorize
Adres URL tokenu:
https://login.microsoftonline.com/common/oauth2/token
Zakresy
Nazwa | Opis |
---|---|
https://cognitiveservices.azure.com/.default |
Przykłady
Analyze Batch Documents
Przykładowe żądanie
POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyzeBatch?api-version=2024-11-30&pages=1-5&locale=en-US&stringIndexType=textElements
{
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"prefix": "trainingDocs/"
},
"resultContainerUrl": "https://myStorageAccount.blob.core.windows.net/myOutputContainer?mySasToken",
"resultPrefix": "trainingDocsResult/",
"overwriteExisting": true
}
Przykładowa odpowiedź
Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeBatchResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview
Definicje
Nazwa | Opis |
---|---|
Analyze |
Parametry analizy dokumentów wsadowych. |
Analyze |
Dodatkowe dane wyjściowe do wygenerowania podczas analizy. |
Azure |
Zawartość usługi Azure Blob Storage. |
Azure |
Lista plików w usłudze Azure Blob Storage. |
Document |
Funkcje analizy dokumentów do włączenia. |
Document |
Format zawartości w przeanalizowanym wyniku. |
Document |
Obiekt błędu. |
Document |
Błąd obiektu odpowiedzi. |
Document |
Obiekt zawierający bardziej szczegółowe informacje o błędzie. |
String |
Metoda używana do obliczania przesunięcia i długości ciągu. |
AnalyzeBatchDocumentsRequest
Parametry analizy dokumentów wsadowych.
Nazwa | Typ | Domyślna wartość | Opis |
---|---|---|---|
azureBlobFileListSource |
Lista plików usługi Azure Blob Storage określająca dokumenty wsadowe. Należy określić element azureBlobSource lub azureBlobFileListSource. |
||
azureBlobSource |
Lokalizacja usługi Azure Blob Storage zawierająca dokumenty wsadowe. Należy określić element azureBlobSource lub azureBlobFileListSource. |
||
overwriteExisting |
boolean |
False |
Czy zastąpić istniejące pliki wyników analizy? |
resultContainerUrl |
string |
Adres URL kontenera usługi Azure Blob Storage, w którym będą przechowywane pliki wyników analizy. |
|
resultPrefix |
string |
Prefiks nazwy obiektu blob plików wynikowych. |
AnalyzeOutputOption
Dodatkowe dane wyjściowe do wygenerowania podczas analizy.
Nazwa | Typ | Opis |
---|---|---|
figures |
string |
Generowanie przyciętych obrazów wykrytych liczb. |
string |
Generowanie danych wyjściowych pliku PDF z możliwością wyszukiwania. |
AzureBlobContentSource
Zawartość usługi Azure Blob Storage.
Nazwa | Typ | Opis |
---|---|---|
containerUrl |
string |
Adres URL kontenera usługi Azure Blob Storage. |
prefix |
string |
Prefiks nazwy obiektu blob. |
AzureBlobFileListContentSource
Lista plików w usłudze Azure Blob Storage.
Nazwa | Typ | Opis |
---|---|---|
containerUrl |
string |
Adres URL kontenera usługi Azure Blob Storage. |
fileList |
string |
Ścieżka do pliku JSONL w kontenerze określającym podzbiór dokumentów. |
DocumentAnalysisFeature
Funkcje analizy dokumentów do włączenia.
Nazwa | Typ | Opis |
---|---|---|
barcodes |
string |
Włącz wykrywanie kodów kreskowych w dokumencie. |
formulas |
string |
Włącz wykrywanie wyrażeń matematycznych w dokumencie. |
keyValuePairs |
string |
Włącz wykrywanie ogólnych par wartości klucza (pól formularza) w dokumencie. |
languages |
string |
Włącz wykrywanie języka zawartości tekstowej. |
ocrHighResolution |
string |
Wykonaj funkcję OCR w wyższej rozdzielczości, aby obsługiwać dokumenty z precyzyjnym drukowaniem. |
queryFields |
string |
Włącz wyodrębnianie dodatkowych pól za pomocą parametru zapytania QueryFields. |
styleFont |
string |
Włącz rozpoznawanie różnych stylów czcionek. |
DocumentContentFormat
Format zawartości w przeanalizowanym wyniku.
Nazwa | Typ | Opis |
---|---|---|
markdown |
string |
Reprezentacja markdown zawartości dokumentu z nagłówkami sekcji, tabelami itp. |
text |
string |
Reprezentacja zwykłego tekstu zawartości dokumentu bez formatowania. |
DocumentIntelligenceError
Obiekt błędu.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
details |
Tablica szczegółów dotyczących określonych błędów, które doprowadziły do tego zgłoszonego błędu. |
|
innererror |
Obiekt zawierający bardziej szczegółowe informacje niż bieżący obiekt o błędzie. |
|
message |
string |
Czytelna dla człowieka reprezentacja błędu. |
target |
string |
Element docelowy błędu. |
DocumentIntelligenceErrorResponse
Błąd obiektu odpowiedzi.
Nazwa | Typ | Opis |
---|---|---|
error |
Informacje o błędzie. |
DocumentIntelligenceInnerError
Obiekt zawierający bardziej szczegółowe informacje o błędzie.
Nazwa | Typ | Opis |
---|---|---|
code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
innererror |
Błąd wewnętrzny. |
|
message |
string |
Czytelna dla człowieka reprezentacja błędu. |
StringIndexType
Metoda używana do obliczania przesunięcia i długości ciągu.
Nazwa | Typ | Opis |
---|---|---|
textElements |
string |
Postrzegany przez użytkownika znak wyświetlania lub klaster grafu, zgodnie z definicją w standardze Unicode 8.0.0. |
unicodeCodePoint |
string |
Jednostka znaku reprezentowana przez pojedynczy punkt kodu Unicode. Używany przez język Python 3. |
utf16CodeUnit |
string |
Jednostka znaków reprezentowana przez 16-bitową jednostkę kodu Unicode. Używane przez języki JavaScript, Java i .NET. |