Ingestion Jobs - Create
Tworzy zadanie pozyskiwania o określonym identyfikatorze zadania.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2025-01-01-preview
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
endpoint
|
path | True |
string url |
Obsługiwane punkty końcowe usług Cognitive Services (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp ciąg "aoairesource" nazwą konta usługi Azure OpenAI. |
job-id
|
path | True |
string |
Identyfikator zadania, które zostanie utworzone. |
api-version
|
query | True |
string |
Żądana wersja interfejsu API. |
Nagłówek żądania
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
mgmt-user-token |
string |
Token używany do uzyskiwania dostępu do obszaru roboczego (wymagany tylko w przypadku zadań obliczeniowych użytkownika). |
|
aml-user-token |
string |
Token używany do uzyskiwania dostępu do zasobów w ramach zadania w obszarze roboczym (wymagany tylko w przypadku zadań obliczeniowych użytkownika). |
Treść żądania
Treść żądania może być jedną z następujących:
Nazwa | Opis |
---|---|
Ingestion |
|
Ingestion |
IngestionJobSystemCompute
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
kind | True |
string:
System |
IngestionJobType |
completionAction |
Akcja ukończenia. |
||
dataRefreshIntervalInHours |
integer |
||
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
jobId |
string |
||
searchServiceConnection | BaseConnection: |
Połączenie podstawowe |
IngestionJobUserCompute
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
kind | True |
string:
User |
IngestionJobType |
workspaceId | True |
string |
|
compute | JobCompute: |
ZadanieCompute |
|
dataRefreshIntervalInHours |
integer |
||
datasource | UserComputeDatasource: |
UserComputeDatasource |
|
jobId |
string |
||
target | TargetIndex: |
TargetIndex |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
200 OK | IngestionJob: |
Sukces |
Other Status Codes |
Wystąpił błąd. |
Zabezpieczenia
api-key
Uwierzytelnianie klucza interfejsu API
Typ:
apiKey
W:
header
OAuth2Auth
Uwierzytelnianie OAuth2
Typ:
oauth2
Flow:
implicit
Adres URL autoryzacji:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Zakresy
Nazwa | Opis |
---|---|
https://cognitiveservices.azure.com/.default |
Przykłady
Create a system-compute ingestion job |
Create a user-compute ingestion job |
Create a system-compute ingestion job
Przykładowe żądanie
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-01-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Przykładowa odpowiedź
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-01-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Create a user-compute ingestion job
Przykładowe żądanie
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-01-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Przykładowa odpowiedź
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-01-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Definicje
Nazwa | Opis |
---|---|
Azure |
Indeks usługi Azure AI Search. |
Chunking |
ChunkingSettings |
Compute |
Typ obliczeniowy. |
Connection |
Połączenie parametrów połączenia. |
Connection |
Typ połączenia. |
Cosmos |
Indeks usługi CosmosDB. |
Crawling |
PrzeszukiwanieUstawienia |
Custom |
Niestandardowe obliczenia. |
Deployment |
Względne połączenie wdrożenia. |
Endpoint |
Połączenie klucza punktu końcowego. |
Endpoint |
Połączenie tożsamości zarządzanej punktu końcowego. |
Error |
Błąd |
Error |
Kod błędu |
Error |
ErrorResponse |
Generic |
ConnectionEmbeddingSettings |
Ingestion |
Akcja ukończenia. |
Ingestion |
|
Ingestion |
IngestionJobType |
Ingestion |
|
Inner |
InnerError |
Inner |
InnerErrorCode |
Pinecone |
Indeks Pinecone. |
Serverless |
Bezserwerowe obliczenia. |
System |
Typ źródła danych. |
System |
SystemComputeStorage |
System |
SystemComputeUrl |
Target |
Typ docelowy. |
User |
UserComputeStorage |
User |
Typ źródła danych. |
User |
UserComputeUrl |
Workspace |
Połączenie obszaru roboczego AML. |
Workspace |
WorkspaceConnectionEmbeddingSettings |
AzureAISearchIndex
Indeks usługi Azure AI Search.
Nazwa | Typ | Opis |
---|---|---|
connectionId |
string |
Identyfikator połączenia wskazującego indeks usługi Azure AI Search. |
kind |
string:
Azure |
Typ docelowy. |
ChunkingSettings
ChunkingSettings
Nazwa | Typ | Opis |
---|---|---|
maxChunkSizeInTokens |
integer |
ComputeType
Typ obliczeniowy.
Nazwa | Typ | Opis |
---|---|---|
CustomCompute |
string |
Niestandardowe obliczenia użytkownika. |
ServerlessCompute |
string |
Obliczenia użytkownika bezserwerowego. |
ConnectionStringConnection
Połączenie parametrów połączenia.
Nazwa | Typ | Opis |
---|---|---|
connectionString |
string |
Parametry połączenia |
kind |
string:
Connection |
Typ połączenia. |
ConnectionType
Typ połączenia.
Nazwa | Typ | Opis |
---|---|---|
ConnectionString |
string |
Parametry połączenia. |
EndpointWithKey |
string |
Połączenie punktów końcowych i kluczy. |
EndpointWithManagedIdentity |
string |
Punkt końcowy i tożsamość zarządzana. |
RelativeConnection |
string |
Wdrożenie względne |
WorkspaceConnection |
string |
Połączenie obszaru roboczego AML. |
CosmosDBIndex
Indeks usługi CosmosDB.
Nazwa | Typ | Opis |
---|---|---|
collectionName |
string |
Nazwa kolekcji cosmos DB. |
connectionId |
string |
Identyfikator połączenia wskazującego usługę Cosmos DB. |
databaseName |
string |
Nazwa bazy danych cosmos DB. |
kind |
string:
CosmosDB |
Typ docelowy. |
CrawlingSettings
PrzeszukiwanieUstawienia
Nazwa | Typ | Opis |
---|---|---|
maxCrawlDepth |
integer |
|
maxCrawlTimeInMins |
integer |
|
maxDownloadTimeInMins |
integer |
|
maxFileSize |
integer |
|
maxFiles |
integer |
|
maxRedirects |
integer |
CustomCompute
Niestandardowe obliczenia.
Nazwa | Typ | Opis |
---|---|---|
computeId |
string |
Identyfikator obliczeń niestandardowych |
kind | string: |
Typ obliczeniowy. |
DeploymentConnection
Względne połączenie wdrożenia.
Nazwa | Typ | Opis |
---|---|---|
kind |
string:
Relative |
Typ połączenia. |
EndpointKeyConnection
Połączenie klucza punktu końcowego.
Nazwa | Typ | Opis |
---|---|---|
endpoint |
string |
Punkt końcowy |
key |
string |
Klucz |
kind |
string:
Endpoint |
Typ połączenia. |
EndpointMIConnection
Połączenie tożsamości zarządzanej punktu końcowego.
Nazwa | Typ | Opis |
---|---|---|
endpoint |
string |
Punkt końcowy |
kind |
string:
Endpoint |
Typ połączenia. |
resourceId |
string |
Identyfikator zasobu |
Error
Błąd
Nazwa | Typ | Opis |
---|---|---|
code |
Kod błędu |
|
details |
Error[] |
Szczegóły błędu, jeśli są dostępne. |
innererror |
InnerError |
|
message |
string |
Komunikat o tym błędzie. |
target |
string |
Lokalizacja, w której wystąpił błąd, jeśli jest dostępny. |
ErrorCode
Kod błędu
Nazwa | Typ | Opis |
---|---|---|
conflict |
string |
Żądana operacja powoduje konflikt z bieżącym stanem zasobu. |
contentFilter |
string |
Generowanie obrazu nie powiodło się w wyniku naszego systemu bezpieczeństwa. |
fileImportFailed |
string |
Importowanie pliku nie powiodło się. |
forbidden |
string |
Operacja jest zabroniona dla bieżącego klucza użytkownika/interfejsu API. |
internalFailure |
string |
Błąd wewnętrzny. Ponów próbę. |
invalidPayload |
string |
Dane żądania są nieprawidłowe dla tej operacji. |
itemDoesAlreadyExist |
string |
Element już istnieje. |
jsonlValidationFailed |
string |
Sprawdzanie poprawności danych jsonl nie powiodło się. |
notFound |
string |
Nie można odnaleźć zasobu. |
quotaExceeded |
string |
Przekroczono limit przydziału. |
serviceUnavailable |
string |
Usługa jest obecnie niedostępna. |
tooManyRequests |
string |
Zbyt wiele żądań. Spróbuj ponownie później. |
unauthorized |
string |
Bieżący klucz użytkownika/interfejsu API nie jest autoryzowany dla operacji. |
unexpectedEntityState |
string |
Nie można wykonać operacji w stanie bieżącego zasobu. |
ErrorResponse
ErrorResponse
Nazwa | Typ | Opis |
---|---|---|
error |
Błąd |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
Nazwa | Typ | Opis |
---|---|---|
connection | BaseConnection: |
Połączenie podstawowe |
deploymentName |
string |
|
modelName |
string |
IngestionJobCompletionAction
Akcja ukończenia.
Nazwa | Typ | Opis |
---|---|---|
cleanUpTempAssets |
string |
Czyści pośrednie zasoby utworzone podczas procesu pozyskiwania. |
keepAllAssets |
string |
Nie wyczyści żadnego z zasobów pośrednich utworzonych podczas procesu pozyskiwania. |
IngestionJobSystemCompute
Nazwa | Typ | Opis |
---|---|---|
completionAction |
Akcja ukończenia. |
|
dataRefreshIntervalInHours |
integer |
|
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
jobId |
string |
|
kind |
string:
System |
IngestionJobType |
searchServiceConnection | BaseConnection: |
Połączenie podstawowe |
IngestionJobType
IngestionJobType
Nazwa | Typ | Opis |
---|---|---|
SystemCompute |
string |
Zadania uruchamiane w zasobach należących do usługi. |
UserCompute |
string |
Zadania uruchamiane w obszarze roboczym należącym do użytkownika. |
IngestionJobUserCompute
Nazwa | Typ | Opis |
---|---|---|
compute | JobCompute: |
ZadanieCompute |
dataRefreshIntervalInHours |
integer |
|
datasource | UserComputeDatasource: |
UserComputeDatasource |
jobId |
string |
|
kind |
string:
User |
IngestionJobType |
target | TargetIndex: |
TargetIndex |
workspaceId |
string |
InnerError
InnerError
Nazwa | Typ | Opis |
---|---|---|
code |
InnerErrorCode |
|
innererror |
InnerError |
InnerErrorCode
InnerErrorCode
Nazwa | Typ | Opis |
---|---|---|
invalidPayload |
string |
Dane żądania są nieprawidłowe dla tej operacji. |
PineconeIndex
Indeks Pinecone.
Nazwa | Typ | Opis |
---|---|---|
connectionId |
string |
Identyfikator połączenia wskazującego na pinecone. |
kind |
string:
Pinecone |
Typ docelowy. |
ServerlessCompute
Bezserwerowe obliczenia.
Nazwa | Typ | Opis |
---|---|---|
instanceCount |
integer |
Liczba wystąpień do uruchomienia zadania. |
kind | string: |
Typ obliczeniowy. |
sku |
string |
Poziom jednostki SKU |
SystemComputeDatasourceType
Typ źródła danych.
Nazwa | Typ | Opis |
---|---|---|
Storage |
string |
Konto usługi Azure Storage. |
Urls |
string |
Adresy URL. |
SystemComputeStorage
SystemComputeStorage
Nazwa | Typ | Opis |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
Połączenie podstawowe |
containerName |
string |
nazwa kontenera |
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Storage |
Typ źródła danych. |
SystemComputeUrl
SystemComputeUrl
Nazwa | Typ | Opis |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
Połączenie podstawowe |
containerName |
string |
nazwa kontenera |
crawling |
PrzeszukiwanieUstawienia |
|
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Typ źródła danych. |
urls |
string[] |
TargetType
Typ docelowy.
Nazwa | Typ | Opis |
---|---|---|
AzureAISearch |
string |
Indeks usługi Azure AI Search. |
CosmosDB |
string |
Indeks usługi CosmosDB. |
Pinecone |
string |
Indeks Pinecone. |
UserComputeDataset
UserComputeStorage
Nazwa | Typ | Opis |
---|---|---|
chunking |
ChunkingSettings |
|
datasetId |
string |
|
datasetType |
string |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Dataset |
Typ źródła danych. |
UserComputeDatasourceType
Typ źródła danych.
Nazwa | Typ | Opis |
---|---|---|
Dataset |
string |
Zestaw danych obszaru roboczego. |
Urls |
string |
Adresy URL. |
UserComputeUrl
UserComputeUrl
Nazwa | Typ | Opis |
---|---|---|
chunking |
ChunkingSettings |
|
crawling |
PrzeszukiwanieUstawienia |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Typ źródła danych. |
urls |
string[] |
WorkspaceConnection
Połączenie obszaru roboczego AML.
Nazwa | Typ | Opis |
---|---|---|
connectionId |
string |
Identyfikator połączenia |
kind | string: |
Typ połączenia. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
Nazwa | Typ | Opis |
---|---|---|
connectionId |
string |
|
deploymentName |
string |
|
modelName |
string |