Ingestion Jobs - Create
Skapar ett inmatningsjobb med det angivna jobb-ID:t.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2025-01-01-preview
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string url |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Ersätt "aoairesource" med ditt Azure OpenAI-kontonamn). |
job-id
|
path | True |
string |
ID:t för jobbet som ska skapas. |
api-version
|
query | True |
string |
Den begärda API-versionen. |
Begärandehuvud
Name | Obligatorisk | Typ | Description |
---|---|---|---|
mgmt-user-token |
string |
Den token som används för att komma åt arbetsytan (behövs endast för användarberäkningsjobb). |
|
aml-user-token |
string |
Den token som används för att komma åt resurserna i jobbet på arbetsytan (behövs endast för användarberäkningsjobb). |
Begärandetext
Brödtexten i begäran kan vara något av följande:
Name | Description |
---|---|
Ingestion |
|
Ingestion |
IngestionJobSystemCompute
Name | Obligatorisk | Typ | Description |
---|---|---|---|
kind | True |
string:
System |
IngestionJobType |
completionAction |
Slutförandeåtgärden. |
||
dataRefreshIntervalInHours |
integer |
||
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
jobId |
string |
||
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobUserCompute
Name | Obligatorisk | Typ | Description |
---|---|---|---|
kind | True |
string:
User |
IngestionJobType |
workspaceId | True |
string |
|
compute | JobCompute: |
JobCompute |
|
dataRefreshIntervalInHours |
integer |
||
datasource | UserComputeDatasource: |
UserComputeDatasource |
|
jobId |
string |
||
target | TargetIndex: |
TargetIndex |
Svar
Name | Typ | Description |
---|---|---|
200 OK | IngestionJob: |
Framgång |
Other Status Codes |
Ett fel uppstod. |
Säkerhet
api-key
API-nyckelautentisering
Typ:
apiKey
I:
header
OAuth2Auth
OAuth2-autentisering
Typ:
oauth2
Flow:
implicit
Auktoriseringswebbadress:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Omfattningar
Name | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Exempel
Create a system-compute ingestion job |
Create a user-compute ingestion job |
Create a system-compute ingestion job
Exempelbegäran
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-01-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Exempelsvar
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-01-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Create a user-compute ingestion job
Exempelbegäran
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-01-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Exempelsvar
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-01-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Definitioner
Name | Description |
---|---|
Azure |
Azure AI Search Index. |
Chunking |
ChunkingSettings |
Compute |
Beräkningstypen. |
Connection |
Anslutningssträngsanslutning. |
Connection |
Anslutningstypen. |
Cosmos |
CosmosDB-index. |
Crawling |
CrawlingSettings |
Custom |
Anpassad beräkning. |
Deployment |
Relativ distributionsanslutning. |
Endpoint |
Slutpunktsnyckelanslutning. |
Endpoint |
Slutpunktshanterad identitetsanslutning. |
Error |
Fel |
Error |
ErrorCode |
Error |
ErrorResponse |
Generic |
ConnectionEmbeddingSettings |
Ingestion |
Slutförandeåtgärden. |
Ingestion |
|
Ingestion |
IngestionJobType |
Ingestion |
|
Inner |
InnerError |
Inner |
InnerErrorCode |
Pinecone |
Pinecone Index. |
Serverless |
Serverlös beräkning. |
System |
Datakällans typ. |
System |
SystemComputeStorage |
System |
SystemComputeUrl |
Target |
Måltypen. |
User |
UserComputeStorage |
User |
Datakällans typ. |
User |
UserComputeUrl |
Workspace |
Anslutning till AML-arbetsyta. |
Workspace |
WorkspaceConnectionEmbeddingSettings |
AzureAISearchIndex
Azure AI Search Index.
Name | Typ | Description |
---|---|---|
connectionId |
string |
ID:t för anslutningen som pekar på Azure AI Search Index. |
kind |
string:
Azure |
Måltypen. |
ChunkingSettings
ChunkingSettings
Name | Typ | Description |
---|---|---|
maxChunkSizeInTokens |
integer |
ComputeType
Beräkningstypen.
Name | Typ | Description |
---|---|---|
CustomCompute |
string |
Anpassad användarberäkning. |
ServerlessCompute |
string |
Serverlös användarberäkning. |
ConnectionStringConnection
Anslutningssträngsanslutning.
Name | Typ | Description |
---|---|---|
connectionString |
string |
Anslutningssträng |
kind |
string:
Connection |
Anslutningstypen. |
ConnectionType
Anslutningstypen.
Name | Typ | Description |
---|---|---|
ConnectionString |
string |
Anslutningssträng. |
EndpointWithKey |
string |
Slutpunkt och nyckelanslutning. |
EndpointWithManagedIdentity |
string |
Slutpunkt och hanterad identitet. |
RelativeConnection |
string |
Relativ distribution |
WorkspaceConnection |
string |
Anslutning till AML-arbetsyta. |
CosmosDBIndex
CosmosDB-index.
Name | Typ | Description |
---|---|---|
collectionName |
string |
Namnet på cosmos DB-samlingen. |
connectionId |
string |
ID:t för anslutningen som pekar på cosmos DB. |
databaseName |
string |
Namnet på cosmos DB-databasen. |
kind |
string:
CosmosDB |
Måltypen. |
CrawlingSettings
CrawlingSettings
Name | Typ | Description |
---|---|---|
maxCrawlDepth |
integer |
|
maxCrawlTimeInMins |
integer |
|
maxDownloadTimeInMins |
integer |
|
maxFileSize |
integer |
|
maxFiles |
integer |
|
maxRedirects |
integer |
CustomCompute
Anpassad beräkning.
Name | Typ | Description |
---|---|---|
computeId |
string |
ID för den anpassade beräkningen |
kind | string: |
Beräkningstypen. |
DeploymentConnection
Relativ distributionsanslutning.
Name | Typ | Description |
---|---|---|
kind |
string:
Relative |
Anslutningstypen. |
EndpointKeyConnection
Slutpunktsnyckelanslutning.
Name | Typ | Description |
---|---|---|
endpoint |
string |
Slutpunkt |
key |
string |
Nyckel |
kind |
string:
Endpoint |
Anslutningstypen. |
EndpointMIConnection
Slutpunktshanterad identitetsanslutning.
Name | Typ | Description |
---|---|---|
endpoint |
string |
Slutpunkt |
kind |
string:
Endpoint |
Anslutningstypen. |
resourceId |
string |
Resurs-ID |
Error
Fel
Name | Typ | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Felinformationen om den är tillgänglig. |
innererror |
InnerError |
|
message |
string |
Meddelandet om det här felet. |
target |
string |
Platsen där felet inträffade om det var tillgängligt. |
ErrorCode
ErrorCode
Name | Typ | Description |
---|---|---|
conflict |
string |
Den begärda åtgärden står i konflikt med det aktuella resurstillståndet. |
contentFilter |
string |
Bildgenereringen misslyckades till följd av vårt säkerhetssystem. |
fileImportFailed |
string |
Det gick inte att importera filen. |
forbidden |
string |
Åtgärden är förbjuden för den aktuella användaren/API-nyckeln. |
internalFailure |
string |
Internt fel. Försök igen. |
invalidPayload |
string |
Begärandedata är ogiltiga för den här åtgärden. |
itemDoesAlreadyExist |
string |
Objektet finns redan. |
jsonlValidationFailed |
string |
Verifieringen av jsonl-data misslyckades. |
notFound |
string |
Det går inte att hitta resursen. |
quotaExceeded |
string |
Kvoten har överskridits. |
serviceUnavailable |
string |
Tjänsten är inte tillgänglig för närvarande. |
tooManyRequests |
string |
För många begäranden. Försök igen senare. |
unauthorized |
string |
Den aktuella användar-/API-nyckeln har inte behörighet för åtgärden. |
unexpectedEntityState |
string |
Åtgärden kan inte köras i den aktuella resursens tillstånd. |
ErrorResponse
ErrorResponse
Name | Typ | Description |
---|---|---|
error |
Fel |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
Name | Typ | Description |
---|---|---|
connection | BaseConnection: |
BaseConnection |
deploymentName |
string |
|
modelName |
string |
IngestionJobCompletionAction
Slutförandeåtgärden.
Name | Typ | Description |
---|---|---|
cleanUpTempAssets |
string |
Rensar mellanliggande tillgångar som skapats under inmatningsprocessen. |
keepAllAssets |
string |
Rensar inte någon av de mellanliggande tillgångar som skapades under inmatningsprocessen. |
IngestionJobSystemCompute
Name | Typ | Description |
---|---|---|
completionAction |
Slutförandeåtgärden. |
|
dataRefreshIntervalInHours |
integer |
|
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
jobId |
string |
|
kind |
string:
System |
IngestionJobType |
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobType
IngestionJobType
Name | Typ | Description |
---|---|---|
SystemCompute |
string |
Jobb som körs på tjänstägda resurser. |
UserCompute |
string |
Jobb som körs på användarägd arbetsyta. |
IngestionJobUserCompute
Name | Typ | Description |
---|---|---|
compute | JobCompute: |
JobCompute |
dataRefreshIntervalInHours |
integer |
|
datasource | UserComputeDatasource: |
UserComputeDatasource |
jobId |
string |
|
kind |
string:
User |
IngestionJobType |
target | TargetIndex: |
TargetIndex |
workspaceId |
string |
InnerError
InnerError
Name | Typ | Description |
---|---|---|
code |
InnerErrorCode |
|
innererror |
InnerError |
InnerErrorCode
InnerErrorCode
Name | Typ | Description |
---|---|---|
invalidPayload |
string |
Begärandedata är ogiltiga för den här åtgärden. |
PineconeIndex
Pinecone Index.
Name | Typ | Description |
---|---|---|
connectionId |
string |
ID:t för anslutningen som pekar på tallkotten. |
kind |
string:
Pinecone |
Måltypen. |
ServerlessCompute
Serverlös beräkning.
Name | Typ | Description |
---|---|---|
instanceCount |
integer |
Antalet instanser som jobbet ska köras på. |
kind | string: |
Beräkningstypen. |
sku |
string |
SKU-nivå |
SystemComputeDatasourceType
Datakällans typ.
Name | Typ | Description |
---|---|---|
Storage |
string |
Azure Storage-konto. |
Urls |
string |
URL:er. |
SystemComputeStorage
SystemComputeStorage
Name | Typ | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
containernamn |
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Storage |
Datakällans typ. |
SystemComputeUrl
SystemComputeUrl
Name | Typ | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
containernamn |
crawling |
CrawlingSettings |
|
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Datakällans typ. |
urls |
string[] |
TargetType
Måltypen.
Name | Typ | Description |
---|---|---|
AzureAISearch |
string |
Azure AI Search Index. |
CosmosDB |
string |
CosmosDB-index. |
Pinecone |
string |
Pinecone Index. |
UserComputeDataset
UserComputeStorage
Name | Typ | Description |
---|---|---|
chunking |
ChunkingSettings |
|
datasetId |
string |
|
datasetType |
string |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Dataset |
Datakällans typ. |
UserComputeDatasourceType
Datakällans typ.
Name | Typ | Description |
---|---|---|
Dataset |
string |
Datauppsättning för arbetsyta. |
Urls |
string |
URL:er. |
UserComputeUrl
UserComputeUrl
Name | Typ | Description |
---|---|---|
chunking |
ChunkingSettings |
|
crawling |
CrawlingSettings |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Datakällans typ. |
urls |
string[] |
WorkspaceConnection
Anslutning till AML-arbetsyta.
Name | Typ | Description |
---|---|---|
connectionId |
string |
ConnectionId |
kind | string: |
Anslutningstypen. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
Name | Typ | Description |
---|---|---|
connectionId |
string |
|
deploymentName |
string |
|
modelName |
string |