Ingestion Jobs - Create
Crée un travail d’ingestion avec l’ID de travail spécifié.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2025-02-01-preview
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string url |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre compte Azure OpenAI). |
job-id
|
path | True |
string |
ID du travail qui sera créé. |
api-version
|
query | True |
string |
Version de l’API demandée. |
En-tête de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
mgmt-user-token |
string |
Jeton utilisé pour accéder à l’espace de travail (nécessaire uniquement pour les travaux de calcul utilisateur). |
|
aml-user-token |
string |
Jeton utilisé pour accéder aux ressources au sein du travail dans l’espace de travail (nécessaire uniquement pour les travaux de calcul utilisateur). |
Corps de la demande
Le corps de la requête peut être l’un des suivants :
Nom | Description |
---|---|
Ingestion |
|
Ingestion |
IngestionJobSystemCompute
Nom | Obligatoire | Type | Description |
---|---|---|---|
kind | True |
string:
System |
IngestionJobType |
completionAction |
Action d’achèvement. |
||
dataRefreshIntervalInHours |
integer |
||
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
jobId |
string |
||
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobUserCompute
Nom | Obligatoire | Type | Description |
---|---|---|---|
kind | True |
string:
User |
IngestionJobType |
workspaceId | True |
string |
|
compute | JobCompute: |
JobCompute |
|
dataRefreshIntervalInHours |
integer |
||
datasource | UserComputeDatasource: |
UserComputeDatasource |
|
jobId |
string |
||
target | TargetIndex: |
TargetIndex |
Réponses
Nom | Type | Description |
---|---|---|
200 OK | IngestionJob: |
Succès |
Other Status Codes |
Une erreur s’est produite. |
Sécurité
api-key
Authentification par clé API
Type:
apiKey
Dans:
header
OAuth2Auth
Authentification OAuth2
Type:
oauth2
Flux:
implicit
URL d’autorisation:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Étendues
Nom | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Exemples
Create a system-compute ingestion job |
Create a user-compute ingestion job |
Create a system-compute ingestion job
Exemple de requête
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-02-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Exemple de réponse
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-02-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Create a user-compute ingestion job
Exemple de requête
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-02-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Exemple de réponse
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-02-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Définitions
Nom | Description |
---|---|
Azure |
Index Recherche d’IA Azure. |
Chunking |
ChunkingSettings |
Compute |
Type de calcul. |
Connection |
Connexion à la chaîne de connexion. |
Connection |
Type de connexion. |
Cosmos |
Index CosmosDB. |
Crawling |
CrawlingSettings |
Custom |
Calcul personnalisé. |
Deployment |
Connexion de déploiement relative. |
Endpoint |
Connexion de clé de point de terminaison. |
Endpoint |
Connexion d’identité managée de point de terminaison. |
Error |
Erreur |
Error |
ErrorCode |
Error |
ErrorResponse |
Generic |
ConnectionEmbeddingSettings |
Ingestion |
Action d’achèvement. |
Ingestion |
|
Ingestion |
IngestionJobType |
Ingestion |
|
Inner |
InnerError |
Inner |
InnerErrorCode |
Pinecone |
Pinecone Index. |
Serverless |
Calcul serverless. |
System |
Type de source de données. |
System |
SystemComputeStorage |
System |
SystemComputeUrl |
Target |
Type cible. |
User |
UserComputeStorage |
User |
Type de source de données. |
User |
UserComputeUrl |
Workspace |
Connexion de l’espace de travail AML. |
Workspace |
WorkspaceConnectionEmbeddingSettings |
AzureAISearchIndex
Index Recherche d’IA Azure.
Nom | Type | Description |
---|---|---|
connectionId |
string |
ID de la connexion pointant vers l’index Recherche d’IA Azure. |
kind |
string:
Azure |
Type cible. |
ChunkingSettings
ChunkingSettings
Nom | Type | Description |
---|---|---|
maxChunkSizeInTokens |
integer |
ComputeType
Type de calcul.
Valeur | Description |
---|---|
CustomCompute |
Calcul utilisateur personnalisé. |
ServerlessCompute |
Calcul utilisateur serverless. |
ConnectionStringConnection
Connexion à la chaîne de connexion.
Nom | Type | Description |
---|---|---|
connectionString |
string |
Chaîne de connexion |
kind |
string:
Connection |
Type de connexion. |
ConnectionType
Type de connexion.
Valeur | Description |
---|---|
ConnectionString |
Chaîne de connexion. |
EndpointWithKey |
Connexion de point de terminaison et de clé. |
EndpointWithManagedIdentity |
Point de terminaison et identité managée. |
RelativeConnection |
Déploiement relatif |
WorkspaceConnection |
Connexion de l’espace de travail AML. |
CosmosDBIndex
Index CosmosDB.
Nom | Type | Description |
---|---|---|
collectionName |
string |
Nom de la collection cosmos DB. |
connectionId |
string |
ID de la connexion pointant vers cosmos DB. |
databaseName |
string |
Nom de la base de données cosmos DB. |
kind |
string:
CosmosDB |
Type cible. |
CrawlingSettings
CrawlingSettings
Nom | Type | Description |
---|---|---|
maxCrawlDepth |
integer |
|
maxCrawlTimeInMins |
integer |
|
maxDownloadTimeInMins |
integer |
|
maxFileSize |
integer |
|
maxFiles |
integer |
|
maxRedirects |
integer |
CustomCompute
Calcul personnalisé.
Nom | Type | Description |
---|---|---|
computeId |
string |
ID du calcul personnalisé |
kind | string: |
Type de calcul. |
DeploymentConnection
Connexion de déploiement relative.
Nom | Type | Description |
---|---|---|
kind |
string:
Relative |
Type de connexion. |
EndpointKeyConnection
Connexion de clé de point de terminaison.
Nom | Type | Description |
---|---|---|
endpoint |
string |
Extrémité |
key |
string |
Clé |
kind |
string:
Endpoint |
Type de connexion. |
EndpointMIConnection
Connexion d’identité managée de point de terminaison.
Nom | Type | Description |
---|---|---|
endpoint |
string |
Extrémité |
kind |
string:
Endpoint |
Type de connexion. |
resourceId |
string |
ID de ressource |
Error
Erreur
Nom | Type | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Détails de l’erreur s’il est disponible. |
innererror |
InnerError |
|
message |
string |
Message de cette erreur. |
target |
string |
Emplacement où l’erreur s’est produite si disponible. |
ErrorCode
ErrorCode
Valeur | Description |
---|---|
conflict |
L’opération demandée est en conflit avec l’état de ressource actuel. |
contentFilter |
La génération d’images a échoué suite à notre système de sécurité. |
fileImportFailed |
Échec de l’importation du fichier. |
forbidden |
L’opération est interdite pour la clé utilisateur/API actuelle. |
internalFailure |
Erreur interne. Réessayez. |
invalidPayload |
Les données de requête ne sont pas valides pour cette opération. |
itemDoesAlreadyExist |
L’élément existe déjà. |
jsonlValidationFailed |
Échec de la validation des données jsonl. |
notFound |
La ressource est introuvable. |
quotaExceeded |
Quota dépassé. |
serviceUnavailable |
Le service n’est actuellement pas disponible. |
tooManyRequests |
Trop de demandes. Réessayez ultérieurement. |
unauthorized |
La clé utilisateur/API actuelle n’est pas autorisée pour l’opération. |
unexpectedEntityState |
L’opération ne peut pas être exécutée dans l’état de la ressource actuelle. |
ErrorResponse
ErrorResponse
Nom | Type | Description |
---|---|---|
error |
Erreur |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
Nom | Type | Description |
---|---|---|
connection | BaseConnection: |
BaseConnection |
deploymentName |
string |
|
modelName |
string |
IngestionJobCompletionAction
Action d’achèvement.
Valeur | Description |
---|---|
cleanUpTempAssets |
Nettoie les ressources intermédiaires créées pendant le processus d’ingestion. |
keepAllAssets |
Ne nettoie pas les ressources intermédiaires créées pendant le processus d’ingestion. |
IngestionJobSystemCompute
Nom | Type | Description |
---|---|---|
completionAction |
Action d’achèvement. |
|
dataRefreshIntervalInHours |
integer |
|
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
jobId |
string |
|
kind |
string:
System |
IngestionJobType |
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobType
IngestionJobType
Valeur | Description |
---|---|
SystemCompute |
Travaux qui s’exécutent sur des ressources appartenant au service. |
UserCompute |
Travaux qui s’exécutent sur l’espace de travail appartenant à l’utilisateur. |
IngestionJobUserCompute
Nom | Type | Description |
---|---|---|
compute | JobCompute: |
JobCompute |
dataRefreshIntervalInHours |
integer |
|
datasource | UserComputeDatasource: |
UserComputeDatasource |
jobId |
string |
|
kind |
string:
User |
IngestionJobType |
target | TargetIndex: |
TargetIndex |
workspaceId |
string |
InnerError
InnerError
Nom | Type | Description |
---|---|---|
code |
InnerErrorCode |
|
innererror |
InnerError |
InnerErrorCode
InnerErrorCode
Valeur | Description |
---|---|
invalidPayload |
Les données de requête ne sont pas valides pour cette opération. |
PineconeIndex
Pinecone Index.
Nom | Type | Description |
---|---|---|
connectionId |
string |
ID de la connexion pointant vers le pincone. |
kind |
string:
Pinecone |
Type cible. |
ServerlessCompute
Calcul serverless.
Nom | Type | Description |
---|---|---|
instanceCount |
integer |
Nombre d’instances sur laquelle exécuter le travail. |
kind | string: |
Type de calcul. |
sku |
string |
Niveau de référence SKU |
SystemComputeDatasourceType
Type de source de données.
Valeur | Description |
---|---|
Storage |
Compte de stockage Azure. |
Urls |
URL. |
SystemComputeStorage
SystemComputeStorage
Nom | Type | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
nom du conteneur |
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Storage |
Type de source de données. |
SystemComputeUrl
SystemComputeUrl
Nom | Type | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
nom du conteneur |
crawling |
CrawlingSettings |
|
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Type de source de données. |
urls |
string[] |
TargetType
Type cible.
Valeur | Description |
---|---|
AzureAISearch |
Index Recherche d’IA Azure. |
CosmosDB |
Index CosmosDB. |
Pinecone |
Pinecone Index. |
UserComputeDataset
UserComputeStorage
Nom | Type | Description |
---|---|---|
chunking |
ChunkingSettings |
|
datasetId |
string |
|
datasetType |
string |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Dataset |
Type de source de données. |
UserComputeDatasourceType
Type de source de données.
Valeur | Description |
---|---|
Dataset |
Jeu de données d’espace de travail. |
Urls |
URL. |
UserComputeUrl
UserComputeUrl
Nom | Type | Description |
---|---|---|
chunking |
ChunkingSettings |
|
crawling |
CrawlingSettings |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Type de source de données. |
urls |
string[] |
WorkspaceConnection
Connexion de l’espace de travail AML.
Nom | Type | Description |
---|---|---|
connectionId |
string |
ConnectionId |
kind | string: |
Type de connexion. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
Nom | Type | Description |
---|---|---|
connectionId |
string |
|
deploymentName |
string |
|
modelName |
string |