Ingestion Jobs - Create
Crea un trabajo de ingesta con el identificador de trabajo especificado.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2025-02-01-preview
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string url |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre de la cuenta de Azure OpenAI). |
job-id
|
path | True |
string |
Identificador del trabajo que se creará. |
api-version
|
query | True |
string |
La versión de API solicitada. |
Encabezado de la solicitud
Nombre | Requerido | Tipo | Description |
---|---|---|---|
mgmt-user-token |
string |
El token usado para acceder al área de trabajo (solo es necesario para los trabajos de proceso de usuario). |
|
aml-user-token |
string |
Token que se usa para acceder a los recursos del trabajo del área de trabajo (solo es necesario para los trabajos de proceso de usuario). |
Cuerpo de la solicitud
El cuerpo de la solicitud puede ser uno de los siguientes:
Nombre | Description |
---|---|
Ingestion |
|
Ingestion |
IngestionJobSystemCompute
Nombre | Requerido | Tipo | Description |
---|---|---|---|
kind | True |
string:
System |
IngestionJobType |
completionAction |
Acción de finalización. |
||
dataRefreshIntervalInHours |
integer |
||
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
jobId |
string |
||
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobUserCompute
Nombre | Requerido | Tipo | Description |
---|---|---|---|
kind | True |
string:
User |
IngestionJobType |
workspaceId | True |
string |
|
compute | JobCompute: |
JobCompute |
|
dataRefreshIntervalInHours |
integer |
||
datasource | UserComputeDatasource: |
UserComputeDatasource |
|
jobId |
string |
||
target | TargetIndex: |
TargetIndex |
Respuestas
Nombre | Tipo | Description |
---|---|---|
200 OK | IngestionJob: |
Éxito |
Other Status Codes |
Error. |
Seguridad
api-key
Autenticación de clave de API
Tipo:
apiKey
En:
header
OAuth2Auth
Autenticación de OAuth2
Tipo:
oauth2
Flujo:
implicit
Dirección URL de autorización:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Ámbitos
Nombre | Description |
---|---|
https://cognitiveservices.azure.com/.default |
Ejemplos
Create a system-compute ingestion job |
Create a user-compute ingestion job |
Create a system-compute ingestion job
Solicitud de ejemplo
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-02-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Respuesta de muestra
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-02-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Create a user-compute ingestion job
Solicitud de ejemplo
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-02-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Respuesta de muestra
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-02-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Definiciones
Nombre | Description |
---|---|
Azure |
Índice de Azure AI Search. |
Chunking |
ChunkingSettings |
Compute |
Tipo de proceso. |
Connection |
Conexión de cadena de conexión. |
Connection |
Tipo de conexión. |
Cosmos |
Índice de CosmosDB. |
Crawling |
CrawlingSettings |
Custom |
Proceso personalizado. |
Deployment |
Conexión de implementación relativa. |
Endpoint |
Conexión de clave de punto de conexión. |
Endpoint |
Conexión de identidad administrada del punto de conexión. |
Error |
Error |
Error |
ErrorCode |
Error |
ErrorResponse |
Generic |
ConnectionEmbeddingSettings |
Ingestion |
Acción de finalización. |
Ingestion |
|
Ingestion |
IngestionJobType |
Ingestion |
|
Inner |
InnerError |
Inner |
InnerErrorCode |
Pinecone |
Índice pinecone. |
Serverless |
Proceso sin servidor. |
System |
Tipo de origen de datos. |
System |
SystemComputeStorage |
System |
SystemComputeUrl |
Target |
Tipo de destino. |
User |
UserComputeStorage |
User |
Tipo de origen de datos. |
User |
UserComputeUrl |
Workspace |
Conexión del área de trabajo de AML. |
Workspace |
WorkspaceConnectionEmbeddingSettings |
AzureAISearchIndex
Índice de Azure AI Search.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
Identificador de la conexión que apunta al índice de Azure AI Search. |
kind |
string:
Azure |
Tipo de destino. |
ChunkingSettings
ChunkingSettings
Nombre | Tipo | Description |
---|---|---|
maxChunkSizeInTokens |
integer |
ComputeType
Tipo de proceso.
Valor | Description |
---|---|
CustomCompute |
Proceso de usuario personalizado. |
ServerlessCompute |
Proceso de usuario sin servidor. |
ConnectionStringConnection
Conexión de cadena de conexión.
Nombre | Tipo | Description |
---|---|---|
connectionString |
string |
Cadena de conexión |
kind |
string:
Connection |
Tipo de conexión. |
ConnectionType
Tipo de conexión.
Valor | Description |
---|---|
ConnectionString |
Cadena de conexión. |
EndpointWithKey |
Punto de conexión y conexión de clave. |
EndpointWithManagedIdentity |
Punto de conexión e identidad administrada. |
RelativeConnection |
Implementación relativa |
WorkspaceConnection |
Conexión del área de trabajo de AML. |
CosmosDBIndex
Índice de CosmosDB.
Nombre | Tipo | Description |
---|---|---|
collectionName |
string |
Nombre de la colección de cosmos DB. |
connectionId |
string |
Identificador de la conexión que apunta a cosmos DB. |
databaseName |
string |
Nombre de la base de datos de Cosmos DB. |
kind |
string:
CosmosDB |
Tipo de destino. |
CrawlingSettings
CrawlingSettings
Nombre | Tipo | Description |
---|---|---|
maxCrawlDepth |
integer |
|
maxCrawlTimeInMins |
integer |
|
maxDownloadTimeInMins |
integer |
|
maxFileSize |
integer |
|
maxFiles |
integer |
|
maxRedirects |
integer |
CustomCompute
Proceso personalizado.
Nombre | Tipo | Description |
---|---|---|
computeId |
string |
Identificador del proceso personalizado |
kind | string: |
Tipo de proceso. |
DeploymentConnection
Conexión de implementación relativa.
Nombre | Tipo | Description |
---|---|---|
kind |
string:
Relative |
Tipo de conexión. |
EndpointKeyConnection
Conexión de clave de punto de conexión.
Nombre | Tipo | Description |
---|---|---|
endpoint |
string |
Extremo |
key |
string |
Llave |
kind |
string:
Endpoint |
Tipo de conexión. |
EndpointMIConnection
Conexión de identidad administrada del punto de conexión.
Nombre | Tipo | Description |
---|---|---|
endpoint |
string |
Extremo |
kind |
string:
Endpoint |
Tipo de conexión. |
resourceId |
string |
Identificador de recurso |
Error
Error
Nombre | Tipo | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Los detalles del error si están disponibles. |
innererror |
InnerError |
|
message |
string |
Mensaje de este error. |
target |
string |
Ubicación donde se produjo el error si está disponible. |
ErrorCode
ErrorCode
Valor | Description |
---|---|
conflict |
La operación solicitada entra en conflicto con el estado de recurso actual. |
contentFilter |
Se produjo un error en la generación de imágenes como resultado de nuestro sistema de seguridad. |
fileImportFailed |
Error en la importación del archivo. |
forbidden |
La operación está prohibida para la clave de usuario o API actual. |
internalFailure |
Error interno. Vuelva a intentarlo. |
invalidPayload |
Los datos de solicitud no son válidos para esta operación. |
itemDoesAlreadyExist |
El elemento ya existe. |
jsonlValidationFailed |
Error en la validación de datos jsonl. |
notFound |
No se encuentra el recurso. |
quotaExceeded |
Se superó la cuota. |
serviceUnavailable |
El servicio no está disponible actualmente. |
tooManyRequests |
Demasiadas solicitudes. Vuelva a intentarlo más tarde. |
unauthorized |
La clave de usuario o API actual no está autorizada para la operación. |
unexpectedEntityState |
La operación no se puede ejecutar en el estado del recurso actual. |
ErrorResponse
ErrorResponse
Nombre | Tipo | Description |
---|---|---|
error |
Error |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
Nombre | Tipo | Description |
---|---|---|
connection | BaseConnection: |
BaseConnection |
deploymentName |
string |
|
modelName |
string |
IngestionJobCompletionAction
Acción de finalización.
Valor | Description |
---|---|
cleanUpTempAssets |
Limpiará los recursos intermedios creados durante el proceso de ingesta. |
keepAllAssets |
No limpiará ninguno de los recursos intermedios creados durante el proceso de ingesta. |
IngestionJobSystemCompute
Nombre | Tipo | Description |
---|---|---|
completionAction |
Acción de finalización. |
|
dataRefreshIntervalInHours |
integer |
|
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
jobId |
string |
|
kind |
string:
System |
IngestionJobType |
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobType
IngestionJobType
Valor | Description |
---|---|
SystemCompute |
Trabajos que se ejecutan en recursos de propiedad del servicio. |
UserCompute |
Trabajos que se ejecutan en el área de trabajo propiedad del usuario. |
IngestionJobUserCompute
Nombre | Tipo | Description |
---|---|---|
compute | JobCompute: |
JobCompute |
dataRefreshIntervalInHours |
integer |
|
datasource | UserComputeDatasource: |
UserComputeDatasource |
jobId |
string |
|
kind |
string:
User |
IngestionJobType |
target | TargetIndex: |
TargetIndex |
workspaceId |
string |
InnerError
InnerError
Nombre | Tipo | Description |
---|---|---|
code |
InnerErrorCode |
|
innererror |
InnerError |
InnerErrorCode
InnerErrorCode
Valor | Description |
---|---|
invalidPayload |
Los datos de solicitud no son válidos para esta operación. |
PineconeIndex
Índice pinecone.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
Identificador de la conexión que apunta al pinecone. |
kind |
string:
Pinecone |
Tipo de destino. |
ServerlessCompute
Proceso sin servidor.
Nombre | Tipo | Description |
---|---|---|
instanceCount |
integer |
Recuento de instancias en las que ejecutar el trabajo. |
kind | string: |
Tipo de proceso. |
sku |
string |
Nivel de SKU |
SystemComputeDatasourceType
Tipo de origen de datos.
Valor | Description |
---|---|
Storage |
Cuenta de Azure Storage. |
Urls |
Direcciones URL. |
SystemComputeStorage
SystemComputeStorage
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
nombre del contenedor |
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Storage |
Tipo de origen de datos. |
SystemComputeUrl
SystemComputeUrl
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
nombre del contenedor |
crawling |
CrawlingSettings |
|
embeddings |
ConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Tipo de origen de datos. |
urls |
string[] |
TargetType
Tipo de destino.
Valor | Description |
---|---|
AzureAISearch |
Índice de Azure AI Search. |
CosmosDB |
Índice de CosmosDB. |
Pinecone |
Índice pinecone. |
UserComputeDataset
UserComputeStorage
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
datasetId |
string |
|
datasetType |
string |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Dataset |
Tipo de origen de datos. |
UserComputeDatasourceType
Tipo de origen de datos.
Valor | Description |
---|---|
Dataset |
Conjunto de datos del área de trabajo. |
Urls |
Direcciones URL. |
UserComputeUrl
UserComputeUrl
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
crawling |
CrawlingSettings |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
Urls |
Tipo de origen de datos. |
urls |
string[] |
WorkspaceConnection
Conexión del área de trabajo de AML.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
ConnectionId |
kind | string: |
Tipo de conexión. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
|
deploymentName |
string |
|
modelName |
string |