Compartir vía


Recomendaciones de selección de recursos para cargas de trabajo de IA en Azure

Este artículo ofrece recomendaciones de selección de recursos para organizaciones que ejecutan cargas de trabajo de IA en Azure. Se centra en las soluciones de plataforma como servicio (PaaS) de IA de Azure, incluidos Inteligencia artificial de Azure Studio, Azure OpenAI, Azure Machine Learning y Azure AI Services. Cubre cargas de trabajo de IA generativas y no generativas.

Tomar decisiones informadas sobre los recursos de IA permite a las organizaciones lograr un mejor rendimiento, escalabilidad y rentabilidad al administrar las cargas de trabajo de IA. La siguiente tabla proporciona una visión general de las principales soluciones Azure AI PaaS y los criterios de decisión importantes.

Plataforma de inteligencia artificial Tipo de IA Descripción Capacidades necesarias
Azure OpenAI IA generativa Plataforma de acceso a modelos OpenAI aptitudes de desarrollador y ciencia de datos
Azure AI Studio IA generativa Plataforma para impulsar la ingeniería y desplegar puntos de conexión de IA generativa aptitudes de desarrollador y ciencia de datos
Servicios de Azure AI Inteligencia artificial analítica Plataforma para consumir modelos de aprendizaje automático preconstruidos Competencias para desarrolladores
Azure Machine Learning Machine Learning Plataforma para entrenar y desplegar modelos de aprendizaje automático Competencias de desarrollador y conocimientos avanzados de ciencia de datos

Seleccionar recursos para cargas de trabajo de IA generativa

La IA generativa requiere la combinación de diferentes recursos para procesar y generar resultados significativos basados en los datos de entrada. Una selección adecuada garantiza que las aplicaciones de IA generativa, como las que utilizan la generación aumentada por recuperación (RAG), ofrezcan resultados precisos al fundamentar los modelos de IA.

Diagrama que muestra los componentes básicos de una carga de trabajo de IA generativa.

En una carga de trabajo RAG típica, (1) la carga de trabajo recibe la consulta del usuario. (2) Un orquestador, como Prompt flow, Semantic Kernel o LangChain, administra el flujo de datos. (3) Un mecanismo de búsqueda y recuperación encuentra los datos de base (4) adecuados para enviarlos al punto de conexión de IA generativa. (5) Un punto de conexión del modelo de IA generativa genera una respuesta basada en la consulta del usuario y los datos de base. Utilice las siguientes recomendaciones como marco para crear cargas de trabajo RAG generativas.

  • Elija una plataforma de IA generativa. Utilice Azure OpenAI o Inteligencia artificial de Azure Studio para desplegar y administrar modelos de IA generativa. Azure OpenAI Service proporciona acceso a redes privadas de modelos OpenAI y filtrado de contenido. Inteligencia artificial de Azure Studio ofrece una plataforma de código para desarrollar cargas de trabajo de IA. Cuenta con herramientas integradas para crear y desplegar aplicaciones. También cuenta con un amplio catálogo de modelos, flujo de avisos, ajuste, filtros de seguridad de contenido y mucho más.

  • Elija el tipo de computación de IA adecuado. Inteligencia artificial de Azure Studio requiere instancias de procesamiento para el flujo de avisos, la creación de índices y la apertura de Visual Studio Code (Web o Desktop) dentro del estudio. Elija un tipo de computación basado en sus necesidades de rendimiento y presupuesto.

  • Elija un orquestador. Entre los orquestadores más populares para la IA generativa se incluyen Semantic Kernel, Prompt flow y LangChain. Semantic Kernel se integra con los servicios Azure. LangChain proporciona extensibilidad más allá del ecosistema de Microsoft.

  • Elija un mecanismo de búsqueda y recuperación de conocimientos. Para fundamentar los modelos generativos de IA, cree un índice o una base de datos vectorial para la recuperación de datos relevantes. Utilice Azure AI Search para crear índices tradicionales y vectoriales a partir de varias fuentes de datos, aplicar fragmentación de datos y utilizar varios tipos de consulta. Si sus datos residen en bases de datos estructuradas, considere el uso de Azure Cosmos DB, Azure Database for PostgreSQL y Azure Cache for Redis.

  • Elija una fuente de datos de base. Para imágenes, audio, vídeo o grandes conjuntos de datos, almacene los datos de base en Azure Blob Storage. Como alternativa, utilice bases de datos compatibles con Búsqueda de Azure AI o bases de datos vectoriales.

  • Elija una plataforma de proceso. Utilice el árbol de decisión de proceso de Azure para elegir la plataforma adecuada para su carga de trabajo.

Seleccionar recursos para cargas de trabajo de IA no generativa

Las cargas de trabajo de IA no generativa dependen de plataformas, recursos informáticos, fuentes de datos y herramientas de procesamiento de datos para respaldar las tareas de aprendizaje automático. La selección de los recursos adecuados le permite crear cargas de trabajo de IA utilizando soluciones prediseñadas y personalizadas.

Diagrama que muestra los componentes básicos de una carga de trabajo de IA no generativa.

En una carga de trabajo de IA no generativa, (1) la carga de trabajo ingiere datos. (2) Un mecanismo opcional de procesamiento de datos extrae o manipula los datos entrantes. (3) Un punto de conexión del modelo de IA analiza los datos. (4) Los datos apoyan el entrenamiento o el ajuste preciso de los modelos de IA. Utilice las siguientes recomendaciones como marco para crear cargas de trabajo de IA no generativa.

  • Elija una plataforma de IA no generativa. Los servicios de Azure AI ofrecen modelos de IA preconstruidos que no requieren conocimientos de ciencia de datos. Para obtener orientación sobre cómo seleccionar el servicio Azure AI adecuado, consulte Elegir una tecnología de servicios Azure AI. Azure Machine Learning proporciona una plataforma para crear modelos de aprendizaje automático con sus propios datos y consumir esos modelos en cargas de trabajo de IA.

  • Elija el proceso de IA adecuado. Para Azure Machine Learning, necesita recursos de procesos para ejecutar un trabajo o alojar un endpoint. Utilice el tipo de computación que satisfaga sus necesidades de rendimiento y presupuesto. Los servicios Azure AI no requieren recursos de procesos.

  • Elija una fuente de datos. Para Azure Machine Learning, utilice una de las fuentes de datos compatibles para alojar sus datos de entrenamiento. Para los servicios de Azure AI, muchos de los servicios no requieren datos de entrenamiento, y algunos, como Azure AI Custom Vision, proporcionan una opción para cargar archivos locales a una solución de almacenamiento de datos administrada.

  • Elija una plataforma de proceso. Utilice el árbol de decisión de proceso de Azure para elegir la plataforma de carga de trabajo adecuada.

  • Elija un servicio de procesamiento de datos (opcional). Azure Functions es una opción común de procesamiento de datos porque proporciona una opción sin servidor. Azure Event Grid también es un mecanismo de activación común para poner en marcha un pipeline de procesamiento de datos.

Paso siguiente