Cargas de trabajo de IA en Azure
En este artículo se abordan los desafíos arquitectónicos del diseño de cargas de trabajo de inteligencia artificial. Se centra en la funcionalidad no determinista, el diseño de datos y aplicaciones y las operaciones. Las recomendaciones se basan en los principios de Azure Well-Architected Framework e incluyen información de implementaciones de Azure correctas.
Estos artículos están diseñados para propietarios de cargas de trabajo y partes interesadas técnicas, como arquitectos, responsables de desarrollo y líderes de TI. La inteligencia artificial especializada y los roles de datos, como los científicos de datos, también deben tener en cuenta esta guía, ya que la colaboración entre varios roles y equipos es un aspecto clave.
Nota:
Azure ofrece varios servicios de inteligencia artificial que puede integrar en la carga de trabajo o construir a su alrededor. En función de sus necesidades empresariales, puede elegir entre soluciones de software como servicio (SaaS) totalmente administradas, soluciones de plataforma como servicio (PaaS) o crear su propia solución de IA. Los servicios específicos de Azure y sus funcionalidades no se tratan aquí. Se recomienda que consulte la documentación del producto correspondiente para esa información.
Además, algunas cargas de trabajo de IA no están en el ámbito, como:
- Cargas de trabajo implementadas a través de soluciones de código bajo y sin código, como Copilot Studio.
- Cargas de trabajo que requieren informática de alto rendimiento.
- Cargas de trabajo que no implementan casos de uso de IA generativos o discriminativos.
¿Qué es una carga de trabajo de IA?
En el contexto de Well-Architected Framework, una carga de trabajo de IA satisface las necesidades de tareas predictivas, discriminatorias o generativas. Se centra en la funcionalidad ética, la adaptación a las tecnologías de inteligencia artificial en evolución rápida y mantenerse relevante y explicable. Aplique los pilares del marco de Well-Architected en cada punto de decisión para garantizar que el sistema sea confiable, seguro, eficaz y rentable.
Las cargas de trabajo de IA son diferentes de las tradicionales porque reemplazan la funcionalidad determinista en partes de la carga de trabajo por un comportamiento no determinista que resuelve situaciones en las que los resultados fijos no son prácticos. En su lugar, combinan código y datos en una entidad, o un modelo de , para habilitar experiencias únicas que los sistemas tradicionales no pueden proporcionar.
Antes de comenzar las estrategias de diseño, tenga en cuenta estos puntos clave en primer lugar.
Familiarícese con las amplias categorías de modelos
generative AI: usa el aprendizaje automático para crear contenido de forma autónoma. Incluye modelos de lenguaje que se pueden personalizar con datos de usuario o que se usan como servicios como el servicio Azure OpenAI. Por ejemplo, GPT, un tipo de modelo de lenguaje, se especializa en imitar el lenguaje conversacional humano y es ideal para experiencias de chat y lenguaje natural.
Casos de uso: la inteligencia artificial generativa puede generar artículos, historias y arte. También puede generar datos sintéticos para equilibrar los conjuntos de datos y hacer que los bots de chat sean más humanos.
IA discriminativa: Utiliza programación explícita para realizar tareas específicas basadas en reglas y algoritmos. Se divide en:
- basados en modelos: los sistemas predictivos encuentran patrones basados en el entrenamiento realizado desde observaciones anteriores para realizar predicciones, pero no pueden crear contenido nuevo ni adaptarse por sí mismos.
- no basado en modelos: los agentes autónomos siguen reglas predefinidas para interactuar con sistemas, como los personajes de los videojuegos.
Caso de uso: la inteligencia artificial discriminativa se usa para el análisis predictivo, los sistemas de recomendaciones y la detección de fraudes.
En esta serie de artículos se tratan diferentes cargas de trabajo de IA y se centra en tipos específicos, como los modelos de lenguaje cuando sea necesario.
Importante
Al elegir entre modelos generativos y discriminativos, piense en la tarea que necesita realizar. Los modelos generativos crean nuevos datos. Los modelos discriminativos clasifican los datos existentes en función de las características. Para las tareas de clasificación o regresión, elija los modelos que se ajusten al trabajo. Por ejemplo, un modelo de lenguaje que puede clasificar podría ser más versátil que uno que solo clasifica.
Evaluación de la compilación frente a las opciones de compra
Si las respuestas genéricas son aceptables, un modelo precompilado o una solución basada en el servicio ai que usa el procesamiento opaco debe ser suficiente para la carga de trabajo. Pero si necesita datos específicos de su empresa o tiene requisitos de cumplimiento, cree un modelo personalizado.
Al elegir entre un modelo personalizado, un modelo precompilado o un servicio, tenga en cuenta estos factores:
- Control de datos: los modelos personalizados proporcionan más control sobre los datos confidenciales. Los modelos creados previamente son más fáciles para tareas generales.
- Personalización: Los modelos personalizados son mejores para necesidades únicas. Los modelos creados previamente podrían carecer de flexibilidad.
- costo y mantenimiento: los modelos personalizados necesitan mantenimiento y recursos continuos. Los modelos precompilados suelen tener costos iniciales más bajos y menos carga de infraestructura.
- Rendimiento: Los servicios predefinidos ofrecen una infraestructura y escalabilidad optimizadas. Son ideales para necesidades de baja latencia o alta escalabilidad.
- Experiencia: los modelos personalizados requieren un equipo cualificado. Los modelos precompilados suelen ser más rápidos para implementar y facilitar su uso si la experiencia es limitada.
Importante
La creación y el mantenimiento de su propio modelo requiere una gran cantidad de recursos, tiempo y experiencia. Es importante investigar exhaustivamente antes de decidir. Normalmente, elegir un modelo precompilado o un servicio administrado es una mejor opción.
¿Cuáles son los desafíos comunes?
- Costos de proceso: las funciones de IA pueden ser costosas debido a las necesidades de proceso elevadas y las necesidades de proceso pueden variar según el diseño de la carga de trabajo. Comprenda sus requisitos y elija el servicio adecuado para administrar los costos.
- Requisitos de seguridad y cumplimiento: es posible que las soluciones fuera de la plataforma no cumplan sus necesidades de seguridad y cumplimiento. Opciones de investigación para evitar cargas innecesarias.
- volumen de datos: el manejo de grandes volúmenes de datos en varios formatos conlleva desafíos para proteger la información confidencial y el procesamiento eficiente. Optimizar los costos de almacenamiento, procesamiento y transferencia debe ser una actividad continua.
- Degradación del modelo: Los modelos pueden degradarse con el tiempo, lo que conduce a resultados inexactos. La prueba de sistemas de inteligencia artificial es difícil debido a su aleatoriedad.
- desafíos de aptitudes: las nuevas cargas de trabajo de IA pueden necesitar roles especializados y nuevos procesos de operaciones que requieren un entrenamiento extenso.
- Ritmo de innovación de inteligencia artificial: la adopción de las tecnologías más recientes puede ser tentadora para mantenerse al nivel de vanguardia. Evalúe cuidadosamente las nuevas tecnologías para asegurarse de que mejoran la experiencia del usuario y no solo agregan complejidad por motivos de actualización.
- requisitos éticos: determine claramente si su caso de uso es un objetivo ético para la inteligencia artificial. El mantenimiento de estándares éticos es necesario a lo largo de las fases de planificación e implementación para asegurarse de que está creando un sistema responsable.
Cómo usar esta guía
✔ Empieza con la metodología de diseño, que describe la justificación y los temas recurrentes en áreas técnicas y operativas. Este enfoque sistemático ayuda a definir requisitos y estrategias de diseño. Vuelva a consultar esta metodología cuando tenga opciones inciertas para mantenerse alineadas con los objetivos generales de la carga de trabajo. También proporciona un marco para colaborar con las partes interesadas para justificar decisiones técnicas e incorporar comentarios de los clientes para mejorar continuamente.
✔ Continúe con los principios de diseño de para ver cómo se alinea la metodología de diseño con los pilares básicos de Well-Architected Framework. Considere la evolución del crecimiento. Evalúe los principios subyacentes de todos los pilares colectivamente, incluidos los inconvenientes.
✔ Céntrese en las áreas de diseño que tienen el mayor efecto en la solución. Cada área incluye consideraciones y recomendaciones para guiarle a través de las decisiones de diseño.
✔ Utilice el Assessment Review Tool para evaluar la preparación de la carga de trabajo de inteligencia artificial optimizada en producción.
Áreas típicas de diseño y patrón de arquitectura
En el diagrama siguiente se muestra cómo fluyen los datos a través del sistema desde la recopilación inicial hasta la interacción final del usuario.
La arquitectura resalta la integración de diferentes componentes para habilitar el procesamiento de datos eficaz, la optimización del modelo y la implementación de aplicaciones en tiempo real en soluciones controladas por ia. Incluye módulos como orígenes de datos, procesamiento de datos, entrenamiento de modelos, implementación de modelos e interfaces de usuario.
En la tabla siguiente se describen algunas áreas de diseño clave relacionadas con ese patrón.
Área de diseño |
---|
diseño de aplicaciones: obtenga información sobre las consideraciones exclusivas de las cargas de trabajo de IA que podrían tener un efecto significativo en los estándares de diseño de aplicaciones existentes. |
plataforma de aplicaciones: determine las mejores plataformas que se usarán para admitir funciones de carga de trabajo de IA, como el hospedaje de modelos, el entrenamiento del modelo y la inferencia. |
Diseño de datos de entrenamiento: diseñar estrategias para la ingesta de datos, el preprocesamiento, la retención y los temas de gobernanza para controlar los datos de entrenamiento del modelo. |
Diseño de datos de puesta a tierra: diseñe estrategias para optimizar la búsqueda y recuperación, al tiempo que cumple los requisitos de seguridad y cumplimiento de los datos de base. |
plataforma de datos: Determine la mejor plataforma de hospedaje para gestionar las grandes cantidades y potencialmente muchos formatos de datos que usa su carga de trabajo. |
Las operaciones de aprendizaje automático y las operaciones de IA generativa: Establezca prácticas modernas de DevOps para admitir las funciones y sistemas de aprendizaje automático o inteligencia artificial generativa. |
Operaciones de carga de trabajo: modernice las prácticas operativas con nuevos enfoques y agregue roles y entrenamiento especializados. |
Prueba y evaluación: Desarrolle estrategias de prueba y evaluación para medir características como la exactitud, la precisión, la sensibilidad y la especificidad a través de métricas orientadas a las cargas de trabajo de inteligencia artificial. |
Personas de carga de trabajo: Comprenda cómo las personas están involucradas en el ciclo de vida completo de su carga de trabajo de IA para ayudar a garantizar que su equipo sea totalmente capaz de crearlas y apoyarlas. |
de inteligencia artificial responsable: preste especial atención a la experiencia del usuario y a las implicaciones éticas de la publicación de la solución de inteligencia artificial al público. La inteligencia artificial aporta increíbles oportunidades para nuevos productos y servicios, pero también conlleva un grado considerable de riesgo. |
Sugerencia
Cada decisión arquitectónica implica una serie de consideraciones y un conjunto de compromisos reconocidos que equilibran distintos aspectos del marco. Estos inconvenientes se indican mediante este icono .