Implantar um modelo no Servidor de Inferência NVIDIA Triton

Módulo
6 Unidades

Intermediário

Engenheiro de IA

Cientista de Dados

Azure

Azure Machine Learning

O Servidor de Inferência NVIDIA Triton é um software de código aberto de várias estruturas que é otimizado para inferência. Ele dá suporte a estruturas populares de machine learning como TensorFlow, Open Neural Network Exchange (ONNX) Runtime, PyTorch, NVIDIA TensorRT e muito mais. Ele pode ser usado nas cargas de trabalho de CPU ou GPU. Nesse módulo, você implanta seu modelo de produção no servidor NVIDIA Triton para realizar inferência em uma máquina virtual hospedada na nuvem.

Objetivos de aprendizagem

Neste módulo, você saberá como:

Crie uma máquina virtual acelerada por GPU NVIDIA.
Configure o Servidor de inferência NVIDIA Triton e os pré-requisitos relacionados.
Execute uma carga de trabalho de inferência no Servidor de inferência NVIDIA Triton.

Pré-requisitos

Conta de avaliação gratuita do Azure

Introdução min
Criar uma máquina virtual acelerada por GPU min
Instalar pré-requisitos e o Servidor de Inferência NVIDIA Triton min
Executar carga de trabalho de inferência no Servidor de Inferência NVIDIA Triton min
Verificação de conhecimentos min
Resumo min