Disponibilità dell'area per i modelli negli endpoint dell'API serverless | Azure Machine Learning
In questo articolo, vengono fornite informazioni sulle aree disponibili per ognuno dei modelli che supportano le distribuzioni di endpoint API serverless.
Alcuni modelli nel catalogo modelli possono essere distribuiti come API serverless con la fatturazione di pagamenti in base al consumo. Questo tipo di distribuzione consente di usare i modelli come le API senza ospitarli nella sottoscrizione, mantenendo al contempo la sicurezza e la conformità aziendali necessarie alle organizzazioni. Questa opzione di distribuzione non richiede la quota dalla sottoscrizione.
Aree di disponibilità
La distribuzione con pagamento in base al consumo è disponibile solo per gli utenti la cui sottoscrizione di Azure appartiene a un account di fatturazione in un paese in cui il provider di modelli ha reso disponibile l'offerta (vedere "Area di disponibilità dell'offerta" nella tabella della sezione successiva). Se l'offerta è disponibile nell'area pertinente, l'utente deve avere un hub/progetto nell'area di Azure in cui il modello è disponibile per la distribuzione o l'ottimizzazione, a seconda dei casi (vedere le colonne "Area dell'hub/progetto" nelle tabelle seguenti).
Modelli Cohere
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
Comando Cohere R+ 08-2024 | Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Comando Cohere R 08-2024 | Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Command R+ | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Command R | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Rerank 3 - English | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Rerank 3 - Multilingual | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Embed 3 - Inglese | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Cohere Embed 3 - Multilingua | Paesi gestiti da Microsoft Giappone Qatar |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Modelli JAIS
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
JAIS 30B Chat | Paesi gestiti da Microsoft Egitto |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Modelli Meta Llama
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
Llama 2 7B Llama 2 13B Llama 2 70B |
Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Stati Uniti occidentali Stati Uniti occidentali 3 |
Stati Uniti occidentali 3 |
Llama 2 7B Chat Llama 2 70B Chat |
Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Stati Uniti occidentali Stati Uniti occidentali 3 |
Stati Uniti occidentali 3 |
Llama 3 8B Instruct Llama 3 70B Instruct |
Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Llama 3.1 8B Instruct Llama 3.1 70B Instruct |
Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Stati Uniti occidentali Stati Uniti occidentali 3 |
Stati Uniti occidentali 3 |
Llama 3.1 405B Instruct | Paesi gestiti da Microsoft | Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Modelli della famiglia Microsoft Phi-3
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
Phi-3.5-vision-Instruct | Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Non disponibile |
Phi-3.5-MoE-Instruct | Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Stati Uniti orientali 2 |
Phi-3.5-Mini-Instruct | Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Stati Uniti orientali 2 |
Phi-3-Mini-4k-Instruct Phi-3-Mini-128K-Instruct |
Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Stati Uniti orientali 2 |
Phi-3-Small-8K-Instruct Phi-3-Small-128K-Instruct |
Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Non disponibile |
Phi-3-Medium-4K-Instruct Phi-3-Medium-128K-Instruct |
Non applicabile | Stati Uniti orientali 2 Svezia centrale |
Stati Uniti orientali 2 |
Modelli Mistral
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
Mistral Nemo | Paesi gestiti da Microsoft Brasile RAS di Hong Kong Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Ministral-3B | Paesi gestiti da Microsoft Brasile RAS di Hong Kong Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Mistral Small | Paesi gestiti da Microsoft Brasile RAS di Hong Kong Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Mistral Large (2402) | Paesi gestiti da Microsoft Brasile RAS di Hong Kong Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Mistral-Large (2407) | Paesi gestiti da Microsoft Brasile RAS di Hong Kong Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Modelli Nixtla
Modello | Area di disponibilità dell'offerta | Hub/Area del progetto per la distribuzione | Area dell'hub/progetto per l'ottimizzazione |
---|---|---|---|
TimeGEN-1 | Paesi gestiti da Microsoft Messico Israele |
Stati Uniti orientali Stati Uniti orientali 2 Stati Uniti centro-settentrionali Stati Uniti centro-meridionali Svezia centrale Stati Uniti occidentali Stati Uniti occidentali 3 |
Non disponibile |
Alternative alle aree di disponibilità
Se la maggior parte dell'infrastruttura si trova in una determinata area e si vogliono sfruttare i modelli disponibili solo come endpoint API serverless, è possibile creare un'area di lavoro nell'area supportata e quindi usare l'endpoint da un'altra area.
Leggere Usare endpoint API serverless da un'area di lavoro diversa per informazioni su come configurare un endpoint API serverless esistente in un'area di lavoro diversa da quella in cui è stato distribuito.