Sdílet prostřednictvím


Vektorizátor katalogu modelů Azure AI Foundry

Důležité

Tento vektorizátor je ve verzi Public Preview v rámci dodatečných podmínek použití. Rozhraní REST API verze 2024-05-05-01-Preview tuto funkci podporuje.

Vektorizátor katalogu modelů Azure AI Foundry se připojí k modelu vkládání, který byl nasazen prostřednictvím katalogu modelů Azure AI Foundry, ke koncovému bodu služby Azure Machine Learning. Vaše data se zpracovávají v geografické oblasti, ve které je váš model nasazený.

Pokud jste k vytvoření vektorových polí použili integrovanou vektorizaci, měla by sada dovedností AML odkazovat na katalog modelů na portálu Azure AI Foundry.

Parametry vektorizátoru

Parametry rozlišují malá a velká písmena. Které parametry, které se rozhodnete použít, závisí na tom, jaké ověřování vyžaduje online koncový bod AML( pokud existuje).

Název parametru Popis
uri (Povinné) Identifikátor URI online koncového bodu AML, do kterého se odesílá datová část JSON . Je povoleno pouze schéma identifikátoru URI https .
modelName (Povinné) ID modelu z katalogu modelů Azure AI Foundry nasazené v zadaném koncovém bodu. Podporované modely jsou:
  • Facebook-DinoV2-Image-Embeddings-ViT-Base
  • Facebook-DinoV2-Image-Embeddings-ViT-Giant
  • Cohere-embed-v3-english
  • Cohere-embed-v3-multilingual
key (Požadováno pro ověřování klíčů) Klíč pro online koncový bod AML.
resourceId (Požadováno pro ověřování tokenů). ID prostředku Azure Resource Manageru online koncového bodu AML. Měla by být ve formátu předplatných/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name}.
region (Volitelné pro ověřování tokenů). Oblast, ve které je online koncový bod AML nasazený. Je potřeba, pokud se oblast liší od oblasti vyhledávací služby.
timeout (Volitelné) Po zadání označuje časový limit pro klienta HTTP, který volá rozhraní API. Musí být formátovaná jako hodnota XSD dayTimeDuration (omezená podmnožina hodnoty doby trvání ISO 8601). Například PT60S 60 sekund. Pokud není nastavená, vybere se výchozí hodnota 30 sekund. Časový limit je možné nastavit na maximálně 230 sekund a minimálně 1 sekundu.

Jaké parametry ověřování se mají použít

Jaké parametry ověřování se vyžadují, závisí na tom, jaké ověřování váš online koncový bod AML používá, pokud nějaké. Online koncové body AML poskytují dvě možnosti ověřování:

  • Ověřování založené na klíčích Pro ověření žádostí o bodování z vektorizátoru se poskytuje statický klíč.
    • Použití parametrů identifikátoru URI a klíče
  • Ověřování založené na tokenech Online koncový bod AML se nasadí pomocí ověřování na základě tokenu. Spravovaná identita azure AI Search musí být povolená. Vektorizátor pak použije spravovanou identitu služby k ověření vůči online koncovému bodu AML bez nutnosti statických klíčů. Identitě musí být přiřazena role vlastníka nebo přispěvatele.
    • Použijte parametr resourceId.
    • Pokud je vyhledávací služba v jiné oblasti než pracovní prostor AML, použijte parametr oblasti k nastavení oblasti, ve které byl nasazen online koncový bod AML.

Podporované typy vektorových dotazů

Které typy vektorových dotazů podporuje vektorizátor katalogu modelů Azure AI Foundry, závisí na modelName nakonfigurované konfiguraci.

Vložený model Podporuje dotaz.text Podporuje dotaz.imageUrl Podporuje dotaz.imageBinary
Facebook-DinoV2-Image-Embeddings-ViT-Base X X
Facebook-DinoV2-Image-Embeddings-ViT-Giant X X
Cohere-embed-v3-english X
Cohere-embed-v3-multilingual X

Očekávané rozměry pole

Očekávané dimenze pole pro pole nakonfigurované pomocí vektorizátoru katalogu modelů Azure AI Foundry závisí na modelName nakonfigurované konfiguraci.

modelName Očekávané rozměry
Facebook-DinoV2-Image-Embeddings-ViT-Base 768
Facebook-DinoV2-Image-Embeddings-ViT-Giant 1536
Cohere-embed-v3-english 1024
Cohere-embed-v3-multilingual 1024

Ukázková definice

Navrhované názvy modelů v katalogu modelů Azure AI Foundry se skládají ze základního modelu a náhodné třímísmenné přípony. Název modelu se bude lišit od názvu, který je znázorněn v tomto příkladu.

"vectorizers": [
    {
        "name": "my-model-catalog-vectorizer",
        "kind": "aml",
        "amlParameters": {
            "uri": "https://Cohere-embed-v3-multilingual-hin.eastus.models.ai.azure.com",
            "key": "aaaaaaaa-0b0b-1c1c-2d2d-333333333333",
            "timeout": "PT60S",
            "modelName": "Cohere-embed-v3-multilingual-hin",
            "resourceId": null,
            "region": null,
        },
    }
]

Viz také