Utvärdera, distribuera och testa en finjusterad grundmodell

Slutförd

När du har finjusterat en grundmodell från modellkatalogen i Azure Machine Learning kan du utvärdera modellen och distribuera den för att enkelt testa och använda modellen.

Utvärdera din finjusterade modell

Om du vill avgöra om din finjusterade modell fungerar som förväntat kan du granska tränings- och utvärderingsmåtten.

När du skickar en modell som ska finjusteras skapar Azure Machine Learning ett nytt pipelinejobb i ett experiment. Pipelinejobbet innehåller en komponent som representerar finjusteringen av modellen. Du kan analysera loggar, mått och utdata för jobbet genom att välja det slutförda pipelinejobbet och utforska mer genom att välja den specifika finjusteringskomponenten.

Screenshot of metrics of the completed pipeline job that fine-tuned a foundation model.

Dricks

I Azure Machine Learning spåras modellmått med MLflow. Om du vill komma åt och granska mått programmatiskt kan du använda MLflow i en Jupyter-notebook-fil.

Distribuera din finjusterade modell

Om du vill testa och använda din finjusterade modell kan du distribuera modellen till en slutpunkt.

En slutpunkt i Azure Machine Learning är ett API (Application Programming Interface) som exponerar den tränade eller finjusterade modellen, så att användare eller program kan göra förutsägelser baserat på nya data.

Det finns två typer av slutpunkter i Azure Machine Learning:

  • Realtidsslutpunkter: Utformade för att hantera omedelbara eller snabba förutsägelser.
  • Batchslutpunkter : Optimerad för hantering av en stor mängd data samtidigt.

Eftersom realtidsslutpunkter gör att du kan få omedelbara förutsägelser är dessa slutpunkter också idealiska för att testa en modells förutsägelser.

Registrera din modell med hjälp av Azure Machine Learning-studio

Om du vill distribuera din finjusterade modell med hjälp av Azure Machine Learning-studio kan du använda utdata från finjusteringsjobbet.

Azure Machine Learning använder MLflow för att spåra jobb och logga mått och modellfiler. Eftersom MLflow är integrerat med Azure Machine Learning-studio kan du distribuera en modell från ett jobb med minimal ansträngning.

Först måste du registrera modellen från jobbutdata. Gå till jobböversikten för att hitta alternativet + Registrera modell .

Screenshot of pipeline job overview with register model feature.

Den registrerade modelltypen är MLflow och Azure Machine Learning fyller automatiskt i mappen som innehåller modellfilerna. Du måste ange ett namn för den registrerade modellen och eventuellt en version.

Distribuera din modell med hjälp av Azure Machine Learning-studio

När modellen har registrerats på Azure Machine Learning-arbetsytan kan du navigera till modellöversikten och distribuera den till en realtids- eller batchslutpunkt.

Screenshot of the deployment options from a registered model.

Du kan till exempel distribuera din modell till en realtidsslutpunkt genom att ange:

Screenshot of the endpoint creation from a registered model.

  • Virtuell dator: Den beräkning som används av slutpunkten.
  • Antal instanser: Antalet instanser som ska användas för distributionen.
  • Slutpunkt: Distribuera din modell till en ny eller en befintlig slutpunkt.
  • Slutpunktsnamn: Används för att generera slutpunkts-URL:en.
  • Distributionsnamn: Namnet på den distribuerade modellen till slutpunkten.

Kommentar

Du kan distribuera flera modeller till samma slutpunkt. Det tar lite tid att skapa slutpunkten och distributionen av en modell till en slutpunkt. Vänta tills både slutpunkten och distributionen är klara innan du försöker testa eller använda den distribuerade modellen.

Testa modellen i Azure Machine Learning-studio

När din modell distribueras till en realtidsslutpunkt kan du snabbt testa modellen i Azure Machine Learning-studio.

Gå till slutpunkten och utforska fliken Test .

Screenshot of the test pane of a deployed model.

Eftersom realtidsslutpunkten fungerar som ett API förväntar den sig indata i JSON-format. Ett exempel på förväntade utdata finns på fliken Test :

{
  "input_data": {
    "columns": [
      "input_string"
    ],
    "index": [],
    "data": []
  }
}

Formatet för testdata bör likna träningsdata, exklusive etikettkolumnen. När du till exempel vill testa en modell som finjusterats för textklassificering måste du ange en kolumn till slutpunkten: den mening som ska klassificeras:

{
  "input_data": {
    "columns": [
      "input_string"
    ],
    "index": [0, 1],
    "data": [["This would be the first sentence you want to classify."], ["This would be the second sentence you want to classify."]]
  }
}

Du kan ange alla testdata i studion och välja Testa för att skicka data till slutpunkten. Resultatet visas under Testresultat nästan omedelbart.

Dricks

Om du inte hittar det förväntade svaret under Testresultat är den troligaste orsaken att indataformatet är felaktigt. Bedömningsskriptet genereras automatiskt när du distribuerar en MLflow-modell, vilket innebär att formatet för indata bör likna träningsdata (exklusive etikettkolumnen).