Dela via


Exempel: Skapa och distribuera en anpassad färdighet med Azure Machine Learning (arkiverad)

Det här exemplet arkiveras och stöds inte. Den förklarade hur du skapar en anpassad färdighet med hjälp av Azure Machine Learning för att extrahera aspektbaserade sentiment från recensionerna. Detta gjorde det möjligt att tilldela positiva och negativa sentiment inom samma granskning korrekt tillskrivas identifierade entiteter som personal, rum, lobby eller pool.

Om du vill träna den aspektbaserade attitydmodellen i Azure Machine Learning använder du lagringsplatsen nlp-recept. Modellen distribueras sedan som en slutpunkt i ett Azure Kubernetes-kluster. När slutpunkten har distribuerats läggs den till i berikande pipelinen som en AML-färdighet för användning av Cognitive tjänsten Search.

Det finns två datauppsättningar. Om du vill träna modellen själv krävs den hotel_reviews_1000.csv filen. Föredrar du att hoppa över träningssteget? Ladda ned hotel_reviews_100.csv.

  • Skapa en Azure Cognitive Search instans
  • Skapa en Azure Machine Learning-arbetsyta (söktjänsten och arbetsytan ska finnas i samma prenumeration)
  • Träna och distribuera en modell till ett Azure Kubernetes-kluster
  • Länka en AI-berikningspipeline till den distribuerade modellen
  • Mata in utdata från distribuerad modell som en anpassad färdighet

Viktigt

Den här färdigheten är i offentlig förhandsversion under kompletterande användningsvillkor. Rest-API:et för förhandsversion stöder den här färdigheten.

Förutsättningar

  • Azure-prenumeration – hämta en kostnadsfri prenumeration.
  • Kognitiv tjänsten Search
  • Cognitive Services-resurs
  • Azure Storage-konto)
  • Azure Machine Learning-arbetsyta

Installation

  • Klona eller ladda ned innehållet i exempellagringsplatsen.
  • Extrahera innehåll om nedladdningen är en zip-fil. Kontrollera att filerna är skrivskyddade.
  • När du konfigurerar Azure-konton och -tjänster kopierar du namn och nycklar till en textfil som är enkel att komma åt. Namn och nycklar läggs till i den första cellen i notebook-filen där variabler för åtkomst till Azure-tjänsterna definieras.
  • Om du inte känner till Azure Machine Learning och dess krav vill du granska dessa dokument innan du börjar:
  • Konfigurera en utvecklingsmiljö för Azure Machine Learning
  • Skapa och hantera Azure Machine Learning-arbetsytor i Azure Portal
  • När du konfigurerar utvecklingsmiljön för Azure Machine Learning bör du överväga att använda den molnbaserade beräkningsinstansen för att snabbt och enkelt komma igång.
  • Ladda upp datamängdsfilen till en container i lagringskontot. Den större filen är nödvändig om du vill utföra träningssteget i anteckningsboken. Om du föredrar att hoppa över träningssteget rekommenderas den mindre filen.

Öppna notebook-filen och anslut till Azure-tjänster

  1. Placera all nödvändig information för variablerna som tillåter åtkomst till Azure-tjänsterna i den första cellen och kör cellen.
  2. Om du kör den andra cellen bekräftas att du har anslutit till söktjänsten för din prenumeration.
  3. Avsnitt 1.1–1.5 skapar söktjänstens datalager, kompetensuppsättning, index och indexerare.

Nu kan du välja att hoppa över stegen för att skapa träningsdatauppsättningen och experimentera i Azure Machine Learning och hoppa direkt till att registrera de två modeller som finns i mappen models på GitHub-lagringsplatsen. Om du hoppar över de här stegen går du vidare till avsnitt 3.5 i notebook-filen och skriver bedömningsskriptet. Detta sparar tid. datahämtnings- och uppladdningsstegen kan ta upp till 30 minuter att slutföra.

Skapa och träna modellerna

Avsnitt 2 har sex celler som laddar ned handskeinbäddningsfilen från lagringsplatsen nlp-recept. Efter nedladdningen laddas filen upp till Azure Machine Learning-datalagret. Den .zip filen handlar om 2G och det tar lite tid att utföra dessa uppgifter. När träningsdata har laddats upp extraheras de och nu är du redo att gå vidare till avsnitt 3.

Träna den aspektbaserade attitydmodellen och distribuera slutpunkten

Avsnitt 3 i notebook-filen tränar de modeller som skapades i avsnitt 2, registrerar dessa modeller och distribuerar dem som en slutpunkt i ett Azure Kubernetes-kluster. Om du inte är bekant med Azure Kubernetes rekommenderar vi starkt att du läser följande artiklar innan du försöker skapa ett slutsatsdragningskluster:

Det kan ta upp till 30 minuter att skapa och distribuera slutsatsdragningsklustret. Vi rekommenderar att du testar webbtjänsten innan du går vidare till de sista stegen, uppdaterar din kompetensuppsättning och kör indexeraren.

Uppdatera kompetensuppsättningen

Avsnitt 4 i notebook-filen har fyra celler som uppdaterar kompetensuppsättningen och indexeraren. Du kan också använda portalen för att välja och tillämpa den nya färdigheten på kompetensuppsättningen och sedan köra indexeraren för att uppdatera söktjänsten.

I portalen går du till Kompetensuppsättning och väljer länken Kompetensuppsättningsdefinition (JSON). Portalen visar JSON för din kompetensuppsättning som skapades i de första cellerna i anteckningsboken. Till höger om skärmen finns en nedrullningsbara meny där du kan välja mallen för färdighetsdefinition. Välj mallen Azure Machine Learning (AML). ange namnet på Azure ML-arbetsytan och slutpunkten för modellen som distribuerats till slutsatsdragningsklustret. Mallen uppdateras med slutpunkts-URI och nyckel.

Definitionsmall för kompetensuppsättning

Kopiera kompetensuppsättningsmallen från fönstret och klistra in den i definitionen för kompetensuppsättningen till vänster. Redigera mallen för att ange saknade värden för:

  • Name
  • Beskrivning
  • Kontext
  • Namn och källa för indata
  • Namn på utdata och targetName

Spara kompetensuppsättningen.

När du har sparat kompetensuppsättningen går du till indexeraren och väljer länken Indexerdefinition (JSON). Portalen visar JSON för indexeraren som skapades i de första cellerna i anteckningsboken. Mappningarna av utdatafält måste uppdateras med ytterligare fältmappningar för att säkerställa att indexeraren kan hantera och skicka dem korrekt. Spara ändringarna och välj sedan Kör.

Rensa resurser

När du arbetar i din egen prenumeration kan det dock vara klokt att i slutet av ett projekt kontrollera om du fortfarande behöver de resurser som du skapade. Resurser som fortsätter att köras kostar pengar. Du kan ta bort resurser individuellt eller ta bort resursgruppen om du vill ta bort hela uppsättningen resurser.

Du hittar och hanterar resurser i portalen med hjälp av länken Alla resurser eller Resursgrupper i det vänstra navigeringsfönstret.

Om du använder en kostnadsfri tjänst bör du komma ihåg att du är begränsad till tre index, indexerare och datakällor. Du kan ta bort enskilda objekt i portalen för att hålla dig under gränsen.