Sdílet prostřednictvím


Pro dostupné verze 8 modelu skóre

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vyhodnotí data pomocí strojového výukového systému pro dostupné z rozhraní příkazového řádku.

kategorie: Analýza textu

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak použít modul skóre pro dostupné verze 8 v Machine Learning studiu (classic) k vygenerování skóre pro sadu vstupních dat pomocí existujícího modelu pro dostupné.

Tento modul poskytuje nejnovější verzi rozhraní pro dostupné Framework verze 8. Tento modul použijte k určení skóre dat pomocí výukového modelu uloženého ve formátu VW verze 8.

Pokud jste vytvořili existující modely pomocí starší verze, použijte tyto moduly:

Postup konfigurace skóre pro dostupné model 8

  1. Přidejte modul skóre pro dostupné verze 8 do experimentu.

  2. Přidejte vyškolený model dostupné pro a připojte ho k portu pro vstup na levé straně. Můžete použít vyškolený model vytvořený ve stejném experimentu nebo vyhledat uložený model ve skupině proškolené modely v levém navigačním podokně aplikace Studio (Classic). model ale musí být dostupný v Machine Learning studiu (classic); nemůžete přímo načíst model z Azure storage.

    Poznámka

    Podporují se jenom modely pro dostupné 8. uložené modely, které byly vyškoleny pomocí jiných algoritmů, nelze propojit a nelze použít modely, které byly vyškoleny pomocí dřívějších verzí.

  3. Do textového pole argumenty VW zadejte sadu platných argumentů příkazového řádku pro spustitelný soubor pro dostupné.

    informace o tom, které argumenty pro dostupné jsou v Machine Learning podporované a nepodporované, najdete v části technické poznámky .

  4. Klikněte na zadat datový typa v seznamu vyberte jeden z podporovaných datových typů.

    Bodování vyžaduje jeden sloupec dat kompatibilních s VW.

    pokud máte existující soubor, který byl vytvořený ve formátech SVMLight nebo VW, můžete ho načíst do pracovního prostoru Azure ML jako novou datovou sadu v jednom z těchto formátů: Generic CSV bez hlavičky, TSV bez hlavičky.

    Možnost VW vyžaduje, aby byl popisek přítomen, ale není použit ve vyhodnocování s výjimkou porovnání.

  5. Přidejte modul Import dat a připojte ho ke správnému vstupnímu portu skóre pro dostupné verze 8. Nakonfigurujte Import dat pro přístup ke vstupním datům.

    Vstupní data pro bodování musí být připravená předem v jednom z podporovaných formátů a uložená v úložišti objektů BLOB v Azure.

  6. Vyberte možnost a přidejte sloupec navíc obsahující popisky, pokud chcete výstupní popisky spolu s výsledky.

    Obvykle při zpracování textových dat pro dostupné nevyžaduje popisky a vrátí pouze skóre pro každý řádek dat.

  7. Tuto možnost vyberte, pokud chcete výstupovat nezpracované výsledky společně s výsledky, Zahrňte sloupec navíc obsahující nezpracovaná skóre.

    Tip

    Tato možnost je novinkou pro pro dostupné verze 8.

  8. Vyberte možnost, použijte výsledky uložené v mezipaměti, pokud chcete znovu použít výsledky z předchozího běhu, pokud jsou splněné následující podmínky:

    • V předchozím běhu existuje platná mezipaměť.

    • Nastavení vstupních dat a parametrů modulu se od předchozího spuštění nezměnilo.

    V opačném případě se proces importu zopakuje při každém spuštění experimentu.

  9. Spusťte experiment.

Výsledky

Po dokončení školení:

Výstup označuje skóre předpovědi normalizované z 0 na 1.

Příklady

Příklady toho, jak se dá pro dostupné použít ve službě Machine Learning, najdete v Azure AI Gallery:

  • Ukázka pro dostupné

    Tento experiment znázorňuje přípravu, školení a provozuschopnost modelu VW.

Následující video poskytuje návod k procesu školení a bodování pro pro dostupné:

https://azure.microsoft.com/documentation/videos/text-analytics-and-vowpal-wabbit-in-azure-ml-studio/

Technické poznámky

Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.

Parametry

Pro dostupné má mnoho možností příkazového řádku pro výběr a ladění algoritmů. Úplnou diskusi o těchto možnostech tady není možné; doporučujeme zobrazit stránku wikiwebu pro dostupné.

následující parametry nejsou v Machine Learning studiu (classic) podporovány.

  • Možnosti vstupu a výstupu zadané v https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Tyto vlastnosti jsou již modulem konfigurovány automaticky.

  • Kromě toho je zakázána jakákoli možnost, která generuje více výstupů nebo přijímá více vstupů. Mezi ně patří --cbt , --lda a --wap .

  • Podporují se jenom kontrolní algoritmy pro učení pod dohledem. Tato možnost nepovoluje tyto možnosti: –active , --rank , --search atd.

Všechny argumenty kromě těch, které jsou popsané výše, jsou povoleny.

Očekávané vstupy

Název Typ Description
Školený model Rozhraní ILearner Školený učí
Datová sada Tabulka dat Datová sada, která se má skóre

Parametry modulu

Name Rozsah Typ Výchozí Description
Zadat datový typ VW

SVMLight
DataType VW Určuje, jestli je typ souboru SVMLight nebo pro dostupné.
Argumenty VW Libovolný Řetězec žádné Zadejte argumenty pro dostupné. Nezahrnovat-i ani-p nebo-t
Zahrnutí sloupce navíc obsahujícího popisky Pravda/nepravda Logická hodnota false (nepravda) Určete, zda má soubor zip obsahovat popisky s předpovědi
Zahrnout sloupec navíc obsahující nezpracovaná skóre Pravda/nepravda Logická hodnota false (nepravda) Určete, zda má výsledek zahrnovat další sloupce obsahující nezpracovaná skóre (odpovídající raw_predictions).

Výstupy

Název Typ Description
Datová sada výsledků Tabulka dat Datová sada s výsledky předpovědi

Výjimky

Výjimka Description
Chyba 0001 K výjimce dojde v případě, že se nepovedlo najít jeden nebo více zadaných sloupců datové sady.
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0,0004 K výjimce dojde, pokud je parametr menší nebo roven konkrétní hodnotě.
Chyba 0017 K výjimce dojde v případě, že jeden nebo více zadaných sloupců má nepodporovaný typ aktuálním modulem.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Analýza textu
Hashování funkcí
Rozpoznávání pojmenovaných entit
Pro model skóre dostupné 7-4
Pro model dostupné 7-4 pro vlaky
Pro model dostupné 8 pro vlaky
Seznam modulů a-Z