Trénování modelu
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Navlakuje model klasifikace nebo regrese v dohledovém režimu.
kategorie: Machine Learning/výuka
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak používat modul vlakového modelu v Machine Learning studiu (classic) pro výuku modelu klasifikace nebo regrese. Školení proběhne po definování modelu a nastavení jeho parametrů a vyžaduje označení dat. Pomocí výukového modelu můžete také přeškolovat stávající model s novými daty.
Jak proces školení funguje
v Machine Learning je vytváření a používání modelu strojového učení obvykle proces tří kroků.
Nakonfigurujete model, výběrem konkrétního typu algoritmu a definováním jeho parametrů nebo parametrů. Vyberte některý z následujících typů modelů:
- Klasifikační modelyzaložené na neuronovéch sítích, rozhodovacích stromů a doménových strukturách a dalších algoritmech.
- Regresní modely, které mohou zahrnovat standardní lineární regresi nebo které používají jiné algoritmy, včetně neuronovéch sítí a Baysian regrese.
Poskytněte datovou sadu, která je označena a má data kompatibilní s algoritmem. Připojení dat i modelu pro výuku modelu.
Jaké školení vytváří konkrétní binární formát, iLearner, který zapouzdřuje statistické vzorce získané z dat. Tento formát nejde změnit přímo ani číst. Nicméně jiné moduly v aplikaci Studio (Classic) mohou používat tento vycvičený model.
Můžete také zobrazit vlastnosti modelu. Další informace najdete v části s výsledky .
Po dokončení školení použijte školicí model s jedním z modulů pro vyhodnocovánía předpovědi se na nová data.
Poznámka
Další specializované úkoly strojového učení vyžadují různé metody školení a Studio (Classic) poskytuje pro ně samostatné školicí moduly. Například detekce imagí, clusteringu a anomálie detction využívají vlastní školicí metody. Model výuky je určený jenom pro použití s regresí a klasifikačními modely.
Pod dohledem a bez dohledu školení
Je možné, že jste si vyslyšeli výrazy pod dohledem nebo bez dohledu nad učením. Školení modelu klasifikace nebo regrese pomocí modelu výuky je klasickým příkladem strojového učení pod dohledem. To znamená, že musíte poskytnout datovou sadu, která obsahuje historická data, ze kterých se naučíte vzory. Data by měla obsahovat výsledek (popisek), který se pokoušíte odhadnout, a související faktory (proměnné). Model strojového učení potřebuje výsledky pro určení funkcí, které nejlépe vypovídají výsledky.
Během procesu školení se data seřadí podle výsledků a algoritmus získá statistické vzory pro sestavování modelu.
Učení bez dohledu znamená, že výsledek není znám, nebo pokud se rozhodnete nepoužívat známé popisky. Například algoritmy clusteringu obvykle využívají bezdohledné metody učení, ale mohou používat popisky, pokud jsou k dispozici. Dalším příkladem je modelování tématu pomocí LDA. Pomocí těchto algoritmů nelze model výuky použít.
Tip
Začínáte se strojovým učením? Tento kurz vás provede procesem získání dat, konfigurací algoritmu, školením a následným použitím modelu: Vytvoření prvního experimentu machine learningu
Jak používat model výuky
v Machine Learning studiu (classic) nakonfigurujte model klasifikace nebo modely regresních modelů.
Můžete také vytvořit vlastní model vytvořený pomocí modelu vytvoření R.
Přidejte modul vlakového modelu do experimentu. tento modul můžete najít v kategorii Machine Learning . Rozbalte položku vlaka přetáhněte modul vlakového modelu do experimentu.
Na levém vstupu připojte nev nevýukovém režimu. Připojte datovou sadu ke správnému vstupu modelu výuky.
Datová sada školení musí obsahovat sloupec popisku. Všechny řádky bez popisků jsou ignorovány.
U sloupce popisekklikněte na Spustit selektor sloupcůa vyberte jeden sloupec obsahující výsledky, které model může použít pro školení.
Pro problémy s klasifikací musí sloupec popisku obsahovat buď hodnoty kategorií nebo diskrétní hodnoty. Některé příklady mohou být hodnocení typu Ano/bez, kód klasifikace choroby nebo název nebo skupina pro příjem. Pokud vyberete sloupec noncategorical, modul během školení vrátí chybu.
V případě regresních problémů musí sloupec popisku obsahovat Číselná data, která představují proměnnou odpovědi. V ideálním případě číselná data představují souvislý rozsah.
Příkladem může být skóre úvěrového rizika, předpokládaný čas k selhání pevného disku nebo předpokládaný počet volání centra volání v daném dni nebo čase. Pokud nevyberete číselný sloupec, může se zobrazit chyba.
- pokud neurčíte, který sloupec popisku použít, Machine Learning se pokusí odvodit, který je příslušným sloupcem popisku, pomocí metadat datové sady. Pokud se sloupec vybere jako špatný, můžete ho opravit pomocí voliče sloupců.
Tip
Pokud máte potíže s použitím voliče sloupců, přečtěte si článek Výběr sloupců v datové sadě pro tipy. Popisuje několik běžných scénářů a tipů k používání pravidel s pravidly a možnostmi názvu .
Spusťte experiment. Pokud máte velké množství dat, může to chvíli trvat.
Výsledky
Po vyškolení modelu:
Pokud chcete zobrazit parametry modelu a váhy funkcí, klikněte pravým tlačítkem na výstup a vyberte vizualizovat.
Pokud chcete model použít v jiných experimentech, klikněte pravým tlačítkem na model a vyberte Uložit model. Zadejte název modelu.
Tím se model uloží jako snímek, který není aktualizován opakovanými běhy experimentu.
Pokud chcete model použít při předvídání nových hodnot, připojte ho k modulu skóre modelu spolu s novými vstupními daty.
Související úlohy
Pokud potřebujete vytvořit typ modelu, který není podporován modelem výuky, existuje několik možností:
Vytvořte vlastní metodu bodování pomocí skriptu jazyka R nebo použijte jeden z mnoha dostupných balíčků pro vyhodnocování R.
Psaní vlastního skriptu Pythonu pro výuku a hodnocení modelu nebo použití existující knihovny Pythonu:
Modely detekce anomálií
- Model detekce anomálií vlaků podporuje moduly detekce anomálií v studiu (Classic).
Modely doporučení
Modely clusteringu
Pro zahrnutý algoritmus K použijte model clusteringu pro vlak .
Pro jiné modely clusteringu použijte skripty R nebo moduly Python Script ke konfiguraci a vytváření výukových modelů.
Příklady
Příklady toho, jak se modul vlakového modelu používá při experimentech machine learningu, najdete v následujících experimentech v Azure AI Gallery:
- Prognózování maloobchodního prodeje: Ukazuje, jak sestavit, vytrénovat a porovnat více modelů.
- Předpověď zpoždění letů: Ukazuje, jak trénovat více souvisejících klasifikačních modelů.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Model bez trénování | ILearner – rozhraní | Nevytrénovaný learner |
Datová sada | Tabulka dat | Data pro trénink |
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Sloupec Popisek | Libovolný | Výběr sloupce | Vyberte sloupec, který obsahuje sloupec popisku nebo výsledku. |
Výstupy
Název | Typ | Description |
---|---|---|
Natrénovaný model | ILearner – rozhraní | Natrénovaný učení |
Výjimky
Seznam všech chyb modulů najdete v tématu Kódy chyb modulů.
Výjimka | Description |
---|---|
Chyba 0032 | K výjimce dojde, pokud argument není číslo. |
Chyba 0033 | K výjimce dojde, pokud je argument nekonečno. |
Chyba 0083 | K výjimce dochází v případě, že datovou sadu použitou pro trénování nelze použít pro konkrétní typ výuky. |
Chyba 0035 | K výjimce dochází v případě, že pro daného uživatele nebo položku nebyly k dispozici žádné funkce. |
Chyba 0003 | K výjimce dochází v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdný. |
Chyba 0020 | K výjimce dochází v případě, že je počet sloupců v některých datových sadách předaný modulu příliš malý. |
Chyba 0021 | K výjimce dochází v případě, že je počet řádků v některých datových sadách předaný modulu příliš malý. |
Chyba 0013 | K výjimce dochází v případě, že je předaný modulu learneru neplatný typ. |