Machine Learning – vlak
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek popisuje moduly poskytované v Machine Learning studiu (classic) pro školení modelu strojového učení. Školení je proces analýzy vstupních dat pomocí parametrů předdefinovaného modelu. Z této analýzy model seznámí vzory a ukládá je ve formě poučeného modelu.
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
tento článek také popisuje celkový proces v Machine Learning studiu (classic) pro vytváření modelů, školení, vyhodnocení a bodování.
Vytváření a používání modelů strojového učení
Typický pracovní postup pro Machine Learning zahrnuje tyto fáze:
- Výběr vhodného algoritmu a nastavení počátečních možností.
- Školení modelu na kompatibilních datech.
- Vytváření předpovědi pomocí nových dat na základě vzorů v modelu.
- Vyhodnotili jste model, abyste zjistili, jestli je předpovědi přesné a kolik chyb má, a pokud existuje nějaké přeložení.
Machine Learning Studio (classic) podporuje flexibilní, přizpůsobitelnou architekturu pro strojové učení. Každý úkol v tomto procesu provádí konkrétní typ modulu, který je možné upravit, přidat nebo odebrat, aniž by došlo k porušení zbytku experimentu.
Moduly v této kategorii podporují školení pro různé typy modelů. Během školení se data analyzují pomocí algoritmu strojového učení. Tento algoritmus analyzuje rozdělení a typ dat, zkompiluje statistiku a vytváří vzory, které lze použít později pro předpověď.
Další informace o školení modelů
když Machine Learning provádí školení modelu, řádky s chybějícími hodnotami se přeskočí. Proto pokud chcete hodnoty opravit ručně, použijte imputace nebo zadejte jinou metodu pro zpracování chybějících hodnot, před školením datové sady použijte modul Vyčištění chybějících dat .
K opravě dalších problémů s daty doporučujeme použít modul Upravit metadata . Možná budete muset označit sloupec popisku, změnit datové typy nebo opravit názvy sloupců.
Pro další běžné úlohy čištění dat, jako je normalizace, vzorkování, binningu a škálování, se podívejte na kategorii transformace dat .
Výběr pravého traineru
Metoda, kterou použijete pro výuku modelu, závisí na typu vytvářeného modelu a na typu dat, která model vyžaduje. Machine Learning například poskytuje moduly specificky pro školení modelů detekce anomálií, modelů doporučení a dalších.
Zkontrolujte seznam školicích modulů , abyste zjistili, který z nich je pro váš scénář správný.
Pokud si nejste jistí, jaké nejlepší parametry použít při výuce modelu, použijte jeden z modulů, které jsou k dispozici pro mazání a ověřování parametrů:
Laditelné parametry modelu mohou pro téměř všechny klasifikace a regresní modely provádět úklid parametrů. Navlakuje více modelů a potom vrátí nejlepší model.
Modul pro čištění clusterů podporuje ladění modelu během procesu školení a je určen pouze pro použití s modely clusteringu. Můžete určit rozsah centroids a při automatickém zjišťování nejlepších parametrů vyškolit data.
Modul model křížové validace je také užitečný pro optimalizaci modelu, ale nevrací školený model. Místo toho poskytuje metriky, které můžete použít k určení nejlepšího modelu.
Přeučování modelů
Pokud potřebujete přeškolit produkční model, můžete experiment kdykoli znovu spustit.
Proces přeškolení můžete také automatizovat pomocí webových služeb. návod najdete v tématu přeškolení a aktualizace Machine Learningch modelů pomocí Azure Data Factory.
Použití předvlakových modelů
Machine Learning obsahuje některé modely, které jsou předinstalované, jako je například předvlakovaná klasifikační modul imagí . Tyto modely můžete použít pro vyhodnocování bez dalšího vstupu dat.
Některé moduly (například detekce anomálií časové řady) negenerují trained model ve formátu iLearner. Ale přebírají data školení a vytvoří model interně, který je možné použít k vytvoření předpovědi. Pokud je chcete použít, stačí nakonfigurovat parametry a poskytnout data.
Uložení snímku vyučeného modelu
Pokud chcete model Uložit nebo exportovat, klikněte pravým tlačítkem na školicí modul a vyberte Uložit jako trained model. Model se exportuje do formátu iLearner a uloží se do vašeho pracovního prostoru pod vyškolené modely. Vyškolené modely se dají znovu použít v jiných experimentech nebo připojené k jiným modulům pro účely bodování.
Můžete také použít modul vyškolený model zátěže v experimentu k načtení uloženého modelu.
Seznam modulů
Kategorie vlaků zahrnuje tyto moduly:
- Clustering pro čištění: provádí v modelu clusteringu pro určení optimálního nastavení parametrů a vlaky nejlepšího modelu.
- Model detekce anomálií vlaku: vlaky model detektoru anomálií a data popisků ze sady školení.
- Model clusteringu: vlaky model clusteringu a přiřadí data ze školicí sady do clusterů.
- Matchbox doporučení pro vlaky: vlaky bayesovského rozhodování doporučit pomocí algoritmu Matchbox.
- Vlakový model: vlaky model klasifikace nebo regrese ze sady školení.
- Ladit parametry modelu: provádí Sweep parametrů v modelu regrese nebo klasifikace pro určení optimálního nastavení parametrů a vlaky nejlepšího modelu.
Související úlohy
Některé moduly nejsou v této kategorii, protože vyžadují speciální formát nebo jsou přizpůsobené pro konkrétní úlohu:
- Trénování modelu detekce anomálií
- Výuka pro dostupné verze 7-4
- Výuka pro dostupné verze 7-10
- Výuka pro dostupné verze 8
- Model LDA (Latent Dirichlet Allocation)