Počítač Two-Class Bayes Point
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vytvoří binární klasifikační model počítače Bayes Point
kategorie: Machine Learning/inicializovat Model/klasifikace
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak použít modul Bayesho počítače se dvěma třídami v Machine Learning studiu (classic) k vytvoření nevýukového modelu binární klasifikace.
Algoritmus v tomto modulu používá bayesovského rozhodování přístup k lineární klasifikaci s názvem "Bayes Point Machine". Tento algoritmus efektivně seblíží teoreticky optimální bayesovského rozhodování průměr lineárních klasifikátorů (z hlediska výkonu generalizace) výběrem jednoho "průměrného" klasifikátoru, Bayesho bodu. Vzhledem k tomu, že počítač s bodem Bayes je model klasifikace bayesovského rozhodování, není náchylný k přemístění do školicích dat.
další informace najdete v příspěvku chrisho Bishop na blogu k Microsoft Machine Learning: přechodu nejistota pravděpodobnostní – odvození.
Jak nakonfigurovat Two-Class počítač s Bayes bodem
v Machine Learning studiu (classic) přidejte do experimentu modul Bayes Point-to-Class . modul najdete pod Machine Learning, inicializací modelu, klasifikace.
Pro počet iterací cvičenízadejte číslo, které určuje, jak často se algoritmus předávání zpráv v školicích datech opakuje. Obvykle by počet iterací měl být nastaven na hodnotu v rozsahu 5 – 100.
Čím vyšší je počet iterací cvičení, tím přesnější je předpovědi; školení ale bude pomalejší.
U většiny datových sad je výchozí nastavení 30 výukových iterací dostačující pro to, aby algoritmus mohl zajistit přesné předpovědi. Někdy je možné provést přesné předpovědi pomocí menšího počtu iterací. U datových sad s vysoce korelačními funkcemi můžete těžit z dalších cvičení.
Pokud chcete, aby se do každé instance v rámci školení a předpovědi přidala konstantní funkce nebo posun, vyberte možnost Zahrnout bias.
Zahrnutí bias je nezbytné, pokud data ještě neobsahují konstantní funkci.
Tuto možnost vyberte, pokud chcete vytvořit skupinu pro neznámé hodnoty, Povolte v funkcích kategorií neznámé hodnoty.
Pokud zrušíte výběr této možnosti, může model přijímat pouze hodnoty, které jsou obsaženy v školicích datech.
Pokud vyberete tuto možnost a povolíte neznámé hodnoty, model může být pro známé hodnoty méně přesný, ale může poskytovat lepší předpovědi pro nové (neznámé) hodnoty.
Přidejte instanci modulu vlakového modelu a školicí data.
Připojení školicích dat a výstupu modulu Bayesho bodu dvou tříd do modulu vlakového modelu a vyberte sloupec popisek.
Spusťte experiment.
Výsledky
Po dokončení školení klikněte pravým tlačítkem na výstup modulu vlak model a zobrazte výsledky:
Pokud chcete zobrazit souhrn parametrů modelu spolu s váhy funkcí zjištěnými ze školení, vyberte vizualizovat.
Pokud chcete model Uložit pro pozdější použití, klikněte pravým tlačítkem myši na výstup modelu výukya vyberte Uložit jako trained model.
K provedení předpovědi použijte trained model jako vstup do modulu určení skóre modelu .
Nevýukový model lze také předat modelu křížového ověřování pro křížové ověřování proti označené datové sadě.
Příklady
Pokud chcete zjistit, jak se počítač Two-Class Bayes bodu používá ve službě Machine Learning, přečtěte si tyto ukázkové experimenty v Azure AI Gallery:
- Porovnání binárních klasifikátorů: Tato ukázka demonstruje použití více klasifikátorů se dvěma třídami.
Technické poznámky
Tato část obsahuje podrobné informace o implementaci a nejčastější dotazy týkající se tohoto algoritmu.
Podrobnosti z původního výzkumu a základní teoretickosti jsou k dispozici v tomto dokumentu (PDF): počítače Bayes Point, Herbert, Graepe a Campbell
Tato implementace ale vylepšuje původní algoritmus několika způsoby:
Používá očekávaný algoritmus pro předávání zpráv šíření. Další informace najdete v tématu rodina algoritmů pro přibližnou odvození bayesovského rozhodování.
Parametr Sweep není povinný.
Tato metoda nevyžaduje normalizování dat.
Tato vylepšení umožňují model klasifikace počítače Bayes Point robustnější a snazší použití a můžete obejít časově náročný krok ladění parametrů.
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Počet iterací cvičení | >= 1 | Integer | 30 | Zadejte počet iterací, které se mají použít při výuce. |
Zahrnout posun | Všechny | Logická hodnota | Ano | Označuje, zda by měla být do každé instance přidána konstantní funkce nebo bias. |
Povolení neznámých hodnot ve funkcích kategorií | Všechny | Logická hodnota | Ano | Pokud má hodnotu true, vytvoří další úroveň pro každý sloupec kategorií. Všechny úrovně v testovací sadě, které nejsou k dispozici v datové sadě školení, jsou namapovány na tuto další úroveň. |
Výstup
Název | Typ | Description |
---|---|---|
Nevlakový model | Rozhraní ILearner | Nevýukový binární klasifikační model |