Transformace počtu sloučení
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vytvoří sadu funkcí založenou na tabulce počtů.
kategorie: Učení s počty
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak použít modul transformace počtu sloučení v aplikaci Machine Learning Studio (classic) ke kombinování dvou sad funkcí založených na počtu. Sloučením dvou sad souvisejících počtů a funkcí můžete potenciálně zlepšit pokrytí a distribuci funkcí.
počty Učení jsou zvláště užitečné u velkých datových sad s funkcemi s vysokou mohutnosti. Možnost zkombinovat více datových sad do sad funkcí založených na počtu bez nutnosti opětovného zpracování datových sad usnadňuje shromažďování statistik u velmi rozsáhlých datových sad a jejich použití pro nové datové sady. Například tabulky Count lze použít ke shromažďování informací z terabajtů dat. Tyto statistiky můžete znovu použít ke zlepšení přesnosti prediktivních modelů v malých datových sadách.
Chcete-li sloučit dvě sady funkcí založených na počtu, je nutné tyto funkce vytvořit pomocí tabulek, které mají stejné schéma: to znamená, že obě sady musí používat stejné sloupce a mají stejné názvy a datové typy.
Jak nakonfigurovat transformaci počtu sloučení
Chcete-li použít transformaci počtu sloučení, je nutné vytvořit alespoň jednu transformaci na základě počtu a tato transformace musí být ve vašem pracovním prostoru přítomna. Pokud jste uložili transformaci na základě počtu na jiný experiment, podívejte se do skupiny transformes . Pokud jste v aktuálním experimentu vytvořili transformaci, připojte výstupy následujících modulů:
Vytvoří transformaci výpočtu. Vytvoří novou transformaci založenou na počtu ze zdrojových dat.
Změňte parametry tabulky Count. Převezme existující transformaci Count jako vstup a výstupem aktualizovanou transformaci.
Tabulka Count importu Tento modul podporuje zpětnou kompatibilitu se staršími experimenty, které používaly učení na základě počtu. Pokud jste použili tabulku Count importů k analýze distribuce hodnot v datové sadě a následně jste převedli hodnoty na funkce pomocí modulu využívaného čítače Featurizer, použijte k převedení výsledků na transformaci tabulku Count import .
Přidejte modul transformace počtu sloučení do experimentu a připojte transformaci ke každému vstupu.
Tip
Druhá transformace je nepovinný vstup – stejnou transformaci můžete propojit dvakrát nebo se na druhém vstupním portu připojit nic.
Pokud nechcete, aby druhá datová sada byla stejně jako první, zadejte hodnotu pro faktor Decay. Hodnota, kterou zadáte, určuje, jak má být sada funkcí z druhé transformace vážená.
Například výchozí hodnota 1 závaží obě sady funkcí rovnoměrně. Hodnota 0,5 znamená, že funkce ve druhé sadě budou mít v první sadě poloviční váhu.
Volitelně můžete přidat instanci modulu použít transformaci a použít transformaci na datovou sadu.
Příklady
Příklady toho, jak se tento modul používá, najdete v Azure AI Gallery:
Učení with counts: binární klasifikace: ukazuje, jak používat moduly učení s počty, abyste vygenerovali funkce ze sloupců hodnot kategorií pro binární klasifikační model.
Učení with counts: třída NYC taxislužby data: ukazuje, jak používat moduly učení s počty pro provádění klasifikace s více třídami na veřejně dostupné datové sadě NYC taxislužby. Ukázka používá k modelování tohoto problému více tříd logistické regrese.
Učení with counts: binární klasifikace s NYC taxislužby daty: ukazuje, jak používat moduly učení s počty pro provádění binární klasifikace na veřejně dostupné datové sadě NYC taxislužby. Ukázka používá ke modelování problému se dvěma třídami logistické regrese.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Transformace předchozí inventury | Rozhraní ITransform | Transformace počítání k úpravě |
Nová transformace počítání | Rozhraní ITransform | Počítání transformace, která se má přidat (volitelné) |
Parametry modulu
Název | Typ | Rozsah | Volitelné | Description | Výchozí |
---|---|---|---|---|---|
Faktor Decay | Float | Vyžadováno | 1,0 f | Faktor Decay, který se má vynásobit při počítání transformaci na správném vstupním portu |
Výstupy
Název | Typ | Description |
---|---|---|
Sloučená transformace počítání | Rozhraní ITransform | Sloučená transformace |
Výjimky
Výjimka | Description |
---|---|
Chyba 0003 | K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné. |
Chyba 0086 | K výjimce dojde, pokud je transformace počítání neplatná. |