Sdílet prostřednictvím


Transformace pro výběr sloupců

Tento článek popisuje, jak používat komponentu Select Columns Transform v návrháři služby Azure Machine Learning. Účelem komponenty Transformace výběrových sloupců je zajistit, aby se v podřízených operacích strojového učení používala předvídatelná konzistentní sada sloupců.

Tato komponenta je užitečná pro úlohy, jako je bodování, které vyžadují konkrétní sloupce. Změny v dostupných sloupcích můžou kanál přerušit nebo změnit výsledky.

K vytvoření a uložení sady sloupců použijete transformaci vybrat sloupce. Potom použijte komponentu Použít transformaci k použití těchto výběrů na nová data.

Jak používat transformaci Vybrat sloupce

Tento scénář předpokládá, že chcete použít výběr funkcí k vygenerování dynamické sady sloupců, které se použijí pro trénování modelu. Pokud chcete zajistit, aby výběry sloupců byly pro proces vyhodnocování stejné, použijte komponentu Select Columns Transform (Transformace sloupců) k zachycení výběrů sloupců a jejich použití jinde v kanálu.

  1. Přidejte do kanálu vstupní datovou sadu v návrháři.

  2. Přidejte instanci výběru funkce na základě filtru.

  3. Připojte komponenty a nakonfigurujte komponentu výběru funkcí, aby automaticky našla řadu nejlepších funkcí ve vstupní datové sadě.

  4. Přidejte instanci modelu trénování a jako vstup pro trénování použijte výstup výběru funkcí na základě filtru.

    Důležité

    Vzhledem k tomu, že důležitost funkce je založená na hodnotách ve sloupci, nemůžete předem vědět, které sloupce mohou být dostupné pro vstup do trénování modelu.

  5. Připojte instanci komponenty Select Columns Transform.

    Tento krok vygeneruje výběr sloupce jako transformaci, kterou lze uložit nebo použít u jiných datových sad. Tento krok zajistí, že sloupce identifikované ve výběru funkce budou uloženy pro další součásti, které se mají znovu použít.

  6. Přidejte komponentu Určení skóre modelu .

    Nepřipojí vstupní datovou sadu. Místo toho přidejte komponentu Použít transformaci a propojte výstup transformace výběru funkce.

    Struktura kanálu by měla vypadat takto:

    Ukázkový kanál

    Důležité

    U datové sady bodování nemůžete očekávat použití výběru funkcí na základě filtru a získání stejných výsledků. Vzhledem k tomu, že výběr funkce je založený na hodnotách, může zvolit jinou sadu sloupců, což by způsobilo selhání operace vyhodnocování.

  7. Odešlete kanál.

Tento proces ukládání a následného použití výběru sloupce zajišťuje, že pro trénování a vyhodnocování je k dispozici stejné schéma dat.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.