Sdílet prostřednictvím


Výběr sloupců v komponentě Datová sada

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Pomocí této komponenty můžete zvolit podmnožinu sloupců, které se mají použít v podřízených operacích. Komponenta fyzicky neodebere sloupce ze zdrojové datové sady; místo toho vytvoří podmnožinu sloupců, podobně jako zobrazení nebo projekci databáze.

Tato komponenta je užitečná, když potřebujete omezit sloupce dostupné pro podřízenou operaci nebo pokud chcete zmenšit velikost datové sady odebráním nepotřebných sloupců.

Sloupce v datové sadě jsou ve stejném pořadí jako v původních datech, i když je zadáte v jiném pořadí.

Způsob použití

Tato komponenta nemá žádné parametry. Selektor sloupců slouží k výběru sloupců, které chcete zahrnout nebo vyloučit.

Volba sloupců podle názvu

V komponentě je několik možností pro výběr sloupců podle názvu:

  • Filtrování a vyhledávání

    Klikněte na možnost BY NAME .

    Pokud jste připojili datovou sadu, která už je naplněná, měl by se zobrazit seznam dostupných sloupců. Pokud se nezobrazí žádné sloupce, možná budete muset spustit nadřazené komponenty, abyste zobrazili seznam sloupců.

    Pokud chcete seznam filtrovat, zadejte do vyhledávacího pole. Pokud například zadáte písmeno w do vyhledávacího pole, seznam se vyfiltruje tak, aby zobrazoval názvy sloupců, které obsahují písmeno w.

    Vyberte sloupce a kliknutím na tlačítko šipky vpravo přesuňte vybrané sloupce do seznamu v pravém podokně.

    • Pokud chcete vybrat souvislou oblast názvů sloupců, stiskněte shift + kliknutí.
    • Pokud chcete do výběru přidat jednotlivé sloupce, stiskněte ctrl a klikněte.

    Kliknutím na tlačítko zaškrtnutí uložte a zavřete ho.

  • Použití názvů v kombinaci s jinými pravidly

    Klikněte na možnost WITH RULES (PRAVIDLA ).

    Zvolte pravidlo, například zobrazení sloupců konkrétního datového typu.

    Potom klikněte na jednotlivé sloupce daného typu podle názvu a přidejte je do seznamu výběru.

  • Zadejte nebo vložte čárkami oddělený seznam názvů sloupců.

    Pokud je vaše datová sada široká, může být jednodušší používat indexy nebo vygenerované seznamy názvů místo výběru sloupců jednotlivě. Za předpokladu, že jste seznam připravili předem:

    1. Klikněte na možnost WITH RULES (PRAVIDLA ).
    2. Vyberte Žádné sloupce, vyberte Zahrnout a potom klikněte do textového pole s červeným vykřičníkem.
    3. Vložte nebo zadejte čárkami oddělený seznam dříve ověřených názvů sloupců. Komponentu nelze uložit, pokud některý sloupec obsahuje neplatný název, proto nezapomeňte názvy zkontrolovat předem.

    Tuto metodu můžete použít také k určení seznamu sloupců pomocí jejich hodnot indexu.

Zvolit podle typu

Pokud použijete možnost WITH RULES , můžete u výběru sloupce použít více podmínek. Můžete například potřebovat získat pouze sloupce funkcí číselného datového typu.

Možnost ZAČÍT S určuje výchozí bod a je důležitá pro pochopení výsledků.

  • Pokud vyberete možnost VŠECHNY SLOUPCE , všechny sloupce se přidají do seznamu. Potom je nutné použít možnost Vyloučit k odebrání sloupců, které splňují určité podmínky.

    Můžete například začít se všemi sloupci a pak sloupce odebrat podle názvu nebo podle typu.

  • Pokud vyberete možnost ŽÁDNÉ SLOUPCE , začne seznam sloupců prázdný. Pak zadáte podmínky pro přidání sloupců do seznamu.

    Pokud použijete více pravidel, každá podmínka se sčítá. Řekněme například, že začínáte bez sloupců a pak přidáte pravidlo pro získání všech číselných sloupců. V datové sadě Automobile price to vede k 16 sloupcům. Potom kliknutím na + znaménko přidáte novou podmínku a vyberete Zahrnout všechny funkce. Výsledná datová sada obsahuje všechny číselné sloupce a všechny sloupce funkcí, včetně některých sloupců s řetězcovými funkcemi.

Volba podle indexu sloupce

Index sloupce odkazuje na pořadí sloupce v původní datové sadě.

  • Sloupce se číslují postupně od 1.
  • Pokud chcete získat rozsah sloupců, použijte spojovník.
  • Otevřené specifikace, jako 1- jsou nebo -3 nejsou povoleny.
  • Duplicitní hodnoty indexu (nebo názvy sloupců) nejsou povolené a můžou vést k chybě.

Pokud má například vaše datová sada alespoň osm sloupců, můžete vložit některý z následujících příkladů a vrátit několik nesousměrných sloupců:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

konečný příklad nemá za následek chybu; však vrátí jednu instanci sloupce 4.

Změna pořadí sloupců

Možnost Povolit duplikáty a zachovat pořadí sloupců ve výběru začíná prázdným seznamem a přidá sloupce, které zadáte podle názvu nebo indexu. Na rozdíl od jiných možností, které vždy vrací sloupce v jejich přirozeném pořadí, tato možnost vypíše sloupce v pořadí, ve kterém je pojmenujete nebo vypíšete.

Například v datové sadě se sloupci Col1, Col2, Col3 a Col4 můžete obrátit pořadí sloupců a vynechat sloupec 2 zadáním některého z následujících seznamů:

  • Col4, Col3, Col1
  • 4,3,1

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.