Ruční zadávání dat
Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.
Pomocí komponenty Zadat data ručně vytvořte malou datovou sadu zadáním hodnot. Datová sada může mít více sloupců.
Tato komponenta může být užitečná ve scénářích, jako jsou:
- Generování malé sady hodnot pro testování
- Vytvoření krátkého seznamu popisků
- Zadejte seznam názvů sloupců, které chcete vložit do datové sady.
Vytvoření datové sady
Přidejte do kanálu komponentu Zadat data ručně . Tuto komponentu najdete v kategorii Vstup a výstup dat ve službě Azure Machine Learning.
U datového formátu vyberte jednu z následujících možností. Tyto možnosti určují, jak mají být data, která zadáte, analyzována. Požadavky na každý formát se výrazně liší, proto si nezapomeňte přečíst související témata.
- ARFF: Formát souboru relačního atributu, který používá Weka.
- CSV: Formát hodnot oddělených čárkami Další informace najdete v tématu Převod na CSV.
- SVMLight: Formát používaný Vowpal Wabbitem a dalšími architekturami strojového učení
- TSV: Formát hodnot oddělených tabulátory
Pokud zvolíte formát a nezadáte data splňující specifikace formátu, dojde k chybě za běhu.
Kliknutím do textového pole Data začněte zadávat data. Následující formáty vyžadují zvláštní pozornost:
CSV: Pokud chcete vytvořit více sloupců, vložte text oddělený čárkami nebo zadejte více sloupců pomocí čárek mezi poli.
Pokud vyberete možnost HasHeader , můžete jako záhlaví sloupce použít první řádek hodnot.
Pokud tuto možnost zrušíte, použijí se názvy sloupců (Col1, Col2 atd.). Názvy sloupců můžete později přidat nebo změnit pomocí možnosti Upravit metadata.
TSV: Pokud chcete vytvořit více sloupců, vložte text oddělený tabulátorem nebo zadejte více sloupců pomocí tabulátoru mezi poli.
Pokud vyberete možnost HasHeader , můžete jako záhlaví sloupce použít první řádek hodnot.
Pokud tuto možnost zrušíte, použijí se názvy sloupců (Col1, Col2 atd.). Názvy sloupců můžete později přidat nebo změnit pomocí možnosti Upravit metadata.
ARFF: Vložte existující soubor formátu ARFF. Pokud zadáváte hodnoty přímo, nezapomeňte na začátek dat přidat volitelná pole záhlaví a požadovaných atributů.
Do jednoduchého seznamu lze například přidat následující záhlaví a řádky atributů. Záhlaví sloupce by bylo
SampleText
. Všimněte si, že typ String není podporován.% Title: SampleText.ARFF % Source: Enter Data component @ATTRIBUTE SampleText NUMERIC @DATA \<type first data row here>
SVMLight: Zadejte nebo vložte hodnoty pomocí formátu SVMLight.
Například následující ukázka představuje první pár řádků datové sady Dar krve ve formátu SVMLight:
# features are [Recency], [Frequency], [Monetary], [Time] 1 1:2 2:50 3:12500 4:98 1 1:0 2:13 3:3250 4:28
Při spuštění komponenty Zadat data ručně se tyto řádky převedou na datovou sadu sloupců a hodnot indexu následujícím způsobem:
Sloupec 1 Sloupec 2 Sloupec 3 Sloupec 4 Popisky 0.00016 0,004 0.999961 0.00784 0 0 0,004 0.999955 0.008615 0
Po každém řádku vyberte klávesu Enter, aby se spustil nový řádek.
Pokud vyberete klávesu Enter několikrát a přidáte několik prázdných koncových řádků, prázdné řádky se odeberou nebo oříznou.
Pokud vytváříte řádky s chybějícími hodnotami, můžete je kdykoli později vyfiltrovat.
Připojte výstupní port k jiným komponentám a spusťte kanál.
Pokud chcete datovou sadu zobrazit, klikněte pravým tlačítkem myši na komponentu a vyberte Vizualizovat.
Další kroky
Podívejte se na sadu komponent dostupných pro Azure Machine Learning.