Použití matematických operací
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Použije matematickou operaci na hodnoty sloupce.
Kategorie: statistické funkce
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak použít modul matematické operace v Machine Learning studiu (classic) k vytvoření výpočtů, které se použijí na číselné sloupce vstupní datové sady.
Podporované matematické operace zahrnují běžné aritmetické funkce, jako je násobení a dělení, trigonometrické funkce, celá řada funkcí zaokrouhlení a speciální funkce používané v oblasti datových věd, jako je například hodnota gamma a funkce Error.
Po definování operace a spuštění experimentu jsou hodnoty přidány do datové sady. V závislosti na tom, jak nakonfigurujete modul, můžete:
- Přidejte výsledky do datové sady. To je užitečné zejména při ověřování výsledku operace.
- Nahraďte hodnoty sloupců novými, vypočítanými hodnotami.
- Vygeneruje nový sloupec pro výsledky a nezobrazuje původní data.
Tip
Tento modul provádí jednu matematickou operaci v jednom okamžiku. U složitých matematických operací doporučujeme místo toho používat tyto moduly:
Hledání potřebných operací v těchto kategoriích:
-
Funkce v kategorii Basic lze použít k manipulaci s jednou hodnotou nebo sloupcem hodnot. Například můžete získat absolutní hodnotu všech čísel ve sloupci nebo vypočítat druhou odmocninu každé hodnoty ve sloupci.
-
Funkce v kategorii porovnání jsou použity pro porovnání: můžete provést párové porovnání hodnot ve dvou sloupcích nebo můžete porovnat jednotlivé hodnoty ve sloupci se zadanou konstantou. Můžete například porovnat sloupce a určit, zda byly hodnoty stejné ve dvou datových sadách. Nebo můžete použít konstantu, jako je například maximální povolená hodnota, abyste našli odlehlé hodnoty v číselném sloupci.
-
Tato kategorie zahrnuje základní matematické funkce: sčítání, odčítání, násobení a dělení. Můžete pracovat s buď sloupci, nebo konstantami. Například můžete přidat hodnotu do sloupce A do hodnoty ve sloupci B. Případně můžete z každé hodnoty ve sloupci A odečíst konstantu, jako je například dříve vypočtená střední hodnota.
-
Tato kategorie zahrnuje řadu funkcí pro provádění operací, jako je zaokrouhlení, strop, patra a zkrácení na různé úrovně přesnosti. Můžete určit úroveň přesnosti pro Desítková i celá čísla.
-
Speciální kategorie obsahuje matematické funkce, které jsou obzvláště používány v oblasti datové vědy, jako jsou eliptické integrály a funkce pro chybu Gaussovské.
-
Tato kategorie zahrnuje všechny standardní trigonometrické funkce. Například můžete převést radiány na stupně nebo výpočetní funkce, jako je například Tečna v radiánech nebo stupních. Tyto funkce jsou Unární, což znamená, že přebírají jeden sloupec hodnot jako vstup, aplikují trigonometrické funkci a vrátí sloupec hodnot jako výsledek. Proto je nutné se ujistit, že vstupní sloupec je odpovídající typ a obsahuje správný druh hodnot pro určenou operaci.
Příklady
Příklady použití matematických operacínajdete v těchto ukázkových experimentech v Azure AI Gallery:
Color kvantizační: jedna sada hodnot sloupců je odečtená od druhé a výsledky jsou čtverce.
Předpověď vztahů se zákazníky: konstanta 1 je přidána ke všem hodnotám ve sloupci pro rozlišení nul a chybějících hodnot.
Předpověď zpoždění letu: ukazuje různé operace, včetně zaokrouhlování a dělení.
Přímý marketing: používá operace porovnání k určení, zda skóre pravděpodobnosti splňují požadovanou hodnotu.
Použití operace Apply Math
Modul použití matematické operace vyžaduje datovou sadu, která obsahuje alespoň jeden sloupec obsahující pouze čísla. Čísla mohou být diskrétní nebo souvislá, ale musí být číselného datového typu, nikoli řetězce.
Stejnou operaci můžete použít na několik číselných sloupců, ale všechny sloupce musí být ve stejné datové sadě.
Každá instance tohoto modulu může v jednom okamžiku provádět pouze jeden typ operace. Chcete-li provádět složité matematické operace, může být nutné zřetězit několik instancí modulu použití matematické operace .
Přidejte k experimentu modul použití matematické operace . Tento modul můžete najít v kategorii statistické funkce .
Připojení datovou sadu, která obsahuje alespoň jeden numerický sloupec.
Kliknutím na kategorie vyberte typ matematické operace, která se má provést.
Například chcete-li provést základní aritmetické operace se sloupci, vyberte možnost operace. Pro získání logaritmu nebo stropu vyberte základní. Chcete-li porovnat sloupce hodnot, použijte porovnání.
Tip
Všechny ostatní možnosti se mění v závislosti na typu matematické operace, kterou zvolíte. Jakékoli změny v kategorii také obnoví všechny ostatní možnosti. Proto si nezapomeňte vybrat z kategorie jako první!
Vyberte konkrétní operaci ze seznamu v této kategorii.
Vyberte jeden nebo více zdrojových sloupců, u kterých chcete provést výpočet.
- Libovolný sloupec, který zvolíte, musí být číselný datový typ.
- Rozsah dat musí být platný pro vybranou matematickou operaci. V opačném případě může dojít k chybě nebo NaN (nejedná se o číslo). Například ln (-1,0) je neplatná operace a výsledkem je hodnota
NaN
.
Nastavte další parametry požadované jednotlivými typy operace.
Použijte možnost výstupní režim k určení, jak chcete, aby se vygenerovala Matematická operace:
- Připojit. Do výstupní datové sady jsou zahrnuty všechny sloupce používané jako vstupy a navíc je připojen jeden další sloupec, který obsahuje výsledky matematické operace.
- Na místě. Hodnoty ve sloupcích použitých jako vstupy jsou nahrazeny novými počítanými hodnotami.
- ResultOnly. Vrátí se jeden sloupec obsahující výsledky matematické operace.
Spusťte experiment, nebo klikněte pravým tlačítkem myši pouze na modul použití matematické operace a vyberte možnost Spustit vybrané.
Výsledky
Vygenerujete-li výsledky pomocí možností připojit nebo ResultOnly , budou záhlaví sloupců vrácené datové sady označovat operaci a sloupce, které byly použity. Například pokud porovnáte dva sloupce pomocí operátoru Equals , výsledky budou vypadat takto:
- Equals (Col2_Col1), což značí, že jste otestovali col2 proti sloupci Sloupec1.
- Rovná se (Col2_ $10), což značí, že jste porovnali sloupec 2 s konstantou 10.
I když použijete možnost umístění , zdrojová data se neodstraní ani nezmění. sloupec v původní datové sadě je stále k dispozici v nástroji Studio (Classic). Chcete-li zobrazit původní data, můžete připojit modul Přidat sloupce a spojit ho s výstupem použití matematické operace.
Základní matematické operace
Funkce v základní kategorii obvykle přebírají jednu hodnotu ze sloupce, provádějí předdefinovanou operaci a vracejí jednu hodnotu. Pro některé funkce můžete zadat konstantu jako druhý argument.
Machine Learning podporuje následující funkce v kategorii Základní:
Abs
Vrátí absolutní hodnotu vybraných sloupců.
Atan2
Vrátí inverzní tangens se čtyřmi kvadranty.
Vyberte sloupce, které obsahují souřadnice bodu. Pro druhý argument, který odpovídá souřadnici x, můžete také zadat konstantu.
Odpovídá funkci ATAN2 v Matlabu.
Conj
Vrátí konjug pro hodnoty ve vybraném sloupci.
CubeRoot
Vypočítá kořen datové krychle pro hodnoty ve vybraném sloupci.
DoubleFactorial**
Vypočítá dvojité faktoriály pro hodnoty ve vybraném sloupci. Dvojitý faktoriál je rozšíření normální faktoriální funkce a je označen jako x!!.
Eps
Vrátí velikost mezery mezi aktuální hodnotou a dalším nejvyšším číslem s dvojitou přesností. Odpovídá funkci EPS v Matlabu.
Exp
Vrátí e uvolanou mocí hodnoty ve vybraném sloupci. Je to stejné jako funkce Excel EXP.
Exp2
Vrátí exponenciální hodnotu argumentů se základem 2, která řeší y = x * 2t , kde t je sloupec hodnot obsahujících exponenty.
Pro Exp2 můžete zadat druhý argument x, což může být konstanta nebo jiný sloupec hodnot.
V poli Druhý typ argumentu určete, jestli zadáte násobitel t jako konstantu, nebo hodnotu ve sloupci.
Můžete vybrat jeden sloupec s hodnotami exponentu nebo zadat hodnotu exponentu do textového pole Konstantní druhý argument . Potom v sadě sloupců vyberte sloupec, který obsahuje hodnoty exponentu.
Pokud například vyberete sloupec s hodnotami pro násobitel i {0,1,2,3,4,5} exponent, vrátí funkce {0, 2, 8, 24, 64 160).
ExpMinus1
Vrátí záporný exponent pro hodnoty ve vybraném sloupci.
Faktoriál
Vrátí faktoriální hodnotu pro hodnoty ve vybraném sloupci.
Hypotenuse
Vypočítá hypotenzu trojúhelníku, ve kterém je délka jedné strany zadaná jako sloupec hodnot a délka druhé strany je zadaná jako konstanta nebo jako dva sloupce.
ImaginaryPart
Vrátí imaginární část hodnot ve vybraném sloupci.
Logaritmus
Vrátí přirozený logaritmus pro hodnoty ve vybraném sloupci.
LnPlus1
Vrátí přirozený logaritmus plus jeden pro hodnoty ve vybraném sloupci.
Protokol
Vrátí protokol hodnot ve vybraném sloupci na základě zadaného základu.
Základ (druhý argument) můžete zadat buď jako konstantu, nebo výběrem jiného sloupce hodnot.
Log10
Vrátí logaritmus základu 10 hodnot ve vybraném sloupci.
Protokol 2
Vrátí logaritmus základu 2 pro hodnoty ve vybraném sloupci.
NthRoot
Vrátí n-té kořenové číslo hodnoty pomocí n, který zadáte.
Vyberte sloupce, pro které chcete vypočítat kořen, pomocí možnosti ColumnSet .
V části Druhý typ argumentu vyberte jiný sloupec, který obsahuje kořen, nebo zadejte konstantu, která se má použít jako kořen.
Pokud je druhým argumentem sloupec, použije se každá hodnota ve sloupci jako hodnota n pro odpovídající řádek. Pokud je druhým argumentem konstanta, zadejte hodnotu n do textového pole Druhý argument konstanty .
Pow
Vypočítá X u všech hodnot ve vybraném sloupci na mocnnou hodnotu Y.
Nejprve vyberte sloupce, které obsahují základ, který by měl být float, pomocí možnosti ColumnSet .
V poli Druhý typ argumentu vyberte sloupec, který obsahuje exponent, nebo zadejte konstantu, která se má použít jako exponent.
Pokud je druhým argumentem sloupec, použije se každá hodnota ve sloupci jako exponent pro odpovídající řádek. Pokud je druhým argumentem konstanta, zadejte hodnotu exponentu do textového pole Druhý argument konstanty .
RealPart
Vrátí skutečnou část hodnot ve vybraném sloupci.
Sqrt
Vrátí odmocninu hodnot ve vybraném sloupci.
SqrtPi
Pro každou hodnotu ve vybraném sloupci vynásobí hodnotu pí a pak vrátí odmocninu výsledku.
Square
Umocní hodnoty ve vybraném sloupci na čtverce.
Operace porovnání
Funkce porovnání v nástroji Machine Learning Studio (classic) používejte vždy, když potřebujete vzájemně testovat dvě sady hodnot. Například v experimentu možná budete muset provést tyto operace porovnání:
- Vyhodnotí se sloupec modelu skóre pravděpodobnosti s prahovou hodnotou.
- Určete, jestli jsou dvě sady výsledků stejné, a pro každý jiný řádek přidejte příznak FALSE, který lze použít k dalšímu zpracování nebo filtrování.
EqualTo
Pokud jsou hodnoty stejné, vrátí hodnotu True.
GreaterThan
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší než zadaná konstanta nebo větší než odpovídající hodnoty ve sloupci porovnání.
GreaterThanOrEqualTo
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců větší nebo rovny zadané konstantě, nebo větší než nebo rovno odpovídajícím hodnotám ve sloupci porovnání.
LessThan
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší než zadaná konstanta nebo menší než odpovídající hodnoty ve sloupci porovnání.
LessThanOrEqualTo
Vrátí hodnotu True, pokud jsou hodnoty v sadě sloupců menší nebo rovny zadané konstantě, nebo menší než nebo rovno odpovídajícím hodnotám ve sloupci porovnání.
NotEqualTo
Vrátí hodnotu True, pokud se hodnoty v sadě sloupců nerovnají konstantě nebo srovnávacímu sloupci, a vrátí hodnotu False, pokud jsou stejné.
Pár párůMax
Vrátí hodnotu, která je větší – hodnota v sadě sloupců nebo hodnota ve sloupci konstanty nebo porovnání.
PairMin (Pár min.)
Vrátí menší hodnotu – hodnotu v sadě sloupců nebo hodnotu ve sloupci konstanty nebo porovnání.
Aritmetické operace
Zahrnuje základní aritmetické operace: sčítání a odčítání, dělení a násobení. Vzhledem k tomu, že většina operací je binární a vyžaduje dvě čísla, nejprve zvolíte operaci a pak zvolíte sloupec nebo čísla, které se mají použít v prvním a druhém argumentu.
Pořadí, ve kterém zvolíte sloupce pro dělení a odčítání, se může zdát neintuitivní. Pro snadnější pochopení výsledků ale záhlaví sloupce obsahuje název operace a pořadí, ve kterém byly sloupce použity.
Operace | Num1 | Num2 | Sloupec výsledků | Výsledná hodnota |
---|---|---|---|---|
Sčítání | 1 | 5 | Přidat (Num2_Num1) | 4 |
Násobení | 1 | 5 | Vícenásobný (Num2_Num1) | 5 |
Odčítání | 1 | 5 | Odečíst (Num2_Num1) | 4 |
Odčítání | 0 | 1 | Odečíst (Num2_Num1) | 0 |
Oddělení | 1 | 5 | Dělit (Num2_Num1) | 5 |
Oddělení | 0 | 1 | Dělit (Num2_Num1) | Nekonečno |
Přidání
Určete zdrojové sloupce pomocí sady sloupcůa pak je přidejte do těchto hodnot číslo zadané v argumentu konstantní operace.
Chcete-li přidat hodnoty ve dvou sloupcích, zvolte sloupec nebo sloupce pomocí sady sloupcůa pak vyberte druhý sloupec pomocí argumentu operace.
Dělení
Vydělí hodnoty ve sloupci pomocí konstanty nebo hodnoty sloupce definované v argumentu operace. Jinými slovy, můžete nejprve vybrat dělitele a potom dividendy. Výstupní hodnota je podíl.
Násobení
Vynásobí hodnoty v sadě sloupců zadanými hodnotami konstanty nebo sloupce.
Odčítání
Pomocí rozevíracího seznamu argumentu operace zadejte číslo, které se má odečíst ( subtrahend). Můžete zvolit buď konstantu, nebo sloupec hodnot. Pak určete sloupec hodnot, na kterých se má ( minuend) pracovat, výběrem jiného sloupce pomocí možnosti druhá sada sloupců .
Můžete odečíst konstantu z každé hodnoty ve sloupci hodnot, ale ne zpětnou operaci. K tomu použijte místo toho sčítání.
Operace zaokrouhlení
Studio (Classic) podporuje nejrůznější operace zaokrouhlení. Pro mnoho operací je nutné zadat množství přesnosti, které se má použít při zaokrouhlování. Můžete použít buď statickou úroveň přesnosti, zadanou jako konstantu, nebo můžete použít hodnotu dynamické přesnosti získanou ze sloupce hodnot.
Použijete-li konstantu, nastavte typ přesnosti na konstantní a pak zadejte počet číslic jako celé číslo v textovém poli přesnost konstanty . Pokud zadáte jiné než celé číslo, modul nevyvolává chybu, ale výsledky mohou být neočekávané.
Chcete-li pro každý řádek datové sady použít jinou hodnotu přesnosti, nastavte typ přesnosti na sadou sloupcůa pak vyberte sloupec, který obsahuje odpovídající hodnoty přesnosti.
Ceiling
Vrátí strop pro hodnoty v sadě sloupců.
CeilingPower2
Vrátí čtvercovou mez pro hodnoty v sadě sloupců.
Floor
Vrátí podlahovou hodnotu pro hodnoty ve sloupci nastavenéna zadanou přesnost.
Mod
Vrátí zlomkovou část hodnot v sadě sloupcůna zadanou přesnost.
Podíl
Vrátí zlomkovou část hodnot v sadě sloupcůna zadanou přesnost.
Zbytek
Vrátí zbytek hodnot v sadě sloupců.
RoundDigits
Vrátí hodnoty v sadě sloupcůzaokrouhlené pravidlem 4/5 na zadaný počet číslic.
RoundDown
Vrátí hodnoty v sadě sloupcůzaokrouhlené dolů na zadaný počet číslic.
RoundUp
Vrátí hodnoty v sadě sloupcůzaokrouhlené až na zadaný počet číslic.
ToEven
Vrátí hodnoty v sadě sloupcůzaokrouhlené na nejbližší celé číslo, sudé číslo.
ToOdd
Vrátí hodnoty v sadě sloupcůzaokrouhlené na nejbližší celé, liché číslo.
Truncate
Zkrátí hodnoty v sadě sloupců odebráním všech číslic, které nejsou povoleny zadanou přesností.
Speciální matematické funkce
Tato kategorie zahrnuje specializované matematické funkce často používané v oblasti datových věd. Není-li uvedeno jinak, funkce je unární a vrátí zadaný výpočet pro každou hodnotu ve vybraném sloupci nebo sloupci.
Beta
Vrátí hodnotu funkce beta Eulerova.
EllipticIntegralE
Vrací hodnotu neúplného eliptického integrálu.
EllipticIntegralK
Vrátí hodnotu úplného typu eliptického integrálu (K).
ERF
Vrátí hodnotu funkce Error.
Funkce Error (označovaná také jako funkce Error Gauss) je zvláštní funkcí tvaru sigmoid, který se používá v pravděpodobnosti k popisu difúze.
ERFC –
Vrátí hodnotu doplňkové chybové funkce.
ERFC – je definována jako 1 – ERF (x).
ErfScaled
Vrátí hodnotu funkce s možností horizontálního navýšení kapacity.
Pomocí škálované verze funkce Error lze zabránit aritmetickému podtečení.
ErfInverse
Vrátí hodnotu inverzní funkce ERF.
ExponentialIntegralEin
Vrátí hodnotu exponenciálního integrálu EI.
Hodnot
Vrátí hodnotu funkce gamma.
GammaLn
Vrátí přirozený logaritmus funkce gamma.
GammaRegularizedP
Vrací hodnotu regulární neúplné funkce gamma.
Tato funkce přijímá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedPInverse
Vrátí hodnotu inverzní nekompletní funkce gamma.
Tato funkce přijímá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedQ
Vrací hodnotu regulární neúplné funkce gamma.
Tato funkce přijímá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
GammaRegularizedQInverse
Vrací hodnotu inverzní generalizované neúplné funkce gamma.
Tato funkce přijímá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
Hodnota Gamma
Vrátí hodnotu funkce gamma.
Tato funkce přijímá druhý argument, který lze zadat buď jako konstantu, nebo jako sloupec hodnot.
Trigonometrické funkce
Tato kategorie iIncludes většinu důležitých trigonometrických a inverzních trigonometrických funkcí. Všechny trigonometrické funkce jsou unární a nevyžadují žádné další argumenty.
Acos
Vypočítá Arkus kosinus pro hodnoty sloupce.
AcosDegree
Vypočítá Arkus kosinus hodnot sloupce ve stupních.
Acosh –
Vypočítá Hyperbolický arkuskosinus hodnot sloupců.
Acot
Vypočítá Arkus kotangens hodnot sloupců.
AcotDegrees
Vypočítá Arkus kotangens hodnot sloupce ve stupních.
Acoth
Vypočítá hyperbolický Arkus kotangens hodnot sloupců.
Acsc
Vypočítá arccosecant hodnot sloupců.
AcscDegrees
Vypočítá arccosecant hodnot sloupce ve stupních.
Asec
Vypočítá arcsecant hodnot sloupců.
AsecDegrees
Vypočítá arcsecant hodnot sloupce ve stupních.
Asech
Vypočítá hyperbolický arcsecant hodnot sloupců.
Asin
Vypočítá Arkus sinus hodnot sloupců.
AsinDegrees
Vypočítá Arkus sinus hodnot sloupce ve stupních.
Asinh –
Vypočítá hyperbolický arkussinus pro hodnoty sloupce.
Atan
Vypočítá arkustangens hodnot sloupců.
AtanDegrees
Vypočítá arkustangens hodnot sloupce ve stupních.
Atanh –
Vypočítá hyperbolický arkustangens hodnot sloupců.
Služby
Vrátí funkci s komplexní hodnotou vytvořenou ze sinus a kosinus pomocí definice CIS θ = cos θ + ISIN θ.
Cos
Vypočítá kosinus hodnot sloupců.
CosDegrees
Vypočítá kosinus pro hodnoty sloupce ve stupních.
Cosh
Vypočítá hyperbolický kosinus hodnot sloupců.
Cot
Vypočítá kotangens hodnot sloupců.
CotDegrees
Vypočítá kotangens hodnot sloupců ve stupních.
Coth
Vypočítá hyperbolický kotangens pro hodnoty sloupce.
Soubor
Vypočítá kosekans pro hodnoty sloupce.
CscDegrees
Vypočítá kosekans pro hodnoty sloupce ve stupních.
Csch
Vypočítá hyperbolický kosekans pro hodnoty sloupce.
DegreesToRadians
Převede stupně na radiány.
Přihrádka
Vypočítá sekans hodnot sloupců.
aSecDegrees
Vypočítá sekans pro hodnoty sloupce ve stupních.
aSech
Vypočítá hyperbolický sekans hodnot sloupců.
Znaménko
Vrátí znaménko hodnot sloupce.
Sin
Vypočítá sinus hodnot sloupce.
Sinc
Vypočítá hodnotu hodnoty sloupce ve sinus-kosinus hodnot.
SinDegrees
Vypočítá sinus hodnot sloupce ve stupních.
Sinh
Vypočítá hyperbolický sinus hodnot sloupců.
Tan
Vypočítá tangens hodnot sloupců.
TanDegrees
Vypočítá tangens argumentu ve stupních.
Tanh
Vypočítá hyperbolický tangens hodnot sloupců.
Technické poznámky
Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.
Operace na více sloupcích
Buďte opatrní, když vyberete více než jeden sloupec jako druhý operátor. Výsledky jsou snadno pochopitelné, pokud je operace jednoduchá, například přidání konstanty do všech sloupců.
Předpokládejme, že vaše datová sada má více sloupců a že si ji přidáte do sebe. Ve výsledcích se každý sloupec přidá sám sobě následujícím způsobem:
Num1 | Num2 | Num3 | Add(Num1_Num1) | Add(Num2_Num2) | Add(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Pokud potřebujete provádět složitější výpočty, můžete zřetězovat více instancí matematické operace Apply Math Operation. Můžete například přidat dva sloupce pomocí jedné instance použít matematickou operaci a pak pomocí jiné instance použít matematickou operaci vydělit součet konstantou, která získá střední hodnotu.
Případně můžete použít jeden z následujících modulů k provedení všech výpočtů najednou pomocí skriptu SQL, R nebo Python :
Unární a binární funkce
V unární operaci vytvoříte výpočty založené na hodnotách sloupců bez odkazování na jiné sloupce nebo konstanty.
Můžete například zkrátit hodnoty sloupce na určitou míru přesnosti, zaokrouhlit hodnoty nahoru nebo dolů nebo najít hodnoty mezní hodnoty nebo podlahy.
Příkladem unární operace je Abs(X)
, kde X je sloupec, který je poskytn jako vstup.
V binární operaci zadáte dvě sady hodnot. Prvním argumentem musí být vždy sloupec nebo sada sloupců, zatímco druhým argumentem může být číslo, které zadáte jako konstantu, nebo jiný sloupec.
Příkladem binární operace, která Subtract(X,Y)
používá dva sloupce, je , ve kterém X je první sloupec, který vyberete, a Y je druhý sloupec.
Příkladem použití binární operace, která kombinuje sloupec a Subtract(X,mean)
konstantu, může být , kde zadáte střední hodnotu sloupce jako konstantu a odečtete ho od každé hodnoty ve sloupci X.
Zpracování čísel ve sloupcích kategorií
Podpora kategorických hodnot prezentovaných jako čísla závisí na funkci a na tom, kolik argumentů funkce přebírá.
Pokud vaše operace obsahuje čísla označená jako sloupce kategorií, je možné u hodnot dat kategorií použít unární operaci.
Pokud se na sloupec kategorií použije unární operace, je možné hodnoty dat kategorií vstupního sloupce transformovat tak, aby se rovnaa přidruženým hodnotám dat kategorií výstupního sloupce. V tomto případě jsou hodnoty sloučeny tak, aby počet hodnot dat kategorií ve výstupu byl vždy menší než počet hodnot ve vstupu.
Pokud se binární operace použije na sloupec kategorií a nějaký jiný sloupec, očekávané chování je následující:
Pokud je druhý sloupec silný, výstupní sloupec je kategorický.
Hodnoty dat zařazené do kategorií uvedené ve vstupu se ztratí.
Výstupní sloupec obsahuje pouze hodnoty, které jsou přítomné ve výstupních sloupcových datech.
Pokud je druhý sloupec zhuštěný, výstupní sloupec je zhuštěný.
Pokud jsou oba argumenty binární operace zhuštěné sloupce, výsledný sloupec obsahuje nuly pozadí na všech pozicích, kde oba vstupní sloupce obsahovaly nuly pozadí.
Zpracování řídkých sloupců
V unárních operacích jsou všechny prvky zhuštěných sloupců, které odpovídají nulem na pozadí, ponechány nezpracované.
Pokud je v binárních operacích jeden argument řídký sloupec a druhý argument je zhuštěný sloupec, je výsledný sloupec zhuštěný se všemi nulami pozadí, které se šíří ze vstupu ze řídkého sloupce.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Datová sada | Tabulka dat | Vstupní datová sada |
Výstupy
Název | Typ | Description |
---|---|---|
Datová sada výsledků | Tabulka dat | Datová sada výsledků |