Statistické funkce
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek popisuje moduly v Machine Learning studiu (classic), které podporují matematické a statistické operace důležité pro strojové učení. Pokud potřebujete provést v experimentu úkoly, jako je například následující, podívejte se do kategorie statistické funkce :
- Provádět výpočty ad hoc pro hodnoty sloupců, jako je například zaokrouhlování nebo použití absolutní hodnoty.
- Výpočetní prostředky znamenají, logaritmy a další statistiky běžně používané ve strojovém učení.
- Vypočítat korelaci a skóre pravděpodobnosti.
- COMPUTE z – skóre.
- COMPUTE široce používaných statistických distribucí, jako je třeba WEIBULL, Gamma a beta.
- Generování statistických sestav přes sadu sloupců nebo datovou sadu.
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Například pokud máte novou datovou sadu, můžete nejdřív použít modul Shrnutí dat . Generuje sestavu pro celou datovou sadu, která obsahuje standardní statistická opatření, například střední a směrodatnou odchylku.
Pokud budete potřebovat pokročilejší statistiku, jako je například zkosená nebo interquartileá vzdálenost, můžete k vytváření dalších popisných statistik použít modul COMPUTE pro základní statistiky .
Vzhledem k tomu, že moduly generují výsledky pokaždé, když spustíte experiment, výsledky se aktualizují, pokud se data změní.
Seznam modulů
Kategorie statistické funkce zahrnuje následující moduly:
- Použít matematickou operaci: aplikuje matematickou operaci na hodnoty sloupce.
- Základní statistiky COMPUTE: vypočítá zadané souhrnné statistiky pro vybrané sloupce datové sady.
- Lineární korelace COMPUTE: Vypočítá lineární korelaci mezi hodnotami sloupce v datové sadě.
- Vyhodnotit pravděpodobnost funkce: přizpůsobí určenou funkci distribuce pravděpodobnosti objektu DataSet.
- Nahradit diskrétní hodnoty: nahradí diskrétní hodnoty z jednoho sloupce číselnými hodnotami založenými na jiném sloupci.
- Sumarizace dat: vygeneruje základní zprávu o popisných statistikách pro sloupce v datové sadě.
- Test hypotézy pomocí t-test: porovnání znamená ze dvou datových sad pomocí t-test.