Transformace dat – škálování a zmenšení
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek popisuje moduly v aplikaci Machine Learning Studio (classic), které vám pomůžou pracovat s numerickými daty. V případě strojového učení zahrnují běžné datové úlohy ořezové, binningu a normalizace číselných hodnot. Ostatní moduly podporují snížení rozměru.
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Modelování číselných dat
Úlohy jako normalizace, binningu nebo redistribuce číselných proměnných jsou důležitou součástí přípravy dat pro strojové učení. Moduly v této skupině podporují následující úkoly přípravy dat:
- Seskupení dat do přihrádek s různou velikostí nebo distribucí.
- Odebírají se odlehlé hodnoty nebo mění jejich hodnoty.
- Normalizace sady číselných hodnot do konkrétního rozsahu.
- Vytváření kompaktní sady sloupců funkcí z datové sady s vysokou dimenzí.
Související úlohy
- Vyberte relevantní a užitečné funkce, které se použijí při sestavování modelu: použijte Výběr funkcí nebo moduly lineárního naDiscriminantho analýzy pro rybáře .
- vyberte funkce na základě počtu hodnot: použijte modul Učení s počty .
- Odeberte nebo nahraďte chybějící hodnoty: použijte modul Vyčištění chybějících dat .
- Nahraďte hodnoty kategorií číselnými hodnotami, které jsou odvozeny z výpočtů: použijte modul nahradit diskrétní hodnoty .
- Vypočítat rozdělení pravděpodobnosti pro diskrétní nebo číselné sloupce: použijte modul funkce vyhodnotit pravděpodobnost .
- Filtrování a transformace digitálních signálů a signálů: použijte modul Filter .
Seznam modulů
Tato transformace dat – rozsah a snížení kategorie obsahují následující moduly:
- Hodnoty oříznutí: detekuje odlehlé hodnoty a potom klipy nebo nahradí jejich hodnoty.
- Seskupit data do přihrádek: vloží do přihrádek číselná data.
- Normalizovat data: přeškáluje číselná data, aby se omezily hodnoty datových sad na rozsah Standard.
- Analýza hlavní komponenty: vypočítá sadu funkcí, které mají omezenou dimenzionální kapacitu pro efektivnější vzdělávání.