ClassificationModels type
Definuje hodnoty pro ClassificationModels.
KnownClassificationModels lze použít zaměnitelně s ClassificationModels, tento výčet obsahuje známé hodnoty, které služba podporuje.
Známé hodnoty podporované službou
LogisticRegression: Logistická regrese je základní klasifikační technika.
Patří do skupiny lineárních klasifikátorů a je poněkud podobná polynomické a lineární regresi.
Logistická regrese je rychlá a relativně nekomplikovaná a je vhodná pro interpretaci výsledků.
I když se jedná v podstatě o metodu pro binární klasifikaci, lze ji použít také u problémů s více třídami.
SGD: SGD: Stochastic gradientní sestup je optimalizační algoritmus, který se často používá v aplikacích strojového učení k nalezení parametrů modelu, které odpovídají nejlepšímu přizpůsobení mezi predikovanými a skutečnými výstupy.
MultinomialNaiveBayes: Multinomický klasifikátor Naive Bayes je vhodný pro klasifikaci s diskrétními funkcemi (např. počet slov pro klasifikaci textu).
Multinomické rozdělení obvykle vyžaduje celočíselné počty funkcí. V praxi ale můžou fungovat i zlomkové počty, jako je tf-idf.
BernoulliNaiveBayes: Klasifikátor Naive Bayes pro multivariate Bernoulli modely.
SVM: Model svm (support vector machine) je model strojového učení pod dohledem, který používá klasifikační algoritmy pro problémy klasifikace se dvěma skupinami.
Po udělení sady modelů SVM s označenými trénovacími daty pro každou kategorii budou moct kategorizovat nový text.
linearSVM: Model SVM (Support Vector Machine) je model strojového učení pod dohledem, který používá klasifikační algoritmy pro problémy klasifikace se dvěma skupinami.
Po udělení sady modelů SVM s označenými trénovacími daty pro každou kategorii budou moct kategorizovat nový text.
Lineární SVM funguje nejlépe, když jsou vstupní data lineární, tj. data lze snadno klasifikovat nakreslením přímky mezi klasifikovanými hodnotami v vykresleném grafu.
KNN: Algoritmus K-nejbližších sousedů (KNN) používá k predikci hodnot nových datových bodů "podobnost funkce", což dále znamená, že nový datový bod bude přiřazen hodnotu na základě toho, jak přesně odpovídá bodům v trénovací sadě.
DecisionTree: Rozhodovací stromy představují metodu učení, která není parametrická pod dohledem, která se používá pro úlohy klasifikace i regrese.
Cílem je vytvořit model, který predikuje hodnotu cílové proměnné učením jednoduchých rozhodovacích pravidel odvozených z datových funkcí.
RandomForest: Náhodná doménová struktura je algoritmus učení pod dohledem.
"Les", který vytváří, je soubor rozhodovacích stromů, obvykle trénovaný metodou "sáček".
Obecná myšlenka metody baggingu spočívá v tom, že kombinace modelů učení zvyšuje celkový výsledek.
ExtremeRandomTrees: Extreme Trees je algoritmus strojového učení, který kombinuje předpovědi z mnoha rozhodovacích stromů. Souvisí s široce používaným algoritmem náhodné doménové struktury.
LightGBM: LightGBM je architektura pro zvýšení přechodu, která používá algoritmy učení založené na stromech.
GradientBoosting: Technika přenášení týdenních učení do silného učení se nazývá Boosting. Proces přechodu podporující algoritmus funguje na této teorii provádění.
XGBoostClassifier: XGBoost: Extreme Gradient Boosting Algorithm. Tento algoritmus se používá pro strukturovaná data, kde je možné hodnoty cílového sloupce rozdělit na odlišné hodnoty tříd.
type ClassificationModels = string