Principy datových věd pro strojové učení

Začátečník
AI Engineer
Data Scientist
Developer
Student
Azure

Microsoft Learn nabízí několik interaktivních způsobů, jak získat úvod do klasického strojového učení. Tyto studijní programy vám zajistí produktivitu sami a jsou také vynikající základnou pro přechod na témata hlubokého učení.

Od nejzákladnějších klasických modelů strojového učení až po průzkumnou analýzu dat a přizpůsobení architektur vás provede jednoduchým přehledným koncepčním obsahem a interaktivními poznámkovými bloky Jupyter, a to vše bez opuštění prohlížeče.

Zvolte si vlastní cestu v závislosti na vašem vzdělání a zájmech.

Možnost 1: Kompletní kurz: Základy datových věd pro strojové učení

Tato cesta se doporučuje pro většinu lidí. Má všechny stejné moduly jako ostatní dva studijní programy s vlastním tokem, který maximalizuje posílení konceptů. Pokud se chcete dozvědět o základních konceptech a o tom, jak se dostat k vytváření modelů pomocí nejběžnějších nástrojů strojového učení, je tento postup určený pro vás. Je to také nejlepší cesta, pokud plánujete přejít nad rámec klasického strojového učení a získat vzdělání v hlubokém učení a neurálních sítích, které zde představíme.

✔ Možnost 2: Principy datových věd pro studijní program strojového učení

Pokud chcete pochopit, jak strojové učení funguje a nemáte moc matematického pozadí, je tento postup určený pro vás. Nevyučuje žádné předpoklady o předchozím vzdělávání (kromě lehké znalosti konceptů kódování) a učí se s kódem, metaforou a vizuálem, které vám poskytnou okamžik ah ha. Je to praktické, ale zaměřuje se spíše na pochopení základů a méně na výkon dostupných nástrojů a knihoven.

✔ Právě jste na této cestě, posuňte se dolů a začněte.

Možnost 3: Studijní program Vytvoření modelů strojového učení

Pokud už máte představu, o čem je strojové učení nebo máte silné matematické pozadí, můžete se nejlépe pustit přímo do studijního programu Vytvořit modely strojového učení. Tyto moduly učí některé koncepty strojového učení, ale rychle se dostanou k výkonu používání nástrojů, jako jsou scikit-learn, TensorFlow a PyTorch. Tento studijní program je také pro vás nejlepší, pokud hledáte jenom dostatek znalosti, abyste porozuměli příkladům strojového učení pro produkty, jako je Azure ML nebo Azure Databricks.

Požadavky

Nic

Moduly v tomto studijním programu

Základní přehled strojového učení pro lidi s malými nebo žádnými znalostmi počítačových věd a statistiky. Seznámíte se s některými základními koncepty, prozkoumáte data a interaktivně si projdete životní cyklus strojového učení pomocí Pythonu k trénování, ukládání a používání modelu strojového učení, stejně jako ve skutečném světě.

Učení pod dohledem je forma strojového učení, kde se algoritmus učí z příkladů dat. Postupně vykreslujeme obrázek toho, jak učení pod dohledem automaticky generuje model, který dokáže vytvářet předpovědi o skutečném světě. Dotkneme se také toho, jak jsou tyto modely testovány, a potíže, které mohou nastat při jejich trénování.

Síla modelů strojového učení vychází z dat, která se používají k jejich trénování. Prostřednictvím obsahu a cvičení prozkoumáme, jak porozumět vašim datům, jak je kódovat, aby ho počítač mohl správně interpretovat, jak vyčistit případné chyby a tipy, které vám pomůžou vytvářet vysoce výkonné modely.

Regrese je pravděpodobně nejpoužívanější technikou strojového učení, která je obvykle základem vědeckých objevů, obchodního plánování a analýz akciového trhu. Tento výukový materiál se zabývá některými běžnými regresními analýzami, jak jednoduchými, tak složitějšími, a poskytuje přehled o tom, jak hodnotit výkon modelu.

Když o strojovém učení přemýšlíme, často se soustředíme na proces trénování. Malé množství přípravy před tímto procesem může nejen urychlit a zlepšit učení, ale také nám dát jistotu o tom, jak dobře budou naše modely fungovat, když čelíme datům, která jsme předtím neviděli.

Klasifikace znamená přiřazování položek do kategorií nebo si také můžete představit automatizované rozhodování. Zde představíme klasifikační modely prostřednictvím logistické regrese a poskytneme vám odrazový můstek ke složitějším a zajímavějším metodám klasifikace.

Složitější modely je často možné přizpůsobit ručně, aby se zlepšila jejich efektivita. Prostřednictvím cvičení a vysvětlujícího obsahu prozkoumáme, jak může změna architektury složitějších modelů přinést efektivnější výsledky.

Jak poznáme, jestli model naše data klasifikuje dobře nebo špatně? Způsob, jakým počítače hodnotí výkon modelu, pro nás někdy může být obtížné pochopit nebo může příliš zjednodušovat chování modelu v reálném světě. Abychom mohli vytvářet modely, které fungují uspokojivě, musíme najít intuitivní způsoby, jak je posoudit, a chápat, jak tyto metriky mohou ovlivnit náš pohled.

Křivky ROC jsou účinným způsobem, jak vyhodnotit a vyladit natrénované klasifikační modely. Seznámíme vás s užitečností těchto křivek a vysvětlíme si je prostřednictvím výukového obsahu a praktických cvičení.