Sdílet prostřednictvím


Co je nového ve službě SQL Server Machine Learning Services?

platí pro: SQL Server 2016 (13.x) a novější verze

Tento článek popisuje, jaké nové funkce a funkce jsou součástí každé verze služby SQL Server Machine Learning Services. Funkce strojového učení se přidají do SQL Serveru v každé verzi, protože pokračujeme v rozšiřování, rozšiřování a prohlubování integrace mezi datovou platformou, pokročilou analýzou a datovými vědami.

Poznámka

Možnosti funkce a možnosti instalace se liší mezi verzemi SQL Serveru. Pomocí rozevíracího seznamu selektoru verzí zvolte odpovídající verzi SQL Serveru.

Novinka v SQL Serveru 2022

Počínaje SQL Serverem 2022 (16.x) se moduly runtime pro R, Python a Java už s instalací SQL nenainstalují. Místo toho nainstalujte požadované vlastní runtimy a balíčky. Další informace najdete v tématu Instalace služby SQL Server 2022 Machine Learning Services (Python a R) ve Windows nebo Instalace služby SQL Server Machine Learning Services (Python a R) v Linuxu.

Novinka v SQL Serveru 2019

Tato verze přidává nejžádané funkce pro operace strojového učení v Pythonu a R na SQL Serveru. Další informace o všech funkcích v této verzi najdete v tématu Co je nového v SQL Serveru 2019 a poznámky k vydání SQL Serveru 2019.

Co je nového dokumentace k Javě a C# v SQL Serveru 2019, najdete v tématu Co je nového v sql Server Language Extensions?.

Níže jsou uvedené nové funkce pro SQL Server Machine Learning Services, které jsou dostupné na Windows i Linuxu:

Novinka v SQL Serveru 2017

Tato verze přidává podporu Pythonu a špičkové algoritmy strojového učení. Přejmenováno tak, aby odráželo nový obor, SQL Server 2017 označuje zavedení služby SQL Server Machine Learning Services (In-Database), s jazykovou podporou pro Python i R.

Informace o všech oznámeních o funkcích najdete v tématu Co je nového v SQL Serveru 2017.

Vylepšení jazyka R

Komponenta R služby SQL Server Machine Learning Services je příští generace služeb SQL Server 2016 R Services s aktualizovanými verzemi base R, RevoScaler a dalšími balíčky.

Mezi nové možnosti R patří správa balíčků, zahrnující , s následujícími zvýrazněnými body:

Knihovny jazyka R

Balíček Popis
MicrosoftML V této verzi je MicrosoftML součástí výchozí instalace jazyka R a eliminuje krok upgradu vyžadovaný v předchozích službách SQL Server 2016 R. MicrosoftML poskytuje nejmodernější algoritmy strojového učení a transformace dat, které je možné škálovat nebo spouštět ve vzdálených výpočetních kontextech. Algoritmy zahrnují přizpůsobitelné hluboké neurální sítě, rychlé rozhodovací stromy a rozhodovací doménové struktury, lineární regresi a logistickou regresi.

Integrace Pythonu pro analýzu v databázi

Python je jazyk, který nabízí velkou flexibilitu a výkon pro různé úlohy strojového učení. Opensourcové knihovny pro Python zahrnují několik platforem pro přizpůsobitelné neurální sítě a také oblíbené knihovny pro zpracování přirozeného jazyka.

Vzhledem k tomu, že je Python integrovaný s databázovým strojem, můžete analýzy udržovat blízko dat a eliminovat náklady a bezpečnostní rizika spojená s přesunem dat. Řešení strojového učení můžete nasadit na základě Pythonu pomocí nástrojů, jako je Visual Studio. Produkční aplikace můžou získat předpovědi, modely nebo vizuály z modulu runtime Python 3.5 pomocí metod přístupu k datům SQL Serveru.

Integrace T-SQL a Pythonu se podporuje prostřednictvím uložené procedury sp_execute_external_script systému. Pomocí této uložené procedury můžete volat libovolný kód Pythonu. Kód běží v zabezpečené a duální architektuře, která umožňuje nasazení modelů Pythonu na podnikové úrovni a skriptů, které lze volat z aplikace pomocí jednoduché uložené procedury. Další zvýšení výkonu se dosahuje streamováním dat z SQL do procesů Pythonu a paralelizací okruhu MPI.

Funkci T-SQL PREDICT můžete použít k provedení nativního bodování u předem natrénovaného modelu, který byl dříve uložen v požadovaném binárním formátu.

Knihovny Pythonu

Balíček Popis
revoscalepy Python ekvivalent RevoScaleR Můžete vytvářet modely Pythonu pro lineární a logistickou regresi, rozhodovací stromy, posílené stromy a náhodné doménové struktury, všechny paralelizovatelné a schopné běžet ve vzdálených výpočetních kontextech. Tento balíček podporuje použití více zdrojů dat a vzdálených výpočetních kontextů. Datový vědec nebo vývojář může spouštět kód Pythonu na vzdáleném SQL Serveru a zkoumat data nebo vytvářet modely bez přesunu dat.
microsoftml Ekvivalent Pythonu balíčku MicrosoftML R

Předem natrénované modely

předem natrénované modely jsou k dispozici pro Python i R. Tyto modely můžete použít k rozpoznávání obrázků a analýze pozitivního negativního mínění k vygenerování předpovědí na vlastních datech.

Samostatný server jako sdílená funkce v instalaci SQL Serveru

Tato verze také přidává SQL Server Machine Learning Server (samostatný), plně nezávislý server datových věd, který podporuje statistické a prediktivní analýzy v R a Pythonu. Stejně jako u R Services je tento server další verzí SQL Serveru 2016 R Server (samostatně). Se samostatným serverem můžete distribuovat a škálovat řešení R nebo Python bez závislostí na SQL Serveru.

Novinka v SQL Serveru 2016

Tato verze zavedla funkce strojového učení do SQL Serveru prostřednictvím služby SQL Server 2016 R Services, což je analytický nástroj v rámci databáze ke zpracování skriptů jazyka R na rezidentních datech v instanci databázového stroje.

Kromě toho byl SQL Server 2016 R Server (samostatný) vydán jako způsob instalace R Serveru na Windows Server. Instalační program SQL Serveru zpočátku poskytoval jediný způsob instalace R Serveru pro Windows. V pozdějších verzích můžou vývojáři a datoví vědci, kteří chtěli R Server ve Windows použít k dosažení stejného cíle jiný samostatný instalační program. Samostatný server v SYSTÉMU SQL Server je funkčně ekvivalentní samostatnému serveru produktu Microsoft R Server pro Windows.

Informace o všech oznámeních o funkcích najdete v tématu Co je nového v SQL Serveru 2016.

Uvolnit Aktualizace funkcí
Doplňky CU bodování v reálném čase spoléhá na nativní knihovny C++ ke čtení modelu uloženého v optimalizovaném binárním formátu a následné generování predikcí bez nutnosti volat modul runtime jazyka R. Díky tomu jsou operace vyhodnocování mnohem rychlejší. Při vyhodnocování v reálném čase můžete spustit uloženou proceduru nebo provést bodování v reálném čase z kódu R. Bodování v reálném čase je také k dispozici pro SQL Server 2016, pokud je instance upgradována na nejnovější verzi Microsoft R Serveru.
Počáteční verze integrace jazyka R pro analýzy v databázi.

Balíčky R pro volání funkcí jazyka R v jazyce T-SQL a naopak Funkce RevoScaleR poskytují analýzu R ve velkém měřítku tím, že data rozdělují do částí komponent, koordinují a spravují distribuované zpracování a agregují výsledky. Ve službě SQL Server 2016 R Services (In-Database) je modul RevoScaleR integrován s instancí databázového stroje, což spojuje data a analýzy ve stejném kontextu zpracování.

Integrace T-SQL a R prostřednictvím sp_execute_external_script. Pomocí této uložené procedury můžete volat jakýkoli kód R. Tato zabezpečená infrastruktura umožňuje nasazení modelů Rn na podnikové úrovni a skriptů, které lze volat z aplikace pomocí jednoduché uložené procedury. Další zvýšení výkonu se dosahuje streamováním dat z procesů SQL do R a paralelizací okruhu MPI.

Funkci T-SQL PREDICT můžete použít k provedení nativního hodnocení předem natrénovaného modelu, který byl dříve uložen do požadovaného binárního formátu.

Podpora Linuxu

SQL Server 2019 přidává podporu Linuxu pro R a Python při instalaci balíčků strojového učení s instancí databázového stroje. Další informace najdete v tématu Instalace služby SQL Server Machine Learning Services v systému Linux.

Na Linuxu nemá SQL Server 2017 integraci s jazykem R nebo Python, ale můžete použít nativní vyhodnocování na Linuxu, protože tato funkce je dostupná prostřednictvím T-SQL PREDICT, který běží na Linuxu. Nativní bodování umožňuje vysoce výkonné bodování z předem natrénovaného modelu bez volání nebo dokonce vyžadování modulu runtime R.

Další kroky