Co je nového ve službě SQL Server Machine Learning Services?
platí pro: SQL Server 2016 (13.x) a novější verze
Tento článek popisuje, jaké nové funkce a funkce jsou součástí každé verze služby SQL Server Machine Learning Services. Funkce strojového učení se přidají do SQL Serveru v každé verzi, protože pokračujeme v rozšiřování, rozšiřování a prohlubování integrace mezi datovou platformou, pokročilou analýzou a datovými vědami.
Poznámka
Možnosti funkce a možnosti instalace se liší mezi verzemi SQL Serveru. Pomocí rozevíracího seznamu selektoru verzí zvolte odpovídající verzi SQL Serveru.
Novinka v SQL Serveru 2022
Počínaje SQL Serverem 2022 (16.x) se moduly runtime pro R, Python a Java už s instalací SQL nenainstalují. Místo toho nainstalujte požadované vlastní runtimy a balíčky. Další informace najdete v tématu Instalace služby SQL Server 2022 Machine Learning Services (Python a R) ve Windows nebo Instalace služby SQL Server Machine Learning Services (Python a R) v Linuxu.
Novinka v SQL Serveru 2019
Tato verze přidává nejžádané funkce pro operace strojového učení v Pythonu a R na SQL Serveru. Další informace o všech funkcích v této verzi najdete v tématu Co je nového v SQL Serveru 2019 a poznámky k vydání SQL Serveru 2019.
Co je nového dokumentace k Javě a C# v SQL Serveru 2019, najdete v tématu Co je nového v sql Server Language Extensions?.
Níže jsou uvedené nové funkce pro SQL Server Machine Learning Services, které jsou dostupné na Windows i Linuxu:
- Podpora platformy Linux byla přidána ve službě Machine Learning Services pro Python a R. Začínáme s Instalace služby SQL Server Machine Learning Services v Linuxu.
- Připojení zpětné smyčky k SQL Serveru ze skriptu v jazyce Python nebo R.
- CREATE EXTERNAL LIBRARY (Transact-SQL) pro práci s Pythonem a R.
- sp_execute_external_script zavádí dva nové parametry, které umožňují snadno vygenerovat více modelů z dělených dat. Více informací se dozvíte v tomto návodu o vytváření modelů založených na oddílech v jazyce R.
- Podpora převzetí služeb při selhání clusteru je dostupná pro službu Launchpad, pokud je spuštěna služba SQL Server Launchpad na všech uzlech. Další informace najdete v tématu instalace clusteru převzetí služeb při selhání SQL Serveru.
- Změny mechanismu izolace pro službu Machine Learning Services Další informace najdete v tématu SQL Server 2019 ve Windows: Změny izolace pro službu Machine Learning Services.
Novinka v SQL Serveru 2017
Tato verze přidává podporu Pythonu a špičkové algoritmy strojového učení. Přejmenováno tak, aby odráželo nový obor, SQL Server 2017 označuje zavedení služby SQL Server Machine Learning Services (In-Database), s jazykovou podporou pro Python i R.
Informace o všech oznámeních o funkcích najdete v tématu Co je nového v SQL Serveru 2017.
Vylepšení jazyka R
Komponenta R služby SQL Server Machine Learning Services je příští generace služeb SQL Server 2016 R Services s aktualizovanými verzemi base R, RevoScaler a dalšími balíčky.
Mezi nové možnosti R patří správa balíčků, zahrnující , s následujícími zvýrazněnými body:
- Databázové role pomáhají správcům DBA spravovat balíčky a přiřazovat oprávnění k instalaci balíčku.
- VYTVOŘIT EXTERNÍ KNIHOVNu pomáhá DBA spravovat balíčky ve známém jazyce T-SQL.
- funkce RevoScaleR pomáhají instalovat, odebírat nebo vypisovat balíčky vlastněné uživateli. Další informace naleznete v tématu Použití funkcí RevoScaleR k vyhledání nebo instalaci balíčků R na SQL Server.
Knihovny jazyka R
Balíček | Popis |
---|---|
MicrosoftML | V této verzi je MicrosoftML součástí výchozí instalace jazyka R a eliminuje krok upgradu vyžadovaný v předchozích službách SQL Server 2016 R. MicrosoftML poskytuje nejmodernější algoritmy strojového učení a transformace dat, které je možné škálovat nebo spouštět ve vzdálených výpočetních kontextech. Algoritmy zahrnují přizpůsobitelné hluboké neurální sítě, rychlé rozhodovací stromy a rozhodovací doménové struktury, lineární regresi a logistickou regresi. |
Integrace Pythonu pro analýzu v databázi
Python je jazyk, který nabízí velkou flexibilitu a výkon pro různé úlohy strojového učení. Opensourcové knihovny pro Python zahrnují několik platforem pro přizpůsobitelné neurální sítě a také oblíbené knihovny pro zpracování přirozeného jazyka.
Vzhledem k tomu, že je Python integrovaný s databázovým strojem, můžete analýzy udržovat blízko dat a eliminovat náklady a bezpečnostní rizika spojená s přesunem dat. Řešení strojového učení můžete nasadit na základě Pythonu pomocí nástrojů, jako je Visual Studio. Produkční aplikace můžou získat předpovědi, modely nebo vizuály z modulu runtime Python 3.5 pomocí metod přístupu k datům SQL Serveru.
Integrace T-SQL a Pythonu se podporuje prostřednictvím uložené procedury sp_execute_external_script systému. Pomocí této uložené procedury můžete volat libovolný kód Pythonu. Kód běží v zabezpečené a duální architektuře, která umožňuje nasazení modelů Pythonu na podnikové úrovni a skriptů, které lze volat z aplikace pomocí jednoduché uložené procedury. Další zvýšení výkonu se dosahuje streamováním dat z SQL do procesů Pythonu a paralelizací okruhu MPI.
Funkci T-SQL PREDICT můžete použít k provedení nativního bodování u předem natrénovaného modelu, který byl dříve uložen v požadovaném binárním formátu.
Knihovny Pythonu
Balíček | Popis |
---|---|
revoscalepy | Python ekvivalent RevoScaleR Můžete vytvářet modely Pythonu pro lineární a logistickou regresi, rozhodovací stromy, posílené stromy a náhodné doménové struktury, všechny paralelizovatelné a schopné běžet ve vzdálených výpočetních kontextech. Tento balíček podporuje použití více zdrojů dat a vzdálených výpočetních kontextů. Datový vědec nebo vývojář může spouštět kód Pythonu na vzdáleném SQL Serveru a zkoumat data nebo vytvářet modely bez přesunu dat. |
microsoftml | Ekvivalent Pythonu balíčku MicrosoftML R |
Předem natrénované modely
předem natrénované modely jsou k dispozici pro Python i R. Tyto modely můžete použít k rozpoznávání obrázků a analýze pozitivního negativního mínění k vygenerování předpovědí na vlastních datech.
Samostatný server jako sdílená funkce v instalaci SQL Serveru
Tato verze také přidává SQL Server Machine Learning Server (samostatný), plně nezávislý server datových věd, který podporuje statistické a prediktivní analýzy v R a Pythonu. Stejně jako u R Services je tento server další verzí SQL Serveru 2016 R Server (samostatně). Se samostatným serverem můžete distribuovat a škálovat řešení R nebo Python bez závislostí na SQL Serveru.
Novinka v SQL Serveru 2016
Tato verze zavedla funkce strojového učení do SQL Serveru prostřednictvím služby SQL Server 2016 R Services, což je analytický nástroj v rámci databáze ke zpracování skriptů jazyka R na rezidentních datech v instanci databázového stroje.
Kromě toho byl SQL Server 2016 R Server (samostatný) vydán jako způsob instalace R Serveru na Windows Server. Instalační program SQL Serveru zpočátku poskytoval jediný způsob instalace R Serveru pro Windows. V pozdějších verzích můžou vývojáři a datoví vědci, kteří chtěli R Server ve Windows použít k dosažení stejného cíle jiný samostatný instalační program. Samostatný server v SYSTÉMU SQL Server je funkčně ekvivalentní samostatnému serveru produktu Microsoft R Server pro Windows.
Informace o všech oznámeních o funkcích najdete v tématu Co je nového v SQL Serveru 2016.
Uvolnit | Aktualizace funkcí |
---|---|
Doplňky CU | bodování v reálném čase spoléhá na nativní knihovny C++ ke čtení modelu uloženého v optimalizovaném binárním formátu a následné generování predikcí bez nutnosti volat modul runtime jazyka R. Díky tomu jsou operace vyhodnocování mnohem rychlejší. Při vyhodnocování v reálném čase můžete spustit uloženou proceduru nebo provést bodování v reálném čase z kódu R. Bodování v reálném čase je také k dispozici pro SQL Server 2016, pokud je instance upgradována na nejnovější verzi Microsoft R Serveru. |
Počáteční verze | integrace jazyka R pro analýzy v databázi. Balíčky R pro volání funkcí jazyka R v jazyce T-SQL a naopak Funkce RevoScaleR poskytují analýzu R ve velkém měřítku tím, že data rozdělují do částí komponent, koordinují a spravují distribuované zpracování a agregují výsledky. Ve službě SQL Server 2016 R Services (In-Database) je modul RevoScaleR integrován s instancí databázového stroje, což spojuje data a analýzy ve stejném kontextu zpracování. Integrace T-SQL a R prostřednictvím sp_execute_external_script. Pomocí této uložené procedury můžete volat jakýkoli kód R. Tato zabezpečená infrastruktura umožňuje nasazení modelů Rn na podnikové úrovni a skriptů, které lze volat z aplikace pomocí jednoduché uložené procedury. Další zvýšení výkonu se dosahuje streamováním dat z procesů SQL do R a paralelizací okruhu MPI. Funkci T-SQL PREDICT můžete použít k provedení nativního hodnocení předem natrénovaného modelu, který byl dříve uložen do požadovaného binárního formátu. |
Podpora Linuxu
SQL Server 2019 přidává podporu Linuxu pro R a Python při instalaci balíčků strojového učení s instancí databázového stroje. Další informace najdete v tématu Instalace služby SQL Server Machine Learning Services v systému Linux.
Na Linuxu nemá SQL Server 2017 integraci s jazykem R nebo Python, ale můžete použít nativní vyhodnocování na Linuxu, protože tato funkce je dostupná prostřednictvím T-SQL PREDICT, který běží na Linuxu. Nativní bodování umožňuje vysoce výkonné bodování z předem natrénovaného modelu bez volání nebo dokonce vyžadování modulu runtime R.