Co nowego w usługach SQL Server Machine Learning Services?
Dotyczy: SQL Server 2016 (13.x) i nowsze wersje
W tym artykule opisano nowe możliwości i funkcje zawarte w każdej wersji usług SQL Server Machine Learning Services. Funkcje uczenia maszynowego są dodawane do programu SQL Server w każdej wersji w miarę dalszego rozszerzania, rozszerzania i pogłębienia integracji między platformą danych, zaawansowaną analizą i nauką o danych.
Notatka
Możliwości funkcji i opcje instalacji różnią się w zależności od wersji programu SQL Server. Użyj listy rozwijanej selektora wersji, aby wybrać odpowiednią wersję programu SQL Server.
Nowość w programie SQL Server 2022
Począwszy od programu SQL Server 2022 (16.x), środowiska uruchomieniowe dla języków R, Python i Java nie są już instalowane przy użyciu instalatora SQL. Zamiast tego zainstaluj wszystkie żądane niestandardowe środowiska uruchomieniowe i pakiety. Aby uzyskać więcej informacji, zobacz Instalowanie usług SQL Server 2022 Machine Learning (Python i R) na Windowsie lub Instalowanie usług SQL Server Machine Learning (Python i R) na Linuxie.
Nowość w programie SQL Server 2019
W tej wersji dodano najważniejsze funkcje dla operacji uczenia maszynowego w języku Python i R w programie SQL Server. Aby uzyskać więcej informacji na temat wszystkich funkcji w tej wersji, zobacz "Co nowego w SQL Server 2019" i "Notatki do wydania SQL Server 2019".
Aby uzyskać nową dokumentację dotyczącą języka Java i języka C# w programie SQL Server 2019, zobacz Co nowego w rozszerzeniach języka programu SQL Server?.
Poniżej przedstawiono nowe funkcje usług SQL Server Machine Learning Services dostępne zarówno w windows, jak i Linux:
- Dodano obsługę platformy Linux w usługach Machine Learning Services dla języków Python i R. Rozpocznij od Instalowanie usług SQL Server Machine Learning Services w systemie Linux.
- połączenie sprzężenia zwrotnego z programem SQL Server ze skryptu języka Python lub R.
- TWORZENIE ZEWNĘTRZNEJ BIBLIOTEKI (Transact-SQL) dla języków Python i R.
- W sp_execute_external_script wprowadzono dwa nowe parametry, które umożliwiają łatwe generowanie wielu modeli z partycjonowanych danych. Dowiedz się więcej w tym samouczku Tworzenie modeli opartych na partycjach w języku R.
- Obsługa klastra trybu failover jest dostępna dla usługi Launchpad, pod warunkiem, że usługa programu SQL Server Launchpad jest uruchamiana na wszystkich węzłach. Aby uzyskać więcej informacji, zobacz instalacja klastra failover programu SQL Server.
- Zmiany mechanizmu izolacji dla usług Machine Learning Services. Aby uzyskać więcej informacji, zobacz SQL Server 2019 w systemie Windows: Zmiany izolacji dla usług uczenia maszynowego.
Nowość w programie SQL Server 2017
W tej wersji dodano obsługę języka Python i wiodące w branży algorytmy uczenia maszynowego. Zmieniono nazwę, aby odzwierciedlić nowy zakres, SQL Server 2017 wprowadza usługi SQL Server Machine Learning Services (In-Database), z obsługą dla języków Python i R.
Aby zapoznać się z ogłoszeniami dotyczącymi funkcji, zobacz Co nowego w programie SQL Server 2017.
Ulepszenia języka R
Składnik języka R usług SQL Server Machine Learning Services to następna generacja usług SQL Server 2016 R z zaktualizowanymi wersjami podstawowych pakietów R, RevoScaler i innych.
Nowe możliwości języka R obejmują zarządzanie pakietami, z następującymi najważniejszymi punktami:
- Role bazy danych ułatwiają administratora bazy danych zarządzanie pakietami i przypisywanie uprawnień do instalacji pakietu.
- CREATE EXTERNAL LIBRARY ułatwia administratora bazy danych zarządzanie pakietami w znanym języku T-SQL.
- funkcje RevoScaleR ułatwiają instalowanie, usuwanie lub wyświetlanie listy pakietów należących do użytkowników. Aby uzyskać więcej informacji, zobacz Jak używać funkcji RevoScaleR do znajdowania lub instalowania pakietów języka R w programie SQL Server.
Biblioteki języka R
Pakiet | Opis |
---|---|
MicrosoftML | W tej wersji język MicrosoftML jest uwzględniony w domyślnej instalacji języka R, eliminując krok uaktualniania wymagany w poprzednich usługach SQL Server 2016 R. Rozwiązanie MicrosoftML udostępnia najnowocześniejsze algorytmy uczenia maszynowego i przekształcenia danych, które można skalować lub uruchamiać w zdalnych kontekstach obliczeniowych. Algorytmy obejmują dostosowywalne głębokie sieci neuronowe, szybkie drzewa decyzyjne i lasy decyzyjne, regresję liniową i regresję logistyczną. |
Integracja języka Python z analizą w bazie danych
Python to język, który zapewnia dużą elastyczność i możliwości dla różnych zadań uczenia maszynowego. Biblioteki typu open source dla języka Python obejmują kilka platform do dostosowywania sieci neuronowych, a także popularne biblioteki do przetwarzania języka naturalnego.
Ponieważ język Python jest zintegrowany z aparatem bazy danych, możesz trzymać analizę w pobliżu danych i wyeliminować koszty i zagrożenia bezpieczeństwa związane z przenoszeniem danych. Rozwiązania uczenia maszynowego można wdrażać na podstawie języka Python przy użyciu narzędzi takich jak Visual Studio. Aplikacje produkcyjne mogą uzyskiwać przewidywania, modele lub wizualizacje ze środowiska uruchomieniowego języka Python 3.5 przy użyciu metod dostępu do danych programu SQL Server.
Integracja języków T-SQL i Python jest obsługiwana za pośrednictwem procedury składowanej systemu sp_execute_external_script. Możesz wywołać dowolny kod języka Python przy użyciu tej procedury składowanej. Kod działa w bezpiecznej, podwójnej architekturze, która umożliwia wdrażanie modeli i skryptów języka Python klasy korporacyjnej, które można wywołać z aplikacji przy użyciu prostej procedury składowanej. Dodatkowe zyski wydajności są osiągane przez przesyłanie strumieniowe danych z SQL do procesów Pythona i równoległą obróbkę w pierścieniu MPI.
Za pomocą funkcji T-SQL PREDICT można wykonywać natywne ocenianie na wstępnie wytrenowanym modelu, który został wcześniej zapisany w wymaganym formacie binarnym.
Biblioteki języka Python
Pakiet | Opis |
---|---|
revoscalepy | Odpowiednik RevoScaleR w Pythonie. Modele języka Python można tworzyć na potrzeby regresji liniowej i logistycznej, drzew decyzyjnych, drzew wzmocnionych i lasów losowych, wszystkich równoległych i zdolnych do uruchamiania w zdalnych kontekstach obliczeniowych. Ten pakiet obsługuje korzystanie z wielu źródeł danych i zdalnych kontekstów obliczeniowych. Analityk danych lub deweloper może wykonywać kod języka Python na zdalnym serwerze SQL Server, aby eksplorować dane lub tworzyć modele bez przenoszenia danych. |
microsoftml | Pythonowy odpowiednik pakietu MicrosoftML dla języka R. |
Wstępnie wytrenowane modele
Wstępnie wytrenowane modele są dostępne zarówno dla Pythona, jak i R. Użyj tych modeli do rozpoznawania obrazów i analizy tonacji pozytywno-negatywnej, aby wygenerować przewidywania na własnych danych.
Autonomiczny serwer jako funkcja udostępniona w instalatorze programu SQL Server
W tej wersji dodano również SQL Server Machine Learning Server (autonomiczny), w pełni niezależny serwer danych, obsługujący analizy statystyczne i predykcyjne w językach R i Python. Podobnie jak w przypadku usług R, ten serwer jest następną wersją programu SQL Server 2016 R Server (autonomiczna). Korzystając z autonomicznego serwera, można dystrybuować i skalować rozwiązania R lub Python bez zależności w programie SQL Server.
Nowość w programie SQL Server 2016
W tej wersji wprowadzono możliwości uczenia maszynowego w programie SQL Server za pośrednictwem usług SQL Server 2016 R Services, silnika analizy w bazie danych do przetwarzania skryptu języka R na danych przechowywanych w wystąpieniu aparatu bazy danych.
Ponadto SQL Server 2016 R Server (autonomiczny) zostało wydane w celu zainstalowania R Server na serwerze z systemem Windows. Początkowo instalator programu SQL Server zapewniał jedyny sposób instalowania programu R Server dla systemu Windows. W kolejnych wersjach deweloperzy i analitycy danych, którzy chcieli, aby program R Server w systemie Windows mógł użyć innego autonomicznego instalatora, aby osiągnąć ten sam cel. Autonomiczny serwer w systemie SQL Server jest funkcjonalnym odpowiednikiem autonomicznego produktu serwerowego, Microsoft R Server na system Windows.
Aby zapoznać się z pełnymi informacjami dotyczącymi nowych funkcji, zobacz Co nowego w programie SQL Server 2016.
Wydanie | Aktualizacja funkcji |
---|---|
Dodatki CU | ocenianie w czasie rzeczywistym opiera się na natywnych bibliotekach języka C++ do odczytywania modelu przechowywanego w zoptymalizowanym formacie binarnym, a następnie generowania przewidywań bez konieczności wywoływania środowiska uruchomieniowego języka R. Dzięki temu operacje oceniania są znacznie szybsze. Za pomocą oceniania w czasie rzeczywistym można uruchomić procedurę składowaną lub wykonać ocenianie w czasie rzeczywistym z poziomu kodu języka R. Ocena w czasie rzeczywistym jest również dostępna dla programu SQL Server 2016, jeśli wystąpienie zostanie uaktualnione do najnowszej wersji programu Microsoft R Server. |
Pierwsze wydanie |
integracja języka R na potrzeby analizy w bazie danych. Pakiety języka R do wywoływania funkcji języka R w języku T-SQL i na odwrót. Funkcje RevoScaleR zapewniają analizę języka R na dużą skalę przez podział danych na części składników, koordynowanie rozproszonego przetwarzania i zarządzanie nim oraz agregowanie wyników. W usługach SQL Server 2016 R Services (In-Database) silnik RevoScaleR jest zintegrowany z instancją silnika bazy danych, wprowadzając dane i analizy do tego samego kontekstu przetwarzania. Integracja języka T-SQL i języka R za pośrednictwem sp_execute_external_script. Można wywołać dowolny kod języka R przy użyciu tej procedury składowanej. Ta bezpieczna infrastruktura umożliwia wdrażanie modeli Rn i skryptów klasy korporacyjnej, które mogą być wywoływane z aplikacji przy użyciu prostej procedury składowanej. Dodatkowa poprawa wydajności jest osiągana przez przesyłanie strumieniowe danych z SQL do procesów R i równoległość pierścieniową MPI. Za pomocą funkcji T-SQL PREDICT można wykonywać natywne prognozowanie na wytrenowanym modelu, który został zapisany w wymaganym formacie binarnym. |
Obsługa systemu Linux
SQL Server 2019 dodaje obsługę Linuxa dla języków R i Python po zainstalowaniu pakietów uczenia maszynowego z silnikiem baz danych. Aby uzyskać więcej informacji, zobacz Install SQL Server Machine Learning Services on Linux.
W systemie Linux program SQL Server 2017 nie ma integracji języka R lub Python, ale można użyć natywnej oceny, ponieważ ta funkcja jest dostępna za pośrednictwem T-SQL PREDICT, który działa w systemie Linux. Natywne ocenianie umożliwia ocenianie o wysokiej wydajności z wstępnie wytrenowanego modelu bez wywoływania lub nawet wymagania środowiska uruchomieniowego języka R.