Wat is er nieuw in SQL Server Machine Learning Services?
Van toepassing op: SQL Server 2016 (13.x) en latere versies
In deze artikelen wordt beschreven welke nieuwe mogelijkheden en functies zijn opgenomen in elke versie van SQL Server Machine Learning Services. Machine learning-mogelijkheden worden in elke release toegevoegd aan SQL Server, omdat we de integratie tussen het gegevensplatform, geavanceerde analyses en gegevenswetenschap blijven uitbreiden, uitbreiden en verdiepen.
Notitie
Functiemogelijkheden en installatieopties verschillen per versie van SQL Server. Gebruik de vervolgkeuzelijst versiekiezer om de juiste versie van SQL Server te kiezen.
Nieuw in SQL Server 2022
Vanaf SQL Server 2022 (16.x) worden runtimes voor R, Python en Java niet meer geïnstalleerd met SQL Setup. Installeer in plaats daarvan alle gewenste aangepaste runtime(s) en pakketten. Zie SQL Server 2022 Machine Learning Services (Python en R) installeren in Windows of SQL Server Machine Learning Services (Python en R) installeren op Linuxvoor meer informatie.
Nieuw in SQL Server 2019
In deze release worden de meest aangevraagde functies toegevoegd voor Python- en R-machine learning-bewerkingen in SQL Server. Zie Wat is er nieuw in SQL Server 2019 en sql Server 2019 releaseopmerkingenvoor meer informatie over alle functies in deze release.
Zie voor de nieuwe documentatie over Java en C# in SQL Server 2019 de Wat is er nieuw in SQL Server Language Extensions?.
Hieronder vindt u de nieuwe functies voor SQL Server Machine Learning Services, beschikbaar op zowel Windows als Linux-:
- Ondersteuning voor Linux-platform is toegevoegd in Machine Learning Services voor Python en R. Ga aan de slag met SQL Server Machine Learning Services installeren op Linux.
- Loopback-verbinding met SQL Server vanuit een Python- of R-script.
- CREATE EXTERNAL LIBRARY (Transact-SQL) voor Python en R.
- De sp_execute_external_script introduceert twee nieuwe parameters waarmee u eenvoudig meerdere modellen kunt genereren op basis van gepartitioneerde gegevens. Meer informatie in deze zelfstudie Partitiemodellen maken in R.
- Ondersteuning voor failoverclusters is beschikbaar voor de Launchpad-service, ervan uitgaande dat de SQL Server Launchpad-service op alle knooppunten wordt gestart. Voor meer informatie, zie SQL Server-failoverclusterinstallatie.
- Isolatiemechanismewijzigingen voor Machine Learning Services. Zie SQL Server 2019 op Windows voor meer informatie: Isolatiewijzigingen voor Machine Learning Services.
Nieuw in SQL Server 2017
In deze release worden Python-ondersteuning en toonaangevende machine learning-algoritmentoegevoegd. SQL Server 2017 is hernoemd om het nieuwe bereik te weerspiegelen en markeert de introductie van SQL Server Machine Learning Services (In-Database), met taalondersteuning voor zowel Python als R.
Zie Wat is er nieuw in SQL Server 2017voor functieaankondigingen.
R-verbeteringen
Het R-onderdeel van SQL Server Machine Learning Services is de volgende generatie SQL Server 2016 R Services, met bijgewerkte versies van base R, RevoScaler en andere pakketten.
Nieuwe mogelijkheden voor R omvatten pakketbeheer, met de volgende hoogtepunten:
- Databaserollen helpen DBA's bij het beheren van pakketten en het toewijzen van machtigingen voor pakketinstallatie.
- CREATE EXTERNAL LIBRARY helpt DBA's om pakketten te beheren in de vertrouwde T-SQL-taal.
- RevoScaleR--functies helpen bij het installeren, verwijderen of vermelden van pakketten die eigendom zijn van gebruikers. Zie RevoScaleR-functies gebruiken om R-pakketten te zoeken of te installeren op SQL Servervoor meer informatie.
R-bibliotheken
Pakket | Beschrijving |
---|---|
MicrosoftML | In deze release is MicrosoftML opgenomen in een standaard-R-installatie, waardoor de upgradestap die is vereist in de vorige SQL Server 2016 R-services wordt geëlimineerd. MicrosoftML biedt geavanceerde machine learning-algoritmen en gegevenstransformaties die kunnen worden geschaald of uitgevoerd in externe rekencontexten. Algoritmen omvatten aanpasbare diepe neurale netwerken, snelle beslissingsbomen en beslissingsbossen, lineaire regressie en logistieke regressie. |
Python-integratie voor in-databaseanalyse
Python is een taal die veel flexibiliteit en kracht biedt voor verschillende machine learning-taken. Opensource-bibliotheken voor Python bevatten verschillende platforms voor aanpasbare neurale netwerken, evenals populaire bibliotheken voor verwerking van natuurlijke taal.
Omdat Python is geïntegreerd met de database-engine, kunt u analyses dicht bij de gegevens houden en de kosten en beveiligingsrisico's voor gegevensverplaatsing elimineren. U kunt machine learning-oplossingen implementeren op basis van Python met behulp van hulpprogramma's zoals Visual Studio. Uw productietoepassingen kunnen voorspellingen, modellen of visuals ophalen uit de Python 3.5-runtime met behulp van SQL Server-methoden voor gegevenstoegang.
T-SQL- en Python-integratie wordt ondersteund via de sp_execute_external_script systeemopslagprocedure. U kunt python-code aanroepen met behulp van deze opgeslagen procedure. Code wordt uitgevoerd in een beveiligde, dubbele architectuur die implementatie van Python-modellen en -scripts op bedrijfsniveau mogelijk maakt, die kan worden aangeroepen vanuit een toepassing met behulp van een eenvoudige opgeslagen procedure. Extra prestatieverbeteringen worden bereikt door het streamen van gegevens van SQL naar Python-processen en mpi-ringparallelisatie.
U kunt de functie T-SQL PREDICT gebruiken om natuurlijke scoring uit te voeren op een vooraf getraind model dat eerder is opgeslagen in het vereiste binaire formaat.
Python-bibliotheken
Pakket | Beschrijving |
---|---|
opnieuw schalen | Python-equivalent van RevoScaleR. U kunt Python-modellen maken voor lineaire en logistieke regressies, beslissingsstructuren, versterkte bomen en willekeurige forests, allemaal parallelliseerbare en kunnen worden uitgevoerd in externe rekencontexten. Dit pakket ondersteunt het gebruik van meerdere gegevensbronnen en externe rekencontexten. De data scientist of ontwikkelaar kan Python-code uitvoeren op een externe SQL Server om gegevens te verkennen of modellen te bouwen zonder gegevens te verplaatsen. |
microsoftml | Python-equivalent van het MicrosoftML R-pakket. |
Vooraf getrainde modellen
vooraf getrainde modellen beschikbaar zijn voor Zowel Python als R. Gebruik deze modellen voor afbeeldingsherkenning en positief-negatieve sentimentanalyse om voorspellingen te genereren voor uw eigen gegevens.
Zelfstandige server als een gedeelde functie in SQL Server Setup
In deze release wordt ook SQL Server Machine Learning Server (standalone)toegevoegd, een volledig onafhankelijke data science-server die statistische en voorspellende analyses ondersteunt in R en Python. Net als bij R Services is deze server de volgende versie van SQL Server 2016 R Server (zelfstandig). Met de zelfstandige server kunt u R- of Python-oplossingen distribueren en schalen zonder afhankelijkheden op SQL Server.
Nieuw in SQL Server 2016
In deze release zijn machine learning-mogelijkheden in SQL Server geïntroduceerd via SQL Server 2016 R Services, een in-database analytics-engine voor het verwerken van R-script op ingezeten gegevens in een database-engine-exemplaar.
Daarnaast is SQL Server 2016 R Server (zelfstandig) uitgebracht als een manier om R Server op een Windows-server te installeren. In eerste instantie biedt SQL Server Setup de enige manier om R Server voor Windows te installeren. In latere releases konden ontwikkelaars en gegevenswetenschappers die R Server in Windows wilden gebruiken, een ander zelfstandig installatieprogramma gebruiken om hetzelfde doel te bereiken. De zelfstandige server in SQL Server is functioneel gelijk aan het zelfstandige serverproduct, Microsoft R Server voor Windows.
Zie Wat is er nieuw in SQL Server 2016voor functieaankondigingen.
Loslaten | Onderdelenupdate |
---|---|
CU-toevoegingen | real-time scoring is afhankelijk van systeemeigen C++-bibliotheken om een model te lezen dat is opgeslagen in een geoptimaliseerde binaire indeling en vervolgens voorspellingen te genereren zonder de R-runtime-omgeving aan te roepen. Dit maakt de scoringsbewerkingen veel sneller. Met realtime scoren kunt u een opgeslagen procedure uitvoeren of realtime scoren vanuit R-code. Realtime scoren is ook beschikbaar voor SQL Server 2016, als het exemplaar wordt bijgewerkt naar de nieuwste versie van Microsoft R Server. |
Eerste release |
R-integratie voor in-databaseanalyses. R-pakketten voor het aanroepen van R-functies in T-SQL en omgekeerd. RevoScaleR-functies bieden R-analyses op schaal door gegevens te segmenteren in onderdelen, gedistribueerde verwerking te coördineren en te beheren en resultaten samen te aggregateren. In SQL Server 2016 R Services (In-Database) is de RevoScaleR-engine geïntegreerd met een database-engine-instantie, waardoor gegevens en analyses samenkomen in dezelfde verwerkingscontext. T-SQL- en R-integratie via sp_execute_external_script. U kunt R-code aanroepen met behulp van deze opgeslagen procedure. Deze beveiligde infrastructuur maakt het mogelijk om Rn-modellen en -scripts op bedrijfsniveau te implementeren die vanuit een toepassing kunnen worden aangeroepen met behulp van een eenvoudige opgeslagen procedure. Extra prestatieverbeteringen worden bereikt door het streamen van gegevens van SQL naar R-processen en mpi-ringparallelisatie. U kunt de T-SQL PREDICT functie gebruiken om native scoring uit te voeren op een vooraf getraind model dat eerder is opgeslagen in het vereiste binaire formaat. |
Linux-ondersteuning
SQL Server 2019 voegt Linux-ondersteuning voor R en Python toe wanneer u de machine learning-pakketten installeert met een database-engine-exemplaar. Zie SQL Server Machine Learning Services installeren op Linuxvoor meer informatie.
In Linux heeft SQL Server 2017 geen R- of Python-integratie, maar u kunt systeemeigen scoren op Linux gebruiken omdat deze functionaliteit beschikbaar is via T-SQL PREDICT, die wordt uitgevoerd op Linux. Systeemeigen scoren maakt high-performance scoren mogelijk vanaf een vooraf getraind model, zonder aanroepen of zelfs een R-runtime te vereisen.