Importieren aus lokaler SQL Server-Datenbank

Artikel
2019-05-06

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Siehe Migrieren zu Azure Machine Learning
Weitere Informationen zu Azure Machine Learning.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel wird beschrieben, wie Sie das Import Data-Modul in Machine Learning Studio (klassisch) verwenden, um Daten aus einer lokalen SQL Server-Datenbank in ein Machine Learning-Experiment zu importieren.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Machine Learning können auf eine lokale SQL Server zugreifen, wenn die Daten über ein Microsoft Datenverwaltung Gateway bereitgestellt werden. Daher müssen Sie vor dem Importieren von Daten die folgenden Anforderungen erfüllen:

Installieren eines Microsoft Datenverwaltung Gateways, das auf die Datenquelle zugreifen kann
Registrieren des Gateways in Ihrem Machine Learning Arbeitsbereich
Konfigurieren des Datenimports zum Identifizieren des Gateways

Nachdem die Gatewayverbindung hergestellt wurde, können Sie zusätzliche Eigenschaften angeben, z. B. die Server- und Datenbanknamen, die Authentifizierungsmethode und eine Datenbankabfrage.

Installieren eines Microsoft Datenverwaltung Gateways

Für den Zugriff auf eine lokale SQL Server-Datenbank in Machine Learning müssen Sie das Microsoft Datenverwaltung-Gateway herunterladen und installieren und das Gateway dann in Machine Learning Studio (klassisch) registrieren.

Weitere Informationen zum Installieren und Registrieren des Gateways finden Sie in den folgenden Artikeln:

Importieren von Daten aus einer lokalen SQL Server Datenbank

Nachdem ein Datenverwaltung-Gateway auf einem Computer installiert wurde, auf dem es auf Ihre SQL Server-Datenbank zugreifen kann, und Sie das Gateway in Machine Learning Studio (klassisch) registriert haben, müssen Sie das Import Data-Modul konfigurieren.

Bevor Sie beginnen, deaktivieren Sie den Popupblocker Ihres Browsers für die Website. studio.azureml.net

Wenn Sie den Google Chrome-Browser verwenden, müssen Sie eines der Plug-Ins herunterladen und installieren, die im Google Chrome WebStore verfügbar sind: Klicken Sie auf Einmal-App-Erweiterung.

Verwenden des Assistenten zum Importieren von Daten

Das Modul verfügt über einen neuen Assistenten, mit dem Sie eine Speicheroption auswählen, aus vorhandenen Abonnements und Konten auswählen und schnell alle Optionen konfigurieren können.

Fügen Sie das Modul Import Data Ihrem Experiment hinzu. Sie finden das Modul in Studio (klassisch) in der Kategorie Dateneingabe und - ausgabe.
Klicken Sie auf Datenimport-Assistenten starten , und befolgen Sie die Anweisungen.
Klicken Sie nach Abschluss der Konfiguration mit der rechten Maustaste auf das Modul, und wählen Sie Ausgewählte ausführen aus, um die Daten tatsächlich in Ihr Experiment zu kopieren.

Wenn Sie eine vorhandene Datenverbindung bearbeiten müssen, lädt der Assistent alle vorherigen Konfigurationsdetails, damit Sie nicht von Grund auf neu starten müssen.

Manuelles Festlegen der Eigenschaften im Modul „Daten importieren“

Fügen Sie das Modul Import Data Ihrem Experiment hinzu. Sie finden das Modul in Studio (klassisch) in der Kategorie Dateneingabe und - ausgabe.
Wählen Sie unter Datenquelle die Option Lokale SQL-Datenbank.
Legen Sie die folgenden Optionen fest, die für die SQL Server sind.
- Datengateway: Wählen Sie das Gateway aus, das Sie erstellt haben. Das Gateway muss registriert sein, oder es wird nicht in der Liste angezeigt.
- Datenbankservername: Geben Sie den Namen der SQL Server ein.
- Datenbankname: Geben Sie den Datenbanknamen ein.
- Klicken Sie unter User name and password auf Enter values, und geben Sie Ihre Datenbank-Anmeldeinformationen ein. Je nach Ihrer lokalen SQL Server-Konfiguration können Sie die Integrierte Windows-Authentifizierung oder SQL Server-Authentifizierung verwenden.
  
  Wichtig
  
  Der Anmeldeinformations-Manager muss innerhalb desselben Netzwerks wie die SQL Server und den Gatewayclient gestartet werden. Anmeldeinformationen können nicht domänenübergreifend übergeben werden.
- Geben Oder fügen Sie in Datenbankabfrage eine SQL ein, die die zu lesenden Daten beschreibt. Überprüfen Sie die SQL-Anweisung und die Abfrageergebnisse jeweils vorab mithilfe eines Tools wie dem Server-Explorer von Visual Studio oder mit SQL Server Data Tools.
- Wenn nicht erwartet wird, dass sich das Dataset zwischen den Experimentläufen ändert, wählen Sie die Option Zwischengespeicherte Ergebnisse verwenden aus. Wenn diese Option ausgewählt ist und keine weiteren Änderungen an Modulparametern vorgenommen werden, werden die Daten beim ersten Ausführen des Moduls geladen, und anschließend wird eine zwischengespeicherte Version des Datasets verwendet.
Führen Sie das Experiment aus.

Ergebnisse

Wenn Import Data die Daten in Studio (klassisch) lädt, kann abhängig von den in der Quelldatenbank verwendeten Datentypen eine implizite Typkonvertierung durchgeführt werden. Weitere Informationen zu Datentypen finden Sie unter Moduldatentypen.

Klicken Sie nach Abschluss des Experiments auf das Ausgabedataset, und wählen Sie Visualisieren aus, um festzustellen, ob die Daten erfolgreich importiert wurden.

Optional können Sie das Dataset und seine Metadaten mithilfe der Tools in Studio (klassisch) ändern:

Verwenden Sie Edit Metadata (Metadaten bearbeiten), um Spaltennamen zu ändern, eine Spalte in einen anderen Datentyp zu konvertieren oder Spalten für Bezeichnungen oder Features anzugeben.
Verwenden Sie Select Columns in Dataset (Spalten im Dataset auswählen), um eine Teilmenge von Spalten auszuwählen.
Verwenden Sie Partition und Beispiel , um das Dataset nach Kriterien zu trennen oder die ersten n Zeilen zu erhalten.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Häufig gestellte Fragen

Kann ich Daten filtern, während sie aus der Quelle gelesen werden?

Das Modul Import Data selbst unterstützt keine Filterung, wenn Daten gelesen werden. Es wird empfohlen, eine Sicht zu erstellen oder eine Abfrage zu definieren, die nur die benötigten Zeilen generiert.

Hinweis

Wenn Sie feststellen, dass Sie mehr Daten als erforderlich geladen haben, können Sie das zwischengespeicherte Dataset durch Lesen eines neuen Datasets überschreiben und dieses mit dem gleichen Namen wie die älteren, größeren Daten speichern.

Warum wird der Fehler "Type Decimal is not supported" (Typdezimalzahl wird nicht unterstützt) angezeigt?

Beim Lesen von Daten aus SQL Datenbank tritt möglicherweise eine Fehlermeldung mit einem nicht unterstützten Datentyp auf.

Wenn die Daten, die Sie aus der SQL-Datenbank erhalten, Datentypen enthalten, die in Machine Learning nicht unterstützt werden, sollten Sie die Dezimalzahlen vor dem Lesen der Daten in einen unterstützten Datentyp umwandeln oder konvertieren. Der Grund dafür ist, dass Import Data nicht automatisch Konvertierungen durchführen kann, die zu einem Genauigkeitsverlust führen würden.

Warum werden einige Zeichen nicht richtig angezeigt?

Machine Learning unterstützt die UTF-8-Codierung. Wenn Zeichenfolgenspalten in Ihrer Datenbank eine andere Codierung verwenden, werden die Zeichen möglicherweise nicht ordnungsgemäß importiert.

Eine Möglichkeit zum Beibehalten dieser Zeichen ist das Exportieren der Daten in eine CSV-Datei in Azure Storage und die Verwendung der Option CSV mit Codierung, um Parameter für benutzerdefinierte Trennzeichen, die Codepage usw. anzugeben.

Nein. Sie müssen für jeden Arbeitsbereich ein separates Gateway erstellen.

Sie können zwar mehrere Datenverwaltung-Gateways in einem einzelnen Arbeitsbereich einrichten (z. B. jeweils eines für Entwicklung, Tests, Produktion usw.), aber ein Gateway kann nicht arbeitsbereichsübergreifend gemeinsam genutzt werden.

Ich habe ein Datenverwaltung-Gateway auf meinem lokalen Server eingerichtet, das ich für Power BI oder Azure Data Factory verwende und das gleiche Gateway für Machine Learning

Jeder Dienst erfordert ein separates Datenverwaltung Gateway. Wenn Sie bereits über ein Gateway verfügen, das für Power BI oder Azure Data Factory verwendet wird, müssen Sie einen separaten Server einrichten und ein Gateway für Machine Learning installieren.

Sie können nicht mehrere Gateways auf einem einzelnen Server installieren.

Ich möchte Daten auf meinen lokalen Server SQL können. Kann ich das Gateway mit dem Modul Daten exportieren verwenden, um Daten auf meinen lokalen SQL schreiben?

Derzeit unterstützt Machine Learning nur das Importieren von Daten. Wir bewerten, ob Sie in Zukunft in Ihre lokale Datenbank schreiben können. In der Zwischenzeit können Sie Azure Data Factory verwenden, um Daten aus der Cloud in Ihre lokale Datenbank zu kopieren.

Ich habe eine Datenquelle, die nicht Microsoft SQL Server ist (Oracle, Teradata usw.). Kann ich die Daten in Machine Learning lokalen Option im Import Data-Modul lesen?

Derzeit unterstützt Machine Learning Import Data-Modul nur Microsoft SQL Server.

Als Problemumgehung können Sie Azure Data Factory verwenden, um Ihre lokalen Daten in den Cloudspeicher zu kopieren, z. B. Azure Blob Storage oder Azure Database, und dann Ihre Clouddatenquelle im Import Data-Modul verwenden.

Modulparameter

Name	Range	type	Standard	Beschreibung
Datenquellen-	Liste	Datenquelle oder Senke	Azure Blob Storage	Die Datenquelle kann HTTP, FTP, anonymes HTTPS oder FTPS, eine Datei in Azure BLOB Storage, eine Azure-Tabelle, eine Azure SQL-Datenbank, eine lokale SQL Server-Datenbank, eine Hive-Tabelle oder ein OData-Endpunkt sein.
Datengateway	any	DataGatewayName	Keine	Datengatewayname
Database server name	any	Zeichenfolge	Keine	Lokaler SQL Server
Datenbankname	any	String	Keine	Lokale SQL Server-Datenbankinstanz
Benutzername und Kennwort	any	SecureString	Keine	Benutzername und Kennwort
Datenbankabfrage	any	StreamReader	Keine	Lokale SQL Abfrage

Ausgaben

Name	Type	Beschreibung
Ergebnisdataset	Datentabelle	Dataset mit den heruntergeladenen Daten.

Ausnahmen

Ausnahme	Beschreibung
Fehler 0027	Eine Ausnahme tritt auf, wenn zwei Objekte gleich groß sein müssen, dies aber nicht der Fall ist.
Fehler 0003	Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0029	Eine Ausnahme tritt auf, wenn ein ungültiger URI übergeben wird.
Fehler 0030	Eine Ausnahme tritt auf, wenn es nicht möglich ist, eine Datei herunterzuladen.
Fehler 0002	Eine Ausnahme tritt auf, wenn mindestens ein Parameter nicht analysiert oder nicht aus einem angegebenen Typ in den für die Zielmethode erforderlichen Typ konvertiert werden konnte.
Fehler 0048	Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu öffnen.
Fehler 0015	Eine Ausnahme tritt auf, wenn ein Fehler beim Herstellen einer Datenbankverbindung aufgetreten ist.
Fehler 0046	Eine Ausnahme tritt auf, wenn es nicht möglich ist, ein Verzeichnis im angegebenen Pfad zu erstellen.
Fehler 0049	Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu analysieren.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Daten importieren
Daten exportieren
Importieren aus Web-URL über HTTP
Importieren aus Hive-Abfrage
Importieren aus Azure SQL-Datenbank
Importieren aus Azure Table
Importieren aus Azure Blob Storage
Importieren aus Datenfeedanbietern

Freigeben über