Udostępnij za pośrednictwem


Wykonywanie analiz za pomocą usługi Machine Learning Studio (klasycznej) przy użyciu bazy danych programu SQL Server

DOTYCZY: Dotyczy.Machine Learning Studio (wersja klasyczna) Nie dotyczy.Azure Machine Learning

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Często przedsiębiorstwa współpracujące z danymi lokalnymi chcą korzystać ze skali i elastyczności chmury na potrzeby obciążeń uczenia maszynowego. Nie chcą jednak zakłócać bieżących procesów biznesowych i przepływów pracy przez przeniesienie danych lokalnych do chmury. Usługa Machine Learning Studio (klasyczna) obsługuje teraz odczytywanie danych z bazy danych programu SQL Server, a następnie trenowanie i ocenianie modelu przy użyciu tych danych. Nie trzeba już ręcznie kopiować i synchronizować danych między chmurą a serwerem lokalnym. Zamiast tego moduł Importuj dane w usłudze Machine Learning Studio (wersja klasyczna) może teraz odczytywać bezpośrednio z bazy danych programu SQL Server na potrzeby zadań trenowania i oceniania.

Ten artykuł zawiera omówienie sposobu ściągnąć dane z programu SQL Server do usługi Machine Learning Studio (wersja klasyczna). Przyjęto założenie, że znasz pojęcia programu Studio (klasyczne), takie jak obszary robocze, moduły, zestawy danych, eksperymenty itp.

Uwaga

Ta funkcja nie jest dostępna dla bezpłatnych obszarów roboczych. Aby uzyskać więcej informacji na temat cen i warstw usługi Machine Learning, zobacz Machine Learning Studio (wersja klasyczna) — cennik.

Instalowanie własnego środowiska Integration Runtime w usłudze Data Factory

Aby uzyskać dostęp do bazy danych programu SQL Server w usłudze Machine Learning Studio (wersja klasyczna), musisz pobrać i zainstalować własne środowisko Integration Runtime w usłudze Data Factory, wcześniej znane jako brama Zarządzanie danymi. Podczas konfigurowania połączenia w usłudze Machine Learning Studio (wersja klasyczna) możesz pobrać i zainstalować środowisko Integration Runtime (IR) przy użyciu okna dialogowego Pobieranie i rejestrowanie bramy danych opisanego poniżej.

Możesz również zainstalować środowisko IR przed upływem czasu, pobierając i uruchamiając pakiet instalacyjny MSI z Centrum pobierania Microsoft. Tożsamość usługi zarządzanej może również służyć do uaktualniania istniejącego środowiska IR do najnowszej wersji z zachowanymi wszystkimi ustawieniami.

Własne środowisko Integration Runtime usługi Data Factory ma następujące wymagania wstępne:

  • Samodzielna integracja z usługą Data Factory wymaga 64-bitowego systemu operacyjnego z programem .NET Framework 4.6.1 lub nowszym.
  • Obsługiwane wersje systemu operacyjnego Windows to Windows 10 , Windows Server 2012, Windows Server 2012 R2, Windows Server 2016.
  • Zalecaną konfiguracją maszyny IR jest co najmniej 2 GHz, 4 rdzeni procesora CPU, 8 GB pamięci RAM i 80 GB dysku.
  • Jeśli hibernacji maszyny hosta środowisko IR nie odpowie na żądania danych. W związku z tym należy skonfigurować odpowiedni plan zasilania na komputerze przed zainstalowaniem środowiska IR. Jeśli maszyna jest skonfigurowana do hibernacji, instalacja środowiska IR wyświetla komunikat.
  • Ponieważ działanie kopiowania występuje z określoną częstotliwością, użycie zasobów (procesor CPU, pamięć) na maszynie jest również zgodne z tym samym wzorcem ze szczytowymi i bezczynnymi godzinami. Wykorzystanie zasobów zależy również w dużej mierze od ilości przenoszonych danych. Gdy trwa wiele zadań kopiowania, zauważysz, że użycie zasobów będzie rosnąć w godzinach szczytu. Chociaż minimalna konfiguracja wymieniona powyżej jest technicznie wystarczająca, możesz mieć konfigurację z większą ilością zasobów niż minimalna konfiguracja w zależności od konkretnego obciążenia przenoszenia danych.

Podczas konfigurowania własnego środowiska Integration Runtime w usłudze Data Factory i korzystania z niego należy wziąć pod uwagę następujące kwestie:

  • Na jednym komputerze można zainstalować tylko jedno wystąpienie środowiska IR.

  • Można użyć jednego środowiska IR dla wielu lokalnych źródeł danych.

  • Wiele adresów IP można połączyć na różnych komputerach z tym samym lokalnym źródłem danych.

  • Adresy IP można skonfigurować tylko dla jednego obszaru roboczego jednocześnie. Obecnie nie można udostępniać adresów IP między obszarami roboczymi.

  • Można skonfigurować wiele adresów IP dla jednego obszaru roboczego. Na przykład możesz chcieć użyć środowiska IR połączonego ze źródłami danych testowych podczas programowania i produkcyjnego środowiska IR, gdy wszystko będzie gotowe do operacji.

  • Środowisko IR nie musi znajdować się na tej samej maszynie co źródło danych. Jednak bliższe źródło danych skraca czas łączenia bramy ze źródłem danych. Zalecamy zainstalowanie środowiska IR na maszynie, która różni się od tego, który hostuje lokalne źródło danych, aby brama i źródło danych nie konkurowały o zasoby.

  • Jeśli masz już środowisko IR zainstalowane na komputerze obsługującym scenariusze usługi Power BI lub Azure Data Factory, zainstaluj oddzielne środowisko IR dla usługi Machine Learning Studio (wersja klasyczna) na innym komputerze.

    Uwaga

    Na tym samym komputerze nie można uruchomić własnego środowiska Integration Runtime i usługi Power BI Gateway w usłudze Data Factory.

  • Musisz użyć własnego środowiska Integration Runtime usługi Data Factory dla usługi Machine Learning Studio (wersja klasyczna), nawet jeśli używasz usługi Azure ExpressRoute dla innych danych. Źródło danych należy traktować jako lokalne źródło danych (które znajduje się za zaporą), nawet jeśli używasz usługi ExpressRoute. Użyj własnego środowiska Integration Runtime usługi Data Factory, aby nawiązać łączność między usługą Machine Learning i źródłem danych.

Szczegółowe informacje na temat wymagań wstępnych instalacji, kroków instalacji i wskazówek dotyczących rozwiązywania problemów można znaleźć w artykule Integration Runtime in Data Factory (Środowisko Integration Runtime w usłudze Data Factory).

Dane przychodzące z bazy danych programu SQL Server do usługi Machine Learning

W tym przewodniku skonfigurujesz środowisko Azure Data Factory Integration Runtime w obszarze roboczym usługi Azure Machine Learning, skonfigurujesz je, a następnie odczytujesz dane z bazy danych programu SQL Server.

Napiwek

Przed rozpoczęciem wyłącz blokowanie wyskakujących okienek przeglądarki dla elementu studio.azureml.net. Jeśli używasz przeglądarki Google Chrome, pobierz i zainstaluj jedną z kilku wtyczek dostępnych w sklepie Google Chrome WebStore kliknij pozycję Po rozszerzeniu aplikacji.

Uwaga

Własne środowisko Integration Runtime usługi Azure Data Factory było wcześniej znane jako Zarządzanie danymi Gateway. Samouczek krok po kroku będzie nadal odnosić się do niego jako brama.

Krok 1. Tworzenie bramy

Pierwszym krokiem jest utworzenie i skonfigurowanie bramy w celu uzyskania dostępu do bazy danych SQL.

  1. Zaloguj się do usługi Machine Learning Studio (klasycznej) i wybierz obszar roboczy, w którym chcesz pracować.

  2. Kliknij blok USTAWIENIA po lewej stronie, a następnie kliknij kartę BRAMY DANYCH u góry.

  3. Kliknij pozycję NOWA BRAMA DANYCH w dolnej części ekranu.

    Nowa brama danych

  4. W oknie dialogowym Nowa brama danych wprowadź nazwę bramy i opcjonalnie dodaj opis. Kliknij strzałkę w prawym dolnym rogu, aby przejść do następnego kroku konfiguracji.

    Wprowadź nazwę i opis bramy

  5. W oknie dialogowym Pobieranie i rejestrowanie bramy danych skopiuj klucz rejestracji bramy do schowka.

    Pobieranie i rejestrowanie bramy danych

  6. Jeśli jeszcze nie pobrano i nie zainstalowano bramy microsoft Zarządzanie danymi Gateway, kliknij pozycję Pobierz bramę zarządzania danymi. Spowoduje to przejście do Centrum pobierania Microsoft, w którym można wybrać potrzebną wersję bramy, pobrać ją i zainstalować. Szczegółowe informacje na temat wymagań wstępnych instalacji, kroków instalacji i wskazówek dotyczących rozwiązywania problemów można znaleźć w początkowych sekcjach artykułu Przenoszenie danych między źródłami lokalnymi i chmurą przy użyciu usługi Zarządzanie danymi Gateway.

  7. Po zainstalowaniu bramy zostanie otwarty program Zarządzanie danymi Gateway Configuration Manager i zostanie wyświetlone okno dialogowe Rejestrowanie bramy. Wklej skopiowany klucz rejestracji bramy do schowka i kliknij przycisk Zarejestruj.

  8. Jeśli masz już zainstalowaną bramę, uruchom program Zarządzanie danymi Gateway Configuration Manager. Kliknij przycisk Zmień klucz, wklej klucz rejestracji bramy skopiowany do schowka w poprzednim kroku, a następnie kliknij przycisk OK.

  9. Po zakończeniu instalacji zostanie wyświetlone okno dialogowe Rejestrowanie bramy dla programu Microsoft Zarządzanie danymi Gateway Configuration Manager. Wklej klucz REJESTRACJI BRAMY skopiowany do schowka w poprzednim kroku, a następnie kliknij przycisk Zarejestruj.

    Rejestrowanie bramy

  10. Konfiguracja bramy jest zakończona po ustawieniu następujących wartości na karcie Narzędzia główne w programie Microsoft Zarządzanie danymi Gateway Configuration Manager:

    • Nazwa bramy i nazwa wystąpienia są ustawione na nazwę bramy.

    • Rejestracja jest ustawiona na Wartość Zarejestrowano.

    • Stan jest ustawiony na Uruchomiono.

    • Na pasku stanu w dolnej części zostanie wyświetlony komunikat Połączono z usługą w chmurze bramy Zarządzanie danymi wraz z zielonym znacznikiem wyboru.

      menedżer bramy Zarządzanie danymi

      Usługa Machine Learning Studio (wersja klasyczna) jest również aktualizowana po pomyślnym zakończeniu rejestracji.

    Rejestracja bramy powiodła się

  11. W oknie dialogowym Pobieranie i rejestrowanie bramy danych kliknij znacznik wyboru, aby ukończyć instalację. Na stronie Ustawienia wyświetlany jest stan bramy jako "Online". W okienku po prawej stronie znajdziesz stan i inne przydatne informacje.

    Ustawienia bramy

  12. W programie Microsoft Zarządzanie danymi Gateway Configuration Manager przejdź do karty Certyfikat. Certyfikat określony na tej karcie służy do szyfrowania/odszyfrowywania poświadczeń dla lokalnego magazynu danych określonego w portalu. Ten certyfikat jest certyfikatem domyślnym. Firma Microsoft zaleca zmianę tego certyfikatu na własny certyfikat, który jest kopią zapasową w systemie zarządzania certyfikatami. Kliknij pozycję Zmień , aby zamiast tego użyć własnego certyfikatu.

    Zmienianie certyfikatu bramy

  13. (opcjonalnie) Jeśli chcesz włączyć pełne rejestrowanie w celu rozwiązywania problemów z bramą, w programie Microsoft Zarządzanie danymi Gateway Configuration Manager przejdź do karty Diagnostyka i zaznacz opcję Włącz pełne rejestrowanie na potrzeby rozwiązywania problemów. Informacje rejestrowania można znaleźć w Podgląd zdarzeń systemu Windows w obszarze Dzienniki aplikacji i usług ->Zarządzanie danymi Brama. Możesz również użyć karty Diagnostyka , aby przetestować połączenie z lokalnym źródłem danych przy użyciu bramy.

    Włączanie pełnego rejestrowania

Spowoduje to ukończenie procesu konfiguracji bramy w usłudze Machine Learning Studio (wersja klasyczna). Teraz możesz używać danych lokalnych.

Dla każdego obszaru roboczego można utworzyć i skonfigurować wiele bram w programie Studio (klasycznym). Na przykład może istnieć brama, którą chcesz połączyć ze źródłami danych testowych podczas programowania, oraz inną bramą dla produkcyjnych źródeł danych. Usługa Machine Learning Studio (klasyczna) zapewnia elastyczność konfigurowania wielu bram w zależności od środowiska firmowego. Obecnie nie można współużytkować bramy między obszarami roboczymi i tylko jedną bramą można zainstalować na jednym komputerze. Aby uzyskać więcej informacji, zobacz Przenoszenie danych między źródłami lokalnymi i chmurą przy użyciu usługi Zarządzanie danymi Gateway.

Krok 2. Odczytywanie danych z lokalnego źródła danych przy użyciu bramy

Po skonfigurowaniu bramy możesz dodać moduł Importuj dane do eksperymentu, który wprowadza dane z bazy danych programu SQL Server.

  1. W usłudze Machine Learning Studio (wersja klasyczna) wybierz kartę EKSPERYMENTY , kliknij pozycję +NOWY w lewym dolnym rogu i wybierz pozycję Pusty eksperyment (lub wybierz jeden z kilku dostępnych przykładowych eksperymentów).

  2. Znajdź i przeciągnij moduł Importuj dane do kanwy eksperymentu.

  3. Kliknij przycisk Zapisz poniżej kanwy. Wprowadź ciąg "Machine Learning Studio (wersja klasyczna) Samouczek dotyczący lokalnego programu SQL Server" jako nazwę eksperymentu, wybierz obszar roboczy i kliknij znacznik wyboru OK .

    Zapisywanie eksperymentu przy użyciu nowej nazwy

  4. Kliknij moduł Importuj dane , aby go zaznaczyć, a następnie w okienku Właściwości po prawej stronie kanwy wybierz pozycję "Lokalna baza danych SQL" na liście rozwijanej Źródło danych.

  5. Wybierz zainstalowaną i zarejestrowaną bramę danych. Możesz skonfigurować inną bramę, wybierając pozycję "(dodaj nową bramę danych...)".

    Wybieranie bramy danych dla modułu Import Data (Importowanie danych)

  6. Wprowadź nazwę serwera usługi SQL Database i nazwę bazy danych wraz z zapytaniem usługi SQL Database, które chcesz wykonać.

  7. Kliknij pozycję Wprowadź wartości w obszarze Nazwa użytkownika i hasło , a następnie wprowadź poświadczenia bazy danych. W zależności od konfiguracji programu SQL Server można użyć zintegrowanego uwierzytelniania systemu Windows lub uwierzytelniania programu SQL Server.

    Wprowadzanie poświadczeń bazy danych

    Komunikat "wymagane wartości" zmienia się na "zestaw wartości" z zielonym znacznikiem wyboru. Wystarczy wprowadzić poświadczenia tylko raz, chyba że informacje o bazie danych lub hasło zostaną zmienione. Usługa Machine Learning Studio (wersja klasyczna) używa certyfikatu podanego podczas instalowania bramy do szyfrowania poświadczeń w chmurze. Platforma Azure nigdy nie przechowuje poświadczeń lokalnych bez szyfrowania.

    Właściwości modułu Importuj dane

  8. Kliknij pozycję URUCHOM , aby uruchomić eksperyment.

Po zakończeniu eksperymentu możesz zwizualizować dane zaimportowane z bazy danych, klikając port wyjściowy modułu Importuj dane i wybierając pozycję Visualize (Wizualizacja).

Po zakończeniu opracowywania eksperymentu możesz wdrożyć i zoperalizować model. Przy użyciu usługi Batch Execution Service dane z bazy danych programu SQL Server skonfigurowanej w module Importowanie danych będą odczytywane i używane do oceniania. Chociaż możesz użyć usługi Request Response Service do oceniania danych lokalnych, firma Microsoft zaleca zamiast tego korzystanie z dodatku programu Excel. Obecnie zapisywanie w bazie danych programu SQL Server za pomocą funkcji Eksportuj dane nie jest obsługiwane w eksperymentach lub opublikowanych usługach internetowych.