Provádění analýz pomocí nástroje Machine Learning Studio (classic) s využitím databáze SQL Serveru
PLATÍ PRO: Machine Learning Studio (Classic) Azure Machine Learning
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- Přečtěte si informace o přesunu projektů strojového učení ze sady ML Studio (classic) do služby Azure Machine Learning.
- Další informace o službě Azure Machine Learning
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Podniky, které pracují s místními daty, by často chtěly využít škálování a flexibilitu cloudu pro své úlohy strojového učení. Nechtějí ale narušovat své aktuální obchodní procesy a pracovní postupy přesunem místních dat do cloudu. Machine Learning Studio (classic) teď podporuje čtení dat z databáze SQL Serveru a následné trénování a vyhodnocování modelu s daty. Už nemusíte ručně kopírovat a synchronizovat data mezi cloudem a místním serverem. Místo toho může modul Import dat v nástroji Machine Learning Studio (classic) číst přímo z databáze SQL Serveru pro trénovací a bodovací úlohy.
Tento článek obsahuje přehled o tom, jak příchozí přenos dat SQL Serveru do nástroje Machine Learning Studio (classic). Předpokládá se, že znáte koncepty Studia (klasické), jako jsou pracovní prostory, moduly, datové sady, experimenty atd.
Poznámka:
Tato funkce není k dispozici pro bezplatné pracovní prostory. Další informace o cenách a úrovních služby Machine Learning najdete v tématu Ceny nástroje Machine Learning Studio (Classic).
Instalace místního prostředí Integration Runtime služby Data Factory
Pokud chcete získat přístup k databázi SQL Serveru v nástroji Machine Learning Studio (Classic), musíte stáhnout a nainstalovat místní prostředí Integration Runtime služby Data Factory, dříve označované jako brána Správa dat. Při konfiguraci připojení v nástroji Machine Learning Studio (Classic) máte možnost stáhnout a nainstalovat prostředí Integration Runtime (IR) pomocí dialogového okna Stáhnout a zaregistrovat bránu dat popsanou níže.
Prostředí IR můžete také nainstalovat předem stažením a spuštěním instalačního balíčku MSI z webu Microsoft Download Center. MSI se dá použít také k upgradu existujícího prostředí IR na nejnovější verzi se zachováním všech nastavení.
Místní prostředí Integration Runtime služby Data Factory má následující požadavky:
- Integrace služby Data Factory v místním prostředí vyžaduje 64bitový operační systém s rozhraním .NET Framework 4.6.1 nebo novějším.
- Podporované verze operačního systému Windows jsou Windows 10 , Windows Server 2012, Windows Server 2012 R2, Windows Server 2016.
- Doporučená konfigurace pro počítač IR je minimálně 2 GHz, 4jádrový procesor, 8 GB RAM a 80 GB disku.
- Pokud hostitelský počítač přejde do režimu hibernace, prostředí IR nebude odpovídat na žádosti o data. Před instalací prostředí IR proto na počítači nakonfigurujte vhodný plán napájení. Pokud je počítač nakonfigurovaný na hibernaci, instalace prostředí IR zobrazí zprávu.
- Vzhledem k tomu, že aktivita kopírování probíhá v určité frekvenci, využití prostředků (procesor, paměť) na počítači se také řídí stejným způsobem s dobou špičky a nečinnosti. Využití prostředků také výrazně závisí na množství dat, která se přesouvají. Když probíhá více úloh kopírování, uvidíte, jak se využití prostředků během špičky zpozoruje. I když je minimální výše uvedená konfigurace technicky dostatečná, můžete chtít mít konfiguraci s více prostředky, než je minimální konfigurace v závislosti na vašem konkrétním zatížení pro přesun dat.
Při nastavování a používání místního prostředí Integration Runtime služby Data Factory zvažte následující skutečnosti:
Na jeden počítač můžete nainstalovat jenom jednu instanci prostředí IR.
Jedno prostředí IR můžete použít pro více místních zdrojů dat.
Ke stejnému místnímu zdroji dat můžete připojit více ir na různých počítačích.
Najednou nakonfigurujete žádosti o přijetí změn jenom pro jeden pracovní prostor. V současné době se žádosti o přijetí změn nedají sdílet mezi pracovními prostory.
Pro jeden pracovní prostor můžete nakonfigurovat více ir. Můžete například chtít použít prostředí IR, které je připojené ke zdrojům testovacích dat během vývoje a produkčního prostředí IR, když jste připraveni zprovoznit.
Prostředí IR nemusí být na stejném počítači jako zdroj dat. Zůstat blíž ke zdroji dat ale zkracuje dobu, po které se brána může připojit ke zdroji dat. Doporučujeme nainstalovat prostředí IR na počítač, který se liší od počítače, který je hostitelem místního zdroje dat, aby brána a zdroj dat nekonkuroval prostředkům.
Pokud už máte na počítači nainstalované prostředí IR, které obsluhuje scénáře Power BI nebo Azure Data Factory, nainstalujte samostatné prostředí IR pro Machine Learning Studio (classic) na jiný počítač.
Poznámka:
Na stejném počítači nemůžete spustit místní prostředí Integration Runtime služby Data Factory a Bránu Power BI.
Potřebujete použít místní prostředí Integration Runtime služby Data Factory pro Machine Learning Studio (classic), i když používáte Azure ExpressRoute pro jiná data. Zdroj dat byste měli považovat za místní zdroj dat (který je za bránou firewall), i když používáte ExpressRoute. K navázání připojení mezi Machine Learning a zdrojem dat použijte místní prostředí Integration Runtime služby Data Factory.
Podrobné informace o požadavcích instalace, krocích instalace a tipech pro řešení potíží najdete v článku Integration Runtime ve službě Data Factory.
Příchozí přenos dat z databáze SQL Serveru do služby Machine Learning
V tomto názorném postupu nastavíte prostředí Azure Data Factory Integration Runtime v pracovním prostoru Azure Machine Learning, nakonfigurujete ho a pak načtete data z databáze SQL Serveru.
Tip
Než začnete, zakažte blokování automaticky otevíraných oken prohlížeče pro studio.azureml.net
. Pokud používáte prohlížeč Google Chrome, stáhněte a nainstalujte jeden z několika modulů plug-in, které jsou k dispozici v Prohlížeči Google Chrome WebStore Click Once App Extension.
Poznámka:
Místní prostředí Integration Runtime služby Azure Data Factory se dříve označovalo jako Správa dat Gateway. Podrobný kurz se na ni bude dál odkazovat jako na bránu.
Krok 1: Vytvoření brány
Prvním krokem je vytvoření a nastavení brány pro přístup k databázi SQL.
Přihlaste se k nástroji Machine Learning Studio (Classic) a vyberte pracovní prostor, ve který chcete pracovat.
Klikněte na okno NASTAVENÍ na levé straně a potom klikněte na kartu BRÁNY DAT v horní části.
V dolní části obrazovky klikněte na NOVÁ BRÁNA DAT.
V dialogovém okně Nová brána dat zadejte název brány a volitelně přidejte popis. Kliknutím na šipku v pravém dolním rohu přejděte k dalšímu kroku konfigurace.
V dialogovém okně Stáhnout a zaregistrovat bránu dat zkopírujte REGISTRAČNÍ KLÍČ BRÁNY do schránky.
Pokud jste ještě nestáhli a nenainstalovali bránu Microsoft Správa dat Gateway, klikněte na tlačítko Stáhnout bránu pro správu dat. Tím přejdete do webu Microsoft Download Center, kde můžete vybrat požadovanou verzi brány, stáhnout ji a nainstalovat. Podrobné informace o požadavcích instalace, krocích instalace a tipech pro řešení potíží najdete v úvodních částech článku Přesun dat mezi místními zdroji a cloudem pomocí služby Správa dat Gateway.
Po instalaci brány se otevře Správa dat Správce konfigurace brány a zobrazí se dialogové okno Registrovat bránu. Vložte registrační klíč brány, který jste zkopírovali do schránky, a klikněte na Zaregistrovat.
Pokud už máte bránu nainstalovanou, spusťte nástroj Správa dat Gateway Configuration Manager. Klikněte na Změnit klíč, vložte registrační klíč brány, který jste zkopírovali do schránky v předchozím kroku, a klikněte na OK.
Po dokončení instalace se zobrazí dialogové okno Zaregistrovat bránu pro Microsoft Správa dat Gateway Configuration Manager. Vložte REGISTRAČNÍ KLÍČ BRÁNY, který jste zkopírovali do schránky v předchozím kroku, a klikněte na Zaregistrovat.
Konfigurace brány se dokončí po nastavení následujících hodnot na kartě Domů v nástroji Microsoft Správa dat Gateway Configuration Manager:
Název brány a název instance jsou nastavené na název brány.
Registrace je nastavená na Registrováno.
Stav je nastavený na Hodnotu Spuštěno.
Stavový řádek v dolní části zobrazuje připojeno ke cloudové službě brány Správa dat spolu se zelenou značkou zaškrtnutí.
Machine Learning Studio (classic) se také aktualizuje, když registrace proběhne úspěšně.
V dialogovém okně Stáhnout a zaregistrovat bránu dat kliknutím na značku zaškrtnutí dokončete nastavení. Na stránce Nastavení se zobrazí stav brány jako Online. V pravém podokně najdete stav a další užitečné informace.
V nástroji Microsoft Správa dat Gateway Configuration Manager přepněte na kartu Certifikát. Certifikát zadaný na této kartě slouží k šifrování a dešifrování přihlašovacích údajů pro místní úložiště dat, které zadáte na portálu. Tento certifikát je výchozím certifikátem. Společnost Microsoft doporučuje změnit tento certifikát na vlastní certifikát, který zálohujete v systému pro správu certifikátů. Chcete-li místo toho použít vlastní certifikát, klikněte na tlačítko Změnit .
(volitelné) Pokud chcete povolit podrobné protokolování, abyste mohli řešit problémy s bránou, přepněte v Nástroji Microsoft Správa dat Gateway Configuration Manager na kartu Diagnostika a zkontrolujte možnost Povolit podrobné protokolování pro účely řešení potíží. Informace o protokolování najdete v Prohlížeč událostí Systému Windows v uzlu Protokoly aplikací a služeb ->Správa dat Gateway. Pomocí karty Diagnostika můžete také otestovat připojení k místnímu zdroji dat pomocí brány.
Tím se dokončí proces nastavení brány v nástroji Machine Learning Studio (Classic). Teď jste připraveni použít místní data.
V sadě Studio (Classic) můžete vytvořit a nastavit více bran pro každý pracovní prostor. Můžete mít například bránu, kterou chcete připojit k testovacím zdrojům dat během vývoje, a jinou bránu pro produkční zdroje dat. Machine Learning Studio (classic) vám dává flexibilitu při nastavování více bran v závislosti na firemním prostředí. V současné době nemůžete sdílet bránu mezi pracovními prostory a do jednoho počítače je možné nainstalovat jenom jednu bránu. Další informace najdete v tématu Přesun dat mezi místními zdroji a cloudem pomocí služby Správa dat Gateway.
Krok 2: Čtení dat z místního zdroje dat pomocí brány
Po nastavení brány můžete do experimentu přidat modul importu dat , který zadává data z databáze SQL Serveru.
V nástroji Machine Learning Studio (classic) vyberte kartu EXPERIMENTS , klikněte v levém dolním rohu na +NOVÝ a vyberte Prázdný experiment (nebo vyberte jeden z několika dostupných ukázkových experimentů).
Najděte a přetáhněte modul Import dat na plátno experimentu.
Klikněte na Uložit jako pod plátnem. Jako název experimentu zadejte "Machine Learning Studio (classic) On-Premises SQL Server Tutorial", vyberte pracovní prostor a klikněte na značku zaškrtnutí OK .
Kliknutím na modul Importovat data ho vyberte a v podokně Vlastnosti napravo od plátna vyberte v rozevíracím seznamu Zdroj dat místní databázi SQL.
Vyberte bránu dat, kterou jste nainstalovali a zaregistrovali. Jinou bránu můžete nastavit tak, že vyberete "(přidat novou bránu dat...)".
Zadejte název serveru SLUŽBY SQL Database a název databáze spolu s dotazem služby SQL Database, který chcete spustit.
Klikněte na Zadat hodnoty pod uživatelským jménem a heslem a zadejte přihlašovací údaje k databázi. Integrované ověřování systému Windows nebo ověřování SQL Serveru můžete použít v závislosti na konfiguraci SQL Serveru.
Zpráva "hodnoty povinné" se změní na "hodnoty nastavené" se zelenou značkou zaškrtnutí. Přihlašovací údaje stačí zadat jenom jednou, pokud se nezmění informace o databázi nebo heslo. Machine Learning Studio (Classic) používá certifikát, který jste zadali při instalaci brány, k šifrování přihlašovacích údajů v cloudu. Azure nikdy neuchová místní přihlašovací údaje bez šifrování.
Kliknutím na SPUSTIT spustíte experiment.
Po dokončení experimentu můžete vizualizovat data importovaná z databáze kliknutím na výstupní port modulu Import dat a výběrem možnosti Vizualizovat.
Po dokončení vývoje experimentu můžete model nasadit a zprovoznit. Pomocí služby Batch Execution Service se data z databáze SQL Serveru nakonfigurované v modulu Import data načtou a použijí k vyhodnocování. I když pro bodování místních dat můžete použít službu Request Response Service, Microsoft místo toho doporučuje použít doplněk Excelu. V současné době není zápis do databáze SQL Serveru prostřednictvím exportu dat podporován buď ve vašich experimentech nebo publikovaných webových službách.