Nauka o danych analiza zespołu oparta na maszynach wirtualnych i środowisko sztucznej inteligencji
Maszyna wirtualna Nauka o danych (DSVM) udostępnia bogate środowisko na platformie Azure, ze wstępnie utworzonym oprogramowaniem do sztucznej inteligencji (AI) i analizą danych.
Tradycyjnie maszyna DSVM została użyta jako indywidualny pulpit analityczny. To udostępnione, wstępnie utworzone środowisko analityczne zwiększa produktywność naukowców. Ponieważ duże zespoły analityczne planują środowiska dla swoich analityków danych i deweloperów sztucznej inteligencji, jednym z motywów cyklicznych jest współużytkowany projekt i infrastruktura analizy eksperymentów. Ta infrastruktura jest zarządzana zgodnie z zasadami IT przedsiębiorstwa, które ułatwiają również współpracę i spójność w zespołach nauki o danych i analizie.
Udostępniona infrastruktura zwiększa wykorzystanie it w środowisku analitycznym. Niektóre organizacje opisują infrastrukturę analizy danych opartą na zespole jako piaskownicę analizy. Dzięki temu analitycy danych mogą uzyskiwać dostęp do różnych zasobów danych, aby szybko zrozumieć te dane i obsługiwać je. To środowisko piaskownicy pomaga również analitykom danych uruchamiać eksperymenty, weryfikować hipotezy i tworzyć modele predykcyjne, które nie mają wpływu na środowisko produkcyjne.
Ponieważ maszyna DSVM działa na poziomie infrastruktury platformy Azure, administratorzy IT mogą łatwo skonfigurować maszynę DSVM do działania zgodnie z zasadami IT przedsiębiorstwa. Maszyna DSVM zapewnia pełną elastyczność implementacji różnych architektur udostępniania i zapewnia dostęp do zasobów danych firmowych w kontrolowany sposób.
W tej sekcji omówiono wzorce i wskazówki, których można użyć do wdrożenia maszyny DSVM jako infrastruktury nauki o danych opartych na zespole. Ponieważ bloki konstrukcyjne dla tych wzorców pochodzą z infrastruktury jako usługi (IaaS) platformy Azure, mają zastosowanie do wszystkich maszyn wirtualnych platformy Azure. Ta seria artykułów koncentruje się na zastosowaniu tych standardowych funkcji infrastruktury platformy Azure do maszyny DSVM.
Kluczowe bloki konstrukcyjne środowiska analizy zespołu przedsiębiorstwa obejmują:
- Automatycznie skalowana pula maszyn DSVM
- Wspólna tożsamość i dostęp do obszaru roboczego z dowolnej maszyny DSVM w puli
- Bezpieczny dostęp do źródeł danych
Ta seria zawiera wskazówki i porady dotyczące każdego z powyższych tematów. Nie obejmuje wszystkich zagadnień i wymagań dotyczących wdrażania maszyn DSVM w dużych konfiguracjach przedsiębiorstwa. Poniżej przedstawiono kilka innych zasobów platformy Azure, których można używać podczas implementowania wystąpień maszyn WIRTUALNYch DSVM w przedsiębiorstwie:
- Bezpieczeństwo sieci
- Monitorowanie i zarządzanie
- Rejestrowanie i przeprowadzanie inspekcji
- Kontrola dostępu na podstawie ról na platformie Azure (Azure RBAC)
- Ustawienie zasad i wymuszanie
- Oprogramowanie chroniące przed złośliwym kodem
- Szyfrowanie
- Odnajdywanie danych i nadzór
Na koniec centrum architektury platformy Azure udostępnia szczegółową architekturę i modele służące do tworzenia infrastruktury analizy opartej na chmurze i zarządzania nią.