Szybki start: Tworzenie nowej bazy danych typu lake z wykorzystaniem szablonów bazy danych
Ten przewodnik Szybki start zawiera kompletny przykładowy scenariusz dotyczący sposobu stosowania szablonów baz danych do tworzenia bazy danych typu lake, dopasowywania danych do nowego modelu oraz używania zintegrowanego środowiska do analizowania danych.
Wymagania wstępne
- Do eksplorowania szablonu bazy danych lake z galerii są wymagane co najmniej uprawnienia roli użytkownika usługi Synapse.
- Uprawnienia administratora usługi Synapse lub współautora usługi Synapse są wymagane w obszarze roboczym usługi Azure Synapse do tworzenia bazy danych lake.
- Uprawnienia współautora danych obiektu blob usługi Storage są wymagane w usłudze Data Lake podczas korzystania z opcji tworzenia tabeli Z magazynu data lake .
Tworzenie bazy danych lake na podstawie szablonów baz danych
Użyj nowych funkcji szablonów baz danych, aby utworzyć bazę danych typu lake, której można użyć do skonfigurowania modelu danych dla bazy danych.
W naszym scenariuszu użyjemy szablonu Retail
bazy danych i wybierzemy następujące jednostki:
- RetailProduct — produkt to wszystko, co może być oferowane na rynku, który może zaspokoić potrzebę potencjalnych klientów. Ten produkt jest sumą wszystkich atrybutów fizycznych, psychologicznych, symbolicznych i usług skojarzonych z nim.
- Transakcja — najniższy poziom pracy wykonywalnej lub aktywności klienta. Transakcja składa się z co najmniej jednego zdarzenia dyskretnego.
- TransactionLineItem — składniki transakcji podzielone według produktu i ilości, po jednym na element wiersza.
- Strona — strona jest jednostką indywidualną, organizacją, jednostką prawną, organizacją społeczną lub jednostką biznesową dla firmy.
- Klient — klient jest osobą fizyczną lub prawną, która kupiła produkt lub usługę.
- Kanał — kanał to sposób, w jaki produkty lub usługi są sprzedawane i/lub dystrybuowane.
Najprostszym sposobem znalezienia jednostek jest użycie pola wyszukiwania powyżej różnych obszarów biznesowych, które zawierają tabele.
Konfigurowanie bazy danych lake
Po utworzeniu bazy danych upewnij się, że konto magazynu i ścieżka pliku jest ustawiona na lokalizację, w której chcesz przechowywać dane. Ścieżka zostanie domyślnie zmieniona na podstawowe konto magazynu w usłudze Azure Synapse Analytics, ale może zostać zmieniona zgodnie z potrzebami.
Aby zapisać układ i udostępnić go w usłudze Azure Synapse, opublikuj wszystkie zmiany. Ten krok umożliwia ukończenie konfiguracji bazy danych typu lake i udostępnienie jej wszystkim składnikom w usłudze Azure Synapse Analytics i poza nią.
Pozyskiwanie danych do bazy danych lake
Aby pozyskiwać dane do bazy danych typu lake, możesz wykonywać potoki za pomocą mapowań przepływu wolnych danych kodu, które mają łącznik bazy danych obszaru roboczego, aby załadować dane bezpośrednio do tabeli bazy danych. Możesz również użyć interaktywnych notesów platformy Spark do pozyskiwania danych do tabel bazy danych lake:
%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);
Wykonywanie zapytań na danych
Po utworzeniu bazy danych lake istnieją różne sposoby wykonywania zapytań dotyczących danych. Obecnie bazy danych SQL w bezserwerowych pulach SQL są obsługiwane i automatycznie rozumieją nowo utworzony format bazy danych lake.
SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]
Innym sposobem uzyskiwania dostępu do danych w usłudze Azure Synapse jest otwarcie nowego notesu platformy Spark i użycie zintegrowanego środowiska:
df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)
Trenowanie modeli uczenia maszynowego
Za pomocą bazy danych lake można trenować modele uczenia maszynowego i oceniać dane. Aby uzyskać więcej informacji , trenowanie modeli uczenia maszynowego
Następne kroki
Kontynuuj eksplorowanie możliwości projektanta bazy danych, korzystając z poniższych linków.