Tworzenie zestawów danych pulpitu nawigacyjnego i zarządzanie nimi
W tym artykule wyjaśniono, jak tworzyć zestawy danych pulpitu nawigacyjnego i zarządzać nimi przy użyciu edytora zestawów danych na pulpicie nawigacyjnym sztucznej inteligencji/analizy biznesowej.
Definiowanie zestawów danych
Aby zdefiniować istniejące zestawy danych lub uzyskać do ich dostępu, kliknij kartę Dane w lewym górnym rogu pulpitu nawigacyjnego. Można zdefiniować maksymalnie 100 zestawów danych na pulpit nawigacyjny.
Zestawy danych można zdefiniować jako:
- Nowe zapytanie względem co najmniej jednej tabeli lub widoków.
- Istniejąca tabela lub widok Katalogu Unity.
Wszystkie zestawy danych są definiowane przez zapytanie. Po wybraniu istniejącej tabeli lub widoku Unity Catalogu, zapytanie dla tego zestawu danych jest poleceniem SELECT *
dla tej tabeli lub widoku. Możesz zmodyfikować zapytanie, aby uściślić zestaw danych.
Zestaw danych musi być tworzony przez zapytanie, które można opakować w dodatkowy język SQL. Dane wyjściowe poleceń, takich jak DESCRIBE
lub EXPLAIN
, są nieprawidłowe jako zestawy danych. Ponadto zapytania pulpitu nawigacyjnego są tylko do odczytu, więc instrukcje modyfikujące dane, takie jak CREATE TABLE
, INSERT
lub DELETE
, nie są obsługiwane.
Po zdefiniowaniu zestawu danych użyj menu menu kebab po prawej stronie nazwy zestawu danych, aby uzyskać dostęp do następujących opcji:
Zmień nazwę: Nadaj zestawowi danych opisową nazwę, aby Ty i Twój zespół mogli szybko identyfikować zapytania, które chcesz edytować lub przeglądać.
Sugerowana nazwa: Automatycznie wygeneruj sugerowaną nazwę na podstawie zapytania. Tę nazwę można edytować po jego wygenerowaniu.
Clone: Utwórz kopię zapytania w miejscu. Zapytanie można edytować po jego sklonowaniu.
Usuń: Usuń zestaw danych. Ta opcja jest niedostępna, jeśli zestaw danych jest używany na kanwie.
Pobierz: Zestaw danych można pobrać jako plik CSV, TSV lub Excel.
Menu
Notatka
Zestawy danych używane obecnie na kanwie są wyświetlane w tekście pogrubionym z niebieską ikoną, natomiast nieużywane zestawy danych mają szarą ikonę i nazwy nieodgrubione.
Wyświetlanie tabeli wyników
Podczas tworzenia zestawu danych zapytanie jest uruchamiane automatycznie, a wyniki są wyświetlane jako tabela w okienku poniżej edytora. Każda kolumna zawiera ikonę wskazującą jej typ danych.
Aby posortować wartości kolumn:
- Umieść kursor na każdej kolumnie, aby wyświetlić ikonę sortowania
.
- Kliknij ikonę, aby posortować wartości w kolejności rosnącej lub malejącej.
Wyświetlanie schematu wyników zapytania
Aby wyświetlić schemat zdefiniowanego zestawu danych, kliknij pozycję
Miary obliczeniowe
Miary obliczeniowe umożliwiają stosowanie obliczeń do istniejącego zestawu danych bez modyfikowania bazy danych SQL tworzącej zestaw danych. Aby dowiedzieć się więcej na temat tworzenia i używania miar obliczeniowych, zobacz Jakie są miary obliczeniowe?
Pisanie zapytań obejmujących wiele instrukcji
W niektórych przypadkach możesz utworzyć zestaw danych przy użyciu wielu instrukcji SQL. Aby uruchomić wiele instrukcji, zakończ każdą instrukcję średnikiem (;
). Po uruchomieniu tych poleceń w celu utworzenia zestawu danych dane wyjściowe zawierają wyniki ostatniej instrukcji w edytorze. Ten zestaw danych jest używany dla dowolnych powiązanych wizualizacji na kanwie.
Deklaracje są lokalne dla zestawu danych, w którym są wydawane. Jeśli na przykład utworzysz zestaw danych z instrukcją USE
w celu ustawienia wykazu lub schematu, to ustawienie dotyczy tylko tego zestawu danych.
Przykłady
Przykłady poniżej demonstrują typowe zastosowania wieloinstrukcyjnych zapytań.
Ustawianie wykazu i schematu
Możesz napisać instrukcję USE
, aby zadeklarować wykaz i schemat dla tabeli w zapytaniu. Poniższe zapytanie zawiera trzy twierdzenia. Pierwszy element ustawia nazwę katalogu. Drugi ustawia schemat. Instrukcja SELECT
odwołuje się tylko do nazwy tabeli, ponieważ katalog i schemat zostały ustawione. Zobacz USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
Ustawianie trybu ANSI
Możesz ustawić zapytanie tak, aby uruchamiało się z ANSI_MODE
ustawionym na TRUE
lub FALSE
. W przypadku usługi Databricks SQL wartość domyślna systemu dla ANSI_MODE
to TRUE
. Zobacz ANSI_MODE.
Następujące zapytanie ustawia ANSI_MODE
na FALSE
, aby nieprawidłowe dane wejściowe typu danych zwracały NULL
zamiast zgłaszać błąd.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Parametryzowanie złożonych zapytań
Można użyć wielu instrukcji, aby sparametryzować nazwę widoku dla wspólnego wyrażenia tabeli lub innego złożonego zapytania.
Poniższe zapytanie tworzy dwa widoki tymczasowe. Instrukcja SELECT
używa klauzuli IDENTIFIER
do interpretowania ciągu wejściowego jako nazwy tabeli. Zobacz klauzulę IDENTIFIER.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Ustawianie zmiennych
Poniższe zapytanie deklaruje zmienną oraz jej wartość w ramach pierwszej instrukcji. Druga instrukcja zmienia wartość zmiennej. Trzecia instrukcja pokazuje wartość końcową zmiennej 5. Zobacz SET VARIABLE, aby uzyskać szczegółowe informacje i pełną składnię używania zmiennych tymczasowych.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);
Ograniczanie dostępu do danych przy użyciu języka SQL
Osoby przeglądające pulpit nawigacyjny mogą uzyskiwać dostęp do wszystkich danych w zestawie danych, nawet jeśli nie są wyświetlane w wizualizacjach. Aby zapobiec uwidacznianiu poufnych danych w przeglądarce, ogranicz kolumny w zapytaniu SQL definiującym zestaw danych. Na przykład zamiast wybierać wszystkie kolumny z tabeli, należy uwzględnić tylko określone pola wymagane dla wizualizacji.