Udostępnij za pośrednictwem


Tworzenie zestawów danych pulpitu nawigacyjnego i zarządzanie nimi

W tym artykule wyjaśniono, jak tworzyć zestawy danych pulpitu nawigacyjnego i zarządzać nimi przy użyciu edytora zestawów danych na pulpicie nawigacyjnym sztucznej inteligencji/analizy biznesowej.

Definiowanie zestawów danych

Aby zdefiniować istniejące zestawy danych lub uzyskać do ich dostępu, kliknij kartę Dane w lewym górnym rogu pulpitu nawigacyjnego. Można zdefiniować maksymalnie 100 zestawów danych na pulpit nawigacyjny.

Zestawy danych można zdefiniować jako:

  • Nowe zapytanie względem co najmniej jednej tabeli lub widoków.
  • Istniejąca tabela lub widok Katalogu Unity.

Wszystkie zestawy danych są definiowane przez zapytanie. Po wybraniu istniejącej tabeli lub widoku Unity Catalogu, zapytanie dla tego zestawu danych jest poleceniem SELECT * dla tej tabeli lub widoku. Możesz zmodyfikować zapytanie, aby uściślić zestaw danych.

Zestaw danych musi być tworzony przez zapytanie, które można opakować w dodatkowy język SQL. Dane wyjściowe poleceń, takich jak DESCRIBE lub EXPLAIN, są nieprawidłowe jako zestawy danych. Ponadto zapytania pulpitu nawigacyjnego są tylko do odczytu, więc instrukcje modyfikujące dane, takie jak CREATE TABLE, INSERTlub DELETE, nie są obsługiwane.

Po zdefiniowaniu zestawu danych użyj menu Kebab menu kebab po prawej stronie nazwy zestawu danych, aby uzyskać dostęp do następujących opcji:

  • Zmień nazwę: Nadaj zestawowi danych opisową nazwę, aby Ty i Twój zespół mogli szybko identyfikować zapytania, które chcesz edytować lub przeglądać.

  • Sugerowana nazwa: Automatycznie wygeneruj sugerowaną nazwę na podstawie zapytania. Tę nazwę można edytować po jego wygenerowaniu.

  • Clone: Utwórz kopię zapytania w miejscu. Zapytanie można edytować po jego sklonowaniu.

  • Usuń: Usuń zestaw danych. Ta opcja jest niedostępna, jeśli zestaw danych jest używany na kanwie.

  • Pobierz: Zestaw danych można pobrać jako plik CSV, TSV lub Excel.

    Menu zawiera opcje zestawu danych

Notatka

Zestawy danych używane obecnie na kanwie są wyświetlane w tekście pogrubionym z niebieską ikoną, natomiast nieużywane zestawy danych mają szarą ikonę i nazwy nieodgrubione.

Wyświetlanie tabeli wyników

Podczas tworzenia zestawu danych zapytanie jest uruchamiane automatycznie, a wyniki są wyświetlane jako tabela w okienku poniżej edytora. Każda kolumna zawiera ikonę wskazującą jej typ danych.

Aby posortować wartości kolumn:

  • Umieść kursor na każdej kolumnie, aby wyświetlić ikonę sortowania .
  • Kliknij ikonę, aby posortować wartości w kolejności rosnącej lub malejącej.

Wyświetlanie schematu wyników zapytania

Aby wyświetlić schemat zdefiniowanego zestawu danych, kliknij pozycję Schemat z prawej stronytabeli wyników . Karta Schemat zawiera listę wszystkich pól ze zdefiniowanego zestawu danych. Każde pole jest oznaczone ikoną oznaczającą typ danych kolumny. Jeśli tabele lub widoki bazowe zawierają komentarze, są one wyświetlane na karcie schematu .

Miary obliczeniowe

Miary obliczeniowe umożliwiają stosowanie obliczeń do istniejącego zestawu danych bez modyfikowania bazy danych SQL tworzącej zestaw danych. Aby dowiedzieć się więcej na temat tworzenia i używania miar obliczeniowych, zobacz Jakie są miary obliczeniowe?

Pisanie zapytań obejmujących wiele instrukcji

W niektórych przypadkach możesz utworzyć zestaw danych przy użyciu wielu instrukcji SQL. Aby uruchomić wiele instrukcji, zakończ każdą instrukcję średnikiem (;). Po uruchomieniu tych poleceń w celu utworzenia zestawu danych dane wyjściowe zawierają wyniki ostatniej instrukcji w edytorze. Ten zestaw danych jest używany dla dowolnych powiązanych wizualizacji na kanwie.

Deklaracje są lokalne dla zestawu danych, w którym są wydawane. Jeśli na przykład utworzysz zestaw danych z instrukcją USE w celu ustawienia wykazu lub schematu, to ustawienie dotyczy tylko tego zestawu danych.

Przykłady

Przykłady poniżej demonstrują typowe zastosowania wieloinstrukcyjnych zapytań.

Ustawianie wykazu i schematu

Możesz napisać instrukcję USE, aby zadeklarować wykaz i schemat dla tabeli w zapytaniu. Poniższe zapytanie zawiera trzy twierdzenia. Pierwszy element ustawia nazwę katalogu. Drugi ustawia schemat. Instrukcja SELECT odwołuje się tylko do nazwy tabeli, ponieważ katalog i schemat zostały ustawione. Zobacz USE CATALOG.


USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;

Ustawianie trybu ANSI

Możesz ustawić zapytanie tak, aby uruchamiało się z ANSI_MODE ustawionym na TRUE lub FALSE. W przypadku usługi Databricks SQL wartość domyślna systemu dla ANSI_MODE to TRUE. Zobacz ANSI_MODE.

Następujące zapytanie ustawia ANSI_MODE na FALSE, aby nieprawidłowe dane wejściowe typu danych zwracały NULL zamiast zgłaszać błąd.

SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);

Parametryzowanie złożonych zapytań

Można użyć wielu instrukcji, aby sparametryzować nazwę widoku dla wspólnego wyrażenia tabeli lub innego złożonego zapytania.

Poniższe zapytanie tworzy dwa widoki tymczasowe. Instrukcja SELECT używa klauzuli IDENTIFIER do interpretowania ciągu wejściowego jako nazwy tabeli. Zobacz klauzulę IDENTIFIER.

CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)

Ustawianie zmiennych

Poniższe zapytanie deklaruje zmienną oraz jej wartość w ramach pierwszej instrukcji. Druga instrukcja zmienia wartość zmiennej. Trzecia instrukcja pokazuje wartość końcową zmiennej 5. Zobacz SET VARIABLE, aby uzyskać szczegółowe informacje i pełną składnię używania zmiennych tymczasowych.

DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);

Ograniczanie dostępu do danych przy użyciu języka SQL

Osoby przeglądające pulpit nawigacyjny mogą uzyskiwać dostęp do wszystkich danych w zestawie danych, nawet jeśli nie są wyświetlane w wizualizacjach. Aby zapobiec uwidacznianiu poufnych danych w przeglądarce, ogranicz kolumny w zapytaniu SQL definiującym zestaw danych. Na przykład zamiast wybierać wszystkie kolumny z tabeli, należy uwzględnić tylko określone pola wymagane dla wizualizacji.