Udostępnij za pośrednictwem


Reguły typów danych SQL

Dotyczy:zaznacz pole wyboru oznaczone jako tak Databricks SQL zaznacz pole wyboru oznaczone jako tak Databricks Runtime

Usługa Azure Databricks używa kilku reguł do rozwiązywania konfliktów między typami danych:

Można również jawnie rzutować między wieloma typami:

Podwyższanie typu

Podwyższanie typu to proces rzutowania typu do innego typu rodziny tego samego typu, który zawiera wszystkie możliwe wartości oryginalnego typu. W związku z tym podwyższenie poziomu typu jest bezpieczną operacją. Na przykład TINYINT ma zakres od -128 do 127. Wszystkie możliwe wartości można bezpiecznie awansować do INTEGERelementu .

Lista pierwszeństwa typów

Lista pierwszeństwa typów określa, czy wartości danego typu danych mogą być niejawnie promowane do innego typu danych.

Typ danych Lista pierwszeństwa (od najwęższej do najszerszej)
TINYINT TINYINT -> SMALLINT - INT ->> BIGINT -> DECIMAL -> FLOAT (1) -> DOUBLE
SMALLINT SMALLINT - INT ->> BIGINT -> DECIMAL -> FLOAT (1) -> DOUBLE
INT INT - BIGINT ->> DECIMAL -> FLOAT (1) -> DOUBLE
BIGINT BIGINT — LICZBA DZIESIĘTNA —>> ZMIENNOPRZECINKOWA (1) —> PODWÓJNA
DZIESIĘTNY DZIESIĘTNE —> ZMIENNOPRZECINKOWE (1) —> PODWÓJNE
SPŁAWIK ZMIENNOPRZECINKOWY (1) —> PODWÓJNY
PODWÓJNY PODWÓJNY
DATA DATA —> SYGNATURA CZASOWA
TIMESTAMP TIMESTAMP
TABLICA TABLICA (2)
DWÓJKOWY DWÓJKOWY
BOOLOWSKI BOOLOWSKI
INTERWAŁ INTERWAŁ
MAPA MAP (2)
STRUNA STRUNA
STRUCT STRUKTURA (2)
WARIANT VARIANT
SPRZECIWIAĆ SIĘ OBJECT (3)

(1) W przypadku najmniejszej typowej rozdzielczościFLOAT typu pomija się, aby uniknąć utraty precyzji.

(2) W przypadku typu złożonego reguła pierwszeństwa jest cyklicznie stosowana do jej elementów składników.

(3)OBJECT istnieje tylko w obrębie obiektu VARIANT.

Ciągi i wartość NULL

Zasady specjalne mają zastosowanie do STRING i nietypowe NULL:

  • NULL można awansować do dowolnego innego typu.
  • STRINGmożna awansować do BIGINT, , BINARYBOOLEANDATEDOUBLE, INTERVAL, i .TIMESTAMP Jeśli nie można rzutować rzeczywistej wartości ciągu na najmniej typowy typ usługi Azure Databricks, zgłasza błąd środowiska uruchomieniowego. W przypadku podwyższenia poziomu do INTERVAL wartości ciągu musi być zgodna z jednostkami interwałów.

Wykres pierwszeństwa typu

Jest to graficzna ilustracja hierarchii pierwszeństwa, łącząca listę pierwszeństwa typów oraz ciągi i reguły NULLs .

Graficzna reprezentacja reguł pierwszeństwa

Najmniej typowa rozdzielczość typu

Najmniej typowym typem z zestawu typów jest najwęższy typ osiągalny z wykresu pierwszeństwa typu przez wszystkie elementy zestawu typów.

Najmniej typowe rozpoznawanie typów jest używane do:

  • Zdecyduj, czy funkcja, która oczekuje parametru danego typu, może być wywoływana przy użyciu argumentu węższego typu.
  • Utwórz typ argumentu dla funkcji, która oczekuje współużytkowanego typu argumentu dla wielu parametrów, takich jak łączenie, w, najmniej lub najwspanialsze.
  • Utwórz typy operandów dla operatorów, takich jak operacje arytmetyczne lub porównania.
  • Utwórz typ wyniku dla wyrażeń, takich jak wyrażenie przypadku.
  • Wyodrębnij typy elementów, kluczy lub wartości dla konstruktorów tablic i map .
  • Utwórz wynik typu UNION, INTERSECT lub Z wyjątkiem operatorów zestawu.

Reguły specjalne są stosowane, jeśli najmniej typowy typ jest rozpoznawany jako FLOAT. Jeśli którykolwiek z typów współtworzenia jest dokładnym typem liczbowym (TINYINT, SMALLINT, INTEGER, BIGINTlub DECIMAL) jest wypchnięty najmniejszy typ, aby DOUBLE uniknąć potencjalnej utraty cyfr.

Gdy najmniej typowy typ to STRING sortowanie jest obliczane zgodnie z regułami pierwszeństwa sortowania .

Niejawne obniżanie i przechodzenie krzyżowe

Usługa Azure Databricks wykorzystuje te formy niejawnego rzutowania tylko w przypadku wywołania funkcji i operatora oraz tylko wtedy, gdy może jednoznacznie określić intencję.

  • Niejawne obniżanie

    Niejawne zmniejszanie automatycznie rzutuje szerszy typ na węższy typ bez konieczności jawnego określania rzutowania. Obniżanie jest wygodne, ale wiąże się z ryzykiem nieoczekiwanych błędów środowiska uruchomieniowego, jeśli rzeczywista wartość nie może być reprezentowana w wąskim typie.

    Downcasting stosuje listę pierwszeństwa typu w odwrotnej kolejności.

  • Niejawne przesłanie krzyżowe

    Niejawne rzutowanie krzyżowe rzutuje wartość z jednej rodziny typów na inną bez konieczności jawnego określenia rzutowania.

    Usługa Azure Databricks obsługuje niejawne crosscasting z:

    • Dowolny prosty typ, z wyjątkiem BINARY, do STRING.
    • Od STRING dowolnego prostego typu.

Rzutowanie na wywołanie funkcji

Biorąc pod uwagę rozpoznaną funkcję lub operator, obowiązują następujące reguły w kolejności, w której są wymienione, dla każdego parametru i pary argumentów:

  • Jeśli obsługiwany typ parametru jest częścią grafu pierwszeństwa typu argumentu, usługa Azure Databricks promuje argument tego typu parametru.

    W większości przypadków opis funkcji jawnie określa obsługiwane typy lub łańcuch, takie jak "dowolny typ liczbowy".

    Na przykład funkcja sin(expr) działa, DOUBLE ale zaakceptuje dowolną wartość liczbową.

  • Jeśli oczekiwany typ parametru to STRING a argument jest prostym typem, usługa Azure Databricks przesłania argument do typu parametru ciągu.

    Na przykład parametr substr(str, start, len) oczekuje str wartości .STRING Zamiast tego można przekazać typ liczbowy lub data/godzina.

  • Jeśli typ argumentu to STRING , a oczekiwany typ parametru jest prostym typem, usługa Azure Databricks przesłania argument ciągu do najszerszego obsługiwanego typu parametru.

    Na przykład date_add (data, dni) oczekuje wartości i DATEINTEGER.

    W przypadku wywołania za date_add() pomocą dwóch STRINGs usługa Azure Databricks wykonuje krzyżowe emisje od pierwszego STRING do DATE i drugiego STRING do .INTEGER

  • Jeśli funkcja oczekuje typu liczbowego, takiego jak INTEGER, lub DATE typu, ale argument jest bardziej ogólnym typem, takim jak DOUBLE lub TIMESTAMP, usługa Azure Databricks niejawnie obniża argument do tego typu parametru.

    Na przykład date_add (data, dni) oczekuje wartości i DATEINTEGER.

    Jeśli wywołasz element date_add() z elementem TIMESTAMPBIGINT i , usługa Azure Databricks obniżyTIMESTAMP wartość elementu , DATE usuwając składnik time i element BIGINT do elementu INTEGER.

  • W przeciwnym razie usługa Azure Databricks zgłasza błąd.

Przykłady

Funkcja coalesce akceptuje dowolny zestaw typów argumentów, o ile mają one najmniej wspólny typ.

Typ wyniku jest najmniej typowym typem argumentów.

-- The least common type of TINYINT and BIGINT is BIGINT
> SELECT typeof(coalesce(1Y, 1L, NULL));
  BIGINT

-- INTEGER and DATE do not share a precedence chain or support crosscasting in either direction.
> SELECT typeof(coalesce(1, DATE'2020-01-01'));
  Error: DATATYPE_MISMATCH.DATA_DIFF_TYPES

-- Both are ARRAYs and the elements have a least common type
> SELECT typeof(coalesce(ARRAY(1Y), ARRAY(1L)))
  ARRAY<BIGINT>

-- The least common type of INT and FLOAT is DOUBLE
> SELECT typeof(coalesce(1, 1F))
  DOUBLE

> SELECT typeof(coalesce(1L, 1F))
  DOUBLE

> SELECT typeof(coalesce(1BD, 1F))
  DOUBLE

-- The least common type between an INT and STRING is BIGINT
> SELECT typeof(coalesce(5, '6'));
  BIGINT

-- The least common type is a BIGINT, but the value is not BIGINT.
> SELECT coalesce('6.1', 5);
  Error: CAST_INVALID_INPUT

-- The least common type between a DECIMAL and a STRING is a DOUBLE
>  SELECT typeof(coalesce(1BD, '6'));
  DOUBLE

-- Two distinct explicit collations result in an error
>  SELECT collation(coalesce('hello' COLLATE UTF8_BINARY,
                             'world' COLLATE UNICODE));
  Error: COLLATION_MISMATCH.EXPLICIT

-- The resulting collation between two distinct implicit collations is indeterminate
>  SELECT collation(coalesce(c1, c2))
     FROM VALUES('hello' COLLATE UTF8_BINARY,
                 'world' COLLATE UNICODE) AS T(c1, c2);
  NULL

-- The resulting collation between a explicit and an implicit collations is the explicit collation.
> SELECT collation(coalesce(c1 COLLATE UTF8_BINARY, c2))
    FROM VALUES('hello',
                'world' COLLATE UNICODE) AS T(c1, c2);
  UTF8_BINARY

-- The resulting collation between an implicit and the default collation is the implicit collation.
> SELECT collation(coalesce(c1, ‘world’))
    FROM VALUES('hello' COLLATE UNICODE) AS T(c1, c2);
  UNICODE

-- The resulting collation between the default collation and the indeterminate collation is the default collation.
> SELECT collation(coalesce(coalesce(‘hello’ COLLATE UTF8_BINARY, ‘world’ COLLATE UNICODE), ‘world’));
  UTF8_BINARY

Funkcja podciągów oczekuje argumentów typu STRING dla ciągu oraz INTEGER parametrów początkowych i długości.

-- Promotion of TINYINT to INTEGER
> SELECT substring('hello', 1Y, 2);
 he

-- No casting
> SELECT substring('hello', 1, 2);
 he

-- Casting of a literal string
> SELECT substring('hello', '1', 2);
 he

-- Downcasting of a BIGINT to an INT
> SELECT substring('hello', 1L, 2);
 he

-- Crosscasting from STRING to INTEGER
> SELECT substring('hello', str, 2)
  FROM VALUES(CAST('1' AS STRING)) AS T(str);
 he

-- Crosscasting from INTEGER to STRING
> SELECT substring(12345, 2, 2);
 23

|| (CONCAT) umożliwia niejawne przesiełowanie krzyżowe do ciągu.

-- A numeric is cast to STRING
> SELECT 'This is a numeric: ' || 5.4E10;
 This is a numeric: 5.4E10

-- A date is cast to STRING
> SELECT 'This is a date: ' || DATE'2021-11-30';
 This is a date: 2021-11-30

date_add można wywołać za pomocą elementu TIMESTAMP lub BIGINT z powodu niejawnego downcastingu.

> SELECT date_add(TIMESTAMP'2011-11-30 08:30:00', 5L);
 2011-12-05

date_add można wywołać z STRINGs z powodu niejawnego przesłaniania krzyżowego.

> SELECT date_add('2011-11-30 08:30:00', '5');
  2011-12-05