Poznámka k vydání verze Ga katalogu Unity
Důležité
Tato dokumentace byla vyřazena a nemusí být aktualizována. Produkty, služby nebo technologie uvedené v tomto obsahu se už nepodporují. Viz téma Co je katalog Unity?.
25. srpna 2022
Katalog Unity je teď obecně dostupný v Azure Databricks.
Tento článek popisuje katalog Unity od data vydání verze GA. Zaměřuje se především na funkce a aktualizace přidané do katalogu Unity od verze Public Preview. Aktuální informace o katalogu Unity najdete v tématu Co je Katalog Unity?. Poznámky k verzi, které popisují aktualizace katalogu Unity od ga, najdete v poznámkách k verzi platformy Azure Databricks a ve verzích a kompatibilitě k verzi modulu Databricks Runtime.
Omezení metastoru a kvóty prostředků
Od 25. srpna 2022
- Váš účet Azure Databricks může mít pro každou oblast pouze jeden metastor.
- Metastor může mít až 1 000 katalogů.
- Katalog může mít až 10 000 schémat.
- Schéma může mít až 10 000 tabulek.
Aktuální kvóty katalogu Unity najdete v tématu Kvóty prostředků.
Podporované formáty úložiště v ga
Od 25. srpna 2022:
- Všechny spravované tabulky katalogu Unity ukládají data pomocí Delta Lake.
- Externí tabulky katalogu Unity a externí umístění podporují Delta Lake, JSON, CSV, Avro, Parquet, ORC a textová data.
Aktuální podporované formáty tabulek v Katalogu Unity najdete v tématu Podpora formátu souborů.
Správa prostředků katalogu Unity z konzoly účtu
Pomocí uživatelského rozhraní konzoly účtu Azure Databricks můžete:
- Správa životního cyklu metastoru (vytvoření, aktualizace, odstranění a zobrazení metastorů spravovaných katalogem Unity)
- Přiřazení a odebrání metastorů pro pracovní prostory
Podporované typy clusterů a verze Databricks Runtime
Unity Catalog vyžaduje clustery, na kterých běží Databricks Runtime 11.1 nebo novější. Katalog Unity se ve výchozím nastavení podporuje ve všech výpočetních verzích SQL Warehouse .
Starší verze Databricks Runtime podporovaly verze Preview katalogu Unity. Clustery spuštěné v dřívějších verzích databricks Runtime neposkytují podporu pro všechny funkce a funkce ga katalogu Unity.
Katalog Unity vyžaduje při vytváření nového clusteru jeden z následujících režimů přístupu:
- Společný
- Jazyky: SQL nebo Python
- Zabezpečený cluster, který může sdílet více uživatelů. Uživatelé clusteru jsou plně izolovaní, aby si navzájem neviděli data a přihlašovací údaje.
- Jeden uživatel
- Jazyky: SQL, Scala, Python, R
- Zabezpečený cluster, který může používat výhradně zadaný jeden uživatel.
Další informace o režimech přístupu ke clusteru najdete v tématu Režimy přístupu.
Informace o aktualizovaných funkcích katalogu Unity v novějších verzích Databricks Runtime najdete v poznámkách k verzi pro tyto verze.
Systémové tabulky
information_schema
je plně podporován pro datové prostředky katalogu Unity. Každý metastor obsahuje katalog označovaný jako system
ten, který zahrnuje metastor s vymezeným information_schema
oborem . Viz Schéma informací. K zodpovězení otázek můžete použít information_schema
následující:
Počet tabulek na katalog
SELECT table_catalog, count(table_name)
FROM system.information_schema.tables
GROUP BY 1
ORDER by 2 DESC
"Ukaž mi všechny tabulky, které byly změněny za posledních 24 hodin"
SELECT table_name, table_owner, created_by, last_altered, last_altered_by, table_catalog
FROM system.information_schema.tables
WHERE datediff(now(), last_altered) < 1
Podpora strukturovaného streamování
Úlohy strukturovaného streamování se teď podporují v katalogu Unity. Podrobnosti a omezení najdete v tématu Omezení.
Viz také Použití katalogu Unity se strukturovaným streamováním.
Funkce SQL
Uživatelem definované funkce SQL jsou nyní plně podporovány v katalogu Unity. Informace o tom, jak vytvářet a používat funkce definované uživatelem SQL, najdete v tématu CREATE FUNCTION (SQL a Python).
Syntaxe SQL pro externí umístění v katalogu Unity
Standardní definice dat a příkazy jazyka definice dat jsou nyní podporovány ve Spark SQL pro externí umístění, včetně následujících:
CREATE | DROP | ALTER | DESCRIBE | SHOW EXTERNAL LOCATION
Můžete také spravovat a zobrazovat oprávnění pomocí GRANT
REVOKE
SHOW
a pro externí umístění pomocí SQL. Viz Externí umístění.
Příklad syntaxe:
CREATE EXTERNAL LOCATION <your-location-name>
URL `<your-location-path>'
WITH (CREDENTIAL <your-credential-name>);
GRANT READ FILES, WRITE FILES, CREATE EXTERNAL TABLE ON EXTERNAL LOCATION `<your-location-name>`
TO `finance`;
Omezení katalogu Unity ve verzi GA
Od 25. srpna 2022 měl katalog Unity následující omezení. Aktuální omezení najdete v tématu Omezení.
- Scala, R a úlohy využívající modul runtime Machine Learning se podporují jenom v clusterech, které používají režim přístupu jednoho uživatele. Úlohy v těchto jazycích nepodporují použití dynamických zobrazení pro zabezpečení na úrovni řádků nebo sloupců.
- Při použití katalogu Unity jako zdroje nebo cíle klonu se nepodporují klony s mělkými klony.
- Kontejnery nejsou podporovány pro tabulky katalogu Unity. Pokud spustíte příkazy, které se pokusí vytvořit tabulku v katalogu Unity, vyvolá výjimku.
- Zápis do stejné cesty nebo tabulky Delta Lake z pracovních prostorů ve více oblastech může vést k nespolehlivému výkonu, pokud některé clustery přistupují ke katalogu Unity a jiné ne.
- Režim přepsání operací zápisu do objektu DataFrame do katalogu Unity je podporován pouze pro tabulky Delta, ne pro jiné formáty souborů. Uživatel musí mít
CREATE
oprávnění pro nadřazené schéma a musí být vlastníkem existujícího objektu. - Streamování aktuálně má následující omezení:
- Nepodporuje se v clusterech pomocí režimu sdíleného přístupu. Pro úlohy streamování musíte použít režim přístupu jednoho uživatele.
- Asynchronní vytváření kontrolních bodů se zatím nepodporuje.
- V Databricks Runtime verze 11.2 a novějších dotazech na streamování, které trvají déle než 30 dní v clusterech pro všechny účely nebo úlohy, vyvolá výjimku. U dlouhotrvajících streamovacích dotazů nakonfigurujte automatické opakování úloh nebo použijte Databricks Runtime 11.3 a vyšší.
- Odkazování na tabulky katalogu Unity z kanálů Delta Live Tables se v současné době nepodporuje.
- Skupiny vytvořené v pracovním prostoru nelze použít v příkazech GRANT v rámci katalogu Unity. Tím zajistíte konzistentní zobrazení skupin, které můžou překlenovat mezi pracovními prostory. Pokud chcete používat skupiny v instrukcích GRANT, vytvořte své skupiny v konzole účtu a aktualizujte veškeré automatizované procesy pro správu objektů zabezpečení nebo skupin (například konektory SCIM, Okta a Microsoft Entra ID a Terraform) tak, aby odkazovaly na koncové body účtu namísto koncových bodů pracovního prostoru.
Oblasti dostupnosti katalogu Unity ve verzi GA
Od 25. srpna 2022 byl katalog Unity k dispozici v následujících oblastech. Seznam aktuálně podporovaných oblastí najdete v tématu Oblasti Azure Databricks.
canadacentral
centralus
francecentral
germanywestcentral
japaneast
norwayeast
southafricanorth
swedencentral
switzerlandnorth
switzerlandwest
uaenorth
westcentralus
westus3
australiaeast
brazilsouth
centralindia
eastus
eastus2
koreacentral
northcentralus
northeurope
southeastasia
ukwest
westeurope
westus