同盟查詢 (Lakehouse 同盟)
適用於: Databricks SQL Databricks Runtime 13.3 LTS 和更新版本, Unity Catalog
查詢同盟可讓 Azure Databricks 針對其他 Azure Databricks metastores 所提供的數據執行查詢,以及許多第三方資料庫管理系統,例如 PostgreSQL、mySQL,以及 Snowflake。
若要從另一個系統查詢數據,您必須:
- 建立 外部連線。 這會向 Unity Catalog 註冊特定的同盟伺服器,並建立與其通訊的方法,例如使用的 URL、埠和 credentials。
- 在同盟伺服器中使用 Unity Catalog 註冊 外來 catalogs
- Grant 使用者存取外部 catalogs。 這可以在 catalog、schema或 table 層級完成,就像對於一般的可保護物件一樣。
您現在可以跨各種地方和對外關係發出查詢。
外部連線
外部連接是 Unity Catalog 可加密物件,用來識別外部伺服器。 在 CREATE CONNECTION中,您可以指定伺服器可存取的 URL where。
您也必須提供選項,例如使用者名稱和密碼或其他已接受的驗證,Azure Databricks 將用來通訊。
外國 catalog
假設有支援三層命名空間的外接(catalog/database.schema.table
),您可以使用 create FOREIGN CATALOG 命令,向 Unity Catalog 註冊整個 catalogs。
Azure Databricks 會保留 catalog架構的定義及其與外部來源 sync 的關係。
範例
-- Create a postgresql connection
> CREATE CONNECTION postgresql_connection
TYPE POSTGRESQL
OPTIONS (
host 'qf-postgresql-demo.xxxxxx.us-west-2.rds.amazonaws.com',
port '5432',
user 'postgresql_user',
password 'password123');
-- Alternatively create a postgresql connection with secret scope
> CREATE CONNECTION postgresql_connection
TYPE POSTGRESQL
OPTIONS (
host 'qf-postgresql-demo.xxxxxx.us-west-2.rds.amazonaws.com',
port '5432',
user secret('secrets.r.us', 'postgresUser'),
password secret('secrets.r.us', 'postgresPassword'));
-- Expose the "postgresdb" database with schemas and tables postgresql_user can access.
> CREATE FOREIGN CATALOG postgresql_catalog
USING CONNECTION postgresql_connection
OPTIONS (database 'postgresdb');
-- Execute a query across tables in the above catalog, schema, and table.
> SELECT * FROM postgresql_catalog.a_schema.table1
UNION ALL
SELECT * FROM default.postgresql_schema.table2
UNION ALL
SELECT * FROM default.postgresql.mytable
UNION ALL
SELECT local_table;
...