Compartilhar via


Guia de Início Rápido do H3 (Databricks SQL)

O guia de início rápido das funções geoespaciais H3 nesta página ilustra o seguinte:

  • Como carregar conjuntos de dados de geolocalização no Unity Catalog.
  • Como converter colunas de latitude e longitude em colunas de célula H3.
  • Como converter o polígono de código postal ou colunas WKT de vários polígonos em colunas de célula H3.
  • Como consultar a análise de retirada e entrega do Aeroporto LaGuardia para o Distrito Financeiro de Manhattan.
  • Como renderizar contagens de agregação H3 em um mapa.

Exemplo de notebooks e consultas

Preparar dados do Unity Catalog

Neste notebook, nós:

  • Configuramos o conjunto de dados de táxi público do sistema de arquivos do Databricks.
  • Configure o conjunto de dados NYC Zip Code.

Preparar dados do Unity Catalog

Obter notebook

Consultas SQL do Databricks com o Databricks Runtime 11.3 LTS e superior

Consulta 1: verifique se os dados base foram configurados. Consulte Notebook.

use catalog geospatial_docs;
use database nyc_taxi;
show tables;
-- Verify initial data is setup (see instructions in setup notebook)
-- select format_number(count(*),0) as count from yellow_trip;
-- select * from nyc_zipcode;

Consulta 2: H3 NYC Zip Code – aplique h3_polyfillash3 na resolução 12.

use catalog geospatial_docs;
use database nyc_taxi;
-- drop table if exists nyc_zipcode_h3_12;
create table if not exists nyc_zipcode_h3_12 as (
  select
    explode(h3_polyfillash3(geom_wkt, 12)) as cell,
    zipcode,
    po_name,
    county
  from
    nyc_zipcode
);
-- optional: zorder by `cell`
optimize nyc_zipcode_h3_12 zorder by (cell);
select
  *
from
  nyc_zipcode_h3_12;

Consulta 3: H3 Taxi Trips – aplique h3_longlatash3 na resolução 12.

use catalog geospatial_docs;
use database nyc_taxi;
-- drop table if exists yellow_trip_h3_12;
create table if not exists yellow_trip_h3_12 as (
  select
    h3_longlatash3(pickup_longitude, pickup_latitude, 12) as pickup_cell,
    h3_longlatash3(dropoff_longitude, dropoff_latitude, 12) as dropoff_cell,
    *
  except
    (
      rate_code_id,
      store_and_fwd_flag
    )
  from
    yellow_trip
);
-- optional: zorder by `pickup_cell`
-- optimize yellow_trip_h3_12 zorder by (pickup_cell);
select
  *
from
  yellow_trip_h3_12
 where pickup_cell is not null;

Consulta 4: retiradas de LGA H3 – 25M de retiradas do LaGuardia (LGA)

use catalog geospatial_docs;
use database nyc_taxi;
create
or replace view lga_pickup_h3_12 as (
  select
    t.*
  except(cell),
    s.*
  from
    yellow_trip_h3_12 as s
    inner join nyc_zipcode_h3_12 as t on s.pickup_cell = t.cell
  where
    t.zipcode = '11371'
);
select
  format_number(count(*), 0) as count
from
  lga_pickup_h3_12;
-- select
  --   *
  -- from
  --   lga_pickup_h3_12;

Consulta 5: entregas do Distrito Financeiro H3 - 34M de entregas totais no Distrito Financeiro

use catalog geospatial_docs;
use database nyc_taxi;
create
or replace view fd_dropoff_h3_12 as (
  select
    t.*
  except(cell),
    s.*
  from
    yellow_trip_h3_12 as s
    inner join nyc_zipcode_h3_12 as t on s.dropoff_cell = t.cell
  where
    t.zipcode in ('10004', '10005', '10006', '10007', '10038')
);
select
  format_number(count(*), 0) as count
from
  fd_dropoff_h3_12;
-- select * from fd_dropoff_h3_12;

Consulta 6: H3 LGA-FD – 827 mil entregas no FD com retirada em LGA

use catalog geospatial_docs;
use database nyc_taxi;
create
or replace view lga_fd_dropoff_h3_12 as (
  select
    *
  from
    fd_dropoff_h3_12
  where
    pickup_cell in (
      select
        distinct pickup_cell
      from
        lga_pickup_h3_12
    )
);
select
  format_number(count(*), 0) as count
from
  lga_fd_dropoff_h3_12;
-- select * from lga_fd_dropoff_h3_12;

Consulta 7: LGA-FD por código postal – contar entregas em FD por código postal + gráfico de barras

use catalog geospatial_docs;
use database nyc_taxi;
select
  zipcode,
  count(*) as count
from
  lga_fd_dropoff_h3_12
group by
  zipcode
order by
  zipcode;

Consulta 8: LGA-FD por H3 – contagem de retiradas em FD por célula H3 + visualização de marcador de mapa

use catalog geospatial_docs;
use database nyc_taxi;
select
  zipcode,
  dropoff_cell,
  h3_centerasgeojson(dropoff_cell) :coordinates [0] as dropoff_centroid_x,
  h3_centerasgeojson(dropoff_cell) :coordinates [1] as dropoff_centroid_y,
  format_number(count(*), 0) as count_disp,
  count(*) as `count`
from
  lga_fd_dropoff_h3_12
group by
  zipcode,
  dropoff_cell
order by
  zipcode,
  `count` DESC;

Contagens 1 LGA-FD H3

Contagens 2 LGA-FD H3

Notebooks para Databricks Runtime 11.3 LTS e superior

Guia de Início Rápido – Python: H3 NYC Táxi de LaGuardia para Manhattan

Obter notebook

Mesma estrutura de início rápido que no Databricks SQL, usando associações de Spark Python em Notebooks + kepler.gl.

Guia de Início Rápido – Scala: H3 NYC Táxi de LaGuardia para Manhattan

Obter notebook

Mesma estrutura de início rápido que no Databricks SQL, usando associações de Spark Scala em Notebooks + kepler.gl por meio de células de Python.

Guia de Início Rápido – SQL: H3 NYC Táxi de LaGuardia para Manhattan

Obter notebook

Mesma estrutura de início rápido que no Databricks SQL, usando associações de Spark SQL em Notebooks + kepler.gl por meio de células de Python.