Partilhar via


Estrutura de teste do SDK do Power Query, parte 2 - Dados de teste

Esta referência com várias partes abrange a configuração e a execução de um conjunto padrão de testes para programadores de conectores do Power Query. A referência deve ser seguida sequencialmente para garantir que seu ambiente esteja configurado para testar seu conector de extensão.

Nesta secção, pode:

  • Saiba mais sobre o conjunto de dados usado no conjunto padrão dos testes
  • Faça o download de uma cópia dos dados do teste
  • Carregue os dados para o banco de dados de sua escolha para o conector que você pretende testar

Esta seção aborda os dados de teste usados pelo conjunto de testes para verificar o conector.

Visão geral do conjunto de dados

Os dados de teste usados para a estrutura são uma versão modificada dos dados de registro de viagem verde da NewYork City Taxi & Limousine Commission (TLC).

Os dados da viagem verde de fevereiro de 2023 foram convertidos em arquivo CSV "NycTaxiGreen" e 10.000 linhas foram amostradas a partir dele. Da mesma forma, o arquivo CSV "TaxiZoneLookup" contém 265 linhas da tabela de pesquisa da zona de táxi. O formato de dados CSV foi escolhido devido à sua grande aplicabilidade a quase todas as outras fontes de dados, facilitando a importação.

A definição para cada campo pode ser ligeiramente diferente das informações encontradas no conjunto de dados verde do NYC Taxi and Limousine - Azure Open Datasets and data_dictionary_trip_records_green.pdf (nyc.gov).

O conjunto de dados para nossos testes é dividido em dois arquivos csv: NycTaxiGreen e TaxiZoneLookup.

Obtendo os dados de teste

Os dados de teste são colocados no repositório git Data Connectors. Os dados de teste são fornecidos na forma de CSV, juntamente com a definição de esquema para as tabelas NycTaxiGreen e TaxiZoneLookup . Esses dados devem ser carregados na fonte de dados como tabelas separadas e você precisa garantir que o esquema corresponda aos tipos de dados definidos na fonte de dados.

Nota

Ao carregar para a fonte de dados, todos os valores decimais devem ter uma escala de 2. Ou seja, o número de dígitos após a vírgula decimal deve ser 2. Todos os valores de carimbo de data/hora devem ser carregados para o datasouce em MM/DD/YYYY HH24:MI:SS formato.

Você também pode revisar os detalhes sobre os dados do teste.

Recursos:

Descrição da tabela NycTaxiGreen

A tabela a seguir fornece mais informações sobre cada campo na tabela "NycTaxiGreen":

Nome Tipo Description
ID de registo Número inteiro A ordem de ID do registro original. O CSV começa com ele fora de ordem devido à amostragem aleatória. Este campo pode ser usado como a chave primária da tabela.
ID do fornecedor Número inteiro Código que indica o fornecedor.
lpep_pickup_datetime Carimbo de Data/Hora As informações de fuso horário não estão incluídas. Se a fonte de dados exigir um, o UTC deve ser usado.
lpep_dropoff_datetime Carimbo de Data/Hora As informações de fuso horário não estão incluídas. Se a fonte de dados exigir um, o UTC deve ser usado.
store_and_fwd_flag Boolean Um campo verdadeiro/falso. Algumas fontes de dados podem importar esse campo como um caractere ou cadeia de caracteres se o tipo de campo não for especificado. Para efeitos de ensaio, este campo deve ser especificado como booleano.
RatecodeID Número inteiro Código de tarifa em vigor no final da viagem.
PULocationID Número inteiro TLC Taxi Zone quando o taxímetro engatado.
DOLocationID Número inteiro TLC Taxi Zone quando o taxímetro desligou.
passenger_count Número inteiro Número de passageiros no veículo.
trip_distance Duplo Distância da viagem decorrida em milhas.
fare_amount Duplo Tarifa por tempo e distância. Duas casas decimais .
extra Duplo Cobranças diversas. Duas casas decimais .
mta_tax Duplo Imposto MTA adicionado. Duas casas decimais .
tip_amount Duplo Valor da gorjeta. Duas casas decimais .
tolls_amount Duplo Número total de portagens pagas na viagem. Duas casas decimais .
improvement_surcharge Duplo Uma sobretaxa de melhoria. Duas casas decimais .
total_amount Duplo Preço total cobrado aos clientes. Não inclui dicas. Duas casas decimais .
payment_type Número inteiro Um código numérico de como o passageiro pagou.
trip_type Número inteiro Um código numérico para saber se o táxi foi saudado ou despachado.
congestion_surcharge Duplo Uma taxa extra para o congestionamento. Duas casas decimais .

Descrição da tabela TaxiZoneLookup

A tabela a seguir fornece mais informações sobre cada campo na tabela "TaxiZoneLookup":

Nome Tipo Description
LocalizaçãoId Número inteiro ID de localização para qualquer local. Ele mapeia para PULocationID e DOLocationID na tabela "NycTaxiGreen". Este campo pode ser usado como a chave primária da tabela.
Bairro String Bairro para a localização.
Zona String Nome da Zona para o local.
service_zone String Nome da Zona de Serviço do local.

Conclusão

Esta seção descreveu os dados de teste usados no conjunto de testes padronizados e seu esquema. Seu banco de dados agora deve ser preenchido com tabelas baseadas nos arquivos CSV especificados com o esquema correto.

Na próxima seção, você obtém uma compreensão de diferentes seções do conjunto de testes que o ajuda a validar a configuração do conjunto de dados e seu conector de extensão.

Próximos passos

Estrutura de teste do SDK do PowerQuery, parte 3 - Conjunto de testes