Estrutura de teste do SDK do Power Query, parte 2 - Dados de teste
Esta referência com várias partes abrange a configuração e a execução de um conjunto padrão de testes para programadores de conectores do Power Query. A referência deve ser seguida sequencialmente para garantir que seu ambiente esteja configurado para testar seu conector de extensão.
Nesta secção, pode:
- Saiba mais sobre o conjunto de dados usado no conjunto padrão dos testes
- Faça o download de uma cópia dos dados do teste
- Carregue os dados para o banco de dados de sua escolha para o conector que você pretende testar
Esta seção aborda os dados de teste usados pelo conjunto de testes para verificar o conector.
Visão geral do conjunto de dados
Os dados de teste usados para a estrutura são uma versão modificada dos dados de registro de viagem verde da NewYork City Taxi & Limousine Commission (TLC).
Os dados da viagem verde de fevereiro de 2023 foram convertidos em arquivo CSV "NycTaxiGreen" e 10.000 linhas foram amostradas a partir dele. Da mesma forma, o arquivo CSV "TaxiZoneLookup" contém 265 linhas da tabela de pesquisa da zona de táxi. O formato de dados CSV foi escolhido devido à sua grande aplicabilidade a quase todas as outras fontes de dados, facilitando a importação.
A definição para cada campo pode ser ligeiramente diferente das informações encontradas no conjunto de dados verde do NYC Taxi and Limousine - Azure Open Datasets and data_dictionary_trip_records_green.pdf (nyc.gov).
O conjunto de dados para nossos testes é dividido em dois arquivos csv: NycTaxiGreen e TaxiZoneLookup.
Obtendo os dados de teste
Os dados de teste são colocados no repositório git Data Connectors. Os dados de teste são fornecidos na forma de CSV, juntamente com a definição de esquema para as tabelas NycTaxiGreen e TaxiZoneLookup . Esses dados devem ser carregados na fonte de dados como tabelas separadas e você precisa garantir que o esquema corresponda aos tipos de dados definidos na fonte de dados.
Nota
Ao carregar para a fonte de dados, todos os valores decimais devem ter uma escala de 2. Ou seja, o número de dígitos após a vírgula decimal deve ser 2.
Todos os valores de carimbo de data/hora devem ser carregados para o datasouce em MM/DD/YYYY HH24:MI:SS
formato.
Você também pode revisar os detalhes sobre os dados do teste.
Recursos:
Descrição da tabela NycTaxiGreen
A tabela a seguir fornece mais informações sobre cada campo na tabela "NycTaxiGreen":
Nome | Tipo | Description |
---|---|---|
ID de registo | Número inteiro | A ordem de ID do registro original. O CSV começa com ele fora de ordem devido à amostragem aleatória. Este campo pode ser usado como a chave primária da tabela. |
ID do fornecedor | Número inteiro | Código que indica o fornecedor. |
lpep_pickup_datetime | Carimbo de Data/Hora | As informações de fuso horário não estão incluídas. Se a fonte de dados exigir um, o UTC deve ser usado. |
lpep_dropoff_datetime | Carimbo de Data/Hora | As informações de fuso horário não estão incluídas. Se a fonte de dados exigir um, o UTC deve ser usado. |
store_and_fwd_flag | Boolean | Um campo verdadeiro/falso. Algumas fontes de dados podem importar esse campo como um caractere ou cadeia de caracteres se o tipo de campo não for especificado. Para efeitos de ensaio, este campo deve ser especificado como booleano. |
RatecodeID | Número inteiro | Código de tarifa em vigor no final da viagem. |
PULocationID | Número inteiro | TLC Taxi Zone quando o taxímetro engatado. |
DOLocationID | Número inteiro | TLC Taxi Zone quando o taxímetro desligou. |
passenger_count | Número inteiro | Número de passageiros no veículo. |
trip_distance | Duplo | Distância da viagem decorrida em milhas. |
fare_amount | Duplo | Tarifa por tempo e distância. Duas casas decimais . |
extra | Duplo | Cobranças diversas. Duas casas decimais . |
mta_tax | Duplo | Imposto MTA adicionado. Duas casas decimais . |
tip_amount | Duplo | Valor da gorjeta. Duas casas decimais . |
tolls_amount | Duplo | Número total de portagens pagas na viagem. Duas casas decimais . |
improvement_surcharge | Duplo | Uma sobretaxa de melhoria. Duas casas decimais . |
total_amount | Duplo | Preço total cobrado aos clientes. Não inclui dicas. Duas casas decimais . |
payment_type | Número inteiro | Um código numérico de como o passageiro pagou. |
trip_type | Número inteiro | Um código numérico para saber se o táxi foi saudado ou despachado. |
congestion_surcharge | Duplo | Uma taxa extra para o congestionamento. Duas casas decimais . |
Descrição da tabela TaxiZoneLookup
A tabela a seguir fornece mais informações sobre cada campo na tabela "TaxiZoneLookup":
Nome | Tipo | Description |
---|---|---|
LocalizaçãoId | Número inteiro | ID de localização para qualquer local. Ele mapeia para PULocationID e DOLocationID na tabela "NycTaxiGreen". Este campo pode ser usado como a chave primária da tabela. |
Bairro | String | Bairro para a localização. |
Zona | String | Nome da Zona para o local. |
service_zone | String | Nome da Zona de Serviço do local. |
Conclusão
Esta seção descreveu os dados de teste usados no conjunto de testes padronizados e seu esquema. Seu banco de dados agora deve ser preenchido com tabelas baseadas nos arquivos CSV especificados com o esquema correto.
Na próxima seção, você obtém uma compreensão de diferentes seções do conjunto de testes que o ajuda a validar a configuração do conjunto de dados e seu conector de extensão.
Próximos passos
Estrutura de teste do SDK do PowerQuery, parte 3 - Conjunto de testes