Marco de pruebas del SDK de Power Query, parte 2: datos de prueba
Esta referencia de varias partes abarca la configuración y ejecución de un conjunto estándar de pruebas para desarrolladores de conectores de Power Query. La referencia está pensada para seguirse secuencialmente a fin de asegurarse de que el entorno está configurado para probar el conector de extensión.
En esta sección:
- Obtendrá información sobre el conjunto de datos usado en el conjunto estándar de pruebas
- Descargará una copia de los datos de prueba
- Cargará los datos en la base de datos que elija para el conector que quiere probar
En esta sección se tratan los datos de prueba que usa el conjunto de pruebas para comprobar el conector.
Información general del conjunto de datos
Los datos de prueba usados para el marco son una versión modificada de los datos de registro de carreras verdes de NewYork City Taxi & Limousine Commission (TLC).
Los datos de carreras verdes de febrero de 2023 se convirtieron en el archivo CSV "NycTaxiGreen" y se muestrearon 10 000 filas. Del mismo modo, el archivo CSV "TaxiZoneLookup" contiene 265 filas de la tabla de búsqueda de zona de taxi. Se eligió el formato de datos CSV debido a su gran aplicabilidad a casi todos los demás orígenes de datos, lo que facilita la importación.
La definición de cada campo puede ser ligeramente diferente de la información que se encuentra en NYC Taxi and Limousine green dataset - Azure Open Datasets y data_dictionary_trip_records_green.pdf (nyc.gov).
El conjunto de datos de nuestras pruebas se divide en dos archivos csv: NycTaxiGreen y TaxiZoneLookup.
Obtención de los datos de prueba
Los datos de prueba se colocan en el repositorio git de conectores de datos. Los datos de prueba se proporcionan en forma de CSV junto con la definición de esquema para las tablas NycTaxiGreen y TaxiZoneLookup. Estos datos se deben cargar en el origen de datos como tablas independientes y debe asegurarse de que el esquema corresponde a los tipos de datos definidos en el origen de datos.
Nota:
Al cargarlos en el origen de datos, todos los valores decimales deben tener una escala de 2. Es decir, el número de dígitos después del separador decimal debe ser 2.
Todos los valores de marca de tiempo deben cargarse en el origen de datos en formato MM/DD/YYYY HH24:MI:SS
.
También puede revisar los detalles relacionados con los datos de prueba.
Recursos:
Descripción de la tabla NycTaxiGreen
En la tabla siguiente se proporciona más información sobre cada campo de la tabla "NycTaxiGreen":
Nombre | Escribir | Descripción |
---|---|---|
RecordID | Entero | Orden de identificador de registro original. El CSV comienza con él fuera de orden debido al muestreo aleatorio. Este campo se puede usar como clave principal de la tabla. |
VendorID | Entero | Código que indica el proveedor. |
lpep_pickup_datetime | Marca de tiempo | No se incluye información de marca de tiempo. Si el origen de datos requiere uno, se debe usar UTC. |
lpep_dropoff_datetime | Marca de tiempo | No se incluye información de marca de tiempo. Si el origen de datos requiere uno, se debe usar UTC. |
store_and_fwd_flag | Booleano | Campo true/false. Algunos orígenes de datos pueden importar este campo como carácter o cadena si no se especifica el tipo de campo. A efectos de las pruebas, este campo debe especificarse como booleano. |
RatecodeID | Entero | Código de la tarifa final en vigor cuando termina la carrera. |
PULocationID | Entero | Parada de taxi de TLC donde se conectó el taxímetro. |
DOLocationID | Entero | Parada de taxi de TLC donde se desconectó el taxímetro. |
passenger_count | Entero | Número de pasajeros en el vehículo. |
trip_distance | Doble | Distancia de viaje transcurrido en millas. |
fare_amount | Doble | Tarifa de tiempo y distancia. Dos posiciones decimales. |
extra | Doble | Cargos varios. Dos posiciones decimales. |
mta_tax | Doble | Impuesto de MTA añadido. Dos posiciones decimales. |
tip_amount | Doble | Importe de la propina. Dos posiciones decimales. |
tolls_amount | Doble | Número total de peajes pagados en el viaje. Dos posiciones decimales. |
improvement_surcharge | Doble | Un suplemento de mejora. Dos posiciones decimales. |
total_amount | Doble | Precio total cargado a los clientes. No incluye propinas. Dos posiciones decimales. |
payment_type | Entero | Código numérico que indica cómo pagó el pasajero. |
trip_type | Entero | Un código numérico para si el taxi se para o envía. |
congestion_surcharge | Doble | Un suplemento por congestión. Dos posiciones decimales. |
Descripción de la tabla TaxiZoneLookup
En la tabla siguiente se proporciona más información sobre cada campo de la tabla "TaxiZoneLookup":
Nombre | Escribir | Descripción |
---|---|---|
LocationId | Entero | Id. de ubicación para cualquier ubicación. Se asigna a PULocationID y DOLocationID en la tabla "NycTaxiGreen". Este campo se puede usar como clave principal de la tabla. |
Borough | Cadena | Municipio para la ubicación. |
Zona | Cadena | Nombre de la zona de la ubicación. |
service_zone | Cadena | Nombre de la zona de servicio de la ubicación. |
Conclusión
En esta sección se describen los datos de prueba utilizados en el conjunto de pruebas estandarizado y su esquema. La base de datos ahora debe rellenarse con tablas basadas en los archivos CSV especificados con el esquema correcto.
En la sección siguiente, obtendrá información sobre las distintas secciones del conjunto de pruebas que le ayudará a validar la configuración del conjunto de datos y el conector de extensión.
Pasos siguientes
Marco de pruebas del SDK de Power Query, parte 3: conjunto de pruebas