Compartir a través de


Marco de pruebas del SDK de Power Query, parte 2: datos de prueba

Esta referencia de varias partes abarca la configuración y ejecución de un conjunto estándar de pruebas para desarrolladores de conectores de Power Query. La referencia está pensada para seguirse secuencialmente a fin de asegurarse de que el entorno está configurado para probar el conector de extensión.

En esta sección:

  • Obtendrá información sobre el conjunto de datos usado en el conjunto estándar de pruebas
  • Descargará una copia de los datos de prueba
  • Cargará los datos en la base de datos que elija para el conector que quiere probar

En esta sección se tratan los datos de prueba que usa el conjunto de pruebas para comprobar el conector.

Información general del conjunto de datos

Los datos de prueba usados para el marco son una versión modificada de los datos de registro de carreras verdes de NewYork City Taxi & Limousine Commission (TLC).

Los datos de carreras verdes de febrero de 2023 se convirtieron en el archivo CSV "NycTaxiGreen" y se muestrearon 10 000 filas. Del mismo modo, el archivo CSV "TaxiZoneLookup" contiene 265 filas de la tabla de búsqueda de zona de taxi. Se eligió el formato de datos CSV debido a su gran aplicabilidad a casi todos los demás orígenes de datos, lo que facilita la importación.

La definición de cada campo puede ser ligeramente diferente de la información que se encuentra en NYC Taxi and Limousine green dataset - Azure Open Datasets y data_dictionary_trip_records_green.pdf (nyc.gov).

El conjunto de datos de nuestras pruebas se divide en dos archivos csv: NycTaxiGreen y TaxiZoneLookup.

Obtención de los datos de prueba

Los datos de prueba se colocan en el repositorio git de conectores de datos. Los datos de prueba se proporcionan en forma de CSV junto con la definición de esquema para las tablas NycTaxiGreen y TaxiZoneLookup. Estos datos se deben cargar en el origen de datos como tablas independientes y debe asegurarse de que el esquema corresponde a los tipos de datos definidos en el origen de datos.

Nota:

Al cargarlos en el origen de datos, todos los valores decimales deben tener una escala de 2. Es decir, el número de dígitos después del separador decimal debe ser 2. Todos los valores de marca de tiempo deben cargarse en el origen de datos en formato MM/DD/YYYY HH24:MI:SS.

También puede revisar los detalles relacionados con los datos de prueba.

Recursos:

Descripción de la tabla NycTaxiGreen

En la tabla siguiente se proporciona más información sobre cada campo de la tabla "NycTaxiGreen":

Nombre Escribir Descripción
RecordID Entero Orden de identificador de registro original. El CSV comienza con él fuera de orden debido al muestreo aleatorio. Este campo se puede usar como clave principal de la tabla.
VendorID Entero Código que indica el proveedor.
lpep_pickup_datetime Marca de tiempo No se incluye información de marca de tiempo. Si el origen de datos requiere uno, se debe usar UTC.
lpep_dropoff_datetime Marca de tiempo No se incluye información de marca de tiempo. Si el origen de datos requiere uno, se debe usar UTC.
store_and_fwd_flag Booleano Campo true/false. Algunos orígenes de datos pueden importar este campo como carácter o cadena si no se especifica el tipo de campo. A efectos de las pruebas, este campo debe especificarse como booleano.
RatecodeID Entero Código de la tarifa final en vigor cuando termina la carrera.
PULocationID Entero Parada de taxi de TLC donde se conectó el taxímetro.
DOLocationID Entero Parada de taxi de TLC donde se desconectó el taxímetro.
passenger_count Entero Número de pasajeros en el vehículo.
trip_distance Doble Distancia de viaje transcurrido en millas.
fare_amount Doble Tarifa de tiempo y distancia. Dos posiciones decimales.
extra Doble Cargos varios. Dos posiciones decimales.
mta_tax Doble Impuesto de MTA añadido. Dos posiciones decimales.
tip_amount Doble Importe de la propina. Dos posiciones decimales.
tolls_amount Doble Número total de peajes pagados en el viaje. Dos posiciones decimales.
improvement_surcharge Doble Un suplemento de mejora. Dos posiciones decimales.
total_amount Doble Precio total cargado a los clientes. No incluye propinas. Dos posiciones decimales.
payment_type Entero Código numérico que indica cómo pagó el pasajero.
trip_type Entero Un código numérico para si el taxi se para o envía.
congestion_surcharge Doble Un suplemento por congestión. Dos posiciones decimales.

Descripción de la tabla TaxiZoneLookup

En la tabla siguiente se proporciona más información sobre cada campo de la tabla "TaxiZoneLookup":

Nombre Escribir Descripción
LocationId Entero Id. de ubicación para cualquier ubicación. Se asigna a PULocationID y DOLocationID en la tabla "NycTaxiGreen". Este campo se puede usar como clave principal de la tabla.
Borough Cadena Municipio para la ubicación.
Zona Cadena Nombre de la zona de la ubicación.
service_zone Cadena Nombre de la zona de servicio de la ubicación.

Conclusión

En esta sección se describen los datos de prueba utilizados en el conjunto de pruebas estandarizado y su esquema. La base de datos ahora debe rellenarse con tablas basadas en los archivos CSV especificados con el esquema correcto.

En la sección siguiente, obtendrá información sobre las distintas secciones del conjunto de pruebas que le ayudará a validar la configuración del conjunto de datos y el conector de extensión.

Pasos siguientes

Marco de pruebas del SDK de Power Query, parte 3: conjunto de pruebas