Detectiemodi voor automatisch laadprogramma's vergelijken
Auto Loader ondersteunt twee modi voor het detecteren van nieuwe bestanden: mapvermelding en bestandsmelding. U kunt schakelen tussen bestandsdetectiemodi voor het opnieuw opstarten van stromen en nog steeds exactly-once gegevensverwerkingsgaranties verkrijgen.
Modus voor adreslijstvermelding
In de mapvermeldingsmodus identificeert Auto Loader nieuwe bestanden door de invoermap weer te geven. Met de modus Adreslijstvermelding kunt u snel AutoLoader-streams starten zonder andere machtigingsconfiguraties dan toegang tot uw gegevens in cloudopslag.
In Databricks Runtime 9.1 en hoger kan Auto Loader automatisch detecteren of bestanden met lexicale volgorde in uw cloudopslag aankomen en de hoeveelheid API-aanroepen die nodig zijn om nieuwe bestanden te detecteren aanzienlijk verminderen. Zie Wat is de lijstmodus voor automatisch laden? voor meer informatie.
Bestandsmeldingsmodus
De bestandsmeldingsmodus maakt gebruik van bestandsmeldingen en wachtrijservices in uw cloudinfrastructuuraccount. Auto Loader kan automatisch een meldingsdienst en wachtrijdienst instellen die zich abonneren op bestandsevenementen uit de invoermap.
De bestandsmeldingsmodus is beter presterend en schaalbaar voor grote invoermappen of een groot aantal bestanden, maar vereist aanvullende cloudmachtigingen om in te stellen. Zie Wat is de meldingsmodus voor het automatisch laden van bestanden? voor meer informatie.
Cloudopslag ondersteund door modi
Hieronder vindt u de beschikbaarheid voor deze modi.
Als u migreert vanaf een externe locatie of een DBFS-mount naar een Unity Catalog-volume, blijft Auto Loader exacte garantie op eenmalige verwerking bieden.
Cloudopslag | Adreslijstvermelding | Bestandsmeldingen |
---|---|---|
AWS S3 | Alle versies | Alle versies |
ADLS Gen2 | Alle versies | Alle versies |
GCS | Alle versies | Databricks Runtime 9.1 en hoger |
Azure Blob-opslag | Alle versies | Alle versies |
ADLS Gen1 | Alle versies | Niet ondersteund |
DBFS | Alle versies | Alleen voor koppelpunten |
Unity Catalog-volume | Databricks Runtime 13.3 LTS en hoger | Niet ondersteund |