Dela via


IndexingParametersConfiguration interface

En ordlista med indexerarspecifika konfigurationsegenskaper. Varje namn är namnet på en specifik egenskap. Varje värde måste vara av en primitiv typ.

Egenskaper

allowSkillsetToReadFileData

Om det är sant skapar du en sökväg //document///file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. På så sätt kan du skicka ursprungliga fildata till en anpassad färdighet för bearbetning i berikningspipelinen, eller till skickligheten för dokumentextrahering.

dataToExtract

Anger vilka data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "ingen". Detta gäller inbäddat bildinnehåll i ett .PDF eller annat program, eller bildfiler som .jpg och .pngi Azure-blobar.

delimitedTextDelimiter

För CSV-blobar anger du avgränsare för enskilda tecken i slutet av rad för CSV-filer där varje rad startar ett nytt dokument (till exempel |").

delimitedTextHeaders

För CSV-blobar anger en kommaavgränsad lista med kolumnrubriker, som är användbar för att mappa källfält till målfält i ett index.

documentRoot

För JSON-matriser, med ett strukturerat eller halvstrukturerat dokument, kan du ange en sökväg till matrisen med hjälp av den här egenskapen.

excludedFileNameExtensions

Kommaavgränsad lista över filnamnstillägg som ska ignoreras vid bearbetning från Azure Blob Storage. Du kan till exempel exkludera ".png, .mp4" för att hoppa över dessa filer under indexeringen.

executionEnvironment

Anger i vilken miljö indexeraren ska köras.

failOnUnprocessableDocument

För Azure-blobar anger du till false om du vill fortsätta indexeringen om ett dokument inte indexerar.

failOnUnsupportedContentType

För Azure-blobbar anger du till false om du vill fortsätta indexeringen när en innehållstyp som inte stöds påträffas och du inte känner till alla innehållstyper (filtillägg) i förväg.

firstLineContainsHeaders

För CSV-blobar anger att den första raden (icke-tom) för varje blob innehåller rubriker.

imageAction

Avgör hur du bearbetar inbäddade avbildningar och avbildningsfiler i Azure Blob Storage. Om du ställer in konfigurationen "imageAction" på något annat värde än "ingen" krävs att en kompetensuppsättning också är kopplad till indexeraren.

indexedFileNameExtensions

Kommaavgränsad lista över filnamnstillägg som ska väljas vid bearbetning från Azure Blob Storage. Du kan till exempel fokusera indexering på specifika programfiler ".docx, .pptx, .msg" för att specifikt inkludera dessa filtyper.

indexStorageMetadataOnlyForOversizedDocuments

För Azure-blobar anger du den här egenskapen till true för att fortfarande indexeras lagringsmetadata för blobinnehåll som är för stort för att bearbetas. Överdimensionerade blobar behandlas som fel som standard. Begränsningar för blobstorlek finns i https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

Representerar parsningsläget för indexering från en Azure-blobdatakälla.

pdfTextRotationAlgorithm

Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.

queryTimeout

Ökar tidsgränsen utöver standardvärdet på 5 minuter för Azure SQL-databasdatakällor, som anges i formatet "hh:mm:ss".

Egenskapsinformation

allowSkillsetToReadFileData

Om det är sant skapar du en sökväg //document///file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. På så sätt kan du skicka ursprungliga fildata till en anpassad färdighet för bearbetning i berikningspipelinen, eller till skickligheten för dokumentextrahering.

allowSkillsetToReadFileData?: boolean

Egenskapsvärde

boolean

dataToExtract

Anger vilka data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "ingen". Detta gäller inbäddat bildinnehåll i ett .PDF eller annat program, eller bildfiler som .jpg och .pngi Azure-blobar.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

Egenskapsvärde

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

För CSV-blobar anger du avgränsare för enskilda tecken i slutet av rad för CSV-filer där varje rad startar ett nytt dokument (till exempel |").

delimitedTextDelimiter?: string

Egenskapsvärde

string

delimitedTextHeaders

För CSV-blobar anger en kommaavgränsad lista med kolumnrubriker, som är användbar för att mappa källfält till målfält i ett index.

delimitedTextHeaders?: string

Egenskapsvärde

string

documentRoot

För JSON-matriser, med ett strukturerat eller halvstrukturerat dokument, kan du ange en sökväg till matrisen med hjälp av den här egenskapen.

documentRoot?: string

Egenskapsvärde

string

excludedFileNameExtensions

Kommaavgränsad lista över filnamnstillägg som ska ignoreras vid bearbetning från Azure Blob Storage. Du kan till exempel exkludera ".png, .mp4" för att hoppa över dessa filer under indexeringen.

excludedFileNameExtensions?: string

Egenskapsvärde

string

executionEnvironment

Anger i vilken miljö indexeraren ska köras.

executionEnvironment?: "standard" | "private"

Egenskapsvärde

"standard" | "private"

failOnUnprocessableDocument

För Azure-blobar anger du till false om du vill fortsätta indexeringen om ett dokument inte indexerar.

failOnUnprocessableDocument?: boolean

Egenskapsvärde

boolean

failOnUnsupportedContentType

För Azure-blobbar anger du till false om du vill fortsätta indexeringen när en innehållstyp som inte stöds påträffas och du inte känner till alla innehållstyper (filtillägg) i förväg.

failOnUnsupportedContentType?: boolean

Egenskapsvärde

boolean

firstLineContainsHeaders

För CSV-blobar anger att den första raden (icke-tom) för varje blob innehåller rubriker.

firstLineContainsHeaders?: boolean

Egenskapsvärde

boolean

imageAction

Avgör hur du bearbetar inbäddade avbildningar och avbildningsfiler i Azure Blob Storage. Om du ställer in konfigurationen "imageAction" på något annat värde än "ingen" krävs att en kompetensuppsättning också är kopplad till indexeraren.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

Egenskapsvärde

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Kommaavgränsad lista över filnamnstillägg som ska väljas vid bearbetning från Azure Blob Storage. Du kan till exempel fokusera indexering på specifika programfiler ".docx, .pptx, .msg" för att specifikt inkludera dessa filtyper.

indexedFileNameExtensions?: string

Egenskapsvärde

string

indexStorageMetadataOnlyForOversizedDocuments

För Azure-blobar anger du den här egenskapen till true för att fortfarande indexeras lagringsmetadata för blobinnehåll som är för stort för att bearbetas. Överdimensionerade blobar behandlas som fel som standard. Begränsningar för blobstorlek finns i https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Egenskapsvärde

boolean

parsingMode

Representerar parsningsläget för indexering från en Azure-blobdatakälla.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

Egenskapsvärde

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

Egenskapsvärde

"none" | "detectAngles"

queryTimeout

Ökar tidsgränsen utöver standardvärdet på 5 minuter för Azure SQL-databasdatakällor, som anges i formatet "hh:mm:ss".

queryTimeout?: string

Egenskapsvärde

string