Sdílet prostřednictvím


IndexingParametersConfiguration interface

Slovník vlastností konfigurace specifické pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.

Vlastnosti

allowSkillsetToReadFileData

Pokud je hodnota true, vytvoří se cesta //document//file_data, která představuje původní data souboru stažená z vašeho zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo do dovednosti extrakce dokumentů.

dataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.

delimitedTextDelimiter

U objektů blob sdíleného svazku clusteru určuje oddělovač jednoho řádku pro soubory CSV, kde každý řádek začíná novým dokumentem (například |).

delimitedTextHeaders

Pro objekty blob sdíleného svazku clusteru určuje čárkami oddělený seznam záhlaví sloupců, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.

documentRoot

Pro pole JSON, vzhledem k strukturovanému nebo částečně strukturovanému dokumentu, můžete zadat cestu k poli pomocí této vlastnosti.

excludedFileNameExtensions

Čárkami oddělený seznam přípon souborů, které se při zpracování z Úložiště objektů blob v Azure ignorují. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování.

executionEnvironment

Určuje prostředí, ve kterém má indexer provést.

failOnUnprocessableDocument

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnsupportedContentType

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud je zjištěn nepodporovaný typ obsahu a neznáte všechny typy obsahu (přípony souborů) předem.

firstLineContainsHeaders

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.

imageAction

Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností.

indexedFileNameExtensions

Seznam přípon souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování na konkrétní soubory aplikace ".docx, .pptx, .msg" tak, aby byly tyto typy souborů konkrétně zahrnuty.

indexStorageMetadataOnlyForOversizedDocuments

U objektů blob Azure nastavte tuto vlastnost na true, aby stále indexovat metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

Představuje režim analýzy indexování ze zdroje dat objektů blob Azure.

pdfTextRotationAlgorithm

Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure.

queryTimeout

Zvýší časový limit nad rámec 5minutového výchozího nastavení pro zdroje dat databáze Azure SQL, který je zadaný ve formátu hh:mm:ss.

Podrobnosti vlastnosti

allowSkillsetToReadFileData

Pokud je hodnota true, vytvoří se cesta //document//file_data, která představuje původní data souboru stažená z vašeho zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo do dovednosti extrakce dokumentů.

allowSkillsetToReadFileData?: boolean

Hodnota vlastnosti

boolean

dataToExtract

Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

Hodnota vlastnosti

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

U objektů blob sdíleného svazku clusteru určuje oddělovač jednoho řádku pro soubory CSV, kde každý řádek začíná novým dokumentem (například |).

delimitedTextDelimiter?: string

Hodnota vlastnosti

string

delimitedTextHeaders

Pro objekty blob sdíleného svazku clusteru určuje čárkami oddělený seznam záhlaví sloupců, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.

delimitedTextHeaders?: string

Hodnota vlastnosti

string

documentRoot

Pro pole JSON, vzhledem k strukturovanému nebo částečně strukturovanému dokumentu, můžete zadat cestu k poli pomocí této vlastnosti.

documentRoot?: string

Hodnota vlastnosti

string

excludedFileNameExtensions

Čárkami oddělený seznam přípon souborů, které se při zpracování z Úložiště objektů blob v Azure ignorují. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování.

excludedFileNameExtensions?: string

Hodnota vlastnosti

string

executionEnvironment

Určuje prostředí, ve kterém má indexer provést.

executionEnvironment?: "standard" | "private"

Hodnota vlastnosti

"standard" | "private"

failOnUnprocessableDocument

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.

failOnUnprocessableDocument?: boolean

Hodnota vlastnosti

boolean

failOnUnsupportedContentType

U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud je zjištěn nepodporovaný typ obsahu a neznáte všechny typy obsahu (přípony souborů) předem.

failOnUnsupportedContentType?: boolean

Hodnota vlastnosti

boolean

firstLineContainsHeaders

U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.

firstLineContainsHeaders?: boolean

Hodnota vlastnosti

boolean

imageAction

Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

Hodnota vlastnosti

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Seznam přípon souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování na konkrétní soubory aplikace ".docx, .pptx, .msg" tak, aby byly tyto typy souborů konkrétně zahrnuty.

indexedFileNameExtensions?: string

Hodnota vlastnosti

string

indexStorageMetadataOnlyForOversizedDocuments

U objektů blob Azure nastavte tuto vlastnost na true, aby stále indexovat metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Hodnota vlastnosti

boolean

parsingMode

Představuje režim analýzy indexování ze zdroje dat objektů blob Azure.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

Hodnota vlastnosti

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

Hodnota vlastnosti

"none" | "detectAngles"

queryTimeout

Zvýší časový limit nad rámec 5minutového výchozího nastavení pro zdroje dat databáze Azure SQL, který je zadaný ve formátu hh:mm:ss.

queryTimeout?: string

Hodnota vlastnosti

string