IndexingParametersConfiguration interface
Slovník vlastností konfigurace specifické pro indexer. Každý název je název konkrétní vlastnosti. Každá hodnota musí být primitivního typu.
Vlastnosti
allow |
Pokud je hodnota true, vytvoří se cesta //document//file_data, která představuje původní data souboru stažená z vašeho zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo do dovednosti extrakce dokumentů. |
data |
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure. |
delimited |
U objektů blob sdíleného svazku clusteru určuje oddělovač jednoho řádku pro soubory CSV, kde každý řádek začíná novým dokumentem (například |). |
delimited |
Pro objekty blob sdíleného svazku clusteru určuje čárkami oddělený seznam záhlaví sloupců, který je užitečný pro mapování zdrojových polí na cílová pole v indexu. |
document |
Pro pole JSON, vzhledem k strukturovanému nebo částečně strukturovanému dokumentu, můžete zadat cestu k poli pomocí této vlastnosti. |
excluded |
Čárkami oddělený seznam přípon souborů, které se při zpracování z Úložiště objektů blob v Azure ignorují. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování. |
execution |
Určuje prostředí, ve kterém má indexer provést. |
fail |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří. |
fail |
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud je zjištěn nepodporovaný typ obsahu a neznáte všechny typy obsahu (přípony souborů) předem. |
first |
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky. |
image |
Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností. |
indexed |
Seznam přípon souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování na konkrétní soubory aplikace ".docx, .pptx, .msg" tak, aby byly tyto typy souborů konkrétně zahrnuty. |
index |
U objektů blob Azure nastavte tuto vlastnost na true, aby stále indexovat metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
Představuje režim analýzy indexování ze zdroje dat objektů blob Azure. |
pdf |
Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure. |
query |
Zvýší časový limit nad rámec 5minutového výchozího nastavení pro zdroje dat databáze Azure SQL, který je zadaný ve formátu hh:mm:ss. |
Podrobnosti vlastnosti
allowSkillsetToReadFileData
Pokud je hodnota true, vytvoří se cesta //document//file_data, která představuje původní data souboru stažená z vašeho zdroje dat objektu blob. To vám umožní předat původní data souboru vlastní dovednosti pro zpracování v rámci kanálu rozšiřování nebo do dovednosti extrakce dokumentů.
allowSkillsetToReadFileData?: boolean
Hodnota vlastnosti
boolean
dataToExtract
Určuje data, která se mají extrahovat z úložiště objektů blob v Azure, a řekne indexeru, která data se mají extrahovat z obsahu obrázku, když je vlastnost imageAction nastavená na jinou hodnotu než žádná. To platí pro vložený obsah obrázku v .PDF nebo jiné aplikaci nebo soubory obrázků, jako jsou .jpg a .png, v objektech blob Azure.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Hodnota vlastnosti
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
U objektů blob sdíleného svazku clusteru určuje oddělovač jednoho řádku pro soubory CSV, kde každý řádek začíná novým dokumentem (například |).
delimitedTextDelimiter?: string
Hodnota vlastnosti
string
delimitedTextHeaders
Pro objekty blob sdíleného svazku clusteru určuje čárkami oddělený seznam záhlaví sloupců, který je užitečný pro mapování zdrojových polí na cílová pole v indexu.
delimitedTextHeaders?: string
Hodnota vlastnosti
string
documentRoot
Pro pole JSON, vzhledem k strukturovanému nebo částečně strukturovanému dokumentu, můžete zadat cestu k poli pomocí této vlastnosti.
documentRoot?: string
Hodnota vlastnosti
string
excludedFileNameExtensions
Čárkami oddělený seznam přípon souborů, které se při zpracování z Úložiště objektů blob v Azure ignorují. Můžete například vyloučit ".png, .mp4" a přeskočit tyto soubory během indexování.
excludedFileNameExtensions?: string
Hodnota vlastnosti
string
executionEnvironment
Určuje prostředí, ve kterém má indexer provést.
executionEnvironment?: "standard" | "private"
Hodnota vlastnosti
"standard" | "private"
failOnUnprocessableDocument
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud se indexování dokumentu nezdaří.
failOnUnprocessableDocument?: boolean
Hodnota vlastnosti
boolean
failOnUnsupportedContentType
U objektů blob Azure nastavte hodnotu false, pokud chcete pokračovat v indexování, pokud je zjištěn nepodporovaný typ obsahu a neznáte všechny typy obsahu (přípony souborů) předem.
failOnUnsupportedContentType?: boolean
Hodnota vlastnosti
boolean
firstLineContainsHeaders
U objektů blob CSV označuje, že první (neprázdný) řádek každého objektu blob obsahuje hlavičky.
firstLineContainsHeaders?: boolean
Hodnota vlastnosti
boolean
imageAction
Určuje, jak zpracovávat vložené obrázky a soubory obrázků v Úložišti objektů blob v Azure. Nastavení konfigurace imageAction na jinou hodnotu než žádná vyžaduje, aby byla k sadě dovedností připojena také tato sada dovedností.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Hodnota vlastnosti
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Seznam přípon souborů oddělených čárkami, které se mají vybrat při zpracování ze služby Azure Blob Storage. Můžete se například zaměřit na indexování na konkrétní soubory aplikace ".docx, .pptx, .msg" tak, aby byly tyto typy souborů konkrétně zahrnuty.
indexedFileNameExtensions?: string
Hodnota vlastnosti
string
indexStorageMetadataOnlyForOversizedDocuments
U objektů blob Azure nastavte tuto vlastnost na true, aby stále indexovat metadata úložiště pro obsah objektů blob, který je příliš velký na zpracování. Nadlimitní objekty blob se ve výchozím nastavení považují za chyby. Omezení velikosti objektu blob najdete v tématu https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Hodnota vlastnosti
boolean
parsingMode
Představuje režim analýzy indexování ze zdroje dat objektů blob Azure.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
Hodnota vlastnosti
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Určuje algoritmus extrakce textu ze souborů PDF v úložišti objektů blob v Azure.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Hodnota vlastnosti
"none" | "detectAngles"
queryTimeout
Zvýší časový limit nad rámec 5minutového výchozího nastavení pro zdroje dat databáze Azure SQL, který je zadaný ve formátu hh:mm:ss.
queryTimeout?: string
Hodnota vlastnosti
string