IndexingParametersConfiguration interface
索引子特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。
屬性
allow |
如果為 true,將會建立路徑 //document//file_data,代表從 Blob 資料來源下載的原始檔案資料。 這可讓您將原始檔案資料傳遞至自訂技能,以在擴充管線內處理,或傳遞至檔擷取技能。 |
data |
指定要從 Azure Blob 儲存體擷取的資料,並在 「imageAction」 設定為 「none」 以外的值時,告知索引子要從影像內容擷取哪些資料。 這適用于 Azure Blob 中.PDF或其他應用程式中的內嵌影像內容,或 azure Blob 中的.jpg和.png等影像檔。 |
delimited |
針對 CSV Blob,指定 CSV 檔案的行尾單一字元分隔符號,其中每一行都會啟動新的檔 (例如「|」) 。 |
delimited |
針對 CSV Blob,指定以逗號分隔的資料行標頭清單,適用于將來源欄位對應至索引中的目的地欄位。 |
document |
針對 JSON 陣列,假設有結構化或半結構化檔,您可以使用這個屬性來指定陣列的路徑。 |
excluded |
從 Azure Blob 儲存體處理時,要忽略的副檔名逗號分隔清單。 例如,您可以排除「.png,.mp4」,以在編制索引期間略過這些檔案。 |
execution |
指定索引子應該執行的環境。 |
fail |
針對 Azure Blob,如果您想要在檔索引失敗時繼續編制索引,請將 設定為 false。 |
fail |
針對 Azure Blob,如果您想要在遇到不支援的內容類型時繼續編制索引,而且您事先不知道所有內容類型 (副檔名) 。 |
first |
針對 CSV Blob,表示每個 Blob 的第一行 (非空白) 行包含標頭。 |
image |
決定如何處理 Azure Blob 儲存體中的內嵌映射和映射檔案。 將 「imageAction」 組態設定為 「none」 以外的任何值,都需要將技能集附加至該索引子。 |
indexed |
從 Azure Blob 儲存體處理時,要選取的副檔名逗號分隔清單。 例如,您可以專注在編製特定應用程式檔案「.docx、.pptx、.msg」的索引,以特別包含那些檔案類型。 |
index |
針對 Azure Blob,請將此屬性設定為 true,以針對太大而無法處理的 Blob 內容為儲存體中繼資料編制索引。 預設會將過大的 Blob 視為錯誤。 如需 Blob 大小的限制,請參閱 https://docs.microsoft.com/azure/search/search-limits-quotas-capacity 。 |
parsing |
表示從 Azure Blob 資料來源編制索引的剖析模式。 |
pdf |
決定從 Azure Blob 儲存體中的 PDF 檔案擷取文字的演算法。 |
query |
針對 Azure SQL以 「hh:mm:ss」 格式指定的資料庫資料來源,增加超過 5 分鐘預設值的逾時。 |
屬性詳細資料
allowSkillsetToReadFileData
如果為 true,將會建立路徑 //document//file_data,代表從 Blob 資料來源下載的原始檔案資料。 這可讓您將原始檔案資料傳遞至自訂技能,以在擴充管線內處理,或傳遞至檔擷取技能。
allowSkillsetToReadFileData?: boolean
屬性值
boolean
dataToExtract
指定要從 Azure Blob 儲存體擷取的資料,並在 「imageAction」 設定為 「none」 以外的值時,告知索引子要從影像內容擷取哪些資料。 這適用于 Azure Blob 中.PDF或其他應用程式中的內嵌影像內容,或 azure Blob 中的.jpg和.png等影像檔。
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
屬性值
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
針對 CSV Blob,指定 CSV 檔案的行尾單一字元分隔符號,其中每一行都會啟動新的檔 (例如「|」) 。
delimitedTextDelimiter?: string
屬性值
string
delimitedTextHeaders
針對 CSV Blob,指定以逗號分隔的資料行標頭清單,適用于將來源欄位對應至索引中的目的地欄位。
delimitedTextHeaders?: string
屬性值
string
documentRoot
針對 JSON 陣列,假設有結構化或半結構化檔,您可以使用這個屬性來指定陣列的路徑。
documentRoot?: string
屬性值
string
excludedFileNameExtensions
從 Azure Blob 儲存體處理時,要忽略的副檔名逗號分隔清單。 例如,您可以排除「.png,.mp4」,以在編制索引期間略過這些檔案。
excludedFileNameExtensions?: string
屬性值
string
executionEnvironment
指定索引子應該執行的環境。
executionEnvironment?: "standard" | "private"
屬性值
"standard" | "private"
failOnUnprocessableDocument
針對 Azure Blob,如果您想要在檔索引失敗時繼續編制索引,請將 設定為 false。
failOnUnprocessableDocument?: boolean
屬性值
boolean
failOnUnsupportedContentType
針對 Azure Blob,如果您想要在遇到不支援的內容類型時繼續編制索引,而且您事先不知道所有內容類型 (副檔名) 。
failOnUnsupportedContentType?: boolean
屬性值
boolean
firstLineContainsHeaders
針對 CSV Blob,表示每個 Blob 的第一行 (非空白) 行包含標頭。
firstLineContainsHeaders?: boolean
屬性值
boolean
imageAction
決定如何處理 Azure Blob 儲存體中的內嵌映射和映射檔案。 將 「imageAction」 組態設定為 「none」 以外的任何值,都需要將技能集附加至該索引子。
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
屬性值
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
從 Azure Blob 儲存體處理時,要選取的副檔名逗號分隔清單。 例如,您可以專注在編製特定應用程式檔案「.docx、.pptx、.msg」的索引,以特別包含那些檔案類型。
indexedFileNameExtensions?: string
屬性值
string
indexStorageMetadataOnlyForOversizedDocuments
針對 Azure Blob,請將此屬性設定為 true,以針對太大而無法處理的 Blob 內容為儲存體中繼資料編制索引。 預設會將過大的 Blob 視為錯誤。 如需 Blob 大小的限制,請參閱 https://docs.microsoft.com/azure/search/search-limits-quotas-capacity 。
indexStorageMetadataOnlyForOversizedDocuments?: boolean
屬性值
boolean
parsingMode
表示從 Azure Blob 資料來源編制索引的剖析模式。
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
屬性值
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
決定從 Azure Blob 儲存體中的 PDF 檔案擷取文字的演算法。
pdfTextRotationAlgorithm?: "none" | "detectAngles"
屬性值
"none" | "detectAngles"
queryTimeout
針對 Azure SQL以 「hh:mm:ss」 格式指定的資料庫資料來源,增加超過 5 分鐘預設值的逾時。
queryTimeout?: string
屬性值
string