共用方式為


IndexingParametersConfiguration interface

索引子特定組態屬性的字典。 每個名稱都是特定屬性的名稱。 每個值都必須是基本類型。

屬性

allowSkillsetToReadFileData

如果為 true,將會建立路徑 //document//file_data,代表從 Blob 資料來源下載的原始檔案資料。 這可讓您將原始檔案資料傳遞至自訂技能,以在擴充管線內處理,或傳遞至檔擷取技能。

dataToExtract

指定要從 Azure Blob 儲存體擷取的資料,並在 「imageAction」 設定為 「none」 以外的值時,告知索引子要從影像內容擷取哪些資料。 這適用于 Azure Blob 中.PDF或其他應用程式中的內嵌影像內容,或 azure Blob 中的.jpg和.png等影像檔。

delimitedTextDelimiter

針對 CSV Blob,指定 CSV 檔案的行尾單一字元分隔符號,其中每一行都會啟動新的檔 (例如「|」) 。

delimitedTextHeaders

針對 CSV Blob,指定以逗號分隔的資料行標頭清單,適用于將來源欄位對應至索引中的目的地欄位。

documentRoot

針對 JSON 陣列,假設有結構化或半結構化檔,您可以使用這個屬性來指定陣列的路徑。

excludedFileNameExtensions

從 Azure Blob 儲存體處理時,要忽略的副檔名逗號分隔清單。 例如,您可以排除「.png,.mp4」,以在編制索引期間略過這些檔案。

executionEnvironment

指定索引子應該執行的環境。

failOnUnprocessableDocument

針對 Azure Blob,如果您想要在檔索引失敗時繼續編制索引,請將 設定為 false。

failOnUnsupportedContentType

針對 Azure Blob,如果您想要在遇到不支援的內容類型時繼續編制索引,而且您事先不知道所有內容類型 (副檔名) 。

firstLineContainsHeaders

針對 CSV Blob,表示每個 Blob 的第一行 (非空白) 行包含標頭。

imageAction

決定如何處理 Azure Blob 儲存體中的內嵌映射和映射檔案。 將 「imageAction」 組態設定為 「none」 以外的任何值,都需要將技能集附加至該索引子。

indexedFileNameExtensions

從 Azure Blob 儲存體處理時,要選取的副檔名逗號分隔清單。 例如,您可以專注在編製特定應用程式檔案「.docx、.pptx、.msg」的索引,以特別包含那些檔案類型。

indexStorageMetadataOnlyForOversizedDocuments

針對 Azure Blob,請將此屬性設定為 true,以針對太大而無法處理的 Blob 內容為儲存體中繼資料編制索引。 預設會將過大的 Blob 視為錯誤。 如需 Blob 大小的限制,請參閱 https://docs.microsoft.com/azure/search/search-limits-quotas-capacity

parsingMode

表示從 Azure Blob 資料來源編制索引的剖析模式。

pdfTextRotationAlgorithm

決定從 Azure Blob 儲存體中的 PDF 檔案擷取文字的演算法。

queryTimeout

針對 Azure SQL以 「hh:mm:ss」 格式指定的資料庫資料來源,增加超過 5 分鐘預設值的逾時。

屬性詳細資料

allowSkillsetToReadFileData

如果為 true,將會建立路徑 //document//file_data,代表從 Blob 資料來源下載的原始檔案資料。 這可讓您將原始檔案資料傳遞至自訂技能,以在擴充管線內處理,或傳遞至檔擷取技能。

allowSkillsetToReadFileData?: boolean

屬性值

boolean

dataToExtract

指定要從 Azure Blob 儲存體擷取的資料,並在 「imageAction」 設定為 「none」 以外的值時,告知索引子要從影像內容擷取哪些資料。 這適用于 Azure Blob 中.PDF或其他應用程式中的內嵌影像內容,或 azure Blob 中的.jpg和.png等影像檔。

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

屬性值

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

針對 CSV Blob,指定 CSV 檔案的行尾單一字元分隔符號,其中每一行都會啟動新的檔 (例如「|」) 。

delimitedTextDelimiter?: string

屬性值

string

delimitedTextHeaders

針對 CSV Blob,指定以逗號分隔的資料行標頭清單,適用于將來源欄位對應至索引中的目的地欄位。

delimitedTextHeaders?: string

屬性值

string

documentRoot

針對 JSON 陣列,假設有結構化或半結構化檔,您可以使用這個屬性來指定陣列的路徑。

documentRoot?: string

屬性值

string

excludedFileNameExtensions

從 Azure Blob 儲存體處理時,要忽略的副檔名逗號分隔清單。 例如,您可以排除「.png,.mp4」,以在編制索引期間略過這些檔案。

excludedFileNameExtensions?: string

屬性值

string

executionEnvironment

指定索引子應該執行的環境。

executionEnvironment?: "standard" | "private"

屬性值

"standard" | "private"

failOnUnprocessableDocument

針對 Azure Blob,如果您想要在檔索引失敗時繼續編制索引,請將 設定為 false。

failOnUnprocessableDocument?: boolean

屬性值

boolean

failOnUnsupportedContentType

針對 Azure Blob,如果您想要在遇到不支援的內容類型時繼續編制索引,而且您事先不知道所有內容類型 (副檔名) 。

failOnUnsupportedContentType?: boolean

屬性值

boolean

firstLineContainsHeaders

針對 CSV Blob,表示每個 Blob 的第一行 (非空白) 行包含標頭。

firstLineContainsHeaders?: boolean

屬性值

boolean

imageAction

決定如何處理 Azure Blob 儲存體中的內嵌映射和映射檔案。 將 「imageAction」 組態設定為 「none」 以外的任何值,都需要將技能集附加至該索引子。

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

屬性值

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

從 Azure Blob 儲存體處理時,要選取的副檔名逗號分隔清單。 例如,您可以專注在編製特定應用程式檔案「.docx、.pptx、.msg」的索引,以特別包含那些檔案類型。

indexedFileNameExtensions?: string

屬性值

string

indexStorageMetadataOnlyForOversizedDocuments

針對 Azure Blob,請將此屬性設定為 true,以針對太大而無法處理的 Blob 內容為儲存體中繼資料編制索引。 預設會將過大的 Blob 視為錯誤。 如需 Blob 大小的限制,請參閱 https://docs.microsoft.com/azure/search/search-limits-quotas-capacity

indexStorageMetadataOnlyForOversizedDocuments?: boolean

屬性值

boolean

parsingMode

表示從 Azure Blob 資料來源編制索引的剖析模式。

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

屬性值

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

決定從 Azure Blob 儲存體中的 PDF 檔案擷取文字的演算法。

pdfTextRotationAlgorithm?: "none" | "detectAngles"

屬性值

"none" | "detectAngles"

queryTimeout

針對 Azure SQL以 「hh:mm:ss」 格式指定的資料庫資料來源,增加超過 5 分鐘預設值的逾時。

queryTimeout?: string

屬性值

string