STAT_CHUNK structure (filter.h)
注意
自 Windows XP 起,不再支援編製索引服務,且無法從 Windows 8 使用。 請改用 Windows 搜尋 進行客戶端搜尋,並使用 Microsoft Search Server Express 進行伺服器端搜尋。
描述區塊的特性。
語法
typedef struct tagSTAT_CHUNK {
ULONG idChunk;
CHUNK_BREAKTYPE breakType;
CHUNKSTATE flags;
LCID locale;
FULLPROPSPEC attribute;
ULONG idChunkSource;
ULONG cwcStartSource;
ULONG cwcLenSource;
} STAT_CHUNK;
成員
idChunk
區塊標識碼。 區塊標識碼對於 IFilter 介面目前的實例必須是唯一的。 區塊標識碼必須以遞增順序排列。 區塊編號的順序應該對應至出現在源文檔的順序。 某些搜尋引擎可以利用各種屬性區塊的鄰近性。 如果是,則發出不同屬性的區塊順序對搜尋引擎而言很重要。
breakType
分隔上一個區塊與目前區塊的中斷類型。 值來自 CHUNK_BREAKTYPE 列舉。
flags
指出此區塊是否包含文字類型或實值型別屬性。 旗標值取自 CHUNKSTATE 列舉。 如果已設定CHUNK_TEXT旗標,則應該使用 IFilter::GetText 來擷取區塊的內容做為一系列字組。 如果已設定CHUNK_VALUE旗標,則應該使用 IFilter::GetValue 來擷取值,並將其視為單一屬性值。 如果篩選條件規定將相同的內容視為文字和值,則區塊應該以兩個不同的區塊發出兩次,每個區塊都設定一個旗標。
locale
與文字區塊相關聯的語言和子語言。 檔索引器會使用區塊地區設定來執行適當的文字斷詞。 如果區塊不是文字類型,也不是具有數據類型VT_LPWSTR、VT_LPSTR或VT_BSTR的實值型別,則會忽略此字段。
attribute
要套用至區塊的屬性。 請參閱 FULLPROPSPEC。 如果篩選條件要求相同的文字有多個屬性,它必須針對個別區塊中的每個屬性發出一次文字。
idChunkSource
區塊來源的標識碼。 idChunkSource 成員的值取決於區塊的本質:
- 如果區塊是文字類型屬性, idChunkSource 成員的值必須與 idChunk 成員的值相同。
- 如果區塊是衍生自文字內容的內部實值類型屬性, idChunkSource 成員的值就是其衍生來源之文字類型區塊的區塊標識符。
- 如果篩選屬性指定只傳回內部實值類型屬性,則沒有任何內容區塊可從中衍生目前的內部實值類型屬性。 在此情況下, idChunkSource 成員的值必須設定為零,這是無效的區塊。
cwcStartSource
衍生區塊的來源文字在來源區塊中開始的位移。
cwcLenSource
從中衍生目前區塊的來源文字字元長度。 零值表示來源文字與衍生文字之間的字元逐字元對應。 非零值表示沒有這類直接對應存在。
備註
最後三個成員 (idChunkSource、 cwcStartSource 和 cwcLenSource) 用來描述衍生區塊的來源;也就是說,可以對應回文字區段的 。 例如,章節的標題可以是文字類型屬性和內部實值類型屬性 ? 標題。 實值類型屬性 「heading」 會是衍生的區塊。 如果目前實值類型區塊的文字 (來自內部實值類型屬性) 衍生自某些文字類型區塊,則必須發出一次以上。
下列區段是書籍中可能發生這種情形的範例。
小偵測驚嘆號,“C'est fini!”
自白
會議室已無訊息數分鐘。 在思考這點非常困難之後,這位女性詢問「但您如何知道?」
此區段可能會以下列方式分成區塊。
識別碼 | Text | BreakType | Flags | Locale | 屬性 |
---|---|---|---|---|---|
1 | 小 dete | N/A | CHUNK_TEXT | ENGLISH_UK | CONTENT |
2 | ctive exclaimed, | CHUNK_NO_BREAK | N/A | N/A | N/A |
3 | “C'est fini!” | CHUNK_EOW | CHUNK_TEXT | FRENCH_BELGIAN | CONTENT |
4 | 自白 | CHUNK_EOC | CHUNK_TEXT | ENGLISH_UK | CHAPTER_NAMES |
5 | 自白 | CHUNK_EOP | CHUNK_TEXT | ENGLISH_UK | CONTENT |
6 | 會議室已無訊息數分鐘。 | CHUNK_EOP | CHUNK_TEXT | ENGLISH_UK | CONTENT |
7 | 在思考這點非常困難之後,這位女性詢問「但您如何知道?」 | CHUNK_EOS | CHUNK_TEXT | ENGLISH_UK | CONTENT |
idChunkSource、cwcStartSource 和 cwcLenSource 所提供的信息對於醒目提示點擊的搜尋引擎很有用。 如果針對內部實值型別屬性完成查詢,搜尋引擎將會反白顯示衍生內部實值型別屬性之文字的原始文字。 例如,在 C++ 程式代碼篩選中,瀏覽器在內部實值類型屬性 「function definitions」 中搜尋 MyFunction 時,將會反白顯示檔案中的函式標頭。
規格需求
需求 | 值 |
---|---|
最低支援的用戶端 | Windows 2000 Professional [僅限傳統型應用程式] |
最低支援的伺服器 | Windows 2000 Server [僅限桌面應用程式] |
標頭 | filter.h |