다음을 통해 공유


STAT_CHUNK 구조체(filter.h)

참고

인덱싱 서비스는 Windows XP에서 더 이상 지원되지 않으며 Windows 8 현재 사용할 수 없습니다. 대신 클라이언트 쪽 검색에 Windows Search 를 사용하고 서버 쪽 검색에 Microsoft Search Server Express 를 사용합니다.

청크의 특성을 설명합니다.

구문

typedef struct tagSTAT_CHUNK {
  ULONG           idChunk;
  CHUNK_BREAKTYPE breakType;
  CHUNKSTATE      flags;
  LCID            locale;
  FULLPROPSPEC    attribute;
  ULONG           idChunkSource;
  ULONG           cwcStartSource;
  ULONG           cwcLenSource;
} STAT_CHUNK;

멤버

idChunk

청크 식별자입니다. 청크 식별자는 IFilter 인터페이스의 현재 instance 고유해야 합니다. 청크 식별자는 오름차순이어야 합니다. 청크가 번호가 매겨진 순서는 원본 문서에 표시되는 순서와 일치해야 합니다. 일부 검색 엔진은 다양한 속성의 청크 근접성을 활용할 수 있습니다. 이 경우 다른 속성을 가진 청크가 내보내지는 순서는 검색 엔진에 중요합니다.

breakType

이전 청크를 현재 청크와 구분하는 중단 유형입니다. 값은 CHUNK_BREAKTYPE 열거형에서 가져옵니다.

flags

이 청크에 text-type 또는 value-type 속성이 포함되어 있는지 여부를 나타냅니다. 플래그 값은 CHUNKSTATE 열거형에서 가져옵니다. CHUNK_TEXT 플래그가 설정된 경우 IFilter::GetText 를 사용하여 청크의 내용을 일련의 단어로 검색해야 합니다. CHUNK_VALUE 플래그가 설정된 경우 IFilter::GetValue 를 사용하여 값을 검색하고 단일 속성 값으로 처리해야 합니다. 필터가 동일한 콘텐츠를 텍스트와 값으로 모두 처리하도록 지시하는 경우 청크는 각각 하나의 플래그가 설정된 두 개의 서로 다른 청크로 두 번 내보내야 합니다.

locale

텍스트 청크에 연결된 언어 및 하위 언어입니다. 청크 로캘은 문서 인덱서에서 텍스트의 적절한 단어 분리를 수행하는 데 사용됩니다. 청크가 텍스트 형식이 아니거나 데이터 형식이 VT_LPWSTR 값 형식이 아니면 VT_LPSTR 또는 VT_BSTR 이 필드는 무시됩니다.

attribute

청크에 적용할 속성입니다. FULLPROPSPEC를 참조하세요. 필터에 동일한 텍스트에 둘 이상의 속성이 있어야 하는 경우 각 속성에 대해 별도의 청크로 텍스트를 한 번 내보내야 합니다.

idChunkSource

청크 원본의 ID입니다. idChunkSource 멤버의 값은 청크의 특성에 따라 달라집니다.

  • 청크가 텍스트 형식 속성인 경우 idChunkSource 멤버의 값은 idChunk 멤버의 값과 동일해야 합니다.
  • 청크가 텍스트 콘텐츠에서 파생된 내부 값 형식 속성인 경우 idChunkSource 멤버의 값은 파생된 텍스트 형식 청크의 청크 ID입니다.
  • 필터 특성이 내부 값 형식 속성만 반환하도록 지정하는 경우 현재 내부 값 형식 속성을 파생시킬 콘텐츠 청크가 없습니다. 이 경우 idChunkSource 멤버의 값은 잘못된 청크인 0으로 설정해야 합니다.

cwcStartSource

파생 청크의 원본 텍스트가 원본 청크에서 시작되는 오프셋입니다.

cwcLenSource

현재 청크가 파생된 원본 텍스트의 문자 길이입니다. 0 값은 원본 텍스트와 파생 텍스트 간의 문자별 대응을 나타냅니다. 0이 아닌 값은 그러한 직접적인 대응이 없음을 의미합니다.

설명

마지막 세 멤버(idChunkSource, cwcStartSourcecwcLenSource)는 파생 청크의 원본을 설명하는 데 사용됩니다. 즉, 텍스트 섹션에 다시 매핑할 수 있습니다. 예를 들어 챕터의 제목은 text-type 속성과 내부 값 형식 속성인가요? 제목입니다. 값 형식 속성 "제목"은 파생된 청크입니다. 현재 값 형식 청크의 텍스트(내부 값 형식 속성에서)가 일부 텍스트 형식 청크에서 파생된 경우 두 번 이상 내보내야 합니다.

다음 세그먼트는 책에서 이런 일이 발생할 수 있는 방법의 예입니다.

작은 형사는 "C'est fini!" 라고 외쳤다.

고백

방은 몇 분 동안 침묵했다. 그것에 대해 매우 열심히 생각 한 후, 젊은 여자는 물었다, "하지만 당신은 어떻게 알고 있었습니까?"

이 세그먼트는 다음과 같은 방법으로 청크로 나눌 수 있습니다.

ID 텍스트 BreakType 플래그 Locale attribute
1 작은 dete 해당 없음 CHUNK_TEXT ENGLISH_UK 콘텐츠
2 ctive가 외쳤습니다. CHUNK_NO_BREAK 해당 없음 해당 없음 해당 없음
3 "C'est fini!" CHUNK_EOW CHUNK_TEXT FRENCH_BELGIAN 콘텐츠
4 고백 CHUNK_EOC CHUNK_TEXT ENGLISH_UK CHAPTER_NAMES
5 고백 CHUNK_EOP CHUNK_TEXT ENGLISH_UK 콘텐츠
6 방은 몇 분 동안 침묵했다. CHUNK_EOP CHUNK_TEXT ENGLISH_UK 콘텐츠
7 그것에 대해 매우 열심히 생각 한 후, 젊은 여자는 물었다, "하지만 당신은 어떻게 알고 있었습니까?" CHUNK_EOS CHUNK_TEXT ENGLISH_UK 콘텐츠
 

idChunkSource, cwcStartSourcecwcLenSource에서 제공하는 정보는 적중을 강조 표시하는 검색 엔진에 유용합니다. 내부 값 형식 속성에 대한 쿼리가 수행되면 검색 엔진은 내부 값 형식 속성의 텍스트가 파생된 원래 텍스트를 강조 표시합니다. instance 경우 C++ 코드 필터에서 브라우저는 내부 값 형식 속성 "함수 정의"에서 MyFunction을 검색할 때 파일의 함수 헤더를 강조 표시합니다.

요구 사항

요구 사항
지원되는 최소 클라이언트 Windows 2000 Professional[데스크톱 앱만]
지원되는 최소 서버 Windows 2000 Server[데스크톱 앱만]
머리글 filter.h

추가 정보

CHUNKSTATE

CHUNK_BREAKTYPE

FULLPROPSPEC

IFilter