IFILTER_INIT 열거형(filter.h)
[인덱싱 서비스는 Windows XP에서 더 이상 지원되지 않으며 Windows 8을 기준으로 사용할 수 없습니다. 대신 클라이언트 쪽 검색에 Windows Search 를 사용하고 서버 쪽 검색에는 Microsoft Search Server Express 를 사용합니다.]
필터링 프로세스를 제어하는 플래그입니다.
Syntax
typedef enum tagIFILTER_INIT {
IFILTER_INIT_CANON_PARAGRAPHS = 1,
IFILTER_INIT_HARD_LINE_BREAKS = 2,
IFILTER_INIT_CANON_HYPHENS = 4,
IFILTER_INIT_CANON_SPACES = 8,
IFILTER_INIT_APPLY_INDEX_ATTRIBUTES = 16,
IFILTER_INIT_APPLY_OTHER_ATTRIBUTES = 32,
IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES = 256,
IFILTER_INIT_INDEXING_ONLY = 64,
IFILTER_INIT_SEARCH_LINKS = 128,
IFILTER_INIT_FILTER_OWNED_VALUE_OK = 512,
IFILTER_INIT_FILTER_AGGRESSIVE_BREAK = 1024,
IFILTER_INIT_DISABLE_EMBEDDED = 2048,
IFILTER_INIT_EMIT_FORMATTING = 4096
} IFILTER_INIT;
상수
IFILTER_INIT_CANON_PARAGRAPHS 값: 1 단락 나누기는 유니코드 단락 구분 기호(0x2029)로 표시되어야 합니다. |
IFILTER_INIT_HARD_LINE_BREAKS 값: 2 Word 줄 바꿈 문자와 같은 소프트 반환을 하드 반환으로 바꿔야 하나요? 줄 구분 기호(0x2028). 기존 하드 리턴은 두 배가 될 수 있습니다. 캐리지 리턴(0x000D), 줄 바꿈(0x000A) 또는 캐리지 리턴과 줄 바꿈을 함께 하드 리턴으로 간주해야 합니다. 의도는 관찰된 줄 바꿈과 일치하는 패턴 식 일치를 사용하도록 설정하는 것입니다. |
IFILTER_INIT_CANON_HYPHENS 값: 4 다양한 워드 프로세싱 프로그램에는 선택적 하이픈(줄 끝에만 표시됨) 및 깨지지 않는 하이픈과 같이 호스트 문자 집합에 표시되지 않는 하이픈 형식이 있습니다. 이 플래그는 선택적 하이픈을 null로 변환하고 호환되지 않는 하이픈을 일반 하이픈(0x2010) 또는 HYPHEN-MINUSES(0x002D)로 변환해야 했음을 나타냅니다. |
IFILTER_INIT_CANON_SPACES 값: 8 IFILTER_INIT_CANON_HYPHENS 플래그가 하이픈을 표준화하는 것처럼 이 플래그는 공백을 표준화합니다. 구분되지 않는 공백과 같은 모든 특수 공간 문자는 표준 공백 문자(0x0020)로 변환됩니다. |
IFILTER_INIT_APPLY_INDEX_ATTRIBUTES 값: 16 클라이언트가 내부 값 형식 속성을 나타내는 청크로 텍스트를 분할하려고 했음을 나타냅니다. |
IFILTER_INIT_APPLY_OTHER_ATTRIBUTES 값: 32 IFILTER_INIT_APPLY_INDEX_ATTRIBUTES 및 IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES 플래그가 적용되지 않는 모든 속성을 내보내야 합니다. |
IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES 값: 256 클라이언트가 인덱싱 프로세스 중에 결정된 속성을 나타내는 청크로 텍스트를 분할하려고 했음을 나타냅니다. |
IFILTER_INIT_INDEXING_ONLY 값: 64 클라이언트가 IFilter::Init 메서드를 한 번만 호출하고 IFilter::BindRegion을 호출하지 않으므로 인덱싱을 위해 IFilter를 최적화합니다. 이렇게 하면 다른 청크에 액세스하기 전과 후에 청크에 액세스할 가능성이 없습니다. |
IFILTER_INIT_SEARCH_LINKS 값: 128 텍스트 추출 프로세스는 문서 내의 연결된 모든 개체를 재귀적으로 검색해야 합니다. 링크를 사용할 수 없는 경우 링크의 첫 번째 청크를 가져온 IFilter::GetChunk 호출은 FILTER_E_LINK_UNAVAILABLE 반환해야 합니다. |
IFILTER_INIT_FILTER_OWNED_VALUE_OK 값: 512 콘텐츠 인덱싱 프로세스는 필터에서 설정한 속성 값을 반환할 수 있습니다. |
IFILTER_INIT_FILTER_AGGRESSIVE_BREAK 값: 1024 TBD |
IFILTER_INIT_DISABLE_EMBEDDED 값: 2048 TBD |
IFILTER_INIT_EMIT_FORMATTING 값: 4096 TBD |
설명
일반적으로 IFilter::GetText 메서드의 텍스트 출력은 문서의 실제 텍스트와 정확히 일치해야 합니다. 그러나 최대 상호 운용성을 달성하기 위해 일반적인 기능의 일부 표준화가 바람직합니다. 이러한 기능에는 단락 나누기, 줄 바꿈, 하이픈 및 공백이 포함됩니다. IFilter 인터페이스 서버는 클라이언트에서 거의 무시되는 텍스트에 null 문자를 포함할 수도 있습니다. 즉, 유니코드 문자 0x0000 완전히 무시되고 0x0001 단어 분리로 처리됩니다.
IFILTER_INIT_CANON_PARAGRAPHS, IFILTER_INIT_HARD_LINE_BREAKS, IFILTER_INIT_CANON_HYPHENS 및 IFILTER_INIT_CANON_SPACES 네 개의 플래그가 텍스트 표준화를 제어합니다.
IFilter 인터페이스의 클라이언트는 서로 다른 개체 보기를 원합니다. IFILTER_INIT_APPLY_INDEX_ATTRIBUTES, IFILTER_INIT_APPLY_CRAWL_ATTRIBUTES 및 IFILTER_INIT_APPLY_OTHER_ATTRIBUTES 세 개의 플래그는 청크에 적용해야 하는 속성 집합을 제어합니다. 또한 iFilter::Init 메서드를 호출할 때 aAttributes에 저장된 cAttributes 크기의 배열로 특정 속성을 요청할 수 있습니다.
IFilter 인터페이스 구현은 콘텐츠 인덱싱 이외의 작업이 발생할 때 일부 청크 정보를 저장해야 합니다. IFILTER_INIT_INDEXING_ONLY 인덱싱을 위해 필터를 최적화합니다.
보기 목적으로 문서 및 포함된 모든 개체뿐만 아니라 링크 간에 검색하는 것이 좋습니다. IFILTER_INIT_SEARCH_LINKS 모든 링크를 재귀적으로 검색합니다.
특정 IFilter 인터페이스 구현은 콘텐츠 인덱싱 프로세스 중에 속성 값을 생성할 수 있으며, IFILTER_INIT_FILTER_OWNED_VALUE_OK 이러한 값을 반환해도 괜찮다는 것을 나타냅니다.
요구 사항
지원되는 최소 클라이언트 | Windows 2000 Professional[데스크톱 앱만] |
지원되는 최소 서버 | Windows 2000 Server[데스크톱 앱만] |
머리글 | filter.h |