다음을 통해 공유


EDM SIT 스키마 및 규칙 패키지 만들기(새 환경)

Microsoft Purview 규정 준수 포털에서 단일 워크플로를 사용하여 새 환경에서 정확한 EDM(데이터 일치) 스키마와 SIT(EDM 중요한 정보 유형)를 모두 만들 수 있습니다.

E5 고객이 아닌 경우 90일 Microsoft Purview 솔루션 평가판을 사용하여 조직이 데이터 보안 및 규정 준수 요구 사항을 관리하는 데 도움이 되는 추가 Purview 기능을 살펴보세요. Microsoft Purview 규정 준수 포털 평가판 허브에서 지금 시작하세요. 등록 및 평가판 조건에 대한 세부 정보를 알아봅니다.

적용 대상

  • 새로운 환경

클래식 환경을 사용하여 EDM SIT를 만들려면 EDM SIT 만들기(클래식 환경)를 참조하세요. 사용할 환경을 결정하는 데 도움이 필요한 경우 적합한 EDM SIT 만들기 환경 선택을 참조하세요.

시작하기 전에

이 문서에 설명된 절차를 시작하기 전에 다음 문서의 단계를 완료해야 합니다.

  1. 정확한 데이터 일치 기반 중요한 정보 유형에 대한 원본 데이터 내보내기
  2. EDM SIT 샘플 파일 만들기(새 환경)

EDM 기반 SID 또는 해당 구현에 익숙하지 않은 경우 다음 문서의 개념을 숙지해야 합니다 .

권한

규정 준수 포털을 통해 사용자 지정 중요한 정보 유형을 만들고, 테스트하고, 배포하려면 전역 관리자 또는 규정 준수 관리자 권한이 있어야 합니다. 역할 및 권한에 대한 자세한 내용은 Office 365 관리자 역할 정보를 참조하세요.

중요한 고려 사항

다음은 EDM 스키마 및 EDM 기반 SID를 만들 때 고려해야 할 몇 가지 중요한 고려 사항입니다.

  • 기본 요소를 선택하기 전에기본 제공 SID 를 검토하여 요구 사항을 가장 잘 충족하는 항목을 파악합니다.

  • 각 EDM SIT에 대해 하나 이상의 기본 요소 와 10개 이하의 기본 요소를 선택해야 합니다. 다중 토큰 부식성 데이터 필드가 있는 경우 다음 옵션 중 하나를 선택합니다.

    1. 다중 토큰 일치를 선택합니다.
    2. 다중 토큰 필드의 요소를 해당 콘텐츠를 검색할 수 있는 SIT에 매핑합니다. (매핑하는 고유한 값이 있는 필드가 많을수록 EDM SIT가 더 정확해집니다. 여러 필드를 매핑하면 성능을 향상시키고, 처리 부하를 줄이고, 시스템 시간 제한을 방지할 수 있습니다.)
  • SIT의 기본 요소를 선택할 때 데이터 테이블의 각 행이 고유하도록 하는 필드를 선택합니다. 예를 들어 또는 DateOfBirth와 같은 FirstName 필드를 사용하지 마세요. 이유 이름 및 생년월일은 중요한 데이터 테이블 전체에서 중복될 가능성이 높기 때문입니다. 대신 또는 BankAccountNumber와 같은 SocialSecurityNumber 고유한 값이 있는 필드를 사용합니다.

  • 추천:샘플 데이터 파일에서 EDM 스키마를 빌드합니다. 이 권장 사항에 따라 샘플 데이터 파일이 다음 요구 사항을 준수하는지 확인합니다.

    • 데이터는 열과 행을 사용하여 테이블로 구성해야 합니다. 열 머리글에 필드 이름을 사용합니다. 테이블의 행은 개별 데이터 항목에 해당합니다.
    • 필드 이름은 영숫자 문자만 포함할 수 있습니다.
    • 필드 이름은 문자로 시작해야 하며 3자 이상의 영숫자로 구성되어야 합니다.
    • 이러한 명명 요구 사항이 충족되지 않으면 샘플 데이터 파일을 업로드할 때 오류가 발생할 수 있습니다.
  • 중요한 정보의 샘플 파일을 사용하여 EDM SIT를 구성하는 경우 시스템은 업로드된 데이터를 가장 잘 감지하는 각 필드에 대해 기존 SIT를 제안합니다(이러한 SIT를 사용할 수 있는 경우). Microsoft Purview는 중요한 콘텐츠를 검색하기 위해 기본적으로 단일 토큰 일치로 설정됩니다. 따라서 기존 SID가 EDM 스키마의 필드에 대한 데이터를 검색할 수 없는 경우 단일 토큰 일치 모드를 적용합니다. 각 요소에 대해 제안된 SIT가 모니터링하려는 정확한 문자열을 검색하는지 확인해야 합니다.

    1. 제안된 SIT에 검색하려는 콘텐츠와 다른 주변 문자가 포함되어 있지 않은지 확인합니다.
    2. 제안된 SIT가 중요한 정보 테이블에 저장된 대로 문자열의 유효한 부분을 제외하지 않는지 확인합니다.
    3. 사용하는 SIT가 검색하려는 데이터의 형식과 밀접하게 일치하는지 확인합니다. 예를 들어 단순히 digits가 아닌 와 같은 Nine digits with optional hyphens or spaces 항목을 찾거나 단순히 text strings가 아닌 에 대한 A combination of 32 characters consisting of letters and digits 검사 찾습니다.

      검색하려는 데이터의 형식과 밀접하게 일치하는 SIT를 사용하는 것은 결과의 정확도를 개선하고 일치가 완료되는 데 걸리는 시간을 단축하는 또 다른 방법입니다.

참고

선택한 상태에서 도구를 통해 앞으로(다음) 및 뒤로(뒤로)이동할 때 모든 데이터가 저장됩니다. 뒤로 탐색은 최상위 페이지에서 최상위 페이지로, 하위 페이지에서 하위 페이지로 이동하는 것만 지원합니다. 최상위 페이지에서 이전 하위 페이지로 또는 하위 페이지에서 이전 최상위 페이지로 뒤로 이동할 수 없습니다.

EDM 스키마 및 SIT 만들기

다음 절차에서는 새 환경을 사용하여 EDM 스키마 및 SID를 만들기 위한 단계별 지침을 제공합니다. 프로세스 전체의 개념 개요 및 다이어그램은 EDM 워크플로 개요(새 환경)를 참조하세요.

지침

  1. 테넌트 규정 준수 포털에서 데이터 분류>EDM 분류자로 이동합니다.

  2. 새 EDM 환경 토글이 켜기로 설정되어 있는지 확인합니다.

  3. + EDM 분류자 만들기를 선택합니다.

  4. SIT의 이름을 지정하고 설명을 추가합니다. 시스템에서는 스키 라는 단어가 추가된 이 이름을 생성한 연결된 스키마에 사용합니다.

  5. 다음을 선택합니다.

  6. 스키마에 사용할 메서드를 선택합니다. 샘플 데이터가 포함된 파일 업로드 또는 데이터 구조를 수동으로 정의합니다. (모범 사례는 샘플 데이터 파일을 업로드하는 것입니다. 이 절차의 나머지 부분에는 이 옵션이 있다고 가정합니다.)

    두 경우 모두 샘플 파일에 대한 EDM SIT 샘플 파일 만들기(새 환경) 에서 설명하는 정보가 필요합니다.

  7. 다음을 선택합니다.

  8. 샘플 파일을 선택한 다음 파일 업로드를 선택합니다. 다음을 선택합니다.
    업로드하는 동안 오류가 표시되면 해결한 다음 다시 시도하세요.

  9. 기본 요소 선택 페이지에서 다음을 수행합니다.

    1. Primary 요소 열에서 기본 요소를 선택합니다. 각 기본 요소는 SIT에 매핑되어야 합니다. 일치 유효성 검사 열 아래에서 전체 일치를 표시하는 필드를 선택하는 것이 가장 좋습니다.
    2. 각 필드에 대한 일치 모드 열에서 적용할 다음 일치 옵션을 지정합니다.
      • 옵션 1: 시스템 제안 SIT를 수락하려면 아무 작업도 수행하지 않습니다.
      • 옵션 2: 드롭다운 메뉴를 확장합니다. SIT(중요한 정보 유형)에서 연필(편집) 아이콘을 선택한 다음, 다른 기존 SIT를 선택합니다.
      • 옵션 3:일치 모드 에서 단일 토큰을 선택합니다.
      • 옵션 4:일치 모드 에서 다중 토큰을 선택합니다.
  10. 다음을 선택합니다.

  11. 선택한 열의 데이터에 대한 설정을 구성합니다.

    • 토글 모든 열에 대해 동일한 설정 사용 은 기본적으로 기로 설정됩니다. 각 데이터 필드에 대해 별도의 설정을 사용하려면 토글을 기로 설정합니다.
    • 열의 데이터는 대/소문자를 구분하지 않는 옵션이 기본적으로 선택되어 있습니다. 대/소문자 구분 검색을 적용하려면 이 확인란의 선택을 취소합니다.
    • 필요한 경우 모든 열의 데이터에 대한 구분 기호 및 문장 부호 무시 옵션을 선택한 다음 목록에서 무시할 구분 기호 및 문장 부호를 선택하거나 무시할 사용자 지정 구분 기호와 문장 부호를 입력할 수 있습니다.

중요

스키마의 기본 요소 열에 대해 구분 기호 무시 옵션을 선택하는 경우 매핑하는 SIT가 선택한 구분 기호와 관계없이 데이터를 일치하도록 디자인되었는지 확인합니다.

  1. Choose Submit.



완료되면 EDM은 식별한 각 기본 요소에 대해 하나의 검색 규칙을 자동으로 생성합니다. 또한 신뢰도가 높은 규칙과 중간 신뢰 도 규칙을 만듭니다. 신뢰도가 높은 규칙은 중간 신뢰도 규칙보다 일치하는 요구 사항이 더 많으며, 이는 신뢰도가 낮은 규칙보다 더 많은 요구 사항을 갖습니다. (신뢰도가 낮은 규칙을 수동으로 만들어야 합니다.) 기본 요소에 대한 검색 규칙 구성 페이지에서 이러한 규칙을 검토하고 편집할 수 있습니다.

기본으로 선택되지 않은 요소는 여전히 확증(지원) 증거로 사용할 수 있습니다. 기본 요소에 대해 정의된 근접에 있는 지원 요소가 많을수록 일치가 참 긍정이라는 신뢰도가 높아집니다.

권장 사항

  • 스키마를 만들거나 편집한 후 EDM 데이터 업로드를 다운로드하여 사용하기 전에 적어도 1시간 정도 기다립니다. 이렇게 하면 스키마가 시스템과 동기화되었는지 확인할 수 있습니다. 스키마가 너무 빨리 다운로드되면 명령줄을 통해 스키마를 다운로드하려고 할 때 오류 메시지가 표시될 수 있습니다.

  • EDM 업로드 에이전트를 사용하여 스키마를 다운로드, 수동으로 편집한 다음 다시 업로드하지 마세요. 이렇게 하면 EDM 업로드 에이전트를 사용하여 스키마를 다운로드하면 스키마 만들기 검사를 통과하지 못하는 태그가 스키마에 추가되기 때문에 오류가 발생합니다.

  • 모든 확증적 증거가 검색되도록 하려면 다음 작업 중 하나를 수행합니다. - 다중 토큰 확증 증거 필드를 다중 토큰 기능(현재 5개의 토큰)에서 지원하는 최대 토큰 수로 트리밍합니다.
    - 다중 토큰 필드를 다중 토큰 데이터를 완전히 검색할 수 있는 SIT에 매핑합니다. - EDM SIT를 만들거나 편집한 후 다음 PowerShell cmdlet을 사용하여 테스트한 다음 DLP(데이터 손실 방지) 정책 솔루션에서 테스트하기 전에 24시간을 기다립니다.

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

다음 단계