Azure AI 모델 유추에 대한 기본 콘텐츠 안전 정책

아티클
01/30/2025

Azure AI 모델 유추에는 Azure OpenAI Whisper를 제외한 모든 모델에 적용되는 기본 안전성이 포함됩니다. 이러한 구성은 기본적으로 책임 있는 환경을 제공합니다.

기본 안전은 증오와 공정성, 성적, 폭력, 자해, 보호된 자료 콘텐츠 및 사용자 프롬프트 주입 공격과 같은 위험을 완화하는 것을 목표로 합니다. 콘텐츠 필터링에 대한 자세한 내용은 범주 및 심각도 수준을 설명하는 설명서를 참조하세요.

이 문서에서는 기본 구성에 대해 설명합니다.

팁

기본적으로 모든 모델 배포는 기본 구성을 사용합니다. 그러나 콘텐츠 필터링 구성에 설명된 대로 모델 배포당 콘텐츠 필터링을 구성할 수 있습니다.

텍스트 모델

Azure AI 모델 유추의 텍스트 모델은 텍스트와 코드를 모두 사용하고 생성할 수 있습니다. 이러한 모델은 Azure의 텍스트 콘텐츠 필터링 모델을 적용하여 유해한 콘텐츠를 감지하고 방지합니다. 이 시스템은 프롬프트와 완료 모두에서 작동합니다.

위험 범주	프롬프트/완료	심각도 임계값
증오와 공정성	프롬프트 및 완료	중간
폭력	프롬프트 및 완료	중간
성적	프롬프트 및 완료	중간
자해	프롬프트 및 완료	중간
사용자 프롬프트 주입 공격(Jailbreak)	프롬프트	해당 없음
보호 자료 – 텍스트	완성	해당 없음
보호 자료 – 코드	완성	해당 없음

비전 모델과 비전 및 채팅

비전 모델은 입력의 일부와 동시에 텍스트와 이미지를 모두 사용할 수 있습니다. 기본 콘텐츠 필터링 기능은 모델 및 공급자마다 다릅니다.

Azure OpenAI: GPT-4o 및 GPT-4 Turbo

위험 범주	프롬프트/완료	심각도 임계값
증오와 공정성	프롬프트 및 완료	중간
폭력	프롬프트 및 완료	중간
성적	프롬프트 및 완료	중간
자해	프롬프트 및 완료	중간
개인 식별 및 중요한 특성 유추	프롬프트	해당 없음
사용자 프롬프트 주입 공격(Jailbreak)	프롬프트	해당 없음

Azure OpenAI: DALL-E 3 및 DALL-E 2

위험 범주	프롬프트/완료	심각도 임계값
증오와 공정성	프롬프트 및 완료	낮음
폭력	프롬프트 및 완료	낮음
성적	프롬프트 및 완료	낮음
자해	프롬프트 및 완료	낮음
콘텐츠 자격 증명	완성	해당 없음
기만적인 정치 후보 생성	프롬프트	해당 없음
공인 묘사	프롬프트	해당 없음
사용자 프롬프트 주입 공격(Jailbreak)	프롬프트	해당 없음
보호 자료 – 예술 및 스튜디오 캐릭터	프롬프트	해당 없음
욕설	프롬프트	해당 없음

이전 안전 구성 외에도 Azure OpenAI DALL-E에는 기본적으로 프롬프트 변환이 제공됩니다. 이 변환은 원래 프롬프트의 안전성을 강화하기 위해 모든 프롬프트에서 발생합니다. 특히 위험 범주인 다양성, 기만적인 정치 후보 생성, 공용 묘사, 보호 자료 등의 경우 더욱 그렇습니다.

Meta: Llama-3.2-11B-Vision-Instruct 및 Llama-3.2-90B-Vision-Instruct

콘텐츠 필터는 텍스트 프롬프트 및 완성에만 적용됩니다. 이미지는 con텐트 모드ration의 적용을 받지 않습니다.

Microsoft: Phi-3.5-vision-instruct