Azure OpenAI 프로비전 2024년 8월 업데이트
2024년 8월 중순, Microsoft는 새로운 결제 옵션 및 배포 시나리오를 여는 유용성 및 운영 민첩성에 대한 고객의 피드백을 처리하는 프로비전된 처리량 제공을 개선했습니다.
이 문서는 프로비전된 처리량 제품의 기존 사용자를 위한 것입니다. 새 고객은 Azure OpenAI 프로비전 온보딩 가이드를 참조해야 합니다.
변경 내용은?
아래 기능은 프로비전된 관리되는 제품에 대해 배포됩니다.
Important
이 문서의 변경 내용은 이전의 "프로비전된 클래식(PTU-C)" 제품에는 적용되지 않습니다. 프로비전된(프로비저닝된 관리형이라고도 함) 제품에만 영향을 줍니다.
유용성 향상
기능 | 이점 |
---|---|
모델 독립적 할당량 | 모든 모델/버전을 포함하는 단일 할당량 한도는 할당량 관리를 줄이고 새 모델을 사용한 실험을 가속화합니다. |
셀프 서비스 할당량 요청 | 영업 팀에 참여하지 않고 할당량 증가를 요청합니다. 많은 사람들이 자동 승인될 수 있습니다. |
많은 지역에서 프로비저닝된 관리되는 기본 할당량 | 먼저 할당량을 요청하지 않고도 빠르게 시작합니다. |
실시간 용량 가용성 + 새 배포 흐름에 대한 투명한 정보 | 가용성에 대한 협상 감소는 출시 시간을 가속화합니다. |
새 시간별/예약 상용 모델
기능 | 이점 |
---|---|
커밋되지 않은 시간별 사용량 | 필요한 약정이 없는 시간별 결제 옵션을 사용하면 단기 배포 시나리오를 사용할 수 있습니다. |
Azure Reservations를 통한 기간 할인 | Azure 예약은 1개월 및 1년 기간 동안 시간별 요금에 대해 상당한 할인을 제공하며, 관리를 최소화하고 오늘날의 리소스 바인딩된 약정과 관련된 유연한 범위를 제공합니다. |
많은 지역에서 프로비저닝된 관리되는 기본 할당량 | 먼저 할당량을 요청하지 않고도 새 지역에서 빠르게 시작합니다. |
기존 프로비전된 고객을 위한 유연한 결제 모델 선택 | 약정을 가진 고객은 적어도 2024년 말까지 약정 모델을 유지할 수 있으며 셀프 서비스 또는 관리 프로세스를 통해 기존 약정을 시간별/예약으로 마이그레이션하도록 선택할 수 있습니다. |
최신 모델 생성 지원 | 2024년 8월 1일 이후에 릴리스된 모델을 배포하려면 시간별/예약 모델이 필요합니다. |
유용성 개선 세부 정보
프로비전된 할당량 세분성이 모델별에서 모델 독립적으로 변경됩니다. 구독 및 지역 내의 각 모델 및 버전에 자체 할당량 제한이 있는 대신 지원되는 모든 모델 및 버전에 배포할 수 있는 총PTU 수를 제한하는 구독 및 지역당 단일 할당량 항목이 있습니다.
모델 독립적 할당량
2024년 8월 12일부터 기존 고객의 현재 모델별 할당량이 모델 독립적으로 변환되었습니다. 자동으로 진행됩니다. 전환에서 할당량이 손실되지 않습니다. 기존 할당량 한도는 합계를 계산하고 새 모델 독립적 할당량 항목에 할당됩니다.
새 모델 독립적 할당량은 프로비전 및 관리된 처리량 단위라는 할당량 항목으로 표시되며 모델 및 버전은 더 이상 이름에 포함되지 않습니다. Studio 할당량 창에서 할당량 항목을 확장해도 할당량 항목에 기여하는 모든 배포가 표시됩니다.
기본 할당량
신규 및 기존 구독에는 많은 지역에서 소량의 프로비전된 할당량이 할당됩니다. 이를 통해 고객은 먼저 할당량을 요청하지 않고도 해당 지역을 사용할 수 있습니다.
기존 고객의 경우 지역에 할당량 할당이 이미 포함되어 있는 경우 해당 지역에 대한 할당량 제한이 변경되지 않습니다. 예를 들어 새 기본값만큼 자동으로 증가하지는 않습니다.
셀프 서비스 할당량 요청
고객은 영업 팀에 문의하여 더 이상 할당량을 얻지 않습니다. 대신 셀프 서비스 할당량 요청 양식을 사용하고 PTU 관리 할당량 유형을 지정합니다. 양식은 할당량 항목의 오른쪽에 있는 링크에서 액세스할 수 있습니다. 목표는 영업일 기준 2일 이내에 모든 할당량 요청에 응답하는 것입니다.
다음 할당량 스크린샷은 다양한 유형의 배포에서 사용되는 모델 독립적 할당량과 추가 할당량을 요청하는 링크를 보여 줍니다.
한도로 할당량
8월 업데이트 이전에 Azure OpenAI Provisioned는 일부 고객에게만 제공되었으며, 배포 및 사용 기능을 최대화하기 위해 할당량이 할당되었습니다. 이러한 변경으로 모든 사용자에 대해 할당량을 획득하는 프로세스가 간소화되고 배포를 시도할 때 서비스 용량 제한이 발생할 가능성이 더 큽니다. 사용자가 구독에 할당량이 있고 서비스에 원하는 모델의 배포를 지원할 수 있는 용량이 있는 지역을 찾는 데 도움이 되는 새로운 API 및 Studio 환경을 사용할 수 있습니다.
또한 약정을 사용하는 고객은 이제 약정을 만들거나 확장하기 전에 배포를 만드는 것이 좋습니다. 이렇게 하면 약정을 만들기 전에 용량을 사용할 수 있으며 약정의 초과 구매를 방지할 수 있습니다. 이를 지원하기 위해 배포를 약정보다 크게 만들지 못하게 하는 제한이 제거되었습니다. 할당량, 용량 가용성 및 약정에 대한 이 새로운 접근 방식은 시간/예약 모델에 따라 제공되는 것과 일치하며 약정(또는 시간별 모델에 대한 예약)을 구매하기 전에 배포하는 지침은 둘 다 동일합니다.
자세한 내용은 다음 링크를 참조하세요. 예약 및 약정에 대한 지침은 동일합니다.
새 시간별 예약 결제 모델
참고 항목
다음 결제 모델에 대한 설명은 이전 “프로비전된 클래식(PTU-C)” 서비스에는 적용되지 않습니다. 프로비전된(즉, 프로비전 및 관리된) 제품에만 영향을 줍니다. 프로비전된 클래식은 변경되지 않은 월별 약정 지불 모델로 계속 관리됩니다.
Microsoft는 프로비전된 배포에 대한 새로운 "시간/예약" 결제 모델을 도입했습니다. 이는 현재의 약정 결제 모델에 추가되며, 최소 2024년 말까지 계속 지원될 예정입니다.
약정 결제 모델
프로비전된 서비스를 사용하려면 지역별 월 단위 약정이 필요합니다(계약에 따라 더 긴 기간 사용 가능).
약정은 Azure OpenAI 리소스에 바인딩되므로 리소스 간에 배포를 이동하기가 어렵습니다.
약정 기간 중에는 새 PTU를 추가하는 경우를 제외하고는 약정을 취소하거나 변경할 수 없습니다.
2024년 8월 1일 이전에 출시된 모델만 지원됩니다.
시간별 예약 결제 모델
결제 모델은 다른 제품에 대한 Azure 표준과 일치합니다.
시간별 사용량은 약정 없이 지원됩니다.
1개월 및 1년 기간 할인은 지역별 Azure 예약으로 구매할 수 있습니다.
예약은 여러 구독을 포함하도록 유연하게 범위를 지정할 수 있으며, 중도에 범위를 변경할 수도 있습니다.
구형 및 신형 모델을 모두 지원합니다.
Important
2024년 8월 1일 이후에 출시되는 모델은 시간별/예약 결제 모델을 사용해야 합니다. 활성 약정이 있는 Azure OpenAI 리소스에는 배포할 수 없습니다. 8월 1일 이후에 출시된 모델을 배포하려면 기존 고객은 둘 중 하나를 선택해야 합니다.
- 약정 없이 Azure OpenAI 리소스에서 배포를 생성하세요.
- 기존 리소스를 약정에서 마이그레이션하세요.
결제 모델 프레임워크
시간별/예약 결제 모델이 출시되면서 결제 옵션이 더욱 유연해지고 선불 결제에 대한 모델이 변경되었습니다. 1개월 약정이 프로비저닝을 구매할 수 있는 유일한 방법일 때 이 모델은 다음과 같습니다.
- Microsoft 계정 팀에서 PTU 할당량을 가져옵니다.
- 배포하려는 리소스에 대한 약정에서 할당량을 "구매" 합니다.
- 약정 한도까지 리소스에 배포를 생성합니다.
이 모델과 새 모델의 주요 차이점은 이전에는 프로비전 비용을 지불하는 유일한 방법이 1개월 기간 할인이었다는 점입니다. 이제 이전과 같이 1개월 약정 또는 Azure 예약을 통해 할인 여부를 별도로 결정하고 선택하면 시간 단위로 배포하고 비용을 지불할 수 있습니다.
이러한 인사이트를 바탕으로 결제 모델에 대한 새로운 사고 방식은 다음과 같습니다.
- 셀프 서비스 양식을 사용하여 PTU 할당량을 받으세요.
- 할당량을 사용하여 배포를 만듭니다.
- 필요에 따라 약정 또는 예약을 구매하거나 연장하여 배포에 기간 할인을 적용합니다.
1단계와 2단계는 모든 경우에 동일합니다. 차이점은 할인을 제공하기 위한 수단으로 약정 또는 Azure 예약을 사용하는지 여부입니다. 두 모델에서:
할인한 금액보다 더 많은 PTU를 배포할 수 있습니다. (예를 들어, 새로운 모델을 사용해 보기 위해 단기 배포를 생성하는 경우 할인 구매 없이 배포를 통해 사용 가능)
할인 방법(약정 또는 예약)은 고정된 수의 PTU에 할인 가격을 적용하고 할인에 대해 계산되는 배포를 정의하는 범위를 가집니다.
할인 유형 사용 가능한 범위(지역 내) 약속 Azure OpenAI 리소스 Row2 리소스 그룹, 단일 구독, 관리 그룹(구독 그룹), 공유(청구 계정의 모든 구독) 할인된 가격은 할인된 PTU 수까지 배포된 PTU에 적용됩니다.
할인된 PTU를 초과하거나 할인이 적용되지 않는 배포된 PTU 수에 대해서는 시간별 요금이 청구됩니다.
가장 좋은 방법은 먼저 배포를 만든 다음 할인을 적용하는 것입니다. 이는 해당 서비스를 보장하기 위한 것입니다. 사용할 수 없는 PTU에 대한 기간 약정을 만들기 전에 배포를 지원하기 위해 용량을 사용할 수 있습니다.
참고 항목
모범 사례를 따르는 경우 배포를 생성하고 할인(약정 또는 예약)을 늘릴 때까지 시간별 요금을 받을 수 있습니다.
따라서 배포 후 즉시 할인을 늘릴 준비를 하는 것이 좋습니다. Azure 예약 구매의 전제 조건은 약정과 다르며, 배포 할인을 위해 사용하려는 경우 배포 전에 이를 확인하는 것이 좋습니다. 자세한 내용은 Azure 예약 플랜을 보고 관리할 수 있는 권한을 참조하세요.
배포를 할인 방법에 매핑하기
2024년 8월 이전에 Azure OpenAI 프로비전을 사용하는 고객은 구독 내에서 결제 모델 중 하나 또는 두 가지를 동시에 사용할 수 있습니다. 각 배포에 사용되는 결제 모델은 해당 Azure OpenAI 리소스에 따라 결정됩니다.
리소스에 활성 약정이 있음
- 이 약정은 약정의 PTU 수까지 리소스에 대한 모든 배포를 할인합니다. 초과 PTU는 시간별 요금이 청구됩니다.
리소스에 활성 약정이 없음
- 리소스 아래의 배포는 Azure 예약을 통해 할인을 받을 수 있습니다. 이러한 배포를 할인 받으려면 해당 배포가 활성 예약 범위 내에 존재해야 합니다. 예약 범위 내의 모든 배포(동일 또는 다른 구독의 다른 리소스에 대한 배포 가능성 포함)는 예약의 PTU 수까지 그룹으로 할인됩니다. 초과 PTU는 시간별 요금이 청구됩니다.
기존 결제 모드 변경
현재 약정이 있는 고객은 최소 2024년 말까지 약정을 계속 사용할 수 있습니다. 여기에는 신규 또는 기존 약정에 대한 새로운 PTU 구매와 약정 갱신 동작 관리가 포함됩니다. 하지만 8월 업데이트로 인해 약정 운영의 일부 측면이 변경되었습니다.
2024년 8월 1일 이전에 프로비전된 상태로 출시된 모델만 약정이 있는 리소스에 배포할 수 있습니다.
약정에 따라 배포된 PTU가 약정된 PTU를 초과하는 경우, 새로운 시간별/예약 결제 모델에 사용된 것과 동일한 시간별 미터기에 대해 시간별 초과 요금이 부과됩니다. 이렇게 하면 Azure 예약을 통해 초과 요금을 할인받을 수 있습니다.
리소스에 커밋된 것보다 더 많은 PTU를 배포할 수 있습니다. 이를 통해 약정 규모를 늘리기 전에 용량 가용성을 보장하여 이를 충당할 수 있습니다.
기존 리소스를 약정에서 마이그레이션
기존 고객은 기존 리소스를 약정에서 시간별/예약 결제 모델로 마이그레이션하여 최신 모델을 배포하거나 단일 예약으로 다양한 배포에 대한 할인을 통합하여 혜택을 누릴 수 있습니다.
고객이 약정 모델을 사용하는 리소스를 시간별/예약 모델로 마이그레이션하는 데는 두 가지 접근 방식을 사용할 수 있습니다.
셀프 서비스 마이그레이션
셀프 서비스 마이그레이션 방식을 사용하면 고객이 약정을 만료할 수 있도록 허용하여 약정에서 유기적으로 리소스를 확보할 수 있습니다. 리소스를 마이그레이션하는 프로세스는 다음과 같습니다.
기존 약정을 자동 갱신하지 않도록 설정하고 만료 날짜를 기록해 두세요.
만료 날짜 전에 고객은 구독당 약정된 총 PTU 수를 포함하는 Azure 예약을 구매해야 합니다. 기존 예약의 범위에 이미 구독이 포함되어 있는 경우, 새 PTU를 포함하도록 예약의 크기를 늘릴 수 있습니다.
약정이 만료되면 리소스 아래의 배포는 자동으로 시간별/예약 모드로 전환되며, 예약에 따라 사용량이 할인됩니다.
이 셀프 서비스 마이그레이션 방식은 예약과 약정이 모두 활성화된 상태에서 겹치게 됩니다. 이는 이 마이그레이션 모드의 특징이며 이 중복되는 예약 또는 약정 시간은 고객에게 다시 적립되지 않습니다.
셀프 서비스 마이그레이션의 다른 접근 방식은 약정 만료 후에 예약 구매가 이루어지도록 전환하는 것입니다. 이 접근 방식에서는 약정 만료와 예약 구매 사이의 기간 동안 배포가 시간별 사용량을 생성합니다. 이전 모델과 마찬가지로 이 접근 방식의 특징이며, 이 시간별 사용량은 적립되지 않습니다.
셀프 서비스 마이그레이션의 이점:
- 개별 리소스는 서로 다른 시간에 마이그레이션할 수 있습니다.
- 고객은 Microsoft에 대한 종속성 없이 마이그레이션을 관리합니다.
셀프 서비스 마이그레이션의 단점:
- 커밋된 요금에서 매시간/예약 청구로 전환하는 동안 단기간에 이중 청구 또는 시간별 요금이 청구됩니다.
Important
두 셀프 서비스 방식 모두 결제 모드가 약정에서 시간별/예약으로 전환될 때 약간의 추가 요금이 발생합니다. 이는 마이그레이션 방식의 특성이며 고객은 이러한 요금에 대해 크레딧을 받지 못합니다. 고객은 이러한 문제를 피하기 위해 아래에 설명된 관리형 마이그레이션 방식을 사용할 수 있습니다.
관리되는 마이그레이션
관리되는 마이그레이션 방식은 고객이 Microsoft와 협력하여 구독/지역의 모든 PTU 약정을 동시에 일괄 마이그레이션하는 방식입니다. 다음과 같이 작동합니다.
- 고객은 계정 팀에 연락하여 관리되는 마이그레이션을 요청합니다. Microsoft 팀에서 마이그레이션 소유자가 배정되어 고객의 마이그레이션을 지원합니다.
- 현재 PTU 약정이 포함된 각 고객의 구독 및 지역 내의 모든 리소스가 약정에서 시간별/예약 청구 모델로 마이그레이션되는 날짜가 선택됩니다. 여러 구독과 지역을 같은 날짜에 마이그레이션할 수 있습니다.
- 합의된 날짜:
- 고객은 전환될 약정 PTU를 충당하기 위해 지역 예약을 구매하고 예약 정보를 Microsoft 마이그레이션 담당자에게 전달합니다.
- 영업일 기준 2~3일 이내에 모든 약정이 사전에 취소되며, 이전에 약정된 배포는 시간당/예약 결제 모델을 사용하여 시작됩니다.
- 예약 구매가 있는 결제 기간 이후의 결제 기간에 고객은 예약 구매 시점부터 취소된 약정 부분에 해당하는 예약 구매 크레딧을 받게 됩니다.
고객은 관리되는 마이그레이션을 예약하려면 계정 팀에 문의해야 합니다.
관리되는 마이그레이션 이점:
- 구독/지역에 있는 모든 약정의 일괄 마이그레이션은 약정이 많은 고객에게 유용합니다.
- 원활한 비용 마이그레이션: 이중 청구 또는 시간당 추가 요금이 발생하지 않습니다.
관리되는 마이그레이션 단점:
- 구독/지역에 있는 모든 약정은 동시에 마이그레이션해야 합니다.
- Microsoft 팀과 마이그레이션 시간을 조율해야 합니다.
프로비전된 처리량 약정 관리
프로비전된 처리량 약정은 Azure OpenAI Studio의 약정 관리 메뉴에서 만들기 및 관리됩니다. 할당량 메뉴에서 약정 관리를 선택하여 이 보기로 이동할 수 있습니다.
약정 관리 보기에서는 다음과 같은 여러 작업을 수행할 수 있습니다.
- 새 약정을 구매하거나 기존 약정을 편집합니다.
- 구독의 모든 약정을 모니터링합니다.
- 예기치 못한 청구가 발생할 수 있는 약정을 식별하고 조치를 취합니다.
다음 섹션에서는 이러한 작업을 안내합니다.
프로비전된 처리량 약정 구매
약정 플랜이 준비되면 다음 단계는 약정을 만드는 것입니다. 약정은 Azure OpenAI Studio를 통해 수동으로 생성되며, 약정을 만드는 사용자는 구독 수준에서 기여자 또는 Cognitive Services 기여자 역할이 있어야 합니다.
새로 만들어야 하는 각 약정에 대해 다음 단계를 수행합니다.
- 할당량>Azure OpenAI 프로비전된 약정 관리 계획을 선택하여 프로비전된>처리량 구매 대화 상자를 시작합니다.
구매 약정을 선택합니다.
Azure OpenAI 리소스를 선택하고 약정을 구매합니다. 리소스가 편집 가능한 기존 약정이 있는 리소스와 현재 약정이 없는 리소스로 구분되어 표시됩니다.
설정 | 주의 |
---|---|
리소스 선택 | 프로비전된 배포를 만들 리소스를 선택합니다. 약정을 구매한 후에는 현재 약정이 만료될 때까지 다른 리소스에서 PTU를 사용할 수 없습니다. |
약정 형식 선택 | 프로비전됨을 선택합니다. (프로비전됨은 프로비전된 관리와 동등합니다) |
현재 약정되지 않은 프로비전된 할당량 | 이 리소스에 커밋하는 데 현재 사용할 수 있는 PTU 수입니다. |
약정할 크기(PTU) | 약정할 PTU 수를 선택합니다. 이 숫자는 약정 기간 동안 늘릴 수 있지만 줄일 수는 없습니다. 프로비전됨 약정 형식에 값을 50씩 입력합니다. |
현재 기간의 약정 계층 | 약정 기간은 1개월로 설정됩니다. |
갱신 설정 | 현재 PTU에서 자동 갱신 낮은 PTU에서 자동 갱신 자동 갱신 안 함 |
- 구매를 선택합니다. 확인 대화 상자가 표시됩니다. 확인한 후에는 PTU가 약정되고 이를 사용하여 프로비전된 배포를 만들 수 있습니다. |
Important
전체 기간 동안 새로운 약정 요금이 선불로 청구됩니다. 갱신 설정이 자동 갱신으로 설정된 경우 갱신 설정에 따라 각 갱신 날짜에 다시 요금이 청구됩니다.
기존 프로비전된 처리량 약정 편집
약정 관리 보기에서 기존 약정을 편집할 수도 있습니다. 기존 약정에는 두 가지 형식의 변경이 가능합니다.
- 약정에 PTU를 추가할 수 있습니다.
- 갱신 설정을 변경할 수 있습니다.
약정을 편집하려면 편집할 현재 약정을 선택한 다음 약정 편집을 선택합니다.
기존 약정에 프로비전된 처리량 단위 추가
기존 약정에 PTU를 추가하면 리소스 내에서 더 크거나 더 많은 배포를 만들 수 있습니다. 약정 기간 동안 언제든지 이 작업을 수행할 수 있습니다.
Important
약정에 PTU를 추가하면 현재 날짜부터 기존 약정 기간 종료일까지 일할 계산된 금액으로 즉시 요금이 청구됩니다. PTU를 추가해도 약정 기간이 다시 설정되지 않습니다.
갱신 설정 변경
약정 갱신 설정은 약정 만료 날짜 이전에 언제든지 변경할 수 있습니다. 갱신 설정을 변경하려는 이유에는 약정을 자동 갱신하지 않도록 설정하여 프로비전된 처리량 사용을 종료하거나 다음 기간에 약정될 PTU 수를 줄여 프로비전된 처리량의 사용량을 줄이는 것이 포함됩니다.
Important
리소스 아래의 배포에 리소스 약정보다 더 많은 PTU가 필요하도록 약정 만료 또는 크기 감소를 허용하는 경우 초과 PTU에 대해 시간당 초과 요금이 부과됩니다. 예를 들어, 총 500PTU의 배포와 300PTU에 대한 약정이 있는 리소스는 200PTU에 대한 시간당 초과 요금을 생성합니다.
약정을 모니터링하고 예기치 못한 청구를 방지합니다.
약정 관리 창에서는 지정된 Azure 구독 내의 약정 및 PTU 사용량이 포함된 모든 리소스에 대한 구독 전체 개요를 제공합니다. 특히 중요도는 다음과 같습니다.
- 커밋된 PTU, 배포된 PTU 및 사용량 – 이 수치는 약정의 크기와 배포에서 사용 중인 양을 제공합니다. 커밋된 PTU를 모두 사용하여 투자를 최대화합니다.
- 만료 정책 및 날짜 - 만료 날짜와 정책은 약정이 만료되는 시기와 만료되면 어떻게 되는지 알려 줍니다. 자동 갱신으로 설정된 약정은 갱신 날짜에 청구 이벤트를 생성합니다. 만료되는 약정의 경우 시간당 초과 요금 청구를 방지하려면 만료 날짜 전에 이러한 리소스에서 배포를 삭제해야 합니다. 약정에 대한 현재 갱신 설정입니다.
- 경고 - 사용되지 않은 약정, 초과 청구로 이어질 수 있는 구성 등 중요한 조건에 대한 경고입니다. 약정이 만료되고 배포가 아직 존재하지만 시간별 청구로 전환된 경우와 같은 상황으로 인해 초과 청구가 발생할 수 있습니다.
일반적인 약정 관리 시나리오
프로비전된 처리량 사용 중단
프로비전된 처리량의 사용을 종료하고 약정 만료 후 시간당 초과 요금을 방지하려면 현재 약정이 만료된 후 요금을 중지하려면 다음 두 단계를 수행해야 합니다.
- 모든 약정에 대해 갱신 정책을 자동 갱신 안 함으로 설정합니다.
- 할당량을 사용하여 프로비전된 배포를 삭제합니다.
동일한 구독/지역의 새 리소스로 약정/배포 이동
Azure OpenAI Studio에서는 배포 또는 약정을 새 리소스로 직접 이동할 수 없습니다. 대신 대상 리소스에 새 배포를 만들고 트래픽을 이동해야 합니다. 이 작업을 수행하려면 새 리소스에 대해 구매한 약정을 설정해야 합니다. 약정 금액은 30일에 대해 선불로 청구되므로 겹치는 기간 동안 새 약정과의 겹침 및 "이중 청구"를 최소화하기 위해 원래 약정 만료 시에 이러한 이동을 위한 시간이 필요합니다.
이 전환을 구현하기 위해 수행할 수 있는 두 가지 방법이 있습니다.
옵션 1: 겹치지 않는 전환
이 옵션을 사용하려면 약간의 가동 중지 시간이 필요하지만 추가 할당량이 필요하지 않으며 추가 비용이 발생하지 않습니다.
단계 | 주의 |
---|---|
만료할 기존 약정에 대한 갱신 정책 설정 | 이렇게 하면 약정이 갱신되지 않으며 추가 요금도 발생하지 않습니다. |
기존 약정이 만료되기 전에 배포 삭제 | 가동 중지 시간은 이 시점에서 시작되며 새 배포가 생성되고 트래픽이 이동될 때까지 지속됩니다. 만료 날짜/시간에 최대한 가깝게 삭제 시간을 지정하여 이 기간을 최소화합니다. |
기존 약정이 만료된 후 새 리소스에 대한 약정 만들기 | 만료 후 가능한 빨리 이 단계와 다음 단계를 실행하여 가동 중지 시간을 최소화합니다. |
새 리소스에 배포를 만들고 트래픽을 해당 리소스로 이동 |
옵션 2: 겹치는 전환
이 옵션은 기존 배포와 새 배포를 동시에 즉시 진행하므로 가동 중지 시간이 없습니다. 이 경우 새 배포를 만드는 데 할당량을 사용할 수 있어야 하며, 겹치는 배포 기간 동안 추가 비용이 발생합니다.
단계 | 주의 |
---|---|
만료할 기존 약정에 대한 갱신 정책 설정 | 이렇게 하면 약정이 갱신되지 않으며 추가 요금도 발생하지 않습니다. |
기존 약정이 만료되기 전: 1. 새 리소스에 대한 약정 만들기 2. 새 배포 만들기 3. 트래픽 전환 4. 기존 배포 삭제 |
기존 약정이 만료되기 전에 모든 단계에 대해 충분한 시간을 남겨 두세요. 그렇지 않으면 옵션에 대해 초과분 요금이 생성됩니다(다음 섹션 참조). |
최종 단계가 예상보다 오래 걸리고 기존 약정이 만료된 후 완료되는 경우 초과분 요금을 최소화하는 세 가지 옵션을 사용할 수 있습니다.
- 가동 중지 시간: 원래 배포를 삭제한 다음, 이동을 완료합니다.
- 초과분 지불: 원래 배포를 유지하고 트래픽을 이동하고 배포를 삭제할 때까지 매시간 지불합니다.
- 원래 약정을 다시 설정하여 한 번 더 갱신합니다. 이렇게 하면 알려진 비용으로 이동을 완료할 수 있습니다.
초과분에 대해 지불하고 원래 약정을 다시 설정하면 원래 만료 날짜 이후의 요금이 발생합니다. 이동을 완료하는 데 하루 또는 이틀만 필요한 경우 초과분 요금을 지불하는 것이 새로운 1개월 약정보다 저렴할 수 있습니다. 두 옵션의 비용을 비교하여 가장 저렴한 방법을 찾습니다.
배포를 새 지역 및/또는 구독으로 이동
모든 경우에 새 위치에서 사용 가능한 할당량이 필요하다는 점을 제외하고 지역 내에서 약정 및 배포를 이동하는 경우에도 동일한 방법이 적용됩니다.
기존 리소스 보기 및 편집
Azure OpenAI Studio에서 할당량>프로비전됨>약정 계층 관리를 선택하고 기존 약정의 리소스를 선택하여 보거나 변경합니다.