Välj en tjänstnivå för Azure AI Search
En del av att skapa en söktjänst är att välja en prisnivå (eller SKU) som är fast under tjänstens livslängd. I portalen anges nivån på sidan Välj prisnivå när du skapar tjänsten. I PowerShell eller Azure CLI anges nivån via parametern -Sku
.
Nivån avgör:
- Maximalt antal index och andra objekt som tillåts i tjänsten
- Storlek och hastighet för partitioner (fysisk lagring)
- Fakturerbar ränta som en fast månadskostnad, men också en inkrementell kostnad om du lägger till kapacitet
I några få fall avgör den nivå du väljer tillgängligheten för premiumfunktioner.
Faktureringspriser visas på sidan Välj prisnivå i portalen. Du kan kontrollera prissidan för regionala priser och granska Planera och hantera kostnader för att lära dig mer om faktureringsmodellen.
Kommentar
tjänsten Search som skapats efter den 3 april 2024 har större partitioner och högre vektorkvoter på nästan alla nivåer. Mer information finns i tjänstbegränsningar.
Nivåbeskrivningar
Nivåerna är Kostnadsfri, Basic, Standard och Lagringsoptimerad. Standard- och lagringsoptimerade är tillgängliga med flera konfigurationer och kapaciteter. Följande skärmbild från Azure Portal visar tillgängliga nivåer, minus priser (som du hittar i portalen och på prissidan).
Kostnadsfritt skapar en begränsad söktjänst för mindre projekt, som att köra självstudier och kodexempel. Internt delas systemresurser mellan flera prenumeranter. Du kan inte skala en kostnadsfri tjänst, köra betydande arbetsbelastningar och vissa premiumfunktioner är inte tillgängliga. Du kan bara ha en kostnadsfri söktjänst per Azure-prenumeration. Om tjänsten är inaktiv under en längre tid kan den tas bort för att frigöra kapacitet, särskilt om regionen är under kapacitetsbegränsningar.
De vanligaste fakturerbara nivåerna är:
Basic har möjlighet att uppfylla serviceavtalet med stöd för tre repliker.
Standard (S1, S2, S3) är standardvärdet. Det ger dig större flexibilitet när det gäller skalning för arbetsbelastningar. Du kan skala både partitioner och repliker. Med dedikerade resurser under din kontroll kan du distribuera större projekt, optimera prestanda och öka kapaciteten.
Vissa nivåer är utformade för vissa typer av arbete:
Standard 3 High Density (S3 HD) är ett värdläge för S3, där den underliggande maskinvaran är optimerad för ett stort antal mindre index och är avsedd för scenarier med flera innehavare. S3 HD har samma avgift per enhet som S3, men maskinvaran är optimerad för snabba filläsningar på ett stort antal mindre index.
Lagringsoptimerade nivåer (L1, L2) erbjuder större lagringskapacitet till ett lägre pris per TB än standardnivåerna. Dessa nivåer är utformade för stora index som inte ändras särskilt ofta. Den primära kompromissen är högre frågesvarstid, vilket du bör validera för dina specifika programkrav.
Du kan ta reda på mer om de olika nivåerna på prissidan, i artikeln Tjänstbegränsningar i Azure AI Search och på portalsidan när du etablerar en tjänst.
Regiontillgänglighet efter nivå
Listan över regioner som stöds innehåller de platser där Azure AI Search erbjuds.
För närvarande har flera regioner kapacitet för specifika nivåer och kan inte användas för nya söktjänster. Om du använder Azure Portal för att skapa en söktjänst utesluter portalen alla kombinationer på regionnivå som inte är tillgängliga.
Region | Inaktiverad nivå (SKU) på grund av överkapacitet | Föreslaget alternativ |
---|---|---|
USA, östra 2 | Basic, S1 | Centrala USA |
USA, södra centrala | Alla nivåer | Centrala USA |
US Gov, Virginia | Alla nivåer | US Gov, Arizona |
Västeuropa | Alla nivåer | Sverige, centrala/Europa, norra |
USA, västra 3 | Basic, S1 | Centrala USA |
Europa, norra | S2, S3, S3 HD, L1, L2 | Södra Storbritannien |
Funktionstillgänglighet per nivå
De flesta funktioner är tillgängliga på alla nivåer, inklusive den kostnadsfria nivån. I några fall avgör nivån tillgängligheten för en funktion. I följande tabell beskrivs begränsningarna.
Funktion | Överväganden på nivå |
---|---|
Indexerare | Indexerare är inte tillgängliga i S3 HD. Indexerare har fler begränsningar på den kostnadsfria nivån. |
indexerarens executionEnvironment konfigurationsparameter |
Möjligheten att fästa all indexeringsbearbetning på bara de sökkluster som allokerats till söktjänsten kräver S2 och högre. |
AI-berikande | Körs på den kostnadsfria nivån men rekommenderas inte. |
Hanterade eller betrodda identiteter för utgående åtkomst (indexerare) | Inte tillgängligt på den kostnadsfria nivån. |
Kundhanterade krypteringsnycklar | Inte tillgängligt på den kostnadsfria nivån. |
ÅTKOMST till IP-brandvägg | Inte tillgängligt på den kostnadsfria nivån. |
Privat slutpunkt (integrering med Azure Private Link) | För inkommande anslutningar till en söktjänst, inte tillgängligt på den kostnadsfria nivån. För utgående anslutningar av indexerare till andra Azure-resurser, som inte är tillgängliga i Kostnadsfri eller S3 HD. För indexerare som använder kunskapsuppsättningar, som inte är tillgängliga i Kostnadsfri, Basic, S1 eller S3 HD. |
Tillgänglighetszoner | Inte tillgängligt på nivån Kostnadsfri eller Basic. |
Semantisk ranker | Inte tillgängligt på den kostnadsfria nivån. |
Resursintensiva funktioner kanske inte fungerar bra om du inte ger den tillräcklig kapacitet. AI-berikning har till exempel långvariga kunskaper som överskrider tidsgränsen för en kostnadsfri tjänst om inte datauppsättningen är liten.
Övre gränser
Nivåerna avgör den maximala lagringen av själva tjänsten, plus det maximala antalet index, indexerare, datakällor, kompetensuppsättningar och synonymkartor som du kan skapa. En fullständig utbrytning av alla gränser finns i Tjänstgränser i Azure AI Search.
Partitionsstorlek och hastighet
Prisnivån innehåller information om lagring per partition som sträcker sig från 15 GB för basic-nivåer, upp till 2 TB för lagringsoptimerade nivåer (L2). Andra maskinvaruegenskaper, till exempel hastighet för åtgärder, svarstider och överföringshastigheter, publiceras inte, men nivåer som är utformade för specifika lösningsarkitekturer bygger på maskinvara som har funktioner för att stödja dessa scenarier. Mer information om partitioner finns i Beräkna och hantera kapacitet och tillförlitlighet i Azure AI Search.
Kommentar
Partitioner med högre kapacitet blev tillgängliga i utvalda regioner från och med april 2024. En andra våg av partitioner med högre kapacitet som släpptes i maj 2024. Om du använder en äldre söktjänst kan du överväga att skapa en ny söktjänst för att dra nytta av mer kapacitet med samma faktureringstakt. Mer information finns i Tjänstbegränsningar. Information om hur du kontrollerar din söktjänsts ålder finns i Så här kontrollerar du datumet då tjänsten skapades.
Faktureringspriser
Nivåerna har olika faktureringspriser, med högre priser för nivåer som körs på dyrare maskinvara eller ger dyrare funktioner. Faktureringsfrekvensen på nivån finns på azure-prissidorna för Azure AI Search.
När du har skapat en tjänst blir faktureringspriset både en fast kostnad för att köra tjänsten dygnet runt och en inkrementell kostnad om du väljer att lägga till mer kapacitet.
tjänsten Search allokeras beräkningsresurser i form av partitioner (för lagring) och repliker (instanser av frågemotorn). Till en början skapas en tjänst med en av var och en, och faktureringsfrekvensen omfattar båda resurserna. Men om du skalar kapacitet går kostnaderna upp eller ned i steg av den fakturerbara kursen.
I följande exempel visas en bild. Anta en hypotetisk faktureringstakt på 100 USD per månad. Om du behåller söktjänsten på den ursprungliga kapaciteten för en partition och en replik är 100 USD vad du kan förvänta dig att betala i slutet av månaden. Men om du lägger till ytterligare två repliker för att uppnå hög tillgänglighet, ökar den månatliga fakturan till $ 300 ($ 100 för det första replikpartitionsparet, följt av $ 200 för de två replikerna).
Den här faktureringsmodellen baseras på konceptet att tillämpa faktureringsfrekvensen på de antal sökenheter (SU) som används av en söktjänst. Alla tjänster etableras ursprungligen på en SU, men du kan öka SUs genom att lägga till antingen partitioner eller repliker för att hantera större arbetsbelastningar. Mer information finns i Så här beräknar du kostnader för en söktjänst.
Nivåuppgradering eller nedgradering
Det finns inget inbyggt stöd för att uppgradera eller nedgradera nivåer. Om du vill växla till en annan nivå är metoden:
Skapa en ny söktjänst på den nya nivån.
Distribuera ditt sökinnehåll till den nya tjänsten. Följ den här checklistan för att se till att du har allt innehåll.
Ta bort den gamla söktjänsten när du är säker på att den inte längre behövs.
Överväg att använda säkerhetskopierings - och återställningsexemplet för att flytta dem för stora index som du inte vill återskapa från grunden.
Nästa steg
Det bästa sättet att välja prisnivå är att börja med en lägsta kostnadsnivå och sedan låta erfarenhet och testning informera dig om ditt beslut att behålla tjänsten eller skapa en ny på en högre nivå. För nästa steg rekommenderar vi att du skapar en söktjänst på en nivå som kan hantera den testnivå som du föreslår att göra och sedan gå igenom följande vägledning för rekommendationer om att beräkna kostnader och kapacitet.