Auswählen einer Dienstebene für Azure AI Search
Beim Erstellen eines Suchdiensts müssen Sie auch einen Tarif (oder eine SKU) auswählen, der für die Lebensdauer des Diensts festgelegt wird. Im Azure-Portal wird die Stufe auf der Seite Preisstufe auswählen angegeben, wenn Sie den Dienst erstellen. In PowerShell oder Azure CLI wird die Ebene über den -Sku
Parameter angegeben.
Die Ebene bestimmt Folgendes:
- Maximale Anzahl von Indizes und anderen Objekten, die im Dienst zulässig sind
- Größe und Geschwindigkeit von Partitionen (physischer Speicher)
- Die abrechenbare Rate als eine festgelegte monatliche Gebühr, aber auch als inkrementelle Kosten, wenn Sie Kapazität hinzufügen
In einigen Fällen bestimmt der von Ihnen gewählte Tarif die Verfügbarkeit von Premium-Features.
Die Abrechnungsraten werden auf der Seite Preisebene auswählen des Azure-Portals angezeigt. Sie können die Preisseite für regionale Tarife überprüfen und Plan überprüfen und Kosten verwalten, um mehr über das Abrechnungsmodell zu erfahren.
Hinweis
Suchdienste, die nach dem 3. April 2024 erstellt wurden, weisen größere Partitionen und höhere Vektorkontingente auf fast jeder Ebene auf. Weitere Informationen finden Sie unter Diensteinschränkungen.
Tarifbeschreibungen
Folgende Tarife sind verfügbar: Free, Basic, Standard und Speicheroptimiert. „Standard“ und „Speicheroptimiert“ werden mit verschiedenen Konfigurationen und Kapazitäten bereitgestellt. Im folgenden Screenshot aus dem Azure-Portal sind die verfügbaren Tarife ohne Preise aufgeführt (die Preise finden Sie im Azure-Portal und auf der Preisübersichtsseite).
Mit Free wird ein eingeschränkter Suchdienst für kleinere Projekte wie das Ausführen von Tutorials und Codebeispielen erstellt. Intern werden Systemressourcen von mehreren Abonnenten gemeinsam genutzt. Sie können keinen kostenlosen Dienst skalieren, erhebliche Workloads ausführen, und einige Premium-Features sind nicht verfügbar. Sie können nur einen kostenlosen Suchdienst pro Azure-Abonnement nutzen. Wenn der Dienst über einen längeren Zeitraum inaktiv ist, kann er gelöscht werden, um Kapazität freizugeben, insbesondere wenn die Region unter Kapazitätsengpässen leidet.
Zu den am häufigsten verwendeten abrechnungsfähigen Ebenen gehören:
Basic bietet die Möglichkeit, SLA mit seiner Unterstützung für drei Replikate zu erfüllen.
Standard (S1, S2, S3) ist der Standardwert. Er bietet Ihnen mehr Flexibilität bei der Skalierung von Workloads. Sie können sowohl Partitionen als auch Replikate skalieren. Wenn Sie dedizierte Ressourcen nutzen, können Sie größere Projekte bereitstellen, die Leistung optimieren und die Kapazität steigern.
Einige Tarife sind für bestimmte Verwendungszwecke konzipiert:
Standard 3 High Density (S3 HD) ist ein Hostingmodus für S3. Die zugrunde liegende Hardware ist für eine große Anzahl kleinerer Indizes optimiert und für Szenarien mit Mehrinstanzenfähigkeit konzipiert. Die Gebühr pro Einheit unterscheidet sich zwischen „S3 HD“ und „S3“ nicht. Die Hardware ist bei „S3 HD“ jedoch für schnelle Dateilesevorgänge bei einer großen Anzahl kleinerer Indizes optimiert.
Datenspeicheroptimierte Tarife (L1, L2) bieten eine höhere Speicherkapazität zu einem niedrigeren Preis pro TB als die Standard-Tarife. Diese Tarife sind für große Indizes ausgelegt, die sich nicht sehr oft ändern. Der größte Nachteil ist die höhere Wartezeit. Diese müssen Sie bei Ihren spezifischen Anwendungsanforderungen berücksichtigen.
Weitere Informationen zu den verschiedenen Tarifen finden Sie auf der Preisübersichtsseite im Artikel Dienstgrenzwerte in Azure KI-Suche und auf der Azure-Portalseite beim Bereitstellen eines Diensts.
Regionsverfügbarkeit nach Ebene
Die Liste der unterstützten Regionen stellt die Speicherorte bereit, an denen Azure AI Search angeboten wird.
Derzeit sind mehrere Regionen für bestimmte Tarife ausgelastet und können nicht für neue Suchdienste verwendet werden. Wenn Sie das Azure-Portal zum Erstellen eines Suchdiensts verwenden, schließt das Azure-Portal alle Kombinationen für Regionen und Ebenen aus, die nicht verfügbar sind.
Region | Deaktivierte Ebene (SKU) aufgrund von Überlastung | Vorgeschlagene Alternative |
---|---|---|
USA (Ost) 2 | Basic, S1 | USA (Mitte) |
USA Süd Mitte | Alle Ebenen | USA (Mitte) |
US Gov Virginia | Alle Ebenen | US Gov Arizona |
Europa, Westen | Alle Ebenen | Schweden, Mitte/Europa, Norden |
USA, Westen 3 | Basic, S1 | USA (Mitte) |
Nordeuropa | S2, S3, S3 HD, L1, L2 | UK, Süden |
Funktionsverfügbarkeit pro Tarif
Die meisten Funktionen sind in allen Tarifen (einschließlich des Free-Tarifs) verfügbar. In einigen Fällen bestimmt die Dienstebene die Verfügbarkeit eines Features. In der folgenden Tabelle werden die Einschränkungen beschrieben.
Funktion | Überlegungen zur Ebene |
---|---|
Indexer | Indexer sind in S3 HD nicht verfügbar. Für Indexer gelten im Free-Tarif mehr Einschränkungen. |
Indexer executionEnvironment Konfigurationsparameter |
Die Möglichkeit, alle Indizierungsverarbeitungen nur an die Suchcluster anzuheften, die Ihrem Suchdienst zugeordnet sind, erfordert S2 und höher. |
KI-Anreicherung | Wird im Free-Tarif ausgeführt, aber nicht empfohlen. |
Verwaltete oder vertrauenswürdige Identitäten für den ausgehenden Zugriff (Indexer) | Im Free-Tarif nicht verfügbar. |
Von Kunden verwaltete Verschlüsselungsschlüssel | Im Free-Tarif nicht verfügbar. |
IP-Firewallzugriff | Im Free-Tarif nicht verfügbar. |
Privater Endpunkt (Integration mit Azure Private Link) | Für eingehende Verbindungen bei einem Suchdienst, nicht im Free-Tarif verfügbar. Für ausgehende Verbindungen von Indexern zu anderen Azure-Ressourcen, nicht verfügbar im Tarif „Free“ oder „S3 HD“. Für Indexer, die Skillsets verwenden, nicht verfügbar im Tarif „Free“, „Basic“, „S1“ oder „S3 HD“ |
Verfügbarkeitszonen | In den Tarifen „Free“ und „Basic“ nicht verfügbar. |
Semantischer Sortierer | Im Free-Tarif nicht verfügbar. |
Ressourcenintensive Funktionen funktionieren möglicherweise nicht gut, wenn Sie ihnen nicht genügend Kapazität zuweisen. Beispielsweise umfasst die KI-Anreicherung Skills mit langer Laufzeit, die bei einem kostenlosen Dienst zu einem Timeout führen, sofern es sich nicht um ein kleines Dataset handelt.
Obergrenzen
Ebenen bestimmen den maximalen Speicher des Diensts selbst sowie die maximale Anzahl von Indizes, Indexern, Datenquellen, Skillsets und Synonymzuordnungen, die Sie erstellen können. Eine vollständige Aufschlüsselung aller Grenzwerte finden Sie unter Diensteinschränkungen in Azure AI Search.
Partitionsgröße und Geschwindigkeit
Der Tarifpreis enthält Details zum partitionsweisen Speicher, der von 15 GB für „Basic“ bis zu 2 TB für datenspeicheroptimierte Tarife (L2) reicht. Andere Hardwaremerkmale, wie z. B. die Geschwindigkeit von Vorgängen, die Latenz und die Übertragungsraten, werden nicht veröffentlicht, aber die für bestimmte Lösungsarchitekturen vorgesehenen Tarife basieren auf Hardware mit den Features zur Unterstützung dieser Szenarios. Weitere Informationen zu Partitionen finden Sie unter Schätzen und Verwalten von Kapazität und Zuverlässigkeit in Azure AI Search.
Hinweis
Im April 2024 wurden Partitionen mit höherer Kapazität in ausgewählten Regionen verfügbar. Eine zweite Welle von Partitionen mit höherer Kapazität wurde im Mai 2024 veröffentlicht. Wenn Sie einen älteren Suchdienst verwenden, sollten Sie einen neuen Suchdienst erstellen, um mehr Kapazität mit dem gleichen Abrechnungssatz zu nutzen. Weitere Informationen finden Sie unter Diensteinschränkungen. Informationen zum Überprüfen des Alters Ihres Suchdiensts finden Sie unter Überprüfen des Erstellungsdatums des Diensts.
Abrechnungsraten
Bei Tarifen gibt es unterschiedliche Abrechnungsraten, mit höheren Raten für Tarife, die auf teurerer Hardware ausgeführt werden oder teurere Features bereitstellen. Die Abrechnungsrate pro Dienstebene finden Sie auf den Seiten zu Azure-Preisen für Azure AI Search.
Nachdem Sie einen Dienst erstellt haben, wird die Abrechnungsrate sowohl zu Fixkosten für die Ausführung des Diensts rund um die Uhr als auch zu inkrementellen Kosten, wenn Sie mehr Kapazität hinzufügen möchten.
Suchdiensten werden Computerressourcen in Form von Partitionen (für Speicher) und Replikaten (Instanzen der Abfrage-Engine) zugeordnet. Anfänglich wird ein Dienst mit jeweils einer der beiden Ressourcen erstellt, und die Abrechnungsrate ist in beiden Ressourcen enthalten. Wenn Sie jedoch die Kapazität skalieren, werden die Kosten in Inkrementen der abrechenbaren Rate erhöht oder gesenkt.
Dies wird im folgenden Beispiel veranschaulicht. Nehmen Sie eine hypothetische Abrechnungsrate von 100 € pro Monat an. Wenn Sie für den Suchdienst seine Anfangskapazität von einer Partition und einem Replikat beibehalten, ist 100 € der Betrag, den Sie am Monatsende erwartungsgemäß bezahlen werden. Wenn Sie aber zwei weitere Replikate hinzufügen, um Hochverfügbarkeit zu erreichen, erhöht sich die monatliche Rechnung auf 300 € (100 € für das erste Paar aus Replikat und Partition, gefolgt von 200 € für die zwei Replikate).
Dieses Abrechnungsmodell basiert auf dem Konzept einer Anwendung der Abrechnungsrate auf die Anzahl der Sucheinheiten (Search Units, SUs), die von einem Suchdienst verwendet werden. Alle Dienste werden zunächst in einer einzigen SU bereitgestellt. Sie können aber die Anzahl der SUs erhöhen, indem Sie entweder Partitionen oder Replikate zur Verarbeitung größerer Workloads hinzufügen. Weitere Informationen finden Sie unter Schätzen der Kosten für einen Suchdienst.
Herauf- oder Herabstufen von Dienstebenen
Es gibt keine integrierte Unterstützung für das Herauf- oder Herabstufen von Dienstebenen. Wenn Sie zu einer anderen Dienstebene wechseln möchten, müssen Sie Folgendes tun:
Erstellen Sie einen neuen Suchdienst auf der neuen Dienstebene.
Stellen Sie Ihre Suchinhalte im neuen Dienst bereit. Befolgen Sie diese Prüfliste, um sicherzustellen, dass Sie über alle Inhalte verfügen.
Löschen Sie den alten Suchdienst, sobald Sie sicher sind, dass er nicht mehr benötigt wird.
Bei großen Indizes, die Sie nicht von Grund auf neu erstellen möchten, sollten Sie das Sicherungs- und Wiederherstellungsbeispiel verwenden, um sie zu verschieben.
Nächste Schritte
Die beste Möglichkeit zur Auswahl eines Tarifs ist, mit dem kostengünstigsten Tarif zu beginnen und sich dann aufgrund von Erfahrungen und anhand von Tests zu entscheiden, ob Sie den Dienst beibehalten oder einen neuen Dienst zu einem höheren Tarif erstellen möchten. Für die nächsten Schritte empfehlen wir, dass Sie einen Suchdienst auf einer Ebene erstellen, die die von Ihnen vorgeschlagenen Testebene aufnehmen kann. Lesen Sie dann den folgenden Leitfaden mit Empfehlungen zum Schätzen von Kosten und Kapazität.