Verwalten der Kapazität
Um eine Azure KI-Suchlösung zu erstellen, müssen Sie in Ihrem Azure-Abonnement eine Ressource für die Azure KI-Suche erstellen. Abhängig von der Lösung, die Sie erstellen möchten, benötigen Sie möglicherweise auch Azure-Ressourcen für die Datenspeicherung und andere Anwendungsdienste.
Dienstebenen und Kapazitätsverwaltung
Wenn Sie eine Ressource für die Azure KI-Suche erstellen, müssen Sie einen Tarif angeben. Der von Ihnen gewählte Tarif bestimmt die Kapazitätsbeschränkungen des Suchdiensts, die für Sie verfügbaren Konfigurationsoptionen sowie die Kosten des Diensts. Die verfügbaren Tarife lauten:
- Free (F). Verwenden Sie diesen Tarif, um den Dienst zu erkunden oder die Tutorials in der Produktdokumentation zu testen.
- Basic (B): Verwenden Sie diesen Tarif für kleine Suchlösungen, die maximal 15 Indizes und 5 GB Indexdaten umfassen.
- Standard (S): Verwenden Sie diesen Tarif für Lösungen auf Unternehmensniveau. Es gibt mehrere Varianten dieses Tarifs, z. B. S, S2 und S3, die einen größeren Umfang an Indizes und Speicher bieten. Der Tarif S3 HD wurde für eine schnelle Leseleistung bei einer geringeren Anzahl von Indizes optimiert.
- Storage Optimized (L): Verwenden Sie den Tarif „Storage Optimized“ (L1 oder L2), wenn Sie große Indizes erstellen müssen, die mit einer höheren Abfragewartezeit einhergehen.
Hinweis
Es ist wichtig, den am besten geeigneten Tarif für Ihre Lösung auszuwählen, da Sie ihn später nicht mehr ändern können. Wenn Sie feststellen, dass der von Ihnen gewählte Tarif für Ihre Lösung nicht mehr geeignet ist, müssen Sie eine neue Ressource für die Azure KI-Suche erstellen und alle Indizes und Objekte neu erstellen.
Replikate und Partitionen
Je nach gewähltem Tarif können Sie die Skalierbarkeit und Verfügbarkeit Ihrer Lösung optimieren, indem Sie Replikate und Partitionen erstellen.
Replikate sind Instanzen des Suchdiensts. Sie können sich diese als Knoten in einem Cluster vorstellen. Wenn Sie die Anzahl der Replikate erhöhen, lässt sich besser sicherstellen, dass die Kapazität ausreicht, um mehrere gleichzeitige Abfrageanforderungen zu verarbeiten, während zur gleichen Zeit Indizierungsvorgänge ausgeführt werden.
Mit Partitionen wird ein Index in mehrere Speicherorte unterteilt, sodass Sie E/A-Vorgänge, z. B. das Abfragen oder Neuerstellen eines Index, aufteilen können.
Die von Ihnen konfigurierte Kombination von Replikaten und Partitionen bestimmt die in der Lösung verwendeten Sucheinheiten. Mit anderen Worten: Die Anzahl der Sucheinheiten ist die Anzahl der Replikate multipliziert mit der Anzahl der Partitionen (R x P = SE). Beispielsweise werden für eine Ressource mit vier Replikaten und drei Partitionen 12 Sucheinheiten verwendet.
Tipp
Weitere Informationen zu den Tarifen und der Kapazitätsverwaltung finden Sie in der Dokumentation zur Azure KI-Suche.