Limity usług w usłudze Azure AI Search
Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od tego, czy tworzysz usługę Azure AI Search w warstwach cenowych Bezpłatna, Podstawowa, Standardowa czy Zoptymalizowana pod kątem magazynu.
Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.
Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę, ale udostępnia infrastrukturę sieciową innym dzierżawcom.
Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie zapewnia funkcji indeksatora, a pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.
Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Zoptymalizowane pod kątem magazynu są dostępne na dwóch poziomach: L1 i L2.
Limity subskrypcji
Można utworzyć wiele rozliczanych usług wyszukiwania (podstawowa i wyższa), maksymalnie maksymalną liczbę usług dozwolonych w każdej warstwie na region. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji i regionu. Następnie można utworzyć dodatkowe 16 podstawowych usług w innym regionie dla łącznie 32 usług Podstawowych w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.
Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.
Zasób | Bezpłatna 1 | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba usług na region | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maksymalna liczba jednostek wyszukiwania (SU)2 | Nie dotyczy | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB. Bezpłatna usługa wyszukiwania może zostać usunięta po dłuższym okresie braku aktywności, aby zwolnić miejsce na więcej usług.
2 Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replika lub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji jednostek jednostki organizacyjnej, zobacz Szacowanie pojemności usługi wyszukiwania i zarządzanie nią.
Limity usługi
W poniższej tabeli opisano umowy SLA, liczby partycji i liczby replik na poziomie usługi.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Umowa dotycząca poziomu usług (SLA) | Nie. | Tak | Tak | Tak | Tak | Tak | Tak | Tak |
Partycje | Nie dotyczy | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliki | Nie dotyczy | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Warstwa Podstawowa obsługuje trzy partycje i trzy repliki, w sumie dziewięć jednostek wyszukiwania (SU) w nowych usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. Starsze usługi podstawowe są ograniczone do jednej partycji i trzech replik.
Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.
Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług mających co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w umowie SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.
Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.
Partycjonowanie magazynu (GB)
Limity magazynu dla usługi różnią się w zależności od dwóch rzeczy: daty utworzenia usługi i regionu. Istnieją wyższe limity dla nowszych usług w większości obsługiwanych regionów.
W tej tabeli przedstawiono postęp zwiększenia limitu przydziału magazynu w GB w czasie. Partycje o większej pojemności zostały przeniesione do trybu online od kwietnia 2024 r. w regionach wymienionych w przypisach. Większa pojemność jest ograniczona do nowych usług wyszukiwania. Obecnie nie ma uaktualnienia w miejscu.
Data utworzenia usługi | Podstawowy | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Przed 3 kwietnia 2024 r. | 2 | 25 | 100 | 200 | 1,024 | 2048 |
3 kwietnia 2024 r. do 17 maja 2024 r. | 15 | 160 | 512 | 1,024 | 1,024 | 2048 |
Po 17 maja 2024 r. | 15 | 160 | 512 | 1,024 | 2,048 | 4,096 |
1 Magazyn o wyższej pojemności dla warstwy Podstawowa, S1, S2, S3 w tych regionach. Ameryki: Brazylia Południowa, Kanada Środkowa, Kanada Wschodnia, Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA. Europa: Francja Środkowa. Włochy Północne, Europa Północna, Norwegia Wschodnia, Polska Środkowa, Szwajcaria Północna, Szwecja Środkowa, Zjednoczone Królestwo Południowe, Zachodnie Zjednoczone Królestwo. Bliski Wschód: Północ ZEA. Afryka: Republika Południowej Afryki Północnej. Azja i Pacyfik: Australia Wschodnia, Australia Południowo-Wschodnia, Indie Środkowe, Jio Indie Zachodnie, Azja Wschodnia, Azja Południowo-Wschodnia, Japonia Wschodnia, Japonia Zachodnia, Korea Środkowa, Korea Południowa.
2 Magazyn o wyższej pojemności dla L1 i L2. Więcej regionów zapewnia większą pojemność w każdej warstwie rozliczanej. Europa: Niemcy Północne, Niemcy Zachodnio-Środkowe, Szwajcaria Zachodnia. Azure Government: Texas, Arizona, Virginia. Afryka: Republika Południowej Afryki Północnej. Azja i Pacyfik: Chiny Północne 3, Chiny Wschodnie 3.
Kilka regionów nadal działa w starszej infrastrukturze, z zastrzeżeniem limitów 3 kwietnia. Przed utworzeniem nowej usługi sprawdź obsługiwane regiony , aby upewnić się, że wybrany region zapewnia dodatkową pojemność.
Limity indeksów
Zasób | Bezpłatna | Podstawowa 1 | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba indeksów | 3 | 5 lub 15 | 50 | 200 | 200 | 1000 na partycję lub 3000 na usługę | 10 | 10 |
Maksymalna liczba prostych pól na indeks 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Maksymalne wymiary na pole wektora | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Maksymalna liczba złożonych kolekcji na indeks | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maksymalna głębokość pól złożonych | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maksymalna liczba sugestorów na indeks | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maksymalna liczba profilów oceniania na indeks | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maksymalna liczba funkcji na profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Maksymalny rozmiar indeksu 4 | Brak | NIE DOTYCZY | Brak | 1,88 TB | 2,34 TB | 100 GB | Brak | Brak |
1 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.
2 Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone pola podrzędne w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.
3 Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument hotelowy z złożoną kolekcją Rooms każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie. Ten limit został wprowadzony w api-version=2019-05-06
systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.
4 W większości warstw maksymalny rozmiar indeksu jest dostępny w usłudze wyszukiwania. W przypadku S2, S3 i S3 HD maksymalny rozmiar dowolnego indeksu to liczba podana w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.
W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.
Limity dokumentów
Maksymalna liczba dokumentów na indeks to:
- 24 miliardy w warstwie Podstawowa, S1, S2, S3
- 2 miliardy na S3 HD
- 288 miliardów na L1
- 576 miliardów na L2
Każde wystąpienie złożonej kolekcji jest liczone jako oddzielny dokument pod względem tych limitów.
Maksymalny rozmiar każdego dokumentu wynosi około 16 megabajtów. Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru ładunku żądania interfejsu API indeksowania, który wynosi 16 megabajtów. Ten ładunek może być pojedynczym dokumentem lub partią dokumentów. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.
Rozmiar dokumentu ma zastosowanie do indeksowania w trybie wypychania, które przekazuje dokumenty do usługi wyszukiwania. Jeśli używasz indeksatora do indeksowania w trybie ściągania, pliki źródłowe mogą mieć dowolny rozmiar pliku, z zastrzeżeniem limitów indeksatora. W przypadku indeksatora obiektów blob limity rozmiaru plików są większe dla wyższych warstw. Na przykład limit S1 wynosi 128 megabajtów, limit S2 wynosi 256 megabajtów itd.
Podczas szacowania rozmiaru dokumentu pamiętaj, aby indeksować tylko te pola, które dodają wartość do scenariuszy wyszukiwania, i wykluczyć wszystkie pola źródłowe, które nie mają celu w zapytaniach, które mają być uruchamiane.
Limity rozmiaru indeksu wektorowego
Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną dla wyszukiwania wektorowego dla warstwy usługi (lub SKU
). Aby uzyskać wskazówki dotyczące zarządzania i maksymalizacji magazynu wektorów, zobacz Rozmiar indeksu wektora i pozostawanie w granicach.
Limity wektorów różnią się w zależności od:
Wyższe limity wektorów od kwietnia 2024 r. istnieją w nowych usługach wyszukiwania w regionach zapewniających dodatkową pojemność, która jest w większości z nich.
W tej tabeli przedstawiono postęp zwiększenia limitu przydziału wektorów w GB w czasie. Limit przydziału jest na partycję, więc w przypadku skalowania nowej usługi w warstwie Standardowa (S1) do 6 partycji łączny limit przydziału wektorów jest pomnożony przez 6.
Data utworzenia usługi | Podstawowy | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Przed 1 lipca 2023 r. 1 | 0.5 | 1 | 6 | 12 | 12 | 36 |
1 lipca 2023 r. do 3 kwietnia 2024 r. | 1 | 3 | 12 | 36 | 12 | 36 |
3 kwietnia 2024 r. do 17 maja 2024 r. | 5 | 35 | 150 | 300 | 12 | 36 |
Po 17 maja 2024 r. 4 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Początkowe limity wektorów podczas wczesnej wersji zapoznawczej.
2 Limity wektorów w późniejszym okresie obowiązywania wersji zapoznawczej. Trzy regiony nie miały wyższych limitów: Niemcy Zachodnio-środkowe, Indie Zachodnie, Katar Środkowy.
3 Wyższe limity przydziału wektorów na podstawie większych partycji dla obsługiwanych warstw i regionów.
4 Wyższe limity przydziału wektorów dla większej liczby warstw i regionów na podstawie aktualizacji rozmiaru partycji.
Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest trudnym limitem, który gwarantuje, że usługa pozostaje w dobrej kondycji, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowoduje niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub skalowanie w górę w partycjach.
Ważne
Wyższe limity wektorów są powiązane z większymi rozmiarami partycji. Regiony działające na starszej infrastrukturze podlegają limitom z lipca do kwietnia. Przejrzyj listę regionów, aby uzyskać stan limitów magazynu partycji.
Limity indeksatora
Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Harmonogram śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może odebrać miejsce, w którym ostatnio zostało przerwane przy następnym zaplanowanym uruchomieniu.
Zasób | Bezpłatna 1 | Podstawowa 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba indeksatorów | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalna liczba źródeł danych | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalna liczba zestawów umiejętności 4 | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
Maksymalne obciążenie indeksowania na wywołanie | 10 000 dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Ograniczone tylko przez maksymalną liczbę dokumentów | Nie dotyczy | Brak ograniczeń | Brak ograniczeń |
Minimalny harmonogram | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min | 5 min |
Maksymalny czas działania 5 | 1-3 lub 3-10 minut | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | Nie dotyczy | 2 lub 24 godziny | 2 lub 24 godziny |
Indeksator obiektów blob: maksymalny rozmiar obiektu blob, MB | 16 | 16 | 128 | 256 | 256 | Nie dotyczy | 256 | 256 |
Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob 6 | 32,000 | 64,000 | 4 miliony | 8 mln | 16 milionów | Nie dotyczy | 4 miliony | 4 miliony |
1 Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, które wywołuje usługi Azure AI, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania (porada: możesz zresetować indeksator, aby zresetować jego liczbę).
2 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.
3 Usługi S3 HD nie obejmują obsługi indeksatora.
4 Maksymalnie 30 umiejętności na zestaw umiejętności.
5 Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Odnosi się do indeksatorów uruchamianych w środowisku publicznym, używanych do odciążania przetwarzania intensywnie korzystającego z obliczeń i pozostawiania większej ilości zasobów dla zapytań. Limit 24-godzinny ma zastosowanie w przypadku skonfigurowania indeksatora do działania w środowisku prywatnym przy użyciu tylko infrastruktury przydzielonej do usługi wyszukiwania. Należy pamiętać, że niektóre starsze indeksatory nie są w stanie działać w środowisku publicznym, a indeksatory zawsze mają 24-godzinny zakres przetwarzania. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, możesz założyć, że nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, w przypadku zadań indeksowania, które nie mogą zakończyć się w ciągu dwóch godzin, umieść indeksator w harmonogramie 5 minut, aby indeksator mógł szybko odebrać miejsce, w którym został przerwany. W warstwie Bezpłatna maksymalny czas wykonywania wynoszący 3–10 minut jest przeznaczony dla indeksatorów z zestawami umiejętności.
6 Maksymalna liczba znaków jest oparta na jednostkach kodu Unicode, w szczególności UTF-16.
Uwaga
Jak określono w limitach indeksów, indeksatory będą również wymuszać górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ogólnie dostępnej, która obsługuje typy złożone (2019-05-06
). Oznacza to, że jeśli indeksator został utworzony z wcześniejszą wersją interfejsu API, nie będzie podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06
interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.
Limity zasobów udostępnionego łącza prywatnego
Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Obsługa indeksatora prywatnego punktu końcowego | Nie. | Tak | Tak | Tak | Tak | Nie | Tak | Tak |
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawemumiejętności 1 | Nie | Nie. | Nie. | Tak | Tak | Nie | Tak | Tak |
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawem umiejętności i zintegrowaną wektoryzacją 2 | Nie. | Tak | Tak | Tak | Tak | Nie | Tak | Tak |
Maksymalna liczba prywatnych punktów końcowych | Nie dotyczy | 10 lub 30 | 100 | 400 | 400 | Nie dotyczy | 20 | 20 |
Maksymalna liczba unikatowych typówzasobów 3 | Nie dotyczy | 100 | 7 | 15 | 15 | Nie dotyczy | 4 | 4 |
1 Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania.
2 Usługi o wysokiej pojemności utworzone po 3 kwietnia 2024 r. w regionach wymienionych w obszarze Magazyn partycji i uruchomione zintegrowane obciążenia wektoryzacji w czasie indeksowania obsługują udostępnione linki prywatne w warstwach płatnych. System musi wykryć co najmniej umiejętności osadzania danych.
3 Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId
wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.
Limity synonimów
Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.
Zasób | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maksymalna liczba map synonimów | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maksymalna liczba reguł na mapę | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limity aliasów indeksu
Maksymalna liczba aliasów indeksu zależy od daty utworzenia warstwy i usługi. We wszystkich warstwach, jeśli usługa została utworzona po październiku 2022 r., maksymalna liczba aliasów jest dwukrotnie liczbą dozwolonych indeksów. Jeśli usługa została utworzona przed październikiem 2022 r., limit jest dozwoloną liczbą indeksów.
Data utworzenia usługi | Bezpłatna | Podstawowy | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Przed październikiem 2022 r. | 3 | 5 lub 15 1 | 50 | 200 | 200 | 1000 na partycję lub 3000 na usługę | 10 | 10 |
Po październiku 2022 r. | 6 | 30 | 100 | 400 | 400 | 2000 na partycję lub 6000 na usługę | 20 | 20 |
1 Usługi podstawowe utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) w indeksach
Limity danych (wzbogacanie sztucznej inteligencji)
Potok wzbogacania sztucznej inteligencji, który wykonuje wywołania zasobu języka AI platformy Azure na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych podlega limitom danych. Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Length
wartość . Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj umiejętności Dzielenie tekstu.
Limity ograniczania przepustowości
Żądania interfejsu API są ograniczane, ponieważ system zbliża się do szczytowej pojemności. Ograniczanie działa inaczej dla różnych interfejsów API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) i indeksowanie interfejsów API są dynamicznie ograniczane na podstawie obciążenia usługi. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.
Statyczne limity żądań szybkości dla operacji związanych z indeksem:
- Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
- Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
- Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
- Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
- Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania
Statyczne limity żądań szybkości dla operacji związanych z usługą:
- Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania
Limity ograniczania klasyfikacji semantycznej
Semantyczny ranger używa systemu kolejkowania do zarządzania współbieżnych żądań. Dzięki temu usługa sytem umożliwia usługom wyszukiwania uzyskanie największej liczby zapytań na sekundę. Po osiągnięciu limitu współbieżnych żądań dodatkowe żądania są umieszczane w kolejce. Jeśli kolejka jest pełna, kolejne żądania są odrzucane i muszą zostać ponowione.
Łączna liczba zapytań rangi semantycznej na sekundę różni się w zależności od następujących czynników:
- Jednostka SKU usługi wyszukiwania. Zarówno pojemność kolejki, jak i limity żądań współbieżnych różnią się w zależności od jednostki SKU.
- Liczba jednostek wyszukiwania w usłudze wyszukiwania. Najprostszym sposobem zwiększenia maksymalnej liczby współbieżnych zapytań rangą semantyczną jest dodanie dodatkowych jednostek wyszukiwania do usługi wyszukiwania.
- Łączna dostępna pojemność klasyfikatora semantycznego w regionie.
- Czas potrzebny na obsługę zapytania przy użyciu klasyfikatora semantycznego. Różni się to w zależności od tego, jak zajęta jest usługa wyszukiwania.
W poniższej tabeli opisano limity ograniczania klasyfikacji semantycznej według jednostki SKU. Z zastrzeżeniem dostępnej pojemności w regionie skontaktuj się z pomocą techniczną, aby poprosić o zwiększenie limitu.
Zasób | Podstawowy | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Maksymalna liczba współbieżnych żądań (na jednostkę wyszukiwania) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Maksymalny rozmiar kolejki żądań (na jednostkę wyszukiwania) | 100 | 6 | 8 | 8 | 8 | 8 | 8 |
Limity żądań interfejsu API
Z wyjątkiem przypadków, w których zaznaczono, następujące żądania interfejsu API dotyczą wszystkich programowalnych interfejsów, w tym zestawów SDK platformy Azure.
- Maksymalnie 16 MB na indeksowanie lub żądanie zapytania podczas wypychania ładunku do usługi wyszukiwania 1
- Maksymalna długość adresu URL 8 KB (dotyczy tylko interfejsów API REST)
- Maksymalnie 1000 dokumentów na partię przekazywania, scalania lub usuwania indeksu
- Maksymalnie 32 pola w klauzuli $orderby
- Maksymalnie 100 000 znaków w klauzuli wyszukiwania
- Maksymalna liczba klauzul (
search
w wyrażeniach oddzielonych znakami AND lub OR) wynosi 1024 - Maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu w formacie UTF-8
- Maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych
- Wyszukiwanie symboli wieloznacznych i wyszukiwanie wyrażeń regularnych jest ograniczone do maksymalnie 1000 stanów podczas przetwarzania przez lucene.
1 W usłudze Azure AI Search treść żądania podlega górnemu limitowi 16 MB, nakładając praktyczny limit zawartości poszczególnych pól lub kolekcji, które nie są w inny sposób ograniczone przez limity teoretyczne (zobacz Obsługiwane typy danych, aby uzyskać więcej informacji na temat kompozycji i ograniczeń pól).
Istnieją limity rozmiaru i kompozycji zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.
Limity odpowiedzi interfejsu API
- Maksymalnie 1000 dokumentów zwracanych na stronę wyników wyszukiwania
- Maksymalna liczba sugestii zwróconych na żądanie interfejsu API sugerowanego: 100
Limity kluczy interfejsu API
Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy analizatorów. Klucze administratora są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.
- Maksymalnie 2 klucze administracyjne na usługę
- Maksymalnie 50 kluczy zapytań na usługę