Co to jest klasyfikacja semantyczna?
Klasyfikacja semantyczna to funkcja usługi Azure AI Search, która ma na celu poprawę klasyfikacji wyników wyszukiwania. Klasyfikacja semantyczna poprawia klasyfikację wyników wyszukiwania przy użyciu interpretacji języka w celu dokładniejszego dopasowania kontekstu oryginalnego zapytania.
Funkcja klasyfikacji BM25
Usługa Azure AI Search domyślnie używa funkcji klasyfikacji BM25. Funkcja klasyfikacji BM25 klasyfikuje wyniki wyszukiwania na podstawie częstotliwości wyświetlania terminu wyszukiwania w dokumencie. Funkcja klasyfikacji BM25 często osiąga doskonałe wyniki klasyfikacji, ponieważ dokument, który często zawiera termin wyszukiwania, jest często najbardziej istotny, jednak nie zawsze jest to przypadek. Klasyfikacja BM25 nie ma znaczenia dla semantyki zapytania i klasyfikacji może być czasami ulepszona przez dodanie interpretacji języka.
Ranking semantyczny
Klasyfikacja semantyczna ma dwie funkcje; Poprawia ona klasyfikację wyników zapytania na podstawie zrozumienia języka i poprawia odpowiedź na zapytanie, podając podpis i odpowiedzi w wynikach.
Klasyfikacja semantyczna używa klasyfikacji BM25 i oblicza nowy wynik istotności przy użyciu oryginalnego rankingu BM25 w połączeniu z modelami interpretacji języka w celu wyodrębnienia kontekstu i znaczenia zapytania.
Semantyczne podpis i odpowiedzi
Semantyczne podpis i odpowiedzi zawierają dodatkowe wyniki obok sklasyfikowanych wyników wyszukiwania, które można wyświetlić, aby poprawić zrozumienie wyników dla użytkowników.
Semantyczne podpis wyodrębnia zdania podsumowania z dokumentu dosłownie i wyróżnia najbardziej odpowiedni tekst w zdaniach podsumowania.
Semantyczne odpowiedzi to opcjonalna dodatkowa funkcja semantycznego klasyfikowania, która zapewnia odpowiedzi na pytania. Jeśli zapytanie wyszukiwania wydaje się być pytaniem, a wyniki wyszukiwania zawierają tekst, który wydaje się być odpowiednią odpowiedzią, zwracana jest semantyczna odpowiedź.
Jak działa klasyfikacja semantyczna
Ranking semantyczny przyjmuje 50 najlepszych wyników z wyników klasyfikacji BM25. Wyniki są podzielone na wiele pól zdefiniowanych przez konfigurację semantyczną. Pola są konwertowane na ciągi tekstowe i przycinane do 256 unikatowych tokenów. Token jest w przybliżeniu odpowiednikiem słowa w dokumencie.
Po przygotowaniu ciągów są one przekazywane do modeli zrozumienia do odczytu maszynowego w celu znalezienia fraz i zdań, które najlepiej pasują do zapytania. Wyniki tej frazy podsumowania to semantyczna podpis i, opcjonalnie, semantyczna odpowiedź.
Semantyczne podpis są teraz klasyfikowane na podstawie semantycznego znaczenia podpis. Wyniki są następnie zwracane w kolejności malejącej istotności.
Możliwości klasyfikacji semantycznej
Zapoznaj się z poniższym filmem wideo, aby zapoznać się z omówieniem możliwości wyszukiwania sztucznej inteligencji:
Zalety klasyfikacji semantycznej
Klasyfikacja semantyczna ma dwie kluczowe zalety w porównaniu z tradycyjnymi wynikami wyszukiwania:
- Klasyfikacja semantyczna może bardziej odpowiadać semantyce oryginalnego zapytania. Może to sprawić, że będzie bardziej prawdopodobne, aby najbardziej przydatne dokumenty były wyświetlane w górnej części wyników wyszukiwania.
- Klasyfikacja semantyczna może znaleźć ciągi w wynikach, które mają być renderowane jako podpis na stronie wyników wyszukiwania i w celu udzielenia odpowiedzi na pytanie.
Ograniczenia klasyfikacji semantycznej
Klasyfikacja semantyczna jest stosowana do wyników zwracanych z funkcji klasyfikacji BM25. Mimo że klasyfikacja semantyczna może ponownie sklasyfikować wyniki udostępniane przez funkcję klasyfikacji BM25, nie będzie dostarczać żadnych dodatkowych dokumentów, które nie zostały zwrócone przez funkcję klasyfikacji BM25.
Ranking semantyczny używa 50 najlepszych wyników z funkcji klasyfikacji BM25. Jeśli zostanie zwróconych więcej niż 50 wyników, zostaną uwzględnione tylko 50 pierwszych wyników.
Cennik klasyfikacji semantycznej
Do 1000 semantycznych zapytań rankingowych miesięcznie jest dostępnych bezpłatnie.
W przypadku ponad 1000 zapytań miesięcznie należy wybrać standardowe ceny. Koszt cen standardowych zależy od liczby wyszukiwań, typu wyszukiwań i regionu wyszukiwania.
Aby uzyskać więcej informacji na temat cennika klasyfikacji semantycznej, zobacz Cennik usługi Azure AI Search