Omówienie pobierania rozszerzonej generacji (RAG) za pomocą usługi Azure OpenAI Service
Rozwiązanie RAG z usługą Azure OpenAI umożliwia deweloperom korzystanie z obsługiwanych modeli czatów sztucznej inteligencji, które mogą odwoływać się do określonych źródeł informacji w celu uziemienia odpowiedzi. Dodanie tych informacji pozwala modelowi odwoływać się zarówno do podanych danych, jak i jego wstępnie wytrenowanej wiedzy w celu zapewnienia bardziej skutecznych odpowiedzi.
Usługa Azure OpenAI umożliwia narzędziu RAG łączenie wstępnie wytrenowanych modeli z własnymi źródłami danych. Usługa Azure OpenAI na danych wykorzystuje możliwość wyszukiwania usługi Azure AI Search w celu dodania odpowiednich fragmentów danych do monitu. Gdy dane są w indeksie usługi AI Search, usługa Azure OpenAI na danych wykonuje następujące kroki:
- Otrzymuj monit użytkownika.
- Określ odpowiednią zawartość i intencję monitu.
- Wykonaj zapytanie względem indeksu wyszukiwania przy użyciu tej zawartości i intencji.
- Wstaw fragment wyniku wyszukiwania do wiersza polecenia usługi Azure OpenAI wraz z komunikatem systemowym i monitem użytkownika.
- Wyślij cały monit do usługi Azure OpenAI.
- Zwróć odpowiedź i odwołanie do danych (jeśli istnieją) użytkownikowi.
Domyślnie usługa Azure OpenAI na danych zachęca, ale nie wymaga, aby model reagował tylko przy użyciu danych. To ustawienie może być niezaznaczone podczas łączenia danych, co może spowodować, że model zdecyduje się na użycie wstępnie wytrenowanej wiedzy na temat danych.
Dostrajanie w porównaniu z RAG
Dostrajanie jest techniką używaną do tworzenia modelu niestandardowego przez trenowanie istniejącego podstawowego modelu, takiego jak gpt-35-turbo
zestaw danych dodatkowych danych szkoleniowych. Dostrajanie może spowodować żądania o wyższej jakości niż tylko monitowanie inżynieryjne, dostosowanie modelu na przykładach większych niż w wierszu polecenia i umożliwienie użytkownikowi dostarczenia mniejszej liczby przykładów w celu uzyskania tej samej wysokiej jakości odpowiedzi. Jednak proces dostosowywania jest kosztowny i czasochłonny i powinien być używany tylko w przypadkach użycia, gdy jest to konieczne.
Narzędzie RAG z usługą Azure OpenAI na danych nadal używa bezstanowego interfejsu API do nawiązywania połączenia z modelem, co eliminuje wymaganie trenowania modelu niestandardowego z danymi i upraszcza interakcję z modelem sztucznej inteligencji. Usługa AI Search najpierw znajduje przydatne informacje umożliwiające udzielenie odpowiedzi na monit, dodaje je do monitu jako dane uziemione, a usługa Azure OpenAI tworzy odpowiedź na podstawie tych informacji.