Dodawanie własnego źródła danych

Ukończone

Dodawanie danych odbywa się za pośrednictwem programu Azure AI Studio, na placu zabaw czatu lub przez określenie źródła danych w wywołaniu interfejsu API. Dodane źródło danych jest następnie używane do rozszerzania monitu wysyłanego do modelu. Podczas konfigurowania danych w studio możesz przekazać pliki danych, użyć danych na koncie usługi Blob Storage lub nawiązać połączenie z istniejącym indeksem wyszukiwania sztucznej inteligencji.

Jeśli przekazujesz lub używasz plików już na koncie magazynu, usługa Azure OpenAI na danych obsługuje .mdpliki , , .txt, .html.pdf, i Microsoft Word lub PowerPoint. Jeśli którykolwiek z tych plików zawiera grafikę lub obrazy, jakość odpowiedzi zależy od tego, jak dobrze można wyodrębnić tekst z zawartości wizualizacji.

Podczas przekazywania danych lub nawiązywania połączenia z plikami na koncie magazynu zaleca się użycie programu Azure AI Studio do utworzenia zasobu wyszukiwania i indeksu. Dodanie danych w ten sposób umożliwia wykonanie odpowiedniego fragmentu podczas wstawiania do indeksu, co daje lepsze odpowiedzi. Jeśli używasz dużych plików tekstowych lub formularzy, użyj dostępnego skryptu przygotowywania danych, aby poprawić dokładność modelu sztucznej inteligencji.

Włączenie semantycznego wyszukiwania usługa wyszukiwania sztucznej inteligencji może poprawić wynik przeszukiwania indeksu danych i prawdopodobnie otrzymasz odpowiedzi i cytaty o wyższej jakości. Jednak włączenie wyszukiwania semantycznego może zwiększyć koszt usługi wyszukiwania.

Możesz również użyć kreatora w zasobie wyszukiwania sztucznej inteligencji, aby odpowiednio wektoryzować dane, które omówisz w ćwiczeniu tego modułu. Wykonanie kilku dodatkowych kroków w porównaniu z tym w programie AI Studio jest jednak dobrym przykładem użycia wzorca RAG z istniejącym zestawem danych.

Połącz swoje dane

Aby połączyć dane, przejdź do placu zabaw czatu w usłudze Azure AI Studio i wybierz kartę Dodaj dane. Wybierz przycisk Dodaj źródło danych, aby uzyskać połączenie z danymi. Monity zawierają instrukcje konfigurowania połączenia z poszczególnymi źródłami danych i pobierania tych danych do indeksu wyszukiwania.

Napiwek

Jeśli używasz kreatora w programie AI Studio do tworzenia i łączenia źródła danych, musisz utworzyć centrum i projekt, który nie został omówiony w tym miejscu. Program AI Studio przeprowadzi Cię przez ten proces lub zapoznaje się z dokumentacją programu AI Studio.

Jeśli używasz własnego indeksu, który nie został utworzony za pośrednictwem usługi Azure AI Studio, jedna ze stron umożliwia określenie mapowania kolumn. Ważne jest, aby zapewnić dokładne pola, aby umożliwić modelowi zapewnienie lepszej odpowiedzi, zwłaszcza w przypadku danych zawartości.

Zrzut ekranu przedstawiający mapowanie pól indeksu usługi Azure AI Studio.