Sdílet prostřednictvím


Vkládání v .NET

Vkládání je způsob, jakým LLMs zachycují sémantický význam. Jedná se o číselnou reprezentaci nečíselných dat, která může LLM použít k určení vztahů mezi koncepty. Vkládání můžete použít k tomu, aby model umělé inteligence rozuměl významu vstupů, aby mohl provádět porovnání a transformace, například sumarizaci textu nebo vytváření obrázků z popisů textu. LLMs mohou okamžitě používat embeddingy a můžete je ukládat do vektorových databází, aby poskytovaly sémantickou paměť pro LLMs podle potřeby.

Případy použití pro vkládání

Tato část uvádí hlavní případy použití pro vkládání.

Použijte vlastní data ke zlepšení relevance dokončování

Využijte své vlastní databáze k vygenerování embeddingů pro svá data a integrujte je s LLM, aby byly dostupné pro automatické doplňování. Toto použití vkládání je důležitou součástí načítání rozšířené generace.

Zvětšení množství textu, který můžete umístit do výzvy

Vkládáním můžete zvýšit množství kontextu, který se dá přizpůsobit výzvě, aniž byste zvýšili požadovaný počet tokenů.

Předpokládejme například, že chcete do výzvy zahrnout 500 stránek textu. Počet tokenů pro tolik nezpracovaného textu překročí limit vstupních tokenů, což znemožňuje jeho přímé vložení do výzvy. Vkládání můžete použít k shrnutí a rozdělení velkých objemů tohoto textu na části, které jsou dostatečně malé, aby se vešly do jednoho vstupu, a pak posoudit podobnost jednotlivých částí s celým nezpracovaným textem. Pak můžete zvolit kus, který nejlépe zachová sémantický význam nezpracovaného textu a použije ho ve výzvě bez dosažení limitu tokenu.

Provádění klasifikace textu, shrnutí nebo překladu

Vkládání vám pomůže modelu porozumět významu a kontextu textu a pak tento text klasifikovat, shrnout nebo přeložit. Vkládání můžete například použít k tomu, aby modely klasifikovaly texty jako kladné nebo záporné, spamové nebo ne spamy nebo zprávy nebo názory.

Generování a přepis zvuku

Pomocí vkládání zvuku můžete zpracovávat zvukové soubory nebo vstupy ve vaší aplikaci.

Například Azure AI Speech podporuje řadu audio embedování, včetně převodu řeči na text a převodu textu na řeč. Zvuk můžete zpracovávat v reálném čase nebo v dávkách.

Převod textu na obrázky nebo obrázky na text

Sémantické zpracování obrázků vyžaduje vkládání obrázků, které většina LLM nemůže vygenerovat. Pomocí modelu vkládání obrázků, jako je ViT, můžete vytvářet vektorové vkládání obrázků. Tyto vložené objekty s modelem generování obrázků pak můžete použít k vytvoření nebo úpravě obrázků pomocí textu nebo naopak. Můžete například použít DALL· Model E pro generování obrázků, jako jsou loga, tváře, zvířata a krajiny.

Generovat nebo dokumentovat kód

Pomocí vložených výrazů můžete modelu pomoct vytvořit kód z textu nebo naopak tím, že převedete jiný kód nebo textové výrazy na společnou reprezentaci. Například můžete použít embeddingy k tomu, abyste pomohli modelu generovat nebo dokumentovat kód v jazyce C# nebo Python.

Volba modelu vkládání

Vkládání pro nezpracovaná data vygenerujete pomocí modelu vkládání AI, který dokáže kódovat nečíselná data do vektoru (dlouhé pole čísel). Model může také dekódovat vložení do nečíselných dat, která mají stejný nebo podobný význam jako původní nezpracovaná data. Existuje mnoho modelů vkládání, které můžete použít, s modelem OpenAI text-embedding-ada-002, který je jedním z běžných modelů, které se používají. Další příklady najdete v seznamu embeddingových modelů , které jsou k dispozici na Azure OpenAI.

Ukládání a zpracování embeddingů ve vektorové databázi

Po vygenerování embeddingů budete potřebovat způsob, jak je uložit, abyste je později mohli načíst pomocí volání LLM. Vektorové databáze jsou navržené tak, aby ukládaly a zpracovávaly vektory, takže jsou přirozeným domovem pro vkládání. Různé vektorové databáze nabízejí různé možnosti zpracování, takže byste měli zvolit jednu z nezpracovaných dat a vašich cílů. Informace o možnostech najdete v tématu dostupná řešení vektorové databáze.

Použití vkládání do řešení LLM

Při vytváření aplikací založených na LLM můžete použít sémantické jádro k integraci vložených modelů a vektorových úložišť, takže můžete rychle načíst textová data a vkládat a ukládat vložené položky. To vám umožní použít řešení vektorové databáze k ukládání a načítání sémantických pamětí.