Který model použít
Existuje mnoho faktorů, včetně nákladů, dostupnosti, výkonu a možností, které je potřeba vzít v úvahu při výběru toho, který LLM se má použít. Obecně doporučujeme následující příručky:
gpt-35-turbo: Tento model je ekonomický, funguje dobře a i přes název ChatGPT lze použít pro celou řadu úkolů mimo chat a konverzaci.
gpt-35-turbo-16k, gpt-4 nebo gpt-4-32k: Tyto modely jsou dobrou volbou, pokud potřebujete vygenerovat více než 4 096 tokenů nebo potřebujete podporovat větší výzvy. Tyto modely jsou ale dražší, můžou být pomalejší a můžou mít omezenou dostupnost.
Modely vkládání: Pokud vaše úlohy zahrnují vyhledávání, clustering, doporučení a detekci anomálií, měli byste použít model vkládání. Počítače mohou snadno využívat vektor čísel, které tvoří vkládání. Vkládání je informativní hustá reprezentace sémantického významu části textu. Vzdálenost mezi dvěma vkládáními ve vektorovém prostoru je korelována s sémantickou podobností. Pokud jsou například dva texty podobné, jejich vektorové reprezentace jsou také podobné.
DALL-E: Tento model generuje obrázky z textových výzev. DALL-E se liší od jiných jazykových modelů, protože jeho výstupem je obrázek, nikoli text.
Šeptej: Tento model je trénovaný na velké datové sadě anglického zvuku a textu. Funkce Šeptání je optimalizovaná pro funkce převodu řeči na text, jako je přepis zvukových souborů. Dá se použít k přepisu zvukových souborů, které obsahují řeč v jiných jazycích než v angličtině, ale výstupem modelu je anglický text. Pomocí funkce Šeptejte rychle přepisovat zvukové soubory po jednom, přeložit zvuk z jiných jazyků do angličtiny nebo poskytnout výzvu k provedení výstupu modelu.