Sdílet prostřednictvím


Co jsou tokeny?

Tokeny jsou malé bloky textu vygenerované rozdělením vstupního textu na menší segmenty. Tyto segmenty můžou být slova nebo skupiny znaků, které se liší délkou od jednoho znaku po celé slovo. Například slovo hamburger by se rozdělilo na tokeny, jako je šunka, bur a ger, zatímco krátké a společné slovo jako hrušeň by se považovalo za jediný token. Velké jazykové modely (LLM), jako jsou GPT-3.5 nebo GPT-4, rozdělují slova na tokeny pro zpracování.