Какую модель следует использовать
Существует множество факторов, в том числе затрат, доступности, производительности и возможностей, которые следует учитывать при выборе используемого LLM. Как правило, рекомендуется использовать следующие руководства.
gpt-35-turbo: эта модель экономична, хорошо работает, и, несмотря на имя ChatGPT, можно использовать для широкого спектра задач за пределами чата и беседы.
gpt-35-turbo-16k, gpt-4 или gpt-4-32k: эти модели являются хорошим выбором, если вам нужно создать более 4096 токенов или поддерживать более крупные запросы. Однако эти модели являются более дорогими, могут быть медленнее и могут иметь ограниченную доступность.
Внедрение моделей. Если задачи включают поиск, кластеризацию, рекомендации и обнаружение аномалий, следует использовать модель внедрения. Компьютеры могут легко использовать вектор чисел, которые образуют внедрение. Внедрение — это информационно-плотное представление семантического значения фрагмента текста. Расстояние между двумя внедрениями в векторное пространство сопоставляется с семантической сходностью. Например, если два текста похожи, то их векторные представления также похожи.
DALL-E: эта модель создает изображения из текстовых запросов. DALL-E отличается от других языковых моделей, так как его выходные данные являются изображением, а не текстом.
Whisper: эта модель обучена на большом наборе данных английского звука и текста. Whisper оптимизирован для возможностей преобразования речи в текст, таких как транскрибирование звуковых файлов. Его можно использовать для транскрибирования аудиофайлов, содержащих речь на языках, отличных от английского, но выходные данные модели — английский текст. Используйте Whisper для быстрой транскрибирования аудиофайлов по одному за раз, перевода звука с других языков на английский или предоставления запроса модели для руководства выходными данными.