使用哪个模型
选择要使用的 LLM 时,需要考虑许多因素,包括成本、可用性、性能和功能。 通常,我们建议参考以下指南:
gpt-35-turbo:此模型经济适用,性能良好,尽管有着 ChatGPT 的名字,但它可用于聊天和对话以外的各种任务。
gpt-35-turbo-16k、 gpt-4 或 gpt-4-32k:如果需要生成超过 4,096 个标记或需要支持更大的提示,则这些模型是一个不错的选择。 但是,这些模型更昂贵,可能更慢,并且可用性可能受限。
嵌入模型:如果你的任务包含搜索、聚类分析、建议和异常情况检测,则应使用嵌入模型。 计算机可以轻松利用构成嵌入的数字矢量。 嵌入是文本片段的语义的信息密集型表示形式。 矢量空间中的两个嵌入之间的距离与语义相似性相关。 例如,如果两个文本相似,则它们的矢量表示形式也相似。
DALL-E:此模型根据文本提示生成图像。 DALL-E 不同于其他语言模型,因为它的输出是图像,而不是文本。
Whisper:此模型是在一个大型英语音频和文本数据集上训练的。 Whisper 针对语音转文本功能(如听录音频文件)进行了优化。 它可用于听录包含英语以外的语言的话语的音频文件,但该模型的输出是英语文本。 使用 Whisper 可快速逐个听录音频文件,将其他语言的音频翻译为英语,或向模型提供你的提示来引导输出。