사용할 모델
사용할 LLM을 선택할 때 고려해야 할 비용, 가용성, 성능 및 기능을 포함한 많은 요소가 있습니다. 일반적으로 다음 가이드를 권장합니다.
gpt-35-turbo: 이 모델은 경제적이고 성능이 좋으며 ChatGPT라는 이름에도 불구하고 채팅 및 대화를 넘어 광범위한 작업에 사용할 수 있습니다.
gpt-35-turbo-16k, gpt-4 또는 gpt-4-32k: 이러한 모델은 4,096개 이상의 토큰을 생성해야 하거나 더 큰 프롬프트를 지원해야 하는 경우 좋은 선택입니다. 그러나 이러한 모델은 가격이 더 비싸고 속도가 느릴 수 있으며 가용성이 제한될 수 있습니다.
모델 포함: 작업에 검색, 클러스터링, 권장 사항, 이상 탐지가 포함된 경우 포함 모델을 사용해야 합니다. 컴퓨터는 포함을 형성하는 숫자 벡터를 쉽게 활용할 수 있습니다. 포함은 텍스트의 의미 체계 의미를 정보 밀도로 표현한 것입니다. 벡터 공간에서 두 포함 사이의 거리는 의미 체계 유사성과 상관관계가 있습니다. 예를 들어, 두 텍스트가 유사하면 해당 텍스트의 벡터 표현도 유사합니다.
DALL-E: 이 모델은 텍스트 프롬프트에서 이미지를 생성합니다. DALL-E는 출력이 텍스트가 아닌 이미지라는 점에서 다른 언어 모델과 다릅니다.
Whisper: 이 모델은 영어 오디오 및 텍스트로 구성된 대규모 데이터 세트에 대해 학습되었습니다. Whisper는 오디오 파일 변환과 같은 음성 텍스트 변환 기능에 최적화되어 있습니다. 영어 이외의 언어로 된 음성이 포함된 오디오 파일을 텍스트로 변환하는 데 사용할 수 있지만 모델의 출력은 영어 텍스트입니다. Whisper를 사용하면 오디오 파일을 한 번에 하나씩 빠르게 텍스트로 변환하거나, 다른 언어의 오디오를 영어로 번역하거나, 모델에 프롬프트를 제공하여 출력을 안내할 수 있습니다.