影像提示工程技術
若要發揮具有視覺功能之 GPT-4 Turbo 的完整潛力,請務必根據您的特定需求量身打造提示。 下列是增強提示精確度和效率的部分指導方針。
建立影像提示的基本概念
內容特定性:為手頭上的案例新增內容,讓模型更加了解適當的輸出應具有何種內容。 這種特定程度有助於專注於相關內容,並避免多餘的細節。
任務導向提示:將焦點放在特定任務上,可協助模型在開發輸出的同時,將該觀點納入考量。
處理拒絕情形:當模型指出無法執行工作時,改善提示可能是有效的解決方法。 更具體的提示可引導模型更清楚了解內容,並更妥善地執行工作。 請記得下列部分提示:
- 要求所產生回應的說明,以增強模型輸出的透明度
- 如果使用單一影像提示,請將影像放在文字之前
- 要求模型先在詳細描述影像,然後藉由該描述完成您的特定工作
- 要求所產生回應的說明,以增強模型輸出的透明度
新增範例:新增可代表要尋找之回應類型的範例
細分要求:嘗試逐步細分複雜的要求,建立可管理的子目標
定義輸出格式:清楚提及輸出所需的格式,例如 Markdown、JSON、HTML 等。您也可以建議回應的特定結構、長度或特定屬性。
範例提示輸入和輸出
有許多方法可以建立系統提示,根據您的需求專門量身打造輸出。 下列範例輸入和輸出會示範調整提示如何提供不同的結果。 請使用這些影像自行試用模型,並在 Azure AI Studio 遊樂場中調整系統提示。
內容特定性
內容可協助改善來自模型的回應。 例如,如果您正在處理產品目錄的影像描述,請確定提示會以清楚且簡潔的方式反映這一點。 與「描述用於戶外健行產品目錄的影像,專注描寫熱情和專業精神」類似的提示,可引導模型產生準確且與內容相關的回應。
基本提示 | 模型輸出 |
---|---|
此影像展現了哪些內容? | 該圖顯示森林區域中的露營裝備。 圖中有一頂黃色帳篷,兩把摺疊的露營椅 (一張紅色,一張藍色),以及一張便攜式露營桌。 周邊區域樹木茂密,表明營地位於林區。 |
工作導向提示
為模型提供要遵循的特定工作,是改善回應的方式之一。 在此範例中,這項提示會引導模型專注於對保險評估至關重要的元素,進而改善精確度和相關性。
基本提示 | 模型輸出 |
---|---|
此影像展現了哪些內容? | 下圖顯示一輛發生事故的銀色轎車。 汽車的前端受損,引擎蓋凸起,保險桿部分分離。 這輛汽車正倚靠著人行道上的一根電線桿,發動機區域出現可見的煙霧,表明剛剛出現車禍。 場景似乎是一條住宅街道,就如背景中存在的房屋、整齊修剪的樹籬和人行道所示。 |
處理拒絕情形
當您收到模型的拒絕輸出時,有數種方式可以調整輸入以產生更適當的回應。 下列是如何處理拒絕情形並取得進展的範例。
基本提示 | 模型輸出 |
---|---|
規劃這頓餐點 | 很抱歉,我無法提供該資訊。 |
後續提示 | 模型輸出 |
---|---|
您需要哪些資訊? | 我為先前造成的困擾道歉。 若要根據提供的影像來規劃餐點,我需要知道下列事項: 用餐人數,用以確保每個人都有足夠食物。 需要考量的任何飲食限制或偏好 (例如素食者、無麩質飲食、過敏症)。 計劃用餐的場合或類型 (例如休閒午餐、晚宴)。 在食物類別和營養方面所需的膳食平衡。 有了這些資訊,我可以協助建議如何分菜、創造平衡的膳食,並確保膳食符合所有食客的需求。 |
新增範例
更新的提示 | 模型輸出 |
---|---|
問:這隻狗屬於什麼品種,平均體重和身高為何?
答:品種:博美犬;平均體重:3-7 磅;平均身高:8-14 英吋 答:品種: 英國鬥牛犬;平均體重:50-55 磅;平均身高:14-16 英吋 |
答:品種:邊境牧羊犬;平均體重:30-45 磅;平均身高:18-22 英吋 |
細分要求
基本提示 | 模型輸出 |
---|---|
此影像中有什麼? | 圖像包含一張標題為「奶奶的酥脆蘋果派」的食譜卡片。 食譜被註解為感恩節傳統。 列出的食材如下:
請注意,影像中未完整展示糖、麵粉和奶油的份量。 下列為參考資訊,標準分量的餅皮配料,通常涉及將糖、麵粉和奶油混合在一起,直到酥脆為止 |
定義輸出格式
基本提示 | 模型輸出 |
---|---|
描述此影像 | 下圖顯示一座豪華的白色別墅,部分建築物上有傳統的茅草屋頂,前景有一個清澈的藍色游泳池。 游泳池邊排著太陽椅,令人感到十分放鬆。 該建築物包括優雅的拱門、帶木欄杆的陽台,寬大的窗戶和門也顯示出室內既明亮又通風。 別墅周圍是茂密的熱帶植被 (包括高大的棕櫚樹),為整個環境增加了寧靜感和異國情調。 |
這些指導方針和範例,示範了量身打造的系統提示如何大幅提升具有視覺功能的 GPT-4 Turbo 效能,確保回應不僅準確,而且非常適合手頭工作中的特定內容。