編輯

共用方式為


Azure 上的影像分類

Azure Blob 儲存體
Azure 電腦視覺
Azure Cosmos DB
Azure Event Grid
Azure Functions

解決方案構想

本文說明解決方案概念。 您的雲端架構設計人員可以使用本指南,協助可視化此架構的一般實作的主要元件。 使用本文作為起點,設計符合您工作負載特定需求的架構良好解決方案。

藉由使用電腦視覺 API 和 Azure Functions 等 Azure 服務,公司就不需要管理個別伺服器,同時降低成本,並利用Microsoft已透過 Azure AI 服務處理影像而開發的專業知識。 此解決方案概念特別解決了影像處理使用案例。 如果您有不同的 AI 需求,請考慮 Azure AI 服務的完整套件

建築

用於影像分類工作的架構圖表。

下載此解決方案構想的 Visio 檔案

數據流

此案例涵蓋 Web 或行動應用程式的後端元件。 數據流會流經案例,如下所示:

  1. 在 Blob 記憶體中新增檔案(影像上傳)會觸發 Azure 事件方格中的事件。 上傳程式可以透過 Web 或行動應用程式進行協調。 或者,您可以將映像個別上傳至 Azure Blob 記憶體。
  2. 事件方格會傳送觸發 Azure 函式的通知。
  3. Azure Functions 會呼叫 Azure AI 視覺 API 來分析新上傳的影像。 Azure AI 視覺會透過 Azure Functions 剖析的 Blob URL 來存取影像。
  4. Azure Functions 會在 Azure Cosmos DB 中保存 AI 視覺 API 回應。 此回應包含分析的結果,以及影像元數據。
  5. 結果可以取用並反映在 Web 或行動前端上。 請注意,此方法會擷取分類的結果,但不會擷取上傳的影像。

元件

  • Azure AI Vision 是 Azure AI 服務套件的一部分,可用來擷取每個映像的相關信息。
  • Azure Functions 提供 Web 應用程式的後端 API。 此平臺也提供上傳影像的事件處理。
  • Azure 事件方格 將新映射上傳至 Blob 記憶體時觸發事件。 接著會使用 Azure Functions 處理映像。
  • Azure Blob 記憶體 儲存上傳至 Web 應用程式的所有映像檔,以及 Web 應用程式取用的任何靜態檔案。
  • Azure Cosmos DB 會儲存所上傳每個影像的相關元數據,包括電腦視覺 API 處理的結果。

選擇

  • Azure OpenAI GPT-4o 和 GPT-4o-mini。 GPT-4o 和 GPT-4o-mini 是 OpenAI 的多模式聊天模型,可回答有關您所提供影像中存在的一般問題。
  • 自訂視覺服務。 計算機視覺 API 會 傳回一組以分類法為基礎的分類類別。 如果您需要處理電腦視覺 API 未傳回的資訊,請考慮自定義視覺服務,這可讓您建置自定義影像分類器。 若要瞭解此服務,請遵循使用自定義視覺 建置影像分類模型的快速入門
  • Azure AI 搜尋。 如果您的使用案例牽涉到查詢元數據以尋找符合特定準則的影像,請考慮使用 Azure AI 搜尋。 Azure AI 搜尋 順暢地整合此工作流程。
  • Logic Apps。 如果您不需要在將檔案即時新增至 Blob 時做出反應,您可能會考慮使用 Logic Apps。 邏輯應用程式,可檢查檔案是否已由 週期觸發程式或滑動視窗觸發程式啟動,啟動。
  • 如果您有內嵌在檔中的影像,請使用 Azure AI 檔智慧 來找出這些影像。 透過該資訊,您可以在內嵌影像上擷取並執行進一步的電腦視覺工作。 使用文件智慧收集這些內嵌影像的相關數據,例如可以儲存的頁碼或標題文字,以及透過電腦視覺 API 接收之影像的其他元數據。 如果您的影像主要是相片或文件掃描,請使用 Document Intelligence 自定義分類模型 一次執行輸入檔案的分類,以識別其中的檔。 這種方法也可以識別輸入檔案內單一檔多個檔或多個實例。

案例詳細數據

此案例與需要處理映像的企業相關。

潛在的應用程式包括分類時尚網站的影像、分析保險索賠的文字和影像,或從遊戲螢幕快照瞭解遙測數據。 傳統上,公司必須開發機器學習模型的專業知識、定型模型,最後透過其自定義程序執行映像,以將數據從影像中取出。

潛在的使用案例

此解決方案適用於零售、遊戲、金融和保險產業。 其他相關的使用案例包括:

  • 分類時尚網站上的影像。 銷售人員可在平臺上上傳產品圖片以供銷售時使用影像分類。 然後,他們可以自動化相關的後續手動標記。 客戶也可以搜尋產品的視覺印象。

  • 從遊戲螢幕快照分類遙測數據。 螢幕快照中的視頻遊戲分類正在演變成社交媒體中的相關問題,再加上計算機視覺。 例如,當 Twitch 串流機連續播放不同的遊戲時,他們可能會略過手動更新其串流資訊。 無法更新串流資訊可能會導致使用者搜尋中的串流分類錯誤,並可能導致內容建立者和串流平臺的潛在查看器遺失。 在引進新遊戲時,自定義模型路線有助於引進從這些遊戲偵測新影像的功能。

  • 分類保險理賠的影像。 影像分類有助於縮短索賠處理和承銷的時間和成本。 它可以説明分析自然災害損壞、車輛損壞,以及識別住宅和商業財產。

後續步驟

產品檔

如需引導式學習路徑,請參閱: