共用方式為


建立已部署 機器學習 Studio (傳統) Web 服務的端點

適用於:適用。機器學習 Studio(傳統版)不適用。Azure 機器學習

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

部署 Web 服務之後,就會為該服務建立預設端點。 您可以使用其 API 金鑰來呼叫預設端點。 您可以從 Web 服務入口網站使用自己的金鑰來新增更多端點。 Web 服務中的每個端點都會獨立尋址、節流及管理。 每個端點都是一個唯一的 URL,其中包含您可以散發給客戶的授權密鑰。

將端點新增至 Web 服務

您可以使用 機器學習 Web 服務入口網站,將端點新增至 Web 服務。 建立端點之後,您可以透過同步 API、批次 API 和 Excel 工作表加以取用。

注意

如果您已將其他端點新增至 Web 服務,則無法刪除預設端點。

  1. 在 機器學習 Studio(傳統版)的左側導覽數據行上,按兩下 [Web 服務]。
  2. 在 Web 服務儀錶板底部,按兩下 [ 管理端點]。 機器學習 Web 服務入口網站會開啟至 Web 服務的端點頁面。
  3. 按一下新增
  4. 輸入新端點的名稱和描述。 端點名稱長度必須是 24 個字元或更少,而且必須由小寫字母或數字組成。 選取記錄層級,以及是否啟用範例數據。 如需記錄的詳細資訊,請參閱啟用 機器學習 Web 服務的記錄。

藉由新增其他端點來調整 Web 服務

根據預設,每個已發佈的 Web 服務都會設定為支援 20 個並行要求,而且可能高達 200 個並行要求。 機器學習 Studio (傳統版) 會自動優化設定,為您的 Web 服務提供最佳效能,並忽略入口網站值。

如果您打算呼叫負載高於最大並行呼叫值 200 的 API,您應該在同一個 Web 服務上建立多個端點。 然後,您可以隨機將負載分散到所有負載。

Web 服務的調整是常見的工作。 調整的一些原因是支持超過 200 個並行要求、透過多個端點增加可用性,或為 Web 服務提供個別的端點。 您可以透過 機器學習 Web 服務入口網站新增相同 Web 服務的其他端點來增加規模。

請記住,如果您未以相對較高的速率呼叫 API,則使用高並行計數可能會有害。 如果您在為高負載設定的 API 上放置相對較低的負載,您可能會看到延遲的零星逾時和/或尖峰。

同步 API 通常用於需要低延遲的情況。 這裏的延遲表示 API 完成一個要求所需的時間,而且不會考慮任何網路延遲。 假設您有一個具有 50 毫秒延遲的 API。 若要使用節流層級高和最大並行呼叫 = 20 的可用容量,您必須呼叫此 API 20 * 1000 / 50 = 每秒 400 次。 進一步擴充,200 的最大並行呼叫可讓您每秒呼叫 API 4000 次,假設延遲為 50 毫秒。

下一步

如何使用 機器學習Web服務