Fabric 中的 AI 服務 (預覽版)
重要
這項功能處於預覽狀態。
Azure AI 服務 協助開發人員和組織快速建立智慧、尖端、符合市場需求且負責任的應用程式,使用預先建置和可自定義的 API 和模型。 Azure AI 服務先前名為 Azure 認知服務,它使得即便是沒有人工智慧或資料科學技能或知識的開發者也能夠運用這些服務。 Azure AI 服務的目標是協助開發人員建立可以看、聽、說、理解甚至推論的應用程式。
Fabric 提供兩個選項來使用 Azure AI 服務:
網狀架構中預先建置的 AI 模型 (預覽版)
Fabric 與 Azure AI 服務緊密整合,可讓您使用預先建置的 AI 模型來擴充資料,而不需要任何必要條件。 建議您使用此選項,因為您可以使用網狀架構驗證來存取 AI 服務,而且所有使用量都會根據您的網狀架構容量計費。 此選項目前處於公開預覽狀態,提供有限的 AI 服務。
網狀架構預設提供 Azure OpenAI Service、文字分析,以及 Azure AI Translator,同時支援 SynapseML 和 RESTful API。 您也可以使用 OpenAI Python 程式庫來存取 Fabric 中的 Azure OpenAI 服務。 如需可用模型的詳細資訊,請流覽 fabric中
預先建置的 AI 模型。 攜帶您自己的金鑰 (BYOK)
您可以在 Azure 上佈建 AI 服務,並攜帶您自己的金鑰從 Fabric 加以使用。 如果預先建置的 AI 模型尚未支援所需的 AI 服務,您仍然可以使用 BYOK(自備密鑰)。
若要深入了解如何搭配使用 Azure AI 服務與 BYOK,請瀏覽 SynapseML 中的 Azure AI 服務與攜帶您自己的金鑰。
Fabric 中預先建置的 AI 模型 (預覽版)
注意
預先建置的 AI 模型目前可在預覽中提供,並免費提供,限制每個使用者的並行要求數目。 針對 Open AI 模型,每個使用者的限制為每分鐘 20 個要求。
Azure OpenAI 服務
REST API、Python SDK。 SynapseML
- GPT-35-turbo:GPT-3.5 模型可以了解並產生自然語言或程式碼。 GPT-3.5 系列中最有能力且符合成本效益的模型是 GPT-3。 針對聊天優化的
5 Turbo
選項在傳統完成任務中也運作良好。 此gpt-35-turbo-0125
模型最多支援 16,385 個輸入權杖和 4,096 個輸出權杖。 - gpt-4 系列:支援
gpt-4-32k
。 - text-embedding-ada-002 (第 2 版),可與內嵌 API 要求一起使用的內嵌模型。 接受的要求權杖上限為 8,191,且傳回的向量維度為 1,536。
文字分析
- 語言偵測:偵測輸入文字的語言
- 情感分析:傳回介於0到1之間的分數,以指出輸入文字中的情感
- 關鍵片語擷取:識別輸入文字中的重點交談點
- 個人標識資訊(PII) 實體辨識:在輸入文字中識別、分類和修訂敏感性資訊
- 具名實體辨識:識別輸入文字中的已知實體和一般具名實體
- 實體連結:識別和釐清文本中找到的實體
Azure AI 翻譯工具
- 翻譯:翻譯文字
- 轉寫:將一種語言的文字轉換成另一種書寫系統。
可用區域
Azure OpenAI 服務的可用區域
如需目前可在 Fabric 中預先建置 AI 服務的 Azure 區域清單,請流覽 Fabric 和 Power BI 中 Copilot 概觀一文的 可用區域 一節 文章。
文字分析和 Azure AI 翻譯工具的可用區域
預先建置的 文字分析,以及 Fabric 中的 Azure AI Translator 現在可在本文所列的 Azure 區域中公開預覽。 如果您在本文中找不到 Microsoft Fabric 的主要區域,您仍然可以在支持的區域中建立 Microsoft Fabric 容量。 如需詳細資訊,請瀏覽 購買 Microsoft Fabric 訂閱。 若要判斷您的 Fabric 主區域,請瀏覽 尋找您的 Fabric 首頁區域。
亞太地區 | 歐洲 | 美洲 | 中東與非洲 |
---|---|---|---|
澳大利亞東部 | 北歐 | 巴西南部 | 南非北部 |
澳大利亞東南部 | 西歐 | 加拿大中部 | 阿拉伯聯合大公國北部 |
印度中部 | 法國中部 | 加拿大東部 | |
東亞 | 挪威東部 | 美國東部 | |
日本東部 | 瑞士北部 | 美國東部 2 | |
南韓中部 | 瑞士西部 | 美國中北部 | |
東南亞 | 英國南部 | 美國中南部 | |
印度南部 | 英國西部 | 美國西部 | |
美國西部 2 | |||
美國西部 3 |
耗用量率
注意
網狀架構中預先建置 AI 服務的計費於 2024 年 11 月 1 日生效,成為現有 Power BI Premium 或網狀架構容量的一部分。
提出使用預建 AI 服務的要求會消耗 Fabric 容量單位。 下表定義使用 AI 服務時,會取用多少容量單位 (CU)。
OpenAI 語言模型的消耗率
模型 | 內容 | 輸入 (每 1,000 個令牌) | 輸出(每 1,000 個標記) |
---|---|---|---|
GPT-4o-2024-08-06 全域部署 | 128 K | 84.03 CU 秒 | 336.13 CU 秒 |
GPT-4 | 32 K | 2,016.81 CU 秒 | 4,033.61 CU 秒 |
GPT-3.5-Turbo-0125 | 16K | 16.81 CU 秒 | 50.42 CU 秒 |
OpenAI 嵌入模型的使用率
模型 | 操作測量單位 | 耗用量率 |
---|---|---|
text-embedding-ada-002 | 1,000 個令牌 | 3.36 CU 秒 |
文字分析的耗用量率
作業 | 操作測量單位 | 耗用量率 |
---|---|---|
語言偵測 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
情感分析 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
關鍵片語擷取 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
個人身份識別資訊實體辨識 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
具名實體辨識 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
實體聯結 | 1,000 筆文字記錄 | 33,613.45 CU 秒 |
綜述 | 1,000 筆文字記錄 | 67,226.89 CU 秒 |
文字翻譯工具的消耗率
作業 | 測量單位 | 耗用量率 |
---|---|---|
翻譯 | 100 萬個字元 | 336,134.45 CU 秒 |
音譯 | 1M 個字元 | 336,134.45 CU 秒 |
AI 服務在 Fabric 使用率上的變更
消費率隨時可能會變更。 Microsoft盡合理的努力,透過電子郵件或產品內通知發出通知。 變更應在Microsoft版本資訊或Microsoft網狀架構部落格中所述的日期生效。 如果光纖使用量率中 AI 服務的任何變更會大幅增加使用所需的容量單位(CU),客戶可以使用所選付款方式可用的取消選項。
監視使用量
與工作相關聯的工作負載計量會影響 Fabric 中預建 AI 服務的收費標準。 例如,如果 AI 服務使用量衍生自 Spark 工作負載,AI 使用量會分組在一起,並在 Fabric 容量計量應用程式上的 Spark 計費計量下計費,。
例
在線商店擁有者使用 SynapseML 和 Spark 將數百萬個產品分類為相關類別。 目前,店主會套用硬式編碼邏輯來清理,並將原始的「產品類型」對應至類別。 不過,擁有者計劃切換為使用新的原生網狀架構 OpenAI LLM(大型語言模型)端點。 這會反覆處理每個數據列的 LLM 數據,然後根據其「產品名稱」、「描述」、「技術詳細數據」等來分類產品。
Spark 使用量的預期成本為 1000 個 CU。 OpenAI 使用的預期成本約為 300 個 CU。
若要測試新的邏輯,請先在Spark筆記本互動式執行中反覆執行。 針對執行的作業名稱,請使用「Notebook 互動式執行」。擁有者預期會在「Notebook 互動式執行」下看到 1300 個 CU 的整體使用量,其中 Spark 計費表會計入整體使用量。
一旦店主驗證邏輯後,便會設定定期的執行,並預期在作業名稱「Spark Job Scheduled Run」下看到 1300 個 CU 的總使用量,其中 Spark 計費儀表會計入全部的使用量。