人工智慧 (AI) 架構設計
人工智慧(AI) 是一種技術,可讓機器模仿智慧人類行為。 透過 AI,機器可以:
- 分析數據以建立影像和影片。
- 分析和合成語音。
- 以自然的方式口頭互動。
- 進行預測併產生新的數據。
架構設計人員設計使用人工智慧來執行函式或做出決策的工作負載,其中傳統邏輯或處理可能會令人禁止,甚至幾乎不可能實作。 身為設計解決方案的架構設計人員,請務必瞭解 AI 和機器學習環境,以及 Azure 如何提供解決方案以整合到工作負載設計中。
AI 概念
演算法
演算法或機器學習演算法是一組程式代碼,可協助人類在複雜的數據集中探索、分析和尋找意義。 每種演算法都是一組有限的明確逐步指示,可讓電腦遵循,以達成特定目標。 在機器學習模型中,目標是建立或探索人類可用來進行預測或分類資訊的模式。 演算法可能會描述如何判斷寵物是否為貓、狗、魚、鳥或蜥蜴。 另一個更複雜的演算法可能描述如何識別書面或口說語言、分析其單字、將一種語言翻譯成不同的語言,然後檢查翻譯的正確性。
當您設計工作負載時,您必須選取適合您工作的演算法系列,並評估各種可用的演算法,以找出適合的演算法。
機器學習服務
機器學習是一種 AI 技術,會使用演算法來建立預測模型。 此演算法可用來剖析數據欄位,並使用其內找到的模式來「學習」數據,以產生模型。 然後,這些模型會用來對新資料做出明智的預測或決策。
預測模型會根據已知資料進行驗證,針對特定商務案例選取的效能計量來測量,然後視需要進行調整。 此學習和驗證的程序稱為訓練。 透過定期重新定型,ML 模型會隨著時間而改善。
在工作負載設計方面,當您有過去觀察可以可靠地用來預測未來情況的情況時,請考慮使用機器學習服務。 這些觀察可以是通用事實,例如計算機視覺,偵測另一種動物形式的動物,或這些觀察可以具體到您的情況,例如計算機視覺,根據過去的瑕疵擔保索賠數據,在您的組裝線上偵測潛在的元件錯誤。
深度學習
深度學習 是一種 ML 類型,可透過自己的數據處理來學習。 就像機器學習一樣,它也會使用演算法來分析數據,但會使用包含許多輸入、輸出和處理層的人工神經網路。 每個圖層都可以以不同的方式處理數據,而一層的輸出會成為下一層的輸入。 這可讓深度學習建立比傳統機器學習更複雜的模型。
作為工作負載設計工具,此選項需要大量投資來產生高度自定義或探勘模型。 一般而言,您會先考慮本文提供的其他解決方案,再將深度學習新增至您的工作負載。
生成式 AI
產生 AI 是一種人工智慧形式,模型會定型,以根據許多形式的內容產生新的原始內容,例如自然語言、計算機視覺、音訊或影像輸入。 透過產生 AI,您可以使用一般日常語言來描述所需的輸出,而且模型可以藉由建立適當的文字、影像、程式代碼等來回應。 衍生式 AI 應用程式的一些範例包括:
Microsoft Copilot 主要是使用者介面,可協助使用者撰寫程式代碼、檔和其他以文字為基礎的內容。 它是以熱門的 OpenAI 模型為基礎,並已整合到各種Microsoft應用程式和用戶體驗中。
Azure OpenAI 是一種開發平臺即服務,可讓您存取 OpenAI 的強大語言模型,例如 o1-preview、o1-mini、GPT-4o、GPT-4o mini、GPT-4 Turbo with Vision、GPT-4、GPT-3.5-Turbo 和 Embeddings 模型系列。 這些模型可以適應您的特定工作,例如:
- 內容產生
- 內容摘要
- 影像理解
- 語意搜尋
- 程式代碼翻譯的自然語言。
語言模型
語言模型 是產生 AI 的子集,著重於自然語言處理 (NLP) 工作,例如文字產生和情感分析。 這些模型會根據特定內容中出現的單字或單字序列機率來代表自然語言。
傳統語言模型已用於受監督的設定,以用於研究目的,這些模型會針對特定工作,在標示良好的文字數據集上定型。 預先定型的語言模型提供無障礙方式來開始使用 AI,而且近年來已更廣泛地使用。 這些模型是使用深度學習神經網路從因特網定型的大型文字主體,並可針對特定工作微調較小的數據集。
語言模型的大小取決於其參數數目或權數,以決定模型如何處理輸入資料及產生輸出。 參數會在定型過程中學習,方法是調整模型層內的權數,以將模型預測與實際資料之間的差異降到最低。 模型擁有的參數越多,其複雜性和表達性也就越高,但定型及使用上的計算成本也比較昂貴。
一般而言,小型語言模型的參數少於 100 億個,而大型語言模型則有大於 100 億個參數。 例如,Microsoft Phi-3 模型系列有三個不同尺寸的版本:迷你(38億個參數)、小型(70億個參數)和中型(140億個參數)。
Copilots
語言模型的可用性導致了透過數位共同作業和連線、領域特定、代理程式與應用程式和系統互動的新方式的出現。 副手是生成式 AI 助理,通常作為聊天介面整合至應用程式中。 它們為這些應用程式中的一般工作提供了内容支援。
Microsoft Copilot 已整合到各種Microsoft應用程式和用戶體驗中。 其以開放架構為基礎,可讓第三方開發人員建立自己的外掛程式,以使用 Microsoft Copilot 擴充或自定義用戶體驗。 此外,協力廠商開發人員可以使用相同的開放結構建立自己的副手。
跨 Microsoft 雲端採用、擴充及建置 Copilot 體驗。
擷取擴增產生 (RAG)
擷取擴增世代 (RAG) 是一種架構模式,可增強大型語言模型 (LLM) 的功能,例如 ChatGPT,僅針對公用數據進行定型。 此模式可讓您新增擷取系統,以在內容中提供相關的地面數據與使用者要求。 新增資訊擷取系統可讓您控制語言模型在制定回應時所使用的地面數據。 RAG 架構可協助您將產生 AI 的範圍限定為從向量化檔、影像和其他數據格式所產生的內容。 不過,RAG 不限於向量搜尋記憶體,但模式會與任何數據存放區技術搭配使用。
自動化機器學習 (AutoML)
自動化機器學習也稱為自動化 ML 或 AutoML,是自動化機器學習模型開發的耗時反覆工作的程式。 這可以讓資料科學家、分析師和開發人員建置規模龐大、有效率且富生產力的 ML 模型,同時維持模型的品質。
AI 服務
透過 Azure AI 服務 開發人員和組織,可以使用現成、預先建置且可自定義的 API 和模型,建立智慧型手機、市場就緒且負責任的應用程式。 使用方式包括交談、搜尋、監視、翻譯、語音、視覺和決策的自然語言處理。
MLflow 是一種開放原始碼架構,旨在管理整個機器學習生命週期。
AI 語言模型
大型語言模型(LLM),例如 OpenAI 的 GPT 模型,是功能強大的工具,可以跨各種領域和工作產生自然語言。 考慮使用這些模型時,請考慮數據隱私權、道德使用、精確度和偏差等因素。
Phi 開放式模型 是小型、較少的計算密集型模型,適用於 Generative AI 解決方案。 小型語言模型 (SLM) 可能會比大型語言模型更有效率、可解譯且可解釋。
設計工作負載時,您可以使用語言模型做為託管解決方案、計量 API 後方,或針對許多小型語言模型使用,或至少裝載於與取用者相同的計算中。 在解決方案中使用語言模型時,請考慮您所選擇的語言模型及其可用的裝載選項,以確保您使用優化的解決方案作為使用案例。
AI 開發平臺和工具
Azure Machine Learning 服務
Azure 機器學習 是用來建置和部署模型的機器學習服務。 Azure 機器學習 提供 Web 介面和 SDK,讓您可以大規模定型和部署機器學習模型和管線。 您可以搭配 PyTorch、TensorFlow 和 scikit-learn 等開放原始碼 Python 架構使用這些功能。
什麼是 Azure Machine Learning? 具有許多學習資源、SDK、文件等連結的一般方向
適用於 Azure 的機器學習參考架構
基準 OpenAI 端對端聊天參考架構是一種參考架構 ,示範如何使用 OpenAI 的 GPT 模型建置端對端聊天架構。
Azure 登陸區域中 的 Azure OpenAI 聊天基準架構會示範如何在 Azure OpenAI 基準架構上建置,以解決在 Azure 登陸區域中部署時所做的變更和期望。
自動化機器學習 (AutoML)
使用 Azure 中的 AutoML 功能大規模建置 ML 模型,機器學習 將工作自動化。
MLflow
Azure Machine Learning 工作區與 MLflow 相容,這表示您可以採取與使用 MLflow 伺服器相同的方式使用 Azure Machine Learning 工作區。 此相容性具有下列優點:
- Azure Machine Learning 不會裝載 MLflow 伺服器執行個體,但可以直接使用 MLflow API。
- 您可使用 Azure Machine Learning 工作區,作為任何 MLflow 程式碼的追蹤伺服器,無論其是否在 Azure Machine Learning 中執行。 您只需要將 MLflow 設定為指向追蹤應該發生的工作區。
- 您可以在 Azure Machine Learning 中執行任何使用 MLflow 的定型常式,而無需進行任何變更。
如需詳細資訊,請參閱 MLflow 和 Azure 機器學習
Generative AI 工具
提示流程 是一套開發工具,旨在簡化產生 AI 應用程式的端對端開發週期,從構想、原型設計、測試、評估到生產部署和監視。 它透過在模組化協調流程和流程引擎中表達動作,支援提示工程。
Azure AI Studio 可協助您以完整的平台負責任地實驗、開發及部署產生式 AI 應用程式和 API。 透過 Azure AI Studio,您可以存取 Azure AI 服務、基礎模型、遊樂場和資源,以協助您建置、定型、微調及部署 AI 模型。 此外,您也可以評估模型回應,並使用提示流程協調提示應用程式元件,以提升效能。
Azure Copilot Studio 可用來擴充 Microsoft 365 中的 Microsoft Copilot,併為內部和外部案例建置自定義的 Copilot。 透過 Copilot Studio,使用者可以使用完整的撰寫畫布來設計、測試及發布 Copilot。 用戶可以輕鬆地建立已啟用 AI 的交談、為現有輔助程式提供更大的回應控制,以及使用特定自動化工作流程加速生產力。
AI 的數據平臺
Microsoft Fabric
Microsoft Fabric 是一種端對端分析和資料平台,專為需要整合解決方案的企業所設計。 工作負載小組可以授與這些系統中數據的存取權。 其包含資料移動、處理、擷取、轉換、即時事件路由,以及報表建置功能。 Microsoft Fabric 提供完整的服務套件,包括資料工程、Data Factory、資料科學、即時分析、資料倉儲和資料庫。
Microsoft Fabric 會將個別的元件整合至一致性堆疊。 您可以使用 OneLake 來集中儲存資料,而不是依賴不同的資料庫或資料倉儲。 AI 功能內嵌在 Fabric 中,不需要手動整合。
Fabric 中的 Copilots
Copilot 和其他產生式 AI 功能可讓您轉換和分析數據、產生見解,並在 Microsoft Fabric 和 Power BI 中建立視覺效果和報表。 您可以建置自己的 Copilot,或選擇下列其中一個預先建置的 Copilot:
Fabric 中的 Copilot 概觀 (部分內容可能是機器或 AI 翻譯)
Fabric 中的 AI 技能
透過Microsoft Fabric AI 技能,您可以設定產生產生查詢,以回答數據相關問題。 設定 AI 技能之後,可以與同事共用,然後以簡單的英文詢問其問題。 根據其問題,AI 會針對回答這些問題的資料產生查詢。
適用於 AI 的 Apache Spark 型數據平臺
Apache Spark 是一個平行處理架構,可支援記憶體內部處理,以大幅提升巨量資料分析應用程式的效能。 Spark 提供用於記憶體內部叢集運算的基本項目。 Spark 作業可以將數據載入並快取到記憶體中,並重複查詢數據,這比 Hadoop 等磁碟應用程式更快。
Azure Fabric 中的 Apache Spark
Microsoft Fabric 執行時間是以 Apache Spark 為基礎的 Azure 整合平臺,可執行和管理資料工程和資料科學體驗。 它會結合內部和開放原始碼來源的重要元件,為客戶提供完整的解決方案。
Fabric 執行階段的主要元件:
Apache Spark - 功能強大的開放原始碼分散式運算連結庫,可進行大規模的資料處理和分析工作。 Apache Spark 為資料工程和資料科學體驗提供多功能且高效能的平臺。
Delta Lake - 一個開放原始碼儲存層,為 Apache Spark 帶來 ACID 異動和其他資料可靠性功能。 Delta Lake 已整合在 Fabric 執行階段內,可增強資料處理功能,並確保跨多個並行作業的資料一致性。
Java/Scala、Python 和 R 的預設層級套件 - 支援各種程式設計語言和環境的套件。 這些套件會自動安裝並設定,讓開發人員套用其慣用的程式設計語言來進行資料處理工作。
Microsoft Fabric 執行階段是以強固的開放原始碼操作系統為基礎,確保與各種硬體組態和系統需求相容。
用於 Machine Learning 的 Azure Databricks Runtime
Azure Databricks 是一個基於 Apache Spark 的分析平台,具有一鍵式設定、簡化工作流程,以及用於資料科學家、工程師和業務分析師之間協作的互動式工作區。
適用於r Machine Learning (Databricks Runtime ML) 的 Databricks Runtime,可讓您啟動 Databricks 叢集,其中包含分散式定型所需的所有程式庫。 它提供機器學習和數據科學的環境。 此外,它包含多個熱門程式庫,包括 TensorFlow、PyTorch、Keras 和 XGBoost。 它還支援使用 Horovod 進行分散式訓練。
Azure HDInsight 中的 Apache Spark
Azure HDInsight 中的 Apache Spark 是 Apache Spark 在雲端中的 Microsoft 實作。 HDInsight 中的 Spark 叢集與 Azure 儲存體和 Azure Data Lake Storage 相容,因此可使用 HDInsight Spark 叢集來處理儲存在 Azure 中的資料。
適用於 Apache Spark 的 Microsoft 機器學習程式庫是 SynapseML (以前稱為 MMLSpark)。 此開放原始碼程式庫會將許多深度學習和資料科學工具、網路功能和生產等級效能,新增至 Spark 生態系統。 深入了解 SynapseML 特性和功能。
Azure HDInsight 概觀 有關功能、叢集架構和使用案例的基本資訊,以及快速入門和教學課程的指標。
適用於 SynapseML 的 GitHub 存放庫:適用於 Apache Spark 的 Microsoft 機器學習程式庫
AI 的數據記憶體
Microsoft Fabric OneLake
Fabric 中的 OneLake 是針對整個組織量身打造的統一且有邏輯的資料湖。 它可作為所有分析資料的中央中樞,並隨附於每個 Microsoft Fabric 租用戶中。 Fabric 中的 OneLake 是以 Data Lake Storage Gen2 為基礎而建置。
Fabric 中的 OneLake:
- 支援結構化和非結構化檔案類型。
- 以 Delta Parquet 格式儲存所有表格資料。
- 提供依預設控管之租用戶界限內的單一資料湖。
- 支援在租用戶內建立工作區,讓組織可以分發擁有權和存取原則。
- 支援建立各種資料項目,例如您可以從中存取資料的和倉儲。
如需詳細資訊,請參閱 OneLake 即為適用於資料的 OneDrive。
Azure Data Lake Storage Gen2
Azure Data Lake Storage 是單一集中式存放庫,您可以儲存結構化和非結構化的所有數據。 資料湖可讓您的組織快速且更輕鬆地在單一位置中儲存、存取及分析各種不同的資料。 使用資料湖時,您不需要使您的資料符合現有的結構。 相反地,您可以將資料以原始或原生格式儲存,通當儲存為檔案或二進位大型物件 (Blob)。
Data Lake Storage Gen2 提供文件系統語意、檔案層級安全性和規模。 因為這些功能是基於 Blob 儲存體所建置,所以您也可以取得低成本的分層式儲存體,並具備高可用性/災害復原功能。
Data Lake Storage Gen2 讓 Azure 儲存體成為在 Azure 上打造企業 Data Lake 的基礎。 Data Lake Storage Gen2 從一開始就設計為服務數 PB 的資訊,同時可以維持數百 GB 的輸送量,可讓您輕鬆地管理大量資料。
AI 數據處理
Microsoft Fabric Data Factory
使用 Data Factory,您可以擷取、準備及轉換多個數據源的數據(例如資料庫、數據倉儲、Lakehouse、實時數據等等)。 當您設計工作負載時,這是一種工具,可協助您符合 DataOps 需求。
Data Factory 同時支援程式代碼和無/低程式代碼解決方案:
數據管線 可讓您在雲端規模建立工作流程功能。 透過數據管線,您可以使用拖放介面來建置工作流程,以重新整理數據流、移動 PB 大小的數據,以及定義控制流程管線。
數據流 提供低程式代碼介面,可讓您從數百個數據源擷取數據,使用300個以上的資料轉換來轉換您的數據。
另請參閱:
Azure Databricks
使用 Databricks Data Intelligence Platform,您可以使用特徵工程撰寫程式代碼來建立機器學習工作流程:
- 數據管線會內嵌未經處理的數據、建立特徵數據表、定型模型,以及執行批次推斷。 當您在 Unity Catalog 中使用特徵工程來訓練和記錄模型時,會使用特徵中繼資料來封裝模型。 當您使用模型進行批次評分或線上推斷時,它會自動擷取特徵值。 呼叫端不需要知道它們,也不需要包含邏輯來查閱或聯結功能來為新數據評分。
- 模型和功能服務端點可透過按兩下提供,並提供毫秒的延遲。
- 資料和模型監測。
您也可以使用 馬賽克 AI 向量搜尋,其已針對儲存和擷取內嵌進行優化。 內嵌對於需要相似性搜尋的應用程式至關重要,例如 RAG (擷取擴增產生)、建議系統和影像辨識。
適用於 AI 的數據連接器
Azure Data Factory 和 Azure Synapse Analytics 管線可透過複製、資料流、查閱、取得元數據和刪除活動來支援許多數據存放區和格式。 若要查看可用的數據存放區連接器、支援的功能和對應的組態,以及一般 ODBC 連線選項,請參閱 Azure Data Factory 和 Azure Synapse Analytics 連接器概觀。
自訂 AI
Azure Machine Learning
Azure Machine Learning 是一項雲端服務,可加速和管理機器學習 (ML) 專案生命週期。 ML 專業人員、資料科學家和工程師可以在日常工作流程中用機器學習來訓練和部署模型以及管理機器學習作業 (MLOp)。
Azure 機器學習 提供下列功能:
演算法選取 某些演算法會針對數據結構或所需結果做出特定假設。 如果可以找到符合需求的假設,您就能獲得更實用的結果、更精確的預測或更快的定型時間。
超參數微調或優化 是尋找產生最佳效能之超參數位態的程式。 此程式在計算上相當昂貴且手動。 超參數是可調整的參數,可讓您控制模型定型流程。 例如,使用神經網路時,您可以決定隱藏層的數目和每個圖層中的節點數目。 模型效能主要取決於超參數。
Azure Machine Learning 可讓您將超參數微調自動化,並平行執行實驗,以有效率地最佳化超參數。
模型定型。 使用 Azure 機器學習,您可以反覆使用演算法來建立或「教導」模型。 定型之後,就可以使用這些模型來分析可進行預測的數據。 在訓練階段期間,會標記一組高品質的已知資料,以便識別個別欄位。 標記的資料會饋送至設定為進行特定預測的演算法。 完成後,演算法會輸出模型,以描述其找到的模式做為一組參數。 在驗證期間,會標記全新資料,並用來測試模型。 演算法會視需要調整,並且進行更多訓練。 最後,測試階段會使用真實環境中的資料,而不需要任何標記或預先選取的目標。 假設模型的結果正確無誤,它會被視為可供使用且可部署。
自動化機器學習 (AutoML) 是自動化機器學習模型開發的耗時反覆工作的程式。 它可以大幅減少取得生產就緒 ML 模型所需的時間。 自動化 ML 可協助模型選擇、超參數微調、模型定型和其他工作,而不需要廣泛的程式設計或領域知識。
當您想要 Azure 機器學習 使用指定的目標計量來定型和微調模型時,您可以使用自動化 ML。 不論數據科學專業知識為何,都可以使用自動化 ML 來識別任何問題的端對端機器學習管線。
跨產業的 ML 專業人員和開發人員可以使用自動化 ML 來執行下列動作:
實作 ML 解決方案,而不需要廣泛的程式設計或機器學習知識
節省時間與資源
套用資料科學最佳做法
提供敏捷的解決問題方式
計分 也稱為預測,而且是在一些新的輸入資料的情況下,根據定型機器學習模型產生值的程序。 所建立的值或評分可以代表未來值的預測,但也可能代表可能分類或結果。
特徵工程和特徵化。 定型資料由資料列和資料行組成。 每個資料列都是觀察或記錄,而每個資料列的資料行都是描述每筆記錄的特徵。 通常,系統會選取最能特徵化資料中模式的特徵,以建立預測模型。
雖然許多原始資料欄位都可以直接用來定型模型,但通常需要建立其他 (工程設計) 特徵,其會提供更能區分資料中模式的資訊。 此流程稱為特徵工程,其中使用資料的網域知識來建立特徵,進而協助機器學習演算法更好地學習。
在 Azure Machine Learning 中,會套用資料調整和正規化技術,讓特徵工程更容易。 在自動化機器學習 (ML) 實驗中,這些技術和此特徵工程統稱為特徵化。
Azure OpenAI
Azure OpenAI 服務可讓您使用稱為 微調的程式,為個人數據集量身打造 OpenAI 模型。 藉由提供下列內容,此自訂步驟可讓您來獲得更多服務:
- 相較於直接從提示工程獲得的結果,可將品質提升至更高層次
- 能夠針對超出模型最大要求內容限制的範例進行定型。
- 由於提示較短而節省權杖
- 低延遲要求,尤其是使用較小模型時。
如需詳細資訊,請參閱
適用於自定義 AI 的 Azure AI 服務
Azure AI 服務 提供可讓您建置自定義 AI 模型和應用程式的功能。 本節提供其中一些重要功能的概觀。
客製化的語音
自訂語音 是 Azure AI 語音服務的一項功能。 有了 自訂語音,您即可評估與提高應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字、語音翻譯和批次謄寫。
開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 基底模型會預先訓練代表各種常見領域的方言和注音符號。 當您提出語音辨識要求時,系統預設會使用每個支援語言的最新基礎模型。 基礎模型在大部分的語音辨識案例中運作良好。
自訂模型可用於增強基礎模型,藉由提供文字資料來定型模型,以改善應用程式特有領域限定的詞彙辨識。 它也可以藉由提供音訊資料與參考轉錄內容,來改善應用程式特定音訊條件的辨識。
您也可以在資料遵循模式時使用結構化文字定型模型,以指定自訂發音,以及使用自訂反向文字正規化、自訂重寫和自訂不雅內容篩選來自訂顯示文字格式。
自訂翻譯工具
自定義翻譯工具是 Azure AI Translator 服務的一項功能。 透過自定義翻譯工具、企業、應用程式開發人員和語言服務提供者,可以建置自定義的類神經機器翻譯(NMT)系統。 自訂的翻譯系統會順暢地整合到現有應用程式、工作流程和網站。
該平台可讓使用者建置並發佈將其他語言翻成英文,或將英文翻譯成其他語言的自訂翻譯系統。 自訂翻譯工具支援三十幾種以上的語言,直接對應至 NMT 可用的語言。 如需完整清單,請參閱 翻譯工具語言支援。
自訂翻譯工具提供下列功能:
功能 | 描述 |
---|---|
套用類神經機器翻譯技術 | 套用自訂翻譯工具所提供的類神經機器翻譯 (NMT) 來改善您的翻譯。 |
建置知道您商務術語的系統 | 使用平行處理的文件來自訂和建置翻譯系統,其瞭解您自己的企業和產業中所使用的術語。 |
使用字典來建置模型 | 如果您沒有訓練資料集,則可以只使用字典資料來訓練模型。 |
與其他人共同作業 | 藉由與不同的人共享工作,來與您的小組共同作業。 |
存取自訂翻譯模型 | 您可以使用現有應用程式/程式,透過 Microsoft 翻譯工具 API V3 隨時存取您的自訂翻譯模型。 |
文件智慧服務自訂模型
Azure AI 檔智慧 使用進階機器學習技術來識別檔、偵測及擷取表單和文件的資訊,以及傳回結構化 JSON 輸出中擷取的數據。 透過文件智慧,您可以使用檔分析模型、預先建置/預先定型,或已定型的獨立自定義模型。
Document Intelligence 自定義模型 現在包含自定義分類模型,適用於您需要在叫用擷取模型之前識別文件類型的案例。 分類模型可以與自訂擷取模型配對,以分析及擷取您企業專屬的表單和文件中的欄位。 您可以結合獨立自訂擷取模型來建立組成模型。
自定義 AI 工具
雖然預先建置的 AI 模型很有用且越來越具彈性,但從 AI 取得所需專案的最佳方式,是建置專為您特定需求量身打造的模型。 建立自訂 AI 模型的主要工具有兩種:Generative AI 和傳統機器學習:
Azure Machine Learning studio
Azure Machine Learning 工作室 是一項雲端服務,可用來加速和管理機器學習 (ML) 專案生命週期。 ML 專業人員、數據科學家和工程師可以在日常工作流程中使用它來定型及部署模型,以及管理機器學習作業 (MLOps)。
- 使用任何類型的運算 (包括 Spark 和 GPU),組建並訓練 Azure Machine Learning 模型,方便處理大規模的雲端 AI 工作負載。
- 針對低程式代碼 Azure Machine Learning,執行自動化 Azure Machine Learning (AutoML) 和拖放功能 UI。
- 執行端到端 Azure Machine LearningOps 和可重複的 Azure Machine Learning 管線。
- 使用負責任的 AI 儀表板進行偏差檢測和錯誤分析。
- 協調和管理工程與 LLM 流程。
- 使用 REST API 端點、即時和批次推論來部署模型。
- 使用中樞(預覽版)與一組工作區共用計算、配額、安全性和連線能力,同時集中治理 IT。 設定中樞一次,然後直接從 Studio 為每個專案建立安全工作區。 使用中樞在 ML Studio 和 AI Studio 中管理小組的工作。
Azure AI Studio
Azure AI Studio 的設計訴求是協助您利用 Azure 廣泛 AI 供應項目的強大功能,有效率地建置及部署自定義產生的 AI 應用程式:
- 以小組形式共同建置。 您的 AI Studio 中樞資源 會提供企業級的安全性,以及具有共用資源和連線至預先定型模型、資料和計算的共同作業環境。
- 組織您的工作。 您的 AI Studio 專案 可協助您儲存狀態,讓您從第一個想法、第一個原型到第一個生產環境部署逐一查看。 也可以輕鬆邀請其他人在此旅程中共同作業。
- 使用您偏好的開發平台和框架,包括 GitHub、Visual Studio Code、LangChain、Semantic Kernel、AutoGen 等。
- 從超過 1,600 種機型中發掘和比較。
- 透過無伺服器 API 和託管微調提供模型即服務 (MaaS)。
- 結合多種模型、資料來源和模式。
- 使用您受保護的企業資料建立檢索增強生成 (RAG),無需微調。
- 協調和管理提示工程與大型語言模型 (LLM) 流程。
- 使用可設定的過濾器和控制項設計並保護應用程式和 API。
- 使用內建及自訂的評估流程評估模型回應。
- 透過持續監視和治理環境,將 AI 創新部署至 Azure 受控基礎結構。
- 持續監視已部署的應用程式,以取得生產環境中的安全性、品質和令牌耗用量。|
如需 Azure 機器學習 與 Azure AI Studio 之間的詳細比較,請參閱 Azure 機器學習 與 Azure AI Studio。
Azure AI Studio 中的提示流程
Azure AI Studio 中的提示流程是一項開發工具,旨在簡化由大型語言模型 (LLM) 提供之 AI 應用程式的整個開發週期。 提示流程提供了全方位的解決方案,可簡化原型設計、實驗、反覆執行和部署 AI 應用程式的流程。
- 提示流程是可以用來產生、自訂或執行流程的功能。
- 流程是可執行的指令集,可實作 AI 邏輯。 可以透過多種工具建立或執行流程,例如預先建立的畫布、LangChain 等。 流程的反覆項目可儲存為資產;部署流程之後,即會變成 API。 並非所有流程都是提示流程;相反地,提示流程是建立流程的一種方式。
- 提示是傳送至模型的輸入套件,其中包含使用者輸入、系統訊息和任何範例。 使用者輸入是在聊天視窗中提交的文字。 系統訊息是模型的一組指示,會界定其行為和功能範圍。
- 範例流程是簡單的預先建置協調流程,可示範流程的運作方式,並可加以自訂。
- 範例提示是特定案例的已定義提示,可從程式庫複製,並在提示設計中依現狀使用或修改。
自定義 AI 程式代碼語言
AI 的核心概念是使用演算法來分析資料,並且在產生模型後,以有用的方式描述 (或評分)。 演算法是由開發人員和資料科學家 (有時由其他演算法) 使用程式設計程式碼所撰寫。 目前 AI 開發最流行的兩種程式設計語言是 Python 和 R。
Python 是一般用途的高階程式設計語言。 該語言有簡單又易學的語法,特別強調可讀性。 沒有編譯步驟。 Python 具有大型標準程式庫,但也支援新增模組和套件的功能。 這是在鼓催模組化,可讓您在需要時擴充功能。 適用於 Python 的 AI 和 ML 程式庫生態系統相當龐大,且仍不斷在增長,包括許多可在 Azure 中取得的生態系統。
scikit-learn
. 適用於 Python 的開放原始碼 ML 程式庫PyTorch。 具有豐富生態系統的開放原始碼 Python 程式庫,可用於深度學習、電腦視覺、自然語言處理等等
TensorFlow。 開放原始碼符號數學程式庫也適用於 ML 應用程式和神經網路
R 是一種語言和環境,專供統計運算與圖形設計之用。 可用從線上對應廣泛的社會和行銷趨勢,到開發金融和氣候模型的各個領域。
Microsoft 已完全採用 R 程式設計語言,提供許多不同的選項讓 R 開發人員在 Azure 中執行其程式碼。
Azure 上自訂 AI 的一般資訊
Azure Machine Learning Python SDK 筆記本。 示範 Azure 機器學習 Python SDK 的範例筆記本 GitHub 存放庫。
客戶案例
不同產業以創新且鼓舞人心的方式套用 AI。 以下是一些客戶案例研究和成功案例:
- Volkswagen:機器翻譯介紹 Volkswagen - 40 種語言
- 使用 Azure Open AI 搭配 Kry 使用 All 醫療保健
- PIMCO 使用以 Azure AI 為基礎的 AI 型搜尋平臺來提升客戶端服務
- Legrand 和 Azure OpenAI 服務:使用 AI 驅動工具提供更聰明的解決方案
- C.H. Robinson 克服了數十年來使用 Azure AI 將物流產業自動化的障礙
Microsoft AI 的一般資訊
深入了解 Microsoft AI,並掌握相關新聞的最新消息:
下一步
若要瞭解從 Microsoft 取得的人工智慧開發產品,請移至 Microsoft AI。
如需如何開發 AI 解決方案的訓練,請移至 AI 學習中樞。
GitHub 上的 Microsoft AI:範例、參考架構和最佳做法組織 Microsoft 開放原始碼 AI 型存放庫,以提供教學課程和學習教材。
尋找 AI 解決方案參考架構的架構圖表和技術描述。