Windows 範例庫上的 AI
範例集合,示範使用本機 API 和 Machine Learning (ML) 模型、使用 DirectML 的本機硬體加速,以及使用雲端式 API 來增強 Windows 應用程式的各種方式。
使用 AI 功能時,建議您檢閱:在 Windows上開發負責任的產生式 AI 應用程式和功能。
使用本機 API 和機器學習模型,增強您的 Windows 應用程式與人工智慧
這些範例將協助您使用本機 API 和 Machine Learning 模型,透過 AI 增強 Windows 應用程式。
AI 支援的音訊編輯器
GitHub 存放庫:AI 音訊編輯器範例
描述:AI 驅動的音訊編輯器展示了如何建置 WinUI 3 音訊編輯應用程式,透過使用 AI 將音訊片段與相關查詢進行匹配。 例如,使用案例可能是播客創作者,想要為其內容建立簡短的音訊剪輯,以在社交媒體上推廣。 此範例會使用本機 ML 模型推斷來處理轉譯和語意搜尋。
功能:使用 ONNX Runtime、Whisper 模型、嵌入模型進行本地模型推理
AI 支援的筆記應用程式
GitHub 存放庫:AI 驅動的筆記範例應用程式
描述:這個以 AI 為基礎的記事應用程式展示各種 API 的使用,包括:OCR 文字辨識、透過本地 ML 模型進行的音訊轉錄、使用本地嵌入模型的語義搜索、透過 Phi3 進行的摘要、自動完成及文字推理,以及擷取增強生成 (RAG),其用於將語言模型對接到真實數據。
功能:使用本機模型進行語意搜尋、使用本機模型進行音訊轉錄、使用 Phi3的本機檢索增強生成(RAG)、使用 Phi3 進行本機文字摘要和推理、使用 OCR API 從影像擷取文字
使用 PDF 和 Phi3 的檢索增強生成 (RAG)
GitHub 存放庫:RAG PDF 分析器 WPF 範例應用程式
描述:此 WPF 範例應用程式示範如何建置使用本機語言模型的體驗(例如 Phi3),以回答 PDF 檔中內容的相關問題。 此範例會先參考模型本身定型數據之外的知識庫,再產生回應,以尋找答案。 這個模式稱為「擷取增強生成」(RAG),是將語言模型紮根於真實世界權威數據的範例。
功能:檢索增強生成(RAG)、ONNX Runtime Generative AI、DirectML
Phi3 生成式人工智慧對話
GitHub 存放庫:Phi3 聊天 WinUI 3 範例
描述:此 WinUI 3 應用程式範例演示如何使用 ONNX Runtime Generative AI 函式庫來構建與本地語言模型的聊天體驗,特別是 Phi3 小型語言模型(SLM)。
功能:Phi3、ONNX Runtime Generative AI、DirectML
Windows Studio 效果範例
GitHub 存放庫:Windows Studio 效果範例應用程式
描述:瞭解如何透過此 Windows 應用程式的程式碼範例來控制 Camera Studio Effects。 檢查系統上是否提供支持的相機(需要具有 NPU 和內建相機的裝置),然後取得並設定與 Windows Studio 效果相關聯的擴充相機控件,例如背景模糊、眼球注視校正和自動框架。
透過 DirectML 的本機硬體加速
硬體加速在網路上穩定擴散
GitHub 存放庫:WebNN 穩定擴散渦輪增壓
說明:此範例說明如何使用 WebNN 與 ONNX Runtime Web 結合 DirectML 在本機的 GPU 上執行 Stable Diffusion。 SD-Turbo 是一種快速的生成式文本到圖像模型,能在單次網絡評估中從文字提示中合成擬真影像。 在演示中,您可以利用 WebNN API,在 AI 個人電腦設備上於 2 秒內生成影像,這是專為神經網路推斷硬體加速設計的低階 API。
應用程式類型:JavaScript、Web 應用程式
網路上的硬體加速 Segment Anything 模型
GitHub 存放庫:WebNN 區段任何專案
zh-TW: 描述:此範例說明如何使用 WebNN 與 ONNX Runtime Web,透過 DirectML 在 GPU 上本機執行 Segment Anything。 Segment Anything 是 Meta AI 的新 AI 模型,可「分割」任何物件。 在示範中,您可以從上傳的影像區隔任何物件。
應用程式類型:JavaScript、Web 應用程式
網路上的硬體加速 Whisper
GitHub 存放庫:WebNN Whisper 平台
描述:此範例說明如何使用 WebNN 搭配 ONNX Runtime Web,在 GPU 或 NPU 上使用 DirectML 在本機執行 Whisper 模型的語音轉換文字功能。 Whisper Base 是自動語音辨識 (ASR) 和語音翻譯的預先定型模型。 在示範中,您可以體驗語音轉文字功能,這是由 WebNN API 和 DirectML 提供的裝置推斷技術所支持,尤其是透過 NPU 加速。
應用程式類型:JavaScript、Web 應用程式
具有 DirectML 的硬體加速和預先優化的 ONNX 運行時語言模型(Phi3、Llama3 等)
GitHub 存放庫:Olive 存放庫中的 DirectML 範例
描述:此範例說明如何使用 DirectML 在 GPU 本機上執行預先優化的 ONNX Runtime (ORT) 語言模型。 此範例包含有關如何設定環境的指示、使用 ORT 產生 API 下載最新的預先定型語言模型,並在 Gradio 應用程式中執行模型。
功能:硬體加速、GenAI、ONNX、ONNX Runtime、DirectML
應用程式類型:Python、Gradio
使用硬體加速的 PyTorch 模型(如 Phi3、Llama3 等)與 DirectML
GitHub 存放庫:DirectML PyTorch 範例
描述:此範例說明如何使用 DirectML 在 GPU 本機上執行 PyTorch 語言模型。 此範例包含如何設定環境的指示、下載最新的預先定型語言模型,並在 Gradio 應用程式中執行模型。 此範例支援各種開放原始碼語言模型,例如 Llama 模型、Phi3-mini、Phi2 和 Mistral-7B。
應用程式類型:Python、Gradio
使用雲端 API 使用 AI 增強 Windows 應用程式
如需更多雲端式 API 範例,請參閱 azure AI 服務 檔。
將 OpenAI 聊天功能新增至您的 WinUI 3 / Windows 應用程式開發套件應用程式
教學課程:將 OpenAI 聊天功能新增至您的 WinUI 3 / Windows App SDK 應用程式
描述:將 OpenAI 聊天完成功能整合到 WinUI 3 / Windows App SDK 傳統型應用程式中。
特性:OpenAI 聊天補全功能
將 DALL-E 新增至您的 WinUI 3 / Windows App SDK 傳統型應用程式
教學課程:將 DALL-E 新增至您的 WinUI 3 / Windows App SDK 桌面應用程式
描述:將 OpenAI DALL-E 影像生成功能整合到 WinUI 3 / Windows App SDK 桌面應用程式中。
功能:映射產生
使用 .NET MAUI 和 ChatGPT 建立建議應用程式
教學課程:使用 .NET MAUI 和 ChatGPT 建立建議應用程式
描述:將 OpenAI 聊天完成功能整合到 .NET MAUI 傳統型應用程式中。
功能:映射產生
將 DALL-E 新增至 .NET MAUI Windows 桌面應用程式
教學課程:將 DALL-E 新增至 .NET MAUI Windows 桌面應用程式
描述:將 OpenAI DALL-E 影像生成功能整合到 .NET MAUI 桌面應用程式中。
功能:映射產生
舊版 WinML 範例
描述:WinML 會繼續受到支援,但這些範例尚未更新以反映新式 AI 使用。