Windows Copilot Runtime 概觀
Windows Copilot Runtime 提供各種 AI 支援的功能和 APIs,可讓您利用 AI 功能,而不需要尋找、執行或優化您自己的 Machine Learning (ML) 模型。 在 Copilot+ 電腦上提供電源 Windows Copilot Runtime 的模型會隨時在本機和背景中執行。
適用於 Windows 應用程式的 Windows Copilot Runtime 功能和 APIs
Windows Copilot Runtime 包含以下功能和 AI 支援的 APIs(在 Windows App SDK 中),這些功能由在 Windows 裝置上本地運行的模型提供。
Phi 矽:尚未提供。 Phi 矽 APIs 將在 Windows App SDK中出貨。 與支援 ChatGPT 的 OpenAI 大型語言模型 (LLM) 類似,Phi 是由 Microsoft Research 開發的小型語言模型 (SLM),在本機裝置上執行語言處理工作。 Phi Silica 專為具有類神經處理單元(NPU)的 Windows 裝置而設計,使文字生成和對話功能能夠以高效能並硬體加速的方式直接在裝置上運行。
Text Recognition 搭配 OCR:尚未提供。Text RecognitionAPIs(也稱為光學字元辨識,或簡稱為 OCR)將在 Windows App SDK中提供。 這些 APIs 可讓您辨識影像中的文字,以及將不同類型的檔(例如掃描的紙張檔、PDF 檔案或數位相機所擷取的影像)轉換成本機裝置上可編輯和可搜尋的數據。
映像處理 APIs:尚未提供。 AI 增強的映像處理 APIs 將會在 Windows App SDK中提供。 這些 APIs 執行各種動作,例如智慧調整影像,以及識別影像中的物件。
Studio Effects:適用於 Windows 11 版本 22H2 或更新版本(Build 22623.885+),在支持 Copilot+ 的電腦上可用。 配備兼容類神經處理單元(NPU)的 Windows 裝置,Studio Effects 整合進入內建裝置的相機和麥克風設置中。 套用利用 AI 的特殊效果,包括:背景模糊、眼部接觸校正、自動構圖、肖像光線校正、創意濾鏡或消除背景噪音的語音焦點。
Recall:可在 Copilot+ 電腦上透過 Windows 預覽體驗計畫進行預覽。Recall 可讓使用者從過去的活動快速找到專案,例如文件、圖片、網站等。 開發人員可以使用 用戶活動 API,將內容資訊新增至基礎向量資料庫,以擴充使用者的 Recall 體驗。 這項整合可協助使用者在應用程式中繼續先前的操作,提升應用程式的參與感,並使使用者在 Windows 與應用程式之間的流暢性得以加強。
Live Caption Translations 協助 Windows 上的所有人,包括耳聾或聽障人士,透過檢視口語內容的輔助字幕來進一步瞭解音訊(即使音訊內容與系統慣用的語言不同)。
整合您自己的 ML 模型
除了 AI 支援Windows Copilot RuntimeAPIs之外,我們還提供如何使用 機器學習 (ML) 模型增強應用程式的工具和指引。
AI Toolkit 在 Visual Studio Code 中,可讓您使用 、PyTorch 或 WebNN 等 ONNX Runtime架構來整合自己的 ML 模型,並存取硬體加速,以提升效能並透過 DirectML 進行調整。
深入了解:
- Windows 應用程式如何運用 ML 模型?
- 哪裡可以找到網路上 開放原始碼 ML 模型?
- 如何? 優化 ML 模型,以在我的 Windows 應用程式中使用?
- 如何使用自己的自定義數據來微調 ML 模型?
- 如何使用 AI 功能利用硬體加速來提升效能?
負責任的 AI 做法
使用裝置上的生成式 AI 模型 負責任地開發應用程式,Windows Copilot Runtime 以協助執行符合本地內容安全的功能,例如用於有害內容的裝置上分類引擎和預設封鎖清單。 Microsoft優先支持開發人員在 Windows 上建置安全且值得信任的 AI 體驗。 在建立在 Windows 裝置 上執行的應用程式和 AI 輔助功能時,深入瞭解要套用的負責任開發做法,請參閱在 Windows 上開發負責任 Ai 應用程式和功能指引。
另請參閱
Phi Silica,小身型但效能強大的內建裝置 SLM (Windows 部落格)
Windows 範例庫上的 AI:示範如何將 AI 整合到 Windows 應用程式中的範例。
關於搭配 Windows 使用 AI 的常見問題:關於在 Windows 內容中使用 AI 的相關術語和概念常見問題,涵蓋「什麼是 DirectML?」、「什麼是 ONNX?」、「什麼是 ORT?」、「什麼是 NPU?」、「什麼是 SLM?」、「什麼是推斷?」、「什麼是微調?」等問題。