共用方式為


Windows Copilot Runtime 概觀

Windows Copilot Runtime 提供各種 AI 支援的功能和 APIs,可讓您利用 AI 功能,而不需要尋找、執行或優化您自己的 Machine Learning (ML) 模型。 在 Copilot+ 電腦上提供電源 Windows Copilot Runtime 的模型會隨時在本機和背景中執行。

適用於 Windows 應用程式的 Windows Copilot Runtime 功能和 APIs

Windows Copilot Runtime 包含以下功能和 AI 支援的 APIs(在 Windows App SDK 中),這些功能由在 Windows 裝置上本地運行的模型提供。

  • Phi 矽尚未提供。 Phi 矽 APIs 將在 Windows App SDK中出貨。 與支援 ChatGPT 的 OpenAI 大型語言模型 (LLM) 類似,Phi 是由 Microsoft Research 開發的小型語言模型 (SLM),在本機裝置上執行語言處理工作。 Phi Silica 專為具有類神經處理單元(NPU)的 Windows 裝置而設計,使文字生成和對話功能能夠以高效能並硬體加速的方式直接在裝置上運行。

  • Text Recognition 搭配 OCR尚未提供。Text RecognitionAPIs(也稱為光學字元辨識,或簡稱為 OCR)將在 Windows App SDK中提供。 這些 APIs 可讓您辨識影像中的文字,以及將不同類型的檔(例如掃描的紙張檔、PDF 檔案或數位相機所擷取的影像)轉換成本機裝置上可編輯和可搜尋的數據。

  • 映像處理 APIs尚未提供。 AI 增強的映像處理 APIs 將會在 Windows App SDK中提供。 這些 APIs 執行各種動作,例如智慧調整影像,以及識別影像中的物件。

  • Studio Effects適用於 Windows 11 版本 22H2 或更新版本(Build 22623.885+),在支持 Copilot+ 的電腦上可用。 配備兼容類神經處理單元(NPU)的 Windows 裝置,Studio Effects 整合進入內建裝置的相機和麥克風設置中。 套用利用 AI 的特殊效果,包括:背景模糊、眼部接觸校正、自動構圖、肖像光線校正、創意濾鏡或消除背景噪音的語音焦點。

  • Recall可在 Copilot+ 電腦上透過 Windows 預覽體驗計畫進行預覽。Recall 可讓使用者從過去的活動快速找到專案,例如文件、圖片、網站等。 開發人員可以使用 用戶活動 API,將內容資訊新增至基礎向量資料庫,以擴充使用者的 Recall 體驗。 這項整合可協助使用者在應用程式中繼續先前的操作,提升應用程式的參與感,並使使用者在 Windows 與應用程式之間的流暢性得以加強。

  • Live Caption Translations 協助 Windows 上的所有人,包括耳聾或聽障人士,透過檢視口語內容的輔助字幕來進一步瞭解音訊(即使音訊內容與系統慣用的語言不同)。

整合您自己的 ML 模型

除了 AI 支援Windows Copilot RuntimeAPIs之外,我們還提供如何使用 機器學習 (ML) 模型增強應用程式的工具和指引。

AI Toolkit 在 Visual Studio Code 中,可讓您使用 、PyTorch 或 WebNN 等 ONNX Runtime架構來整合自己的 ML 模型,並存取硬體加速,以提升效能並透過 DirectML 進行調整。

深入了解:

負責任的 AI 做法

使用裝置上的生成式 AI 模型 負責任地開發應用程式,Windows Copilot Runtime 以協助執行符合本地內容安全的功能,例如用於有害內容的裝置上分類引擎和預設封鎖清單。 Microsoft優先支持開發人員在 Windows 上建置安全且值得信任的 AI 體驗。 在建立在 Windows 裝置 上執行的應用程式和 AI 輔助功能時,深入瞭解要套用的負責任開發做法,請參閱在 Windows 上開發負責任 Ai 應用程式和功能指引。

另請參閱