Copilot 的語意索引
語意索引是從 Microsoft Graph 中的內容產生。 它可用來協助生產對使用者查詢的內容相關回應。 它可讓組織搜尋數十億個向量 (特徵或屬性的數學表示法) 並傳回相關結果。 語意索引結合了 Microsoft Graph 的增強功能,可讓您與組織中的相關信息連線。 它是以Microsoft的完整 安全性、合規性、隱私權方法為基礎,並遵守租用戶內的所有組織界限。
什麼是索引?
在 Microsoft 365 中已妥善建立編製數據索引的概念。 編製索引是Microsoft 365 服務存取 Microsoft Graph 中大量數據的重要方式之一,Microsoft 365 租用戶位於其中。 透過編製索引,使用者會看到來自 Microsoft Graph 的搜尋結果,包括來自您租使用者中大部分Microsoft 365 應用程式的內容和訊號。 這可確保根據您在內容與網路中人員之間的連線,將搜尋結果個人化並提升。
與 Microsoft Graph 中數據的互動是以關鍵詞比對、個人化和社交比對為基礎。 關鍵詞搜尋會針對 Microsoft Graph 中的索引進行查詢,該索引會對應至檔或一組檔中的位置。 Microsoft 365 使用 Microsoft Graph,根據其對使用者及其關閉網路之其他訊號的知識,來排名最相關的內容。 這稱為 Microsoft 365 中的個人化和社交比對,可針對組織中的內容推動查詢的相關性。 Microsoft Graph 中的租用戶數據存取權是由角色型訪問控制所限制。 組織一律透過 Microsoft 365 系統管理中心 中的搜尋和智慧入口網站來控制Microsoft搜尋功能。
語意索引如何協助管理您的數據
語意索引可增強 Business Chat 和 Microsoft 365 應用程式中的 Microsoft 365 Copilot 體驗。 它支援增強的內容基礎,以及您在線數據的概念性理解,並由Microsoft自動啟用。 其會藉由建立向量化索引來執行此作業。 向量是單詞、影像圖元或其他資料點的數值表示法。 向量會以彼此相近的近似數位來排列或對應,以表示相似度。 向量會儲存在多維度空間中,其中語意類似的數據點會叢集在向量空間中,讓Microsoft 365 能夠處理「完全相符」以外的一組更廣泛的搜尋查詢。
實際上,這表示Microsoft 365 服務,例如 Microsoft 365 Copilot 可以:
- 瞭解不同字詞形式之間的關聯性 (例如技術、技術、技術;美國,美國,美國,美國 美國;狗、貓、寵物) 。
- 擷取同義字以擴充可搜尋的資訊量,包括句子、代碼段、檔和會議的意圖。
- 識別查詢或範例內容的相關資產。
下圖使用文字 (,而不是向量化索引所使用的數位) 顯示數據點之間的相似度範例:
語意索引提供快速且精確的相似度搜尋,並根據數據向量距離或相似度擷取數據。 這表示除了使用傳統語彙方法來根據完全相符或預先定義的準則進行查詢之外,語意索引還可以根據語意或內容意義來尋找最相似或相關的數據。
功能
下列語意索引功能不但可增強搜尋結果;它們共同合作可協助您了解數據、更快速地尋找資訊,以及提高生產力。 使用者一開始可以透過 Microsoft 365 Copilot整合來與語意索引互動。 我們會為具有付費 Microsoft 365 Copilot 授權的用戶產生語意索引。 以下是每個功能運作方式的詳細數據。
Microsoft Copilot 搭配圖形式聊天
語意索引可藉由了解查詢的意圖,並將其他資訊附加至您的 Microsoft Copilot 提示,協助使用圖形式聊天 Microsoft Copilot 內呈現結果。 相關信息會在 Microsoft Graph 和語意索引中取得,以提供大型語言模型 (LLM) ,並提供要推理的詳細資訊。 例如,假設您想要 Microsoft Copilot 找到同事正在瀏覽廠商設計工作的電子郵件。 語意索引包含附近的字組 (例如,在搜尋中) ,以提升搜尋區域並提供最佳結果。 所有這些工作都會在幕後進行,以將相關性新增至您使用 Microsoft Copilot 搜尋的結果,而不會增加複雜度。
語意索引的運作方式
語意索引可增強 Microsoft 365 應用程式、SharePoint Online 和 Microsoft Teams 中的 Microsoft Copilot 和搜尋結果。 它支援增強的搜尋體驗,以及您在線數據的概念性理解,並由Microsoft自動啟用。
現今會在租用戶層級建立語意索引。 這是從以文字為基礎的 SharePoint Online 檔案產生的全組織索引,可供兩位或多位人員透過網站繼承存取。 不過,只有在用戶已經擁有角色型訪問控制所控制之內容的存取權時,才會將結果呈現給使用者。 此外,SharePoint Online 網站必須保持可搜尋狀態。 我們也會及時產生用戶層級的索引內容。 這會新增一組工作數據的個人化索引,可供執行日常工作的使用者存取。 這包括您所製作或互動的任何文字型內容,例如電子郵件、提及您的檔,或您在或共用上留言的檔。
下一節說明如何啟用每個索引、Microsoft 365 Copilot 中的數據流如何使用語意索引、每個索引可以處理的檔類型,以及每個索引如何處理更新。
支援
每個 Microsoft 365 Copilot 客戶現在都有租用戶層級語意索引。 編製索引程式不需要系統管理介入。
數據流
語意索引會與 Microsoft Graph 互動,讓用戶能夠存取索引中的資訊。 下圖顯示數據流如何使用 Microsoft 365 Copilot 來處理要求。
來自 Microsoft 365 應用程式的使用者提示會傳送至 Copilot (1) ,而 Copilot 會存取 Microsoft Graph 和語意索引,以處理 (2) 。 Copilot 會將修改過的提示傳送至大型語言模型 (3) 、接收 LLM 回應 (4) ,然後存取Microsoft圖形和語意索引,以進行後置處理 (5) 。 Copilot 接著會將回應和應用程式命令傳送回Microsoft 365 應用程式。 所有要求都會由 HTTPS 加密,而客戶數據會在待用時保持加密。
支援的內容類型
語意索引支援對下表所列的使用者信箱和文件類型編製索引,並隨著時間支援更多文件類型。 數據表中包含用戶層級索引和租用戶層級索引的支援檔類型清單。
內容/檔案類型 | 用戶層級 | 租使用者層級 |
---|---|---|
使用者信箱 | 支援 | 不適用 |
委派的信箱 | 不支援 | 不適用 |
共用信箱 | 不支援 | 不適用 |
封存的信箱數據 | 不支援 | 不適用 |
封存的 SharePoint 數據 | 不支援 | 不支援 |
Word 檔 (檔/檔) | 支援 | 支援 |
PowerPoint (pptx) | 支援 | 支援 |
PDF 檔案 | 支援 | 支援 |
(aspx) 的網頁 | 支援 | 支援 |
OneNote 檔案 (一個) | 支援 | 支援 |
圖形連接器數據 | 不適用 | 支援 |
注意事項
PDF、PPTX 和 DOCX 擴充功能現在支援最多 512MB 的檔案。 這項增強功能可讓 Copilot 使用者有效地分析、摘要,並從這些大型檔案產生見解。
索引更新
當語意索引第一次完成客戶的索引編製時,使用者所建立的檔會在使用者的信箱中以近乎即時的方式編製索引。 新增至 SharePoint Online 網站的新檔,可透過網站繼承存取,由兩位或多個使用者每日編製索引。 當已編製索引的使用者和租用戶層級檔更新時,變更會立即編製索引。
系統管理
我們會為系統管理員提供選擇性活動,以透過 Microsoft 365 系統管理中心 來準備和管理語意索引。 啟用語意索引不需要系統管理介入,因為服務是由Microsoft自動啟用。 語意索引是Microsoft 365 搜尋服務的改進,無法停用。
系統管理員可以選擇準備和管理語意索引,方法是檢閱 在 SharePoint 中規劃和部署檔案共同 作業的考慮,以及 SharePoint 新式體驗中的共享許可權。 系統管理員可以選擇從語意索引中排除檔案,方法是檢閱使用 Microsoft Purview 資料外洩防護 (DLP) 排除數據的考慮。 如果 DLP 解決方案不存在,系統管理員可以從租用戶層級索引中排除 SharePoint Online 網站。
排除 SharePoint Online 網站
有時候,沒有 Microsoft Purview 資料外洩防護 的組織可能會想要排除 SharePoint Online 網站,使其數據由Microsoft搜尋編製索引。 這些步驟應該只考慮敏感數據,例如薪資、人力資源或財務資訊。 若要排除 SharePoint Online 網站,請遵循下列步驟:
以適當的系統管理員許可權瀏覽至網站。
從下拉功能表 中選取 [設定 ],然後選取 [ 網站資訊 ]。
選 取 [檢視所有網站設定 ] 以顯示 [網站設定] 頁面。
選取 [搜尋] 類別底下的 [搜尋和離線可用性],然後針對 [允許此網站出現在搜尋結果中] 選取 [否],將它從 [搜尋] 和 [語意索引搜尋] Microsoft排除。 您也可以針對多個網站使用PowerShell來執行此動作。
Microsoft搜尋和語意索引僅支援從租用戶層級索引排除 SharePoint 在線內容。 沒有選項可從僅限搜尋或語意索引中排除Microsoft結果;動作會同時套用至這兩者。
設定專案深入解析
在 Microsoft 365 系統管理中心 的 [搜尋與智慧] 頁面上,預設會啟用 [專案深入解析]。 關閉人員或專案深入解析可減少Microsoft搜尋和語意索引體驗,因為結果不會包含可能衍生自通訊群組或組織結構的相關人員。
人員 深入解析會根據使用者在 Microsoft 365 中的公開共同作業工作,為使用者提供相關人員的清單。 公用共同作業包括公用通訊群組的成員,以及在組織結構中聯機的個人。
專案深入解析 可讓您組織中的人員根據其在 Microsoft 365 中的共同作業來提供建議。 這些建議可能包含但不限於檔或其他類型的內容,並顯示在人員卡片中, (聯繫人) 、Delve、Microsoft 365 應用程式、Microsoft Copilot 結果和其他位置。
專案深入解析和 人員 深入解析都未涵蓋以使用者自己的數據為基礎的個人化功能。
合併第三方資訊
組織可以使用 Copilot 連接器,將來自外部來源的組織數據或內容帶入 Microsoft Graph,然後將其帶入語意索引中。 Microsoft索引所有 Graph 連接器數據,同時維護內容的訪問控制。 這會擴充可在您的Microsoft 365 生產力應用程式和更廣泛的Microsoft生態系統中搜尋的內容來源類型,並且在連接器內容為文字豐富時效果最佳。 第三方數據可以裝載於內部部署或公用或私人雲端中,而這項資訊是由 Microsoft Graph 取用,其可內嵌到語意索引中,以協助貴組織提供跨Microsoft 365 和貴組織第三方內容的所有內容。 如需深入了解圖表連接器授權需求,請參閱授權需求和定價 Microsoft 365 企業版 和 Microsoft 365 Copilot。
隱私權、合規性和安全性
Microsoft 365 租用戶內的權限模型可協助確保資料不會在使用者、群組和租用戶之間意外洩漏。 語意索引只會提供每個人員可以使用相同基礎控件存取數據的數據,以存取其他Microsoft 365 服務中的數據。 語意索引會接受以使用者身分識別為基礎的存取界限,因此接地程式只會存取目前用戶有權存取的內容。 如需詳細資訊, 請參閱Microsoft的隱私策略和服務檔。
Microsoft 365 Copilot 符合我們對 Microsoft 365 商業客戶的現有隱私權、安全性和合規性承諾,包括一般資料保護規定 (GDPR) 和歐盟 (EU) 資料邊界。 透過語意索引存取的 提示、回應和數據不會用來定型基礎 LLM,包括 Microsoft 365 Copilot 所使用的 LLM。 如需詳細資訊,請參閱數據、隱私權和安全性 Microsoft 365 Copilot。
儲存和處理
語意索引所產生的數據會保留在貴公司的租用戶內,並符合您的安全性、合規性、身分識別,以及隱私策略和程式。 語意索引僅適用於您的使用者已具有許可權且不會影響記憶體配額的內容。
用戶層級索引資訊會儲存在使用者信箱所在的位置。 另一方面,租用戶層級索引資訊會儲存在隔離且受保護的客戶租使用者容器中。 此容器位於 SharePoint 網站所在的區域,可以是主區域或租用戶系統管理員指定的另一個區域。針對歐盟數據界限 (EUDB) 內的客戶,索引會儲存在以 EU/EFTA 為基礎的數據中心內。 處理其他客戶可能會在租用戶區域或 美國 中進行。 針對多地理位置組織,會遵守所有地理界限。 區域內數據會儲存並在每個區域中處理。
Microsoft Purview 客戶金鑰 (BYOK) 支援
語意索引提供您自己的密鑰 (BYOK) 支援已在其環境中啟用 BYOK 的企業。 Microsoft會自動為啟用 BYOK 的客戶啟用語意索引,而不需要任何系統管理介入。
資訊保護
在搜尋內容中,沒有其他方法可以使用資訊保護功能從語意索引中排除數據。 語意索引會從Microsoft搜尋繼承安全性和隱私權設定,而從第三方連接器傳入的數據會提供與其他Microsoft 365 數據相同的儲存和保護。 針對調查其他資訊保護選項的組織,Microsoft 365 提供Microsoft 365 應用程式中的內建功能。 附加元件產品也可用來協助系統管理員透過數據最小化和減少過度共享來保護組織數據。 下列各節概述僅供組織參考的選項。
數據最小化
數據最小化可減少貴組織可能存取的可用數據量。 為了符合規範和法規需求,通常需要保留和刪除內容,但刪除不再具有商業價值的內容也可協助您管理風險和責任。 Microsoft Purview 資料生命週期管理 是個別授權的,可用來刪除保留原則不再需要的內容以進行大規模管理,以及保留卷標以進行例外狀況和細微控制。
減少過度共用
組織早已能夠使用 Microsoft 365 系統管理中心 和 SharePoint Online 中的現有控件,在 Microsoft 365 中採取動作來減少過度共用。 請務必注意,語意索引不會變更內容的訪問許可權,也不會變更用戶應該如何與同事共用信息的原則。 例如,語意索引不會讓內容與鏈接共用,該連結可與我組織中每個人一起使用租用戶層級索引的一部分。 只有選取可存取連結的使用者,才會將資訊新增至其使用者索引。 建議組織在探索資訊保護選項時考慮下列事項:
規劃安全檔案共同作業 – 檢閱 規劃和部署檔案共同作業 ,以深入瞭解為使用者操作安全且具生產力檔案共同作業環境的建議做法。
使用者存取數據以減少清單的大小正確 – 藉由繼承 SharePoint Online 網站的排除清單並即時執行訪問控制檢查,來減少過度共用。 組織可以考慮使用 Syntex SharePoint 進階管理附加元件 來管理和控管這些許可權。
使用敏感度標籤 - 減少內容過度共用的另一種方式是使用 Microsoft Purview 資訊保護 套用敏感度標籤,這可讓您根據敏感度分類數據,並套用加密和內容行銷等保護。 敏感度標籤也包含在搜尋修剪 (,也就是支援用於視覺標記和存取限制的篩選和應用端規則) 。
限制存取– Microsoft Purview 資料外洩防護 可在 Microsoft 365 E5 中使用,而且可用來回溯並暫時限制對已回報為過度共用之檔的存取。 您沒有 Microsoft 365 E5 授權的組織可以使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助管理您的數據安全性與合規性需求。
對於想要探索如何部署進階資訊保護解決方案的客戶,請檢閱下列文章,說明如何 使用 Microsoft Purview 部署資訊保護解決方案。 如需 Microsoft Purview 如何協助您強化 Microsoft 365 Copilot 資料安全性與合規性需求的詳細資訊,請參閱使用 Microsoft Purview 保護和管理 Microsoft 365 Copilot 互動。
其他資源
Microsoft 365,Microsoft圖形和語意索引可讓您利用Microsoft 365 數據,以空前表達方式搜尋、聊天和交談。 這種表達性有助於呈現正確的接地數據,以使用 Microsoft 365 和 Microsoft 365 Copilot 充分利用您的組織數據。
若要深入瞭解 Microsoft 365 Copilot,請參閱下列資源: