資料科學與數據工程 Copilot 概觀 (預覽)
重要
這項功能目前處於 預覽版。
適用於數據科學和數據工程的 Copilot 是一個 AI 助理,可協助分析和可視化數據。 它可與 Lakehouse 數據表和檔案、Power BI 數據集和 pandas/spark/fabric 數據框架搭配使用,直接在筆記本中提供答案和代碼段。 使用 Copilot 最有效的方法是將資料新增為資料框。 您可以在聊天面板中詢問您的問題,而 AI 會提供回應或程式代碼,以複製到您的筆記本中。 它了解數據的架構和元數據,如果數據載入數據框架中,它也會感知數據框架內的數據。 您可以要求 Copilot 提供數據的深入解析、建立視覺效果的程式碼,或提供數據轉換的程式代碼,並辨識檔名以方便參考。 Copilot 藉由排除複雜的程式代碼來簡化數據分析。
注意
- 您的系統管理員必須先啟用租戶切換,才能開始使用 Copilot。 如需詳細資訊,請參閱 Copilot 租用戶設定 一文。
- 您的 F64 或 P1 容量必須位於本文所列的其中一個區域,Fabric 區域可用性。
- 如果您的租用者或容量位於美國或法國之外,則預設會停用
,除非您的 Fabric 租用者管理員在網狀架構管理入口網站中啟用 租用者設定,如此一來,傳送至 Azure OpenAI 的 數據就可以在租用者的地理區域、合規性界限或國家雲端實例之外進行處理。 - 試用版 SKU 不支援 Microsoft Fabric 中的 Copilot。 僅支持付費 SKU(F64 或更新版本或 P1 或更高版本)。
- 網狀架構中的 Copilot 目前正在公開預覽中推出,預計在 2024 年 3 月底之前可供所有客戶使用。
- 如需詳細資訊,請參閱 中有關 Fabric 和 Power BI 的 Copilot 概觀一文。
適用於 Fabric 資料科學的數據科學和數據工程 Copilot 簡介
使用適用於數據科學和數據工程的 Copilot,您可以與 AI 助理聊天,協助您處理數據分析和視覺效果工作。 您可以在筆記本中就 lakehouse 數據表、Power BI 數據集或 Pandas/Spark 數據框架中的問題發表 Copilot 問疑。 Copilot 提供以自然語言或代碼片段形式的解答。 視工作而定,Copilot 也可以為您產生數據特定的程序代碼。 例如,適用於數據科學和數據工程的 Copilot 可以產生下列專案的程式代碼:
- 圖表建立
- 篩選數據
- 套用轉換
- 機器學習模型
首先,選取筆記本功能區中的 Copilot 圖示。 Copilot 聊天面板隨即開啟,且筆記本頂端會出現新的儲存格。 每次 Spark 會話載入 Fabric 筆記本中時,此儲存格都必須執行。 否則,Copilot 體驗將無法正常運作。 我們正在評估其他機制,以在未來版本中處理此必要的初始化。
使用下列程式代碼,在筆記本頂端執行資料格:
#Run this cell to install the required packages for Copilot
%pip install https://aka.ms/chat-magics-0.0.0-py3-none-any.whl
%load_ext chat_magics
成功執行儲存格之後,您可以使用 Copilot。 當您的筆記本會話關閉時,您必須重新執行筆記本頂端的儲存格。
若要將 Copilot 效率最大化,請在筆記本中將數據表或數據集載入為數據框架。 如此一來,AI 就可以存取數據並瞭解其結構和內容。 然後,開始與 AI 聊天。 在筆記本工具列中選取聊天圖示,然後在聊天面板中輸入您的問題或要求。 例如,您可以詢問:
- 「此數據集中客戶的平均存留期為何?
- 「顯示依區域分類的銷售條形圖」
還有更多。 Copilot 回應答案或程式碼,接著您可以將其複製並貼上到您的筆記本。 適用於數據科學和數據工程的 Copilot 是一種方便、互動式的方式,可用來探索和分析您的數據。
當您使用 Copilot時,您也可以在筆記本的儲存格中叫用魔法命令,直接在筆記本中獲取輸出。 例如,對於回應的自然語言解答,您可以使用 「%%chat」 命令來詢問問題,例如:
%%chat
What are some machine learning models that may fit this dataset?
或
%%code
Can you generate code for a logistic regression that fits this data?
專為數據科學和數據工程設計的 Copilot 也能識別湖倉中數據表的架構及元數據。 Copilot 可以在附加的 Lakehouse 中的數據內容中提供相關信息。 例如,您可以詢問:
- “湖屋裡有多少張桌子?
- 「客戶資料表的欄位有哪些?」
如果您將 Lakehouse 新增至筆記本,Copilot 將提供相關資訊。 Copilot 也知道新增至筆記本所連結之任何 Lakehouse 的檔名。 您可以在聊天中依名稱參考這些檔案。 例如,如果您的 lakehouse 中有名為 sales.csv 的檔案,您可以詢問「從 sales.csv建立數據框架」。 Copilot 會產生程式代碼,並將其顯示在聊天面板中。 透過筆記本 Copilot,您可以輕鬆地從不同的來源存取和查詢您的資料。 您不需要確切的命令語法即可執行。
提示
- 在 Copilot 聊天面板中,使用位於聊天面板頂端的掃把來「清除」您的交談。 Copilot 會在會話期間保留任何輸入或輸出的資訊,但如果您覺得目前的內容會讓您分心,可以利用這個功能。
- 使用聊天魔術庫來配置 Copilot的各種設定,包括隱私權設定。 預設共享模式的設計目的是最大化 Copilot 可以存取的內容,所以限制提供給 copilot 的資訊會直接且顯著地影響其回應的相關性。
- Copilot 第一次啟動時,它會提供一組實用的提示,可協助您開始使用。 他們可以協助您開始與 Copilot的對話。 若要稍後參考提示,您可以使用聊天面板底部的sparkle按鈕。
- 您可以「拖曳」copilot 聊天的側邊欄,展開聊天面板,以更清楚地檢視程式代碼或提高螢幕上輸出的可讀性。
局限性
Copilot 數據科學體驗中的功能目前限定於筆記本。 這些功能包括 Copilot 聊天窗格、可在程式碼儲存格內使用的 IPython 魔術指令,以及在程式碼儲存格中輸入時的自動程式碼建議。 Copilot 也可以使用語意連結的整合來讀取 Power BI 語意模型。
Copilot 有兩個主要用途:
- 您可以要求 Copilot 檢查和分析筆記本中的數據(例如,先載入 DataFrame,然後詢問 Copilot 關於 DataFrame 內的數據)。
- 第二,您可以要求 Copilot 提供一系列關於您的數據分析過程的建議,例如哪些預測模型可能是相關的、用來進行不同類型數據分析的程式碼,以及已完成筆記本的文件。
請記住,使用快速變動或最近發行的程式庫來產生程式碼可能包含不準確或虛構。