了解人工智慧與自訂視覺

已完成

現在您已備妥專案,就可以逐步了解我們所即將進行項目的概觀。 人工智慧 (AI) 正如其名:人工。 AI 是模擬智慧,其使用「大量」的資料為後盾。

特別是看自訂視覺 AI 的物件偵測,我們可將處理序分成兩個步驟:

  1. 告訴 AI 物件在影像中的位置。
  2. 提供 AI 具有物件的圖片,然後 AI 會告知物件的所在位置。

聽起來相當簡單,但 AI 如何知道運作的方式?

影像辨識:色彩

雖然深入探討 AI 的建置方式超出本課程模組討論範圍,但我們可從其運作方式開始了解。 電腦會依賴可轉換成資料的內容 -- 更明確的說,就是數字。 您可想像當電腦顯示影像時,可以檢查每個像素,並告訴您每個位置的色彩。 此電腦並非「智慧型」,但其可在檢查像素時告訴您每個像素的色彩。

現在想像電腦更聰明一點,且可識別影像中顯示的主要色彩。 我們已經可以開始「教學」(在 AI 中稱為「訓練」) 電腦以識別影像。 例如,若我向電腦顯示這張蹦吉的圖片:

主要顯示蹦吉的影像。

電腦可能會理解白色與黃色佔大部分的圖片,就是有蹦吉的圖片。 但是,若我們向電腦顯示這張嫦娥的圖片呢?

顯示嫦娥打乒乓球的影像。

該圖片也有許多白色與黃色,因此電腦可能會認為這也是蹦吉的圖片。

若我們向電腦顯示這張蹦吉在夜空下的圖片呢?

顯示蹦吉看著月球的影像。

有白色,但完全沒有黃色,因此電腦可能會認為這「並非」蹦吉的圖片。

影像辨識:圖形

為了解釋具有類似色彩的不同物件影像,或具有不同色彩的相同物件影像,我們演進了 AI 演算法,以開始辨識線條與圖形。 您可開始想像如何在 AI 開發之初完成此作業。 可將線條或圖形描述為色彩的轉移。

電腦會開始將這些色彩的位置納入考量,而非只追蹤影像中的彙總色彩。 若相同的色彩相鄰,則色彩之間可能正在建立線條或圖形。

這種分析可能很有用 (例如,若我們要開始識別月亮的圖片)。 現在若圖片中有白色圓形 (通常針對藍色或黑色背景),我們就可以說其中有月亮,如下所示:

顯示夜空中月球的影像。

以及若我們向電腦顯示這張圖片:

顯示菲菲身後月球的影像。

電腦可能仍可辨識,因為有與藍色或黑色背景相異的白色圓形。

但電腦可能無法將下列圖片辨識為月球的圖片:

顯示一隻大狗咬一口月球的影像。

因為該月亮並非完整的白色圓形。

影像辨識:進階 AI

如您所見,AI 的進展 (特別是在影像辨識方面) 從一開始簡單,到因為越來越多人開始以各種方式投資,以協助電腦找出其看到的內容,而變得更複雜。 在今天的世界,以及用來驅動 Azure 自訂視覺資源的 AI 中,影像辨識將許多因素納入考量,而非只有色彩或圖形。 AI 已經在成千上萬個影像上訓練過。 AI 可偵測貓與狗之間的輕微差異,其可能對人類而言很明顯。 但是,若電腦看著兩個大小相同、四腳、具有尾巴與耳朵的褐色圖形,那麼您就可以看到區分貓與狗的特徵如何讓人印象深刻。

特定影像的訓練

雖然進階 AI 能夠偵測許多常見的物件 (狗與貓、汽車與自行車),但若想要訓練 AI 以辨識「特定的」物件 (例如蹦吉之類特定電影的特定人物),仍必須完成工作。

這是自訂視覺服務開始起作用的地方。 此服務其 AI 具有某些世界知識的背景,但對蹦吉 (或您的寵物) 「一無所知」。 所以我們要提供許多蹦吉的圖片,告訴 AI:它們是蹦吉。 我們每提供一個有蹦吉的影像,AI 就擁有更多專門代表蹦吉的特性資料。 有愈多不同角度、燈光和大小的蹦吉圖片,AI 就愈能夠從更大的影像中辨識出蹦吉。

這稱為「訓練」AI。

接下來,我們將測試 AI 以查看其是否已訓練完成。 我們的做法是提供其之前「從未」看過且包含蹦吉的影像。 這很「重要」,因為您會使用 AI 「尚未」用於訓練的圖片進行測試。 否則,您實際上並非測試其辨識蹦吉的能力。 您只是辨識其記住看過該精確圖片的能力。

這是「預測」您專案的步驟,稱為「測試」 AI。

在驗證 AI 的預測是否足夠精確之後,即可部署 AI,以便讓其他人可使用手機或電腦來識別物件。 雖然該活動超出本課程模組的範圍,但絕對值得您試用看看!

注意

請記住,何時要在自訂視覺入口網站中建立自訂視覺專案,以及何時詢問要個別進行訓練及預測的地區? 這是因為您可能會 (例如從華盛頓州西雅圖) 訓練您的 AI。 在此情況下,您會想要使用接近雲端資源,以便有快速的處理序。 但是,您可能會將此 AI 部署給位於倫敦的母親,而您想要她能夠「快速」取得預測。 在此情況下,您會想要對預測使用更接近她的雲端資源。