Compreender a inteligência artificial e a Visão Personalizada

Concluído

Agora que tem o seu projeto pronto, vamos fazer uma descrição geral sobre o que vamos fazer. A IA (inteligência artificial) é exatamente isso – artificial. A IA é uma inteligência simulada que utiliza uma enorme quantidade de dados para a suportar.

No caso específico da Deteção de Objetos da IA de Visão Personalizada, podemos dividir o processo em dois passos:

  1. Indica à IA onde se encontra um objeto numa imagem.
  2. Dá à IA uma imagem com o objeto nela e a IA indica a localização do objeto.

Parece simples, mas como é que a IA sabe fazer isso?

Reconhecimento de imagem: Cor

Embora os detalhes sobre a forma como a IA é criada estejam fora do âmbito deste módulo, podemos começar a compreender como ela funciona. Os computadores dependem do que pode ser convertido em dados, mais especificamente, dos números. Poderia imaginar um computador que, quando lhe é mostrado uma imagem, consegue passar por cada pixel e indicar a cor em cada localização. Este computador não seria "inteligente", mas seria capaz de lhe indicar a cor de cada pixel à medida que passa por cada um eles.

Agora imagine que o computador é um pouco mais inteligente e consegue identificar a cor primária que aparece numa imagem. Podemos já começar a ensinar (ou seja, preparar em IA) o computador a identificar imagens. Por exemplo, se mostrasse ao computador esta imagem de Bungee:

Image that shows mostly Bungee.

O computador provavelmente compreenderia que as imagens que são principalmente brancas e amarelas são imagens da Bungee. E se mostrássemos ao computador esta imagem de Chang'e?

Image that shows Chang'e playing ping pong.

Esta imagem também tem muito branco e amarelo, pelo que o computador provavelmente consideraria que também se tratava de uma imagem da Bungee.

E se mostrássemos ao computador esta imagem da Bungee ao lado do céu noturno?

Image that shows Bungee looking at the Moon.

Há branco, mas não há amarelo, pelo que o computador provavelmente consideraria que não se tratava de uma imagem de Bungee.

Reconhecimento de imagem: Forma

Para considerar imagens de objetos diferentes com cores semelhantes ou imagens do mesmo objeto com cores diferentes, evoluímos os algoritmos de IA para começarem a reconhecer linhas e formas. Pode começar a imaginar a forma como isto foi feito no início do desenvolvimento de IA. Uma linha ou forma pode ser descrita como a mudança de cor.

Em vez de controlar apenas cores agregadas numa imagem, o computador começaria também a considerar a posição destas cores. Se as mesmas cores estiverem próximas umas das outras, provavelmente estão a criar uma linha ou forma.

Este tipo de análise pode ser útil, por exemplo, se começarmos a identificar imagens da Lua. Podemos dizer que a Lua está numa imagem se existir um círculo branco, normalmente com um fundo azul ou preto, como esta:

Image that shows the Moon against a night sky.

E se mostrássemos ao computador esta imagem?

Image that shows the Moon behind Fei Fei.

O computador provavelmente continuaria a reconhecê-la porque há um círculo branco distinto com um fundo azul ou preto.

No entanto, o computador provavelmente não seria capaz de reconhecer isto como uma imagem da Lua:

Image that shows the Moon with a big dog taking a bite from it.

Isto porque não é um círculo branco completo.

Reconhecimento de imagem: IA avançada

Como pode ver, a evolução da IA, especificamente em relação ao reconhecimento de imagens, começou por ser simples e ficou mais complexa à medida que mais pessoas começaram a investir em formas de ajudar os computadores a descobrir o que estavam a ver. No mundo atual, e na IA que orienta o recurso de Visão Personalizada do Azure, o reconhecimento de imagens considera muito mais do que apenas cor ou forma. A IA foi preparada com base em milhares e milhões de imagens. A IA consegue detetar pequenas diferenças entre gatos e cães, o que poderá parecer óbvio para um ser humano. No entanto, se um computador examinasse duas formas castanhas com caudas e orelhas, com o mesmo tamanho e quatro pernas, pode começar a ver como a diferenciação das características de um gato e de um cão é impressionante.

Preparação com base em imagens específicas

Embora a IA avançada consiga detetar vários objetos comuns (cães vs. gatos, carros vs. bicicletas), ainda é preciso fazer algum trabalho se quiser preparar a IA para reconhecer um objeto específico, ou seja, uma personagem específica de um filme específico, como a Bungee.

É aqui que entra o serviço Visão Personalizada. Este serviço tem como base a IA que já tem algum conhecimento do mundo, mas não sabe nada sobre a Bungee (ou o seu animal de estimação). Portanto, o que vamos fazer é fornecer muitas imagens da Bungee e dizer à IA que são a Bungee. Cada imagem que fornecemos da Bungee fornece à IA mais dados de características que representam especificamente a Bungee. Quantas mais imagens houver da Bungee, com diferentes ângulos, iluminação e tamanhos, melhor a IA conseguirá reconhecer a Bungee numa imagem maior.

A isto chama-se preparar a IA.

Em seguida, vamos testar a nossa IA para ver se foi bem preparada. Para tal, vamos fornecer imagens que contêm a Bungee e que a IA nunca viu. É fundamental que teste com imagens que não foram utilizadas para preparar a IA. Caso contrário, não estará efetivamente a testar a capacidade de a IA reconhecer a Bungee. Está apenas a reconhecer a capacidade de a IA se lembrar que viu exatamente essa imagem.

Este é o passo de predição do nosso projeto e que se chama testar a IA.

Depois de ter validado que a predição da IA é suficientemente exata, pode implementar a sua IA para que outras pessoas a possam utilizar para identificar objetos com telemóveis ou computadores. Essa atividade não é abrangida neste módulo, mas é algo que deve definitivamente experimentar!

Nota

Lembra-se quando criámos o projeto de Visão Personalizada no portal de Visão Personalizada e nos perguntaram qual era a região que queríamos para preparar e prever separadamente? Isso porque poderá estar a preparar a IA a partir de sua casa, por exemplo, em Seattle ou Washington. Neste caso, pretendia utilizar recursos de cloud próximos de si para que o processo fosse rápido. Contudo, poderá estar a implementar esta IA na casa da sua mãe que vive em Londres e pretende que ela obtenha as predições de forma rápida. Nesse caso, pretendia utilizar recursos de cloud mais próximos dela para as predições.