Compreender a inteligência artificial e a Visão Personalizada
Agora que tem o seu projeto pronto, vamos fazer uma descrição geral sobre o que vamos fazer. A IA (inteligência artificial) é exatamente isso – artificial. A IA é uma inteligência simulada que utiliza uma enorme quantidade de dados para a suportar.
No caso específico da Deteção de Objetos da IA de Visão Personalizada, podemos dividir o processo em dois passos:
- Indica à IA onde se encontra um objeto numa imagem.
- Dá à IA uma imagem com o objeto nela e a IA indica a localização do objeto.
Parece simples, mas como é que a IA sabe fazer isso?
Reconhecimento de imagem: Cor
Embora os detalhes sobre a forma como a IA é criada estejam fora do âmbito deste módulo, podemos começar a compreender como ela funciona. Os computadores dependem do que pode ser convertido em dados, mais especificamente, dos números. Poderia imaginar um computador que, quando lhe é mostrado uma imagem, consegue passar por cada pixel e indicar a cor em cada localização. Este computador não seria "inteligente", mas seria capaz de lhe indicar a cor de cada pixel à medida que passa por cada um eles.
Agora imagine que o computador é um pouco mais inteligente e consegue identificar a cor primária que aparece numa imagem. Podemos já começar a ensinar (ou seja, preparar em IA) o computador a identificar imagens. Por exemplo, se mostrasse ao computador esta imagem de Bungee:
O computador provavelmente compreenderia que as imagens que são principalmente brancas e amarelas são imagens da Bungee. E se mostrássemos ao computador esta imagem de Chang'e?
Esta imagem também tem muito branco e amarelo, pelo que o computador provavelmente consideraria que também se tratava de uma imagem da Bungee.
E se mostrássemos ao computador esta imagem da Bungee ao lado do céu noturno?
Há branco, mas não há amarelo, pelo que o computador provavelmente consideraria que não se tratava de uma imagem de Bungee.
Reconhecimento de imagem: Forma
Para considerar imagens de objetos diferentes com cores semelhantes ou imagens do mesmo objeto com cores diferentes, evoluímos os algoritmos de IA para começarem a reconhecer linhas e formas. Pode começar a imaginar a forma como isto foi feito no início do desenvolvimento de IA. Uma linha ou forma pode ser descrita como a mudança de cor.
Em vez de controlar apenas cores agregadas numa imagem, o computador começaria também a considerar a posição destas cores. Se as mesmas cores estiverem próximas umas das outras, provavelmente estão a criar uma linha ou forma.
Este tipo de análise pode ser útil, por exemplo, se começarmos a identificar imagens da Lua. Podemos dizer que a Lua está numa imagem se existir um círculo branco, normalmente com um fundo azul ou preto, como esta:
E se mostrássemos ao computador esta imagem?
O computador provavelmente continuaria a reconhecê-la porque há um círculo branco distinto com um fundo azul ou preto.
No entanto, o computador provavelmente não seria capaz de reconhecer isto como uma imagem da Lua:
Isto porque não é um círculo branco completo.
Reconhecimento de imagem: IA avançada
Como pode ver, a evolução da IA, especificamente em relação ao reconhecimento de imagens, começou por ser simples e ficou mais complexa à medida que mais pessoas começaram a investir em formas de ajudar os computadores a descobrir o que estavam a ver. No mundo atual, e na IA que orienta o recurso de Visão Personalizada do Azure, o reconhecimento de imagens considera muito mais do que apenas cor ou forma. A IA foi preparada com base em milhares e milhões de imagens. A IA consegue detetar pequenas diferenças entre gatos e cães, o que poderá parecer óbvio para um ser humano. No entanto, se um computador examinasse duas formas castanhas com caudas e orelhas, com o mesmo tamanho e quatro pernas, pode começar a ver como a diferenciação das características de um gato e de um cão é impressionante.
Preparação com base em imagens específicas
Embora a IA avançada consiga detetar vários objetos comuns (cães vs. gatos, carros vs. bicicletas), ainda é preciso fazer algum trabalho se quiser preparar a IA para reconhecer um objeto específico, ou seja, uma personagem específica de um filme específico, como a Bungee.
É aqui que entra o serviço Visão Personalizada. Este serviço tem como base a IA que já tem algum conhecimento do mundo, mas não sabe nada sobre a Bungee (ou o seu animal de estimação). Portanto, o que vamos fazer é fornecer muitas imagens da Bungee e dizer à IA que são a Bungee. Cada imagem que fornecemos da Bungee fornece à IA mais dados de características que representam especificamente a Bungee. Quantas mais imagens houver da Bungee, com diferentes ângulos, iluminação e tamanhos, melhor a IA conseguirá reconhecer a Bungee numa imagem maior.
A isto chama-se preparar a IA.
Em seguida, vamos testar a nossa IA para ver se foi bem preparada. Para tal, vamos fornecer imagens que contêm a Bungee e que a IA nunca viu. É fundamental que teste com imagens que não foram utilizadas para preparar a IA. Caso contrário, não estará efetivamente a testar a capacidade de a IA reconhecer a Bungee. Está apenas a reconhecer a capacidade de a IA se lembrar que viu exatamente essa imagem.
Este é o passo de predição do nosso projeto e que se chama testar a IA.
Depois de ter validado que a predição da IA é suficientemente exata, pode implementar a sua IA para que outras pessoas a possam utilizar para identificar objetos com telemóveis ou computadores. Essa atividade não é abrangida neste módulo, mas é algo que deve definitivamente experimentar!
Nota
Lembra-se quando criámos o projeto de Visão Personalizada no portal de Visão Personalizada e nos perguntaram qual era a região que queríamos para preparar e prever separadamente? Isso porque poderá estar a preparar a IA a partir de sua casa, por exemplo, em Seattle ou Washington. Neste caso, pretendia utilizar recursos de cloud próximos de si para que o processo fosse rápido. Contudo, poderá estar a implementar esta IA na casa da sua mãe que vive em Londres e pretende que ela obtenha as predições de forma rápida. Nesse caso, pretendia utilizar recursos de cloud mais próximos dela para as predições.