Como os computadores enxergam o mundo ao nosso redor?

19 de janeiro de 2024

Emanuella Dias Ferreira

🤖A cada ano que passa a tecnologia evolui mais rápido e hoje já estamos produzindo carros autônomos e robôs assistentes. Muitas pessoas passaram a se perguntar como é possível um computador desempenhar atividades que necessitam de habilidades humanas como identificação e descrição de objetos. Tudo isso foi possível graças ao surgimento da Visão Computacional, uma área de estudos de Inteligência Artificial que vem sendo desenvolvido há décadas para tornar computadores capazes de interpretar imagens através de grande volume de dados.

👁️Como a Visão Computacional surgiu?

🧑‍🏫Durante a década 60, o matemático do MIT Seymour Papert desafiou seus alunos durante o The Summer Vision Project a conseguir fazer um computador descrever as imagens que via numa câmera. Entretanto, eles logo perceberam que seria uma tarefa um pouco mais difícil. Deste modo, marcando o início da Visão Computacional. Entretanto, foi somente no final do século XX e início dos anos 2000 que a habilidade de reconhecimento e caracterização de imagens por computadores alcançou um novo nível. Sendo hoje aplicada a diversas áreas como Medicina, Indústria, Segurança, etc.

⚙️Como ela funciona?

🧠O funcionamento da Visão Computacional é baseado em grande pelas Redes Neurais Convolucionais (CNNs, na sigla em inglês). Entretanto, o processo é dividido em várias etapas

  1. Seleção de imagens para treinamento📸: o cientista de dados insere bancos de imagens de um mesmo objeto em formas, posições ou cores diferentes. Exemplos:

    Depois é necessário tratar as imagens para que o computador a compreenda em forma de pixels e matrizes. Exemplo:
    Na imagem acima podemos verificar que se trata de uma imagem com matriz 28×28 pixels, em que esse pixels estão em tons de cinza.
  2. Extração de características📊: Através da inserção de filtros (matrizes menores) que percorrem os pixels da imagem de entrada e gerando uma nova imagem (Featured Maps. Isto é feito através de uma operação matemática entre a imagem de entrada (I) e Filtro (k), gerando os Feature Maps (I*k). Esse processo é denominado convolução.


    O processo de convolução pode ser realizado diversas vezes pelo Cientista de Dados até que seja obtido os Featured Maps desejados.

  3. Flattening⌨️: Quando os mapas desejados são obtidos é hora de aplicar as técnicas de flattening responsável por transformar a matriz advinda das convoluções em um vetor de 1 colunas e N linhas.
  4. Camada densa🗃️: o vetor produzido pela etapa de flattening dará entrada na camada densa com objetivo de classificar a imagem.Esta camada é formada por uma redes neurais com uma quantidade mínima de neurônios que vão receber esses vetores. Ela pode usar técnicas como DropOut para melhorar resultados. Entretanto, a principal técnica é a de Backpropagation que serve para diminuir erros na camada de saída. Esta técnica é dividida em duas partes. Primeiro, o Forward Pass quando o vetores e valores de entrada se propagam pela rede. Segunda, o Backward Pass em que o gradiente da função de perda da camada final é direcionada recursivamente à regra da cadeia. Deste modo, a rede neural consegue aprender melhores pesos e se adaptar à classificação de objetos e imagens. Terminado o treinamento dessa rede, obtém-se um modelo de classificação que pode ser utilizado para fins específicos (identificação facial em smartphones, carros autônomos, etc)

🧑🏿‍🎓Oportunidades para aprender mais sobre IA, Visão Computacional e chatbots na PUC-Rio:

📊O Laboratório de Inteligência Computacional da PUC-Rio acaba de abrir inscrições para a próxima turma do curso de pós-graduação lato sensu MBA Computer Vision Master. O curso é destinado para profissionais advindos, principalmente, de áreas de exatas que desejam se colocar melhor no mercado de trabalho dentro da Era da Inteligência Artificial.

Diferenciais do ICA PUC-Rio:

🌐Reconhecidas como umas das melhores universidades da américa latina, o ICA juntamente com a PUC-Rio traz como diferenciais:

  • 👔Experiência e Reconhecimento: Líderes no ensino de Machine Learning e Business Intelligence. Corpo docente de excelência, com cientistas de dados, desenvolvedores de IA, doutores, mestres e embaixadores da NVIDIA e Intel.
  • 🛜Metodologia Flexível: Aproveite o formato online com aulas ao vivo, gravações, suporte contínuo de professores e videoconferências para garantir aprendizado eficaz e interativo.
  • 📚Abordagem Multidisciplinar: Mergulhe em uma visão interdisciplinar que combina processamento de imagens, estatística, aprendizado de máquina e aprendizado profundo para formar uma compreensão sólida.
  • 💻Aprendizagem Prática: Aprenda com métodos práticos e frameworks de visão computacional, permitindo a criação rápida de sistemas robustos para resolver desafios de mercado.

📒Conheça o programa do nosso curso clicando aqui. Aproveite a oportunidade e inscreva-se. Descontos especiais de 20% para alunos e ex-alunos do curso BI MASTER.

Outros cursos

📈Tendo em vista os avanços do mercado de trabalho e a curiosidade de profissionais por entender melhor esta tecnologia, bem como, impulsionar a carreira, a PUC-Rio lança seu programa de Pós-graduação MBA BI MASTER – Business Intelligence. Um curso focado em capacitar profissionais em Ciência de Dados e Inteligência Artificial para o ambiente corporativo e de negócios. Além disso, a PUC-Rio oferece um novo curso de extensão focado em LLMs, ChatBots: Chat GPT, AI generativa, Bert, Prompt Engineer e Hugging Engineering.