• WebLuneta Agência

Pesquisadores conseguem fazer com que Inteligência Artificial “imagine” o invisível

O avanço dessa técnica pode permitir criar novos medicamentos e maior segurança para veículos autônomos, por exemplo.


Uma equipe de pesquisadores da University of Southern California (#USC) está ajudando a #IA a imaginar o invisível, uma técnica que também pode levar a uma IA olhares mais humanos e permitir a criação de novos medicamentos e maior segurança para veículos autônomos, por exemplo.


Imagine um gato laranja. Agora, imagine o mesmo gato, mas com pelo preto. Agora, imagine o gato andando ao longo da Grande Muralha da China. Fazendo isso, uma série rápida de ativações de neurônios em seu cérebro surgirá com variações da imagem apresentada, com base em seu conhecimento prévio do mundo.


Em outras palavras, como humanos, é fácil imaginar um objeto com atributos diferentes. Mas, apesar dos avanços em redes neurais profundas que correspondem ou superam o desempenho humano em certas tarefas, os computadores ainda lutam com a habilidade humana de "imaginação".


Agora, uma equipe de pesquisa da USC composta pelo professor de ciência da computação Laurent Itti e os alunos de PhD Yunhao Ge, Sami Abu-El-Haija e Gan Xin, desenvolveu uma IA que usa recursos semelhantes aos humanos para imaginar um objeto nunca visto com diferentes atributos. O artigo, intitulado “Zero-Shot Synthesis with Group-Supervised Learning”, foi publicado na Conferência Internacional de 2021 sobre Representações de Aprendizagem em 7 de maio.


“Fomos inspirados pelas capacidades de generalização visual humana para tentar simular a imaginação em máquinas”, disse Ge, o principal autor do estudo.


“Os humanos podem separar seu conhecimento aprendido por atributos - por exemplo, forma, pose, posição, cor - e então recombiná-los para imaginar um novo objeto. Nosso artigo tenta simular esse processo usando redes neurais”.

Quando um humano vê a cor de um objeto ele pode aplicá-la a outro usando a imaginação
Quando um humano vê a cor de um objeto ele pode aplicá-la a outro usando a imaginação (Imagem: Reprodução/USC)

PROBLEMA DE GENERALIZAÇÃO DA IA


Por exemplo, digamos que você queira criar um sistema de IA que gere imagens de carros. Normalmente, você forneceria ao algoritmo algumas imagens de um carro, e ele seria capaz de gerar muitos tipos de carros em qualquer cor, de vários ângulos.


Este é um dos objetivos da IA: criar modelos que possam ir além do que apenas os dados previamente apresentados. Isso significa que, dados alguns exemplos, o modelo deve ser capaz de extrair as regras subjacentes e aplicá-las a uma vasta gama de novos exemplos que não viu antes. Mas as máquinas são mais comumente treinadas em recursos de amostra, pixels por exemplo, sem levar em conta os atributos do objeto.


A CIÊNCIA DA IMAGINAÇÃO


Neste novo estudo, os pesquisadores tentam superar essa limitação usando um conceito denominado desemaranhamento que pode ser usado para gerar modificações (falsificações) profundas, por exemplo, ao desemaranhar os movimentos e a identidade do rosto humano. Ao fazer isso, disse Ge, “as pessoas podem sintetizar novas imagens e vídeos que substituem a identidade da pessoa original por outra pessoa, mas mantêm o movimento original”.


Da mesma forma, a nova abordagem pega um grupo de imagens de amostra - em vez de uma amostra por vez, como os algoritmos tradicionais fizeram - e analisa a semelhança entre eles para alcançar algo chamado de "aprendizagem de representação desemaranhada controlável"


Em seguida, ele recombina esse conhecimento para alcançar uma “nova síntese de imagem controlável”, ou o que você pode chamar de imaginação. “Por exemplo, tome o filme Transformer como exemplo”, disse Ge, “ele pode assumir a forma de um carro Megatron, a cor e a pose de um carro Bumblebee amarelo e o plano de fundo da Times Square de Nova York. O resultado será um carro Megatron cor de abelha dirigindo na Times Square, mesmo que esta amostra não tenha sido testemunhada durante a sessão de treinamento”.


Isso é semelhante como nós, como humanos, extrapolamos: quando um humano vê uma cor de um objeto, podemos aplicá-la facilmente a qualquer outro objeto, substituindo a cor original pela nova. Usando sua técnica, o grupo gerou um novo conjunto de dados contendo 1,56 milhão de imagens que podem auxiliar pesquisas futuras na área.

Imagens de treinamento (na parte inferior) são usadas para "imaginar" novas figuras (Imagem: Reprodução/USC)
Imagens de treinamento (na parte inferior) são usadas para "imaginar" novas figuras (Imagem: Reprodução/USC)

Fonte: USC


VEJA TAMBÉM