Pesquisadores no laboratório do Google pediram recentemente a um robô para montar um hambúrguer com vários ingredientes de brinquedo de plástico.
O braço mecânico sabia bem que devia adicionar o ketchup depois da carne e antes da alface, mas achava que a maneira certa de fazer isso era colocar a garrafa inteira dentro do hambúrguer.
Embora esse robô não vá estar em breve trabalhando como auxiliar de cozinha em um restaurante, ele é a materialização de uma conquista maior anunciada pelos engenheiros do Google na última terça-feira, 16.
Usando um software de inteligência artificial (IA) desenvolvido recentemente e conhecido como “modelos de linguagem ampla”, os pesquisadores dizem que foram capazes de projetar robôs que podem ajudar os humanos com uma variedade maior de tarefas do dia a dia.
Em vez de dar uma longa lista com instruções – orientando detalhe por detalhe cada movimento das máquinas –, os robôs agora podem atender a solicitações completas, de um jeito mais parecido ao de um humano.
Em uma demonstração na semana passada, um pesquisador disse a um robô: “Estou com fome. Você pode me dar algo para comer?”. O robô então começou a procurar por algo em uma cafeteria, abriu uma gaveta, encontrou um pacote de batatinhas e levou para o pesquisador.
Novo paradigma para a robótica
É a primeira vez que modelos de linguagem são integrados a robôs, segundo os executivos e pesquisadores do Google.
“Este é basicamente um paradigma diferente”, disse Brian Ichter, pesquisador do Google e um dos autores de um artigo divulgado na terça-feira no qual são descritos os avanços alcançados pela empresa.
Robôs já são algo corriqueiro. Milhões deles trabalham em fábricas por todo o mundo, mas seguem instruções específicas e costumam focar em apenas uma ou duas tarefas, como mover um produto pela linha de montagem ou soldar e unir duas peças de metal. A corrida para construir um robô que pode fazer uma série de tarefas do dia a dia – e aprender com o trabalho – é muito mais complexa. Tanto pequenas como grandes empresas de tecnologia trabalham há anos para construir esses robôs de uso geral.
Os modelos de linguagem funcionam a partir de grandes quantidades de texto baixados da internet que são usados para treinar o software de inteligência artificial para adivinhar quais tipos de respostas podem surgir depois de certas perguntas ou comentários. Os modelos se tornaram tão bons em prever a resposta correta, que ao interagir com eles, muitas vezes temos a sensação de estarmos conversando com um ser humano sábio. O Google e outras empresas, incluindo a OpenAI e a Microsoft, investiram recursos para criar modelos melhores e treiná-los com conjuntos de texto cada vez maiores, em vários idiomas.
A atividade é polêmica. Em julho, o Google demitiu um de seus funcionários que afirmou acreditar que o software era senciente. O consenso entre os especialistas em IA é que os modelos não são sencientes, mas muitos estão preocupados com o fato de eles expressarem preconceitos porque foram treinados com quantidades enormes de textos sem filtros e criados por humanos.
Alguns modelos de linguagem demonstraram ser racistas ou machistas, ou facilmente influenciados para espalhar discurso de ódio ou mentiras quando solicitados com as frases ou perguntas certas.
No geral, os modelos de linguagem poderiam dar aos robôs conhecimento de alto nível das etapas de planejamento, disse o professor da Carnegie Mellon, Deepak Pathak, que estuda IA e robótica e comentava a respeito da área de estudo, não especificamente do Google. Mas esses modelos não darão aos robôs todas as informações que eles precisam – por exemplo, quanta força aplicar ao abrir uma geladeira. Esse conhecimento precisa vir de outro lugar.
“Isso resolve apenas a questão do planejamento de alto nível”, disse ele.
De qualquer modo, o Google está avançando e agora combinou os modelos de linguagem com alguns de seus robôs. Atualmente, em vez de ter que codificar instruções técnicas específicas para cada tarefa que um robô é capaz de realizar, os pesquisadores podem simplesmente conversar com eles usando o vocabulário do nosso cotidiano. Ainda mais significativo, o novo software ajuda os robôs a analisarem instruções complexas para várias etapas por conta própria. Agora, os robôs podem interpretar instruções que nunca escutaram antes e elaborar respostas e ações que façam sentido.
Robôs capazes de usar modelos de linguagem poderiam mudar a forma como as fábricas e os centros de distribuição são administrados, disse Zac Stewart Rogers, professor de gestão da cadeia de suprimentos da Universidade do Estado do Colorado.
“Um humano e um robô trabalhando juntos é sempre mais produtivo” hoje, disse ele. “Os robôs podem fazer o trabalho braçal pesado. Os humanos podem solucionar problemas variados.”
Se os robôs forem capazes de compreender tarefas complexas, isso poderia significar que os centros de distribuição poderiam ser menores, com menos humanos e mais robôs. Isso pode significar menos empregos para as pessoas, embora Rogers aponte que geralmente quando há uma redução no quadro de funcionários devido à automação em uma área, empregos são criados em outras.
Ainda resta provavelmente um longo caminho até isso. As técnicas de IA, como redes neurais e aprendizado por reforço, têm sido usadas para treinar robôs há anos. Isso levou a alguns avanços, mas o progresso ainda é lento. Os robôs do Google estão muito longe de estar prontos para o mundo real e, em entrevistas, pesquisadores e executivos do Google disseram inúmeras vezes que estão apenas operando um laboratório de pesquisa e ainda não têm planos de comercializar a tecnologia.
Mas está claro que o Google e outras gigantes da tecnologia têm um grande interesse em robótica. A Amazon usa muitos robôs em seus armazéns, está experimentando a entrega por drones e no início deste mês concordou em comprar a fabricante do robô aspirador Roomba por US$ 1,7 bilhão.
A Tesla, que desenvolveu alguns recursos de direção autônoma para seus veículos, também está trabalhando em robôs de uso geral.
Em 2013, o Google não poupou gastos e fez uma série de aquisições de empresas de robótica, entre elas a Boston Dynamics, fabricante dos robôs-cães que muitas vezes se tornam virais nas redes sociais. Mas o executivo responsável pelo programa foi acusado de assédio sexual e deixou a empresa logo depois.
Em 2017, o Google vendeu a Boston Dynamics para a gigante japonesa de telecomunicações e investimentos em tecnologia Softbank. E o entusiasmo em torno dos robôs cada vez mais inteligentes projetados pelas empresas de tecnologia mais poderosas perdeu força.
No projeto com modelo de linguagem, os pesquisadores do Google trabalharam ao lado dos profissionais da Everyday Robots, uma empresa a parte, mas de propriedade da Alphabet, e que trabalha especificamente na construção de robôs que podem realizar uma série de tarefas “repetitivas” e “pesadas”. Os robôs já estão atuando em várias cafeterias do Google, limpando balcões e jogando lixo fora.
Ver todos os comentários | 0 |