43 99188 7566
inovemmlondrina@gmail.com
InovemmInovemmInovemmInovemm
  • EletroMetalMecânico
  • Programação
  • Galeria
  • Notícias
  • Contato
  • Inscreva-se

Robôs aprendem a trabalhar em equipe com o uso de Inteligência Artificial

Por inovemm | Notícias | 0 comentário | 9 agosto, 2022 | 0

09/08/22

Quando as linhas de comunicação estão abertas, agentes individuais, como robôs ou drones, podem trabalhar juntos para colaborar e concluir uma tarefa. Mas e se eles não estiverem equipados com o hardware certo ou os sinais estiverem bloqueados, impossibilitando a comunicação? 

Os pesquisadores da Universidade de Illinois Urbana-Champaign desenvolveram um método para treinar vários agentes para trabalharem juntos usando aprendizado de reforço multiagente, um tipo de inteligência artificial.

“É mais fácil quando os agentes podem conversar uns com os outros”, disse Huy Tran, engenheiro aeroespacial de Illinois. “Mas queríamos fazer isso de forma descentralizada, o que significa que eles não conversam entre si. Também nos concentramos em situações em que não é óbvio quais deveriam ser as diferentes funções ou trabalhos dos agentes”.

Tran disse que esse cenário é muito mais complexo e um problema mais difícil porque não está claro o que um agente deve fazer em relação a outro agente. “A questão interessante é como aprendemos a realizar uma tarefa juntos ao longo do tempo”, disse Tran.

Tran e seus colaboradores usaram o aprendizado de máquina (machine learning) para resolver esse problema criando uma função de utilidade que informa ao agente quando ele está fazendo algo útil ou bom para a equipe.

“Com os gols da equipe, é difícil saber quem contribuiu para a vitória”, disse ele. “Desenvolvemos uma técnica de aprendizado de máquina que nos permite identificar quando um agente individual contribui para o objetivo global da equipe. Se você olhar em termos de esportes, um jogador de futebol pode marcar, mas também queremos saber sobre ações de outros companheiros de equipe que levaram ao gol, como assistências. É difícil entender esses efeitos retardados”.

Os algoritmos desenvolvidos pelos pesquisadores também podem identificar quando um agente ou robô está fazendo algo que não contribui para o objetivo. “Não é tanto que o robô escolheu fazer algo errado, apenas algo que não é útil para o objetivo final”.

Eles testaram seus algoritmos usando jogos simulados como Capture the Flag e StarCraft, um popular jogo de computador. “StarCraft pode ser um pouco mais imprevisível – ficamos empolgados em ver nosso método funcionar bem nesse ambiente também”.

Tran disse que esse tipo de algoritmo é aplicável a muitas situações da vida real, como vigilância militar, robôs trabalhando juntos em um armazém, controle de semáforos, veículos autônomos coordenando entregas ou controlando uma rede de energia elétrica.

Tran disse que Seung Hyun Kim fez a maior parte da teoria por trás da ideia quando era um estudante de graduação de Engenharia Mecânica, com Neale Van Stralen, um estudante aeroespacial, ajudando na implementação. Tran e Girish Chowdhary aconselharam ambos os alunos. O trabalho foi recentemente apresentado à comunidade de IA na conferência revisada por pares de Agentes Autônomos e Sistemas Multiagentes.

O estudo, “Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning”, escrito por Seung Hyun Kim, Neale Van Stralen, Girish Chowdhary e Huy Tran, aparece nos Anais da 21ª Conferência Internacional sobre Agentes Autônomos e Sistemas Multiagentes realizada em maio de 2022.

Confira o vídeo (em inglês) em que Tran descreve como ele usou o modelo baseado no jogo Capture the Flag para desenvolver a nova visão do aprendizado por reforço profundo que ajuda os robôs a avaliar seu próximo movimento:

Fonte: CIMM

Sem tags.

Deixe um Comentário

Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts recentes

  • (sem título)
  • 113ª Reunião da Governança Inovemm
  • 112ª Reunião da Governança Inovemm
  • Reunião Pós Inovemm
  • 111ª Reunião da Governança 11.06.2024

Comentários

    Arquivos

    • agosto 2024
    • julho 2024
    • junho 2024
    • abril 2024
    • março 2024
    • fevereiro 2024
    • janeiro 2024
    • dezembro 2023
    • novembro 2023
    • outubro 2023
    • setembro 2023
    • agosto 2023
    • julho 2023
    • junho 2023
    • maio 2023
    • abril 2023
    • março 2023
    • fevereiro 2023
    • janeiro 2023
    • dezembro 2022
    • novembro 2022
    • outubro 2022
    • setembro 2022
    • agosto 2022
    • julho 2022
    • junho 2022
    • maio 2022
    • abril 2022
    • março 2022
    • fevereiro 2022
    • janeiro 2022
    • dezembro 2021
    • novembro 2021
    • outubro 2021
    • setembro 2021
    • agosto 2021
    • julho 2021
    • junho 2021
    • maio 2021
    • abril 2021
    • março 2021
    • fevereiro 2021
    • janeiro 2021
    • dezembro 2020
    • novembro 2020
    • outubro 2020
    • setembro 2020
    • agosto 2020
    • julho 2020
    • junho 2020
    • maio 2020
    • abril 2020
    • março 2020
    • fevereiro 2020
    • janeiro 2020
    • dezembro 2019
    • novembro 2019
    • outubro 2019
    • setembro 2019
    • agosto 2019
    • julho 2019
    • junho 2019

    Categorias

    • Galeria
    • Notícias
    • Uncategorized

    Meta

    • Cadastre-se
    • Acessar
    • Feed de posts
    • Feed de comentários
    • WordPress.org
    © 2019 Inovemm. Desenvolvido por Weblite | All Rights Reserved
    • EletroMetalMecânico
    • Programação
    • Galeria
    • Notícias
    • Contato
    • Inscreva-se
    Inovemm