Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/65139
Tipo: | Capítulo de Livro |
Título: | Path Planning Collision Avoidance Using Reinforcement Learning |
Título em inglês: | Path Planning Collision Avoidance Using Reinforcement Learning |
Autor(es): | Batista, Josias Guimarães Dias, Emerson Veras Aragão Vasconcelos, Felipe José de Sousa Ramos, Kaio Martins Souza, Darielson Araújo de Silva, José Leonardo Nunes da Lopes, João Luiz Dallamuta Holzman, Henrique Ajuz |
Palavras-chave: | Planejamento de caminho;Prevenção de colisão;Aprendizagem por reforço;Manipulador robótico;Geração de trajetória;Path planning;Collision avoidance;Reinforcement learning;Robotic manipulator;Trajectory generation |
Data do documento: | 2021 |
Instituição/Editor/Publicador: | Atena Editora - https://www.atenaeditora.com.br |
Citação: | BATISTA, Josias Guimarães; DIAS, Emerson Veras Aragão; VASCONCELOS, Felipe José de Sousa; RAMOS, Kaio Martins; SOUZA, Darielson Araújo de; SILVA, José Leonardo Nunes da. Path planning collision avoidance using reinforcement learning. In: DALLAMUTA, João; HOLZMANN, Henrique Ajuz. Engenharia elétrica: o mundo sob perspectivas avançadas. Ponta Grossa - PR: Atena, 2021. Cap. 16, p. 237-251. DOI 10.22533/at.ed.13821130516 |
Resumo: | Os robôs industriais têm crescido ao longo dos anos tornando os sistemas de produção cada vez mais eficientes, exigindo a necessidade de algoritmos de geração de trajetórias eficientes que otimizem e, se possível, gerem trajetórias livres de colisão sem interromper o processo de produção. Neste trabalho é apresentado o uso da Aprendizagem por Reforço (AR), baseado no algoritmo Q-Learning, na geração de trajetórias de um manipulador robótico e também uma comparação de seu uso com e sem restrições da cinemática do manipulador, a fim de gerar trajetórias livres de colisão. Os resultados das simulações são apresentados com relação à eficiência do algoritmo e seu uso na geração de trajetórias, uma comparação do custo computacional para o uso de restrições também é apresentada. |
Abstract: | Industrial robots have grown over the years making production systems more and more efficient, requiring the need for efficient trajectory generation algorithms that optimize and, if possible, generate collision-free trajectories without interrupting the production process. In this work is presented the use of Reinforcement Learning (RL), based on the Q-Learning algorithm, in the trajectory generation of a robotic manipulator and also a comparison of its use with and without constraints of the manipulator kinematics, in order to generate collision free trajectories. The results of the simulations are presented with respect to the efficiency of the algorithm and its use in trajectory generation, a comparison of the computational cost for the use of constraints is also presented. |
URI: | http://www.repositorio.ufc.br/handle/riufc/65139 |
ISBN: | 978-65-5983-013-8 |
Aparece nas coleções: | DEEL - Capítulos de livro |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2021_capliv_jgbatista.pdf | 3,88 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.