Path Planning Collision Avoidance Using Reinforcement Learning

Batista, Josias Guimarães; Dias, Emerson Veras Aragão; Vasconcelos, Felipe José de Sousa; Ramos, Kaio Martins; Souza, Darielson Araújo de; Silva, José Leonardo Nunes da; Lopes, João Luiz Dallamuta; Holzman, Henrique Ajuz

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/65139

Tipo:	Capítulo de Livro
Título:	Path Planning Collision Avoidance Using Reinforcement Learning
Título em inglês:	Path Planning Collision Avoidance Using Reinforcement Learning
Autor(es):	Batista, Josias Guimarães Dias, Emerson Veras Aragão Vasconcelos, Felipe José de Sousa Ramos, Kaio Martins Souza, Darielson Araújo de Silva, José Leonardo Nunes da Lopes, João Luiz Dallamuta Holzman, Henrique Ajuz
Palavras-chave:	Planejamento de caminho;Prevenção de colisão;Aprendizagem por reforço;Manipulador robótico;Geração de trajetória;Path planning;Collision avoidance;Reinforcement learning;Robotic manipulator;Trajectory generation
Data do documento:	2021
Instituição/Editor/Publicador:	Atena Editora - https://www.atenaeditora.com.br
Citação:	BATISTA, Josias Guimarães; DIAS, Emerson Veras Aragão; VASCONCELOS, Felipe José de Sousa; RAMOS, Kaio Martins; SOUZA, Darielson Araújo de; SILVA, José Leonardo Nunes da. Path planning collision avoidance using reinforcement learning. In: DALLAMUTA, João; HOLZMANN, Henrique Ajuz. Engenharia elétrica: o mundo sob perspectivas avançadas. Ponta Grossa - PR: Atena, 2021. Cap. 16, p. 237-251. DOI 10.22533/at.ed.13821130516
Resumo:	Os robôs industriais têm crescido ao longo dos anos tornando os sistemas de produção cada vez mais eficientes, exigindo a necessidade de algoritmos de geração de trajetórias eficientes que otimizem e, se possível, gerem trajetórias livres de colisão sem interromper o processo de produção. Neste trabalho é apresentado o uso da Aprendizagem por Reforço (AR), baseado no algoritmo Q-Learning, na geração de trajetórias de um manipulador robótico e também uma comparação de seu uso com e sem restrições da cinemática do manipulador, a fim de gerar trajetórias livres de colisão. Os resultados das simulações são apresentados com relação à eficiência do algoritmo e seu uso na geração de trajetórias, uma comparação do custo computacional para o uso de restrições também é apresentada.
Abstract:	Industrial robots have grown over the years making production systems more and more efficient, requiring the need for efficient trajectory generation algorithms that optimize and, if possible, generate collision-free trajectories without interrupting the production process. In this work is presented the use of Reinforcement Learning (RL), based on the Q-Learning algorithm, in the trajectory generation of a robotic manipulator and also a comparison of its use with and without constraints of the manipulator kinematics, in order to generate collision free trajectories. The results of the simulations are presented with respect to the efficiency of the algorithm and its use in trajectory generation, a comparison of the computational cost for the use of constraints is also presented.
URI:	http://www.repositorio.ufc.br/handle/riufc/65139
ISBN:	978-65-5983-013-8
Aparece nas coleções:	DEEL - Capítulos de livro

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2021_capliv_jgbatista.pdf		3,88 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas