Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/75141
Tipo: TCC
Título : Experimentos de transferência neural de estilo em aplicações de visão computacional
Título en inglés: Neural style transfer experiments in computer vision applications
Autor : Silva, Lucas de Lima
Tutor: Carmo, Rafael Augusto Ferreira do
Palabras clave en portugués brasileño: Visão computacional;Python;Detecção de objeto;Transferência neural de estilo;Redes neurais convolucionais
Áreas de Conocimiento - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Fecha de publicación : 2023
Citación : SILVA, Lucas de Lima. Experimentos de transferência neural de estilo em aplicações de visão computacional. 2023. 57 f. TCC (Graduação em Sistemas e Mídias Digitais) - Universidade Federal do Ceará, Fortaleza, 2023.
Resumen en portugués brasileño: O trabalho em questão visa propor uma arquitetura por intermédio da elaboração e prototipação de soluções em realidade aumentada que combinam detecção de objeto e transferência neural de estilo. Ao longo do trabalho, serão exploradas tecnologias para lidar com os desafios mencionados, além de apontar as limitações enfrentadas no desenvolvimento, como o desempenho computacional, a complexidade dos modelos e a otimização dos resultados. Foi necessária uma pesquisa prévia para levantamento de tecnologias para detecção de objeto, transferência neural de estilo e realidade aumentada. Para a elaboração e prototipação do trabalho foram utilizadas as tecnologias ARCore, YOLO, redes neurais convolucionais, Python, Pytorch e a biblioteca OpenCV. Este trabalho apresenta o desenvolvimento de três protótipos, sendo que o terceiro é disponibilizado em duas versões distintas: a original e uma versão aprimorada com a implementação de melhorias significativas de desempenho. Como resultado dos protótipos, destaca-se no primeiro a utilização de detecção de objeto e a manipulação do objeto detectado, contudo, no segundo destaca-se a integração entre a detecção de objeto e a transferência neural de estilo somente nos objetos detectados, mantendo todo resto da cena em sua forma original, ademais como terceiro e último protótipo manteve-se a funcionalidade do segundo protótipo, porém agora cada classe dos objetos detectados terá um dos dois estilos escolhidos para o trabalho, que no caso foram as obras "Self-portrait" de Pablo Picasso e “O Gato” de Romero Britto. Por fim, foi considerado o desempenho das soluções desenvolvidas em certos contextos, para ser possível verificar a eficácia e a adaptabilidade delas, mas podemos destacar a capacidade da solução rodar a mais de 60 quadros por segundo, no primeiro protótipo e cerca de 10 quadros no terceiro protótipo, utilizando uma máquina com placa gráfica RTX 2060 para executar a solução em ambos os casos citados.
Abstract: The objective of this work is the development and prototyping of augmented reality solutions that combine object detection and neural style transfer. Throughout the work, technologies will be explored to address the mentioned challenges, in addition to highlighting the limitations faced during development, such as computational performance, model complexity, and result optimization. A preliminary research was required to survey technologies for object detection, neural style transfer, and augmented reality. For the elaboration and prototyping of the work, technologies such as ARCore, YOLO, convolutional neural networks, Python, PyTorch, and the OpenCV library were utilized. This study presents the development of three prototypes, with the third being provided in two distinct versions: the original and an enhanced version with the implementation of significant performance improvements. As a result of the prototypes, the first one emphasizes object detection and manipulation of the detected object, while the second highlights the integration of object detection and neural style transfer exclusively on the detected objects, preserving the rest of the scene in its original form. Furthermore, the third and final prototype maintains the functionality of the second prototype, but now each class of detected objects is assigned one of the two chosen styles for the work, specifically the works "Self-portrait" by Pablo Picasso and "O Gato" by Romero Britto. Finally, the performance of the developed solutions was considered in certain contexts to verify their effectiveness and adaptability. Notably, the solution demonstrated the ability to run at over 60 frames per second in the first prototype and around 10 frames in the third prototype, using a machine equipped with an RTX 2060 graphics card to execute the solution in both aforementioned cases.
URI : http://repositorio.ufc.br/handle/riufc/75141
ORCID del tutor: https://orcid.org/0000-0002-5080-1688
Lattes del tutor: http://lattes.cnpq.br/3102406452063651
Derechos de acceso: Acesso Aberto
Aparece en las colecciones: SISTEMAS E MÍDIAS DIGITAIS - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2023_tcc_llsilva.pdf1,59 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.