Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/75141
Tipo: | TCC |
Título: | Experimentos de transferência neural de estilo em aplicações de visão computacional |
Título em inglês: | Neural style transfer experiments in computer vision applications |
Autor(es): | Silva, Lucas de Lima |
Orientador: | Carmo, Rafael Augusto Ferreira do |
Palavras-chave em português: | Visão computacional;Python;Detecção de objeto;Transferência neural de estilo;Redes neurais convolucionais |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Data do documento: | 2023 |
Citação: | SILVA, Lucas de Lima. Experimentos de transferência neural de estilo em aplicações de visão computacional. 2023. 57 f. TCC (Graduação em Sistemas e Mídias Digitais) - Universidade Federal do Ceará, Fortaleza, 2023. |
Resumo: | O trabalho em questão visa propor uma arquitetura por intermédio da elaboração e prototipação de soluções em realidade aumentada que combinam detecção de objeto e transferência neural de estilo. Ao longo do trabalho, serão exploradas tecnologias para lidar com os desafios mencionados, além de apontar as limitações enfrentadas no desenvolvimento, como o desempenho computacional, a complexidade dos modelos e a otimização dos resultados. Foi necessária uma pesquisa prévia para levantamento de tecnologias para detecção de objeto, transferência neural de estilo e realidade aumentada. Para a elaboração e prototipação do trabalho foram utilizadas as tecnologias ARCore, YOLO, redes neurais convolucionais, Python, Pytorch e a biblioteca OpenCV. Este trabalho apresenta o desenvolvimento de três protótipos, sendo que o terceiro é disponibilizado em duas versões distintas: a original e uma versão aprimorada com a implementação de melhorias significativas de desempenho. Como resultado dos protótipos, destaca-se no primeiro a utilização de detecção de objeto e a manipulação do objeto detectado, contudo, no segundo destaca-se a integração entre a detecção de objeto e a transferência neural de estilo somente nos objetos detectados, mantendo todo resto da cena em sua forma original, ademais como terceiro e último protótipo manteve-se a funcionalidade do segundo protótipo, porém agora cada classe dos objetos detectados terá um dos dois estilos escolhidos para o trabalho, que no caso foram as obras "Self-portrait" de Pablo Picasso e “O Gato” de Romero Britto. Por fim, foi considerado o desempenho das soluções desenvolvidas em certos contextos, para ser possível verificar a eficácia e a adaptabilidade delas, mas podemos destacar a capacidade da solução rodar a mais de 60 quadros por segundo, no primeiro protótipo e cerca de 10 quadros no terceiro protótipo, utilizando uma máquina com placa gráfica RTX 2060 para executar a solução em ambos os casos citados. |
Abstract: | The objective of this work is the development and prototyping of augmented reality solutions that combine object detection and neural style transfer. Throughout the work, technologies will be explored to address the mentioned challenges, in addition to highlighting the limitations faced during development, such as computational performance, model complexity, and result optimization. A preliminary research was required to survey technologies for object detection, neural style transfer, and augmented reality. For the elaboration and prototyping of the work, technologies such as ARCore, YOLO, convolutional neural networks, Python, PyTorch, and the OpenCV library were utilized. This study presents the development of three prototypes, with the third being provided in two distinct versions: the original and an enhanced version with the implementation of significant performance improvements. As a result of the prototypes, the first one emphasizes object detection and manipulation of the detected object, while the second highlights the integration of object detection and neural style transfer exclusively on the detected objects, preserving the rest of the scene in its original form. Furthermore, the third and final prototype maintains the functionality of the second prototype, but now each class of detected objects is assigned one of the two chosen styles for the work, specifically the works "Self-portrait" by Pablo Picasso and "O Gato" by Romero Britto. Finally, the performance of the developed solutions was considered in certain contexts to verify their effectiveness and adaptability. Notably, the solution demonstrated the ability to run at over 60 frames per second in the first prototype and around 10 frames in the third prototype, using a machine equipped with an RTX 2060 graphics card to execute the solution in both aforementioned cases. |
URI: | http://repositorio.ufc.br/handle/riufc/75141 |
ORCID do Orientador: | https://orcid.org/0000-0002-5080-1688 |
Currículo Lattes do Orientador: | http://lattes.cnpq.br/3102406452063651 |
Tipo de Acesso: | Acesso Aberto |
Aparece nas coleções: | SISTEMAS E MÍDIAS DIGITAIS - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2023_tcc_llsilva.pdf | 1,59 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.