Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/70162
Tipo: Tese
Título: Lidar3dnet - Abordagem inteligente para classificar objetos 3d com base em nuvens de pontos reais e sintéticas
Autor(es): Sousa, Pedro Henrique Feijó de
Orientador: Rebouças Filho, Pedro Pedrosa
Coorientador: Torrico, Bismark Claure
Palavras-chave: Engenharia elétrica;Aprendizado de máquina;Classificação de objetos 3D;LiDAR;Nuvem de pontos
Data do documento: 2022
Citação: SOUSA, Pedro Henrique Feijó de. Lidar3dnet - Abordagem inteligente para classificar objetos 3d com base em nuvens de pontos reais e sintéticas. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2022.
Resumo: Utilizar nuvem de pontos de datasets da literatura e geradas em simuladores e evitam custos de tempo de coleta. Dessa forma, há acesso a uma quantidade ilimitada e organizada de nuvens de pontos, um cenário ideal para redes de aprendizado profundo. No entanto, modelos que utilizam redes neurais convolucionais e dados sintéticos apresentam limitações quando aplicados a dados do mundo real. Este trabalho propõe um método baseado em perceptron multicamadas (MLP) para classificação de objetos 3D com base em nuvens de pontos reais, aquisitadas com o sensor Light Detection and Ranging (LiDAR), e uma etapa de pré-processamento. Além disso, são propostos dois dataset, com dados reais e sintéticos, e a pesquisa utiliza o dataset ModelNet para fomentar as comparações. A rede neural proposta, Lidar3DNet, possui arquitetura baseada em MLP, pois suporta a elevada quantidade de dados como entrada. Com o objetivo de proporcionar o melhor desempenho das redes neurais selecionadas, é prosposta uma etapa de pré-processamento com duas tratativas, normalização dos pontos e ajuste da nuvem de pontos no plano cartesiano 3D, para contornar discrepâncias na distribuição dos pontos das nuvens de pontos. A pesquisa é composta por quatro etapas: (1) são selecionadas as nove redes com melhor desempenho no dataset ModelNet40 e todas as arquiteturas são configuradas e executadas. em seguida, (2) o uso do dataset ModelNet40 é substituído pelo dataset com nuvens de pontos proposto, variando a aplicação das nuvens de pontos originais e pré-processados. Na sequência, (3) o dataset com nuvens de pontos reais é substituído pelo dataset com nuvens de pontos sintéticas, também com nuvens de pontos originais e pré-processados. Nessas etapas, cinco métricas de avaliação foram aplicadas em conjunto com dois métodos de avaliação estatística. Por fim, (4) uma variação na quantidade de pontos das nuvens de pontos é implementada para avaliar a interferência da quantidade de pontos no desempenho da rede Lidar3DNet, com testes em CPU e GPU e com dados reais e sintéticos. A etapa de pré-processamento proporcionou aumento no desempenho das redes neurais selecionadas com ganhos de 25% no melhor caso. A rede proposta alcançou 98,33% de acurácia e um tempo de teste de 88 µs com dados sintético e com dados reais atingiu 98,47% e 125 µs em acurácia e tempo de teste, respectivamente. Avaliação da variação da quantidade de pontos das nuvens de pontos para classificação de objetos 3D indicou que o uso de GPU é válido a partir de nuvens de pontos com mais de 1024 pontos.
Abstract: Use point clouds of datasets from the literature and generated in simulators and avoid collection time costs. In this way, there is access to an unlimited and organized amount of point clouds, an ideal scenario for deep learning networks. However, models that use convolutional neural networks and synthetic data have limitations when applied to real-world data. This work proposes a multilayer perceptron (MLP)-based method for classifying 3D objects based on real point clouds, acquired with the Light Detection and Ranging (LiDAR) sensor, and a pre-processing step. In addition, two dataset are proposed, with real and synthetic data, and the research uses dataset ModelNet to encourage comparisons. The proposed neural network, Lidar3DNet, has an architecture based on MLP, as it supports a high amount of data as input. To provide the best performance of the selected neural networks, a pre-processing step is proposed with two treatments, normalization of points and adjustment of the point cloud in the 3D Cartesian plane, to overcome discrepancies in the distribution of points in the point clouds. The research consists of four steps: (1) the nine networks with the best performance in the dataset ModelNet40 are selected and all architectures are configured and executed. then (2) the use of the ModelNet40 dataset is replaced by the proposed dataset with point clouds, varying the application of the original and pre-processed point clouds. Next, (3) the dataset with real point clouds is replaced by the dataset with synthetic point clouds, also with original and pre-processed point clouds. In these stages, five evaluation metrics were applied together with two statistical evaluation methods. Finally, (4) a variation in the number of points of the point clouds is implemented to evaluate the interference of the number of points in the performance of the Lidar3DNet network, with CPU and GPU tests and with real and synthetic data. The pre-processing step provided an increase in the performance of the selected neural networks with gains of 25% in the best case. The proposed network reached 98.33% accuracy and a test time of 88 µs with synthetic data and with real data it reached 98.47% and 125 µs in accuracy and test time, respectively. Evaluation of the variation in the number of points of point clouds for the classification of 3D objects indicated that the use of GPU is valid from point clouds with more than 1024 points
URI: http://www.repositorio.ufc.br/handle/riufc/70162
Aparece nas coleções:DEEL - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tese_2022_phfsousa.pdf15,2 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.