Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/25056
Title in Portuguese: Uma proposta para análise de dados abertos do PROCON utilizando Data Mart
Author: Sousa, Pedro José Rodrigues de
Advisor(s): Silva, Ticiana Linhares Coelho da
Keywords: Mineração de dados (computação)
Exploração de dados (Computação)
Sistemas de Computação
Issue Date: 2014
Citation: SOUSA, Pedro José Rodrigues de. Uma proposta para análise de dados abertos do PROCON utilizando Data Mart. 2014. 39 f. TCC (graduação em Sistemas de Informação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2014.
Abstract in Portuguese: Atualmente, é gerada uma grande quantidade de dados por sistemas de informação. Uma parte destes dados é disponibilizada ao público em geral, através de iniciativas de alguns órgãos. No entanto, a maioria desses dados não são disponibilizados de maneira legível, apresentam incoerências e inconsistências. Assim, é necessário propor soluções que manipulem esses dados e os tornem compreensíveis para que a informação seja transmitida ao público. Este trabalho utilizou os dados abertos da Fundação de Proteção e Defesa do Consumidor (PROCON), disponível ao público no portal de Dados Abertos do Governo Federal. Para transformar esses dados em informações úteis, foi realizado o processo de descoberta de conhecimento em bases de dados(ou KDD – Knowledge Discover in Databases, em inglês) e foi proposto um modelo ROLAP (Relational On Line Analytical Processing) para construção de um Data Mart em que as análises por meio de consultas OLAP(On-Line Analytical Processing) possam ser realizadas. Os resultados dessas consultas permitiram a geração de gráficos que facilitam o entendimento das informações contidas. O povoamento do Data Mart foi realizado utilizando o Pentaho Data Integration, que consiste em ferramenta de ETL (Extract, Transform, Load). As consultas OLAP realizadas e os gráficos gerados, foram construídos utilizando-se O Pentaho Business Analytics, uma ferramenta bastante utilizada no mercado de Tecnologia da Informação e que garante a corretude das análises realizadas. Ainda sobre a análise dos dados, o autor tentou criar um sistema de recomendação com base no perfil dos usuários do PROCON. Porém, não foi possível estabelecer o perfil dos usuários utilizando tais dados abertos. Como trabalhos futuros, planeja-se a coleta de novos dados para análises temporais, e verificação da possibilidade de construção de um sistema de recomendação com o cruzamento de outras bases de dados abertos referentes ao PROCON. Por fim, o presente trabalho foi apresentado como Minicurso no Workshop de Tecnologia da Informação do Sertão Central (WTISC 2014) realizado pela Universidade Federal do Ceará, Campus Quixadá.
Abstract: Nowadays, it has been generated a large amount of data. There are many government systems that provide these data public. However, most of these data available are not legible, and they are incoherent and inconsistent. Thus, it is necessary to propose solutions that manipulate these data, make them understandable as information, and provide them to the public community. This study used data from the Fundação de Proteção e Defesa do Consumidor (PROCON), available to the public on Portal de Dados Abertos do Governo Federal. To transform this data into useful information, we performed all the process of Knowledge Discovery in Databases (KDD) and we proposed a Data Mart using ROLAP (Relational Online Analytical Processing) as a model for the construction. The tests through OLAP (OnLine Analytical Processing) queries were processed on the Data Mart proposed. The results of these queries enabled the generation of graphs that facilitate the understanding of the information. Still on the data analysis, the authors attempted to create a recommendation system based on user profiles of PROCON. However, it has not been possible to establish the profile of users using such open data. As future work, we plan to collect new data for more time analysis, and verify the possibility of create a recommendation system with the integration of other databases related to PROCON. Finally, this work was presented as short course on the Workshop de Tecnologia da Informação do Sertão Central (WTISC 2014) that occurred on Federal University of Ceará, Campus Quixadá.
URI: http://www.repositorio.ufc.br/handle/riufc/25056
metadata.dc.type: TCC
Appears in Collections:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Files in This Item:
File Description SizeFormat 
2014_tcc_pjrsousa.pdf998,38 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.