Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/25056
Tipo: TCC
Título: Uma proposta para análise de dados abertos do PROCON utilizando Data Mart
Autor(es): Sousa, Pedro José Rodrigues de
Orientador: Silva, Ticiana Linhares Coelho da
Palavras-chave: Mineração de dados (computação);Exploração de dados (Computação);Sistemas de Computação
Data do documento: 2014
Citação: SOUSA, Pedro José Rodrigues de. Uma proposta para análise de dados abertos do PROCON utilizando Data Mart. 2014. 39 f. TCC (graduação em Sistemas de Informação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2014.
Resumo: Atualmente, é gerada uma grande quantidade de dados por sistemas de informação. Uma parte destes dados é disponibilizada ao público em geral, através de iniciativas de alguns órgãos. No entanto, a maioria desses dados não são disponibilizados de maneira legível, apresentam incoerências e inconsistências. Assim, é necessário propor soluções que manipulem esses dados e os tornem compreensíveis para que a informação seja transmitida ao público. Este trabalho utilizou os dados abertos da Fundação de Proteção e Defesa do Consumidor (PROCON), disponível ao público no portal de Dados Abertos do Governo Federal. Para transformar esses dados em informações úteis, foi realizado o processo de descoberta de conhecimento em bases de dados(ou KDD – Knowledge Discover in Databases, em inglês) e foi proposto um modelo ROLAP (Relational On Line Analytical Processing) para construção de um Data Mart em que as análises por meio de consultas OLAP(On-Line Analytical Processing) possam ser realizadas. Os resultados dessas consultas permitiram a geração de gráficos que facilitam o entendimento das informações contidas. O povoamento do Data Mart foi realizado utilizando o Pentaho Data Integration, que consiste em ferramenta de ETL (Extract, Transform, Load). As consultas OLAP realizadas e os gráficos gerados, foram construídos utilizando-se O Pentaho Business Analytics, uma ferramenta bastante utilizada no mercado de Tecnologia da Informação e que garante a corretude das análises realizadas. Ainda sobre a análise dos dados, o autor tentou criar um sistema de recomendação com base no perfil dos usuários do PROCON. Porém, não foi possível estabelecer o perfil dos usuários utilizando tais dados abertos. Como trabalhos futuros, planeja-se a coleta de novos dados para análises temporais, e verificação da possibilidade de construção de um sistema de recomendação com o cruzamento de outras bases de dados abertos referentes ao PROCON. Por fim, o presente trabalho foi apresentado como Minicurso no Workshop de Tecnologia da Informação do Sertão Central (WTISC 2014) realizado pela Universidade Federal do Ceará, Campus Quixadá.
Abstract: Nowadays, it has been generated a large amount of data. There are many government systems that provide these data public. However, most of these data available are not legible, and they are incoherent and inconsistent. Thus, it is necessary to propose solutions that manipulate these data, make them understandable as information, and provide them to the public community. This study used data from the Fundação de Proteção e Defesa do Consumidor (PROCON), available to the public on Portal de Dados Abertos do Governo Federal. To transform this data into useful information, we performed all the process of Knowledge Discovery in Databases (KDD) and we proposed a Data Mart using ROLAP (Relational Online Analytical Processing) as a model for the construction. The tests through OLAP (OnLine Analytical Processing) queries were processed on the Data Mart proposed. The results of these queries enabled the generation of graphs that facilitate the understanding of the information. Still on the data analysis, the authors attempted to create a recommendation system based on user profiles of PROCON. However, it has not been possible to establish the profile of users using such open data. As future work, we plan to collect new data for more time analysis, and verify the possibility of create a recommendation system with the integration of other databases related to PROCON. Finally, this work was presented as short course on the Workshop de Tecnologia da Informação do Sertão Central (WTISC 2014) that occurred on Federal University of Ceará, Campus Quixadá.
URI: http://www.repositorio.ufc.br/handle/riufc/25056
Aparece nas coleções:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2014_tcc_pjrsousa.pdf998,38 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.