Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/25054
Title in Portuguese: Um processo para conversão e publicação de dados para modelo rdf seguindo os princípios de Linked Data
Author: Santos, Salomão da Silva
Advisor(s): Magalhães, Regis Pires
Keywords: Fluxo de trabalho
Web semântica
Linked data
Metadados
Framework (Programa de computador)
Issue Date: 2016
Citation: SANTOS, Salomão da Silva. Um processo para conversão e publicação de dados para modelo rdf seguindo os princípios de Linked Data. 2016. TCC (Graduação em Sistemas de Informação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2016.
Abstract in Portuguese: Passado o período inicial de grande entusiasmos pela publicação de novas bases de dados em Linked Data, a comunidade científica resolve agora passar a avaliar as bases quanto à sua qualidade. Contudo, alguns problemas têm se apresentado frequentemente, são eles: falta de um processo que incentive, guie e contribua com o aprimoramento da publicação e reutilização de dados conectados naWeb e não poder identificar e ou verificar o fluxo de trabalho realizado antes da publicação. Portanto, este trabalho tem como objetivo propor um processo que incentive, guie e contribua com o aprimoramento da publicação e reutilização de dados conectados na Web, bem como, simplificar e recomendar a utilização de algumas ferramentas, padrões, princípios e boas práticas para transformação, interligação, exposição e compartilhamento de recursos de dados no modelo RDF, levando em consideração os padrões de Linked Data. Foi realizado um exemplo de aplicação real envolvendo dados abertos e transparência do governo Brasileiro sobre o combate às empresas fraudulentas de licitações de compras públicas para evidenciar as contribuições da abordagem proposta. Além disso, a execução de um workflow de ETL (Extração, Transformação e Carga) através da ferramenta Pentaho e do plugin ETL4LOD para converter fontes de dados de diversos formatos, para RDF, a fim de demonstrar que esta ferramenta é capaz de automatizar o processo de geração e atualização de RDF, bem como, realizar consultas SPARQL.
Abstract: After the initial period of great enthusiasm through the publication of Databases in linked data, the scientific community decides now evaluate the bases as their quality. However, some problems have often presented, such as: lack of a process which encourages, guides and contributes with the improvement of publication and reuses of data connected to the web and can not identify, verify and/or evaluate the source and workflow conducted prior to publication. Therefore, this study aims to propose a process that encourages, guides and contributes with the improvement of publication and reutilization of data connected in the Web, as well as simplifies and recommends the use of some tools, standards, principles and good practices for transformation, interconnection, exposure, and sharing of data resources in RDF model, considering Linked Data patterns. It was performed an example of a real application involving open data and transparency of the Brazilian government related to the combat of fraudulent companies of bidding public commerce to highlight the contribution of the proposed approach. Besides that, the execution of a workflow ETL (Extraction, Transformation and Load) by Pentaho tool and ETL4LOD plugin to convert data sources of various formats, to RDF, in order to demonstrate that this tool is able to automate the generation process and update of RDF, as well as SPARQL queries.
URI: http://www.repositorio.ufc.br/handle/riufc/25054
metadata.dc.type: TCC
Appears in Collections:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Files in This Item:
File Description SizeFormat 
2016_tcc_sdassantos.pdf6,04 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.