Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/78300
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMonteiro Filho, José Maria da Silva-
dc.contributor.authorCoelho, Luan Carvalho de Araújo-
dc.date.accessioned2024-09-27T15:25:50Z-
dc.date.available2024-09-27T15:25:50Z-
dc.date.issued2023-
dc.identifier.citationCOELHO, Luan Carvalho de Araújo. Uma Arquitetura de Código Aberto para a Aplicação do Strangler Pattern com Change Data Capture para Setores com Alto Volume de Dados. 2023. 79 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2023.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/78300-
dc.description.abstractThis paper proposes an open-source architecture for implementing the Strangler Pattern in contexts managing large volumes of data, using technologies such as Apache Spark, Debezium, and Apache Kafka. The Strangler Pattern is a legacy system modernization strategy that facilitates the gradual transition to new functionalities and services, minimizing the disruption of essential services. It is particularly beneficial in scenarios dealing with large data volumes, where continuity and evolution of services need to be carefully balanced. In this architecture, Apache Spark and Debezium are employed to implement the Changed Data Capture (CDC), a technique that identifies and captures changes in a database, including INSERT, UPDATE, and DELETE operations. This allows for processing and transfer of only modified data to the Data Warehouse, Data Lake, or other destinations, optimizing processing time and resource use. The architecture also utilizes Apache Kafka to manage real-time data flows, a critical feature for business intelligence in high data volume environments. Other tools such as Kafka Connect and Alluxio play central roles in the architecture and will be discussed later. Initial results suggest that the proposed architecture can significantly decrease computational costs, improve data processing efficiency, and minimize the disruption of existing services. The paper thoroughly presents the architecture implementation, addressing challenges, solutions, and a case study in the supply chain market where the architecture was initially applied.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleUma arquitetura de código aberto para a aplicação do Strangler Pattern com Change Data Capture para setores com alto volume de dadospt_BR
dc.typeTCCpt_BR
dc.description.abstract-ptbrEste artigo propõe uma arquitetura de código aberto para a implementação do Strangler Pattern em contextos que gerenciam grandes volumes de dados, usando tecnologias como Apache Spark, Debezium e Apache Kafka. O Strangler Pattern é uma estratégia de modernização de sistemas legados que facilita a transição gradual para novas funcionalidades e serviços, reduzindo a interrupção de serviços essenciais. É especialmente útil em cenários com grandes volumes de dados, onde a continuidade e a evolução dos serviços necessitam ser equilibradas cuidadosamente. Nesta arquitetura, o Apache Spark e o Debezium são empregados para implementar o Change Data Capture (CDC), uma técnica que identifica e captura alterações em um banco de dados, incluindo operações de inserção (INSERT), atualização (UPDATE) e exclusão (DELETE). Isso permite o processamento e transferência apenas dos dados modificados para o Data Warehouse, Data Lake ou outro destino, otimizando o tempo de processamento e o uso de recursos. A arquitetura também utiliza o Apache Kafka para gerenciar fluxos de dados em tempo real, recurso essencial para a inteligência de negócios em ambientes de alto volume de dados. Outras ferramentas como Kafka Connect e Alluxio desempenham papéis centrais na arquitetura e serão discutidos posteriormente. Resultados iniciais sugerem que a arquitetura proposta pode diminuir substancialmente os custos computacionais, aprimorar a eficiência do processamento de dados e minimizar a interrupção dos serviços existentes. O artigo apresenta detalhadamente a implementação da arquitetura, abordando os desafios, as soluções e um estudo de caso no mercado de supply chain em que a arquitetura foi primeiramente aplicada.pt_BR
dc.subject.ptbrStrangler Patternpt_BR
dc.subject.ptbrArquitetura de Microserviçospt_BR
dc.subject.ptbrAlluxiopt_BR
dc.subject.ptbrApache Sparkpt_BR
dc.subject.ptbrDebeziumpt_BR
dc.subject.ptbrApache Kafkapt_BR
dc.subject.ptbrChange Data Capturept_BR
dc.subject.ptbrAlto Volume de Dadospt_BR
dc.subject.enStrangler Patternpt_BR
dc.subject.enMicroservices Architecturept_BR
dc.subject.enAlluxiopt_BR
dc.subject.enApache Sparkpt_BR
dc.subject.enDebeziumpt_BR
dc.subject.enApache Kafkapt_BR
dc.subject.enChange Data Capturept_BR
dc.subject.enHigh Volume of Datapt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
local.author.latteshttp://lattes.cnpq.br/9352609317415601pt_BR
local.advisor.latteshttp://lattes.cnpq.br/9790693300026949pt_BR
local.date.available2024-09-24-
Aparece nas coleções:CIÊNCIA DA COMPUTAÇÃO - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2023_tcc_lcacoelho.pdf4,41 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.