Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/84644
Type: TCC
Title: Carcará: sistema para integração de dados meteorológicos e hidrológicos no semiárido brasileiro
Title in English: Carcará: a system for integrating meteorological and hydrological data in the brazilian semi-arid region
Authors: Sales, Mikael Mota Feitosa
Advisor: Silva, José Wellington Franco da
Co-advisor: Silva, Bruno Riccelli dos Santos
Keywords in Brazilian Portuguese : arquitetura de dados;Big Data;monitoramento climático;semiárido brasileiro
Keywords in English : data architecture;Big Data;climate monitoring;brazilian semi-arid region
Knowledge Areas - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
Issue Date: 2026
Citation: SALES, Mikael Mota Feitosa. Carcará: sistema para integração de dados meteorológicos e hidrológicos no semiárido brasileiro. 2026. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Campus de Crateús, Universidade Federal do Ceará, Crateús, 2026. Disponível em: Acesso em:
Abstract in Brazilian Portuguese: O Semiárido Brasileiro demanda acesso integrado a dados meteorológicos e hidrológicos para subsidiar análises ambientais e decisões agrícolas; no entanto, essas informações encontram-se fragmentadas em múltiplas fontes, com heterogeneidade de formatos e baixa padronização. Este trabalho propõe o Carcará, um sistema voltado à integração automática de dados provenientes de fontes como Instituto Nacional de Meteorologia (INMET), Agência Nacional de Águas e Saneamento Básico (ANA) e ERA5-Land (ERA5), atuando na coleta, padronização, armazenamento e disponibilização dessas informações. A solução é estruturada como um pipeline Extract, Transform, Load (ETL) composto por ingestão, mensageria, data lake, transformação e carga em data warehouse, orquestrado por um gerenciador de workflows. O sistema prioriza escalabilidade, rastreabilidade e governança, viabilizando a consolidação de grandes volumes de dados com atualização conforme sua disponibilização nas bases de origem. Como resultado, foi gerado um dataset integrado com 17.472 registros horários (192 timestamps), cobrindo 44 municípios, 8 UFs e 91 reservatórios, com alinhamento temporal via janela D−6 (defasagem do ERA5); no intervalo, o ERA5 teve cobertura completa, a ANA forneceu nível/volume para 58/91 reservatórios (63,7% dos registros) e o INMET foi o principal limitante (dados em 20/44 municípios e preenchimento meteorológico em 39,6% dos registros), validando a execução sob restrições reais; por fim, as aplicações incluem análises de demanda evaporativa (UR vs. VPD), comparação de UR por UF, fatores da PEV (SSRD, VPD, t2m e WS) e relação PEV vs. umidade observada, entre outras coisas.
Abstract: The Brazilian Semi-Arid region requires integrated access to meteorological and hydrological data to support environmental analyses and agricultural decision-making; however, this information is fragmented across multiple sources, with heterogeneous formats and low standardization. This work proposes Carcará, a system aimed at the automatic integration of data from sources such as INMET, ANA, and ERA5, covering data collection, standardization, storage, and availability. The solution is structured as an Extract, Transform, Load (ETL) pipeline composed of ingestion, messaging, a data lake, transformation, and loading into a data warehouse, orchestrated by a workflow manager. The system prioritizes scalability, traceability, and governance, enabling the consolidation of large data volumes with updates as they become available in the source repositories. As a result, an integrated dataset with 17,472 hourly records (192 timestamps) was generated, covering 44 municipalities, 8 states, and 91 reservoirs, with temporal alignment via a D−6 window (ERA5 lag); within the analyzed period, ERA5 achieved full coverage, ANA provided level/volume data for 58/91 reservoirs (63.7% of records), and INMET was the main completeness bottleneck (data for 20/44 municipalities and at least one meteorological field filled in 39.6% of records), validating end-to-end execution under real operational constraints; finally, the demonstrated applications include analyses of evaporative demand (RH vs. VPD), comparison of RH by state, drivers of PEV (SSRD, VPD, t2m, and WS), and the relationship between PEV and observed humidity, among others.
URI: http://repositorio.ufc.br/handle/riufc/84644
Author's ORCID: https://orcid.org/0009-0006-4478-243X
Author's Lattes: http://lattes.cnpq.br/7895090112181246
Access Rights: Acesso Aberto
Appears in Collections:SISTEMAS DE INFORMAÇÃO - CRATEÚS - Artigos Científicos

Files in This Item:
File Description SizeFormat 
2026_tcc_mmfsales.pdf1,14 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.