Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/79971
Type: Tese
Title: A syntactic-semantic analysis method for automatic API connection points discovery in systems-of-information systems
Authors: Borges, Marcos Vinícius de Freitas
Advisor: Rocha, Lincoln Souza
Co-advisor: Maia, Paulo Henrique Mendes
Keywords in Brazilian Portuguese : Sistemas de sistemas-de-informação;Descoberta de pontos de conexão;API;Análise sintática;Análise semântica
Keywords in English : Systems-of-information systems;Connection points discovery;API;Syntactic analysis;Semantic analysis
Knowledge Areas - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Issue Date: 2025
Citation: BORGES, Marcos Vinícius de Freitas. A syntactic-semantic analysis method for automatic API connection points discovery in systems-of-information systems. 2025. 135 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2025.
Abstract in Brazilian Portuguese: Estabelecer links de interoperabilidade é um desafio significativo na engenharia de sistemas de sistemas-de-informação (SoIS, do inglês systems-of-information systems). Mesmo com a documentação das interfaces dos sistemas constituintes (CS, do inglês constituent systems), alcançar esses links é uma tarefa difícil, demorada e suscetível a erros, que requer atenção dos desenvolvedores de CS, especialmente se realizada manualmente. Para contribuir com essa tarefa, esta tese apresenta um método semiautomático que utiliza análise de similaridade sintática e semântica de descrições de interfaces de programação de aplicações (API, do inglês application programming interface) para identificar potenciais pontos de conexão entre CS. Esse método é constituído por três etapas interligadas: (i) definição de requisitos, onde são delineadas as motivações e justificativas para a criação do método; (ii) design do núcleo do método, onde são detalhadas todas as fases e componentes necessários para obter os pontos de conexão de API; e (iii) implementação do núcleo do método, onde são apresentadas os detalhes tecnológicos da ferramenta desenvolvida para suportar o método. Através dessa ferramenta, foram realizadas duas avaliações. Na primeira, foi executado um experimento controlado para avaliar o desempenho da ferramenta e definir empiricamente os melhores algoritmos de similaridade e limiares para a tarefa de identificação de pontos de conexão entre duas API bem conhecidas. Na segunda, a ferramenta foi empregada em um estudo de caso aplicado a um SoIS real de um fabricante global de computadores. O estudo abrangeu três cenários, envolvendo sete API de CS, e considerou as perspectivas de análise sintática, e análise sintático-semântica de API. Em seguida, foram conduzidas entrevistas semiestruturadas com cinco desenvolvedores que trabalharam no SoIS para avaliar a eficiência da ferramenta. Os resultados demonstraram que a ferramenta é bem-sucedida, com a análise de similaridade sintática e semântica de API provando ser eficiente para identificar links de interoperabilidade entre CS. Do ponto de vista prático, os algoritmos sintáticos demonstraram desempenho notável em ambientes locais. Ao mesmo tempo, a análise semântica, que é mais robusta, requer infraestrutura avançada devido à sua alta complexidade computacional. Do ponto de vista da pesquisa, o uso de similaridade semântica de textos curtos (STSS, do inglês short text semantic similarity) é ainda um campo promissor, e o uso de inteligência artificial com modelos largos de linguagem (LLM, do inglês Large Language Models) pode gerar novos resultados e descobertas de links de interoperabilidade em SoIS.
Abstract: Establishing interoperability links is a significant challenge in systems-of-information systems (SoIS) engineering. Even with constituent systems (CS) interfaces documentation, achieving such links is a difficult, time-consuming, and error-prone task that requires attention from CS developers, especially if it is performed manually. To contribute to that task, this thesis presents a semi-automatic method using both syntactic and semantic similarity analysis of application programming interface (API) descriptions to identify potential connection points among CS. That method consists of three interconnected steps: (i) requirements definition, where the motivations and justifications for creating the method are outlined; (ii) core method design, where all the phases and components necessary to obtain the API connection points are detailed; and (iii) core method implementation, where the technological details of the tool developed to support the method are presented. Through that tool, two evaluations were performed. In the first, a controlled experiment was executed to evaluate the tool’s performance and empirically define the best similarity algorithms and thresholds for the task of identifying connection points between two well-known API. In the second, the tool was used in a case study applied to a real-world SoIS of a global computer manufacturer. The study covered three scenarios, involving seven CS API, and considered the perspectives of syntactic analysis and syntactic-semantic analysis of API. Then, semi-structured interviews were conducted with five developers who worked on the SoIS to evaluate the tool’s efficiency. The results demonstrated that the tool is successful, with the syntactic and semantic similarity analysis of API proving to be efficient in identifying interoperability links between CS. From a practical point of view, the syntactic algorithms demonstrated notable performance in local environments. At the same time, semantic analysis, which is more robust, requires advanced infrastructure due to its high computational complexity. From a research perspective, the use of short text semantic similarity (STSS) is still a promising field, and the use of artificial intelligence with Large Language Models (LLM) can generate new results and discoveries of interoperability links in SoIS.
URI: http://repositorio.ufc.br/handle/riufc/79971
Author's Lattes: http://lattes.cnpq.br/3020917473487656
Advisor's ORCID: https://orcid.org/0000-0001-5402-8744
Advisor's Lattes: http://lattes.cnpq.br/0656977742590515
Co-advisor's Lattes: http://lattes.cnpq.br/7227955029154651
Access Rights: Acesso Aberto
Appears in Collections:DCOMP - Teses defendidas na UFC

Files in This Item:
File Description SizeFormat 
2025_tese_mvfborges.pdf5,99 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.