Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/79971
Tipo: Tese
Título: A syntactic-semantic analysis method for automatic API connection points discovery in systems-of-information systems
Autor(es): Borges, Marcos Vinícius de Freitas
Orientador: Rocha, Lincoln Souza
Coorientador: Maia, Paulo Henrique Mendes
Palavras-chave em português: Sistemas de sistemas-de-informação;Descoberta de pontos de conexão;API;Análise sintática;Análise semântica
Palavras-chave em inglês: Systems-of-information systems;Connection points discovery;API;Syntactic analysis;Semantic analysis
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Data do documento: 2025
Citação: BORGES, Marcos Vinícius de Freitas. A syntactic-semantic analysis method for automatic API connection points discovery in systems-of-information systems. 2025. 135 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2025.
Resumo: Estabelecer links de interoperabilidade é um desafio significativo na engenharia de sistemas de sistemas-de-informação (SoIS, do inglês systems-of-information systems). Mesmo com a documentação das interfaces dos sistemas constituintes (CS, do inglês constituent systems), alcançar esses links é uma tarefa difícil, demorada e suscetível a erros, que requer atenção dos desenvolvedores de CS, especialmente se realizada manualmente. Para contribuir com essa tarefa, esta tese apresenta um método semiautomático que utiliza análise de similaridade sintática e semântica de descrições de interfaces de programação de aplicações (API, do inglês application programming interface) para identificar potenciais pontos de conexão entre CS. Esse método é constituído por três etapas interligadas: (i) definição de requisitos, onde são delineadas as motivações e justificativas para a criação do método; (ii) design do núcleo do método, onde são detalhadas todas as fases e componentes necessários para obter os pontos de conexão de API; e (iii) implementação do núcleo do método, onde são apresentadas os detalhes tecnológicos da ferramenta desenvolvida para suportar o método. Através dessa ferramenta, foram realizadas duas avaliações. Na primeira, foi executado um experimento controlado para avaliar o desempenho da ferramenta e definir empiricamente os melhores algoritmos de similaridade e limiares para a tarefa de identificação de pontos de conexão entre duas API bem conhecidas. Na segunda, a ferramenta foi empregada em um estudo de caso aplicado a um SoIS real de um fabricante global de computadores. O estudo abrangeu três cenários, envolvendo sete API de CS, e considerou as perspectivas de análise sintática, e análise sintático-semântica de API. Em seguida, foram conduzidas entrevistas semiestruturadas com cinco desenvolvedores que trabalharam no SoIS para avaliar a eficiência da ferramenta. Os resultados demonstraram que a ferramenta é bem-sucedida, com a análise de similaridade sintática e semântica de API provando ser eficiente para identificar links de interoperabilidade entre CS. Do ponto de vista prático, os algoritmos sintáticos demonstraram desempenho notável em ambientes locais. Ao mesmo tempo, a análise semântica, que é mais robusta, requer infraestrutura avançada devido à sua alta complexidade computacional. Do ponto de vista da pesquisa, o uso de similaridade semântica de textos curtos (STSS, do inglês short text semantic similarity) é ainda um campo promissor, e o uso de inteligência artificial com modelos largos de linguagem (LLM, do inglês Large Language Models) pode gerar novos resultados e descobertas de links de interoperabilidade em SoIS.
Abstract: Establishing interoperability links is a significant challenge in systems-of-information systems (SoIS) engineering. Even with constituent systems (CS) interfaces documentation, achieving such links is a difficult, time-consuming, and error-prone task that requires attention from CS developers, especially if it is performed manually. To contribute to that task, this thesis presents a semi-automatic method using both syntactic and semantic similarity analysis of application programming interface (API) descriptions to identify potential connection points among CS. That method consists of three interconnected steps: (i) requirements definition, where the motivations and justifications for creating the method are outlined; (ii) core method design, where all the phases and components necessary to obtain the API connection points are detailed; and (iii) core method implementation, where the technological details of the tool developed to support the method are presented. Through that tool, two evaluations were performed. In the first, a controlled experiment was executed to evaluate the tool’s performance and empirically define the best similarity algorithms and thresholds for the task of identifying connection points between two well-known API. In the second, the tool was used in a case study applied to a real-world SoIS of a global computer manufacturer. The study covered three scenarios, involving seven CS API, and considered the perspectives of syntactic analysis and syntactic-semantic analysis of API. Then, semi-structured interviews were conducted with five developers who worked on the SoIS to evaluate the tool’s efficiency. The results demonstrated that the tool is successful, with the syntactic and semantic similarity analysis of API proving to be efficient in identifying interoperability links between CS. From a practical point of view, the syntactic algorithms demonstrated notable performance in local environments. At the same time, semantic analysis, which is more robust, requires advanced infrastructure due to its high computational complexity. From a research perspective, the use of short text semantic similarity (STSS) is still a promising field, and the use of artificial intelligence with Large Language Models (LLM) can generate new results and discoveries of interoperability links in SoIS.
URI: http://repositorio.ufc.br/handle/riufc/79971
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/3020917473487656
ORCID do Orientador: https://orcid.org/0000-0001-5402-8744
Currículo Lattes do Orientador: http://lattes.cnpq.br/0656977742590515
Currículo Lattes do Coorientador: http://lattes.cnpq.br/7227955029154651
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DCOMP - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tese_mvfborges.pdf5,99 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.