Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/66566
Type: TCC
Title: Obtenção e análise in silico de sequências de aminoácidos presentes em anticorpos humanos
Authors: Diniz, Gabriele Gomes
Advisor: Silva, Maria Goretti de Vasconcelos
Co-advisor: Oliveira, Cássio Pinheiro
Keywords: Anticorpos;Bioquímica;CDRs;In silico;NCBI
Issue Date: 2021
Citation: DINIZ, Gabriele Gomes. Obtenção e análise in silico de sequências de aminoácidos presentes em anticorpos humanos. 2021. 36 f. Trabalho de Conclusão de Curso (Bacharelado em Química) - Universidade Federal do Ceará, Fortaleza, 2021.
Abstract in Brazilian Portuguese: Os anticorpos são proteínas que tem a função de identificar corpos estranhos e elicitar resposta imunológica. O estudo das características bioquímicas dos anticorpos foi, e continua sendo, essencial para o desenvolvimento de novas tecnologias que envolvam essa classe de proteínas. Devido a sua função, a diversidade de anticorpos é alta, o que representa uma barreira para o estudo de anticorpos em larga escala. Esse tipo de estudo, entretanto, pode ser uma forma de chegar a conhecimentos importantes que abrangem os anticorpos de uma maneira mais geral. Com o avanço da computação e da bioinformática, se tornou possível realizar estudos em larga escala com métodos in silico. O presente trabalho busca, então, obter sequências de cadeias leves e pesadas de anticorpos humanos e realizar análises in silico das características bioquímicas dessas cadeias obtidas, em larga escala. A obtenção se deu pela interface do NCBI, portal que reúne diversos bancos de dados, incluindo bancos de sequência de aminoácidos de anticorpos. Esta obtenção foi realizada pela ferramenta Entrez, que realiza buscas textuais. As sequências de aminoácidos obtidas foram então filtradas por meio da linguagem Python, e numeradas pelo programa ANARCI, com o esquema de Kabat. Após a numeração, realizou-se análises de comprimentos das CDRs e a partir disso, selecionou-se duas CDRs para seguir com as análises bioquímicas. Estas análises foram feitas por meio da linguagem Python e com uso da biblioteca MatPlotLib, e estas análises consistiam de frequência de aminoácido por posição, caráter químico por posição, e GRAVY por posição. Obteve-se cerca de 52 mil cadeias leves e 36 mil cadeias pesadas. Observou-se que algumas posições dentro das CDRs estudadas apresentavam frequência maior de certos tipos de aminoácidos, e/ou frequência maior de certo caráter químico, o que indica a possibilidade que o resíduo ou sua natureza química naquela posição tem algum papel na função ou estabilidade dos anticorpos humanos. Observou-se também que não há uma correlação forte entre o GRAVY por posição e o caráter químico por posição. De modo geral, conseguiu-se mapear alguns padrões dentre as sequências de aminoácidos estudadas, o que pode fornecer dados importantes para tecnologias que trabalhem com humanização, enxertos de CDRs e mutagênese de anticorpos humanos.
Abstract: Antibodies are proteins that identify antigens and elicit immune response. The study of antibodies’ biochemical characteristics was, and still is, essential to the development of new technologies that employ such proteins. Due to their function, there is a great diversity of antibodies, which represents a hurdle to the study of antibodies in large scale. This type of study, however, may be a way of arriving to important insights that relate to antibodies as a whole. With the advancement of informatics and bioinformatics, it became possible to do such studies in large scale through in silico methods. This work seeks to obtain amino acid sequences of light and heavy chains of human antibodies and run in silico analysis of the biochemical characteristics of those sequences. The obtainment of the sequences was through the interface of NCBI, a website that unites several data bases, including aminoacid sequence data banks. The “Entrez” tool, which does textual searches, was used for such obtainment. The obtained sequences were then selected through scripts in Python language and numbered by the software ANARCI according to the Kabat numbering scheme. After that, an analysis of the CDRs lengths was done, and through the results two CDRs were selected to be further analyzed. The biochemical analysis were made through the Python language and the graphs were plotted with the MatPlotLib library; the analyses were: amino acid per position, chemical character per position and GRAVY per position. Around 52 thousand light chain sequences and 36 thousand heavy chain sequences were obtained. Some CDRs positions displayed tendencies in either amino acid type per position and/or chemical character per position, which indicates the possibility that those positions played a role in either function or stability of human antibodies. There didn’t seem to be any correlation between the GRAVY per position and the dominant chemical character per position. All in all, it was possible to map certain trends within the studied amino acid sequences, which may provide important data to technologies that deal with humanization, CDR grafting and mutagenesis of human antibodies.
URI: http://www.repositorio.ufc.br/handle/riufc/66566
Appears in Collections:QUÍMICA - BACHARELADO - Monografias

Files in This Item:
File Description SizeFormat 
2021_tcc_ggdiniz.pdf938,36 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.