Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/74512
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMacêdo, José Antonio Fernandes de-
dc.contributor.authorSoares, Felipe Melo-
dc.date.accessioned2023-09-28T15:00:55Z-
dc.date.available2023-09-28T15:00:55Z-
dc.date.issued2019-
dc.identifier.citationSOARES, Felipe Melo. Compressão de sentenças sobre domínios com disponibilidade limitada de dados rotulados. 2019. 77 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2019.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/74512-
dc.description.abstractHuge volumes of data are produced every day on the Web. These are a big amount of videos, images, and texts that store unstructured information. Text summarization systems were created to facilitate the presentations of large amounts of textual data as well as to aid information retrieval over this type of data. The sentence compression has been developed due to the need for better summaries generated by these systems. However, when trained over domains with restricted amounts of labeled data for sentence compression, neural netword-based models tend to not be able to extract important features. Thus, to improve the performance of these models in this scenario, some pieces of information must be extracted and adapted before being used for training. Thus, we propose a sentence compression model capable of achieving competitive results, even when trained with smaller amounts of data, compared with other neural networkbased models, by using a set of linguistic features extracted from words alongside a rare words reduction strategy over the sentences.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleCompressão de sentenças sobre domínios com disponibilidade limitada de dados rotuladospt_BR
dc.typeDissertaçãopt_BR
dc.description.abstract-ptbrDia após dia, volumes gigantescos de dados são produzidos na Web. São grandes quantidades de vídeos, imagens e textos que armazenam informação de maneira não estruturada. Sistemas de sumarização de textos foram criados com o intuito facilitar a apresentação de grandes quantidades de dados textuais para usuários assim como para facilitar a recuperação de informações nesses tipos de dados. A tarefa de compressão de sentenças surgiu para melhorar a qualidade dos sumários gerados por esses sistemas. No entanto, em domínios com pouca disponibilidade de dados rotulados para a compressão de sentenças, modelos baseados em redes neurais tem grandes dificuldades de extrair todas as informações que eles precisam. Para melhorar a performance destes modelos neste cenário, é possível que parte da informação das palavras seja extraída e adaptada antes de ser utilizada para o treinamento. Portanto, este trabalho propõe um método de compressão de sentenças capaz de atingir resultados competitivos mesmo utilizando quantidades de dados inferiores ao normalmente utilizado na literatura através da utilização de um conjunto de atributos linguísticos extraídos das palavras, aliada a uma estratégia de redução de palavras raras aplicada sobre as sentenças.pt_BR
dc.title.enSentence compression on domains with restricted labeled data availabilitypt_BR
dc.subject.ptbrCompressão de sentençaspt_BR
dc.subject.ptbrSumarização automática de textospt_BR
dc.subject.ptbrProcessamento de linguagem naturalpt_BR
dc.subject.ptbrRedes neurais recorrentespt_BR
dc.subject.ptbrRotulação de sequênciaspt_BR
dc.subject.enSentence compressionpt_BR
dc.subject.enAutomatic text summarizationpt_BR
dc.subject.enNatural language processingpt_BR
dc.subject.enRecurrent neural networkspt_BR
dc.subject.enSequence labelingpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
local.author.latteshttp://lattes.cnpq.br/1407114598800709pt_BR
local.advisor.latteshttp://lattes.cnpq.br/5801731850423324pt_BR
local.date.available2019-
Aparece nas coleções:DCOMP - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2019_dis_fmsoares.pdf1,5 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.