Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/26049
Tipo: | Artigo de Evento |
Título : | Aelius: uma ferramenta para anotação automática de corpora usando o NLTK |
Autor : | Araripe, Leonel Figueiredo de Alencar |
Palabras clave : | Aelius;Natural Language Toolkit (NLTK);Ferramenta para anotação automática de corpora |
Fecha de publicación : | 2010 |
Editorial : | IX Encontro de Linguística de Corpus |
Citación : | ARARIPE, Leonel Figueiredo de Alencar. Aelius: uma ferramenta para anotação automática de corpora usando o NLTK. In: ENCONTRO DE LINGUÍSTICA DE CORPUS, 9, 2010, Porto Alegre. Anais ... Porto Alegre: PUCRS, 2010. 8p. |
Resumen en portugués brasileño: | Este trabalho descreve aspectos do Aelius, pacote em Python que, utilizando a biblioteca Natural Language Toolkit (NLTK) (Bird, Klein e Loper, 2009), se destina ao pré-processamento de textos, construção de etiquetador morfossintático, anotação de corpora e auxílio de revisão humana de anotação automática. O Aelius não se limita a oferecer uma interface simplificada para algumas dessas funcionalidades no NLTK, mas o complementa de várias formas, com destaque para o aumento da eficácia da etiquetagem morfossintática por meio da utilização de um algoritmo próprio para lidar com palavras de inicial maiúscula. Os módulos de construção de etiquetador e anotação morfossintática de corpora são exemplificados por meio de sua aplicação, no âmbito do projeto CORPTEXLIT (Alencar, 2010), a textos do português do séc. XIX ainda não contemplados pelo Corpus Histórico do Português Tycho Brahe (CHPTB). O nível alcançado de acurácia da etiquetagem supera o de ferramentas análogas livremente disponíveis, voltadas sobretudo para o português contemporâneo. |
URI : | http://www.repositorio.ufc.br/handle/riufc/26049 |
Derechos de acceso: | Acesso Aberto |
Aparece en las colecciones: | DLE - Trabalhos apresentados em eventos |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
2010_eve_lfalencar.pdf | 1,04 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.