Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/52984
Tipo: | Artigo de Periódico |
Título : | Técnicas em software livre para exploração de corpora do português livremente disponíveis na WWW |
Autor : | Araripe, Leonel Figueiredo de Alencar |
Palabras clave : | Linguística de Corpus;Informática Aplicada;Sufixação;Repetição;Extração de dados;Linha de comando do UNIX |
Fecha de publicación : | 2009 |
Editorial : | Veredas - Revista de Estudos Linguísticos |
Citación : | ARARIPE, Leonel Figueiredo de Alencar. Técnicas em software livre para exploração de corpora do português livremente disponíveis na WWW. Veredas - Revista de Estudos Linguísticos, Juiz de Fora(MG), v. 13, n. 2, p. 134-150, 2009. |
Resumen en portugués brasileño: | Este artigo aborda a lingüística de corpus como subárea da informática aplicada que tem na extração automática de dados de corpora um de seus focos principais. Com esse propósito, desenvolvemos comandos e scripts na linguagem de comandos bash do UNIX, exemplificando a sua aplicabilidade na investigação do sufixo -vel e de repetições de letras e palavras em dois dos principais corpora do português. Argumentamos que autilização de software livre com interface textual, cujo domínio, juntamente com a habilidade de programar, constitui uma necessidade na lingüística computacional, é mais vantajosa na lingüística de corpus em comparação com programas comerciais e proprietários com interface gráfica. |
Abstract: | This paper approaches corpus linguistics as a subfield in applied informatics which features among its main focuses automatic data extraction from corpora. For this purpose, we develop commands and scripts in the UNIX bash command language, illustrating its applicability in the investigation of the -vel suffix and of iterations of letters and words in two of the main corpuses of Portuguese. We argue that using free software tools with textual interface, whose mastering together with programming skills is a necessity in computational linguistics, is more advantageous in corpus linguistics in comparison to commercial and proprietary programs with graphical interface. |
URI : | http://www.repositorio.ufc.br/handle/riufc/52984 |
ISSN : | 1982-2243 |
Derechos de acceso: | Acesso Aberto |
Aparece en las colecciones: | DLE - Artigos publicados em revistas científicas |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
2009_art_lfaararipe.pdf | 141,92 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.