Técnicas em software livre para exploração de corpora do português livremente disponíveis na WWW

Araripe, Leonel Figueiredo de Alencar

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/52984

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.author	Araripe, Leonel Figueiredo de Alencar	-
dc.date.accessioned	2020-07-17T23:10:40Z	-
dc.date.available	2020-07-17T23:10:40Z	-
dc.date.issued	2009	-
dc.identifier.citation	ARARIPE, Leonel Figueiredo de Alencar. Técnicas em software livre para exploração de corpora do português livremente disponíveis na WWW. Veredas - Revista de Estudos Linguísticos, Juiz de Fora(MG), v. 13, n. 2, p. 134-150, 2009.	pt_BR
dc.identifier.issn	1982-2243	-
dc.identifier.uri	http://www.repositorio.ufc.br/handle/riufc/52984	-
dc.description.abstract	This paper approaches corpus linguistics as a subfield in applied informatics which features among its main focuses automatic data extraction from corpora. For this purpose, we develop commands and scripts in the UNIX bash command language, illustrating its applicability in the investigation of the -vel suffix and of iterations of letters and words in two of the main corpuses of Portuguese. We argue that using free software tools with textual interface, whose mastering together with programming skills is a necessity in computational linguistics, is more advantageous in corpus linguistics in comparison to commercial and proprietary programs with graphical interface.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.publisher	Veredas - Revista de Estudos Linguísticos	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Linguística de Corpus	pt_BR
dc.subject	Informática Aplicada	pt_BR
dc.subject	Sufixação	pt_BR
dc.subject	Repetição	pt_BR
dc.subject	Extração de dados	pt_BR
dc.subject	Linha de comando do UNIX	pt_BR
dc.title	Técnicas em software livre para exploração de corpora do português livremente disponíveis na WWW	pt_BR
dc.type	Artigo de Periódico	pt_BR
dc.description.abstract-ptbr	Este artigo aborda a lingüística de corpus como subárea da informática aplicada que tem na extração automática de dados de corpora um de seus focos principais. Com esse propósito, desenvolvemos comandos e scripts na linguagem de comandos bash do UNIX, exemplificando a sua aplicabilidade na investigação do sufixo -vel e de repetições de letras e palavras em dois dos principais corpora do português. Argumentamos que autilização de software livre com interface textual, cujo domínio, juntamente com a habilidade de programar, constitui uma necessidade na lingüística computacional, é mais vantajosa na lingüística de corpus em comparação com programas comerciais e proprietários com interface gráfica.	pt_BR
Aparece nas coleções:	DLE - Artigos publicados em revistas científicas

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2009_art_lfaararipe.pdf		141,92 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas