Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/67159
Tipo: Dissertação
Título : Avaliação de redes neurais auto-organizáveis para reconhecimento de voz em sistemas embarcados
Autor : Souza Júnior, Amauri Holanda de
Tutor: Barreto, Guilherme de Alencar
Palabras clave : Teleinformática;Redes neurais;Sistemas embarcados
Fecha de publicación : 2009
Citación : SOUZA JÚNIOR, A. H. Avaliação de redes neurais auto-organizáveis para reconhecimento de voz em sistemas embarcados. 2009. 121 fl. : Dissertação (mestrado) - Universidade Federal do Ceará, Departamento de Engenharia de Teleinformática, Fortaleza-CE, 2009.
Resumen en portugués brasileño: Esta dissertação apresenta um amplo estudo comparativo do desempenho de arquiteturas de redes neurais auto-organizáveis em tarefas de reconhecimento de voz para sistemas embarcados. Em particular, avalia-se a viabilidade do uso das redes SOM (self-organizing map) e TS-SOM (tree-structured SOM) na tarefa de interesse. Os sinais de voz são parametrizados por coeficientes LPC e Cepstrais, e os testes executados envolvem reconhecimento de voz nos modos dependente e independente do locutor. O conjunto de dados utilizado neste trabalho consiste de 17 classes de elocuções, pronunciadas naturalmente, correspondendo aos dígitos e operações necessárias para o desenvolvimento de uma calculadora acionada pela voz. A aplicação é então embarcada em um smartphone N95 da Nokia. Os resultados indicam que as redes SOM e TS-SOM podem ser aplicadas na tarefa de interesse com sucesso, e apresentaram resultados similares ou superiores aos de outras técnicas clássicas quanto à taxa de reconhecimento e custo computacional.
Abstract: This dissertation presents a comprehensive performance comparison study of self-organizing neural network architectures applied to speech recognition in embedded systems. In particular, we assess the feasibility of using the self-organizing map (SOM) and the tree-structured self- organizing map (TS-SOM) in the task of interest. Speech signals are parameterized through LPC and Cepstral coefficients, and both, speaker dependent and speaker independent tests, are carried out. The speech data used in this work consisted of 17 classes of words, naturally pronounced, corresponding to digits and operators required to develop a voice-driven calculator. The application is then embedded into the N95 Nokia smartphone. The obtained results indicate that the SOM and TS-SOM networks can be successfully applied to the task of interest, since they perform similarly to or even better than classical speech recognition methods, concerning recognition rates and the computational costs.
URI : http://www.repositorio.ufc.br/handle/riufc/67159
Aparece en las colecciones: DETE - Dissertações defendidas na UFC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2009_dis_ahsouzajunior.pdf1,3 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.