Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/67159
Tipo: | Dissertação |
Título: | Avaliação de redes neurais auto-organizáveis para reconhecimento de voz em sistemas embarcados |
Autor(es): | Souza Júnior, Amauri Holanda de |
Orientador: | Barreto, Guilherme de Alencar |
Palavras-chave: | Teleinformática;Redes neurais;Sistemas embarcados |
Data do documento: | 2009 |
Citação: | SOUZA JÚNIOR, A. H. Avaliação de redes neurais auto-organizáveis para reconhecimento de voz em sistemas embarcados. 2009. 121 fl. : Dissertação (mestrado) - Universidade Federal do Ceará, Departamento de Engenharia de Teleinformática, Fortaleza-CE, 2009. |
Resumo: | Esta dissertação apresenta um amplo estudo comparativo do desempenho de arquiteturas de redes neurais auto-organizáveis em tarefas de reconhecimento de voz para sistemas embarcados. Em particular, avalia-se a viabilidade do uso das redes SOM (self-organizing map) e TS-SOM (tree-structured SOM) na tarefa de interesse. Os sinais de voz são parametrizados por coeficientes LPC e Cepstrais, e os testes executados envolvem reconhecimento de voz nos modos dependente e independente do locutor. O conjunto de dados utilizado neste trabalho consiste de 17 classes de elocuções, pronunciadas naturalmente, correspondendo aos dígitos e operações necessárias para o desenvolvimento de uma calculadora acionada pela voz. A aplicação é então embarcada em um smartphone N95 da Nokia. Os resultados indicam que as redes SOM e TS-SOM podem ser aplicadas na tarefa de interesse com sucesso, e apresentaram resultados similares ou superiores aos de outras técnicas clássicas quanto à taxa de reconhecimento e custo computacional. |
Abstract: | This dissertation presents a comprehensive performance comparison study of self-organizing neural network architectures applied to speech recognition in embedded systems. In particular, we assess the feasibility of using the self-organizing map (SOM) and the tree-structured self- organizing map (TS-SOM) in the task of interest. Speech signals are parameterized through LPC and Cepstral coefficients, and both, speaker dependent and speaker independent tests, are carried out. The speech data used in this work consisted of 17 classes of words, naturally pronounced, corresponding to digits and operators required to develop a voice-driven calculator. The application is then embedded into the N95 Nokia smartphone. The obtained results indicate that the SOM and TS-SOM networks can be successfully applied to the task of interest, since they perform similarly to or even better than classical speech recognition methods, concerning recognition rates and the computational costs. |
URI: | http://www.repositorio.ufc.br/handle/riufc/67159 |
Aparece nas coleções: | DETE - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2009_dis_ahsouzajunior.pdf | 1,3 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.