Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/83044| Tipo: | TCC |
| Título : | Um sistema de avaliação de pronúncia via encoder-decoder transformer |
| Autor : | Oliveira, Gabriel Campos de |
| Tutor: | Maia, José Gilvan Rodrigues |
| Palabras clave en portugués brasileño: | Avaliação de pronúncia;Reconhecimento automático de fala;Fonética;Alfabeto fonético internacional;Devolutiva automatizada |
| Palabras clave en inglés: | Pronunciation assessment;Automatic speech recognition;Phonetics;International phonetic alphabet;Automated feedback |
| Áreas de Conocimiento - CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Fecha de publicación : | 2025 |
| Citación : | OLIVEIRA, Gabriel Campos de. Um sistema de avaliação de pronúncia via encoder-decoder transformer. 2025. 44 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) — Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2025. |
| Resumen en portugués brasileño: | O domínio da pronúncia correta continua sendo um obstáculo significativo tanto na alfabetização quanto no aprendizado de línguas estrangeiras, pois desvios fonéticos (i.e., trocas, omissões ou distorções de sons) afetam diretamente a inteligibilidade da fala, o desempenho acadêmico e profissional. Aproveitando os avanços recentes em Automatic Speech Recognition (ASR) e técnicas de processamento fonético, este trabalho descreve o desenvolvimento de um sistema que converte gravações de voz em transcrições fonéticas alinhadas ao Alfabeto Fonético Internacional (IPA) e avalia a assertividade da pronúncia esperada. A plataforma combina o modelo Whisper-large-v3-turbo para ASR, um módulo de alinhamento forçado, gerando uma devolutiva que destaca os fonemas produzidos corretamente e aqueles que requerem correção. |
| Abstract: | Mastery of accurate pronunciation remains a significant hurdle in both literacy acquisition and foreign language learning, as phonetic deviations (i.e., substitutions, omissions, or distortions of sounds) directly impact speech intelligibility, as well as academic and professional performance. Leveraging recent advancements in Automatic Speech Recognition (ASR) and phonetic processing techniques, this work describes the development of a system that converts voice recordings into International Phonetic Alphabet (IPA)-aligned phonetic transcriptions and assesses the accuracy of the expected pronunciation. The platform combines the Whisper-large-v3-turbo model for ASR with a forced alignment module, generating feedback that highlights both correctly produced phonemes and those requiring correction. |
| URI : | http://repositorio.ufc.br/handle/riufc/83044 |
| Lattes del tutor: | http://lattes.cnpq.br/0022110232147076 |
| Derechos de acceso: | Acesso Aberto |
| Aparece en las colecciones: | ENGENHARIA DE COMPUTAÇÃO - Monografias |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 2025_tcc_gcoliveira.pdf | 1,67 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.