Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/73526
Tipo: Dissertação
Título: Modelos de regressão linear para dados intervalares usando transformações logarítmicas
Título em inglês: Linear regression models for interval-valued data using log-transformations
Autor(es): Barbosa, Nykolas Mayko Maia
Orientador: Gomes, João Paulo Pordeus
Coorientador: Mattos, César Lincoln Cavalcante
Palavras-chave: Regressão linear;Dados intervalares;Aprendizado sequencial
Data do documento: 2019
Instituição/Editor/Publicador: Universidade Federal do Ceará
Citação: BARBOSA, Nykolas Mayko Maia. Modelos de regressão linear para dados intervalares usando transformações logarítmicas. 2019. 48 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2019.
Resumo: Resolver problemas de aprendizagem de máquina com conjuntos de dados intervalares é uma tarefa desafiadora que pode surgir em muitas aplicações do mundo real, por exemplo, na predição da pressão arterial (sistólica e diastólica). Diante disso, muitos pesquisadores propuseram métodos de regressão linear para lidar com dados intervalares nos últimos anos. Embora muitos esforços tenham sido aplicados nesses problemas, todos os métodos disponíveis dependem da modelagem do problema como uma tarefa de otimização restrita, as quais podem levar a resultados sub-ótimos. Além disso, nenhum trabalho anterior forneceu uma maneira de treinar um modelo de forma incremental, o qual é fundamental para problemas de big data. Nesse trabalho, atacou-se ambos esses problemas pela proposição de dois diferentes métodos de regressão linear baseados em transformações logarítmicas. Os métodos propostos serão referidos como Mínimos Quadrados Ordinários Log Transformados (Log-transformed Ordinary Least Squares for Interval Data) (LOID) e Mínimos Quadrados Estocásticos Log Transformados (Log-transformed Least Mean Squares for Interval Data) (LLID) para dados intervalares, ambos foram comparados com o método estado da arte em conjuntos de dados sintéticos e reais. Os resultados obtidos indicam a viabilidade de ambas abordagens propostas por este trabalho. Além disso, destaca-se que, diante do que foi pesquisado, o LLID é o primeiro método de regressão linear sequencial para dados intervalares.
Abstract: Solving linear regression problems on interval-valued data is a challenging task that may arise in many applications, for example, blood pressure prediction (sistolic and diastolic). Because of that, many researchers have designed methods for such task in recent years. Although much e!ort has been devoted to this problem, all available methods rely on modeling the problem as a constrained optimization task, which may lead to sub-optimal results. Moreover, no previous work provide a way to train a model in a incremental way, which is fundamental for big data problems. In this paper, we address both problems by proposing two di!erent linear regression methods based on log-transformations. The proposed methods, referred as Log-transformed OLS for interval data (LOID) and Logtransformed LMS for interval data (LLID), are compared to state-of-the-art methods on both synthetic and real-world datasets. The obtained results indicate the feasibility of our approaches. Furthermore, to the best of our knowledge, LLID is the first sequential linear regression method for interval valued.
URI: http://www.repositorio.ufc.br/handle/riufc/73526
Aparece nas coleções:DCOMP - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2019_dis_nmmbarbosa.pdf616,57 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.