Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/73526
Tipo: | Dissertação |
Título: | Modelos de regressão linear para dados intervalares usando transformações logarítmicas |
Título em inglês: | Linear regression models for interval-valued data using log-transformations |
Autor(es): | Barbosa, Nykolas Mayko Maia |
Orientador: | Gomes, João Paulo Pordeus |
Coorientador: | Mattos, César Lincoln Cavalcante |
Palavras-chave: | Regressão linear;Dados intervalares;Aprendizado sequencial |
Data do documento: | 2019 |
Instituição/Editor/Publicador: | Universidade Federal do Ceará |
Citação: | BARBOSA, Nykolas Mayko Maia. Modelos de regressão linear para dados intervalares usando transformações logarítmicas. 2019. 48 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2019. |
Resumo: | Resolver problemas de aprendizagem de máquina com conjuntos de dados intervalares é uma tarefa desafiadora que pode surgir em muitas aplicações do mundo real, por exemplo, na predição da pressão arterial (sistólica e diastólica). Diante disso, muitos pesquisadores propuseram métodos de regressão linear para lidar com dados intervalares nos últimos anos. Embora muitos esforços tenham sido aplicados nesses problemas, todos os métodos disponíveis dependem da modelagem do problema como uma tarefa de otimização restrita, as quais podem levar a resultados sub-ótimos. Além disso, nenhum trabalho anterior forneceu uma maneira de treinar um modelo de forma incremental, o qual é fundamental para problemas de big data. Nesse trabalho, atacou-se ambos esses problemas pela proposição de dois diferentes métodos de regressão linear baseados em transformações logarítmicas. Os métodos propostos serão referidos como Mínimos Quadrados Ordinários Log Transformados (Log-transformed Ordinary Least Squares for Interval Data) (LOID) e Mínimos Quadrados Estocásticos Log Transformados (Log-transformed Least Mean Squares for Interval Data) (LLID) para dados intervalares, ambos foram comparados com o método estado da arte em conjuntos de dados sintéticos e reais. Os resultados obtidos indicam a viabilidade de ambas abordagens propostas por este trabalho. Além disso, destaca-se que, diante do que foi pesquisado, o LLID é o primeiro método de regressão linear sequencial para dados intervalares. |
Abstract: | Solving linear regression problems on interval-valued data is a challenging task that may arise in many applications, for example, blood pressure prediction (sistolic and diastolic). Because of that, many researchers have designed methods for such task in recent years. Although much e!ort has been devoted to this problem, all available methods rely on modeling the problem as a constrained optimization task, which may lead to sub-optimal results. Moreover, no previous work provide a way to train a model in a incremental way, which is fundamental for big data problems. In this paper, we address both problems by proposing two di!erent linear regression methods based on log-transformations. The proposed methods, referred as Log-transformed OLS for interval data (LOID) and Logtransformed LMS for interval data (LLID), are compared to state-of-the-art methods on both synthetic and real-world datasets. The obtained results indicate the feasibility of our approaches. Furthermore, to the best of our knowledge, LLID is the first sequential linear regression method for interval valued. |
URI: | http://www.repositorio.ufc.br/handle/riufc/73526 |
Aparece nas coleções: | DCOMP - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2019_dis_nmmbarbosa.pdf | 616,57 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.