Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/80792
Tipo: Dissertação
Título: Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos
Título em inglês: Solutions for anomaly detection in multivariate time series using predictive models
Autor(es): Trentini, Erick Lima
Orientador: Macêdo, José Antonio Fernandes de
Coorientador: Silva, Ticiana Linhares Coelho da
Palavras-chave em português: Séries temporais;Detecção de anomalias;Redes neurais;Descoberta de períodos;Ensembles
Palavras-chave em inglês: Time series;Anomaly detection;Neural networks;Period discovery;Ensembles
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Data do documento: 2021
Citação: TRENTINI, Erick Lima. Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos. 2021. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021.
Resumo: Detecção de anomalias em séries temporais é uma área de estudo em rápido crescimento atualmente, devido ao aumento exponencial da criação de novos dados temporais produzidos por sensores de diversos contextos, como, por exemplo, a Internet das Coisas (IoT). Muitos modelos preditivos foram propostos ao longo dos anos, e muitos trazem resultados promissores na diferenciação de pontos normais e anômalos nas séries temporais. Neste trabalho, serão propostas três contribuições. Em uma delas, buscamos encontrar e combinar os melhores modelos preditivos em detecção de anomalias em séries temporais, para que as diferentes estratégias e diferentes parâmetros na criação dos modelos possam contribuir para a análise das séries, propondo um ensemble baseado em modelos chamado TSPME-AD (Time Series Prediction Model Ensemble for Anomaly Detection, ou Ensemble de Modelos Preditivos em Séries Temporais para a Detecção de Anomalias). O TSPME-AD utiliza os modelos preditivos do estado-da-arte e combina seus scores de anomalias com uma função ponderada. As outras duas contribuições desse trabalho são, uma técnica dinâmica de quebra de janelas, que utiliza a periodicidade e o formato das séries para facilitar o treinamento dos modelos e a descoberta de padrões, e um novo modelo de auto-encoder que modifica a estrutura de um dos modelos do estado-da-arte. A efetividade das propostas do trabalho são analisadas com o uso de dois conjuntos de dados reais, sendo esses os dados de um ano de demanda de energia elétrica, e o banco de dados de eletrocardiogramas do MIT. Com os experimentos, demonstramos que a técnica de ensemble proposta, melhora o score F1 em até 22% comparado com o melhor score dentre os modelos individuais que a compõem, com nossa função de combinação específica apresentando uma melhora de até 13% com relação a outras funções de combinação mais simples. Também demonstramos que nossa nova arquitetura de auto-encoder, combinada com a nova estratégia de quebra dinâmica de janelas consegue melhorias de até 25% no score F1 comparado com uma das técnicas de auto-encoder do estado-da-arte, e uma melhoria de até 64% comparado com um modelo de LSTM empilhada.
Abstract: Time-series anomalies detection is a fast-growing area of study, due to the exponential growth of new data produced by sensors in many different contexts as the Internet of Things (IoT). Many predictive models have been proposed, and they provide promising results in differentiating normal and anomalous points in a time-series. In this work, we provide three contributions. We aim to identify and combine the best models for detecting anomalies in time-series, so that the different strategies or parameters of the models can contribute to the time series analysis by proposing a model-centered ensemble called TSPME-AD (stands for Time Series Prediction Model Ensemble for Anomaly Detection). TSPME-AD uses state-of-the-art predictive models, combining their anomaly scores using a weighted function. Other contributions are a dynamic window breaking technique based on scanning thresholds, leveraging the periodicity and shape of the series to generate windows that aid in training and testing models, and a new auto-encoder predictive model. The effectiveness of our proposals is analyzed using two real-world time-series datasets, a year of power demand data, and the MIT electrocardiogram database. We show that our ensemble technique improves on the F1 score up to 22% on the best score of the individual models composing the ensemble, with our specific combination function improving on simpler functions on up to 13% F1 score increase. We also show that our new auto-encoder architecture, combined with the new window breaking technique, can have an up to 25% F1 score increase compared to another proposed auto-encoder technique, and a 64% score increase over a stacked LSTM model.
URI: http://repositorio.ufc.br/handle/riufc/80792
ORCID do(s) Autor(es): https://orcid.org/0000-0002-9213-8458
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/5994900773879580
ORCID do Orientador: 0000-0002-0661-2978
Currículo Lattes do Orientador: http://lattes.cnpq.br/5801731850423324
Currículo Lattes do Coorientador: http://lattes.cnpq.br/3125027229507836
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DCOMP - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2021_dis_eltrentini.pdf1,24 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.