Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos

Trentini, Erick Lima

Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/80792

Type:	Dissertação
Title:	Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos
Title in English:	Solutions for anomaly detection in multivariate time series using predictive models
Authors:	Trentini, Erick Lima
Advisor:	Macêdo, José Antonio Fernandes de
Co-advisor:	Silva, Ticiana Linhares Coelho da
Keywords in Brazilian Portuguese :	Séries temporais;Detecção de anomalias;Redes neurais;Descoberta de períodos;Ensembles
Keywords in English :	Time series;Anomaly detection;Neural networks;Period discovery;Ensembles
Knowledge Areas - CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Issue Date:	2021
Citation:	TRENTINI, Erick Lima. Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos. 2021. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021.
Abstract in Brazilian Portuguese:	Detecção de anomalias em séries temporais é uma área de estudo em rápido crescimento atualmente, devido ao aumento exponencial da criação de novos dados temporais produzidos por sensores de diversos contextos, como, por exemplo, a Internet das Coisas (IoT). Muitos modelos preditivos foram propostos ao longo dos anos, e muitos trazem resultados promissores na diferenciação de pontos normais e anômalos nas séries temporais. Neste trabalho, serão propostas três contribuições. Em uma delas, buscamos encontrar e combinar os melhores modelos preditivos em detecção de anomalias em séries temporais, para que as diferentes estratégias e diferentes parâmetros na criação dos modelos possam contribuir para a análise das séries, propondo um ensemble baseado em modelos chamado TSPME-AD (Time Series Prediction Model Ensemble for Anomaly Detection, ou Ensemble de Modelos Preditivos em Séries Temporais para a Detecção de Anomalias). O TSPME-AD utiliza os modelos preditivos do estado-da-arte e combina seus scores de anomalias com uma função ponderada. As outras duas contribuições desse trabalho são, uma técnica dinâmica de quebra de janelas, que utiliza a periodicidade e o formato das séries para facilitar o treinamento dos modelos e a descoberta de padrões, e um novo modelo de auto-encoder que modifica a estrutura de um dos modelos do estado-da-arte. A efetividade das propostas do trabalho são analisadas com o uso de dois conjuntos de dados reais, sendo esses os dados de um ano de demanda de energia elétrica, e o banco de dados de eletrocardiogramas do MIT. Com os experimentos, demonstramos que a técnica de ensemble proposta, melhora o score F1 em até 22% comparado com o melhor score dentre os modelos individuais que a compõem, com nossa função de combinação específica apresentando uma melhora de até 13% com relação a outras funções de combinação mais simples. Também demonstramos que nossa nova arquitetura de auto-encoder, combinada com a nova estratégia de quebra dinâmica de janelas consegue melhorias de até 25% no score F1 comparado com uma das técnicas de auto-encoder do estado-da-arte, e uma melhoria de até 64% comparado com um modelo de LSTM empilhada.
Abstract:	Time-series anomalies detection is a fast-growing area of study, due to the exponential growth of new data produced by sensors in many different contexts as the Internet of Things (IoT). Many predictive models have been proposed, and they provide promising results in differentiating normal and anomalous points in a time-series. In this work, we provide three contributions. We aim to identify and combine the best models for detecting anomalies in time-series, so that the different strategies or parameters of the models can contribute to the time series analysis by proposing a model-centered ensemble called TSPME-AD (stands for Time Series Prediction Model Ensemble for Anomaly Detection). TSPME-AD uses state-of-the-art predictive models, combining their anomaly scores using a weighted function. Other contributions are a dynamic window breaking technique based on scanning thresholds, leveraging the periodicity and shape of the series to generate windows that aid in training and testing models, and a new auto-encoder predictive model. The effectiveness of our proposals is analyzed using two real-world time-series datasets, a year of power demand data, and the MIT electrocardiogram database. We show that our ensemble technique improves on the F1 score up to 22% on the best score of the individual models composing the ensemble, with our specific combination function improving on simpler functions on up to 13% F1 score increase. We also show that our new auto-encoder architecture, combined with the new window breaking technique, can have an up to 25% F1 score increase compared to another proposed auto-encoder technique, and a 64% score increase over a stacked LSTM model.
URI:	http://repositorio.ufc.br/handle/riufc/80792
Author's ORCID:	https://orcid.org/0000-0002-9213-8458
Author's Lattes:	http://lattes.cnpq.br/5994900773879580
Advisor's ORCID:	0000-0002-0661-2978
Advisor's Lattes:	http://lattes.cnpq.br/5801731850423324
Co-advisor's Lattes:	http://lattes.cnpq.br/3125027229507836
Access Rights:	Acesso Aberto
Appears in Collections:	DCOMP - Dissertações defendidas na UFC

Files in This Item:

File	Description	Size	Format
2021_dis_eltrentini.pdf		1,24 MB	Adobe PDF	View/Open

Show full item record