Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/80792| Tipo: | Dissertação |
| Título : | Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos |
| Título en inglés: | Solutions for anomaly detection in multivariate time series using predictive models |
| Autor : | Trentini, Erick Lima |
| Tutor: | Macêdo, José Antonio Fernandes de |
| Co-asesor: | Silva, Ticiana Linhares Coelho da |
| Palabras clave en portugués brasileño: | Séries temporais;Detecção de anomalias;Redes neurais;Descoberta de períodos;Ensembles |
| Palabras clave en inglés: | Time series;Anomaly detection;Neural networks;Period discovery;Ensembles |
| Áreas de Conocimiento - CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Fecha de publicación : | 2021 |
| Citación : | TRENTINI, Erick Lima. Soluções em detecção de anomalias em séries temporais multivariadas utilizando modelos preditivos. 2021. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021. |
| Resumen en portugués brasileño: | Detecção de anomalias em séries temporais é uma área de estudo em rápido crescimento atualmente, devido ao aumento exponencial da criação de novos dados temporais produzidos por sensores de diversos contextos, como, por exemplo, a Internet das Coisas (IoT). Muitos modelos preditivos foram propostos ao longo dos anos, e muitos trazem resultados promissores na diferenciação de pontos normais e anômalos nas séries temporais. Neste trabalho, serão propostas três contribuições. Em uma delas, buscamos encontrar e combinar os melhores modelos preditivos em detecção de anomalias em séries temporais, para que as diferentes estratégias e diferentes parâmetros na criação dos modelos possam contribuir para a análise das séries, propondo um ensemble baseado em modelos chamado TSPME-AD (Time Series Prediction Model Ensemble for Anomaly Detection, ou Ensemble de Modelos Preditivos em Séries Temporais para a Detecção de Anomalias). O TSPME-AD utiliza os modelos preditivos do estado-da-arte e combina seus scores de anomalias com uma função ponderada. As outras duas contribuições desse trabalho são, uma técnica dinâmica de quebra de janelas, que utiliza a periodicidade e o formato das séries para facilitar o treinamento dos modelos e a descoberta de padrões, e um novo modelo de auto-encoder que modifica a estrutura de um dos modelos do estado-da-arte. A efetividade das propostas do trabalho são analisadas com o uso de dois conjuntos de dados reais, sendo esses os dados de um ano de demanda de energia elétrica, e o banco de dados de eletrocardiogramas do MIT. Com os experimentos, demonstramos que a técnica de ensemble proposta, melhora o score F1 em até 22% comparado com o melhor score dentre os modelos individuais que a compõem, com nossa função de combinação específica apresentando uma melhora de até 13% com relação a outras funções de combinação mais simples. Também demonstramos que nossa nova arquitetura de auto-encoder, combinada com a nova estratégia de quebra dinâmica de janelas consegue melhorias de até 25% no score F1 comparado com uma das técnicas de auto-encoder do estado-da-arte, e uma melhoria de até 64% comparado com um modelo de LSTM empilhada. |
| Abstract: | Time-series anomalies detection is a fast-growing area of study, due to the exponential growth of new data produced by sensors in many different contexts as the Internet of Things (IoT). Many predictive models have been proposed, and they provide promising results in differentiating normal and anomalous points in a time-series. In this work, we provide three contributions. We aim to identify and combine the best models for detecting anomalies in time-series, so that the different strategies or parameters of the models can contribute to the time series analysis by proposing a model-centered ensemble called TSPME-AD (stands for Time Series Prediction Model Ensemble for Anomaly Detection). TSPME-AD uses state-of-the-art predictive models, combining their anomaly scores using a weighted function. Other contributions are a dynamic window breaking technique based on scanning thresholds, leveraging the periodicity and shape of the series to generate windows that aid in training and testing models, and a new auto-encoder predictive model. The effectiveness of our proposals is analyzed using two real-world time-series datasets, a year of power demand data, and the MIT electrocardiogram database. We show that our ensemble technique improves on the F1 score up to 22% on the best score of the individual models composing the ensemble, with our specific combination function improving on simpler functions on up to 13% F1 score increase. We also show that our new auto-encoder architecture, combined with the new window breaking technique, can have an up to 25% F1 score increase compared to another proposed auto-encoder technique, and a 64% score increase over a stacked LSTM model. |
| URI : | http://repositorio.ufc.br/handle/riufc/80792 |
| ORCID del autor: | https://orcid.org/0000-0002-9213-8458 |
| Lattes del autor: | http://lattes.cnpq.br/5994900773879580 |
| ORCID del tutor: | 0000-0002-0661-2978 |
| Lattes del tutor: | http://lattes.cnpq.br/5801731850423324 |
| Lattes del co-asesor: | http://lattes.cnpq.br/3125027229507836 |
| Derechos de acceso: | Acesso Aberto |
| Aparece en las colecciones: | DCOMP - Dissertações defendidas na UFC |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 2021_dis_eltrentini.pdf | 1,24 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.