Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/58126
Tipo: | Tese |
Título: | Métodos de detecção de outliers para o monitoramento ambiental de espaços urbanos inteligentes via análise multivariada e multidimensional |
Autor(es): | Souza, Thiago Iachiley Araújo de |
Orientador: | Gomes, Danielo Gonçalves |
Coorientador: | Aquino, André Luiz Lins de |
Palavras-chave: | Detecção de outliers;Internet das coisas;Análise multivariada;Análise multidimensional;Cidades inteligentes |
Data do documento: | 2020 |
Citação: | SOUZA, Thiago Iachiley Araújo de. Métodos de detecção de outliers para o monitoramento ambiental de espaços urbanos inteligentes via análise multivariada e multidimensional. 2020. 101 f. Tese (Doutorado em Engenharia de Teleinformática) – Universidade Federal do Ceará, Centro de Tecnologia, Programa de Pós-Graduação em Engenharia de Teleinformática, Fortaleza, 2020. |
Resumo: | Desde 2007, pela primeira vez na história da humanidade, mais pessoas vivem nas cidades do que no campo. Segundo projeções da Organização das Nações Unidas (ONU), a população mundial deverá ser cerca de 70% urbana em 2050. Este crescimento urbano exponencial traz consigo problemas críticos e típicos das cidades, tais como os de mobilidade urbana, saúde, segurança pública e de poluição ambiental. Dado que as cidades são um vasto e heterogêneo repositório de dados em potencial, cuja complexidade é proporcional ao seu tamanho e população, uma possível solução para tratar estes problemas parte do monitoramento de eventos associados a dados urbanos. Entretanto, um dos desafios ao lidar com estes dados é reconhecer quais deles estão "fora do padrão"(outliers). Esta tese investiga a detecção de outliers em dados urbanos sob três abordagens diferentes: (i) abordagem multivariada offline, através da qual modelamos os dados como matrizes, suprimindo uma de suas dimensões, e realizamos uma análise mul- tivariada através da técnica multivariada Análise Fatorial Exploratória (AFE); (ii) abordagem multidimensional offline, em que modelamos os dados como um tensor de terceira ordem, e realizamos uma análise multidimensional offline através da técnica multidimensional HOSVD (Higher-Order Singular Value Decomposition - HOSVD); e (iii) abordagem multidimensional online, na qual modelamos os dados como um tensor de terceira ordem e realizamos uma análise multidimensional online combinando a técnica multidimensional HOSVD com a estratégia da janela deslizante. Foram coletados dados reais da plataforma de monitoramento ambiental urbano Smart Citizen, configurando-se como conjuntos de dados multidimensionais dada as suas dimensões: temporal (instantes da ocorrência dos eventos), variáveis ambientais (medidas físicas coletadas pelos sensores) e espacial (cidades analisadas). Os resultados obtidos revelaram para a abordagem multivariada offline quais os fatores mais influentes nos padrões de outliers detectados (com uma AUC de 75%), enquanto que para a abordagem multidimensional offline um modelo de detecção de outliers foi gerado (com uma AUC de 91%), e por fim, para a abordagem multidimensional online variações instantâneas de ocorrência de eventos específicos foram extraídas, identificando com eficiência a dinâmica do processo (com uma AUC de 95%) |
Abstract: | Since 2007, for the first time in human history, more people live in cities than in the countryside. According to projections by the United Nations (UN), the world population is expected to be about 70% urban by 2050. This exponential urban growth brings with it critical and typical problems in cities, such as urban mobility, health, public safety and security. environment pollution. Given that cities are a vast and heterogeneous repository of potential data, the complexity of which is proportional to their size and population, a possible solution to address these problems comes from monitoring events associated with urban data. However, one of the challenges when dealing with this data is to distinguish it as "in the pattern"and "out of the pattern"(outlier) which, in the final analysis, can help or hinder the decision making, for example, of a manager public in a city. This thesis investigates the detection of outliers in smart city applications under three different approaches: offline multivariate approach, where we model the data as matrices, suppressing one of its dimensions, and perform a multivariate analysis using the exploratory factor analysis (EFA) multivariate technique; offline multidimensional approach, where we model the data as a third order tensor, and perform an offline multidimensional analysis using the multidimensional technique Higher-Order Singular Value Decomposition (HOSVD); and online multidimensional approach, where we model the data as a third order tensor and perform an online multidimensional analysis combining the multidimensional HOSVD technique with the sliding window strategy. In order to carry out this research, real data were collected from the Smart Citizen urban environmental monitoring platform, configuring themselves as multidimensional data sets given their dimensions: temporal (moments of occurrence of events), environmental variables (physical measures collected by the sensors) and spatial (analyzed cities). The results obtained revealed for the offline multivariate approach which factors were most influential in the patterns of detected outliers (with an accuracy of 75%), whereas for the multidimensional offline approach an outlier detection model was generated (with an accuracy of 91% ), and finally, for the online multidimensional approach, instantaneous variations of the occurrence of specific events were extracted, efficiently identifying the dynamics of the process (with an accuracy of 95%). |
URI: | http://www.repositorio.ufc.br/handle/riufc/58126 |
Aparece nas coleções: | DETE - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2020_tese_tiasouza.pdf | 3,25 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.