Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/17681
Type: Dissertação
Title: Aprendizado de máquina na detecção do uso do solo no bioma caatinga via sensoriamento remoto
Title in English: Remote sensing and machine learning applied to soil use detection in caatinga bioma
Authors: Sousa, Beatriz Fernandes Simplício
Advisor: Teixeira, Adunias dos Santos
Keywords: Irrigação e drenagem;Inteligência artificial;Semiárido;Classificação de imagens de satélite;Artificial intelligence;Semiarid
Issue Date: 2009
Citation: SOUSA, Beatriz Fernandes Simplício. Aprendizado de Máquina na detecção do uso do solo no bioma caatinga via sensoriamento remoto. 2009. 89 f. Dissertação (Mestrado em engenharia agrícola)- Universidade Federal do Ceará, Fortaleza-CE, 2009.
Abstract in Brazilian Portuguese: O manejo adequado dos recursos naturais em ambientes frágeis, como o da Caatinga, requer o conhecimento de suas propriedades e distribuição espacial. Desta forma, o presente trabalho propõe uma abordagem para a classificação de imagens do satélite LANDSAT-5, correspondente a uma região semiárida localizada no município de Iguatu no Estado do Ceará, objetivando detectar o bioma da Caatinga por meio de dois tipos de classificadores baseados em aprendizado de máquina: o método baseado em Perceptrons de Múltiplas Camadas-MLP (do inglês Multi Layer Perceptron) e o método Máquinas de Vetores de Suporte-SVM (do inglês Support Vector Machine). O classificador estatístico da máxima verossimilhança, por ser amplamente utilizado na literatura, também foi aplicado à área em estudo para que o desempenho dos métodos propostos fosse comparado aos destes. Cinco classes foram definidas para a classificação, a saber: agricultura, antropizada, água, caatinga herbácea arbustiva (CHA) e caatinga arbórea densa (CAD). Para o método MLP, foram realizados testes variando a quantidade de neurônios na camada intermediária. Já os testes para o método SVM consistiram em variar o parâmetro σ da função gaussiana e o parâmetro de penalização (C). A eficiência dos métodos foi analisada por meio dos coeficientes de Exatidão Global, Exatidão Específica e de Kappa calculados por meio dos dados da matriz de confusão. Esta, por sua vez, foi gerada para cada método a partir da comparação entre a classificação e os pontos georreferenciados com aparelho GPS (correspondentes à verdade terrestre). O método MLP apresentou melhor desempenho para o teste em que 12 neurônios foram atribuídos à camada intermediária, com valores de Exatidão Global e de Kappa de 82,14% e 0,76, respectivamente. Já o método SVM apresentou melhor performance para o teste com C=1000 e σ=2 no qual se obteve valores de 86,03% e 0,77 para os coeficientes de Exatidão Global e Kappa, respectivamente. O valor de Exatidão Global para o classificador estatístico da máxima verossimilhança permitiu concluir que 81,2% dos pixels foram classificados corretamente e o coeficiente de Kappa para este método foi de 0,73. Os valores dos coeficientes de Exatidão Específica, que proporcionam analisar o desempenho dos métodos em cada classe, foram superiores a 70%. A área total classificada foi de 576 km2 e, dentre as duas classes consideradas para o bioma Caatinga, a predominante é a do tipo caatinga herbácea arbustiva (CHA). Assim, por meio dos resultados experimentais obtidos, pode-se afirmar que os métodos SVM e MLP, baseados em aprendizado de máquina, apresentaram desempenho satisfatório para a classificação do bioma Caatinga.
Abstract: In order to manage adequately natural resources inside a fragile environment, just like Caatinga, one should know its properties and spatial distribution. This work proposes an approach to classify LANDSAT-5 satellite images. These images, corresponding to a semiarid environment located in Iguatu country, Ceara, Brazil, were classified aiming at detecting the Caatinga biome by two type of classifiers based on machinery learning: Multi Layer Perceptron (MLP) and Support Vector Machine (SVM). The static classifier of Maximum Likelihood was also used as comparison to the other two methods. Agriculture, water, anthropical, herbaceous shrub Caatinga (CHA) and dense high Caatinga (CAD) are the five classes defined for classifying. MLP method tests were carried out changing neurons quantity in the intermediate layer. SVM method tests were carried out changing σ, from Gauss function, and penalization parameter (C). Performance of the tests was analyzed by Global Accuracy, Specific Accuracy and Kappa coefficient. The last one calculated by confusion matrix, which has been generated by comparison of classification data and ground control points GPS georreferenced (true points). MLP method presented best performance for tests in which 12 neurons have been attributed to the intermediate layer resulting in Global Accuracy and Kappa values of 82.14% and 0.76, respectively. On the other hand, SVM method presented best performance for tests carried out with C=1000 and σ=2, resulting in Global Accuracy and Kappa values of 86.03% and 0.77, respectively. The Maximum Likelihood classifier presented 81.2% of its pixels correctly classified (Global Accuracy) and K coefficient value of 0.73. The values of Specific Accuracy, which makes it possible to analyze the performance of each individual class, were above 70% in each class. A total 576 km2 area was classified. Between the two types of Caatinga biome considered, herbaceous shrub Caatinga (CHA) comes to be the most common. Therefore, taking into account experimental results, it is possible to conclude that both SVM and MLP methods, which are based on machine learning, show satisfactory performance for classifying Caatinga biome.
URI: http://www.repositorio.ufc.br/handle/riufc/17681
Appears in Collections:PPGENA - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2009_dis_bfssousa.pdf1,81 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.