Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/52808
Type: | Dissertação |
Title: | Uma Análise comparativa de técnicas de subamostragem para projetos de sistemas de detecção de intrusão em redes de computadores |
Authors: | Silva, Bruno Riccelli dos Santos |
Advisor: | Cortez, Paulo César |
Keywords: | Teleinformática;Computadores - Aprendizagem;Segurança computacional;Intrusion Detection Systems;Undersampling |
Issue Date: | 2020 |
Citation: | SILVA, B. R. dos S. Uma Análise comparativa de técnicas de subamostragem para projetos de sistemas de detecção de intrusão em redes de computadores. 2020. 85 f. Dissertação (Mestrado em Engenharia de Teleinformática) – Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2020. |
Abstract in Brazilian Portuguese: | Sistemas de Detecção de Intrusão (SDIs) figuram como um das principais soluções adotadas na área de segurança em redes para evitar intrusões de rede e garantir a segurança dos dados e serviços de forma assertiva e eficiente. Técnicas de subamostragem de classes majoritárias permitem que classificadores sejam avaliados a partir de sub-bases de dados menores de forma representativa, buscando obter melhor assertividade em tempo aceitável. Esta dissertação tem por objetivo realizar uma análise comparativa de três técnicas de subamostragem (Aleatória, Cluster centroides e NearMiss) para projetos de SDIs através de cinco classificadores em duas bases de dados recentes (CICIDS 2017 e CICIDS 2018) para fins de comparação. Para esta avaliação, entre estes classificadores, são empregados as métricas de acurácia, precision, recall e eficiência que permitem escolher o(s) classificador(es) mais adequado(s) a ser(em) utilizado(s) em projetos de SDIs baseados em aprendizagem de máquina. Além disso, adotou-se o esquema de treinamento e testes baseado em técnicas de validação cruzada, seguida do teste estatístico de Wilcoxon. Os resultados indicam que a subamostragem por Cluster centroides apresenta o melhor desempenho quando aplicados em classificadores baseados em distância, podendo-se inferir que a técnica de subamostragem influencia no processo de escolha do melhor classificador no projeto de um Sistema de Detecção de Intrusão. |
Abstract: | Intrusion Detection Systems (IDS) figure as one of the leading solutions adopted in the area of network security to prevent network intrusion and ensure the security of data and services. However, this type of problem requires IDS to be assertive and efficient concerning processing time. Undersampling techniques allow classifiers to be evaluated from smaller sub-databases in a representative manner, seeking better assertiveness in less processing time. Some works in the literature present this kind of solution in the IDS project, but criteria such as the adoption of a replicable methodology, are generally not respected. Three sub-sampling methodologies were selected: random selection, by Cluster centroids and Nearmiss in two recent databases (CICIDS 2017 and CICIDS 2018) and comparison purposes between the classifiers. Thus, based on the results obtained and on the criteria adopted for the choice of classifiers, in the complete CIC2017 and CIC2018 databases, the random forest classifier obtains the best results. As for the sub-base generated, from the CIC2017 database, by the random under-sampling, the KNN classifier was considered the best for its average metrics of accuracy, efficiency, and training time. In the sub-base using the Cluster centroids under-sampling technique, generated from CIC2018, the classifier Naive Bayes gets the best results. As for the subbases generated from CIC2017 and CIC2018, using the NearMiss sub-sampling technique, the best classifiers, for their average metrics of accuracy, efficiency and training time, were KNN and Naive Bayes, respectively. Also, the results indicate that the sub-sampling by Cluster centroids presents the best performance when applied to classifiers based on distance, it follows that the technique of under-sampling influences the process of choosing the best classifier in the design of an Intrusion Detection Systems. |
URI: | http://www.repositorio.ufc.br/handle/riufc/52808 |
Appears in Collections: | DETE - Dissertações defendidas na UFC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2020_dis_brssilva.pdf | 1,63 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.