Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/75056
Type: | Tese |
Title: | Differentially private release of count-weighted graphs |
Authors: | Brito, Felipe Timbó |
Advisor: | Machado, Javam de Castro |
Keywords in Brazilian Portuguese : | Privacidade diferencial;Privacidade diferencial local;Grafos ponderados de contagem |
Keywords in English : | Differential privacy;Local-DP;Count-weighted graphs |
Knowledge Areas - CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Issue Date: | 2023 |
Citation: | BRITO, Felipe Timbó. Differentially private release of count-weighted graphs. 2023. 102 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023. |
Abstract in Brazilian Portuguese: | Muitos sistemas complexos são comumente modelados como grafos ponderados de contagem, onde os nós representam entidades, as arestas modelam as relações entre eles e os pesos das arestas definem alguma estatística de contagem associada a cada relação. Como dados em formato de grafo geralmente contêm informações confidenciais, a preservação de privacidade no compartilhamento desse tipo de dado torna-se uma questão importante. Nesse contexto, a privacidade diferencial (PD) tornou-se o padrão para o compartilhamento de dados sob fortes garantias matemáticas. Ao lidar com PD para grafos ponderados, a maioria dos trabalhos recentes assumem que a topologia do grafo é conhecida. Entretanto, em diversas aplicações do mundo real, a privacidade da topologia do grafo também precisa ser assegurada. Nesta tese, pretendemos preencher a lacuna entre o compartilhamento de dados de grafos ponderados de contagem e privacidade diferencial, considerando tanto a estrutura do grafo quanto os pesos das arestas como informações privadas. Primeiro adaptamos a definição de PD em grafos ponderados para levar em consideração a privacidade da estrutura do grafo. Em seguida, introduzimos uma técnica escalável para adicionar aleatoriamente ruído aos pesos das arestas e à topologia do grafo. Também aproveitamos a propriedade de pós-processamento da PD para melhorar a utilidade dos dados, considerando restrições do domínio em grafos. Finalmente, essas contribuições combinadas são utilizadas como base para o desenvolvimento de duas novas abordagens para o compartilhamento privado de grafos ponderados de contagem sob as noções de PD global e local. Experimentos utilizando grafos do mundo real demonstram a superioridade das nossas abordagens em relação à utilidade sobre técnicas já existentes, permitindo a computação subsequente de uma variedade de estatísticas no grafo compartilhado com alta utilidade, em alguns casos comparáveis aos resultados originais. |
Abstract: | Many complex systems are commonly modeled as count-weighted graphs, where nodes represent entities, edges model relationships between them and edge weights define some counting statistics associated with each relationship. As graph data usually contain sensitive information, preserving privacy when releasing this type of data becomes an important issue. In this context, differential privacy (DP) has become the de facto standard for data release under strong mathematical guarantees. When dealing with DP for weighted graphs, most state-of-the-art works assume that the graph topology is known. However, in several real-world applications, the privacy of the graph topology also needs to be ensured. In this dissertation, we aim to bridge the gap between DP and count-weighted graph data release, considering both graph structure and edge weights as private information. We first adapt the weighted graph DP definition to take into account the privacy of the graph structure. We then introduce a scalable technique to randomly add noise to the edge weights and to the graph topology. We also leverage the post-processing property of DP to improve the data utility, considering graph domain constraints. Finally, these combined contributions are used as the foundation for the development of two novel approaches to privately releasing count-weighted graphs under the notions of global and local DP. Experiments using real-world graph data demonstrate the superiority of our approaches in terms of utility over existing techniques, enabling subsequent computation of a variety of statistics on the released graph with high utility, in some cases comparable to the non-private results. |
URI: | http://repositorio.ufc.br/handle/riufc/75056 |
Author's Lattes: | http://lattes.cnpq.br/4819140338774766 |
Advisor's Lattes: | http://lattes.cnpq.br/9884980518986225 |
Access Rights: | Acesso Aberto |
Appears in Collections: | DCOMP - Teses defendidas na UFC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2023_tese_ftbrito.pdf | 5,1 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.