• Flickr Governo de São Paulo
  • Linkedin Governo de São Paulo
  • TikTok Governo de São Paulo
  • Twitter Governo de São Paulo
  • Youtube Governo de São Paulo
  • Instagram Governo de São Paulo
  • Facebook Governo de São Paulo
  • /governosp

Análise comparativa de algoritmos para anonimização de dados pessoais

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

157

Resumo

A crescente digitalização e a regulamentação da LGPD evidenciam a necessidade de proteger dados pessoais em um contexto cada vez mais orientado por dados. Este estudo busca avaliar e comparar técnicas de anonimização aplicadas a um dataset sintético gerado com a biblioteca Faker, incluindo Masking, Tokenization, Hashing, k-Anonymity, l-Diversity e t-Closeness. A pesquisa utilizou métodos aplicados que permitem balancear a privacidade com a utilidade dos dados, respeitando princípios como confidencialidade, integridade e disponibilidade. As técnicas foram implementadas e avaliadas quanto à eficácia e limitações. Masking oculta parcialmente informações sensíveis, preservando a estrutura dos dados. Tokenization substitui atributos sensíveis por tokens irreversíveis, enquanto Hashing utiliza funções para anonimização irreversível. O k-Anonymity garante que cada registro pertença a grupos de pelo menos k registros indistinguíveis, enquanto o l-Diversity adiciona diversidade ao atributo sensível. O t-Closeness fortalece a proteção, controlando a proximidade da distribuição local com a global. Os resultados mostram que cada técnica possui aplicações específicas, dependendo da sensibilidade dos dados e da análise requerida. Conclui-se que a escolha da abordagem deve considerar o equilíbrio entre privacidade e utilidade, sendo a combinação de técnicas uma estratégia eficiente para atender a diferentes cenários e regulamentações.
Increasing digitalization and LGPD regulation highlight the need to protect personal data in an increasingly data-driven context. This study seeks to evaluate and compare anonymization techniques applied to a dataset artificially generated with the Faker library, including Masking, Tokenization, Hashing, k-Anonymity, l-Diversity and t-Closeness. The research used applied methods that allow balancing privacy with data privacy, respecting principles such as confidentiality, integrity and availability. The techniques were innovative and evaluated for effectiveness and limitations. Masking partially confidential information, preserving the data structure. Tokenization replaces sensitive attributes with irreversible tokens, while Hashing uses functions such as SHA-256 for irreversible anonymization. k-Anonymity ensures that each record belongs to groups of at least kkk indistinguishable records, while l-Diversity adds diversity to the sensitive attribute. t-Closeness strengthens protection by controlling the proximity of local to global distribution. The results show that each technique has specific applications, depending on the sensitivity of the data and the analysis required. It is concluded that the choice of approach must consider the balance between privacy and utility, with the combination of techniques being an efficient strategy to meet different scenarios and regulations.

Descrição

Citação

SILVA, João Pedro da. Análise comparativa de algoritmos para anonimização de dados pessoais. Orientador: Vanessa dos Anjos Borges. 2024. 29 f. Trabalho de Conclusão de Curso (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Presidente Prudente, Presidente Prudente, SP, 2024.

Avaliação

Revisão

Suplementado Por

Referenciado Por

Governo do Estado de SP