Análise comparativa de algoritmos para anonimização de dados pessoais

SILVA, João Pedro da

Análise comparativa de algoritmos para anonimização de dados pessoais

Arquivos

ads_2024_2_joaopsilva_analisecomparativadealgoritmosparaanonimizacao.pdf (1.32 MB)

Data

2024-12-17

Autores

SILVA, João Pedro da

Editor

157

Resumo

A crescente digitalização e a regulamentação da LGPD evidenciam a necessidade de proteger dados pessoais em um contexto cada vez mais orientado por dados. Este estudo busca avaliar e comparar técnicas de anonimização aplicadas a um dataset sintético gerado com a biblioteca Faker, incluindo Masking, Tokenization, Hashing, k-Anonymity, l-Diversity e t-Closeness. A pesquisa utilizou métodos aplicados que permitem balancear a privacidade com a utilidade dos dados, respeitando princípios como confidencialidade, integridade e disponibilidade. As técnicas foram implementadas e avaliadas quanto à eficácia e limitações. Masking oculta parcialmente informações sensíveis, preservando a estrutura dos dados. Tokenization substitui atributos sensíveis por tokens irreversíveis, enquanto Hashing utiliza funções para anonimização irreversível. O k-Anonymity garante que cada registro pertença a grupos de pelo menos k registros indistinguíveis, enquanto o l-Diversity adiciona diversidade ao atributo sensível. O t-Closeness fortalece a proteção, controlando a proximidade da distribuição local com a global. Os resultados mostram que cada técnica possui aplicações específicas, dependendo da sensibilidade dos dados e da análise requerida. Conclui-se que a escolha da abordagem deve considerar o equilíbrio entre privacidade e utilidade, sendo a combinação de técnicas uma estratégia eficiente para atender a diferentes cenários e regulamentações.
Increasing digitalization and LGPD regulation highlight the need to protect personal data in an increasingly data-driven context. This study seeks to evaluate and compare anonymization techniques applied to a dataset artificially generated with the Faker library, including Masking, Tokenization, Hashing, k-Anonymity, l-Diversity and t-Closeness. The research used applied methods that allow balancing privacy with data privacy, respecting principles such as confidentiality, integrity and availability. The techniques were innovative and evaluated for effectiveness and limitations. Masking partially confidential information, preserving the data structure. Tokenization replaces sensitive attributes with irreversible tokens, while Hashing uses functions such as SHA-256 for irreversible anonymization. k-Anonymity ensures that each record belongs to groups of at least kkk indistinguishable records, while l-Diversity adds diversity to the sensitive attribute. t-Closeness strengthens protection by controlling the proximity of local to global distribution. The results show that each technique has specific applications, depending on the sensitivity of the data and the analysis required. It is concluded that the choice of approach must consider the balance between privacy and utility, with the combination of techniques being an efficient strategy to meet different scenarios and regulations.

Palavras-chave

Privacidade, Proteção de dados pessoais, Informação - segurança

Citação

SILVA, João Pedro da. Análise comparativa de algoritmos para anonimização de dados pessoais. Orientador: Vanessa dos Anjos Borges. 2024. 29 f. Trabalho de Conclusão de Curso (Tecnólogo em Análise e Desenvolvimento de Sistemas) - Faculdade de Tecnologia de Presidente Prudente, Presidente Prudente, SP, 2024.

URI

https://ric.cps.sp.gov.br/handle/123456789/28872

Coleções

Trabalhos de Conclusão de Curso

Página do item completo

Análise comparativa de algoritmos para anonimização de dados pessoais

Arquivos

Data

Autores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Descrição

Palavras-chave

Citação

URI

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por