DEV Community

Cover image for Removendo Dados Sensiveis de Images
Ronaldo Modesto
Ronaldo Modesto

Posted on

Removendo Dados Sensiveis de Images

Hoje quero falar sobre um tema importante quando falamos em segurança de dados e o que podemos fazer para melhorar a nossa segurança de dados quando processamos imagens com dados sensíveis de nossos usuários. Vou apresentar uma solução que construí pensando nessa situação. Vamos nessa 😃

Imagens e Dados Sensíveis

A crescente capacidade de processamento e armazenamento de dados permitiu que empresas capturassem e analisassem um volume imenso de informações, muitas vezes sem o consentimento explícito dos indivíduos envolvidos.

Em termos de cibersegurança, a proteção de dados pessoais em imagens é de suma importância. O vazamento de informações sensíveis, como CPF e e-mail, pode ter consequências desastrosas. Criminosos cibernéticos podem utilizar essas informações para realizar fraudes, roubo de identidade e outras atividades ilícitas. Por exemplo, com um CPF e um endereço de e-mail, um criminoso pode tentar abrir contas bancárias em nome da vítima, solicitar empréstimos ou realizar compras online, tudo isso sem o conhecimento da pessoa afetada.

Além disso, a exposição de dados pessoais pode levar ao assédio e à violação de privacidade. Imagine uma situação onde fotos de uma reunião ou evento são compartilhadas publicamente e nelas estão visíveis documentos ou identificações pessoais. Essas informações podem ser exploradas maliciosamente, comprometendo a segurança e o bem-estar das pessoas envolvidas.

Então, o que fazer?

Sabemos que dados sensíveis em imagens podem ser um problema, então, o que fazer? Anonimizar!

A anonimização de dados em imagens tornou-se uma prática crucial nos dias atuais, especialmente com o crescimento exponencial da coleta de dados por grandes empresas para treinar inteligências artificiais (IA).

Portanto, a anonimização de dados em imagens é uma prática essencial não apenas para proteger a privacidade individual, mas também para garantir a segurança cibernética. Com a intensificação da coleta de dados por grandes corporações para o treinamento de IA, a adoção de medidas rigorosas de anonimização torna-se ainda mais crítica. É responsabilidade das empresas e desenvolvedores implementar técnicas eficazes para garantir que os dados pessoais sejam adequadamente protegidos, preservando a privacidade e a segurança dos indivíduos em um mundo cada vez mais digitalizado.

Anonimizar dados em imagens envolve a remoção ou ocultação de informações identificáveis, como rostos, placas de veículos, endereços de e-mail, números de CPF, entre outros. Essa prática é vital para proteger a privacidade dos indivíduos, impedindo que dados pessoais sejam facilmente associados a pessoas específicas. Com a anonimização, mesmo que as imagens sejam acessadas por terceiros, a possibilidade de identificar e prejudicar os indivíduos retratados é significativamente reduzida.

Com isso queria trazer uma API que construí pensando em viabilizar a anonimização de dados em imagens de forma sistemática.

Ela possui os seguintes endpoints em sua versão V1:

  • /v1/remove/all: Este endpoint remove todos os textos encontrados na imagem

  • /v1/remove/cep: Este endpoint remove todos os ceps encontrados na imagem

  • /v1/remove/cnpj: Aqui são removidos todos os cnpj's

  • /v1/remove/cpf: Este endpoint remove todos os cpf's

  • /v1/remove/custom-text: Aqui são removidos textos específicos que o usuário queira

  • /v1/remove/email: Remove todos os emails

-/v1/remove/face: Este endpoint remove todos os rostos detectados na imagem

  • /v1/remove/ipv4: Aqui são removidos os ipv4's que forem encontrados

  • /v1/remove/phone: Remove todos telefones

  • /v1/remove/rg: Remove todos os numeros de rg (por enquanto apenas Minas Gerais)

Caso queira acessar a API para checar todas as features e apoiar meu trabalho é só dar uma conferida aqui 😃

==>>>DOCK ANONYMIZE API<<<==

Anonimizando dados

Agora vamos explorar como utilizar a API para anonimizar dados em exemplos de imagens contendo informações sensíveis de usuários.

CPFs
Os CPFs são informações extremamente confidenciais e toda empresa deve garantir que essas informações não sejam vazadas na internet. A seguir, apresentamos um exemplo de anonimização de CPF em uma imagem de um contrato de trabalho. Este poderia ser um documento escaneado real.

Imagem original

exemplo de carteira de trabalho com cpf

Imagem anonimizada

exemplo de carteira de trabalho com cpf anonimizado

Emails
Os emails também são informações que podem ser divulgadas inadvertidamente. Se for intencional, como na divulgação de um email de contato para um serviço, não há problema. Porém, quando se trata de emails pessoais, existe o risco de que pessoas maliciosas os utilizem para criar cadastros em diversos sites ou até mesmo realizar compras online.

Imagem original

exemplo de emails

Imagem anonimizada

exemplo de emails anonimizados

Mais Exemplos
Agora, vamos ver um exemplo de uma tela de sistema que pode conter informações pessoais do usuário ou da empresa cujo cadastro está sendo acessado.

exemplo de imagem com dados sensiveis

Perceba que na imagem original existem diversas informações de cunho pessoal, como CNPJ, email, CEP, entre outras.

Imagine que você possui um serviço que lida com muitas imagens semelhantes (por exemplo, um serviço que processa notas fiscais e depois as armazena). Para garantir a segurança das informações do cliente, você pode anonimizar alguns dados. Neste caso, vamos anonimizar campos como email, CNPJ e um valor arbitrário, como o limite de crédito.

Imagem anonimizada

exemplo de imagem com dados sensiveis

Como pode ser visto é possível anonimizar de forma sistemática dados sensíveis em imagens, garantindo assim, a privacidade dos dados dos usuários.

Casos de uso

Trago aqui mais alguns casos de uso onde pode ser extremamente necessário a anonimização dos dados presentes.

  1. Processamento de Documentos Fiscais
    Empresas que lidam com um grande volume de documentos fiscais (notas fiscais, recibos, etc.) podem precisar anonimizar dados sensíveis antes de armazená-los ou compartilhá-los com terceiros.

  2. Segurança em Sistemas de RH
    Sistemas de Recursos Humanos que gerenciam documentos como contratos de trabalho, formulários de cadastro de funcionários, e declarações de imposto podem anonimizar informações sensíveis para proteger a privacidade dos funcionários.

  3. Compliance com Regulamentações
    Organizações que precisam cumprir regulamentações de proteção de dados (como a GDPR na Europa ou a LGPD no Brasil).

  4. Serviços de Armazenamento em Nuvem
    Provedores de serviços de armazenamento em nuvem podem querer oferecer um nível adicional de segurança, garantindo que dados sensíveis em documentos escaneados sejam automaticamente anonimizados antes de serem armazenados.

  5. Aplicativos de Telemedicina
    Plataformas de telemedicina que processam imagens de documentos médicos (receitas, laudos, etc.) podem anonimizar dados pessoais dos pacientes para proteger a privacidade e garantir a segurança das informações médicas.

  6. Gestão de Imóveis
    Empresas de gestão imobiliária podem querer anonimizar dados sensíveis em documentos como contratos de aluguel e comprovantes de residência antes de compartilhá-los com partes interessadas.

  7. Bancos e Instituições Financeiras
    Bancos podem anonimizar dados em imagens de documentos financeiros (extratos bancários, contratos de empréstimo) para proteger a privacidade dos clientes ao realizar auditorias ou ao compartilhar informações internamente.

  8. Sistemas de Educação
    Instituições de ensino podem anonimizar dados em documentos estudantis (boletins, registros acadêmicos) ao compartilhar informações com terceiros ou ao armazená-las de forma segura.

  9. Agências Governamentais
    Agências governamentais podem anonimizar dados em documentos oficiais (identidade, passaportes, declarações de imposto) antes de processá-los ou arquivá-los para garantir a privacidade dos cidadãos.

  10. Aplicações Jurídicas
    Escritórios de advocacia e tribunais podem precisar anonimizar informações sensíveis em documentos legais (petições, contratos, depoimentos) para proteger a privacidade das partes envolvidas.

  11. Plataformas de Crowdsourcing
    Plataformas que utilizam crowdsourcing para processamento de dados podem anonimizar informações sensíveis em documentos submetidos pelos usuários para garantir a segurança e privacidade durante o processo de revisão.

  12. Serviços de Análise de Dados
    Empresas que oferecem serviços de análise de dados podem anonimizar informações sensíveis em documentos antes de realizar análises, garantindo que nenhum dado pessoal seja comprometido.

Conclusões

Com isso podemos ver que em várias situações pode ser bom, e até necessário, a anonimização de dados em imagens, principalmente quando falamos de documentos.

Se você trabalha com iamgens que podem conter dados sensíveis sempre considere a anonimização dos dados pois assim você colabora para a privacidade dos dados de seus usuários, além de evitar possíveis multas ou outros problemas decorrentes de vazamentos de dados 💯

Bom por hora é isso, fiquem bem e até a próxima 🙂

Top comments (0)