#bomdialgpd
Tenho visto algumas demandas sobre inclusão de tarjas em textos e fiz uns breves estudos sobre o tema.
Marca Texto Preto
Outro dia minha filhinha, que adora papelarias, me mostrou um marca texto preto e eu demorei para encaixar que é uma alternativa rápida e barata para esconder alguns dados em documentos. Em uma visão geral é eficiente: com um documento nas mãos, marca-se o que precisa esconder. Porém há limitações: colocando o documento contra a luz, é possível ver o texto por traz da marcação. Como uma solução rápida é possível esconder os dados com um marca texto preto e tirar uma foto com um papel em cima de um fundo escuro, uma mesa por exemplo (duplicar em uma copiadora ou ler em um em um scanner ainda pode possibilitar a leitura, devido ao fundo branco e à iluminação).
Pesquisei um pouco sobre isso e vi que há soluções como tinta opaca, mas aí aumenta a sofisticação.
Chat GPT
Uma alternativa para retirar dados é utilizar o Chat GPT, preparei junto com o próprio ChatGPT4o o prompt a seguir que reescreve o texto de um PDF retirando os dados pessoais, vale executá-lo junto com o PDF e buscar melhorias.
"Instruções para Processamento de Documento PDF com Redação de Dados Pessoais
Objetivo: Processar o documento PDF fornecido para identificar e redigir (tarjar) automaticamente os dados pessoais, em conformidade com a Lei Geral de Proteção de Dados (LGPD) e as melhores práticas de proteção de dados.
Detalhes do Processamento:
Identificação de Dados Pessoais: Identifique automaticamente todos os dados pessoais no documento, incluindo, mas não se limitando a: Nomes completos, Números de identificação (CPF, RG, passaporte, etc.), Endereços de e-mail, Números de telefone, Endereços residenciais, Dados financeiros (números de contas bancárias, cartões de crédito, etc.), Dados de saúde, Outras informações que possam identificar direta ou indiretamente uma pessoa
Redação (Tarja) de Dados Pessoais: Substitua os dados pessoais identificados com uma tarja preta ou outro método de ocultação adequado. Assegure-se de que as informações redigidas não possam ser recuperadas ou visualizadas, mesmo que o documento seja colocado contra a luz, escaneado ou fotografado.
Preservação do Formato Original: Mantenha o formato original do documento, incluindo parágrafos, espaçamentos, e qualquer formatação especial, ao replicar o texto com as informações redigidas.
Relatório de Redação: Gere um relatório documentando todas as instâncias de dados pessoais redigidos. Indique a página e a linha onde as informações foram ocultadas e inclua um sumário detalhando os tipos de dados pessoais identificados e redigidos.
Exclusões Específicas: Caso existam áreas do documento que não devam ser redigidas (por exemplo, seções públicas ou de domínio comum), especifique essas áreas antes de iniciar o processo.
Revisão e Verificação: Após a redação, revise o documento para garantir que todas as informações pessoais foram adequadamente redigidas e que não restam dados sensíveis visíveis.
Exemplo de Resposta Esperada: O documento replicado deve conter o texto original com todas as informações pessoais redigidas conforme descrito. O relatório deve estar completo e detalhado, assegurando que a proteção dos dados foi realizada de acordo com as melhores práticas e a conformidade legal.
Entrada do Documento PDF: [Anexar o documento PDF para processamento]"
Atenção: Usar o marca textos do editor de PDF na mesma for do texto é eficiente para esconder na impressão, porém na visualização digital, o arquivo mantém os metadados, pois o recurso é de destaque de texto, coincidentemente o destaque do texto na mesma cor das palavras esconde visualmente, mas os dados continuam lá e podem ser buscados e copiados e colados em outro lugar.
Aplicações dedicadas
Uma alternativa mais sofisticada é o uso de aplicações especializadas para realizar o tarjamento, a CGU lançou recentemente uma ferramenta de inteligência artificial para o tarjamento automático de informações pessoais para documentos públicos em PDF com objetivo de identificar e ocultar automaticamente os dados pessoais em documentos requisitados pela Lei de Acesso à Informação (LAI) ou outras demandas. (link no comentário)
Obrigado,
Aquele abraço,
FNery.