Como Anonimizar Dados no Power BI para Compartilhar Seus Projetos com Segurança

Você também já criou um dashboard que ficou com muita vontade de compartilhar ou de colocar no seu portifólio porém ficou receoso por conter informações sigilosas da sua empresa/cliente? Neste artigo, vou mostrar um passo a passo para deixar as informações do seu projeto totalmente anônimas. Assim, podemos compartilhar nosso trabalho em segurança e, claro, livres de processos judiciais! rs

Passo a Passo: Anonimizando os Dados

Cuidado! Antes de começar, faça uma cópia do seu arquivo .pbix. Jamais faça esse processo no arquivo original de produção!

1. Transforme os dados no Power Query

Vamos começar arrumando a casa dentro do Power Query. O objetivo aqui é simplificar o que vamos exportar. Use o Power Query para excluir colunas com dados sensíveis que você não usa nos visuais ou cálculos (ex: CPF, CNPJ, Endereços, Telefones...). Calma, se você precisa dessas colunas nas visualizações ou relacionamentos, vamos tratar no excel nas próximas etapas.

Para trocas fáceis, como nomes de lojas ou filiais, você pode usar a função "Substituir Valores" diretamente no Power Query. É rápido e eficiente para casos pontuais.

Outra coisa que pode ser feito no power query é diminuir a quantidade de dados, pois vamos passar esses dados para planilhas e não queremos que nossos arquivos ocupem muito espaço, para isso, você pode filtrar os dados para trazer um período menor (ex: apenas o último ano) ou agrupar as informações (ex: total de vendas por região em vez de por cliente individual).

2. Exporte os dados para Excel

Após clicar em fechar e aplicar, abra uma nova página no relatório e insira um visual de tabela, coloque as colunas na tabela e em seguida clique nos três pontinhos, exportar dados e salve o arquivo, faça isso para cada tabela do modelo.

3. Usando Excel + Python para Anonimizar

Aqui é onde a mágica acontece! Ao abrir o arquivo exportado, você pode notar que os dados vieram todos juntos numa única coluna, então primeiro precisamos separa-lás.

Para separar:

  1. Selecione a coluna com os dados.

  2. Vá na faixa de opções em Dados -> Texto para Colunas.

  3. Escolha Delimitado -> Avançar.

  4. Marque a caixa Vírgula -> Avançar -> Concluir.

Agora para trocar os nomes dos clientes para nomes aleatórios vamos ir em Fórmulas > Clicar na primeira célula de nome > Inserir Python

Ao lado da caixa de fórmula troque a saída Python para valor de Excel:

Na caixa de fórmula PY, insira o script:

from faker import Faker
fake = Faker('pt_BR')
fake.name()

Este script usa a biblioteca Faker para gerar nomes aleatórios em português.

Em seguida dê um Enter e propague a fórmula para as demais células da coluna dando crtl+c na célula com a fórmula e colando nas demais células(para facilitar você pode selecionar a segunda linha, clicar em ctrl+shift+seta para baixo e selecionar crtl+v)

Pode demorar um pouco para carregar, principalmente se tabela tiver muitas linhas. Quando está carregando pode aparecer mensagens na célula como #OCUPADO! ou o mesmo nome da primeira linha, isso é normal!

Depois, para garantirmos que a fórmula não fique alterando os nomes você pode copiar a tabela e colar somente valores clicando com o botão direito.

A biblioteca Faker oferece muitas outras opções de geradores de dados falsos. Você pode substituir o .name() por outros métodos para gerar qualquer tipo de dado:

# Esse script cria um cpf aleatório
from faker import Faker
fake = Faker('pt_BR')
fake.cpf()

# Esse script cria um email aleatório
from faker import Faker
fake = Faker('pt_BR')
fake.email()

Caso queira consultar outros métodos em pt-BR: https://faker.readthedocs.io/en/master/locales/pt_BR.html

4.Reimportando os dados para o Power BI

Antes de tudo, recomendo tirar um print da sua aba de Relacionamentos! Isso vai te salvar um tempo precioso para reconstruir a lógica do relatório.

Em transformar dados apague todas as tabelas e insiras as tabelas em Excel anonimizadas

Deixe os mesmos nomes utilizados nas tabelas de origem, isso evita que precise fazer alterações nas medidas

Faça as transformações necessárias (ajustar tipos de dados, etc.), verique as medidas e refaça os relacionamentos conforme o print que você tirou.

5. O Toque Final e Boas Práticas

  • Exclua logos, nomes de marcas ou imagens específicas do cliente.

  • Mude o tema do relatório, se ele for baseado na identidade visual da empresa.

  • Revise todos os filtros, segmentações de dados e tooltips para garantir que nenhum dado sensível tenha permanecido.

  • No seu projeto você pode incluir uma frase como essa: "Todos os dados deste projeto foram anonimizados para fins de demonstração. Nenhuma informação real foi divulgada."

  • Nunca compartilhe conexões com bancos reais, senhas, API keys, etc.

E aí, já fez utilizou esses métodos antes? Compartilhe aqui nos comentários se você tem outras dicas para mascarar dados!

0
Subscribe to my newsletter

Read articles from Gabrielle Cristine directly inside your inbox. Subscribe to the newsletter, and don't miss out.

Written by

Gabrielle Cristine
Gabrielle Cristine