Parte 2 - Descomplicando Soluções Analíticas


Ótimo que você chegou até aqui, cansei de ver a galera patinar na hora de montar uma estrutura de dados que entregue valor. Ou complicam demais, ou fazem algo tão capenga que não serve pra nada. É um desafio real que a gente precisa encarar de frente.
Minha missão aqui é te dar uma visão de quem já viu de tudo um pouco, sem firulas. Vamos começar pelo básico do básico, o esqueleto de qualquer solução analítica. Porque, no fundo, todo sistema de dados, do mais simples ao mais complexo, faz três coisas fundamentais. E se você não entender isso, vai continuar se perdendo no mar de possibilidades propostas por inúmeras ferramentas.
Solução Simples: Entenda de forma simples o que é básico para começar.
Pra mim, a base de qualquer projeto de analytics, por mais simples que seja, se resume a isso:
Carregar os dados: Você precisa pegar seus dados e colocar num lugar centralizado, geralmente um tal de data warehouse. É tipo arrumar a casa antes da festa.
Transformar e modelar: Os dados brutos raramente vêm prontos pro consumo. É preciso dar um trato, limpar, organizar e modelar pra que fiquem no jeito e prontos pra serem usados.
Entregar a informação: Depois de tudo pronto, a cereja do bolo é fazer com que essa informação chegue nas mãos de quem toma as decisões do negócio. Afinal, dados parados não valem nada.
No começo dessa jornada, quando a empresa é pequena e os dados vêm de um lugar só (tipo o banco de dados da sua aplicação), a gente consegue improvisar. Dá pra plugar uma ferramenta de BI direto no seu banco de dados principal. Mas, ó, fique esperto: isso pode dar um nó na performance da sua aplicação e irritar a galera da TI.
E qual a saída mais inteligente? Usar uma réplica do seu banco de dados de produção. Assim, sua aplicação não sofre, e você continua com dados relativamente frescos.
E se a sua aplicação roda em um banco NoSQL (tipo DynamoDB, MongoDB ou Cassandra)? Aí a coisa complica. A maioria das ferramentas de BI usa SQL, e fazer análises complexas em NoSQL pode ser algo complexo e lento. Nesses casos, pra mim, o caminho é um só: precisa de um data warehouse SQL.
A Solução Analítica Moderna: O Próximo Nível
Agora, se a sua empresa cresceu ou se você já está num patamar mais avançado, o setup simples já não aguenta o tranco. Aqui, os três passos fundamentais que mencionei se tornam a base da sua solução analítica moderna:
Coletar, Consolidar e Armazenar Dados: O primeiro passo é o "Extract & Load" (EL). Pense em puxar todos os dados de diferentes sistemas (seu app, CRMs, ferramentas de marketing, planilhas) e centralizar tudo num data warehouse. Esse é o coração da sua arquitetura analítica, um banco de dados otimizado pra aguentar o tranco das análises pesadas.
Processar Dados: Transformar e Modelar: Dados brutos não servem pra quase nada em BI. Aqui, a gente entra na fase de limpeza e transformação. É onde você aplica a lógica de negócio, filtra lixo (tipo dados duplicados ou trata os valores nulos!), e prepara os dados pra virarem informação de verdade. Isso envolve tanto a modelagem (aplicar regras de negócio) quanto a transformação (limpar, sumarizar, pré-calcular). Essa etapa é onde a mágica acontece e o bicho pega – e é aqui que a gente se diverte!
Apresentar e Usar Dados: Com os dados limpos e modelados, é hora de fazer eles trabalharem. Isso vai muito além de criar uns gráficos bonitos em dashboards. Envolve desde relatórios ad-hoc (pra quelas perguntas que aparecem do nada) até a exploração livre de dados e, o sonho de consumo de qualquer gestor: o self-service real, onde a galera de negócio consegue as respostas que precisa, sozinha.
Cada um desses passos tem seus próprios desafios e segredos, e a gente vai desvendar cada um deles nos próximos artigos.
Minhas impressões para uma solução de dados de respeito:
Ao longo da minha jornada, criei algumas convicções sobre o que faz um setup de analytics ser, de fato, bom. São as "minhas manias", se quiser chamar assim, mas que pra mim viraram regra de ouro:
ELT (Extract-Load-Transform) é o caminho. Esqueça o ETL tradicional, onde a transformação era feita fora do data warehouse. O futuro é carregar tudo de uma vez e transformar lá dentro, aproveitando o poder das ferramentas modernas.
Data Warehouse na nuvem é lei. Os data warehouses de hoje, baseados em nuvem e com arquitetura com processamento paralelo massivo, é a virada de chave. Eles são mais potentes e muito mais baratos do que as soluções antigas. Não tem por que não usar.
Modelagem de dados é fundamental. Ignorar a modelagem é pedir pra ter dor de cabeça com métricas inconsistentes e analistas virando gargalo. É o que dá inteligência ao seu dado.
SQL reina soberano. No mundo dos dados, o SQL se tornou a língua universal. Se você não domina, é hora de aprender. Ferramentas que fogem disso são coisa do passado.
O fluxo de trabalho vale mais que a visualização. Fazer dashboards bonitinhos é legal, mas o que importa de verdade é o processo por trás: como você garante que os dados cheguem, sejam transformados e estejam prontos para o uso, no tempo certo. O foco precisa ser na operação, não só na cereja do bolo.
Esses são os pilares que me guiam. E, te garanto, seguir essa linha vai te poupar muita dor de cabeça e te colocar numa posição de destaque.
Nos próximos artigos, a gente vai aprofundar em cada um desses pilares, te mostrando o "como" construir essa base sólida. Prepara-se, porque a gente vai transformar a sua relação com os dados. Você não vai mais se sentir perdido, vai dominar o jogo.
Subscribe to my newsletter
Read articles from Anderson Braz directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by

Anderson Braz
Anderson Braz
I'm Solutions Specialist and Data Engineer. Also i'm an Enthusiast in Open Software, Technologies and AI.