O Viés de Sobrevivência: Sucesso não é regra


Impressão, Nascer do Sol" (1872), Claude Monet. Óleo sobre tela. Museu Marmottan Monet, Paris.
✅ O Viés da sobrevivência representa o erro de julgar o sucesso olhando apenas para quem "sobreviveu", enquanto ignoramos todos os que fracassaram fazendo exatamente a mesma coisa. Neste artigo, tento demonstrar por que copiar negócios bem-sucedidos pode ser uma armadilha, usando uma simulação simples.
A simulação
✅ Escrevi uma simulação pra 1.000 empresas, atribuindo dois fatores para cada uma:
Quanto dinheiro foi investido.
Anos de experiência do fundador.
Apliquei uma função de sobrevivência (logística) para dizer se a empresa sobreviveu ou não, dependendo desses dois fatores. Por fim, gerei dois gráficos: Um com todas as empresas. Outro com apenas as empresas que sobreviveram.
Figura 1 - A simulação das Startups.
Figura 2 - Diferença nas tendências: Efeito do viés da sobrevivência.
Parâmetros da Simulação
n = 1000: simulando 1000 startups.
investimento: cada startup receberá um valor de investimento sorteado de uma distribuição log-normal.
experiencia: sorteia a experiência dos fundadores entre 0 e 14 anos (distribuição uniforme).
Figura 3 - Variáveis da equação.
Apliquei uma função logística, comum em modelos de probabilidade.
np.log(investimento): converte o investimento em escala logarítmica (valores financeiros).
-12: base de dificuldade. Se o log do investimento for menor que 12, a startup tem menos chance.
(experiencia - 7) * 0.2: aqui, tratei 7 anos de experiência como neutro. Para cada ano a mais de experiência, soma-se 0.2 à chance de sobrevivência.
Figura 4 - A equação.
Portanto, quanto maior o investimento (em log), maior a chance de sobreviver. Quanto maior a experiência, maior a chance de sobreviver. A influência da experiência é mais leve (fator 0.2), enquanto o investimento pesa mais.
Conclusão
Analisando apenas quem teve sucesso, parece que empresas com mais investimento sempre têm fundadores mais experientes. Mas, ao observar todos os dados, essa relação muda, ou até desaparece. Portanto, considerar apenas os casos de sucesso pode gerar conclusões incorretas, evidenciando o viés da sobrevivência.
Como implicações, destaca-se que empresas com o mesmo nível de investimento e experiência também falham. Entender os fracassos ajuda a calibrar nossas expectativas. Sem as falhas, a história fica pela metade.
Referências
BROWNLEE, J. (2020). "Data Leakage in Machine Learning". Machine Learning Mastery.
TALEB, N. N. A lógica do cisne negro: o impacto do altamente improvável. Rio de Janeiro: Best Business, 2011.
SMITHSONIAN MAGAZINE. Abraham Wald and the missing bullet holes. Publicado em 2013.
Subscribe to my newsletter
Read articles from Bernardo Ribeiro de Moura directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by

Bernardo Ribeiro de Moura
Bernardo Ribeiro de Moura
Analista de dados sênior na Unimed Rio Preto, explorando modelos preditivos, otimização de custos e tomadas de decisão baseadas em dados. Bacharel em Química (UNESP), em transição para Ciência de Dados (UNIVESP), combinando ciência e tecnologia para resolver problemas do mundo real. Especializações em Google Data Analytics e Data Science pela HarvardX. Escrevo sobre análises preditivas, visualização de dados e modelagem estatística. Vamos trocar ideias sobre Python, SQL e o impacto dos dados no dia a dia?