
Testando Claude Fable 5: Avaliação em Análise Financeira
Testamos o novo Claude Fable 5 da Anthropic contra o Qwen Deep Research para análise financeira. Será que essa atualização realmente vale o seu preço premium?
Em 9 de junho de 2026, a Anthropic lançou o Claude Fable 5, um modelo de classe Mythos com salvaguardas avançadas em áreas como cibersegurança, destilação, química e biologia.

A Anthropic publicou dados mostrando que o Fable 5 está à frente do Opus 4.8 e do GPT-5.5 em vários benchmarks importantes. No GDPval-AA (trabalho cognitivo), ele está significativamente à frente do Opus 4.8, GPT 5.5 e Gemini 3.1 Pro.

De acordo com o Claude, "o Fable 5 apresenta forte desempenho em tarefas analíticas complexas".

Decidimos testar o Fable 5 executando uma análise comparativa da 'Space Exploration Technologies Corporation (SpaceX)' para fins de pesquisa de investimentos, utilizando a habilidade de 'comps-analysis'. O arquivo 'skill.md' foi extraído do repositório de serviços financeiros do GitHub da Anthropic.



A tarefa levou cerca de 25 minutos. O Claude não fez perguntas para esclarecimento, exceto para pedir permissão de acesso a sites externos. Impressionantemente, o Fable 5 foi capaz de encontrar de forma independente as empresas concorrentes para a comparação.

*Atenção: Este teste tem fins educacionais e de pesquisa e não constitui recomendação de investimento. Os arquivos originais gerados podem ser baixados aqui: SpaceX_Comps_Analysis_2026-06-10.xlsx e SpaceX_Comps_Memo_2026-06-10.pdf.
Quando testamos a mesma habilidade usando o Qwen deep research, tivemos que inserir manualmente as empresas concorrentes. Os dados numéricos apresentaram pequenas variações em relação ao Fable 5.



*O relatório gerado pelo Qwen pode ser baixado aqui: The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf.
Embora ambos os relatórios de Claude e Qwen tenham sido produzidos com base na mesma metodologia especificada na habilidade, os números divergiram porque Claude e Qwen extraíram dados de fontes diferentes. For exemplo, o Claude Fable 5 usou Stock Analysis, enquanto o Qwen usou o SEC.gov.


O relatório do Qwen também continha muito mais informações sobre o modelo de negócios, estrutura de capital e operações corporativas.
Depois de comparar os relatórios, decidimos tentar novamente utilizando o comando /research no aplicativo de desktop do Claude.

O relatório de análise recém-gerado, SpaceX_Analysis.pdf, incluiu seções extras de recomendações e ressalvas. Comparado à pesquisa profunda do Qwen, ele ainda carecia de informações detalhadas da empresa, como as operações e a estrutura de capital.
Será que o Fable 5 vale o preço premium cobrado? Pode valer para tarefas complexas e longas e para codificação autônoma. No entanto, para certos trabalhos cognitivos, como análise de empresas, pode ainda não ser o melhor custo-benefício.
No final, testamos o quão bem o Fable 5 se desempenha em traduções. Estranhamente, o modelo reverteu automaticamente de volta para o Opus 4.8.

Será que isso significa que qualquer conversão de contexto longo será revertida para o Opus 4.8? Trata-se de uma instabilidade temporária durante o uso antes de 22 de junho? Ou o sistema é simplesmente inteligente o bastante para identificar que a tradução não requer um modelo tão potente?
Guia do Browser e do Scheduler no Google Antigravity 2
Descubra como os comandos /browser e /schedule elevam o Google Antigravity 2 a uma poderosa plataforma de automação proativa com IA.
Guia do Conector de IA do NetSuite: Configuração do MCP
Configure o Conector de IA do NetSuite (MCP) com o ChatGPT e Claude. Descubra como consultar dados de ERP e automatizar tarefas usando linguagem natural.