Claude Fable 5 vs Qwen: Teste de Análise Financeira de IA

Testando Claude Fable 5: Avaliação em Análise Financeira

Testamos o novo Claude Fable 5 da Anthropic contra o Qwen Deep Research para análise financeira. Será que essa atualização realmente vale o seu preço premium?

Jun 11, 2026 - 6 MIN DE LEITURA

Em 9 de junho de 2026, a Anthropic lançou o Claude Fable 5, um modelo de classe Mythos com salvaguardas avançadas em áreas como cibersegurança, destilação, química e biologia. Anúncio oficial de lançamento do Anthropic Claude Fable 5 e recursos avançados do modelo

A Anthropic publicou dados mostrando que o Fable 5 está à frente do Opus 4.8 e do GPT-5.5 em vários benchmarks importantes. No GDPval-AA (trabalho cognitivo), ele está significativamente à frente do Opus 4.8, GPT 5.5 e Gemini 3.1 Pro. Comparação de benchmarks do Claude Fable 5 incluindo pontuação de trabalho cognitivo GDPval-AA

De acordo com o Claude, "o Fable 5 apresenta forte desempenho em tarefas analíticas complexas".

Declaração de excelente desempenho do Claude Fable 5 em tarefas analíticas complexas

Decidimos testar o Fable 5 executando uma análise comparativa da 'Space Exploration Technologies Corporation (SpaceX)' para fins de pesquisa de investimentos, utilizando a habilidade de 'comps-analysis'. O arquivo 'skill.md' foi extraído do repositório de serviços financeiros do GitHub da Anthropic.

Iniciando a habilidade de análise comparativa financeira do SpaceX no chat do Claude Fable 5 Claude Fable 5 executando a análise comparativa financeira automatizada para a SpaceX

Resultado final do fluxo de trabalho de análise financeira comparativa da SpaceX

A tarefa levou cerca de 25 minutos. O Claude não fez perguntas para esclarecimento, exceto para pedir permissão de acesso a sites externos. Impressionantemente, o Fable 5 foi capaz de encontrar de forma independente as empresas concorrentes para a comparação.

Claude Fable 5 solicitando permissão explícita para acessar de forma segura sites externos

Empresas concorrentes da SpaceX identificadas de maneira totalmente autônoma pelo Claude Fable 5 *Atenção: Este teste tem fins educacionais e de pesquisa e não constitui recomendação de investimento. Os arquivos originais gerados podem ser baixados aqui: SpaceX_Comps_Analysis_2026-06-10.xlsx e SpaceX_Comps_Memo_2026-06-10.pdf.

Quando testamos a mesma habilidade usando o Qwen deep research, tivemos que inserir manualmente as empresas concorrentes. Os dados numéricos apresentaram pequenas variações em relação ao Fable 5.

Iniciando a análise comparativa financeira da SpaceX usando o Qwen deep research Inserção manual de empresas concorrentes no Qwen deep research para análise corporativa da SpaceX Visualização prévia do relatório financeiro de benchmarking da SpaceX gerado pelo Qwen

*O relatório gerado pelo Qwen pode ser baixado aqui: The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf.

Embora ambos os relatórios de Claude e Qwen tenham sido produzidos com base na mesma metodologia especificada na habilidade, os números divergiram porque Claude e Qwen extraíram dados de fontes diferentes. For exemplo, o Claude Fable 5 usou Stock Analysis, enquanto o Qwen usou o SEC.gov. Dados financeiros corporativos extraídos do Stock Analysis pelo modelo Claude Fable 5 Documentos oficiais da SEC e portal de dados do SEC.gov utilizados pelo Qwen deep research

O relatório do Qwen também continha muito mais informações sobre o modelo de negócios, estrutura de capital e operações corporativas.

Depois de comparar os relatórios, decidimos tentar novamente utilizando o comando /research no aplicativo de desktop do Claude. Utilizando o novo comando de pesquisa no app de desktop do Claude para análise aprofundada de mercado

O relatório de análise recém-gerado, SpaceX_Analysis.pdf, incluiu seções extras de recomendações e ressalvas. Comparado à pesquisa profunda do Qwen, ele ainda carecia de informações detalhadas da empresa, como as operações e a estrutura de capital.

Será que o Fable 5 vale o preço premium cobrado? Pode valer para tarefas complexas e longas e para codificação autônoma. No entanto, para certos trabalhos cognitivos, como análise de empresas, pode ainda não ser o melhor custo-benefício.

No final, testamos o quão bem o Fable 5 se desempenha em traduções. Estranhamente, o modelo reverteu automaticamente de volta para o Opus 4.8. O app de desktop do Claude revertendo automaticamente o modelo ativo de Fable 5 para Opus 4.8

Será que isso significa que qualquer conversão de contexto longo será revertida para o Opus 4.8? Trata-se de uma instabilidade temporária durante o uso antes de 22 de junho? Ou o sistema é simplesmente inteligente o bastante para identificar que a tradução não requer um modelo tão potente?

Guia do Browser e do Scheduler no Google Antigravity 2

Descubra como os comandos /browser e /schedule elevam o Google Antigravity 2 a uma poderosa plataforma de automação proativa com IA.

Guia do Conector de IA do NetSuite: Configuração do MCP

Configure o Conector de IA do NetSuite (MCP) com o ChatGPT e Claude. Descubra como consultar dados de ERP e automatizar tarefas usando linguagem natural.