Techvoyage
首页
Claude Fable 5对比Qwen:AI企业财务分析能力实测

深度评测全新AI Claude Fable 5:高度复杂的企业财务与金融投资分析能力全面实测与深入对比

我们针对Anthropic最新发布的Claude Fable 5与Qwen Deep Research在SpaceX企业对比分析(Comps Analysis)等复杂金融财务分析任务中的表现进行了深度实测。本文将为您详细评估和解答,这款备受瞩目的高阶大模型是否真的值得金融从业者与企业级用户付费升级。

Jun 11, 2026 - 15 分钟阅读

2026年6月9日,Anthropic 发布了 Claude Fable 5,这是一款“神话级”(Mythos-Class)模型,在网络安全、知识提炼、化学和生物学等特定领域配备了更先进的安全防护机制。

Anthropic 官方公布的数据显示,Fable 5 在多项关键基准测试中均领先于 Opus 4.8 和 GPT-5.5。特别是在评估知识工作能力的 GDPval-AA 测试中,它明显领先于 Opus 4.8、GPT 5.5 以及 Gemini 3.1 Pro。

根据 Claude 的自述:“Fable 5 在处理复杂的分析任务时展现出了强大的性能。”

为了测试 Fable 5 的实际水平,我们决定以投资研究为目的,使用“comps-analysis”(可比公司分析)技能对 SpaceX(Space Exploration Technologies Corporation)进行分析。该分析所用的 'skill.md' 文件来源于 Anthropic 官方的金融服务 GitHub 仓库

整个任务耗时约 25 分钟。期间,Claude 除了请求访问外部网站的权限外,没有提出任何需要澄清的问题。令人印象深刻的是,Fable 5 能够完全自主地找到用于对比的同业竞争公司。

*请注意: 本评测仅用于研究与教学目的,不构成任何投资建议。实际生成的原始文件可在此下载:Excel 表格 SpaceX_Comps_Analysis_2026-06-10.xlsx 以及分析备忘录 SpaceX_Comps_Memo_2026-06-10.pdf

当我们使用 Qwen deep research(千问深度搜索)测试相同的技能时,我们必须手动输入对比的同业公司。并且在最终生成的数值上,Qwen 与 Fable 5 相比存在轻微的差异。

*由 Qwen 生成的报告可在此处下载:The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf

尽管 Claude 和 Qwen 的报告都是基于该技能中指定的相同方法生成的,但由于它们提取的数据源不同,数据依然存在偏差。例如,Claude Fable 5 使用了 Stock Analysis 网站,而 Qwen 则使用了美国证券交易委员会官网 SEC.gov

此外,Qwen 生成的报告中包含更多关于 SpaceX 商业模式、资本结构和日常运营的详细信息。

在对比了两份报告后,我们决定在 Claude 桌面应用中尝试使用 /research 命令重新生成一份报告。

新生成的分析报告 SpaceX_Analysis.pdf 增加了额外的投资建议和注意事项(免责声明)部分。但与 Qwen 的深度搜索报告相比,它依然缺乏关于公司具体日常运营和资本结构等层面的详细企业背景信息。

Fable 5 是否值得其昂贵的订阅价格?如果是针对高难度、长周期的任务或自主代码编写,它确实物有所值。但对于某些知识型工作(如企业财务分析),它可能还不是性价比最高的选择。

最后,我们测试了 Fable 5 在翻译任务中的表现。然而奇怪的是,该模型在翻译时自动切回了 Opus 4.8

这是否意味着所有涉及长上下文的转换任务都会被强制退回到 Opus 4.8?这只是 6 月 22 日产品上线前的使用期内临时出现的特殊状况,还是系统本身足够智能,能够自动判断翻译任务并不需要如此强大的模型算力?