Techvoyage
ホーム
Claude Fable 5対Qwen:AI金融財務分析テスト比較

最先端AI Claude Fable 5を徹底検証:企業財務分析における驚異的な実力と詳細な評価レビュー

Anthropicの最新AIモデル「Claude Fable 5」と「Qwen Deep Research」を、SpaceX of の企業比較分析(Comps Analysis)を用いて徹底比較!高度な金融財務分析における両者の詳細な違いを検証し、プレミアムなアップグレード料金に見合う価値があるのか検証します。

Jun 11, 2026 - 16分で読める

2026年6月9日、Anthropic社は、サイバーセキュリティ、蒸留(ディスティレーション)、化学、生物学などの特定領域において高度なセーフガードを備えた「Mythos(ミトス)」クラスのモデルであるClaude Fable 5をリリースしました。

Anthropicが公開したデータによると、Fable 5はいくつかの主要ベンチマークでOpus 4.8やGPT-5.5を上回っています。特にナレッジワークを評価するGDPval-AAでは、Opus 4.8、GPT 5.5、Gemini 3.1 Proを大幅にリードしています。

Claudeの公式発表によると、「Fable 5は、複雑な分析タスクにおいて強力なパフォーマンスを発揮する」とされています。

そこで私たちは、投資リサーチを目的として、「Space Exploration Technologies Corporation(SpaceX)」の企業比較分析を実行し、Fable 5の実力をテストすることにしました。今回使用した「comps-analysis」スキル(skill.md)は、Anthropicの金融サービス向けGitHubリポジトリから取得したものです。

タスクの完了までにかかった時間は約25分でした。Claudeは外部ウェブサイトへのアクセス許可を求めた以外、一切の質問をしてきませんでした。素晴らしいことに、Fable 5は比較対象となる同業他社(ピアグループ)を自律的に見つけ出す能力を示しました。

*注意: 本記事は研究および教育目的のみを目的としており、投資勧誘やアドバイスを行うものではありません。実際に生成されたオリジナルファイルは、こちらからダウンロード可能です:Excelシート「SpaceX_Comps_Analysis_2026-06-10.xlsx」、分析メモ「SpaceX_Comps_Memo_2026-06-10.pdf」。

一方、同じスキルをQwen deep researchでテストした際には、比較対象企業を手動で入力する必要がありました。また、算出された数値もFable 5と比較して若干の差異が見られました。

*Qwenが生成したレポートはこちらからダウンロードできます:The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf

ClaudeとQwenのレポートは、どちらも同一スキル内の定義に沿った手順で作成されたものの、取得ソースが異なったため数値に違いが生じました。例えば、Claude Fable 5はStock Analysisからデータを取得したのに対し、Qwenは米国証券取引委員会のSEC.govを使用していました。

また、Qwenが作成したレポートの方が、SpaceXのビジネスモデル、資本構成、および業務運営(オペレーション)についてより詳細な情報が含まれていました。

これらのレポートを比較した後、私たちはClaudeのデスクトップアプリで /research コマンドを使って再挑戦することにしました。

新しく生成された分析レポート「SpaceX_Analysis.pdf」には、追加の推奨事項や注意書き(免責事項)セクションが盛り込まれていました。しかし、Qwen deep search(ディープサーチ)と比較すると、事業オペレーションや資本構成といった企業自体の詳細情報がまだ不足している印象でした。

Fable 5は、そのプレミアムな価格に見合う価値があるでしょうか?難易度が高く時間のかかるタスクや、自律的なコーディングにおいては、その価値があるかもしれません。しかし、企業分析のような特定のナレッジワークにおいては、現時点では最高のコストパフォーマンスとは言えない可能性があります。

最後に、Fable 5が翻訳タスクでどの程度機能するかテストしました。奇妙なことに、翻訳を開始するとモデルが自動的にOpus 4.8へとダウングレードされました。

これは、長いコンテキストを処理する変換タスクにおいて、システムが自動的にOpus 4.8へ切り替えてしまうことを意味するのでしょうか?6月22日以前の利用における一時的なバグなのか、あるいは翻訳にはそこまで高性能なモデルが必要ないとシステム側が賢く判断した結果なのでしょうか。