
Đánh giá Claude Fable 5: Phân tích Tài chính Doanh nghiệp
Chúng tôi thử nghiệm Claude Fable 5 của Anthropic với Qwen Deep Research để phân tích tài chính. Liệu bản nâng cấp mới này có thực sự xứng đáng với chi phí?
Vào ngày 9 tháng 6 năm 2026, Anthropic đã phát hành Claude Fable 5, một mô hình thuộc Lớp Mythos với các biện pháp bảo vệ tiên tiến trong một số lĩnh vực như an ninh mạng, chưng cất hóa học, hóa học và sinh học.

Anthropic đã công bố các số liệu cho thấy Fable 5 vượt trội hơn Opus 4.8 và GPT-5.5 trên một số bài kiểm tra chuẩn (benchmark) chính. Trong GDPval-AA (công việc tri thức), mô hình này vượt xa Opus 4.8, GPT 5.5 và Gemini 3.1 Pro.

Theo Claude, "Fable 5 cho thấy hiệu suất mạnh mẽ trong các tác vụ phân tích phức tạp".

Chúng tôi quyết định thử nghiệm Fable 5 bằng cách chạy phân tích so sánh về 'Space Exploration Technologies Corporation (SpaceX)' cho mục đích nghiên cứu đầu tư, sử dụng kỹ năng 'comps-analysis'. Tệp 'skill.md' được lấy từ kho lưu trữ GitHub dịch vụ tài chính của Anthropic.



Tác vụ này mất khoảng 25 phút. Claude không yêu cầu bất kỳ câu hỏi làm rõ nào ngoại trừ việc xin phép truy cập các trang web bên ngoài. Thật ấn tượng, Fable 5 có khả năng tự động tìm kiếm các công ty cùng ngành để so sánh.

*Xin lưu ý: Thử nghiệm này chỉ phục vụ mục đích nghiên cứu và giáo dục, không cấu thành lời khuyên đầu tư. Các tệp được tạo ban đầu có thể được tải xuống tại đây: tệp Excel SpaceX_Comps_Analysis_2026-06-10.xlsx và báo cáo PDF SpaceX_Comps_Memo_2026-06-10.pdf.
Khi chúng tôi thử nghiệm cùng một kỹ năng bằng Qwen deep research, chúng tôi phải nhập các công ty đối thủ theo cách thủ công. Các số liệu thống kê có sự khác biệt nhỏ so với Fable 5.



*Báo cáo do Qwen tạo ra có thể được tải xuống tại đây: The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf.
Mặc dù cả hai báo cáo từ Claude và Qwen đều được tạo ra dựa trên cùng một phương pháp được chỉ định trong kỹ năng, nhưng các con số có sự chênh lệch do Claude và Qwen lấy dữ liệu từ các nguồn khác nhau. Ví dụ, Claude Fable 5 đã sử dụng Stock Analysis trong khi Qwen sử dụng SEC.gov.


Báo cáo từ Qwen cũng chứa nhiều thông tin chi tiết hơn về mô hình kinh doanh, cơ cấu vốn và hoạt động vận hành của doanh nghiệp.
Sau khi so sánh các báo cáo, chúng tôi quyết định thử lại với lệnh /research trong ứng dụng Claude trên máy tính.

Báo cáo phân tích mới được tạo, SpaceX_Analysis.pdf, bao gồm thêm các phần khuyến nghị và cảnh báo bổ sung. So với tính năng tìm kiếm sâu của Qwen, báo cáo này vẫn thiếu thông tin chi tiết về doanh nghiệp như hoạt động vận hành và cơ cấu vốn.
Liệu Fable 5 có xứng đáng với mức giá cao cấp của nó không? Nó có thể hữu ích cho các tác vụ khó khăn, kéo dài và lập trình tự động. Nhưng đối với một số công việc tri thức nhất định, chẳng hạn như phân tích công ty, nó có thể chưa phải là lựa chọn tối ưu nhất về mặt chi phí.
Cuối cùng, chúng tôi đã thử nghiệm khả năng dịch thuật của Fable 5. Thật kỳ lạ, mô hình đã tự động chuyển đổi trở lại Opus 4.8.

Liệu điều này có nghĩa là mọi chuyển đổi ngữ cảnh dài sẽ bị trả về Opus 4.8? Đây chỉ là một lỗi tạm thời trong quá trình sử dụng trước ngày 22 tháng 6? Hay chỉ đơn giản là hệ thống đủ thông minh để nhận biết rằng tác vụ dịch thuật không cần một mô hình mạnh mẽ đến vậy.
Hướng dẫn sử dụng Browser và Scheduler trong Antigravity 2
Khám phá cách các lệnh /browser và /schedule biến Google Antigravity 2 thành một nền tảng tự động hóa AI chủ động và cực kỳ mạnh mẽ.
Hướng dẫn thiết lập và sử dụng NetSuite AI Connector (MCP)
Thiết lập NetSuite AI Connector (MCP) với ChatGPT và Claude. Khám phá cách truy vấn dữ liệu ERP trực quan và tự động hóa tác vụ bằng ngôn ngữ tự nhiên.