Claude Fable 5 vs Qwen: Thử Nghiệm Phân Tích Tài Chính AI

Đánh giá Claude Fable 5: Phân tích Tài chính Doanh nghiệp

Chúng tôi thử nghiệm Claude Fable 5 của Anthropic với Qwen Deep Research để phân tích tài chính. Liệu bản nâng cấp mới này có thực sự xứng đáng với chi phí?

Jun 11, 2026 - 7 PHÚT ĐỌC

Vào ngày 9 tháng 6 năm 2026, Anthropic đã phát hành Claude Fable 5, một mô hình thuộc Lớp Mythos với các biện pháp bảo vệ tiên tiến trong một số lĩnh vực như an ninh mạng, chưng cất hóa học, hóa học và sinh học. Thông báo ra mắt Anthropic Claude Fable 5 và các nâng cấp tính năng vượt trội của mô hình

Anthropic đã công bố các số liệu cho thấy Fable 5 vượt trội hơn Opus 4.8 và GPT-5.5 trên một số bài kiểm tra chuẩn (benchmark) chính. Trong GDPval-AA (công việc tri thức), mô hình này vượt xa Opus 4.8, GPT 5.5 và Gemini 3.1 Pro. Bản đồ so sánh chuẩn hiệu năng Claude Fable 5 bao gồm điểm công việc tri thức GDPval-AA

Theo Claude, "Fable 5 cho thấy hiệu suất mạnh mẽ trong các tác vụ phân tích phức tạp".

Báo cáo khẳng định hiệu suất mạnh mẽ của Claude Fable 5 đối với các phân tích dữ liệu phức tạp

Chúng tôi quyết định thử nghiệm Fable 5 bằng cách chạy phân tích so sánh về 'Space Exploration Technologies Corporation (SpaceX)' cho mục đích nghiên cứu đầu tư, sử dụng kỹ năng 'comps-analysis'. Tệp 'skill.md' được lấy từ kho lưu trữ GitHub dịch vụ tài chính của Anthropic.

Kích hoạt kỹ năng phân tích so sánh tài chính của SpaceX trong giao diện chat Claude Claude Fable 5 đang tự động thực hiện quy trình so sánh tài chính doanh nghiệp SpaceX

Kết quả phân tích tài chính so sánh SpaceX được hoàn thành tự động bởi quy trình của hệ thống

Tác vụ này mất khoảng 25 phút. Claude không yêu cầu bất kỳ câu hỏi làm rõ nào ngoại trừ việc xin phép truy cập các trang web bên ngoài. Thật ấn tượng, Fable 5 có khả năng tự động tìm kiếm các công ty cùng ngành để so sánh.

Claude Fable 5 yêu cầu sự đồng ý truy cập vào các nguồn thông tin mạng bên ngoài

Danh sách các công ty cùng phân khúc SpaceX được Claude Fable 5 tự động tìm kiếm thành công *Xin lưu ý: Thử nghiệm này chỉ phục vụ mục đích nghiên cứu và giáo dục, không cấu thành lời khuyên đầu tư. Các tệp được tạo ban đầu có thể được tải xuống tại đây: tệp Excel SpaceX_Comps_Analysis_2026-06-10.xlsx và báo cáo PDF SpaceX_Comps_Memo_2026-06-10.pdf.

Khi chúng tôi thử nghiệm cùng một kỹ năng bằng Qwen deep research, chúng tôi phải nhập các công ty đối thủ theo cách thủ công. Các số liệu thống kê có sự khác biệt nhỏ so với Fable 5.

Khởi động quy trình phân tích so sánh đầu tư SpaceX trong công cụ tìm kiếm Qwen deep research Cung cấp danh sách đối thủ thủ công trong Qwen deep research để phân tích doanh nghiệp SpaceX Xem trước báo cáo thống kê tăng trưởng tài chính của SpaceX được tổng hợp bởi mô hình Qwen

*Báo cáo do Qwen tạo ra có thể được tải xuống tại đây: The_SpaceX_Comp_Analysis_A_Statistical_Benchmark_of_Growth_Efficiency_and_Valuation_Against_Public_Peers.pdf.

Mặc dù cả hai báo cáo từ Claude và Qwen đều được tạo ra dựa trên cùng một phương pháp được chỉ định trong kỹ năng, nhưng các con số có sự chênh lệch do Claude và Qwen lấy dữ liệu từ các nguồn khác nhau. Ví dụ, Claude Fable 5 đã sử dụng Stock Analysis trong khi Qwen sử dụng SEC.gov. Dữ liệu tài chính doanh nghiệp được trích xuất từ trang Stock Analysis bởi mô hình Claude Fable 5 Các hồ sơ SEC chính thức và hệ thống dữ liệu SEC.gov được thu thập bởi Qwen deep research

Báo cáo từ Qwen cũng chứa nhiều thông tin chi tiết hơn về mô hình kinh doanh, cơ cấu vốn và hoạt động vận hành của doanh nghiệp.

Sau khi so sánh các báo cáo, chúng tôi quyết định thử lại với lệnh /research trong ứng dụng Claude trên máy tính. Thực hiện khảo sát thị trường sâu hơn với lệnh /research mới trong ứng dụng Claude cho máy tính

Báo cáo phân tích mới được tạo, SpaceX_Analysis.pdf, bao gồm thêm các phần khuyến nghị và cảnh báo bổ sung. So với tính năng tìm kiếm sâu của Qwen, báo cáo này vẫn thiếu thông tin chi tiết về doanh nghiệp như hoạt động vận hành và cơ cấu vốn.

Liệu Fable 5 có xứng đáng với mức giá cao cấp của nó không? Nó có thể hữu ích cho các tác vụ khó khăn, kéo dài và lập trình tự động. Nhưng đối với một số công việc tri thức nhất định, chẳng hạn như phân tích công ty, nó có thể chưa phải là lựa chọn tối ưu nhất về mặt chi phí.

Cuối cùng, chúng tôi đã thử nghiệm khả năng dịch thuật của Fable 5. Thật kỳ lạ, mô hình đã tự động chuyển đổi trở lại Opus 4.8. Giao diện hệ thống tự động đổi từ mô hình Fable 5 sang Opus 4.8 khi xử lý tác vụ dịch thuật

Liệu điều này có nghĩa là mọi chuyển đổi ngữ cảnh dài sẽ bị trả về Opus 4.8? Đây chỉ là một lỗi tạm thời trong quá trình sử dụng trước ngày 22 tháng 6? Hay chỉ đơn giản là hệ thống đủ thông minh để nhận biết rằng tác vụ dịch thuật không cần một mô hình mạnh mẽ đến vậy.

Hướng dẫn sử dụng Browser và Scheduler trong Antigravity 2

Khám phá cách các lệnh /browser và /schedule biến Google Antigravity 2 thành một nền tảng tự động hóa AI chủ động và cực kỳ mạnh mẽ.

Hướng dẫn thiết lập và sử dụng NetSuite AI Connector (MCP)

Thiết lập NetSuite AI Connector (MCP) với ChatGPT và Claude. Khám phá cách truy vấn dữ liệu ERP trực quan và tự động hóa tác vụ bằng ngôn ngữ tự nhiên.