Công cụ 'Suy nghĩ' mới của Anthropic cho phép Claude dừng lại và suy ngẫm trong các tình huống sử dụng công cụ phức tạp

Bitget App

Giao dịch thông minh hơn

MPOST2025/03/24 11:22

Theo:MPOST

Tóm lại Anthropic đã giới thiệu công cụ “Suy nghĩ”, cho phép Claude thêm một bước suy nghĩ bổ sung—hoàn chỉnh với không gian được chỉ định riêng—trước khi đưa ra câu trả lời cuối cùng.

Công ty chuyên về an toàn và nghiên cứu AI, nhân loại giới thiệu công cụ “Think”, cung cấp không gian dành riêng cho tư duy có cấu trúc trong các nhiệm vụ phức tạp. Công cụ này cho phép Claude kết hợp thêm một bước tư duy—hoàn chỉnh với không gian được chỉ định riêng—trước khi đưa ra câu trả lời cuối cùng.

Mặc dù khái niệm này có vẻ giống với tư duy mở rộng, nhưng có những điểm khác biệt chính. Tư duy mở rộng diễn ra trước khi Claude bắt đầu tạo phản hồi, khi đó nó cân nhắc sâu sắc và tinh chỉnh cách tiếp cận của mình. Ngược lại, công cụ "Suy nghĩ" được sử dụng sau khi Claude bắt đầu tạo phản hồi, cho phép nó tạm dừng và đánh giá xem nó đã thu thập được tất cả thông tin cần thiết để tiếp tục hay chưa. Điều này đặc biệt có lợi trong các tác vụ liên quan đến chuỗi dài các cuộc gọi công cụ hoặc các cuộc trò chuyện nhiều bước với người dùng.

Công cụ “Think” đặc biệt hiệu quả trong những tình huống mà Claude không có đủ thông tin từ riêng truy vấn của người dùng và cần xử lý dữ liệu bên ngoài (chẳng hạn như kết quả từ các lệnh gọi công cụ). Lý luận đằng sau công cụ này ít toàn diện hơn so với quy trình suy nghĩ mở rộng và tập trung hơn vào việc tích hợp thông tin mới xuất hiện trong quá trình thực hiện nhiệm vụ.

Anthropic khuyến nghị sử dụng tư duy mở rộng cho các tình huống đơn giản hơn, chẳng hạn như các lệnh gọi công cụ không tuần tự hoặc hướng dẫn trực tiếp. Nó cũng hiệu quả đối với các nhiệm vụ như mã hóa, toán học và vật lý, trong đó Claude không cần phải dựa vào các công cụ bên ngoài. Công cụ này phù hợp hơn với các nhiệm vụ phức tạp hơn, trong đó Claude phải phân tích cẩn thận các đầu ra của công cụ, điều hướng các hướng dẫn chi tiết trong môi trường có nhiều chính sách hoặc đưa ra các quyết định tuần tự dựa trên nhau, trong đó lỗi có thể gây ra hậu quả.

Thực hành tốt nhất để triển khai công cụ 'Think'

Để tối đa hóa lợi ích của công cụ “Think” với Claude, Anthropic đề xuất các biện pháp triển khai sau dựa trên các thí nghiệm τ-bench của mình.

Chiến lược hiệu quả nhất là đưa ra hướng dẫn rõ ràng về thời điểm và cách sử dụng công cụ “Think”. Điều này đặc biệt rõ ràng trong lĩnh vực hàng không τ-bench, nơi các ví dụ cụ thể về lĩnh vực này giúp tăng cường đáng kể hiệu quả của mô hình trong việc áp dụng công cụ “think”. Các ví dụ này nên bao gồm hướng dẫn về một số khía cạnh, chẳng hạn như: phác thảo mức độ chi tiết dự kiến trong quá trình lập luận, chia nhỏ các hướng dẫn phức tạp thành các bước có thể thực hiện được, cung cấp cây quyết định để xử lý các tình huống phổ biến và giúp đánh giá xem tất cả thông tin cần thiết đã được thu thập hay chưa.

Ngoài ra, nhân loại phát hiện ra rằng đối với các hướng dẫn dài hoặc phức tạp, việc đưa chúng vào lời nhắc hệ thống hiệu quả hơn là đưa chúng vào chính mô tả công cụ. Điều này cho phép mô hình tích hợp tốt hơn quá trình suy nghĩ vào hành vi tổng thể của nó bằng cách cung cấp cho nó bối cảnh rộng hơn.

Việc tích hợp công cụ “Think” vào quá trình triển khai Claude tương đối đơn giản và có thể dẫn đến những cải tiến. Công ty đề xuất bắt đầu với các trường hợp sử dụng đầy thách thức, đặc biệt là những trường hợp mà Claude gặp khó khăn trong việc tuân thủ chính sách hoặc lý luận phức tạp trong chuỗi dài các lệnh gọi công cụ. Người dùng có thể bắt đầu bằng cách thêm công cụ definition và triển khai một công cụ “think” tùy chỉnh dành riêng cho miền. Quá trình này yêu cầu mã hóa tối thiểu nhưng tạo điều kiện cho lý luận có cấu trúc hơn. Người dùng cũng nên cân nhắc đưa hướng dẫn về thời điểm và cách sử dụng công cụ, cùng với các ví dụ liên quan đến miền trong lời nhắc hệ thống.

Khi công cụ đã được đưa vào sử dụng, người dùng được khuyến khích theo dõi và tinh chỉnh cách sử dụng bằng cách quan sát cách Claude áp dụng nó vào thực tế. Họ có thể điều chỉnh lời nhắc để thúc đẩy các mô hình tư duy hiệu quả hơn. Việc thêm công cụ mới có ít nhược điểm nhất về mặt hiệu suất. Nó sẽ không thay đổi hành vi bên ngoài trừ khi Claude chọn sử dụng nó và nó không can thiệp vào các công cụ hoặc quy trình làm việc hiện có.

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Khóa ngay!