Claude vừa công bố một điều khiến các nhà phát triển phải dừng cuộn trang: Claude giờ đây có thể điều khiển máy tính của bạn.
Hãy dùng thử Apidog ngay hôm nay
Không phải thông qua API. Không phải thông qua các tích hợp. Mà là trực tiếp. Nó mở ứng dụng, duyệt trình duyệt, nhấp vào nút, điền vào bảng tính — bất cứ điều gì bạn làm khi ngồi trước máy tính.
Đây không phải là bản demo. Hiện tại, tính năng này đã có sẵn trong Claude Cowork và Claude Code dành cho người dùng macOS trên gói Pro và Max. Thông báo này đã đạt 23 triệu lượt xem trong 8 giờ. Mọi người đang rất quan tâm.
Nhưng đây là điều quan trọng đối với các nhà phát triển: điều này thay đổi cách chúng ta nghĩ về tự động hóa. Bao gồm cả kiểm thử API.
Claude sử dụng máy tính thực sự làm gì
Hãy làm rõ những gì đang diễn ra ở đây.
Claude không chỉ tạo văn bản nữa. Nó có thể:
- Mở ứng dụng trên màn hình của bạn
- Điều hướng trình duyệt và tương tác với các trang web
- Điền vào biểu mẫu và bảng tính
- Nhấp nút, cuộn, gõ phím — toàn bộ các tương tác GUI
- Làm việc khi bạn vắng mặt — giao việc từ điện thoại di động, quay lại khi công việc đã hoàn thành
Điểm mấu chốt: Claude ưu tiên sử dụng các tích hợp đã kết nối của bạn trước (Slack, Lịch, v.v.). Khi không có trình kết nối cho công cụ bạn cần, nó sẽ hỏi quyền để mở ứng dụng trực tiếp trên màn hình của bạn.
Đây là một sự thay đổi cơ bản. Chúng ta đang chuyển từ “AI phản hồi” sang “AI hành động.”
Tại sao điều này quan trọng đối với các nhà phát triển API
Bạn có thể đang nghĩ: “Tuyệt vời, nhưng tôi là một nhà phát triển API. Điều này liên quan gì đến tôi?”
Vấn đề là: kiểm thử API sắp thay đổi.
Hiện tại, kiểm thử API trông như thế này:
- Viết script kiểm thử
- Thiết lập môi trường
- Chạy các bộ sưu tập
- Phân tích kết quả
- Gỡ lỗi các lỗi
- Ghi lại các phát hiện
Nó là thủ công. Nó lặp đi lặp lại. Nó yêu cầu chuyển đổi ngữ cảnh giữa các công cụ.
Bây giờ hãy hình dung quy trình làm việc này thay vào đó:
“Claude, kiểm thử điểm cuối API thanh toán. Hãy thử theo kịch bản thành công, sau đó kiểm thử các trường hợp biên cho thẻ không hợp lệ, token hết hạn và lỗi mạng. Ghi lại mọi lỗi vào trình theo dõi lỗi.”
Claude mở công cụ kiểm thử API của bạn, chạy các yêu cầu, phân tích phản hồi, xác định các bất thường và ghi lại các vấn đề. Bạn xem lại bản tóm tắt.
Đó là hướng mà chúng ta đang đi tới.
Quy trình kiểm thử với tác nhân AI
Hãy cùng phác thảo kiểm thử được hỗ trợ bởi AI có thể trông như thế nào:
Quy trình làm việc hiện tại
Developer → Write tests → Run manually → Check results → Debug → Document
Quy trình làm việc với tác nhân AI
Developer → Assign task → Agent runs tests → Agent analyzes → Agent documents → Developer reviews
Tác nhân xử lý các bước lặp lại ở giữa. Bạn tập trung vào:
- Xác định những gì cần kiểm thử
- Xem xét các trường hợp biên
- Đưa ra các quyết định kiến trúc
Các khối xây dựng đã tồn tại:
- Apidog lưu trữ các thông số kỹ thuật API và các trường hợp kiểm thử của bạn
- Các pipeline CI/CD chạy kiểm thử tự động
- Claude giờ đây có thể điều phối các công cụ trên máy tính của bạn
Khoảng cách đang được thu hẹp.
Những gì nhà phát triển nên chuẩn bị
Nếu bạn đang xây dựng hoặc kiểm thử API, đây là những điều cần bắt đầu suy nghĩ:
1. Ghi lại quy trình làm việc kiểm thử của bạn
Các tác nhân AI cần hướng dẫn rõ ràng. Quy trình kiểm thử của bạn càng được ghi lại tốt thì việc ủy quyền càng dễ dàng.
Ghi lại:
- Cách bạn kiểm thử từng điểm cuối
- Những trường hợp biên nào bạn kiểm tra
- Cách bạn xử lý các lỗi
- Nơi bạn ghi nhận lỗi
2. Giúp công cụ của bạn dễ tiếp cận
Claude hoạt động tốt nhất với các ứng dụng mà nó có thể mở và điều khiển. Đảm bảo các công cụ kiểm thử của bạn:
- Có giao diện người dùng rõ ràng (ngay cả khi bạn thường sử dụng CLI)
- Có thể được khởi chạy theo chương trình
- Xuất kết quả dưới định dạng dễ đọc
3. Xác định tiêu chí thành công
Khi bạn yêu cầu một tác nhân AI “kiểm thử API”, thành công trông như thế nào?
- Tất cả các kiểm thử đều vượt qua?
- Thời gian phản hồi dưới 200ms?
- Không có lỗi 5xx?
- Xác thực dữ liệu thành công?
Các tiêu chí rõ ràng giúp kiểm thử bằng tác nhân đáng tin cậy.
4. Chuẩn bị cho mô hình cấp quyền
Claude hỏi quyền trước khi kiểm soát. Hãy làm quen với:
- Xem xét những gì tác nhân muốn làm
- Hiểu phạm vi truy cập
- Đặt ra giới hạn cho các hoạt động nhạy cảm
Đây cũng là một thực hành bảo mật tốt.
Cuộc đối thoại bảo mật chúng ta cần có
Hãy nói về vấn đề hiển nhiên nhưng thường bị bỏ qua.
Trao quyền kiểm soát máy tính của bạn cho AI đặt ra những câu hỏi bảo mật:
- Nó có thể truy cập những gì?
- Dữ liệu đi về đâu?
- Làm thế nào để bạn kiểm toán các hành động của nó?
- Điều gì sẽ xảy ra nếu nó mắc lỗi?
Anthropic đã tích hợp các biện pháp bảo vệ:
- Lời nhắc cấp quyền trước khi điều khiển ứng dụng
- Tích hợp đã kết nối được ưu tiên hơn điều khiển trực tiếp
- Chỉ dành cho MacOS hiện tại (môi trường được kiểm soát tốt hơn)
- Bản xem trước nghiên cứu — họ cũng đang học hỏi
Đối với kiểm thử API:
- Không cấp quyền truy cập API sản phẩm cho tác nhân
- Sử dụng môi trường sandbox
- Xem lại nhật ký các hành động đã thực hiện
- Bắt đầu với các hoạt động rủi ro thấp
Đây là lãnh địa mới. Hãy xử lý nó phù hợp.
Apidog phù hợp như thế nào trong tương lai này
Đây là nơi các công cụ như Apidog trở nên quan trọng.
Khi một tác nhân AI cần kiểm thử API, nó cần:
- Thông số kỹ thuật API (OpenAPI/Swagger)
- Bộ sưu tập kiểm thử với các yêu cầu đã định nghĩa
- Cấu hình môi trường (staging, production)
- Quy tắc xác thực phản hồi
- Tài liệu rõ ràng về hành vi mong đợi
Apidog cung cấp tất cả những điều này dưới một định dạng có cấu trúc, dễ truy cập.
Tác nhân không cần đoán những điểm cuối nào tồn tại hay thông số nào hợp lệ. Nó đọc thông số kỹ thuật, thực thi các kiểm thử, xác thực phản hồi dựa trên schema.
Đây là loại môi trường có cấu trúc nơi tác nhân AI phát huy tối đa khả năng.
Bắt đầu kiểm thử API với Apidog - miễn phí
Điều này có ý nghĩa gì đối với công việc của bạn
Cùng nhìn thẳng vào tác động đến sự nghiệp.
Các tác nhân AI sẽ không thay thế các nhà phát triển API. Nhưng chúng sẽ thay đổi công việc.
Đây là những gì thay đổi:
| Trách nhiệm hiện tại | Trạng thái tương lai |
|---|---|
| Viết script kiểm thử | Thiết kế chiến lược kiểm thử |
| Chạy các bộ kiểm thử | Xem xét kết quả của tác nhân |
| Gỡ lỗi các lỗi | Xác định tiêu chí thất bại |
| Tạo tài liệu API | Quản lý tài liệu của tác nhân |
Những phần tẻ nhạt được tự động hóa. Những phần tư duy vẫn do con người đảm nhiệm.
Giá trị của bạn chuyển từ “thực hiện kiểm thử” sang “biết kiểm thử gì và tại sao.”
Đó là một sự nâng cấp: nhiều chiến lược hơn, ít lặp lại hơn.
Khi nào nên bắt đầu thử nghiệm
Đây là bản xem trước nghiên cứu. Vẫn còn sớm. Nhưng đây là lúc các nhà phát triển thông minh bắt đầu thử nghiệm.
Cách để bắt đầu làm quen:
Tuần 1: Thử sử dụng Claude điều khiển máy tính
- Cập nhật ứng dụng Claude trên máy tính của bạn
- Ghép nối với điện thoại di động
- Giao cho nó những nhiệm vụ đơn giản: “Mở lịch của tôi và tìm các cuộc họp ngày mai”
- Làm quen với các lời nhắc cấp quyền
Tuần 2: Áp dụng vào quy trình làm việc của bạn
- Thử: “Mở tài liệu API của tôi và tóm tắt luồng xác thực”
- Sau đó: “Chạy qua các điểm cuối đăng ký người dùng và ghi chú bất kỳ trường nào bị thiếu”
- Xem điều gì hoạt động, điều gì bị lỗi
Tuần 3: Suy nghĩ về kiểm thử
- Ghi lại một quy trình kiểm thử API từng bước
- Cân nhắc những gì một tác nhân sẽ cần để thực hiện nó
- Xác định những lỗ hổng trong tài liệu của bạn
Tuần 4: Đánh giá công cụ
- Công cụ kiểm thử API của bạn có hỗ trợ tự động hóa không?
- Thông số kỹ thuật của bạn có được cập nhật không?
- Điều gì cần thay đổi cho việc kiểm thử do tác nhân điều khiển?
Bức tranh tổng thể
Việc Claude sử dụng máy tính không chỉ dừng lại ở sự tiện lợi. Đó là một phần của sự thay đổi rộng lớn hơn.
Chúng ta đang hướng tới các tác nhân AI như đồng nghiệp:
- Không phải chatbot phản hồi
- Không phải script chạy theo lịch trình
- Các tác nhân hiểu ngữ cảnh, hành động và báo cáo lại
Các công ty làm việc được với các tác nhân AI sẽ có lợi thế về năng suất. Những công ty không làm được sẽ dành nhiều thời gian hơn cho công việc thủ công.
Kiểm thử API là một trường hợp sử dụng hoàn hảo:
- Nhiệm vụ được định nghĩa rõ ràng
- Tiêu chí thành công rõ ràng
- Thực thi lặp lại
- Đầu ra có cấu trúc
Nếu có một nơi mà các tác nhân AI có ý nghĩa, thì đó là ở đây.
Những điều cần theo dõi tiếp theo
Lĩnh vực này đang phát triển nhanh chóng. Hãy theo dõi:
- Khả năng của tác nhân — Claude có thể điều khiển những gì khác?
- Tích hợp công cụ — Apidog sẽ có trình kết nối trực tiếp với Claude chứ?
- Áp dụng trong doanh nghiệp — các nhóm triển khai điều này ở quy mô lớn như thế nào?
- Phản ứng của đối thủ cạnh tranh — ChatGPT, Gemini và các công cụ khác sẽ làm gì?
12 tháng tới sẽ định hình cách các nhà phát triển làm việc với các tác nhân AI.
Điểm mấu chốt
Claude giờ đây có thể sử dụng máy tính của bạn. Đây là một sự thay đổi khả năng cơ bản.
Đối với các nhà phát triển API, điều này có nghĩa là:
- Tự động hóa đang trở nên thông minh hơn — không chỉ là các script theo lịch trình, mà là các tác nhân nhận biết ngữ cảnh
- Tài liệu càng trở nên quan trọng hơn — các tác nhân cần hướng dẫn rõ ràng
- Quy trình làm việc của bạn sẽ thay đổi — ít thực thi hơn, nhiều chỉ đạo hơn
- Các công cụ như Apidog trở nên quan trọng — các thông số kỹ thuật có cấu trúc cho phép kiểm thử bằng tác nhân
Tương lai không phải là AI thay thế các nhà phát triển. Đó là các tác nhân AI xử lý công việc lặp lại để các nhà phát triển tập trung vào kiến trúc, bảo mật và quyết định sản phẩm.
Đây là một tương lai đáng để chuẩn bị.
Bắt đầu ngay hôm nay
Trong khi các tác nhân AI đang phát triển, bạn vẫn cần các công cụ kiểm thử API vững chắc.
Apidog cung cấp cho bạn:
- Thiết kế và tài liệu API trực quan
- Bộ sưu tập kiểm thử tự động
- Cộng tác nhóm
- Tích hợp CI/CD
Khi các tác nhân AI sẵn sàng chạy kiểm thử, thông số kỹ thuật của bạn cũng sẽ sẵn sàng.
Bắt đầu kiểm thử API với Apidog - miễn phí
Câu hỏi thường gặp
Tính năng Claude điều khiển máy tính có dành cho tất cả mọi người không?
Không. Hiện tại chỉ dành cho macOS, trên gói Pro và Max. Đây là bản xem trước nghiên cứu, vì vậy hãy mong đợi những thay đổi.
Claude có thể truy cập bất kỳ ứng dụng nào không?
Claude hỏi quyền trước khi điều khiển ứng dụng. Nó ưu tiên các tích hợp đã kết nối (Slack, Lịch) hơn là điều khiển ứng dụng trực tiếp.
Điều này có an toàn cho việc sử dụng trong doanh nghiệp không?
Bản xem trước nghiên cứu có nghĩa là bạn cần thận trọng. Không cấp quyền truy cập vào hệ thống sản phẩm hoặc dữ liệu nhạy cảm cho tác nhân. Hãy sử dụng các môi trường sandbox.
Điều này có thay thế kỹ sư QA không?
Không. Nó dịch chuyển công việc của họ từ thực thi sang chiến lược. Các kỹ sư QA sẽ thiết kế kế hoạch kiểm thử, xem xét kết quả của tác nhân và định nghĩa tiêu chí chất lượng.
Điều này khác với RPA (Tự động hóa Quy trình bằng Robot) như thế nào?
RPA tuân theo các script cứng nhắc. Claude hiểu các hướng dẫn bằng ngôn ngữ tự nhiên và thích ứng với ngữ cảnh. Nó linh hoạt hơn nhưng cũng ít đoán trước được hơn.
Điều gì sẽ xảy ra nếu Claude mắc lỗi?
Bạn xem xét các hành động trước khi chúng xảy ra. Claude hỏi quyền. Đối với kiểm thử API, hãy sử dụng môi trường phi sản phẩm và xác minh kết quả.
Tôi có thể sử dụng tính năng này để kiểm thử API ngay bây giờ không?
Có, nhưng còn sớm. Bạn sẽ hướng dẫn Claude mở công cụ kiểm thử của bạn và chạy các yêu cầu. Trải nghiệm sẽ được cải thiện khi tính năng này trưởng thành hơn.


Top comments (0)