Sebastian Petrus

Posted on Mar 24 • Originally published at apidog.com

Claude Giờ Đây Có Thể Sử Dụng Máy Tính Của Bạn: Ý Nghĩa Cho Kiểm Thử API

Claude vừa công bố một điều khiến các nhà phát triển phải dừng cuộn trang: Claude giờ đây có thể điều khiển máy tính của bạn.

Hãy dùng thử Apidog ngay hôm nay

Không phải thông qua API. Không phải thông qua các tích hợp. Mà là trực tiếp. Nó mở ứng dụng, duyệt trình duyệt, nhấp vào nút, điền vào bảng tính — bất cứ điều gì bạn làm khi ngồi trước máy tính.

Đây không phải là bản demo. Hiện tại, tính năng này đã có sẵn trong Claude Cowork và Claude Code dành cho người dùng macOS trên gói Pro và Max. Thông báo này đã đạt 23 triệu lượt xem trong 8 giờ. Mọi người đang rất quan tâm.

Nhưng đây là điều quan trọng đối với các nhà phát triển: điều này thay đổi cách chúng ta nghĩ về tự động hóa. Bao gồm cả kiểm thử API.

Claude sử dụng máy tính thực sự làm gì

Hãy làm rõ những gì đang diễn ra ở đây.

Claude không chỉ tạo văn bản nữa. Nó có thể:

Mở ứng dụng trên màn hình của bạn
Điều hướng trình duyệt và tương tác với các trang web
Điền vào biểu mẫu và bảng tính
Nhấp nút, cuộn, gõ phím — toàn bộ các tương tác GUI
Làm việc khi bạn vắng mặt — giao việc từ điện thoại di động, quay lại khi công việc đã hoàn thành

Điểm mấu chốt: Claude ưu tiên sử dụng các tích hợp đã kết nối của bạn trước (Slack, Lịch, v.v.). Khi không có trình kết nối cho công cụ bạn cần, nó sẽ hỏi quyền để mở ứng dụng trực tiếp trên màn hình của bạn.

Đây là một sự thay đổi cơ bản. Chúng ta đang chuyển từ “AI phản hồi” sang “AI hành động.”

Tại sao điều này quan trọng đối với các nhà phát triển API

Bạn có thể đang nghĩ: “Tuyệt vời, nhưng tôi là một nhà phát triển API. Điều này liên quan gì đến tôi?”

Vấn đề là: kiểm thử API sắp thay đổi.

Hiện tại, kiểm thử API trông như thế này:

Viết script kiểm thử
Thiết lập môi trường
Chạy các bộ sưu tập
Phân tích kết quả
Gỡ lỗi các lỗi
Ghi lại các phát hiện

Nó là thủ công. Nó lặp đi lặp lại. Nó yêu cầu chuyển đổi ngữ cảnh giữa các công cụ.

Bây giờ hãy hình dung quy trình làm việc này thay vào đó:

“Claude, kiểm thử điểm cuối API thanh toán. Hãy thử theo kịch bản thành công, sau đó kiểm thử các trường hợp biên cho thẻ không hợp lệ, token hết hạn và lỗi mạng. Ghi lại mọi lỗi vào trình theo dõi lỗi.”

Claude mở công cụ kiểm thử API của bạn, chạy các yêu cầu, phân tích phản hồi, xác định các bất thường và ghi lại các vấn đề. Bạn xem lại bản tóm tắt.

Đó là hướng mà chúng ta đang đi tới.

Quy trình kiểm thử với tác nhân AI

Hãy cùng phác thảo kiểm thử được hỗ trợ bởi AI có thể trông như thế nào:

Quy trình làm việc hiện tại

Developer → Write tests → Run manually → Check results → Debug → Document

Quy trình làm việc với tác nhân AI

Developer → Assign task → Agent runs tests → Agent analyzes → Agent documents → Developer reviews

Tác nhân xử lý các bước lặp lại ở giữa. Bạn tập trung vào:

Xác định những gì cần kiểm thử
Xem xét các trường hợp biên
Đưa ra các quyết định kiến trúc

Các khối xây dựng đã tồn tại:

Apidog lưu trữ các thông số kỹ thuật API và các trường hợp kiểm thử của bạn
Các pipeline CI/CD chạy kiểm thử tự động
Claude giờ đây có thể điều phối các công cụ trên máy tính của bạn

Khoảng cách đang được thu hẹp.

Những gì nhà phát triển nên chuẩn bị

Nếu bạn đang xây dựng hoặc kiểm thử API, đây là những điều cần bắt đầu suy nghĩ:

1. Ghi lại quy trình làm việc kiểm thử của bạn

Các tác nhân AI cần hướng dẫn rõ ràng. Quy trình kiểm thử của bạn càng được ghi lại tốt thì việc ủy quyền càng dễ dàng.

Ghi lại:

Cách bạn kiểm thử từng điểm cuối
Những trường hợp biên nào bạn kiểm tra
Cách bạn xử lý các lỗi
Nơi bạn ghi nhận lỗi

2. Giúp công cụ của bạn dễ tiếp cận

Claude hoạt động tốt nhất với các ứng dụng mà nó có thể mở và điều khiển. Đảm bảo các công cụ kiểm thử của bạn:

Có giao diện người dùng rõ ràng (ngay cả khi bạn thường sử dụng CLI)
Có thể được khởi chạy theo chương trình
Xuất kết quả dưới định dạng dễ đọc

3. Xác định tiêu chí thành công

Khi bạn yêu cầu một tác nhân AI “kiểm thử API”, thành công trông như thế nào?

Tất cả các kiểm thử đều vượt qua?
Thời gian phản hồi dưới 200ms?
Không có lỗi 5xx?
Xác thực dữ liệu thành công?

Các tiêu chí rõ ràng giúp kiểm thử bằng tác nhân đáng tin cậy.

4. Chuẩn bị cho mô hình cấp quyền

Claude hỏi quyền trước khi kiểm soát. Hãy làm quen với:

Xem xét những gì tác nhân muốn làm
Hiểu phạm vi truy cập
Đặt ra giới hạn cho các hoạt động nhạy cảm

Đây cũng là một thực hành bảo mật tốt.

Cuộc đối thoại bảo mật chúng ta cần có

Hãy nói về vấn đề hiển nhiên nhưng thường bị bỏ qua.

Trao quyền kiểm soát máy tính của bạn cho AI đặt ra những câu hỏi bảo mật:

Nó có thể truy cập những gì?
Dữ liệu đi về đâu?
Làm thế nào để bạn kiểm toán các hành động của nó?
Điều gì sẽ xảy ra nếu nó mắc lỗi?

Anthropic đã tích hợp các biện pháp bảo vệ:

Lời nhắc cấp quyền trước khi điều khiển ứng dụng
Tích hợp đã kết nối được ưu tiên hơn điều khiển trực tiếp
Chỉ dành cho MacOS hiện tại (môi trường được kiểm soát tốt hơn)
Bản xem trước nghiên cứu — họ cũng đang học hỏi

Đối với kiểm thử API:

Không cấp quyền truy cập API sản phẩm cho tác nhân
Sử dụng môi trường sandbox
Xem lại nhật ký các hành động đã thực hiện
Bắt đầu với các hoạt động rủi ro thấp

Đây là lãnh địa mới. Hãy xử lý nó phù hợp.

Apidog phù hợp như thế nào trong tương lai này

Đây là nơi các công cụ như Apidog trở nên quan trọng.

Khi một tác nhân AI cần kiểm thử API, nó cần:

Thông số kỹ thuật API (OpenAPI/Swagger)
Bộ sưu tập kiểm thử với các yêu cầu đã định nghĩa
Cấu hình môi trường (staging, production)
Quy tắc xác thực phản hồi
Tài liệu rõ ràng về hành vi mong đợi

Apidog cung cấp tất cả những điều này dưới một định dạng có cấu trúc, dễ truy cập.

Tác nhân không cần đoán những điểm cuối nào tồn tại hay thông số nào hợp lệ. Nó đọc thông số kỹ thuật, thực thi các kiểm thử, xác thực phản hồi dựa trên schema.

Đây là loại môi trường có cấu trúc nơi tác nhân AI phát huy tối đa khả năng.

Bắt đầu kiểm thử API với Apidog - miễn phí

Điều này có ý nghĩa gì đối với công việc của bạn

Cùng nhìn thẳng vào tác động đến sự nghiệp.

Các tác nhân AI sẽ không thay thế các nhà phát triển API. Nhưng chúng sẽ thay đổi công việc.

Đây là những gì thay đổi:

Trách nhiệm hiện tại	Trạng thái tương lai
Viết script kiểm thử	Thiết kế chiến lược kiểm thử
Chạy các bộ kiểm thử	Xem xét kết quả của tác nhân
Gỡ lỗi các lỗi	Xác định tiêu chí thất bại
Tạo tài liệu API	Quản lý tài liệu của tác nhân

Những phần tẻ nhạt được tự động hóa. Những phần tư duy vẫn do con người đảm nhiệm.

Giá trị của bạn chuyển từ “thực hiện kiểm thử” sang “biết kiểm thử gì và tại sao.”

Đó là một sự nâng cấp: nhiều chiến lược hơn, ít lặp lại hơn.

Khi nào nên bắt đầu thử nghiệm

Đây là bản xem trước nghiên cứu. Vẫn còn sớm. Nhưng đây là lúc các nhà phát triển thông minh bắt đầu thử nghiệm.

Cách để bắt đầu làm quen:

Tuần 1: Thử sử dụng Claude điều khiển máy tính

Cập nhật ứng dụng Claude trên máy tính của bạn
Ghép nối với điện thoại di động
Giao cho nó những nhiệm vụ đơn giản: “Mở lịch của tôi và tìm các cuộc họp ngày mai”
Làm quen với các lời nhắc cấp quyền

Tuần 2: Áp dụng vào quy trình làm việc của bạn

Thử: “Mở tài liệu API của tôi và tóm tắt luồng xác thực”
Sau đó: “Chạy qua các điểm cuối đăng ký người dùng và ghi chú bất kỳ trường nào bị thiếu”
Xem điều gì hoạt động, điều gì bị lỗi

Tuần 3: Suy nghĩ về kiểm thử

Ghi lại một quy trình kiểm thử API từng bước
Cân nhắc những gì một tác nhân sẽ cần để thực hiện nó
Xác định những lỗ hổng trong tài liệu của bạn

Tuần 4: Đánh giá công cụ

Công cụ kiểm thử API của bạn có hỗ trợ tự động hóa không?
Thông số kỹ thuật của bạn có được cập nhật không?
Điều gì cần thay đổi cho việc kiểm thử do tác nhân điều khiển?

Bức tranh tổng thể

Việc Claude sử dụng máy tính không chỉ dừng lại ở sự tiện lợi. Đó là một phần của sự thay đổi rộng lớn hơn.

Chúng ta đang hướng tới các tác nhân AI như đồng nghiệp:

Không phải chatbot phản hồi
Không phải script chạy theo lịch trình
Các tác nhân hiểu ngữ cảnh, hành động và báo cáo lại

Các công ty làm việc được với các tác nhân AI sẽ có lợi thế về năng suất. Những công ty không làm được sẽ dành nhiều thời gian hơn cho công việc thủ công.

Kiểm thử API là một trường hợp sử dụng hoàn hảo:

Nhiệm vụ được định nghĩa rõ ràng
Tiêu chí thành công rõ ràng
Thực thi lặp lại
Đầu ra có cấu trúc

Nếu có một nơi mà các tác nhân AI có ý nghĩa, thì đó là ở đây.

Những điều cần theo dõi tiếp theo

Lĩnh vực này đang phát triển nhanh chóng. Hãy theo dõi:

Khả năng của tác nhân — Claude có thể điều khiển những gì khác?
Tích hợp công cụ — Apidog sẽ có trình kết nối trực tiếp với Claude chứ?
Áp dụng trong doanh nghiệp — các nhóm triển khai điều này ở quy mô lớn như thế nào?
Phản ứng của đối thủ cạnh tranh — ChatGPT, Gemini và các công cụ khác sẽ làm gì?

12 tháng tới sẽ định hình cách các nhà phát triển làm việc với các tác nhân AI.

Điểm mấu chốt

Claude giờ đây có thể sử dụng máy tính của bạn. Đây là một sự thay đổi khả năng cơ bản.

Đối với các nhà phát triển API, điều này có nghĩa là:

Tự động hóa đang trở nên thông minh hơn — không chỉ là các script theo lịch trình, mà là các tác nhân nhận biết ngữ cảnh
Tài liệu càng trở nên quan trọng hơn — các tác nhân cần hướng dẫn rõ ràng
Quy trình làm việc của bạn sẽ thay đổi — ít thực thi hơn, nhiều chỉ đạo hơn
Các công cụ như Apidog trở nên quan trọng — các thông số kỹ thuật có cấu trúc cho phép kiểm thử bằng tác nhân

Tương lai không phải là AI thay thế các nhà phát triển. Đó là các tác nhân AI xử lý công việc lặp lại để các nhà phát triển tập trung vào kiến trúc, bảo mật và quyết định sản phẩm.

Đây là một tương lai đáng để chuẩn bị.

Bắt đầu ngay hôm nay

Trong khi các tác nhân AI đang phát triển, bạn vẫn cần các công cụ kiểm thử API vững chắc.

Apidog cung cấp cho bạn:

Thiết kế và tài liệu API trực quan
Bộ sưu tập kiểm thử tự động
Cộng tác nhóm
Tích hợp CI/CD

Khi các tác nhân AI sẵn sàng chạy kiểm thử, thông số kỹ thuật của bạn cũng sẽ sẵn sàng.

Bắt đầu kiểm thử API với Apidog - miễn phí

Câu hỏi thường gặp

Tính năng Claude điều khiển máy tính có dành cho tất cả mọi người không?

Không. Hiện tại chỉ dành cho macOS, trên gói Pro và Max. Đây là bản xem trước nghiên cứu, vì vậy hãy mong đợi những thay đổi.

Claude có thể truy cập bất kỳ ứng dụng nào không?

Claude hỏi quyền trước khi điều khiển ứng dụng. Nó ưu tiên các tích hợp đã kết nối (Slack, Lịch) hơn là điều khiển ứng dụng trực tiếp.

Điều này có an toàn cho việc sử dụng trong doanh nghiệp không?

Bản xem trước nghiên cứu có nghĩa là bạn cần thận trọng. Không cấp quyền truy cập vào hệ thống sản phẩm hoặc dữ liệu nhạy cảm cho tác nhân. Hãy sử dụng các môi trường sandbox.

Điều này có thay thế kỹ sư QA không?

Không. Nó dịch chuyển công việc của họ từ thực thi sang chiến lược. Các kỹ sư QA sẽ thiết kế kế hoạch kiểm thử, xem xét kết quả của tác nhân và định nghĩa tiêu chí chất lượng.

Điều này khác với RPA (Tự động hóa Quy trình bằng Robot) như thế nào?

RPA tuân theo các script cứng nhắc. Claude hiểu các hướng dẫn bằng ngôn ngữ tự nhiên và thích ứng với ngữ cảnh. Nó linh hoạt hơn nhưng cũng ít đoán trước được hơn.

Điều gì sẽ xảy ra nếu Claude mắc lỗi?

Bạn xem xét các hành động trước khi chúng xảy ra. Claude hỏi quyền. Đối với kiểm thử API, hãy sử dụng môi trường phi sản phẩm và xác minh kết quả.

Tôi có thể sử dụng tính năng này để kiểm thử API ngay bây giờ không?

Có, nhưng còn sớm. Bạn sẽ hướng dẫn Claude mở công cụ kiểm thử của bạn và chạy các yêu cầu. Trải nghiệm sẽ được cải thiện khi tính năng này trưởng thành hơn.

DEV Community

Claude Giờ Đây Có Thể Sử Dụng Máy Tính Của Bạn: Ý Nghĩa Cho Kiểm Thử API

Claude sử dụng máy tính thực sự làm gì

Tại sao điều này quan trọng đối với các nhà phát triển API

Quy trình kiểm thử với tác nhân AI

Quy trình làm việc hiện tại

Quy trình làm việc với tác nhân AI

Những gì nhà phát triển nên chuẩn bị

1. Ghi lại quy trình làm việc kiểm thử của bạn

2. Giúp công cụ của bạn dễ tiếp cận

3. Xác định tiêu chí thành công

4. Chuẩn bị cho mô hình cấp quyền

Cuộc đối thoại bảo mật chúng ta cần có

Apidog phù hợp như thế nào trong tương lai này

Điều này có ý nghĩa gì đối với công việc của bạn

Khi nào nên bắt đầu thử nghiệm

Tuần 1: Thử sử dụng Claude điều khiển máy tính

Tuần 2: Áp dụng vào quy trình làm việc của bạn

Tuần 3: Suy nghĩ về kiểm thử

Tuần 4: Đánh giá công cụ

Bức tranh tổng thể

Những điều cần theo dõi tiếp theo

Điểm mấu chốt

Bắt đầu ngay hôm nay

Câu hỏi thường gặp

Top comments (0)