Trải nghiệm thực tế ChatGPT Agent: Trợ lý AI ảo lướt web, tự code... năng lực đến đâu?
By Duy Luân Dễ Thương
Key Concepts
- Chat GPT Agent: Một công cụ mới của Chat GPT, tích hợp sẵn trên nền web, có khả năng thao tác trên máy tính ảo, lướt web, chạy code.
- Máy tính ảo: Một môi trường giả lập trên Chat GPT Agent, cho phép nó mở trình duyệt, chạy dòng lệnh, lưu trữ file.
- Generic Agent: Một agent có thể làm được nhiều tác vụ khác nhau, không chuyên biệt.
- Prom: Câu lệnh hoặc yêu cầu mà người dùng đưa ra cho agent.
- Tự động hóa công việc: Mục tiêu của việc sử dụng AI và agent, giúp tiết kiệm thời gian cho những công việc lặp đi lặp lại.
Đặt vé xem phim tự động
- Mô tả: Agent được yêu cầu đặt vé xem phim Conan tại rạp CGV quận 1 vào thứ bảy tuần này.
- Quá trình:
- Agent thiết lập máy tính để bàn ảo.
- Agent mở trình duyệt Chrome trên máy ảo.
- Agent tìm kiếm trên Google với từ khóa liên quan.
- Agent truy cập các trang web khác nhau để tìm thông tin.
- Agent vào được trang web CGV.
- Agent chọn suất chiếu, rạp phim.
- Agent dừng lại khi gặp yêu cầu capcha và đăng nhập tài khoản.
- Người dùng đăng nhập tài khoản.
- Agent tiếp tục chọn ghế ngồi, combo bắp nước.
- Agent chuyển quyền kiểm soát cho người dùng ở bước thanh toán.
- Nhận xét:
- Agent có thể thao tác trên web, đọc nội dung hình ảnh và văn bản.
- Thời gian thực hiện có thể lâu (6-10 phút).
- Agent dừng lại khi gặp yêu cầu capcha hoặc thông tin cá nhân.
- Ví dụ này minh họa khả năng của agent trong việc tự động hóa các tác vụ phức tạp trên web.
Chỉnh sửa file Excel
- Mô tả: Agent được yêu cầu tách dữ liệu laptop từ một file Excel theo hãng sản xuất và tạo thành các sheet riêng biệt.
- Quá trình:
- Người dùng upload file Excel lên agent.
- Agent chạy script Python để xử lý file.
- Agent tạo các sheet mới cho từng hãng laptop.
- Agent xuất file Excel đã chỉnh sửa.
- Người dùng yêu cầu agent cập nhật lại dữ liệu, phân loại chính xác hơn các hãng như ThinkPad (Lenovo), MSI Titan (MSI).
- Agent thực hiện lại quy trình và tạo file Excel hoàn chỉnh.
- Nhận xét:
- Agent có thể chạy code Python và Node.js.
- Agent có thể tự suy nghĩ logic và viết code.
- Agent có thể chỉnh sửa file theo yêu cầu của người dùng.
- Ví dụ này cho thấy khả năng của agent trong việc xử lý dữ liệu và tự động hóa các tác vụ văn phòng.
Tạo slide từ nội dung web
- Mô tả: Agent được yêu cầu đọc nội dung từ một link và chuyển thành các slide để chia sẻ lên Facebook.
- Quá trình:
- Agent mở link bằng trình duyệt để lấy nội dung.
- Agent cố gắng sử dụng Canva nhưng không thành công.
- Agent chuyển sang sử dụng script Python và Node.js để tự tạo slide.
- Agent tạo slide mở đầu, agenda, nội dung chính.
- Agent tạo hình minh họa cho slide.
- Agent xuất file PowerPoint.
- Agent xuất các slide thành file ảnh riêng lẻ.
- Agent zip các file ảnh lại để người dùng tải về.
- Người dùng yêu cầu agent chỉnh sửa hình ảnh cho giống với một hình mẫu.
- Agent tiếp tục viết code và chỉnh sửa hình ảnh.
- Nhận xét:
- Thời gian thực hiện rất lâu (31 phút).
- Agent có thể tạo slide với hình minh họa.
- Agent có thể xuất file PowerPoint và file ảnh.
- Chất lượng slide chưa hoàn hảo nhưng có thể chỉnh sửa thêm.
- Ví dụ này cho thấy khả năng của agent trong việc tạo nội dung và tự động hóa các tác vụ sáng tạo.
Tổng kết
Chat GPT Agent là một công cụ tiềm năng, có thể tự động hóa nhiều tác vụ khác nhau như đặt vé xem phim, chỉnh sửa file Excel, tạo slide. Agent có thể thao tác trên web, chạy code, xử lý dữ liệu, tạo nội dung. Tuy nhiên, agent vẫn còn một số hạn chế như thời gian thực hiện lâu, chất lượng chưa hoàn hảo, cần có sự can thiệp của người dùng trong một số trường hợp. Việc sử dụng agent hiệu quả phụ thuộc vào công việc cụ thể và cách người dùng đưa ra yêu cầu (prom). Nên xem agent như một người trợ lý, giúp tiết kiệm thời gian cho những công việc lặp đi lặp lại. Chat GPT Agent phục vụ tốt nhất cho những tác vụ liên quan đến web và xử lý dữ liệu.
Chat with this Video
AI-PoweredHi! I can answer questions about this video "Trải nghiệm thực tế ChatGPT Agent: Trợ lý AI ảo lướt web, tự code... năng lực đến đâu?". What would you like to know?