Trong nhiều năm qua, các CEO Big Tech đã nuôi dưỡng tầm nhìn về những tác nhân AI có khả năng tự động sử dụng phần mềm để hoàn thành công việc thay con người. Thế nhưng, nếu thử trải nghiệm các tác nhân AI hiện tại, từ ChatGPT Agent của OpenAI đến Comet của Perplexity, dễ dàng nhận thấy công nghệ này vẫn còn nhiều hạn chế. Để cải thiện sức mạnh của tác nhân AI, giới công nghệ cho rằng cần đến những kỹ thuật mới, trong đó nổi bật là việc mô phỏng không gian làm việc hay còn gọi là môi trường học tăng cường (Reinforcement Learning – RL).