# why
# what
- OpenAI在 2025 年 1月 24 日发布的第一个真正的[[AI agent]],能够操作电脑网页的任务代理。
- 线上订餐、订票、购物等
# how
- Powering Operator 是 Computer-Using Agent ([[CUA]]),该模型通过[[RL 强化学习]]将 [[GPT-4o]] 的视觉能力与高级推理相结合。
- CUA 经过训练,可以像人类一样与图形用户界面 (GUI) 交互,即人们在屏幕上看到的按钮、菜单和文本字段。这使它能够灵活地执行数字任务,而无需使用特定于操作系统或 Web 的 API。
# how good
# Ref.
https://readwise.io/reader/shared/01jjb2091v23ej4mkw6k6tpbrm
https://readwise.io/reader/shared/01jjb1kpt67f14jqtr0wrjwxma
https://readwise.io/reader/shared/01jjb1jaekf0gtmk3egshfe6dm