# why # what - OpenAI在 2025 年 1月 24 日发布的第一个真正的[[AI agent]],能够操作电脑网页的任务代理。 - 线上订餐、订票、购物等 # how - Powering Operator 是 Computer-Using Agent ([[CUA]]),该模型通过[[RL 强化学习]]将 [[GPT-4o]] 的视觉能力与高级推理相结合。 - CUA 经过训练,可以像人类一样与图形用户界面 (GUI) 交互,即人们在屏幕上看到的按钮、菜单和文本字段。这使它能够灵活地执行数字任务,而无需使用特定于操作系统或 Web 的 API。 # how good # Ref. https://readwise.io/reader/shared/01jjb2091v23ej4mkw6k6tpbrm https://readwise.io/reader/shared/01jjb1kpt67f14jqtr0wrjwxma https://readwise.io/reader/shared/01jjb1jaekf0gtmk3egshfe6dm