微软研究:API 代理速度更快,但 GUI 代理更灵活
近日,微软的研究团队对 API 代理和 GUI 代理进行了对比研究,发现这两种代理各有特点,可以根据不同需求进行合理选择。API 代理通过可编程接口与软件进行交互,而 GUI 代理则模拟人类的操作方式,通过点击按钮和导航菜单来完成任务。例如,若要安排一个活动,API 代理可能只需一次函数调用,而 GUI 代理则需要打开日历应用,逐步填写相关信息。
在研究中,微软团队评估了这两种代理在九个类别上的表现。其中一个主要差异在于它们与软件的交互方式:API 代理利用函数调用,通常表现得更稳定且出错概率低;而 GUI 代理则依赖于视觉界面内容,虽然效率较低,却具备更高的灵活性。GUI 代理能够控制几乎所有具有可见界面的软件,即使这些软件并不提供 API。
研究还指出,API 代理在安全性和维护上具有优势,因为可以在功能级别限制访问权限,并且受益于版本控制。相比之下,GUI 代理则更加脆弱,稍微的视觉变化就可能导致其无法正常工作。然而,GUI 代理的透明度更高,用户可以清晰地看到每个操作,方便审计。
微软提出了三种结合 API 代理与 GUI 代理的混合系统策略。第一种是通过 API 封装隐藏 GUI 操作,例如将生成财务报告的多步骤过程简化为一个单一的 GenerateReport () 函数。第二种策略是使用编排工具来协调 API 和 GUI 的步骤,适用于数据库查询和信用检查等工作流。第三种策略是低代码和无代码平台,允许非技术用户通过拖放界面构建自动化流程。
在选择合适的代理时,研究团队提供了明确的指导。API 代理适合性能要求高的任务,特别是在与良好文档的接口打交道时,而 GUI 代理则适用于缺乏 API 的旧系统以及移动应用等场景。随着时间的推移,混合系统能够适应新出现的 API,提供更大的灵活性。
划重点:
🌟 API 代理通过函数调用实现快速、稳定的任务完成,适合安全要求高的环境。
🔄 GUI 代理灵活性强,能够应对视觉界面的变化,适合老旧系统和需要视觉确认的任务。
🤝 混合系统结合了两者的优点,能根据具体需求选择最优方案,助力自动化进程。
相关文章
OpenAI和微软正在改写双方数十亿美元的合作条款,这是一项高风险谈判,旨在让OpenAI能够在未来进行IPO,同时保证微软在未来继续获得尖端人工智能模型技术的机会...
2025-05-12 16:47:12 446 A I 资讯
在《The Game Business Show》最新一期节目中,主编兼联合创始人克里斯托弗·德林提到,与他交流过的某些发行商和开发者对Xbox的多平台战略感到“困惑”。在他们看来,这一战略限制了主机领域内的竞争...
2025-05-10 16:11:00 756 周边报道
近日微软在官方博客中宣布了一系列Windows 11和Copilot+ PC的最新测试功能,常用的开始菜单、记事本、文件资源管理器等都包含在内...
2025-05-08 17:56:08 341 周边报道
近日有消息称微软的 Azure 云平台将会托管马斯克的 Grok AI 模型。这一消息引发了业内广泛关注,特别是在 AI 技术日益成为企业和社会各个层面的重要工具的背景下。Grok AI 是一款旨在提供智能辅助...
2025-05-06 03:32:16 491 A I 资讯
《少数幸运儿》、《午夜以南》开发商Compulsion Games CEO Guillaume Provost透漏,微软不会强迫旗下工作室使用生成式AI开发游戏,尽管微软正在大力推动在游戏中应用AI...
2025-05-05 02:27:48 218 周边报道