微软开源创新框架：可将DeepSeek-R1等模型变成AI Agent-易百科

广告 X

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

火星财经消息, 微软在官网发布了视觉 Agent 解析框架 OmniParser 最新版本 V2.0，可将 DeepSeek-R1、GPT-4o、Qwen-2.5VL 等模型，变成可在计算机使用的 AI Agent。与 V1 版本相比，V2 在检测较小的可交互 UI 元素时准确率更高、推理速度更快，延迟降低了 60%。在高分辨率 Agent 基准测试 ScreenSpot Pro 中，V2 GPT-4o 的准确率达到了惊人的 39.6%，而 GPT-4o 原始准确率只有 0.8%，整体提升非常大。除了 V2，微软还开源了 omnitool，这是一个基于 Docker 的 Windows 系统，涵盖屏幕理解、定位、动作规划和执行等功能，也是将大模型变成 Agent 的关键工具。（金十）

声明：易百科所有作品（图文、音视频）均由用户自行上传分享，仅供网友学习交流。若您的权利被侵害，请联系。