在更接近真实场景的MobileWorld测试集上,MAI-UI-235B-A22B整体成功率41.7%,比其他端到端模型高出20.8个百分点。在需要主动询问用户的任务上成功率37.5%,在需要调用MCP工具的任务上成功率51.1%,分别比之前最好的成绩高出32.1和18.7个百分点。
然而,在这种技术路径下,AI助手可以直接绕过银行、淘宝等App的沙箱隔离机制(原本用于防止应用越权、保护系统安全的设计)直接读取聊天记录、验证码、账户信息等敏感数据。这条看似高效的技术捷径,迅速引发了关于数据授权、隐私保护与系统安全的讨论。 当前,围绕AI手机也出现两条截然不同的技术路线之争:一条是以“豆包手机”为代表的GUI ...
很多大模型在演示里生成UI很漂亮,但落地到真实项目,能不能用还得打个问号。为了搞清楚这些AI生成的界面到底能不能进实际项目,我把目前市面上大家讨论最多的4款工具:Figma、墨刀设计、Pixso、Framer挨个跑了一遍。本文尽量还原真实体验,不夸也 ...