7月26日,在世界人工智能大会(WAIC)期间,荣耀正式发布自研多模态感知大模型——MagicGUI大模型。作为荣耀推出的首个GUI开源大模型,MagicGUI以7B(70亿)参数规模,支撑底层 AI 智能体的多模态感知与自动执行规划能力,比肩SOTA模型达到行业领先水平。同时,MagicGUI也是荣耀阿尔法战略不断持续推进的重要里程碑,此次面向全球软硬件开发者正式开源,将持续助力行业构建更繁荣的AI生态,进一步助力AI真正地走进用户生活。
技术创新突破:从感知到执行的AI进化
凭借独创的”继续预训练+强化微调”两阶段训练方案,荣耀MagicGUI大模型在荣耀Magic V5常用场景用机操控中的准确率达到91.5%,较行业同类顶级开源模型提升16.4%。这背后,是荣耀在AI技术方面的创新突破。
荣耀采用全新的 AI 算法方案,创新性引入多样化多模态训练数据,并通过继续预训练与强化微调的两阶段训练方法,解决了现有技术瓶颈。在数据工程方面,荣耀构建了高效的数据采集与构造框架,优化数据配比与筛选方案,形成多样且高质量的训练数据集;训练中引入空间增强的复合奖励函数、DF-GRPO 强化学习算法等创新方法,大幅提升模型数据利用效率与泛化能力,使其在未经训练的新场景中仍能保持稳定性能,实现跨场景适应。
对比评测结果显示MagicGUI 大模型已达到行业领先水平。在行业开源和荣耀内部榜单测试中,移动端的视觉定位能力、页面理解问答能力、单步操作能力、动作序列拆解执行能力4类任务跑分全面领先。
(图:单步操作能力、动作序列拆解执行能力的模型效果对比)
加速AI落地:YOYO一语打车越用越好用
当 AI 进入智能体时代,技术革新已超越简单的信息处理范畴。荣耀Magic V5 作为首款搭载MagicGUI 大模型的折叠屏旗舰,其智能助手 YOYO完成了从单智能体任务执行到多智能体协同的跨越式升级。借助MagicGUI大模型赋予的感知、推理、规划、反思、执行任务的全链路能力,YOYO能够像人类助理般拆解复杂任务、调度跨应用资源、闭环完成操作流程,让“一语打车”等常用场景用机操控成为现实。
以出行场景为例,只需一句话,YOYO便会在用户授权范围内自主调度高德、滴滴等应用,完成打开App、修改地址、选择车型、下发或取消订单,无需手动操作。这种交互体验,让YOYO真正成为用户的“贴身助理”。
基于MagicGUI的多模态感知和自动化执行能力,YOYO还能高效完成常见APP主页搜索、查看订单与购物车等操作。经过训练的 MagicGUI 大模型,在“自动驾驶”时能根据屏幕视觉信息边思考边行动,依据页面反馈精准推理下一步操作,让 YOYO 的操作更智能高效。如果遇到用户指令有误、操作无法完成等突发情况,它还能主动停止,实现自动操作和人工接管的智能切换,保证操作流程顺畅进行。
安全与智能并重是荣耀MagicGUI大模型的亮点之一。上述YOYO 智能体所有“自动驾驶”操作,荣耀均采用了业界公认的隐私保护方法,并且通过 ISO/IEC 27701、ISO/IEC 27001、ePrivacyseal 等多项国际权威隐私安全认证,从技术与合规层面双重保障用户信息安全,让 “放心用 AI” 成为基本前提。
阿尔法战略加速度:技术、标准、安全协作共进
在阿尔法战略指导下,荣耀正以开放包容的生态思维开辟独特路径,将技术共识转化为切实可感的落地实践。不仅是技术创新引领,在标准建设以及安全等领域荣耀也协同共进,推动AI终端生态向更加成熟、规范的方向快速发展。
此次,在WAIC人工智能标准化国际合作论坛上,荣耀作为首批单位将与中国电子技术标准化研究院、阿里、百度等百余家行业企业共同发布《智能体协议共建共享联合倡议》,以进一步推动人工智能技术、标准的国际交流合作以及产业发展。截至今年6月,荣耀也已联合20余家企业推动终端智能化分级指南标准落地,并联合中国信息通信研究院等牵头10余个AI终端的标准立项及起草,为AI终端技术产品应用普及和产业发展提供中国方案。
在AI隐私保护与安全方面,荣耀在积极推动AI安全治理体系的完善。近日,在中国人工智能产业发展联盟第十五次全会上,荣耀携手中国信息通信研究院、阿里、百度等行业领军企事业单位,共同发布了《人工智能安全承诺》实践披露成果。联盟围绕风险管理、模型安全、数据安全等6大核心内容,提炼了20项关键安全标签,公开了43项企业典型实践,致力于推进我国人工智能安全治理迈入体系化、透明化、实操化新阶段,为全球贡献“以人为本、智能向善”的中国方案。荣耀MagicGUI大模型此次开源,正是践行该理念的典范。
今年以来,AI创新正进入应用落地的重要机遇期。近日,在中国互联网协会组织召开的第24届中国互联网大会上,荣耀与行业伙伴共同发起“智能体创新推进计划”,联合产业力量,围绕技术攻关、应用拓展、生态建设等方向,凝聚行业力量,推动智能体技术突破与产业化落地进程。
荣耀以开放共建AI终端生态蓝图
在AI生态系统的参天巨树中,荣耀坚持做“树干”——向下整合芯片、算法、数据等“根系”资源,向上支撑场景、服务、交互等“枝叶”生长,通过双向价值循环的枢纽地位,将技术要素转化为可感知的用户体验。同样MagicGUI 大模型并非封闭的技术孤岛:荣耀将模型的技术报告、参数配置、评估数据等核心要素向公众开放,旨在打破 AI 技术壁垒,推动行业内的技术共享与创新加速。
对于全球 AI 产业而言,MagicGUI 大模型的价值不仅在于降低了技术研发的门槛——全球开发者可基于开源资源快速构建差异化应用,更在于它为行业提供了一个开放的创新基座,推动 AI 技术从“同质化竞争”转向“多样化突破”,最终满足千行百业对 AI 服务的个性化需求。
这种开放合作的理念,在 MagicGUI 大模型的研发过程中也得到充分体现。自 2023 年起,荣耀便与复旦大学共建自然语言处理大模型校企联合实验室,在自然语言理解、多模态大模型、Agent等前沿领域展开深度合作。MagicGUI 大模型正是双方共同探索的成果——通过联合设计数据生成框架、优化训练方案、创新强化学习算法,最终实现了终端场景下业界领先的 “理解 – 规划 – 操作” 一体化能力,“一语打车”等特性也得以在荣耀 Magic V5 上快速落地。
这正契合荣耀对 AI 未来的判断:AI 的发展不依赖单点突破,而在于生态协同。基于这一理念,荣耀将持续通过开源合作、产学研联动,与全球开发者共同打造更智能、更开放的终端体验,让技术创新真正惠及每一位用户。这种开放创新的产业范式,也将为 AI 技术的可持续发展注入持久动力。
荣耀MagicOS副总裁孙建发表示:“我们始终坚持“以人为中心”,将科技与人文相结合,加速推动AI融入每一位用户的生活。MagicGUI不仅是技术成果的分享,更是我们推动AI终端生态的责任。目前荣耀MagicGUI大模型报告已登陆GitHub平台,模型与相关测试数据将于近期上线相关开源平台。荣耀期待与各界伙伴携手,加速AI终端生态的普惠化进程。”