美图自研AI视觉大模型3.0发布，助力电商广告游戏动漫影视五大行业

2023年10月9日 90,246次阅读

10月9日，美图公司举办15周年生日会并发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本。面世100天后，美图AI视觉大模型MiracleVision3.0将全面应用于美图旗下影像与设计产品，并将助力电商、广告、游戏、动漫、影视五大行业。

在美图公司15周年生日会现场，美图公司创始人、董事长兼首席执行官吴欣鸿发布了自研AI视觉大模型MiracleVision3.0版本。

吴欣鸿介绍说，三个月前，MiracleVision绘画水平还停留在初级阶段，如今3.0版本已经能描绘出真实细腻的画面细节，目前用户可以访问AI视觉创作工具“WHEE”官网体验。

吴欣鸿将自己15岁的绘画作品与面世100天的美图视觉大模型生成作品进行对比，他认为训练AI与人类学画有很多共通之处，通过充分学习不同的绘画风格和技巧，AI能创作出具有独特性的原创作品。

美图公司将自研AI视觉大模型MiracleVision(奇想智能)的核心能力拆解为“奇思妙想”和“智能创作”两大特性。

在“奇思妙想”层面，MiracleVision通过“提示词智能联想”功能降低大众的使用门槛，当用户输入关键词，MiracleVision可自动补充相关表述，如光影效果、质感、风格、图片质量等，推动创作平权。此外，MiracleVision通过“提示词精准控制”功能来满足更加专业的设计要求，如使用“近景”、“远景”、“顺光”、“逆光”等描述控制最终生成效果。

在“智能创作”层面，MiracleVision通过“深化创作”功能，可以进一步丰富作品细节和提升表现力。通过“AI画面扩展”功能让作品尺寸更大、细节更丰富。通过“局部修改”功能，对部分画面进行精准修改与调整。通过“分辨率提升”功能生成高清大图，让细节表现、色彩展示、物体辨识更加的精准和生动。

在吴欣鸿看来，AI视觉大模型带来的不仅仅是更好的视觉呈现，还有对工作流的效率提升，但目前大模型与工作流的结合仍在探索阶段，抓住应用场景的核心需求更为重要。

吴欣鸿介绍说，MiracleVision将落地电商、广告、游戏、动漫、影视五大行业，希望能帮助五大行业“工作流提效”。

在电商行业，从涂鸦生成线稿、线稿上色、商品图、模特试穿图，再到电商物料输出，全程可通过MiracleVision实现。

在广告行业，MiracleVision覆盖创意脑暴、创意深化、平面排版、多尺寸延展、线下投放预览的全工作流，助力客户在广告物料制作环节提效。

在游戏行业，MiracleVision可以包揽场景设计、角色设计、道具设计、UI图标、宣发物料等流程，拓宽设计师想象空间的同时助力游戏行业降本。

在动漫行业，MiracleVision打通了概念设计、故事板生成、线稿上色、动漫补帧、视频转动漫等流程，支持创意到物料成品的快速落地。

在影视行业，MiracleVision的高可控性可充分满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求，极大提升影视行业设计环节的效率。

吴欣鸿表示，MiracleVision将充分发挥奇思妙想、智能创作的能力，在上述五大行业深耕，持续助力更多的设计场景。

活动现场，吴欣鸿还分享了对于AI视觉大模型的思考。“AI视觉大模型的本质，是无穷无尽的视觉创意库。应用层相当于内容提取器，根据用户的需求，从这个巨大的创意库中提取所需要的内容，让用户在特定场景中使用。AI视觉大模型和应用之间相辅相成，大模型为应用提供技术支撑，应用反哺大模型的效果迭代。”

吴欣鸿表示，目前AI视觉大模型在生产端的三个待解决的问题是：垂直领域的极致效果、工作流整合、变现能力。随着AI视觉大模型和生产端的磨合，这三个问题会被逐步解决。

在吴欣鸿看来，视觉大模型应用普及将经历三个阶段：2024年之前为探索期，2024-2025年为高速发展期，2026-2030年为成熟期，随着视觉大模型在生产端的应用走向成熟，视觉大模型将助力千万设计场景，引领美学的升级与社会经济增长。

此外，美图公司还公布了6月19日发布的影像生产力工具最新数据：AI视觉创作工具“WHEE”的优质AI效果生成数已超过550万张，打造的设计师生态也初见成效；AI口播视频工具“开拍”月活跃用户数已突破35万；桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者；主打AI商业设计的“美图设计室”正助力近百万中小电商卖家降本增效；美图AI助手“RoboNeo”每天帮助近万名用户自动修图，比传统修图效率提升35%；AI数字人生成工具“DreamAvatar”于8月底上线并主打“AI演员”数字人服务。