你的第一台空间计算机!苹果 or Rokid?

苹果在今年6月发布了它的空间计算产品,近日来自中国杭州的创业公司Rokid发布了消费级OST(Optical See Through)个人空间计算平台Rokid AR Studio。至此苹果Vision Pro与Rokid AR Studio引领的安卓AR开放生态均开始发力,你的第一台空间计算机就要来了!

是头盔形态的VST 还是眼镜形态的OST?是开放生态还是封闭生态?国际巨头还是中国新兴的创新力量?苹果与Rokid站在了同一起跑线上。

《你的第一台空间计算机!苹果 or Rokid?》

事实上,自2021年来,消费级AR眼镜新品频出,轻薄型AR眼镜成为行业进化无可争议的方向。而如何在现有的轻薄眼镜形态下,从入门级的AR跨入大众期待的科幻片级别的AR,成为横亘在AR进化路上的一把达摩克利斯之剑。

九年磨一剑,Rokid交出了漂亮的答卷。采用分体式设计,让鼻梁上的AR眼镜只多1克,甚至比同行的消费级眼镜还轻,但交互和显示是全方位的跨域,进入AR空间计算时代。

Rokid创始人、CEO祝铭明在发布会上表示:“我们希望带给用户体验更极致、更轻便的空间计算产品,让空间计算能更自然地融入日常生活和工作,让Rokid AR Studio成为你的第一台空间计算机。”

《你的第一台空间计算机!苹果 or Rokid?》

把信息“吸”过来又“丢”出去?

人和信息的对话不再需要介质

大拇指和食指轻轻一碰,空间交互的大门即被打开。里面有个人在互联网世界游走多年熟悉也不愿轻易改变的一切:微信、b站、浏览器等。只是它们显示的界面从方寸固定的电脑和手机屏幕变成了无所不在的空间。

每一寸空间都可以成为显示屏幕,你可以同时并列打开4-5个浏览窗口,每一个都是大屏。还可以把其中一个屏幕设置成巨屏模式。想象一下,你的电脑桌面变成了影院里的巨幕,这是何等的办公体验?

在兼容过去生态的过程中,Rokid也赋予了产品全新的交互体验。比如,在传统搜索场景下,原本的信息展示都是瀑布流布局,手指和鼠标不断往下滑,信息会不断刷新,选择其中一个点击,打开一个新窗口。而在Rokid 的空间搜索模式中,当你选择文本或者语音输入一句话,所有相关的信息会“飞”入眼帘,立体排列的各种信息扑面而来,点开其中一个链接,其他信息会根据你的兴趣智能化重新排布。

它打破了信息传递的方式:人和信息的交互,不再需要实体屏幕,人和信息可以直接“沟通”。

这是信息搜索的一种前所未有的体验。从浏览器信息的搜索到短视频流的数据推荐机制,都将因为AI+AR的融入而酝酿新的变革。

此外,这个空间里也有大众期待已久的全新生态体验:篮球和篮框都漂浮在空中,你可以用手掌把篮球“吸”过来,然后把它“丢”到篮框里;大拇指和食指再轻轻一碰,你的办公室可以秒变游戏场,空中弥漫着怪兽,你前进后退,合并双指不断点击。点击得有多快,极限走位有多灵活,就决定了你得分能有多高。你还能闭上眼睛,根据声音的方位判断怪兽在哪个位置。

Rokid小心翼翼地烹饪着空间计算这道小鲜,调和着新旧的生态比例,让用户能有新奇感又不至于有完全的陌生感,没有一丝设计是多余的。

这个空间套装名叫Rokid AR Studio。延续Rokid分体式设计思路,由AR空间计算眼镜Rokid Max Pro和AR空间计算主机 Rokid Station Pro组成。

1克的变化

承载一个时代的跨越

《你的第一台空间计算机!苹果 or Rokid?》

难以想象,这所有的变化,只是让用户戴在鼻梁上的眼镜重了1克。这1克的变化也意味着,AR眼镜可以做到大众所期待的轻薄、可穿戴形态,但是具备酷炫的3D交互和全新的应用。也意味着,AR行业的进化,不再是以眼镜进化为唯一标准,而是进入软件系统和生态建设的第二阶段。

2021年,Rokid在AR行业率先提出了分体设计。打造了AR行业首款主机Station,引入云计算为AR开辟道路,让显示与计算分离。在重量、算力和续航矛盾之间找到了软解法。这个分体设计在这一次的空间计算套装上发挥到了极致:

眼镜承担感知和显示功能,算力搭载在独立的主机上。为了让Station Pro足够强大,Rokid为其选用了一颗高通的专用芯片XR2+ Gen 1。相较于骁龙XR2平台,可以带来30%的散热性能提升和50%的持续性能提升。

Station Pro脱离了手机的制擘,通过定制化的主动散热与性能均衡机制设计,可以持久保持高频高性能输出、高速计算的同时,给用户带来90Hz刷新率下极致低延迟的AR体验;得益于定制化的大容量电池,续航能力是手机型AR主机方案的2倍以上。可以担负起丝滑的双手空间实时交互体验,也可以承载应运而生的空间计算生态。

而要支撑起这一整套空间交互的背后,是其操作系统。好的操作系统一定是软硬件高度配合和协同。为了实现最好的AR体验,Rokid产品一直都是跑在自研的操作系统YodaOS-Master上,并在每个细节都进行重新定义和深度调优。

空间计算有两个核心算法:SLAM和裸手手势。一个用来精准感知物理空间,一个用来和虚拟内容交互。通过优化算法和XR2+的硬件加速,Rokid基于单目摄像头的空间定位和交互体验达到了业界领先水平。

上接用户,下接硬件,中间还要桥接开发者,Rokid操作系统为开发者构建空间内容提供了丰富的开发套件。开发者可以基于手势做出丰富多彩的互动应用。

AR进入软件系统和生态建设第二阶段

Rokid 9年磨一剑成为名副其实的AR领航员

对于VST方向的硬件来说,400克以上的自重,还没有很卷;但对于OST方向的硬件来说,眼镜只有几十克,每增加1克,可能都要做平衡考虑;而每减少1克,都是一个技术攻坚了。

AR眼镜每一克的变化,都蕴含了无限的功力。

2013年,谷歌推出了世界上第一款AR眼镜。Rokid CEO 祝铭明第一次戴上谷歌眼镜时在朋友圈记录下了他的两个感受:1、非常棒的创新;2、我们可以做得更好。也正是这时候萌生了离开阿里创业的想法。

他万万没想到,这个启蒙他的科技巨头,在10年后成了盟友,Rokid Station搭载谷歌安卓电视生态,一起赋能全球AR生态;更令他没想到的是,他从小当成偶像的乔布斯的苹果公司,也在10年后经过严苛的审核流程,将Rokid Max陈列在了专卖店中,成为内地第一个进驻苹果专卖店的AR眼镜。

今天,Misa用1克来诠释了他的创新,十年的AI和人工智能技术的积淀也发挥得如火纯青。

在产品和技术路线选择上,坚持用更少的摄像头结合大量的AI技术来实现AR的空间计算能力。我们知道摄像头在将世界三维信息投影在二维的CMOS上,会损失一个维度的深度信息,为了还原真实的深度信息,Rokid死磕技术难题。为了解决业界单摄像头3D手势识别精度不够高的问题,Rokid采集和标注了数百万手势样本训练数据集,经过大量的AI训练,充分发挥XR2+的硬件加速能力,最后达到了厘米级的识别精度、厘米级虚实手贴合精度和10ms极低单帧跟踪耗时体验。

2013年,AR还并不成熟,Misa选择更容易被产品化的AI能力入手,推出陪伴型AI智能音箱产品;并在2018年找准时机,用AI+AR的组合拳切入了AR眼镜产品。

自此以后,从测温、工业、制造、汽车到文博文旅、消费级,路越走越宽,产品形态也越来越多样化;从中国到全球,Rokid不断在每个国家插上旗帜。

从语音交互、图形计算,AI的基因一直融入在Rokid的技术命脉中,但鲜为外人道。因为对于Misa来说,无论是AI还是AR,科技都是被人文主义“关”起来的。科技的创新是为了帮助人们更好地体验和享受科技:在博物馆为100多万人讲述“活着”的历史;在边远山区和海岛为10余万当地人提供急救医疗辅助……

在看不见的地方,Rokid已引领行业深深扎根。