大奶女 李飞飞空间智能首秀:AI靠单图生成3D天下,可探索,除名基本物理几何法例

发布日期:2024-12-04 12:29    点击次数:191


大奶女 李飞飞空间智能首秀:AI靠单图生成3D天下,可探索,除名基本物理几何法例

就在刚刚大奶女,李飞飞空间智能首个神气顷刻间发布:

仅凭借 1 张图,就能生成一个 3D 游戏天下的 AI 系统!

要点在于,生成的 3D 天下具有交互性。

粗放像玩游戏那样,开脱地移动相机来探索这个 3D 天下,浅景深、希区柯克变焦等操作均可行。

强劲输入一张图:

除了这张图本色,可探索的 3D 天下里,悉数东西皆是 AI 生成的:

这些场景在浏览器中及时渲染,配备了可控的录像机效果和可调遣的模拟景深(DoF)。

你以致不错调动其中物体心计,动态调理布景光影,在场景中插入其他对象。

此外,之前大多数生成模子估量的是像素,而这个 AI 系统径直估量 3D 场景。

是以场景在你移开视野再追念时不会发生变化,况且除名基本的 3D 几何物理法例。

网友们径直炸开锅,磋商区"难以置信"一词径直刷屏。

其中不乏 Shopify 独创东谈主 Tobi Lutke 等着名东谈主士点赞:

还有不少网友合计这径直为 VR 通达了新天下。

官方则暗示"这只是是 3D 原生生成 AI 未来的一个缩影":

咱们正在奋力尽快将这项时间交到用户手中!

李飞飞本东谈主也第一时期共享了这项后果并暗示:

不管奈何表面化这个想法,用语言很难描写通过一张像片或一句话生成的 3D 场景互动的体验,但愿寰球可爱。

现在候补名单恳求已开启,有内容创作家也曾用上了。

保重的涎水不争光地从眼边缘了下来。

Beyond the input image 官方博文暗示,今天,World labs 迈出了通往空间智能的第一步:

发布一个从单张图片生成 3D 天下的 AI 系统。

Beyond the input image, all is generated。

而且是输入任何图片。

而且是粗放互动的 3D 天下——用户不错通过 W/A/S/D 键来截止高下控制视角,或者用鼠标拖动画面来逛这个生成的天下。

官网博文中放了许多个不错试玩的 demo。

此次真是推选寰球皆去试玩一下,上手体验和看视频 or 动图的感受尽头的不通常。

(纵贯车按老例,放在文末)

好,问题来了,这个 AI 系统生成的 3D 天下还有什么值得探究的细节之处?

成人午夜电影

影相机效果

World Labs 暗示,一朝生成,这个 3D 天下就会在浏览器中及时渲染,给东谈主的嗅觉跟在看一个编造录像头似的。

而且,用户粗放精确地截止这个录像头。

所谓"精确截止",有 2 种玩法,

一是粗放模拟景深效果,也等于只可了了对焦距离相机一定距离的物体。

二是能模拟滑动变焦(Dolly Zoom),也等于电影拍摄妙技中尽头经典的希区柯克变焦。

它的特色是"镜头中的主体大小不变,而布景大小调动"。

许多驴友去西藏、新疆玩儿的时候皆但愿用希区柯克变焦拍视频,有很强的视觉冲击力。

在 World Labs 展示中,效果如下(不外在这个玩法里,没办法截止视角):

3D 效果

World Labs 暗示,大多数生成模子估量的皆是像素,与它们不同,咱这个 AI 估量的是 3D 场景。

官方博文陈设了三点克己:

第一,握久施行。

一朝生成一个天下,它就会一直存在。

不会因为你看向别的视角,再看追念,原视角的场景就会调动了。

第二,及时截止。

生成场景后,用户不错通过键盘或鼠标截止,及时在这个 3D 天下畅徬徨动。

你以致不错仔细不雅察一朵花的细节,或者在某个地点阴晦不雅察,用天主视角介意这个天下的一言一动。

第三,除名正确的几何法例。

这个 AI 系统生成的天下,是校服 3D 聚会物理基本法例的。

某些 AI 生成的视频,诚然效果很梦核,但可莫得咱的这种深度的真实感哟(doge)。

官方博文中还写谈,创造一个可视化 3D 场景,最简短的办法是画图深度图。

图中每个像素的心计,皆是由它和录像头的距离来决定的。

天然了,用户不错使用 3D 场景结构来构建互动效果——

单击就能与场景互了,包括但不限于顷刻间给场景打个聚光灯。

动画效果?

那亦然 so easy 啦。

走进绘画天下

团队还玩儿了一把,以"全新的款式"体验一些经典的艺术作品。

全新,不仅在于可互动的交互款式,还在于就靠输入进去的那一张图,就能补全原画里莫得的部分。

然后酿成 3D 天下。

这是梵高的《夜晚露天咖啡座》:

这是爱德华 · 霍普的《夜行者》:

创造性的职责流

团队暗示,3D 天下生成不错尽头天然地和其它 AI 器用相‍结合。

这让创作家们不错用他们也曾用顺遂的器用感受新的职责流体验。

举个栗子:

不错先用文生图模子,从文本天下来到图像天下。

因为不同模子有各自擅长的作风特色,3D 天下不错把这些作风迁移、吸收过来。

在并吞 prompt 下,输入不同作风的文生图模子生成的图片,不错降生不同的 3D 天下:

一个充满活力的卡通作风青少年卧室,床上铺着五彩斑斓的毯子,桌子上芜乱地摆放着电脑,墙上挂着海报,洒落着通顺器材。一把吉他靠在墙上,中间铺着一块自得的斑纹地毯。窗户透进的色泽给房间增添了一点慈爱和芳华的气味。

World Labs 和空间智能

" World Labs "公司,由斯坦福大学教悔、AI 教母李飞飞在本年 4 月创立。

这亦然她被曝出的初次创业。

而她的创业宗旨是一个新见解——空间智能,即:

视觉化为瞻念察;看见成为联接;联接导致举止。

在李飞飞看来,这是"惩处东谈主工智能长途的要道拼图"。

只用了 3 个月时期,公司就冲破了 10 亿好意思元估值,成为新晋独角兽。

公开贵府显现,a16z、NEA 和 Radical Ventures 是领投方,Adobe、AMD、Databricks,以及老黄的英伟达也皆在投资者之列。

个东谈主投资者中也不乏大佬:Karpathy、Jeff Dean、Hinton ……

本年 5 月,李飞飞有一场公开的 15 分钟 TED 演讲。

她游刃多余,共享了关于空间智能的更多想考,要点包括:

视觉才气被合计激发了寒武纪大爆发——一个动物物种无数参加化石记载的时期。源泉是被迫体验,简短让色泽参加的定位,很快变得愈加主动,神经系统运转进化……这些变化催生了智能。

多年来,我一直在说拍照和联接不是一趟事。今天,我想再补充少许:只是看是不够的。看,是为了举止和学习。

若是咱们想让 AI 高出现时才气,咱们不仅想要粗放看到和言语的 AI,咱们还想要粗放举止的 AI。空间智能的最新里程碑是,教缱绻机看到、学习、举止,并学习看到和举止得更好。

跟着空间智能的加快越过,一个新时间在这个良性轮回中正在咱们咫尺伸开。这种轮回正在催化机器东谈主学习,这是任何需要联接和与 3D 天下互动的具身智能系统的要道构成部分。

据报谈,该公司的目的客户包括视频游戏竖立商和电影制片厂。除了互动场景以外,World Labs 还筹备竖立一些对艺术家、瞎想师、竖立东谈主员、电影制作主谈主和工程师等专科东谈主士有效的器用。

如今伴跟着空间智能首个神气的发布,他们要作念的事也缓缓具象化了起来。

但 World Labs 暗示,现在发布的只是一个"早期预览":

咱们正在奋力阅兵咱们生成的天下的边界和传神度,并尝试新的款式让用户与之互动。

参考连结:

[ 1 ] https://www.worldlabs.ai/blog

[ 2 ] https://mp.weixin.qq.com/s/3MWUv3Qs7l-Eg9A9_3SnOA?token=965382502&lang=zh_CN

[ 3 ] https://x.com/theworldlabs/status/1863617989549109328大奶女






Powered by r级书屋狂师 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024

栏目分类

热点资讯

相关资讯