| 
![]() GPT Image 2 的发布给系数 AI 圈带来了亿点点涟漪。
但好多东谈主可能没提神到,幕后最会玩梗的竟然是他——主力稽查者陈博远。 他和奥特曼同台主握,暗暗修好了中语渲染;给模子起代号"布基胶带",还拿香蕉艺术品玩梗;为了秀模子的笔墨智力,贪图了米粒刻字、漫画套娃、视觉剖判注解题这些"彩蛋级"测试。 这篇共享里,他把官网展示图片的幕后花絮全抖了出来,又可笑又细节控狂喜。 本文经授权转载,以下为原文: 寰球好,我是 GPT Image 团队的斟酌科学家陈博远。上周发布的 GPT 生图模子等于我主力稽查的! 此次终于轮到我和奥特曼沿途主握发布会。很欢笑此次修好了模子的中语渲染!要是寰球有什么响应不错径直回应我哦。 图 1 中是我在发布会上的直播(不外多言语智力是直播后半节,国内媒体大要并莫得发现唯有我才是国东谈主 QwQ)。此次有益用图片生成了系数官网 blog,背后有好多花絮很好玩。 
△陈博远在 OpenAI GPT Image 2 发布会上和山姆奥特曼演示笔墨渲染智力 咱们的模子在发布前用 duct-tape 的代号在 LMArena 上进行了双盲测试。这个代号亦然我起的,原理是布基胶带,也等于底下这个东西: 
△duct tape 翻译过来叫布基胶带,不外国内不常见 至于为啥起名叫布基胶带嘛 .. 虽然是因为你不错用布基胶带把香蕉贴在墙上啦! 
△那幅寰球闻明的艺术品,等于用布基胶带把香蕉贴在墙上 虽然,限制亦然在双盲测试中断崖伊始了代号为小香蕉的第二名。 
除此以外我花工夫作念了好多咱们官网上的图片。系数 Blog 都是用图片生成的,全都莫得文本。 底下这些图都是我亲手作念的!每张图的背后都有好多想考,这里也像艺术家相似和寰球展示下。 
然后是咱们的中语彩蛋。 其时终点想作念一个很搞笑的漫画,于是预料了接住梗和香蕉梗。虽然,为了秀一下笔墨智力,我有益让他用多国言语加了好多笔墨,何况家乡海报的右下角让他生成终点终点小的中语来测试到底能多细节。 我为了让模子作念一些唯有咱们才作念得到的事情,米兰有益让它生成的图要看起来像是一张对着一册真的漫画书拍的像片。 这整张图,包括画中画和画中画中画都是一次性生成的。我贪图完以跋文忆寰球合计这是张拼接图,于是稀奇在图底加了备注。 
想来想去,这样的笔墨渲染其实仍是不够惊艳。 在队友的教唆下我作念了一张 4K 图(为了省俭寰球的流量压缩了极少点)。本体是一堆米粒,然则其中的一颗上头刻着字。你能找到吗?  
这张日语漫画亦然我作念的。 其时想作念一个和 GPT 图片生成关系的漫画。其时作念了一张和香蕉关系的巨搞笑的漫画,然则嗅觉放在官网上不太相宜。于是临了仍是用了另一种模式把漫画和 GPT 生图猜度在沿途。 我构想了羽羊毫这个主题,剩下的唯有很肤浅的教唆词,告诉他构想"戏剧化"的漫画。 
更多杂志页,这张是和共事沿途作念的。想路是让生图模子用一些真实的物体诱骗艺术的布局。这样既不错体现模子的对真实寰球的复原,又不失贪图感。 
作念底下这张图的时候,我在预料底有什么东西能隆起咱们模子在想考智力上的跳跃。 要是让他解平庸数学题方程啥的,似乎就太肤浅了。Nano Banana 似乎通过想考模式 + 笔墨渲染的模式也能作念。 于是我预料了我额外可爱的一个视觉剖判注解来竟然进修 GPT Image 2 独到的视觉推理后果。 图里教唆词说的是,在黑板上用视觉(而不是代数)剖判注解从 1 开动的奇数之和是一个平日。平庸的模子其实很容易推理出代数解,然则图形解唯有视觉模子才能作念了。 
临了这张图展示的是搜索智力,要去咱们官网的商店里找本体作念一个海报。 直播里咱们还展示了 Thinking mode 自动生成二维码放进图片里,其实背后有个彩蛋,其时展示的二维码扫进去的前多少个东谈主不错得回一个免费小奖品。 
临了的临了仍是要感谢团队的都心合力!每个东谈主都作念了好多好多的事情。 在发布前的尾声,我除了在修一些小东西等于和阛阓部门的共事还有作念艺术的共事沿途准备发布会和这个网站,他们真的是我见过的最高大的互助者了,也让咱们临了才有了这样漂亮的网站。 但愿这回稳稳地接住了寰球! 《我在 OpenAI 修中语》: https://zhuanlan.zhihu.com/p/2033191141806437343 — 迎接 AI 产物从业者共建 — � �「AI 产物学问库」是量子位智库基于永恒产物库跟踪和用户行径数据推出的飞书学问库,旨在成为 AI 行业从业者、投资者、斟酌者的中枢信息要道与决议复旧平台。 一键心绪 � � 点亮星标 科技前沿剖判逐日见milansports 时时彩app官方网站下载
|