当前位置:首页 > 元宇宙 > AI

OpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭

来源: 责编: 时间:2025-03-31 11:07:20 205观看
导读 刚刚,OpenAI 深夜直播,GPT-4o 的原生图像生成大升级!奥尔特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI 的这波动作着实有点不够看。就在谷歌刚刚扔出地表最强模型 Ge

刚刚,OpenAI 深夜直播,GPT-4o 的原生图像生成大升级!奥尔特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI 的这波动作着实有点不够看。Yma28资讯网——每日最新资讯28at.com

就在谷歌刚刚扔出地表最强模型 Gemini 2.5 Pro 不久,OpenAI 也有动作了。Yma28资讯网——每日最新资讯28at.com

奥尔特曼亲自带队,展示了 GPT-4o 图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

目前,这项功能已经在 ChatGPT 和 Sora 中,向所有 Plus、Pro、Team 和免费用户推出。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

当然,新版 Sora 生图的时间,也比以往更长了。但 OpenAI 看来,生图的质量和其具备的世界知识,让用户值得等待那多出的几秒。Yma28资讯网——每日最新资讯28at.com

GPT-4o 原生图像生成来了!

在直播中,奥尔特曼介绍道,从今天起,ChatGPT 中的原生图像生成功能正式推出!Yma28资讯网——每日最新资讯28at.com

GPT-4o 的全模态能力,从此也融合进了 Sora 中。Yma28资讯网——每日最新资讯28at.com

OpenAI 多模态研究的负责人 Gabe 介绍说,两年前刚开始这个项目时,他对于 GPT-4 这个强大的模型会怎样原生支持图像模型非常好奇。Yma28资讯网——每日最新资讯28at.com

一年后,当模型完成训练时,他看到了令人兴奋的迹象。从 GPT-2 以来,他已经很久没有这种感觉 —— 这是一个疯狂时刻。Yma28资讯网——每日最新资讯28at.com

给出以下 prompt,GPT-4o 就生成了符合要求的图像,完全还原了要求。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

接下来,三个人用手机来了张自拍,GPT-4o 立刻把三人自拍转换成了动漫风格的版本。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

甚至他们开始官方玩梗,让模型添加一段「Feel The AGI」在图片上,一张表情包就此诞生。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

这个过程,就体现了 4o 作为全能模型的强大能力。Yma28资讯网——每日最新资讯28at.com

因为它不仅仅是一个语言模型,还包括图像、音频,所有输入和输出的模态。它可以理解、生成这些模态,并且无缝地在它们之间工作。Yma28资讯网——每日最新资讯28at.com

用 OpenAI 的话说,「我们终于迈向了这种真正集成的多模态模型」。Yma28资讯网——每日最新资讯28at.com

接下来,他们让模型画出一幅描述相对论的漫画,要求通俗易懂,还要加入一些幽默元素。Yma28资讯网——每日最新资讯28at.com

这个提示词非常模糊,因此看看模型会生成什么样的图,就格外令人期待了。果然,生成效果令人惊喜。Yma28资讯网——每日最新资讯28at.com

注意,这个过程中,模型很可能利用了自己的世界知识,对提示词进行了扩展。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

然后,他们给了模型一张卡片,希望生成同样风格的图像,但要求主角不再是卡片中的巨猫国王,而是某位研究者的狗狗。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

另外,卡片上还需要出现一些细节,比如模型的名字和年份,以及狗狗的体重和身高。Yma28资讯网——每日最新资讯28at.com

可以看到,生成图像在文本渲染方面非常惊艳,所有数据都准确无误。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

最后一个演示,是基于此前几人生成的内容,制作一个纪念币。Yma28资讯网——每日最新资讯28at.com

而且,还要求图使用了一个特殊的十六进制代码,且加上生成图像的文本和日期。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

可以看到,生成结果非常惊艳!此前曾出现的艺术熊、收音机、爱因斯坦漫画、研究者的狗狗以及模型名称和日期,全部都出现在了纪念币上。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

模型之所以精准完成这样复杂的要求,是因为它是用非自回归的方式训练的,因此它能够理解上下文中的文本和多张图片,以非常和谐的方式在纪念币上呈现出来。Yma28资讯网——每日最新资讯28at.com

和 GPT-4o 聊天,定制各种图像

总之,现在使用这个功能,我们可以创建各种图像,或将其转换为各种风格。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

从此,用 GPT-4o 创建和定制图像,就像聊天一样简单。Yma28资讯网——每日最新资讯28at.com

只需描述所需,就能得到想要的任何细节,比如纵横比、使用十六进制代码的精确颜色或透明背景。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

我们可以让它设计一个信息图,解释牛顿的棱镜宽高比,背景为深蓝色。Yma28资讯网——每日最新资讯28at.com

一张画质高级的教学级图片,立马生成。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

这个图像生成功能的特点就是,能遵循非常复杂的提示,极其注重细节。Yma28资讯网——每日最新资讯28at.com

15 个非常细化的要求,它都在一张图里完美实现了。Yma28资讯网——每日最新资讯28at.com

要知道,大多数生图模型被要求渲染多个项目时,往往就会混淆颜色和形状,但新模型却能正确绑定 15 到 20 个对象的属性,还能成功理解各自的复杂需求。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

在你和它的聊天上下文中,GPT-4o 就能为你构建图像和文本,还能确保一致性。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

主打一个实用

从最早的洞穴壁画到现代信息图表,人类一直使用视觉图像来交流、说服和分析。Yma28资讯网——每日最新资讯28at.com

如今的生成式 AI 模型可以创造出超现实的场景,但在处理人们用于分享和创建信息的实用图像方面仍然存在困难。Yma28资讯网——每日最新资讯28at.com

GPT‑4o 的图像生成功能擅长准确渲染文本,精确遵循提示词,并利用 GPT-4o 固有的知识库和聊天上下文 —— 包括转换上传的图像或将其用作视觉灵感。Yma28资讯网——每日最新资讯28at.com

这些能力让用户可以更加容易地创建想象中的画面,帮助通过视觉更有效地沟通,并将图像生成发展成为一种具有精确性和强大功能的实用工具。Yma28资讯网——每日最新资讯28at.com

毕竟,只有当图像配上指代共享语言和经验的符号时,才能传达精确的含义。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

能力大幅增强

通过线上图像和文本的联合分布训练,模型不仅能学会图像如何与语言相关联,还能知道它们之间的相互关系。Yma28资讯网——每日最新资讯28at.com

结合积极的后训练优化,最终的模型展现出惊人的视觉表现力,能够生成实用、一致且具有上下文感知能力的图像。Yma28资讯网——每日最新资讯28at.com

文本渲染

一张图片胜过千言万语,但有时在正确的位置添加几个词能够大大提升图像的含义。Yma28资讯网——每日最新资讯28at.com

GPT-4o 将精确的符号与图像融合的能力使图像生成成为视觉交流的有力工具。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

多轮交互生成

由于图像生成现在是 GPT‑4o 的原生功能,用户可以通过自然对话来完善图像。Yma28资讯网——每日最新资讯28at.com

GPT‑4o 能够基于聊天上下文中的图像和文本进行构建,确保始终保持一致性。Yma28资讯网——每日最新资讯28at.com

比如,一个正在设计中的游戏角色,它的外观就能在多次迭代和调整中保持连贯一致。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

指令遵循

GPT‑4o 的图像生成功能不仅可以遵循详细的提示词,而且还十分注重细节。Yma28资讯网——每日最新资讯28at.com

相比起其他只能处理 5-8 个物体的模型,GPT‑4o 可以轻松搞定多达 10-20 个不同的物体。Yma28资讯网——每日最新资讯28at.com

并且,物体与其特征和关系的更紧密绑定使得控制更加精准。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

上下文内学习

GPT‑4o 能够分析并学习用户上传的图像,将图像细节无缝整合到上下文中,用于辅助图像生成。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

世界知识

内置的图像生成功能使 GPT‑4o 能够连接文本和图像之间的知识,使模型表现得更智能、更高效。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

真实照片风格

通过对反映多种多样图像风格的图像进行训练,模型能够以令人信服的方式创建或转换图像。Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

Yma28资讯网——每日最新资讯28at.com

参考资料:Yma28资讯网——每日最新资讯28at.com

https://openai.com/index/introducing-4o-image-generation/Yma28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11767-0.htmlOpenAI 直播狙击谷歌:奥尔特曼 AGI 梗图现场直出,GPT-4o 超强原生生图来袭

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌最强模型 Gemini 2.5 Pro 发布即屠榜,创下史上最大分数飞跃纪录

下一篇: DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

标签:
  • 热门焦点
  • 万字专访Vitalik Buterin:以太坊将成为主流和最安全的基础层

    Vitalik Buterin 在 19 岁时撰写了以太坊白皮书。他的目标简单而全面,即创建一个“世界计算机”,旨在成为所有在线应用程序的灵活基础层,无需任何第三方。自 2015
  • 国内涌现70余家数字藏品平台:合规、流量与利润在博弈

    作者:杨郑君2月16日,迅雷链企业数字藏品服务平台正式上线,继阿里、腾讯、京东、百度、网易等之后,又一家互联网企业正式加入到火热的数字藏品平台的竞争中。除互联
  • 吸金31亿美元,谁在催火2021年的链游?

    2021年究竟发生了什么,才使得链游领域在这年一飞冲天?作者:廖羽2022年2月16日,Invest Game发布《2021年全球游戏投资报告》,报告显示,游戏行业的投资重点正在向区块
  • 餐桌上怎么变出元宇宙?

    作者:星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙,看起来风马牛不相及,但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初,全球最大
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • a16z:元宇宙办公会取代实体办公室吗?

    6位不同的专家对未来的工作发表看法----元宇宙--沉浸式的、基于区块链的虚拟世界,大多数日常活动最终会在这里发生--但仍然只是一个概念。但它是一个拥有宝贵不
  • 就业年龄歧视如何解决?来Web3看看

    上周,我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划,那年我们的协议实习生刚出生。在一阵恐慌后,我又花了一点时间反思我这个拥有近1
  • 知识产权可能在元宇宙中“消失”?

    开篇老雅痞先来划重点:一些公司开始采取积极的方式来保护他们在元宇宙的知识产权。耐克、爱马仕和米拉麦克斯最近提起诉讼,声称NFT侵犯了他们的知识产权。Inside
  • 韩国流行音乐巨头SM与Binance达成NFT合作伙伴关系

    韩国流行音乐巨头 SM Entertainment 与加密货币交易所 Binance(币安)达成“Play2Create”NFT 合作伙伴关系。SM 娱乐一直在投资打造元宇宙该公司于 2020 年 10
Top