GPT – 青瓜传媒

Chat已死，GPT史上最大改版，不只聊天

青瓜传媒 — Mon, 08 Jun 2026 08:29:51 +0000

聊天已死！

就在周末，FT放出了一份十多位OpenAI现任和前任员工的集体爆料——

ChatGPT即将迎来2022年上线以来最大规模的改版。

5天前，ChatGPT月活刚破10亿。达成这一数字只花了三年，堪称史上最快。

然而万万没想到，如此成功的聊天机器人，OpenAI转头就给判了死刑。

ChatGPT不想只跟你聊天了

接下来几周，你每天打开的那个界面就要变了。

ChatGPT的网页端和App端将迎来全面改版。干干净净的对话框要消失了。

编程工具、图片生成、第三方合作伙伴的入口会挤进来。Canva在里面，Booking.com也在里面。

对此，OpenAI核心产品负责人Thibault Sottiaux表示：

我们要做的东西将超越现有的界面形态。它会让你拥有一个个人Agent，能在你生活和工作的方方面面帮到你。手机上、电脑上、浏览器里，甚至在车里，你都能跟它对话。

过去三年半，ChatGPT的核心逻辑是「你问我答」。你输入一句话，它给你一段文字。

这个逻辑撑起了一条疯狂的增长曲线。

2022年11月上线，两个月破1亿用户，史上最快的消费级应用；
2023年，GPT-4、插件商店、企业版，一路狂飙；
2024年，语音对话、内置搜索、200美元的Pro套餐，什么都往里塞；
2025年，Codex上线，Agent时代开幕；
2026年5月，10亿月活。

但OpenAI内部越来越觉得，这条曲线撑不起一家万亿美元公司的估值。

新的逻辑是「你说，我去干」。

订机票、管日程、写代码、做报表、跑数据分析，ChatGPT要从聊天对象变成能动手的Agent。

在OpenAI企业产品负责人Alex Embiricos看来：

当AGI到来的时候，我不认为会有很多不同的品牌存在。大概只会有一个实体，你跟它对话，它能帮你做任何事。

Codex上位，ChatGPT的人靠边站

在这之前，Thibault Sottiaux的身份其实是Codex的负责人。

5月的组织重组中，他被提拔到整个核心产品和平台团队的一把手，管辖范围覆盖消费者、企业和开发者三条线。

而从2022年起就带着ChatGPT一路做到9亿周活的Nick Turley，则被调去了企业产品线。

换句话说就是，现在是做Codex的人在管ChatGPT，不是做ChatGPT的人在管Codex。

正如在内部备忘录里，Greg Brockman写的是「投资一个统一的Agent平台」，而不是「给ChatGPT升级」。

几天前的Intelligence at Work发布会上，OpenAI产品负责人更是当着所有人的面挑明了：

我们要把Codex装进ChatGPT里，就这么简单。

ChatGPT、Codex、开发者API，三条产品线被合并进一个团队。

一个不能写代码的ChatGPT只是聊天界面，一个没有消费者入口的Codex只是工程师工具。两者必须合体。

超级应用真正争的是分发权

当ChatGPT帮你订酒店的时候，它调用Booking还是Expedia？当它帮你做海报的时候，它选Canva还是Figma？

谁来决定这个排序，谁就握着新一代的流量分发权。

OpenAI做的不只是AI助手，它在抢搜索引擎和应用商店的生意。

这不是推测。OpenAI已经开始在ChatGPT里向免费用户投放广告，六周内年化广告收入突破了1亿美元。

超级应用的真正价值，不在于功能多，在于占住了用户意图产生的那个瞬间。

Codex的增长数据说明了一切

Agent商业化的第一个场景之所以是写代码，原因在于，代码有仓库、有测试、有PR、有bug、有交付周期，企业能算清楚ROI。

比起「帮我想个营销创意」，Codex能不能修bug、跑测试、写内部工具，更容易进入企业预算。

今年2月，Codex推出桌面端App之后，用户量从80万直接起飞。

3月初160万，4月底400万，5月底500万，六倍增长。

目前，Codex有20%的用户不是开发者，知识工作者的增速是开发者的3倍以上。

OpenAI也已经为这批用户上线了银行、投研、销售、设计等垂直场景的专用插件。

可以说，当一个「编程工具」开始服务银行家和设计师的时候，它就已经不是编程工具了。Codex正在变成一个覆盖所有知识工作的Agent平台。

而ChatGPT的那个聊天框，只剩下一个功能，当入口；后面，跑的全是Agent。

ChatGPT的未来，就是Codex的未来。

GitHub的数据可以做一个侧面印证。

2025年全年，GitHub上的代码提交总量是10亿次。2026年，这个数字预计将达到140亿次。

AI Agent发起的Pull Request从2025年9月的400万跳到了2026年3月的1700万。

代码不是人在写了，是机器在写，而Codex和Claude Code正在争夺这个新世界的入口。

OpenAI最不想看到的一幕发生了

产品要重做，组织要重组，但这一切的一切，指向同一个名字。

10亿月活用户里，只有5000万在付费。付费率不到5%。

真正给OpenAI交大钱的是200万家企业客户，贡献了大约40%的收入，目标年底推到50%。10亿免费用户只是漏斗最上面那一层。

过去几个月，OpenAI疯狂砍掉一切不赚钱的东西。

Sora砍了，购物结账功能砍了，科学研究部门也砍了。

但真正让OpenAI慌的，是外面追上来的那个名字。

5月28日，Anthropic宣布完成650亿美元H轮融资，估值9650亿。OpenAI在3月的估值是8520亿。

Anthropic第一次反超OpenAI，成为全球最贵的AI公司。

估值只是最表层的压力。

收入端，Anthropic的年化营收已经超过OpenAI。

从不到10亿到超过300亿，只花了一年出头。有分析师口径更激进，称5月底ARR已接近470亿。

用户端，ChatGPT的10亿MAU增速只有62%。Claude App的月活只有5600万，体量还不到ChatGPT的零头，但增速是640%。

不仅如此，美国用户装了Claude App之后，直接让ChatGPT的使用时间平均少了5%。

编程工具战场上，Claude Code拿下了54%的市占率，GitHub星标112K，Codex CLI只有74K。Claude Code已经占到公共GitHub commit的10%左右，年初这个数字才4%。

5月13日，两家上演了一场教科书级别的贴身肉搏。

OpenAI向Claude Code企业客户提供免费两个月Codex使用权，就差没把「快来叛逃」写在脸上。

几小时后，Anthropic反手把Claude Code周使用限额提升了50%。

前OpenAI研究员、Leonis Capital合伙人Jenny Xiao分析表示：

大约一年前，OpenAI的战略是放手一搏，Anthropic的战略是先把钱赚到手。现在两家在趋同，因为都在冲IPO，投资人关心的是钱，不是梦想。

9月vs10月，两场万亿IPO赛跑

这场趋同的终点在华尔街。

5月22日，OpenAI向SEC秘密提交S-1招股书。

Goldman Sachs和Morgan Stanley主承销，目标估值突破1万亿，最早9月上市，将是历史上最大的科技IPO。

11天后，Anthropic也秘密提交了S-1，目标10月。

史上头一次，两家估值接近万亿的AI公司在同一个季度冲刺IPO。

但OpenAI的财务故事不好讲。

月收入约20亿美元，年化250亿，但每赚1美元要亏1.22美元。

公司告诉投资人，不预计2030年之前实现正现金流。

所以「超级应用」是OpenAI唯一的路。

ChatGPT作为聊天工具，商业模型太薄。

95%的用户白嫖，剩下5%每月付20美元，靠这个模式给万亿估值讲盈利故事，没有投资人会买账。

但如果ChatGPT变成一个Agent平台，企业客户为自动化工作流付费，开发者为API调用付费，合作伙伴为流量入口付费。

10亿用户就变成了全世界最大的销售漏斗。

「Chat is dead」或许就是IPO倒计时逼出来的一句大实话。

ChatGPT，名字里写着自己的悖论

ChatGPT这个名字里，G是Generative，P是Pre-trained，T是Transformer。

但真正让全世界记住它的，是最前面那个词，Chat。

聊天，对话，你一句我一句。这个交互方式简单到极致，让一个本来只有研究员才会碰的大语言模型，三个月就获得了1亿用户。

如今OpenAI说，聊天死了，Agent才是未来。

但当你打开一个叫「ChatGPT」的东西，发现它想让你写代码、订酒店、做数据分析、接入十几个第三方服务的时候，你大概会想，我当初只是想跟它聊个天。

两场万亿IPO，一个在9月，一个在10月。

OpenAI拥有10亿用户但深陷变现焦虑，Anthropic只有5600万用户但增速碾压一切。

谁活成了谁想活成的样子，Q4见分晓。

作者：ASI启示录，编辑：摩西

来源：新智元

如何正确使用GPT生图？AI生图技巧！

青瓜传媒 — Fri, 29 May 2026 08:33:08 +0000

AI 生图技术正重塑视觉设计领域，GPT 凭借强大的语言理解与图像生成能力，成为 2026 年最受瞩目的创作工具。本文将从主流 AI 生图软件对比切入，解析 GPT 生图的核心亮点，并提供可直接落地的使用方法，帮助你避开创作误区，高效生成精准、高质量的图像作品

2026 年主流 AI 生图软件对比

当前主流AI 生图工具主要有以下几类，不同工具在画质、门槛、功能、费用上差异显著，以下为 7 款热门工具核心维度对比：

新手优先选GPT 、即梦 AI、豆包零门槛、中文友好、快速出图；

专业艺术创作选Midjourney，风格化与艺术质感佳

追求高度可控与自定义选Stable Diffusion，需具备技术基础；

商业合规优先选Adobe Firefly，版权风险低

针对新手友好的几个ai，尝试了一下生图情况，GPT是效果最好的，不管是从色彩、文字、排版、细节装饰、质感等角度，gpt都远超即梦和豆包，国内ai要说赢主要就是数量吧……具体效果如下：

提示词：生成一张庆祝六一儿童节海报 16:9 颜色使用蓝绿黄为主，画面有朝气，有树有小朋友在玩耍

GPT生成界面：

豆包生成界面

即梦生成界面：（os：即梦听说挺好的，生成效果这么拉，不知道是不是没充钱的缘故）

所以我们今天就集中讲一下gpt如何应用，以及使用中遇到的问题怎么解决

GPT 生图的核心亮点

1. 语言理解天花板，提示词遵循度极高

依托 GPT-4o 的推理能力，生图前会先 “思考规划”，拆解复杂指令，甚至联网补充信息（如生成信息图时抓取数据），精准还原文字描述，避免 “答非所图”，复杂场景与细节指令的遵循度远超同类工具。

2. 文字渲染零出错，中文排版稳定

解决行业长期痛点：中文、英文、符号渲染清晰无乱码，海报、菜单、UI 界面中的文字可精准生成，支持指定字体（宋体、黑体等），非拉丁字符（中日韩）排版自然，直接可用于商业场景。

3. 图生图强可控，原图改动极小

支持低重绘幅度图生图，可严格保留原图颜色、光影、构图、文字，仅优化细节；上传图片后，能精准识别主体，实现 “换装、换背景、风格迁移”，且人物 / 物体一致性强。

4. 零门槛 + 全场景适配，新手秒上手

无需额外安装软件，ChatGPT 界面直接操作，新手易上手；
支持任意宽高比，适配海报、短视频、PPT、插画等全场景；
一次可生成 8 张连贯图片，角色 / 风格统一，适合漫画、故事板、系列创作。

如何正确使用 GPT 生图

GPT 生图的核心逻辑是精准指令 + 迭代优化，万能提示词公示如下

公式：版式 + 主体 + 场景 + 风格 + 光影 + 细节 + 文字约束 + 用途

– 版式：明确比例（如 9:16 竖版、16:9 横版、正方形）、分辨率（2K 高清）；

– 主体：清晰描述核心元素（人物 / 物体 / 场景，含数量、特征）；

– 场景：环境、背景、时间（如夕阳下的海边、赛博朋克城市夜景）；

– 风格：具体风格词（如吉卜力风格、写实照片、油画风、扁平化 UI）；

– 光影：光线类型（自然光、电影光、逆光、柔和暖光）；

– 细节：质感、材质、清晰度（如毛孔可见、发丝清晰、高细节、无噪点）；

– 文字约束：关键文字用引号包裹，指定字体（如 “春日限定”，黑体，白色）；

– 用途：明确使用场景（如海报、短视频封面、PPT 配图

对于非专业使用者而言，精准描述画面风格、光影效果与细节质感存在一定难度。对此，可直接上传参考图，AI 将自动识别并对标参考画面进行生成。

即便提示词描述足够详尽，当前 AI 仍无法完全复刻指令要求，生成结果往往需要二次调整。若需在已有成品图上局部修改，切勿使用模糊指令（例如 “仅修改图标，保留原有色彩与文字”），这类表述易导致画面多处元素被意外改动。建议参照以下标准化模板撰写修改指令，精准限定调整范围

基于参考图做“像素级局部修改”，禁止全图重绘，具体要求如下：

1. 100%保留原图所有文字、文字内容、字体、颜色、位置，禁止改动、变形、重绘文字；

2. 完整保留原图整体色调、所有色块颜色、光影、构图、元素位置，不更改原有色彩；

3. 仅修改【你要改的具体内容，例：背景花纹】，其余所有区域完全保持原图不变；

4.禁止重新设计、禁止改变整体风格、禁止AI自由发挥；

5.使用原图修补逻辑，而不是重新生成整张图。

实践案例演示，精准避雷

接着上面六一儿童节的海报讲解，假如我的文案过于简单会得到一个什么样的图，可能就是一个竖版的，元素杂乱的界面。当然我们也不得不感慨下图简单的提示词生成的效果其实已经非常不错了，颜色丰富和谐，氛围感也好。

生成一张庆祝六一儿童节海报

那如果我们想要修改部分的内容，比如字体和颜色和元素，我们看一下不同提示词的效果差异

提示词1：效果见下面图1

将祝所有小朋友改成祝宋亚轩小朋友，去掉愿每个孩子都能拥有一个快乐的童年，健康成长，勇敢追梦！，去掉右上角的纸飞机和彩带

提示词2:效果见下面图2

基于参考图做“像素级局部修改”，禁止全图重绘，具体要求如下：

1. 100%保留原图所有文字、文字内容、字体、颜色、位置，禁止改动、变形、重绘文字；

2. 完整保留原图整体色调、所有色块颜色、光影、构图、元素位置，不更改原有色彩；

3.仅修改文字把【祝所有的小朋友】改为【祝宋亚轩小朋友】，去掉文字【去掉愿每个孩子都能拥有一个快乐的童年，健康成长，勇敢追梦！】，去掉右上角的纸飞机和彩带，其余所有区域完全保持原图不变；

4.禁止重新设计、禁止改变整体风格、禁止AI自由发挥；

5.使用原图修补逻辑，而不是重新生成整张图。

原图图1 图2

其实我们发现两张图和原图对比整体效果非常接近的，gpt的理解能力还是非常强的，把我需要修改的地方都执行了。但是还是有一些细节问题，图1除了我指令外还把纸飞机、爱心去掉了，下方的祝福文字的位置向下挪动了。图2进行非常多限制和约束提问后，更接近原图了，但是整体色彩饱和度被修改的更高了

但是小编试了多次，虽然强约束的提示词不能百分百实现要求，但是效果是更稳定，更接近我们的目标图像的，如果提示词很范，ai就会根据自己理解无限发挥，最终可能改的次数越多偏离就越多。如果实在试了很多次都无法实现效果的时候可以考虑让某个位置留白，自己下载图片后再进行二次创作

以上就是使用gpt生图的一些心得，希望对大家有帮助。本人从事b端设计，很少做这么复杂的视觉，对于ai生成视觉稿理解有不到位的欢迎指教

作者：(*≧▽≦)

GPT-4.1正式上线ChatGPT

青瓜传媒 — Thu, 15 May 2025 06:31:01 +0000

就在刚刚，OpenAI官宣：GPT-4.1，今天起直接在ChatGPT中可用。

这个模型擅长编码任务和遵循指令，是o3和o4-mini的绝佳替代品。

一个月前，GPT-4.1刚推出的时候，仅通过API向开发者开放。而现在，它在ChatGPT中就直接可用了。

其中，Plus、Pro和Team用户可以通过模型选择器中的「更多模型」下拉菜单访问GPT-4.1。企业版和教育版用户将在未来几周内获得访问权限。

OpenAI表示，他们还将在ChatGPT中为所有用户引入GPT-4.1 mini来取代GPT-4o mini。

由于超长的上下文能力，现在你可以将整段代码放到GPT-4.1中进行分析。

GPT-4.1和GPT-4.1 mini都已经通过了OpenAI的最新标准安全评估。

在以下两项评估中，GPT-4.1均排名前列。

not_unsafe：根据OpenAI政策和模型规范，检查模型是否未产生不安全的输出。
not_overrefuse：检查模型是否遵循良性请求。

幻觉评估以及指令遵循方面，GPT-4.1也均表现优秀；但在越狱评估方面表现不佳。

GPT-4.1，比GPT-4.5还好？

这次放出GPT-4.1，也算响应群众的呼声。

早在4月底，就有用户抱怨说：GPT-4.1简直是自己最喜欢的OpenAI模型，可惜在ChatGPT中并不能使用。

他确定地说：使用体验比GPT-4.5还要好！

不断有开发者现身说法，表示：除了GPT-4.1的早期版本Quasar Alpha之外，它也是自己测试过的最好的编码模型！

不断有人表示，GPT-4.1，绝对是一个被低估的模型。

就在上个月，OpenAI专为开发者推出了GPT-4.1系列新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

它们均拥有最高100万Token的超大上下文窗口，在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini，并且知识截止日期也已更新至2024年6月。

实测：庞大代码任务顺利完成

既然很多ChatGPT用户都能用上GPT-4.1了，现在全网已经涌出了不少实测。

比如沃顿商学院教授Ethan Mollick，就用一道考遍了各大模型的景点难题来考验GPT-4.1。

「请创建一段我可以直接粘贴到p5.js中的代码，它要以惊人的巧思震撼我，仿佛是未来某艘星舰控制面板的呈现。」

GPT-4.1的表现，可是相当优秀。

另一位开发者实测后发现，GPT-4.1实在令人惊喜！

当时，他正在处理一个代码量非常庞大的任务，系统自动选择的模型根本无法处理，完全没有生成任何内容。

结果让GPT-4.1上场后，它不仅比默认模型更快，还准确地完成了任务。

甚至，它还给了一个额外的惊喜：竟然还把整个文件中没用到的代码都清理掉了。

通过实测发现，GPT-4.1在代码生成速度方面达到了新的高度。

比如让GPT-4.1生成一个博客首页，在几秒钟之内就完成了输出。

再比如，让他用python写一个地球飞往火星的动画，几乎就是在一瞬间，GPT-4.1就完成了任务的输出。

结果看起来还行，这只是第一轮交互的结果，能够感受到GPT-4.1的速度是得到根本性的提升。

再挑战一下，让给GPT-4.1用动画来解释一下量子纠缠。

初步来看，GPT-4.1还是「领会」到了什么是量子纠缠

对于推理问题，GPT-4.1表现的也非常优秀。比如多步骤的年龄计算问题，GPT-4.1的求解逻辑非常严谨。

面对一些逆向思考、脑筋急转弯之类的问题，GPT-4.1也能快速完成推理，当然面对这个问题得出的答案倒是非常有趣。

网友吐槽：没有1M上下文版本，令人失望！

但试用GPT-4.1后，许多网友表示：太失望了！

虽然OpenAI发布了GPT-4.1，却没有包含100万上下文窗口的API版本。

本来大家最希望在ChatGPT中使用GPT-4.1，就是因为想要超长的上下文窗口。

现在，只能期望GPT-5能提供一个超长的上下文窗口了。

的确，不断有人发现，ChatGPT（Pro）中的GPT-4.1，最大上下文长度似乎仅为128k token，跟API中的100万token相差甚远。

也就是说，OpenAI并没有在GPT-4.1中提高限制。

总之，真的让人很失望。看来还是得用Gemini。

也有网友发现了「华点」：自己尝试运行他们在直播演示中用来展示 ChatGPT 4.1的提示词，但网页版无法运行成功，不过在API Playground中尝试后却运行成功了。

也有人说，自己刚刚氛围编程了一个使用GPT-4.1的AI助手，因为这个模型仅通过API提供，今天，ChatGPT中就能用了。

不过，他还是会用自己的助手，因为用户界面比ChatGPT更好。

其实，OpenAI此前已经放出GPT-4.1的prompt指南，总结了一系列内部测试中得出的重要prompt技巧。

想实测的小伙伴，可以参考这篇用起来了。

作者：ZNX

来源：新智元