AI – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Wed, 06 May 2026 01:43:52 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico AI – 青瓜传媒 //m.clubpenjuin.com 32 32 豆包付费,AI公司都逃不掉的算术题! //m.clubpenjuin.com/381191.html Wed, 06 May 2026 01:43:52 +0000 //m.clubpenjuin.com/?p=381191

 

免费用AI的好日子,还没结束——但可能正在分叉。

五一假期期间,豆包App Store页面悄然出现付费版本入口,随即在科技圈引发热议。很多人的第一反应是:豆包要收费了?白嫖的日子到头了?

但事情没那么简单。

豆包官方随即回应:免费服务始终保留,付费只是在免费之上新增的一层增值选项,目前还在测试阶段。换句话说,豆包不是要”把免费变成收费”,而是要在原有免费版的基础上,为愿意付费的用户提供更强的能力——PPT生成、数据分析、影视制作这类复杂生产力场景,将是付费版的主战场。

发生了什么?先把事实说清楚

事情的起因是豆包App Store页面出现了付费版本的服务声明,随即引发广泛讨论。

对此,豆包官方给出了回应,原话是这样的:

“豆包始终提供免费服务,在免费服务的基础上,豆包也在探索推出更多增值服务,相关方案细节目前还在测试阶段。”

据接近豆包的人士透露,付费功能将主要聚焦在复杂任务和生产力场景,具体包括PPT生成、数据分析、影视制作等方向。随着模型能力持续升级,产品已经能满足越来越多的复杂高价值任务,但此类任务需要消耗更多算力与推理时间,因此豆包计划上线付费服务来覆盖这部分成本。

目前流出的定价区间为:标准版68元/月、加强版200元/月、专业版500元/月。需要注意的是,这是测试阶段的数据,并非官方最终确认,正式上线后可能有所调整。

免费版本则继续保留,面向用户的日常使用。

换句话说:豆包没有取消免费,而是在免费之上加了一层付费。但问题来了——为什么偏偏是现在?

为什么偏偏是现在收费?

这个问题,表面上看是豆包的商业决策,背后其实是整个大模型行业都绕不开的一道算术题。

第一层原因:成本压力是根本。

很多人以为AI对话就是”打几个字、等几秒”,成本应该不高。但实际上,大模型的推理成本远超想象,而且任务越复杂,成本越高。普通的聊天对话消耗算力有限,但PPT生成、长视频制作、复杂数据分析这类任务,每次调用的算力成本可能是普通对话的几十倍甚至更高。

根据行业数据,前沿模型的训练成本已从2020年的数百万美元激增至如今的3亿美元以上,增长约66倍,且仍在向更高量级攀升。推理成本同样没有下降的趋势——随着用户要求的任务越来越复杂,推理的难度和次数都在上涨。

简单说:免费模式在复杂场景下,字节自己也烧不起。

第二层原因:免费策略已经到了天花板。

过去一年,豆包靠巨额投流成为国内用户数量断层式第一的AI应用。据统计,仅2024年6月上旬的一次投放,金额就高达1.24亿元。这种力度确实换来了用户规模,但用户活跃度数据却并不好看:豆包用户每周仅活跃2~3天,每天发消息轮次仅为5~6次,人均使用时长约10分钟,且这些数据在过去一年中增长幅度并不显著。

用户量大,但粘性不够深。字节内部甚至有判断认为,AI对话类产品可能只是AI产品的”中间态”,而付费订阅模式在中国不太可能完全走通。广告变现空间有限,免费烧量的边际效益在递减,会员订阅是必然要走的下一步。

第三层原因:市场时机到了。

经过一年多的用户教育,国内用户对AI工具的依赖度在悄悄提升。越来越多的职场人开始把AI工具嵌入日常工作流,愿意为效率买单的用户群体正在形成。早了用户不买账,晚了竞争对手先占位——现在,是试水付费的合适窗口。

豆包这次收费,有哪些地方做对了?

作为一个长期关注AI产品的人,我觉得豆包这次收费的方式,至少有三个地方值得肯定。

第一,免费版保留是关键决策。

不搞强制付费,不把原有免费功能”降级”来逼用户升级,这是成熟产品在商业化时最重要的克制。一旦用户感觉”原来有的东西被拿走了”,负面情绪会被迅速放大。豆包选择在免费版之上新增付费层,而不是削减免费版,这个决策大大降低了用户流失的风险。

第二,付费锁定”复杂场景”而非基础功能。

普通聊天、查资料、写短文继续免费,付费版针对的是PPT生成、数据分析、影视制作这类有明确生产力需求的场景。这个边界划得很清楚:免费用户不会感到被剥夺,付费用户能看到明确的价值对应。定价逻辑清晰,是产品设计上的加分项。

第三,三档定价覆盖不同用户层。

68元/月、200元/月、500元/月——这是典型的SaaS分层定价思路。标准版面向有基础生产力需求的个人用户,加强版面向重度职场用户,专业版面向有影视制作等专业需求的创作者。梯度设计比一刀切更聪明,不同付费意愿的用户都能找到对应的入口,而不是”要么全要要么不要”。

当然,这些判断都建立在一个前提上:功能要真正兑现承诺。框架设计得再好,如果付费版的PPT生成质量让用户失望,定价再合理也留不住人。

作为用户,你该怎么看这件事?

不同的人,面对这件事的处境是完全不同的,没必要一刀切地焦虑或者兴奋。

  • 如果你是轻度用户,日常用豆包聊天、查资料、写几段文字,免费版完全够用,这件事对你几乎没有任何影响,不需要有任何焦虑。
  • 如果你是职场用户,频繁用豆包做PPT、写报告、整理数据,那值得认真算一笔账。如果付费版真的能把你每次做PPT的时间从2小时压缩到20分钟,68元/月可能一天就回本了——问题的关键不是“贵不贵”,而是“功能有没有达到你期待的效率提升”。建议等正式版上线后,先试用再决定是否付费。
  • 如果你是创作者或视频从业者,豆包在影视制作方向的付费功能值得持续关注。但目前仍在测试阶段,功能边界和定价都可能变化,建议观望,不必急着做决定。

最后说一句实话

豆包收费,不是AI工具变坏了,而是这个行业终于开始认真思考可持续性了。

免费的午餐从来都不是真正的免费,只是成本由谁来承担的问题。过去一年,字节用巨额补贴换来了用户规模;接下来,它要用产品价值换来用户真实的付费意愿。这两件事的难度,完全不在一个量级上。

烧钱买用户,靠的是钱。让用户心甘情愿掏钱,靠的是产品。

这场考验,才刚刚开始。

作者:哲子在*** pm

]]>
AI生成的界面太难看?试试这个开源项目Awesome DESIGN! //m.clubpenjuin.com/381073.html Mon, 04 May 2026 00:15:00 +0000 //m.clubpenjuin.com/?p=381073

 

最近Vibe Coding真的太火了。

越来越多人开始直接用 AI 写页面、搭产品、做官网,动动嘴就能出 UI,效率看着确实很爽。

但问题也很真实。

你以为AI会给你整出那种大厂味、极简风、质感拉满的界面,结果它一出手,像是把十年前的建站模板重新缝了一遍。

不是 AI 故意演你,问题其实很简单:你嘴里的“高级感”,AI 根本脑补不出来。

你觉得“像 Apple 一点”“像 Stripe 一点”“做得更有质感一点”,但这些话对 AI 来说都太虚了。没有明确的设计规则,它最后大概率还是只能靠自由发挥。然后你懂的,翻车现场就来了。

最近我刷到一个挺顶的 GitHub 项目,刚好就是来解决这个问题的。

它叫 Awesome DESIGN.md。

项目地址:github.com/VoltAgent/awesome-design-md

规范详情:https://getdesign.md

01. Awesome DESIGN是什么?

简单说,它就是一份写给 AI 看的设计规范。不是给前端开发看的,也不是给设计师交付用的,而是专门用来告诉 AI:这个页面应该长什么样。

它的逻辑很简单,就是把页面该怎么配色、用什么字体、组件长什么样、版式怎么排,全部整理进一份 Markdown 文档里。

AI 读完之后,就不是再靠感觉乱猜,而是会按照你给定的风格规则去生成页面。

说白了,这东西就是 AI 时代的设计说明书。

而且重点是,它不是插件,不是 SaaS,也不是那种点进去就开始收费解锁的套路产品。

它是免费、开源、现成就能拿来用的。

下方为部分设计规范展示

02. 如何安装?

Claude Code、Cursor、Codex、Trae 这类 AI 编程工具都能直接读取 DESIGN.md。你只要把文件放进项目根目录,再告诉 AI 按这份设计规范生成页面,它就能照着这套风格往下写。

如果还要更简单的方式就是直接把命令发给对应AI编程工具叫他帮你安装

https://hao.uied.cn/website/1218

如果还不了解AI 编程工具的可以看看我之前写的AI知识库

https://facomqeet1v.feishu.cn/wiki/YK3QwtWDciTsj6kraJScEGjDniS

这里使用Trae来进行案例展示其他AI编程工具类似操作

打开https://getdesign.md

选择自己需要的设计规范,这里我以苹果的为例。其他同类型

复制命令给AI编程工具让它来安装

安装完会显示在你的文件根目录(显示有就是安装成功了)

如果你觉得让AI安装太慢可以直接自己复制到DESIGN.md

替换到这个DESIGN.md就行。

03. 如何使用

告诉 AI 助手使用它在你的 AI 编程助手中输入:

仅做测试,具体能力也要看大模型本身

请根据项目根目录的 DESIGN.md 文件,为我构建一个后台页面。

效果展示(大模型kimi)

04. 如何将生成的html或者web网页转为figma源文件

打开你需要转为figma的html文件

Web to Design 浏览器插件安装教程

https://facomqeet1v.feishu.cn/wiki/LJL6wBolJiZPBEkFLhEc9ka2nxc

安装好后点击打开工具条

执行复制页面

在figma画布中执行ctrl+v即可

写在最后

整体效果看起来比没用规范之前好看多了,但还差点意思,进步空间还是挺大的。

基本就是AI做的页面,至少告别了“廉价外包感”,直接看起来像是某个大厂的水平,简约有质感,但还是能感觉到跟真正大厂的精细度有差距。可能是细节和小调整的地方还没到位,所以整体风格不错,但还不能完全满分,想要完全做到完美,可能还得进一步优化。

作者:Tomda

]]>
确认!DeepSeek多模态AI已经开测 //m.clubpenjuin.com/381102.html Thu, 30 Apr 2026 03:51:43 +0000 //m.clubpenjuin.com/?p=381102

 

DeepSeek的视觉功能,真的来了!!

DeepSeek研究员陈小康发帖放出一条消息——

Now, we see you.

随后,另一位研究员陈德里也跟了一条,确认V4视觉模式已经开始灰度测试。

怎么说,小鲸鱼的多模态拼图,要补齐了。

已经具备真实图像理解能力

之前上传图片,模型只能识别图片中的文字,做做OCR工作。

今天一个小更新之后,被灰度到的幸运鹅首页已经出现了识图模式,下面还有一行小字表示图片理解能力内测中。

从幸运鹅分享的截图来看,DeepSeek视觉测试版已经具备真实图像理解能力,识别出了图片里的饮品、杯型等信息,思考4秒输出了完整的描述。

这是一张没有明显文字的图,明显与之前仅识别文字的模式不一样了。

V4,满血归来

放出消息的两位研究员,其中一位是陈小康,DeepSee多模态研究组负责人,北大博士毕业。

他是DeepSeek两个重磅多模态项目的核心作者:Janus系列统一多模态理解与生成模型;DeepSeek-VL2基于MoE架构的视觉语言模型。

简单说,DeepSeek的视觉能力,就是他带队搞出来的。

另一位陈德里主要负责语言模型、对齐机制、训练策略及模型泛化能力等核心方向。

在过去两年的时间里,DeepSeek发布的多项重要研究成果,无论是V2、V3还是R1,几乎都能看到他的名字,这次的V4也不例外。

价格打骨折之后,视觉功能又来了,请问还有什么惊喜是我们不知道的!!!

不得不说,DeepSeek V4,这次是真满血归来了。

作者: 凹非寺量子位

来源:量子位

]]>
小红书正式发布AI治理主张 //m.clubpenjuin.com/381021.html Tue, 28 Apr 2026 01:35:10 +0000 //m.clubpenjuin.com/?p=381021

 

4月27日,小红书首次公布平台「AI治理主张」,提出鼓励AI辅助创作但必须标识,同时明确抵制AI造假、侵权等行为。

这套治理方案涵盖四个方面:要求创作者对AI生成内容如实标注、未标注内容由平台统一标识、建设AI内容识别能力、上线AI笔记申诉通道。

这并非小红书的首次AI治理动作。

今年3月,小红书已发布打击AI托管运营账号的公告,对全AI代发公开笔记的账号直接封禁,对普通账号偶发性使用的AI代写则进行梯度处理,包括警告和限制内容分发。

当时的治理主要聚焦“模拟真人”的虚假互动行为。

而此次AI治理主张的发布,将关注面从纯托管账号扩展到更广泛的内容层面。

小红书将AI定位为“创意的放大器”,希望在鼓励技术使用与维护社区真实性之间寻找平衡。

有分析认为,这套机制能否有效执行,关键在于平台的AI识别技术能力和用户标识的自觉性。

从行业横向对比来看,小红书的AI治理公告发布时间并不算早。

早在2025年3月,国家互联网信息办公室等四部门联合发布《人工智能生成合成内容标识办法》,并于同年9月1日正式施行。

该办法规定所有AI生成的文字、图片、视频等内容须添加显式标识和隐式标识。

在法规生效前夕,抖音、腾讯、微博、B站、快手、DeepSeek等平台已集中出台了细化规则。

抖音在2025年9月1日上线了两项功能,分别是AI内容辅助标识功能和元数据读写功能。

若创作者未主动标识,平台会通过技术检测疑似AI内容并补充标识。

腾讯则强调优化内容识别能力,对可能是AI生成的内容进行相应提示;微博在用户自主声明机制基础上,投诉侧新增“未添加AI标识”分类用于用户监督;B站、快手也分别上线了声明功能和双重标识系统。

相比这些平台相对全面的技术铺底和对接法规的执行方案,小红书目前的治理主张仍处于框架性原则层面,缺乏具体的技术细节与执行路径披露。

对于用户是否积极配合平台标注,以及平台技术识别与纠察的边界在哪里,目前还没有官方公布的详细方案。

不过值得留意的是,在小红书发布AI治理主张的同一天,追觅科技创始人兼CEO俞浩在个人社交平台公开批评小红书的价值观导向和盈利模式,引起科技圈广泛关注。

在外界舆论正在聚焦社区导向问题的时间节点上,小红书选择公布AI治理主张,这究竟是回应舆论关切的前瞻性举措,还是单纯的时间偶合,目前外界看法不一。

无论如何,AI内容的标识合规已成为整个互联网行业的共同课题。

从法规施行近8个月的情况来看,头部平台基本完成了标识功能部署,但中小平台的落实仍存在差距。

如今小红书正式加入AI治理阵营,能否在保持社区活跃度同时做到精细化管理,将成为评判其内容生态建设能力的重要标尺。

]]>
AI 会取代UI吗?至少Stitch现在还不行 //m.clubpenjuin.com/380899.html Wed, 22 Apr 2026 06:08:55 +0000 //m.clubpenjuin.com/?p=380899

 

两天,我认真测了下刷屏的 Google Stitch

伴随着各种演示视频,网上再次充斥着“UI 设计师要彻底失业”的论调。为了看清它在真实设计链路里到底能跑多远,我做了三组连环测试,看看它放到真实设计链路里,到底能跑多远。

测完之后,我的核心结论其实很简单: Google Stitch 是目前顶级的“方案发散工具”,但它目前还接不了严谨的落地设计。

为了验证这一判断,我用 3.0 Flash 模型做了三组“套娃式”连环对比:

首页统一选择3.0Flash 模型

三组测评方向

测完后我发现,Stitch 的表现规律非常明显:越自由,它越强;越有约束,它越容易变笨

一、A 组:纯文本生成,往往是它表现最好的时候

先说 A 组。

这一组也是目前网上最容易刷到、最容易让人“哇塞”的部分:输入一段 prompt,页面几秒出图,酷炫的设计稿秒出。

C 端和 B端的提示词展示(注意:每一次的测试为了减少可能存在的影响因素,都是新开一个项目重新输入提示词的)

A 组针对 C端的纯文本生图

A 组针对B端的纯文本生图

我分别拿了一个 C 端首页和一个 B 端工作台首页测试,结果都不差:C 端首页的整体氛围、模块关系、视觉节奏都挺顺, B 端虽然还有排版瑕疵,但第一眼也已经有“成熟后台”的感觉了

A 组针对 C端的测评结果

A 组针对 B端的测评结果

把两个结果放一块展示下,为什么这一步 Stitch 表现最好?

A 组完整的测评结果

因为纯文本阶段,本质上是在做一件事:

从 0 到 1 找方向。

这个阶段没有原型约束,它可以自由组织页面结构、模块关系、视觉节奏和氛围感。

所以它特别擅长做这些事:

如果你的目标是:先看几个方向、先找感觉、先把页面氛围跑出来,那 Stitch 确实很好用。

一句话总结 A 组:Stitch 在“方案发散”这一步,确实很强。

二、B 组:一旦给低保真原型,它就开始从“设计”退化成“执行”

第二步,我把 A 组生成的页面抽成低保真原型,再喂回去让它按原型生成。

这一组是最关键的,因为它更接近真实工作场景。 真实设计里,很多时候并不是“完全从零开始”,而是基于现有的原型或者业务框架,有字段和模块的约束等等。

设计师的核心任务就是在约束下把页面真正设计好,而 Stitch 在这一步,问题就开始明显了。

B组针对 C端的关键词

B组针对 B端的关键词

C 端页面的问题

C 端页面还能做出来,但已经没那么聪明了。

先不谈页面的效果如何,最简单看功能是否完全按原型的来。对比发现,C 端页面在根据原型画图的过程中,局部细节会自己乱发挥

最明显的感受,页面留白变大了,首屏屏效明显是过低, 某些模块虽然“在”,但没有被真正设计好 。

也就是说,它不是完全不会做,而是:能把原型“做出来”,但还做不到把原型真正“设计好”。

B组针对C端的生图结果

B 端页面的问题

B 端这里问题更明显。它已经能把页面推到一个“70 分方向稿”的程度,但如果你认真看,会发现,模块之间的布局依旧有很大的优化空间,警告信息区占比不合理,很多地方仍然停留在“把结构摆出来”这一层。

这种结果在实际项目里是不能直接交付的,后面还得靠设计师自己去收整个版面信息布局。

B组针对B端的生图结果

这一步让我最确认的一件事就是:一旦进入“有结构约束”的阶段,Stitch 的能力会明显下降。

它不再像一个会主动思考的设计师,更像一个开始机械执行的工具。

而且还有一个现实问题是:

我这次喂给它的原型,已经算是很规整、很干净的版本了。真正项目里的原型,通常更乱、更碎、信息密度也更高。真把那种原型直接丢进去,效果只会更拉。

看下B 组原型生图的具体效果对比:

B组低保真生图效果对比

所以 B 组真正说明的问题是:它能把原型“做出来”,但还做不到把原型真正“设计好”。

三、C 组:高保真参考下,完成度会回升,但更像“重绘”而不是“重构”

第三步,我又拿 A 组里已经生成出来的高保真页面,让它继续做 redesign。

C组针对 C端的redesign关键词

C组针对 B端的redesign关键词

这一组的结果比 B 组顺眼很多,完成度也明显更高。

无论是 C 端还是 B 端,都能看出 Stitch 在高保真参考下更容易保住页面的整体气质、视觉统一性和完整度。

C组 针对C端的生图结果

C组 针对B端的生图结果

这说明一件事:当你给 Stitch一个已经比较成熟的视觉锚点时,它会做得更像样。

但问题也很明显:它更像是在做视觉重绘 / 风格迁移,而不是真正的深度 redesign,理解需求结构、判断主次关系等。也就是说,它会更“像”,但不一定更“懂”。

所以 C 组并不能说明它已经具备成熟的 redesign 能力,只能说明:在高保真参考足够完整的情况下,它能把结果做得更体面。

四、三组放在一起看,结论其实很清楚

如果把这三组测试放在一起看,Stitch 的能力边界就非常明显了:

A 组:纯文本生成

最适合做方案发散,最容易出亮点。

B 组:低保真原型约束

一旦进入结构约束,它就开始从“设计”退化成“执行”。

C 组:高保真参考 redesign

完成度会提升,但更像延续风格,而不是真正重构结构。

也就是说,Stitch 最擅长的,不是“接管设计”,而是在没有太多约束的时候,快速把方向跑出来。

这也是为什么它现在会让很多人产生错觉:“它是不是已经可以替代设计师了?”

其实不是,更准确的说法应该是:

它已经能极大强化设计流程中的“发散阶段”, 但在“收敛阶段”还远远不够稳定。

五、但还有一个很有意思的补充发现:它的“复刻能力”比“原型理解能力”更强

前面几组测试让我越来越确认:Stitch 不太擅长从原型出发,稳定地做出成熟页面。

但当我把任务换成另一种,不是让它“根据原型做设计”,而是让它“尽量复刻已有设计稿”,它的表现反而明显变强了。

比如我拿一张成熟的 B 端商家后台首页去测,发现它在这些方面的还原度都不低,左边是参考,右边是复刻的页面。

可以看到基本都复刻出来了,而且这个页面可以复制到 figma 里直接编辑。

页面复刻案例

这件事特别有意思。因为它说明:Stitch 未必擅长“理解原型”,但它很擅长“模仿结果”。

换句话说,它现在更像一个很强的页面生成 / 页面复刻工具,而不是一个已经成熟的原型到设计稿工具

不过这一点我不准备在这篇展开,因为它其实值得后续单独写一篇。

六、这对 UI 设计师意味着什么?

我测完之后,最大的感受不是“设计师安全了”,也不是“设计师完了”。

而是终于看清了:AI 会先重构设计流程里的哪一段。

目前来看,答案很清楚:Stitch显著增强的,是发散阶段。比如方案探索、概念稿生成、方向稿输出等等

Stitch暂时接不住的,是收敛阶段,比如复杂结构判断 、主次关系取舍 、真正可交付的设计稿精修

所以 Stitch 对 UI 的冲击当然是真的,但它先冲击的,不一定是“设计师”这个角色本身,而是设计流程里那些更偏生成、发散、方向探索、风格迁移的部分

而真正难被替代的,还是那部分:理解问题、组织结构、做取舍、最后收口。

最后

如果你最近也被各种“UI 要被替代了”的内容搞得有点焦虑,我想说的是:先别急着自己吓自己。

Stitch 现在最强的,还不是“替你完成设计工作”, 而是替你更快生成创意页面、发散方案。

至于真正难的那部分,这一天也许会到来,但在它真正到来之前,设计师还有一段不长不短的过渡期。

作者:B端设计情报局

]]>
2026福布斯AI 50榜单发布 //m.clubpenjuin.com/380890.html Wed, 22 Apr 2026 01:39:16 +0000 //m.clubpenjuin.com/?p=380890

 

人工智能已深度融入日常生活,在人们的工作、信息检索与创意表达中扮演着愈发核心的角色。过去一年,引领这场范式变革的初创企业从风投机构斩获巨额资金,打造出各色应用,服务于法律、软件工程、银行乃至音乐等各行各业数亿用户。AI热潮兴起三年,初创公司已开始证明,它们能将宏大构想转化为可持续的商业模式——这一点在聚焦全球最具潜力非上市AI企业的《福布斯》第八届人工智能50强榜单(AI 50)中,体现得淋漓尽致。

OpenAI、Anthropic等行业领军者依旧是榜单中的巨无霸,它们从硅谷顶级风投与科技巨头处获得前所未有的资金支持,据悉正筹备重磅IPO。这两家AI巨头累计融资2426亿美元,约占今年AI 50上榜企业总融资额3056亿美元的80%。产品的广泛普及推动它们的收入强劲增长:截至2月底,OpenAI年化收入据称超250亿美元;4月初,Anthropic宣布其收入运行率突破300亿美元。这两家AI实验室凭借Claude Code、OpenAI Codex等产品成为编程等市场的主导者,迫使估值293亿美元的Cursor等公司创新求存。

投身模型训练的不止这两家巨头。

总部位于旧金山的Physical Intelligence已融资10亿美元,通过人类远程操作员在厨房、卧室等真实场景控制人形机器人收集数据,训练机器人基础模型。法国初创企业Mistral不仅向思科等大型企业,还向欧洲政府机构销售其开源权重模型,本土背景成为其核心竞争优势。剑桥AI初创公司Suno则凭借音乐生成模型,瞄准整个创意产业。

本届榜单共有20家新上榜公司,包括估值80亿美元的Reflection,该公司正打造开源模型,欲与DeepSeek等公司抗衡;估值21亿美元的AI演示文稿工具Gamma,这家仅50人的公司年化收入已突破1亿美元;成立两年、估值13亿美元的Chai Discovery,正利用AI研发新药、加速药物开发;还有总部位于纽约的Rogo,约2.5万名银行家和投资者使用其AI软件进行数据分析。

榜单上还有四家女性领导的企业,包括前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)创立的Thinking Machine Labs(融资20亿美元),以及斯坦福传奇计算机科学教授李飞飞创办的World Labs(专注空间智能,融资超10亿美元)。此外还有估值40亿美元的Fireworks AI,该公司帮助开发者便捷地获取最新顶尖模型,无需担忧技术后端问题。

过去一年,AI行业格局发生巨变。2025年AI 50榜单中有三家企业或是被科技巨头收购,或是人才被巨头收编。数据标注公司Scale AI的CEO兼联合创始人Alexandr Wang转投Meta,牵头组建其超智能实验室;埃隆·马斯克的AI初创公司xAI被SpaceX收购,合并后实体估值达1.25万亿美元;谷歌斥资24亿美元收编AI编程初创公司Windsurf的联合创始人团队,并获得其技术授权;今年首次登榜、估值100亿美元的编程智能体公司Cognition,则收购了Windsurf剩余资产。

尽管行业整合不断,今年的AI 50榜单依旧竞争激烈。《福布斯》收到数百份申请,申请企业无需付费,评审团队通过量化算法与定性评估,从商业前景、技术实力与AI应用价值等维度综合评估。榜单鼓励企业披露多元化数据,旨在推动初创生态更趋公平。今年,《福布斯》还首次推出AI 50 Brink榜单,聚焦20家极具潜力的早期AI初创企业。

以下是值得关注的AI 50上榜公司

1. Anthropic

CEO:达里奥·阿莫迪

总部:旧金山

融资:600亿美元

成立时间:2021年

2月,Anthropic动作频频。先是推出可自动化常见业务流程的Claude Cowork,引发市场震动,导致SaaS、IT及法律服务相关股票市值蒸发2850亿美元。随后,其最新版编程模型Claude Opus上线,颠覆软件工程领域。再后来,公司又与美国政府发生公开冲突:因拒绝在自主武器与大规模国内监控相关安全保障上妥协,Anthropic被五角大楼列入黑名单。但这也让CEO兼联合创始人达里奥·阿莫迪成为AI界的英雄,OpenAI、谷歌等竞争对手纷纷为其发声。公司业务持续蓬勃发展,去年收入达45亿美元;2月,Claude超越ChatGPT,成为App Store下载量最高的应用。目前,Anthropic估值达3800亿美元。

2. EliseAI

CEO:Minna Song

总部:纽约

融资:3.92亿美元

成立时间:2017年

美国80%以上的大型物业管理公司使用EliseAI的聊天机器人,以高效处理维修请求跟踪、公寓看房预约、租约续签等重复性行政工作。2017年在纽约创立这家公司前,Minna Song曾在一家房地产公司担任前台,深知行业痛点。当时,她费尽口舌也难以说动投资者押注一家聚焦房地产领域的AI公司。但如今,35岁的Song表示:“现在我们去见投资人,反而是他们主动向我们推销合作机会。”2023年,公司拓展至另一关键行业——医疗,运用自身技术辅助保险核验、预约挂号及账单咨询等流程。

3. Gamma

CEO:Grant Lee

总部:旧金山

融资:9100万美元

成立时间:2020年

前投资银行家Grant Lee曾耗费数小时为PPT排版、设计图像。如今,他创立的Gamma只需用户输入简单文本指令,就能快速生成精美的金融行业幻灯片、社交媒体配图,甚至完整的网站。42岁的Lee回忆,2020年推出的首个版本反响惨淡,有投资人称它是自己“听过的最糟糕的创意”。但AI热潮彻底改变了Gamma的命运:公司自2023年起实现盈利,目前估值21亿美元。至少使用过一次其工具的用户已超1亿人,付费常客则超60万,月费从9美元到100美元不等。

4. Reflection

CEO:米沙·拉斯金

总部:布鲁克林

融资:21亿美元

成立时间:2024年

DeepSeek等中国AI企业的开源AI模型(底层代码对客户可见且可修改)全球领先,特朗普政府迫切希望扶持美国本土模型。总部位于纽约布鲁克林的Reflection成立仅两年,现已融资21亿美元,估值80亿美元,投资方包括英伟达、红杉资本、光速创投,以及小唐纳德·特朗普担任合伙人的1789 Capital。目前公司尚未公开发布自研AI产品,但正斥资数十亿美元在韩国建设数据中心,并为韩国企业开发定制AI模型。公司由前谷歌DeepMind研究员米沙·拉斯金(Misha Laskin)与约阿尼斯·安东诺格鲁(Ioannis Antonoglou)于2024年创立,二人曾主导Gemini早期研发工作。

以下为2026福布斯AI 50全榜单:

本文译自:https://www.forbes.com/lists/ai50/

翻译:Lemin&Elaine,编辑:Rashi Shrivastava,记者:Sofia Chierchio、Richard Nieva、Anna Tong

来源:福布斯

]]>
AI生成的界面太难看?试试这个开源项目Awesome DESIGN! //m.clubpenjuin.com/380885.html Tue, 21 Apr 2026 08:49:58 +0000 //m.clubpenjuin.com/?p=380885

 

最近Vibe Coding真的太火了。

越来越多人开始直接用 AI 写页面、搭产品、做官网,动动嘴就能出 UI,效率看着确实很爽。

但问题也很真实。

你以为AI会给你整出那种大厂味、极简风、质感拉满的界面,结果它一出手,像是把十年前的建站模板重新缝了一遍。

不是 AI 故意演你,问题其实很简单:你嘴里的“高级感”,AI 根本脑补不出来。

你觉得“像 Apple 一点”“像 Stripe 一点”“做得更有质感一点”,但这些话对 AI 来说都太虚了。没有明确的设计规则,它最后大概率还是只能靠自由发挥。然后你懂的,翻车现场就来了。

最近我刷到一个挺顶的 GitHub 项目,刚好就是来解决这个问题的。

它叫 Awesome DESIGN.md。

项目地址:github.com/VoltAgent/awesome-design-md

规范详情:https://getdesign.md

01. Awesome DESIGN是什么?

简单说,它就是一份写给 AI 看的设计规范。不是给前端开发看的,也不是给设计师交付用的,而是专门用来告诉 AI:这个页面应该长什么样。

它的逻辑很简单,就是把页面该怎么配色、用什么字体、组件长什么样、版式怎么排,全部整理进一份 Markdown 文档里。

AI 读完之后,就不是再靠感觉乱猜,而是会按照你给定的风格规则去生成页面。

说白了,这东西就是 AI 时代的设计说明书。

而且重点是,它不是插件,不是 SaaS,也不是那种点进去就开始收费解锁的套路产品。

它是免费、开源、现成就能拿来用的。

下方为部分设计规范展示

02. 如何安装?

Claude Code、Cursor、Codex、Trae 这类 AI 编程工具都能直接读取 DESIGN.md。你只要把文件放进项目根目录,再告诉 AI 按这份设计规范生成页面,它就能照着这套风格往下写。

如果还要更简单的方式就是直接把命令发给对应AI编程工具叫他帮你安装

https://hao.uied.cn/website/1218

如果还不了解AI 编程工具的可以看看我之前写的AI知识库

https://facomqeet1v.feishu.cn/wiki/YK3QwtWDciTsj6kraJScEGjDniS

这里使用Trae来进行案例展示其他AI编程工具类似操作

打开https://getdesign.md

选择自己需要的设计规范,这里我以苹果的为例。其他同类型

复制命令给AI编程工具让它来安装

安装完会显示在你的文件根目录(显示有就是安装成功了)

如果你觉得让AI安装太慢可以直接自己复制到DESIGN.md

替换到这个DESIGN.md就行。

03. 如何使用

告诉 AI 助手使用它在你的 AI 编程助手中输入:

仅做测试,具体能力也要看大模型本身

请根据项目根目录的 DESIGN.md 文件,为我构建一个后台页面。

效果展示(大模型kimi)

04. 如何将生成的html或者web网页转为figma源文件

打开你需要转为figma的html文件

Web to Design 浏览器插件安装教程

https://facomqeet1v.feishu.cn/wiki/LJL6wBolJiZPBEkFLhEc9ka2nxc

安装好后点击打开工具条

执行复制页面

在figma画布中执行ctrl+v即可

写在最后

整体效果看起来比没用规范之前好看多了,但还差点意思,进步空间还是挺大的。

基本就是AI做的页面,至少告别了“廉价外包感”,直接看起来像是某个大厂的水平,简约有质感,但还是能感觉到跟真正大厂的精细度有差距。可能是细节和小调整的地方还没到位,所以整体风格不错,但还不能完全满分,想要完全做到完美,可能还得进一步优化。

作者:Tomda

]]>
AI斩杀线,Anthropic还要制造多少条? //m.clubpenjuin.com/380874.html Tue, 21 Apr 2026 03:52:06 +0000 //m.clubpenjuin.com/?p=380874

 

又一家明星公司,被Anthropic无情“斩杀”。

4月18日,Anthropic发布新产品Claude Design。用户可以通过它创建网页或App设计方案,包括交互式原型、产品功能图等,也可以制作演示PPT、线上活动落地页、营销素材等,功能非常丰富。

所有这一切,用户通过对话就能完成,而非一板一眼寻找素材、搭建页面。此外,用户还可以把生成的内容一键打包到Claude Code生成代码。

新产品一出,首当其冲的自然是仍在走传统路线的设计软件公司。当天的美股交易中,美国最大的设计软件公司Figma股价大跌近7%。

Figma成立于2012年,十余年间成长为全球UI设计的主流工具。2022年,Adobe计划以200亿美元收购Figma,震动全球软件圈。不过,在多国监管机构的干预下,这笔惊天收购最终告吹。

2025年7月,Figma在纽交所上市,首日市值高达680亿美元。然而,在AI浪潮及其他因素的影响下,Figma股价一路走低。

Claude Design的横空出世,又给了处于低谷的Figma沉重一击。如今,Figma市值已经不足100亿美元,股价相比52周高点跌去近90%。

Figma并不是第一家被Anthropic斩落马下的公司。

今年1月以来,Anthropic推出了一系列新产品、新功能,面向多条传统赛道,导致相关公司股价重挫,发展前景蒙上阴影。法务、金融、营销、设计、安全、自动化……Anthropic兵锋所及之处,那些赫赫有名的玩家几乎没有抵抗之力。

有些时候,Anthropic端上来的“新菜”远未完善,商业化更是无从谈起,并没有显露替代原有产品的潜力。即便如此,资本市场依然会用脚投票,而整个行业也会因为Anthropic的入局而陷入普遍焦虑。

Figma遭到Anthropic“偷袭”的背后,一条“AI斩杀线”正在愈发清晰:那些看似坚不可摧、稳如磐石的公司和赛道,在AI浪潮下竟然一击即破,溃不成军。

01

在软件设计领域“斩杀”Figma,是Anthropic过去四个月横扫传统行业的缩影。

今年1月底,Anthropic发布Claude Cowork插件包,包含法律、销售、财务、市场营销、数据分析等领域的11款插件。这些插件把不同领域的工作流融入Agent中,用户只需以自然语言下达指令,就能快速完成一整套操作。

以往,用户需要调用不同的第三方软件,并掌握相应的软件使用规范,才能通过一番复杂操作得到结果。如今,在插件的帮助下,这些工作都被AI代劳了。

以法律插件为例,Claude Cowork有了这款插件的加持,可以自动完成合同检阅、合规审查、法务简报等工作,大大减轻了企业法务人员的工作量。企业需要的法务少了,对于第三方法律类软件的需求也降低了。

随着涟漪传播到更多领域,“Anthropic斩杀”正式开始。

1月底、2月初,美国股市刮起风暴,软件股成为重灾区。

据“量子位”统计,仅2月3日当天,提供法律检索服务的汤森路透就大跌16%,创公司史上最大单日跌幅;法律科技公司CS Disco下挫12%;标准化法律服务商LegalZoom大跌20%。

随着恐慌继续蔓延,越来越多的软件股卷入其中,Adobe、Salesforce、Atlassian等均出现下跌。一天之内,高盛编制的一篮子美国软件股下跌6%,金融服务公司指数下挫接近7%。

几个小时内,这些股票的总市值就缩水了2850亿美元。另据路透社统计,不到一周,美国软件和服务股的市值蒸发近8300亿美元,几乎与OpenAI的估值相当。

有人在社交媒体上评价:“Anthropic发布了11个插件,纳斯达克就慌了。为什么?因为第一次,一家基础模型公司无视了API层,直接吞噬了应用层。……如果模型能直接干活,那软件就一文不值。”

更震撼的是,Claude Cowork上线于1月12日,半个多月后就推出了这些插件。仓促赶工、略显毛糙的几个插件,已经足以横扫软件行业,而Anthropic对于插件生态的挖掘和推广,远不到1%。

软件股的暴跌,迅速引来了空头。截至2月中旬,各路对冲基金通过做空软件股,已经赚了240 亿美元。

当月下旬,又一场“Anthropic斩杀”来袭,这一次的受害者是安全软件。

20日,Anthropic发布代码安全工具Claude Code Security。这款工具被集成到Claude Code中,能够像人类安全研究员那样,主动理解、识别和定位漏洞,而非仅仅按照规则库匹配漏洞。同一天,CrowdStrike、Cloudflare等网络安全股集体重挫。

但这场“斩杀”远未结束。

4月初,Claude Mythos Preview正式亮相。Anthropic宣称,尽管新模型并未为了安全而生,但它挖掘与利用漏洞的效率约为前代模型的十倍。为了避免被滥用、冲击网络安全,公司决定暂时不公开发布,而是先提供给数十家关键基础设施和头部科技公司使用。

不难想象,倘若Claude Mythos Preview全量开放,安全公司的传统商业模式面临崩塌,将面临前所未有的生存压力。

更多“武器”已经或即将亮相:Cowork定时任务,Claude Code Channels,Claude Managed Agents,等等。Anthropic每一次出手,都会让一批公司、行业和投资人风声鹤唳。

这也是“Anthropic斩杀”的可怕之处:

Anthropic从未把刀锋指向某个垂直行业,也没有把某一家软件公司作为敌手;但它随便挥舞大棒,就能轻松扫倒一大片人。别人不仅无从防御“Anthropic斩杀”,甚至难以判断下一场斩杀何时会发生、发生在哪里。

02

Anthropic为什么能够不断制造“斩杀线”?

关键原因就是AI一个顶十个,性价比爆棚。

大公司的主要成本项之一就是买软件,更确切地说,是购买第三方SaaS服务的账号。规模越大、员工越多的公司,需要买的账号就越多。

以法律服务为例,汤森路透旗下的WestLaw是全球最大判例和法条数据库之一,几乎是美国法律从业人员的必备工具,其收费标准分为不同档次,主流档位为每月每人300~400美元。对于大量中小律所而言,这是一笔颇为沉重的负担。

如今,有了Claude Cowork的法律插件,律所就可以省下一大笔费用,甚至砍掉一些专门从WestLaw查资料的初级岗位,进一步压缩成本。

至于工作能力,AI同样不遑多让。在Claude Opus 4.6模型的支撑下,上述插件在BigLaw Bench法律推理基准测试的得分为90.2%,足以满足日常工作要求。

又比如,在安全领域,Claude Code Security在生产级开源代码库中,发现了超500个此前未被检出的漏洞。一些漏洞存在了数十年,专家审查并未发现。

Claude Code Security之所以如此强悍,关键在于它模拟了真人安全测试人员的工作方式:理解代码库,追踪数据流动方式,分析组件交互逻辑,最后发现规则库难以覆盖的复杂漏洞。

随后,AI会尝试证实或证伪每一项检测结果,过滤误报,并为每个漏洞分配严重性评级和置信度评分,再把所有发现和修复建议呈现在仪表盘中供安全团队审查。

相比之下,大多数安全软件还停留在规则库匹配的基本框架里。倘若维护不及时,规则库难以覆盖所有漏洞,安全软件的性能就会大打折扣。

刚刚被冲击的Figma,面临的则是从内到外的产品力超越。

根据Anthropic的介绍,Claude Design可以提前读取用户的代码库和设计文件,以便在进行新设计时保持同样的规范和标准。用户可以使用自然语言进行设计、微调,并将最终成果一键打包,传递给Claude Code,进行下一步的工作,彻底打通设计与开发。

相比之下,Figma的AI原生能力弱得多,各种操作远不及Claude Design方便。此外,用户需要投入时间和精力进行学习,才能上手使用Figma;人人都可以用Claude Design设计产品,且与编程环节无缝衔接,Figma却很难做到这一点。

由此可见,Anthropic的“斩杀”,并不是单纯地以AI工具取代传统软件,而是融合了技术、产品、生态与成本优势的“组合拳”。

Anthropic并不讳言这种愈演愈烈的“斩杀”。

就在Figma被Claude Design重锤的同时,Anthropic CEO达里奥-阿莫迪公开表示,AI将在未来五年内,取代最多50%的初级白领岗位。他认为,行业不能淡化这种冲击,必须让AI带来更大的正面价值。

此外,Anthropic在3月初的一份报告中表示,程序员的日常工作中,已有约75%的任务可以被Claude覆盖。此外,客服代表(70%)、数据录入员(67%)等岗位也面临类似状况。

倘若大代替真的发生,被取代的显然不仅仅是人,也会包含从事这些业务的公司。美国软件公司被集体“斩杀”,只是这场大代替的外在表现之一。

03

扮演“杀手”角色的,并非只有Anthropic。

每当大公司发布重磅AI新品,总是会有一批传统公司的生存根基面临挑战,甚至被严重动摇。

以影视行业为例,字节去年底推出Seedance 2.0视频生成模型,成品效果几乎赶上了“手搓”视频,制作周期只需几天,成本却从动辄数十万元压缩至几千元甚至几百元。传统影视行业沿袭百年的工业化流程面临重塑,随之而来的将是一大批制作公司的消亡。

更可怕的是,字节及其他公司仍在快速迭代新模型,比如阿里近期推出的Happy Horse,已经在部分指标上超越Seedance 2.0。AI视频反超“手搓”视频,只是时间问题。

又比如,谷歌2月初发布世界模型Genie,只需要一段话、一张图,就能快速构造可交互、可漫游的虚拟世界。外界很快意识到Genie对游戏制作的影响,Unity、Roblox、Apploving等公司股价随即大跌。

具备“斩杀”能力,是一家AI公司推高估值的手段之一。它意味着,AI公司具备摧毁一个旧行业、塑造一片新市场的惊人能力,并从中切走最大的蛋糕。

截至目前,四处“斩杀”的Anthropic,估值已逼近8000亿,相比两个月前的3800亿美元,增长超过1倍。能够以AI技术创新“吸收”旧行业的价值,是这一估值的重要支柱。

不过,Anthropic的“斩杀”虽然凶猛,却也很难瞬间摧毁一整个行业。

从成本上看,使用AI取代传统工作流,虽然可以省下不少SaaS订阅费,却也需要承担不菲的token费用。两者相抵消后,未必能够让企业省多少钱。

尤其是那些需要频繁调用Agent的应用场景,token消耗速度极快。据“极客公园”报道,有人体验 Claude Design 后发现,仅仅是构建设计系统、搭建原型网站、再做几次调整,就已经消耗了超50%的每周配额,需要额外付费。

另一方面,被Anthropic“斩杀”的企业,也有长期沉淀、不容易被复制的优势。

SaaS之所以收费高昂,并非仅仅是软件有多么好用。相反,大多数SaaS软件的UI和交互停留在十年甚至二十年前,体验十分糟糕。

即便如此,仍有大量企业愿意为之付费,关键是SaaS服务商千锤百炼的数据、规则、范式、工作流等综合能力。像Figma这样的公司,其产品迭代十余年,每一个功能改进都是基于万千用户的体验和需求,并不是AI能够全盘复制。

此外,传统SaaS公司的真正长板是解决方案,而AI大模型更擅长单点突破,两者并非完全重叠。

以安全软件为例,Claude Code Security表现出色,但企业对于网络安全的要求,显然比“查漏洞”复杂得多。第三方安全公司能够提供的,往往是量身定制的解决方案,而非单一的产品;其能力更加全面和系统,绝非单一AI模型所能比拟。

一些投资机构也持有这样的看法。巴克莱此前一份研报指出,Claude Code Security本质上是一个开发者安全工具,不构成对网络安全公司的直接竞争。后者的核心业务,如端点防护、身份管理、网络安全、威胁情报等,与代码漏洞扫描有明显的功能差异。

AI与传统软件并不一定是取代,更有可能的是融合。传统SaaS服务商都在积极拥抱AI,而AI工具在炫技之余,也需要与SaaS平台合作,以触达更精准的用户群。

这也意味着,被Anthropic“斩杀”的各个走出最初的恐慌后,市值和信心都有机会迎来修复。特别是那些龙头企业,反而有很大机会从AI中获利。

不过,长期来看,随着AI工具在越来越多场景落地、用户心智越来越强,被“斩杀”行业再也回不到过去了。身处其中的企业除了争夺客户,也更要争夺AI大模型的青睐——谁与AI大模型结合得更好,谁才能继续活下去,而非被AI公司逐渐淘汰。

新时代对旧时代的“斩杀”,已经发生在智能手机vs.功能机、新能源汽车vs.燃油车、短视频vs.中长视频等领域。如今,轮到AI和SaaS了。

作者:彦飞 编辑:王靖

来源:字母榜

]]>
AI视频三国杀:阿里逼宫,字节开放 //m.clubpenjuin.com/380712.html Wed, 15 Apr 2026 03:21:04 +0000 //m.clubpenjuin.com/?p=380712

 

“快乐马”后发赶超,阿里截胡快手字节。

4月14日,字节跳动旗下火山引擎正式上线Seedance2.0 系列API服务,企业和个人用户都可调用其视频生成能力。

早期,上述服务需要高额预付、动辄千万级“最低消耗”。

算力足够的情况下,API大面积开放几乎算是大模型商业化的主引擎。但有意思的是,近期被不少用户诟病排队时间长、变相涨价背刺用户的Seedance2.0,怎么突然就全面开放API了呢?

这背后,或许有上周爆火的HappyHorse的推动。

4月7日,HappyHorse以匿名身份空降权威AI平台Video Arena盲测榜单上。在图生视频(无音频)榜单上,它拿到1411分登顶,把Seedance 2.0甩出约55分;在文生视频(无音频)一栏,1379分同样排在字节跳动Seedance 2.0、快手可灵AI 3.0、昆仑万维SkyReels V4等公开产品前。

三天之后,阿里官方出面认领了这匹“千里马”。

今年3月34日, OpenAI 宣布关停 Sora,所有人都以为,Seedance 2.0 要在AI视频生成模型领域一统天下,阿里却出其不意,截胡字节Seedance与快手可灵。

AI视频生成模型这一赛道,三国杀格局雏形初显,而且中国公司在全球拿下了主导权。

OpenAI退场,中国大厂上位

2024年以来,AI视频生成模型之所以能实现从“玩具”到“工具”的质变,其核心驱动力在于底层技术范式的根本性转变——从基于海量数据统计的模式匹配,升级为对物理世界规律进行模拟与理解的“世界模型”。这一转变解决了此前技术无法逾越的两大鸿沟,即物理合理性与长期一致性。其中,长期一致性更是实现影视级应用的前提。

据媒体报道,HappyHorse用一个统一的Transformer同时处理视频和音频,一次推理直接输出带声音的成片,不需要后期拼接。这种有点特别的技术架构(单流Transformer架构),对提升长期一致性很有优势。

统一的 Transformer直接处理长序列的混合Token,其自注意力机制能够捕捉视频帧与音频帧之间长距离的依赖关系。

这比用多个独立模型分别处理再协调要简单直接,减少了信息在模块间传递的损耗,理论上更有利于维持长时序的连贯叙事。

根据Artificial Analysis的评测指标(满分5分),HappyHorse在物理一致性方面得分为4.52,视觉质量得分为4.80,文本对齐得分为4.18。这表明其在基础一致性方面表现良好,但在复杂场景下的长期一致性仍有提升空间。

不过参考Sora的经验可知,长期一致性表现好≠商业可用性表现好。

根据央视财经的报道,Sora在实际应用中,其长期一致性高度依赖大模型的“记忆”能力, 商业可用率极低,仅5%-10%的生成视频能用于初步筛选,更像一个不可控的“抽卡游戏”。

Sora的关停,也并非源于技术升级的困难,而是一笔算不过来的经济账。据Appfigures估算,Sora上线以来的应用程序内总收入仅约210万美元,投入产出比接近2500:1,堪称AI史上最昂贵的“技术烟花”。

硅谷风投机构a16z合伙人Olivia Moore曾在社交媒体晒出SensorTower的监测截图,显示Sora APP的30天用户留存率为1%,60天留存率0%。如此低的留存率,显然不符合商业应用的要求。

AI发展到了今天,资本对无法变现、耗资巨大的技术突破态度已经足够理智,甚至是冷酷了。所以,正在筹备上市的OpenAI只能关停Sora,并退回和迪士尼的10亿美元合作款项。

而且OpenAI也需要集中精力继续推进世界模型的研发。毕竟从某种意义上来说,并不存在单独的视频大模型,视频大模型更像是是世界模型和多模态技术融合进程中的阶段性里程碑。

目前顶级的视频模型几乎都基于DiT架构,这个架构的前身是图像生成 Diffusion,下一步很可能就是Omni-Model。视频只是这些模型在时间维度上插了帧,并在数据清洗时喂入了大量物理世界因果片段。

做视频,是验证时空预测能力的最低门槛。能做出视频大模型的公司,理论上也可以把这种技术用来研发其他垂直领域的大模型 ——如果有足够多优质的真实数据用来训练。

阿里的目标,显然也不只是做出一个受欢迎的视频生成工具。

AI视频大有潜力

视频是AI大模型很好的垂直应用方向,因为从流量逻辑看,视频是AI目前唯一能无缝嵌入娱乐、社交、电商三大现金牛领域的模态。

ChatGPT(文本)的月活是亿级,TikTok(视频)的日活是十亿级。人类天生就懒于阅读文字,乐于消费视频。字节能深入所有互联网巨头的业务腹地,也是因为它抓住了视频这个关键点。

抖音上的视频流数据,涵盖人物行为、物体运动、场景交互等多维度的动态信息,每一帧都是真实世界规律的记录。用这种优质数据训练出的垂直应用AI,很容易就赢在起跑线上。

根据极客公园测算,Seedance2.0生成15秒视频的可用率或达到90%,相较此前行业内大概20%的平均值,提升幅度较大。技术实力与商业可用性的双重提升,让Seedance2.0的爆火很容易理解。

而且Seedance 2.0的商业化推进,节奏感极强。先用“宠物猫狗暴揍哥斯拉”等病毒式模板引爆社交媒体的全民二创热潮,完成零成本的流量引爆和用户教育,在口碑和需求双双达到顶峰后,立即启动商业化变现。

3月4日,火山引擎公布商用定价:包含视频输入的场景28元/百万tokens,不含视频输入46元/百万tokens,折合纯视频生成成本约0.95元/秒。

紧接着,字节采取差异化定价面向市场、降低门槛开放公测的策略,于4月2日正式面向企业用户开放API申请。至此,Seedance2.0完成了从网红AI玩具到企业生产工具的身份跃迁。

这也验证了AI产业投资逻辑的变化,无论是公司内部的资金还是外部的资金,都会流向更能垂直应用、快速变现、贡献ROI的地方。B端和C端的用户在付费时,也同样遵从这个底层逻辑。

一个值得注意的细节是,HappyHorse原生支持英语、普通话、粤语、日语、韩语、德语、法语的唇形同步,这很可能是为了让HappyHorse生成的视频能进入到电商(包括跨境电商)等实际应用场景中。

毕竟张迪作为快手可灵和阿里HappyHorse之父,不仅懂技术,也很懂业务(这一点从他的职业履历就能看出),天然就擅长把业务思维带入到HappyHorse的技术研发中。

一个佐证是,快手可灵的商业化效果已经有了财报数据支撑。2025年第四季度,可灵AI营业收入达到3.4亿元;2025年12月单月收入突破2000万美元,年化收入运行率(ARR)达到2.4亿美元。

而且,HappyHorse所属的阿里ATH创新事业部,早已喊出“创造Token、输送Token、应用Token”的口号。这种以“Token消耗量”为核心KPI的组织设计,决定了其下所有技术尝试,其实都会落脚在商业化应用上。

和Seedance 2.0一样,HappyHorse从匿名冲榜到官宣认领,再到计划开放API、接入阿里百炼MaaS平台,商业化推进的节奏也非常快。

考虑到HappyHorse团队负责人郑波同时兼任阿里妈妈CTO,未来HappyHorse的应用很可能要与电商业务深度绑定。

不止工具,生态协同

让AI与原本的核心业务深度协同,带来更大的生态繁荣,是现在每个互联网巨头都看重的事。除此之外,阿里还有一个多年的心愿,即打造流量入口,反哺电商等核心业务。

理想情况下,HappyHorse可以同时踩中这两个关键点。

作为视频生成工具,HappyHorse可以应用于商品广告、虚拟主播等电商业务场景中。如果还能在AI内容生成的源头占据一席之地,就能为电商交易等业务提供内生流量,从而构建“内容-交易-履约”的完整闭环。

这并非毫无根据的想象,毕竟Seedance2.0已经杀入电商领域了。

4月2日,AI Agent 公司 NoDesk AI 发布旗下产品 DeskClaw 新版本,正式接入Seedance2.0。这是 Claw 赛道先一步明确聚焦垂直电商、也是电商领域首批接入 Seedance2.0 的 AI 产品。

对于大部分的投资者和从业人员来说,阿里作为电商一哥,似乎没有理由做不到类似的事情。

HappyHorse这种阿里系视频生成工具的出现,某种意义上来说是符合公众预期的,毕竟,让商家可以在电商平台上直接用上稳定、可靠的视频生成工具,才是逻辑最顺畅的做法。

而内容生态领域,只要HappyHorse足够稳定、可靠并且便宜,同样可以杀出一片天地来。

对大部分的内容创作者来说,成本可控是非常重要,并不只是简单的价格高了或者低了的问题。

无论是个人UP主、小型工作室还是MCN机构,其内容生产都有预算和周期。一个价格频繁波动、排队时间无法预估的工具,会直接打乱整个生产计划,让项目无法报价、无法按期交付。

Seedance2.0现在恰恰就有这样的问题和风险。一方面,高峰期普通用户排队可达8万人,等待时间超过7小时,即便是付费高级会员也难以幸免。

另一方面,即梦平台在短期内连续调价,据说制作一部2分钟AI漫剧的纯素材生成成本,已经从最初的约7元飙升至80元,击穿了许多中小团队的商业模式底线。

“字节在年费之上推出vvip等升级服务,算是变相提价了,就是因为Seedance一家独大”, 有用户向《财经故事荟》吐槽,“现在HappyHorse上线,估计字节要掂量掂量了。”

只要HappyHorse质量稳定,又能做到体验好、定价低,就可以从竞争对手那里挖到到一批有真实内容生成需求的客户了。或许聪明的阿里云销售,已经开始接触火山引擎的客户了。

字节今天放开Seedance2.0的API接入,就是在主动降低用户的使用门槛,有了HappyHorse这个对手,接下来双方大打价格战,也是大概率事件。

字节、快手、阿里三国杀,模型能力你追我赶,算力成本稳中有降,让越来越多的中小创业者可以享受到技术普惠的红利,也能快速引爆市场——这才是我们想看到的AI时代。

作者:陆小鹿

来源:财经故事荟

]]>
Superpowers:145k Star的AI编码框架,到底是什么来头? //m.clubpenjuin.com/380616.html Mon, 13 Apr 2026 01:43:24 +0000 //m.clubpenjuin.com/?p=380616

 

讲真,我第一次看到superpowers这个项目的时候,脑子里冒出来的第一个念头是:谁会给自己的开源项目起这么中二的名字?

结果一查数据,我沉默了——145k stars,12.4k forks,常年霸占GitHub Trending。这个叫obra的开发者,到底做对了什么?

今天咱们就来聊聊这个”超级能力”框架。

一、Superpowers是什么?

superpowers是一个代理技能框架和软件开发方法论,专门为AI编码代理设计。它的核心思路很简单:不要让AI直接写代码,而是先让它学会怎么做一个合格的软件开发工程师。

项目作者是obra(Jesse Vincent),全栈开源,MIT协议。目前支持Claude Code、Cursor、Codex、OpenCode、GitHub Copilot CLI和Gemini CLI等主流AI编码工具。

听起来像是一个”AI编程规范”,但实际上它的野心更大——要成为AI编码代理的”操作系统”。

二、用户规模和营收情况

这是一个开源项目,没有商业化,所以没有直接的营收数据。但从GitHub数据可以看出它的影响力:

指标 数据
Stars 145k
Forks 12.4k
Watchers 612
最新版本 v5.0.7(2026年3月31日)
贡献者 持续增长中

作为一个编程工具类开源项目,145k的star数已经超过了VS Code官方插件库里的绝大多数项目。这个数字说明什么?AI编程赛道真的火了,而且开发者愿意为”好的方法论”买单。

不过需要说明的是,superpowers目前没有商业化版本,主要靠社区维护。如果你想要商业支持,可能需要自己对接。

三、核心功能有哪些?

这是重点。superpowers的核心是一套7步工作流程,每一步都有明确的输入输出和执行规范:

1. brainstorming(头脑风暴)

在写代码之前,AI代理会先和用户对话,通过提问来”精炼”那些模糊的想法。它不是直接开始写,而是先把设计拆解成小块,展示给用户确认。

核心问题:用户真正想做什么?

2. using-git-worktrees(隔离工作空间)

设计批准后,AI会创建一个隔离的Git worktree,确保实验性代码不会污染主分支。同时验证基线测试是干净的。

核心问题:我们的代码基线干净吗?

3. writing-plans(任务分解)

这是最关键的一步。AI把工作分解成小任务,每个任务2-5分钟,包含确切的文件路径和验证步骤

核心问题:任务是否足够小,让一个”缺乏判断力的初级工程师”也能执行?

4. subagent-driven-development(子代理驱动开发)

每个小任务派发给子代理处理,AI代理变成”项目经理”,负责协调和审查。引入两阶段审查机制。

核心问题:子代理是否按计划执行?

5. test-driven-development(TDD测试驱动)

强制执行RED-GREEN-REFACTOR循环。先写测试,再写实现,这是superpowers的核心原则。

核心问题:测试通过了吗?

6. requesting-code-review(代码审查)

任务间的持续审查,按严重程度分类报告问题。不是最后一次性审查,而是边做边审。

核心问题:代码质量达标了吗?

7. finishing-a-development-branch(完成开发分支)

最后一步,验证所有测试,提供合并或PR选项。

聊完这7步,你会发现superpowers的本质:它不是在帮AI写更好的代码,而是在帮AI建立更好的开发习惯。

四、面向的人群有哪些?

superpowers主要面向以下用户:

用户类型 使用场景 收益
AI编程工具用户 使用Claude Code/Cursor等工具的开发者 把AI变成真正的”开发搭档”而不是”代码生成器”
技术团队负责人 规范团队AI编程流程 确保AI产出的一致性和可维护性
AI应用开发者 构建自己的AI编码代理 参考其方法论设计自己的框架
开源爱好者 贡献代码或参与社区 学习先进的AI编程实践

如果你只是一个普通开发者,偶尔用用GitHub Copilot写点小工具,superpowers可能有点”杀鸡用牛刀”。但如果你每天都在和AI编程打交道,它能帮你把工作效率提升一个档次。

五、应用场景有哪些?

基于7步工作流程,superpowers适合以下场景:

1. 大型代码库重构

superpowers的”任务分解”机制特别适合处理复杂重构。每个任务小到2-5分钟,可以随时暂停、审查、回滚。

2. 新项目初始化

从brainstorming开始,确保你在写第一行代码之前就想清楚了要做什么。

3. Bug修复

systematic-debugging技能提供了4阶段的根因分析方法,比”不断试错”高效得多。

4. 代码审查

无论是AI写的还是人写的,都可以用superpowers的审查流程过一遍。

5. 团队知识传递

把superpowers的规范引入团队,让每个成员都用同一套方法论和AI协作,减少”AI写的代码只有我自己能看懂”的问题。

六、和同类竞品的差异有哪些?

AI编程辅助工具现在有很多,superpowers的差异化在哪里?

工具 定位 核心特点 superpowers的差异
Claude Code 官方CLI工具 开箱即用,交互简单 superpowers是它的”方法论插件”
Cursor AI代码编辑器 注重实时补全和聊天 superpowers提供工作流程框架
GitHub Copilot IDE插件 注重代码补全 superpowers提供完整的开发方法论
SWE-agent 自主编程代理 注重端到端任务完成 superpowers强调人的参与和审查
Devin 全流程AI工程师 端到端自动化 superpowers强调人机协作而非全自动化

说白了,superpowers不做AI编程的”替代者”,而是在帮AI变成更合格的”工具人”。它假设AI代理是”缺乏判断力的初级工程师”,需要人来把控方向。

七、有哪些使用技巧?

技巧1:从”提问”开始

安装superpowers后,新会话开始时不要直接说”帮我写功能”,而是问”帮我规划一下这个功能”。superpowers会自动触发brainstorming流程。

技巧2:学会”否定”

在brainstorming阶段,如果AI的提议不对,要明确说”不,这不是我想要的”。它的设计就是让你不断纠偏,直到双方达成共识。

技巧3:利用git-worktree隔离实验

想在主分支之外尝试新想法?superpowers会自动创建worktree,确保主分支不受污染。

技巧4:TDD不是可选的

superpowers强制执行RED-GREEN-REFACTOR。如果你跳过测试直接写代码,它会提醒你。

 技巧5:支持多工具

superpowers不绑特定工具。如果你用Claude Code,可以用官方插件安装;如果用Cursor,搜索插件市场即可。

八、对于企业和个人的价值

价值维度 个人开发者 企业团队
效率提升 减少”AI写了我发现不对”的情况 统一团队的AI编程规范
代码质量 通过TDD确保测试覆盖 通过审查流程把控代码质量
知识沉淀 形成自己的开发方法论 形成团队级别的AI使用规范
学习价值 学习先进的开发理念 减少AI编程的”试错成本”

对于个人来说,superpowers更像是一套”AI编程最佳实践”,帮你建立更好的开发习惯。对于团队来说,它是把”AI编程经验”从个人层面上升到组织层面的工具。

不过需要提醒的是,superpowers目前没有商业化支持,企业使用需要自己维护和定制。

九、产品定价是怎样的?

免费,开源,MIT协议。

没有免费版和付费版的区别,所有功能都开源可用。

版本 价格 功能
开源版 免费 全部功能
商业支持 暂无 需要自己对接

如果你需要商业支持或定制开发,可能需要直接联系作者或社区。

十、官网和项目地址

资源 链接
GitHub仓库 https://github.com/obra/superpowers
Claude Code插件 `/plugin install superpowers@claude-plugins-official`
Cursor插件 插件市场搜索”superpowers”

说实话,superpowers让我对”AI编程工具”这个赛道有了新的认知。之前我总觉得这类工具就是”AI写代码,人来审查”,但superpowers告诉我:AI不是来替代人的,而是来执行人的意志的。 它把”做什么”和”怎么做”分开了——人负责做决策,AI负责执行。

这套方法论是否完美?不一定。比如对于快速原型开发,superpowers的流程可能太重了。但对于追求代码质量和可维护性的团队来说,它提供了宝贵的框架。

]]>