青瓜传媒

如何做好小红书达播BD？

青瓜传媒 — Fri, 08 May 2026 00:45:25 +0000

小红书达播合作是一门精细活，从选品策略到直播脚本撰写，再到达人筛选与流量转化，每个环节都暗藏玄机。本文将深度拆解达播全流程，揭秘如何通过逆向选品、精准脚本设计和达人匹配策略，实现高ROI的直播带货效果。

01.小红书达播合作全流程

1.1 合作前的准备

1.1.1 梳理达播合作货盘

1.1.1.1. 在梳理达播合作货盘的时候，需要学会算账，计算好相关利润空间；

1.1.1.2. 达人在选品的时候，比较看重的 4 个维度；

在梳理达播合作货盘的时候。可基于这 4 个维度进行逆向选品；

1）产品外观

产品外观包括但不局限于包装、赠品数量等，这些需要在直播间及链接里进行呈现；

其次，需要注意色差，避免产生售后问题；

最后，一些功能性产品可通过小实验、效果对比等进行演示，可视化表达产品卖点；

2）品类丰富

3）价格价值

假设达人在直播的时候，偏向于强调价格的话，可合作一些需要冲销量的产品；

假设不是的话，则可侧重产品的附加价值，e.g. 产品背书、赠品等；

4）质量保证

品控是跟达人合作的基础，品控做不好的话，容易影响后续与达人的合作，导致没有达人愿意跟自己合作；

1.1.2 撰写产品手卡及直播脚本

1.1.2.1. 产品手卡及直播脚本需要包含这些信息，

品牌背景
产品类型
产品特点
产品使用方法
产品效果
应用场景
目标人群
商品原价
直播间优惠价格
历史最低价格
赠品
买 1 发几
赠品价格
优惠券的数量
优惠券的面额
满减
宠粉活动
……

1.1.2.2. 跟达人合作的时候，可给达人提供这些图片，

产品日常价的图片，在突出直播间优惠力度大的时候，可作为背书
产品日常的一些赠品，可突出直播间的福利/赠品优势大
产品对比去年这个时间段的价格，可突出今年的优惠力度非常大
……

1.1.2.3.在撰写直播脚本的时候，可整理产品相关的爆款内容，从爆款内容里提炼产品的核心卖点，以及目标用户的痛点；

1.1.2.4.在介绍产品的时候，可用一些其他背书作为辅助，e.g. 直播间已经卖了 xx 件、零差评、知名博主 xx 推荐过、xx 明星同款等；

1.1.2.5.在直播的过程，可借助一些道具、实验来可视化表达产品卖点；

1.2 寻找合适的达人

小红书现在直播达人并不多，且大多是纯佣为主，所以在筛选上不需要花太多时间，只需要大致适配即可，不需要像筛选合作博主一样；

当然，假设产品成本比较高的话，还是推荐好好筛选一下，避免被骗产品。

1.2.1 达播筛选维度

粉丝人群：找到与自己产品用户相匹配的价格带/年龄段/生活场景；
流量能力：粉丝量级并不能代表达人的流量规模，需要侧重关注达人直播时候的流量数据与流量结构；
在线人数：在线人数可预估订单数，推荐选择在线人数多的达人合作；
直播能力
……

1.2.2 如何与达人建联？

其实小红书直播达人建联语博主建联逻辑跟方式是一样的，所以在这儿就不展开阐述啦，可自行回顾之前的内容。

最后，可利用蒲公英电商带货的“活动招商 – 招募拼团“的功能，招募直播达人进行合作；

或者报名参与小红书官方活动招商。

1.3 达人合作沟通

与直播达人的合作沟通逻辑跟方式是类似的，所以就不展示展开，侧重阐述一些不同的内容。

1.4 开播前的准备

1.4.1 寄送样品

给达人寄送样品的话，推荐至少寄送 2 套，1 套给达人自己体验，1 套用于直播间展示；

1.4.2 安排预热

达播的预热方式可跟店铺自播一样，即

修改账号昵称/简介，通过账号昵称/简介进行预告；
发布直播预告内容（e.g. 笔记、瞬间打卡等）及置顶进行预告；
修改店铺装修，在店铺及商品详情页进行预告；
在直播结束前对下一场直播的信息进行预告；
二次编辑过往内容进行预告；
在过往内容里，通过置顶评论进行预告；
……

1.4.3 合作信息等配置

1.4.3.1. 可利用达人信息单独给合作产品创建一个链接，用达人的头像、昵称等信息来编辑商品信息；

1.4.3.2. 给达人设置定向计划，创建完毕后提供合作口令给达人；

1.5 直播配合

1.5.1.在达播过程配合达人调整库存；

1.5.2.设置超级助手或者小助手在直播间评论区回答粉丝问题或者反复介绍品牌与产品信息等；

1.5.3.假设不是专场的话，也可用品牌专业号去看直播，在达人讲品的时候，进行活跃及回答相关问题等；

1.5.4. 针对头腰部数据表现好的达人可安排专门的小伙伴进行跟播，避免发生突发状况；

1.6 合作复盘

1.6.1.及时记录相关直播数据，方便后续复盘；

1.6.2.直播的时候，记得录屏，这样有好的内容素材即可进行二次创作；

1.6.3. 针对达播的相关数据及脚本内容等进行复盘，为下一次直播合作做好准备；

1.6.4.定期进行达播整体复盘，侧重复盘这 4 个维度，

1）带货效果，即实际 ROI

可根据实际带货效果迭代货盘，看看哪些产品卖得好、哪些产品卖的不好，原因是什么等；

2）费用评估，即达播是否赚钱

费用评估就会涉及到各项成本，可通过优化成本等让它变得赚钱，e.g.降低产品成本、设置合理的佣金、坑位费等；

其次，根据转化率做好各个环节的优化，e.g. 消费群体、商品主图、商品详情页、评价等；

3）内容复盘

内容复盘最重要的是把产品讲解好、呈现好，可考虑主打 1 个卖点说清楚讲透彻，图片信息等多角度呈现产品等；

4）达人合作

02.小红书达播合作 Tips

2.1.跟小红书达人合作直播的时候，可考虑设置阶梯式佣金，以此激励达人直播；

2.2.遇到夸张承诺的达人，以及热情的中间商需要谨慎，有比较大的几率是骗子；

作者：林卿LinQ

来源：林卿LinQ

Skill最佳实践：AI Agent能力构建的底层逻辑

青瓜传媒 — Thu, 07 May 2026 07:48:45 +0000

你每次打开Claude，说”帮我写一份产品分析报告”，它都能给你一份看起来还不错的文档。但如果你有20个不同的任务——写报告、分析数据、写代码、回复邮件——你发现了一件令人沮丧的事：AI的表现忽高忽低，同一个任务，今天输出好，明天输出差。问题不在AI本身。问题在于：你每次都在重新发明轮子。Skill的出现，就是为了解决这个根本矛盾。

一、大多数人理解错了Skill

“Skill不就是一段提示词吗？”这是关于Skill最常见、也最有害的误解。如果你把Skill理解为”一段文字塞给AI”，那你只看到了它的表面。Skill的真实定义是：一套精心设计的能力加载机制——它要回答的是四个最基本的问题：什么时候触发，加载什么，执行什么，以及怎么迭代。

这是一个系统工程的命题，不是写prompt的命题。两者有什么区别？提示词是静态的，Skill是动态的。提示词是点对点的指令，Skill是可组合的能力单元。提示词写完就结束了，Skill需要测试、需要迭代、需要和其他Skill共存。Anthropic给Skill的定义值得原话引用：

“A skill is a set of instructions — packaged as a simple folder — that teaches Claude how tohandle specific tasks or workflows. Instead of re-explaining your preferences, processes, anddomain expertise in every conversation, skills let you teach Claude once and benefit every time.”

“教一次，永久受益”——这才是Skill的本质。它不是在告诉AI”做什么”，而是在正确的时间、以正确的方式、让AI做正确的事。这就是核心冲突所在。同样的Claude能力，有人用Skill做到90%任务成功率，有人每次从零开始只有30%。差距不在模型，在于Skill设计的质量。

二、纵向：Skill的概念不是凭空出现的

理解Skill，必须把它放回历史脉络里。它不是一次偶然的发明，而是AI能力表达方式演进的必然产物。

前Skill时代

重新发明每一次最早的AI使用方式极为朴素：用户说一句，AI答一句。没有记忆，没有上下文积累，没有能力复用。每次对话开始，AI都是一张白纸。你跟它聊了半小时的数据分析偏好，下一次打开窗口，全部归零。这意味着：所有的高质量输出，都建立在重复劳动之上。专业用户很快发现，这不是可持续的使用模式。

System Prompt时代

静态配置的死胡同2022年前后，System Prompt（系统提示词）的概念开始流行。本质上，这是把常用指令”写死”在对话开头，让AI一启动就具备某种角色或能力。这比每次重说强多了。但System Prompt有三个根本局限：

第一，无法按需加载。不管当前任务是什么，System Prompt的内容全部加载进上下文。任务越复杂，System Prompt越长，上下文膨胀越严重。Anthropic的文档里特别指出了这一点——大量Skill内容一股脑塞进SKILL.md，正是最常见的错误之一。

第二，不可组合。 多个System Prompt互相干扰的情况极为普遍。当你有一个”数据分析专家”的System Prompt和一个”代码审查员”的System Prompt，二者同时存在时，AI的行为往往互相矛盾，因为没有清晰的加载和触发机制。

第三，无法迭代。 System Prompt是”一锤子买卖”，写完即定型。没有内置的测试、验证、反馈机制，你只能靠感觉判断效果好坏。

Plugin/GPTs时代

能力扩展的第一次尝试2023年，OpenAI推出Plugin生态和GPTs，试图解决能力扩展问题。用户在ChatGPT里”装”一个插件，就能让AI访问外部API、获取实时数据、执行特定操作。

这代表了重要的范式转变：AI开始从“回答问题的工具”进化为“执行任务的工具”。

但Plugin体系有一个根本缺陷：强耦合，不可组合。GPTs的Actions本质上是OpenAPI规范的包装——你把API描述告诉AI，AI根据描述决定是否调用。这种模式的局限在于：API能做什么是固定的，AI只能在其范围内工作。

更关键的是，一个GPT里的多个Action互相不知道对方的存在，无法协调完成需要跨服务的工作流。

简单说：Plugin时代解决的是”AI能调用什么工具”的问题，但没有解决”AI在什么场景下该用什么工具、工具之间怎么协作”的问题。

Skill时代：质的飞跃

2024年底到2025年初，Anthropic正式推出Claude Skills。与Plugin相比，Skill体系实现了三个关键跃迁：

渐进式加载（Progressive Disclosure）。 这可能是Skill设计里最深刻的创新。它将能力加载分为三个层次：

第一层是YAML frontmatter，永远加载，但极轻量（约100个token），只够让AI”知道”有这项能力存在；

第二层是SKILL.md正文，按需加载，包含完整的执行指令；

第三层是references和scripts，按需深入，提供细节支撑。token是稀缺资源。

渐进式加载的本质是：不是所有能力都需要同时在场。这是一个关于”何时加载什么”的设计哲学，而不仅仅是技术实现。

可组合性（Composability）。 Claude可以同时加载多个Skill，每个Skill之间有清晰的边界，互不干扰。这意味着Skill是真正的模块化单元——你可以同时拥有”报告生成”Skill和”代码审查”Skill，它们各自工作，互不冲突。
可移植性（Portability）。 同一个Skill在Claude.ai、Claude Code和API中行为一致。这打破了”平台绑定”的魔咒——你在本地调试好的Skill，上传到任何支持的平台都能工作。

纵向梳理到这里，核心洞察已经浮现：Skill的演化本质是从“静态配置”到“动态能力加载”的范式转变。

前两个时代的核心问题是”怎么让AI知道更多”，Skill时代的核心问题是”怎么让AI在正确的时刻调用正确的知识”。这不是同一个问题的不同答案，这是两个完全不同的问题。

三、Skill的核心设计原则

从Anthropic的官方指南中提炼出最重要的设计原则，但关键不是记住它们——而是理解它们为什么存在。

原则一：YAML Frontmatter是生死线

Skill能不能被触发，完全取决于frontmatter中的description字段写得怎么样。这不是夸张。一个Skill写完上传，系统一切正常，但Claude永远不会自动加载它——90%的原因是description没写好。description的核心结构只有三个要素：做什么 + 什么时候触发 + 关键触发词。

Anthropic给出的好description示例：

description: Manages Linear project workflows including sprint planning,task creation, and status tracking. Use when user mentions “sprint”,”Linear tasks”, “project planning”, or asks to “create tickets”.

坏的description：

description: Helps with projects.

“帮助处理项目”——这是对Skill功能的总结，不是触发条件描述。Claude拿到这个描述，它怎么判断用户什么时候需要这个Skill？它没法判断。这引出了一个反直觉但极其重要的设计原则：description不是写给人看的，是写给AI的触发判断器。它的读者是Claude的语义理解引擎，不是用户。你写的不是产品文档，是一份触发条件清单。

好的description = “做什么”（语义上清晰的能力边界）+ “触发信号”（用户可能说的话）。坏description = 模糊的功能概括。

原则二：渐进式加载是Token经济学

前文提到渐进式加载是Skill最重要的设计哲学，这里要展开它为什么重要。当你把所有内容都塞进SKILL.md，Claude每次启动都要处理这些内容。单个Skill可能还好，10个Skill同时启用，上下文窗口里堆满了各种能力描述，AI的注意力被严重分散。

更实际的影响：响应变慢，成本上升。

Claude处理每一条上下文token都要消耗计算资源，这些资源本来可以用来处理你的实际任务。Anthropic的建议很具体：SKILL.md保持简洁，把详细文档移到references/目录，按需引用。

这看起来是文件组织问题，实际上是能力加载的优先级管理问题。

具体操作上，有几个实践技巧：

references/目录存放API文档、示例代码、详细的错误处理说明。这些文件默认不加载，只有当Claude需要深入了解某个细节时，才去引用。
scripts/目录存放可执行脚本——比如数据验证脚本、格式检查脚本。这些脚本在Skill执行时调用，不在prompt里用自然语言描述校验逻辑。
代码是确定性的，语言描述不是。
当校验规则复杂时，用脚本比用文字说明可靠得多。

原则三：指令的具体性决定执行质量

这是Skill设计中最容易出问题的地方，也是最有改善空间的点。模糊指令：

“验证数据后继续”

这条指令的”可解释空间”太大了。什么叫验证？验证哪些字段？什么算验证通过？验证失败怎么办？Claude面对这种指令，要么自己猜测，要么反复确认，两种结果都不理想。具体指令：

“调用 python scripts/validate.py –input {filename} 检查数据格式。验证失败时，常见原因包括：缺失必填字段（将缺失字段名返回给用户）、日期格式错误（使用YYYY-MM-DD格式）。只有在所有验证通过后才能进入下一步。”

区别在于：具体指令告诉了AI用什么工具、传什么参数、预期什么输出、失败怎么处理。

这四个要素齐全，Claude的执行路径就清晰了。Anthropic在文档里特别提了一个高级技巧：对于关键验证，考虑将检查逻辑封装为脚本，而不是用自然语言描述。

这背后的逻辑很朴素：代码执行的结果是确定的，语言模型的输出具有概率性。当精度重要的时候，放弃概率。

原则四：可组合性是设计约束，不是选项

当你设计一个Skill，必须假设它不是唯一存在的。这个假设带来了具体的约束：Skill不能独占全局上下文，不能假设所有工具都可用，不能做与相邻Skill冲突的行为假设。反过来，这要求你在Skill设计时明确声明它依赖什么能力（通过compatibility字段），以及它不处理什么场景（通过description中的negative trigger）。Anthropic文档中给了一个negative trigger的示例：

description: Advanced data analysis for CSV files. Use for statisticalmodeling, regression, clustering. Do NOT use for simple dataexploration (use data-viz skill instead).

这种边界声明表面上是在”拒绝”一些场景，实际上是在保护Skill的专注度。一个什么都做的Skill，实际上什么都做不精。

原则五：可移植性从命名开始

Skill设计有一个容易被忽视的细节：文件夹和name字段的命名方式。

Anthropic的规定很清楚：使用kebab-case（全小写，横杠分隔），禁止空格、禁止下划线、禁止大写。文件夹名必须和name字段完全一致。

# 正确

name: figma-design-handoff

# 错误

name: Figma_Design_Handoff

这不是格式癖好，这是系统兼容性的基础。当一个Skill可能在Claude.ai、Claude Code和API之间迁移时，任何命名不一致都可能导致加载失败。命名规范是最基础的可移植性保障。

四、各平台Skill体系的全景对比

Skill不是Anthropic的独角戏。将它放在更宽的视野里，能更清楚地看到它的特点和局限。

对比框架

我选取四个最具代表性的平台进行对比：Anthropic Claude Skills、OpenAI GPTs/Actions、Coze扣子Bot，以及LangChain/LangGraph。

Anthropic Claude Skills：精细度的领跑者

Claude Skill体系在”能力加载的精细度”上领先整个行业。三层渐进式加载是迄今为止最优雅的上下文管理方案，它解决了Plugin时代最核心的矛盾：能力丰富度和上下文膨胀之间的张力。

YAML frontmatter作为触发判断层，是一个小而美的设计决策。只加载几百个token的元数据，让AI”感知”所有可用Skill，然后只在需要时才加载完整内容——这个思路从根本上优化了token使用效率。

但它的局限也很明显：Skill自己没有执行工具的能力，需要依赖MCP（Model Context Protocol）提供工具层。Skill告诉你”怎么做”，MCP让你”能做到”。二者结合才有完整的能力闭环。

另外，Claude Skill体系相对较新（2025年才成熟），社区生态和工具链的丰富度不如老牌平台。

OpenAI GPTs/Actions：配置驱动，但强耦合

GPTs/Actions的最大优势是门槛极低——任何人花几分钟就能创建一个能调用外部API的GPT。但这个优势同时也是它的局限所在。

Actions基于OpenAPI规范构建，本质上是把你的API描述告诉ChatGPT的模型。这解决了一个基本问题：AI怎么知道有哪些API可以调用。但OpenAPI规范是描述性的，它告诉你”接口是什么”，不告诉你”什么时候该用哪个接口、多个接口之间怎么协作”。

GPTs的多个Actions之间是隔离的，没有内置的跨Action协调机制。当你需要从Google Calendar读取事件、从Slack发送通知、再把结果写回Notion——GPTs本身无法编排这个流程，你需要自己写额外的逻辑或者借助Zapier这样的中间层。

简单说：GPTs适合单点能力扩展，不适合复杂工作流。

Coze扣子：中文生态的低代码最优解

Coze代表了另一种思路：用可视化编排降低技能构建的门槛。

Coze的Bot构建有几个核心组件：人设与提示词（相当于System Prompt）、插件（相当于工具调用）、工作流（可视化节点编排）、知识库（RAG增强）。对于非技术背景的用户，这套体系的上手成本极低——拖拖拽拽就能搭出一个能用的Agent。

工作流是Coze最有特色的部分。它用图形化界面把Agent的思维过程”外化”出来：输入→LLM节点处理→插件调用→条件分支→输出。每个节点有明确的输入输出定义，流程的每一步都是可追溯的。

但Coze也有明显的局限：它高度绑定Coze生态，一旦你投入大量精力构建了复杂的工作流，迁移成本极高。另外，可视化编排虽然降低了入门门槛，但也限制了表达复杂逻辑的上限——当流程分支足够多时，图形界面本身就变成了理解障碍。

LangChain/LangGraph：开发者的工坊

LangChain和LangGraph代表了完全不同的用户群：它们是为程序员准备的。

LangChain 1.0（2025年10月发布）提供了create_agent抽象，用几行代码就能创建一个带工具调用能力的Agent。LangGraph则在底层提供了图形化状态机，用于构建高度复杂的Agent工作流。

从技术角度，LangChain/LangGraph是目前最灵活的方案：你可以定义任何工具、任何状态转换逻辑、任何中间件处理。ReAct循环、checkpoint持久化、human-in-the-loop介入——这些高级功能都有原生支持。但代价是：这是一套代码优先的方案，需要Python/JavaScript编程能力。对于没有工程背景的用户，这是无法逾越的鸿沟。

核心判断

各平台在”能力加载精细度”上的排序是：Claude Skills > LangChain > Coze > GPTs。

各平台在”开发便利性”上的排序是：Coze > GPTs > Claude Skills > LangChain。

结论：Anthropic的Skill体系在工程设计层面确实领先，但它面向的是有一定技术理解力的用户群体。 想要真正发挥Skill的能力，用户需要理解渐进式加载的逻辑、能写出有效的description、能组织好references结构——这比在Coze里拖拽节点需要更多的认知投入。

两种路线都有其价值。市场需要低门槛的方案让更多人用起来，也需要精密的体系让深度用户构建真正可靠的生产级能力。

五、五大实战模式：从Pattern到实践

Anthropic文档提炼出了五个经过验证的Skill执行模式。这些模式不是教条，而是经过真实场景检验的工作流模板。每个模式都有其最佳适用场景。

模式一：顺序工作流编排

适用场景： 多步骤流程，每一步依赖前一步的结果，且顺序固定。

典型例子：客户入职流程——创建账户→配置支付→建立订阅→发送欢迎邮件。每个步骤的输出是下一步的输入，中途失败需要回滚。

这个模式的核心不是”步骤多”，而是步骤之间有明确的依赖关系和失败处理。

顺序编排的关键技术点：每一步明确声明依赖字段（”从Step 1获取customer_id，传入Step 3″）；每个阶段包含验证逻辑，不验证就不进入下一步；失败时提供明确的回滚指令，不是一句”出错就停止”。

Anthropic的文档特别强调：Rollback instructions（回滚指令）是顺序工作流里最容易被忽略、也最不该被忽略的部分。 如果第四步失败了，前三步做的操作需要被撤销——账户创建了但订阅失败，残留数据怎么处理？没有这一步，Skill在失败场景下会留下一地鸡毛。

模式二：多MCP协调

适用场景： 工作流跨越多个外部服务，每个服务由独立的MCP处理。

典型例子：设计-开发交接流程——从Figma MCP导出设计资源→从Drive MCP存储资源→从Linear MCP创建开发任务→从Slack MCP通知团队。

多MCP编排的挑战在于阶段分离和数据传递。

Phase 1（设计导出）完成后，资源链接需要被捕获，并作为参数传给Phase 2（存储）。Phase 2完成后，存储路径需要传给Phase 3（任务创建）。每个阶段的边界必须清晰，交接的数据必须标准化。

这个模式的另一个关键点：集中式错误处理。当某个MCP调用失败，需要有一个统一的错误处理策略——是重试几次？是跳过这个步骤继续后续流程？还是整个流程中止？不能在每个阶段各自为政。

模式三：迭代精炼

适用场景： 输出质量随迭代次数提升，且质量标准可以明确定义。

典型例子：报告生成。第一遍草稿→质量检查（脚本验证）→识别问题（缺失章节、格式不一致、数据校验错误）→针对性修改→再验证→直到质量达标。

这个模式的本质是把质量控制从“AI自己判断”变成“程序化验证”。

迭代精炼的核心不是”多生成几遍”，而是质量标准必须前置。在开始迭代之前，必须明确：什么算”高质量”报告？结构完整（包含哪些章节）？数据准确（怎么校验）？格式统一（用什么模板）？

Anthropic的文档给出了关键洞察：知道什么时候停止迭代，和知道如何迭代一样重要。 没有停止条件，Skill会陷入无限循环——每次生成都比上次稍微好一点，然后继续改，永远不输出最终版本。

设置停止条件的常见策略：验证脚本返回通过（程序化标准）；达到最大迭代次数（硬上限）；人工确认环节（human-in-the-loop）。

模式四：上下文感知工具选择

适用场景： 同样的目标，不同的工具选择取决于输入的具体特征。

典型例子：智能文件存储——根据文件类型和大小决定存储位置。大型文件（>10MB）走云存储MCP，协作文档走Notion/Docs MCP，代码文件走GitHub MCP，临时文件走本地存储。

这个模式的关键是清晰的决策树和降级方案。

决策树必须穷举所有可能的输入场景。Claude遇到一个”没见过”的场景时，应该怎么做？降级方案提供了答案：默认走最通用的选项，而不是直接报错。

另一个重要的设计点：向用户解释为什么做了这个选择。Anthropic的文档将”提供上下文给用户”作为这个模式的必要组成部分。一个透明的决策过程，既建立了用户信任，也便于用户发现问题后及时纠正。

模式五：领域专有智能

适用场景： Skill需要嵌入超出工具访问的领域知识，且涉及合规或审计要求。

典型例子：金融合规支付处理——交易前必须检查制裁名单、验证司法管辖区许可、评估风险等级。处理完成后，所有合规检查必须记录日志，可供审计追溯。

这个模式的独特之处在于：合规检查先于业务操作，审计追溯贯穿全程。

很多领域都有这样的强制约束：医疗AI在推荐治疗方案前必须检查禁忌症，工业AI在执行操作前必须验证安全条件。领域专有智能模式把这些约束内置到Skill的执行逻辑中，而不是事后追加。

这也揭示了Skill设计的一个深层原则：能力不仅仅是“能做到”，还包括“做到的方式是否符合规范”。一个支付处理Skill，如果缺少合规检查前置步骤，它的能力是不完整的。

六、最常见的三个陷阱

Skill设计有三个高频失败点。每一个都有明确的诊断方法和修复路径。

陷阱一：Skill存在，但永远不被触发

诊断：上传后测试，发现Claude从不自动加载这个Skill，每次都需要用户手动指定。

根本原因： description字段写得过于模糊或缺少触发词。

“帮助用户处理Figma相关任务”——这句话的问题在于，”处理Figma相关任务”是一个太大的语义空间。Claude在判断是否加载这个Skill时，需要在description中找到足够具体的匹配信号。

修复方案：

第一步，用Anthropic建议的方法验证：直接问Claude”你什么时候会使用[Skill名称]这个Skill？”Claude会引用它的description内容。根据引用的内容判断：是否包含了足够具体的触发场景？

第二步，增加触发词。Anthropic明确建议description中应该包含”用户可能说的话”——包括具体的文件类型（.fig、.sketch）、具体的操作动词（”导出”、”handoff”、”生成规格”）、具体的产品名称（Linear任务、Figma设计）。

第三步，如果description已经很具体但仍然不触发，检查是否有其他Skill的description覆盖了更广的范围，导致竞争。通常的解决思路是：让description更窄但更精准，而不是更宽但更模糊。

陷阱二：Skill加载了，但AI不按指令走

诊断：Skill触发了，但Claude输出的内容与SKILL.md中描述的步骤不一致。Claude忽略某些步骤，或者用自己的理解重新组织了流程。

根本原因： 指令要么太模糊、要么太冗长、要么关键指令被埋在了文件深处。

Claude的注意力有优先级。写在文件开头的内容比埋在结尾的内容权重更高。 如果关键指令在文档中间，Claude在长上下文里可能会”忘记”它们——这不是AI的缺陷，这是注意力机制的特性。

修复方案：

关键指令前置。用 ## Critical 或 ## Important 这样的标题明确标记最核心的步骤。Anthropic的文档甚至建议”如果需要，重复关键点”。

避免冗长。如果SKILL.md超过5000词，Claude的执行质量通常会下降。把详细文档移到references/目录，正文保持核心流程的精炼描述。

使用脚本替代自然语言描述关键校验。当校验逻辑复杂时，写一个 scripts/validate.py，然后在SKILL.md中用”运行 python scripts/validate.py –input {filename} 检查数据格式”来调用。代码是确定性的执行路径，不依赖模型的概率解释。

加入正面激励。Anthropic文档提了一个反直觉但有效的技巧：明确鼓励Claude慢下来、把质量放在速度前面。”Take your time to do this thoroughly. Quality is more important than speed.”——这句话写进用户的prompt比写进SKILL.md效果更好。

陷阱三：Skill本身不大，但整个系统变慢了

诊断：单个Skill性能正常，但当启用10个以上Skill时，明显感觉到响应变慢、延迟增加、输出质量下降。

根本原因：多个Skill同时加载导致上下文膨胀，或者SKILL.md设计时没有利用渐进式加载的层次结构。

修复方案：

减少同时启用的Skill数量。Anthropic建议评估是否同时启用了超过20-50个Skill。如果是这样，考虑使用”Skill Pack”策略——把相关能力打包成更少、更大的Skill，而不是维护几十个细粒度Skill。

充分利用三层加载结构。frontmatter只放触发元数据（<1024字符），SKILL.md正文放核心指令（<5000词），references/放深度文档（在SKILL.md中按需引用）。

SKILL.md内部也用渐进式。 在SKILL.md正文中，不要一次性铺开所有细节。用”## Overview”介绍整体流程，在需要时才深入到”### 详细步骤”。这种结构本身也是一种渐进式——Claude可以先获取高层理解，再按需加载细节。

七、Skill设计的深层逻辑

把纵向的演化脉络和横向的平台对比交叉，能看到一些单从任何一个维度都看不出的东西。

洞察一：Skill的本质是”能力的编译”

提示词时代，AI能力的传递依赖”文字”——人写一段话，AI读一段话。文字天然具有歧义性，同一句话在不同上下文里有不同理解，这导致了提示词的不稳定性。

Skill不是文字，是经过结构化组织的知识模块。YAML frontmatter提供元数据，SKILL.md正文提供执行指令，references/提供深度支撑，scripts/提供确定性执行路径。这套结构将人的隐性知识——知道什么时候该做什么、怎么做——编译成AI可解析、可执行、可验证的显性指令。

“编译”这个比喻值得深想。编译器处理源代码，输出机器指令。好的编译器做优化——删除冗余代码、重排执行顺序、缓存中间结果。好的Skill设计者做同样的事——删除冗余的指令描述、优化触发条件的精确度、把模糊的”尽量做好”编译成精确的”在X条件下执行Y动作”。

从这个角度看，Skill写得好不好，本质上不是”文笔好不好”，而是编译质量高不高。

洞察二：Skill是AI Agent范式演进的锚点

从更宏观的视角看，AI Agent领域正在经历一个核心转变：从”模型输出”到”系统执行”。

早期Agent（如AutoGPT，2023年4月）试图让模型自主决定整个行动计划，代价是极度不可靠——模型会陷入循环、调用错误的工具、无法从错误中恢复。

LangChain的ReAct模式（Reasoning + Acting）推进了一步：明确让模型在”思考”和”行动”之间交替，每次工具调用后都让模型审视结果再决定下一步。这提高了可靠性，但也带来了新问题：模型在每个循环里都要”想一下该怎么做”，这本身就是token和时间上的浪费。

Skill提供了一个不同的解决思路：把“知道该怎么做”这件事本身结构化。模型不需要在每次执行时都从头推理”这个多步骤任务应该先做什么再做什么”——Skill已经把这条路经编码好了。模型只需要在Skill的框架内处理当前的具体输入。

这意味着Skill不是在”控制”AI，而是在”卸载”重复推理的负担，让模型把注意力集中在真正需要判断的地方。

洞察三：Skill的成熟度决定Agent能力的上限

AI Agent目前面临的核心矛盾是：模型越来越聪明，但可靠执行复杂任务的能力仍然有限。 原因不在模型本身，在于”怎么组织能力”这个工程问题还没有被很好地解决。

Skill体系正在尝试解决这个问题。它的五个设计原则——渐进式加载、可组合性、可移植性、具体性指令、领域嵌入——对应了五个真实的能力缺口：上下文管理、多Skill协作、跨平台迁移、执行可靠性、垂直领域合规。

这五个问题解决到什么程度，AI Agent就能从”聊天机器人”进化到什么程度。

洞察四：Skill的未来——从手写到自生成

当前Skill还需要人工编写。但这个状态不会持续太久。

几个信号已经出现：Anthropic内置了skill-creator Skill，可以根据自然语言描述自动生成SKILL.md框架。LangChain的PromptEvolver框架已经在实验自动优化提示结构的工作流。多Agent协作系统（如MetaGPT）中，已经开始用”角色编码的SOP”来自动生成Agent的行为规范。

未来的Skill很可能有两层：基础层是结构化模板（由平台或框架预制），个性化层由用户通过自然语言描述生成。就像现在的网页模板——大多数人用现成模板，少数人从零手写。

但即使在那时，理解Skill的底层设计原则仍然重要。你不需要成为模板设计师，但你需要知道为什么一个模板有效、另一个模板失败。

八、结尾

Skill不是给AI写说明书，是给AI装手艺。

说明书是死的参照物，用的时候查一下，用完放回去。手艺是活的执行能力——它是身体的一部分，不需要每次调用都从零想起。

说明书式的AI使用方式，每一次任务都是从零建立上下文。你以为你在”用AI”，实际上你在反复做知识搬运的工作，把你脑子里的隐性经验一遍遍翻译成AI能理解的文字。

手艺式的AI使用方式，是把那些反复用到的知识和流程编译成Skill，让AI在正确的时间自动调用它们。你只需要在关键时刻做判断、做校正、做升级。

这个转变的难度不在于技术，在于认知。

大多数人还在用”说明书思维”使用AI——每次把任务描述一遍，等AI给一个答案，下次再描述一遍。这是一个令人疲惫的循环，也是AI表现不稳定的根本原因。

Skill是一扇门。打开它，AI就不再是你每次用完就忘的工具，而是会积累、会进化、会在下一次自动做得更好的执行者。

至于门后面是什么——取决于你愿意把多少”手艺”装进去。

作者：老徐的干货铺

DeepSeek-V4手搓Agent，冲上GitHub热榜第一？

青瓜传媒 — Thu, 07 May 2026 05:59:31 +0000

DeepSeek版Claude Code爆了！

智东西5月6日消息，今日，美国独立开发者Hunter Bown的开源项目DeepSeek-TUI在GitHub上爆了，冲上GitHub热榜第一，今天Star数上涨2434，总Star数已超10.2k。

这一项目是基于DeepSeek-V4的终端原生编程Agent，其允许开发人员直接在终端与DeepSeek聊天、编辑文件、运行shell命令、管理任务，甚至协调代码库中的子Agent。

今早，DeepSeek-TUI更新了0.8.13新版本，聚焦运行时和TUI相关问题修复，提示词规范优化、运行轨迹日志、Anthropic接口兼容支持以及大规模界面整理优化，均已延后至后续版本发布。

值得一提的是，DeepSeek-TUI的开发者并不是专业人士，Bown的本硕专业与编程无关，Bown 2015年获得北得克萨斯大学音乐教育学士，2019年在南方卫理公会大学获得音乐教育硕士，目前就读于美国南方卫理公会大学Dedman法学院。

该项目2026年1月发布，伴随今年4月底DeepSeek-V4升级、Bown在X上发帖想和中国开发者建联而走红，他称中国开发者为“鲸鱼兄弟”。

X上网友分享，Bown已经成功拥有微信账号，并和中国开发者交流起来了。

在DeepSeek-TUI开源主页的贡献者名单中，还有Claude、Gemini。

一站式全能调度智能Agent终端Tday开源项目的作者发帖称，他成功将DeepSeek-TUI集成到Tday后，其体验表现出极高的稳健性，配合DeepSeek-v4-flash时，速度非常接近开源AI编程智能体OpenCode。

Claude Design的开源替代方案Nexu作者称，这是首次在代码智能Agent的终端环境中直接运行DeepSeek-V4，他们测试的效果相当不错。

有网友在下面称赞，这么好的项目必须支持。

还有网友询问Bown帖子里说的“鲸鱼兄弟”来源，感觉这个称呼很有喜感。

不过，也有网友认为DeepSeek-TUI火得莫名其妙：“为什么要抛弃一个已有成熟方案的产品，转向没有稳定的产品？”

01.基于DeepSeek-V4构建，还专门发了中国开发者友好版本

DeepSeek-TUI是基于DeepSeek-V4构建的终端编程智能体，具备100万token上下文窗口、流式推理块和前缀缓存感知成本报告的能力。

具体而言，其可读取与编辑文件、执行终端命令、联网检索、管理Git版本库，并能在键盘交互的终端界面（TUI）中调度多个子智能Agent协同工作。

网友评价DeepSeek-TUI的界面布局一目了然，但缺点是对话区中AI输出和用户输入的分界不明显。

有网友用DeepSeek官方API进行了对比，相比Claude Code，DeepSeek-TUI在跑长时长任务时，缓存命中率会下降。

DeepSeek-TUI的架构如下：DeepSeek调度命令行→DeepSeek-TUI配套程序→终端图形界面↔异步引擎↔兼容OpenAI协议的流式客户端。

工具调用通过类型化注册中心流转，包含终端命令、文件操作、Git版本管理、联网检索、子智能体、MCP协议、RLM大模型，执行结果以流式方式回写到对话日志中。

引擎负责管理会话状态、对话轮次、持久化任务队列，还内置LSP语言服务子系统；代码编辑完成后，会先把语法诊断信息送入大模型上下文，再进行下一步逻辑推理。

DeepSeek-TUI的开源主页还有对中国开发者的镜像友好安装版本：

02.共三大运行模式，还能自适应调整推理等级

在开源项目主页，Bown专门用中文写了README.zh-CN.md文件，其中提到DeepSeek-TUI的主要特点包括：

自动模式：用户可以通过model auto指令启用自动模式，该工具会在每一轮交互中自动适配选择合适大模型，并匹配对应的推理思考等级。

切换推理等级：用户可以通过按下Shift+Tab快捷键循环切换推理等级，分别为关闭推理→高推理强度→最高推理强度。

推理流式输出：其会将模型进行思考推理的过程进行实时流式展示，可直观看到DeepSeek的完整逻辑推理步骤。

全量工具能力：内置完整工具集，支持文件读写操作、终端命令执行、Git版本管理、网页搜索与网页浏览、补丁应用、子智能Agent调度，以及MCP协议服务器连接。

百万token上下文：具备上下文内容追踪、手动/自动配置内容压缩功能，同时提供前缀缓存监控统计能力。

内置三大运行模式：规划模式（仅只读查阅项目代码与文件）、Agent模式（交互操作且需手动审批）、极简自动模式（全部操作自动审批执行）。

会话保存与接续：支持为长时间运行的工作会话创建检查点，随时保存进度，后续可一键恢复接续会话继续工作。

工作区版本回滚：项目会内置独立快照Git机制，在每轮操作前后自动生成项目快照，通过/restore和revert_turn命令即可回滚操作，不会改动项目原生的Git仓库配置。

持久化任务队列：后台运行的任务支持持久化保存，程序重启后，未完成的后台任务可自动继续执行。

HTTP/SSE运行接口：支持通过deepseek serve—http启动服务，提供HTTP、SSE接口，适配无图形界面的无头自动化代理工作流。

MCP模型上下文协议：可连接Model Context Protocol模型上下文协议服务器，扩展更多第三方工具能力。

原生RLM批量查询：内置rlm_query原生能力，复用同一API客户端，调用轻量化低成本的deepseek-v4-flash模型，高效完成批量代码与数据分析任务。

LSP代码诊断：依托rust-analyzer、pyright、typescript-language-server、gopls、clangd等主流语言服务工具，每次编辑代码后，都会在界面内实时展示代码错误与警告信息。

用户个性化记忆：用户可开启持久化备注文件功能，自定义的偏好设置会注入系统提示词，实现跨会话保留个人使用习惯与配置偏好。

多语言界面本地化：支持英文、日文、简体中文、巴西葡萄牙语四种界面语言，可自动识别系统语言适配切换。

实时费用统计：实时统计每一轮交互及整个会话的token消耗、预估使用成本，同时细化展示缓存命中与缓存未命中的明细数据。

技能扩展系统：支持从GitHub安装、组合自定义指令技能包，可灵活扩展工具能力，全程无需依赖额外后端服务。

今早，DeepSeek-TUI更新了0.8.13新版本，聚焦运行时和TUI相关问题修复：

额外更新包括在压缩前对无LLM工具结果进行剪枝：在付费摘要处理之前，对旧的详细工具结果进行机械式摘要。重复读取保留最新的完整数据体，并将旧的副本替换为单行摘要；如果这样能使会话大小回到压缩阈值以下，则完全跳过LLM摘要调用。

重复工具防环保护装置：每个用户回合都会生成(tool_name,args)对参数。在第三次相同的调用时，它会插入一个合成的纠错工具结果，而不是再次运行相同的工具而不做任何更改；如果某个工具出现故障，则会在三次调用时发出警告，并在八次调用时停止。

V4缓存命中遥测兼容兜底适配：用量解析现已支持识别 usage.prompt_tokens_details.cached_tokens字段，因此底部状态栏现有的缓存命中标识组件，既能适配DeepSeek-V4自动前缀缓存的遥测数据，也能兼容旧版明确的缓存命中/未命中字段格式。

03.结语：想打造Claude Code平替，但稳定性存疑

Claude Code这样的专有系统通常需要付费API访问，且运行在较为封闭的生态系统中，而DeepSeek-TUI的出现或能为打破这种局面提供参考，依托DeepSeek的低成本模型堆栈，以更低成本提供类似的工作流程。但开发者仍然不能这类不稳定开源项目背后的风险。

不过，这一开源项目的爆火，无疑也从侧面印证了DeepSeek-V4的影响力，其为更多开发者提供了低成本搭建终端智能编程体、自主定制开发工作流的全新可能。

作者：程茜，编辑：李水青

来源：智东西

豆包能否掀起国内AI订阅浪潮

青瓜传媒 — Thu, 07 May 2026 03:11:18 +0000

国内AI原生应用市场迎来了一个具有行业风向标意义的拐点。

5月4日，字节跳动旗下AI应用豆包在苹果App Store更新了付费版本服务声明，正式宣布在保留免费基础版本的同时，推出三档分级付费订阅模式：标准版（连续包月68元/包年688元）、加强版（200元/2048元）和专业版（500元/5088元）。

这一举措不仅标志着豆包作为国内用户基数最大的AI应用率先迈出C端商业化的实质性步伐，也宣告了国内大模型应用单纯依靠免费换规模的阶段性终结。

根据QuestMobile最新发布的2026年春季报告数据，截至2026年第一季度，国内AI原生App月活用户规模已达到4.4亿。

其中，豆包以3.45亿的月度活跃用户占据绝对的市场第一份额，其体量已超过行业第二名千问（1.66亿）与第三名DeepSeek（1.27亿）的总和。

然而，海量用户带来的并非纯粹的规模效应，而是指数级增长的算力消耗与持续承压的利润表现。豆包此次试水付费，核心逻辑在于剥离高算力消耗场景的成本压力，通过向核心生产力用户收费，建立可持续的商业闭环。

作为大厂玩家中率先打破“全免费”默契的头部应用，豆包的付费尝试具有一定的行业意义。摩根士丹利在最新研报中将豆包开启付费模式定性为行业“从用户教育期迈向商业化阶段的关键节点”。

然而，面对豆包的付费机制，部分用户流向其他免费平台成为必然趋势，但这是否意味着千问、元宝等竞争对手将借机收割流量并长期固守免费阵地？在算力成本面前，这种流量转移对接收方而言究竟是红利还是负债？

这些问题还要等豆包付费模式正式上线之后，才能有答案。

3.45亿月活的“甜蜜负担”

回顾豆包的成长曲线，这是一条令任何互联网产品都艳羡的轨迹。

2025年全年，豆包月活用户从第一季度的9980万飙升至第四季度的2.27亿，涨幅超过127%，并成为国内首个日活破亿的AI原生应用。进入2026年，增速不减，仅第一季度便新增活跃用户约1亿，在央视春晚期间DAU一度冲至1.45亿。

更值得注意的是增长质量。国内移动广告监测机构AppGrowing的数据显示，豆包的投放费用在2025年整体呈下降趋势：第一季度1.61亿元，第二季度1.17亿元，第三季度直接腰斩至0.65亿元，第四季度略回升至0.92亿元，与此同时，2025年1至11月豆包30日留存率平均达到44%，大幅领先行业第二名。

正是这种“低买量、高留存”的增长模式，让豆包断崖领先同行，成为国产AI应用的第一名。

然而，大模型应用的底层经济学与传统的移动互联网产品存在本质差异。

在传统的SaaS或社交软件中，边际成本趋近于零，增加一个用户的服务成本微乎其微。但对于生成式AI而言，每一次交互、每一次推理都在真实地消耗GPU集群的算力。

据CNDS上的一份算力成本拆解数据，豆包单次推理的成本结构中，硬件折旧占比高达58%，电力消耗占比约为29%。这意味着，3.45亿月活用户产生的120万亿日均Token，直接对应着每天数以百万计的电力与硬件损耗账单。

在利润考核下，“大DAU等于大负债”的模式显然不具备长期的可持续性。

随着模型能力的升级，尤其是多模态和长文本解析能力的引入，单个任务的推理成本正在呈几何级数上升。一份专业PPT的生成或几分钟的视频渲染所消耗的算力，往往是日常闲聊的数十倍甚至上百倍。如果继续对所有用户不加区分地提供全免费服务，平台的财务模型可能被少部分重度需求用户彻底拖垮。

有不少豆包用户对华尔街见闻表示，在最近的体验中，豆包在晚高峰时段，经常对深度研究、视频生成等复杂任务出现网络排队的情况，这也从侧面说明豆包的免费服务算力正在吃紧。

种种压力下，“免费”已不可持续。此前有接近字节的人士表示，字节2025年净利润同比下滑超过70%，庞大的AI资本开支是重要拖累。

未来豆包会采用基础版永久免费+增值服务付费的分层架构。接近豆包的人士透露，付费功能将主要专注在复杂任务和生产力场景，如PPT生成、数据分析、影视制作等。

换句话说，豆包是用三档定价从3.45亿月活中精准识别那批算力消耗大户。

从定价策略来看，豆包三档月费为68元、200元、500元，入门价较国内竞品Kimi的49元/月高出近40%。摩根士丹利指出，定价水平指向的是专业用户而非大众市场，目标受众为创作者和知识工作者。

这意味着豆包的核心变现逻辑并非将免费用户转化为付费用户，而是筛选具有较强付费意愿和支付能力的高价值用户。

摩根士丹利对豆包付费的分析认为，即便按保守的0.3%至3%付费转化率测算，豆包年化订阅收入区间可达1.01亿至15亿美元；中性情景下约为4.26亿至6.84亿美元。相对于字节跳动核心广告业务而言，这一规模仍属有限，但足以开启用户变现的第一扇窗。

实际上，豆包的商业化并非突如其来。

字节跳动旗下AI开发平台“扣子”自2024年起已对专业开发者收费，2026年1月下旬推出个人版套餐，价格从每月19.9元到99元不等。豆包收费之类或许只是字节AI矩阵体系化变现的自然延伸。

付费墙两侧博弈

豆包的付费声明一出，市场关注的焦点迅速转移到了竞争对手的反应上。

在豆包明确建立收费墙后，不少用户开始担心免费版的功能受限，进而行业不可避免地出现了用户流失的讨论。

比如，部分习惯了免费白嫖高阶功能的极客用户或重度生产力用户，极有可能在面临68元至500元的月费时，选择迁移至目前仍保持全免费的千问或元宝。

从短期数据波动来看，这种流量的溢出效应是必然的。

有不少用户已经开始寻找替代产品。一位从事专业技能培训的用户对华尔街见闻表示，她经常会使用豆包生成上课的PPT，这节约了她很多时间，但是如果需要每月最少付68元，她将开始寻找替代应用。不过由于习惯使用豆包了，她决定现在付费版还没有正式上线之前，先赶工生成一批。

然而，基于大模型行业的成本规律，用户迁移对承载方而言，也可能成为“甜蜜负担”，毕竟高阶复杂任务对应着高昂的推理成本。

如果千问或元宝为了吸收从豆包流出的这部分重度用户，选择继续无差别地免费提供长文本解析、深度数据挖掘和视频生成等高算力服务，其服务器与电费开支将迅速爆表。

在当前互联网大厂普遍强调降本增效、追求业务自身造血能力的宏观环境下，没有任何一家企业能够长期无底线地承受这种由竞争对手挤出的算力负担。豆包的率先打破“免费默契”，或将引发互联网大厂AI应用收费的浪潮。

一位AI行业从业者对华尔街见闻表示，对于复杂的使用场景，未来收费是必然的，这样才能可循环提供更优质的服务。他自己平常在工作当中就会付费尝试国内外各个AI模型的能力，作为一个资深使用者，他认为用户并不完全在乎付费与否，如果模型足够聪明，切实提示效率，很多生产型用户还是愿意付费的。

从行业的行业演进来看，豆包的率先收费，可能是国内大模型行业“试水”付费的开始，作为月活近4亿的国民级应用，豆包似乎可以打破此前各家企业陷入的“谁先收费谁先死”的困境。

短期内，千问、元宝等是否跟进还难以确认；但从中长期来看，这些高算力用户的成本必将在财报上显现，这些玩家也极有可能紧跟豆包的步伐，推出基于复杂场景的“基础免费+高阶付费”模式。

毕竟免费终究是暂时的市场教育手段，价值对等才是商业的最终形态。

在这个过程中，也可以将豆包的商业化路径与行业先驱ChatGPT的付费路径进行交叉对比。

OpenAI在早期也经历了巨大的成本阵痛，随后逐步确立了严格的分层订阅体系。

目前，ChatGPT不仅有基础的免费版，还推出了8美元/月Go版、20美元/月的Plus版、Team版，以及高达200美元/月的Pro版本。

对比来看，豆包的定价策略在逻辑上与ChatGPT高度同源，但在价格带宽上针对国内市场进行了本土化调整。

豆包标准版的68元/月低于ChatGPT Plus，意在降低国内用户的付费门槛，培养订阅习惯；而其专业版的500元/月虽然绝对值较高，但相较于ChatGPT Pro的200美元，仍显得相对克制。

ChatGPT的财务数据已经证明，只要模型的推理能力确实能够显著提升生产效率，C端用户是具备强烈的付费意愿的。

豆包此次试水，实际上是在验证这一逻辑在中国市场是否同样成立。

对于行业而言，这也标志着竞争维度的升维，过去两年，国内大模型在B端API市场打响了惨烈的价格战，导致商业价值被严重压缩；如今在C端市场，如果豆包能够跑通高客单价的订阅模式，将引导行业从单纯的规模比拼转向能力与商业模式的综合比拼。

回到其付费模式，短期内，这可能会引发一定程度的用户流向其他免费平台，甚至引发关于定价合理性的讨论；但长远来看，它推动了AI行业定价机制的回归。

最终的考验还是将回归产品能力，当产品能力足够强大，能够实质性介入生产力环节时，用户就可能为其消耗的算力与研发成果买单，这或许将成为下一阶段AI行业健康发展的基础共识。

作者：王小娟，编辑：松壑

来源：全天候科技

DeepSeek-V4发布后的行业景观

青瓜传媒 — Thu, 07 May 2026 01:46:45 +0000

DeepSeek-V4正式对外发布已经有好几天了，大家是不是感觉到，明显没有R1的热度？的确如此。业界本来对DeepSeek新模型积攒了很高的期待，希望这家公司能再次带来一个引发行业震动的大核弹，要么全民刷屏，要么把英伟达上天的股价再次打下来。

显然，V4并没有在大众层面掀起预想中的波澜与热议，甚至没什么出圈的话题。不过，这并不意味着新模型无人问津，也不是幻方量化廉颇老矣。其实我所在的行业群、朋友圈，V4是有不少人讨论、刷屏的。但讨论的角度和话题，确实跟R1时代有着截然不同的画风。

简单总结了我见到的V4发布之后的行业景观。从这些变化中，我们可以看到当下的国民级AI公司到底在做些什么，大模型行业有哪些新的变化。

第一道景观：英伟达效应的褪去

R1之所以炸裂，将DeepSeek捧上神坛，最核心的原因就是把英伟达股价给打下来了。一经推出，直接冲击英伟达资本市场估值。

但V4问世之后，英伟达股价不降反涨，小幅上涨超 4%，一有风吹草动就剧烈波动的华尔街也格外平静。

要知道，R1还是跑在英伟达集群之上，相当于用海外的算力，捅破了它们自己营造出来的泡泡。而DeepSeek-V4，全程基于国产集群训练，没有提前给英伟达任何专属测试、优先适配的权限。按照常理来说，本该比上一次更有冲击力，更能戳破英伟达高溢价的行业泡沫，可为什么这一次不奏效了呢？

很多人第一反应会疑惑：是DeepSeek-V4不够犀利了？这个问题我们稍后讲，有一个情况大家可能没有注意到，那就是今时不同往日。

此前，国内模型训练几乎都是跟英伟达深度绑定的，国产算力主要是推理，所以稍有变化，就会挤压英伟达的商业空间。

但过去两年多的时间，国产芯片的进展比较大，V4发布后，华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯在内的八家国内主流AI芯片厂商，都完成DeepSeek V4的兼容性验证与技术适配。当然，也包括英伟达。

垄断威慑力被稀释，资本市场的过激反应自然随之消失。所以DeepSeek的英伟达效应，也就这样悄然失效了。

4月底，海外半导体厂商与国内半导体厂商的股价均出现大幅暴涨，这也从侧面印证，市场普遍看好全球算力领域的需求潜力，行业格局也从单一垄断转向共生、各自发力。这个景观，或许标志着一个时代的落幕。

第二个景观：蹭不上DeepSeek的流量了

DeepSeek-V4发布之后，圈内很多媒体老师都有同一个疑惑：不知道是不是自己关注度不够，感觉没有去年那种炸裂的氛围感。大家私下交流一对账，发现不是自己的问题，整个行业都集体冷静了。一些解读V4的文章，也没什么流量。

不再能吸引全民热议和自媒体扎堆拆解的DeepSeek-V4，到底是什么成色啊？

像R1那样B端、C端通吃的能力，确实是没有了，V4的表现在大众用户和B端开发/企业用户这两类群体中，影响力比较参差。

在C端，同期海外GPT新品迭代过于逆天，性能突破拉满，抢走了绝大部分全网注意力。相比之下，DeepSeek-V4 没有拿出颠覆认知的炸裂表现，没有让大家觉得“我的妈呀这也太强了”，C 端用户感知不强，也就少了话题引爆点。

但B端的态度还是挺积极的。有不少企业开发者都第一时间进行了实测，据反馈，他们对V4最满意的地方：一个是成本，在100万tokens上下文设置下，DeepSeek-V4-Pro相比上一代V3.2，仅需27%的单令牌推理FLOP，KV缓存占用更是降到只有原来的10%。推理算力大幅缩减，KV缓存断崖式下降，直接节省大量HBM显存资源，连锁带动整体存储成本往下走，给行业留出极大的降本空间。

还有一个是应用层面，V4和各类AI智能体的适配比较强，OpenClaw、OpenCode 等主流AI代理都能无缝集成，而且价格仅为Opus的 1/58，更是GPT5.5的1/70。大家都知道agent是烧token狂魔，所以这一点备受开发者和企业的关注。

总体来看，V4确实没有给普通用户炸裂的体验感，这导致它的社交话题属性快速消退。但这不代表模型没有价值，反而说明行业正在褪去浮躁，从追逐C端噱头，转向深耕To B产业落地。

第三道景观：刷屏的不再是AI写作，而是一段语录

回想一下上一轮R1爆火，朋友圈刷屏的都是DeepSeek生成的炸裂文案、诗歌、小说，总之，大家惊叹的是AI的能力。但这一次，我朋友圈的画风完全不一样，DeepSeek-V4问世后刷屏最多、讨论最多的，是技术文章中的一句格言：不诱于誉，不恐于诽，率道而行，端然正己。

模型能力，不再震撼我们。从业者最认同的东西，变成了一种态度、一种理想主义宣言。这个社交媒体的景观也非常有意思。我想，行业的集体潜意识或许都认可，AI产业已经到了褪去浮躁、静水流深的阶段，不应该继续无谓的算力军备竞赛、模型内卷。

之所以这么说，是因为近段时间以来，整个AI赛道都在疯狂卷token，agent龙虾带火了Token经济，带来了无限的应用潜力和商业想象，但同时也催生了巨大的焦虑，从开发者、企业、普通人不断外溢，大家都感到疲惫：技术工具迭代越来越快，算力成本越来越高，可又不敢不用、不敢不学，这种猫捉老鼠式的追赶到底什么时候是个头？全社会为AI投入的巨额成本，到底能不能看到真实回报？可能很多人的脑海中，都曾浮现过这些疑虑。

这种局面下，行业其实早已不需要参数更夸张、能力更炸裂的模型核弹了。能让大家感觉成本可控、ROI更清晰的技术方案，是大家真正渴求的。

而DeepSeek-V4发布时说的这句话，不诱于誉，不恐于诽，率道而行，端然正己，代表着一种踏实、有定力的做事风格，比起炫酷的技术展演，更精准地踩中了行业的痛处，引发了大家的共鸣。

DeepSeek-V4发布之后的行业景观，结合起来看，部分呈现了当下AI产业的真实缩影：国产算力+国产大模型的生态日趋茁壮，与此同时，跟风蹭流量的泡沫开始褪去，C端的热闹抵不过真金白银的ROI回报，踏实做事、降低成本，向大模型要收益，成为主流导向，这也是AI模型厂商的全新竞逐焦点。

誉也好，毁也罢，用户对V4模型自有判断。但没有人会否认，DeepSeek依然是国产大模型中至关重要的存在，它的选择，也部分彰显着中国 AI的前行方向。

作者：脑极体

来源：脑极体

千问App产品分析报告（2026）

青瓜传媒 — Thu, 07 May 2026 01:10:47 +0000

憋了两周，终于写完了。这将会是我目前写过的最完整的一篇AI产品深度分析报告。

从2025年11月千问上线公测至今，我一直在密切关注这款产品的每一次更新和动向，期间和行业内多位AI从业者朋友反复交流和讨论，也花了大量时间梳理公开信息、对比竞品、拆解产品逻辑，最终把这些积累整理成你现在看到的这篇报告。

全篇内容预计逼近两万字，我将从产品演进、赛道格局、战略背景、产品定位、信息架构、功能矩阵、核心差异化、用户口碑、SWOT与机会点等多个维度，系统分析千问这款产品。

需要说明的是，以下全部内容仅代表个人观点，不代表任何机构立场，若有分析不当之处，欢迎和我交流讨论哈。并且内容过长，所以我做了一个一文总览的思维导图，可以先看下：

为什么是千问？

因为它做了一件在AI赛道几乎前所未见的事，用不到两个月时间，月活从306万冲到1亿。更关键的是，它走的不是任何一条已有的路：不是靠大厂流量砸出来的，不是靠模型能力口碑自然增长的，而是做了一件其他AI助手都还没做成的事，让AI真的替你把事情办完。

这背后的产品逻辑是值得认真拆解一下的

一、产品演进：从通义到千问的战略转身

1.1 通义时代：一个长达三年的战略模糊期

理解千问，必须先理解通义为什么失败。

通义大模型早在2022年就已横空出世，同步推出了通义千问、通义万相、通义听悟等众多产品。但这恰恰埋下了后来最大的问题：产品名称混乱，让用户完全搞不清楚这到底是AI助手、云计算服务，还是大模型。

这种认知困境直接体现在数据上。截至2025年第三季度，通义App的月活用户仅有306万，而同期豆包、DeepSeek的月活已经达到数亿级，差距断层。

更早的2024年上半年，通义App的活跃率（DAU/MAU）只有14.3%，月人均使用天数4.3天，两项指标都明显落后于竞争对手。

这是一个典型的技术驱动型组织做C端产品的困局：模型能力在技术层面已经不弱，但产品逻辑从来没有真正以用户为出发点建立起来

1.2 改名节点：一个名字背后的战略信号

2025年11月14日，阿里巴巴通义App版本号从3.60.0直接升级至5.0.0，软件名正式变为千问。

版本号跳过4直接到5，这个细节本身就在表态：这不是迭代，是重启。

阿里对这次更名的官方解释是：更名不是简单换名字，而是把通义从一个技术模型推向全民级AI产品的关键一步。

技术模型和全民级AI产品，是两种完全不同的产品逻辑。前者的核心用户是开发者和企业，评判标准是模型能力的强弱；后者的核心用户是普通人，评判标准是能不能解决真实生活里的具体问题。

阿里用这次改名，完成了一个明确的站队：从B端技术展示窗口，转向C端生活服务入口。

1.3 关键版本时间线

从更名到月活破亿，千问走过了一条极其密集的演进路径：公测23天月活突破3000万；12月25日月活破4000万；2026年1月15日月活破亿。同日，千问举办产品发布会，正式宣布全面接入阿里生态，开启AI办事时代。

这条时间线有一个值得注意的细节：从MAU 306万到破亿，只用了两个月。但从通义诞生到千问上线，阿里花了整整三年。

这三年不是在浪费时间，而是在完成两件必要的前置工作：

一是把Qwen大模型做到全球开源第一，建立模型底座的绝对优势；

二是把阿里生态里的各类服务标准化成可被AI调用的接口。

没有这三年，千问的两个月爆发不可能发生。

1.4 一个被忽视的关键：夸克的引流作用

千问冷启动并不是从零开始的。2025年11月26日，千问宣布与夸克AI浏览器深度整合，而夸克在电脑端的安装量高达1.1亿。这批存量用户直接变成了千问的第一波导入流量。

理解这一点很重要：千问的增长数据里，有一部分是存量迁移，而不是纯粹的新用户获取。真正考验千问的，是这批迁移过来的用户留下来之后，有多少愿意高频使用。

二、赛道格局：2026年AI助手市场的结构性分化

2.1 四强格局确立，第二集团持续分化

先看数据。根据QuestMobile 2026年3月数据，千问移动端月活1.65亿，同比增长4241%，单季度新增月活1.26亿，是同期其他AI产品新增量的数倍。阿里2026财年Q3财报同期披露，2月千问全端（App+Web+PC）月活已超3亿。

需要做一个口径说明：1.65亿是移动端App口径，3亿是全端合计口径，两个数都真实，但不能混用对比。

2.2 三条路径，本质是三种不同的留存逻辑

看完数据，更重要的是理解这三家为什么走了完全不同的路。

豆包的路：字节把豆包嵌入抖音、今日头条、剪映等50余个自家应用，内容消费、AI辅助、创作输出形成闭环。用户在刷视频、做剪辑的过程中自然触达豆包，留存建立在内容消费习惯上。优势是流量天然、获客成本低；劣势是脱离字节系场景后，豆包的独立价值就会被削弱。

DeepSeek的路：靠2025年初R1模型的现象级能力出圈，在开发者和专业用户里建立了极高的品牌认知。但C端产品力不足是它的硬伤，没有具体的高频生活场景承接用户，尝鲜之后就流失了。月活负增长已经证明了这一点。

千问的路：把AI帮你把事情办完做成闭环。接入淘宝、支付宝、淘宝闪购、飞猪、高德，上线400+项AI办事功能。这条路最重，但壁垒也最高，它需要阿里十几年积累的商业基础设施来支撑，不是靠堆模型能力就能复制的。

2.3 千问增速背后的一个隐患

4241%的增速很好看，但有一个数据需要人证分析一下。

春节免单活动首日，千问日活暴增5100万，增幅727.7%。活动驱动的日活峰值和真实留存是两回事。活动结束后，能有多少用户把千问变成日常习惯，才是真正的考验。

三、战略背景：阿里为何将千问定为集团AI入口

3.1 吴泳铭上任后的战略转向

理解千问，必须先理解吴泳铭。

2023年9月，吴泳铭出任阿里CEO，上任第三天就发了全员信，确立用户为先、AI驱动两大战略。这是阿里集团层面第一次把AI提到和电商、云计算同等重要的位置。

但真正的战略加速，发生在2025年。2025年9月的云栖大会上，吴泳铭抛出了一个比AI驱动更激进的目标：AGI是确定性事件，但AGI只是起点，阿里的终极目标是ASI。

他把路径分为三个阶段：智能涌现、自主行动、自我迭代。

当前阶段是自主行动，也就是AI要从能回答进化到能执行。千问的产品逻辑，正是这个战略阶段的直接产物。

3.2 3800亿投入的逻辑

阿里在AI上的投入规模，是理解千问战略地位的重要背景。

2025年2月，阿里宣布三年3800亿元的AI基础设施建设计划。这个数字相当于阿里2025财年营收的近40%，是一个需要集团最高层直接拍板的决策量级。随后，阿里2026财年Q1财报披露，过去4个季度AI基础设施和研发累计投入已超1000亿元。

这种量级的投入，意味着阿里不允许AI基础设施很强、C端产品很弱的错位继续存在。千问的出现，就是要把模型能力和C端用户规模这两件事真正连起来。

3.3 千问在阿里AI版图中的位置

千问在这个版图里的定位很清晰：它不是一个产品，它是一个调度层。

模型能力在底层，生态服务在末端，千问站在中间，负责把用户的自然语言意图转化成对具体服务的调用。阿里内部把这个定位描述为出门带一个千问App就能解决所有问题。

3.4 与夸克的分工逻辑

很多人搞不清楚千问和夸克的关系，因为两者在功能上有大量重叠。

拆开来看，分工其实是这样的：夸克回归到它最核心的能力（AI搜索和浏览器），服务的是我想找信息、我想搜索的需求；千问承接的是我想把一件事办完的需求。前者是信息获取，后者是任务执行。

这个分工的问题在于，随着千问的AI搜索能力不断增强，两者的边界会越来越模糊，内部竞争压力是客观存在的。这是阿里未来需要持续解决的产品管理问题。

四、产品定位：AI超级助手还是生活服务调度台

4.1 官方定位与差异化思考

千问官方给自己的定位是个人AI助手，口号是会聊天、能办事。

阿里需要把生态服务的调用能力快速展示出来，所以功能密度很高；但高密度功能对新用户来说，认知成本也相应变高。

从产品经理的视角来看，会聊天、能办事这个口号里，办事才是真正的差异化。

4.2 目标用户画像

根据公开数据和产品功能设计，千问当前的用户群体大致可以拆成三类：

学生群体：千问破亿月活的公告里明确提到在学生和白领人群中增长迅猛。学习辅导模块（千问小讲堂、整页批改、5亿资料库）是针对这一群体的核心功能，也是差异化最明显的地方。这批用户的特点是使用频次高、场景固定、但付费意愿相对偏低。

白领/职场人群：智能办公模块（AI写作、AI PPT、文档解析、实时记录）针对的就是这批人。这一群体的付费意愿更高，但竞争也最激烈，豆包、Kimi都在同一战场。

生活消费用户：靠AI办事功能拉新的那批用户，主要是被春节免单活动吸引进来的。这批用户的留存最难，因为他们进来是为了薅羊毛，能否在活动结束后继续留住，取决于千问的日常使用价值是否足够高。

4.3 千问最大的不同在哪里

和其他AI助手相比，千问最本质的差异只有一个：它是唯一一个真正打通了商业服务履约闭环的AI助手。

其他AI助手告诉你你可以去哪里买，千问直接帮你买完。这一步的跨越，看起来只是产品能力的差异，但背后需要的是整套商业基础设施的支撑。这是它的核心壁垒，也是它在2026年最值得被认真对待的原因。

五、信息架构：首页结构与核心导航逻辑拆解

5.1 整体信息架构概览

实际打开App，迎面是一个极简的对话欢迎界面：AI助手头像、个性化问候”你好，小普”、三条场景化快捷提示词，仅此而已。

这个设计选择本身就值得分析。千问没有把所有功能平铺在首页，而是选择用”对话框”作为唯一核心入口。这意味着它在传递一个明确的产品主张：不管你想做什么，说一句话就行。

5.2 首页信息架构拆解

千问首页的设计逻辑，可以用一句话概括：大对话框 + 功能快捷入口矩阵。

顶部是一个全宽的对话输入框，这是千问最核心的交互入口。无论你想做什么（点外卖、写文章、问问题）理论上都从这里开始。这个设计是对的，因为它在告诉用户：千问的核心是说一句话，事情就开始了。

5.3 顶部导航栏：两个独立入口的设计逻辑

顶部导航栏藏着两个值得拆解的设计决策。

左侧千问办事独立入口

千问没有把AI办事能力混在首页功能栏里，而是单独提升到顶部导航栏的左上角位置。这是一个明确的产品表态：办事能力是独立于对话能力的另一条路径，用户可以直接进入，不需要通过对话框来触达。

这个设计逻辑上是对的，我要问问题和我要办一件事是两种完全不同的用户意图，分开入口减少了认知混淆。

居中模型切换

顶部居中放的是模型切换入口，默认Qwen3.5，可手动切换到Qwen3-Max。

对普通用户来说，模型版本的差异是很难认清的，因此千问选择默认展示最新的模型。并且不在首页展示模型版本，而是仅保留千问。

右上角AI创作入口

右上角图标进入AI创作模块，这是一个独立的内容创作空间，区别于主对话界面。

5.4 输入框上方功能快捷栏：15个功能的取舍逻辑

输入框上方横向排列了15个功能快捷入口，按照截图里的顺序依次是：任务助理、HappyHorse、拍题答疑、AI生图、作业批改、AI写作、PPT创作、实时记录、小讲堂、AI生视频、翻译、打电话、深度研究、文档阅读、AI修图。

这里有几个值得注意的设计信息：

首先，功能密度高但不显眼。这15个入口是横向滚动排列在输入框上方的小图标，不是占据大面积的功能卡片。视觉上不会让首页显得臃肿，但对新用户来说，能不能发现这个区域、能不能看懂每个图标的含义，是一个门槛。

其次，前三位的优先级选择很有意思：任务助理、HappyHorse、拍题答疑。任务助理代表”办事”，HappyHorse是情感陪伴类功能，拍题答疑代表”学习”。这三个场景的前置，揭示了千问对自己核心用户群的判断：办事用户、情感用户、学生用户，这三类是它最想优先服务的人群。

第三，打电话功能单独拎出来值得说一说。这是千问独有的能力：AI代替用户拨打电话完成预约、询问等任务。这个功能出现在功能栏里，但位置排在第12位，优先级偏低。如果这个功能真的成熟，应该有更高的展示权重，因为它的差异化程度远超AI写作、翻译这类标配功能。

5.5 左侧抽屉：被低估的导航空间

左上角展开后可以看到我的空间、智能体、对话历史。

智能体在这里，是一个值得关注的信号。千问把智能体入口放在抽屉里而不是首页主导航，说明当前版本对智能体的定位是进阶用户功能，而不是面向大众的核心场景。这和豆包把Bot广场做成主导航Tab的策略形成了明显差异。

哪种策略更好，取决于千问对智能体的判断：它认为普通用户还没准备好高频使用智能体，对话框才是当前阶段最低门槛的入口。这个判断未必错，但随着用户熟悉度提升，智能体的入口层级应该适时上调。

六、功能矩阵：六大能力模块的边界与评估

6.1 先说清楚一件事：千问的功能比大多数人以为的要复杂得多

在正式拆解之前，我想先纠正一个我自己之前的误判。

在没有真正深入研究这款产品之前，我对千问的认知是一个能办事的AI助手，功能堆砌。但当你真的把它的功能矩阵铺开来看，会发现它走的其实是两条完全不同的产品线：

一条是AI办事超级入口，对标的是你的生活方式；另一条是AI创作平台，对标的是你的内容需求。

这两条线共享一个对话框入口，但背后的能力体系和目标用户几乎是两个独立的世界。这既是千问的产品野心，也是它最难解决的定位模糊问题。

把功能矩阵拆成六个模块来看：

6.2 模块一：AI生活办事

这是千问六个模块里唯一一个能让人停下来说”这件事只有它能做到”的功能。

但有一点必须说清楚：所谓的400+AI办事功能，并不是400个全部实现了无缝闭环。按照实际接入程度，可以分成三个层级：

这个区分很重要。如果把400+全部等同于真闭环，是在夸大千问的实际能力，也会让读者产生预期落差。

打电话订餐这个功能值得单独说一说。千问会自动拨打商家电话，用AI语音（实时情绪识别，100ms内识别50+种情绪）完成预订沟通，之后给你生成文字纪要和录音回放。

这件事本身技术含量相当高，而且真的解决了一个真实痛点：很多人不喜欢打电话，尤其是用中文和餐厅沟通这类相对复杂的任务。但它也带来了一个意想不到的问题：商家经常以为是真人在打，千问不得不在通话结尾主动声明：我是千问AI助手。这个细节透露出一件事：AI代替人类打电话这件事，在伦理和商业规则层面，还有很多没有被厘清的问题。

6.3 模块二：AI创作

如果说办事是千问的理性壁垒，那AI创作就是它正在建立的感性壁垒。

这里必须纠正一个误解：HappyHorse不是情感陪伴功能，而是阿里自研的视频生成模型。

HappyHorse 1.0的技术规格是：150亿参数、40层单流Transformer架构、原生音视频联合生成、支持7种语言唇形同步，单H100卡38秒出片。2026年4月以匿名身份登顶Artificial Analysis文生视频和图生视频双榜，随后阿里ATH创新事业部认领。4月27日开始在千问App首页以”胶囊入口”形式灰测，普通用户免费体验。

AI小剧场是另一个值得重点提的功能。它是国内第一个真正做出角色合拍玩法的AI产品——你上传照片创建数字分身，然后和近百个公开IP（甄嬛、林黛玉、孙悟空、马斯克等）同框出演AI短片，还可以把结果保存成Live实况图发朋友圈。

这个玩法的战略意图很清晰：从娱乐社交场景切入，解决千问日活不够高的问题。用户为了看自己和马斯克合拍，会反复打开App——这是一种完全不依赖阿里电商生态的留存路径。

6.4 模块三：任务助理

任务助理1.0是2026年1月15日以邀测形式上线的，初期邀请码一度在闲鱼炒到500元，足以说明用户的期待程度。

它的能力定位是类人多步骤规划Agent：你描述一个复杂任务，它自动拆解步骤、调用工具、完成执行、输出结果。Web端最多可并行处理100个文件，App端是10个，平均8到10分钟完成一份研报或小工具的生成。它还引入了双重核查机制，关键数据可由第三方Agent复核，降低幻觉风险。

这个模块和打电话订餐背后是同一套Agent基础设施，只是一个面向信息处理，一个面向物理世界执行。两者合在一起，才是千问真正意义上的AI Agent能力边界。

目前的问题是：任务助理还在邀测阶段，普通用户还没有全量覆盖。一旦全量开放，加上功能继续打磨，这会是千问最有可能建立长期用户习惯的模块。

6.5 模块四到六：学习辅导、智能办公、对话问答

学习辅导：这是千问在学生群体渗透最深的功能。千问小讲堂把AI辅导做成了可视化板书加1对1语音互动的形式，整页拍题批改直接解决家长和孩子的核心场景，5亿资料库配合千万真人老师讲题视频是真实的差异化。和猿辅导、作业帮这类垂直产品相比，千问的优势是免费、通用；劣势是系统化课程体系和深度内容还有明显差距。

智能办公：AI写作、PPT、文档解析、实时记录，这些是AI助手的标配功能，千问在这个赛道是跟随者，差异化程度不高。值得一提的是实时记录支持录制系统内部音频，可以录小宇宙、B站、播客，这比大多数竞品多了一个使用场景。

对话与问答：底层是Qwen3 Max（默认模式，非推理）和Qwen3-Max-Thinking（推理模式），默认版本是Qwen3.5，用户可以手动切换到Max。能力上和ChatGPT、Gemini处于同一水平，且完全免费，这一点在当前AI产品普遍商业化的背景下是真实的优势。但问题和信息架构章节说过的一样——模型能力的感知化不够，用户很难在对话过程中感受到”这是Qwen3 Max在帮我”的具体体验。

6.6 功能矩阵的结构性判断

把六个模块放在一起，有一个很清晰的格局：

千问有两个真正有差异化的核心能力——AI生活办事（是护城河）和AI创作（特别是HappyHorse+AI小剧场，是增长飞轮）。任务助理是第三个有潜力的支柱，但还在建设中。

其余三个模块（学习辅导、智能办公、对话问答）有实力但不独特，面对豆包和Kimi的竞争没有明显优势。

这个结构告诉我们一件事：千问真正需要打透的是前两个，而不是把资源平摊在六个方向上同时追求完美。

七、核心差异化：AI办事闭环的链路与壁垒分析

7.1 为什么这个模块值得单独拎出来讲

第六章功能矩阵里，AI生活办事是唯一一个拿到五星差异化的模块。

这不是因为其他功能不好，而是因为这个模块做到了一件事：在AI助手这个赛道里，它是全球第一个真正打通了搜索、决策、支付、履约完整链路的产品。不是宣传意义上的第一，是产品形态意义上的第一。

豆包会告诉你附近有什么好吃的。千问帮你把外卖下好了。

这一步的跨越，听起来不大，但背后需要的东西完全不同。

7.2 一句话下单的完整链路

先从最典型的场景说起。2026年1月15日的发布会现场，千问C端事业群总裁吴嘉说了一句话：帮我点40杯霸王茶姬的伯牙绝弦。

千问随后完成了这些事：识别商品品牌和产品名、定位附近门店、查询库存和可用优惠券、生成订单卡片、调用支付宝AI付完成支付、骑手接单配送。

全程没有跳转，没有手动操作，8分钟后奶茶送到了现场。

为了验证这个链路，刚好我准备买一些零食，顺便买一个挖耳勺。

把这个链路拆开来看，有三个技术节点：

第一个是意图理解。Qwen3-Max需要从一句自然语言里解析出品牌、产品名、数量、位置信息，同时推断出隐含需求，比如优先选近的门店、自动匹配可用优惠券。这依赖的是大模型的全模态理解能力。

第二个是服务调用。解析完意图之后，千问需要实时调用淘宝闪购的商品库、门店库和优惠券系统，完成商家匹配和订单生成。这依赖淘宝闪购多年积累的本地生活数据库和API接口体系。

第三个是支付闭环。传统流程里，AI推荐完商品还需要用户跳转到支付App付款。千问通过和支付宝共同开发的AI付能力，把支付授权内嵌到对话流程里，第一次授权后后续无需重复操作。

7.3 办事闭环的能力边界：不能一刀切说全部闭环

这里有一个必须说清楚的问题。

千问官方宣传的400+AI办事功能，并不意味着400项全部实现了无缝端内闭环。按照实际接入程度，大致分成三个层级：

真正实现完整闭环的是外卖、打车、电影票、演出票这几项。用户在千问界面内完成从下单到支付的全流程，不需要跳出去。这是最核心的差异化能力所在。

基本闭环的是酒店、机票、火车票。支付步骤在端内完成，但部分确认流程会跳转到飞猪页面。体验上有一定断点，但整体还算流畅。

引导型的是政务服务、充话费等。主要以入口卡片和引导链接为主，不是真正意义上的自动执行闭环。

这个分层很重要。在评估千问的办事能力时，要区分这三类，而不是把所有服务混为一谈。

7.4 打电话订餐：一个技术上领先但伦理上模糊的功能

打电话这个能力值得单独说一段。

千问会自动拨打商家电话，用AI语音完成预订沟通。背后的技术是实时情绪与意图识别引擎，100毫秒内识别50多种情绪，拟人化程度相当高。完成后生成文字纪要和录音回放，整个过程用户不需要开口说一个字。

这解决了一个真实痛点：很多人不喜欢打电话，尤其是在嘈杂环境里或者不确定对方态度的时候。AI代劳电话这件事，在效率上是实实在在的提升。

但它也带来了一个意想不到的问题：商家经常以为在跟真人对话，千问团队为此不得不在通话结尾主动声明是AI助手。这个细节暴露了一个还没被行业充分讨论的问题：AI冒充人类发起交互，在商业和伦理层面边界在哪里？这不是千问一家的问题，但作为第一个把这个能力做出来的产品，它首先要面对这个追问。

7.5 这个闭环，别家为什么复制不了

这是整个分析里最关键的问题：为什么豆包、DeepSeek、元宝做不到同样的事？

豆包也在做类似方向。它走的是系统级权限路线，通过获取手机底层权限，代替用户操作微信、淘宝、美团等第三方App。这个路线技术上更激进，但遭遇了严重阻力：上线72小时内，部分用户微信账号因登录异常被封，淘宝比价触发平台风控，多家银行App启动限制措施。

千问走的路完全不同。它不去操控别人的App，而是让所有服务主动接入千问的调度接口。这两种路线的本质差异在于：

豆包路线：我控制你的App，需要对方允许，摩擦极大。千问路线：你主动接入我的平台，需要自家生态配合，阿里恰好有这个条件。

淘宝闪购、支付宝、飞猪、高德、大麦、盒马全都是阿里系产品，接口打通不需要任何外部谈判授权。这个壁垒在短期内其他任何玩家都复制不了，因为他们没有一家公司同时拥有这些商业基础设施。

美团有外卖和打车，但没有机票和政务。腾讯有微信支付，但没有电商履约体系。字节有内容分发，但没有本地生活闭环。只有阿里，在电商、支付、本地生活、出行这几条线上同时有成熟的商业基础设施，而且全部归属同一家公司。

这是千问真正意义上的战略护城河，而不只是一个产品功能。

7.6 春节免单活动：一次压力测试，两种解读

2026年2月6日，千问启动春节30亿免单活动，9小时内订单量突破1000万单，服务器全面过载，随后连续崩溃两天。

从负面角度看，这是一次工程化能力的集体暴露：服务器宕机、配送延迟、支付失败、客服失联，黑猫投诉半天上百条，App Store中文区差评集中出现。千问在用户体验上欠了一笔不小的账。

但从产品视角来看，这次活动实际上证明了一件极为重要的事：当价格门槛足够低（25元无门槛券），用户真的愿意用AI来完成真实的生活消费。1000万单不是假数据，是真实下单，真实配送，真实送到用户手里。

这验证了AI办事闭环作为产品方向的根本可行性。在此之前，这件事还停留在理论层面。

另一个加分项：千问团队的危机公关处理意外赢得了口碑。崩溃后官方发出接地气的致歉，承诺所有已领取福利全部兑现并延长有效期。这种姿态和以往互联网大厂的冷漠式回应不同，让不少用户感受到了人情味。

这个细节说明千问的团队文化和产品调性上有一些值得肯定的东西，不应该被单纯的技术失误遮蔽。

7.7 办事能力的下一步在哪里

当前版本的千问办事，本质上还是阿里生态内的闭环。美团外卖、滴滴打车、京东购物这些生态外的服务，目前还做不到。这个边界不是技术问题，是商业生态的边界。

下一步的关键问题是：千问能否推动更多非阿里系服务接入调度层？

这个问题的答案，决定了千问能否从一个阿里生活服务超级入口，进化成一个真正意义上的AI生活操作系统。

目前来看，阿里的策略是先把自家生态内的服务做扎实，建立用户习惯和信任，再逐步向外延伸。这个路径是稳健的，但也意味着在相当一段时间里，千问的办事能力会受限于阿里生态的边界。对于一个定位是全民AI助手的产品，这是一个需要正视的天花板。

八、用户口碑：真实评价的分布与产品信号解读

8.1 先说方法论：怎么看用户口碑才不会被带偏

在拆解千问的用户口碑之前，有一件事值得先说清楚。

千问上线以来，围绕它的声音极度两极化。一边是大量格式高度雷同的好评，以”千问App：从能聊到能干”开头，结尾固定问”需要我帮你整理吗”——这类评论疑似AI批量生成或营销稿件，可信度存疑。另一边是部分自媒体言辞激烈的唱衰文，把春节崩溃事件和MAU数据争议混在一起，结论跑偏到”千问要完”。

真实的用户口碑在这两端之间。我在分析时优先采用三类来源：App Store一星差评、知乎实名用户的具体使用反馈、以及界面新闻、财新、36氪等独立媒体的实测内容。这三类来源有明确的利益无关性，更能反映产品的真实状态。

8.2 正面声音：打动用户的三个核心点

第一个是真的能把事情办完。

这是千问和其他AI助手最本质的区别，也是最高频被提及的正面评价。以前用AI点外卖，AI会告诉你可以去美团或饿了么下单。千问直接帮你下单完。

这个体验上的跨越，对第一次感受到的用户来说冲击力很强。知乎上有实测帖记录了用千问点外卖的全过程，评论区统一的感受是：它好像真的长了手。这种评价背后反映的是用户对AI能力边界预期的根本改变。

8.3 负面声音：集中在产品体验层，而不是模型能力层

这是一个很重要的观察。

千问的负面评价几乎不是在说模型能力差，而是在说产品体验上的各种细节问题。这两件事是完全不同的性质：前者是技术底座问题，后者是产品打磨问题。

基础交互流畅度：有用户明确指出，输入键盘弹出不丝滑这个问题只在千问上出现，豆包、Kimi、元宝、DeepSeek都没有。这种细节级别的卡顿，往往比功能缺失更让用户产生负面情绪，因为它是每次使用都会遇到的摩擦。

交互设计不直觉：右上角按钮不是开启新对话的入口，新对话需要从侧边栏操作，导致很多用户不小心让上下文污染了后续对话。历史记录页面里复制和分享按钮消失。这些是设计层面的取舍，但对用户来说是迷惑。

功能稳定性：联网搜索的识别失败是被反复提及的槽点。用户描述的典型场景是：明明是需要联网的问题，千问没有触发联网，直接用知识库里的信息回答，导致结果过时或错误。这个问题在内容时效性要求高的场景下特别明显。

活动体验管理失控：春节免单活动的负面口碑相当集中。App Store中文区出现格式相似度极高的大段好评，疑似批量营销，但真实差评也同样密集，典型内容是：领取页面反复失败，第二天发现券被使用，客服仅以活动火爆为由敷衍，无补偿方案。这类体验对用户信任的伤害远超一次功能Bug。

把所有正负面声音放在一起看，有一个很清晰的结构。

正面评价几乎全部来自功能层面：AI把事情办完了、模型能力够强、某个具体功能超出预期。这些评价指向的是千问的产品能力上限。

负面评价则几乎全部来自体验层面：键盘卡顿、交互反直觉、宣传和实际有落差、活动崩溃客服不给力。这些评价指向的是千问的产品体验下限。

这个分裂说明千问目前的状态是：能力过关，体验欠打磨。

对于一个已经有1.66亿月活的产品，这个状态下的优先级选择很关键。继续堆新功能，还是把现有能力的体验层做扎实？从口碑数据来看，答案相当明显：用户已经认可了千问能做什么，现在更大的流失风险来自体验层的摩擦，而不是功能的缺失。

8.4 一个值得关注的用户结构信号

春节免单活动期间有两组数据值得放在一起看：156万60岁以上长辈首次通过千问体验外卖下单，156万下沉市场和县城用户被首次激活。

这两组数字说明千问在下沉用户和银发用户群体里有真实的渗透能力，而且这批用户的触达路径靠的是活动，不是口碑传播。

这对产品的长期留存意味着什么？活动拉进来的用户，如果后续产品体验不够顺滑，是最容易流失的一批人。对于识字率低、操作习惯不够稳定的银发用户来说，一次键盘弹出卡顿或者对话历史找不到，就可能意味着永久流失。

千问如果真的把”普通人可以随时用”当成产品使命，这两批用户的留存质量，是比MAU数字更值得关注的指标。

九、产品诊断：SWOT分析与AI协同时代的机会点

9.1 SWOT分析

先把四个象限铺开来，再做交叉分析。

9.2 SWOT交叉分析：策略方向判断

SWOT不是列清单，是要把四个象限交叉起来看，才能得出有用的策略判断。

SO策略（用优势抓机会）

千问最大的机会窗口，是在AI硬件爆发期之前，用AI办事闭环这个独特能力把用户习惯建立起来。眼镜、车机、PC端是下一个入口战场，而千问已经具备了调度层的基础架构。如果能在移动端先把19.8次的月人均使用次数提升到30次以上，多端扩张的用户迁移成本会大幅降低。

银发和下沉用户是另一个值得重点投入的方向。这批人156万的规模是春节活动一次性激活的，他们对AI办事的需求是真实的，但对产品流畅度的容忍度更低。如果产品体验能跟上，这批用户的渗透空间比城市白领更大，因为他们没有使用替代产品的习惯。

WO策略（用机会补劣势）

海外国际版是一个绕开国内问题的机会。在国际市场里，千问没有微信封禁的干扰，没有春节崩溃的负面记忆，可以用一个更干净的产品形态重新起步。Qwen模型在海外开发者里已经建立了良好口碑，这是C端国际版最好的背书。

ST策略（用优势抵抗威胁）

对抗微信封禁最有效的方式不是和微信博弈，而是让用户在千问内形成足够深的行为闭环，使他们不需要通过微信来分享和传播千问。当一个用户在千问里完成外卖、机票、电影票的日常消费闭环，他对千问的依赖就不再需要通过社交分享来维持。

WT策略（规避劣势与威胁叠加）

月人均使用次数低加上活动退潮，是最危险的组合。千问必须在2026年Q2里把至少一个高频场景的用户习惯固化。从现有数据来看，学习辅导（K12用户高频且规律）和日常餐饮消费（外卖高频且刚需）是最有可能做到的两个方向，比智能办公更适合作为留存抓手。

9.3 AI 协同新范式：“白纸心态”为什么在千问上特别成立

我在研究千问的过程中，反复想到一段话。

罗福莉在播客里，说她现在招人更偏爱大二大三的本科生，因为他们对AI没有先入为主的偏见。她用了一个词：污染。年轻人是一张白纸，没有被旧范式污染。以前经验是护城河，现在反而成了枷锁。

Boris Cherny也有一个类似的观察：最能发挥大模型潜力的，往往是对技术边界一无所知的新同事或者应届生。他们不会人为给AI设限，反而更能用好AI。

这两个观察，我认为在千问这个产品上有非常具体的体现。

千问不是一个面向有经验用户设计的产品。它的核心用户画像里，学生、家庭用户、年轻人占了相当比例。这些用户没有搜索引擎的使用习惯，没有要分多个App完成不同任务的路径依赖，他们第一次接触AI就是千问：一句话说需求，等结果。这种“白纸式”的使用方式，反而和千问的产品逻辑高度契合。

再往远处看。猎豹移动首届黑客松冠军姜睦然，14岁，做了一个叫Claw Founder的项目，让AI自动化完成整个创业流程：从想法到白皮书，到开发文档，到写代码，到测试，到发布GitHub，全程6小时AI跑完，人只聊了半小时。Christine Zhang，19岁，哈佛gap year，和室友创立Intera，做AI加临床试验，融了100万美元。Aidan Guo，19岁，做了个AI桌面助手Attention Engineering，拿了125万美元pre-seed。

这群人没有一个靠积累了十年行业经验起家。一个想法，加上会用AI，一个人能干以前一个团队的活。

这不是偶然现象，这是AI时代的结构性机会重分配。

但我想说的不是年纪大了就完蛋了。白纸心态跟年龄无关，跟的是你愿不愿意放下已有的经验框架，重新以AI为起点想问题。AI面前我们都是小学生，没有资历这回事，只有愿不愿意重新学。

这和千问有什么关系？

千问是目前所有国内AI助手里，最接近”让普通人以AI为起点完成真实任务”这个产品理想的产品。它把点外卖、叫出行、找攻略、订酒店这些日常事务，压缩成了一句话的交互。这种设计逻辑，天然对白纸用户友好——不需要你懂什么叫Agent，不需要你懂什么叫工作流，只需要你说出你的需求。

从这个角度看，千问最大的机会不是在存量的AI重度用户里和豆包、DeepSeek抢份额，而是在那些从来没有被AI助手真正服务到的普通人里，建立第一次认知。这批人数量足够大，习惯还没固化，而且一旦在千问里形成了”说一句话就能办成事”的心智，这种习惯会非常稳固。

9.4 机会点优先级：PM视角的判断

把前面所有的分析收拢，作为PM，我会把千问接下来的机会点按优先级这样排列：

优先级一：新用户引导体验重构（高价值，低难度）

这是目前千问最容易拿到但还没拿到的分。现有的新用户第一次打开App，面对的是一个充满功能入口的首页，和一个不知道该说什么的对话框。千问需要一个有引导感的冷启动流程，告诉用户”你可以这样开始用我”——三个场景，三句话，让用户的第一次交互就能成功。第一次成功的体验，是留存的根基。

优先级二：办事场景覆盖密度（高价值，中低难度）

AI办事闭环是千问最大的护城河，但目前支持的场景还相对集中在外卖、出行等少数高频场景。接下来需要把场景密度做高——挂号、买药、机票预订、演出票务、政务服务……每增加一个场景，就多一批对应场景的用户被激活。阿里的生态纵深是支撑这件事的最大优势，这也是其他竞品最难复制的部分。

优先级三：学习辅导场景的纵深扩展（高价值，中等难度）

学习辅导是千问目前在功能差异化上最有竞争力的模块之一，但还停留在”解题、批改”这个层次。往上走一层是”个性化学习路径”，往下走一层是”家长端的数据洞察”。这个方向足够深，用户黏性极高，而且变现路径比通用对话清晰得多。

优先级四：信息架构和功能入口的整合收敛（中等价值，中等难度）

这是一道必做的”减法题”。目前千问首页的信息密度还是偏高，很多功能的触达路径不够清晰。需要在产品层面做一次系统性的信息架构梳理，把用户最高频的三到五个场景放到最显眼的位置，其余功能做好分层收纳，而不是全部堆在首页等用户自己发现。

优先级五：模型能力的感知化设计（中等价值，中等难度）

千问底层用的是Qwen3-Max，这个能力是真实存在的，但用户感知不到。需要在产品层面设计更多”让用户感受到AI在帮我思考”的交互时刻——思考过程的可视化、回答质量的主动标注、和上下文强相关的追问引导。把模型能力翻译成用户可感知的体验，是这个阶段的重要课题。

结尾

我做产品这几年，见过太多产品死在什么都想做这件事上。

功能越堆越多，首页越来越满，用户越来越困惑，留存越来越差。最后团队复盘，结论往往是”我们的功能不够好”——然后继续堆。这个循环，在国内AI助手赛道正在密集上演。

千问是一个异类。不是因为它做得有多完美，而是因为它至少做对了一件事：它找到了一条别人没走过的路，并且在这条路上跑出了真实的数据。

月活从306万到1亿，用了不到两个月。这个数字放在任何赛道都是异常值。背后是淘宝闪购的履约体系、支付宝的支付闭环、阿里云的模型底座——这些资源不是任何一家创业公司能复制的，也不是豆包、Kimi这样的产品能在短期内追上的。

但我也说了我的担忧。

1.3亿用户、2亿次下单，这组数据里有多少是春节红包活动带来的冲量，有多少是真正沉淀下来的日活，千问自己比谁都清楚。活动退潮之后，DAU的长期曲线才是真正的考卷。

千问真正的挑战不在于能不能做更多功能，而在于能不能让用户在没有补贴的普通日子里，还是习惯性地打开它说一句话。这件事，任何一个月活数字都证明不了，只有时间能证明。

我倾向于相信它能做到。但前提是，它得先学会做减法。

把最有价值的那一两个场景做到极致，比把所有功能都堆在首页等用户自己发现，要难得多，也有效得多。这不是AI时代的新道理，这是产品永远的第一原则。

作者：小普

如何运营好小红书店铺？

青瓜传媒 — Thu, 07 May 2026 00:45:31 +0000

小红书店铺实际上跟淘宝、天猫之类的店铺经营是类似的逻辑，只是小红书店铺的流量侧重来源于自己的账号及内容，而非商城搜索之类，所以针对小红书店铺经营就不过多阐述基础性操作之类，而是侧重阐述一些我觉得值得关注的微操。

1. 假设商品品牌里，没有自己的品牌，可进行申请“添加自荐品牌“；

2. 发布商品的时候，商品标题可带有“新人限时优惠”之类的具有引导购买性质的内容；

3. 商品主图实际上不一定非得是白底图，可设置成类似于淘宝一样的、带有相关关键信息的主图；

4. 商品上架后，推荐做一下基础销量及晒单笔记，这样可提高转化率；

5. 可在“商品 – 评价管理”管理所有的晒单笔记，支持“置顶”、“精选”优质的晒单笔记；假设有负面晒单笔记，也可进行申诉，但是申诉成功率不高。

6. 售后的话，可通过“售后助手”设置售后策略， e.g. 自动同意未发货仅退款，提高效率；

7. 推荐开通“运费宝”，至于“安心购”则需要考虑“假一赔四”的问题；

8. 开通“运费宝”之后，需要注意店铺余额账户，假设余额不足，会导致运费险失效；

9. 小红书笔记带货可在小红书商家管理后台“带货”版块查看是否有权限，以及进行相关设置管理；

推荐不要设置“免费拿样”，而是设置“买样返款”，这样可提高销量数据，尤其是新品；

其次，合作笔记带货的博主也需要进行筛选及管理，而不是随缘，在博主申请合作之后，即可主动建联，提供 Brief 等，方便博主进行创作，甚至可把这些博主作为直发博主，或者内容提供者等；

最后，笔记带货也可跟达播一样，设置阶梯式佣金，以及投流奖励等，这套逻辑可参考借鉴抖音。

10. 推荐定期查看小红书商家管理后台的消息，避免错过一些关键信息，e.g. 活动报名、违规通知等；

11. 小红书的营销活动推荐多报名参与，每次活动只需要按照规则去执行均有一定流量扶持；

12. 小红书店铺的相关营销工具可利用起来，尤其是“优惠券”与“晒单有礼”；

优惠券，推荐设置“全网自动推广券”、“店铺新客券“、”购物车惊喜券“、“粉丝专享券”，这些优惠券推荐设置成全店商品，因为设置之后，在商品笔记侧是有优惠价格显示的，可提高一定的转化率，而“粉丝专享券”则可提高账号粉丝量；

但是优惠券的每个人可领取的数量不推荐太多，这样容易影响客单价；

晒单有礼，推荐设置比较有吸引力的优惠券，这样可刺激用户好评，以及晒单，提高商品分，以及转化率。

13. 小红书店铺的 ARK 推广现阶段不是特别好用，实际转化数据会有点虚高；

14. 可在小红书商家管理后台“用户”版块查看自己店铺的 AIPL 人数数据，至于是否需要开通会员管理，推荐跟电商保持一致即可；

15. 小红书客服需要稍微花点心思去管理，因为客服会影响账号流量，假设客服数据不达标的话，会导致账号限流。

作者：林卿LinQ

来源：林卿LinQ

青瓜早报：Kimi将完成20亿美元融资；DeepSeek估值近450亿美元…

青瓜传媒 — Thu, 07 May 2026 00:05:44 +0000

一、国内新闻

月之暗面将完成20亿美元新融资，估值破200亿美元

据悉，Kimi（月之暗面）即将完成新一轮20亿美元融资，投后估值突破200亿美元。本轮融资由美团龙珠领投，中国移动、CPE（中信产业基金）等参投，其中仅龙珠就出手超2亿美元。

今年1月和2月，Kimi刚密集完成3轮融资，分别融了5亿美元、7亿美元和7亿美元。算上这笔最新融资，不到半年里，Kimi融资超39亿美元，最新估值相比去年11月的约43亿美元翻了4倍有余。

至此，Kimi 累计融资额已超376亿人民币，成为大模型创业公司中累计融资最多的公司。算上IPO募资，MiniMax累计融资约150亿人民币，智谱约130亿人民币。

DeepSeek估值近450亿美元

据《金融时报》报道，国家集成电路产业投资基金（简称“国家大基金”）正在与 DeepSeek 洽谈主导其首轮融资事宜，其最终估值有望定在 450 亿美元左右。就在数周前的谈判早期阶段，外界对 DeepSeek 的估值还处于 200 亿美元左右，而现在直接翻了一番。《金融时报》认为，尽管该公司目前仍以模型研发为主、商业化力度有限，但投资者仍看好其发展潜力。

消息人士透露，参与此次融资谈判的其他潜在投资者中，还有中国科技巨头腾讯。不过，本轮融资的最终参投方阵容尚未尘埃落定。

三星突发公告：在中国大陆停售所有家电产品

5月6日，三星电子在官网发布公告称，为应对急剧变化的市场环境，经慎重研究，三星电子决定在中国大陆市场停止销售含电视、显示器在内的所有家电产品。针对已购买三星家电产品的用户，公司仍将严格按照《消费者权益保护法》、国家三包规定等相关法律法规，继续为用户提供规范的售后服务，保障用户合法权益不受影响。此外，三星电子回应表示，手机产品正常销售，不会退出中国。将停止销售的产品包括电视、显示器、大型商用显示器、空调、冰箱、洗衣机、干衣机、洗衣干衣一体机、衣物护理机、音响、投影仪、吸尘器、空气净化器等所有家用电器。（中国新闻网）

五粮液：五粮液集团拟增持不少于30亿元

五粮液5月6日发布公告称，四川省宜宾五粮液集团有限公司计划自6日起6个月内通过深交所增持公司股票，拟增持金额不低于30亿元、不超过50亿元，不设价格区间，资金来源为自有资金，增持完成后股份锁定6个月。此外，4月30日，五粮液曾公告称，拟以80亿元—100亿元回购公司股份，回购价格不超过153.59元/股，本次回购股份将用于减少公司注册资本。（财联社）

二、国际新闻

OpenAI将在算力方面投入500亿美元

OpenAI联合创始人兼总裁布罗克曼当地时间5月5日出庭作证时表示，预计公司今年将在算力方面投入500亿美元。布罗克曼称，随着OpenAI开发更先进的AI模型并向更广泛用户提供服务，其计算成本已从2017年的约3000万美元激增至今年的数百亿美元。（界面新闻）

Meta计划面向消费者推出先进的“代理型”AI助手

据悉，Meta Platforms正在构建一个高度个性化的AI助手，以执行日常任务。与此同时，该公司因其不断飙升的AI支出正面临投资者的审视。据知情人士透露，该公司正在为其超过30亿用户构建代理型工具，其中包括一个将由新款Muse Spark AI模型驱动的高级数字助手。

SpaceXAI与Anthropic签署协议，进军太空算力领域

据财联社5月7日电，马斯克旗下初创公司xAI称，与Anthropic建立新的计算合作伙伴关系。SpaceXAI已与Anthropic签署协议，将提供Colossus 1的访问权限；Anthropic计划利用这额外的计算能力直接提升Claude Pro和Claude Max用户的服务能力。Anthropic表示，这项合作将大幅提高公司的算力水平，仅在未来1个月内就能带来超过300兆瓦的新增容量，相当于22万个英伟达GPU。SpaceX与Anthropic的合作协议，还包括太空算力领域的愿景。Anthropic表示“有兴趣合作开发数吉瓦级的轨道AI算力”。

MiroMind暂停中国服务

5月6日，记者获悉，有用户收到MiroMind公司邮件，称由于业务调整需要，MiroMind旗下MiroThinker服务（dr.miromind.ai网页版与MiroMind移动应用）将于2026年5月12日起，暂停向中国大陆、香港、澳门地区提供，恢复时间待定。MiroMind公司官网（https://miromind.ai）不受影响，将保持正常访问。记者向MiroMind方面证实了邮件的真实性。MiroMind是盛大集团创始人陈天桥创办的AI研究公司，MiroThinker为该公司推出的智能体服务。此举正值MiroMind知识产权争议升级之际。上个月，MiroMind发布《关于代季峰相关不实言论的内部通报》，通报指公司早期核心人员代季峰“商业诚信违约”。（第一财经）

达成和解！马斯克同意支付150万美元罚款

据报道，近日，一份法庭文件显示，美国证券交易委员会已经与美国企业家马斯克就收购推特期间涉嫌违规的诉讼达成和解。作为和解协议的一部分，当时买入推特股票所使用的马斯克名下可撤销信托，将向美国证交会支付150万美元（约合人民币1025万元）的民事罚款。（每经综合）

苹果因夸大AI功能以2.5亿美元和解

当地时间5月5日，因夸大AI系统“苹果智能”（Apple Intelligence）的能力，误导数百万iPhone买家，苹果公司被起诉后达成2.5亿美元和解，部分iPhone用户将有资格获得25美元至95美元赔偿。（澎湃新闻）

特斯拉将召回美国市场近21.9万辆汽车

美国国家公路交通安全管理局当地时间6日发布的召回信息显示，特斯拉将召回在美国销售的218868辆汽车，原因是部分车辆倒车时后视摄像头图像延迟显示，影响驾驶员视野，可能增加碰撞风险。召回涉及部分Model 3、Model Y、Model S和Model X车型。（央视新闻）

宝马回应LG新能源电池大单传闻：不评论猜测，持续评估供应商阵容

5月6日，针对近期“LG新能源即将拿下宝马46系列大圆柱电池10万亿韩元订单”的市场传闻，宝马表示，不会就媒体的猜测发表评论。宝马同时强调，为确保全球供应链的韧性，公司持续根据自身需求评估供应商阵容，这一原则同样适用于快速发展的电动汽车产业以及相关电池电芯的供应。（财联社）

作者：青瓜早报

来源：青瓜传媒

小红书上能爆的产品到底长什么样！

青瓜传媒 — Wed, 06 May 2026 08:25:36 +0000

每次选品这个主题我都会花长篇大论来讲。

不是因为方法论有多复杂，而是因为大部分人对选品的理解，从第一步就偏了 —— 拿到一个产品，先看品质好不好、价格有没有竞争力、供应链稳不稳定……

这些重要嘛？重要。但在小红书闭环电商的语境下，这些只是基本功，不是决胜点。

因为在小红书这样的内容电商平台，你卖的不是产品，而是内容素材。

什么意思？

用户在小红书上看到的“产品”，本质上是你通过图文、视频、直播这些内容形式塑造出来的。用户没有摸到你的产品，没有闻到你的产品……TA对于产品的所有感知都来自于你做的内容。

所以选品的时候就不能只盯着产品本身，还需要同时考虑一系列问题：这个产品能不能做出好内容？能不能被传播？能不能被包装成一个让人想点进去看的东西？……

一个品质90分但做不出好内容的产品，和一个品质75分但天然适合出内容的产品，在小红书上，后者的爆款概率大概率高于前者，这就是内容电商和货架电商的本质区别。

在货架电商，用户搜索、比价、下单，产品本身就是一切；在内容电商，内容是产品和用户之间的桥梁，桥梁质量决定了有多少人能“走过来”。

因为选品涉及的内容太多，所以我把它拆成了2篇文章，这篇是上篇，集中讲清楚一件事儿：什么样的产品在小红书上具备爆款潜质？

我自己的习惯是把它拆成一套判断参照系，不是说每条都必须满足，而是你的产品命中的共性越多，爆的概率就越大。毕竟选品本身就是个概率游戏，我们能做的就是尽量把概率往上拉。

01.先过小红书平台这一关

小红书有三个底层特性，你的产品如果不匹配其中任何一个，基本就很难在这个平台跑起来。这三个特性不是我总结的，而是这个平台的用户结构和内容生态决定的。

1.1.审美驱动：颜值即正义

产品要满足高颜值、有设计感、视觉表现力强，这三个条件的任意一个。

*视觉表现力强：颜色鲜艳、造型奇特、在杂乱背景里一眼能被看见……这些都算视觉表现力强。

但审美驱动不等于盲目精致，比如地方特产，用户愿意买某些“地方特产”，恰恰是因为它保留了地方特色属性 —— 老字号牛皮纸包装、手写体标签、甚至带点“土”的设计感。你要是把它做成无印良品那种极简风格，反而丧失了辨识度，用户还会怀疑：这真的是地方特产嘛？是从产地发的嘛？会不会是贴牌的？……

再比如手工类产品、非遗类产品，它们的审美价值恰恰在于“不完美” —— 手工痕迹、自然质感、不规则的形态，这些才是用户愿意买单的审美点。如果你把它做得跟工业流水线出来的一样精致统一，反而丢了灵魂。

所以审美驱动这件事儿，核心不是“做得精致”，而是“审美匹配品类调性、符合用户认知”。你的产品是什么气质，审美就往什么方向走。该精致精致，该粗犷粗犷，该土味土味……重点是有辨识度、有视觉记忆点。

1.2.价值驱动：超值感

所有产品提供的价值，可以拆成三层：

1.2.1.第一层：实用价值

好用、能解决具体问题。几乎所有产品都能满足这一层，这是基础。

但仅仅是靠基础的实用价值很难让用户产生购买冲动，因为实用价值在哪个产品上都能获得，用户没有非买不可的理由。

1.2.2.第二层：情绪价值

核心就两个字“悦己”，通过自我愉悦引发购买冲动。

情绪价值不是一个虚的概念，它有很多具体的表现形式：

仪式感：生日蛋糕不是因为好吃才买，是因为吹蜡烛许愿那个仪式；
获得感：拆盲盒的那一刻；
陪伴感：一个放在桌上的玩偶，不解决任何实际问题，但你看到它就觉得安心；
治愈感：香薰点上的那一瞬间，整个房间氛围变了；
优越感：穿了一件好看的衣服被同事追问“这衣服哪买的”，那个瞬间的愉悦就是优越感在起作用……

1.2.3.第三层：精神价值

比如穿Lululemon不只是因为舒服，是因为它代表“自律大女主”这个身份标签，这是表达自我；

追星买周边、去偶像演唱会买应援物，这是支持/接近喜欢的人，饭圈逻辑；

买环保品牌、买松弛感设计的产品，这是价值观共鸣，“我认同你传递的生活理念”……

这三层价值不是非此即彼的关系，好的产品往往是多层叠加的，但不管你提供的是哪一层，本质上都要做到一件事儿：让用户觉得“超值”。

怎么做到？

做好用户的预期管理，然后在产品的使用体验里设计一个“惊喜时刻”，比如至本洗面奶99元左右，这个价位用户的心理预期大概就是“还行吧，试试看”；但它用了跟Apple同等级的包装工艺，顺丰包邮，你拆快递的时候，包装的质感、开箱的体验……整个过程远远超出你对99块钱洗面奶的预期。

这就是惊喜时刻，不是产品本身有多惊艳，而是体验和预期之间的落差足够大。

所以，超值感的本质不是便宜，而是“超预期”。

1.3.M型消费：骑着单车去酒吧，该省省该花花

小红书用户的消费结构是两极分化的，中间地带反而在塌陷。

一极是大众刚需品，追求极致“质价比”。

注意是“质价比”，质量除以价格，不是传统的“性价比”，这两个概念的区别很关键。

传统的性价比强调的是“这个价格能买到多少功能”，核心导向是便宜、划算、不亏。

但质价比强调的是“这个价格对应的品质是不是足够好”，核心导向是品质，价格只是品质的一个参照维度。

2026年小红书电商商家大会已经很明确了：用户购买决策的第一核心要素是产品品质，不是价格。

这就意味着在小红书上，你不能靠“比别人便宜”来赢，你要靠“同价位里品质最好”来赢。用户不是不在乎价格，而是TA们先看品质再看价格，“可以买贵的，但不能买贵了”。

另一极是悦己品类，追求“情绪价值”。

香氛、玩具玩偶、潮玩手办、小众设计师品牌……这些能带来情绪价值和精神价值的品类，用户花钱是相对大方的，溢价空间也更大。因为这些品类买的不是功能，是感受，而感受是很难被量化比价的。

所以你的产品落在哪一极，就决定了你的定价逻辑和内容策略。

毕竟这是完全不同的两套打法，刚需品打质价比，内容强调“品质好+价格合理”；悦己品打情绪溢价，内容强调“感受+体验+生活方式”。

02.爆款产品的结构性特征

过了平台适配这一关，接下来就看产品本身的结构性特征，即“什么样的产品结构天然更容易爆”。

2.1.产品类型走两极

在小红书上卖得好的产品，基本就两种类型：

一种是大众刚需品，覆盖人群广、需求稳定、容易起量，以中低客单价和规模体量为主。

但想在小红书卖好，就必须叠加极致差异化，要么是极致体验，要么是极致审美。

你去看小红书上卖得好的扫把、纸巾盒、垃圾桶，再去看淘宝上同品类的销量款，差别一眼就能看出来，小红书上的版本都有明显的设计感和创意化处理，在功能相同的前提下，审美和体验拉开了差距。

这就是大众刚需品在小红书上的打法：在用户已有认知和需求的基础上，做出“更好看”或者“更好用”的版本。

另一种是小众非标品，规模不大但需求鲜明，满足个性化需求，本质是细分加差异化，以中高客单价为主，比如定制游、升学规划、JK/洛丽塔、新中式汉服定制、小众香水定制，都属于这类。

这类产品的优势是竞争相对小、用户粘性高、利润空间大，劣势是天花板有限，需要不断拓展细分场景。

至于中间地带是最难做的，不上不下、不大不小、不够刚需也不够特别，这种品在小红书上容易淹没在信息流里，用户没有非买不可的理由，也没有想分享的冲动。

2.2.必须存在市场机会

所有爆款之所以爆，背后一定存在市场机会，要么是在红海里找到蓝海缝隙，要么是通过趋势捕捉、需求洞察发现全新蓝海。

所以，怎么找到市场机会呢？

2.2.1.找到细分的场景、细分的人群、细分的痛点

比如“防晒”是一个大红海，但“军训防晒”就是一个细分场景，人群明确（准大学生）、时间窗口明确（暑假末期）、痛点非常具体（烈日下暴晒一天还不能打伞）……你围绕这个细分场景去做产品组合和内容，就能避开“防晒”这个大红海里的正面竞争。

2.2.2.从原有竞争里发现新场景、新人群、新需求

比如护手霜这个品类一直存在，但如果你深入去挖用户的搜索行为，会发现很多人搜“送妈妈的礼物”，最后买了护手霜。“送妈妈”就是一个在原有竞争里被忽略的新场景，围绕这个场景去做产品包装和内容，跟你在“护手霜”这个红海里正面厮杀是完全不同的竞争格局。

2.2.3.重新定义一个需求

钻戒就是最经典的案例，钻石以前根本不值钱，是通过营销把“永恒的爱情”这个概念嫁接到钻石上，把结婚仪式感和钻石强绑定，硬生生创造了一个新需求。这种机会最稀缺，但一旦做成了，壁垒也最高。

最后，有一个比较关键的判断标准：这个市场机会必须是“头部品牌看不上，但市场规模还不错”的。

换个说法就是，这个蓝海足够养活你，但还不够大到吸引大品牌进场。一旦头部品牌看上了想进来做，赛道就会极其内卷，你的先发优势就会被资源优势碾压。

2.3.高利润和高复购，至少占一个

高利润是支撑各种经营成本的基础，你要做内容、要投流……这些都需要利润来覆盖。利润薄的品不是不能做，而是容错空间极小，任何一个环节出问题就可能亏钱。

高复购是你的资产沉淀和基本盘，每一个复购用户都是你不需要额外花钱获取的订单，复购越高，你的获客成本就会被摊得越薄，生意模型就越健康。

大部分跑出来的爆款产品至少满足其中一个。两个都不占的品，做起来会非常累，赚的都是辛苦钱，而且抗风险能力极差。

2.4.趋势性：在特定时间段自带流量和转化

季节性、节日性、热点性、流行趋势……我把它们统称为“趋势性”，核心特征是：在特定时间段自带流量和转化势能。

比如冬天的光腿神器、应季水果，这是季节性；

圣诞送苹果、圣诞氛围围巾，这是节日性；
明星同款、热播剧同款衣服和手办，这是热点性；
现在流行的拼豆、捏捏，这是趋势性……

但是追趋势不等于盲目跟风，而是提前布局、快速响应、顺势而为。

大部分人对趋势的理解是“等它火了我跟上”，但这已经晚了，等你看到别人爆了再去找供应链、做内容、上架，流量高峰已经过去一半了。

爆款是一个轮回，大部分爆款就是“新瓶装旧酒”，今年的爆品往往是去年爆品的迭代升级版，比如圣诞氛围产品每年都会火一轮，但每年火的具体款式不一样；夏天的防晒类产品每年都有一波峰值，但每年的爆款单品会迭代……

所以趋势性布局最有效的方法是：建立爆品记录的习惯，回过头来看去年的爆品，提前为今年做布局。

说白了就是：你把去年每个时间段什么品爆了、为什么爆、什么元素起了作用记下来，今年到了同一个时间节点，就提前两个月开始准备……这比盯着实时榜单跟风靠谱得多。

03.能不能做好内容，决定了产品的天花板

小红书是内容电商平台，内容决定传播效率。

一个产品再好，如果没办法做出好内容、没办法做好展示，那在这个平台上就是先天不足，所以这个部分讲三个跟内容直接相关的产品特征。

3.1.卖点可视化：本质是呈现结果，而不是呈现卖点

卖点可视化的本质不是呈现卖点，而是呈现结果，因为用户买的不是产品，而是产品带来的结果。

比如买美白精华的人，想买的是“自己变白”这个结果；

买收纳箱的人，想买的是“房间整洁”这个结果；

买减肥产品的人，想买的是“自己变瘦”这个结果……

所以你的内容不需要花大量篇幅去解释产品的成分、技术、工艺……你只需要呈现“使用前 → 使用后”的变化就够了，用户看到变化，自然会想“我也要”。

但问题来了，不是所有产品的结果都容易被看到。美白精华的变化是可视的，但一个号称“改善睡眠”的枕头，你怎么可视化？

所以当产品本身的卖点不容易被看到的时候，我们就需要通过内容手法让它变得可视化。

我总结了五种常用的方式：

3.1.1.借助道具放大卖点

防晒喷雾的防晒效果肉眼看不出来，但你给一根香蕉喷上防晒霜，另一根不喷，两根一起晒太阳，几小时后对比，效果一目了然；

防蓝光眼镜、护眼灯这类产品，用蓝光试纸或者检测仪去测，数据变化直观可见……

道具的作用就是把“看不到的效果”转化成“看得到的差异”。

3.1.2.通过前后对比强化卖点

护肤品最常用这个手法，但很多人只发一张“使用后”的效果图，这不叫前后对比，这叫自卖自夸。

真正有效的前后对比是记录整个使用周期的变化过程，让用户看到从Day1到Day30的真实变化轨迹，可信度和说服力完全不同。

3.1.3.以量取胜，量大吸睛

这是利用心理学，用户看到一堆东西堆在一起，直觉反应就是“好多啊，好划算”。

9.9元一袋和9.9元一大堆摊开在桌上，视觉冲击力完全不同，即便实际内容量一样。

3.1.4.场景差异化制造信任

大健康产品、水果、食品去做产地溯源实拍，比如田间地头、工厂车间、包装现场，用差异化的场景建立信任感。

用户在小红书上看惯了精致的产品图，突然看到一个产地实拍的真实场景，反而更愿意相信。

3.1.5.极端测试

小杨哥直播间踩行李箱就是这个逻辑，通过极端条件下的测试，让产品卖点被最大化呈现。

你说行李箱结实，不如直接站上去蹦两下；

你说玻璃杯耐摔，不如直接往地上扔……

极端测试的本质是用最直观的方式消除用户的疑虑。

3.2.社交货币属性：让用户替你传播

如果说卖点可视化解决的是“用户愿不愿意买”，社交货币属性解决的是“用户愿不愿意帮你传播”。

产品能让用户产生分享欲、表达欲，或者能帮用户在社交场景里立人设，这就是社交货币属性。

有这个属性的产品，每一个购买用户都可能成为你的“自来水”。

3.2.1.可分享

产品自带话题点、争议性，或者特别上镜，用户买了之后忍不住要分享，比如潮玩抽到隐藏款发朋友圈、买了一个造型很奇特的杯子拍照发小红书、吃了一家颜值很高的甜品必须打卡……这都是“可分享”在起作用。

“可分享”的关键不是产品本身多好，而是产品能不能提供一个“值得分享的瞬间”。

3.2.2.身份标签感

购买即传递生活方式和态度，比如不同品牌的车有鄙视链，买Lululemon代表自律大女主，用无印良品代表极简主义……这都是身份标签。

用户买这些品牌，不只是买产品，是买“我是这样的人”这个标签。

如果你的产品能让用户觉得“买了它，我就是某种人”，那你的传播力和溢价能力都会大幅提高。

3.2.3.“小钱感”：花小钱让别人觉得你花了大钱

这个维度特别有意思，比如看起来很贵的手表实际上只要一两百块钱；57元12瓶的小众饮料，单价跟普通乌龙茶差不多，但因为包装小众、品牌稀缺，拿出来喝，别人看到会觉得“这人喝的水都不一样”……

“小钱感”的本质是用低成本帮用户实现了“看起来很贵”的社交效果，这类产品天然具备传播基因，因为用户有充足的动力去“秀”。

3.3.内容适配性：好不好做内容

这一点看起来最简单，但其实是最容易被忽略的筛选条件。

能不能拍出好看的图？能不能做出有信息增量的视频？能不能在笔记里讲出差异化的故事？产品拿在手里，你能不能在30秒内想到至少三个内容切入角度？……

如果一个产品怎么拍都不好看、怎么讲都讲不出花来、怎么做内容都平平无奇……它可能品质很好，但在小红书这种内容驱动的平台上就是先天不足，这种品更适合走货架电商，靠搜索和比价来转化。

反过来，有些产品天生就适合做内容，比如

食品天然适合做“开箱+试吃”内容；
美妆天然适合做“教程+对比”内容；
家居天然适合做“改造前后”内容；
服饰天然适合做“穿搭+场景”内容……

选品的时候，把“这个品好不好做内容”作为一个硬性筛选条件，能帮你避掉很多坑。

04.用户视角的四个隐性门槛

上述讲的是产品端和内容端的特征，接下来换到用户视角。

产品再好、内容再强，用户愿不愿意掏钱，还受到四个隐性门槛的影响。

4.1.人群定位清晰，场景容易界定

这两者本身是一体的，人群清晰了场景就好界定，场景界定了人群就更清晰。

说白了就是：让目标用户看到你的产品后，能一下子联想到使用场景，即“这个东西我用在哪里、什么时候用、解决什么问题……”，用户不需要想太久就能回答这三个问题，做到这一点，就叫精准切入了“小而具体的需求”。

而大部分人容易犯的错误是什么？

是既要又要还想要，是想覆盖所有人群、想适配所有场景、想传达所有卖点……最后的结果就是谁都记不住你。

想成为大众的，大概率会被大众所颠覆。

用猫砂来举个例子，大部分品牌的猫砂做得很均衡，除臭还行、结团还行、不粘脚还行……每个维度都做到了六七十分，看起来能适配所有养猫人群，但实际上打动不了任何一个细分人群。因为每个维度都是“还行”，就是没有一个维度让人觉得“这个真的好”。

但如果你换个思路，核心锚定“爱干净有洁癖的精致女生”这个人群，这类用户最在意什么？

第一是气味，家里绝对不能有猫屎味，最好猫砂本身还有点香味；

第二是结团性能，结不了团就意味着铲屎的时候碎掉、弄得到处都是；

第三是没有碎渣，猫从猫砂盆出来的时候，不要带一地碎渣……

这样卖点排序就极其清晰了：除臭（甚至要香）> 结团 > 无碎渣。

你只要把这三个点做到极致，其他维度够用就行，这样你就精准切入了这个人群，这群用户看到你的产品第一反应就是“这就是为我做的”。

最后，还有一点很容易被忽略：人群定位和场景界定必须在产品研发阶段就定好，不能产品做好了再甩给市场/营销部门让TA们去想怎么卖。

市场/营销部门能做的是在既有产品基础上找内容角度，但没办法改变产品本身的卖点结构。

卖点排序是有优先级的，这个优先级必须根据目标人群的核心需求来决定，先做到什么再做到什么，哪个极致突出、哪个达标就行，这些在研发阶段就要想清楚。

4.2.强痛点：具体可感知

产品解决的问题必须是具体的、用户能直观感知到的。

什么叫“能感知”？

就是用户自己就能判断“这个问题我有没有、严不严重”，不需要专业知识、不需要检测工具。

比如外貌问题：痘痘、毛孔粗大、法令纹、黑眼圈……一照镜子就看到了，感知成本为零；

效率问题：收纳乱得找不到东西、做饭要切半天菜、出门收拾半天包……这些麻烦每天都在经历，感知成本也很低；

身份问题：想变精致、想显高级、想穿出品味……这些欲望很明确……

至于情绪问题稍微特殊一点，焦虑、睡不好、压力大，用户知道自己不舒服，但“不舒服”的程度很难量化，所以如果你做的是解决情绪问题的产品，就需要在内容里给用户一个判断标准，让TA能感知到变化，比如助眠产品不要只说“改善睡眠”，而是说“入睡时间从1小时缩短到20分钟”，这个用户自己能感知。

痛点越具体、越容易被感知，用户的购买冲动越强，你的内容也越好做。

4.3.决策成本低

小红书上大部分爆款都属于决策成本较低的产品。

即便产品本身的决策成本不低，也是品牌商家通过经营策略把用户感知到的决策成本降下来了。

4.3.1.客单价不过高

大约80%的爆款产品（按销量排序）客单价在300-500元以下。客单价越高，用户犹豫的时间越长，比较的概率越大，完成转化的难度就越高。

4.3.2.试错成本低

这一点的本质是退换政策加上用户心理感知，比如口红试错成本低，因为涂了嘴不会怎样，大不了不喜欢换一支；但面霜试错成本就高，万一过敏烂脸怎么办？所以面霜这类产品，商家需要通过权威检测报告、皮肤科医生背书等方式，把用户感知到的试错成本降下来。

产品本身的试错成本你改不了，但用户心理上的试错焦虑是可以被管理的。

4.3.3.不需要教育

一眼看过去就知道这个产品有什么用。

大部分爆款都是尊重用户常识的产品，从大共识里面找小共识，比如薰衣草助眠人人都知道，但如果你说一个从来没听过的成分比薰衣草助眠效果更好，这就需要极高的教育成本，用户连相信的基础都没有。

所以不要做过多创新，不要违背用户常识，这是选品的一个很重要的筛选原则。

4.4.好价格

好价格不等于最低价，而是让用户觉得“物有所值”，甚至“物超所值”。

4.4.1.在保证品质和体验的基础上，价格比竞品有竞争力

但绝不能盲目打价格战，低价谁都能干，无非就是赚钱和亏钱的区别。

真正的壁垒不是“便宜”，是“总成本领先”，是你能把成本控制到竞品做不到的水平，同样的低价你能赚钱但别人亏钱，这才是护城河。

比如有品牌通过极致供应链管理加上适当减规格（口红以质感和上嘴效果为主，稍微减一点克重，用户几乎无感），把口红做到9.9元且品质对标大牌。蜜雪冰城同理，它选择便宜，是因为它的供应链能力让它在便宜的同时还能赚钱。

4.4.2.通过组合、赠品、包装让用户觉得占便宜

比如9.9元一袋和9.9元12个，用户心理上明显觉得后者更划算，即便实际单价可能差不多。

“凑满减”、“买一送一”、“加量不加价”……这些策略的本质都是在不大幅降低利润的前提下，放大用户的“占便宜感”。

4.4.3.精准锚定目标人群的支付意愿和心理账户

这一条是最容易被低估的定价策略。

同一款挂件，9.9元卖给学生党，因为学生的支付意愿和心理账户就在这个区间，你定19.9，TA可能就不买了；

但同一款挂件做一个“大吉大利”寓意的包装，挂在车上保平安，39.9元卖给车主，车主就会买单，因为车主的消费力更强，而且TA买的不是挂件，是“大吉大利”这个好寓意（心理安慰），39.9在TA的心理账户里属于小钱。

再比如包包挂件，卖给学生党就是一个装饰品，客单价撑死十几块钱；

但卖给宝妈，寄托对孩子平安的祝福，同时还能做书包标识，让孩子在一堆书包里快速找到自己的，场景变了、故事变了、价值变了，价格可以贵3倍以上。

本质就是：同一个产品，换包装、换人群、换场景、换故事，就能卖出完全不同的价格。

定价不是成本加利润那么简单，定价是“你卖给谁”和“你讲什么故事”决定的。

05.现阶段比较容易爆的五个品类

基于上述这些共性特征，我总结了现阶段小红书闭环电商比较容易起量的五个品类，以及它们各自容易爆的底层原因：

5.1.外貌改善类，比如美妆护肤、头发护理、身体护理、口腔护理……

持续刚需，情绪价值高，最关键的是：变化可以即时可视化，比如用了之后是不是变白了、头发是不是更顺了……用户自己能直观感受到，内容也比较好做前后对比。

加上核心消费人群就是小红书的主力用户，天然匹配。

5.2.生活效率工具类，比如收纳用品、清洁工具、厨房神器、出行好物……

需求持续且稳定，解决的是真实的日常麻烦，前后变化比较容易可视化，比如乱到整齐、脏到干净……内容的信息增量和实用价值都很强。

5.3.风格表达类，比如服饰鞋包、家居装饰……

满足身份表达和审美需求，天然具备社交货币属性，用户穿搭或者改造后很容易产生分享欲。

5.4.情绪价值类，比如香薰香氛、解压玩具、礼盒、玩偶……

悦己需求持续攀升，用户越来越愿意为“让自己开心”买单。

这类产品的特点是不需要强功能卖点，情绪感受就是卖点本身。

5.5.轻养生类，比如贴类产品、助眠类、护眼类……

既解决了健康焦虑，又是轻干预。

什么叫轻干预？就是使用成本低、意志力成本低，比如贴上就行，不需要你每天坚持什么复杂的流程，不需要改变生活习惯。

06.写在最后

最后，补充一个很少有人系统讲过、但对选品判断非常有价值的视角：用户购买一个产品，实际上需要付出四种成本。

大部分人只关注“金钱成本”，这个东西多少钱，但实际上用户在整个购买和使用链路里，还有三种隐性成本在影响TA的决策和复购。

6.1.决策成本（购买前）：用户做购买决策需要消耗的精力和时间。需要比价多久？需要看多少篇笔记？需要纠结多长时间？……决策成本越高，在转化链路里的流失越大。

这就是为什么上述说“不需要教育”的产品更容易爆，因为不需要教育意味着决策成本极低。

6.2.金钱成本（购买时）：花多少钱，这个最直观，不展开了。

6.3.使用成本（购买后）：为了正常使用这个产品，用户需要额外付出的代价。

这一条非常容易被忽略，但它直接影响了了复购。

举个例子：有人买了一块中医手工洗发皂，30元不贵。但买回来发现这个皂很难搓出泡沫，必须配起泡网；没有送皂盒，放在台面上会化掉，又要单独买一个皂盒……为了用这块30元的洗发皂，额外又花了几十块买配件不说，每次洗头的流程还变复杂了，使用成本太高了……

结果就是这块皂可能品质很好，但用户不愿意复购。

所以当你的产品好评不错但复购低的时候，第一个应该排查的就是使用成本。

6.4.意志力成本（贯穿全程）：用户需要克服的懒惰、惯性、习惯等阻力。

比如你家楼下5分钟路程有瑞幸，10分钟路程有星巴克，你今天想喝咖啡，多走5分钟这件事儿，就是意志力消耗；

比如一个需要每天坚持使用才有效的护肤步骤，“每天多花5分钟”看起来不多，但乘以365天就是巨大的意志力消耗。

轻养生类产品之所以容易爆，就是因为像贴类产品、助眠喷雾、护眼贴这些东西，使用成本极低（贴上就行、喷一下就行），意志力成本也极低（不需要改变任何习惯、不需要坚持任何流程），四种成本里，它把后两种几乎降到了零。

所以在选品的时候，除了看产品本身的爆款潜质，也值得用这四种成本去做一次检查：你的产品在每一种成本上的表现怎么样？有没有哪种成本过高但你没有意识到？有没有可以通过产品设计或者经营策略来降低的空间？……

以上就是“什么样的产品在小红书上具备爆款潜质？”的全部内容，讲的是“什么样的产品能爆”，是选品的判断参照系，但光知道什么能爆还不够，你还得知道怎么选、怎么验证、怎么做差异化、怎么迭代。

所以下篇文章讲完整的选品操作链路：从选品的两条路径，到常态化的抄品方法论，到五种测品验证方式，到产品差异化和组合创新的具体方法……

作者：林卿LinQ

来源：林卿LinQ

豆包开启付费模式：AI搞订阅，行得通吗？

青瓜传媒 — Wed, 06 May 2026 06:44:18 +0000

五一假期，国内AI圈来了一记惊雷。

豆包App Store页面悄然上线付费版本服务声明：“为更好地服务专业用户，豆包将在免费版基础上，推出包含更多增值服务的付费版本。”

标准版68元/月、加强版200元/月、专业版500元/月——三档价格清晰明了，并同步给出了包年优惠。

图源豆包App Store页面

虽然官方口径颇为克制，强调“仍提供免费服务，付费仅为增值探索，细节尚在测试中”，但在社交媒体上，却掀起了巨大的波澜，大量网友涌入豆包抖音号评论区留言。

图源豆包抖音评论区

坐拥3.45亿月活，用户断层式领先的豆包，已经通过免费模式积累的海量用户，为付费转化提供了庞大基本盘。

虽然大家都在吐槽收费这一行为，但热议也印证了豆包的火热。毕竟，大量职场人、创作者、学生已形成使用习惯，只要付费能解决更多难题，自然存在“免费转付费”的潜在空间。

但是，豆包的这一行为，也直接将国内AI行业的核心争议摆上了台面——AI订阅，在国内真行得通吗？

01 从“抢用户”到“赚利润”，AI行业不得不走的一步

过去两三年，国内AI大模型与应用深陷“跑马圈地”的逻辑：

谁免费、谁好用、谁更新快，用户就流向谁；

拼算力、拼参数、拼功能，主流AI大厂鲜少谈及盈利；

普通用户习惯“白嫖”，认为AI理应像搜索、社交工具一样永久免费。

然而，AI与其他互联网产品有着本质区别。

算力与Token消耗是真金白银的成本，且各大AI产品短期内很难像搜索引擎或短视频APP那样，通过广告、电商等靠流量变现。

复杂的文案、PPT、数据分析、视频生成，背后都是海量计算与推理开销。用户越多、场景越重，成本便呈指数级攀升。

就算字节跳动体量再大，也难以长期“用爱发电”。

据接近豆包人士透露，此次付费功能将集中在PPT生成、数据分析、影视制作等高算力消耗场景，本质上是将成本与价值重新挂钩。

免费版：守住基本盘，满足日常轻量需求。
付费版：聚焦高算力消耗的“重度生产力”场景。

逻辑很直白：用免费守住基本盘，用付费提供高价值能力。

02 收费的合理性先算三笔账

尽管舆论场上有质疑声，但抛开情绪看，豆包的付费探索在商业逻辑上是成立的。

成本账：AI不是慈善，算力每一秒都在烧钱

大模型运行至少要付出算力、研发、服务，还需要线上线下营销推广的费用。

价值账：既然成了生产力工具，用户就该为效率买单

十年前，视频会员、音乐会员、网盘会员曾被骂“吃相难看”；可现在年轻人几乎人手数个订阅。

这是为啥呢？

一方面，版权收紧使得免费内容获取愈发困难；但更重要的是，大家想通了，省时间、提效率、保体验，就值得花钱。

如今AI已成为新一代生产力底座，虽然很多AI内容仍有问题，但在你我身边，AI的重度使用者比比皆是。

当AI可以产生实际价值，收费是必然的趋势。

竞争账：不收费，是对行业不负责任

国内AI尚处同质化阶段，用户迁移成本极低。一旦某家率先大规模收费，但体验未形成显著优势，用户便极易流失。

豆包敢在此时先行试水，确实需要很大的勇气，但也恰恰说明：

豆包的模型能力已能支撑一定的可感知的付费价值；

平台判断用户付费意愿已跨过临界点，愿意为确定性的效率提升买单。

尽管「克劳锐」不知道正式付费后，豆包将收获多少收入或流失多少用户，但国外的GhatGPT、Gemini，国内早期的文心一言、现在的Kimi都有会员模式，更不要说更垂直的MiniMax、可灵AI、即梦AI等。

从这个逻辑来看，豆包收费也是理所应当。

图源Kimi官网

03 困难与挑战

虽然收费有很强的合理性，但执行起来未必顺利。

豆包要面临的，是用户心智、价值匹配、成本倒挂、竞争挤压等核心困境，短期必然难以取得成效。

而且对绝大部分豆包用户而言，本次收费虽然并不会涉及到他们的使用，但依旧会有相当一部分人，因为这件事对豆包产生负面评价。

毕竟，很多用户听到“付费”就抗拒，他们会坚定的认为，就算今天不收钱、明天也会收钱。

再有，收费还要面临是差异化不足、替代成本低的问题。

当前，国内AI市场同质化严重，主流AI产品提供的功能都类似。深度使用者或许已有自己的喜好，但很多刚入坑的AI探索者还没有那么懂。也许，这其中的一部分在付费后，会对AI提供的能力失望。

这自然就引入到了下一个问题。

收费本身并不可怕，可怕的是收费却不提质。

豆包的付费模式成功的核心只有一条——付费用户能否明显感受到“更值”。

如果付费版本能力更强、速度更快、服务更稳，自然会有用户心甘情愿买单。可如果没有达到这个效果，还可能对品牌口碑产生巨大的影响。

不过，「克劳锐」还是希望大家能以正向视角看待这件事，不要一味唱衰。

对于AI产业而言，我们的眼光需要放长远一些。

如果豆包这类巨头产品一直免费，对这个行业的所有玩家、用户来说，一定不是好事。

04 结语

不管我们愿不愿意承认，AI付费，本质是行业走向成熟的开端。

回归常识，好服务有价，高能力有价，高效率有价，本就是顺理成章之事。

这一天，来得不算早，但或许刚刚好。

作者：克劳锐

来源：TopKlout克劳锐