梁文锋 – 青瓜传媒

20万字不到1分钱，梁文锋把token价格打骨折了

青瓜传媒 — Sun, 03 May 2026 00:15:03 +0000

梁文锋又出手了，而且还是二连降价。

4月25日，DeepSeek-V4-Pro开启限时2.5折优惠，输入价格（缓存命中）降至0.25元/百万tokens。

业内还没反应过来呢，结果4月26日晚间，DeepSeek就再次降价。

全系API输入缓存命中价格直接降至首发价的1/10。

叠加限时折扣后，V4-Pro的缓存输入低至0.025元/百万tokens, V4-Flash降至0.02元/百万tokens，创下全球大模型价格新低。

这是个什么概念呢？

上海译文出版的《挪威的森林》，全书约20万字。将整本书命中缓存后喂给DeepSeek-V4-Pro，那么其总成本不到1分钱。

DeepSeek这次降的，不只是token的单价。它是把“长文本、长代码、长知识库”这些原本最烧钱的AI应用场景，全都打入了价格的谷底。

01 摸着DeepSeek过河

DeepSeek两天两降，这不是简单的价格战。

先用限时折扣测试市场承受力和服务器负载，紧接着对缓存命中这一高频场景实施永久性降价。尤其是对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景，成本可以直接下降90%以上。

DeepSeek研究员陈德里在社交媒体上确认，输入缓存降价是永久性的，并打上了“AGI for Everyone”的标签。

虽然说国内所有AI公司，几乎都是摸着DeepSeek过河，但DeepSeek这波降价之后，却并非所有人都担心。

尤其是大厂，他们压根不在乎DeepSeek降价。

这是因为，大厂卖API的本质，是卖背后的一整套服务。大模型API只是用来引流的，真正赚钱的是背后的计算、存储、数据库等云服务。

以阿里云为例，4月15日算力卡涨5%-34%、存储涨30%，但同时又愿意代理DeepSeek。关键点就在于，即便是客户使用DeepSeek，他们依然离不开阿里云的算力和存储。

阿里、腾讯、字节这些AI大厂，他们靠的是生态和平台赚钱。

真正难受的是智谱、MiniMax和月之暗面这样的中间层。

智谱AI在4个月里已经连续三次涨价。2月代码订阅套餐上调30%,3月旗舰API上调20%,4月8日再次上调10%，累计涨幅83%。调价后，GLM系列编程场景缓存命中Token单价已接近Claude Sonnet 4.6的水平。

智谱CEO张鹏的解释只有一句话：“瓶颈在算力，不在客户。”

在首份财报中，智谱公开了自己的商业逻辑公式：AGI商业价值=智能上限×Token消耗规模。

对于智谱这个上市公司来说，算力是稀缺资源。智谱的API年化收入（ARR）在过去12个月暴涨60倍至17亿元，Token调用量在价格上涨83%的背景下仍增长400%。

问题不是客户不愿意付钱，而是现有算力已经接近满载，继续低价只会让服务质量下降。与其通过价格战抢来大量低价值客户，不如提高价格筛选出高价值客户，把有限的算力用在刀刃上。

月之暗面和MiniMax的特点是量大便宜，当DeepSeek把API价格打到这么低，这两家或多或少都会有些难堪。

但月之暗面的K 2.6以及MiniMax即将发布的M3模型，性能都要高于DeepSeek-V4-Pro。他们在客户群体上可能会和DeepSeek有交集，但很难形成全面冲突。

促使DeepSeek降价的原因或许来自于融资，此前DeepSeek曾传出100亿美元估值，如今随着阿里、腾讯入局，估值进一步拉高至200亿美元。

估值拉高以后，融的金额也就多了，同时梁文锋也需要用市场、收入来证明DeepSeek达到估值所对应的高度。

所以即便DeepSeek是在赔本赚吆喝，也并不会让人感到非常意外。

对于上市公司来说，API就是核心收入，压低API价格就等于降低毛利。

更关键的是，如果承认“我们也要降价才能竞争”，就等于承认“我们没有技术护城河”。但如果坚持高价，又必须拿出足够有说服力的差异化价值。

DeepSeek降价的本质是他们找到了对应的客户。

梁文锋不需要DeepSeek有最强的性能。

无论是企业客户还是个人客户，模型的性能和使用体验之间有一道鸿沟。模型的性能跑分是它的上限，但是我们只需要我们能用到的部分。

只要有足够多的开发者和企业知道“还有这么便宜的选择”，整个行业的定价体系就会被重构。就像当年小米手机对智能手机市场的冲击一样，不是销量第一，但改变了所有人对“合理价格”的预期。

而且梁文锋也意识到一个问题，那就是AI就是基础设施，就和柴米油盐是一样的，那么价格战就变得在所难免，最终，AI也会像云计算一样走向“规模经济+薄利多销”。

在这个逻辑下，谁的成本结构更优、谁的技术迭代更快、谁能更早实现规模效应，谁就能活到最后。

02 DeepSeek给国产AI芯片替代讲故事

更关键的是，DeepSeek已经适配华为昇腾生态。

DeepSeek官方透露，目前Pro版本的服务吞吐受限于高端算力，预计下半年昇腾950超节点批量上市后，Pro的价格还将大幅下调。

所以这次价格下降，还只是预告而已。

昇腾950超节点通过集群方案弥补了单卡制程差距。

单颗昇腾910C芯片的BF16性能仅为英伟达Blackwell单芯片的约三分之一，但通过超节点集群方式，单个CloudMatrix 384集群的BF16总性能反而是NVL72的1.7倍，总内存容量为后者3.6倍，总内存带宽为后者2.1倍。

这还只是算力的方面，考虑硬件成本，事情就会更有意思。

华为昇腾950PR的定价约7万元人民币，英伟达同级别H200约合人民币25万元。根据英伟达AI在X上发布的信息，DeepSeek的确可以部署在英伟达Blackwell架构芯片上，不过这个成本更高，约为40万元人民币。

如果我们按FP8精度来算，昇腾950PR是7万元/PFLOPS，英伟达H200是6.31万元/PFLOPS。昇腾950PR毕竟是一张推理卡，如果我们按照推理专用的FP4精度来算，昇腾950PR是4.49万元/PFLOPS，英伟达B200是4.44万元/PFLOPS。

DeepSeek这次降价，砍在了缓存命中的价格上。

这个场景的特点是，模型不用每次重新理解全部上下文，大量重复输入可以复用，压力主要集中在推理吞吐、显存/内存带宽、调度和缓存管理上。

换句话说，它不是最依赖“单卡训练峰值”的场景，而是更适合通过国产芯片集群、工程优化和规模化调度来摊薄成本的场景。

那么我们如果把单卡的性价比优势放到大规模集群部署里，结果又会如何呢？

以100卡集群为例，国内常用的英伟达H20方案裸卡成本为1000万，13台服务器主机286万，加上机柜等，总价约为不到1500万元。同规模华为昇腾950PR的方案约为1000万出头。

昇腾950PR的单卡功耗（600W）比H20（350W）高，但单位算力功耗低65%，相同算力下对电力和制冷的需求大幅降低，基建投入显著减少。

并且，1张昇腾950PR的推理吞吐量约等于2.2-2.8张H20。这就导致实际上昇腾方案可能要比英伟达H20的方案节省60%到70%。

而大模型的API价格，很大程度上取决于硬件成本。那么DeepSeek打折，也很可能带动一波国产AI芯片销量。

连DeepSeek都开始大规模使用国产芯片，整个产业链就会被激活。云厂商会增加国产芯片的采购，芯片厂商会加大研发投入，开发者会适配国产生态。

华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌在DeepSeek-V4发布当天就完成了适配。

在DeepSeek-V4发布当天，AI算力芯片板块股价大涨。在A股，海光信息以8.2%的增幅领涨、寒武纪增幅为2.23%，在港股，天数智芯的涨幅达到9.54%。

这是一个正向循环。

当然，这并不意味着国产算力已经全面替代英伟达。训练侧仍然更依赖高端GPU、成熟软件栈和大规模集群经验DeepSeek真正走通的路径，可能不是“一夜之间替代英伟达”，而是先在推理侧、缓存场景、长文本应用里，把国产算力的性价比优势释放出来。

芯片只是第一层。

真正决定国产算力能不能吃下这波需求的，是软件生态。模型能不能稳定跑在昇腾上，推理框架能不能适配，算子有没有优化，开发者迁移成本有多高，才决定了这条路是“能演示”，还是“能商业化”。

DeepSeek的价值在于，它不是一家边缘模型厂商做适配，而是一个头部模型亲自把流量和需求带进国产算力生态。

03 梁文锋仍然需要给DeepSeek找商业模式

梁文锋真正的杀招不在于“便宜”，而在于“定价”。

梁文锋在用DeepSeek的影响力，让市场形成一个新的认知：“如果DeepSeek这个级别的模型已经能做到这个价，别家为什么还要卖这么贵？”

一旦这个锚点形成，其他厂商就陷入了两难。跟价，利润空间被压缩；不跟，就必须向客户解释“我贵在哪里”。

梁文锋曾在2024年表示：“我们只是按照自己的步调来做事，然后核算成本定价。我们的原则是不贴钱，也不赚取暴利。这个价格也是在成本之上稍微有点利润。我们降价一方面是因为我们在探索下一代模型的结构中，成本先降下来了，另一方面也觉得无论API，还是AI，都应该是普惠的、人人可以用得起的东西。”

他认为，只有让AI真正普惠，才能激发出足够大的应用市场。也只有应用市场足够大，技术迭代的飞轮才能真正转起来。

便宜可以打开市场，但便宜本身不是商业模式。

DeepSeek不能一辈子靠超低API价格活着。

API价格打到这个程度，短期内可以制造影响力，吸引客户，不过它很难成为一家长期公司的全部收入来源。

尤其是大模型推理本身仍然消耗算力、电力、带宽和运维，价格越低，调用量越大，对基础设施的压力也越大。

低价可以是入口，却不应该成为终点。

DeepSeek的目标，是成为中国AI开发者的“默认底座”。

只要足够多的应用和agent以DeepSeek作为基座模型开发，那么DeepSeek就掌握了入口。

API收入只是第一层，模型标准、开发者生态、企业部署、算力适配、云厂商合作，才是梁文锋想要的商业化空间。

DeepSeek更大的商业化机会，可能在企业私有化部署。

对于金融、政务、制造、能源这些行业来说，价格不是唯一问题，数据安全可控才是核心问题。

它们未必会长期使用公共API，但会愿意为一套能部署在自己机房、自己云环境里的模型系统付费。

梁文锋可以把开源模型作为入口，把企业级部署、调优、运维、安全、权限管理、知识库接入变成真正的收费服务。

如果DeepSeek长期只停留在模型层，它仍然会被卷入无休止的价格战。模型能力会被追赶，API价格会继续下降，开发者也会在不同模型之间切换。

真正能提高商业化上限的，是应用层产品，比如agent和CLI。

所以我始终认为，DeepSeek的低价API，应该不是梁文锋心里所想的商业化答案，更像是一个入口。

它先用价格打穿市场，再用开源建立生态，再用企业服务、私有化部署、云厂商合作和应用产品去承接价值。

这才能把“底座”的价值最大化。

作者：字母榜

来源：字母榜

梁文锋的新想法，DeepSeek的新方向？

青瓜传媒 — Thu, 22 May 2025 02:43:51 +0000

梁文锋，又有了新动向！

这个在几年前创立深度求索公司，推出DeepSeek大模型的年轻人，在2025年初震动了中国上下。

但在这前后，他都始终保持着低调，一如他率领的那个推出DeepSeek大模型的AI技术团队——除了偶尔崭露头角的论文，业界对他和他们的了解，并不比半年前多了多少。

但可以想见的是，这支团队一定在默默的发力，持续攀登新的高峰。

日前，一则不起眼的招聘信息，或许透露了这支年轻团队的一个新方向。

——医疗。

01 DeepSeek招聘医疗实习生

资事堂注意到：DeepSeek的母公司深度求索公司日前在招聘平台持续发力人才引进。

除了常规的算法研究、程序设计等领域。2025年5月，在不少实习生招聘平台上都出现了“DeepSeek招聘数据百晓生（医疗方向）实习生”的需求。

按照相关招聘要求，这个实习生岗位，需求是医学背景的本科高年级和研究生。

一周工作四天以上，实习工资日薪超过500-580元每天。

以此累计，正常的“满勤”实习生，每月大概率收入过万元。

02 独特的“数据百晓生”岗位

“数据百晓生”是梁文锋团队长期招聘的一个岗位。

早年，他创立的量化投资团队“幻方量化”就长期招聘这个岗位，如今的AI公司深度求索（后简称，DeepSeek团队）也在招聘这个岗位。

在最新的招聘需求中，DeepSeek团队提到：

“我们相信，AGI 是数据x算法x算力的完美实践，是科研+工程+组织的优雅艺术。

我们正在寻找并长期培养优秀的数据百晓生，与我们一起进行高水平的科学研究和工程实践。如果你对AGI有浓厚的兴趣，如果你想在一个充满挑战和机遇的初创环境中展现你的才华，那么请不要犹豫，加入DeepSeek，与我们共同在AGI征程上“深度求索”吧！”

来自对该岗位有所了解的人士的信息，所谓的数据百晓生岗位，其重要工作就是通过完成文本语料标注等工作，并与AI工程师进行合作提升大模型的能力和反馈质量。

这个岗位既是模型的tutor（导师），通过对涉及模型的能力解构建构、评估流程建设、训练数据准备等，教会模型在各个方面的能力，对齐人类的偏好。也是模型和产品的桥梁，更是AI原生世代的管培生，备受深度求索公司重视。

03 新的“方向”

无论是梁文锋早期的业务重心量化投资，还是如今的大模型，都包含着“机器学习”、“人工智能”的技术特征。因此，他对数据的重视可想而知。

而承担“模型和产品的桥梁”任务的数据百晓生岗位，正是处理数据的一线岗位。他们受到重视当然可以理解。

而这些岗位的下一步“微妙变化”，也某种程度透露出，DeepSeek团队下一步的发力方向。

资事堂查阅了相关岗位的招聘要求，直到一年前，深度求索招聘的“数据百晓生”，当时的招聘启事显示，应聘者“专业不限，实习经历不限，欢迎各个专业的同学”。

而显然，这次的“医疗方向”实习生，包含了不一样的设定和需求。

04 盯紧“医疗专才”

通过，深度求索公司最新招聘需求，外界可以发现，该团队对相关实习生的要求并不是以往的“泛泛而谈”，“热烈欢迎”。

在数据百晓生（医疗方向）的招聘需求里，相关实习生的招聘门槛，包括：

其一，医学专业背景，本科高年级或者研究生学历；

其二，对于语言模型有深入使用经历，对模型的回答质量有自己的审美；

其三，会写python代码，擅长撰写大模型Prompt；

显然，这个入选要求是医学专业+代码能力。

入职后，具体做什么呢？

深度求索在招聘信息中指出：

和研发人员一起，提升DeepSeek的医学方向的专业能力；包括但不限于：提升模型对医学知识的掌握，专业化医疗咨询问答，减少医学问答的幻觉，提升联网搜索体验等等。

05 AI医疗“方兴未艾”

另外一个关键信息值得注意：DeepSeek招聘的上述职位是医疗方向，并非医药方向。

通常，医药侧重药品，围绕“用什么治”，而医疗则侧重“怎么治”，涉及诊断、治疗、护理等医疗服务。换言之，在DeepSeek的发力方向上，医疗（治疗和服务）这块的投入优先级更高。

事实上，在年初DeepSeek爆火之后，确实有不少大型医药机构和主管部门开始积极将AI应用于医疗环节中。

中国科技部主管的中国科普网，在2025年3月发文称：据不完全统计，DeepSeek已经在全国范围内的超90家知名三甲医院实现部署。其中，“三甲医院”是中国医院等级评审中最高级别的医院，代表医疗水平、服务质量和管理能力均为最优。

此外，一篇题为《DeepSeek重塑中国三甲医院医疗体系》的英文分析文章，提及了多家知名医院的案例。（如下图）

论文提及：上海瑞金医院实现病理组织切片自动分析，每日处理3000张切片，支持与影像/基因等多模态数据联合诊断。

又如：深圳华南医院则运用于泌尿科AI系统快速检索证据，并生成个性化治疗方案。

再如：柳州人民医院实现了自动化细胞识别与血象分析。

这些积极的运用案例，是否是DeepSeek未来会加强医疗方面人工智能研发的一个原因？

06 解决“医学问答幻觉”

此外，在DeepSeek此次招聘中，还提及一项总要的工作内容描述——“减少医学问答幻觉”。

这也非常令人关注。

实际上，人工智能工具出现后，通常用户会遇到“幻觉”问题，即AI生成虚假、误导或捏造的信息。

显然，由于事关大众健康，医学方面的幻觉，其副作用更大。

一些研究文章显示，医疗领域的“幻觉”表现通常包括：

用户咨询症状、药物、治疗方案时，AI虚构医学数据，并给出错误诊断建议等情形。

也就是：AI在问诊者面前“信口开河”，但又显得老神在在，另询问者无从分辨。

此前，华南一家都市报曾提及：一家医院的接诊医生遇到，被大模型幻觉耽误了救治的儿童父母。了解后发现，在孩子初发症状之时，其父母通过手机端AI问诊平台自行判断为“普通呼吸道感染”，并参考网络建议居家用药。结果导致孩童肺部炎症范围扩大的情形。

一些权威医疗杂志也提出过类似关注。《中国卫生杂志》在今年3月刊文提出：“医院借助AI看病，误诊了谁负责？”的疑问和讨论。

如果上述招聘信息背后确实是DeepSeek正在努力发力医疗方向的人工智能的话。那或许也是国内AI机构积极介入、有所作为，让科技更好服务社会和大众的一个尝试。

作者：孙建楠，编辑：袁畅

来源：资事堂