Manus – 青瓜传媒 //m.clubpenjuin.com 全球数字营销运营推广学习平台! Thu, 13 Mar 2025 08:18:28 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Manus – 青瓜传媒 //m.clubpenjuin.com 32 32 Manus的海外口碑也渐渐起来了 //m.clubpenjuin.com/364893.html Fri, 14 Mar 2025 01:10:23 +0000 //m.clubpenjuin.com/?p=364893

 

Manus终于火到海外了。

上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的”爆火”主要局限于国内,在海外却无人问津。

而这个周末,Manus开始破圈了,福布斯等主流媒体开始关注,也成为海外科技博主热议话题,一众科技大佬纷纷展开测评,有媒体称热度甚至赶超流行音乐女王霉霉的演唱会。

热议之下,Manus获得不少好评。比如知名AI博主Rowan Cheung称之为中国的“第二个DeepSeek时刻”,Hugging Face的产品负责人称Manus是他尝试过的“最令人印象深刻的AI工具”。

不过,也有用户在测试中发现体验并不顺畅而持保留态度。

01 世界上第一个完全自主的AI代理

3月8日,福布斯文章称,Manus这个来自中国的AI代理正在改变一切。

福布斯称Manus是一个能够独立思考和行动的革命性AI代理,重新点燃了一个已经持续了几十年的辩论:当人工智能不再寻求许可,而是开始自己做决定时,会发生什么?

在福布斯看来,Manus不仅仅是一个聊天机器人,也不是一个披着未来主义品牌的改进搜索引擎。它是世界上第一个完全自主的AI代理:

一个不仅仅协助人类的系统——它取代了人类。从分析金融交易到筛选求职者,Manus在数字世界中无需监督地导航,以一种即使是经验最丰富的专业人士也难以匹敌的速度和精确度做出决策。本质上,它是一个数字通才,被训练来管理跨行业的任务,而没有人类犹豫不决的低效。

02 第二个DeepSeek时刻

知名AI博主、曾专访扎克伯格并率先发布Llama-3开源消息的Rowan Cheung转发了Manus的官方视频,并将Manus比作“中国的第二个DeepSeek时刻”,并预测其进入美国市场只是时间问题。

这是Rowan首次发文讨论Manus。目前,这条推文评论接近600条,浏览量超260万。

Rowan在评论里介绍了自己的体验经过。在收到邀请码后,他先测试了Manus创建个人传记并基于此传记部署网站的能力。Manus通过他的社交渠道、浏览文章,并成功部署了网站,且信息100%准确,包括最新的信息。

接下来,Rowan测试了Manus在提供实用信息方面的表现,例如寻找旧金山最佳租车地点,要求满足低犯罪率、大量人工智能活动和高密度的雄心勃勃的年轻企业家。Manus提供了4个非常准确的选项。

Rowan进一步测试了Manus完成长时间研究任务的能力,要求它创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。

一番体验下来,Rowan认为Manus“并不全是炒作”。

专注于搜索引擎优化(SEO)的X用户Julian Goldie直言,在看到Manus的实际效果后,他取消了每月200美元的ChatGPT订阅,他认为Manus正在重新定义浏览器自动化的功能。

经过测试,Goldie总结了Manus的强大功能:能够同时控制50个浏览器、实时创建和编辑文件、部署功能齐全的网站……

不仅如此,Goldie认为Manus在效率提升和成本节约上都能“秒杀”竞争对手,不仅在研究方面比任何竞争对手都更快,能够快速生成综合报告和可视化效果,而且使用Manus可以节省数千美元。

Hugging Face的产品负责人Victor M测试了Manus的代码生成功能,展示了Manus编写的一个使用Three.js库控制飞机的游戏。

Victor M大为惊叹,称他尝试过的“最令人印象深刻的人工智能工具”。他表示,Manus的用户体验(UX)是许多其他工具承诺过的,但Manus真正实现了。

X用户Umar Jamil分享了使用了Manus 来帮他在伦敦找房子的过程,他对Manus推荐的社区非常满意,并且很快就要搬过去了。

Umar Jamil的需求是在伦敦找到一个公寓,要求通勤时间不超过一小时,租金不超过1750英镑,至少有一间卧室和一个大客厅。

Manus 花了大约10分钟内完成了研究任务,通过创建一个待办事项列表来构建研究计划,并将所有中间结果保存在文件中,随着找到更多信息不断编辑这些文件。它会浏览互联网,寻找所有与研究相关的有用信息。

最后,Manus 推荐了几个区域,并推荐Walthamstow Central为最佳选择,因为它通勤时间仅为17分钟,租金在1300至1700英镑之间,且在预算内有较大的居住空间。

找到满意房子后,Umar Jamil连发数条推文表达他的震撼,称Manus ~= Claude + MCP*1000 + Deep Research+ Operator,还发问:“马拉多纳是‘上帝之手’,Manus会是‘AGI之手’吗?”

03 耗时太长、信息不准…吐槽也不少

Manus在海外的快速崛起也伴随着争议,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

AI初创公司Pleias的联合创始人Alexander Doria在测试Manus时遇到了错误信息和无限循环的问题。

Jackson Laboratory 教授Derya Unutmaz对比了OpenAI的Deep Research和Manus的性能。

Deep Research在不到15分钟内完成了任务,而Manus AI在运行50分钟后,在步骤18/20时失败了。

Unutma观察了Manus AI的输出,认为其表现相当好,并进行了第二次尝试。但第二次尝试在20分钟后,在步骤9/20时也失败了,Unutma推测可能是Manus AI的服务器过载。

也有用户指出,Manus在事实性问题上会犯错误,并且并不总是引用其工作来源,有时会遗漏很容易在网上找到的信息。

X用户Teortaxes认为Manus是一个针对社交媒体影响者极度优化的产品,这解释了它为何如此受欢迎:

该产品在生成主题内容、旅行计划等一般兴趣方面表现良好,但在STEM领域协助和编程方面表现不佳,甚至不如使用谷歌搜索。

Teortaxes提到Manus AI在处理某些任务时的输出质量不高,与将文档直接输入ChatGPT/Gemini相比没有太大优势,称之为“相当标准的GPT废话”。

TechCrunch记者Kyle Wiggers自己对Manus的体验也不太好。

他让Manus处理一个看似简单的请求:从他所在地区的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus崩溃了。在第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

Wiggers还让Manus预订从纽约到日本的航班,但Manus只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。此外,Manus在尝试预订附近餐厅的座位和构建一个以《火影忍者》为灵感的格斗游戏时也失败了。

04 Manus的双重颠覆:加强中国AI叙事,重定义智能边界

眼下Manus还需要邀请码才能用,它到底是AGI降临的前奏,还是又一个过度营销的AI产品?等更多人用上了,市场自然会给出答案。

无论如何,Manus的横空出世为AI发展带来了双重突破。一方面,Manus进一步加强了中国AI的叙事。多年来,全球AI叙事一直围绕着OpenAI、谷歌、Meta等美国科技巨头展开。而Manus继DeepSeek之后,再次证明了中国在AI领域的实力。

另一方面,Manus颠覆了AI发展的既定路径。过去,业界普遍认为谁能打造出更强大的语言模型、更复杂的聊天机器人,谁就能主宰AI的未来。而Manus的出现打破了这一路径——它不仅仅是对现有AI的迭代升级,而是开创了一个全新的智能范式:从被动响应指令到主动规划行动,从聊天机器人到自主代理,Manus或许正是AGI破茧而出的第一道曙光。

作者:叶桢 华尔街见闻

来源公众号:锦缎

]]>
火出圈的Manus成了今年最会“营销”的AI产品? //m.clubpenjuin.com/364882.html Thu, 13 Mar 2025 06:30:08 +0000 //m.clubpenjuin.com/?p=364882

 

继Deepseek在今年春节期间火爆全球,仅仅一个月后,又一款来自中国的AI产品Manus在互联网上带来了刷屏时刻。准确地来说,在极短的时间内,Manus已经从“红”和“黑”不同的维度上将国内AI圈刷屏了两次,取代Deepseek成为了当下最有热度的AI话题。

3月6日凌晨,随着国内AI团队Monica在国外X平台用英文发布了通用AI Agent产品Manus,后者以超越Deepseek的速度引爆了AI圈。

先是大量关注AI技术的自媒体纷纷点赞吹爆Manus,措辞还特别夸张,有的称Manus作为全球首款通用Agent已在实力层面碾压OpenAI,有的直接喊出了“Manus让硅谷无眠,让ChatGPT沉默”的口号。铺天盖地的宣传搭配上官方所放出的效果惊艳的演示视频,似乎一夜之间Manus真的把人们带进了AGI时代。与此同时,能够率先体验Manus的邀请码更是被炒到了10万的天价。

然而,距离Manus出圈还不到48小时,舆论就出现了极具戏剧性的反转。随着热度的攀升,许多人开始质疑Manus官方演示的功能并不具有技术上的自主创新,本质上更像是将成熟技术“封装套壳”做成产品。再加上邀请码机制形成的饥饿营销,有人甚至直接将Manus的走红当成了一次精心策划的借AI热度发售虚拟币的炒作。

从“Deepseek之后的又一个王炸”到跌入“套壳+过度营销”的舆论漩涡,Manus的口碑在短短几天之内上演了惊天大反转。时至今日,即便官方团队对饱受争议的一些问题尽力做出了澄清,但舆论风向并没有明显变化。Manus是真王炸还是真营销?依然成了外界最为关注的焦点问题。

01 Manus爆火,AI Agent改写行业认知

那么最近刷屏的Manus究竟是一款什么样的AI产品?

从目前信息来看,Manus被视为全球首款通用型AI Agent产品,由国内技术团队Monica打造。在官网上,Manus官方将自己定义为“一款通用型 AI 助手,能将想法转化为行动:不止于思考,更注重成果。Manus 擅长处理工作与生活中的各类任务,在你安心休息的同时,一切都能妥善完成。”

在官网上的演示案例中,Manus的操作具有极高的自主性。比如让Manus筛选简历,用户只需将简历压缩包发给Manus,剩下的任务它都能自动完成。Manus会自己解压文件,从文件中找出重要信息,根据资料给出候选人评估结果,还会做成方便用户查阅的表格。并且在整个过程中并不需要人工干预,用户只需要表达诉求和提供资料。

除此之外,不管是为亚马逊商店销售数据制作可视化表格还是为中学教师制作解释动量定理的课件,Manus统统不在话下,只需要用户一句话的事。也就是说,在使用体验上,与现在的各种AI大模型相比,宣传里的Manus智能体更像是一个真正意义上的个人数字助手。

其实从技术层面来说,能够理解并自主执行任务的AI智能体并不是第一次出现。比如在去年10月的荣耀Magic手机发布会上,荣耀CEO赵明就曾通过语音指令就让手机上的YOYO智能体点单了上千杯咖啡到会场,这便是AI智能体应用的一个案例。

但之前的智能体都存在着比较明显的局限性,那就是只能执行例如点餐这种比较简单的任务,与Manus这种通用型的AI智能体还有着较大差距。从官方公布的演示来看,目前的Manus已经能够处理较为复杂的任务,比如作为房地产经纪人帮助用户在纽约选购房产、做出一份AR/AI眼镜的行业分析报告等,效果相当惊人。

事实上,许多关注AI的技术大佬在近些年对智能体早已寄予厚望。比如百度公司的李彦宏去年就曾明确表示“智能体是AI应用的最主流形态,即将迎来爆发点”,OpenAI CEO奥特曼在去年也将智能体的重要性排在了公司发展战略的前列。

虽然说Manus和Deepseek本质上不是同一类产品,无法横向比较,但在传奇程度上,Manus的技术团队同样不遑多让。公开资料显示,创立DeepSeek的梁文锋是80后,Monica的创始人之一肖弘则是90后,在2015年毕业于华中科技大学。在团队规模上,DeepSeek团队大概是160人,而Monica团队则只有60人左右。

Manus创始人更年轻、团队人数更少,却做出了全球首款通用AI Agent产品,也难怪国内AI圈对这个尚未公开上线的神秘新产品异常关注,甚至将其视为了能比肩Deepseek的技术突破。

02 技术和营销的双重质疑,Manus为什么饱受争议?

或许Manus技术团队自己也没想到,在横空出世震撼国内AI圈后没多久,针对Manus的质疑声便接踵而至。首当其冲的就是技术力方面的质疑。

一些AI行业的从业者表示,Manus背后的团队规模较小,很难有自研底层大模型的能力,Manus所展现出来的模型能力更多的是国外成熟模型的“套壳封装”。打个比方,假如各家大模型的能力是一块块形状各异的乐高积木,那么Manus做的就是把各个积木按照一定的要求拼起来,来满足用户的需求。因此,有网友调侃称“Manus不生产大模型能力,Manus只是大模型的搬运工”。

在AI从业者的视角里,Manus产品并非完全没有技术力,而是“有技术含量,但不多”。在Manus出圈之后,有技术团队声称只用了5个人3小时,就基本复刻出来了Manus,可以实现与原版一样的功能。也就是说Manus本质上基本并没有自己的技术护城河,稍有实力的AI团队都可以在较短时间内手搓一个同款出来。

不过在业内也有一种声音认为,哪怕Manus是封装套壳其他大模型形成的产品,但也具备一定的商业价值。因为能坐上大模型牌桌的就那么几家公司,其他人想要涉足AI赛道,必然会避开技术层,转而在应用层面寻找突破口。

同时根据国信证券电话会透露的信息,腾讯或许在5月份会推出一个类似Manus的产品,字节和阿里的同类产品也已经在路上。本质上,这些大厂的在研产品与Manus并没有什么不同。

除了技术壁垒的缺失,套壳大模型的Manus在实用性上也会相当受限。同样以上文的乐高积木举例,由于Manus只是拼装积木而不是创造新的积木,那么它就不可能拼出积木原本没有的形状。换句话说,Manus的能力上限取决于各家大模型的水平,大模型进步才能带来Manus能力的提升。

而从目前的AI大模型来看,其能力显然还无法完全取代人工。这就导致Manus可以按工作流借助大模型能力达到任务目标,但无法保证任务完成的质量,甚至会出现AI操作2分钟,人工调整3小时的尴尬场景。

虽然Manus在技术上并没有太多创新亮点,但让其从红转黑的关键因素其实是充满争议的一套营销组合拳。在Manus火速出圈之后,其营销模式就被扒了个底朝天,大概可以简化为KOL宣传+邀请码+绑定关键词宣传的三板斧。

首先是KOL宣传,自Manus团队以高姿态推出自家产品之后,国内行动最早的不是AI行业而是科技自媒体。3月6日当天,有大量科技自媒体同步发布测评文章,而且用词相当夸张,也因此被网友调侃Manus是第一款自媒体比专业人员更早发现和评测的AI产品。

有了大量KOL的宣传,Manus在短时间内就被追捧成了可比肩Deepseek的国产之光,而就在大家想要尝鲜一探究竟的时候,却发现体验Manus还需要邀请码。或许邀请码机制如Manus官方所澄清的那样是出于控制算力的考量,但其造成的结果就是,在这几天里能拿到邀请码几乎成了KOL博主人脉和实力的体现,进一步刺激了许多博主免费为其宣传。

在KOL和邀请码制造庞大宣传舆论的过程中,Manus还和Deepseek以及爱国情怀进行了强绑定,将营销推向了高潮。也正因此,在短短几天里、在产品尚未公开上线的情况下,Manus便成了国内AI行业最热门的话题。

Manus这场营销大戏,说到底就是“老套路遇上新行业”。靠天价邀请码制造稀缺感、找自媒体狂吹“吊打OpenAI”、再打一波“国产AI崛起”的情怀牌。这些招数在电商、社交App时代确实好使,但在AI圈却完全不对路。因为现在的AI行业更多的会看实打实的论文paper,会看团队的技术背景以及产品的使用成本,像Manus这种通过宣传造势的产品像极了不断膨胀的泡沫,很容易被AI赛道的同行们一戳就破。

而且更伤的是,这不仅伤害了用户期待,更让踏实做技术的团队被迫卷入浮躁的军备竞赛。毕竟,当“会吆喝”比“会造轮子”更易获得关注,谁还愿意埋头苦熬大模型?

03 结语

Manus的爆红和翻车,像一面镜子照出了AI行业的现状:一边是人们对“黑科技”的狂热期待,另一边却是技术不够成熟、营销用力过猛的尴尬。它试图用“通用AI助手”的噱头打开市场,结果却被质疑“只会拼装别人的技术”。

放眼未来,AI Agent(智能体)的赛道注定热闹,国内外大厂早已摩拳擦掌。但Manus的故事告诉我们,靠包装概念或许能赚一波流量,可要想真正改变生活,终究得靠技术硬实力。就像搭积木的人永远受限于积木的形状,只有那些能自己“造积木”的团队,才可能走得更远。

作者: Lumens

来源公众号:Morketing

]]>
Manus是DeepSeek级创新吗? //m.clubpenjuin.com/364802.html Wed, 12 Mar 2025 01:10:05 +0000 //m.clubpenjuin.com/?p=364802

 

Manus破圈的速度,又刷新了ChatGPT和DeepSeek创下的记录,内测一天之内红遍互联网!

对于这家位于武汉,名为“蝴蝶效应”的企业来说,其实是他们第二次做出爆款产品。第一款正是在海外拥有1000万用户的AI产品Monica,年度经常性收入ARR达到了千万美金,是2024年最具营收能力的AI产品之一。

Manus则是这个团队首款AI Agent产品,在3月6日内测期间,就凭借自主执行任务的AI能力,被很多行业人士评价为“开启Agent元年”的产品。从爆红到今天,至今不过4天时间,甚至还没有公测,大家凭借几个案例展示,就将这款产品碰上了神坛,内测码最高抄到5万元。

实际上,这家公司曾在2024年,被字节出价3000万美元收购。尽管他们最后觉得价格不够公允,而收购没有成行。鲸哥独家多方获悉,内情是字节觉得Monica产品比较”套壳”,产品投流成本很高,留存数据不乐观,未来可能被大模型取代,自己也会推出豆包插件,所以给出的报价有点压价。

而对于Monica来说,ARR千万美金的公司,仅3倍PS(套用二级市场的市销率概念)收购,比他们上一轮估值就高出几百万,明显不符合背后投资人预期。

在移动互联网时代,公司和产品就曾卖给某独角兽。而在AI时代开启后,从Monica到Manus,新公司的产品力和执行力相当强悍,第二轮的红杉中国和腾讯等决定支持他们的进一步创业。毕竟在大厂都缺乏爆款的AI native领域,仅用少量融资做出了两款出圈产品。

尤其Manus的出圈,伴随着惊人的褒奖,很多人认为是DeepSeek级别的创新,是开启AI Agent大门的钥匙,甚至是通往AGI之路的代表性产品;同时,也伴随着潮水版的嘲讽,很多人认为没有核心技术,就是个套壳产品;也有人阴谋是一场联合KOL的营销,国外都没有掀起什么水花;还有人认为后续开放服务成本太高,可能很难落地。

众说纷纭之下,鲸哥也深入研究了这款产品,试图站在更客观以及更长远的视角,和大家交流下这款产品的突破与意义。

DeepSeek打破算力本位,Manus开启Agent元年

在3月6日,Manus产品小型发布会上。这家公司打出了“The next ChatGPT moment”的标语,形容Agent时代的大门已经被打开。

Manus够不够下一个GPT时刻,现在尚且不能够判断。已经火了一个月的DeepSeek,则证明了自己的实力。

DeepSeek在春节期间爆火出圈,是因为大家第一次体验到推理模型的魅力。真的是很聪明,很多回答深度广度和灵活性,都超出了此前大家熟知的豆包、元宝等产品。这是推理模型相比指令性模型的优势,也是DeepSeek这家公司的聪慧之处。

2025年,大模型面临三个突破方向:大参数,多模态、推理。第一条路,Grok 3还是强悍地通过20万张H100显卡,硬突破大模型的Scaling law,其他家则通过MoE等架构做大做强;多模态是大家主要发力的方向,国外的OpneAI,国内的字节豆包、腾讯混元、阶跃星辰等都是代表,融合DIT架构,听说看写样样精通;第三条路就是在推理侧,通过强化学习RL等方式提升模型聪明度 ,DeepSeek就是这个方向的代表,通义也很快跟进。

DeepSeek实际上更大的特点,是出色的成本控制能力,尤其此后连续开源5天的项目。也逐渐证实了这种底层设施优化的能力,打破了英伟达等公司“算力本位”铸就的科技金融秩序。

何为“算力本位”?美国的金融霸权历经三次底层逻辑跃迁:从黄金、石油到算力,本质上是通过垄断全球核心资源重塑信用体系,维系美元霸权。

  1. 金本位崩塌(1944-1971):布雷顿森林体系确立美元与黄金挂钩,但美国黄金储备不足导致体系崩溃。1971年尼克松宣布美元与黄金脱钩,美元亟需新锚定物。
  2. 石油美元霸权(1974-今):美国与沙特秘密协议锁定石油以美元结算,建立”石油-美元-美债”循环:石油出口国赚取美元后购买美债,美元成为全球储备货币。巅峰时期全球86%石油贸易以美元结算,美联储通过美元潮汐收割全球财富。
  3. 算力本位崛起(2020s-):数字时代算力成为新生产资料。英伟达H100芯片成为”算力货币”,2023年全球算力市场规模达2.6万亿美元,美国企业占据60%份额,算力正替代石油成为美元信用的新支柱。

大模型的惊人算力需求,背后的算力本位成就了英伟达近两年股价累计涨幅超 435%,近10年市值更是从3000亿美金涨到接近3万亿美金。

而对于Manus而言,确实尚未引起国外科技圈的震动。不能像DeepSeek那样,影响英伟达股价波动。但据合伙人张涛说公司只有50多人,用两三个月就做出了这款爆红的AI产品。

微信搜索指数对比:Manus未超越巅峰期的Deepseek

但在国内市场,Manus还是最火的AI产品,仅仅是放出了网站几个例子,就能在互联网上掀起讨论风暴。一码难求之下,很多人甚至高价求码。一个Maunus邀请码生成器的应用,甚至3月8日冲上iOS国区付费榜第一名。

当然,这个产品并没有什么用,却蹭到了流量。

Manus洞察力领先,大厂创新不足

对于大部分人来说,都没有体验过OpenAI Deep Research(高达每月200美元)来说,国产的Manus上手后,确实有些惊艳。鲸哥测试了如下问题:

像做一份具身智能报告这样的问题,第一遍在分析资料时就卡住了,要求最后做成PPT的环节无法指望了,于是第二遍要求做成文字版报告,也是在制作图表前停止了。

目前看,Manus很多时候还无法了解和控制自己的能力,经常贪多嚼不烂。

从原理上来说,Manus并不复杂。Manus 是整合了 Computer use、虚拟机、Multi agent 协同的AI产品。

注:来自宝玉AI

但Manus最重要的突破,是相比于自动化编程软件Devin和bolt.new,实现了通用领域的Agent的产品化落地。

此前曾在这家公司工作过的员工就社媒上提到,这家公司工程实践和agent workflow的积累很深厚:

23年9-10月首次在国内推出agent,这里面的todolist.md都是当时学习了各家agent方案之后的最佳实践。

24年3月做gpts平台,24年初开始一直就在做浏览器的技术积累,积累大量对浏览器context利用的理解。

23年11月开始做搜索,对于agent联网获取信息的能力也是有积累的。我没参与的部分。

24年7月份通过roast获取社交流量的增长经验。

24年11月coding产品中对于各模型coding能力的理解。

Erix

“确实每件事都是相对薄的一层,但这些积木在这个窗口形成的组合创新足够强也是事实。”这位员工如此在评价。

鲸哥认为,Manus最成功的是超越大厂的产品洞察力。

蝴蝶效应创始人肖宏作为连续创业者,此前推出的“壹伴插件”是千万收入的微信插件产品(鲸选账号的新媒体运营也在付费使用),此后抓住企微 SCRM 风口做了微伴助手,AI 风口来了又做了大模型集合产品Monica,现在 AI Agent风口来袭、又推出了Manus。

尤其连续两个AI native产品的成功,很不容易。强如OpenAI,实际上除了ChatGPT 外,其余产品也并不成功,很多都处于半成品状态,比如GPTs、SearchGPT、DALL.E、Whisper等等。

现阶段国内大厂的AI产品,则普遍缺乏一些创意。从AI 社交到AI搜索,以及AI Coding产品,都是人有我有的产品。

本图由腾讯元宝AI生成

而蝴蝶效应公司,在利用Monica抢占了AI插件第一波红利后,又率先在Agent方面做出第一款成熟的产品。在山姆奥特曼分享的AI五个阶段中,L1(聊天机器人)、L2(推理者)、L3(智能体),Manus成功卡位L3阶段初期破圈产品。

尤其他们“Less Structure more intellingence”的理念,让他们放弃了AI 浏览器这条卷不过大厂的路,也让其发现了新生机。

至于这波是不是营销杠杆产生的出圈效应,鲸哥认为不是这样。

此前,Monica发布中文版,曾和KOL有过一波合作,就是通过KOL发放免费的会员使用额度。Manus在要求KOL参加小型发布会交流时,确实和大家说了是“全球首款通用型Agent产品”形容词,我了解到没有合作推广的KOL。

估计Manus如果没有大反响,也会和Monica一样通过KOL发布免费token额度,现在看肯定不需要了,但从前文的微信搜索指数看,也火不到DeepSeek的程度。

心资本Soul Capital合伙人吴炳见曾形容:Deepseek破圈后,社会确实被事实教育了,大家开始卷技术水平了——如何改良Attention,如何提升MoE,如何FP8和FP16混训。再进一步,是卷原创水平——谁能创新出下一代模型架构,谁能发现下一套训模型的方法。

所以从这个角度讲,Manus也让大家的产品策略,卷回到前沿创新领域,关注2025年AI应用/Agent元年后,大家能做出怎样的创新产品,而不是AI助手的投流大战。

套壳不影响,成功却还很远

现阶段的AI 产品,本质上并没有核心的壁垒和竞争力。产品理念很难被注册为专利,工程化能力则是大厂最擅长的地方,所以此前鲸哥就曾在小红书上提到,猜猜看哪家大厂做出类似的产品。

但讲道理,Manus相比之前的一些通用Agent产品,比如OpenAI的Operator、Anthropic的Claude use 、腾讯的APPAgent,Manus算是一个工程交付完善度更高的Agent产品。

然而,完善度并不是一个产品很高的壁垒。在Manus爆火后,MetaGPT 团队花费了 3 小时开发了 OpenManus 并开源。

在Manus探索出来了实际需求、优化技术工程路径,不断完善产品功能细节后,外界“半开卷”抄一份作业确实并不难。半天就被复刻,那Manus就没一点壁垒了吗?

某投资人因为套壳论失去投资Perplexity机会

如今数不清的AI搜索产品,并没有影响Perplexity的发展。原生的产品理解,会帮助Perplexity不断更新更好的功能点,而其他同类产品只能后面跟进复刻。

对于Manus来说,同样也是如此。现阶段可能最需要解决的是,接受一家大厂的融资。毕竟不公开测试,原因就是服务器接纳能力不够。

在媒体沟通会上外放的消息显示,Manus团队也给出了单任务运行的成本:约两美元。成本已经低到DeepResearch的1/10,但单任务成本依然高达近15元的价格。这也是Manus 采取小范围发放邀请码的原因,就这还造成了内部的系统崩溃。

接受大厂融资,不仅是资金,更重要的是大模型API 的低成本供给。据参加沟通会的媒体消息,Manus核心调用的是Claude模型,外加一些通义开源大模型的微调。未来是否会接受阿里、腾讯或者字节的投资,类似Kimi那样资金+资源的投资呢?

这样才能让Manus以低于千元的年费,推出订阅会员服务。否则高于这个价格,可能会成为少部分专业人士的玩具。

另一方面是完善产品细节和服务能力,快速迭代才是保证生命力的根本。

目前Manus生成一份回答还十分漫长,很多任务还是会崩溃。Manus需要在产品化上做出更多心思,而不是Manus产品负责人张涛所言:“真的非常简单,就是没有秘密,就是相信模型的力量。”

模型是基础,产品细节是服务能力。比如Claude 3.7 Sonnet在代码编程能力再次打破天花板,但是Cursor凭借代码自动补全方面的优势,还是能吸引大家付费订阅。

更重要的是,MCP(Multi-Agent Communication Protocol)聚合模式已经在呈现很高的成长性。这也是Manus未来应该采用的发展路径。

从大模型进化速度看,内置agent可能也是个趋势。未来GPT 5如果能实现推理和指令模型融合,多模态能力以及内置Agent,可能会强大到出乎意料。国内大厂应该也在跟进这条路线,这之前,Manus需要跑出用户和营收规模。

小结

DeepSeek打破大模型领域的唯国外模型成功论,以及极低的成本落地能力,让大家相信,东方神秘力量有冲击全球科技金融秩序的能力。换句话说,DeepSeek 以一己之力让中国拿到AI竞争门票,直接让全球投资者对中国资产杀估值的时代结束了。

而对于Manus而言,展现了AI native最强的形态,不是千篇一律的Chatbot,也不是像个木马似的AutoAgent,而是更多场景有用,也有希望落地。

说高点,他或许能成为下一个AI时代的微信,但可能影响不了国外的Facebook等产品更受欢迎。说低点,开启了大众对Agent的认知,给了众多初创团队继续造梦的信心。

作者:鲸哥

来源公众号:鲸选AI

]]>
从DeepSeek到Manus:科技群星闪耀时 //m.clubpenjuin.com/364800.html Tue, 11 Mar 2025 06:10:18 +0000 //m.clubpenjuin.com/?p=364800

 

还记得ChatGPT刚问世时我改用过的传播学之父施拉姆的这段话吗?

不好意思,现在我又要把它给搬出来了——因为全球首款通用AI Agent(自主智能体) 产品「Manus」,问世了。

「中国团队出品」「原来深耕海外市场」「在权威的GAIA基准测试中创下新纪录,性能远超OpenAI的同类产品」……都将Manus话题性拉满。

就在圈外人还在对AI Agent式术语和「年度最炸裂AI应用」类大词蒙圈时,圈内人已纷纷求起了邀请码。

▲ Manus让不少AI圈人士陷入不眠之夜,很多专业人士在技术论坛里求邀请码。

现实就摆在那:Manus成了又一个在国外技术论坛刷屏的带有中国印记的AI产品,上一个是被某些人誉为「国运级科技成果」的DeepSeek

即便是对「生成式AI的iPhone时刻」「Agent的GPT时刻」等大词已免疫的我,看着演示视频中Manus自主分析15份简历,最终Excel排名表生成速度比喝光一杯美式咖啡还快的景象,仍不免有些震颤。

奈何自己没文化,只能一句「厉害」走天下。

Ps:我跟Manus有「校缘」关联——Manus背后的Monica.im创始人肖弘(英文名Red),跟我是校友,但同样毕业于华中科技大学,我跟他隔了N个银河系,并无利益相关。

01

问题来了:Manus到底厉害在哪?

  • 场景吞噬力:DeepSeek擅长处理单线程任务(如合同审查),而Manus可并行完成「爬取财报→编写Python→部署网站」的复杂链路。
  • 进化加速度:DeepSeek用3个月实现10倍推理效率提升,Manus则在GAIA基准测试中,将任务拆解颗粒度细化到「0.1秒级决策」。
  • 生态野心:当DeepSeek专注模型层时,Manus已构建多智能体协作沙盒,并宣布年底开源部分模型——这像极了Android早期用开放生态对抗iOS的策略。

看不太懂,是不是?

看不懂就对了,这是DeepSeek说的,我也不懂。

作为0.5个小白,我想说些在我理解范围内的东西。

▲ Manus已引发众多国外科技媒体的关注。

很多人都知道,这两年,Agent一词很火,「Agent,下一个爆款级AI应用」「Agent,下一代入口级机会」「Agent,将取代App」的说法四起。

最形象的表述莫过于:大模型是AI大脑,Agent是AI助理贾维斯。

去年底,中国通信院云计算与大数据研究所所长何宝宏曾指出,2025年Agent将成为焦点,「大模型的七年之痒正在出现。下一步,我们需要从大模型转向Agent,而Agent是目标导向的,这与大模型的知识压缩属性形成对比。」

在他看来,AI大模型角力「下半场」的标志之一,就是内容生成转向智能体(Agent)框架(AutoGPT),支持工具调用(API)、任务规划与动态交互,Agent崛起。

那,何以Agent?

OpenAI前副总裁翁荔此前已给出公式,广受业内认可:Agent=大模型+记忆+主动规划+工具使用。

就这么说吧,AI要从「想象力」迈向「生产力」,Agent是绝佳的云梯。

这两年,Agent概念火归火,可现实中,在绝大多数场景中,打工人还是得自己手动去定义、编排工作流。

AI工具有用,但作用也有限。

这时候,Manus指着身上的「全球首款通用型Agent」标志,来了一句:要不,试试我这个?

02

「通用」,意味着什么?

技术人士可能会甩出一堆术语加术语:要全链路交付(能直接执行到结果产出);要云端异步(可以自动在云服务器干活,干好了再通知用户);要数据可靠(会自动调用权威API,而不是随便用不知名数据源);要擅长代码调用(会自己写代码来调用不同工具,完成数据可视化)。

已经有人对Manus的特点,做出了具象化的概括:

1. 强大的工具调用能力

Manus不仅能听懂你的需求,还能直接调用各种工具,如浏览器、代码编辑器、数据分析工具……直接帮你把任务搞定,直接给成品。

2. 独立运行的计算环境

Manus是「云上打工仔」,有自己的独立计算环境,你不需要盯着它干活,极度省心。

3. 类似人类同事的协作体验

即便你随时调整任务方向,中途改变需求,Manus也能灵活应对,完全不会「卡壳」。非但如此,它还能记住你的偏好,下次直接按照你的喜好来,越用越顺手。

4. 多领域任务处理能力

Manus是「全能王」,无论是教育、金融、旅行、编程还是数据分析,它都能轻松搞定。它能帮你做深度调研、文件整理、可视化分析,甚至是根据你的需求生成个性化内容,如旅行手册、研究报告、代码等。

5. 持续优化与学习能力

Manus还会不断学习和优化,你可以通过它的知识系统添加自己的要求,或让它记住某种工作方式,下次直接用。

Manus擘画出了「mens et manus」(知行合一)的图景——这也是其名字来源。

老实说,被贾老师PPT伤害过的我,对此仍要持谨慎采信态度。

但只要Manus能兑现演示视频中的一半,就已足够强大了。

03

也许在某些人看来,Manus压根算不上颠覆性创新。

在网上,有个流行说法是:套壳到极致,既是TPF,也是PMF,最后都通往用户价值。

言下之意,Manus终归是套壳。

这不算冤枉Manus:Manus身后的Monica,是靠AI插件领域头部产品起家——无论是通过独立开发者产品 ChatGPT for Google完成冷启动,还是去年在 GPT-4o、Claude 3.5上线第一时间帮用户接入最新SOTA(技术最先进)模型,抑或是DIY Bot、Artifacts 写小程序、记忆等功能,都表明,Monica是个「超级缝合怪」。

但这不意味着,作为应用层突破的Manus,没有技术创新。

▲ Manus在权威的GAIA基准测试中创下新纪录,性能远超OpenAI的同类产品。

在《技术的本质》中,布莱恩·阿瑟曾说过:新技术不是无中生有被「发明」出来的,技术都是从先前已有的技术中被创造,包括:a,被构建;b,被聚集;c,被集成而来。

他认为,技术的进化是「自创生」,新技术的产生都源于其他技术的「组合进化」。

就算Manus不是模型层的创新,那也不能否定其技术的突破性。

事实上,即使是代表了模型创新的DeepSeek,此前也被认为只是造出了「30美元iPhone」而已。

可结果……大家都看到了。带动中国资产价值重估,就是对多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术、稀疏激活网络(MoE)架构等创新的盖章确认。

Manus亦如是。

美团、滴滴都是应用创新,应用创新也是创新。

04

从业内反应看,不少人对Manus给技术侧带来的价值已有预判。

就我来说,我更想从更普适的角度去谈谈其更深远的价值。

那就是:它将硅基跟碳基的「物种级差」又拉平了很多,将横亘在二者间的挡板削掉了一大截。

ChatGPT问世后,很多人都说:生成式AI技术具有强颠覆性与强嵌入式特征,能低成本应用到千行百业。

这使得有些人期盼它的提效作用,也有人忌惮它的替代效应。

毕竟,纳西姆·塔勒布曾说过,在任何职业中,90%的人都是无知的,而是通过情境模仿,狭隘的模仿和半意识的角色扮演来工作的,除了社会科学和新闻业——这两者分别为99%和100%。

但两年过去了,不论是提效还是替代,都没很多人想的那么猛烈。

AI和人,差的绝不只是弄懂「鱼头指谁」的能力。

科技观察家元正老师认为,人并不特殊,真正特殊的是算力。瓦特、麦克斯韦、爱因斯坦=生物算力的算力奇点=人体智能超算;ChatGPT=以机器算力为主导的、「生物+机器」混合算力的算力奇点≈机器智能超算。

过去驱动社会进步的,是人体智能超算。机器智能超算之所以没法做人做的很多工作,就是因为还不够「智能」。

可王兴兴用行动说:真的吗?尔后甩出了人形机器人。

具身化,让AI跟人更像了一些。

但高盛显然还有些不服。

这几天,高盛分析师团队调研过宇树科技后认为:宇树科技最强大的人形机器人 H1 只有 19 个自由度(DoF)。这意味着,它还无法处理复杂、精细的任务。

它认为,人形机器人在未来 2-3 年内,很难达到与人类工人相同的工作效率,有意义的应用可能需要在 5-10 年的时间跨度内才会出现。

那,要是宇树H1+Manus呢?

可以肯定的是,至少离抵达图灵奇点更近一步了。

如果将ChatGPT视作「生物+机器」混合算力奇点的第一阶产物,那DeepSeek、人形智能机器人、Manus就是将其不断推向更远的地方。

05

从DeepSeek到Manus,不免让人想起了一句话——科技群星闪耀时。

诸多迹象似乎也表明:2025,是科技大爆发之年。

在《人类群星闪耀时》里,茨威格写道:「充满戏剧性和命运攸关的时刻在个人的一生中和历史的进程中都是难得的;这种时刻往往只发生在某一天、某一小时甚至某一分钟,但它们的决定性影响却跨越时间。

一切有为法,如DeepSeek面世,如Manus问世,应作如是观。

文:佘宗明

来源公众号:数字力场

]]>
国内刷屏的Manus,海外第一波评论来了:第二个DeepSeek时刻? //m.clubpenjuin.com/364771.html Tue, 11 Mar 2025 01:52:48 +0000 //m.clubpenjuin.com/?p=364771

 

Manus终于火到海外了。

上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的”爆火”主要局限于国内,在海外却无人问津。

而这个周末,Manus开始破圈了,福布斯等主流媒体开始关注,也成为海外科技博主热议话题,一众科技大佬纷纷展开测评,有媒体称热度甚至赶超流行音乐女王霉霉的演唱会。

热议之下,Manus获得不少好评。比如知名AI博主Rowan Cheung称之为中国的“第二个DeepSeek时刻”,Hugging Face的产品负责人称Manus是他尝试过的“最令人印象深刻的AI工具”。

不过,也有用户在测试中发现体验并不顺畅而持保留态度。

世界上第一个完全自主的AI代理

3月8日,福布斯文章称,Manus这个来自中国的AI代理正在改变一切。

福布斯称Manus是一个能够独立思考和行动的革命性AI代理,重新点燃了一个已经持续了几十年的辩论:当人工智能不再寻求许可,而是开始自己做决定时,会发生什么?

在福布斯看来,Manus不仅仅是一个聊天机器人,也不是一个披着未来主义品牌的改进搜索引擎。它是世界上第一个完全自主的AI代理:一个不仅仅协助人类的系统——它取代了人类。从分析金融交易到筛选求职者,Manus在数字世界中无需监督地导航,以一种即使是经验最丰富的专业人士也难以匹敌的速度和精确度做出决策。本质上,它是一个数字通才,被训练来管理跨行业的任务,而没有人类犹豫不决的低效。

第二个DeepSeek时刻

知名AI博主、曾专访扎克伯格并率先发布Llama-3开源消息的Rowan Cheung转发了Manus的官方视频,并将Manus比作“中国的第二个DeepSeek时刻”,并预测其进入美国市场只是时间问题。

这是Rowan首次发文讨论Manus。目前,这条推文评论接近600条,浏览量超260万。

Rowan在评论里介绍了自己的体验经过。在收到邀请码后,他先测试了Manus创建个人传记并基于此传记部署网站的能力。Manus通过他的社交渠道、浏览文章,并成功部署了网站,且信息100%准确,包括最新的信息。

接下来,Rowan测试了Manus在提供实用信息方面的表现,例如寻找旧金山最佳租车地点,要求满足低犯罪率、大量人工智能活动和高密度的雄心勃勃的年轻企业家。Manus提供了4个非常准确的选项。

Rowan进一步测试了Manus完成长时间研究任务的能力,要求它创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。

一番体验下来,Rowan认为Manus“并不全是炒作”。

专注于搜索引擎优化(SEO)的X用户Julian Goldie直言,在看到Manus的实际效果后,他取消了每月200美元的ChatGPT订阅,他认为Manus正在重新定义浏览器自动化的功能。

经过测试,Goldie总结了Manus的强大功能:能够同时控制50个浏览器、实时创建和编辑文件、部署功能齐全的网站……

不仅如此,Goldie认为Manus在效率提升和成本节约上都能“秒杀”竞争对手,不仅在研究方面比任何竞争对手都更快,能够快速生成综合报告和可视化效果,而且使用Manus可以节省数千美元。

Hugging Face的产品负责人Victor M测试了Manus的代码生成功能,展示了Manus编写的一个使用Three.js库控制飞机的游戏。

Victor M大为惊叹,称他尝试过的“最令人印象深刻的人工智能工具”。他表示,Manus的用户体验(UX)是许多其他工具承诺过的,但Manus真正实现了。

X用户Umar Jamil分享了使用了Manus 来帮他在伦敦找房子的过程,他对Manus推荐的社区非常满意,并且很快就要搬过去了。

Umar Jamil的需求是在伦敦找到一个公寓,要求通勤时间不超过一小时,租金不超过1750英镑,至少有一间卧室和一个大客厅。

Manus 花了大约10分钟内完成了研究任务,通过创建一个待办事项列表来构建研究计划,并将所有中间结果保存在文件中,随着找到更多信息不断编辑这些文件。它会浏览互联网,寻找所有与研究相关的有用信息。

最后,Manus 推荐了几个区域,并推荐Walthamstow Central为最佳选择,因为它通勤时间仅为17分钟,租金在1300至1700英镑之间,且在预算内有较大的居住空间。

找到满意房子后,Umar Jamil连发数条推文表达他的震撼,称Manus ~= Claude + MCP*1000 + Deep Research+ Operator,还发问:“马拉多纳是‘上帝之手’,Manus会是‘AGI之手’吗?”

耗时太长、信息不准…吐槽也不少

Manus在海外的快速崛起也伴随着争议,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

AI初创公司Pleias的联合创始人Alexander Doria在测试Manus时遇到了错误信息和无限循环的问题。

Jackson Laboratory 教授Derya Unutmaz对比了OpenAI的Deep Research和Manus的性能。

Deep Research在不到15分钟内完成了任务,而Manus AI在运行50分钟后,在步骤18/20时失败了。

Unutma观察了Manus AI的输出,认为其表现相当好,并进行了第二次尝试。但第二次尝试在20分钟后,在步骤9/20时也失败了,Unutma推测可能是Manus AI的服务器过载。

也有用户指出,Manus在事实性问题上会犯错误,并且并不总是引用其工作来源,有时会遗漏很容易在网上找到的信息。

X用户Teortaxes认为Manus是一个针对社交媒体影响者极度优化的产品,这解释了它为何如此受欢迎:

该产品在生成主题内容、旅行计划等一般兴趣方面表现良好,但在STEM领域协助和编程方面表现不佳,甚至不如使用谷歌搜索。

Teortaxes提到Manus AI在处理某些任务时的输出质量不高,与将文档直接输入ChatGPT/Gemini相比没有太大优势,称之为“相当标准的GPT废话”。

TechCrunch记者Kyle Wiggers自己对Manus的体验也不太好。

他让Manus处理一个看似简单的请求:从他所在地区的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus崩溃了。在第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

Wiggers还让Manus预订从纽约到日本的航班,但Manus只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。此外,Manus在尝试预订附近餐厅的座位和构建一个以《火影忍者》为灵感的格斗游戏时也失败了。

Manus的双重颠覆:加强中国AI叙事,重定义智能边界

眼下Manus还需要邀请码才能用,它到底是AGI降临的前奏,还是又一个过度营销的AI产品?等更多人用上了,市场自然会给出答案。

无论如何,Manus的横空出世为AI发展带来了双重突破。一方面,Manus进一步加强了中国AI的叙事。多年来,全球AI叙事一直围绕着OpenAI、谷歌、Meta等美国科技巨头展开。而Manus继DeepSeek之后,再次证明了中国在AI领域的实力。

另一方面,Manus颠覆了AI发展的既定路径。过去,业界普遍认为谁能打造出更强大的语言模型、更复杂的聊天机器人,谁就能主宰AI的未来。而Manus的出现打破了这一路径——它不仅仅是对现有AI的迭代升级,而是开创了一个全新的智能范式:从被动响应指令到主动规划行动,从聊天机器人到自主代理,Manus或许正是AGI破茧而出的第一道曙光。

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

作者:叶桢

来源:华尔街见闻

]]>
深度理解Manus AI Agent //m.clubpenjuin.com/364747.html Mon, 10 Mar 2025 06:25:30 +0000 //m.clubpenjuin.com/?p=364747

 

不得不说,最近一段时间AI圈的发展实在是太快,我们的学习速度实在是有些跟不上,因为这两天身边的技术圈和AI圈的高手们都在讨论Manus,让我觉得自己有必要深入的理解一下Manus的产品和技术原理,所以今天优先快速输入关于Manus的分享,后续会把我过去一个月关于Deepseek的学习成果也分享大家。

为了快速的搞清楚它到底是什么,我花了一天的时间阅读了大量的文献并从产品经理的视角做一次系统的梳理和总结,相比Deepseek,Manus还是相对更容易理解,加上研究助手的支持,今天很快就把这篇文章输出出来了,全文近8000+字,我将从应用视角、技术实现、以及对于Agent探索等角度,深度理解这个产品。

一、从应用视角理解Manus AI

1. Manus AI是什么?

简单一点讲,Manus AI本质上是一个具备“多智能体”能力的应用产品,是一个拥有更多的技能,并且能够自动规划并一次性组合多种技能,解决一个复杂的应用场景问题,相比之前以ChatGPT为主的产品,Manus Ai可以更具体的解决很多通用场景的问题,并且输出结果的满足度更接近用户想要的结果,例如根据其官网的示例,它可以执行“爬取特斯拉股票数据,生成一篇带图表的分析报告,并创建一个数据面板,将其部署成一个可以查看的网站”等这样需要完成爬虫收集数据、图表可视化、创建分析报告、编写代码、部署网站等多个复杂任务的指令,接下来我们详细介绍Manus AI的每一个核心信息:

  1. ManusAI是一个应用,不是大模型:首先它只是个AI应用产品,不是一个大模型,跟DeepSeek完全不是一会事,只能算一个做的很不错的超级产品工程,所以不要和大模型混淆,更不要提“下一个DeepSeek”这种外行的观点,它跟DeepSeek的影响力完全不是一个水平,鉴于当下很多人错误的观点,这里有必要纠正一下部分人的误解;
  2. 具备自动规划和任务拆解的能力:Manus 可以基于用户输入的指令,理解用户的意图之后,自动建立规划,并拆解任务;比如用户输入“帮我生成一篇特斯拉的报告“的时候,Manus将该指令拆解为”创建Python文件-爬取数据-生成图表-创作分析报告-编写HTML代码-部署网站“这个过程,这里的规划能力,和大模型的规划能力还稍微有些不同,后面我们会详细讲解;
  3. 具备更多的技能,可以完成更多复杂的任务:以上面的特斯拉的案例为例,完成整个过程所有的任务,需要具备编写爬虫代码、对接金融数据API、对接数据可视化API、生成分析报告、代码编程、对接网站部署API等一些类的能力,Manus相当于提前具备了这么多技能,当需要使用这些技能的时候,自动调用技能解决问题,”技能库“是Manus AI非常重要的一个能力,同样我们后面会详细讲解;
  4. 可以解决更多通用性的应用场景问题:通过Manus 用户可以更加大胆的提出更多的应用场景问题,比如特斯拉这个例子,以往面对ChatGPT等产品,我们还不能提出让它自己写代码,并且把网站也部署了,可以支持用户直接打开网页这种事情,因为它不支持直接部署网站的能力,而manus却做到了,这是它让大家惊艳和赞叹的原因之一。

总结起来,从应用层的角度上看,manus是一个技能超群,能更灵活的解决用户更复杂的应用场景问题的应用工具,未来很多需要存在复杂工作流的任务,通过Manus这种类型的产品,可能能够得到很好的满足;

2. Manus AI究竟有没有那么神?

这两天有很多营销媒体有点过分的吹捧Manus,这其实并不太客观,很多人甚至都还没有真实的体验过这个产品,也还没搞清楚它就开始吹捧。

但不得不说的是,单纯从当前AI应用的角度上看,Manus定义的应用实现方式和实现效果确实是惊艳的,这个评价并不是个人说的,而是来自业界权威的GAIA测试的结果,GAIA它是由数个来自Meta、HuggingFace和AutoGPT的专家们共同完成,模拟了真实世界的复杂问题,要求AI展现推理、多模态处理、网页浏览和工具使用等多维能力;之前GPT-4+工具调用在这个测试中仅获得了15%的成绩。而Mannus AI在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch,这非常了不得,但是我们只能说,当下它相比其他应用还是很了不起的,至于实际能不能真正一步到位的解决用户的问题,达到非常炸裂的效果,这个我觉得不一定,还是要看到实际的产品,真正放到应用场景里面才好评价。

3. Manus AI和ChatGPT等产品的区别?

Manus AI和ChatGPT都属于AI应用,那么两者有什么区别,Manus为啥能够让科技圈觉得它与众不同,个人的理解,两者的差别主要包括如下:

1.从产品形态和能力边界上看,ChatGPT本质上是一个以大模型为主的生成式AI应用,它目前只能解决一些跟内容生成有关的问题,解决不了跟生成无关的问题,包括自动化任务,或者跨平台执行任务,比如部署网站、帮你订餐等,这些跟生成式AI无关;

而Manus AI更像是一个自主规划并执行任务的机器人,生成式AI只是它的一部分能力,除此之外,它还能能自主执行自动化任务,或者跨端执行任务;而现实的应用场景中,用户并不是只有AI生成的需求,还有自动化任务相关的需求,这是很多用户认可它的原因,相当于它能帮用户解决的问题更多了;

2.从用户体验的角度上看,ChatGPT在执行任务的时候,更多的需要用户写清楚提示词,提供清晰的指示,在用户的引导之下才能完成任务;而Manus可以支持用户简单的输入一个指令,Manus自动理解用户需求并拆解任务,并自动完成任务;

另外一个角度,在解决一些具体任务问题的时候,ChatGPT很多时候只是提供建议和操作指引,但是并不会帮助你完成任务;比如当你问ChatGPT怎么部署网站的时候,它可以很清晰的告诉你一系列过程,但是还是需要用户自己动手做;而Manus不同,它可以自己动脑规划的同时,还直接动手帮你把之情给做了,这完全呼应了“Manus”的中文翻译是“手脑并用”这个点;因此ChatGPT更像是一个只指挥不干活的老板,而Manus是一个动脑子还做事情的优秀员工,这是用户更加喜欢Manus这种应用形态的原因;

3.从技能水平上,ChatGPT除了大模型服务之外,还支持联网搜索等技能,但是整体的技能和工具是比较少的,目前更多的是官方引进了一些跟生成相关的技能,但是Manus却又大量的内置技能,包括搜索引擎、浏览器、本地文件处理、代码编程等,还具备调用多种数据API以及跨端操作等技能,所以技能更多;

4.从技术实现方式上,ChatGPT主要依托大模型技术,而Manus技术底座采用了多代理虚拟机架构,融合规划代理(任务拆解)、执行代理(工具调用)、验证代理(结果校验)等多层代理,形成一个同时具备“模型调度+工具链整合+环境交互(例如跨端交互)”三重能力的应用。

事实上,openai推出的产品中,跟Manus直接对标的可能不是ChatGPT,而应该是其推出的Operator这款产品,但是为啥operator推出的时候,并没有引起相应的轰动,最主要的还是因为其限制只有200美元/月的PRO用户才可使用,或许在能力上Operator并不比manus差,但是因为只有极少数用户才能用上,因此不具备市场效应。

4. Manus AI执行任务的过程

在大致的理解了Manus应用相关的问题之后,我们来分析理解一下Manus AI在具体应用的过程中,它是怎么运作的,我们以其官网示例的:“特斯拉股票分析和投资见解”这个应用场景为例,分析它是怎么逐步完成这个应用场景的实现的,整个实现的效果是,用户仅输入一个需求指令,manus最终输出了一份关于特斯拉的股票分析,同时将数据固定成为一个数据看板,并开发部署为一个可以打开的网站;整个从输入到输出的过程的原理,通过一个脑图梳理概括如下:

具体每个步骤的明细如下:

1.用户输入需求指令,要求对特斯拉股票做一个全面的分析,并提供了需求细节;

2.连接数据源,获取分析需要的数据:获得需求指令后,manus第一件事情是先通过调用金融数据的API获取特斯拉相关的企业信息,财务数据等数据,这个过程中,Manus调用了获取数据的API;

3.规划和任务拆解:接着,manus基于用户的需求,开始制定规划并将该需求拆解成多个任务,任务中包括收集公司概况、财务分析、分析市场情绪、技术分析、竞争对手分析、内在价值分析、制定投资理论、撰写报告等多个任务;

4.任务工作流梳理和执行:然后,开始逐步执行各个任务,在执行该任务的时候,manus先梳理完成该任务的工作流,然后依次执行,我们以收集财务数据这个任务为例,整个流程包括撰写python爬虫代码,运行爬虫并获取财务数据,调用数据可视化组件将数据整理成可视化图表;整个过程背后的技术过程,Manus先是调用了大模型的能力完成python文件的撰写,并自动运行爬虫程序爬取数据,且调用数据可视化图表的API完成图表的转换;

5.最终输出一份分析报告:第一项任务的终点,最后调用大模型的生成能力输出的是一个股票分析报告,客观的讲,个人觉得案例中输出的分析报告肯定还达不到非常专业的水平,但是从完成度而言,已经是比较不错了,一方面基本满足用户的需求,并且报告中有数据、有洞察,只是要说达到ChatGPT DeepResearch的水准那没有。

6.制作仪表板:接下来用户再次发送一个制作仪表板的指令,Manus继续完成前面从规划、任务拆解、任务执行的过程,完成一个交互式仪表板的创作;

7.将仪表板发布为网站:最后一步,用户发送指令,将该仪表板部署到一个公共的URL上,该过程中Manus完成应用程序的编程,并自动将程序部署到公网,支持用户访问,当用户直接打开这个网页,看到这个网站的时候,确实让人觉得非常爽,只是一个指令,真的最后开发了一个网页并且部署为可以直接访问的应用,这点是目前ChatGPT等产品无法做到的;

5. Manus未来更适合能解决哪些应用场景的问题?

从前面大家也可以看到,manus的核心能力个人概括起来主要就两点:任务规划和拆解、调用工具

因此其应用场景,核心围绕着这两个能力,比如基于其任务规划和拆解的能力,未来那些工作流比较漫长并且复杂的应用场景,可能可以被很好的解决;

同时基于其调用工具的能力,未来那些需要跨端、跨系统操作,或者需要组合多动API工具的应用场景,可能通过Manus更好的解决,不过鉴于目前Manus可以调用的工具库主要以浏览器操作、文件操作、编程等为主,API主要以数据获取等为主,未来在应用场景上,也将围绕着其可以调用的技能范围来,概括起来个人觉得,以下这些应用场景可能在Manus中会被更好的满足;

6. Manus AI的能力边界和局限性

概括起来,Manus可能更加适合解决满足一下条件的应用场景的问题,对于任务流程个性化、缺乏公开工具和API、专业性较强的应用场景,Manus依然无法很好的满足。

  1. 任务和工作流可以被标准化或结构化拆解的应用场景:如果任务拆解非常个性化,流程也很难被标准化,比如创意发掘、用户需求洞察等,这些是很难被标准化设计和规划的;
  2. 该场景存在可以开放的API和工具,如果没有开放的工具和API可以使用,这种场景就无法被实现和满足,比如复杂的依赖私密信息的金融投研、企业战略决策等;另外目前Manus在跨端操作上还只支持浏览器的跨端操作,而对于电脑操作系统层级的软件的跨端操作,由于
  3. 专业性较强的场景:从前面的案例中,我们可以看到,即使Manus在自动化执行方面已经非常出色,但是目前它还是没有完全解决专业性的问题,比如它还并不一定知道一个专业的股票分析报告应该是什么样的,可能还是需要用户提供一些信息或者需要进一步的探索,自动规划和工具调用并不能解决这个问题,如何定义一个好的回答,以及专业的结果,其中的know-how依然是壁垒,没有被打破。

二、从技术实现的视角理解Manus AI

1. 从产品实现的角度看,Manus和以往AI Agent设计的思路有什么区别?

作为一个AI应用的产品经理,在了解完Manus的实现逻辑和技术原理之后,我们能明显的感觉到Manus带来了另外一种Agent实现的方式,那么相比之前的AI Agent搭建的方式,manus搭建AI的方式有什么特别之处,这部分主要阐述这个问题。

不管新旧的方式如何,一个Agent的搭建,都必须通过大模型、规划、工具(包括知识库、API、computer use等)这几部分才能搭建出一个完整的Agent,Manus相比之前的AI Agent搭建的方式,有如下几点不同:

  1. 自动的任务规划和拆解:Manus能够自动的规划和拆解任务,不需要人工的接入,而以往我们开发一个Agent的时候,这部分的规划和拆解是产品经理人工拆解的,由人工来定义;
  2. 从工具库从调用工具:Manus具备一个内置的工具库,该工具库中包括浏览器、文件处理、代码编辑器等工具,并且支持调用多种API完成特定任务,还可通过computer use的方式跨端操作,因此它具备了更出色的工具调用能力,而以往AI Agent开发的时候,每一个环节里面的工具能力都需要对接具体的API或者使用具体的工具,工具接入的过程更加繁琐;
  3. 通用性:因为技能限制,以前的Agent的实现,每个agent只能解决特定的场景,很难解决通用场景的应用,而Manus在超多技能支持的情况下,可以成为一个通用的AI Agent,灵活的解决很多问题。

2. Manus AI背后的技术架构和原理

在前面特斯拉的案例中,我们也能够看到,Manus在具体解决某一个问题的时候,是先规划和拆解任务,然后再分别执行各个子任务的工作,最后输出结果;

仔细理解,Manus AI 的底层使用了多代理虚拟机的架构,架构中包括规划代理、执行代理、验证代理三层代理,每个代理都具备动态调用工具库和API的能力,三个代理协同起来,完成任务的处理,整个工作流程概括起来如下:

1.用户输入具体指令需求;

2.规划代理完成任务规划和拆解;

3.通过执行代理完成具体指定任务的执行;

4.通过验证代理验证操作结果并输出结果;

3. Manus的规划任务拆解和大模型的规划能力有什么区别?

Mannus的核心能力之一是自主规划和任务拆解,大家可能会觉得奇怪,大模型明明也具备规划和拆解的能力,为啥不直接使用大模型,Manus为啥还要采用多代理虚拟机这样一个特殊的架构来实现这个事情其中。

其中最主要的原因在于大模型的规划能力和任务拆解往往只是基于“文本生成逻辑”,规划结果也只是停留在文本层面,而非基于实际可行的操作,比如当用户要求“生成特斯拉股票分析报告”时,大模型可能输出步骤建议(如“先获取数据,再分析趋势”),但缺乏具体工具调用路径,如调用雅虎金融API、Python脚本编写、Matplotlib可视化等,因此规划不到具体可落地的层面;

另外对于一些复杂的任务,通常需根据中间结果动态调整策略,Manus的规划代理需要能实时监控执行代理的进度,并根据异常(如API调用失败)重新规划子任务,而单一模型难以实现这种闭环反馈,这就是大模型规划能力和Manus背后的规划能力的区别。

4. Manus是如何解决工具的获取和调用的问题?

前面我们已经知道了Manus具备自动调用工具和API的能力,其中这些工具可能来自如下3个来源:

1.内置工具库:包括浏览器、文件处理器、代码编辑器、图表生成工具等等,这些可能都是一些公开的工具组件,官方整合后放到工具库,并基于Claude在2024年6月20日发布的Artifacts,让Manus能够在对话中动态创建和修改这些工具,从而完成从代码到图表,从文档到交互式组件等直观内容的呈现;

2.API:其中包括数据获取的API以及具体某一个技术能力的API,过往我们搭建Agent的时候,我们是通过function call技术将API转换成模型可以调用的工具或者函数,每次在一个Agent 里面调用API的时候都需要单独做对接,这样的方式,就意味着如果要支持100种API,就要对接100次,这样就不具备可持续发展的条件,Manus之所以能更轻松的解决这个问题,得益于2024年11月25日Anthropic开源了划时代的“模型上下文协议”(MCP),MCP解决了数据获取和功能获取等API的统一接入问题,一方面,市面上只要是支持了MCP协议的API,开发者都可以直接调用,有些指定的API如果还不支持,开发者可以通过自主的开发,让指定的API支持MCP协议,这样,Manus可以构建一个API工具库,这些工具可以被直接调用,不用再进行单独开发;

3.Computer use能力:另外,即使没有API和工具,通过Computer use的能力,AI应用可以不局限于专用工具,而是能像人类一样“看见”屏幕并操作计算机,移动光标、点击按钮、输入文本,真正模拟人类与计算机的自然互动,该能力由Claude在2024年10月22日发布,Manus利用该能力,通过跨端操作等方式,增添了更多的能力;

从这里可以看到,其实Manus并没有创造太多的技术方案,只是将这些大公司公开的技术方案利用到极致,用于形成自己的AI应用,他可能算不上是AI技术的引领者和贡献者,但是至少一定是利用开源技术做产品工程最极致的企业。

5. Manus调用工具的方式:云端异步执行与沙盒环境

1.云端计算环境:Manus的所有工具调用均在独立云端沙盒中完成,用户无需本地安装软件或配置环境。例如,生成HTML演示文稿或运行Python脚本时,直接在云端虚拟机执行,用户可随时关闭设备等待结果。

2.异步处理能力:支持用户上传任务后离线,系统自动分阶段调用工具并执行,完成后通过通知推送结果。例如,用户可提交旅行规划需求,Manus在后台调用地图API、酒店预订接口及预算计算工具,最终生成完整行程表。

3.安全性保障:调用API时优先使用权威数据源,避免非结构化数据的干扰;同时通过沙盒隔离确保用户隐私与任务安全。

三、透过Manus AI看Agent未来的发展趋势

1. Manus的产品形态,是否代表未来Agent的趋势?

个人的观点,Manus AI的这种产品形态,并不一定代表未来Agent的发展趋势,应用的本质是解决用户的应用场景问题,至于产品形态个人认为不重要。

ChatGPT等这些类型的AI应用,也并不是不能实现Manus AI的功能,前面我们理解到,Manus相比ChatGPT等应用主要是多了任务规划和拆解、工具调用(工具库、API、computer use)的能力,如果ChatGPT也同步支持这些能力,其照样也可以实现manus一样的效果,其中核心的多代理虚拟机架构、工具库、基于MCP协议的API、computer use等都并不适合Manus的公司原创,其他应用复现和支持的代价并不高,也就是说ChatGPT等类型的应用也能以其产品形态实现相同的应用效果。

2. Manus是否具备竞争壁垒,和扣子等Agent开发平台的区别

鉴于Manus的很多产品能力其实都是基于开源框架和技术造就的复杂产品工程,所以个人认为,并没有太大的核心竞争壁垒,优势仅仅是因为率先推出,可以抢先获取用户,而像扣子、腾讯元器等类型的Agent搭建工具,也完全有条件可以实现和Manus同样的能力,比如扣子只需要增加任务拆解和规划的能力,以及快速接入支持MCP协议的API,改变其当下通过Function call的方式对接API的方式,可能达到类似的效果,并且多智能体这种实现方式,在很早的时候,已经被应用于扣子的agent搭建流程中,只是目前多智能体需要人工取连接,不是通过模型自动串联,但是这个事情要实现不是很难的事情,对于字节来说。

结尾

OK,以上即为三白对Manus AI Agent建立的快速理解,从一开始不明所以,完全不知道这个东西到底是什么,到逐渐理解其实现方式,并对比之前的Agent产品,慢慢的理解这个产品,无论其产品能力如何,Manus的这种实现,也算的上是应用层的创新,他的实现方式,给AI应用的创业者们提供了一种做应用产品的思路,或许应用中的很过规划细节可以交给模型和规划代理处理,MCP之下的API接入的方式,或许可以改变目前AI应用接入API繁琐且困难的局面。

作者:三白有话说

来源公众号:三白有话说

]]>
“下一个DeepSeek”?Manus还没炸醒硅谷 //m.clubpenjuin.com/364688.html Sat, 08 Mar 2025 00:05:55 +0000 //m.clubpenjuin.com/?p=364688

 

今早一觉醒来,就被“Manus刷屏”的消息刷屏了。

以为是惊天炸雷,用颤抖的双手打开电脑搜寻,却发现英文媒体安静如鸡,没有有关这个“全球首款通用Agent”的报道。

不是说“整个科技圈”失眠、硅谷落泪吗?

在X这样的社交媒体上,确实有很多讨论,但更多的是中文自媒体。发稿前,的确开始有英文的讨论,不乏溢美之词,也看到“老外”也开始求邀请码,但他们也提到了其他一些AI代理产品的名字,并且有人指出Manus的局限性。

另一边,在国内某二手交易平台,已经有人高价售卖Manus的邀请码,价格几千元到16万元不等。惹得Manus官方“明确声明XX等平台发布的邀请码为虚假信息”,提醒用户不要相信。

从官方演示以及少数第三方用户发布的试用视频来看,Manus的确是一款颇为强大的AI代理产品,甚至体验可能要好过目前一些大模型公司自己推出的产品。

而其背后的团队,此前曾推出另一款经受住了市场检验的产品Monica.AI。创始人肖弘是一名90后,毕业于华中科技大学,是一名连续创业者。

AI代理已经是各个AI厂商激战的领域。OpenAI也在一个月前推出了其首款AI代理产品Operator,目前已经在部分国家上线,提供给Pro订阅用户。

一条最新消息是,The Information称OpenAI正在计划推出不同层级的AI代理,其中博士级代理可能每月收费2万美元。

而这个报道发布的时间,也正是Manus所谓“炸翻AI圈”的时间。

一个联想自然会浮现在眼前:

今年初DeepSeek炸翻AI圈,小成本推理模型让整个硅谷重估大模型路径。来自中国的80后梁文锋,给OpenAI的山姆·奥特曼(Sam Altman)出了一个难题。

那如今,是不是又出现了一个来自中国的90后肖弘,狠狠截胡了奥特曼的“AI代理梦”?

激动是可以理解的,但先别太激动。

还是让子弹再飞一会儿吧。

01

让我们先从Manus这款产品本身说起。

官方介绍:“Manus 是一个通用的AI代理,它连接思想和行动:它不仅会思考,还会交付结果。Manus 擅长处理工作和生活中的各种任务,可以在你休息时完成所有事情。”

AI代理大家都不陌生了,和普通的聊天机器人不同的是,它可以真的“出手”帮你做很多事。

就Manus来说,在官方示例中,你可以丢一个包含10份简历的压缩包给它(是的,不用解压缩),Manus就可以自己解压文件、逐页浏览文件并梳理重点、编写Python脚本生成对应表格,最终完成对求职者履历的分析。

在整个过程中,用户可以在界面一侧看到Manus的整个思考与执行过程,另一侧则会展示“Manus的电脑”中的所有操作(云端运行)。从演示的视频来看,整体流程很顺畅。不管是解压缩、现编Python还是直接生成Exel表格都很亮眼。

除此之外,官方还给出了其他示例,如在用户给出的预算和条件(低犯罪率、优质教育资源等)内给出纽约房产推荐。在这个示例中,可以看到Manus先自行拆解任务并做了规划。

据介绍,Manus试用“Multiple Agent”的架构,在虚拟机中运行多种不同的代理分工协作,如规划代理、执行代理、验证代理等。

目前,Manus还并非向所有人开放,想要使用它需要获取邀请码。而邀请码并不易得,也因此很多人在社交媒体上“求一个码”。北京时间3月6日下午一点左右,Manus已经无法打开登录界面,疑似因为涌入的用户超出负载而造成卡顿。

制作Manus的团队的确是有两把刷子的。

创始人之一肖弘是一名90后,本科毕业于华中科技大学软件学院。而这次在Manus官方视频中出镜讲演的季逸超,也是公司“联合创始人和首席科学家”。他也是90后,年少成名,开发的猛犸浏览器曾吸引真格基金投资。19岁的时候,季逸超还登上过《福布斯》中文版封面。

该团队此前的代表作是AI浏览器插件Monica,主打“AI助手”。截至2024年7月,已经有400万用户。

02

Manus“炸场AI圈”、开启AI代理的“GPT时刻”等等振奋人心的描述,究竟最早是怎么出现的已不可考。

但可以确定的是,在国内,Manus属实是火了。

抛开消息面,就以最直观的“邀请码”来说。下午3点钟左右,直面AI(ID:faceaibang)在二手交易平台上,已经看到了有人在出售“Manus邀请码”,而且要加价3万到16万元。

当我们以普通买家的身份询问“不能再便宜了吗”时,标价16万的卖家回复:“没货,一堆问的。

可以想象,这样的现象,是建立在前文所提到的“Manus炸场AI圈”,甚至让硅谷“失眠”的消息的基础上的。甚至已经有不少人将之称为“下一个DeepSeek”。

Manus是否会成为“下一个DeepSeek”,暂未可知,但可以确定的是,至少从目前来看,硅谷该吃吃该喝喝该睡睡,并没有被“炸”到头晕目眩。

一直到下午三点,我们再次在谷歌以“Manus”为关键词搜索,依然只有五条相关新闻,而且未见彭博社、The Information、商业内幕、路透社等大媒体跟进。

在社交媒体X上,已经有一些非中文的消息在讨论Manus,但是没有到铺天盖地的程度。

比如有4万关注者的@AshutoshShrivastava,在12小时前也发了Manus的视频,随后表示拿到邀请码、谢谢Manus官方,并称“昨晚测试了一下,非常好,但是太困了啥也没录制”。随后他又发布了数条消息,但都与Manus无关了。

有意思的是,在Manus相关的消息之后,他紧接着分享的是阿里QwQ-32B,并且说:“中国有一天会为全人类开源AGI。”

还是那句话:Manus是好,但好像还没有让全球上头。

哈希增长(HashMatrix)的联合创始人庞舜心也第一时间分享了试用Manus的喜悦,但是也表示:“Demo是cherry-pick的,实际没有那么惊艳,但是横向对比真的很棒很棒了。”

Zengyi Qin也谈了看法。他MIT博士在读,同时在创业,是MySell的AI研发主管(这家公司去年融资了1100万美元,投资者包括Transformer作者)。

他也先肯定了产品本身:“Manus是一款优秀的产品。这一点显而易见,我无需多言。”

但是他认为,Manus“并不是一项技术突破”,原因有三:

a. 它主要按照预设流程执行任务。这种预设流程会显著限制系统的上限性能,尽管短期内它确实能让系统运行得更好。

b. 它适用于一个相对受限的环境,介于仅限浏览器和操作系统级别之间。在预定义的软件工具之外,它无法运行。例如,它无法控制 PowerPoint 来为你制作幻灯片。事实上,许多软件都在 Manus 的工具箱之外。

c. 如果 Manus 不是技术突破,那么什么才算?答案是:能够在完全开放的操作系统级环境中运行,执行大多数任务,并像人类一样操作软件的系统,才称得上技术突破。

03

AI代理的赛道是非常热闹的,大模型厂商也早已有所行动。

面向所有to C用户的,OpenAI有Operator,Anthropic则推出了Artifacts和Computer Use功能。除此之外,谷歌、微软,以及国内大模型厂商也都有AI代理的动作。

OpenAI的Operator,根据用户指令,在云端执行任务,如订餐、制定计划、购物等。

Anthropic的Artifacts,允许用户在对话过程中生成代码片段、文本文档或网站设计等,并通过一键点击,将这些成果展现在对话旁的专用窗口中。而Computer Use则是让AI“像人一样用计算机”,观看屏幕、精准地移动光标、在需要的位置点击按钮、使用虚拟键盘输入文本。

更进一步的动作还在路上。

The Information报道,OpenAI的高管告诉一些投资者,公司计划面向不同用户推出价格不同的代理:针对“高收入知识工作者”,每月2000美元;用于软件开发的,每月1万美元;博士级研究代理,每月2万美元。

知情人士还透露,从长远来看,OpenAI预计公司未来20%到25%的收入将来自代理产品。

很多人谈论Manus会提到另一款产品Devin。这算是一款和Manus类似的垂类产品,2024年推出,同样一经出道就风光无限,甚至被称为“第一位AI软件工程师”。

但在今年,Devin的光芒已经黯淡下去,被批评“在完成大部分任务时表现糟糕”,比如人们发现,自己半个小时能完成的活儿,到了Devin那里要花六个小时。

很多做AI应用的公司,会围绕各种垂类赛道做AI代理。Manus并非大模型厂商却没有做垂类代理,勇气可嘉,而且如果最终全面推向市场后仍有很好的表现,则更加可喜可贺。但同样也是这一点,再加上外界的极限吹捧,让人也不禁捏一把汗。

面向所有用户的AI代理势必还会是大模型厂商追逐的对象,Manus的生存空间是否会被挤压?

这似乎又回到了朱啸虎和傅盛在两年前的争议:围绕GPT创业能成吗?

现在这个问题可以再进一步补充:围绕大模型厂商很有可能全面入局的领域做AI应用层创业能成吗?

依托主流大模型的AI应用不断涌现,好产品也不胜枚举,但惨痛的案例也屡见不鲜。

面向广告营销人员、自媒体博主等群体的SaaS企业Jasper,曾估值15亿美元,成为顺着大模型风口起飞的第一批独角兽。然而,ChatGPT发布的次年,Jasper AI的空间不断被挤压,风光不再。

前不久,Manus背后团队创始人肖弘接受媒体人张小珺的采访,当被问到:“Agent这件事是原厂会做还是应用公司会做?”

肖弘回答:“我觉得原厂值得做,但是原厂好像都还做得不够好。”

倒也不必唱衰Manus。说Manus“实际没有那么惊艳“的庞舜心随后也又在X上发声,反对外界对Manus“没有深厚技术壁垒”的指摘,称产品就是有用的技术,没用的产品的遮羞布叫“技术”,“所以别瞧不起工程和产品”。

希望未来Manus这款产品能发挥应用层的柔软身段,找到和“原厂”比拼的差异化优势。

但是现阶段,咱们就别“捧杀”它了吧。

撰文:毕安娣 编辑:赵晋杰

来源公众号:直面AI

]]>
一码难求,Manus牛在哪? //m.clubpenjuin.com/364672.html Fri, 07 Mar 2025 01:20:09 +0000 //m.clubpenjuin.com/?p=364672

 

“谁有Manus 的邀请码?求!”

“从昨晚开始排队进Manus,现在还没进去!”

一夜之间,AI圈又炸了。甚至有的AI行业从业者一夜没睡,彻夜研究这个横空出世的 AI Agent产品。

Manus首席科学家peak 来源:Manus官网

Manus有多牛?简单来说,以往DeepSeek、OpenAI更多解决的是问答层面的问题,Manus 不仅能回答问题,还能独立思考、系统规划、自动执行任务,并直接交付最终成果。

比如帮公司筛选简历,并根据候选人资历和匹配度进行排名;根据指令和要求帮教师做PPT,动量定理等复杂教学概念也不在话下;帮助商店制定提升销售策略,帮助企业寻找潜在客户;甚至帮人选房产、规划旅行、设计名片、做课堂笔记等等,可以称得上是“全能AI管家”。

有人评价说:“Manus的出现,让目前的AI不止停留在QA层面,而是真正地帮人类做事。”

这个时代,惊喜总是一波接着一波。

Manus有多牛?

由于大家的热情过于火爆,处于内测期的Manus邀请码一码难求,官网也被挤爆。

我们只能从官网发布的介绍视频和文字中,得以窥见Manus的强大。

比如帮公司筛选简历。

只需要上传一个压缩文件,Manus便可以自动解压,并逐页浏览每一份简历,同时记录其中的重要信息。在这个过程中,指令者还可以持续上传新的文件和要求,甚至关闭电脑,Manus也会自动执行任务,并交付结果。

来源:Manus官网

在 Manus 给出的结果中,不仅有自动生成的排名建议,它还会根据工作经验等重要维度,将候选人分为不同等级。Manus还会根据你偏爱表格还是文字来生出不同的报告,并记住你的喜好。

胖鲸认为,在筛选简历硬件条件上,Manus 的确可以省去不少人力。但是基于公司人才选拔远不止于简历的筛选,更多是软性能力的测试。也许在未来,不管是Manus还是其他AI产品可能增加对人的性格和潜力测试评定,会更加有趣。

还可以帮助用户选择购买房产。指令需求是在纽约购买房产,要求是安全的社区环境、低犯罪率,以及优质的中小学教育资源,还标明了预算。

执行此任务时,Manus 将复杂任务分解为待办事项列表,包括研究安全社区、识别优质学校、计算预算、搜索房产等。并通过网络搜索,仔细阅读有关纽约最安全社区的文章,收集相关信息。

来源:Manus官网

然后,Manus 编写了一个 Python 程序,根据用户收入计算可负担的房产预算。结合房地产网站上相关的房价信息,根据预算范围筛选房产列表。最后,Manus 撰写了一份详细报告,包括社区安全分析、学校质量评估、预算分析、推荐房产列表,并附上了符合条件的房产链接和价格。

来源:Manus官网

在整个过程中,Manus 像一个事无巨细的房产中介,站在用户的角度,进行多方面评估,没有任何宣传和包装,给到最理性的建议,确实为用户节省不少决策的时间。

对于企业用户,Manus也大有用武之地。比如Manus可以分析一家商店附近的居民消费情况和水平,为商店提供针对性的提高销售额的策略和方法。还可以根据B2B企业目标用户的画像和数据,为企业寻找潜在的目标客户,称得上是幕后的“赚钱营销助理”。

此外,Manus 官网还展示了十多个 Manus 能够使用的场景。比如帮你个性化定制旅游路线、分析比较保险政策、帮企业寻找合适的供应商、分析财务报表、网店运营分析,甚至可以在几分钟之内根据指令帮你设计一款网页游戏。

来源:Manus官网

“Manus像一只怪物。”一位业内人如此评价,没想到这一天来的如此之快。数据也证实Manus的恐怖,根据官方网站信息,Manus在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中,已经超越OpenAI的DeepResearch,刷新三项SOTA记录成为GAIA评分第一,堪称“AI Agent元年”的标志性产品。

人类对于AI的探索又到了另一个层面。

从B2B到AI,他将套壳做到了极致

这一次,震惊全球AI圈的仍是一群中国AI年轻创业者。

公开资料显示,Manus背后是一家名为 Monica.im的大模型公司,其创始人是肖弘(昵称小红,英文名 Red)是一位年轻的连续创业者,1992年出生,毕业于华中科技大学软件工程专业。

来源:真格基金

毕业之后,肖弘尝试创业,做过匿名社交平台和二手交易平台,但都以失败告终。2015年,肖弘察觉到微信公众号的广阔市场,转向开发微信公众号编辑与数据分析工具,创立夜莺科技,陆续推出了壹伴助手和微伴助手,在微信举办的创业创新大赛华中赛区获得金奖,拿到了腾讯和真格基金的投资。

随后,肖弘的创业变得一帆风顺。壹伴助手和微伴助手在业内广受好评,服务超200万B端用户,最终公司在2020 年出售给了某独角兽公司,肖弘和创始团队也套现离场。这段经历也给肖弘在业内打响了名声,拿到了后续创业的储备资金。

2022 年,大模型浪潮席卷而来,肖弘再次燃起了创业的斗志。他邀请首席科学家Peak等各行业人才正式创立 Monica(蝴蝶效应)。创立之初,肖弘就明确了公司的发展方向和目标。他要打造具有创新性和实用性的 AI 产品。

从一开始,Monica扮演的就是“集成者”的角色。当时,ChatGPT 横空出世,但使用场景相对单一,主要以对话形式为主。而谷歌作为全球最大的搜索引擎,拥有庞大的用户基础和丰富的搜索数据。肖弘敏锐地发现了将两者结合的商机,于是推出了 ChatGPT for Google。随后,一炮而红,完成了冷启动。

随后,Monica继续扮演集成者, 陆续接入了GPT-4o、Claude 3、Gemini Pro 1.5、Llama 3 70B 、Deepseek等多种高级模型,用户可以根据自己的需求选择不同的模型进行使用。Monica在专业模型的基础上开始试水DIY Bot、Artifacts 写小程序、写作、翻译、绘画等多个方面等初步的AI应用功能,受到了不少用户的喜爱,用户数量激增,2024年达到了 1000 万,同时保持着可观的盈利。

站在巨人的肩膀上,不断探索AI应用场景,像是Monica的使命。早前肖弘接受媒体访谈时表示,产品不能只有聊天机器人一种形态,Agent 会是新增的形态、需要新的产品去承接。

于是,Manus诞生了。而它的爆火便验证了那句:“AI为人类服务才有价值,套壳到了极致便是成功。”

如今,Manus带来的场景应用让人类对于AI的探索更上了一个台阶。从简单的知识问答到真正的成果交付,解决问题,AI彷佛真的能够参与到我们日常的生活工作中来。未来,全面的AI时代似乎又进了一步。

回想今年年初杭州青年梁文峰的Deepseek带来的震撼还历历在目,如今Manus的横空出世再一次给AI圈乃至全球科技圈扔下了一颗深水炸弹。

AI带来的科技变革举世瞩目,而中国的科技创业者正在这股科技浪潮中,写下最振奋人心的注脚。肖弘提供了一种身处浪花中创业者的心态:“世界不是线性外推的,要让自己成为博弈中的重要变量。”

结语

我们应该庆幸活在当下的时代,见证众多科技里程碑的诞生。

今年被称为“ AI Agent”的元年,Manus算是打响的第一枪,但绝对不会是最后一枪。我们将看到更多AI应用,百花齐放,在各个领域中寻找到用武之地。与此同时,我们也看到所谓的“AI威胁论”“AI打败人类”的言论也甚嚣尘上。

胖鲸认为,我们只有足够了解它,理解它,应用它,才能够战胜它,驾驭它,不再恐惧它。

最后,借用肖弘引自莎士比亚的语录作为结尾:世界的起伏本来是波浪式的。人们要是能够趁着高潮一往直前,一定可以功成名就,要是不能把握时机,就要终身蹭蹬,一事无成。

作者:Jolene

来源:胖鲸头条

]]>