Manus – 青瓜传媒 //www.f-o-p.com 全球数字营销运营推广学习平台! Wed, 21 May 2025 02:44:58 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.21 https://static.opp2.com/wp-content/uploads/2021/04/favicon-1.ico Manus – 青瓜传媒 //www.f-o-p.com 32 32 腾讯把“Manus”放进了QQ浏览器 //www.f-o-p.com/368369.html Wed, 21 May 2025 02:44:58 +0000 //www.f-o-p.com/?p=368369

 

5月19日,QQ浏览器宣布升级为AI浏览器,正式推出QBot,使用腾讯混元和DeepSeek双模型。团队透露,QQ浏览器用户规模超4亿。

QBot集成了AI搜索、AI浏览、AI办公、AI学习、AI写作等能力,并引入了Manus类AI Agent,可调用执行复杂任务。其中首批正在灰度的Agent包括行业首个高考Agent“AI高考通”,这是一个可根据用户个性化输入生成高考志愿填报方案等信息的智能体产品。

与大模型Chatbot类产品相似,QQ浏览器改变了导航式入口,转为更简洁的入口界面,同时支持联网和深度思考两种搜索模式。

搜索时,用户在框内输入需求可唤起AI搜索和网页搜索两种搜索结果。同时,QQ浏览器会自动识别用户浏览页面意图,提供工具使用建议,用户点击按钮可调用文件格式转换、文档翻译、文档内容提取等工具。

据QQ浏览器QBot产品负责人刘汉博介绍,两种搜索结果是为了同时保留快速获取信息和找网页资源等诉求。团队认为,在AI时代,传统搜索与AI搜索的目标预期还是存在差异,前者无法被后者完全取代,其本质变化是随着产品迭代,用户获取信息的效率提升。

QBot团队屡次强调要将对于AI使用习惯的选择权交给用户。一个在布局上的体现是,QBot对传统搜索和AI搜索的结果框进行并列展示,用户可自行拖拽大小,自定义呈现主次关系。

大模型及Chatbot类产品诞生之后,传统搜索引擎被认为可能受到巨大冲击,一个最为普遍的拷问是,AI搜索会否替代传统搜索?

这是巨头谷歌时常面临的质疑。数据分析网站Similarweb近期公布了一组数据,2025年4月,ChatGPT.com成为全球十大网站中,唯一实现月度正增长的平台。当谷歌、YouTube、Instagram、X等所有头部平台流量集体下滑时,ChatGPT访问量逆势增长13.04%。

更细致的数据显示,ChatGPT在非工作日的使用量显著下降,这强烈说明人们主要将其用于工作和学习相关的任务。这突显了科技巨头们通过AI产品承接这一庞大用户需求的迫切性。

AI大模型来势汹汹,但这可能不是搜索引擎独自的战争,以搜索为核心功能的浏览器更有必要主动加入战场,利用AI技术改善自己可能面临的困境。

腾讯对于AI的重视早有提升。在刚刚结束的一季度财报会上,腾讯董事会主席兼CEO马化腾表示,AI能力已经对腾讯效果广告与长青游戏等业务产生了实质性贡献,“我们也加大了对元宝应用与微信内的AI等新AI机遇的投入。”

腾讯还预示了微信生态与Agent结合可能释放的化学反应,管理层在财报会上表示,在微信生态系统中,腾讯有机会创建一个非常独特的Agent AI。

“它可以连接微信生态系统以及数百万个小程序。这些小程序涵盖了各种信息以及跨多个应用领域的交易和操作能力。因此,与更通用的Agent AI相比,这将是非常独特的,属于腾讯的一种差异化产品。”

目前看来,Agent在QQ浏览器率先落地。在团队的解释中,这并不意味着浏览器就是更适合Agent的一种产品形态,而是可以视为浏览器目前明确了技术与需求如何匹配,借助内部共享互通的AI技术完成了AI Agent的能力改造。

QBot产品负责人刘汉博对界面新闻记者表示,从用户视角来看,微信和QQ浏览器两个产品的生态逻辑并不一致。微信有小程序等大量能灵活打通的生态空间,而浏览器的核心优势是“Browser Use”(Agent利用AI技术操纵浏览器),它让用户在网页内完成指令执行更加自然高效。

这也是QBot团队眼中,QQ浏览器内嵌工作流AI Agent与Manus类独立通用AI Agent之间的本质区别。

刘汉博认为,相比于Manus、扣子空间等产品,QBot侧重于解决浏览器用户的原始诉求,产品逻辑优先通过大模型技术提升效率,而不是执行范围更泛的复杂性任务。

他同时指出,通用AI Agent存在一个阻力环节就是“Browser Use”,而浏览器对按钮识别、模拟点击等操作更直接,相比通用AI Agent在消耗时长和任务准确性等方面会更有优势。

例如,就下载报表而言,以往用户可能需要点开报表,选择某一个目录,再选择特定日期进行下载,现在的方式是将所有步骤缩减为一个统一的指令。在这类任务上浏览器会更为擅长。

作为互联网企业的产品线之一,QQ浏览器加入模型调用也需要平衡用户体验提升与成本增加之间的商业化平衡。

刘汉博认为,其商业转化最终会有一个正向提升。首先,成本增加是确定的,但长期来看,大模型成本下降速度可能使其快速落到一个可控范围。除此以外,团队观察到的趋势是,大模型加入后,用户平均使用频次这一活跃度指标有所提升,同时,用户和广告主之间的信息链接精准度在持续提升。

根据市场调查机构Statcounter的最新报告,2025年4月中国浏览器市场份额中,Chrome、Edge、Safari分别为前三,安卓、UC浏览器、360安全浏览器和QQ浏览器以相近的市占率分别位列第四至第七。

如今国产浏览器陆续上线AI功能,这俨然形成一场新阶段的产品力角逐。

在QBot团队看来,AI浏览器的未来发展形态将兼具工具和平台属性,这也要求其向内寻求腾讯云等更好的AI技术支持,向外拓展更完善的MCP Server等能力生态。

作者:伍洋宇,编辑:文姝琪

来源:界面新闻

]]>
Manus割不动国内用户 //www.f-o-p.com/368299.html Tue, 20 May 2025 01:35:10 +0000 //www.f-o-p.com/?p=368299

 

火爆一时的Manus终于全面开放注册了,但遗憾的是并没有中文版。

5月12日,Manus官宣开放注册,这个曾经一个邀请码都能被炒到10万元,无数人只能从各种测评中略知一二的神秘AI产品,如今终于揭开了面纱。

相对于3月初作为全球首个通用AI Agent产品火遍全网,Manus此次开放注册并没有引起太大的轰动。

Manus此前引发关注,是因为它不同于单一的大模型生成简单图文,而是将用户输入的命令拆解为不同的任务并调用不同子Agent或工具分别完成具体任务,这让很多人第一次清晰地看到AI Agent与大模型的区别。再加上Manus和DeepSeek一样都是来自于中国的创业公司,很多人将其视为DeepSeek之后中国AI领域的又一个颠覆式产品。

此次蓝媒汇实测发现,Manus当前并没有中文版,若通过百度等中文浏览器直接搜索进入Manus官网,只能看到Manus 3月份发布的与通义千问合作的消息。

在业内人士看来,Manus与通义千问这样的头部AI大模型合作2个月后,之所以中文版至今还不见踪影,主要是国内用户变现难,不容易收割。

一个字儿:贵

初步体验Manus后,最大的感受就一个字:贵。

Manus采用的是消耗积分方式,注册成功后会获得1000免费积分,此外,每天会获得300免费积分。每天获得的免费积分不能累积,无论是否使用完,第二天都自动变为300积分。

不过你如果真的想常用Manus,根本不用考虑这300积分会用不完,因为随便输入一个任务就能轻松消耗掉几百积分,每天获得的免费积分只够完成一些非常简单的任务。

由于Manus上线之初就已经有不少人体验过各种功能,所以为了避免浪费有限的积分,蓝媒汇给Manus安排了一个较为复杂的任务,做一个简单的网页版数独游戏。

尴尬的是,直到注册时送的1300积分全部消耗光,该任务都没能完成,无法检验成果。而且由于不断地测试导致上下文太长超出限制自动停止,不得不通过压缩上下文的方式接力进行。

如果不想让这个任务因此半途而非,要么就得等第二天更新免费积分,要么就得花钱购买积分。根据Manus的收费标准,平均100积分就需要1美元。也正因如此,很多人一看到价格就直呼太贵了。

Manus在“公测”阶段就采用这样的收费标准,或许与其成本有关

据一位业内人士介绍,Agent的运行会依赖大模型规划、执行,消耗大量的tokens(自然语言文本的的最小单位),所以如果没有自研模型,就需要支付模型的API费用给基础模型的厂商。Manus的海外版主要使用美国人工智能初创公司Anthropic开发的大型语言模型Claude,根据外媒报道,平均每执行一个任务,Manus就要向Anthropic支付2美元。

除此之外,Manus还需要支付高昂的云端沙盒成本。该业内人士介绍,Manus在运行时只需要用户使用浏览器,所有的任务都在云端完成,而不需要占用户本地电脑的资源。这样的方式就会带来云端虚拟机的成本,相当于提高了成本,改善了用户的使用体验。

Manus作为一个初创公司,显然没有实力像国内大厂那样免费给C端普通用户免费使用,“公测”阶段就无差别收费在所难免,但这样的价格难免劝退不少人。

中文版上线遥遥无期

Manus中文版何时上线是不少人关注的问题,虽然Manus完全可以通过中文来使用,但到目前为止,Manus中文版仍遥遥无期。

这或许与监管有关。上述业内人士向蓝媒汇分析称,Manus的海外版主要使用美国人工智能初创公司Anthropic公司开发的大型语言模型Claude,海外模型在国内没有备案,所以不能直接使用。这也就意味着,Manus就算已经开发出中文版,也无法在国内上线。

此外,之所以没有立即上线中文版,或许也跟国内用户付费习惯和意愿相关。相比国外用户,在国内大模型内卷的大背景下,直接向用户收费进行付费订阅,显然不是一个好的选择,毕竟国内用户不是非用Manus不可。

虽然Manus已经与通义千问合作,但双方并没有公布任何进展或细节,AI蓝媒汇尝试就中文版Manus的研发进度向双方咨询,截至发稿暂未得到有效回应。

从Manus的相关动态来看,Manus当前似乎并不急于回到国内,主要目标仍然是海外市场。

就在Manus宣布开放注册的同时,有消息称Manus母公司拟融资1亿美元,Manus也是火速辟谣。不过根据天眼查APP,Manus当前已经获得了4轮融资,最近一次融资为今年4月份完成的7500万美元融资(约合人民币5.4亿元),投资方为硅谷风头Benchark。此外,腾讯、红杉中国、真格基金也曾对Manus进行过投资。

虽然这个融资细节可能有误,但根据数据分析机构CB Insights的信息,Manus在今年上半年获得了一笔7500万美元的种子轮融资,投资人中也包含Benchmark、腾讯、红杉以及真格基金。

另据外媒报道,蝴蝶效应计划将这笔新注入的资金用于支持其服务向海外市场扩张,目标直指美国、日本和中东。

缺少模型是优势,也是软肋

据了解,Manus将重点继续放在海外,而不是趁着在国内大热时回国的原因,就在于作为一家创业公司,Manus在国内恐怕难以维持生计。

Manus背后的母公司蝴蝶效应并不研发大模型,而是直接调用已有大模型,这是它在美国各种政策限制下还能获得硅谷融资的原因。但如此一来,Manus就成了一个“赚差价”的AI公司,定价空间受大模型厂商制约明显,即便与通义千问达成了合作,不想赔本赚吆喝,收费就低不下来,这与国内AI市场普遍以低价甚至免费吸引用户的情况水土不服。

更何况,Manus的护城河并不牢靠,至少从用户层面来讲,并非没有其他产品可以替代Manus。

在Manus引爆全球关注之前,字节跳动就先后发布了Coze(扣子)的海外版和国内版。凭借抖音等内容平台,Coze迅速积累了大量用户,而且当前Coze国内版虽然也收费,但对于只需要基础功能的个人用户,免费版足矣。

来源:Coze官网

4月下旬,被一些人称作Manus平替的百度心响APP上线安卓平台,iOS版也在审核中,有消息称心响APP现已签约1500家机构,但还未经证实。该APP依托百度在搜索领域的积累已经可以完成包括城市旅游、AI相亲、法律咨询、试题讲解、游戏开发在内的十大场景超200个任务类型。更重要的是,心响当前是全量免费的。

对于Manus而言,虽然刚刚获得了7500万美元的投资,但想凭此就与字节、百度这样有自研模型也有足够资本的大厂竞争,未免有些杯水车薪。

即便不与这些大厂在国内竞争,Manus在海外市场的竞争压力也不小。国外科技巨头同样也在积极布局AI Agent。北京时间5月15日凌晨,谷歌发布了由Gemini驱动的通用科学智能体AlphaEvolve,可以用于攻克数学分析、组合学、几何学等领域的开放性难题。

对于Manus来说,全球首款通用智能体的头衔确实给它带来了不少关注,但在国内外巨头的层层围堵之下,光有头衔显然不够,能否打好开放注册这一仗,或许正是Manus是否有机会讲新故事的关键。

作者:孙光辛

来源:AI蓝媒汇

]]>
Manus免费开放注册:下一个AI爆发时刻来袭? //www.f-o-p.com/368005.html Wed, 14 May 2025 05:51:01 +0000 //www.f-o-p.com/?p=368005

 

曾炒至10万的Manus免费开放注册了。

符合这两年AI资讯一贯“阶段性沉默、点状式爆发”的传播特点,仅是一则50余个字的资讯,相关话题热度便不断飙升。

得不到的永远在骚动,这个被称为“创造了AI Agent 的DeepSeek时刻”的产品,曾在一夜爆火后,因为邀请码一度炒到5位数,陷入了是靠着营销号带节奏的“饥饿营销”的争议,此后声量渐歇。

5月12日晚上11点,Manus发布公告表示,Manus即日起向所有人开放,无需等待;所有用户将一次性获得1000积分奖励,同时,用户每天还能免费获得300积分(相当于一次使用机会)。

值得注意的是,不同于目前国内其他AI搜索产品,如DeepSeek、Kimi、元宝等几乎都是0门槛、完全免费开放的,而Manus的任务规划、决策和输出生成都需要消耗积分,任务越复杂或越长,所需的积分就越多。这在一定程度上限制了用户的使用次数。

不过,目前Manus开放的仍是国际注册,中文版本还在开发中。

不管早期评价多两极分化,大家对“终于能用上Manus”这件事的期待值还是拉满了。

用起来怎么样?

两个多月前,在Manus推出前夕,Manus创始人之一的张涛对这个新产品的定义是:“我们定义了一个新赛道。”

那到底有多新呢?

简单来说,底层技术上的突破难说,但至少初步定义了一个从去年底就饱受讨论的问题——一个AI Agent产品的形态应该是什么样的?

我首先问了一个重点在于信息整合方向上的问题,让Manus详细讲解一下赤壁之战,以报告的形式具体描述战斗经过,同时结合地图与地形可视化进行说明。

对于第一次使用Manus的人来说,Manus呈现出来的思考过程多少会眼前一亮,Manus先是创建了一个工作流,把它接下来要做的事情细分。

有趣的是,不同于其他AI搜索软件,Manus直接把信息溯源放在了工作流里。比如在整理历史背景和相关地图资料时,它打开了维基 百科和百度百科。

逻辑性很强,姿态标准,从溯源结果追溯也能避免一定程度的AI幻觉(此处重点批评DeepSeek)。

最后,Manus帮我生成了4个文件清单,除了最终整合完的一篇2000多字的完整报告——引言、背景、经过、结果和影响……面面俱到,还有详细的Todo list工作流以及图片文件,其中关于战斗经过还单独拎出来一份。

值得注意的是,其中那张图片,Manus应该还是在一个大地图里截图出来的,虽然能在思考过程中追溯来源,但最终生成结果还是缺少图片来源标注。

接着,我又再问了一个主观性更强的问题:用关键词概括Manus的优势,以及面对“套壳”争议,如何定义通用AI智能体以及理解现阶段AI应用落地的着重点?

这次Manus显然更智能了,再复述完我的问题后,它没有自行猜测我的需求去分析,而是首先反问了我的具体需求和关注点,还给了一些引导思考的关键词。

紧接着,才开始了它的具体工作。这次,Manus整整给了我10个附件,包括完整的报告以及相关的参考资料和中间分析文档。

而这一次,我在prompt中其实并未提及需要帮我整合成一份完整报告,但Manus还是给我写了篇论文——包括了摘要和参考文献。

截至到这一步,Manus整体表现都不错,不同于其他AI产品还需要用户研究如何提出更好的prompt,Manus用户只要提出简单的文字需求,Manus就可以自主工作,并交付成型产品。

唯一的缺点就是,真的太慢了,上述两个任务,Manus花费的时间都需要10分钟,而且后面这个显然更为复杂的提问,花费的积分已经超过300,相当于,如果我把1000积分用完后,靠着每天300积分的免费额度,我甚至拿不到一份完整报告。

任务完成后,Manus还引导我进行网页部署。

这一次是漫长的25分钟……

这次结果反而让我有点失望。

直接说,就是丑。相当于一个网页框架,直接填文案,你看不到任何的UI设计。

PConline综合看到不少体验后的网友评论:做PPT不如另一个定位国际市场的Agent产品Genspark,网页不如字节的扣子。

显然,从内测走向公测,Manus仍处于产品的早期阶段。AI迭代速度之快,让竞争变得极度激烈,特别是国内的AI团队在模型训练和产品创新等方面的表现都尤其出色,这也是市场一直说的,国内AI产品很难有先发优势。因为后来居上的太多了。

但Manus的出现至少指出了前进方向。

是否套壳不再重要

从工作流里其实可以明显看出,Manus的工作模式相当于在云端设置了一个“虚拟机”,在虚拟机里去跑代码——它自己有个操作系统,自主上网,跨平台、跨网页调用API完成任务。

其实就是将复杂任务拆解为多个子任务,并动态调用不同的Agent或工具来执行每个子任务,最终完成整体任务。

其中重点是,对用户的指令没有那么“严格”了。

正如此前Manus团队曾表示,AI 浏览器不是在浏览器里加 AI,而是做给 AI 用的浏览器。

市场给了AI 2年多的发展期,这2年多的时间里,大家基本的共识是,先投入,先All in,寻求技术突破的前提下,AI更多是工具,讲的是模型能力,所以才有风靡一时的“指令”。

而在最近红杉第三届AI峰会上,新共识出现了。

据“AI深度研究员”文章报告,峰会提出AI商业模式转型:下一轮 AI,卖的不是工具,而是收益。

从卖工具到卖协作,最终走向卖成果——未来AI应用的核心问题,不是模型能力,而是“是否能跑起来干活”。不是谁模型参数更多、推理速度更快,而是谁能把结果交付闭环,谁就拥有了客户预算。

红杉认为:“AI 应用价值将超越模型本身。”

从这一点回过头来看Manus,Manus是全球首个通用Agent,扣子空间和百度前不久发布的心响都是这个方向,即在获取用户的指令后,可以自主规划与多智能体协作。

值得注意的是,据剁椒Spicy消息,心响App的一位产品经理表示,团队正是看到了Manus爆红之后,加班加点一个月,打造了心响App。

正如上文所述,Manus至少让市场看到,现阶段一个真正的AI Agent应该是什么样的。

“Attention 不是 all you need,解放用户的 Attention 才能重新定义 DAU”,Manus团队曾分享。

Manus创始人肖弘一直强调的观点是:模型商品化。大家去做use case、去解决具体的问题。——这是应用层。

而对AI应用类产品来说,是否“套壳”便不再重要,Manus的核心优势从来不是大模型,而是通用性、解构性,如何做好任务规划和执行框架,以便更好调用多个智能体。

模型能力是一回事,但落到用户层面,如何顺畅地用到自己的具体工作中,是另一回事。

作者:太平洋科技

来源:PConline太平洋科技

]]>
从Manus到MCP:25年AI的3大新趋势 //www.f-o-p.com/365114.html Wed, 19 Mar 2025 01:10:58 +0000 //www.f-o-p.com/?p=365114

 

25年开年以来,AI发展如火如荼,DeepSeek R1、OpenAI CUA、Manus等重要创新层出不穷,眼花缭乱。

这里我将最近一个月以来的思考总结一下,对25年AI发展趋势做几点预判。

(1)Manus:Agent元年的一次抢跑

Manus推出之后,我们第一时间拿到了体验账号,进行了充分的体验测评。

先说结论:虽然Manus目前还有种种不足,但它的产品设计思路创意满满,值得我们给予充分的肯定。

Manus的核心架构基于“虚拟机+多Agent协同”模式,通过整合多个底层大模型(如GPT-4、Claude 3等)的API,实现任务的动态分配与模型调用。

Manus突破了传统AI助手仅生成建议的局限,实现了从“需求输入”到“成果交付”的端到端闭环。

Manus提出“Less Structure, More Intelligence”的交互理念,通过无代码化的自然语言接口降低用户使用门槛。

与此同时,Manus使用一个外置的markdown文件来管理Agent的任务规划,并且将阶段性的工作成果存储为独立文件,这也是一个非常有趣的创新点。

(2)Manus的不足与缺陷

Manus在MultiAgent的道路上提供了一种非常有趣的思路,但现在依然存在一些显而易见的不足之处。

首先是“幻觉累加”的问题。

Agent的本质是多次大模型问答的串并联。如果单次大模型问答的准确率是90%,串联10次的话,最终Agent回答准确的概率是0.9^10,只有1/3左右了。

在下面的案例中,Manus的任务是针对某上市公司进行财务数据分析。Manus很聪明的import了data_api模块,准备从雅虎提供的接口中调取财务数据。

但是在process_financial_data函数中,manus竟然把revenue、gross_profit等数据直接“硬编码”到了代码中,让人猝不及防。而且经过验证,这里的数据有部分是错误的。

如果原始数据出错了,那么后续无论分析得多么深入、图表做得多么fancy都失去了意义。

Manus的第二个问题是可供大模型调用的工具不足

下面这个例子中,Manus的任务是写一篇关于“小米Su7”的市场分析报告PPT。

Manus完美的拆分了任务,并且检索了大量新闻,但是最后它无法生成一份PPT,因为它无法调用Office软件。

目前Manus输出的内容形式多为纯文本或者网页,还无法和人类工作流进行完美融合。

Manus遇到的第三个挑战是小院高墙的互联网生态。

互联网上有很多优质信息是存放在“围栏”中的。

比如当我们让Manus去分析比较市面上所有AI智能眼镜的性价比时,它聪明的找到了对应商品的淘宝网页。

但是当Manus想要打开具体产品页面获取价格性能等详细信息时,淘宝判定它为机器人,并拒绝了Manus的访问。

无独有偶,当我们让Manus为一家非上市公司进行出具商业分析报告时,Manus为了获取公司的最新融资进展,访问了CrunchBase数据库。

但是Manus的访问被CrunchBase判定为机器人,随后被无情的拒绝了。

互联网看似公开透明,实则存在大量类似小院高墙的情况,优质信息往往就存放在这些高墙之内,Manus无法直接获取,这无疑阻碍了Manus的工作效果。

尽管有着种种问题和挑战,Manus依然给大家描绘了MultiAgent的巨大前景,打响了Agent元年的第一枪,值得我们给予充分的肯定。

在Manus占据大家视野的同时,海外AI大厂究竟做了哪些技术储备呢?

(3)OpenAI CUA:一个会自主操作电脑的Agent

在今年的1月底,OpenAI发布了由其新模型CUA(Computer-Using Agent)驱动的AI智能体Operator。

CUA模型融合了GPT-4o的视觉能力和通过强化学习实现的高级推理能力,能够将任务分解为多步骤计划,并在遇到挑战时进行在我调整和纠正。

简而言之,CUA就是一个会操作电脑的Agent,它的运作原理非常直白且简洁,如下图所示。

首先,CUA会同时接受两种模态的输入:其一是文本指令,其二是屏幕截图。

CUA会同时处理这两种信息,并且生成一系列动作指令,比如“点击屏幕上坐标为(300,200)的点,并且输入XXX,按回车”。

电脑接受到指令并完成操作后,会将新的屏幕截图与新的任务指令返回给CUA,如此循环往复,直到获得最终答案。

那么CUA目前操作电脑的能力达到了怎样的水平呢?

根据OpenAI的官方测评,CUA在操作电脑和操作浏览器这两个场景上,相比上一代SOTA都有了巨大的性能提升。

但是相比人类而言,依然有着较大的差距。换句话来说,目前顶级的Agent依然没有办法像一个成年人一样正确的操作电脑,但我相信这个现状在今年内就会发生质变。

(4)Anthropic MCP:AI时代下的TCP/IP协议

刚才在分析Manus的缺陷时,提到了“工具不足”的问题。

Anthropic显然也意识到了这个问题,并在去年年底推出了MCP来从根源上解决这个问题。

MCP的全称是Model Context Protocol,它定义了应用程序和AI模型之间交换上下文信息的方式,这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型。

MCP之于AI,有点类似于TCP/IP之于互联网。

MCP有三个重要特点:

标准协议:将AI与所有工具层的交互接口统一成一个标准

动态发现:AI能够按需寻找并调用能够完成指定任务的工具或服务

双向通信:AI与工具之间的通信是双向的,有状态的。AI既能从工具获取数据,也能向工具发送指令。

当前越来越多的工具及服务开始接入MCP,呈现愈演愈烈之势,包括Google Maps、PGSQL、ClickHouse(OLAP数据库)、Atlassian、Stripe等等。

在Smithery平台上你可以轻松查找不同功能对应的工具及服务。随着越来越多的Server接入MCP协议,未来AI能够直接调用的工具将呈现指数级增长,这能从根源上打开Agent能力的天花板。

(5)2025年AI发展新趋势:后训练、RL、MultiAgent

这里我结合最近几个月以来的观察和思考,总结一下25年AI发展的几点重要趋势。

第一,预训练即将终结,后训练成为重点。

这其实已经是行业共识。去年年底时,Ilya在NeurIPS大会上提到一个重要观点:数据是AI时代的化石燃料,因为我们人类只有一个互联网。

与此同时,在今年DeepSeek R1的论文中,提到了后训练将成为大模型训练管线中的重要组成部分。

第二,针对后训练而言,强化学习将成为主流,监督学习的重要性逐渐下降。

DeepSeek R1带来最重要的启发是:纯粹的RL可能是通向AGI的正确路径。

随着TTS的增加,大模型会自我涌现出复杂的推理行为,而无需刻意引导。

如下边右图所示,横轴是大模型RL的迭代步数,纵轴是单次问答的token长度。我们可以看到,随着大模型RL步数的增加,大模型会自主的从“快思考”变成“慢思考”,从最开始每次回答100个token,到最后每次回答接近10000个token。

DeepSeek团队将这种现象称为“self-evolution”,并认为它是“the emergence of sophisticated behaviors”。

具体是哪些复杂行为的涌现呢?DeepSeek也给出了答案,比如:self-verfication, reflection等。

这个发现对于我们来说有着重要的启发。未来监督学习在AI训练中究竟应该扮演怎样的角色?监督学习是否反而限制了AI解决问题的能力?

是否不应该让AI通过模仿人类的思维方式来获得智能,而是让AI发展出更加原生的智能?

这些问题,都有待整个AI行业通过实践来给出答案。

第三,MutiAgent是确定性的大趋势。

如果将AI和人脑进行类比的话,大模型就像是人脑中的“前额叶”。

众所周知,前额叶主要负责高级认知功能,比如注意力的分配、思考推理、决策等。

但是仅仅有前额叶,大脑是无法处理复杂任务的。我们需要有颞叶来进行听觉信号的解析,需要顶叶进行阅读和算术,需要小脑来进行运动协调,需要海马体来进行记忆索引。

MultiAgent的定义恰恰就是让多个不同的模型之间互相协调,从单独的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。

在这个蓝图中,MCP就起到了非常重要的作用:协调统一大模型与各工具之间的数据通信接口。

(6)结语:抓好扶手,未来已来!

2025年是AI Agent元年,Manus的出现打响了第一炮。

无论是OpenAI的CUA还是Anthropic的MCP都指向了一个共同的未来,未来2年AI的发展速度将非常陡峭。

抓好扶手,未来已来!

作者 | 费斌杰 北京市青联委员 熵简科技CEO

作者:费斌杰

来源:Alpha Engineer

]]>
Manus的海外口碑也渐渐起来了 //www.f-o-p.com/364893.html Fri, 14 Mar 2025 01:10:23 +0000 //www.f-o-p.com/?p=364893

 

Manus终于火到海外了。

上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的”爆火”主要局限于国内,在海外却无人问津。

而这个周末,Manus开始破圈了,福布斯等主流媒体开始关注,也成为海外科技博主热议话题,一众科技大佬纷纷展开测评,有媒体称热度甚至赶超流行音乐女王霉霉的演唱会。

热议之下,Manus获得不少好评。比如知名AI博主Rowan Cheung称之为中国的“第二个DeepSeek时刻”,Hugging Face的产品负责人称Manus是他尝试过的“最令人印象深刻的AI工具”。

不过,也有用户在测试中发现体验并不顺畅而持保留态度。

01 世界上第一个完全自主的AI代理

3月8日,福布斯文章称,Manus这个来自中国的AI代理正在改变一切。

福布斯称Manus是一个能够独立思考和行动的革命性AI代理,重新点燃了一个已经持续了几十年的辩论:当人工智能不再寻求许可,而是开始自己做决定时,会发生什么?

在福布斯看来,Manus不仅仅是一个聊天机器人,也不是一个披着未来主义品牌的改进搜索引擎。它是世界上第一个完全自主的AI代理:

一个不仅仅协助人类的系统——它取代了人类。从分析金融交易到筛选求职者,Manus在数字世界中无需监督地导航,以一种即使是经验最丰富的专业人士也难以匹敌的速度和精确度做出决策。本质上,它是一个数字通才,被训练来管理跨行业的任务,而没有人类犹豫不决的低效。

02 第二个DeepSeek时刻

知名AI博主、曾专访扎克伯格并率先发布Llama-3开源消息的Rowan Cheung转发了Manus的官方视频,并将Manus比作“中国的第二个DeepSeek时刻”,并预测其进入美国市场只是时间问题。

这是Rowan首次发文讨论Manus。目前,这条推文评论接近600条,浏览量超260万。

Rowan在评论里介绍了自己的体验经过。在收到邀请码后,他先测试了Manus创建个人传记并基于此传记部署网站的能力。Manus通过他的社交渠道、浏览文章,并成功部署了网站,且信息100%准确,包括最新的信息。

接下来,Rowan测试了Manus在提供实用信息方面的表现,例如寻找旧金山最佳租车地点,要求满足低犯罪率、大量人工智能活动和高密度的雄心勃勃的年轻企业家。Manus提供了4个非常准确的选项。

Rowan进一步测试了Manus完成长时间研究任务的能力,要求它创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。

一番体验下来,Rowan认为Manus“并不全是炒作”。

专注于搜索引擎优化(SEO)的X用户Julian Goldie直言,在看到Manus的实际效果后,他取消了每月200美元的ChatGPT订阅,他认为Manus正在重新定义浏览器自动化的功能。

经过测试,Goldie总结了Manus的强大功能:能够同时控制50个浏览器、实时创建和编辑文件、部署功能齐全的网站……

不仅如此,Goldie认为Manus在效率提升和成本节约上都能“秒杀”竞争对手,不仅在研究方面比任何竞争对手都更快,能够快速生成综合报告和可视化效果,而且使用Manus可以节省数千美元。

Hugging Face的产品负责人Victor M测试了Manus的代码生成功能,展示了Manus编写的一个使用Three.js库控制飞机的游戏。

Victor M大为惊叹,称他尝试过的“最令人印象深刻的人工智能工具”。他表示,Manus的用户体验(UX)是许多其他工具承诺过的,但Manus真正实现了。

X用户Umar Jamil分享了使用了Manus 来帮他在伦敦找房子的过程,他对Manus推荐的社区非常满意,并且很快就要搬过去了。

Umar Jamil的需求是在伦敦找到一个公寓,要求通勤时间不超过一小时,租金不超过1750英镑,至少有一间卧室和一个大客厅。

Manus 花了大约10分钟内完成了研究任务,通过创建一个待办事项列表来构建研究计划,并将所有中间结果保存在文件中,随着找到更多信息不断编辑这些文件。它会浏览互联网,寻找所有与研究相关的有用信息。

最后,Manus 推荐了几个区域,并推荐Walthamstow Central为最佳选择,因为它通勤时间仅为17分钟,租金在1300至1700英镑之间,且在预算内有较大的居住空间。

找到满意房子后,Umar Jamil连发数条推文表达他的震撼,称Manus ~= Claude + MCP*1000 + Deep Research+ Operator,还发问:“马拉多纳是‘上帝之手’,Manus会是‘AGI之手’吗?”

03 耗时太长、信息不准…吐槽也不少

Manus在海外的快速崛起也伴随着争议,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

AI初创公司Pleias的联合创始人Alexander Doria在测试Manus时遇到了错误信息和无限循环的问题。

Jackson Laboratory 教授Derya Unutmaz对比了OpenAI的Deep Research和Manus的性能。

Deep Research在不到15分钟内完成了任务,而Manus AI在运行50分钟后,在步骤18/20时失败了。

Unutma观察了Manus AI的输出,认为其表现相当好,并进行了第二次尝试。但第二次尝试在20分钟后,在步骤9/20时也失败了,Unutma推测可能是Manus AI的服务器过载。

也有用户指出,Manus在事实性问题上会犯错误,并且并不总是引用其工作来源,有时会遗漏很容易在网上找到的信息。

X用户Teortaxes认为Manus是一个针对社交媒体影响者极度优化的产品,这解释了它为何如此受欢迎:

该产品在生成主题内容、旅行计划等一般兴趣方面表现良好,但在STEM领域协助和编程方面表现不佳,甚至不如使用谷歌搜索。

Teortaxes提到Manus AI在处理某些任务时的输出质量不高,与将文档直接输入ChatGPT/Gemini相比没有太大优势,称之为“相当标准的GPT废话”。

TechCrunch记者Kyle Wiggers自己对Manus的体验也不太好。

他让Manus处理一个看似简单的请求:从他所在地区的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus崩溃了。在第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

Wiggers还让Manus预订从纽约到日本的航班,但Manus只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。此外,Manus在尝试预订附近餐厅的座位和构建一个以《火影忍者》为灵感的格斗游戏时也失败了。

04 Manus的双重颠覆:加强中国AI叙事,重定义智能边界

眼下Manus还需要邀请码才能用,它到底是AGI降临的前奏,还是又一个过度营销的AI产品?等更多人用上了,市场自然会给出答案。

无论如何,Manus的横空出世为AI发展带来了双重突破。一方面,Manus进一步加强了中国AI的叙事。多年来,全球AI叙事一直围绕着OpenAI、谷歌、Meta等美国科技巨头展开。而Manus继DeepSeek之后,再次证明了中国在AI领域的实力。

另一方面,Manus颠覆了AI发展的既定路径。过去,业界普遍认为谁能打造出更强大的语言模型、更复杂的聊天机器人,谁就能主宰AI的未来。而Manus的出现打破了这一路径——它不仅仅是对现有AI的迭代升级,而是开创了一个全新的智能范式:从被动响应指令到主动规划行动,从聊天机器人到自主代理,Manus或许正是AGI破茧而出的第一道曙光。

作者:叶桢 华尔街见闻

来源公众号:锦缎

]]>
火出圈的Manus成了今年最会“营销”的AI产品? //www.f-o-p.com/364882.html Thu, 13 Mar 2025 06:30:08 +0000 //www.f-o-p.com/?p=364882

 

继Deepseek在今年春节期间火爆全球,仅仅一个月后,又一款来自中国的AI产品Manus在互联网上带来了刷屏时刻。准确地来说,在极短的时间内,Manus已经从“红”和“黑”不同的维度上将国内AI圈刷屏了两次,取代Deepseek成为了当下最有热度的AI话题。

3月6日凌晨,随着国内AI团队Monica在国外X平台用英文发布了通用AI Agent产品Manus,后者以超越Deepseek的速度引爆了AI圈。

先是大量关注AI技术的自媒体纷纷点赞吹爆Manus,措辞还特别夸张,有的称Manus作为全球首款通用Agent已在实力层面碾压OpenAI,有的直接喊出了“Manus让硅谷无眠,让ChatGPT沉默”的口号。铺天盖地的宣传搭配上官方所放出的效果惊艳的演示视频,似乎一夜之间Manus真的把人们带进了AGI时代。与此同时,能够率先体验Manus的邀请码更是被炒到了10万的天价。

然而,距离Manus出圈还不到48小时,舆论就出现了极具戏剧性的反转。随着热度的攀升,许多人开始质疑Manus官方演示的功能并不具有技术上的自主创新,本质上更像是将成熟技术“封装套壳”做成产品。再加上邀请码机制形成的饥饿营销,有人甚至直接将Manus的走红当成了一次精心策划的借AI热度发售虚拟币的炒作。

从“Deepseek之后的又一个王炸”到跌入“套壳+过度营销”的舆论漩涡,Manus的口碑在短短几天之内上演了惊天大反转。时至今日,即便官方团队对饱受争议的一些问题尽力做出了澄清,但舆论风向并没有明显变化。Manus是真王炸还是真营销?依然成了外界最为关注的焦点问题。

01 Manus爆火,AI Agent改写行业认知

那么最近刷屏的Manus究竟是一款什么样的AI产品?

从目前信息来看,Manus被视为全球首款通用型AI Agent产品,由国内技术团队Monica打造。在官网上,Manus官方将自己定义为“一款通用型 AI 助手,能将想法转化为行动:不止于思考,更注重成果。Manus 擅长处理工作与生活中的各类任务,在你安心休息的同时,一切都能妥善完成。”

在官网上的演示案例中,Manus的操作具有极高的自主性。比如让Manus筛选简历,用户只需将简历压缩包发给Manus,剩下的任务它都能自动完成。Manus会自己解压文件,从文件中找出重要信息,根据资料给出候选人评估结果,还会做成方便用户查阅的表格。并且在整个过程中并不需要人工干预,用户只需要表达诉求和提供资料。

除此之外,不管是为亚马逊商店销售数据制作可视化表格还是为中学教师制作解释动量定理的课件,Manus统统不在话下,只需要用户一句话的事。也就是说,在使用体验上,与现在的各种AI大模型相比,宣传里的Manus智能体更像是一个真正意义上的个人数字助手。

其实从技术层面来说,能够理解并自主执行任务的AI智能体并不是第一次出现。比如在去年10月的荣耀Magic手机发布会上,荣耀CEO赵明就曾通过语音指令就让手机上的YOYO智能体点单了上千杯咖啡到会场,这便是AI智能体应用的一个案例。

但之前的智能体都存在着比较明显的局限性,那就是只能执行例如点餐这种比较简单的任务,与Manus这种通用型的AI智能体还有着较大差距。从官方公布的演示来看,目前的Manus已经能够处理较为复杂的任务,比如作为房地产经纪人帮助用户在纽约选购房产、做出一份AR/AI眼镜的行业分析报告等,效果相当惊人。

事实上,许多关注AI的技术大佬在近些年对智能体早已寄予厚望。比如百度公司的李彦宏去年就曾明确表示“智能体是AI应用的最主流形态,即将迎来爆发点”,OpenAI CEO奥特曼在去年也将智能体的重要性排在了公司发展战略的前列。

虽然说Manus和Deepseek本质上不是同一类产品,无法横向比较,但在传奇程度上,Manus的技术团队同样不遑多让。公开资料显示,创立DeepSeek的梁文锋是80后,Monica的创始人之一肖弘则是90后,在2015年毕业于华中科技大学。在团队规模上,DeepSeek团队大概是160人,而Monica团队则只有60人左右。

Manus创始人更年轻、团队人数更少,却做出了全球首款通用AI Agent产品,也难怪国内AI圈对这个尚未公开上线的神秘新产品异常关注,甚至将其视为了能比肩Deepseek的技术突破。

02 技术和营销的双重质疑,Manus为什么饱受争议?

或许Manus技术团队自己也没想到,在横空出世震撼国内AI圈后没多久,针对Manus的质疑声便接踵而至。首当其冲的就是技术力方面的质疑。

一些AI行业的从业者表示,Manus背后的团队规模较小,很难有自研底层大模型的能力,Manus所展现出来的模型能力更多的是国外成熟模型的“套壳封装”。打个比方,假如各家大模型的能力是一块块形状各异的乐高积木,那么Manus做的就是把各个积木按照一定的要求拼起来,来满足用户的需求。因此,有网友调侃称“Manus不生产大模型能力,Manus只是大模型的搬运工”。

在AI从业者的视角里,Manus产品并非完全没有技术力,而是“有技术含量,但不多”。在Manus出圈之后,有技术团队声称只用了5个人3小时,就基本复刻出来了Manus,可以实现与原版一样的功能。也就是说Manus本质上基本并没有自己的技术护城河,稍有实力的AI团队都可以在较短时间内手搓一个同款出来。

不过在业内也有一种声音认为,哪怕Manus是封装套壳其他大模型形成的产品,但也具备一定的商业价值。因为能坐上大模型牌桌的就那么几家公司,其他人想要涉足AI赛道,必然会避开技术层,转而在应用层面寻找突破口。

同时根据国信证券电话会透露的信息,腾讯或许在5月份会推出一个类似Manus的产品,字节和阿里的同类产品也已经在路上。本质上,这些大厂的在研产品与Manus并没有什么不同。

除了技术壁垒的缺失,套壳大模型的Manus在实用性上也会相当受限。同样以上文的乐高积木举例,由于Manus只是拼装积木而不是创造新的积木,那么它就不可能拼出积木原本没有的形状。换句话说,Manus的能力上限取决于各家大模型的水平,大模型进步才能带来Manus能力的提升。

而从目前的AI大模型来看,其能力显然还无法完全取代人工。这就导致Manus可以按工作流借助大模型能力达到任务目标,但无法保证任务完成的质量,甚至会出现AI操作2分钟,人工调整3小时的尴尬场景。

虽然Manus在技术上并没有太多创新亮点,但让其从红转黑的关键因素其实是充满争议的一套营销组合拳。在Manus火速出圈之后,其营销模式就被扒了个底朝天,大概可以简化为KOL宣传+邀请码+绑定关键词宣传的三板斧。

首先是KOL宣传,自Manus团队以高姿态推出自家产品之后,国内行动最早的不是AI行业而是科技自媒体。3月6日当天,有大量科技自媒体同步发布测评文章,而且用词相当夸张,也因此被网友调侃Manus是第一款自媒体比专业人员更早发现和评测的AI产品。

有了大量KOL的宣传,Manus在短时间内就被追捧成了可比肩Deepseek的国产之光,而就在大家想要尝鲜一探究竟的时候,却发现体验Manus还需要邀请码。或许邀请码机制如Manus官方所澄清的那样是出于控制算力的考量,但其造成的结果就是,在这几天里能拿到邀请码几乎成了KOL博主人脉和实力的体现,进一步刺激了许多博主免费为其宣传。

在KOL和邀请码制造庞大宣传舆论的过程中,Manus还和Deepseek以及爱国情怀进行了强绑定,将营销推向了高潮。也正因此,在短短几天里、在产品尚未公开上线的情况下,Manus便成了国内AI行业最热门的话题。

Manus这场营销大戏,说到底就是“老套路遇上新行业”。靠天价邀请码制造稀缺感、找自媒体狂吹“吊打OpenAI”、再打一波“国产AI崛起”的情怀牌。这些招数在电商、社交App时代确实好使,但在AI圈却完全不对路。因为现在的AI行业更多的会看实打实的论文paper,会看团队的技术背景以及产品的使用成本,像Manus这种通过宣传造势的产品像极了不断膨胀的泡沫,很容易被AI赛道的同行们一戳就破。

而且更伤的是,这不仅伤害了用户期待,更让踏实做技术的团队被迫卷入浮躁的军备竞赛。毕竟,当“会吆喝”比“会造轮子”更易获得关注,谁还愿意埋头苦熬大模型?

03 结语

Manus的爆红和翻车,像一面镜子照出了AI行业的现状:一边是人们对“黑科技”的狂热期待,另一边却是技术不够成熟、营销用力过猛的尴尬。它试图用“通用AI助手”的噱头打开市场,结果却被质疑“只会拼装别人的技术”。

放眼未来,AI Agent(智能体)的赛道注定热闹,国内外大厂早已摩拳擦掌。但Manus的故事告诉我们,靠包装概念或许能赚一波流量,可要想真正改变生活,终究得靠技术硬实力。就像搭积木的人永远受限于积木的形状,只有那些能自己“造积木”的团队,才可能走得更远。

作者: Lumens

来源公众号:Morketing

]]>
Manus是DeepSeek级创新吗? //www.f-o-p.com/364802.html Wed, 12 Mar 2025 01:10:05 +0000 //www.f-o-p.com/?p=364802

 

Manus破圈的速度,又刷新了ChatGPT和DeepSeek创下的记录,内测一天之内红遍互联网!

对于这家位于武汉,名为“蝴蝶效应”的企业来说,其实是他们第二次做出爆款产品。第一款正是在海外拥有1000万用户的AI产品Monica,年度经常性收入ARR达到了千万美金,是2024年最具营收能力的AI产品之一。

Manus则是这个团队首款AI Agent产品,在3月6日内测期间,就凭借自主执行任务的AI能力,被很多行业人士评价为“开启Agent元年”的产品。从爆红到今天,至今不过4天时间,甚至还没有公测,大家凭借几个案例展示,就将这款产品碰上了神坛,内测码最高抄到5万元。

实际上,这家公司曾在2024年,被字节出价3000万美元收购。尽管他们最后觉得价格不够公允,而收购没有成行。鲸哥独家多方获悉,内情是字节觉得Monica产品比较”套壳”,产品投流成本很高,留存数据不乐观,未来可能被大模型取代,自己也会推出豆包插件,所以给出的报价有点压价。

而对于Monica来说,ARR千万美金的公司,仅3倍PS(套用二级市场的市销率概念)收购,比他们上一轮估值就高出几百万,明显不符合背后投资人预期。

在移动互联网时代,公司和产品就曾卖给某独角兽。而在AI时代开启后,从Monica到Manus,新公司的产品力和执行力相当强悍,第二轮的红杉中国和腾讯等决定支持他们的进一步创业。毕竟在大厂都缺乏爆款的AI native领域,仅用少量融资做出了两款出圈产品。

尤其Manus的出圈,伴随着惊人的褒奖,很多人认为是DeepSeek级别的创新,是开启AI Agent大门的钥匙,甚至是通往AGI之路的代表性产品;同时,也伴随着潮水版的嘲讽,很多人认为没有核心技术,就是个套壳产品;也有人阴谋是一场联合KOL的营销,国外都没有掀起什么水花;还有人认为后续开放服务成本太高,可能很难落地。

众说纷纭之下,鲸哥也深入研究了这款产品,试图站在更客观以及更长远的视角,和大家交流下这款产品的突破与意义。

DeepSeek打破算力本位,Manus开启Agent元年

在3月6日,Manus产品小型发布会上。这家公司打出了“The next ChatGPT moment”的标语,形容Agent时代的大门已经被打开。

Manus够不够下一个GPT时刻,现在尚且不能够判断。已经火了一个月的DeepSeek,则证明了自己的实力。

DeepSeek在春节期间爆火出圈,是因为大家第一次体验到推理模型的魅力。真的是很聪明,很多回答深度广度和灵活性,都超出了此前大家熟知的豆包、元宝等产品。这是推理模型相比指令性模型的优势,也是DeepSeek这家公司的聪慧之处。

2025年,大模型面临三个突破方向:大参数,多模态、推理。第一条路,Grok 3还是强悍地通过20万张H100显卡,硬突破大模型的Scaling law,其他家则通过MoE等架构做大做强;多模态是大家主要发力的方向,国外的OpneAI,国内的字节豆包、腾讯混元、阶跃星辰等都是代表,融合DIT架构,听说看写样样精通;第三条路就是在推理侧,通过强化学习RL等方式提升模型聪明度 ,DeepSeek就是这个方向的代表,通义也很快跟进。

DeepSeek实际上更大的特点,是出色的成本控制能力,尤其此后连续开源5天的项目。也逐渐证实了这种底层设施优化的能力,打破了英伟达等公司“算力本位”铸就的科技金融秩序。

何为“算力本位”?美国的金融霸权历经三次底层逻辑跃迁:从黄金、石油到算力,本质上是通过垄断全球核心资源重塑信用体系,维系美元霸权。

  1. 金本位崩塌(1944-1971):布雷顿森林体系确立美元与黄金挂钩,但美国黄金储备不足导致体系崩溃。1971年尼克松宣布美元与黄金脱钩,美元亟需新锚定物。
  2. 石油美元霸权(1974-今):美国与沙特秘密协议锁定石油以美元结算,建立”石油-美元-美债”循环:石油出口国赚取美元后购买美债,美元成为全球储备货币。巅峰时期全球86%石油贸易以美元结算,美联储通过美元潮汐收割全球财富。
  3. 算力本位崛起(2020s-):数字时代算力成为新生产资料。英伟达H100芯片成为”算力货币”,2023年全球算力市场规模达2.6万亿美元,美国企业占据60%份额,算力正替代石油成为美元信用的新支柱。

大模型的惊人算力需求,背后的算力本位成就了英伟达近两年股价累计涨幅超 435%,近10年市值更是从3000亿美金涨到接近3万亿美金。

而对于Manus而言,确实尚未引起国外科技圈的震动。不能像DeepSeek那样,影响英伟达股价波动。但据合伙人张涛说公司只有50多人,用两三个月就做出了这款爆红的AI产品。

微信搜索指数对比:Manus未超越巅峰期的Deepseek

但在国内市场,Manus还是最火的AI产品,仅仅是放出了网站几个例子,就能在互联网上掀起讨论风暴。一码难求之下,很多人甚至高价求码。一个Maunus邀请码生成器的应用,甚至3月8日冲上iOS国区付费榜第一名。

当然,这个产品并没有什么用,却蹭到了流量。

Manus洞察力领先,大厂创新不足

对于大部分人来说,都没有体验过OpenAI Deep Research(高达每月200美元)来说,国产的Manus上手后,确实有些惊艳。鲸哥测试了如下问题:

像做一份具身智能报告这样的问题,第一遍在分析资料时就卡住了,要求最后做成PPT的环节无法指望了,于是第二遍要求做成文字版报告,也是在制作图表前停止了。

目前看,Manus很多时候还无法了解和控制自己的能力,经常贪多嚼不烂。

从原理上来说,Manus并不复杂。Manus 是整合了 Computer use、虚拟机、Multi agent 协同的AI产品。

注:来自宝玉AI

但Manus最重要的突破,是相比于自动化编程软件Devin和bolt.new,实现了通用领域的Agent的产品化落地。

此前曾在这家公司工作过的员工就社媒上提到,这家公司工程实践和agent workflow的积累很深厚:

23年9-10月首次在国内推出agent,这里面的todolist.md都是当时学习了各家agent方案之后的最佳实践。

24年3月做gpts平台,24年初开始一直就在做浏览器的技术积累,积累大量对浏览器context利用的理解。

23年11月开始做搜索,对于agent联网获取信息的能力也是有积累的。我没参与的部分。

24年7月份通过roast获取社交流量的增长经验。

24年11月coding产品中对于各模型coding能力的理解。

Erix

“确实每件事都是相对薄的一层,但这些积木在这个窗口形成的组合创新足够强也是事实。”这位员工如此在评价。

鲸哥认为,Manus最成功的是超越大厂的产品洞察力。

蝴蝶效应创始人肖宏作为连续创业者,此前推出的“壹伴插件”是千万收入的微信插件产品(鲸选账号的新媒体运营也在付费使用),此后抓住企微 SCRM 风口做了微伴助手,AI 风口来了又做了大模型集合产品Monica,现在 AI Agent风口来袭、又推出了Manus。

尤其连续两个AI native产品的成功,很不容易。强如OpenAI,实际上除了ChatGPT 外,其余产品也并不成功,很多都处于半成品状态,比如GPTs、SearchGPT、DALL.E、Whisper等等。

现阶段国内大厂的AI产品,则普遍缺乏一些创意。从AI 社交到AI搜索,以及AI Coding产品,都是人有我有的产品。

本图由腾讯元宝AI生成

而蝴蝶效应公司,在利用Monica抢占了AI插件第一波红利后,又率先在Agent方面做出第一款成熟的产品。在山姆奥特曼分享的AI五个阶段中,L1(聊天机器人)、L2(推理者)、L3(智能体),Manus成功卡位L3阶段初期破圈产品。

尤其他们“Less Structure more intellingence”的理念,让他们放弃了AI 浏览器这条卷不过大厂的路,也让其发现了新生机。

至于这波是不是营销杠杆产生的出圈效应,鲸哥认为不是这样。

此前,Monica发布中文版,曾和KOL有过一波合作,就是通过KOL发放免费的会员使用额度。Manus在要求KOL参加小型发布会交流时,确实和大家说了是“全球首款通用型Agent产品”形容词,我了解到没有合作推广的KOL。

估计Manus如果没有大反响,也会和Monica一样通过KOL发布免费token额度,现在看肯定不需要了,但从前文的微信搜索指数看,也火不到DeepSeek的程度。

心资本Soul Capital合伙人吴炳见曾形容:Deepseek破圈后,社会确实被事实教育了,大家开始卷技术水平了——如何改良Attention,如何提升MoE,如何FP8和FP16混训。再进一步,是卷原创水平——谁能创新出下一代模型架构,谁能发现下一套训模型的方法。

所以从这个角度讲,Manus也让大家的产品策略,卷回到前沿创新领域,关注2025年AI应用/Agent元年后,大家能做出怎样的创新产品,而不是AI助手的投流大战。

套壳不影响,成功却还很远

现阶段的AI 产品,本质上并没有核心的壁垒和竞争力。产品理念很难被注册为专利,工程化能力则是大厂最擅长的地方,所以此前鲸哥就曾在小红书上提到,猜猜看哪家大厂做出类似的产品。

但讲道理,Manus相比之前的一些通用Agent产品,比如OpenAI的Operator、Anthropic的Claude use 、腾讯的APPAgent,Manus算是一个工程交付完善度更高的Agent产品。

然而,完善度并不是一个产品很高的壁垒。在Manus爆火后,MetaGPT 团队花费了 3 小时开发了 OpenManus 并开源。

在Manus探索出来了实际需求、优化技术工程路径,不断完善产品功能细节后,外界“半开卷”抄一份作业确实并不难。半天就被复刻,那Manus就没一点壁垒了吗?

某投资人因为套壳论失去投资Perplexity机会

如今数不清的AI搜索产品,并没有影响Perplexity的发展。原生的产品理解,会帮助Perplexity不断更新更好的功能点,而其他同类产品只能后面跟进复刻。

对于Manus来说,同样也是如此。现阶段可能最需要解决的是,接受一家大厂的融资。毕竟不公开测试,原因就是服务器接纳能力不够。

在媒体沟通会上外放的消息显示,Manus团队也给出了单任务运行的成本:约两美元。成本已经低到DeepResearch的1/10,但单任务成本依然高达近15元的价格。这也是Manus 采取小范围发放邀请码的原因,就这还造成了内部的系统崩溃。

接受大厂融资,不仅是资金,更重要的是大模型API 的低成本供给。据参加沟通会的媒体消息,Manus核心调用的是Claude模型,外加一些通义开源大模型的微调。未来是否会接受阿里、腾讯或者字节的投资,类似Kimi那样资金+资源的投资呢?

这样才能让Manus以低于千元的年费,推出订阅会员服务。否则高于这个价格,可能会成为少部分专业人士的玩具。

另一方面是完善产品细节和服务能力,快速迭代才是保证生命力的根本。

目前Manus生成一份回答还十分漫长,很多任务还是会崩溃。Manus需要在产品化上做出更多心思,而不是Manus产品负责人张涛所言:“真的非常简单,就是没有秘密,就是相信模型的力量。”

模型是基础,产品细节是服务能力。比如Claude 3.7 Sonnet在代码编程能力再次打破天花板,但是Cursor凭借代码自动补全方面的优势,还是能吸引大家付费订阅。

更重要的是,MCP(Multi-Agent Communication Protocol)聚合模式已经在呈现很高的成长性。这也是Manus未来应该采用的发展路径。

从大模型进化速度看,内置agent可能也是个趋势。未来GPT 5如果能实现推理和指令模型融合,多模态能力以及内置Agent,可能会强大到出乎意料。国内大厂应该也在跟进这条路线,这之前,Manus需要跑出用户和营收规模。

小结

DeepSeek打破大模型领域的唯国外模型成功论,以及极低的成本落地能力,让大家相信,东方神秘力量有冲击全球科技金融秩序的能力。换句话说,DeepSeek 以一己之力让中国拿到AI竞争门票,直接让全球投资者对中国资产杀估值的时代结束了。

而对于Manus而言,展现了AI native最强的形态,不是千篇一律的Chatbot,也不是像个木马似的AutoAgent,而是更多场景有用,也有希望落地。

说高点,他或许能成为下一个AI时代的微信,但可能影响不了国外的Facebook等产品更受欢迎。说低点,开启了大众对Agent的认知,给了众多初创团队继续造梦的信心。

作者:鲸哥

来源公众号:鲸选AI

]]>
从DeepSeek到Manus:科技群星闪耀时 //www.f-o-p.com/364800.html Tue, 11 Mar 2025 06:10:18 +0000 //www.f-o-p.com/?p=364800

 

还记得ChatGPT刚问世时我改用过的传播学之父施拉姆的这段话吗?

不好意思,现在我又要把它给搬出来了——因为全球首款通用AI Agent(自主智能体) 产品「Manus」,问世了。

「中国团队出品」「原来深耕海外市场」「在权威的GAIA基准测试中创下新纪录,性能远超OpenAI的同类产品」……都将Manus话题性拉满。

就在圈外人还在对AI Agent式术语和「年度最炸裂AI应用」类大词蒙圈时,圈内人已纷纷求起了邀请码。

▲ Manus让不少AI圈人士陷入不眠之夜,很多专业人士在技术论坛里求邀请码。

现实就摆在那:Manus成了又一个在国外技术论坛刷屏的带有中国印记的AI产品,上一个是被某些人誉为「国运级科技成果」的DeepSeek

即便是对「生成式AI的iPhone时刻」「Agent的GPT时刻」等大词已免疫的我,看着演示视频中Manus自主分析15份简历,最终Excel排名表生成速度比喝光一杯美式咖啡还快的景象,仍不免有些震颤。

奈何自己没文化,只能一句「厉害」走天下。

Ps:我跟Manus有「校缘」关联——Manus背后的Monica.im创始人肖弘(英文名Red),跟我是校友,但同样毕业于华中科技大学,我跟他隔了N个银河系,并无利益相关。

01

问题来了:Manus到底厉害在哪?

  • 场景吞噬力:DeepSeek擅长处理单线程任务(如合同审查),而Manus可并行完成「爬取财报→编写Python→部署网站」的复杂链路。
  • 进化加速度:DeepSeek用3个月实现10倍推理效率提升,Manus则在GAIA基准测试中,将任务拆解颗粒度细化到「0.1秒级决策」。
  • 生态野心:当DeepSeek专注模型层时,Manus已构建多智能体协作沙盒,并宣布年底开源部分模型——这像极了Android早期用开放生态对抗iOS的策略。

看不太懂,是不是?

看不懂就对了,这是DeepSeek说的,我也不懂。

作为0.5个小白,我想说些在我理解范围内的东西。

▲ Manus已引发众多国外科技媒体的关注。

很多人都知道,这两年,Agent一词很火,「Agent,下一个爆款级AI应用」「Agent,下一代入口级机会」「Agent,将取代App」的说法四起。

最形象的表述莫过于:大模型是AI大脑,Agent是AI助理贾维斯。

去年底,中国通信院云计算与大数据研究所所长何宝宏曾指出,2025年Agent将成为焦点,「大模型的七年之痒正在出现。下一步,我们需要从大模型转向Agent,而Agent是目标导向的,这与大模型的知识压缩属性形成对比。」

在他看来,AI大模型角力「下半场」的标志之一,就是内容生成转向智能体(Agent)框架(AutoGPT),支持工具调用(API)、任务规划与动态交互,Agent崛起。

那,何以Agent?

OpenAI前副总裁翁荔此前已给出公式,广受业内认可:Agent=大模型+记忆+主动规划+工具使用。

就这么说吧,AI要从「想象力」迈向「生产力」,Agent是绝佳的云梯。

这两年,Agent概念火归火,可现实中,在绝大多数场景中,打工人还是得自己手动去定义、编排工作流。

AI工具有用,但作用也有限。

这时候,Manus指着身上的「全球首款通用型Agent」标志,来了一句:要不,试试我这个?

02

「通用」,意味着什么?

技术人士可能会甩出一堆术语加术语:要全链路交付(能直接执行到结果产出);要云端异步(可以自动在云服务器干活,干好了再通知用户);要数据可靠(会自动调用权威API,而不是随便用不知名数据源);要擅长代码调用(会自己写代码来调用不同工具,完成数据可视化)。

已经有人对Manus的特点,做出了具象化的概括:

1. 强大的工具调用能力

Manus不仅能听懂你的需求,还能直接调用各种工具,如浏览器、代码编辑器、数据分析工具……直接帮你把任务搞定,直接给成品。

2. 独立运行的计算环境

Manus是「云上打工仔」,有自己的独立计算环境,你不需要盯着它干活,极度省心。

3. 类似人类同事的协作体验

即便你随时调整任务方向,中途改变需求,Manus也能灵活应对,完全不会「卡壳」。非但如此,它还能记住你的偏好,下次直接按照你的喜好来,越用越顺手。

4. 多领域任务处理能力

Manus是「全能王」,无论是教育、金融、旅行、编程还是数据分析,它都能轻松搞定。它能帮你做深度调研、文件整理、可视化分析,甚至是根据你的需求生成个性化内容,如旅行手册、研究报告、代码等。

5. 持续优化与学习能力

Manus还会不断学习和优化,你可以通过它的知识系统添加自己的要求,或让它记住某种工作方式,下次直接用。

Manus擘画出了「mens et manus」(知行合一)的图景——这也是其名字来源。

老实说,被贾老师PPT伤害过的我,对此仍要持谨慎采信态度。

但只要Manus能兑现演示视频中的一半,就已足够强大了。

03

也许在某些人看来,Manus压根算不上颠覆性创新。

在网上,有个流行说法是:套壳到极致,既是TPF,也是PMF,最后都通往用户价值。

言下之意,Manus终归是套壳。

这不算冤枉Manus:Manus身后的Monica,是靠AI插件领域头部产品起家——无论是通过独立开发者产品 ChatGPT for Google完成冷启动,还是去年在 GPT-4o、Claude 3.5上线第一时间帮用户接入最新SOTA(技术最先进)模型,抑或是DIY Bot、Artifacts 写小程序、记忆等功能,都表明,Monica是个「超级缝合怪」。

但这不意味着,作为应用层突破的Manus,没有技术创新。

▲ Manus在权威的GAIA基准测试中创下新纪录,性能远超OpenAI的同类产品。

在《技术的本质》中,布莱恩·阿瑟曾说过:新技术不是无中生有被「发明」出来的,技术都是从先前已有的技术中被创造,包括:a,被构建;b,被聚集;c,被集成而来。

他认为,技术的进化是「自创生」,新技术的产生都源于其他技术的「组合进化」。

就算Manus不是模型层的创新,那也不能否定其技术的突破性。

事实上,即使是代表了模型创新的DeepSeek,此前也被认为只是造出了「30美元iPhone」而已。

可结果……大家都看到了。带动中国资产价值重估,就是对多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术、稀疏激活网络(MoE)架构等创新的盖章确认。

Manus亦如是。

美团、滴滴都是应用创新,应用创新也是创新。

04

从业内反应看,不少人对Manus给技术侧带来的价值已有预判。

就我来说,我更想从更普适的角度去谈谈其更深远的价值。

那就是:它将硅基跟碳基的「物种级差」又拉平了很多,将横亘在二者间的挡板削掉了一大截。

ChatGPT问世后,很多人都说:生成式AI技术具有强颠覆性与强嵌入式特征,能低成本应用到千行百业。

这使得有些人期盼它的提效作用,也有人忌惮它的替代效应。

毕竟,纳西姆·塔勒布曾说过,在任何职业中,90%的人都是无知的,而是通过情境模仿,狭隘的模仿和半意识的角色扮演来工作的,除了社会科学和新闻业——这两者分别为99%和100%。

但两年过去了,不论是提效还是替代,都没很多人想的那么猛烈。

AI和人,差的绝不只是弄懂「鱼头指谁」的能力。

科技观察家元正老师认为,人并不特殊,真正特殊的是算力。瓦特、麦克斯韦、爱因斯坦=生物算力的算力奇点=人体智能超算;ChatGPT=以机器算力为主导的、「生物+机器」混合算力的算力奇点≈机器智能超算。

过去驱动社会进步的,是人体智能超算。机器智能超算之所以没法做人做的很多工作,就是因为还不够「智能」。

可王兴兴用行动说:真的吗?尔后甩出了人形机器人。

具身化,让AI跟人更像了一些。

但高盛显然还有些不服。

这几天,高盛分析师团队调研过宇树科技后认为:宇树科技最强大的人形机器人 H1 只有 19 个自由度(DoF)。这意味着,它还无法处理复杂、精细的任务。

它认为,人形机器人在未来 2-3 年内,很难达到与人类工人相同的工作效率,有意义的应用可能需要在 5-10 年的时间跨度内才会出现。

那,要是宇树H1+Manus呢?

可以肯定的是,至少离抵达图灵奇点更近一步了。

如果将ChatGPT视作「生物+机器」混合算力奇点的第一阶产物,那DeepSeek、人形智能机器人、Manus就是将其不断推向更远的地方。

05

从DeepSeek到Manus,不免让人想起了一句话——科技群星闪耀时。

诸多迹象似乎也表明:2025,是科技大爆发之年。

在《人类群星闪耀时》里,茨威格写道:「充满戏剧性和命运攸关的时刻在个人的一生中和历史的进程中都是难得的;这种时刻往往只发生在某一天、某一小时甚至某一分钟,但它们的决定性影响却跨越时间。

一切有为法,如DeepSeek面世,如Manus问世,应作如是观。

文:佘宗明

来源公众号:数字力场

]]>
国内刷屏的Manus,海外第一波评论来了:第二个DeepSeek时刻? //www.f-o-p.com/364771.html Tue, 11 Mar 2025 01:52:48 +0000 //www.f-o-p.com/?p=364771

 

Manus终于火到海外了。

上周,Manus横空出世,以全球首款通用AI Agent在国内社交媒体上刷频。但爆火同时也被质疑存在过度营销之嫌,其中一大质疑是,Manus的”爆火”主要局限于国内,在海外却无人问津。

而这个周末,Manus开始破圈了,福布斯等主流媒体开始关注,也成为海外科技博主热议话题,一众科技大佬纷纷展开测评,有媒体称热度甚至赶超流行音乐女王霉霉的演唱会。

热议之下,Manus获得不少好评。比如知名AI博主Rowan Cheung称之为中国的“第二个DeepSeek时刻”,Hugging Face的产品负责人称Manus是他尝试过的“最令人印象深刻的AI工具”。

不过,也有用户在测试中发现体验并不顺畅而持保留态度。

世界上第一个完全自主的AI代理

3月8日,福布斯文章称,Manus这个来自中国的AI代理正在改变一切。

福布斯称Manus是一个能够独立思考和行动的革命性AI代理,重新点燃了一个已经持续了几十年的辩论:当人工智能不再寻求许可,而是开始自己做决定时,会发生什么?

在福布斯看来,Manus不仅仅是一个聊天机器人,也不是一个披着未来主义品牌的改进搜索引擎。它是世界上第一个完全自主的AI代理:一个不仅仅协助人类的系统——它取代了人类。从分析金融交易到筛选求职者,Manus在数字世界中无需监督地导航,以一种即使是经验最丰富的专业人士也难以匹敌的速度和精确度做出决策。本质上,它是一个数字通才,被训练来管理跨行业的任务,而没有人类犹豫不决的低效。

第二个DeepSeek时刻

知名AI博主、曾专访扎克伯格并率先发布Llama-3开源消息的Rowan Cheung转发了Manus的官方视频,并将Manus比作“中国的第二个DeepSeek时刻”,并预测其进入美国市场只是时间问题。

这是Rowan首次发文讨论Manus。目前,这条推文评论接近600条,浏览量超260万。

Rowan在评论里介绍了自己的体验经过。在收到邀请码后,他先测试了Manus创建个人传记并基于此传记部署网站的能力。Manus通过他的社交渠道、浏览文章,并成功部署了网站,且信息100%准确,包括最新的信息。

接下来,Rowan测试了Manus在提供实用信息方面的表现,例如寻找旧金山最佳租车地点,要求满足低犯罪率、大量人工智能活动和高密度的雄心勃勃的年轻企业家。Manus提供了4个非常准确的选项。

Rowan进一步测试了Manus完成长时间研究任务的能力,要求它创建一门关于内容创作人工智能的完整课程。Manus花了近2个小时完成,最终提供了一门包含8章的课程,其中包含工具、用例和提示示例。

一番体验下来,Rowan认为Manus“并不全是炒作”。

专注于搜索引擎优化(SEO)的X用户Julian Goldie直言,在看到Manus的实际效果后,他取消了每月200美元的ChatGPT订阅,他认为Manus正在重新定义浏览器自动化的功能。

经过测试,Goldie总结了Manus的强大功能:能够同时控制50个浏览器、实时创建和编辑文件、部署功能齐全的网站……

不仅如此,Goldie认为Manus在效率提升和成本节约上都能“秒杀”竞争对手,不仅在研究方面比任何竞争对手都更快,能够快速生成综合报告和可视化效果,而且使用Manus可以节省数千美元。

Hugging Face的产品负责人Victor M测试了Manus的代码生成功能,展示了Manus编写的一个使用Three.js库控制飞机的游戏。

Victor M大为惊叹,称他尝试过的“最令人印象深刻的人工智能工具”。他表示,Manus的用户体验(UX)是许多其他工具承诺过的,但Manus真正实现了。

X用户Umar Jamil分享了使用了Manus 来帮他在伦敦找房子的过程,他对Manus推荐的社区非常满意,并且很快就要搬过去了。

Umar Jamil的需求是在伦敦找到一个公寓,要求通勤时间不超过一小时,租金不超过1750英镑,至少有一间卧室和一个大客厅。

Manus 花了大约10分钟内完成了研究任务,通过创建一个待办事项列表来构建研究计划,并将所有中间结果保存在文件中,随着找到更多信息不断编辑这些文件。它会浏览互联网,寻找所有与研究相关的有用信息。

最后,Manus 推荐了几个区域,并推荐Walthamstow Central为最佳选择,因为它通勤时间仅为17分钟,租金在1300至1700英镑之间,且在预算内有较大的居住空间。

找到满意房子后,Umar Jamil连发数条推文表达他的震撼,称Manus ~= Claude + MCP*1000 + Deep Research+ Operator,还发问:“马拉多纳是‘上帝之手’,Manus会是‘AGI之手’吗?”

耗时太长、信息不准…吐槽也不少

Manus在海外的快速崛起也伴随着争议,一些用户和专家对其技术成熟度提出质疑,也有一些早期用户表示体验Manus的过程并不顺畅,而且存在一些事实性错误。

AI初创公司Pleias的联合创始人Alexander Doria在测试Manus时遇到了错误信息和无限循环的问题。

Jackson Laboratory 教授Derya Unutmaz对比了OpenAI的Deep Research和Manus的性能。

Deep Research在不到15分钟内完成了任务,而Manus AI在运行50分钟后,在步骤18/20时失败了。

Unutma观察了Manus AI的输出,认为其表现相当好,并进行了第二次尝试。但第二次尝试在20分钟后,在步骤9/20时也失败了,Unutma推测可能是Manus AI的服务器过载。

也有用户指出,Manus在事实性问题上会犯错误,并且并不总是引用其工作来源,有时会遗漏很容易在网上找到的信息。

X用户Teortaxes认为Manus是一个针对社交媒体影响者极度优化的产品,这解释了它为何如此受欢迎:

该产品在生成主题内容、旅行计划等一般兴趣方面表现良好,但在STEM领域协助和编程方面表现不佳,甚至不如使用谷歌搜索。

Teortaxes提到Manus AI在处理某些任务时的输出质量不高,与将文档直接输入ChatGPT/Gemini相比没有太大优势,称之为“相当标准的GPT废话”。

TechCrunch记者Kyle Wiggers自己对Manus的体验也不太好。

他让Manus处理一个看似简单的请求:从他所在地区的顶级快餐店订购一份炸鸡三明治。大约十分钟后,Manus崩溃了。在第二次尝试中,Manus找到了符合他标准的菜单项,但无法完成订购过程,甚至无法提供结账链接。

Wiggers还让Manus预订从纽约到日本的航班,但Manus只能提供几个航空网站和像Kayak这样的机票搜索引擎的链接,其中一些链接是无效的。此外,Manus在尝试预订附近餐厅的座位和构建一个以《火影忍者》为灵感的格斗游戏时也失败了。

Manus的双重颠覆:加强中国AI叙事,重定义智能边界

眼下Manus还需要邀请码才能用,它到底是AGI降临的前奏,还是又一个过度营销的AI产品?等更多人用上了,市场自然会给出答案。

无论如何,Manus的横空出世为AI发展带来了双重突破。一方面,Manus进一步加强了中国AI的叙事。多年来,全球AI叙事一直围绕着OpenAI、谷歌、Meta等美国科技巨头展开。而Manus继DeepSeek之后,再次证明了中国在AI领域的实力。

另一方面,Manus颠覆了AI发展的既定路径。过去,业界普遍认为谁能打造出更强大的语言模型、更复杂的聊天机器人,谁就能主宰AI的未来。而Manus的出现打破了这一路径——它不仅仅是对现有AI的迭代升级,而是开创了一个全新的智能范式:从被动响应指令到主动规划行动,从聊天机器人到自主代理,Manus或许正是AGI破茧而出的第一道曙光。

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

作者:叶桢

来源:华尔街见闻

]]>
深度理解Manus AI Agent //www.f-o-p.com/364747.html Mon, 10 Mar 2025 06:25:30 +0000 //www.f-o-p.com/?p=364747

 

不得不说,最近一段时间AI圈的发展实在是太快,我们的学习速度实在是有些跟不上,因为这两天身边的技术圈和AI圈的高手们都在讨论Manus,让我觉得自己有必要深入的理解一下Manus的产品和技术原理,所以今天优先快速输入关于Manus的分享,后续会把我过去一个月关于Deepseek的学习成果也分享大家。

为了快速的搞清楚它到底是什么,我花了一天的时间阅读了大量的文献并从产品经理的视角做一次系统的梳理和总结,相比Deepseek,Manus还是相对更容易理解,加上研究助手的支持,今天很快就把这篇文章输出出来了,全文近8000+字,我将从应用视角、技术实现、以及对于Agent探索等角度,深度理解这个产品。

一、从应用视角理解Manus AI

1. Manus AI是什么?

简单一点讲,Manus AI本质上是一个具备“多智能体”能力的应用产品,是一个拥有更多的技能,并且能够自动规划并一次性组合多种技能,解决一个复杂的应用场景问题,相比之前以ChatGPT为主的产品,Manus Ai可以更具体的解决很多通用场景的问题,并且输出结果的满足度更接近用户想要的结果,例如根据其官网的示例,它可以执行“爬取特斯拉股票数据,生成一篇带图表的分析报告,并创建一个数据面板,将其部署成一个可以查看的网站”等这样需要完成爬虫收集数据、图表可视化、创建分析报告、编写代码、部署网站等多个复杂任务的指令,接下来我们详细介绍Manus AI的每一个核心信息:

  1. ManusAI是一个应用,不是大模型:首先它只是个AI应用产品,不是一个大模型,跟DeepSeek完全不是一会事,只能算一个做的很不错的超级产品工程,所以不要和大模型混淆,更不要提“下一个DeepSeek”这种外行的观点,它跟DeepSeek的影响力完全不是一个水平,鉴于当下很多人错误的观点,这里有必要纠正一下部分人的误解;
  2. 具备自动规划和任务拆解的能力:Manus 可以基于用户输入的指令,理解用户的意图之后,自动建立规划,并拆解任务;比如用户输入“帮我生成一篇特斯拉的报告“的时候,Manus将该指令拆解为”创建Python文件-爬取数据-生成图表-创作分析报告-编写HTML代码-部署网站“这个过程,这里的规划能力,和大模型的规划能力还稍微有些不同,后面我们会详细讲解;
  3. 具备更多的技能,可以完成更多复杂的任务:以上面的特斯拉的案例为例,完成整个过程所有的任务,需要具备编写爬虫代码、对接金融数据API、对接数据可视化API、生成分析报告、代码编程、对接网站部署API等一些类的能力,Manus相当于提前具备了这么多技能,当需要使用这些技能的时候,自动调用技能解决问题,”技能库“是Manus AI非常重要的一个能力,同样我们后面会详细讲解;
  4. 可以解决更多通用性的应用场景问题:通过Manus 用户可以更加大胆的提出更多的应用场景问题,比如特斯拉这个例子,以往面对ChatGPT等产品,我们还不能提出让它自己写代码,并且把网站也部署了,可以支持用户直接打开网页这种事情,因为它不支持直接部署网站的能力,而manus却做到了,这是它让大家惊艳和赞叹的原因之一。

总结起来,从应用层的角度上看,manus是一个技能超群,能更灵活的解决用户更复杂的应用场景问题的应用工具,未来很多需要存在复杂工作流的任务,通过Manus这种类型的产品,可能能够得到很好的满足;

2. Manus AI究竟有没有那么神?

这两天有很多营销媒体有点过分的吹捧Manus,这其实并不太客观,很多人甚至都还没有真实的体验过这个产品,也还没搞清楚它就开始吹捧。

但不得不说的是,单纯从当前AI应用的角度上看,Manus定义的应用实现方式和实现效果确实是惊艳的,这个评价并不是个人说的,而是来自业界权威的GAIA测试的结果,GAIA它是由数个来自Meta、HuggingFace和AutoGPT的专家们共同完成,模拟了真实世界的复杂问题,要求AI展现推理、多模态处理、网页浏览和工具使用等多维能力;之前GPT-4+工具调用在这个测试中仅获得了15%的成绩。而Mannus AI在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch,这非常了不得,但是我们只能说,当下它相比其他应用还是很了不起的,至于实际能不能真正一步到位的解决用户的问题,达到非常炸裂的效果,这个我觉得不一定,还是要看到实际的产品,真正放到应用场景里面才好评价。

3. Manus AI和ChatGPT等产品的区别?

Manus AI和ChatGPT都属于AI应用,那么两者有什么区别,Manus为啥能够让科技圈觉得它与众不同,个人的理解,两者的差别主要包括如下:

1.从产品形态和能力边界上看,ChatGPT本质上是一个以大模型为主的生成式AI应用,它目前只能解决一些跟内容生成有关的问题,解决不了跟生成无关的问题,包括自动化任务,或者跨平台执行任务,比如部署网站、帮你订餐等,这些跟生成式AI无关;

而Manus AI更像是一个自主规划并执行任务的机器人,生成式AI只是它的一部分能力,除此之外,它还能能自主执行自动化任务,或者跨端执行任务;而现实的应用场景中,用户并不是只有AI生成的需求,还有自动化任务相关的需求,这是很多用户认可它的原因,相当于它能帮用户解决的问题更多了;

2.从用户体验的角度上看,ChatGPT在执行任务的时候,更多的需要用户写清楚提示词,提供清晰的指示,在用户的引导之下才能完成任务;而Manus可以支持用户简单的输入一个指令,Manus自动理解用户需求并拆解任务,并自动完成任务;

另外一个角度,在解决一些具体任务问题的时候,ChatGPT很多时候只是提供建议和操作指引,但是并不会帮助你完成任务;比如当你问ChatGPT怎么部署网站的时候,它可以很清晰的告诉你一系列过程,但是还是需要用户自己动手做;而Manus不同,它可以自己动脑规划的同时,还直接动手帮你把之情给做了,这完全呼应了“Manus”的中文翻译是“手脑并用”这个点;因此ChatGPT更像是一个只指挥不干活的老板,而Manus是一个动脑子还做事情的优秀员工,这是用户更加喜欢Manus这种应用形态的原因;

3.从技能水平上,ChatGPT除了大模型服务之外,还支持联网搜索等技能,但是整体的技能和工具是比较少的,目前更多的是官方引进了一些跟生成相关的技能,但是Manus却又大量的内置技能,包括搜索引擎、浏览器、本地文件处理、代码编程等,还具备调用多种数据API以及跨端操作等技能,所以技能更多;

4.从技术实现方式上,ChatGPT主要依托大模型技术,而Manus技术底座采用了多代理虚拟机架构,融合规划代理(任务拆解)、执行代理(工具调用)、验证代理(结果校验)等多层代理,形成一个同时具备“模型调度+工具链整合+环境交互(例如跨端交互)”三重能力的应用。

事实上,openai推出的产品中,跟Manus直接对标的可能不是ChatGPT,而应该是其推出的Operator这款产品,但是为啥operator推出的时候,并没有引起相应的轰动,最主要的还是因为其限制只有200美元/月的PRO用户才可使用,或许在能力上Operator并不比manus差,但是因为只有极少数用户才能用上,因此不具备市场效应。

4. Manus AI执行任务的过程

在大致的理解了Manus应用相关的问题之后,我们来分析理解一下Manus AI在具体应用的过程中,它是怎么运作的,我们以其官网示例的:“特斯拉股票分析和投资见解”这个应用场景为例,分析它是怎么逐步完成这个应用场景的实现的,整个实现的效果是,用户仅输入一个需求指令,manus最终输出了一份关于特斯拉的股票分析,同时将数据固定成为一个数据看板,并开发部署为一个可以打开的网站;整个从输入到输出的过程的原理,通过一个脑图梳理概括如下:

具体每个步骤的明细如下:

1.用户输入需求指令,要求对特斯拉股票做一个全面的分析,并提供了需求细节;

2.连接数据源,获取分析需要的数据:获得需求指令后,manus第一件事情是先通过调用金融数据的API获取特斯拉相关的企业信息,财务数据等数据,这个过程中,Manus调用了获取数据的API;

3.规划和任务拆解:接着,manus基于用户的需求,开始制定规划并将该需求拆解成多个任务,任务中包括收集公司概况、财务分析、分析市场情绪、技术分析、竞争对手分析、内在价值分析、制定投资理论、撰写报告等多个任务;

4.任务工作流梳理和执行:然后,开始逐步执行各个任务,在执行该任务的时候,manus先梳理完成该任务的工作流,然后依次执行,我们以收集财务数据这个任务为例,整个流程包括撰写python爬虫代码,运行爬虫并获取财务数据,调用数据可视化组件将数据整理成可视化图表;整个过程背后的技术过程,Manus先是调用了大模型的能力完成python文件的撰写,并自动运行爬虫程序爬取数据,且调用数据可视化图表的API完成图表的转换;

5.最终输出一份分析报告:第一项任务的终点,最后调用大模型的生成能力输出的是一个股票分析报告,客观的讲,个人觉得案例中输出的分析报告肯定还达不到非常专业的水平,但是从完成度而言,已经是比较不错了,一方面基本满足用户的需求,并且报告中有数据、有洞察,只是要说达到ChatGPT DeepResearch的水准那没有。

6.制作仪表板:接下来用户再次发送一个制作仪表板的指令,Manus继续完成前面从规划、任务拆解、任务执行的过程,完成一个交互式仪表板的创作;

7.将仪表板发布为网站:最后一步,用户发送指令,将该仪表板部署到一个公共的URL上,该过程中Manus完成应用程序的编程,并自动将程序部署到公网,支持用户访问,当用户直接打开这个网页,看到这个网站的时候,确实让人觉得非常爽,只是一个指令,真的最后开发了一个网页并且部署为可以直接访问的应用,这点是目前ChatGPT等产品无法做到的;

5. Manus未来更适合能解决哪些应用场景的问题?

从前面大家也可以看到,manus的核心能力个人概括起来主要就两点:任务规划和拆解、调用工具

因此其应用场景,核心围绕着这两个能力,比如基于其任务规划和拆解的能力,未来那些工作流比较漫长并且复杂的应用场景,可能可以被很好的解决;

同时基于其调用工具的能力,未来那些需要跨端、跨系统操作,或者需要组合多动API工具的应用场景,可能通过Manus更好的解决,不过鉴于目前Manus可以调用的工具库主要以浏览器操作、文件操作、编程等为主,API主要以数据获取等为主,未来在应用场景上,也将围绕着其可以调用的技能范围来,概括起来个人觉得,以下这些应用场景可能在Manus中会被更好的满足;

6. Manus AI的能力边界和局限性

概括起来,Manus可能更加适合解决满足一下条件的应用场景的问题,对于任务流程个性化、缺乏公开工具和API、专业性较强的应用场景,Manus依然无法很好的满足。

  1. 任务和工作流可以被标准化或结构化拆解的应用场景:如果任务拆解非常个性化,流程也很难被标准化,比如创意发掘、用户需求洞察等,这些是很难被标准化设计和规划的;
  2. 该场景存在可以开放的API和工具,如果没有开放的工具和API可以使用,这种场景就无法被实现和满足,比如复杂的依赖私密信息的金融投研、企业战略决策等;另外目前Manus在跨端操作上还只支持浏览器的跨端操作,而对于电脑操作系统层级的软件的跨端操作,由于
  3. 专业性较强的场景:从前面的案例中,我们可以看到,即使Manus在自动化执行方面已经非常出色,但是目前它还是没有完全解决专业性的问题,比如它还并不一定知道一个专业的股票分析报告应该是什么样的,可能还是需要用户提供一些信息或者需要进一步的探索,自动规划和工具调用并不能解决这个问题,如何定义一个好的回答,以及专业的结果,其中的know-how依然是壁垒,没有被打破。

二、从技术实现的视角理解Manus AI

1. 从产品实现的角度看,Manus和以往AI Agent设计的思路有什么区别?

作为一个AI应用的产品经理,在了解完Manus的实现逻辑和技术原理之后,我们能明显的感觉到Manus带来了另外一种Agent实现的方式,那么相比之前的AI Agent搭建的方式,manus搭建AI的方式有什么特别之处,这部分主要阐述这个问题。

不管新旧的方式如何,一个Agent的搭建,都必须通过大模型、规划、工具(包括知识库、API、computer use等)这几部分才能搭建出一个完整的Agent,Manus相比之前的AI Agent搭建的方式,有如下几点不同:

  1. 自动的任务规划和拆解:Manus能够自动的规划和拆解任务,不需要人工的接入,而以往我们开发一个Agent的时候,这部分的规划和拆解是产品经理人工拆解的,由人工来定义;
  2. 从工具库从调用工具:Manus具备一个内置的工具库,该工具库中包括浏览器、文件处理、代码编辑器等工具,并且支持调用多种API完成特定任务,还可通过computer use的方式跨端操作,因此它具备了更出色的工具调用能力,而以往AI Agent开发的时候,每一个环节里面的工具能力都需要对接具体的API或者使用具体的工具,工具接入的过程更加繁琐;
  3. 通用性:因为技能限制,以前的Agent的实现,每个agent只能解决特定的场景,很难解决通用场景的应用,而Manus在超多技能支持的情况下,可以成为一个通用的AI Agent,灵活的解决很多问题。

2. Manus AI背后的技术架构和原理

在前面特斯拉的案例中,我们也能够看到,Manus在具体解决某一个问题的时候,是先规划和拆解任务,然后再分别执行各个子任务的工作,最后输出结果;

仔细理解,Manus AI 的底层使用了多代理虚拟机的架构,架构中包括规划代理、执行代理、验证代理三层代理,每个代理都具备动态调用工具库和API的能力,三个代理协同起来,完成任务的处理,整个工作流程概括起来如下:

1.用户输入具体指令需求;

2.规划代理完成任务规划和拆解;

3.通过执行代理完成具体指定任务的执行;

4.通过验证代理验证操作结果并输出结果;

3. Manus的规划任务拆解和大模型的规划能力有什么区别?

Mannus的核心能力之一是自主规划和任务拆解,大家可能会觉得奇怪,大模型明明也具备规划和拆解的能力,为啥不直接使用大模型,Manus为啥还要采用多代理虚拟机这样一个特殊的架构来实现这个事情其中。

其中最主要的原因在于大模型的规划能力和任务拆解往往只是基于“文本生成逻辑”,规划结果也只是停留在文本层面,而非基于实际可行的操作,比如当用户要求“生成特斯拉股票分析报告”时,大模型可能输出步骤建议(如“先获取数据,再分析趋势”),但缺乏具体工具调用路径,如调用雅虎金融API、Python脚本编写、Matplotlib可视化等,因此规划不到具体可落地的层面;

另外对于一些复杂的任务,通常需根据中间结果动态调整策略,Manus的规划代理需要能实时监控执行代理的进度,并根据异常(如API调用失败)重新规划子任务,而单一模型难以实现这种闭环反馈,这就是大模型规划能力和Manus背后的规划能力的区别。

4. Manus是如何解决工具的获取和调用的问题?

前面我们已经知道了Manus具备自动调用工具和API的能力,其中这些工具可能来自如下3个来源:

1.内置工具库:包括浏览器、文件处理器、代码编辑器、图表生成工具等等,这些可能都是一些公开的工具组件,官方整合后放到工具库,并基于Claude在2024年6月20日发布的Artifacts,让Manus能够在对话中动态创建和修改这些工具,从而完成从代码到图表,从文档到交互式组件等直观内容的呈现;

2.API:其中包括数据获取的API以及具体某一个技术能力的API,过往我们搭建Agent的时候,我们是通过function call技术将API转换成模型可以调用的工具或者函数,每次在一个Agent 里面调用API的时候都需要单独做对接,这样的方式,就意味着如果要支持100种API,就要对接100次,这样就不具备可持续发展的条件,Manus之所以能更轻松的解决这个问题,得益于2024年11月25日Anthropic开源了划时代的“模型上下文协议”(MCP),MCP解决了数据获取和功能获取等API的统一接入问题,一方面,市面上只要是支持了MCP协议的API,开发者都可以直接调用,有些指定的API如果还不支持,开发者可以通过自主的开发,让指定的API支持MCP协议,这样,Manus可以构建一个API工具库,这些工具可以被直接调用,不用再进行单独开发;

3.Computer use能力:另外,即使没有API和工具,通过Computer use的能力,AI应用可以不局限于专用工具,而是能像人类一样“看见”屏幕并操作计算机,移动光标、点击按钮、输入文本,真正模拟人类与计算机的自然互动,该能力由Claude在2024年10月22日发布,Manus利用该能力,通过跨端操作等方式,增添了更多的能力;

从这里可以看到,其实Manus并没有创造太多的技术方案,只是将这些大公司公开的技术方案利用到极致,用于形成自己的AI应用,他可能算不上是AI技术的引领者和贡献者,但是至少一定是利用开源技术做产品工程最极致的企业。

5. Manus调用工具的方式:云端异步执行与沙盒环境

1.云端计算环境:Manus的所有工具调用均在独立云端沙盒中完成,用户无需本地安装软件或配置环境。例如,生成HTML演示文稿或运行Python脚本时,直接在云端虚拟机执行,用户可随时关闭设备等待结果。

2.异步处理能力:支持用户上传任务后离线,系统自动分阶段调用工具并执行,完成后通过通知推送结果。例如,用户可提交旅行规划需求,Manus在后台调用地图API、酒店预订接口及预算计算工具,最终生成完整行程表。

3.安全性保障:调用API时优先使用权威数据源,避免非结构化数据的干扰;同时通过沙盒隔离确保用户隐私与任务安全。

三、透过Manus AI看Agent未来的发展趋势

1. Manus的产品形态,是否代表未来Agent的趋势?

个人的观点,Manus AI的这种产品形态,并不一定代表未来Agent的发展趋势,应用的本质是解决用户的应用场景问题,至于产品形态个人认为不重要。

ChatGPT等这些类型的AI应用,也并不是不能实现Manus AI的功能,前面我们理解到,Manus相比ChatGPT等应用主要是多了任务规划和拆解、工具调用(工具库、API、computer use)的能力,如果ChatGPT也同步支持这些能力,其照样也可以实现manus一样的效果,其中核心的多代理虚拟机架构、工具库、基于MCP协议的API、computer use等都并不适合Manus的公司原创,其他应用复现和支持的代价并不高,也就是说ChatGPT等类型的应用也能以其产品形态实现相同的应用效果。

2. Manus是否具备竞争壁垒,和扣子等Agent开发平台的区别

鉴于Manus的很多产品能力其实都是基于开源框架和技术造就的复杂产品工程,所以个人认为,并没有太大的核心竞争壁垒,优势仅仅是因为率先推出,可以抢先获取用户,而像扣子、腾讯元器等类型的Agent搭建工具,也完全有条件可以实现和Manus同样的能力,比如扣子只需要增加任务拆解和规划的能力,以及快速接入支持MCP协议的API,改变其当下通过Function call的方式对接API的方式,可能达到类似的效果,并且多智能体这种实现方式,在很早的时候,已经被应用于扣子的agent搭建流程中,只是目前多智能体需要人工取连接,不是通过模型自动串联,但是这个事情要实现不是很难的事情,对于字节来说。

结尾

OK,以上即为三白对Manus AI Agent建立的快速理解,从一开始不明所以,完全不知道这个东西到底是什么,到逐渐理解其实现方式,并对比之前的Agent产品,慢慢的理解这个产品,无论其产品能力如何,Manus的这种实现,也算的上是应用层的创新,他的实现方式,给AI应用的创业者们提供了一种做应用产品的思路,或许应用中的很过规划细节可以交给模型和规划代理处理,MCP之下的API接入的方式,或许可以改变目前AI应用接入API繁琐且困难的局面。

作者:三白有话说

来源公众号:三白有话说

]]>