<iframe title="我对2025年AI的判断" src="https://www.youtube.com/embed/J93YIkH_gDA?feature=oembed" height="113" width="200" allowfullscreen="" allow="fullscreen" style="aspect-ratio: 1.76991 / 1; width: 100%; height: 100%;"></iframe> #Agent #AI趋势 #2025预测 #任务引擎 #上下文 ## Key Takeaway - 2025年AI的关键词是Agent,其本质是“任务引擎”,而非简单的“智能体”。 - AI发展将从“信息引擎”阶段(大模型引领)进入“任务引擎”阶段(Agent引领)。 - Chatbot只是Agent的初级形态,未来可能被淘汰,因为其缺乏“上下文”信息,限制了任务完成能力。 - 拥有用户“上下文”的巨头(如Google、Apple)在Agent发展上具有天然优势。 - Agent的产品形态将从“人造形态”(软件/APP封装)发展到“自造形态”(AI自动生成Agent)。 - RAG和Agent是AI原生应用的基础技术,理解它们是把握AI时代的关键。 ## Full Content 2025年,AI的关键词只有一个,就是Agent。不管是搞模型的还是搞应用的,都会把火力集中到Agent这个点上。 单纯比拼模型的阶段已经过去了。注意,我不是说模型不重要了。模型能力肯定还会继续提升。但是,单纯依靠模型去抢市场,早就行不通了。你回顾一下御三家最近这半年的动作就知道了: Anthropic给Claude添加了Artifacts功能,推出了控制电脑能力,还有MCP协议; OpenAI也给ChatGPT加上了类似的canvas功能,还上了搜索,虽然做得不怎么好; Google之前一直很拉跨,最近一次更新直接追平。Gemini的多模态、超长上下文,以及Deep Search功能都非常惊艳。 这三家的动作都是同一个指向、同一个意思:模型即应用。这个应用,就是Agent。 Agent概念,国内吹了得有一年。我看了一圈,好像都没讲明白基本的逻辑,只是停留在“智能体”这个模糊的名字上。我建议大家忘了那些定义,就记住这四个字: 任务引擎。 从底层逻辑来看,AI有一半是在延续互联网的逻辑。 互联网本质上就是信息的组织和分发。从上古时期的雅虎、Google、各种门户,到后来的淘宝、今天的抖音,全都是对各种信息的重新组织、重新分发,最后重新划分地盘。 AI也是这样。大模型能够处理以前难以想象的信息规模,从中提取出有价值的知识和模式。而且,除了文本、图像、视频这些传统形式,AI还可以处理更复杂和抽象的信息,比如知识图谱、语义网络等等。 所以,AI延续了互联网的底层逻辑,继续做信息的组织和分发,而且做得更好。但是,这并不是AI的真正使命。Agent才是AI的真面目。 信息组织和分发侧重于信息的静态方面。而Agent要做的,是对信息进行动态应用,用信息来完成特定任务。 所以我认为,“任务引擎”才是对Agent更准确、更好理解的表述。我特别烦“智能体”这三个字。国内媒体和厂商特别喜欢搞虚头巴脑、说了跟没说一样的概念。 为了方便大家理解,我再做一个提炼和总结: 这一轮AI发展,也就是从GPT-3.5开始的第一阶段,是大模型引领的阶段,特征是“信息引擎”,它是比之前互联网和移动互联网的任何产品都更加强大的“信息引擎”。 从2025年开始,将进入第二阶段,由Agent引领,特征是“任务引擎”。Agent和大模型不是割裂的。正因为有了足够强大的大模型,正因为有了足够强大的“信息引擎”,“任务引擎”才有实现的可能。 OK,理解了Agent,理解了AI发展的底层逻辑之后,下一个问题就来了:Agent长什么样?或者说,它的产品形态是什么样的? 软件和APP都是我们特别熟悉的产品形态。到了AI时代,像ChatGPT一样的聊天机器人会是Agent的标准形态吗? 我认为不是。Chatbot只是最最初级的Agent,甚至这种形态很有可能会被淘汰。 你就想一个问题:Agent要很好地完成任务,最重要的是什么? 就好比一个人一样,要完成领导交代的任务,最关键的是个人能力吗?并不是。最关键的因素是“背景信息”,或者说是“上下文”。 这个任务的前因后果是什么?领导交代这个任务的预期是什么?他的言外之意是什么?如果不搞明白这些,你能力再强有什么用? Agent也是一个道理。你的生成能力很强,那又怎么样呢?真有什么需求的时候,还得先交代一大堆。比如我要写一篇稿子,我得告诉AI:客户需求是这样的,参考资料是这些,等等。而且99%的人根本想不明白也说不明白。我们今天一直在强调的自然语言交互,其实只适合少数人。 正是这些前置条件限制了我们使用Chatbot。你看现在这些产品的数据,每天有多少活跃用户,每天使用几次,就很能反映出问题。 所以,ChatGPT这种形态就好比当年的移动梦网。这个概念,没经历过那个年代的人肯定都没听过。在移动互联网早期,移动梦网就是一个大超市,囊括了短信、彩信,手机上网也就是WAP,以及百宝箱也就是手机游戏在内的各种信息服务。听起来是不是特别像今天的ChatGPT? 而我们都知道,真正让移动互联网爆发和普及的,是今日头条和抖音这种依靠算法推荐的产品形态。AI如果要爆发和普及,同样需要这种适合普罗大众的“傻瓜产品”。这其中最关键的,就是要补上前边说的“上下文”。 这个东西,是OpenAI天生就没有的。谁有?Google有,Apple有,Meta有,腾讯有,阿里有,字节有。 举个例子,大家来想象一下:Chrome浏览器和Gemini彻底打通了。它本来就有我保存的书签、所有浏览记录,对吧?这些就可以作为非常宝贵的上下文信息,让AI版的Chrome给我提供我真正想要的东西。 这就是我为什么说,像ChatGPT一样的聊天机器人只是最最初级的Agent,而且很有可能会被淘汰的原因。OpenAI现在的领先,只是阶段性的。就像当年的移动梦网一样,后来又有谁还记得它呢? OK,理解了“上下文”是Agent的关键之后,再来看产品形态。我认为,Agent会有两种形态,对应两个发展阶段。 第一种形态就是现在的“人造形态”。 ChatGPT是Agent,Perplexity是Agent,Cursor是Agent。现在这些Agent都是人造的,都是我们用软件、用APP的外壳,把Agent给封装进去,从而完成特定的任务,比如搜索和编程。 人造Agent数量不会太多,也只是早期阶段的特色。我估计,最多到2026年,就会进入第二阶段,迎来第二种形态——“自造形态”。 所谓“自造形态”,顾名思义,AI会自动生成Agent。因为每个人的每个需求其实都千奇百怪。非要用软件或者APP的形态去事先提取最大公约数、把它们都框起来,只能满足一部分共通的需求。 当刚才提到的“上下文”全面接入之后,各种个性化的需求就可以变成大大小小的任务。从任务出发,AI可以自主生成相应的Agent去处理。这才是AI时代全面到来的样子。 如果你是做投资的,或者搞开发的,可以好好想想我说的这些。我知道公开做判断、下定论,肯定会有很多人喷。没问题,我特别欢迎大家半年、一年后来挖坟,看看谁对谁错。 过去一年我做的几十期视频,大多数都是关于RAG和Agent的。我当时就说,这两项技术是所有应用的基础。要处理更多相关信息,必须用RAG;要执行各种任务,必须用Agent。而且,让AI自动生成Agent,我之前也有出一期,介绍过这样的技术。没记错的话,应该是用微软的框架。 所以当你一直在关注和实践的话,最终得出本期视频的结论是很自然的。站在今天这个时间点回头看,猛然发现,一切都串起来了,而且指向无比清晰。 OK,不多说了。还是那句话,我是国内少数几个能把AI的WHY和HOW讲明白的博主。想链接我,就来我们newtype社群。那咱们下期见!