我对2025年AI的判断

<iframe title="我对2025年AI的判断" src="https://www.youtube.com/embed/J93YIkH_gDA?feature=oembed" height="113" width="200" allowfullscreen="" allow="fullscreen" style="aspect-ratio: 1.76991 / 1; width: 100%; height: 100%;"></iframe> #Agent #AI趋势 #2025预测 #任务引擎 #上下文 ## Key Takeaway - 2025年AI的关键词是Agent，其本质是“任务引擎”，而非简单的“智能体”。 - AI发展将从“信息引擎”阶段（大模型引领）进入“任务引擎”阶段（Agent引领）。 - Chatbot只是Agent的初级形态，未来可能被淘汰，因为其缺乏“上下文”信息，限制了任务完成能力。 - 拥有用户“上下文”的巨头（如Google、Apple）在Agent发展上具有天然优势。 - Agent的产品形态将从“人造形态”（软件/APP封装）发展到“自造形态”（AI自动生成Agent）。 - RAG和Agent是AI原生应用的基础技术，理解它们是把握AI时代的关键。 ## Full Content 2025年，AI的关键词只有一个，就是Agent。不管是搞模型的还是搞应用的，都会把火力集中到Agent这个点上。单纯比拼模型的阶段已经过去了。注意，我不是说模型不重要了。模型能力肯定还会继续提升。但是，单纯依靠模型去抢市场，早就行不通了。你回顾一下御三家最近这半年的动作就知道了： Anthropic给Claude添加了Artifacts功能，推出了控制电脑能力，还有MCP协议； OpenAI也给ChatGPT加上了类似的canvas功能，还上了搜索，虽然做得不怎么好； Google之前一直很拉跨，最近一次更新直接追平。Gemini的多模态、超长上下文，以及Deep Search功能都非常惊艳。这三家的动作都是同一个指向、同一个意思：模型即应用。这个应用，就是Agent。 Agent概念，国内吹了得有一年。我看了一圈，好像都没讲明白基本的逻辑，只是停留在“智能体”这个模糊的名字上。我建议大家忘了那些定义，就记住这四个字：任务引擎。从底层逻辑来看，AI有一半是在延续互联网的逻辑。互联网本质上就是信息的组织和分发。从上古时期的雅虎、Google、各种门户，到后来的淘宝、今天的抖音，全都是对各种信息的重新组织、重新分发，最后重新划分地盘。 AI也是这样。大模型能够处理以前难以想象的信息规模，从中提取出有价值的知识和模式。而且，除了文本、图像、视频这些传统形式，AI还可以处理更复杂和抽象的信息，比如知识图谱、语义网络等等。所以，AI延续了互联网的底层逻辑，继续做信息的组织和分发，而且做得更好。但是，这并不是AI的真正使命。Agent才是AI的真面目。信息组织和分发侧重于信息的静态方面。而Agent要做的，是对信息进行动态应用，用信息来完成特定任务。所以我认为，“任务引擎”才是对Agent更准确、更好理解的表述。我特别烦“智能体”这三个字。国内媒体和厂商特别喜欢搞虚头巴脑、说了跟没说一样的概念。为了方便大家理解，我再做一个提炼和总结：这一轮AI发展，也就是从GPT-3.5开始的第一阶段，是大模型引领的阶段，特征是“信息引擎”，它是比之前互联网和移动互联网的任何产品都更加强大的“信息引擎”。从2025年开始，将进入第二阶段，由Agent引领，特征是“任务引擎”。Agent和大模型不是割裂的。正因为有了足够强大的大模型，正因为有了足够强大的“信息引擎”，“任务引擎”才有实现的可能。 OK，理解了Agent，理解了AI发展的底层逻辑之后，下一个问题就来了：Agent长什么样？或者说，它的产品形态是什么样的？软件和APP都是我们特别熟悉的产品形态。到了AI时代，像ChatGPT一样的聊天机器人会是Agent的标准形态吗？我认为不是。Chatbot只是最最初级的Agent，甚至这种形态很有可能会被淘汰。你就想一个问题：Agent要很好地完成任务，最重要的是什么？就好比一个人一样，要完成领导交代的任务，最关键的是个人能力吗？并不是。最关键的因素是“背景信息”，或者说是“上下文”。这个任务的前因后果是什么？领导交代这个任务的预期是什么？他的言外之意是什么？如果不搞明白这些，你能力再强有什么用？ Agent也是一个道理。你的生成能力很强，那又怎么样呢？真有什么需求的时候，还得先交代一大堆。比如我要写一篇稿子，我得告诉AI：客户需求是这样的，参考资料是这些，等等。而且99%的人根本想不明白也说不明白。我们今天一直在强调的自然语言交互，其实只适合少数人。正是这些前置条件限制了我们使用Chatbot。你看现在这些产品的数据，每天有多少活跃用户，每天使用几次，就很能反映出问题。所以，ChatGPT这种形态就好比当年的移动梦网。这个概念，没经历过那个年代的人肯定都没听过。在移动互联网早期，移动梦网就是一个大超市，囊括了短信、彩信，手机上网也就是WAP，以及百宝箱也就是手机游戏在内的各种信息服务。听起来是不是特别像今天的ChatGPT？而我们都知道，真正让移动互联网爆发和普及的，是今日头条和抖音这种依靠算法推荐的产品形态。AI如果要爆发和普及，同样需要这种适合普罗大众的“傻瓜产品”。这其中最关键的，就是要补上前边说的“上下文”。这个东西，是OpenAI天生就没有的。谁有？Google有，Apple有，Meta有，腾讯有，阿里有，字节有。举个例子，大家来想象一下：Chrome浏览器和Gemini彻底打通了。它本来就有我保存的书签、所有浏览记录，对吧？这些就可以作为非常宝贵的上下文信息，让AI版的Chrome给我提供我真正想要的东西。这就是我为什么说，像ChatGPT一样的聊天机器人只是最最初级的Agent，而且很有可能会被淘汰的原因。OpenAI现在的领先，只是阶段性的。就像当年的移动梦网一样，后来又有谁还记得它呢？ OK，理解了“上下文”是Agent的关键之后，再来看产品形态。我认为，Agent会有两种形态，对应两个发展阶段。第一种形态就是现在的“人造形态”。 ChatGPT是Agent，Perplexity是Agent，Cursor是Agent。现在这些Agent都是人造的，都是我们用软件、用APP的外壳，把Agent给封装进去，从而完成特定的任务，比如搜索和编程。人造Agent数量不会太多，也只是早期阶段的特色。我估计，最多到2026年，就会进入第二阶段，迎来第二种形态——“自造形态”。所谓“自造形态”，顾名思义，AI会自动生成Agent。因为每个人的每个需求其实都千奇百怪。非要用软件或者APP的形态去事先提取最大公约数、把它们都框起来，只能满足一部分共通的需求。当刚才提到的“上下文”全面接入之后，各种个性化的需求就可以变成大大小小的任务。从任务出发，AI可以自主生成相应的Agent去处理。这才是AI时代全面到来的样子。如果你是做投资的，或者搞开发的，可以好好想想我说的这些。我知道公开做判断、下定论，肯定会有很多人喷。没问题，我特别欢迎大家半年、一年后来挖坟，看看谁对谁错。过去一年我做的几十期视频，大多数都是关于RAG和Agent的。我当时就说，这两项技术是所有应用的基础。要处理更多相关信息，必须用RAG；要执行各种任务，必须用Agent。而且，让AI自动生成Agent，我之前也有出一期，介绍过这样的技术。没记错的话，应该是用微软的框架。所以当你一直在关注和实践的话，最终得出本期视频的结论是很自然的。站在今天这个时间点回头看，猛然发现，一切都串起来了，而且指向无比清晰。 OK，不多说了。还是那句话，我是国内少数几个能把AI的WHY和HOW讲明白的博主。想链接我，就来我们newtype社群。那咱们下期见！