大模型正在吃掉一切

<iframe title="大模型正在吃掉一切" src="https://www.youtube.com/embed/lt6d8kTAzj4?feature=oembed" height="113" width="200" allowfullscreen="" allow="fullscreen" style="aspect-ratio: 1.76991 / 1; width: 100%; height: 100%;"></iframe> #大模型 #OpenAI #Google #Gemini #AI趋势 #创业 ## Key Takeaway - 大模型巨头（OpenAI、Google）的更新正在“吃掉”小厂商和创业者的市场份额。 - OpenAI的GPT-4o通过整合图像生成功能，实现了图文并茂的全新交互体验，拉开了与竞争对手的距离。 - Google的Gemini 2.5 Pro在代码能力和推理能力上显著提升，并具备超大上下文窗口，展现了强大的综合实力。 - 顶级模型正朝着“模型即应用”的方向发展，全面铺开多模态、代码生成、工具调用等能力。 - 文章对AI时代的创业持悲观态度，认为AI的强大和中心化将压缩创业空间，强调人与人之间的关系是AI无法替代的。 ## Full Content 我现在有一种感觉，大模型已经不是小厂商能玩得了的了。每一次大厂的更新，都会吃掉小厂的份额，也会吃掉一批创业者的机会。你看这两天的OpenAI和Google，我要是干这行的，肯定会觉得很心累、很绝望。先是OpenAI。他们更新了GPT模型，把最先进的图像生成功能整合进GPT-4o。结果一夜之间，Twitter上全是用ChatGPT生成的吉卜力风格的图片。不止是用户在玩梗，很多大佬也开始加入了。说实话，这种火爆程度，在AI领域已经有些日子没看到了。奥特曼非常懂传播。因为吉卜力画风本来就有非常广的群众基础。当你把现实的图片转成这种画风之后，那种反转感，特别适合社交媒体传播，想不火都难。而且，OpenAI这个技术不止是图像生成那么简单，它应该是能理解图片的背景信息。因为有网友发现，这张图的左下角，桌上摆着一份《停火协议》，说明GPT知道原图是什么意思。这个就是我在之前那期《逆袭のGemini》里说的：现在AI回答你的问题，可以做到图文并茂。你有什么图片想生成、想修改的，AI可以做到言出法随。这种全新的体验，是之前从未有过的。OpenAI这一次更新，干掉了ComfyUI半壁江山，也再次拉开跟其它厂商的距离。其实郁闷的不止是创业者和小的模型厂商，Google应该也挺不爽的。因为他们在同一时间发布了Gemini 2.5 Pro，结果风头全被抢了。但是有一说一，这个模型非常非常厉害。第一，Gemini 2.5 Pro的代码能力有显著提升，已经接近Claude了。你看，我让它写一个100个小球在球体内反弹的脚本，它很容易就搞定了。第二，Gemini 2.5 Pro的推理能力有显著提升。当推理能力上来之后，加上超大上下文窗口，它给了我一种“全局理解”的惊喜。不管是拿来分析脚本还是翻译PDF，我感觉Gemini 2.5 Pro都比别的模型好使。你看，这个就是今天全球顶级模型该有的样子。这行业早已经过了单纯拼文本生成的阶段了。你会强化学习，我也会。你有思维链，我也有。除此之外，我还有更大的上下文窗口，有原生的多模态，能生成和修改图片，能写代码，能调用工具，甚至还能跟用户实时语音和视频。这么多能力已经全面铺开了。它们只有一个目标，就是把模型变成一个完整的应用。所以，我其实对AI时代的创业一直持悲观态度。因为AI太强大，又太中心化了。创业者的生存空间会比之前互联网时代少得多。那么，有什么是AI无法替代的呢？我认为，最终落脚点只能是人。因为只有人，AI无法替代；也只有人与人之间的关系，AI无法生成。 OK，以上就是本期内容。想了解AI，来我们newtype社群。那咱们下期见！