困扰养虾人最大的问题,第一是 Token 太费钱,第二是长程任务不靠谱。
把 OpenClaw 扔进一个需要跨越 24 小时以上的长程任务里,中间撒手不管,结果往往并不乐观。
要么是 Token 烧完了事情只干了一半,要么是某一步走偏之后一路错到黑,交回来的东西完全不能用。
Meta 安全对齐总监 Summer Yue 的邮箱被 OpenClaw 一夜清空的故事,也是「经典咏流传」。
更早之前,还有不止一个 Agent 把敏感公司数据泄露给无权限员工的案例。
越聪明的单体智能,一旦被放进更长的时间维度和更复杂的协作链条里,就越容易在关键节点掉链子。
这就像一个 IQ 很高但没人管的实习生,前半小时让人惊艳,后半小时就开始自己给自己出难题。
行业里的人开始意识到,光让模型变聪明不够,还得有个东西来管它怎么用自己的聪明。
放到 AI 语境里,它指的是连接「模型(马匹)」和「人类需求(骑手)」的那套控制框架。
它不参与任务执行本身,也不让自己变得更聪明,但它决定这匹马往哪里跑、跑多快、什么时候该停下来。
但背后的道理其实很好理解,自主权越大的东西越容易跑偏,所以给它套上足够好的马具,它反而能跑得更远。
对普通用户来说,接下来半年到一年里大概率会冒出一批新的 AI 产品,不再强调自己的模型有多大,而是强调自己会「驯服」模型。
天使轮由创新工场和 Atypical Ventures 联合领投,奇绩创坛继续跟投,参投方还包括原微软全球副总裁 David Ku 等个人投资者。
真正让业内人停下来多看一眼的,是它的投资人名单,陆奇和李开复罕见同框、同步押注同一家 Agent 初创公司。
两位被称作 AI 圈风向标的人一起出现在一家只成立了一个季度的公司的股东名单上,这件事本身就是信号。
2022 年底,Transformer 架构的潜力刚刚被外界彻底看懂,李笛在小冰内部提出一件事,尽快采购 GPU,加速训练更大规模的模型。
2023 年 2 月,李笛的团队推出了一个叫小冰链(X-CoTA)的项目。
现在回头看,小冰链干的事几乎就是后来震动整个行业的 CoT(思维链),让模型在给出答案之前先「想一段话」,把推理过程显化出来。
小冰链仅用了 GPT-3 约 2% 的参数量,就实现了可观测、可追溯的思维链构建。
到了 2023 年底,小冰在日本的业务做得不错,账上有钱,团队又提出要做推理模型,这个方向在当时的决策框架里再次被否掉。
李笛后来在公开访谈里把这件事称作「到今天为止唯一一次深深的遗憾」,原话大意是,丢掉的不只是一个项目,是一年半到两年的时间。
基础模型、思维链、推理能力,每一颗都精准地对上了后来几轮行业爆发的方向。
2025 年 12 月 9 日,李笛带着微软小冰的创始核心团队成立了明日新程。
李笛团队内部梳理过 1800 年到 2020 年整整 220 年的人类学术文献,目的只有一个,搞清楚人类社会作为一个群体智能系统,是怎么一步步形成大规模高级认知协同的。
用户抛出一个问题之后,几十个 Agent 会「围坐一桌」,各自从不同视角切入、彼此补充、辩论交锋,中间还有投票表决和同行评审这样的专业环节。
但团子跑下来的数据是,在达到同等思考深度的情况下,整体 Token 消耗反而降低 50% 以上。
传统的多智能体架构,在环节越多、节点分支越广的时候,上下文会被一层一层带着走、复制、再传下去,Token 消耗呈指数级增长。
辩论、质疑、反思、投票这些动作的目的不是让信息发散,而是让它在每一层里先收敛一次再往下传。
一个开得好的会,不只是让所有人说完所有的话,更是要让大家吵完之后收敛出一个共识,带着这个共识进入下一个议题。
团子的智能深度评测(IDI)指标,在长程多智能体协同、高难度研究任务和大规模群体仿真这三个场景下,均显著高于包括 GPT-5.2 Thinking 在内的单一大模型。
李笛在最近一次访谈中透露,团队正在全力打造一款形态接近「小冰岛」的新产品。
由于知识产权限制,它不会再叫这个名字,但理念内核是一致的,采用了完全不同的新技术架构。
它最初的设计理念,是围绕每一个具体的人,观察究竟配一群怎样的 AI 才是最合适的。
有人需要工作支持加情感陪伴,有人更需要理性决策辅助,每个人的「最优 AI 阵容」本来就不该是一样的。
按当年的技术能力,这个信息要么被粗暴地广播给岛上所有 AI,所有人一起过来安慰,用户反而尴尬;
要么只被这一个 AI 知道,其他 AI 完全没有上下文,无法形成真正的情感支持网络。
问题不出在单个 AI 是不是聪明,而是出在这群 AI 之间有没有一套合理的协同机制,知道什么信息该传、传给谁、什么时候传。
按李笛自己的描述,新产品里的 Agent 会具备这种「智能判断」,每一次用户的交互,都会在 Agent 群体里产生合理的涟漪,而不是要么全员轰炸要么全员静默。
对普通用户来说,这件事的吸引力其实可以翻译成一句大白话,每个人都能拥有一支属于自己的 AI 小分队。
这支小分队里的成员各有分工,彼此之间知道怎么配合,能完成长时间跨度的复杂任务。
最近流行一个词叫 OPC(一人公司),外人听上去像科技播客里的空中楼阁。
要让一个人真正拥有一家公司的执行力,光有一个聊天机器人远远不够,得有一整个能自主协作的团队。
群体智能加上 Harness 架构,第一次让这件事有了可实际上手的底座。
按官方说法,如果用户已经养了一只「龙虾」,只需要一句话就能让它加入这个 Agent 群体,成为小分队里的一个特种兵。
这种开放性很关键,产品不是要用户重新学一套生态,而是可以把手里已有的工具直接纳进来。
但理念层面能看出来,明日新程的思路是先把底层的协同机制做扎实,再让用户在这个底座上搭出自己的个性化 Agent 群体,而不是上来就塞一个大而全的超级助理。
把时间轴拉长一点看,这一轮围绕 Harness 和群体智能的集体转向,其实是在回答一个更大的问题。
这条路径现在仍然在走,但越来越多的人开始意识到,真正的瓶颈也许不在单体能力,而在协同结构。
人类社会能持续产出价值几千年,靠的也不是某个超级大脑,而是大量普通大脑之间找到了一套「吵架也能吵出共识」的机制。
这个转向对普通用户的意义也许还没到立刻可感的地步,但它已经在悄悄改变接下来一两年里所有 AI 产品的底层逻辑。
回到开头那个问题,为什么超级聪明的单体 Agent 一遇到长程任务就拉胯。
答案现在看起来清楚了一些,单体本来就不是为长程任务设计的,长程任务需要的是一个群体,以及一套让这个群体不至于陷入「群体迷思」或「群体愚蠢」的协同框架。
本文来自微信公众号“新智元”,作者:新智元,编辑:艾伦,36氪经授权发布。
△香港,民众在室外吸烟(资料图)香港特区政府卫生署表示,从4月30日起,香港将禁止任何人在公众场所持有另类吸烟产品(如电子烟、草本烟和加热烟)。消费者即使只是随身携带没有吸食,同样违法,一旦被查获,最低罚款3000港元,最高可被罚款5万港元及监禁6个月。
2026年4月16日,河南省南阳市中级人民法院遵照最高人民法院下达的执行死刑命令,对余金生执行死刑。南阳市人民检察院依法派员临场监督。执行前,余金生与其近亲属进行了会见。
4月14日,“河南54岁班主任猥亵15岁女生被行拘10日,家长希望追究刑责;县教体局称已降级做后勤”一事报道后,引发关注。4月15日,华商报大风新闻记者获悉,光山县公安局重新组织专案组,对该案全面核查。后续将根据核查结果,认定该案是否构成刑事案件,最迟4月16日出结果。
江苏证监局紧急提示:警惕境内公司以在香港“伪交易所”挂牌为名实施非法金融活动
来源:江苏新闻 近期,有不法中介宣称境内公司只需缴纳一笔费用就能在香港交易所“挂牌”“敲锣”,提供股权代码、网站公示等“挂牌”服务,挂牌后企业价值将得以“变现”。此类交易所多为“伪交易所”,通过高仿网站、官方标识,伪造上市“敲锣仪式”等方式包装虚假平台,迷惑普通投资者。
香港14岁男学生成黑社会成员,收取36.6港币红包逼同学入会,警方:该团伙涉嫌经营赌场,清洗近1000万港元
4月13日至14日,香港东区警区刑事部连同特别职务队展开“反三合会”执法行动,通过情报搜集锁定了一个活跃于香港北角区的黑社会,一共拘捕18人(15男3女),包括该团伙头目及成员,年龄从14岁至57岁,分别涉嫌洗黑钱、经营赌场、在赌博场所内赌博、刑事恐吓及煽惑他人成为“三合会”会员
特朗普封锁霍尔木兹!想掐断伊朗和中国的生命线号,特朗普又在社交平台上“放狠话”了,一句话直接搅乱了全球市场:美国海军要封锁霍尔木兹海峡,凡是进出伊朗港口的船,一律拦下来!
这组数据不是中国人自己吹的,是金刻羽在2025年底的《财经》年会上,当着一屋子投资人和学者的面,拿学术论文的数据说的。
文 Note编辑 远观者Note扛不住了?在对华问题上,巴拿马总统一反常态,做出了让所有人意外的表态。近日,巴拿马外长马丁内斯-阿查毫无根据地指控中国增加对巴拿马籍船只的检查是“政治报复”,并扬言要“以牙还牙”。
阅读须知:本文内容所有信息和数据,均为作者查阅官方信息和网络已知数据整合解析,旨在让读者更清晰了解相应信息,如有数据错误或观点有误,请文明评论,作者积极改正!