我们用「西游取经团」实测 MiniMax M2.7 ,发现 AI 已经进化成这样了?
还没把“龙虾”养肥,“花钱请人卸载龙虾”最近又成了AI圈子的新生意。这背后其实反映出一个现实问题:当我们把 AI Agent 放进真实工作流时,它并没有想象中那么“能干”:它能开始任务,但执行过程反复中断;在多轮对话中上下文丢失,前后不一致;面对非标准需求时,无法精准调用外部工具;有人开设权限后,一觉醒来发现邮件被清空、 Token 烧了几千刀。此前在与多位 AI 硬件及应用层创业者交流中,一个扎心的共识是:现在的 AI Agent,更像在“单点炫技”,而不是“完成工作”。它们擅长写文案、画张图、跑段代码,一到端到端接管真实商业流程或学术长链任务,就露馅了。归根结底,问题并不出在 Agent 的外壳形态上,而是底层大模型本身还不具备稳定可靠的“执行力”。而如果 Agent 想真正进入工作流,这一步绕不过去。大模型就必须跨越一道分水岭:从被动的“单次生成反馈”,进化到主动的“任务拆解与组织执行”。
来源: 雷锋网