2026 年 1 月 5 日,Google DeepMind 发布 Gemini Reasoner。这是第一个在科学假设生成、因果推断、长程规划等复杂跨模态推理任务上超越人类平均水平的模型。
大家都在说 AI Agent,但"Agent"这个词已经被用烂了。这篇文章用分级框架来评估 Agent 的实际自主能力,从"只会聊天"到"完全自主"。
2026 年 1 月 2 日,Google DeepMind 发布 SIMA-Real,第一个具备实时物理世界交互能力的通用 AI 代理。已在 Boston Dynamics Atlas 机器人上完成开门、取物、避障全流程测试,零样本迁移。
2026 年 1 月 1 日,Meta 发布 Llama4-Swarm,第一个支持上千个 AI 智能体实时协同决策的开源模型。这是开源 AI 协作能力的重大飞跃。
Claude 3.7、GPT-4o、Gemini 2.0 怎么选?这篇文章给一个实用的选型框架。
Prompt Injection 是 LLM 应用最大的安全风险。这篇文章讲清楚怎么防护。