<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>Gemini - 标签 - Simi Studio</title>
        <link>/tags/gemini/</link>
        <description>Gemini - 标签 - Simi Studio</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>simi@simi.studio (Simi)</managingEditor>
            <webMaster>simi@simi.studio (Simi)</webMaster><lastBuildDate>Tue, 10 Mar 2026 14:30:00 &#43;0800</lastBuildDate><atom:link href="/tags/gemini/" rel="self" type="application/rss+xml" /><item>
    <title>多模态 LLM 成熟了吗：2026 年初的实测</title>
    <link>/posts/multimodal-llm-evolution/</link>
    <pubDate>Tue, 10 Mar 2026 14:30:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/multimodal-llm-evolution/</guid>
    <description><![CDATA[GPT-4o、Gemini 2.0、Claude 3.7 都支持多模态。图片、音频、视频理解到底哪家强？这篇文章实测后给结论。]]></description>
</item>
<item>
    <title>Computer Use Agent 盘点：Claude、GPT-4o、Gemini 谁操作电脑最强</title>
    <link>/posts/computer-use-agent-analysis/</link>
    <pubDate>Sun, 01 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/computer-use-agent-analysis/</guid>
    <description><![CDATA[Computer Use（让 AI 直接操控电脑）是 2026 年最火的方向。Anthropic、OpenAI、Google 都出了方案。这篇文章横向对比实测结果。]]></description>
</item>
<item>
    <title>Gemini 3.1 Pro：77.1% ARC-AGI-2，幻觉率从 88% 降到 44%</title>
    <link>/posts/gemini-3-1-pro-arc-agi/</link>
    <pubDate>Fri, 20 Feb 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-3-1-pro-arc-agi/</guid>
    <description><![CDATA[2026 年 2 月 20 日，Google 发布 Gemini 3.1 Pro，在 ARC-AGI-2 上达到 77.1%（是上一代 3.0 Pro 的两倍），同时将幻觉率从 88% 大幅降至 44%。]]></description>
</item>
<item>
    <title>Gemini 3 Deep Think：84.6% 碾压 ARC-AGI-2，离 AGI 红线只差一步</title>
    <link>/posts/gemini-3-deep-think-arc-agi/</link>
    <pubDate>Fri, 13 Feb 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-3-deep-think-arc-agi/</guid>
    <description><![CDATA[2026 年 2 月 13 日，Google 发布 Gemini 3 的 Deep Think 模式，在 ARC-AGI-2 推理测试中达到 84.6%，距离 ARC Prize 定的「强 AGI 信号」红线 85% 只差 0.4%。]]></description>
</item>
<item>
    <title>Gemini 2.0 Flash Thinking：Google 的编程能力怎么样</title>
    <link>/posts/gemini-2-analysis/</link>
    <pubDate>Thu, 05 Feb 2026 10:30:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-2-analysis/</guid>
    <description><![CDATA[Google Gemini 2.0 推出了 Flash Thinking 模式，在编程任务上表现如何？这篇文章实测后给一个客观评价。]]></description>
</item>
<item>
    <title>Gemini Reasoner 发布：第一次在复杂推理上超越人类平均</title>
    <link>/posts/gemini-reasoner-analysis/</link>
    <pubDate>Mon, 05 Jan 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-reasoner-analysis/</guid>
    <description><![CDATA[2026 年 1 月 5 日，Google DeepMind 发布 Gemini Reasoner。这是第一个在科学假设生成、因果推断、长程规划等复杂跨模态推理任务上超越人类平均水平的模型。]]></description>
</item>
<item>
    <title>LLM 选型指南：Claude vs GPT-4o vs Gemini 选哪个</title>
    <link>/posts/ai-model-selection-guide/</link>
    <pubDate>Sat, 27 Dec 2025 09:40:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/ai-model-selection-guide/</guid>
    <description><![CDATA[Claude 3.7、GPT-4o、Gemini 2.0 怎么选？这篇文章给一个实用的选型框架。]]></description>
</item>
<item>
    <title>LLM Context Window 竞赛：一场没有终点的马拉松</title>
    <link>/posts/llm-context-window-arms-race/</link>
    <pubDate>Sun, 15 Oct 2023 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/llm-context-window-arms-race/</guid>
    <description><![CDATA[2023 年中，Claude 把 context window 做到了 200k，GPT-4 8k/32k，Gemini 1M。一时间 context window 大小成了评判模型的指标。这篇文章解释 context window 为何重要，以及真实场景里你能不能用满 200k tokens。]]></description>
</item>
</channel>
</rss>
