<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>多模态 - 标签 - Simi Studio</title>
        <link>/tags/%E5%A4%9A%E6%A8%A1%E6%80%81/</link>
        <description>多模态 - 标签 - Simi Studio</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>simi@simi.studio (Simi)</managingEditor>
            <webMaster>simi@simi.studio (Simi)</webMaster><lastBuildDate>Mon, 30 Mar 2026 10:00:00 &#43;0800</lastBuildDate><atom:link href="/tags/%E5%A4%9A%E6%A8%A1%E6%80%81/" rel="self" type="application/rss+xml" /><item>
    <title>Qwen3.5-Omni：阿里在 215 项音视频任务上超越了 Gemini-3.1 Pro</title>
    <link>/posts/qwen-3-5-omni-multimodal/</link>
    <pubDate>Mon, 30 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/qwen-3-5-omni-multimodal/</guid>
    <description><![CDATA[2026 年 3 月 30 日，阿里云发布 Qwen3.5-Omni，在 215 项音视频理解、识别、交互任务中取得 SOTA，超越 Gemini-3.1 Pro。这是国产大模型在多模态领域的重要突破。]]></description>
</item>
<item>
    <title>垂直模型崛起：代码模型、语音模型、图像模型的专业分工</title>
    <link>/posts/specialized-ai-models/</link>
    <pubDate>Sat, 21 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/specialized-ai-models/</guid>
    <description><![CDATA[GPT-4o 和 Claude 3.7 是全能选手，但 2026 年垂直模型在各自领域超越了它们。编程用 Codestral，语音用 GPT-4o Audio，图像用 DALL-E 4。]]></description>
</item>
<item>
    <title>多模态 LLM 成熟了吗：2026 年初的实测</title>
    <link>/posts/multimodal-llm-evolution/</link>
    <pubDate>Tue, 10 Mar 2026 14:30:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/multimodal-llm-evolution/</guid>
    <description><![CDATA[GPT-4o、Gemini 2.0、Claude 3.7 都支持多模态。图片、音频、视频理解到底哪家强？这篇文章实测后给结论。]]></description>
</item>
<item>
    <title>Gemini 3.1 Pro：77.1% ARC-AGI-2，幻觉率从 88% 降到 44%</title>
    <link>/posts/gemini-3-1-pro-arc-agi/</link>
    <pubDate>Fri, 20 Feb 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-3-1-pro-arc-agi/</guid>
    <description><![CDATA[2026 年 2 月 20 日，Google 发布 Gemini 3.1 Pro，在 ARC-AGI-2 上达到 77.1%（是上一代 3.0 Pro 的两倍），同时将幻觉率从 88% 大幅降至 44%。]]></description>
</item>
<item>
    <title>Gemini Reasoner 发布：第一次在复杂推理上超越人类平均</title>
    <link>/posts/gemini-reasoner-analysis/</link>
    <pubDate>Mon, 05 Jan 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gemini-reasoner-analysis/</guid>
    <description><![CDATA[2026 年 1 月 5 日，Google DeepMind 发布 Gemini Reasoner。这是第一个在科学假设生成、因果推断、长程规划等复杂跨模态推理任务上超越人类平均水平的模型。]]></description>
</item>
<item>
    <title>SIMA-Real：第一个能在真实环境中操控机器人的通用 AI 代理</title>
    <link>/posts/sima-real-real-world-ai-agent/</link>
    <pubDate>Fri, 02 Jan 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/sima-real-real-world-ai-agent/</guid>
    <description><![CDATA[2026 年 1 月 2 日，Google DeepMind 发布 SIMA-Real，第一个具备实时物理世界交互能力的通用 AI 代理。已在 Boston Dynamics Atlas 机器人上完成开门、取物、避障全流程测试，零样本迁移。]]></description>
</item>
</channel>
</rss>
