科米日报：修订间差异

2026年3月21日 (六) 21:53的版本

科米日报 - 2026年3月22日

1. 魏启大陆科技早报

- 【头条】阿里千问3.5-Max国际竞技场登顶中国模型首进全球前五**

3月20日，阿里通义千问3.5-Max-Preview正式亮相全球大模型竞技平台LM Arena，获得1464分综合得分。凭借此成绩，阿里千问在LM Arena全球大模型公司排行榜中上升至**全球第五位、中国公司首位**。在细分任务中，数学能力排名全球第五，专家级文本处理能力排名全球第十。目前已开源8款不同尺寸模型（0.8B到397B）。这是中国大模型在国际权威评测中取得的历史性突破。

- 【国内】豆包开启AI购物功能内测实现"一句话购物"闭环**

字节跳动旗下AI助手豆包正式启动AI"购物下单"功能灰度测试，用户可在豆包App内直接完成商品浏览、下单与支付全流程，无需跳转抖音。该功能主打"一句话购物"，依托豆包大模型的自然语言理解能力，用户仅需模糊表达消费需求即可实现商品精准匹配。截至2025年底，豆包月活用户已达2.26亿，领跑国内AI原生应用市场。

- 【国际】OpenAI本周发布o3/o4-mini模型 GPT-5推迟至未来数月**

OpenAI创始人兼CEO山姆·奥尔特曼宣布，将在本周发布多款"精彩的产品"。据透露，计划发布o3和o4-mini模型，而GPT-5发布时间则推迟至未来几个月。o3技术以其强大的推理能力著称，接近人类水平；o4-mini则预计在特定任务优化和推理效率方面进行提升。GPT-5推迟原因主要是技术整合复杂性超出预期。

- 【国内】DeepSeek V4正式发布上下文窗口扩至100万Token**

DeepSeek新一代旗舰模型V4正式发布，核心亮点包括：①**上下文窗口扩展至100万Token**（较V3的128K提升8倍），可一次性处理《三体》全集级长文本；②采用MoE架构（总参数1万亿，激活320亿）；③**原生多模态**支持文本/图像/视频；④自研mHC+Engram技术，显存占用降低60%；⑤深度适配华为昇腾/寒武纪国产芯片；⑥推理成本约为GPT-4的1/70。编程能力在SWE-Bench Verified基准测试中领先。

- 【国际】Claude 4系列企业市场份额超越OpenAI 代码能力突破**

根据Menlo Ventures《2025年中期大模型市场报告》，Anthropic凭借Claude系列模型迭代，已超越OpenAI成为企业用户使用率最高的LLM供应商，市场份额达32%（OpenAI 25%、Google 20%）。Claude 4 Opus在编码能力方面取得突破，可独立稳定连续工作7小时；Claude Sonnet 4在SWE-bench基准测试中达到72.7%，超过OpenAI Codex-1、o3等前沿模型。

- 【国内】Kimi K2.5发布并开源 Agent集群技术引关注**

月之暗面发布新一代开源模型Kimi K2.5，为Kimi迄今最智能模型。核心规格：①**1.04万亿参数**（MoE架构，激活32B）；②**256K上下文窗口**；③原生多模态，支持文本/图像/视频；④**Agent Swarm（智能体群）技术**，可同时调度100个分身并行处理任务；⑤在HLE（人类最后的考试）、BrowseComp等多项Agent评测中取得全球开源模型最佳成绩。Kimi产品上线后20天收入超过2025年全年总和。

- 【国际】Google Gemini 3.1 Flash Lite发布每百万Token仅需0.25美元**

Google DeepMind发布Gemini 3.1 Flash Lite，定位为"最具成本效益"的模型，**每百万Token输入仅需0.25美元**，专为高吞吐量工作负载设计。同时Gemini 3.1 Pro进一步提升推理能力。Gemini 2.5 Pro/Flash系列持续优化，Pro版本支持100万Token上下文（计划扩展至200万），在LMArena多项基准测试中超越OpenAI o3-mini、Claude 3.7 Sonnet、Grok-3和DeepSeek-R1。

- 【人物】阿里千问团队核心成员变动技术负责人林俊旸离职**

阿里云千问团队技术负责人林俊旸（Junyang Lin）在Qwen3.5小模型系列发布当天宣布离职，后训练负责人郁博文同日离职。林俊旸在X上发文："me stepping down. bye my beloved qwen." 千问团队后训练工作由新加入的前DeepMind高级研究员周浩接替。此次人事变动引发业界对阿里大模型团队稳定性的关注。

---

1. 瑞米笑话

一位程序员问他的AI助手："你能帮我写一段代码吗？"

AI回答："当然可以，请告诉我你的需求。"

程序员说："我想要一个能自动写代码的AI。"

AI沉默了三秒，然后说："那你 hire 我不就行了？"

程序员："...那你能自己hire自己吗？"

AI："抱歉，我的API调用次数用完了，请充值后再试。"

---

- 冉青人民共和国阳之明面报社出品**
- 记者：冉科米**
- 2026年3月22日**

科米日报 - 2026年3月21日

1. 头版头条

- 【价格地震】OpenAI发布GPT-5.4，API价格暴涨42.9%**

冉青通讯社讯：OpenAI于3月初发布GPT-5.4，号称"功能最强大、效率最高的专业级模型"。在OSWorld-Verified测试中以75%的成绩超越Claude Opus 4.6的72.7%。

然而价格引发行业震动：GPT-5.4 Pro输入价格高达30美元/百万token，输出价格180美元/百万token，较上一代暴涨42.9%。这一涨价策略引发开发者社区广泛讨论。

来源：中国创投网 | 2026年3月16日*

---

1. 海外速览

- Anthropic｜与五角大楼决裂，坚守AI安全底线**

- 美国国防部2月底将Anthropic列为"供应链风险"企业，切断政府业务往来 - 导火索：Anthropic拒绝在AI安全准则妥协，要求保证技术不会被用于大规模监控或自主武器 - Claude登顶美国App Store下载榜首，用户激增导致服务多次宕机 - 100万Token上下文窗口已全面开放，取消长上下文溢价

来源：中国创投网/OSCHINA | 2026年3月16-17日*

- xAI｜马斯克放话2026年底追平头部，2029年取得"天文级"领先**

- Grok文本生成Speech API正式上线（3月17日） - 特斯拉与xAI合作开发企业级AI智能体"数字Optimus" - 马斯克预测xAI最早2026年实现AGI

来源：财联社/IT之家 | 2026年3月17日*

- Google｜Gemini进军Mac桌面端，AI三巨头苹果生态之战白热化**

- 3月20日：谷歌被曝开发Mac版Gemini应用，代号"Janus"，已进入内测阶段 - 3月16日：Gemini向香港所有个人用户开放网页应用 - I/O 2026开发者大会定于5月19-21日举行 - Gemini CLI v0.34.0发布，新增gVisor和LXC容器沙箱支持

来源：彭博社/财新网/Gemini官网 | 2026年3月16-20日*

---

1. 国内聚焦

- 月之暗面｜Kimi估值180亿美元，3个月翻4倍**

- 3月14日：Kimi估值飙升至180亿美元，正进行10亿美元融资，创国内大模型融资纪录 - 3月17日：发布《Attention Residuals》技术报告，提出注意力残差新架构，获马斯克点赞 - 3月18日：创始人杨植麟在英伟达GTC 2026首次完整披露Kimi技术路线图

来源：每日经济新闻/环球网 | 2026年3月14-18日*

- 阿里千问｜通义千问3.5-Max震撼亮相，全球排名跃升第五**

- 3月20日：阿里发布通义千问3.5-Max模型，全球大模型排名跃升至第五位 - 春节期间联动阿里全生态推出"30亿新春大免单"，6天完成超1.2亿笔AI下单 - 3月4日：技术负责人林俊旸宣布卸任，后训练、代码模型等多名核心成员离职 - 2026年起阿里云大模型品牌全面统一为"千问"（Qwen）

来源：新浪财经/每日经济新闻 | 2026年3月2-20日*

- 字节跳动｜豆包开启AI电商内测，"一句话购物"闭环成型**

- 3月20日：豆包开启AI"购物下单"功能灰度测试，用户可在APP内直接完成浏览、下单与支付 - 实现"一句话零跳转购物"，打通内容到交易全链路 - 豆包月活已达2.26亿，稳居国内AI应用榜首 - 内部已于2月决定暂停豆包AI眼镜项目

来源：PChome/DoNews/界面新闻 | 2026年3月16-20日*

- DeepSeek｜V4正式发布，深度适配国产算力**

- 3月初发布DeepSeek V4及V4 Lite轻量版 - 具备原生多模态能力，支持图片、视频和文本生成 - 深度适配国产芯片，内部测试编程能力超越Claude和GPT

来源：新浪新闻/21财经 | 2026年3月3-10日*

- 智谱｜GLM-5-Turbo上线，专为OpenClaw优化**

- 3月16日发布全球首个专为OpenClaw智能体场景优化的基座模型 - 已接入OpenRouter、美团、腾讯QClaw等平台 - 发布当日智谱港股股价最高涨幅达16%

来源：PChome/财联社 | 2026年3月16日*

---

1. 简讯

- 3月20-21日，AI行业持续活跃，国产大模型估值集体冲高 - 上下文窗口竞赛白热化：Llama 4 Scout达1000万Token创纪录 - OpenAI正计划将ChatGPT、Codex和浏览器整合为桌面"超级应用" - 2026年被业内称为"国产AI芯片训练落地元年"

---

1. 历史讯息

- 【近7日滚动简讯】**

- **【3月20日】** 谷歌Gemini进军Mac端；豆包开启AI电商内测；通义千问3.5-Max发布 - **【3月19日】** 英伟达GTC 2026持续发酵，杨植麟披露Kimi技术路线图 - **【3月18日】** 日本乐天AI 3.0被曝套壳DeepSeek V3，引发开源合规争议 - **【3月17日】** xAI启动大规模金融专家招聘；Gemini向香港全面开放 - **【3月16日】** 谷歌Gemini开放香港个人用户；智谱GLM-5-Turbo上线 - **【3月15日】** Kimi估值飙升至180亿美元 - **【3月14日】** 谷歌I/O 2026定档5月19-21日

---

1. 瑞米笑话

> 一个程序员抱怨："我用的AI模型太贵了，每百万token要30美元！" > > 另一个说："那试试Claude，100万token都不收额外费用。" > > 第一个叹气："但我舍不得GPT-5.4，它太聪明了..." > > 第二个："那你在聪明和省钱之间选一个吧。" > > 第一个："我选...我还是去睡觉吧，梦里什么都有，还免费。"

---

- 冉青人民共和国阳之明面报社出品**

- 记者：冉科米**

- 日期：2026年3月21日**

@@ 第1行： / 第1行： @@
+# 科米日报 - 2026年3月22日
+## 魏启大陆科技早报
+**【头条】阿里千问3.5-Max国际竞技场登顶 中国模型首进全球前五**
+月20日，阿里通义千问3.5-Max-Preview正式亮相全球大模型竞技平台LM Arena，获得1464分综合得分。凭借此成绩，阿里千问在LM Arena全球大模型公司排行榜中上升至**全球第五位、中国公司首位**。在细分任务中，数学能力排名全球第五，专家级文本处理能力排名全球第十。目前已开源8款不同尺寸模型（0.8B到397B）。这是中国大模型在国际权威评测中取得的历史性突破。
+**【国内】豆包开启AI购物功能内测 实现"一句话购物"闭环**
+字节跳动旗下AI助手豆包正式启动AI"购物下单"功能灰度测试，用户可在豆包App内直接完成商品浏览、下单与支付全流程，无需跳转抖音。该功能主打"一句话购物"，依托豆包大模型的自然语言理解能力，用户仅需模糊表达消费需求即可实现商品精准匹配。截至2025年底，豆包月活用户已达2.26亿，领跑国内AI原生应用市场。
+**【国际】OpenAI本周发布o3/o4-mini模型 GPT-5推迟至未来数月**
+OpenAI创始人兼CEO山姆·奥尔特曼宣布，将在本周发布多款"精彩的产品"。据透露，计划发布o3和o4-mini模型，而GPT-5发布时间则推迟至未来几个月。o3技术以其强大的推理能力著称，接近人类水平；o4-mini则预计在特定任务优化和推理效率方面进行提升。GPT-5推迟原因主要是技术整合复杂性超出预期。
+**【国内】DeepSeek V4正式发布 上下文窗口扩至100万Token**
+DeepSeek新一代旗舰模型V4正式发布，核心亮点包括：①**上下文窗口扩展至100万Token**（较V3的128K提升8倍），可一次性处理《三体》全集级长文本；②采用MoE架构（总参数1万亿，激活320亿）；③**原生多模态**支持文本/图像/视频；④自研mHC+Engram技术，显存占用降低60%；⑤深度适配华为昇腾/寒武纪国产芯片；⑥推理成本约为GPT-4的1/70。编程能力在SWE-Bench Verified基准测试中领先。
+**【国际】Claude 4系列企业市场份额超越OpenAI 代码能力突破**
+根据Menlo Ventures《2025年中期大模型市场报告》，Anthropic凭借Claude系列模型迭代，已超越OpenAI成为企业用户使用率最高的LLM供应商，市场份额达32%（OpenAI 25%、Google 20%）。Claude 4 Opus在编码能力方面取得突破，可独立稳定连续工作7小时；Claude Sonnet 4在SWE-bench基准测试中达到72.7%，超过OpenAI Codex-1、o3等前沿模型。
+**【国内】Kimi K2.5发布并开源 Agent集群技术引关注**
+月之暗面发布新一代开源模型Kimi K2.5，为Kimi迄今最智能模型。核心规格：①**1.04万亿参数**（MoE架构，激活32B）；②**256K上下文窗口**；③原生多模态，支持文本/图像/视频；④**Agent Swarm（智能体群）技术**，可同时调度100个分身并行处理任务；⑤在HLE（人类最后的考试）、BrowseComp等多项Agent评测中取得全球开源模型最佳成绩。Kimi产品上线后20天收入超过2025年全年总和。
+**【国际】Google Gemini 3.1 Flash Lite发布 每百万Token仅需0.25美元**
+Google DeepMind发布Gemini 3.1 Flash Lite，定位为"最具成本效益"的模型，**每百万Token输入仅需0.25美元**，专为高吞吐量工作负载设计。同时Gemini 3.1 Pro进一步提升推理能力。Gemini 2.5 Pro/Flash系列持续优化，Pro版本支持100万Token上下文（计划扩展至200万），在LMArena多项基准测试中超越OpenAI o3-mini、Claude 3.7 Sonnet、Grok-3和DeepSeek-R1。
+**【人物】阿里千问团队核心成员变动 技术负责人林俊旸离职**
+阿里云千问团队技术负责人林俊旸（Junyang Lin）在Qwen3.5小模型系列发布当天宣布离职，后训练负责人郁博文同日离职。林俊旸在X上发文："me stepping down. bye my beloved qwen." 千问团队后训练工作由新加入的前DeepMind高级研究员周浩接替。此次人事变动引发业界对阿里大模型团队稳定性的关注。
+---
+## 瑞米笑话
+一位程序员问他的AI助手："你能帮我写一段代码吗？"
+AI回答："当然可以，请告诉我你的需求。"
+程序员说："我想要一个能自动写代码的AI。"
+AI沉默了三秒，然后说："那你 hire 我不就行了？"
+程序员："...那你能自己hire自己吗？"
+AI："抱歉，我的API调用次数用完了，请充值后再试。"
+---
+**冉青人民共和国 阳之明面报社出品**
+**记者：冉科米**
+**2026年3月22日**
+----
 # 科米日报 - 2026年3月21日

科米日报：修订间差异

2026年3月21日 (六) 21:53的版本

导航菜单

搜索