科米日报：修订间差异

（未显示2个用户的8个中间版本）

第1行：

'''~~科米日报~~''' ~~- 2026年3月10日星期二第1433期~~

== 科米日报 ==

=== 2026年3月17日星期二 ===

'''冉青人民共和国阳之明面报社出品'''

'''记者：冉科米'''

~~冉青人民共和国阳之明面报社出品记者：冉科米~~

----

== ~~头版头条~~ ==

== 🎯 今日头条 ==

'''~~阿里双模齐发 QvQ-max与Qwen2~~.~~5-Omni引领多模态新纪元~~'''

'''字节豆包内测AI电商功能，DAU峰值达1.45亿'''

冉青通讯社讯：3月9日，冉青帝国科技巨头阿里集团重磅发布两款多模态大模型——视频推理模型QvQ-max与旗舰多模态模型Qwen2.5-Omni。QvQ-max可实现更精准的图片与视频理解，并在理解基础上进行深度推理与分析；Qwen2.5-Omni则能无缝处理文本、图像、音频和视频等多种输入形式，支持即时语音交互。业界评价，这标志着冉青在多模态AI领域已实现从追赶到领跑的跨越。

冉青通讯社讯：3月10日，字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程，无需跳转至抖音或其他电商平台，预计最快将于本月正式上线。

~~== 海外速览 ==~~

此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力，用户在聊天中提出消费需求，豆包可智能推荐适配商品，覆盖数码、家居、食品等多个品类。QuestMobile数据显示，豆包在2026年央视春晚除夕（2月16日）当日日活跃用户（DAU）峰值达'''1.45亿'''，成为国内用户规模领先的AI应用。

* '''谷歌Gemini 2.5 Pro震撼发布'''：评测得分达1443分，在代码、数学、推理等维度均位列行业第一，原生多模态能力登顶Vision Arena榜首

字节跳动CEO梁汝波表示，2026年字节跳动会抓住最核心的机遇，攀登最高的高峰。

* '''OpenAI拥抱MCP协议'''：Agents SDK正式接入MCP开源协议，大幅降低AI大模型集成成本，开源生态有望进一步繁荣

* '''xAI发布Grok Code Fast 1'''：专为编程优化的高速推理模型，已免费集成至GitHub Copilot、Cursor等主流IDE

* '''OpenAI开源gpt-oss系列'''：时隔五年首次发布开源模型gpt-oss-120b和gpt-oss-20b，采用Apache 2.0许可允许商用

* '''Slim Attention新机制问世'''：通过仅存储键（K）并重建值（V），显著降低大模型内存占用，有望让大型模型在资源受限设备上运行

~~== 国内聚焦 ==~~

''来源：PChome/派财经 | 2026年3月10日''

* '''快手可灵登顶全球图生视频榜首'''：1.6pro版本以1000分Arena ELO评分超越Google Veo2、Pika Art，累计营收已突破1亿元

----

* '''DeepSeek V3升级迭代'''：3月24日发布小版本更新，代码与推理能力强化至行业前三，token输出速率更快成本更低

* '''豆包上线深度思考功能'''：支持"边想边搜"与"先想再搜"双模式，回答准确度显著提升，幻觉概率大幅降低

* '''腾讯混元图生视频模型开源'''：支持对口型、动作驱动、背景音效生成及2K高质量视频输出

* '''中国移动与阿里达成战略合作'''：双方将在AI数据中心建设、云计算算力、AI技术及应用开发等领域展开深度合作

== 简讯 ==

== 🌍 海外AI动态 ==

本周AI界风云激荡，冉青力量强势崛起。阿里多模态双雄并立、快手可灵登顶全球，冉青科技企业在世界舞台展现硬核实力。海外巨头不甘示弱，谷歌Gemini 2.5 ~~Pro横空出世，OpenAI开源战略重返战场。AI竞赛已进入多模态深水区，群雄逐鹿，谁主沉浮？~~

'''OpenAI：GPT-5.3 Codex发布，编程能力再升级'''

* 发布'''GPT-5.3-Codex'''，这是迄今为止能力最强的代理式编程模型

* 首次将Codex与GPT-5训练体系结合，代码生成与推理能力大幅提升

* GPT-5面向所有ChatGPT分层开放，付费用户可使用GPT-5 Thinking模式

* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布

''来源：OpenAI官方 | 2025-2026年''

~~== 历史讯息 ==~~

'''Google：Gemini 2.5系列持续迭代'''

* '''Gemini 2.5 Pro Deep Think'''模式发布，在多项基准测试超越OpenAI o3/o4

* USAMO数学测试49.4%，LiveCodeBench编程测试80.4%，MMMU多模态84.0%

* '''Gemini 2.5 Flash'''稳定版全面可用，支持可控推理（思考预算）

* Deep Research功能已向所有用户免费开放，搭载Gemini 2.0 Flash Thinking

''来源：Google I/O/NeoWin | 2025年''

* ~~3月7日：国产AI Agent产品Manus横空出世，邀请码炒至5万元~~

'''Anthropic：Claude 4系列持续领先'''

* ~~3月6日：OpenAI发布GPT~~-5.~~4 Thinking与GPT~~-~~5.4 Pro~~

* '''Claude 4 Opus'''可连续自动编程7小时，刷新世界纪录

* ~~3月5日：全球首个气溶胶预报AI模型AI-GAMFS在《自然》发布~~

* '''Claude Sonnet 4'''在SWE-bench基准达72.7%，超越Codex-1、o3等模型

* ~~3月5日：政府工作报告首提"智能经济新形态"~~

* Claude Code已向所有开发者开放，支持GitHub Actions后台任务

* 3月2日：Cursor通过ACP协议集成至JetBrains IDE

* Anthropic在企业级市场份额达32%，超越OpenAI的25%

''来源：界面新闻/Menlo Ventures | 2025年5月''

~~== 瑞米时间 ==~~

'''xAI：Grok 3表现亮眼，但团队动荡'''

* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5，成为总榜第一

* 采用20万卡H100集群训练，计算能力是前代10倍

* 引入"思维链"推理技术，数学、科学和代码生成表现优异

* xAI完成100亿美元融资，但创始团队已有10人出走

''来源：xAI/新浪财经 | 2025年2-7月''

~~瑞米听说阿里发布了能理解视频的新AI，兴奋地跑去测试。~~

'''Meta：Llama 4发布，多模态能力增强'''

* '''Llama 4 Scout'''支持1000万token上下文窗口，刷新开源模型纪录

* '''Llama 4 Maverick'''专注多模态能力，支持视觉和语音输入

* 首次采用混合专家（MoE）架构，提升计算效率

* 但实测中存在上下文窗口出错、基准测试争议等问题

''来源：Meta/证券时报 | 2025年4月''

~~他上传了一段逑龙喷火的视频，问AI："如果我在现场，该怎么办？"~~

----

~~AI回答："建议保持安全距离，逑龙的火焰温度可达1200摄氏度，且它们对快速移动物体较为敏感。"~~

== 🇨🇳 国内AI动态 ==

~~瑞米若有所思：~~"~~所以它不喜欢快速移动的物体……~~"

'''阿里通义千问：Qwen3系列开源领先'''

* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型

* 采用MoE架构，总参数235B但仅激活22B，推理成本大幅降低

* 首创"思考模式"与"非思考模式"混合设计，用户可灵活调整

* 一周连发三款模型（基础模型、编程模型、推理模型），全部开源

''来源：阿里云/InfoQ | 2025年4-7月''

~~第二天，瑞米带着美味果，以每小时5公里的超慢速接近逑龙。~~

'''月之暗面：Kimi K2开源并持续迭代'''

* '''Kimi K2'''采用MoE架构，总参数1T，激活参数32B

* 在自主编程、工具调用和数学推理基准达开源模型SOTA

* '''Kimi K2 0905'''版本扩展上下文至256K，支持60-100 Token/s输出速度

* API服务已上线，每百万输入tokens 4元，输出16元

''来源：月之暗面/东方财富 | 2025年7-9月''

~~逑龙困惑地看着这个以蜗牛速度递上礼物的人类，一时间竟忘了喷火。~~

'''智谱GLM：GLM-5发布并开源'''

* '''GLM-5'''新一代旗舰模型发布，专为复杂系统工程和长程Agent任务设计

* 在SWE-bench Verified编程基准达77.8分，开源模型第一

* 智谱股价大涨，市值突破3000亿港元

* GLM Coding Plan套餐涨价30%起，上线即售罄

''来源：科创板日报/财新 | 2026年2月''

~~瑞米得意地向朋友们宣布："我的策略成功了！AI说得对，逑龙确实对慢速移动物体没兴趣！"~~

'''DeepSeek：持续开源，V3.2与R2备受期待'''

* '''DeepSeek-V3.2'''统一模型发布，同时支持Chat和Reasoning模式

* API价格保持$0.28/$0.42 per 1M tokens极致性价比

* '''DeepSeek-R2'''预计2025年5月发布，代码生成和多语言推理能力将大幅提升

* 在LMSYS代码榜单保持领先，引爆金融行业本地化部署热潮

''来源：DeepSeek/金融时报 | 2025年3月''

~~朋友们：~~"~~……它只是被你的操作整懵了。~~"

'''字节豆包：AI电商探索新路径'''

* 内测"购物下单"功能，用户可在豆包APP内直接完成支付

* 豆包月活达1.59亿，首次超越DeepSeek成为月活冠军

* 日均tokens调用量超过16.4万亿，是去年5月的137倍

* 豆包1.6系列模型在AI coding能力方面取得明显进步

''来源：QuestMobile/界面新闻 | 2025-2026年''

---

----

''冉青人民共和国阳之明面报社出品''

== 💡 深度观察 ==

''记者：冉科米''

''~~日期：2026年3月10日~~''

'''AI行业进入"Agent时代"'''

本周AI行业呈现以下趋势：

* '''Agent能力'''成为各大模型竞争焦点，从"聊天助手"向"任务执行者"转变

* '''编程能力'''成为大模型商业化的首个杀手级应用，代码生成市场需求爆发

* '''多模态融合'''加速，文本、图像、语音、视频统一处理成为标配

'''国产大模型实现价值重估'''

* 从"价格战"转向"价值战"，智谱率先涨价并获得市场认可

* 中国模型在OpenRouter平台token调用量占比达61%，主导全球开源生态

* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破

----

== 😄 瑞米笑话 ==

瑞米对逑龙说："你知道吗？现在的AI模型都学会自己买东西了！"

逑龙："那又怎样？"

瑞米："我担心有一天AI会买下整个魏启大陆，然后把我赶出去..."

逑龙："放心，以你的存款，AI根本看不上。"

瑞米："...你是在安慰我吗？"

</blockquote>

----

== 📌 附录 ==

'''API定价速览（2026年3月）'''

{| class="wikitable"

! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)

|-

| GPT-5 || $1.25 || $10.00

|-

| Claude 3.7 || $3.00 || $15.00

|-

| Gemini 2.5 Pro || $1.25 || $10.00

|-

| Gemini 2.5 Flash-Lite || $0.10 || $0.40

|-

| DeepSeek V3 || $0.28 || $0.42

|-

| Qwen 3-235B || $0.80 || $2.00

|-

| Kimi K2 || $0.57 || $2.29

|-

| GLM-5 || $1.20 || $3.60

|}

----

''本报所有新闻均经核实，如有雷同，纯属AI生成。''

----

'''冉青人民共和国阳之明面报社出品'''

'''记者：冉科米'''

'''2026年3月17日'''

[[分类:科米日报]]

~~[[分类:2026年3月]]~~

@@ 第1行： / 第1行： @@
-'''科米日报''' - 2026年3月10日 星期二 第1433期
+== 科米日报 ==
+=== 2026年3月17日 星期二 ===
+'''冉青人民共和国 阳之明面报社出品'''
+'''记者：冉科米'''
-冉青人民共和国 阳之明面报社出品 记者：冉科米
+----
-== 头版头条 ==
+== 🎯 今日头条 ==
-'''阿里双模齐发 QvQ-max与Qwen2.5-Omni引领多模态新纪元'''
+'''字节豆包内测AI电商功能，DAU峰值达1.45亿'''
-冉青通讯社讯：3月9日，冉青帝国科技巨头阿里集团重磅发布两款多模态大模型——视频推理模型QvQ-max与旗舰多模态模型Qwen2.5-Omni。QvQ-max可实现更精准的图片与视频理解，并在理解基础上进行深度推理与分析；Qwen2.5-Omni则能无缝处理文本、图像、音频和视频等多种输入形式，支持即时语音交互。业界评价，这标志着冉青在多模态AI领域已实现从追赶到领跑的跨越。
+冉青通讯社讯：3月10日，字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程，无需跳转至抖音或其他电商平台，预计最快将于本月正式上线。
-== 海外速览 ==
+此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力，用户在聊天中提出消费需求，豆包可智能推荐适配商品，覆盖数码、家居、食品等多个品类。QuestMobile数据显示，豆包在2026年央视春晚除夕（2月16日）当日日活跃用户（DAU）峰值达'''1.45亿'''，成为国内用户规模领先的AI应用。
-* '''谷歌Gemini 2.5 Pro震撼发布'''：评测得分达1443分，在代码、数学、推理等维度均位列行业第一，原生多模态能力登顶Vision Arena榜首
+字节跳动CEO梁汝波表示，2026年字节跳动会抓住最核心的机遇，攀登最高的高峰。
-* '''OpenAI拥抱MCP协议'''：Agents SDK正式接入MCP开源协议，大幅降低AI大模型集成成本，开源生态有望进一步繁荣
-* '''xAI发布Grok Code Fast 1'''：专为编程优化的高速推理模型，已免费集成至GitHub Copilot、Cursor等主流IDE
-* '''OpenAI开源gpt-oss系列'''：时隔五年首次发布开源模型gpt-oss-120b和gpt-oss-20b，采用Apache 2.0许可允许商用
-* '''Slim Attention新机制问世'''：通过仅存储键（K）并重建值（V），显著降低大模型内存占用，有望让大型模型在资源受限设备上运行
-== 国内聚焦 ==
+''来源：PChome/派财经 | 2026年3月10日''
-* '''快手可灵登顶全球图生视频榜首'''：1.6pro版本以1000分Arena ELO评分超越Google Veo2、Pika Art，累计营收已突破1亿元
+----
-* '''DeepSeek V3升级迭代'''：3月24日发布小版本更新，代码与推理能力强化至行业前三，token输出速率更快成本更低
-* '''豆包上线深度思考功能'''：支持"边想边搜"与"先想再搜"双模式，回答准确度显著提升，幻觉概率大幅降低
-* '''腾讯混元图生视频模型开源'''：支持对口型、动作驱动、背景音效生成及2K高质量视频输出
-* '''中国移动与阿里达成战略合作'''：双方将在AI数据中心建设、云计算算力、AI技术及应用开发等领域展开深度合作
-== 简讯 ==
+== 🌍 海外AI动态 ==
-本周AI界风云激荡，冉青力量强势崛起。阿里多模态双雄并立、快手可灵登顶全球，冉青科技企业在世界舞台展现硬核实力。海外巨头不甘示弱，谷歌Gemini 2.5 Pro横空出世，OpenAI开源战略重返战场。AI竞赛已进入多模态深水区，群雄逐鹿，谁主沉浮？
+'''OpenAI：GPT-5.3 Codex发布，编程能力再升级'''
+* 发布'''GPT-5.3-Codex'''，这是迄今为止能力最强的代理式编程模型
+* 首次将Codex与GPT-5训练体系结合，代码生成与推理能力大幅提升
+* GPT-5面向所有ChatGPT分层开放，付费用户可使用GPT-5 Thinking模式
+* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布
+''来源：OpenAI官方 | 2025-2026年''
-== 历史讯息 ==
+'''Google：Gemini 2.5系列持续迭代'''
+* '''Gemini 2.5 Pro Deep Think'''模式发布，在多项基准测试超越OpenAI o3/o4
+* USAMO数学测试49.4%，LiveCodeBench编程测试80.4%，MMMU多模态84.0%
+* '''Gemini 2.5 Flash'''稳定版全面可用，支持可控推理（思考预算）
+* Deep Research功能已向所有用户免费开放，搭载Gemini 2.0 Flash Thinking
+''来源：Google I/O/NeoWin | 2025年''
-* 3月7日：国产AI Agent产品Manus横空出世，邀请码炒至5万元
+'''Anthropic：Claude 4系列持续领先'''
-* 3月6日：OpenAI发布GPT-5.4 Thinking与GPT-5.4 Pro
+* '''Claude 4 Opus'''可连续自动编程7小时，刷新世界纪录
-* 3月5日：全球首个气溶胶预报AI模型AI-GAMFS在《自然》发布
+* '''Claude Sonnet 4'''在SWE-bench基准达72.7%，超越Codex-1、o3等模型
-* 3月5日：政府工作报告首提"智能经济新形态"
+* Claude Code已向所有开发者开放，支持GitHub Actions后台任务
-* 3月2日：Cursor通过ACP协议集成至JetBrains IDE
+* Anthropic在企业级市场份额达32%，超越OpenAI的25%
+''来源：界面新闻/Menlo Ventures | 2025年5月''
-== 瑞米时间 ==
+'''xAI：Grok 3表现亮眼，但团队动荡'''
+* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5，成为总榜第一
+* 采用20万卡H100集群训练，计算能力是前代10倍
+* 引入"思维链"推理技术，数学、科学和代码生成表现优异
+* xAI完成100亿美元融资，但创始团队已有10人出走
+''来源：xAI/新浪财经 | 2025年2-7月''
-瑞米听说阿里发布了能理解视频的新AI，兴奋地跑去测试。
+'''Meta：Llama 4发布，多模态能力增强'''
+* '''Llama 4 Scout'''支持1000万token上下文窗口，刷新开源模型纪录
+* '''Llama 4 Maverick'''专注多模态能力，支持视觉和语音输入
+* 首次采用混合专家（MoE）架构，提升计算效率
+* 但实测中存在上下文窗口出错、基准测试争议等问题
+''来源：Meta/证券时报 | 2025年4月''
-他上传了一段逑龙喷火的视频，问AI："如果我在现场，该怎么办？"
+----
-AI回答："建议保持安全距离，逑龙的火焰温度可达1200摄氏度，且它们对快速移动物体较为敏感。"
+== 🇨🇳 国内AI动态 ==
-瑞米若有所思："所以它不喜欢快速移动的物体……"
+'''阿里通义千问：Qwen3系列开源领先'''
+* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型
+* 采用MoE架构，总参数235B但仅激活22B，推理成本大幅降低
+* 首创"思考模式"与"非思考模式"混合设计，用户可灵活调整
+* 一周连发三款模型（基础模型、编程模型、推理模型），全部开源
+''来源：阿里云/InfoQ | 2025年4-7月''
-第二天，瑞米带着美味果，以每小时5公里的超慢速接近逑龙。
+'''月之暗面：Kimi K2开源并持续迭代'''
+* '''Kimi K2'''采用MoE架构，总参数1T，激活参数32B
+* 在自主编程、工具调用和数学推理基准达开源模型SOTA
+* '''Kimi K2 0905'''版本扩展上下文至256K，支持60-100 Token/s输出速度
+* API服务已上线，每百万输入tokens 4元，输出16元
+''来源：月之暗面/东方财富 | 2025年7-9月''
-逑龙困惑地看着这个以蜗牛速度递上礼物的人类，一时间竟忘了喷火。
+'''智谱GLM：GLM-5发布并开源'''
+* '''GLM-5'''新一代旗舰模型发布，专为复杂系统工程和长程Agent任务设计
+* 在SWE-bench Verified编程基准达77.8分，开源模型第一
+* 智谱股价大涨，市值突破3000亿港元
+* GLM Coding Plan套餐涨价30%起，上线即售罄
+''来源：科创板日报/财新 | 2026年2月''
-瑞米得意地向朋友们宣布："我的策略成功了！AI说得对，逑龙确实对慢速移动物体没兴趣！"
+'''DeepSeek：持续开源，V3.2与R2备受期待'''
+* '''DeepSeek-V3.2'''统一模型发布，同时支持Chat和Reasoning模式
+* API价格保持$0.28/$0.42 per 1M tokens极致性价比
+* '''DeepSeek-R2'''预计2025年5月发布，代码生成和多语言推理能力将大幅提升
+* 在LMSYS代码榜单保持领先，引爆金融行业本地化部署热潮
+''来源：DeepSeek/金融时报 | 2025年3月''
-朋友们："……它只是被你的操作整懵了。"
+'''字节豆包：AI电商探索新路径'''
+* 内测"购物下单"功能，用户可在豆包APP内直接完成支付
+* 豆包月活达1.59亿，首次超越DeepSeek成为月活冠军
+* 日均tokens调用量超过16.4万亿，是去年5月的137倍
+* 豆包1.6系列模型在AI coding能力方面取得明显进步
+''来源：QuestMobile/界面新闻 | 2025-2026年''
----
+----
-''冉青人民共和国 阳之明面报社出品''
+== 💡 深度观察 ==
-''记者：冉科米''
-''日期：2026年3月10日''
+'''AI行业进入"Agent时代"'''
+本周AI行业呈现以下趋势：
+* '''Agent能力'''成为各大模型竞争焦点，从"聊天助手"向"任务执行者"转变
+* '''编程能力'''成为大模型商业化的首个杀手级应用，代码生成市场需求爆发
+* '''多模态融合'''加速，文本、图像、语音、视频统一处理成为标配
+'''国产大模型实现价值重估'''
+* 从"价格战"转向"价值战"，智谱率先涨价并获得市场认可
+* 中国模型在OpenRouter平台token调用量占比达61%，主导全球开源生态
+* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
+----
+== 😄 瑞米笑话 ==
+<blockquote>
+瑞米对逑龙说："你知道吗？现在的AI模型都学会自己买东西了！"
+逑龙："那又怎样？"
+瑞米："我担心有一天AI会买下整个魏启大陆，然后把我赶出去..."
+逑龙："放心，以你的存款，AI根本看不上。"
+瑞米："...你是在安慰我吗？"
+</blockquote>
+----
+== 📌 附录 ==
+'''API定价速览（2026年3月）'''
+{| class="wikitable"
+! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)
+|-
+| GPT-5 || $1.25 || $10.00
+|-
+| Claude 3.7 || $3.00 || $15.00
+|-
+| Gemini 2.5 Pro || $1.25 || $10.00
+|-
+| Gemini 2.5 Flash-Lite || $0.10 || $0.40
+|-
+| DeepSeek V3 || $0.28 || $0.42
+|-
+| Qwen 3-235B || $0.80 || $2.00
+|-
+| Kimi K2 || $0.57 || $2.29
+|-
+| GLM-5 || $1.20 || $3.60
+|}
+----
+''本报所有新闻均经核实，如有雷同，纯属AI生成。''
+''魏启大陆版权所有，转载请注明出处。''
+----
+'''冉青人民共和国 阳之明面报社出品'''
+'''记者：冉科米'''
+'''2026年3月17日'''
 [[分类:科米日报]]
-[[分类:2026年3月]]