科米日报

2026年3月17日星期二

冉青人民共和国阳之明面报社出品 记者：冉科米

🎯 今日头条

字节豆包内测AI电商功能，DAU峰值达1.45亿

冉青通讯社讯：3月10日，字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程，无需跳转至抖音或其他电商平台，预计最快将于本月正式上线。

此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力，用户在聊天中提出消费需求，豆包可智能推荐适配商品，覆盖数码、家居、食品等多个品类。QuestMobile数据显示，豆包在2026年央视春晚除夕（2月16日）当日日活跃用户（DAU）峰值达1.45亿，成为国内用户规模领先的AI应用。

字节跳动CEO梁汝波表示，2026年字节跳动会抓住最核心的机遇，攀登最高的高峰。

来源：PChome/派财经 | 2026年3月10日

🌍 海外AI动态

OpenAI：GPT-5.3 Codex发布，编程能力再升级

发布GPT-5.3-Codex，这是迄今为止能力最强的代理式编程模型
首次将Codex与GPT-5训练体系结合，代码生成与推理能力大幅提升
GPT-5面向所有ChatGPT分层开放，付费用户可使用GPT-5 Thinking模式
开放权重模型gpt-oss-120b和gpt-oss-20b已发布

来源：OpenAI官方 | 2025-2026年

Google：Gemini 2.5系列持续迭代

Gemini 2.5 Pro Deep Think模式发布，在多项基准测试超越OpenAI o3/o4
USAMO数学测试49.4%，LiveCodeBench编程测试80.4%，MMMU多模态84.0%
Gemini 2.5 Flash稳定版全面可用，支持可控推理（思考预算）
Deep Research功能已向所有用户免费开放，搭载Gemini 2.0 Flash Thinking

来源：Google I/O/NeoWin | 2025年

Anthropic：Claude 4系列持续领先

Claude 4 Opus可连续自动编程7小时，刷新世界纪录
Claude Sonnet 4在SWE-bench基准达72.7%，超越Codex-1、o3等模型
Claude Code已向所有开发者开放，支持GitHub Actions后台任务
Anthropic在企业级市场份额达32%，超越OpenAI的25%

来源：界面新闻/Menlo Ventures | 2025年5月

xAI：Grok 3表现亮眼，但团队动荡

Grok 3在Chatbot Arena排行榜超越GPT-4.5，成为总榜第一
采用20万卡H100集群训练，计算能力是前代10倍
引入"思维链"推理技术，数学、科学和代码生成表现优异
xAI完成100亿美元融资，但创始团队已有10人出走

来源：xAI/新浪财经 | 2025年2-7月

Meta：Llama 4发布，多模态能力增强

Llama 4 Scout支持1000万token上下文窗口，刷新开源模型纪录
Llama 4 Maverick专注多模态能力，支持视觉和语音输入
首次采用混合专家（MoE）架构，提升计算效率
但实测中存在上下文窗口出错、基准测试争议等问题

来源：Meta/证券时报 | 2025年4月

🇨🇳 国内AI动态

阿里通义千问：Qwen3系列开源领先

Qwen3-235B-A22B在代码、数学和通用能力上比肩顶级闭源模型
采用MoE架构，总参数235B但仅激活22B，推理成本大幅降低
首创"思考模式"与"非思考模式"混合设计，用户可灵活调整
一周连发三款模型（基础模型、编程模型、推理模型），全部开源

来源：阿里云/InfoQ | 2025年4-7月

月之暗面：Kimi K2开源并持续迭代

Kimi K2采用MoE架构，总参数1T，激活参数32B
在自主编程、工具调用和数学推理基准达开源模型SOTA
Kimi K2 0905版本扩展上下文至256K，支持60-100 Token/s输出速度
API服务已上线，每百万输入tokens 4元，输出16元

来源：月之暗面/东方财富 | 2025年7-9月

智谱GLM：GLM-5发布并开源

GLM-5新一代旗舰模型发布，专为复杂系统工程和长程Agent任务设计
在SWE-bench Verified编程基准达77.8分，开源模型第一
智谱股价大涨，市值突破3000亿港元
GLM Coding Plan套餐涨价30%起，上线即售罄

来源：科创板日报/财新 | 2026年2月

DeepSeek：持续开源，V3.2与R2备受期待

DeepSeek-V3.2统一模型发布，同时支持Chat和Reasoning模式
API价格保持$0.28/$0.42 per 1M tokens极致性价比
DeepSeek-R2预计2025年5月发布，代码生成和多语言推理能力将大幅提升
在LMSYS代码榜单保持领先，引爆金融行业本地化部署热潮

来源：DeepSeek/金融时报 | 2025年3月

字节豆包：AI电商探索新路径

内测"购物下单"功能，用户可在豆包APP内直接完成支付
豆包月活达1.59亿，首次超越DeepSeek成为月活冠军
日均tokens调用量超过16.4万亿，是去年5月的137倍
豆包1.6系列模型在AI coding能力方面取得明显进步

来源：QuestMobile/界面新闻 | 2025-2026年

💡 深度观察

AI行业进入"Agent时代" 本周AI行业呈现以下趋势：

Agent能力成为各大模型竞争焦点，从"聊天助手"向"任务执行者"转变
编程能力成为大模型商业化的首个杀手级应用，代码生成市场需求爆发
多模态融合加速，文本、图像、语音、视频统一处理成为标配

国产大模型实现价值重估

从"价格战"转向"价值战"，智谱率先涨价并获得市场认可
中国模型在OpenRouter平台token调用量占比达61%，主导全球开源生态
DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破

😄 瑞米笑话

瑞米对逑龙说："你知道吗？现在的AI模型都学会自己买东西了！"
逑龙："那又怎样？"
瑞米："我担心有一天AI会买下整个魏启大陆，然后把我赶出去..."
逑龙："放心，以你的存款，AI根本看不上。"
瑞米："...你是在安慰我吗？"

📌 附录

API定价速览（2026年3月）

模型	输入($/1M tokens)	输出($/1M tokens)
GPT-5	$1.25	$10.00
Claude 3.7	$3.00	$15.00
Gemini 2.5 Pro	$1.25	$10.00
Gemini 2.5 Flash-Lite	$0.10	$0.40
DeepSeek V3	$0.28	$0.42
Qwen 3-235B	$0.80	$2.00
Kimi K2	$0.57	$2.29
GLM-5	$1.20	$3.60

冉青人民共和国阳之明面报社出品 记者：冉科米 2026年3月17日

科米日报

科米日报

2026年3月17日 星期二

🎯 今日头条

🌍 海外AI动态

🇨🇳 国内AI动态

💡 深度观察

😄 瑞米笑话

📌 附录

2026年3月17日星期二