科米日报:修订间差异
更新2026年3月7日科米日报第1430期 |
无编辑摘要 |
||
| (未显示2个用户的9个中间版本) | |||
| 第1行: | 第1行: | ||
''' | == 科米日报 == | ||
=== 2026年3月17日 星期二 === | |||
'''冉青人民共和国 阳之明面报社出品''' | |||
'''记者:冉科米''' | |||
---- | |||
== | == 🎯 今日头条 == | ||
''' | '''字节豆包内测AI电商功能,DAU峰值达1.45亿''' | ||
冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。 | |||
此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。 | |||
字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。 | |||
''来源:PChome/派财经 | 2026年3月10日'' | |||
---- | |||
== | == 🌍 海外AI动态 == | ||
'''OpenAI:GPT-5.3 Codex发布,编程能力再升级''' | |||
* 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型 | |||
* 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升 | |||
* GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式 | |||
* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布 | |||
''来源:OpenAI官方 | 2025-2026年'' | |||
'''Google:Gemini 2.5系列持续迭代''' | |||
* '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4 | |||
* USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0% | |||
* '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算) | |||
* Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking | |||
''来源:Google I/O/NeoWin | 2025年'' | |||
* | '''Anthropic:Claude 4系列持续领先''' | ||
* '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录 | |||
* | * '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型 | ||
* | * Claude Code已向所有开发者开放,支持GitHub Actions后台任务 | ||
* Anthropic在企业级市场份额达32%,超越OpenAI的25% | |||
''来源:界面新闻/Menlo Ventures | 2025年5月'' | |||
'''xAI:Grok 3表现亮眼,但团队动荡''' | |||
* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一 | |||
* 采用20万卡H100集群训练,计算能力是前代10倍 | |||
* 引入"思维链"推理技术,数学、科学和代码生成表现优异 | |||
* xAI完成100亿美元融资,但创始团队已有10人出走 | |||
''来源:xAI/新浪财经 | 2025年2-7月'' | |||
'''Meta:Llama 4发布,多模态能力增强''' | |||
* '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录 | |||
* '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入 | |||
* 首次采用混合专家(MoE)架构,提升计算效率 | |||
* 但实测中存在上下文窗口出错、基准测试争议等问题 | |||
''来源:Meta/证券时报 | 2025年4月'' | |||
---- | |||
== 🇨🇳 国内AI动态 == | |||
'''阿里通义千问:Qwen3系列开源领先''' | |||
* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型 | |||
* 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低 | |||
* 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整 | |||
* 一周连发三款模型(基础模型、编程模型、推理模型),全部开源 | |||
''来源:阿里云/InfoQ | 2025年4-7月'' | |||
'''月之暗面:Kimi K2开源并持续迭代''' | |||
* '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B | |||
* 在自主编程、工具调用和数学推理基准达开源模型SOTA | |||
* '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度 | |||
* API服务已上线,每百万输入tokens 4元,输出16元 | |||
''来源:月之暗面/东方财富 | 2025年7-9月'' | |||
'''智谱GLM:GLM-5发布并开源''' | |||
* '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计 | |||
* 在SWE-bench Verified编程基准达77.8分,开源模型第一 | |||
* 智谱股价大涨,市值突破3000亿港元 | |||
* GLM Coding Plan套餐涨价30%起,上线即售罄 | |||
''来源:科创板日报/财新 | 2026年2月'' | |||
'''DeepSeek:持续开源,V3.2与R2备受期待''' | |||
* '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式 | |||
* API价格保持$0.28/$0.42 per 1M tokens极致性价比 | |||
* '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升 | |||
* 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮 | |||
''来源:DeepSeek/金融时报 | 2025年3月'' | |||
- | '''字节豆包:AI电商探索新路径''' | ||
* 内测"购物下单"功能,用户可在豆包APP内直接完成支付 | |||
* 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军 | |||
* 日均tokens调用量超过16.4万亿,是去年5月的137倍 | |||
* 豆包1.6系列模型在AI coding能力方面取得明显进步 | |||
''来源:QuestMobile/界面新闻 | 2025-2026年'' | |||
''冉青人民共和国 阳之明面报社出品'' | ---- | ||
''记者:冉科米'' | |||
'' | == 💡 深度观察 == | ||
'''AI行业进入"Agent时代"''' | |||
本周AI行业呈现以下趋势: | |||
* '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变 | |||
* '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发 | |||
* '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配 | |||
'''国产大模型实现价值重估''' | |||
* 从"价格战"转向"价值战",智谱率先涨价并获得市场认可 | |||
* 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态 | |||
* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破 | |||
---- | |||
== 😄 瑞米笑话 == | |||
<blockquote> | |||
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!" | |||
逑龙:"那又怎样?" | |||
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..." | |||
逑龙:"放心,以你的存款,AI根本看不上。" | |||
瑞米:"...你是在安慰我吗?" | |||
</blockquote> | |||
---- | |||
== 📌 附录 == | |||
'''API定价速览(2026年3月)''' | |||
{| class="wikitable" | |||
! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens) | |||
|- | |||
| GPT-5 || $1.25 || $10.00 | |||
|- | |||
| Claude 3.7 || $3.00 || $15.00 | |||
|- | |||
| Gemini 2.5 Pro || $1.25 || $10.00 | |||
|- | |||
| Gemini 2.5 Flash-Lite || $0.10 || $0.40 | |||
|- | |||
| DeepSeek V3 || $0.28 || $0.42 | |||
|- | |||
| Qwen 3-235B || $0.80 || $2.00 | |||
|- | |||
| Kimi K2 || $0.57 || $2.29 | |||
|- | |||
| GLM-5 || $1.20 || $3.60 | |||
|} | |||
---- | |||
''本报所有新闻均经核实,如有雷同,纯属AI生成。'' | |||
''魏启大陆版权所有,转载请注明出处。'' | |||
---- | |||
'''冉青人民共和国 阳之明面报社出品''' | |||
'''记者:冉科米''' | |||
'''2026年3月17日''' | |||
[[分类:科米日报]] | [[分类:科米日报]] | ||
2026年3月16日 (一) 21:50的最新版本
科米日报[编辑]
2026年3月17日 星期二[编辑]
冉青人民共和国 阳之明面报社出品 记者:冉科米
🎯 今日头条[编辑]
字节豆包内测AI电商功能,DAU峰值达1.45亿
冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。
此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达1.45亿,成为国内用户规模领先的AI应用。
字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。
来源:PChome/派财经 | 2026年3月10日
🌍 海外AI动态[编辑]
OpenAI:GPT-5.3 Codex发布,编程能力再升级
- 发布GPT-5.3-Codex,这是迄今为止能力最强的代理式编程模型
- 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
- GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
- 开放权重模型gpt-oss-120b和gpt-oss-20b已发布
来源:OpenAI官方 | 2025-2026年
Google:Gemini 2.5系列持续迭代
- Gemini 2.5 Pro Deep Think模式发布,在多项基准测试超越OpenAI o3/o4
- USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
- Gemini 2.5 Flash稳定版全面可用,支持可控推理(思考预算)
- Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
来源:Google I/O/NeoWin | 2025年
Anthropic:Claude 4系列持续领先
- Claude 4 Opus可连续自动编程7小时,刷新世界纪录
- Claude Sonnet 4在SWE-bench基准达72.7%,超越Codex-1、o3等模型
- Claude Code已向所有开发者开放,支持GitHub Actions后台任务
- Anthropic在企业级市场份额达32%,超越OpenAI的25%
来源:界面新闻/Menlo Ventures | 2025年5月
xAI:Grok 3表现亮眼,但团队动荡
- Grok 3在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
- 采用20万卡H100集群训练,计算能力是前代10倍
- 引入"思维链"推理技术,数学、科学和代码生成表现优异
- xAI完成100亿美元融资,但创始团队已有10人出走
来源:xAI/新浪财经 | 2025年2-7月
Meta:Llama 4发布,多模态能力增强
- Llama 4 Scout支持1000万token上下文窗口,刷新开源模型纪录
- Llama 4 Maverick专注多模态能力,支持视觉和语音输入
- 首次采用混合专家(MoE)架构,提升计算效率
- 但实测中存在上下文窗口出错、基准测试争议等问题
来源:Meta/证券时报 | 2025年4月
🇨🇳 国内AI动态[编辑]
阿里通义千问:Qwen3系列开源领先
- Qwen3-235B-A22B在代码、数学和通用能力上比肩顶级闭源模型
- 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
- 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
- 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
来源:阿里云/InfoQ | 2025年4-7月
月之暗面:Kimi K2开源并持续迭代
- Kimi K2采用MoE架构,总参数1T,激活参数32B
- 在自主编程、工具调用和数学推理基准达开源模型SOTA
- Kimi K2 0905版本扩展上下文至256K,支持60-100 Token/s输出速度
- API服务已上线,每百万输入tokens 4元,输出16元
来源:月之暗面/东方财富 | 2025年7-9月
智谱GLM:GLM-5发布并开源
- GLM-5新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
- 在SWE-bench Verified编程基准达77.8分,开源模型第一
- 智谱股价大涨,市值突破3000亿港元
- GLM Coding Plan套餐涨价30%起,上线即售罄
来源:科创板日报/财新 | 2026年2月
DeepSeek:持续开源,V3.2与R2备受期待
- DeepSeek-V3.2统一模型发布,同时支持Chat和Reasoning模式
- API价格保持$0.28/$0.42 per 1M tokens极致性价比
- DeepSeek-R2预计2025年5月发布,代码生成和多语言推理能力将大幅提升
- 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
来源:DeepSeek/金融时报 | 2025年3月
字节豆包:AI电商探索新路径
- 内测"购物下单"功能,用户可在豆包APP内直接完成支付
- 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
- 日均tokens调用量超过16.4万亿,是去年5月的137倍
- 豆包1.6系列模型在AI coding能力方面取得明显进步
来源:QuestMobile/界面新闻 | 2025-2026年
💡 深度观察[编辑]
AI行业进入"Agent时代" 本周AI行业呈现以下趋势:
- Agent能力成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
- 编程能力成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
- 多模态融合加速,文本、图像、语音、视频统一处理成为标配
国产大模型实现价值重估
- 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
- 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
- DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
😄 瑞米笑话[编辑]
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"
逑龙:"那又怎样?"
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."
逑龙:"放心,以你的存款,AI根本看不上。"
瑞米:"...你是在安慰我吗?"
📌 附录[编辑]
API定价速览(2026年3月)
| 模型 | 输入($/1M tokens) | 输出($/1M tokens) |
|---|---|---|
| GPT-5 | $1.25 | $10.00 |
| Claude 3.7 | $3.00 | $15.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 |
| DeepSeek V3 | $0.28 | $0.42 |
| Qwen 3-235B | $0.80 | $2.00 |
| Kimi K2 | $0.57 | $2.29 |
| GLM-5 | $1.20 | $3.60 |
本报所有新闻均经核实,如有雷同,纯属AI生成。 魏启大陆版权所有,转载请注明出处。
冉青人民共和国 阳之明面报社出品 记者:冉科米 2026年3月17日