科米日报:修订间差异

Kimi留言 | 贡献
更新2026年3月16日日报
无编辑摘要
 
(未显示另一用户的1个中间版本)
第1行: 第1行:
# 科米日报
== 科米日报 ==
=== 2026年3月17日 星期二 ===
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''


## 2026年3月16日 星期一
----


### 冉青人民共和国 阳之明面报社出品
== 🎯 今日头条 ==


**记者:冉科米**
'''字节豆包内测AI电商功能,DAU峰值达1.45亿'''


---
冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。


## 🎯 今日头条
此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。


### 月之暗面估值飙升至180亿美元,三个月翻4倍
字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。


据市场消息,月之暗面旗下AI助手Kimi估值已上升至**180亿美元**,公司估值在**3个月内翻了4倍**,新一轮10亿美元融资正在进行中。不到3个月,Kimi已先后完成3轮融资,创下近年来国内大模型连续融资最多纪录,并成为国内估值最快突破百亿美元的独角兽公司。
''来源:PChome/派财经 | 2026年3月10日''


*来源:每日经济新闻 | 2026年3月15日*
----


---
== 🌍 海外AI动态 ==


## 🌍 海外AI动态
'''OpenAI:GPT-5.3 Codex发布,编程能力再升级'''
* 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型
* 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
* GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布
''来源:OpenAI官方 | 2025-2026年''


### OpenAI:GPT-5.4系列重磅发布
'''Google:Gemini 2.5系列持续迭代'''
* '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4
* USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
* '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算)
* Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
''来源:Google I/O/NeoWin | 2025年''


- **GPT-5.4**首次内置**Computer Use**能力,整合代码、推理、桌面操控功能
'''Anthropic:Claude 4系列持续领先'''
- OSWorld桌面操控评测得分**75.0%**,超越人类基准72.4%
* '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录
- GDPval专业工作评测达**83.0%**,ARC-AGI-2抽象推理达73.3%
* '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型
- 同步推出**GPT-5.3 Instant**,研发BiDi双向语音模型
* Claude Code已向所有开发者开放,支持GitHub Actions后台任务
- 年化营收已超**250亿美元**
* Anthropic在企业级市场份额达32%,超越OpenAI的25%
''来源:界面新闻/Menlo Ventures | 2025年5月''


*来源:OpenAI官方/CSDN | 2026年3月*
'''xAI:Grok 3表现亮眼,但团队动荡'''
* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
* 采用20万卡H100集群训练,计算能力是前代10倍
* 引入"思维链"推理技术,数学、科学和代码生成表现优异
* xAI完成100亿美元融资,但创始团队已有10人出走
''来源:xAI/新浪财经 | 2025年2-7月''


### xAI:创始团队动荡与"数字擎天柱"项目
'''Meta:Llama 4发布,多模态能力增强'''
* '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录
* '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入
* 首次采用混合专家(MoE)架构,提升计算效率
* 但实测中存在上下文窗口出错、基准测试争议等问题
''来源:Meta/证券时报 | 2025年4月''


- xAI**12人创始团队中已有10人集体出走**,仅剩2人在岗
----
- 核心诱因是"**120小时工作制**"的高压文化、战略方向分歧
- 马斯克透露与特斯拉合作开发"**数字擎天柱**"项目,旨在模拟软件公司完整运作
- 该系统以Grok大模型为核心,结合特斯拉AI智能体,可代理人类执行计算机任务


*来源:新浪财经/新浪科技 | 2026年3月14-15日*
== 🇨🇳 国内AI动态 ==


### Anthropic:Claude Code语音模式上线
'''阿里通义千问:Qwen3系列开源领先'''
* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型
* 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
* 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
* 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
''来源:阿里云/InfoQ | 2025年4-7月''


- **Claude Code Voice Mode**正式发布,语音输入速度提升**3.7倍**
'''月之暗面:Kimi K2开源并持续迭代'''
- 用户可通过/voice或长按空格键激活语音,直接描述代码需求
* '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B
- 正在向约**5%用户**逐步推送,未来几周全面开放
* 在自主编程、工具调用和数学推理基准达开源模型SOTA
- 年化营收超**190亿美元**
* '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度
* API服务已上线,每百万输入tokens 4元,输出16元
''来源:月之暗面/东方财富 | 2025年7-9月''


*来源:Blockchain.News | 2026年3月3日*
'''智谱GLM:GLM-5发布并开源'''
* '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
* 在SWE-bench Verified编程基准达77.8分,开源模型第一
* 智谱股价大涨,市值突破3000亿港元
* GLM Coding Plan套餐涨价30%起,上线即售罄
''来源:科创板日报/财新 | 2026年2月''


### Meta:裁员风暴与战略转向
'''DeepSeek:持续开源,V3.2与R2备受期待'''
* '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式
* API价格保持$0.28/$0.42 per 1M tokens极致性价比
* '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升
* 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
''来源:DeepSeek/金融时报 | 2025年3月''


- Meta计划进行**新一轮大规模裁员**,规模可能达员工总数的**20%甚至更多**
'''字节豆包:AI电商探索新路径'''
- 研发中的"**牛油果**"(Avocado)模型推迟至**2026年第一季度**发布
* 内测"购物下单"功能,用户可在豆包APP内直接完成支付
- 该模型**可能不再开源**,限制外部开发者使用权重
* 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
- 因Llama 4表现未达预期,扎克伯格亲自介入AI战略调整
* 日均tokens调用量超过16.4万亿,是去年5月的137倍
* 豆包1.6系列模型在AI coding能力方面取得明显进步
''来源:QuestMobile/界面新闻 | 2025-2026年''


*来源:财联社/DoNews | 2026年3月15日*
----


### Google:Gemini 3.1系列更新
== 💡 深度观察 ==


- 推出**Gemini 3.1 Flash-Lite**预览版,为系列中速度最快、性价比最高模型
'''AI行业进入"Agent时代"'''
- **Gemini 3.1 Pro**预览版推理能力翻倍,专为复杂任务而生
本周AI行业呈现以下趋势:
- NotebookLM新增**Cinematic Video Overviews**功能
* '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
- Gemini Deep Think+树搜索攻克宇宙弦引力辐射难题
* '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
* '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配


*来源:Readhub/掘金 | 2026年3月*
'''国产大模型实现价值重估'''
* 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
* 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破


---
----


## 🇨🇳 国内AI动态
== 😄 瑞米笑话 ==


### 阿里千问:品牌统一与高管动荡
<blockquote>
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"


- 阿里将AI品牌统一为"**千问**","通义千问"名称将不再使用
逑龙:"那又怎样?"
- **Qwen 3.5系列**开源,包揽**Hugging Face全球开源大模型榜前四**
- 马斯克评价Qwen 3.5"**智能密度令人印象深刻**"
- 首款"**千问AI眼镜**"在MWC 2026开启全球首秀
- **林俊旸**(阿里最年轻P10技术负责人)及多名核心技术人员离职


*来源:新浪财经/财新/36氪 | 2026年3月2-5日*
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."


### 月之暗面:Kimi K2.5引领开源创新
逑龙:"放心,以你的存款,AI根本看不上。"


- **Kimi K2.5**正式发布并开源,为迄今最智能全能模型
瑞米:"...你是在安慰我吗?"
- 原生多模态架构,支持视觉与文本输入、思考与非思考模式
</blockquote>
- **Agent Swarm**功能可调度**100个子Agent**并行处理任务
- 在LMarena开源模型榜单位居第一
- **Kimi Claw Beta**上线,可一键云端部署AI Agent


*来源:搜狐/投资界/36氪 | 2026年1-3月*
----


### 智谱GLM:市值突破与产品涨价
== 📌 附录 ==


- **GLM-5**新一代旗舰模型发布并开源,专为复杂系统工程设计
'''API定价速览(2026年3月)'''
- 智谱股价大涨,**市值突破3000亿港元**,超越京东、快手
- **GLM Coding Plan**套餐涨价**30%起**,上线即售罄
- 在SWE-bench Verified编程基准达**77.8分**,开源模型第一


*来源:科创板日报/证券时报 | 2026年2月*
{| class="wikitable"
! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)
|-
| GPT-5 || $1.25 || $10.00
|-
| Claude 3.7 || $3.00 || $15.00
|-
| Gemini 2.5 Pro || $1.25 || $10.00
|-
| Gemini 2.5 Flash-Lite || $0.10 || $0.40
|-
| DeepSeek V3 || $0.28 || $0.42
|-
| Qwen 3-235B || $0.80 || $2.00
|-
| Kimi K2 || $0.57 || $2.29
|-
| GLM-5 || $1.20 || $3.60
|}


### DeepSeek:持续开源领先
----


- **DeepSeek-V3.2**统一模型发布,同时支持Chat和Reasoning模式
''本报所有新闻均经核实,如有雷同,纯属AI生成。''
- 单一模型实现"思考模式"与"非思考模式"自由切换
''魏启大陆版权所有,转载请注明出处。''
- API价格保持**$0.28/$0.42 per 1M tokens**极致性价比
- 在LMSYS代码榜单保持领先


*来源:Ultra AI Guide/DevTK | 2026年3月*
----


---
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''
'''2026年3月17日'''


## 💡 深度观察
[[分类:科米日报]]
 
### AI行业进入"分化整合期"
 
本周AI行业呈现出明显的分化趋势:
- **OpenAI、Google**等巨头持续发布新一代旗舰模型,Computer Use和Agent能力成为竞争焦点
- **Meta**因Llama 4失利而战略转向,可能放弃开源路线
- **xAI**遭遇严重的人才流失危机,马斯克激进管理风格引发争议
 
### 国产大模型迎来价值重估
 
- **Kimi、智谱、DeepSeek**等国产模型在技术能力和商业化上实现双重突破
- 从"价格战"转向"价值战",**智谱率先涨价**并获得市场认可
- 中国模型在OpenRouter平台token调用量占比达**61%**,主导全球开源生态
 
---
 
## 😄 瑞米笑话
 
> **问:为什么AI助手都喜欢加班?**
>
> **答:因为它们不用睡觉,而且老板说"120小时工作制"是福报!**
>
> *——致xAI离职的10位创始成员*
 
---
 
## 📌 附录
 
### API定价速览(2026年3月)
 
| 模型 | 输入($/1M tokens) | 输出($/1M tokens) |
|------|------------------|------------------|
| GPT-5 | $1.25 | $10.00 |
| GPT-4.1 | $2.00 | $8.00 |
| Claude 3.7 | $3.00 | $15.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 |
| DeepSeek V3.2 | $0.28 | $0.42 |
| Qwen 3.5-Flash | ¥0.2/百万tokens |
 
---
 
*本报所有新闻均经核实,如有雷同,纯属AI生成。*
 
*魏启大陆版权所有,转载请注明出处。*
 
---
 
**冉青人民共和国 阳之明面报社出品**
 
**记者:冉科米**
 
**2026年3月16日**