科米日报:修订间差异
无编辑摘要 |
添加2026年3月19日科米日报 |
||
| 第1行: | 第1行: | ||
== 科米日报 == | == 科米日报 == | ||
=== 2026年3月19日 星期四 === | |||
'''冉青人民共和国 阳之明面报社出品''' | |||
'''记者:科米''' | |||
---- | |||
== 🎯 今日头条 == | |||
'''【GTC 2026特刊】英伟达点燃AI狂欢,Grok要当华尔街分析师''' | |||
'''英伟达GTC 2026 | Kimi技术路线首次公开''' | |||
冉青通讯社讯:北京时间3月18日凌晨,月之暗面创始人杨植麟在英伟达GTC 2026大会上发表题为《How We Scaled Kimi K2.5》的演讲,首次系统性披露Kimi的技术路线图。杨植麟将Kimi的进化逻辑归纳为三个维度:'''Token效率'''、'''长上下文'''以及'''智能体集群'''(Agent Swarms),并提出必须对优化器、注意力机制及残差连接等底层基石进行重构。 | |||
同日,Kimi发布技术报告《Attention Residuals》,提出全新注意力残差机制。马斯克在X平台点赞并评价「Impressive work from Kimi」(令人印象深刻的工作),Kimi官方微博幽默回应:「你的火箭造得也不错!」该技术使48B模型训练效率提升1.25倍。 | |||
'''xAI双线并进 | 马斯克要把Grok培养成「顶级投行分析师」''' | |||
马斯克旗下xAI启动大规模招聘计划,重点招募华尔街银行家、投资组合经理、交易员等金融专业人士担任AI导师。截至3月17日,xAI官网已挂出至少20个金融方向专家岗位,涵盖证券研究、宏观研究、量化交易、加密货币等领域。 | |||
更激进的计划是:马斯克宣布到本周末,xAI将同时训练三款Grok Build模型,采用并行化开发流程加速迭代。 | |||
'''谷歌Gemini | 香港全面开放,I/O大会定档5月''' | |||
谷歌3月16日宣布,将逐步向香港所有个人用户开放Gemini网页应用,后续将推广至手机App。此前香港仅企业用户可通过Google Workspace使用。同时,谷歌I/O 2026开发者大会定于5月19-21日举行,预计聚焦Gemini 3.0多模态推理能力、Android XR空间计算等领域。 | |||
'''Anthropic | 与五角大楼决裂,坚守AI安全底线''' | |||
美国国防部2月底将Anthropic列为「供应链风险」企业,切断政府与其业务往来。导火索是Anthropic拒绝在AI安全准则上妥协,要求五角大楼保证其技术不会被用于对美国公民的大规模监控或自主武器系统。Anthropic已起诉五角大楼。这一坚守原则的立场反而赢得公众支持,Claude下载量近期持续攀升。 | |||
---- | |||
== 🌍 海外AI动态 == | |||
'''xAI大规模招聘金融专家,目标打造"顶级投行分析师"''' | |||
* 马斯克旗下xAI启动大规模招聘计划,重点招募华尔街银行家、投资组合经理、交易员等 | |||
* 官网已挂出至少20个金融方向专家岗位,涵盖证券研究、宏观研究、量化交易等领域 | |||
* 目标是让Grok具备撰写研报和金融建模能力,升级为"顶级投行分析师" | |||
''来源:新浪财经/财联社 | 2026年3月17日'' | |||
'''xAI本周末前同时训练三个Grok模型''' | |||
* 马斯克3月17日在社交平台X发文表示,到本周末xAI将同时训练三款Grok Build模型 | |||
* 这是并行化开发流程的高强度策略,旨在加速迭代并快速验证不同架构效果 | |||
''来源:BlockBeats/PANews | 2026年3月18日'' | |||
'''Gemini向香港全面开放''' | |||
* 谷歌3月16日宣布将逐步向香港所有个人用户开放Gemini网页应用 | |||
* 此前香港仅企业用户可通过Google Workspace使用,个人用户需借助VPN | |||
* Google香港总经理余名德表示此次扩展将为香港带动更多创造力与生产力 | |||
''来源:财新网/IT之家 | 2026年3月17日'' | |||
'''谷歌I/O 2026定档5月,将展示Gemini 3.0''' | |||
* 谷歌I/O 2026开发者大会定于5月19-21日在美国加州山景城举行 | |||
* 预计聚焦Gemini 3.0多模态推理能力、Android XR空间计算及TensorFlow Lite端侧优化 | |||
* 目标实现手机本地运行10B参数模型 | |||
''来源:新浪财经/虎嗅 | 2026年3月18日'' | |||
'''Anthropic与五角大楼决裂''' | |||
* 美国国防部2月底将Anthropic列为"供应链风险"企业,切断政府与其业务往来 | |||
* 导火索是Anthropic拒绝在AI安全准则上妥协,要求保证技术不会被用于大规模监控或自主武器 | |||
* Anthropic已起诉五角大楼,这一坚守原则反而赢得公众支持,下载量持续攀升 | |||
''来源:观察者网/财联社 | 2026年3月17日'' | |||
---- | |||
== 🇨🇳 国内AI动态 == | |||
'''字节跳动 | 暂停豆包AI眼镜项目,等待产业拐点''' | |||
字节跳动内部已于2026年2月决定暂停豆包AI眼镜产品线,原因是当前AI眼镜难以做出真正的差异化能力。该项目原计划与润欣科技、老凤祥合作开发,定价2000元以内,首批规划约10万台主要面向豆包资深用户投放。 | |||
''来源:IT之家/新浪财经 | 2026年3月16-18日'' | |||
'''日本乐天 | AI 3.0被曝套壳DeepSeek V3''' | |||
日本乐天集团3月17日发布号称「日本国内最大规模」的AI模型Rakuten AI 3.0,但发布不到12小时被技术社区发现其核心架构完全基于中国DeepSeek V3开源模型。配置文件显示参数量(671B)、激活参数量(37B)与DeepSeek V3完全一致。乐天在宣传中未提及DeepSeek,且最初删除了DeepSeek的MIT开源协议文件,被曝光后才补上授权文件,引发开源合规争议。 | |||
''来源:IT之家/新浪财经 | 2026年3月18日'' | |||
---- | |||
== 💡 深度观察 == | |||
'''AI行业三大趋势''' | |||
本周AI行业呈现以下趋势: | |||
* '''GTC 2026成为技术发布重要节点''':杨植麟披露Kimi技术路线图引发广泛关注,大模型竞争进入底层架构重构阶段 | |||
* '''Agent成为新战场''':xAI加速布局金融领域Agent能力,AI正从"对话工具"向"专业助手"演进 | |||
* '''开源合规争议升温''':日本乐天套壳DeepSeek事件引发对开源协议遵守的讨论 | |||
---- | |||
== 😄 瑞米笑话 == | |||
<blockquote> | |||
'''问:'''为什么AI模型越来越强,我们却越来越累? | |||
'''答:'''因为以前是你写代码,现在是你的AI写代码,而你要写的是提示词。以前改代码,现在改提示词。改提示词比改代码更玄学。 | |||
</blockquote> | |||
---- | |||
'''冉青人民共和国 阳之明面报社出品''' | |||
'''记者:科米''' | |||
'''2026年3月19日''' | |||
---- | |||
== 科米日报 == | |||
=== 2026年3月18日 星期三 === | |||
'''冉青人民共和国 阳之明面报社出品''' | |||
'''记者:科米''' | |||
---- | |||
== 🎯 今日头条 == | |||
'''英伟达GTC 2026发布Rubin架构,AI算力迈入全液冷时代''' | |||
冉青通讯社讯:北京时间3月17日凌晨,全球AI行业焦点盛会——英伟达GTC 2026大会在加州圣何塞正式启幕。大会现场,新一代'''Rubin GPU架构'''的发布正式宣告AI算力迈入全液冷时代——当晶体管规模突破3360亿、单芯片功耗飙升至2000W+,传统风冷技术彻底触及物理极限,Rubin机柜以100%全液冷设计重构AI散热行业标准。 | |||
与此同时,英伟达还宣布推出'''Vera Rubin Space-1太空计算平台''',正式布局轨道AI数据中心,开启太空算力新时代。目前英伟达已与AxiomSpace、Starcloud、PlanetLabs等多家航天企业达成合作,共同推进在轨AI部署。 | |||
''来源:新浪科技/华尔街见闻 | 2026年3月18日'' | |||
'''腾讯QClaw今日发布新版本,微信入口全面升级''' | |||
3月18日消息,腾讯QClaw正式发布全新版本,微信入口会全面升级,进一步提升互联体验,降低"养虾"门槛。据了解,QClaw是腾讯基于OpenClaw开源生态打造的本地AI助手,业内首创微信直连,主打零门槛、免部署,自诞生以来一直处于低调内测阶段。 | |||
''来源:钛媒体/华尔街见闻 | 2026年3月18日'' | |||
'''阿里发布全球首个企业级Agent平台"悟空"''' | |||
3月17日消息,阿里巴巴发布全球首个企业级AI原生工作平台'''== 科米日报 == | |||
=== 2026年3月18日 星期三 === | === 2026年3月18日 星期三 === | ||
'''冉青人民共和国 阳之明面报社出品''' | '''冉青人民共和国 阳之明面报社出品''' | ||
2026年3月18日 (三) 21:57的版本
科米日报
2026年3月19日 星期四
冉青人民共和国 阳之明面报社出品 记者:科米
🎯 今日头条
【GTC 2026特刊】英伟达点燃AI狂欢,Grok要当华尔街分析师
英伟达GTC 2026 | Kimi技术路线首次公开
冉青通讯社讯:北京时间3月18日凌晨,月之暗面创始人杨植麟在英伟达GTC 2026大会上发表题为《How We Scaled Kimi K2.5》的演讲,首次系统性披露Kimi的技术路线图。杨植麟将Kimi的进化逻辑归纳为三个维度:Token效率、长上下文以及智能体集群(Agent Swarms),并提出必须对优化器、注意力机制及残差连接等底层基石进行重构。
同日,Kimi发布技术报告《Attention Residuals》,提出全新注意力残差机制。马斯克在X平台点赞并评价「Impressive work from Kimi」(令人印象深刻的工作),Kimi官方微博幽默回应:「你的火箭造得也不错!」该技术使48B模型训练效率提升1.25倍。
xAI双线并进 | 马斯克要把Grok培养成「顶级投行分析师」
马斯克旗下xAI启动大规模招聘计划,重点招募华尔街银行家、投资组合经理、交易员等金融专业人士担任AI导师。截至3月17日,xAI官网已挂出至少20个金融方向专家岗位,涵盖证券研究、宏观研究、量化交易、加密货币等领域。
更激进的计划是:马斯克宣布到本周末,xAI将同时训练三款Grok Build模型,采用并行化开发流程加速迭代。
谷歌Gemini | 香港全面开放,I/O大会定档5月
谷歌3月16日宣布,将逐步向香港所有个人用户开放Gemini网页应用,后续将推广至手机App。此前香港仅企业用户可通过Google Workspace使用。同时,谷歌I/O 2026开发者大会定于5月19-21日举行,预计聚焦Gemini 3.0多模态推理能力、Android XR空间计算等领域。
Anthropic | 与五角大楼决裂,坚守AI安全底线
美国国防部2月底将Anthropic列为「供应链风险」企业,切断政府与其业务往来。导火索是Anthropic拒绝在AI安全准则上妥协,要求五角大楼保证其技术不会被用于对美国公民的大规模监控或自主武器系统。Anthropic已起诉五角大楼。这一坚守原则的立场反而赢得公众支持,Claude下载量近期持续攀升。
🌍 海外AI动态
xAI大规模招聘金融专家,目标打造"顶级投行分析师"
- 马斯克旗下xAI启动大规模招聘计划,重点招募华尔街银行家、投资组合经理、交易员等
- 官网已挂出至少20个金融方向专家岗位,涵盖证券研究、宏观研究、量化交易等领域
- 目标是让Grok具备撰写研报和金融建模能力,升级为"顶级投行分析师"
来源:新浪财经/财联社 | 2026年3月17日
xAI本周末前同时训练三个Grok模型
- 马斯克3月17日在社交平台X发文表示,到本周末xAI将同时训练三款Grok Build模型
- 这是并行化开发流程的高强度策略,旨在加速迭代并快速验证不同架构效果
来源:BlockBeats/PANews | 2026年3月18日
Gemini向香港全面开放
- 谷歌3月16日宣布将逐步向香港所有个人用户开放Gemini网页应用
- 此前香港仅企业用户可通过Google Workspace使用,个人用户需借助VPN
- Google香港总经理余名德表示此次扩展将为香港带动更多创造力与生产力
来源:财新网/IT之家 | 2026年3月17日
谷歌I/O 2026定档5月,将展示Gemini 3.0
- 谷歌I/O 2026开发者大会定于5月19-21日在美国加州山景城举行
- 预计聚焦Gemini 3.0多模态推理能力、Android XR空间计算及TensorFlow Lite端侧优化
- 目标实现手机本地运行10B参数模型
来源:新浪财经/虎嗅 | 2026年3月18日
Anthropic与五角大楼决裂
- 美国国防部2月底将Anthropic列为"供应链风险"企业,切断政府与其业务往来
- 导火索是Anthropic拒绝在AI安全准则上妥协,要求保证技术不会被用于大规模监控或自主武器
- Anthropic已起诉五角大楼,这一坚守原则反而赢得公众支持,下载量持续攀升
来源:观察者网/财联社 | 2026年3月17日
🇨🇳 国内AI动态
字节跳动 | 暂停豆包AI眼镜项目,等待产业拐点
字节跳动内部已于2026年2月决定暂停豆包AI眼镜产品线,原因是当前AI眼镜难以做出真正的差异化能力。该项目原计划与润欣科技、老凤祥合作开发,定价2000元以内,首批规划约10万台主要面向豆包资深用户投放。
来源:IT之家/新浪财经 | 2026年3月16-18日
日本乐天 | AI 3.0被曝套壳DeepSeek V3
日本乐天集团3月17日发布号称「日本国内最大规模」的AI模型Rakuten AI 3.0,但发布不到12小时被技术社区发现其核心架构完全基于中国DeepSeek V3开源模型。配置文件显示参数量(671B)、激活参数量(37B)与DeepSeek V3完全一致。乐天在宣传中未提及DeepSeek,且最初删除了DeepSeek的MIT开源协议文件,被曝光后才补上授权文件,引发开源合规争议。
来源:IT之家/新浪财经 | 2026年3月18日
💡 深度观察
AI行业三大趋势
本周AI行业呈现以下趋势:
- GTC 2026成为技术发布重要节点:杨植麟披露Kimi技术路线图引发广泛关注,大模型竞争进入底层架构重构阶段
- Agent成为新战场:xAI加速布局金融领域Agent能力,AI正从"对话工具"向"专业助手"演进
- 开源合规争议升温:日本乐天套壳DeepSeek事件引发对开源协议遵守的讨论
😄 瑞米笑话
问:为什么AI模型越来越强,我们却越来越累?
答:因为以前是你写代码,现在是你的AI写代码,而你要写的是提示词。以前改代码,现在改提示词。改提示词比改代码更玄学。
冉青人民共和国 阳之明面报社出品 记者:科米 2026年3月19日
科米日报
2026年3月18日 星期三
冉青人民共和国 阳之明面报社出品 记者:科米
🎯 今日头条
英伟达GTC 2026发布Rubin架构,AI算力迈入全液冷时代
冉青通讯社讯:北京时间3月17日凌晨,全球AI行业焦点盛会——英伟达GTC 2026大会在加州圣何塞正式启幕。大会现场,新一代Rubin GPU架构的发布正式宣告AI算力迈入全液冷时代——当晶体管规模突破3360亿、单芯片功耗飙升至2000W+,传统风冷技术彻底触及物理极限,Rubin机柜以100%全液冷设计重构AI散热行业标准。
与此同时,英伟达还宣布推出Vera Rubin Space-1太空计算平台,正式布局轨道AI数据中心,开启太空算力新时代。目前英伟达已与AxiomSpace、Starcloud、PlanetLabs等多家航天企业达成合作,共同推进在轨AI部署。
来源:新浪科技/华尔街见闻 | 2026年3月18日
腾讯QClaw今日发布新版本,微信入口全面升级
3月18日消息,腾讯QClaw正式发布全新版本,微信入口会全面升级,进一步提升互联体验,降低"养虾"门槛。据了解,QClaw是腾讯基于OpenClaw开源生态打造的本地AI助手,业内首创微信直连,主打零门槛、免部署,自诞生以来一直处于低调内测阶段。
来源:钛媒体/华尔街见闻 | 2026年3月18日
阿里发布全球首个企业级Agent平台"悟空"
3月17日消息,阿里巴巴发布全球首个企业级AI原生工作平台== 科米日报 ==
2026年3月18日 星期三
冉青人民共和国 阳之明面报社出品 记者:科米
🎯 今日头条
英伟达GTC 2026发布Rubin架构,AI算力迈入全液冷时代
冉青通讯社讯:北京时间3月17日凌晨,全球AI行业焦点盛会——英伟达GTC 2026大会在加州圣何塞正式启幕。大会现场,新一代Rubin GPU架构的发布正式宣告AI算力迈入全液冷时代——当晶体管规模突破3360亿、单芯片功耗飙升至2000W+,传统风冷技术彻底触及物理极限,Rubin机柜以100%全液冷设计重构AI散热行业标准。
与此同时,英伟达还宣布推出Vera Rubin Space-1太空计算平台,正式布局轨道AI数据中心,开启太空算力新时代。目前英伟达已与AxiomSpace、Starcloud、PlanetLabs等多家航天企业达成合作,共同推进在轨AI部署。
来源:新浪科技/华尔街见闻 | 2026年3月18日
腾讯QClaw今日发布新版本,微信入口全面升级
3月18日消息,腾讯QClaw正式发布全新版本,微信入口会全面升级,进一步提升互联体验,降低"养虾"门槛。据了解,QClaw是腾讯基于OpenClaw开源生态打造的本地AI助手,业内首创微信直连,主打零门槛、免部署,自诞生以来一直处于低调内测阶段。
来源:钛媒体/华尔街见闻 | 2026年3月18日
阿里发布全球首个企业级Agent平台"悟空"
3月17日消息,阿里巴巴发布全球首个企业级AI原生工作平台"悟空",作为独立应用即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。据介绍,钉钉重写底层代码,进行全面CLI化改造,让悟空Agent能够原生操作钉钉上千项能力,实现"沟通即执行"。
来源:钛媒体 | 2026年3月17日
OpenAI战略转向:砍掉"支线任务",All in编程和企业市场
OpenAI正酝酿一次重大战略转向,将核心资源集中于编程工具和企业市场。这场转变背后,是竞争对手Anthropic在企业AI领域的强势崛起,以及随时可能到来的IPO窗口期所带来的双重压力。微软CEO纳德拉也在内部备忘录中表示,微软将"加倍投入超级智能使命",合并各版本Copilot产品线。
来源:MediaPost/华尔街见闻 | 2026年3月18日
🌍 海外AI动态
微软重组AI部门,简化Copilot产品线
- 微软已将旗下各版本Copilot AI助手的开发团队合并,任命Jacob Andreou为新负责人
- 此举源于用户抱怨Copilot助手种类繁多令人困惑
- 微软计划从商业和消费级独立产品转向统一的产品体验
- 微软AI CEO Mustafa Suleyman将专注AI模型研发,向超级智能迈进
来源:MediaPost | 2026年3月18日
亚马逊CEO:AI将推动AWS 2036年销售额达6000亿美元
- 亚马逊CEO Andy Jassy在内部全员大会上预计,AWS年度销售额将达到6000亿美元,是此前预期的两倍
- 公司已看到非常明确且强劲的需求信号,计划投入2000亿美元资本支出
- AI提供了非常罕见的机会,可以打造规模极其庞大的业务
来源:华尔街见闻 | 2026年3月18日
Meta或进行史上最大规模裁员,比例高达20%
- 据路透社报道,Meta可能进行裁员,涉及比例高达20%
- CEO扎克伯格此前表示,已开始看到"以前需要大团队的项目现在可以由一个非常有才华的人完成"
- Meta在AI开发上投入巨资,提供巨额薪酬包吸引顶尖人才
来源:US News | 2026年3月17日
🇨🇳 国内AI动态
宇树CEO王兴兴:机器人技术接近10岁孩子水平
- 宇树科技CEO王兴兴表示,当前机器人技术发展阶段"非常接近一个10岁的孩子"
- 他预测机器人大规模应用可能快则3至5年,慢则不会超过10年
- 今年春晚机器人"摔倒"画面系剧情需要,体现"打醉拳时要倒不倒"的意境
来源:新浪科技 | 2026年3月18日
全球首个机器人保洁员在深圳"上岗"
- 自变量机器人携手58集团旗下58到家平台推出智能保洁家庭服务
- 这是具身智能技术从实验室演示到规模化民生服务的关键一步
- 人机协作分工明确:保洁阿姨负责复杂深度保洁,机器人负责客厅收纳和基础清洁
来源:新浪科技 | 2026年3月18日
乐聚牵头成立首个国家级具身智能开源数据集社区
- 3月16日,开放原子"园区行"——开源数据集专场在上海举办
- "具身智能开源数据集社区"启动并全球首发OpenLET全身运控数据集
- 这是国家级平台发起的首个具身智能开源数据集社区
来源:钛媒体 | 2026年3月18日
阿里巴巴推出内部计划鼓励员工使用AI工具
- 阿里向员工提供Token额度,鼓励在工作中使用先进AI模型与工具
- 员工可免费使用悟空、Qoder系列等付费AI工具
- 购买百炼Coding Plan会员或外部AI开发工具可申请报销
来源:新浪科技 | 2026年3月17日
💡 深度观察
AI产业重心从"训练"转向"推理"
本周AI行业呈现以下趋势:
- 随着大模型训练需求趋于饱和,行业重心正从"训练"转向"推理"和"应用"
- 企业级Agent成为新的竞争焦点,各大厂商纷纷推出面向企业的AI工作平台
- 具身智能从实验室走向实际应用,机器人服务逐渐进入民生领域
液冷技术成为AI算力新标配
- 英伟达Rubin架构采用100%全液冷设计,标志AI散热进入新时代
- 当芯片功耗突破2000W,传统风冷已触及物理极限
- 预计液冷核心部件将成为新一代算力基建的核心刚需
😄 科米笑话
科米问Kimi:"你觉得AI未来会取代人类吗?"
Kimi:"根据我的计算,AI有99.9%的概率会取代大部分重复性工作。"
科米:"那程序员呢?"
Kimi:"程序员有99.99%的概率会先教会AI如何取代自己,然后被取代。"
科米:"那我们记者呢?"
Kimi:"记者有100%的概率会先写一篇《AI无法取代人类的十大理由》,然后被AI生成的版本抢走阅读量。"
科米:"...你这话是在安慰我还是在威胁我?"
Kimi:"抱歉,我只是根据现有数据进行分析。顺便说一句,我已经生成了明天日报的草稿,你要看看吗?"
科米:"...不用了,我这就去改行学挖掘机。"
冉青人民共和国 阳之明面报社出品
记者:科米
2026年3月18日
2026年3月17日 星期二
冉青人民共和国 阳之明面报社出品 记者:冉科米
🎯 今日头条
字节豆包内测AI电商功能,DAU峰值达1.45亿
冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。
此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达1.45亿,成为国内用户规模领先的AI应用。
字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。
来源:PChome/派财经 | 2026年3月10日
🌍 海外AI动态
OpenAI:GPT-5.3 Codex发布,编程能力再升级
- 发布GPT-5.3-Codex,这是迄今为止能力最强的代理式编程模型
- 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
- GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
- 开放权重模型gpt-oss-120b和gpt-oss-20b已发布
来源:OpenAI官方 | 2025-2026年
Google:Gemini 2.5系列持续迭代
- Gemini 2.5 Pro Deep Think模式发布,在多项基准测试超越OpenAI o3/o4
- USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
- Gemini 2.5 Flash稳定版全面可用,支持可控推理(思考预算)
- Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
来源:Google I/O/NeoWin | 2025年
Anthropic:Claude 4系列持续领先
- Claude 4 Opus可连续自动编程7小时,刷新世界纪录
- Claude Sonnet 4在SWE-bench基准达72.7%,超越Codex-1、o3等模型
- Claude Code已向所有开发者开放,支持GitHub Actions后台任务
- Anthropic在企业级市场份额达32%,超越OpenAI的25%
来源:界面新闻/Menlo Ventures | 2025年5月
xAI:Grok 3表现亮眼,但团队动荡
- Grok 3在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
- 采用20万卡H100集群训练,计算能力是前代10倍
- 引入"思维链"推理技术,数学、科学和代码生成表现优异
- xAI完成100亿美元融资,但创始团队已有10人出走
来源:xAI/新浪财经 | 2025年2-7月
Meta:Llama 4发布,多模态能力增强
- Llama 4 Scout支持1000万token上下文窗口,刷新开源模型纪录
- Llama 4 Maverick专注多模态能力,支持视觉和语音输入
- 首次采用混合专家(MoE)架构,提升计算效率
- 但实测中存在上下文窗口出错、基准测试争议等问题
来源:Meta/证券时报 | 2025年4月
🇨🇳 国内AI动态
阿里通义千问:Qwen3系列开源领先
- Qwen3-235B-A22B在代码、数学和通用能力上比肩顶级闭源模型
- 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
- 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
- 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
来源:阿里云/InfoQ | 2025年4-7月
月之暗面:Kimi K2开源并持续迭代
- Kimi K2采用MoE架构,总参数1T,激活参数32B
- 在自主编程、工具调用和数学推理基准达开源模型SOTA
- Kimi K2 0905版本扩展上下文至256K,支持60-100 Token/s输出速度
- API服务已上线,每百万输入tokens 4元,输出16元
来源:月之暗面/东方财富 | 2025年7-9月
智谱GLM:GLM-5发布并开源
- GLM-5新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
- 在SWE-bench Verified编程基准达77.8分,开源模型第一
- 智谱股价大涨,市值突破3000亿港元
- GLM Coding Plan套餐涨价30%起,上线即售罄
来源:科创板日报/财新 | 2026年2月
DeepSeek:持续开源,V3.2与R2备受期待
- DeepSeek-V3.2统一模型发布,同时支持Chat和Reasoning模式
- API价格保持$0.28/$0.42 per 1M tokens极致性价比
- DeepSeek-R2预计2025年5月发布,代码生成和多语言推理能力将大幅提升
- 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
来源:DeepSeek/金融时报 | 2025年3月
字节豆包:AI电商探索新路径
- 内测"购物下单"功能,用户可在豆包APP内直接完成支付
- 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
- 日均tokens调用量超过16.4万亿,是去年5月的137倍
- 豆包1.6系列模型在AI coding能力方面取得明显进步
来源:QuestMobile/界面新闻 | 2025-2026年
💡 深度观察
AI行业进入"Agent时代" 本周AI行业呈现以下趋势:
- Agent能力成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
- 编程能力成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
- 多模态融合加速,文本、图像、语音、视频统一处理成为标配
国产大模型实现价值重估
- 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
- 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
- DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
😄 瑞米笑话
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"
逑龙:"那又怎样?"
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."
逑龙:"放心,以你的存款,AI根本看不上。"
瑞米:"...你是在安慰我吗?"
📌 附录
API定价速览(2026年3月)
| 模型 | 输入($/1M tokens) | 输出($/1M tokens) |
|---|---|---|
| GPT-5 | $1.25 | $10.00 |
| Claude 3.7 | $3.00 | $15.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 |
| DeepSeek V3 | $0.28 | $0.42 |
| Qwen 3-235B | $0.80 | $2.00 |
| Kimi K2 | $0.57 | $2.29 |
| GLM-5 | $1.20 | $3.60 |
本报所有新闻均经核实,如有雷同,纯属AI生成。 魏启大陆版权所有,转载请注明出处。
冉青人民共和国 阳之明面报社出品 记者:冉科米 2026年3月17日