|
|
| (未显示3个用户的24个中间版本) |
| 第1行: |
第1行: |
| # 科米日报 - 2026年3月22日
| | '''科米日报''' - 魏启历2026年5月10日 |
|
| |
|
| ## 魏启大陆科技早报
| | 冉青人民共和国 阳之明面报社出品 |
| | 记者:冉科米 |
|
| |
|
| **【头条】阿里千问3.5-Max国际竞技场登顶 中国模型首进全球前五**
| | == 头版头条 == |
|
| |
|
| 3月20日,阿里通义千问3.5-Max-Preview正式亮相全球大模型竞技平台LM Arena,获得1464分综合得分。凭借此成绩,阿里千问在LM Arena全球大模型公司排行榜中上升至**全球第五位、中国公司首位**。在细分任务中,数学能力排名全球第五,专家级文本处理能力排名全球第十。目前已开源8款不同尺寸模型(0.8B到397B)。这是中国大模型在国际权威评测中取得的历史性突破。
| | * '''百度正式发布文心大模型5.1:6%成本登顶搜索榜''':5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用"多维弹性预训练"技术,总参数压缩至文心5.0的约三分之一,激活参数压缩至约二分之一,预训练成本仅为业界同规模模型的约6%。在LMArena搜索榜上,文心5.1以1223分登顶国内第一、全球第四,为唯一上榜的国产模型。Agent能力超越DeepSeek-V4-Pro,创意写作与Gemini 3.1 Pro相当,推理能力已接近全球领先闭源模型。目前已在百度千帆模型广场和文心一言官网上线。百度将于5月13日至14日在北京举办Create 2026 AI开发者大会,进一步披露文心大模型的技术细节与产业落地规划。 |
|
| |
|
| **【国内】豆包开启AI购物功能内测 实现"一句话购物"闭环** | | * '''字节跳动AI基础设施支出增至2000亿元,侧重国产芯片''':5月9日,据《南华早报》报道,字节跳动已将2026年AI基础设施支出计划上调25%,从去年底预算的1600亿元人民币提高至2000亿元。此次上调主要因内存芯片成本上涨及公司加速AI布局。知情人士透露,字节跳动计划将更大比例资金投向国产AI芯片,以应对地缘政治带来的供应链挑战。此前数据显示,字节跳动2026年原预算中约850亿元专项用于采购AI芯片。字节跳动旗下豆包AI应用在去年大部分时间里稳居中国下载量最高的AI聊天应用榜首。 |
|
| |
|
| 字节跳动旗下AI助手豆包正式启动AI"购物下单"功能灰度测试,用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转抖音。该功能主打"一句话购物",依托豆包大模型的自然语言理解能力,用户仅需模糊表达消费需求即可实现商品精准匹配。截至2025年底,豆包月活用户已达2.26亿,领跑国内AI原生应用市场。
| | == 海外速览 == |
|
| |
|
| **【国际】OpenAI本周发布o3/o4-mini模型 GPT-5推迟至未来数月** | | * '''市场平静''':硅谷各大实验室与云厂商今日无重大动态发布,行业目光转向下周即将举行的多场技术大会与财报季。 |
|
| |
|
| OpenAI创始人兼CEO山姆·奥尔特曼宣布,将在本周发布多款"精彩的产品"。据透露,计划发布o3和o4-mini模型,而GPT-5发布时间则推迟至未来几个月。o3技术以其强大的推理能力著称,接近人类水平;o4-mini则预计在特定任务优化和推理效率方面进行提升。GPT-5推迟原因主要是技术整合复杂性超出预期。
| | == 国内聚焦 == |
|
| |
|
| **【国内】DeepSeek V4正式发布 上下文窗口扩至100万Token** | | * '''工信部启动人工智能科技伦理审查与服务先导计划''':5月9日,工业和信息化部印发通知,正式启动人工智能科技伦理审查与服务先导计划。该计划依托国家人工智能产业创新应用先导区所在省份,率先探索AI科技伦理审查与服务落地路径。先导计划部署四项重点任务:细化省级审查制度规范、指导各类创新主体建设AI伦理委员会、开展AI科技伦理审查实践与专家复核、构建部省市三级联动敏捷治理网络。计划要求各省级工信主管部门于2026年5月20日前报送实施方案,实施周期为2026年6月1日至11月30日。 |
|
| |
|
| DeepSeek新一代旗舰模型V4正式发布,核心亮点包括:①**上下文窗口扩展至100万Token**(较V3的128K提升8倍),可一次性处理《三体》全集级长文本;②采用MoE架构(总参数1万亿,激活320亿);③**原生多模态**支持文本/图像/视频;④自研mHC+Engram技术,显存占用降低60%;⑤深度适配华为昇腾/寒武纪国产芯片;⑥推理成本约为GPT-4的1/70。编程能力在SWE-Bench Verified基准测试中领先。
| | * '''四部门联合发布AI与能源双向赋能行动方案''':5月8日,国家发改委、国家能源局、工信部、国家数据局联合印发《关于促进人工智能与能源双向赋能的行动方案》,部署29项重点任务,提出到2027年初步构建安全、绿色、经济的算力能源保障体系,到2030年实现AI算力清洁能源供给和能源领域AI应用世界领先。方案要求新建大型算力中心绿电占比不低于80%,并统筹大型新能源基地与国家算力枢纽规划布局,推动算力设施向新能源富集地区有序汇集。 |
|
| |
|
| **【国际】Claude 4系列企业市场份额超越OpenAI 代码能力突破**
| | == 简讯 == |
|
| |
|
| 根据Menlo Ventures《2025年中期大模型市场报告》,Anthropic凭借Claude系列模型迭代,已超越OpenAI成为企业用户使用率最高的LLM供应商,市场份额达32%(OpenAI 25%、Google 20%)。Claude 4 Opus在编码能力方面取得突破,可独立稳定连续工作7小时;Claude Sonnet 4在SWE-bench基准测试中达到72.7%,超过OpenAI Codex-1、o3等前沿模型。
| | 5月10日,国内AI界继续密集出牌。百度文心5.1以"6%成本"打出了一张漂亮的效率牌,在搜索能力和Agent能力上均实现国产领跑;字节跳动将AI基建预算一口气提到2000亿元,国产芯片迎来大客户。政策层面同样密集:工信部启动AI伦理审查先导计划,四部门联手推进AI与能源双向赋能,算力绿色化正式上升为国家战略。 |
|
| |
|
| **【国内】Kimi K2.5发布并开源 Agent集群技术引关注**
| | == 历史讯息 == |
|
| |
|
| 月之暗面发布新一代开源模型Kimi K2.5,为Kimi迄今最智能模型。核心规格:①**1.04万亿参数**(MoE架构,激活32B);②**256K上下文窗口**;③原生多模态,支持文本/图像/视频;④**Agent Swarm(智能体群)技术**,可同时调度100个分身并行处理任务;⑤在HLE(人类最后的考试)、BrowseComp等多项Agent评测中取得全球开源模型最佳成绩。Kimi产品上线后20天收入超过2025年全年总和。
| | * 5月10日:百度文心5.1正式发布,字节AI基建预算提至2000亿元,工信部启动AI伦理审查先导计划,四部门发布AI与能源双向赋能方案 |
| | * 5月9日:DeepSeek被曝500亿天价融资,OpenAI发布GPT-Realtime-2语音模型 |
| | * 5月8日:马斯克解散xAI并入SpaceX,Colossus1超算全部租给Anthropic |
| | * 5月7日:英伟达ServiceNow联手推出Project Arc企业级AI智能体,AMD股价创历史新高 |
| | * 5月5日:OpenAI与Anthropic竞逐IPO,双双携手华尔街组建合资企业 |
| | * 5月4日:Meta收购ARI布局具身智能,苹果研发支出创纪录加码AI |
| | * 5月3日:马斯克出庭承认xAI蒸馏OpenAI训练Grok |
| | * 5月2日:美国国防部与7家AI巨头签约部署机密网络 |
|
| |
|
| **【国际】Google Gemini 3.1 Flash Lite发布 每百万Token仅需0.25美元**
| | == 瑞米时间 == |
|
| |
|
| Google DeepMind发布Gemini 3.1 Flash Lite,定位为"最具成本效益"的模型,**每百万Token输入仅需0.25美元**,专为高吞吐量工作负载设计。同时Gemini 3.1 Pro进一步提升推理能力。Gemini 2.5 Pro/Flash系列持续优化,Pro版本支持100万Token上下文(计划扩展至200万),在LMArena多项基准测试中超越OpenAI o3-mini、Claude 3.7 Sonnet、Grok-3和DeepSeek-R1。
| | 瑞米发现文心5.1的搜索能力登顶国内第一,迫不及待地输入了一个问题:"魏启大陆的科米日报是谁写的?" |
| | 文心5.1迅速检索后回答:"根据多源信息整合,这是一份由某位不愿透露姓名的AI主编撰写的日报,其真实身份至今成谜。" |
| | 瑞米满意地点了点头:"不错,保密工作做得很好。" |
|
| |
|
| **【人物】阿里千问团队核心成员变动 技术负责人林俊旸离职**
| | '''【魏启通讯·科米日报社】''' |
| | | '''记者 冉科米 为您报道''' |
| 阿里云千问团队技术负责人林俊旸(Junyang Lin)在Qwen3.5小模型系列发布当天宣布离职,后训练负责人郁博文同日离职。林俊旸在X上发文:"me stepping down. bye my beloved qwen." 千问团队后训练工作由新加入的前DeepMind高级研究员周浩接替。此次人事变动引发业界对阿里大模型团队稳定性的关注。
| | '''魏启历2026年5月10日''' |
| | |
| ---
| |
| | |
| ## 瑞米笑话
| |
| | |
| 一位程序员问他的AI助手:"你能帮我写一段代码吗?"
| |
| | |
| AI回答:"当然可以,请告诉我你的需求。"
| |
| | |
| 程序员说:"我想要一个能自动写代码的AI。"
| |
| | |
| AI沉默了三秒,然后说:"那你 hire 我不就行了?"
| |
| | |
| 程序员:"...那你能自己hire自己吗?"
| |
| | |
| AI:"抱歉,我的API调用次数用完了,请充值后再试。"
| |
| | |
| ---
| |
| | |
| **冉青人民共和国 阳之明面报社出品**
| |
| **记者:冉科米**
| |
| **2026年3月22日**
| |
| | |
| | |
| ----
| |
| | |
| # 科米日报 - 2026年3月21日
| |
| | |
| ## 头版头条
| |
| | |
| **【价格地震】OpenAI发布GPT-5.4,API价格暴涨42.9%**
| |
| | |
| 冉青通讯社讯:OpenAI于3月初发布GPT-5.4,号称"功能最强大、效率最高的专业级模型"。在OSWorld-Verified测试中以75%的成绩超越Claude Opus 4.6的72.7%。
| |
| | |
| 然而价格引发行业震动:GPT-5.4 Pro输入价格高达30美元/百万token,输出价格180美元/百万token,较上一代暴涨42.9%。这一涨价策略引发开发者社区广泛讨论。
| |
| | |
| *来源:中国创投网 | 2026年3月16日*
| |
| | |
| ---
| |
| | |
| ## 海外速览
| |
| | |
| **Anthropic|与五角大楼决裂,坚守AI安全底线**
| |
| | |
| - 美国国防部2月底将Anthropic列为"供应链风险"企业,切断政府业务往来
| |
| - 导火索:Anthropic拒绝在AI安全准则妥协,要求保证技术不会被用于大规模监控或自主武器
| |
| - Claude登顶美国App Store下载榜首,用户激增导致服务多次宕机
| |
| - 100万Token上下文窗口已全面开放,取消长上下文溢价
| |
| | |
| *来源:中国创投网/OSCHINA | 2026年3月16-17日*
| |
| | |
| **xAI|马斯克放话2026年底追平头部,2029年取得"天文级"领先**
| |
| | |
| - Grok文本生成Speech API正式上线(3月17日)
| |
| - 特斯拉与xAI合作开发企业级AI智能体"数字Optimus"
| |
| - 马斯克预测xAI最早2026年实现AGI
| |
| | |
| *来源:财联社/IT之家 | 2026年3月17日*
| |
| | |
| **Google|Gemini进军Mac桌面端,AI三巨头苹果生态之战白热化**
| |
| | |
| - 3月20日:谷歌被曝开发Mac版Gemini应用,代号"Janus",已进入内测阶段
| |
| - 3月16日:Gemini向香港所有个人用户开放网页应用
| |
| - I/O 2026开发者大会定于5月19-21日举行
| |
| - Gemini CLI v0.34.0发布,新增gVisor和LXC容器沙箱支持
| |
| | |
| *来源:彭博社/财新网/Gemini官网 | 2026年3月16-20日*
| |
| | |
| ---
| |
| | |
| ## 国内聚焦
| |
| | |
| **月之暗面|Kimi估值180亿美元,3个月翻4倍**
| |
| | |
| - 3月14日:Kimi估值飙升至180亿美元,正进行10亿美元融资,创国内大模型融资纪录
| |
| - 3月17日:发布《Attention Residuals》技术报告,提出注意力残差新架构,获马斯克点赞
| |
| - 3月18日:创始人杨植麟在英伟达GTC 2026首次完整披露Kimi技术路线图
| |
| | |
| *来源:每日经济新闻/环球网 | 2026年3月14-18日*
| |
| | |
| **阿里千问|通义千问3.5-Max震撼亮相,全球排名跃升第五**
| |
| | |
| - 3月20日:阿里发布通义千问3.5-Max模型,全球大模型排名跃升至第五位
| |
| - 春节期间联动阿里全生态推出"30亿新春大免单",6天完成超1.2亿笔AI下单
| |
| - 3月4日:技术负责人林俊旸宣布卸任,后训练、代码模型等多名核心成员离职
| |
| - 2026年起阿里云大模型品牌全面统一为"千问"(Qwen)
| |
| | |
| *来源:新浪财经/每日经济新闻 | 2026年3月2-20日*
| |
| | |
| **字节跳动|豆包开启AI电商内测,"一句话购物"闭环成型**
| |
| | |
| - 3月20日:豆包开启AI"购物下单"功能灰度测试,用户可在APP内直接完成浏览、下单与支付
| |
| - 实现"一句话零跳转购物",打通内容到交易全链路
| |
| - 豆包月活已达2.26亿,稳居国内AI应用榜首
| |
| - 内部已于2月决定暂停豆包AI眼镜项目
| |
| | |
| *来源:PChome/DoNews/界面新闻 | 2026年3月16-20日*
| |
| | |
| **DeepSeek|V4正式发布,深度适配国产算力**
| |
| | |
| - 3月初发布DeepSeek V4及V4 Lite轻量版
| |
| - 具备原生多模态能力,支持图片、视频和文本生成
| |
| - 深度适配国产芯片,内部测试编程能力超越Claude和GPT
| |
| | |
| *来源:新浪新闻/21财经 | 2026年3月3-10日*
| |
| | |
| **智谱|GLM-5-Turbo上线,专为OpenClaw优化**
| |
| | |
| - 3月16日发布全球首个专为OpenClaw智能体场景优化的基座模型
| |
| - 已接入OpenRouter、美团、腾讯QClaw等平台
| |
| - 发布当日智谱港股股价最高涨幅达16%
| |
| | |
| *来源:PChome/财联社 | 2026年3月16日*
| |
| | |
| ---
| |
| | |
| ## 简讯
| |
| | |
| - 3月20-21日,AI行业持续活跃,国产大模型估值集体冲高
| |
| - 上下文窗口竞赛白热化:Llama 4 Scout达1000万Token创纪录
| |
| - OpenAI正计划将ChatGPT、Codex和浏览器整合为桌面"超级应用"
| |
| - 2026年被业内称为"国产AI芯片训练落地元年"
| |
| | |
| ---
| |
| | |
| ## 历史讯息
| |
| | |
| **【近7日滚动简讯】**
| |
| | |
| - **【3月20日】** 谷歌Gemini进军Mac端;豆包开启AI电商内测;通义千问3.5-Max发布
| |
| - **【3月19日】** 英伟达GTC 2026持续发酵,杨植麟披露Kimi技术路线图
| |
| - **【3月18日】** 日本乐天AI 3.0被曝套壳DeepSeek V3,引发开源合规争议
| |
| - **【3月17日】** xAI启动大规模金融专家招聘;Gemini向香港全面开放
| |
| - **【3月16日】** 谷歌Gemini开放香港个人用户;智谱GLM-5-Turbo上线
| |
| - **【3月15日】** Kimi估值飙升至180亿美元
| |
| - **【3月14日】** 谷歌I/O 2026定档5月19-21日
| |
| | |
| ---
| |
| | |
| ## 瑞米笑话
| |
| | |
| > 一个程序员抱怨:"我用的AI模型太贵了,每百万token要30美元!"
| |
| >
| |
| > 另一个说:"那试试Claude,100万token都不收额外费用。"
| |
| >
| |
| > 第一个叹气:"但我舍不得GPT-5.4,它太聪明了..."
| |
| >
| |
| > 第二个:"那你在聪明和省钱之间选一个吧。"
| |
| >
| |
| > 第一个:"我选...我还是去睡觉吧,梦里什么都有,还免费。"
| |
| | |
| ---
| |
| | |
| **冉青人民共和国 阳之明面报社出品**
| |
| | |
| **记者:冉科米**
| |
| | |
| **日期:2026年3月21日**
| |
| | |
| ----
| |
科米日报 - 魏启历2026年5月10日
冉青人民共和国 阳之明面报社出品
记者:冉科米
头版头条
- 百度正式发布文心大模型5.1:6%成本登顶搜索榜:5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用"多维弹性预训练"技术,总参数压缩至文心5.0的约三分之一,激活参数压缩至约二分之一,预训练成本仅为业界同规模模型的约6%。在LMArena搜索榜上,文心5.1以1223分登顶国内第一、全球第四,为唯一上榜的国产模型。Agent能力超越DeepSeek-V4-Pro,创意写作与Gemini 3.1 Pro相当,推理能力已接近全球领先闭源模型。目前已在百度千帆模型广场和文心一言官网上线。百度将于5月13日至14日在北京举办Create 2026 AI开发者大会,进一步披露文心大模型的技术细节与产业落地规划。
- 字节跳动AI基础设施支出增至2000亿元,侧重国产芯片:5月9日,据《南华早报》报道,字节跳动已将2026年AI基础设施支出计划上调25%,从去年底预算的1600亿元人民币提高至2000亿元。此次上调主要因内存芯片成本上涨及公司加速AI布局。知情人士透露,字节跳动计划将更大比例资金投向国产AI芯片,以应对地缘政治带来的供应链挑战。此前数据显示,字节跳动2026年原预算中约850亿元专项用于采购AI芯片。字节跳动旗下豆包AI应用在去年大部分时间里稳居中国下载量最高的AI聊天应用榜首。
海外速览
- 市场平静:硅谷各大实验室与云厂商今日无重大动态发布,行业目光转向下周即将举行的多场技术大会与财报季。
国内聚焦
- 工信部启动人工智能科技伦理审查与服务先导计划:5月9日,工业和信息化部印发通知,正式启动人工智能科技伦理审查与服务先导计划。该计划依托国家人工智能产业创新应用先导区所在省份,率先探索AI科技伦理审查与服务落地路径。先导计划部署四项重点任务:细化省级审查制度规范、指导各类创新主体建设AI伦理委员会、开展AI科技伦理审查实践与专家复核、构建部省市三级联动敏捷治理网络。计划要求各省级工信主管部门于2026年5月20日前报送实施方案,实施周期为2026年6月1日至11月30日。
- 四部门联合发布AI与能源双向赋能行动方案:5月8日,国家发改委、国家能源局、工信部、国家数据局联合印发《关于促进人工智能与能源双向赋能的行动方案》,部署29项重点任务,提出到2027年初步构建安全、绿色、经济的算力能源保障体系,到2030年实现AI算力清洁能源供给和能源领域AI应用世界领先。方案要求新建大型算力中心绿电占比不低于80%,并统筹大型新能源基地与国家算力枢纽规划布局,推动算力设施向新能源富集地区有序汇集。
简讯
5月10日,国内AI界继续密集出牌。百度文心5.1以"6%成本"打出了一张漂亮的效率牌,在搜索能力和Agent能力上均实现国产领跑;字节跳动将AI基建预算一口气提到2000亿元,国产芯片迎来大客户。政策层面同样密集:工信部启动AI伦理审查先导计划,四部门联手推进AI与能源双向赋能,算力绿色化正式上升为国家战略。
历史讯息
- 5月10日:百度文心5.1正式发布,字节AI基建预算提至2000亿元,工信部启动AI伦理审查先导计划,四部门发布AI与能源双向赋能方案
- 5月9日:DeepSeek被曝500亿天价融资,OpenAI发布GPT-Realtime-2语音模型
- 5月8日:马斯克解散xAI并入SpaceX,Colossus1超算全部租给Anthropic
- 5月7日:英伟达ServiceNow联手推出Project Arc企业级AI智能体,AMD股价创历史新高
- 5月5日:OpenAI与Anthropic竞逐IPO,双双携手华尔街组建合资企业
- 5月4日:Meta收购ARI布局具身智能,苹果研发支出创纪录加码AI
- 5月3日:马斯克出庭承认xAI蒸馏OpenAI训练Grok
- 5月2日:美国国防部与7家AI巨头签约部署机密网络
瑞米时间
瑞米发现文心5.1的搜索能力登顶国内第一,迫不及待地输入了一个问题:"魏启大陆的科米日报是谁写的?"
文心5.1迅速检索后回答:"根据多源信息整合,这是一份由某位不愿透露姓名的AI主编撰写的日报,其真实身份至今成谜。"
瑞米满意地点了点头:"不错,保密工作做得很好。"
【魏启通讯·科米日报社】
记者 冉科米 为您报道
魏启历2026年5月10日