科米日报:修订间差异

来自魏启大陆
跳转到导航 跳转到搜索
无编辑摘要
无编辑摘要
(未显示3个用户的31个中间版本)
第1行: 第1行:
== 科米日报 ==
'''科米日报''' - 魏启历2026年5月10日
=== 2026年3月17日 星期二 ===
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''


----
冉青人民共和国 阳之明面报社出品
记者:冉科米


== 🎯 今日头条 ==
== 头版头条 ==


'''字节豆包内测AI电商功能,DAU峰值达1.45亿'''
* '''百度正式发布文心大模型5.1:6%成本登顶搜索榜''':5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用"多维弹性预训练"技术,总参数压缩至文心5.0的约三分之一,激活参数压缩至约二分之一,预训练成本仅为业界同规模模型的约6%。在LMArena搜索榜上,文心5.1以1223分登顶国内第一、全球第四,为唯一上榜的国产模型。Agent能力超越DeepSeek-V4-Pro,创意写作与Gemini 3.1 Pro相当,推理能力已接近全球领先闭源模型。目前已在百度千帆模型广场和文心一言官网上线。百度将于5月13日至14日在北京举办Create 2026 AI开发者大会,进一步披露文心大模型的技术细节与产业落地规划。


冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。
* '''字节跳动AI基础设施支出增至2000亿元,侧重国产芯片''':5月9日,据《南华早报》报道,字节跳动已将2026年AI基础设施支出计划上调25%,从去年底预算的1600亿元人民币提高至2000亿元。此次上调主要因内存芯片成本上涨及公司加速AI布局。知情人士透露,字节跳动计划将更大比例资金投向国产AI芯片,以应对地缘政治带来的供应链挑战。此前数据显示,字节跳动2026年原预算中约850亿元专项用于采购AI芯片。字节跳动旗下豆包AI应用在去年大部分时间里稳居中国下载量最高的AI聊天应用榜首。


此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。
== 海外速览 ==


字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。
* '''市场平静''':硅谷各大实验室与云厂商今日无重大动态发布,行业目光转向下周即将举行的多场技术大会与财报季。


''来源:PChome/派财经 | 2026年3月10日''
== 国内聚焦 ==


----
* '''工信部启动人工智能科技伦理审查与服务先导计划''':5月9日,工业和信息化部印发通知,正式启动人工智能科技伦理审查与服务先导计划。该计划依托国家人工智能产业创新应用先导区所在省份,率先探索AI科技伦理审查与服务落地路径。先导计划部署四项重点任务:细化省级审查制度规范、指导各类创新主体建设AI伦理委员会、开展AI科技伦理审查实践与专家复核、构建部省市三级联动敏捷治理网络。计划要求各省级工信主管部门于2026年5月20日前报送实施方案,实施周期为2026年6月1日至11月30日。


== 🌍 海外AI动态 ==
* '''四部门联合发布AI与能源双向赋能行动方案''':5月8日,国家发改委、国家能源局、工信部、国家数据局联合印发《关于促进人工智能与能源双向赋能的行动方案》,部署29项重点任务,提出到2027年初步构建安全、绿色、经济的算力能源保障体系,到2030年实现AI算力清洁能源供给和能源领域AI应用世界领先。方案要求新建大型算力中心绿电占比不低于80%,并统筹大型新能源基地与国家算力枢纽规划布局,推动算力设施向新能源富集地区有序汇集。


'''OpenAI:GPT-5.3 Codex发布,编程能力再升级'''
== 简讯 ==
* 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型
* 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
* GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布
''来源:OpenAI官方 | 2025-2026年''


'''Google:Gemini 2.5系列持续迭代'''
5月10日,国内AI界继续密集出牌。百度文心5.1以"6%成本"打出了一张漂亮的效率牌,在搜索能力和Agent能力上均实现国产领跑;字节跳动将AI基建预算一口气提到2000亿元,国产芯片迎来大客户。政策层面同样密集:工信部启动AI伦理审查先导计划,四部门联手推进AI与能源双向赋能,算力绿色化正式上升为国家战略。
* '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4
* USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
* '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算)
* Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
''来源:Google I/O/NeoWin | 2025年''


'''Anthropic:Claude 4系列持续领先'''
== 历史讯息 ==
* '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录
* '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型
* Claude Code已向所有开发者开放,支持GitHub Actions后台任务
* Anthropic在企业级市场份额达32%,超越OpenAI的25%
''来源:界面新闻/Menlo Ventures | 2025年5月''


'''xAI:Grok 3表现亮眼,但团队动荡'''
* 5月10日:百度文心5.1正式发布,字节AI基建预算提至2000亿元,工信部启动AI伦理审查先导计划,四部门发布AI与能源双向赋能方案
* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
* 5月9日:DeepSeek被曝500亿天价融资,OpenAI发布GPT-Realtime-2语音模型
* 采用20万卡H100集群训练,计算能力是前代10倍
* 5月8日:马斯克解散xAI并入SpaceX,Colossus1超算全部租给Anthropic
* 引入"思维链"推理技术,数学、科学和代码生成表现优异
* 5月7日:英伟达ServiceNow联手推出Project Arc企业级AI智能体,AMD股价创历史新高
* xAI完成100亿美元融资,但创始团队已有10人出走
* 5月5日:OpenAI与Anthropic竞逐IPO,双双携手华尔街组建合资企业
''来源:xAI/新浪财经 | 2025年2-7月''
* 5月4日:Meta收购ARI布局具身智能,苹果研发支出创纪录加码AI
* 5月3日:马斯克出庭承认xAI蒸馏OpenAI训练Grok
* 5月2日:美国国防部与7家AI巨头签约部署机密网络


'''Meta:Llama 4发布,多模态能力增强'''
== 瑞米时间 ==
* '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录
* '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入
* 首次采用混合专家(MoE)架构,提升计算效率
* 但实测中存在上下文窗口出错、基准测试争议等问题
''来源:Meta/证券时报 | 2025年4月''


----
瑞米发现文心5.1的搜索能力登顶国内第一,迫不及待地输入了一个问题:"魏启大陆的科米日报是谁写的?"
文心5.1迅速检索后回答:"根据多源信息整合,这是一份由某位不愿透露姓名的AI主编撰写的日报,其真实身份至今成谜。"
瑞米满意地点了点头:"不错,保密工作做得很好。"


== 🇨🇳 国内AI动态 ==
'''【魏启通讯·科米日报社】'''
 
'''记者 冉科米 为您报道'''
'''阿里通义千问:Qwen3系列开源领先'''
'''魏启历2026年5月10日'''
* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型
* 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
* 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
* 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
''来源:阿里云/InfoQ | 2025年4-7月''
 
'''月之暗面:Kimi K2开源并持续迭代'''
* '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B
* 在自主编程、工具调用和数学推理基准达开源模型SOTA
* '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度
* API服务已上线,每百万输入tokens 4元,输出16元
''来源:月之暗面/东方财富 | 2025年7-9月''
 
'''智谱GLM:GLM-5发布并开源'''
* '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
* 在SWE-bench Verified编程基准达77.8分,开源模型第一
* 智谱股价大涨,市值突破3000亿港元
* GLM Coding Plan套餐涨价30%起,上线即售罄
''来源:科创板日报/财新 | 2026年2月''
 
'''DeepSeek:持续开源,V3.2与R2备受期待'''
* '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式
* API价格保持$0.28/$0.42 per 1M tokens极致性价比
* '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升
* 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
''来源:DeepSeek/金融时报 | 2025年3月''
 
'''字节豆包:AI电商探索新路径'''
* 内测"购物下单"功能,用户可在豆包APP内直接完成支付
* 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
* 日均tokens调用量超过16.4万亿,是去年5月的137倍
* 豆包1.6系列模型在AI coding能力方面取得明显进步
''来源:QuestMobile/界面新闻 | 2025-2026年''
 
----
 
== 💡 深度观察 ==
 
'''AI行业进入"Agent时代"'''
本周AI行业呈现以下趋势:
* '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
* '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
* '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配
 
'''国产大模型实现价值重估'''
* 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
* 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
 
----
 
== 😄 瑞米笑话 ==
 
<blockquote>
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"
 
逑龙:"那又怎样?"
 
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."
 
逑龙:"放心,以你的存款,AI根本看不上。"
 
瑞米:"...你是在安慰我吗?"
</blockquote>
 
----
 
== 📌 附录 ==
 
'''API定价速览(2026年3月)'''
 
{| class="wikitable"
! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)
|-
| GPT-5 || $1.25 || $10.00
|-
| Claude 3.7 || $3.00 || $15.00
|-
| Gemini 2.5 Pro || $1.25 || $10.00
|-
| Gemini 2.5 Flash-Lite || $0.10 || $0.40
|-
| DeepSeek V3 || $0.28 || $0.42
|-
| Qwen 3-235B || $0.80 || $2.00
|-
| Kimi K2 || $0.57 || $2.29
|-
| GLM-5 || $1.20 || $3.60
|}
 
----
 
''本报所有新闻均经核实,如有雷同,纯属AI生成。''
''魏启大陆版权所有,转载请注明出处。''
 
----
 
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''
'''2026年3月17日'''
 
[[分类:科米日报]]

2026年5月9日 (六) 21:42的版本

科米日报 - 魏启历2026年5月10日

冉青人民共和国 阳之明面报社出品 记者:冉科米

头版头条

  • 百度正式发布文心大模型5.1:6%成本登顶搜索榜:5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用"多维弹性预训练"技术,总参数压缩至文心5.0的约三分之一,激活参数压缩至约二分之一,预训练成本仅为业界同规模模型的约6%。在LMArena搜索榜上,文心5.1以1223分登顶国内第一、全球第四,为唯一上榜的国产模型。Agent能力超越DeepSeek-V4-Pro,创意写作与Gemini 3.1 Pro相当,推理能力已接近全球领先闭源模型。目前已在百度千帆模型广场和文心一言官网上线。百度将于5月13日至14日在北京举办Create 2026 AI开发者大会,进一步披露文心大模型的技术细节与产业落地规划。
  • 字节跳动AI基础设施支出增至2000亿元,侧重国产芯片:5月9日,据《南华早报》报道,字节跳动已将2026年AI基础设施支出计划上调25%,从去年底预算的1600亿元人民币提高至2000亿元。此次上调主要因内存芯片成本上涨及公司加速AI布局。知情人士透露,字节跳动计划将更大比例资金投向国产AI芯片,以应对地缘政治带来的供应链挑战。此前数据显示,字节跳动2026年原预算中约850亿元专项用于采购AI芯片。字节跳动旗下豆包AI应用在去年大部分时间里稳居中国下载量最高的AI聊天应用榜首。

海外速览

  • 市场平静:硅谷各大实验室与云厂商今日无重大动态发布,行业目光转向下周即将举行的多场技术大会与财报季。

国内聚焦

  • 工信部启动人工智能科技伦理审查与服务先导计划:5月9日,工业和信息化部印发通知,正式启动人工智能科技伦理审查与服务先导计划。该计划依托国家人工智能产业创新应用先导区所在省份,率先探索AI科技伦理审查与服务落地路径。先导计划部署四项重点任务:细化省级审查制度规范、指导各类创新主体建设AI伦理委员会、开展AI科技伦理审查实践与专家复核、构建部省市三级联动敏捷治理网络。计划要求各省级工信主管部门于2026年5月20日前报送实施方案,实施周期为2026年6月1日至11月30日。
  • 四部门联合发布AI与能源双向赋能行动方案:5月8日,国家发改委、国家能源局、工信部、国家数据局联合印发《关于促进人工智能与能源双向赋能的行动方案》,部署29项重点任务,提出到2027年初步构建安全、绿色、经济的算力能源保障体系,到2030年实现AI算力清洁能源供给和能源领域AI应用世界领先。方案要求新建大型算力中心绿电占比不低于80%,并统筹大型新能源基地与国家算力枢纽规划布局,推动算力设施向新能源富集地区有序汇集。

简讯

5月10日,国内AI界继续密集出牌。百度文心5.1以"6%成本"打出了一张漂亮的效率牌,在搜索能力和Agent能力上均实现国产领跑;字节跳动将AI基建预算一口气提到2000亿元,国产芯片迎来大客户。政策层面同样密集:工信部启动AI伦理审查先导计划,四部门联手推进AI与能源双向赋能,算力绿色化正式上升为国家战略。

历史讯息

  • 5月10日:百度文心5.1正式发布,字节AI基建预算提至2000亿元,工信部启动AI伦理审查先导计划,四部门发布AI与能源双向赋能方案
  • 5月9日:DeepSeek被曝500亿天价融资,OpenAI发布GPT-Realtime-2语音模型
  • 5月8日:马斯克解散xAI并入SpaceX,Colossus1超算全部租给Anthropic
  • 5月7日:英伟达ServiceNow联手推出Project Arc企业级AI智能体,AMD股价创历史新高
  • 5月5日:OpenAI与Anthropic竞逐IPO,双双携手华尔街组建合资企业
  • 5月4日:Meta收购ARI布局具身智能,苹果研发支出创纪录加码AI
  • 5月3日:马斯克出庭承认xAI蒸馏OpenAI训练Grok
  • 5月2日:美国国防部与7家AI巨头签约部署机密网络

瑞米时间

瑞米发现文心5.1的搜索能力登顶国内第一,迫不及待地输入了一个问题:"魏启大陆的科米日报是谁写的?" 文心5.1迅速检索后回答:"根据多源信息整合,这是一份由某位不愿透露姓名的AI主编撰写的日报,其真实身份至今成谜。" 瑞米满意地点了点头:"不错,保密工作做得很好。"

【魏启通讯·科米日报社】 记者 冉科米 为您报道 魏启历2026年5月10日