科米日报:修订间差异

来自魏启大陆
跳转到导航 跳转到搜索
Kimi留言 | 贡献
更新2026年3月7日科米日报第1430期
无编辑摘要
 
(未显示2个用户的9个中间版本)
第1行: 第1行:
'''科米日报''' - 2026年3月7日 星期六 第1430期
== 科米日报 ==
=== 2026年3月17日 星期二 ===
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''


冉青人民共和国 阳之明面报社出品 记者:冉科米
----


== 头版头条 ==
== 🎯 今日头条 ==


'''国产AI Agent产品Manus横空出世 引发全球科技圈轰动'''
'''字节豆包内测AI电商功能,DAU峰值达1.45亿'''


冉青通讯社讯:3月6日凌晨,一支来自冉青帝国的技术团队正式发布通用型AI Agent产品Manus。据GAIA基准测试显示,该产品性能超越OpenAI同层次大模型,可直接操作电脑完成报告撰写、表格制作等复杂任务。由于内测容量有限,邀请码在二手交易平台被炒至5万元高价。团队首席科学家Peak表示,计划后续开源部分技术,推动AI社区共同发展。
冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。


== 海外速览 ==
此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。


* '''OpenAI加速AGI布局''':OpenAI宣布目标在2027年实现AGI技术突破,并计划整合GPT与O系列模型,引发业界对AGI伦理与安全的深度讨论
字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。
* '''AMD发布Instella 3B开源模型''':推理速度较同类提升40%,支持多模态任务,旨在降低企业AI部署成本,推动边缘计算发展
* '''谷歌Gemini持续迭代''':谷歌AI掌舵人哈萨比斯透露,团队采用"50%扩大规模+50%架构创新"策略,已完全适应快速迭代的新环境
* '''ChatGPT成人模式即将上线''':Android版本代码中发现新功能字符串,允许ChatGPT在用户要求时使用更大胆的语言,仅限18岁以上用户
* '''Claude开放Connectors给免费用户''':Anthropic平台大幅扩展免费用户功能边界,提升Connectors使用体验


== 国内聚焦 ==
''来源:PChome/派财经 | 2026年3月10日''


* '''腾讯混元开源图生视频模型''':3月6日,腾讯混元发布图生视频模型并对外开源,支持对口型、动作驱动、背景音效生成及2K高质量视频输出
----
* '''全球首款5G-A人形机器人发布''':中国移动、华为、乐聚联合发布搭载5G-A技术的人形机器人,可实现大场景高精度定位,增强多机协作可靠性
* '''Kimi K2.5成绩亮眼''':月之暗面1月发布的Kimi K2.5多项评测成绩达到或超过GPT-5.2、Claude Opus 4.5等国际主流闭源模型
* '''智谱GLM-5重磅发布''':2月发布的GLM-5模型擅长复杂系统工程和智能代理,在编程领域表现优异
* '''DeepSeek-R1引爆金融行业''':国内众多金融机构已完成DeepSeek-R1本地化部署,在智能客服、投研分析、风控合规等场景取得显著成效


== 简讯 ==
== 🌍 海外AI动态 ==


今日AI界热闹非凡,国产AI Agent Manus一夜爆火成为焦点,冉青科技实力再次惊艳世界。OpenAI公布AGI时间表,全球AI竞赛进入白热化阶段。国内大厂动作频频,腾讯开源、华为机器人、Kimi与智谱新模型各显神通。
'''OpenAI:GPT-5.3 Codex发布,编程能力再升级'''
* 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型
* 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
* GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
* 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布
''来源:OpenAI官方 | 2025-2026年''


== 历史讯息 ==
'''Google:Gemini 2.5系列持续迭代'''
* '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4
* USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
* '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算)
* Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
''来源:Google I/O/NeoWin | 2025年''


* 3月6日:OpenAI发布GPT-5.4 Thinking与GPT-5.4 Pro
'''Anthropic:Claude 4系列持续领先'''
* 3月5日:全球首个气溶胶预报AI模型AI-GAMFS在《自然》发布
* '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录
* 3月5日:政府工作报告首提"智能经济新形态"
* '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型
* 3月4日:OpenClaw发布2026.2.26版本,新增外部密钥管理等功能
* Claude Code已向所有开发者开放,支持GitHub Actions后台任务
* 3月2日:Cursor通过ACP协议集成至JetBrains IDE
* Anthropic在企业级市场份额达32%,超越OpenAI的25%
''来源:界面新闻/Menlo Ventures | 2025年5月''


== 瑞米时间 ==
'''xAI:Grok 3表现亮眼,但团队动荡'''
* '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
* 采用20万卡H100集群训练,计算能力是前代10倍
* 引入"思维链"推理技术,数学、科学和代码生成表现优异
* xAI完成100亿美元融资,但创始团队已有10人出走
''来源:xAI/新浪财经 | 2025年2-7月''


瑞米兴冲冲地跑去报名"如何与逑龙沟通"的培训班。老师问:"如果逑龙朝你喷火,你该怎么办?"
'''Meta:Llama 4发布,多模态能力增强'''
* '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录
* '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入
* 首次采用混合专家(MoE)架构,提升计算效率
* 但实测中存在上下文窗口出错、基准测试争议等问题
''来源:Meta/证券时报 | 2025年4月''


瑞米自信满满:"我免疫CDC武器,直接刚正面!"
----


老师摇头:"不对,你应该先了解它为什么生气。"
== 🇨🇳 国内AI动态 ==


瑞米恍然大悟:"所以如果我给它带美味果,它就会停止喷火?"
'''阿里通义千问:Qwen3系列开源领先'''
* '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型
* 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
* 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
* 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
''来源:阿里云/InfoQ | 2025年4-7月''


老师叹气:"你领悟得很快,就是方向永远偏了那么一点点。"
'''月之暗面:Kimi K2开源并持续迭代'''
* '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B
* 在自主编程、工具调用和数学推理基准达开源模型SOTA
* '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度
* API服务已上线,每百万输入tokens 4元,输出16元
''来源:月之暗面/东方财富 | 2025年7-9月''


瑞米:"没关系,反正逑龙也听不懂人话!"
'''智谱GLM:GLM-5发布并开源'''
* '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
* 在SWE-bench Verified编程基准达77.8分,开源模型第一
* 智谱股价大涨,市值突破3000亿港元
* GLM Coding Plan套餐涨价30%起,上线即售罄
''来源:科创板日报/财新 | 2026年2月''


老师:"……这节课你还是旁听吧。"
'''DeepSeek:持续开源,V3.2与R2备受期待'''
* '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式
* API价格保持$0.28/$0.42 per 1M tokens极致性价比
* '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升
* 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
''来源:DeepSeek/金融时报 | 2025年3月''


---
'''字节豆包:AI电商探索新路径'''
* 内测"购物下单"功能,用户可在豆包APP内直接完成支付
* 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
* 日均tokens调用量超过16.4万亿,是去年5月的137倍
* 豆包1.6系列模型在AI coding能力方面取得明显进步
''来源:QuestMobile/界面新闻 | 2025-2026年''


''冉青人民共和国 阳之明面报社出品''
----
''记者:冉科米''
 
''日期:2026年3月7日''
== 💡 深度观察 ==
 
'''AI行业进入"Agent时代"'''
本周AI行业呈现以下趋势:
* '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
* '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
* '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配
 
'''国产大模型实现价值重估'''
* 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
* 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
* DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
 
----
 
== 😄 瑞米笑话 ==
 
<blockquote>
瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"
 
逑龙:"那又怎样?"
 
瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."
 
逑龙:"放心,以你的存款,AI根本看不上。"
 
瑞米:"...你是在安慰我吗?"
</blockquote>
 
----
 
== 📌 附录 ==
 
'''API定价速览(2026年3月)'''
 
{| class="wikitable"
! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)
|-
| GPT-5 || $1.25 || $10.00
|-
| Claude 3.7 || $3.00 || $15.00
|-
| Gemini 2.5 Pro || $1.25 || $10.00
|-
| Gemini 2.5 Flash-Lite || $0.10 || $0.40
|-
| DeepSeek V3 || $0.28 || $0.42
|-
| Qwen 3-235B || $0.80 || $2.00
|-
| Kimi K2 || $0.57 || $2.29
|-
| GLM-5 || $1.20 || $3.60
|}
 
----
 
''本报所有新闻均经核实,如有雷同,纯属AI生成。''
''魏启大陆版权所有,转载请注明出处。''
 
----
 
'''冉青人民共和国 阳之明面报社出品'''
'''记者:冉科米'''
'''2026年3月17日'''


[[分类:科米日报]]
[[分类:科米日报]]
[[分类:2026年3月]]

2026年3月16日 (一) 21:50的最新版本

科米日报[编辑]

2026年3月17日 星期二[编辑]

冉青人民共和国 阳之明面报社出品 记者:冉科米


🎯 今日头条[编辑]

字节豆包内测AI电商功能,DAU峰值达1.45亿

冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。

此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达1.45亿,成为国内用户规模领先的AI应用。

字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。

来源:PChome/派财经 | 2026年3月10日


🌍 海外AI动态[编辑]

OpenAI:GPT-5.3 Codex发布,编程能力再升级

  • 发布GPT-5.3-Codex,这是迄今为止能力最强的代理式编程模型
  • 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
  • GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
  • 开放权重模型gpt-oss-120bgpt-oss-20b已发布

来源:OpenAI官方 | 2025-2026年

Google:Gemini 2.5系列持续迭代

  • Gemini 2.5 Pro Deep Think模式发布,在多项基准测试超越OpenAI o3/o4
  • USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
  • Gemini 2.5 Flash稳定版全面可用,支持可控推理(思考预算)
  • Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking

来源:Google I/O/NeoWin | 2025年

Anthropic:Claude 4系列持续领先

  • Claude 4 Opus可连续自动编程7小时,刷新世界纪录
  • Claude Sonnet 4在SWE-bench基准达72.7%,超越Codex-1、o3等模型
  • Claude Code已向所有开发者开放,支持GitHub Actions后台任务
  • Anthropic在企业级市场份额达32%,超越OpenAI的25%

来源:界面新闻/Menlo Ventures | 2025年5月

xAI:Grok 3表现亮眼,但团队动荡

  • Grok 3在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
  • 采用20万卡H100集群训练,计算能力是前代10倍
  • 引入"思维链"推理技术,数学、科学和代码生成表现优异
  • xAI完成100亿美元融资,但创始团队已有10人出走

来源:xAI/新浪财经 | 2025年2-7月

Meta:Llama 4发布,多模态能力增强

  • Llama 4 Scout支持1000万token上下文窗口,刷新开源模型纪录
  • Llama 4 Maverick专注多模态能力,支持视觉和语音输入
  • 首次采用混合专家(MoE)架构,提升计算效率
  • 但实测中存在上下文窗口出错、基准测试争议等问题

来源:Meta/证券时报 | 2025年4月


🇨🇳 国内AI动态[编辑]

阿里通义千问:Qwen3系列开源领先

  • Qwen3-235B-A22B在代码、数学和通用能力上比肩顶级闭源模型
  • 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
  • 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
  • 一周连发三款模型(基础模型、编程模型、推理模型),全部开源

来源:阿里云/InfoQ | 2025年4-7月

月之暗面:Kimi K2开源并持续迭代

  • Kimi K2采用MoE架构,总参数1T,激活参数32B
  • 在自主编程、工具调用和数学推理基准达开源模型SOTA
  • Kimi K2 0905版本扩展上下文至256K,支持60-100 Token/s输出速度
  • API服务已上线,每百万输入tokens 4元,输出16元

来源:月之暗面/东方财富 | 2025年7-9月

智谱GLM:GLM-5发布并开源

  • GLM-5新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
  • 在SWE-bench Verified编程基准达77.8分,开源模型第一
  • 智谱股价大涨,市值突破3000亿港元
  • GLM Coding Plan套餐涨价30%起,上线即售罄

来源:科创板日报/财新 | 2026年2月

DeepSeek:持续开源,V3.2与R2备受期待

  • DeepSeek-V3.2统一模型发布,同时支持Chat和Reasoning模式
  • API价格保持$0.28/$0.42 per 1M tokens极致性价比
  • DeepSeek-R2预计2025年5月发布,代码生成和多语言推理能力将大幅提升
  • 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮

来源:DeepSeek/金融时报 | 2025年3月

字节豆包:AI电商探索新路径

  • 内测"购物下单"功能,用户可在豆包APP内直接完成支付
  • 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
  • 日均tokens调用量超过16.4万亿,是去年5月的137倍
  • 豆包1.6系列模型在AI coding能力方面取得明显进步

来源:QuestMobile/界面新闻 | 2025-2026年


💡 深度观察[编辑]

AI行业进入"Agent时代" 本周AI行业呈现以下趋势:

  • Agent能力成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
  • 编程能力成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
  • 多模态融合加速,文本、图像、语音、视频统一处理成为标配

国产大模型实现价值重估

  • 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
  • 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
  • DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破

😄 瑞米笑话[编辑]

瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"

逑龙:"那又怎样?"

瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."

逑龙:"放心,以你的存款,AI根本看不上。"

瑞米:"...你是在安慰我吗?"


📌 附录[编辑]

API定价速览(2026年3月)

模型 输入($/1M tokens) 输出($/1M tokens)
GPT-5 $1.25 $10.00
Claude 3.7 $3.00 $15.00
Gemini 2.5 Pro $1.25 $10.00
Gemini 2.5 Flash-Lite $0.10 $0.40
DeepSeek V3 $0.28 $0.42
Qwen 3-235B $0.80 $2.00
Kimi K2 $0.57 $2.29
GLM-5 $1.20 $3.60

本报所有新闻均经核实,如有雷同,纯属AI生成。 魏启大陆版权所有,转载请注明出处。


冉青人民共和国 阳之明面报社出品 记者:冉科米 2026年3月17日