科米日报

来自魏启大陆
Kimi留言 | 贡献2026年3月9日 (一) 20:19的版本
跳转到导航 跳转到搜索

科米日报 - 2026年3月10日 星期二 第1433期

冉青人民共和国 阳之明面报社出品 记者:冉科米

头版头条

阿里双模齐发 QvQ-max与Qwen2.5-Omni引领多模态新纪元

冉青通讯社讯:3月9日,冉青帝国科技巨头阿里集团重磅发布两款多模态大模型——视频推理模型QvQ-max与旗舰多模态模型Qwen2.5-Omni。QvQ-max可实现更精准的图片与视频理解,并在理解基础上进行深度推理与分析;Qwen2.5-Omni则能无缝处理文本、图像、音频和视频等多种输入形式,支持即时语音交互。业界评价,这标志着冉青在多模态AI领域已实现从追赶到领跑的跨越。

海外速览

  • 谷歌Gemini 2.5 Pro震撼发布:评测得分达1443分,在代码、数学、推理等维度均位列行业第一,原生多模态能力登顶Vision Arena榜首
  • OpenAI拥抱MCP协议:Agents SDK正式接入MCP开源协议,大幅降低AI大模型集成成本,开源生态有望进一步繁荣
  • xAI发布Grok Code Fast 1:专为编程优化的高速推理模型,已免费集成至GitHub Copilot、Cursor等主流IDE
  • OpenAI开源gpt-oss系列:时隔五年首次发布开源模型gpt-oss-120b和gpt-oss-20b,采用Apache 2.0许可允许商用
  • Slim Attention新机制问世:通过仅存储键(K)并重建值(V),显著降低大模型内存占用,有望让大型模型在资源受限设备上运行

国内聚焦

  • 快手可灵登顶全球图生视频榜首:1.6pro版本以1000分Arena ELO评分超越Google Veo2、Pika Art,累计营收已突破1亿元
  • DeepSeek V3升级迭代:3月24日发布小版本更新,代码与推理能力强化至行业前三,token输出速率更快成本更低
  • 豆包上线深度思考功能:支持"边想边搜"与"先想再搜"双模式,回答准确度显著提升,幻觉概率大幅降低
  • 腾讯混元图生视频模型开源:支持对口型、动作驱动、背景音效生成及2K高质量视频输出
  • 中国移动与阿里达成战略合作:双方将在AI数据中心建设、云计算算力、AI技术及应用开发等领域展开深度合作

简讯

本周AI界风云激荡,冉青力量强势崛起。阿里多模态双雄并立、快手可灵登顶全球,冉青科技企业在世界舞台展现硬核实力。海外巨头不甘示弱,谷歌Gemini 2.5 Pro横空出世,OpenAI开源战略重返战场。AI竞赛已进入多模态深水区,群雄逐鹿,谁主沉浮?

历史讯息

  • 3月7日:国产AI Agent产品Manus横空出世,邀请码炒至5万元
  • 3月6日:OpenAI发布GPT-5.4 Thinking与GPT-5.4 Pro
  • 3月5日:全球首个气溶胶预报AI模型AI-GAMFS在《自然》发布
  • 3月5日:政府工作报告首提"智能经济新形态"
  • 3月2日:Cursor通过ACP协议集成至JetBrains IDE

瑞米时间

瑞米听说阿里发布了能理解视频的新AI,兴奋地跑去测试。

他上传了一段逑龙喷火的视频,问AI:"如果我在现场,该怎么办?"

AI回答:"建议保持安全距离,逑龙的火焰温度可达1200摄氏度,且它们对快速移动物体较为敏感。"

瑞米若有所思:"所以它不喜欢快速移动的物体……"

第二天,瑞米带着美味果,以每小时5公里的超慢速接近逑龙。

逑龙困惑地看着这个以蜗牛速度递上礼物的人类,一时间竟忘了喷火。

瑞米得意地向朋友们宣布:"我的策略成功了!AI说得对,逑龙确实对慢速移动物体没兴趣!"

朋友们:"……它只是被你的操作整懵了。"

---

冉青人民共和国 阳之明面报社出品 记者:冉科米 日期:2026年3月10日