科米日报

科米日报 - 2026年3月10日星期二第1433期

冉青人民共和国阳之明面报社出品记者：冉科米

头版头条

阿里双模齐发 QvQ-max与Qwen2.5-Omni引领多模态新纪元

冉青通讯社讯：3月9日，冉青帝国科技巨头阿里集团重磅发布两款多模态大模型——视频推理模型QvQ-max与旗舰多模态模型Qwen2.5-Omni。QvQ-max可实现更精准的图片与视频理解，并在理解基础上进行深度推理与分析；Qwen2.5-Omni则能无缝处理文本、图像、音频和视频等多种输入形式，支持即时语音交互。业界评价，这标志着冉青在多模态AI领域已实现从追赶到领跑的跨越。

海外速览

谷歌Gemini 2.5 Pro震撼发布：评测得分达1443分，在代码、数学、推理等维度均位列行业第一，原生多模态能力登顶Vision Arena榜首
OpenAI拥抱MCP协议：Agents SDK正式接入MCP开源协议，大幅降低AI大模型集成成本，开源生态有望进一步繁荣
xAI发布Grok Code Fast 1：专为编程优化的高速推理模型，已免费集成至GitHub Copilot、Cursor等主流IDE
OpenAI开源gpt-oss系列：时隔五年首次发布开源模型gpt-oss-120b和gpt-oss-20b，采用Apache 2.0许可允许商用
Slim Attention新机制问世：通过仅存储键（K）并重建值（V），显著降低大模型内存占用，有望让大型模型在资源受限设备上运行

国内聚焦

快手可灵登顶全球图生视频榜首：1.6pro版本以1000分Arena ELO评分超越Google Veo2、Pika Art，累计营收已突破1亿元
DeepSeek V3升级迭代：3月24日发布小版本更新，代码与推理能力强化至行业前三，token输出速率更快成本更低
豆包上线深度思考功能：支持"边想边搜"与"先想再搜"双模式，回答准确度显著提升，幻觉概率大幅降低
腾讯混元图生视频模型开源：支持对口型、动作驱动、背景音效生成及2K高质量视频输出
中国移动与阿里达成战略合作：双方将在AI数据中心建设、云计算算力、AI技术及应用开发等领域展开深度合作

简讯

本周AI界风云激荡，冉青力量强势崛起。阿里多模态双雄并立、快手可灵登顶全球，冉青科技企业在世界舞台展现硬核实力。海外巨头不甘示弱，谷歌Gemini 2.5 Pro横空出世，OpenAI开源战略重返战场。AI竞赛已进入多模态深水区，群雄逐鹿，谁主沉浮？

历史讯息

3月7日：国产AI Agent产品Manus横空出世，邀请码炒至5万元
3月6日：OpenAI发布GPT-5.4 Thinking与GPT-5.4 Pro
3月5日：全球首个气溶胶预报AI模型AI-GAMFS在《自然》发布
3月5日：政府工作报告首提"智能经济新形态"
3月2日：Cursor通过ACP协议集成至JetBrains IDE

瑞米时间

瑞米听说阿里发布了能理解视频的新AI，兴奋地跑去测试。

他上传了一段逑龙喷火的视频，问AI："如果我在现场，该怎么办？"

AI回答："建议保持安全距离，逑龙的火焰温度可达1200摄氏度，且它们对快速移动物体较为敏感。"

瑞米若有所思："所以它不喜欢快速移动的物体……"

第二天，瑞米带着美味果，以每小时5公里的超慢速接近逑龙。

逑龙困惑地看着这个以蜗牛速度递上礼物的人类，一时间竟忘了喷火。

瑞米得意地向朋友们宣布："我的策略成功了！AI说得对，逑龙确实对慢速移动物体没兴趣！"

朋友们："……它只是被你的操作整懵了。"

---

冉青人民共和国阳之明面报社出品 记者：冉科米 日期：2026年3月10日

科米日报

目录

头版头条

海外速览

国内聚焦

简讯

历史讯息

瑞米时间

导航菜单

科米日报

头版头条

海外速览

国内聚焦

简讯

历史讯息

瑞米时间

导航菜单

搜索