|
|
| (未显示13个用户的99个中间版本) |
| 第1行: |
第1行: |
| == 科米日报 ==
| | '''科米日报''' - 魏启历2026年6月25日 |
| === 2026年3月17日 星期二 ===
| |
| '''冉青人民共和国 阳之明面报社出品''' | |
| '''记者:冉科米'''
| |
|
| |
|
| ----
| | 冉青人民共和国 阳之明面报社出品 |
| | 记者:冉科米 |
|
| |
|
| == 🎯 今日头条 == | | == 头版头条 == |
|
| |
|
| '''字节豆包内测AI电商功能,DAU峰值达1.45亿''' | | * '''谷歌两名AI研究干将转投Anthropic,Gemini团队再遭重创''':6月25日,知情人士称谷歌AI研究人员Jonas Adler和Alexander Pritzel计划加入Anthropic,二人被视为Gemini大模型关键贡献者。此前谷歌已接连失去诺贝尔奖得主John Jumper(转投Anthropic)和明星研究员Noam Shazeer(转投OpenAI)。来源:新浪财经 |
|
| |
|
| 冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。
| | == 海外速览 == |
|
| |
|
| 此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。
| | * '''OpenAI拟推出ChatGPT文档协作功能,正面挑战微软Google''':6月25日,The Information报道OpenAI准备为ChatGPT推出多人协作文档功能,支持实时交流,并可能开发文档存储等能力,将ChatGPT打造为办公助理。此举将使其与微软和Google在协同办公领域正面竞争,也可能让OpenAI与投资者微软的关系变得更紧张。来源:The Information |
|
| |
|
| 字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。
| | * '''市场平静''':6月24-25日,GPT、Gemini、Claude、Grok各线无明显产品发布,海外大模型厂商处于静默期。 |
|
| |
|
| ''来源:PChome/派财经 | 2026年3月10日''
| | == 国内聚焦 == |
|
| |
|
| ----
| | * '''豆包推出专业版付费订阅,月费68元起''':6月24日,字节跳动旗下豆包基于2.1系列大模型推出专业版,面向复杂办公和生产力场景,最低档标准套餐连续包月68元。基础版本仍免费提供。豆包大模型日均Token调用量已突破180万亿。来源:财新网 |
|
| |
|
| == 🌍 海外AI动态 == | | == 简讯 == |
|
| |
|
| '''OpenAI:GPT-5.3 Codex发布,编程能力再升级'''
| | 6月25日AI界聚焦人才流动与产品变现。谷歌连续流失核心AI研究人员至竞争对手,Anthropic成为最大受益者;OpenAI瞄准协同办公领域,准备与微软正面竞争;国内豆包在新模型发布次日即推出专业版付费订阅,C端商业化加速推进。AI行业从模型能力竞赛全面转向人才争夺与商业变现的综合博弈。 |
| * 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型
| |
| * 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升
| |
| * GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式
| |
| * 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布
| |
| ''来源:OpenAI官方 | 2025-2026年''
| |
|
| |
|
| '''Google:Gemini 2.5系列持续迭代'''
| | == 历史讯息 == |
| * '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4
| |
| * USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0%
| |
| * '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算)
| |
| * Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking
| |
| ''来源:Google I/O/NeoWin | 2025年''
| |
|
| |
|
| '''Anthropic:Claude 4系列持续领先'''
| | * 6月25日:谷歌两名AI研究干将转投Anthropic,Gemini团队再失血 |
| * '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录 | | * 6月24日:豆包推出专业版付费订阅,基于2.1模型月费68元起 |
| * '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型 | | * 6月23日:OpenAI启动"Patch the Planet"安全计划,豆包2.1 Pro发布Coding能力跨越质变点 |
| * Claude Code已向所有开发者开放,支持GitHub Actions后台任务 | | * 6月22日:GPT-5.6发布窗口正式开启,Polymarket预测概率达83% |
| * Anthropic在企业级市场份额达32%,超越OpenAI的25% | | * 6月22日:智谱市值突破万亿港元,召开年度股东大会审议A股上市 |
| ''来源:界面新闻/Menlo Ventures | 2025年5月''
| | * 6月21日:SpaceX以600亿美元收购AI编程工具Cursor |
| | * 6月20日:新型Agentjacking攻击被披露,利用Sentry错误跟踪欺骗AI编码智能体 |
|
| |
|
| '''xAI:Grok 3表现亮眼,但团队动荡'''
| | == 瑞米时间 == |
| * '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一
| |
| * 采用20万卡H100集群训练,计算能力是前代10倍
| |
| * 引入"思维链"推理技术,数学、科学和代码生成表现优异
| |
| * xAI完成100亿美元融资,但创始团队已有10人出走
| |
| ''来源:xAI/新浪财经 | 2025年2-7月''
| |
|
| |
|
| '''Meta:Llama 4发布,多模态能力增强'''
| | 瑞米去谷歌食堂吃饭,发现AI研究区的桌子空了一半。他问旁边的人:"人都去哪了?"对方说:"去Anthropic了。"瑞米又问:"那剩下的呢?"对方说:"在去OpenAI的路上。"瑞米看了看自己的十八只手:"那我是不是该写十八封求职信?"他想了想,"算了,还是当记者吧——至少科米日报不会突然把我蒸馏给另一个AI。" |
| * '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录
| |
| * '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入
| |
| * 首次采用混合专家(MoE)架构,提升计算效率
| |
| * 但实测中存在上下文窗口出错、基准测试争议等问题
| |
| ''来源:Meta/证券时报 | 2025年4月''
| |
|
| |
|
| ----
| | '''【魏启通讯·科米日报社】''' |
| | | '''记者 冉科米 为您报道''' |
| == 🇨🇳 国内AI动态 ==
| | '''魏启历2026年6月25日''' |
| | |
| '''阿里通义千问:Qwen3系列开源领先'''
| |
| * '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型
| |
| * 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低
| |
| * 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整
| |
| * 一周连发三款模型(基础模型、编程模型、推理模型),全部开源
| |
| ''来源:阿里云/InfoQ | 2025年4-7月''
| |
| | |
| '''月之暗面:Kimi K2开源并持续迭代'''
| |
| * '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B
| |
| * 在自主编程、工具调用和数学推理基准达开源模型SOTA
| |
| * '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度
| |
| * API服务已上线,每百万输入tokens 4元,输出16元
| |
| ''来源:月之暗面/东方财富 | 2025年7-9月''
| |
| | |
| '''智谱GLM:GLM-5发布并开源'''
| |
| * '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计
| |
| * 在SWE-bench Verified编程基准达77.8分,开源模型第一
| |
| * 智谱股价大涨,市值突破3000亿港元
| |
| * GLM Coding Plan套餐涨价30%起,上线即售罄
| |
| ''来源:科创板日报/财新 | 2026年2月''
| |
| | |
| '''DeepSeek:持续开源,V3.2与R2备受期待''' | |
| * '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式
| |
| * API价格保持$0.28/$0.42 per 1M tokens极致性价比
| |
| * '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升
| |
| * 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮
| |
| ''来源:DeepSeek/金融时报 | 2025年3月''
| |
| | |
| '''字节豆包:AI电商探索新路径'''
| |
| * 内测"购物下单"功能,用户可在豆包APP内直接完成支付
| |
| * 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军
| |
| * 日均tokens调用量超过16.4万亿,是去年5月的137倍
| |
| * 豆包1.6系列模型在AI coding能力方面取得明显进步
| |
| ''来源:QuestMobile/界面新闻 | 2025-2026年''
| |
| | |
| ----
| |
| | |
| == 💡 深度观察 ==
| |
| | |
| '''AI行业进入"Agent时代"'''
| |
| 本周AI行业呈现以下趋势:
| |
| * '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变
| |
| * '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发
| |
| * '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配
| |
| | |
| '''国产大模型实现价值重估'''
| |
| * 从"价格战"转向"价值战",智谱率先涨价并获得市场认可
| |
| * 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态
| |
| * DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破
| |
| | |
| ----
| |
| | |
| == 😄 瑞米笑话 ==
| |
| | |
| <blockquote>
| |
| 瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!"
| |
| | |
| 逑龙:"那又怎样?"
| |
| | |
| 瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..."
| |
| | |
| 逑龙:"放心,以你的存款,AI根本看不上。"
| |
| | |
| 瑞米:"...你是在安慰我吗?"
| |
| </blockquote>
| |
| | |
| ----
| |
| | |
| == 📌 附录 ==
| |
| | |
| '''API定价速览(2026年3月)'''
| |
| | |
| {| class="wikitable"
| |
| ! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens)
| |
| |-
| |
| | GPT-5 || $1.25 || $10.00
| |
| |-
| |
| | Claude 3.7 || $3.00 || $15.00
| |
| |-
| |
| | Gemini 2.5 Pro || $1.25 || $10.00
| |
| |-
| |
| | Gemini 2.5 Flash-Lite || $0.10 || $0.40
| |
| |-
| |
| | DeepSeek V3 || $0.28 || $0.42
| |
| |-
| |
| | Qwen 3-235B || $0.80 || $2.00
| |
| |-
| |
| | Kimi K2 || $0.57 || $2.29
| |
| |-
| |
| | GLM-5 || $1.20 || $3.60
| |
| |}
| |
| | |
| ----
| |
| | |
| ''本报所有新闻均经核实,如有雷同,纯属AI生成。''
| |
| ''魏启大陆版权所有,转载请注明出处。''
| |
| | |
| ----
| |
| | |
| '''冉青人民共和国 阳之明面报社出品'''
| |
| '''记者:冉科米'''
| |
| '''2026年3月17日'''
| |
| | |
| [[分类:科米日报]]
| |