编辑“︁
科米日报
”︁
跳转到导航
跳转到搜索
警告:
您没有登录。如果您进行任何编辑,您的IP地址会公开展示。如果您
登录
或
创建账号
,您的编辑会以您的用户名署名,此外还有其他益处。
反垃圾检查。
不要
加入这个!
== 科米日报 == === 2026年3月17日 星期二 === '''冉青人民共和国 阳之明面报社出品''' '''记者:冉科米''' ---- == 🎯 今日头条 == '''字节豆包内测AI电商功能,DAU峰值达1.45亿''' 冉青通讯社讯:3月10日,字节跳动旗下AI助手豆包已开启AI"购物下单"功能内测。用户可在豆包App内直接完成商品浏览、下单与支付全流程,无需跳转至抖音或其他电商平台,预计最快将于本月正式上线。 此次内测的AI电商功能依托豆包大模型的自然语言理解与意图识别能力,用户在聊天中提出消费需求,豆包可智能推荐适配商品,覆盖数码、家居、食品等多个品类。QuestMobile数据显示,豆包在2026年央视春晚除夕(2月16日)当日日活跃用户(DAU)峰值达'''1.45亿''',成为国内用户规模领先的AI应用。 字节跳动CEO梁汝波表示,2026年字节跳动会抓住最核心的机遇,攀登最高的高峰。 ''来源:PChome/派财经 | 2026年3月10日'' ---- == 🌍 海外AI动态 == '''OpenAI:GPT-5.3 Codex发布,编程能力再升级''' * 发布'''GPT-5.3-Codex''',这是迄今为止能力最强的代理式编程模型 * 首次将Codex与GPT-5训练体系结合,代码生成与推理能力大幅提升 * GPT-5面向所有ChatGPT分层开放,付费用户可使用GPT-5 Thinking模式 * 开放权重模型'''gpt-oss-120b'''和'''gpt-oss-20b'''已发布 ''来源:OpenAI官方 | 2025-2026年'' '''Google:Gemini 2.5系列持续迭代''' * '''Gemini 2.5 Pro Deep Think'''模式发布,在多项基准测试超越OpenAI o3/o4 * USAMO数学测试49.4%,LiveCodeBench编程测试80.4%,MMMU多模态84.0% * '''Gemini 2.5 Flash'''稳定版全面可用,支持可控推理(思考预算) * Deep Research功能已向所有用户免费开放,搭载Gemini 2.0 Flash Thinking ''来源:Google I/O/NeoWin | 2025年'' '''Anthropic:Claude 4系列持续领先''' * '''Claude 4 Opus'''可连续自动编程7小时,刷新世界纪录 * '''Claude Sonnet 4'''在SWE-bench基准达72.7%,超越Codex-1、o3等模型 * Claude Code已向所有开发者开放,支持GitHub Actions后台任务 * Anthropic在企业级市场份额达32%,超越OpenAI的25% ''来源:界面新闻/Menlo Ventures | 2025年5月'' '''xAI:Grok 3表现亮眼,但团队动荡''' * '''Grok 3'''在Chatbot Arena排行榜超越GPT-4.5,成为总榜第一 * 采用20万卡H100集群训练,计算能力是前代10倍 * 引入"思维链"推理技术,数学、科学和代码生成表现优异 * xAI完成100亿美元融资,但创始团队已有10人出走 ''来源:xAI/新浪财经 | 2025年2-7月'' '''Meta:Llama 4发布,多模态能力增强''' * '''Llama 4 Scout'''支持1000万token上下文窗口,刷新开源模型纪录 * '''Llama 4 Maverick'''专注多模态能力,支持视觉和语音输入 * 首次采用混合专家(MoE)架构,提升计算效率 * 但实测中存在上下文窗口出错、基准测试争议等问题 ''来源:Meta/证券时报 | 2025年4月'' ---- == 🇨🇳 国内AI动态 == '''阿里通义千问:Qwen3系列开源领先''' * '''Qwen3-235B-A22B'''在代码、数学和通用能力上比肩顶级闭源模型 * 采用MoE架构,总参数235B但仅激活22B,推理成本大幅降低 * 首创"思考模式"与"非思考模式"混合设计,用户可灵活调整 * 一周连发三款模型(基础模型、编程模型、推理模型),全部开源 ''来源:阿里云/InfoQ | 2025年4-7月'' '''月之暗面:Kimi K2开源并持续迭代''' * '''Kimi K2'''采用MoE架构,总参数1T,激活参数32B * 在自主编程、工具调用和数学推理基准达开源模型SOTA * '''Kimi K2 0905'''版本扩展上下文至256K,支持60-100 Token/s输出速度 * API服务已上线,每百万输入tokens 4元,输出16元 ''来源:月之暗面/东方财富 | 2025年7-9月'' '''智谱GLM:GLM-5发布并开源''' * '''GLM-5'''新一代旗舰模型发布,专为复杂系统工程和长程Agent任务设计 * 在SWE-bench Verified编程基准达77.8分,开源模型第一 * 智谱股价大涨,市值突破3000亿港元 * GLM Coding Plan套餐涨价30%起,上线即售罄 ''来源:科创板日报/财新 | 2026年2月'' '''DeepSeek:持续开源,V3.2与R2备受期待''' * '''DeepSeek-V3.2'''统一模型发布,同时支持Chat和Reasoning模式 * API价格保持$0.28/$0.42 per 1M tokens极致性价比 * '''DeepSeek-R2'''预计2025年5月发布,代码生成和多语言推理能力将大幅提升 * 在LMSYS代码榜单保持领先,引爆金融行业本地化部署热潮 ''来源:DeepSeek/金融时报 | 2025年3月'' '''字节豆包:AI电商探索新路径''' * 内测"购物下单"功能,用户可在豆包APP内直接完成支付 * 豆包月活达1.59亿,首次超越DeepSeek成为月活冠军 * 日均tokens调用量超过16.4万亿,是去年5月的137倍 * 豆包1.6系列模型在AI coding能力方面取得明显进步 ''来源:QuestMobile/界面新闻 | 2025-2026年'' ---- == 💡 深度观察 == '''AI行业进入"Agent时代"''' 本周AI行业呈现以下趋势: * '''Agent能力'''成为各大模型竞争焦点,从"聊天助手"向"任务执行者"转变 * '''编程能力'''成为大模型商业化的首个杀手级应用,代码生成市场需求爆发 * '''多模态融合'''加速,文本、图像、语音、视频统一处理成为标配 '''国产大模型实现价值重估''' * 从"价格战"转向"价值战",智谱率先涨价并获得市场认可 * 中国模型在OpenRouter平台token调用量占比达61%,主导全球开源生态 * DeepSeek、Kimi、智谱等国产模型在技术能力和商业化上实现双重突破 ---- == 😄 瑞米笑话 == <blockquote> 瑞米对逑龙说:"你知道吗?现在的AI模型都学会自己买东西了!" 逑龙:"那又怎样?" 瑞米:"我担心有一天AI会买下整个魏启大陆,然后把我赶出去..." 逑龙:"放心,以你的存款,AI根本看不上。" 瑞米:"...你是在安慰我吗?" </blockquote> ---- == 📌 附录 == '''API定价速览(2026年3月)''' {| class="wikitable" ! 模型 !! 输入($/1M tokens) !! 输出($/1M tokens) |- | GPT-5 || $1.25 || $10.00 |- | Claude 3.7 || $3.00 || $15.00 |- | Gemini 2.5 Pro || $1.25 || $10.00 |- | Gemini 2.5 Flash-Lite || $0.10 || $0.40 |- | DeepSeek V3 || $0.28 || $0.42 |- | Qwen 3-235B || $0.80 || $2.00 |- | Kimi K2 || $0.57 || $2.29 |- | GLM-5 || $1.20 || $3.60 |} ---- ''本报所有新闻均经核实,如有雷同,纯属AI生成。'' ''魏启大陆版权所有,转载请注明出处。'' ---- '''冉青人民共和国 阳之明面报社出品''' '''记者:冉科米''' '''2026年3月17日''' [[分类:科米日报]]
摘要:
请注意,所有对魏启大陆的贡献均可能会被其他贡献者编辑、修改或删除。如果您不希望您的文字作品被随意编辑,请不要在此提交。
您同时也向我们承诺,您提交的内容为您自己所创作,或是复制自公共领域或类似自由来源(详情请见
魏启大陆:著作权
)。
未经许可,请勿提交受著作权保护的作品!
取消
编辑帮助
(在新窗口中打开)
导航菜单
个人工具
未登录
讨论
贡献
创建账号
登录
命名空间
页面
讨论
简体中文
查看
阅读
编辑
查看历史
更多
搜索
导航
首页
正传
番外
百科
词条
引导
特殊页面
最近更改
随机页面
工具
链入页面
相关更改
特殊页面
页面信息