今日黄历面壁小钢炮4.0发布:性能比肩 Qwen-3-8B,极限220倍提速
新浪科技讯 6月10日下午消息,近日,面壁智能第四代“面壁小钢炮” MiniCPM4.0 端侧模型(代号“前进四”)(❕)发布。据悉,第四代小钢炮拥有 8B 、0.5B两种参数规模,实(🌱)现了同级最佳的模型性能。可让长文本、深思考在端侧真正跑起来,实现220倍极限加速。
今日黄历 其中,MiniCPM 4.0-8B 模型为稀疏注意力模型,在MMLU、CEval、MATH500、HumanEval等基准测试中,以仅22%的训练开销,性能比肩 (💖)Qwen-3-8B、超越Gemma-3-12B。MiniCPM 4.0-0.5B在性能上,也较更大的Qwen-3-0.6B、(🏪)Llama 3.2实现仅2.7%的训练开销(🙂),一半参数(🛤)性能翻倍,并实现了最快 600 Token/s的极速推理速度。
今日黄历 相较于Qwen-3-8B、Llama-3-8B、GLM-4-9B等同等参数规(➖)模端侧模(🚓)型,实现了长文本推理速度5倍常规加速以及最高 220倍加速(显存受限极限场景下测出),让端侧模型长文(🛏)本推理“快如闪电”。面壁智能联合创始人兼首席科学家刘知远在与新浪科技沟通中表示,“最高220倍(🙍)加速,其实是建立在我们模型架构、数据治理、软硬件结合、训练等方面全栈创新优化成果之上的。”
今日黄历 刘知远指出,220倍的加速看上去比较夸张,但(🈹)本身其实存在一个特殊性——由于MiniCPM4.0 在处理更长序列的数据时,可以更好地去处理Transformer架(🔽)构带来的内存爆炸问(💒)题,避免了长序列数据处理带来的内存占用倍增,而同尺寸的Qwen-3-8B、Llama-3-8B等模型并未就此进行优化,因(😈)此MiniCPM4.0有了突出的表现。
据悉,MiniCPM 4.0 模型采用的InfLLMv2稀疏注意力架构改变了传统 Transformer 模型的相关性计算(🕒)方式,有效摆脱了逐字重复计算的低效,将稀疏度从行业普遍的40%-50%,降至极致的5%,注意力层仅需1/10的计算量即可完成长文本计算(🍘)。且(💦)对算子底层重写,进一步加速(🐌)提升,并使得对文本相关性精准性大大提升。
今日黄历 值得一提的是(😂),DeepSeek 使用的长文本(🏁)处理架构NSA(Native Sparse Attention)也引用并采用了与InfLLM相(🐒)同的分块注意力计算思路,但其对于短文本的推理较慢,InfLLMv2则很好地解决了NSA在短文本推理上的短板。
在缓存消耗上,MiniCPM 4.0-8B在 128K 长文本场景下相较于Qwen3-8B仅需 1/4 的缓存存储空间。在速度、性能飙升的同时,又做到了模型极致压缩,让端侧算力不再有压力。
今日黄历 据悉,基于 8B 版本,面壁智能已微调出两个特定能力模型,分别可以用作 MCP Client 和纯端侧性能比肩Deep Research的研究报告神器MiniCPM4-Surve。截至目前,面壁小钢炮 MiniCPM 系列全平台下载量累计破1000万。(文猛)
相关链接:
- 消息称台积电有望多年代工谷歌 Tensor 手机 SoC,“至少到 Pixel 14”
- 马斯克的权力基础他的盔甲和软肋
- 10亿元规模的“有一种叫云南的生活·彩云系列消费券”启动发放
- 推荐美国国务院下令对前往哈佛的签证申请人进行额外审查
- 百度智能云与中国计算机学会数据库专委会达成战略合作 共推数据库技术革新
- 中国香港钢琴家沈靖韬在范·克莱本国际钢琴比赛中夺冠
- 新增支持 Win11 Arm,甲骨文开源虚拟机 VirtualBox 7.2.0 Beta 发布
- 国台办重申两岸两会对话沟通机制重启前提:回到“九二共识”
- 1“只谈吃亏、避谈获利”,中方揭批美国“对等关税”错误叙事
- 中国考古“黑科技”助力乌兹别克斯坦蒙扎铁佩遗址文物保护
相关新闻
- 今日黄历阳氢集团程惊雷:固态电池诞生之日, 就是电动汽车总体成本大幅度下降之时详细阅读
专题:2025轩辕汽车蓝皮书论坛 2025第十七届轩辕汽车蓝皮书论坛于2025年6月13日-15日在广州举行。阳氢集团董事长程惊雷出席并演讲。 ...
2025-06-1563
- 今日黄历“嗦粉”经济火热 中国多地“食力”出圈详细阅读
中新社南昌6月14日电 (记者 吴鹏泉)从大街小巷的早餐摊点到节庆展会的聚光灯下,中国江西、湖南、广西等多省份米粉产品热销。“嗦粉”经济也撬动流量...
2025-06-1592
- 今日黄历Meta入股49%后,AI独角兽Scale遭遇客户流失潮,谷歌带头"逃离"详细阅读
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:华尔街见闻 一场价值290亿美元的交易,本应是AI数据独角...
2025-06-15107
- 今日黄历2025战略传播论坛江西上饶开幕 中外嘉宾聚焦文明交流互鉴详细阅读
中新网上饶6月13日电 (记者 李韵涵)13日,2025战略传播论坛在江西上饶开幕,论坛以“文明交流互鉴 发展共创未来”为主题,与会中外嘉宾围绕促...
2025-06-15108
- 今日黄历越涨越卖!净值不断创新高,这些“迷你基”将离场详细阅读
近期面临清盘的基金中,即将离场的原因多种多样,其中不乏绩优产品却缺乏资金追捧从而导致一边提示清盘风险、另一边却净值持续创新高的状态。 有公募人...
2025-06-15124
- 今日黄历2025年世界杰出女科学家奖颁奖典礼在巴黎举办详细阅读
中新网巴黎6月14日电 2025年“欧莱雅-联合国教科文组织世界杰出女科学家奖”(世界杰出女科学家奖)颁奖典礼当地时间12日在位于法国巴黎的联合国...
2025-06-15135
- 详细阅读
- 今日黄历美参议院批准比利·朗出任国税局局长详细阅读
中新社华盛顿6月12日电 (记者 沙晗汀)美国国会参议院当地时间12日批准密苏里州前联邦众议员比利·朗(Billy Long)出任美国国税局局长。...
2025-06-15148