微软开发出超高效的能运行在 CPU 上的 AI 模型

热点资讯 2025年4月17日 pm7:05 0 来源: 奇客资讯网

微软研究人员声称，他们开发出迄今为止规模最大的 1 位 AI 模型 bitnet。该模型命名为 BitNet b1.58 2B4T，采用 MIT 许可证发布，能在包括苹果 M2 处理器在内的各种 CPU 上运行。大模型是通过修改人工神经元之间的连接强度进行训练，连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络，这一过程被称为量化，参数的位数能从 16 位减少到 8 或 4 位，研究人员正致力于将其推向极限——以 1 位精度储存参数。压缩能让模型在低端硬件上运行。bitnet 将权重量化为三个值：-1、0 和 1，其内存和计算效率远高于大多数模型。BitNet b1.58 2B4T 是首个拥有 20 亿个参数的 bitnet，测试中该模型在包括 GSM8K（小学水平数学题库）和 PIQA（测试物理常识推理能力）的测试中超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。

文章版权归作者所有，未经允许请勿转载。

前一篇：美国主要 AI 公司六成其创始人有移民背景

后一篇：研究发现五成员工使用未批准的 AI 工具

发表回复取消回复

要发表评论，您必须先登录。

微软开发出超高效的能运行在 CPU 上的 AI 模型

相关文章

发表回复 取消回复

发表回复取消回复