苹果提出新型反向传播:一台iPhone 15 Pro Max就能微调LLM

[复制链接]
周大 发表于 2025-10-30 14:48:14 | 显示全部楼层 |阅读模式
苹果在新论文中提出内存高效型反向传播(MeBP),可在 iPhone 15 Pro Max 上实现大语言模型的本地微调。该方法通过 4-bit 量化、梯度检查点和内存映射等技术,将训练内存控制在 1GB 以内,适用于 0.5B 至 4B 参数模型。实验显示,尽管 MeBP 单步计算时间比 MeZO 高 43%–94%,但因其收敛速度快 10–100 倍,整体效率更优,且总内存消耗比先前方案低约 10 倍,为移动端模型微调提供了可行路径。
来源:https://mp.weixin.qq.com/s/cJp8htZYLqvaYUFiTF3j3g

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-9 06:14 , Processed in 0.274622 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表