谷歌推出开源LMEval框架,简化AI模型评测,跨平台无缝运行且降本增效

[复制链接]
周大 发表于 2025-5-28 14:22:20 | 显示全部楼层 |阅读模式
谷歌推出了开源框架 LMEval,旨在解决大语言模型和多模态模型评测中的标准化难题。该框架通过 LiteLLM 抹平不同平台接口差异,支持文本、图像、代码等多领域测试,并引入 Giskard 安全评分以评估模型安全性。LMEval 提供增量评估和多线程处理功能,有效降低时间和计算成本,同时其可视化工具 LMEvalboard 能直观展示模型表现,助力研究人员精准定位问题并优化模型性能。
来源:https://tech.ifeng.com/c/8jhJNUUjnVW

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 05:36 , Processed in 0.285392 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表