多机构联合发布LEXam法律AI评估标准,专精推理模型表现优异,展现法律推理新趋势

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
研究人员发布多语言法律推理基准数据集LEXam,涵盖4886道问题,涉及瑞士及国际法等领域。实验显示,专精推理优化模型(如Gemini-2.5-Pro)在复杂法律推理中表现最佳,而通用模型如GPT-4亦有不俗成绩。研究发现,模型在英文任务和国际法领域表现更优,但在多选项或地区法律任务中准确率下降明显,揭示了当前大模型在法律推理领域的潜能与局限性。
来源:https://mp.weixin.qq.com/s/RpXrssl8vhwFqO_ZeN0jPA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 17:56 , Processed in 0.284884 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表