最新文章

大型语言模型（LLM）已经得到了学术界和产业界的广泛关注，而为了开发出好用的 LLM，适当的评估方法必不可少。现在，一篇有关 LLM 评估的综述论文终于来了！其中分三方面对 LLM 评估的相关研究工作进行了全面的总结，可帮助相关研究者索引和参考。

机器之心 · 2023-07-30 17:47:00

很多时候，内存限制会阻碍 ViT 以及 LLM 的训练，这篇文章介绍了 9 种减少内存消耗峰值的方法。难能可贵的是，这几种方法可以同时使用，就好像降龙十八掌中最后一掌，正是将前几张组合起来就能打出最强大的效果。

机器之心 · 2023-07-30 17:43:00