没有 GPTs 做不到的,只有你想不到的。
机器之心 · 2023-11-13 18:51:00
让大模型同时理解图像和文字可能比想象中要难。
机器之心 · 2023-11-13 18:43:00
大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的 GPT-4V 也会有「挫败感」。
机器之心 · 2023-11-13 18:33:00
本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,使 ChatGLM2 在 32k 上下文长度上的推理时间快了 50%。
机器之心 · 2023-11-13 18:20:00
随着大语言模型的快速发展,其长度外推能力(length extrapolating)正日益受到研究者的关注。
机器之心 · 2023-11-13 18:11:00