自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。
机器之心 · 2024-03-25 14:42:00
PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。
机器之心 · 2024-03-25 14:36:00
最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。
机器之心 · 2024-03-25 14:30:00
刚刚,Mistral AI 的模型又更新了。
机器之心 · 2024-03-25 11:23:00
视频理解的核心目标在于对时空表示的把握,这存在两个巨大挑战:短视频片段存在大量时空冗余和复杂的时空依赖关系。
机器之心 · 2024-03-25 11:19:00