最新文章

最近，AI 圈刮起一股「让照片开口唱歌」的风潮，人人免费可用。

机器之心 · 2024-06-20 20:05:00

大模型、AI 搜索的一次重要实践。

机器之心 · 2024-06-20 15:44:00

为了实现高精度的区域级多模态理解，本文提出了一种动态分辨率方案来模拟人类视觉认知系统。

机器之心 · 2024-06-20 15:39:00

一个具有跨学科问题集、可以从多维度严谨评估AI的认知推理能力评估基准已经变得相当亟需。

机器之心 · 2024-06-20 15:29:00

为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，并都取得了先进的性能表现。

机器之心 · 2024-06-20 15:22:00

最近，来自中国科学技术大学、北京大学、上海 AI Lab等团队的研究人员发布了引人瞩目的 ShareGPT4Video系列，旨在提升视频理解和生成能力。

机器之心 · 2024-06-20 15:14:00

北京时间 6 月 20 日凌晨，在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。

机器之心 · 2024-06-20 14:56:00

自 5 月 15 日从 OpenAI 离职后，OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。

机器之心 · 2024-06-20 14:48:00

VueConf 2024 将于 7 月 6 日在深圳举办。目前已进入倒计时阶段。

机器之心 · 2024-06-20 11:58:00