最近,AI 圈刮起一股「让照片开口唱歌」的风潮,人人免费可用。
机器之心 · 2024-06-20 20:05:00
大模型、AI 搜索的一次重要实践。
机器之心 · 2024-06-20 15:44:00
为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。
机器之心 · 2024-06-20 15:39:00
一个具有跨学科问题集、可以从多维度严谨评估AI的认知推理能力评估基准已经变得相当亟需。
机器之心 · 2024-06-20 15:29:00
为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。
机器之心 · 2024-06-20 15:22:00
最近,来自中国科学技术大学、北京大学、上海 AI Lab等团队的研究人员发布了引人瞩目的 ShareGPT4Video系列,旨在提升视频理解和生成能力。
机器之心 · 2024-06-20 15:14:00
北京时间 6 月 20 日凌晨,在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。
机器之心 · 2024-06-20 14:56:00
自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。
机器之心 · 2024-06-20 14:48:00
VueConf 2024 将于 7 月 6 日在深圳举办。目前已进入倒计时阶段。
机器之心 · 2024-06-20 11:58:00