用 FlexAttention 尝试一种新的注意力模式。
机器之心 · 2024-08-11 11:01:00
混合专家,也得术业有专攻。
机器之心 · 2024-08-11 10:55:00
在人工智能迅猛发展的今天,我们不断探索着机器的智能化,但却往往忽视了这些智能体如何深层地理解我们 —— 它们的创造者。
机器之心 · 2024-08-11 10:52:00
AI穿戴甲在巴黎卖疯了
机器之心 · 2024-08-09 18:34:00
AI 大模型能力,已经全面进入了谷歌工具包。
机器之心 · 2024-08-09 17:37:00
Google DeepMind、柏林工业大学(TU Berlin)的研究人员提出了一种名为 SO3krates 的 transformer 架构,它将稀疏等变表示(欧几里得变量)与分离不变和等变信息的自注意力机制相结合,从而无需昂贵的张量积。
机器之心 · 2024-08-09 17:23:00
阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型
机器之心 · 2024-08-09 15:42:00
甬江论坛2024即将于8月15日截止申请,当前已收到来自海内外数百名优秀学者报名,欢迎感兴趣的海内外专家学者尽早申请!
专注于计算机图形学的全球学术顶会 SIGGRAPH,正在出现新的趋势。
机器之心 · 2024-08-09 14:33:00
今日获悉,由莫斯科国立大学举办的 MSU 世界视频编码器大赛结果揭晓。
机器之心 · 2024-08-09 14:27:00
但可能打不过公园里的老大爷?
机器之心 · 2024-08-09 14:22:00
RLHF 与 RL 到底能不能归属为一类,看来大家还是有不一样的看法。
机器之心 · 2024-08-09 14:17:00