随着大语言模型的快速发展,其长度外推能力(length extrapolating)正日益受到研究者的关注。
机器之心 · 2023-11-13 18:11:00
共建良好技术生态,让AI延续声音温度。
CSDN · 2023-11-13 17:42:00
近日,来自 MIT 的研究团队通过将模型和数据集大小改变多个数量级来研究大型化学模型中的神经尺度(neural-scaling)行为,研究具有超过 10 亿个参数的模型,并在多达 1000 万个数据点的数据集上进行预训练。
机器之心 · 2023-11-13 15:02:00
当今人工智能领域,最受关注的毋庸置疑是大模型。然而,高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。
机器之心 · 2023-11-13 12:05:00
网友:我都不敢想象一年后的视频技术会有多先进。
机器之心 · 2023-11-13 12:01:00
我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。
机器之心 · 2023-11-13 11:56:00
在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。
机器之心 · 2023-11-13 11:41:00
能取代酷睿 i9 和 RTX 显卡吗?
机器之心 · 2023-11-13 11:29:00
网易数帆,前身是网易杭州研究院于2016年孵化的网易云,历经7载探索与沉淀,如今已进化成为覆盖云原生、低代码、大数据和人工智能四大技术赛道的数智化服务提供商,服务于金融、央国企、能源、制造等领域300余家头部企业。
CSDN · 2023-11-13 11:10:00
国内芯片未来能否实现替代?
机器之心 · 2023-11-13 10:59:00