作者采用蒙特卡洛树搜索算法(MCTS)的变体从PPO模型中进行解码,并将新方法命名为PPO-MCTS。
机器之心 · 2023-10-27 13:02:00
小i机器人在上海正式发布了华藏通用大模型生态体系
机器之心 · 2023-10-27 09:53:00