思维链 - 中国电竞网 - 最专业的电子竞技门户网站！

谷歌 DeepMind 通过强化学习微调提升 AI 决策能力

近期，谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作，开展了一项关于人工智能语言模型的新研究。他们采用了强化学习微调（RLFT）技术，旨在提升语言模型的决策能力...

苏轻衣 2025-05-20 1047 AIbase基地