小红书开源大模型强化学习训练引擎Relax
小红书AI平台团队今日正式开源Relax —一款面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。Relax 基于 Megatron-LM 和 SGLang 高性能后端构建,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax 验证了图像、文本、音频和视频四种模态的RL 训练稳定收敛;在16xH800 多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 相关阅读
阿里云百炼上线四大开源模型阿里云百炼上线四大开源模型
19 02-25 12:16
昆仑芯拟赴港上市?百度一度涨超7%有消息人士透露在去年时昆仑芯片已经有上市相关准备计划。
193 2025-12-05 16:24
前OpenAI 联合创始人发声:AI主流发展路线已经遇到瓶颈AI来到了研究的时代。
9 181 2025-11-26 15:16
第一财经“万流引擎·资产管理全周期增长智能体蜂群”发布第一财经“万流引擎·资产管理全周期增长智能体蜂群”发布
22 2025-10-16 10:25
Perplexity CEO表示或将利用Kimi K2进行后训练Perplexity CEO表示或将利用Kimi K2进行后训练
115 2025-07-13 14:03 一财最热 点击关闭下一篇:伊朗部分空域及多个机场重新开放
