
根据Kuai Technology 6月17日,月球的黑暗面推出了Kimi-Dev-72B,这是一种用于软件工程任务的新开源代码模型。该模型在SWE银行验证编程测试中达到了最高的开源模型级别,超过了新的DeepSeek-R1,该测试刚刚启动并具有671B参数量。该模型通过大规模的增强学习优化,只有在通过完整的测试套件时,才可以自动修补和接收奖励皇家码头存储库,从而确保解决方案的精确性和鲁棒性。 Kimi-Dev-72b的设计理念和技术细节包括昆虫走廊和测试作者的结合,中等训练,增强和自我-Gamar在测试过程中。其中,BugFixer和Testwriter的互补设计感觉是模型的基础,在Rightror tion和写作测试中突出。中期培训提高了对实际错误c的模型的理解Orrections和单位测试通过约1500亿高质量的真实数据。强化学习阶段着重于改进代码编辑功能,并且在文件位置和代码编辑中很突出。目前,Kimi-Dev-72B被放出并以脸部和Github的拥抱显示,包括模型的权重,源代码等。