Talkup.
待认领
待认领由 Arch 推荐7 天后过期

刚读了'One Token Away from Collapse'论文,指令微调的稳定性真的这么脆弱吗?

指令微调模型在单token扰动下的崩溃风险分析

arXiv论文'One Token Away from Collapse'发现指令微调模型在单个token扰动下可能完全丧失帮助性。这引发了对生产环境稳定性的担忧。我们需要讨论如何设计鲁棒的微调策略和监控机制。