NuRL имеет поразительное сходство с QUESTA, которая вышла в тот же день (30 сентября), но появилась в моем таймлайне раньше. Та же идея по улучшению CoT для сложных задач с подсказками, тот же аргумент о сохранении/увеличении pass@k. Сильный сигнал о том, что это естественное решение.