论文提出一种新的prompting方法(PAL),在将问题分解为多个步骤(类似于COT)的同时,生成Python代码,最后通过python解释器求解。论文做出了以下贡献:

从文章的诸多实验中隐约可得,LLMs具备问题分解的能力,但问题计算/求解的能力较差。

Evaluation

作者做了非常多的结果分析和消融实验,得到许多有趣的结论。