Advertisement

论文略读:Case-Based or Rule-Based: How Do Transformers Do the Math?

阅读量:

ICML 2024

1 基于规则的推理(rule-based) VS 基于样例的推理(case-based)

  • 一个是基于训练语料库中见过的相似样例
  • 一个是根据学习获得的核心规则

2 方法 & 结论

2.1 直接问答案:case-based

  • 论文评估了Leav-square-out方法来测试大模型的推理能力。
  • 识别关键样本在训练数据中对模型性能的影响。
  • 移除这些样本后观察其对测试性能的影响。
  • 被圈出的部分是非训练集中未展示的数据
    • 如果采用基于规则的方法(rule-based),其在类似场景下的表现应大致相近;然而,在本案例中(red box中的部分),其准确率显著偏低
    • 这表明该大模型采用了基于案例的学习方法

2.2 scratchpad(引导LLM一位一位做加法):case-based

  • 显示结果表明下半部分的准确率为零
  • 该模型不具备解决类似47+48问题的能力, 因为其训练过程中缺少了涉及十位进位的过程
  • 未涉及进位的情况表现较好, 在涉及进制转换的情况下则表现较差

2.3 论文提出的方法: Rule-Following Fine-Tuning (RFFT)

  • 目的是为了教会 transformers 进行基于规则的推理
    • 在输入中提供显式的规则,并逐步引导 transformers 按照这些明确的规则进行推理过程

3 结果

全部评论 (0)

还没有任何评论哟~