Top-p (Nucleus Sampling)

Top-p(又称核采样)是除了 Temperature 之外,另一个常用的控制模型输出随机性的参数。

工作原理

模型在生成下一个词时,会预测所有可能词的概率分布。
  • Top-p = 0.1: 模型只考虑累积概率达到 10% 的那些最高概率的词。这会使输出非常保守和准确。
  • Top-p = 0.9: 模型会考虑累积概率达到 90% 的词,这意味着很多低概率的词也有机会被选中,增加了多样性。

Top-p vs Temperature

  • Temperature 是调整概率分布的“形状”(平滑或尖锐)。
  • Top-p 是直接“截断”低概率的尾部。

最佳实践

不要同时调整 Temperature 和 Top-p。 通常建议:
  • 固定 Top-p (例如 1.0),只调整 Temperature。
  • 或者固定 Temperature (例如 1.0),只调整 Top-p。