Temperature参数在生成式AI中作用

Temperature 参数在生成式 AI 中用于控制模型输出的随机性/创造性，其核心作用在于调整 Softmax 函数归一化之前的 Logits 数值，从而影响最终的概率分布。

模型的输出流程是这样的：

Logits → (Temperature 缩放) → Softmax 归一化 → 概率分布 → 采样

Logits：模型原始输出的、未经归一化的“分数”或“证据”，每个可能的词（Token）都有一个 Logit 值。数值越高，模型“认为”这个词出现在下一个位置的可能性越大。
Softmax：一个数学函数，将所有 Logits 转换为一个概率分布，使得所有词的概率之和为 1。

Temperature 的关键作用，就发生在 Logits 进入 Softmax 之前。

其操作是一个简单的除法：调整后的 Logits = 原始 Logits / Temperature

举例：原始 Logits 为 [2.0, 1.0, 0.1]，T=0.5 调整后变为 [4.0, 2.0, 0.2]，Softmax 后，第一个词的概率会变得极高。

举例：原始 Logits 为 [2.0, 1.0, 0.1]，T=2.0 调整后变为 [1.0, 0.5, 0.05]，Softmax 后，三个词的概率会变得相对接近，第三、第二词“被选中”的几率大大增加。

Temperature 本质上是一个平滑/锐化概率分布的控制旋钮，它通过在 Softmax 归一化前对原始 Logits 进行缩放来工作。

THE END