生成参数

调整这些设置以控制模型输出。

关键参数

Temperature

控制回复中的随机性。

值	效果	用例
0.0 - 0.3	非常一致，确定性	事实性答案，代码
0.5 - 0.7	平衡	一般对话
0.8 - 1.0	更多变化，创造性	创意写作
1.0+	非常随机	头脑风暴

Low temperature (0.3):  "The capital of France is Paris."
High temperature (1.2): "Paris, the city of lights, serves as France's bustling capital!"

Max Tokens

回复的最大长度。

值	典型用途
50-100	简短答案
256	标准回复
512-1024	详细解释
2048+	长文本内容

更大的 max tokens = 更长的生成时间。

Top-p (Nucleus Sampling)

将 token 选择限制为累积概率。

0.95 (UI 默认值) - 考虑直到 95% 概率质量的 tokens
0.9 - 稍微更聚焦
0.5 - 非常聚焦

Top-k

限制为 k 个最可能的 tokens。

50 (默认值) - 考虑前 50 个 tokens
10 - 非常聚焦
100 - 更多变化

参数组合

事实性问答

temperature: 0.3
max_tokens: 256
top_p: 0.9

一致、准确的答案。

创意写作

temperature: 0.9
max_tokens: 1024
top_p: 0.95

多样化、创造性的输出。

代码生成

temperature: 0.2
max_tokens: 512
top_p: 0.95

精确、语法正确的代码。

对话

temperature: 0.7
max_tokens: 256
top_p: 0.9

自然、多样化的回复。

找到正确的设置

从默认值开始

默认设置适用于大多数情况：

temperature: 0.7
max_tokens: 256
top_p: 0.95
top_k: 50
do_sample: true

UI 滑块范围

聊天界面提供以下参数范围：

参数	最小值	最大值	步长	默认值
Temperature	0	2	0.1	0.7
Max Tokens	50	2048	50	256
Top P	0	1	0.05	0.95
Top K	0	100	5	50

一次调整一个

如果回复太随机 → 降低 temperature
如果回复太重复 → 提高 temperature
如果回复被截断 → 增加 max_tokens
如果回复太长 → 减少 max_tokens

系统化测试

对于重要应用：

选择 5-10 个测试提示
尝试每个参数设置
比较输出
记录有效的方法

高级参数

Repetition Penalty

减少重复短语。

1.0 - 无惩罚
1.1 - 轻微惩罚（推荐）
1.3+ - 强惩罚

Stop Sequences

当这些 tokens 出现时结束生成。

对结构化输出有用
示例：["\n\n", "User:"]

Do Sample

控制是否使用采样或贪心解码。

true (默认值) - 使用 temperature/top-p/top-k 进行采样
false - 贪心解码（总是选择最可能的 token）

System Prompt

设置系统消息以指导模型行为。可在聊天界面设置面板中使用。示例 system prompts：

“You are a helpful coding assistant. Provide concise code examples.”
“You are a creative writing partner. Be imaginative and descriptive.”
“You are a technical documentation expert. Be precise and thorough.”

System prompt 会前置到对话上下文中，并在整个会话期间影响模型的响应方式。

参数效果总结

参数	低值	高值
temperature	一致，聚焦	随机，创造性
max_tokens	短回复	长回复
top_p	聚焦	多样化
top_k	非常聚焦	更多选项
repetition_penalty	可能重复	避免重复

入门

使用 Chat

生成参数

生成参数

关键参数

Temperature

Max Tokens

Top-p (Nucleus Sampling)

Top-k

参数组合

事实性问答

创意写作

代码生成

对话

找到正确的设置

从默认值开始

UI 滑块范围

一次调整一个

系统化测试

高级参数

Repetition Penalty

Stop Sequences

Do Sample

System Prompt

参数效果总结

下一步

CLI 训练

Python API

入门

使用 Chat

Documentation Index

​生成参数

​关键参数

​Temperature

​Max Tokens

​Top-p (Nucleus Sampling)

​Top-k

​参数组合

​事实性问答

​创意写作

​代码生成

​对话

​找到正确的设置

​从默认值开始

​UI 滑块范围

​一次调整一个

​系统化测试

​高级参数

​Repetition Penalty

​Stop Sequences

​Do Sample

​System Prompt

​参数效果总结

​下一步

CLI 训练

Python API

生成参数

关键参数

Temperature

Max Tokens

Top-p (Nucleus Sampling)

Top-k

参数组合

事实性问答

创意写作

代码生成

对话

找到正确的设置

从默认值开始

UI 滑块范围

一次调整一个

系统化测试

高级参数

Repetition Penalty

Stop Sequences

Do Sample

System Prompt

参数效果总结

下一步