Unsloth 集成

Unsloth 为 LoRA 微调提供优化的训练，显著减少训练时间和内存使用。

要求

要求	详情
安装	`pip install unsloth`
支持的训练器	仅 `default`、`sft`
支持的模型	`llama`、`mistral`、`gemma`、`qwen2`
平台	推荐 Linux

Unsloth 仅适用于 SFT 训练（--trainer sft 或 --trainer default）。不支持 DPO、ORPO、PPO 和其他训练器。

支持的模型架构

Unsloth 针对特定模型系列进行了优化：

架构	示例模型
`llama`	Llama 2、Llama 3、Llama 3.1、Llama 3.2
`mistral`	Mistral 7B、Mistral Nemo
`gemma`	Gemma、Gemma 2
`qwen2`	Qwen 2、Qwen 2.5

其他模型架构将回退到标准训练并显示警告。

快速开始

aitraining llm --train \
  --model meta-llama/Llama-3.2-1B \
  --data-path ./data \
  --project-name fast-model \
  --trainer sft \
  --unsloth \
  --peft \
  --lora-r 16

参数

参数	CLI 标志	默认值	描述
`unsloth`	`--unsloth`	`False`	启用 Unsloth 以加快训练
`use_sharegpt_mapping`	`--use-sharegpt-mapping`	`False`	使用 Unsloth 的 ShareGPT 映射而不是转换

Python API

from autotrain.trainers.clm.params import LLMTrainingParams
from autotrain.project import AutoTrainProject

params = LLMTrainingParams(
    model="meta-llama/Llama-3.2-1B",
    data_path="./data",
    project_name="fast-model",

    trainer="sft",
    unsloth=True,

    peft=True,
    lora_r=16,
    lora_alpha=32,

    epochs=3,
    batch_size=4,
)

project = AutoTrainProject(params=params, backend="local", process=True)
project.create()

与量化结合

Unsloth 与 int4 和 int8 量化配合使用以减少内存使用：

aitraining llm --train \
  --model meta-llama/Llama-3.2-3B \
  --data-path ./data \
  --project-name quantized-model \
  --trainer sft \
  --unsloth \
  --peft \
  --quantization int4 \
  --lora-r 16

工作原理

当启用 Unsloth 并满足要求时：

使用 Unsloth 库的 FastLanguageModel 进行优化的模型加载
应用优化的梯度检查点（use_gradient_checkpointing="unsloth"）
自动配置 LoRA 目标模块：q_proj、k_proj、v_proj、o_proj、gate_proj、up_proj、down_proj
与 PEFT 集成以进行高效的适配器训练

回退行为

如果无法使用 Unsloth，训练将继续使用标准 transformers/PEFT：

Unsloth 未安装：记录警告，继续不使用 Unsloth
不支持的模型类型：记录警告，继续不使用 Unsloth
不支持的训练器：不应用 Unsloth（仅支持 SFT）

WARNING: Unsloth not available, continuing without it...

ShareGPT 映射

使用 --use-sharegpt-mapping 保留 ShareGPT 格式而不是转换：

aitraining llm --train \
  --model meta-llama/Llama-3.2-1B \
  --data-path ./sharegpt_data.json \
  --project-name model \
  --trainer sft \
  --unsloth \
  --use-sharegpt-mapping \
  --peft

训练技术

优化

自定义开发

评估

研究

生产

Unsloth 集成

Unsloth 集成

要求

支持的模型架构

快速开始

参数

Python API

与量化结合

工作原理

回退行为

ShareGPT 映射

下一步

LoRA/PEFT

Quantization

训练技术

优化

自定义开发

评估

研究

生产

Documentation Index

​Unsloth 集成

​要求

​支持的模型架构

​快速开始

​参数

​Python API

​与量化结合

​工作原理

​回退行为

​ShareGPT 映射

​下一步

LoRA/PEFT

Quantization

Unsloth 集成

要求

支持的模型架构

快速开始

参数

Python API

与量化结合

工作原理

回退行为

ShareGPT 映射

下一步