欣淇
发布于 2026-05-20 / 0 阅读
0
0

🚀 LlamaFactory:71k Stars 的统一大模型微调框架,一行命令搞定 100+ 模型训练

🚀 LlamaFactory:71k Stars 的统一大模型微调框架,一行命令搞定 100+ 模型训练

项目地址:https://github.com/hiyouga/LlamaFactory | ⭐ 71,410 | 🛠 Python | ACL 2024


老实说,现在微调大模型还是太折腾了。环境配置、模型选择、训练方法...每个环节都是坑,大部分开发者直接放弃了。

一、为什么需要它

市面上工具要么只支持特定模型,要么功能残缺。LlamaFactory 直接支持 100+ 大语言模型视觉语言模型,从 LLaMA、Mistral 到 Qwen3、DeepSeek 全覆盖。最关键的是,它把 ACL 2024 最新的训练方法都集成进去了,包括 LoRA、QLoRA、DPO、KTO 等。

二、快速安装

别整那些花里胡哨的,一行命令搞定:

git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git
cd LlamaFactory
pip install -e .
pip install -r requirements/metrics.txt

三、核心功能使用

最骚的操作是,3 个命令完成整个微调流程:

# LoRA 微调
llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml

# 推理测试
llamafactory-cli chat examples/inference/qwen3_lora_sft.yaml

# 合并权重
llamafactory-cli export examples/merge_lora/qwen3_lora_sft.yaml

四、高级特性

支持 2-8-bit QLoRA 训练,内存占用直接砍半。集成了 GaLore、BAdam、FlashAttention-2 等加速技术,训练速度提升 30%+。还有 Web UI 界面,不会命令行的也能用:

llamafactory-cli webui

五、踩坑记录

别问我怎么知道的,配置文件格式要求很严格,yaml 缩进错一个字符就报错。另外显存占用和文档说的有出入,建议实际可用显存乘以 0.8 来估算。

总结

  • 支持 100+ 模型,覆盖主流开源模型
  • 集成最新训练方法,开箱即用
  • 内存优化到位,普通显卡也能跑
  • Web UI + CLI 双模式,适合不同用户
  • 文档详细,社区活跃

标签:#LLM微调 #模型训练 #AI开发


评论