🚀 LlamaFactory：71k Stars 的统一大模型微调框架，一行命令搞定 100+ 模型训练

项目地址：https://github.com/hiyouga/LlamaFactory | ⭐ 71,410 | 🛠 Python | ACL 2024

老实说，现在微调大模型还是太折腾了。环境配置、模型选择、训练方法...每个环节都是坑，大部分开发者直接放弃了。

一、为什么需要它

市面上工具要么只支持特定模型，要么功能残缺。LlamaFactory 直接支持 100+ 大语言模型和视觉语言模型，从 LLaMA、Mistral 到 Qwen3、DeepSeek 全覆盖。最关键的是，它把 ACL 2024 最新的训练方法都集成进去了，包括 LoRA、QLoRA、DPO、KTO 等。

二、快速安装

别整那些花里胡哨的，一行命令搞定：

git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git
cd LlamaFactory
pip install -e .
pip install -r requirements/metrics.txt

三、核心功能使用

最骚的操作是，3 个命令完成整个微调流程：

# LoRA 微调
llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml

# 推理测试
llamafactory-cli chat examples/inference/qwen3_lora_sft.yaml

# 合并权重
llamafactory-cli export examples/merge_lora/qwen3_lora_sft.yaml

四、高级特性

支持 2-8-bit QLoRA 训练，内存占用直接砍半。集成了 GaLore、BAdam、FlashAttention-2 等加速技术，训练速度提升 30%+。还有 Web UI 界面，不会命令行的也能用：

llamafactory-cli webui

五、踩坑记录

别问我怎么知道的，配置文件格式要求很严格，yaml 缩进错一个字符就报错。另外显存占用和文档说的有出入，建议实际可用显存乘以 0.8 来估算。

总结

支持 100+ 模型，覆盖主流开源模型
集成最新训练方法，开箱即用
内存优化到位，普通显卡也能跑
Web UI + CLI 双模式，适合不同用户
文档详细，社区活跃

标签：#LLM微调 #模型训练 #AI开发

菜单

分享

🚀 LlamaFactory：71k Stars 的统一大模型微调框架，一行命令搞定 100+ 模型训练

一、为什么需要它

二、快速安装

三、核心功能使用

四、高级特性

五、踩坑记录

总结

评论

🔥 Firecrawl：122,083 stars 的 AI 网页抓取 API，让 LLM 直接读取互联网数据

[📚] prompts.chat：14.3 万星开源提示词库，一个文件搞定 Prompt

[🛠️ ECC：182K stars 的 AI Agent 调度系统，一套技能打穿七种工具]

[⛏] caveman：让 AI 少说废话，输出 token 砍掉百分之七十五

[🦀] Claw Code：用 Rust 重写的 Claude CLI 智能体工具链

[🛠️] Superpowers：一个可多人协作的 HTML5 游戏开发 IDE

🤖 AutoGPT：让AI替你打工，全天候自动执行复杂任务

🚀 MetaGPT：6.8万 Stars 的多智能体框架，一句话生成完整软件项目

[📚] generative-ai-for-beginners：微软21节课带你从零搭建生成式AI应用

[🔧] Semantic Kernel：一个 SDK 打通多模型、多 Agent、多语言的企业级编排框架