🔥 made-with-ml：40K+开发者验证的ML工程化实战指南

你是不是也遇到过这种情况：在Jupyter Notebook里调模型调得飞起，准确率97%，结果一部署到生产环境就崩？数据管道跑着跑着就断了，模型版本管理一团乱，CI/CD更是想都不敢想？别急，这不是你一个人的问题。ML工程化（MLOps）的坑，几乎每个从实验走向生产的团队都得踩一遍。

项目数据

Made With ML 是GitHub上最火的ML工程化项目之一，目前已经收获了 40K+订阅者 和 高星标，长期位列GitHub ML类仓库前列。作者Goku Mohandas把他在硅谷多年做ML产品的经验，浓缩成了一整套从设计到部署再到迭代的完整课程。不是那种只讲理论的教程，而是真正能跑起来、能直接用在生产环境的东西。

核心功能拆解

这个项目最牛的地方在于，它把ML工程化拆成了五个可操作的核心模块：

第一性原理：不急着写代码，先搞清楚每个ML概念的本质。比如为什么要用这个损失函数，而不是那个。
软件工程最佳实践：从项目结构、代码规范到测试，全都按工业级标准来。
原生规模化：用Python就能搞定数据、训练、调参、服务的规模化，不用学新语言。
MLOps全链路打通：追踪、测试、服务、编排，一个不落。
开发到生产的零切换：代码写好了直接部署，不用改一行，不用手动管理基础设施。

实操步骤

来，我们直接上手。假设你已经有了GitHub账号和Python环境。

1. 克隆仓库并设置环境

git clone https://github.com/GokuMohandas/Made-With-ML.git .
export PYTHONPATH=$PYTHONPATH:$PWD
python3 -m venv venv
source venv/bin/activate
python3 -m pip install --upgrade pip setuptools wheel
python3 -m pip install -r requirements.txt

2. 配置凭证

创建一个 .env 文件来存储你的敏感信息：

touch .env

# 在 .env 文件中写入
GITHUB_USERNAME="你的GitHub用户名"

source .env

3. 设置预提交钩子

这个能帮你自动检查代码质量，避免写出烂代码：

pre-commit install
pre-commit autoupdate

4. 启动Jupyter Notebook交互式学习

jupyter lab notebooks/madewithml.ipynb

避坑指南

Python版本一定要用3.10。用pyenv（Mac）或pyenv-win（Windows）管理版本，别问为什么，问就是踩过坑。
.env文件别提交到Git。已经在.gitignore里了，但你最好再确认一下。
虚拟环境一定要激活。很多人忘了 source venv/bin/activate，结果包装到了全局，后面全乱套。
本地跑大数据集会卡死。课程里的代码在个人笔记本上都能跑，但如果你数据集太大，建议用Anyscale或云平台。
别跳过测试环节。很多人觉得测试浪费时间，结果上线后才发现模型在真实数据上表现一塌糊涂。

要点总结

Made With ML 不是那种你看了就忘的教程。它是一个完整的、可复用的ML工程化框架。学完它，你不仅能写出能在生产环境稳定运行的ML系统，还能理解为什么这么设计。不管你是刚毕业的学生、想转型的软件工程师，还是带产品的技术负责人，这套方法论都能帮你少走弯路。

记住：ML不是独立于软件工程之外的东西，它只是你处理数据的一种思维方式。真正的价值不在于模型多牛，而在于你能多快、多稳地把模型送到用户手里。

菜单

分享

⭐ Made-With-ML：47,818 stars

🔥 made-with-ml：40K+开发者验证的ML工程化实战指南

项目数据

核心功能拆解

实操步骤

1. 克隆仓库并设置环境

2. 配置凭证

3. 设置预提交钩子

4. 启动Jupyter Notebook交互式学习

避坑指南

要点总结

评论

⭐ 1Panel：35,654 stars · 🔥 1Panel is a modern, open-source VPS control panel — and...

⭐ UI-TARS-desktop：35,659 stars · The Open-Source Multimodal AI Agent Stack: Connecting Cut...

⭐ AgentGPT：36,146 stars · 🤖 Assemble, configure, and deploy autonomous AI Agents in...

⭐ arthas：37,333 stars · Alibaba Java Diagnostic Tool Arthas/Alibaba Java诊断利器Arthas

⚡ Serena：24k Stars 的MCP编码工具包

🫴 OpenHands：73k Stars 的AI驱动开发平台

🛠 SWE-agent：19k Stars 的 AI 程序员，扔个 GitHub Issue 它自动帮你修好

📈 TradingAgents：72k Stars 的多智能体交易框架

🖥 Bytebot：11k Stars 的开源 AI 桌面代理，给大模型配台电脑，它替你干活

🦉 OWL：19.7k Stars 的多智能体协作框架，GAIA 开源第一，让你的 Agent 团队自己干活