🔥 GenericAgent:11.4k Stars 的自我进化 Agent,3K 行代码长出专属技能树
🔥 GenericAgent:11.4k Stars 的自我进化 Agent,3K 行代码长出专属技能树
> 项目地址:[lsdefine/GenericAgent](https://github.com/lsdefine/GenericAgent) | ⭐ 11,462 | 🐍 Python | 作者:lsdefine
---
老实说,市面上 AI Agent 框架几十上百个,但思路都差不多:给你一整套预设工具链,你得自己去配流程、写技能。用久了你会发现——90% 的功能你根本用不上,你想做的又得自己手写插件。
**GenericAgent 换了个路子:不给技能,让 Agent 自己长技能。**
核心代码只有 **~3K 行**,Agent Loop 就 ~100 行。通过 9 个原子工具,它直接接管你的浏览器、终端、文件系统、键鼠操作——然后每干一件事,就把执行路径自动固化为 Skill,下次同类任务直接复用。
最骚的操作:**这个仓库本身的全部代码,包括 git init 到每个 commit,全是 GenericAgent 自己写的。作者没打开过一次终端。**
## 🧬 自我进化怎么玩
```bash
# 安装
git clone https://github.com/lsdefine/GenericAgent.git
cd GenericAgent
pip install requests streamlit pywebview
cp mykey_template.py mykey.py # 填入 API Key
python launch.pyw
```
第一次让它"帮我监控这几只股票"——它自己去装包、写选股逻辑、配定时任务、把整个流程存成 Skill。下次再说同样的话,一句话就启动了。
| 你说 | 第一次 | 之后 |
|------|--------|------|
| *"用 Gmail 发文件"* | 配 OAuth → 写脚本 → 存 Skill | 直接可用 |
| *"查上个月支付宝超 2000 的支出"* | ADB 驱动支付宝 → 解析数据 → 存 Skill | 一句话搞定 |
这就是所谓的 **"不预设技能,靠进化获得能力"**。
## ⚡ 省 Token 到离谱
别的 Agent 动不动吃 200K–1M token context window,GenericAgent 只要 **不到 30K**。靠的是分层记忆(L0-L4),关键信息在、噪声不在。
官方 benchmark 数据:在 Tool Efficiency 测试里,**token 消耗是 Claude Code 的 1/6,OpenClaw 的 1/10**,任务成功率反而更高。
## 🎛️ 三种启动方式
```bash
# 终端 UI(最轻量)
python frontends/tuiapp.py
# 桌面 GUI
python launch.pyw
# Streamlit Web
streamlit run frontends/stapp2.py
# Telegram Bot
python frontends/tgapp.py
```
都支持 `/new` 开新会话、`/continue` 恢复之前进度。
## 🧠 关键设计选择
跟 OpenClaw(53 万行代码)、Claude Code 那些庞然大物不同,GenericAgent 只给 **9 个原子工具**:
| 工具 | 功能 |
|------|------|
| `code_run` | 执行任意代码 |
| `file_read` / `file_write` / `file_patch` | 文件操作 |
| `web_scan` / `web_execute_js` | 浏览器控制 |
| `ask_user` | 人工确认 |
就这么几个。需要更复杂的?Agent 通过 `code_run` 自己装包、写脚本、调 API——干了啥自动固化成新工具。**用多少长多少,不预装垃圾。**
## 踩过的坑
- 它默认走 pip 安装,如果环境乱(conda + pip 混装)可能打架。建议用 `uv venv` 隔离
- `mykey.py` 支持多种模型:Claude / Gemini / Kimi / MiniMax,但不同模型表现差异挺大,实测 Claude Sonnet 4.6 最稳
- Windows 下 ADB 连手机需要额外装 Android SDK platform-tools,README 没细说
## 总结
- 核心 3K 行代码,Agent Loop 仅百行——不是玩具,是极致精简
- 自我进化机制是最大亮点:用的越久,Agent 越强
- Token 消耗极低(<30K),成本只有同类框架的 1/6 到 1/10
- 支持浏览器、终端、桌面 GUI、Telegram 等多种前端
- 自举实证——整个项目代码都是它自己写的
如果看腻了那些"装一堆你还用不上的插件"的 Agent 框架,试试这个。道理很简单:**技能不是装的,是长出来的。**