欣淇
发布于 2026-05-18 / 0 阅读
0
0

🐙 OpenSquilla:1k★ 的 Token 高效 AI Agent,同样预算智能密度翻倍

🐙 OpenSquilla:1k★ 的 Token 高效 AI Agent,同样预算智能密度翻倍 / OpenSquilla: 1k★ Token-Efficient AI Agent — Same Budget, Higher Intelligence Density

项目地址:https://github.com/opensquilla/opensquilla | ⭐ 1,001 Stars | 🛠 Python | 🏷 Apache-2.0 | 📅 2026-05-06


老实说,玩 AI Agent 这两年最大的痛就是 Token 账单。OpenClaw 跑一个 PinchBench 吃掉 306 万 Token,烧掉 6 刀多——这还只是一次评测。OpenSquilla 用 SquillaRouter 把同样 0.925 的准确率压到 172 万 Token,成本只要 0.68 刀,省了 89%。 最骚的是这东西还能本地跑路由决策,Prompt 不需要出机器。

🤷 别问为啥叫 Squilla——虾蛄(螳螂虾)的眼睛有 16 种视锥细胞,比人类多 13 种,看东西又准又省能量,跟这项目的设计哲学一模一样。


🎯 SquillaRouter:四层分级,每分钱都花对地方

OpenSquilla 的核心是一个本地运行的 SquillaRouter(LightGBM + ONNX BGE 分类器,走 recommended profile 自带)。每次用户发话,它先在本机分类:

  • T0 — 纯闲聊、打招呼 → 最便宜的模型
  • T1 — 简单问答、信息检索 → 中等模型
  • T2 — 代码生成、复杂推理 → 强模型
  • T3 — 深度分析、多步推理 → 旗舰模型

混合特征(长度、语言、代码占比、关键词 + 语义嵌入)决定该走哪一层,推理 Token 也只在真正需要深度思考时才启用。不会为了你说一句"Hello"去付 Opus 4.7 的推理费。

PinchBench 1.2.1 的数据很硬:

Agent 平均分 输入 Token 成本
OpenSquilla 0.9251 1,721,328 $0.688
OpenClaw (Opus 4.7) 0.9255 3,066,243 $6.233

分数几乎一样,成本差了 9 倍。这不是玩具数据,是实打实的 benchmark。


🔧 安装:两条命令跑起来

跟 OpenClaw 一样,OpenSquilla 也有完整的 CLI 工具链。

# 1. 从源码安装(推荐)
git clone https://github.com/opensquilla/opensquilla.git
cd opensquilla
bash install.sh        # macOS / Linux
# 或 Windows: powershell -ExecutionPolicy Bypass -File .\install.ps1

# 2. 配置(以 OpenRouter 为例)
export OPENROUTER_API_KEY="sk-..."
opensquilla onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

# 3. 启动网关
opensquilla gateway run
# 打开 http://127.0.0.1:18790/control/ 使用 Web UI

也支持预览包下载(免 Git 免 Python,zip 开箱即用),去 GitHub Releases 拿就行。


🧠 四层记忆系统 + 自动整理

OpenSquilla 的另一个亮点是记忆架构。不像大多数 Agent 只有一层"记住刚才说了啥",它分了四层:

  1. Working Memory — 当前任务上下文
  2. Episodic Memory — 经验和因果链
  3. Semantic Memory — 事实和规则
  4. Raw Memory — 审计和重训底料

频繁使用的记忆自动提升优先级,过时的按指数衰减。还有个叫 Dream Consolidation 的机制——定期把散乱的 Episodic 痕迹整理成结构化知识,模仿人类睡眠时的记忆巩固。听着玄乎,但实测 96.6% 的召回率不是吹的。

记忆搜索同时跑 FTS 关键词 + sqlite-vec 语义召回,全部本机 ONNX 推理,不上云。


🔒 安全沙箱三层隔离

Security 这块 OpenSquilla 下了功夫。三层策略(Standard / Strict / Locked),Linux 上用 Bubblewrap 隔离代码执行,拒绝次数多了自动暂停自主执行。所有 Skill 元数据和工具结果做 XML 转义,堵 prompt injection 的路子。

对于生产部署来说,这是跟 OpenClaw 拉开差距的关键点——OpenClaw 默认 Token 权限较大,OpenSquilla 默认收得更紧。


📋 总结

  • Token 效率碾压 — SquillaRouter 本地分类路由,同精度成本省 89%
  • 安装简单 — 一个 git + install.sh 搞定,Web UI 开箱即用
  • 20+ 模型提供商 — OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek 全家桶都支持
  • 生产级安全 — 三层沙箱 + 自动熔断 + XML 转义防注入
  • Docker / 预览包都行 — 不挑环境,Windows 也有完整支持

这个项目才上线 12 天就破千星,增速挺猛的。如果你在用 OpenClaw 做生产 Agent,OpenSquilla 值得仔细看看——同样的预算,它能干更多事。


评论