這個 GitHub 項目一周漲了 1.4 萬顆星,我一開始也以為是那種PPT開源——光有概念沒有實料。


結果看完實測數據,有點出乎意料:
程式碼搜尋結果從 1.7 萬 token 壓縮到了 1400,答案品質幾乎沒變。
項目叫 Headroom,核心就做一件事:把程式碼搜尋結果、日誌、RAG 文件這類長上下文,先壓縮一遍,再喂給 AI。
最狠的是它不是簡單刪內容,而是可逆壓縮。原文還在本地,AI 真需要細節時可以再調回來,Debug 能力不會直接被砍沒。
幾個關鍵點:
1. Token 最高能砍掉 92%
2. Claude Code、Codex、Cursor 這類工具都能包一層直接用
3. 不用大改程式碼,可以當代理跑
4. 資料本地處理,不走雲端
5. Python 和 Node 都能裝
6. 自動在 6 種壓縮算法裡選最優
這東西最適合三類人:
用 Claude 或 Codex 寫程式碼,每月 token 账單肉疼的;
專案上下文太大,AI 動不動就丟細節的;
做 RAG、多 Agent、程式碼搜尋,想壓成本又不想犧牲效果的。
以前大家優化 AI 編程,都是想辦法換模型、換提示詞、換工作流。
但真正被忽略的成本,可能就在於你每次都把一堆"AI 不一定需要完整讀"的上下文原封不動塞進去。
Headroom 這類工具的價值就在這裡:
不是讓 AI 更聰明,而是讓 AI 少讀廢話。
免費、本地、開源。
Token 費用高的,值得重點看看。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆