你的 AI Agent 会思考,但不会记忆——Ghost 给它一个临时 Postgres 数据库

你的 AI Agent 能推理、能规划、能调用工具、写代码、进行几乎像人一样的对话。

但问它昨天做了什么,它不知道。让它存储点东西供之后用,结果是你在替它找地方放。让两个 Agent 处理同一批文件,事情就开始出乱子。让它安全运行代码,你总担心一个不小心 rm -rf 就搞出大麻烦。

Agent 每天都在变聪明,但我们很少花时间给它们一个真正能干活的地方。

当前 AI 基础设施的现状:胶水粘起来的

如果你现在在做 Agent 开发,基础设施大概长这样:
– Neon 或 Supabase —— 数据库
– Mem0 或 Zep —— 记忆
– Pinecone 或 PgVector —— 搜索
– S3 —— 文件存储
– E2B —— 沙箱执行

五套服务。能跑,凑合用。

直到有一天 Agent 的记忆查不到自己的数据库,直到沙箱读不到 Agent 的文件——然后你就知道那些胶水代码有多脆弱了。

Ghost:Agent 真正缺的那个数据库

传统数据库是为永久性设计的,创建流程也让人觉得是永久的。你申请一个、给它起名、选规格、挑云服务商和区域,你维护它、备份它,让它跑上几年。这对人类工作流没问题,但对 Agent 来说,不对。

Ghost 给你的 Agent 提供的是即时、临时、可丢弃的 Postgres 数据库。通过 CLI 或 MCP 申请,不需要 UI。thousands 并行 sessions,1TB 存储,免费。

它的理念是 Git,而不是 RDS。创建一个数据库,就像开发者创建一个分支。做工作,如果结果好就保留,不好就扔掉。危险迁移前先 fork,在 fork 上做实验,合并或丢弃。数据库变成了工作流的一部分,而不是你在底层担心的基础设施。

Ghost 纯 MCP/CLI。Agent 通过 MCP 发现它,就像发现其他任何工具一样,然后立即开始申请数据库。因为 Ghost 数据库本质上就是 Postgres,Agent 天然会用它——每个 LLM 的训练权重里都有 Postgres。schema 设计、查询、索引、调试,没有私有查询语言,不用学 SDK,就是 SQL。

搭配专用工具扩展 Ghost

Ghost 给 Agent 一个数据库,这本身就已经很给力了。但 Agent 不只是需要存储,还需要记忆、搜索、文件和安全执行。

Memory Engine:持久化的、带有时间维度的 Agent 记忆

你的 Agent 每次会话结束就忘光一切。你大概已经尝试过用向量数据库或独立的记忆服务来解决这个问题了。

Memory Engine 在 Postgres 内部解决这个问题。当你把它和 Ghost 配对时,Agent 的记忆和数据就存在于 Ghost 的空间里。你可以用 SQL 查询记忆。你可以问”这个 Agent 在周二下午 3 点对这个用户知道些什么?”并得到答案,因为 Memory Engine 原生理解时间。

不需要独立的向量数据库。不需要在系统间同步。不需要第二份账单。Postgres 做它擅长的事。

时间维度比你听起来的更重要。大多数记忆方案把记忆当作扁平的存储,东西进去,东西出来。Memory Engine 追踪什么是真的、什么时候变成真的、旧信息什么时候被新信息取代。人类记忆是这样工作的,Agent 记忆也该如此。

不止于时间维度。Memory Engine 让你用关键词、语义、分面和层级搜索在同一条查询里搜记忆。底层检索由 pg_textsearch 驱动,结合了 BM25 的关键词精度和 pgvector 的语义相似度。

TigerFS:一个由 Postgres 支撑的文件系统

Agent 不断创建文件。报告、代码、数据集、图片、日志。这些输出大部分最终进了 S3,无法查询,是个黑箱。TigerFS 给 Agent 一个由 Postgres 支撑的文件系统,让文件成为一等公民。写入时支持事务,多个 Agent 并发访问,metadata 可以查询。

Search:向量搜索、关键词搜索、混合搜索,内置在 Postgres 里

每个 Ghost 数据库都自带 pg_textsearch 和 pgvectorscale。这给你 BM25 关键词搜索、向量语义搜索,以及结合两者的混合搜索。不需要 Elasticsearch,不需要 Pinecone,不需要独立的同步系统。

Ox:带有完整上下文的沙箱执行

Agent 需要运行代码。Ox 给它们一个与数据连接但与主分支隔离的沙箱执行环境。当与 Ghost 配对时,Ox 沙箱可以直接查询 Agent 的数据库并读取它的 TigerFS 文件。不需要额外的 API 跳转和认证。

大家都在用 Ghost 构建什么

Ghost 私下预览了两个月,以下是测试者们构建的东西:

代码审查 Agent:Agent 拿到一个 PR,fork 自己的 Ghost 数据库,启动 Ox 沙箱跑测试,搜索 Memory Engine 找历史审查记录,写出审查结果并存入 TigerFS,同时更新记忆。

研究 Agent:Agent 启动 Ghost 数据库存储研究资料,写 Markdown 报告到 TigerFS,查询 Memory Engine 看之前的研究记录,需要处理数据时 fork 到 Ox 沙箱,运行完毕后将学到的东西以完整时间上下文存储。

多 Agent 团队:三个 Agent 同时处理一个项目,一个写代码,一个写文档,一个跑测试,全部通过 TigerFS 读写文件而不互相踩踏,共享基底但不共享故障模式。

数据探索 Agent:用户问”如果改变定价模型,我们的指标会是什么样?”,Agent fork 数据库,在 Ox 沙箱里用新模型重新跑三个月交易,用户十分钟内拿到三个方案,全部基于真实数据,全部不碰生产环境。

全部跑在 Postgres 上

Postgres 久经考验,在生产环境里跑了 30 多年。当你的 Agent 基础设施需要可靠时,你想把它构建在无聊的东西上。

一个基底意味着零胶水代码。当你的数据库、记忆、搜索和文件都跑在 Postgres 上时,它们共享同一个事务模型、同一个认证、同一个查询语言。集成层不存在,因为它不需要存在。

在 Ghost 之前,团队构建了 TimescaleDB,是时间序列数据最广泛使用的 Postgres 扩展之一。Memory Engine 的时间维度能力直接来自那些工作。

开始使用

Ghost 正在早期访问中。安装命令:curl -fsSL https://install.ghost.build | sh

完整工具链:
– Ghost → Agent 的即时临时 Postgres 数据库
– Memory Engine → 持久化的带时间维度的 Agent 记忆
– pg_textsearch → Postgres 的 BM25 + 关键词搜索
– TigerFS → Postgres 支撑的文件存储
– Ox → 与数据连接的安全沙箱执行

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容