产品 / 面向 AI 开发者
AgentX
预览版把智能体变成 Kubernetes 一等原语——可版本化、沙箱隔离、全程可追踪。
AgentX 让 LLM 智能体成为 TAIP 上的平台原语。你编写一份可复用、可版本化的 Agent 定义——模型、系统提示、工具、记忆、沙箱——再以 AgentSession 运行它;agentx-controller 会拉起一个加固的沙箱 Pod,在其中运行自研、与供应商无关的智能体循环,并把每一步事件流式写入持久化事件存储。模型来自 InferX(兼容 OpenAI 的 gemma-4),通过可插拔的适配器接入;工具可以是内置(bash / file / code / web)、MCP 服务,或把密钥留在沙箱之外的自定义宿主侧工具。在此之上还可叠加定时 AgentSchedule、常驻 AgentService 与持久化 MemoryStore——它们都引用同一份 Agent。React 追踪查看器、聊天界面以及 taip-agent CLI,仅凭一个 kubeconfig 即可读取实时 SSE 流。一个 OIDC SSO 前置门户(agentx-bff)加上了浏览器登录、group→role RBAC 与按用户的会话归属,每个沙箱都运行在默认拒绝、失败即关闭的 CiliumNetworkPolicy 之下。
规格
- 状态
- v0.1.0-rc1 — 预览版,已端到端验证
- CRD
- Agent · AgentSession · AgentService · AgentSchedule · MemoryStore
- 模型
- InferX 适配器(兼容 OpenAI 的 gemma-4)· 与供应商无关的循环
- 工具
- 内置 bash/file/code/web · MCP(Streamable-HTTP)· 自定义宿主侧工具
- 追踪
- PVC 持久化事件存储 · 实时 SSE · 按运行计量 token
- 隔离
- 按会话隔离的沙箱 Pod(非 root、丢弃 capabilities)· 默认拒绝的 Cilium 出站 · 可选 HMAC 鉴权
- 身份
- OIDC SSO 前置门户(agentx-bff)· group→role RBAC · 按用户隔离的会话
- 入口
- React 追踪查看器 + 聊天界面 · taip-agent CLI · Helm + kustomize
用实证说话
一段代码看明白。
没有私有 SDK,无需改写—— AgentX 在现有工具所在之处完成对接。
$ kubectl apply -f agent.yaml # 一份可版本化的 Agent 定义
agent.agent.tensorstack.dev/demo created
$ kubectl apply -f session.yaml # 它的一次运行
agentsession/demo-run-1 created
$ kubectl get agentsession demo-run-1 -w
demo-run-1 Pending → Running → Succeeded # 加固的沙箱 Pod
$ taip-agent trace demo-run-1 # 实时 SSE:每一步、每次工具调用、每个 token
# 用量:输入 1,284 · 输出 412 token · 归属到本次运行▌ Agent、AgentSession、AgentService、AgentSchedule、MemoryStore——agent.tensorstack.dev 上的五个 CRD。声明式、适合 GitOps,可用你已有的 Kubernetes 工具直接观测。
核心能力
AgentX 为您带来什么
可版本化的 Agent 定义
把模型、系统提示、工具、记忆与沙箱写进一份 Agent,编写一次、运行多次。创建时会把解析后的 spec 快照进按会话的 ConfigMap,因此后续修改不影响已有运行的可复现性。
Session:自主或交互
一个 AgentSession 就是一次运行——可以是一次性任务,也可以是多轮对话。循环在轮次之间停在 Idle、收到后续消息后继续;控制器负责执行超时、TTL 与 token 预算。
内置、MCP 与自定义工具
bash、file、code 与 web 在沙箱内运行;MCP 服务通过 Streamable-HTTP 客户端接入;自定义宿主侧工具会暂停循环、在外部返回结果后继续——让工具密钥永不进入沙箱。
加固、隔离,且需登录
每次运行都有独立 Pod:以非 root 运行、丢弃 capabilities、不挂载 ServiceAccount token、配置只读挂载,以及一个默认拒绝、出站失败即关闭的 CiliumNetworkPolicy。一个 OIDC SSO 前置门户负责登录,并把每位用户限定在各自的会话内。标记为 ask 的工具会先暂停,待批准 / 拒绝后再执行。
每一步都可追踪
PVC 持久化的事件存储记录每次工具调用、每条助手消息、每次状态变化与 token 计数——实时经 SSE 推送,重启后仍可回放。用量按运行归属。
跨会话记忆
MemoryStore 是挂载进 Agent 各个会话的持久化(可 RWX)PVC,让智能体在多次运行间保留记忆——可选 retain 使其比存储本身存活更久。
定时调度与常驻服务
AgentSchedule 按带时区的 cron 触发 Session,支持并发策略与历史保留上限;AgentService 在一个受限网关后把每个 HTTP 请求转成一次全新 Session——支持异步或同步。
界面与 CLI 共用一条事件流
React 追踪查看器与聊天界面代理到 AgentService 网关;taip-agent CLI 可 run、list、get,并仅凭 kubeconfig 从 Pod 日志实时跟踪 trace。
工作原理
从定义到可追踪的运行,全在 Kubernetes 上。
- 步骤 01
编写 Agent
在一份可版本化的 Agent CRD 中声明模型(InferX)、系统提示、工具、记忆与沙箱。YAML 优先、适合 GitOps——用 kubectl apply 或 taip-agent。
- 步骤 02
运行 Session
启动一个 AgentSession——任务或对话。控制器快照 spec,并拉起一个加固的沙箱 Pod,在其中针对你的模型与工具运行智能体循环。
- 步骤 03
观察追踪
每一步、每次工具调用、每个 token 经 SSE 实时推送到追踪查看器、聊天界面或 taip-agent CLI——持久、可回放,用量归属到本次运行。
- 步骤 04
调度或常驻
把同一份 Agent 提升为定时 AgentSchedule 或常驻 AgentService——并为它配上 MemoryStore,在多次运行间保留上下文。
适用团队
为这些团队而建
- 在自有基础设施上构建生产级智能体产品的团队
- 把智能体作为受治理、多租户服务对外提供的平台团队
- 用定时、可审批的智能体自动化运维手册的 SRE 与运维团队
- 需要完整追踪与回放来探索智能体系统的研究者
搭配使用
其他开发者产品
ConsoleX
正式可用登录即获得受治理的 Kubernetes 工作空间。无需 kubectl,无需提工单。
用户首次 SSO 登录时,自动获得一个隔离的命名空间:配额、默认拒绝的网络策略、存储与 Web 终端——自动开通,持续收敛。
了解更多DevSpace
正式可用几秒钟内在 GPU 上拉起 Jupyter 或 VS Code。闲置环境自动关停。
一键创建 Jupyter、Marimo、Streamlit、Gradio、VS Code 环境——GPU 就绪、按用户经独立认证代理隔离,支持 SSH,默认闲置自动关停。
了解更多TrainX
正式可用管理员写模板,用户填表单,Kubernetes 跑作业。
自描述的训练模板直接渲染成 UI 表单——提交前实时校验配额,运行中流式日志、解析进度条,一键 TensorBoard。
了解更多