TAIP — AI 平台
主权 AI
基础设施。
完整 AI 生命周期——开发、训练、注册、推理、运维——运行在您自己的硬件上,处于您掌控的安全边界内,并兼容您已经在用的 API。
本地部署 · VPC · 物理隔离 — 零数据出界
- 11
- 款产品 · 一个平台
- 5
- 家 GPU 厂商
- 12+
- 个模型推理预设
- 2
- 种语言 — EN · 中文
- 100%
- 支持物理隔离部署
- 0
- 字节离开安全边界
§ 01 — 核心命题
AI 团队常被迫二选一。TAIP 是第三种选择。
租用别人的云,失去控制;或者自己拼装一切,长期背负集成债。我们打造了本应存在的平台:像云一样完整一致,又像硬件一样真正属于您。
选项一
租用别人的云
- 您的提示词、模型权重与数据,存放在您无法控制的基础设施上
- 按 token 计价由别人定,调价无需征求您的意见
- 他们的路线图、他们的弃用计划、他们的可用区
- 合规从一种产品属性,变成一场场谈判
起步很快,信任很贵。
选项二
自己拼接十几个开源工具
- JupyterHub + 训练工具 + 模型仓库 + 网关 + 大盘……
- 身份、配额与审计都要靠您的团队长期拼接和维护
- 每次升级都是一个集成项目,每个缺口都由您的值班兜底
- 平台团队被迫成为产品团队——却没有产品预算
下载免费,债务自负。
第三种选择
TAIP — 一个平台,您的边界
- 完整生命周期——开发、训练、注册、推理、运维——在同一套技术栈上
- 一个身份、一套配额模型、一条贯穿所有产品的审计链
- 每个关键接口都采用开放标准:OCI、OpenAI/Anthropic API、OIDC、OTEL
- 可安装进您的数据中心、VPC,或完全物理隔离的机房
像云一样完整一致,像硬件一样属于您。
§ 02 — 用实证说话
把现有技术栈接入自己的安全边界。
没有私有 SDK,无需改写客户端。TAIP 使用的就是现有工具已经支持的协议——以下都是来自已发布产品的真实工作流。
from openai import OpenAI
client = OpenAI(
base_url="https://inferx.intra.example/api", # ← 唯一的改动
api_key=os.environ["INFERX_API_KEY"],
)
# Anthropic SDK 与 claude-code 同理,经 /anthropic/v1 接入
# 每个请求都进入大盘:成本 · P50/P95/P99 · 错误率▌ OpenAI 与 Anthropic SDK 均可直接替换,支持流式——并带按密钥的预算、限流与模型白名单。
$ export HF_ENDPOINT=https://models.intra.example
# 下游一切照常工作——客户端无需任何补丁
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.1-8B")
# 由您的仓库提供;可缓存自上游,也可在物理隔离环境中使用▌ 协议层兼容 Hugging Face Hub API——包括 git clone 与数 GB 级的 LFS 传输。
# 从您的笔记本,经 DevSpace 堡垒机直达 GPU 环境
$ ssh alice+jupyter@bastion.intra.example
(jupyter) $ nvidia-smi --query-gpu=name --format=csv,noheader
NVIDIA A100-SXM4-80GB
# 闲置 2 小时 → 缩容到零,PVC 保留,GPU 回到资源池▌ 原生 SSH 体验——shell、SCP、端口转发——以您上传的密钥认证,全程不碰 kubectl。
$ ./install/00-preflight.sh # 只读预检
$ ./install/03-install-cluster.sh --cluster site-a
ok k8s · cilium · longhorn · cert-manager · envoy-gateway · authentik
# Ctrl-C 后重跑,就是官方文档写明的恢复路径
# 同一发布包、同一仓库、同一结果——跨站点、跨月份▌ 内容寻址的发布包:版本升级重新打包时只搬运变化的层。一个镜像仓库可以服务多个集群。
开放标准是承重结构——
凡有标准,必用标准。
我们不发明私有协议。
- ▸ OCI
- ▸ OpenAI API
- ▸ Anthropic API
- ▸ OIDC
- ▸ Gateway API
- ▸ KServe
- ▸ Kueue
- ▸ OTEL
- ▸ DRA
- ▸ Cosign
- ▸ eBPF
§ 03 — 产品矩阵
十一款专注的产品,一个平台。
每款产品边界清晰、可独立交付;同时共享身份、租户、策略与可观测性——是一个真正的平台,而非一堆工具的集合。
01 — 面向 AI 开发者
从 Notebook 到生产推理——研究员、工程师与 AI 应用团队交付所需的一切。
ConsoleX
正式可用登录即获得受治理的 Kubernetes 工作空间。无需 kubectl,无需提工单。
了解更多DevSpace
正式可用几秒钟内在 GPU 上拉起 Jupyter 或 VS Code。闲置环境自动关停。
了解更多TrainX
正式可用管理员写模板,用户填表单,Kubernetes 跑作业。
了解更多ModelSphere
正式可用您自己的 Hugging Face Hub。改一个环境变量,所有客户端照常工作。
了解更多InferX
正式可用在您自己的 GPU 上提供兼容 OpenAI 与 Anthropic 的推理服务——每个 token 都可计量。
了解更多ImageSphere
正式可用一个把身份、运行时策略与物理隔离部署当作一等功能的 OCI 制品仓库。
了解更多AgentX
预览版把智能体变成 Kubernetes 一等原语——可版本化、沙箱隔离、全程可追踪。
了解更多GrokX
正式可用让你的智能体扎根于你的文档——支持扫描版 PDF,每个答案都标注到具体页码。
了解更多Slurm on TAIP
正式可用你的 Slurm 脚本,原样不动——跑在 Kubernetes 上,一套登录、一个 home、一份配额。
了解更多02 — 面向平台管理员
以任意规模运行 TAIP。在一个控制台中管理用户、配额、GPU 资源池与策略。
03 — 集群底座
搭建支撑 TAIP 运行的 Kubernetes、身份与存储底座。
§ 04 — 为什么是主权
设计上私有,默认统一。
律所不会把涉密文件交给外部供应商,医院不会把病历放在共享服务器上。当 AI 开始处理您最敏感的工作时,也应达到同样的标准。
一套平台,覆盖完整 AI 生命周期
Notebook、训练、模型注册中心、推理、智能体——都在同一套一致的技术栈上。一个身份、一套配额、一条审计链。不必再拼接十几个工具。
治理就是产品本身,而非事后功课
按用户隔离的命名空间、自动收敛漂移的配额、默认拒绝的网络策略、贯穿全局的 OIDC、审计日志、按 token 的成本归集。最不起眼的部分,最先做好。
随处可部署,完全归您掌控
您的数据中心、您的 VPC,或完全物理隔离的机房——源自设计,而非事后补丁。身份系统自托管,镜像预先打包,任何节点都无需访问公网。
§ 05 — 适用团队
为真正做事的团队而建。
TAIP 围绕数据管控不可妥协的组织而设计——律所、医院、金融机构、政府部门,以及推动前沿的研究团队。
01
AI 研究团队
从 Notebook 到训练任务,全程留在同一平台
为研究员提供 GPU 就绪的开发环境、带实时进度的模板化训练,以及从实验到生产的顺畅交接——全部处于同一套身份与配额体系之下。
阅读更多02
AI 产品团队
在您掌控的基础设施上交付 LLM 驱动的产品
搭建 OpenAI 与 Anthropic 兼容端点,托管微调模型,在专属算力上对每个 token 计量——成本、延迟与隐私都符合产品要求。
阅读更多03
平台与基础设施团队
运营一个像样的内部 AI 平台,而不必从零自研
TAIP 为平台团队提供多租户控制平面、策略与可观测性,把一个 GPU 集群变成服务全公司的真正产品。
阅读更多04
合规与本地部署
满足合规要求的 AI——就在您自己的环境里
TAIP 可安装进您的数据中心、VPC 或物理隔离环境。带上您的 IdP、网络策略与硬件——TAIP 主动适配。
阅读更多