跳到正文
TAIP

产品 / 面向 AI 开发者

ModelSphere

正式可用

您自己的 Hugging Face Hub。改一个环境变量,所有客户端照常工作。

ModelSphere 是部署在您环境内的模型与数据集仓库,在协议层兼容 Hugging Face Hub API。设置 HF_ENDPOINT 后,每个标准客户端——transformers、datasets、diffusers、huggingface-cli,以及带 LFS 的原生 git——都无需补丁即可对接您的仓库。它同时可以作为公共 Hub 的透传缓存:按需懒加载,或为物理隔离机房定时预取;并补齐企业级仓库所需的一切:OIDC SSO、细粒度个人访问令牌、组织与团队、私有仓库、审计日志、Prometheus 指标,以及一个 tar 包搞定的备份恢复。

规格

版本
v1.6.4 — 正式可用
协议
Hugging Face Hub API · git(HTTPS 与 SSH)· git-LFS(> 5 GiB,经 HF 分片)
模式
主仓库 · 透传缓存 · 定时预取
运维
OIDC · 令牌作用域 · 审计日志 · Prometheus · 单 tar 包备份
语言
English · 简体中文

用实证说话

一段代码看明白。

没有私有 SDK,无需改写—— ModelSphere 在现有工具所在之处完成对接。

一个环境变量,所有客户端
$ export HF_ENDPOINT=https://models.intra.example

# 下游一切照常工作——客户端无需任何补丁
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.1-8B")
# 由您的仓库提供;可缓存自上游,也可在物理隔离环境中使用

协议层兼容 Hugging Face Hub API——包括 git clone 与数 GB 级的 LFS 传输。

核心能力

ModelSphere 为您带来什么

01

协议层兼容 Hub

与 huggingface_hub 协议兼容——transformers、datasets、diffusers、huggingface-cli 设置 HF_ENDPOINT 即可使用。不用 fork,不打补丁,没有需要引入的私有 SDK。

02

底层是真正的 git

git clone、git lfs pull、git lfs push 原生可用;超过 5 GiB 的对象通过 Hugging Face 分片传输上传。模型版本管理就是 git 版本管理——分支、标签、提交,您早已熟悉。

03

可浏览的 Hub,而不只是一个 API

除了线缆层协议,ModelSphere 还自带一套 Web UI:可搜索浏览,支持按 tag、pipeline 与 library 过滤;渲染模型卡;浏览器内文件查看器与提交差异历史;讨论与点赞。经 HTTPS 或 SSH 推送;在浏览器里克隆、比对与评审。

04

公共 Hub 的透传缓存

指向 huggingface.co 后,团队拉取过的内容会被自动缓存——也可以按计划预取,服务于物理隔离机房。一个仓库,同时服务两种环境。

05

企业级配套齐全

OIDC SSO、带细粒度作用域的个人访问令牌、组织与团队、公私仓库、全量变更审计日志、随 Chart 发布的 Grafana 大盘与 Prometheus 指标,以及单个 tar 包的备份恢复。

工作原理

从依赖公网,到私有仓库。

  1. 步骤 01

    设置 HF_ENDPOINT

    一个环境变量。所有标准 Hugging Face 客户端即刻改与您的仓库通信,而非公共 Hub。

  2. 步骤 02

    推送、拉取、克隆

    用 huggingface-cli 或 git-lfs 上传微调模型;经内置缓存拉取基础模型——按需懒加载,或为物理隔离环境预取。

  3. 步骤 03

    治理与观测

    OIDC 决定可见性,令牌按范围授权。每次变更进入审计日志,每次调用进入 Prometheus。

适用团队

为这些团队而建

  • 托管微调模型与内部模型的团队
  • 需要 HF 工作流的物理隔离组织
  • 统一模型与数据集存储的平台团队