Open Source • FUSE & NFS Support

Monta Hugging Face
como sistema local

Acceso instantáneo a modelos y datasets sin descargar. Lazy loading, caché inteligente, y API simple basada en archivos.

terminal
$ hf-mount start repo openai/gpt-oss-20b /tmp/model

# Acceso instantáneo - sin descargar
$ ls /tmp/model
config.json  model.safetensors  tokenizer.json

$ python -c "
> from transformers import AutoModel
> model = AutoModel.from_pretrained('/tmp/model')
> # Los archivos se cargan bajo demanda"

¿Por qué hf-mount?

La forma más inteligente de acceder a modelos y datasets de Hugging Face

Sin descarga completa

Acceso inmediato a terabytes de datos. Solo se descargan los bytes que tu código realmente toca.

API simple basada en archivos

Usa herramientas UNIX (ls, cat, find, grep). No necesitas SDKs complejos. Funciona con tu código existente.

Caché inteligente

Caché local automático de hasta 10GB. Los archivos frecuentemente accedidos se guardan localmente.

Instalación

En segundos, sin complicaciones

bash
# Instalación rápida
curl -fsSL https://raw.githubusercontent.com/\
huggingface/hf-mount/main/install.sh | sh

# Verificar instalación
hf-mount --version

# Montar un modelo público
hf-mount start repo openai/gpt-oss-20b /tmp/model
1

Ejecuta el script de instalación

Instala hf-mount en ~/.local/bin/

2

Configura tu token (opcional)

Exporta HF_TOKEN para repos privados

3

¡Listo!

Monta cualquier modelo o dataset

Ejemplos

Todo lo que puedes hacer con hf-mount

Cargar modelos sin descargar

Python
from transformers import AutoModelForCausalLM

# ¡Sin descargar! Lee bajo demanda
model = AutoModelForCausalLM.from_pretrained("/tmp/gpt-oss")

# Tambien funciona con datasets
from datasets import load_dataset
dataset = load_dataset("/tmp/hacker-news", split="train")

Explorar repositorios

Bash
# Ver estructura
ls /tmp/gpt2

# Leer archivos
cat /tmp/gpt2/config.json

# Buscar archivos
find /tmp/gpt2 -name "*.safetensors" | head -5

# Buscar contenido
grep -r "vocab_size" /tmp/gpt2/

Montar buckets privados

Bucket
# Bucket privado con token
hf-mount start --hf-token $HF_TOKEN bucket \
    myuser/my-bucket /tmp/data

# Solo lectura
hf-mount start --hf-token $HF_TOKEN --read-only \
    bucket myuser/my-bucket /tmp/data

# Subfolder específico
hf-mount start --hf-token $HF_TOKEN bucket \
    myuser/my-bucket/checkpoints /tmp/ckpts

Casos de uso

¿Cuándo usar hf-mount?

Perfecto para

  • Cargar modelos/datasets sin descargar el repo completo
  • Explorar contenido con herramientas UNIX
  • Workloads de lectura intensiva (training, inference)
  • Entornos con espacio en disco limitado

No recomendado para

  • Filesystem de propósito general (no multi-writer)
  • I/O aleatorio sensible a latencia
  • Workloads que necesitan consistencia fuerte
  • Edición con editores de texto (usa --advanced-writes)
☸️ Kubernetes

hf-csi-driver

¿Necesitas hf-mount en Kubernetes? El CSI driver te permite montar repos y buckets como volúmenes en tus pods.

Ver documentación
# Instalación con Helm
helm install hf-csi oci://ghcr.io/\
huggingface/charts/hf-csi-driver

# Usage en Pod
volumes:
- name: model
  csi:
    driver: hf.csi.huggingface.co
    volumeAttributes:
      sourceType: repo
      sourceId: openai/gpt2

AI Assistant

Model: gemini-3-flash-preview (Thinking)

ES Google Español

hf-mount Playground

Selecciona un modelo

Selecciona un modelo y comienza a chatear

Los modelos se cargan sin descargar usando hf-mount